Pengantar Machine Learning dan Regresi
Assalamu'alaikum warahmatullah wabarakatuh, Hallo teman - teman semua. Ketemu lagi bersama aku di blogger penddikan ini wkwk. Seperti yang kalian tau bahwa blog ini akan memberikan ilmu - ilmu yang saya pelajari saat ini. Khusunya mengenai ilmu informatika. So, check it's out dan jangan lupa like dan comment yaa!!
Sekarang aku berbagi ilmu pengetahuan tentang mata kuliah machine learning. Yaitu akan membahas sub judul tentang Pengantar Machine Learning dan Regres. Pasti kepo kan?!
Langsung aja check it's out!!
A. Machine
Learning
a. Pengertian
Machine Learning
Machine
learning adalah kumpulan algoritma yang dapat mempelajari dari dan membuat
prediksi berdasarkan data yang direkam, mengoptimalkan fungsi utilitas yang
diberikan dalam ketidakpastian, mengekstrak struktur data tersembunyi, dan menggolongkan
data menjadi deskripsi singkat.
b.
Tipe
– tipe Machine Learning
- Supervised
Learning
Supervised
machine learning adalah algoritma machine learning menggunakan
data terlabel, contohnya input di mana output-nya diketahui.
Sebagai
contoh, sebuah alat memiliki data point yang berlabel F (failed) atau
R (runs).
- Unsupervised
learning
Unsupervised machine
learning adalah kebalikan dari supervised learning.
Contohnya, unsupervised
learning dapat digunakan untuk mengidentifikasi segemen konsumen dengan
atribut yang serupa dan mengelompokkannya agar dapat ditangani atau
diperlakukan sama dalam sebuah kampanye digital marketing.
- Reinforcement
Learning
Reinforcement
learning biasanya digunakan untuk robotik, pembuatan game, dan navigasi.
Dengan
metode learning ini, algoritma akan mampu menemukan aksi atau
perlakuan yang menghasilkan output terbaik dari hasil uji coba
berulang kali (trial and error).
c.
Kompetensi
Dasar yang harus dimiliki untuk memulai belajar machine learning
- Pengetahuan
dasar mengenai bahasa pemrograman dan script
- Pengetahuan
mengenai statistika dan probabilitas.
- Aljabar
linier dan kalkulus
- Pengetahuan
mengenai cara membersihkan dan menyusun raw data ke dalam format yang
dibutuhkan.
d.
Cara
Kerja
Dari
data tersebut, komputer akan melakukan proses belajar (training) untuk
menghasilkan suatu model. Proses belajar ini menggunakan algoritma machine
learning sebagai penerapan teknik statistika. Model inilah yang menghasilkan
informasi, kemudian dapat dijadikan pengetahuan untuk memecahkan suatu
permasalahan sebagai proses input-output. Model yang dihasilkan dapat
melakukan klasifikasi ataupun prediksi ke depan.
Untuk
memastikan efisiensi model yang terbentuk, data akan dibagi menjadi data
pembelajaran (train dataset) dan data pengujian (test dataset). Pembagian
data yang digunakan bervariasi bergantung algoritma yang digunakan. Pada
umumnya train dataset lebih banyak dari test dataset, misalnya
dengan rasio 3:1. Test dataset digunakan untuk menghitung
seberapa efisien model yang dihasilkan untuk melakukan klasifikasi atau
prediksi kedepan yang disebut test score. Semakin banyak data yang
digunakan, test score yang dihasilkan semakin baik. Nilai test
score berada dalam rentang 0-1.
e.
Pentingnya
Machine Learning
- Bermanfaat
untuk menyelesaikan permasalahan dunia dengan cara yang terukur.
- Bisa
digunakan pada berbagai macam industri dan terus digunakan oleh pemilik
industri besar dan peneliti agar dapat terus berkembang.
- Bisa
memroses dan menganalisis data yang lebih besar dan rumit dengan waktu yang
lebih singkat.
- Meningkatkan
hingga 16% atau 13 triliun dolar AS untuk perekonomian amerika serikat per
tahun 2030. Tentu saja, hal ini pun akan berangsur memengaruhi perekonomian
dunia pula.
f.
Pentingnya
Belajar Machine Learning
- Machine
Learning Meningkatkan Efisiensi Belanja
- Mendeteksi
Cybercriminal
- Digunakan
di Berbagai Industri
- Merupakan Skill Populer di Pencarian Kerja
g.
Kesimpulan
Machine Learning adalah mesin
yang dapat berjalan dengan mempelajari dirinya sendiri tanpa arahan pengguna. Yaitu mengolah data yang dimiliki.
B.
Data
Mining
a. Pengertian
Data Mining
Data
mining adalah proses pengumpulan sebuah informasi penting pada suatu data yang
berukuran besar. Istilah lain dapat berarti penambangan data yang berbentuk
sebuah tool untuk melakukan analisa dengan teknik penyaringan
informasi secara lebih akurat. Teknik tersebut biasanya dilakukan untuk
menemukan beberapa pola – pola tertentu yang masih memiliki relevansi
dengan goals atau instruksi dari pengguna (user).
b.
Fungsi
Data Mining
- Prediksi
Setelah
menemukan suatu pola dari kumpulan data, pola tersebut digunakan
untuk memprediksi hasil yang terjadi di periode berikutnya.
- Deskripsi
Fungsinya
untuk memahami karakteristik utama dari suatu data.
- Asosiasi
Menemukan
hubungan antar data. Sehingga kamu bisa tahu apakah karakteristik suatu data
dapat mempengaruhi data lainnya.
- Klasifikasi
Fungsinya
untuk memberikan atribut tertentu pada suatu data. Jadi, datanya
lebih mudah untuk diinterpretasikan.
c. Metode Data Mining
1.
Memahami Tujuan Data Mining
Mengidentifikasi
apa yang dibutuhkan
2.
Mengumpulkan Data
Mengumpulkan
data yang relevan dengan tujuan data mining-nya.
3.
Menyiapkan Data
Memastikan
bahwa data yang digali memang sudah lengkap
4.
Proses Modelling
Mencari pola yang ada di dalam datanya.
5.
Evaluasi Pola
Mengevaluasi
polanya.
6.
Penyajian Data
Mempresentasikan
temuan polanya dengan bahasa yang mudah dimengerti.
d.
Penerapan
Data Mining
- Pemasaran
Mengidentifikasi
karakteristik pembeli dan memprediksi perilaku mereka saat melakukan pembelian
- Pendidikan
Memahami
karakteristik masing-masing pelajar. Sehingga dapat diketahui pola pembelajaran
terbaik untuk mereka
- Perbankan
DataMemprediksi
seberapa besar kemungkinan nasabah mengalami gagal bayar saat melakukan
pinjaman
- Asuransi
Memahami
minat dan kebutuhan nasabah asuransi. Sehingga perusahaan asuransi mampu
memberikan penawaran yang lebih menarik
- Telekomunikasi
Memahami
pola yang muncul ketika pembeli mulai berlangganan paket internet, dan juga
pola di mana mereka berhenti berlangganan
- Bisnis
Retail
Mengidentifikasi
korelasi antara penjualan satu produk dengan produk lainnya. Sehingga pemilik
bisnis bisa melakukan strategi bundling atau cross
selling
e.
Kesimpulan
Data Mining adalah Proses pencarian dan pengumpulan
informasi dari sebuah data besar
C.
Artificial
Intellegent
a. Pengertian
Artificial Intellegent
Artificial
intelligence merupakan sebuah teknologi yang memungkinkan sistem komputer,
perangkat lunak, program dan robot untuk “berpikir” secara cerdas layaknya
manusia.
b.
Klasifikasi
AI
- Reactive
Machines (Mesin Reaktif)
Memiliki
kemampuan mengidentifikasi bagian-bagian di papan catur dan membuat prediksi
langkah untuk bisa menang dalam permainan.
- Limited
Memory (Memori Terbatas)
AI yang mampu memberi keputusan di masa depan.
- Theory of Mind (Teori Pikiran)
Sistem
AI yang memiliki keyakinan sendiri, keinginan sendiri, dan niat yang
mempengaruhi keputusan yang dibuatnya
- Self-Awareness
(Kesadaran Diri)
Mesin
yang memiliki kesadaran diri untuk mengerti keadaannya dan dapat mengolah
informasi untuk mengidentifikasi apa yang dirasakan oleh orang lain
c.
Contoh
Penerapan AI
- DeepFace
Facebook
AI
ini berfungsi untuk mengenali wajah orang yang ada pada postingan foto
- Rekomendasi
E-Commerce
AI
memperoleh data dari pelanggan, misalnya ketika kamu melakukan pencarian
produk, pembelian produk dan kamu sudah melihat produk apa saja.
- Asisten
Virtual
Contoh
dari kecerdasan buatan berikutnya adalah asisten virtual, ada banyak penyedia
asisten virtual seperti Google assistant, Siri atau Alexa.
d.
Kesimpulan
Artfticial Intellegent adalah
Kecerdasaran mirip manusia yang diterapkan atau dimodelkan pada sebuah mesin.
D. Regresi
(Regression)
Regresi
adalah suatu teknik analisis untuk mengidentifikasi relasi atau hubungan
diantara dua variabel atau lebih. Regresi bertujuan untuk menemukan suatu
fungsi yang memodelkan data dengan meminimalkan error atau selisih
antara nilai prediksi dengan nilai sebenarnya.
Regresi
termasuk ke dalam supervised learning yang digunakan untuk
memprediksi nilai kontinu. Untuk lebih jelasnya, perhatikan potongan data dari
dataset automobile.
Data
di atas terdiri dari beberapa variabel di antaranya body-style, engine-size, horsepower, peak-rpm,
dan price. Saya sengaja mengambil beberapa variabel saja sebagai contoh,
sementara dataset automobile yang sesungguhnya terdiri dari 26 variabel.
Dalam
regresi, ada dua jenis variabel yaitu Dependent variable dan Independent
variable. Variabel dependen adalah variabel yang akan kita prediksi atau
pelajari, sedangkan variabel independen adalah variabel yang menjelaskan atau menyebabkan
nilai target di variabel dependen.
Variabel
independen dinotasikan dengan X, sementara variabel dependen dinotasikan dengan
Y. Yang harus diperhatikan dalam kasus regresi adalah nilai dari variabel
dependen (Y) harus berupa nilai kontinu, bukan diskrit. Sementara itu untuk
variabel independen (X) bisa berupa nilai kontinu maupun kategori, misalnya
sedan, hatchback, wagon, convertible.
Untuk
memprediksi harga mobil, kita harus membuat model regresi dari data sebelumnya.
Setelah model selesai dibuat, kita dapat menggunakannya untuk memprediksi harga
mobil menggunakan data baru.
-
Tipe model regresi
Pada
dasarnya, ada dua tipe model regresi yaitu simple regression (regresi
sederhana), dan multiple regression (regresi berganda).
Simple
regression adalah ketika hanya satu variabel independen yang digunakan
untuk memprediksi dependen variabel, bisa berupa linear (simple linear
regression) maupun non-linear (simple non-linear regression). Misalnya
memprediksi harga mobil hanya dengan berdasarkan engine-size saja.
Multiple
regression adalah ketika ada lebih dari satu variabel independen yang
digunakan untuk memprediksi variabel dependen. Misalnya memprediksi harga mobil
berdasarkan engine-size, body-style, horsepower, dan sebagainya.
Linearitas regresi ditentukan berdasarkan sifat hubungan antara variabel independen dan dependen. Sama seperti simple regression, multiple regression juga bisa berupa linear maupun non-linear.
-
Algoritma regresi
Linear
regression merupakan salah satu algoritma regresi yang paling populer.
Kenyataannya, bukan hanya linear regression saja yang dapat kita
gunakan untuk pemodelan regresi, tetapi ada banyak algoritma lainnya yang dapat
kita coba, di antaranya:
- Linear
Regression
- Polynomial
Regression
- Lasso
Regression
- Ridge
Regression
- Bayesian
Linear Regression
- Decision
Tree Regression
- Neural
Network Regression
- dan
lain-lain.
Algoritma-algoritma
yang disebutkan di atas hanya sebagian dari teknik yang dapat digunakan untuk
kasus regresi. Seiring dengan proses belajar, mungkin kita akan menemukan serta
dapat mengeksplorasi teknik-teknik regresi lainnya.
Trekz Titanium headphones, review - iTanium-arts.com
BalasHapusA little later, I was wondering if I should give them a babyliss pro nano titanium proper place to listen to my music titanium canteen as I travel in titanium carabiners search of music that does titanium set off metal detectors will titanium pots and pans keep me warm.