Pengantar Machine Learning dan Regresi

 Assalamu'alaikum warahmatullah wabarakatuh, Hallo teman - teman semua. Ketemu lagi bersama aku di blogger penddikan ini wkwk. Seperti yang kalian tau bahwa blog ini akan memberikan ilmu - ilmu yang saya pelajari saat ini. Khusunya mengenai ilmu informatika. So, check it's out dan jangan lupa like dan comment yaa!!

Sekarang aku berbagi ilmu pengetahuan tentang mata kuliah machine learning. Yaitu akan membahas sub judul tentang Pengantar Machine Learning dan Regres. Pasti kepo kan?!

Langsung aja check it's out!! 

A.    Machine Learning

a.     Pengertian Machine Learning

Machine learning adalah kumpulan algoritma yang dapat mempelajari dari dan membuat prediksi berdasarkan data yang direkam, mengoptimalkan fungsi utilitas yang diberikan dalam ketidakpastian, mengekstrak struktur data tersembunyi, dan menggolongkan data menjadi deskripsi singkat. 

b.     Tipe – tipe Machine Learning

-       Supervised Learning

Supervised machine learning adalah algoritma machine learning menggunakan data terlabel, contohnya input di mana output-nya diketahui.

Sebagai contoh, sebuah alat memiliki data point yang berlabel F (failed) atau R (runs).

-       Unsupervised learning

Unsupervised machine learning adalah kebalikan dari supervised learning.

Contohnya, unsupervised learning dapat digunakan untuk mengidentifikasi segemen konsumen dengan atribut yang serupa dan mengelompokkannya agar dapat ditangani atau diperlakukan sama dalam sebuah kampanye digital marketing.

-       Reinforcement Learning

Reinforcement learning biasanya digunakan untuk robotik, pembuatan game, dan navigasi.

Dengan metode learning ini, algoritma akan mampu menemukan aksi atau perlakuan yang menghasilkan output terbaik dari hasil uji coba berulang kali (trial and error).

c.     Kompetensi Dasar yang harus dimiliki untuk memulai belajar machine learning 

-       Pengetahuan dasar mengenai bahasa pemrograman dan script

-       Pengetahuan mengenai statistika dan probabilitas.

-       Aljabar linier dan kalkulus

-       Pengetahuan mengenai cara membersihkan dan menyusun raw data ke dalam format yang dibutuhkan. 

d.     Cara Kerja

Dari data tersebut, komputer akan melakukan proses belajar (training) untuk menghasilkan suatu model. Proses belajar ini menggunakan algoritma machine learning sebagai penerapan teknik statistika. Model inilah yang menghasilkan informasi, kemudian dapat dijadikan pengetahuan untuk memecahkan suatu permasalahan sebagai proses input-output. Model yang dihasilkan dapat melakukan klasifikasi ataupun prediksi ke depan.

Untuk memastikan efisiensi model yang terbentuk, data akan dibagi menjadi data pembelajaran (train dataset) dan data pengujian (test dataset). Pembagian data yang digunakan bervariasi bergantung algoritma yang digunakan. Pada umumnya train dataset lebih banyak dari test dataset, misalnya dengan rasio 3:1. Test dataset digunakan untuk menghitung seberapa efisien model yang dihasilkan untuk melakukan klasifikasi atau prediksi kedepan yang disebut test score. Semakin banyak data yang digunakan, test score yang dihasilkan semakin baik. Nilai test score berada dalam rentang 0-1.

e.     Pentingnya Machine Learning

-       Bermanfaat untuk menyelesaikan permasalahan dunia dengan cara yang terukur.

-       Bisa digunakan pada berbagai macam industri dan terus digunakan oleh pemilik industri besar dan peneliti agar dapat terus berkembang.

-       Bisa memroses dan menganalisis data yang lebih besar dan rumit dengan waktu yang lebih singkat.

-       Meningkatkan hingga 16% atau 13 triliun dolar AS untuk perekonomian amerika serikat per tahun 2030. Tentu saja, hal ini pun akan berangsur memengaruhi perekonomian dunia pula.

f.      Pentingnya Belajar  Machine Learning

-       Machine Learning Meningkatkan Efisiensi Belanja

-       Mendeteksi Cybercriminal

-       Digunakan di Berbagai Industri

-       Merupakan Skill Populer di Pencarian Kerja

g.     Kesimpulan

Machine Learning adalah mesin yang dapat berjalan dengan mempelajari dirinya sendiri tanpa arahan pengguna. Yaitu mengolah data yang dimiliki.

B.    Data Mining

a.     Pengertian Data Mining

Data mining adalah proses pengumpulan sebuah informasi penting pada suatu data yang berukuran besar. Istilah lain dapat berarti penambangan data yang berbentuk sebuah tool untuk melakukan analisa dengan teknik penyaringan informasi secara lebih akurat. Teknik tersebut biasanya dilakukan untuk menemukan beberapa pola – pola tertentu yang masih memiliki relevansi dengan goals atau instruksi dari pengguna (user).

b.     Fungsi Data Mining

-       Prediksi

Setelah menemukan suatu pola dari kumpulan data, pola tersebut digunakan untuk memprediksi hasil yang terjadi di periode berikutnya.

-       Deskripsi

Fungsinya untuk memahami karakteristik utama dari suatu data.

-       Asosiasi

Menemukan hubungan antar data. Sehingga kamu bisa tahu apakah karakteristik suatu data dapat mempengaruhi data lainnya.

-       Klasifikasi

Fungsinya untuk memberikan atribut tertentu pada suatu data. Jadi, datanya lebih mudah untuk diinterpretasikan.

c.     Metode Data Mining

1. Memahami Tujuan Data Mining

Mengidentifikasi apa yang dibutuhkan

2. Mengumpulkan Data

Mengumpulkan data yang relevan dengan tujuan data mining-nya. 

3. Menyiapkan Data

Memastikan bahwa data yang digali memang sudah lengkap

4. Proses Modelling

Mencari pola yang ada di dalam datanya.

5. Evaluasi Pola

Mengevaluasi polanya. 

6. Penyajian Data

Mempresentasikan temuan polanya dengan bahasa yang mudah dimengerti.

d.     Penerapan Data Mining

-       Pemasaran

Mengidentifikasi karakteristik pembeli dan memprediksi perilaku mereka saat melakukan pembelian

-       Pendidikan

Memahami karakteristik masing-masing pelajar. Sehingga dapat diketahui pola pembelajaran terbaik untuk mereka

-       Perbankan

DataMemprediksi seberapa besar kemungkinan nasabah mengalami gagal bayar saat melakukan pinjaman

-       Asuransi

Memahami minat dan kebutuhan nasabah asuransi. Sehingga perusahaan asuransi mampu memberikan penawaran yang lebih menarik

-       Telekomunikasi

Memahami pola yang muncul ketika pembeli mulai berlangganan paket internet, dan juga pola di mana mereka berhenti berlangganan

-       Bisnis Retail

Mengidentifikasi korelasi antara penjualan satu produk dengan produk lainnya. Sehingga pemilik bisnis bisa melakukan strategi bundling atau cross selling

e.     Kesimpulan

Data Mining adalah Proses pencarian dan pengumpulan informasi dari sebuah data besar

C.    Artificial Intellegent

a.     Pengertian Artificial Intellegent

Artificial intelligence merupakan sebuah teknologi yang memungkinkan sistem komputer, perangkat lunak, program dan robot untuk “berpikir” secara cerdas layaknya manusia.

b.     Klasifikasi AI

-       Reactive Machines (Mesin Reaktif)

Memiliki kemampuan mengidentifikasi bagian-bagian di papan catur dan membuat prediksi langkah untuk bisa menang dalam permainan. 

-       Limited Memory (Memori Terbatas)

AI yang mampu memberi keputusan di masa depan.

-       Theory of Mind (Teori Pikiran)

Sistem AI yang memiliki keyakinan sendiri, keinginan sendiri, dan niat yang mempengaruhi keputusan yang dibuatnya

-       Self-Awareness (Kesadaran Diri)

Mesin yang memiliki kesadaran diri untuk mengerti keadaannya dan dapat mengolah informasi untuk mengidentifikasi apa yang dirasakan oleh orang lain

c.     Contoh Penerapan AI

-       DeepFace Facebook

AI ini berfungsi untuk mengenali wajah orang yang ada pada postingan foto

-       Rekomendasi E-Commerce

AI memperoleh data dari pelanggan, misalnya ketika kamu melakukan pencarian produk, pembelian produk dan kamu sudah melihat produk apa saja.

-       Asisten Virtual

Contoh dari kecerdasan buatan berikutnya adalah asisten virtual, ada banyak penyedia asisten virtual seperti Google assistant, Siri atau Alexa. 

d.     Kesimpulan

Artfticial Intellegent adalah Kecerdasaran mirip manusia yang diterapkan atau dimodelkan pada sebuah mesin.

D.    Regresi (Regression)

Regresi adalah suatu teknik analisis untuk mengidentifikasi relasi atau hubungan diantara dua variabel atau lebih. Regresi bertujuan untuk menemukan suatu fungsi yang memodelkan data dengan meminimalkan error atau selisih antara nilai prediksi dengan nilai sebenarnya.

Regresi termasuk ke dalam supervised learning yang digunakan untuk memprediksi nilai kontinu. Untuk lebih jelasnya, perhatikan potongan data dari dataset automobile. 

Data di atas terdiri dari beberapa variabel di antaranya body-style, engine-size, horsepower, peak-rpm, dan price. Saya sengaja mengambil beberapa variabel saja sebagai contoh, sementara dataset automobile yang sesungguhnya terdiri dari 26 variabel.

Dalam regresi, ada dua jenis variabel yaitu Dependent variable dan Independent variable. Variabel dependen adalah variabel yang akan kita prediksi atau pelajari, sedangkan variabel independen adalah variabel yang menjelaskan atau menyebabkan nilai target di variabel dependen.

Variabel independen dinotasikan dengan X, sementara variabel dependen dinotasikan dengan Y. Yang harus diperhatikan dalam kasus regresi adalah nilai dari variabel dependen (Y) harus berupa nilai kontinu, bukan diskrit. Sementara itu untuk variabel independen (X) bisa berupa nilai kontinu maupun kategori, misalnya sedan, hatchback, wagon, convertible.

Untuk memprediksi harga mobil, kita harus membuat model regresi dari data sebelumnya. Setelah model selesai dibuat, kita dapat menggunakannya untuk memprediksi harga mobil menggunakan data baru.

-       Tipe model regresi

Pada dasarnya, ada dua tipe model regresi yaitu simple regression (regresi sederhana), dan multiple regression (regresi berganda).

Simple regression adalah ketika hanya satu variabel independen yang digunakan untuk memprediksi dependen variabel, bisa berupa linear (simple linear regression) maupun non-linear (simple non-linear regression). Misalnya memprediksi harga mobil hanya dengan berdasarkan engine-size saja.

Multiple regression adalah ketika ada lebih dari satu variabel independen yang digunakan untuk memprediksi variabel dependen. Misalnya memprediksi harga mobil berdasarkan engine-size, body-style, horsepower, dan sebagainya.

Linearitas regresi ditentukan berdasarkan sifat hubungan antara variabel independen dan dependen. Sama seperti simple regression, multiple regression juga bisa berupa linear maupun non-linear.

-       Algoritma regresi

Linear regression merupakan salah satu algoritma regresi yang paling populer. Kenyataannya, bukan hanya linear regression saja yang dapat kita gunakan untuk pemodelan regresi, tetapi ada banyak algoritma lainnya yang dapat kita coba, di antaranya:

-       Linear Regression

-       Polynomial Regression

-       Lasso Regression

-       Ridge Regression

-       Bayesian Linear Regression

-       Decision Tree Regression

-       Neural Network Regression

-       dan lain-lain.

Algoritma-algoritma yang disebutkan di atas hanya sebagian dari teknik yang dapat digunakan untuk kasus regresi. Seiring dengan proses belajar, mungkin kita akan menemukan serta dapat mengeksplorasi teknik-teknik regresi lainnya.

 

Komentar

  1. Trekz Titanium headphones, review - iTanium-arts.com
    A little later, I was wondering if I should give them a babyliss pro nano titanium proper place to listen to my music titanium canteen as I travel in titanium carabiners search of music that does titanium set off metal detectors will titanium pots and pans keep me warm.

    BalasHapus

Posting Komentar

Postingan populer dari blog ini

LENGKAP!! MATERI LIMIT FUNGSI :)

Q-Learning

NILAI MAKSIMUM JEUNG MINIMUM | KALKULUS 1 | BAHASA SUNDA