Q-Learning
Assalamu’alaikum warahmatullah wabarakatuh. Hai gais! Kita masih harus lanjut nih bahas model – model yang udah aku pelajari di mata kuliah Machine Learning. Nah, sekarang kira – kira akan bahas apa yaa.. Yuk Check It’s Out!! Q-Learning A. Pengertian Q-Learning Q -learning adalah algoritma pembelajaran penguatan tanpa model . Q-learning adalah algoritma pembelajaran berbasis nilai . Algoritme berbasis nilai memperbarui fungsi nilai berdasarkan persamaan (khususnya persamaan Bellman). Sedangkan tipe lainnya, policy based mengestimasi fungsi nilai dengan greedy policy yang diperoleh dari perbaikan kebijakan terakhir. Q-learning adalah pembelajar di luar kebijakan . Berarti mempelajari nilai kebijakan optimal secara independen dari tindakan agen. Di sisi lain, pembelajar on-policy mempelajari nilai kebijakan yang dijalankan oleh agen, termasuk langkah-langkah eksplorasi dan akan menemukan kebijakan yang optimal, dengan mempertimbangkan eksplorasi yang melekat pada