"Rantai Pemikiran" adalah cara model AI seperti DeepSeek R1 memecah suatu masalah menjadi langkah-langkah kecil yang logis dan terstruktur. Dengan pendekatan ini, model dapat memberikan jawaban yang lebih akurat karena setiap langkahnya mengikuti alur pemikiran yang jelas.
"Aha moment" yang disebutkan pada contoh di atas adalah ketika model DeepSeek-R1-Zero menyadari bahwa ada sesuatu yang perlu diperiksa ulang dalam proses pemecahan masalah. Ini adalah momen di mana model "berhenti sejenak" untuk mengidentifikasi kemungkinan kesalahan atau langkah yang kurang tepat dalam perhitungan sebelumnya. Momen ini menunjukkan kemampuan model untuk berpikir ulang dan memperbaiki dirinya sendiri, yang sangat penting dalam pembelajaran berbasis penguatan (reinforcement learning).

Mari kita analisis lebih dalam:

1. Proses Awal
Model mencoba menyelesaikan persamaan.


Model kemudian mencoba menyusun ulang untuk memisahkan akar dalam. Namun, pada langkah ini, muncul kerumitan dalam bentuk persamaan kuadrat atau bahkan pangkat empat.

2. Momen "Aha"