Sebagian besar dari Anda mungkin sudah mendengar berita ini - Ding Liren adalah Juara Catur Dunia yang baru. Sebagai penggemar catur, saya tentu saja mengikuti perkembangan permainan ini-dan menganalisisnya menggunakan bot AI bernama Stockfish.
Bagaimana mesin catur seperti Stockfish menganalisis dan mengevaluasi posisi dengan tepat tidak diketahui - tetapi hasilnya dapat dipahami oleh manusia. Evaluasi positif berarti putih menang, hasil seri diberi evaluasi 0, dan evaluasi negatif berarti hitam menang, dan seterusnya.
Tapi dari mana angka ini berasal? Angka ini berasal dari evaluasi Stockfish sendiri terhadap posisi, dengan mempertimbangkan banyak faktor, dan menghasilkan sebuah angka. Kita sering diberitahu bahwa angka tersebut kira-kira setara dengan jumlah pion yang dimiliki oleh salah satu pihak.
Namun, ini adalah cara yang sangat tidak intuitif bagi para pemain catur untuk memahami posisi catur.
Angka tersebut memberi kita jawaban, ya. Dan angka tersebut secara objektif benar hampir sepanjang waktu karena AI telah berhasil memperhitungkan begitu banyak faktor yang berbeda, kemungkinan pergerakan di masa depan, dan banyak lagi untuk sampai pada evaluasinya tentang siapa yang menang dan apa langkah terbaik.
Yang jauh lebih penting adalah pertanyaan 'mengapa evaluasi posisi tersebut seperti itu? Dan mengetahui jawabannya sama sekali tidak menjelaskan kepada Anda alasan dari jawaban tersebut.
Sebagai pemain catur, hal ini bisa sangat menyebalkan. Hal ini memaksa kita untuk menghabiskan waktu untuk menemukan alasan evaluasi mesin catur, dan sering kali, alasan ini sulit ditemukan.
Bayangkan seorang guru yang memberi Anda soal yang sangat sulit, yang juga memberi Anda jawabannya, tetapi menolak untuk membahasnya dengan Anda atau memberikan petunjuk. Anda akan dengan tepat menyimpulkan bahwa guru tersebut adalah guru yang buruk. Namun, jawabannya hampir pasti benar-dengan alasan yang bagus.
Dan ini bukan satu-satunya saat algoritma AI membingungkan kita. Algoritme AI digunakan di situs web seperti Netflix dan Youtube untuk merekomendasikan video yang bisa kita tonton, di mana semakin lama kita berada di situs tersebut, semakin baik algoritme tersebut, tetapi hanya sedikit yang kita pahami tentang algoritme AI ini selain dari metrik yang digunakan untuk mengukur keberhasilannya dan data yang dapat diakses oleh algoritme tersebut.
Namun, memahami alasan kesuksesan mereka akan sangat membantu kita, dan di sinilah perkembangan besar AI selanjutnya - dalam membuat AI yang dapat dipahami oleh kita.
Objektivitas tidak sama dengan kejelasan
Yang saya maksud dengan membuat AI yang dapat dimengerti oleh kita bukan berarti kita dapat memahami apa yang dikatakan oleh AI tersebut - melainkan AI yang dapat dijelaskan secara intuitif.
Mitra Stockfish adalah AlphaZero - dibangun oleh Deepmind, anak perusahaan Google. Alih-alih mengevaluasi posisi dan langkah catur dan mengeluarkan angka yang tampaknya acak, AlphaZero malah mengukur posisi dengan probabilitas. Setiap keluaran dari AlphaZero akan berada di antara -1 hingga 1, sedangkan Stockfish akan sering memberikan angka yang bisa mencapai ratusan, tanpa jelas apa arti angka-angka ini.
Bagan di bawah ini menunjukkan bagaimana evaluasi mesin catur tradisional, yang sering dilambangkan dengan centipawns, berkorelasi dengan evaluasi Leela (penerus AlphaZero).
Yang penting adalah bahwa AlphaZero dan Leela masih memberikan evaluasi yang objektif - tetapi evaluasi ini terasa jauh lebih intuitif. Mengapa? Karena ini memberikan evaluasi yang juga lebih sesuai dengan apa yang Anda rasakan.
Memiliki posisi dari 0 hingga +5 berkorelasi dengan permainan yang berubah dari seri menjadi putih yang memiliki probabilitas tinggi untuk menang. Tetapi apakah ada perbedaan yang besar antara posisi yang berubah dari +5 ke +10? Meskipun Stockfish memberikan perbedaan yang sama dalam evaluasi, perubahan dari 0 ke +5 secara kasar mencerminkan perubahan dari tidak ada peluang untuk menang menjadi 80% peluang untuk menang, sementara perubahan dari +5 ke +10 hanya meningkatkan peluang untuk menang sebesar 10%.
Mengapa metrik ini lebih baik? Karena metrik ini juga lebih berkorelasi dengan bagaimana posisi itu terasa bagi kita. Melihat posisi berubah dari seri 0 menjadi keunggulan +5 terasa seperti White menekan lawannya dengan baik sementara lawannya menyerah pada tekanan. Di sisi lain, peningkatan dari keunggulan +5 ke +10 tidak terasa banyak karena sebagian besar pekerjaan telah dilakukan.
Ini adalah bagian dari apa yang saya maksudkan dengan membuat AI lebih mudah dipahami - AI dalam hal ini lebih mudah dimengerti. AI jauh lebih intuitif dan memberikan output yang secara objektif benar, tetapi juga yang bisa kita rasakan.
AI tradisional selalu bagus dalam hal objektivitas - tetapi manusia tidak akan melihat peningkatan besar dari AI yang terus meningkatkan objektivitasnya. Inilah yang disebut oleh pendiri Paypal, Peter Thiel, sebagai 'bergerak dari 1 ke n'. Sebaliknya, yang kita butuhkan adalah 'bergerak dari 0 ke 1' dan melakukan sesuatu yang berbeda - dan itu adalah membuat AI lebih mudah dipahami oleh manusia.
AlphaZero telah mencapai sebagian dari hal ini-dengan membuat outputnya lebih intuitif, AlphaZero sedang dalam perjalanan untuk membuat AI lebih dimengerti oleh manusia. Tapi apa lagi yang bisa dilakukan?
Memahami kemanusiaan
Pada tahun 1983, sebuah iklan majalah diterbitkan oleh Electronic Arts. Iklan ini diterbitkan pada era di mana komputer baru saja muncul. Di dalamnya, iklan tersebut menjanjikan untuk memenuhi potensi komputer pribadi.
Dimulai dengan sebuah pertanyaan penting, dan beberapa bahan untuk dipikirkan:
"Bisakah komputer membuat Anda menangis? Saat ini, tidak ada yang tahu. Hal ini sebagian karena banyak yang menganggap ide tersebut sangat remeh. Tetapi juga karena siapa pun yang berhasil menjawab pertanyaan ini harus terlebih dahulu menjawab beberapa pertanyaan lainnya.
Mengapa kita menangis? Mengapa kita tertawa, atau mencintai, atau tersenyum? Apa saja yang menjadi batu ujian bagi emosi kita?
Hingga saat ini, orang-orang yang mengajukan pertanyaan seperti itu cenderung bukan orang yang sama yang menjalankan perusahaan perangkat lunak. Sebaliknya, mereka adalah penulis, pembuat film, pelukis, musisi. Mereka, dalam pengertian tradisional, adalah seniman."
Ini adalah pertanyaan-pertanyaan yang sudah diperkirakan pada tahun 1983 - ketika komputer pertama kali menjadi produk konsumen massal. Namun, pertanyaan-pertanyaan tersebut masih relevan hingga saat ini. Selama beberapa dekade terakhir, kami telah menghasilkan AI yang semakin baik dalam hal kalkulasi, objektivitas, dan pemahaman konseptual.
Namun saat ini, pertanyaan-pertanyaan tersebut, meskipun masih penting, semakin lama semakin tidak menjadi satu-satunya pertanyaan yang perlu dijawab. Pertanyaan-pertanyaan baru, tentang bagaimana AI mengekspresikan dirinya sendiri dengan cara yang dapat dimengerti oleh manusia, atau tentang bagaimana manusia dapat memahami AI dengan lebih baik, perlu ditanyakan.
Penjelasan yang lebih baik dari AI tentang jawaban yang mereka hasilkan akan memberikan lebih banyak kejelasan tentang apa yang mendasari keputusan mereka, dan mengapa jawaban mereka benar. Lagipula, ketika para peneliti mempublikasikan hasil penelitian mereka, yang penting bukan hanya kesimpulannya saja-mereka diharapkan untuk menyertakan metodologi, kumpulan data, penalaran kualitatif, dan masih banyak lagi.
Untuk belajar dari AI, manusia perlu memahami AI dengan lebih baik, dan AI perlu berkomunikasi dengan lebih baik dengan manusia-tidak hanya melalui angka, sinyal, dan lampu, tetapi juga melalui kata-kata, gambar, dan emosi. Untuk menjelaskan keputusan yang dapat diambil, perhitungan yang dilakukan, dan tujuan dari operasi ini, adalah hal yang perlu dilakukan oleh AI dengan lebih baik.
Langkah selanjutnya dalam AI tidak akan dibuat dengan meningkatkan daya komputasi komputer-tetapi akan dibuat dengan membuat AI mengekspresikan dirinya sendiri dengan cara yang dapat dipahami manusia dengan lebih baik, dan cara-cara yang dapat dilakukan oleh non-pemrogram.