OpenAI baru-baru ini mengungkapkan serangkaian model AI baru, yang diberi nama o1, yang dapat “berpikir” lebih lama sebelum memberikan respons. Model ini dikembangkan untuk menangani tugas-tugas yang lebih kompleks, khususnya dalam ilmu pengetahuan, pemrograman, dan matematika. Meskipun OpenAI telah menyimpan sebagian besar informasi tentang cara kerja model ini, beberapa petunjuk memberikan wawasan tentang kemampuannya dan apa yang mungkin menjadi sinyal tentang strategi yang sedang berubah di OpenAI. Dalam artikel ini, kita akan menjelajahi apa yang peluncuran o1 mungkin ungkapkan tentang arah perusahaan dan implikasi lebih luas untuk pengembangan AI.
### Membongkar o1: Serangkaian Model Pemikiran Baru dari OpenAI
o1 adalah generasi baru model AI dari OpenAI yang dirancang untuk mengambil pendekatan yang lebih berpikir dalam memecahkan masalah. Model-model ini dilatih untuk menyempurnakan pemikiran mereka, menjelajahi strategi, dan belajar dari kesalahan. OpenAI melaporkan bahwa o1 telah mencapai peningkatan yang mengesankan dalam pemikiran, menyelesaikan 83% masalah dalam Ujian Kualifikasi Olimpiade Matematika Internasional (IMO)—dibandingkan dengan 13% oleh GPT-4o. Model ini juga unggul dalam pemrograman, mencapai persentil ke-89 dalam kompetisi Codeforces. Menurut OpenAI, pembaruan di masa depan dalam seri ini akan melakukan sejajar dengan mahasiswa PhD di bidang fisika, kimia, dan biologi.
### Strategi AI Berkembang di OpenAI
OpenAI telah menekankan skalabilitas model sebagai kunci untuk membuka kemampuan AI yang canggih sejak awal berdirinya. Dengan GPT-1, yang menampilkan 117 juta parameter, OpenAI menjadi perintis dalam transisi dari model-model kecil yang spesifik tugas ke sistem-sistem umum yang luas. Setiap model berikutnya—GPT-2, GPT-3, dan GPT-4 terbaru dengan 1,7 triliun parameter—menunjukkan bagaimana meningkatnya ukuran model dan data dapat menghasilkan peningkatan kinerja yang substansial.
Namun, perkembangan terbaru menunjukkan pergeseran signifikan dalam strategi OpenAI untuk mengembangkan AI. Sementara perusahaan terus menjelajahi skalabilitas, mereka juga beralih ke arah menciptakan model-model yang lebih kecil dan lebih serbaguna, seperti yang ditunjukkan oleh ChatGPT-4o mini. Pengenalan o1 yang menitikberatkan pada ‘berpikir lebih lama’ lebih lanjut menunjukkan kepergian dari ketergantungan eksklusif pada kemampuan pengenalan pola jaringan saraf ke arah pemrosesan kognitif yang lebih canggih.
### Dari Reaksi Cepat ke Berpikir Mendalam
OpenAI menyatakan bahwa model o1 dirancang khusus untuk menghabiskan lebih banyak waktu untuk berpikir sebelum memberikan respons. Fitur ini dari o1 tampaknya sejalan dengan prinsip teori proses dual, kerangka kerja yang mapan dalam ilmu kognitif yang membedakan antara dua mode berpikir—cepat dan lambat.
Dalam teori ini, Sistem 1 mewakili berpikir cepat, intuitif, membuat keputusan secara otomatis dan intuitif, mirip dengan mengenali wajah atau bereaksi terhadap peristiwa tiba-tiba. Sebaliknya, Sistem 2 terkait dengan pemikiran lambat, delibratif yang digunakan untuk memecahkan masalah kompleks dan membuat keputusan yang berpikir.
Secara historis, jaringan saraf—tulang punggung dari sebagian besar model AI—telah unggul dalam meniru pemikiran Sistem 1. Mereka cepat, berbasis pola, dan unggul dalam tugas-tugas yang membutuhkan respons cepat dan intuitif. Namun, mereka sering kurang tepat ketika pemikiran logis yang lebih dalam diperlukan, sebuah keterbatasan yang telah memicu perdebatan berkelanjutan dalam komunitas AI: Apakah mesin benar-benar dapat meniru proses yang lebih lambat, lebih metodis dari Sistem 2?
Beberapa ilmuwan AI, seperti Geoffrey Hinton, menyarankan bahwa dengan kemajuan yang cukup, jaringan saraf akhirnya dapat menunjukkan perilaku yang lebih berpikir, cerdas secara mandiri. Ilmuwan lain, seperti Gary Marcus, berargumen untuk pendekatan hibrida, menggabungkan jaringan saraf dengan penalaran simbolik untuk seimbang antara respons cepat, intuitif, dan pemikiran analitis yang lebih delibratif. Pendekatan ini sudah diuji dalam model-model seperti AlphaGeometry dan AlphaGo, yang menggunakan penalaran neural dan simbolik untuk menangani masalah matematika yang kompleks dan sukses bermain game strategis.
Model o1 dari OpenAI mencerminkan minat yang semakin meningkat dalam mengembangkan model Sistem 2, menunjukkan pergeseran dari AI yang hanya berbasis pola ke mesin pemecah masalah yang lebih berpikir, mampu meniru kedalaman kognitif manusia.
### Apakah OpenAI Mengadopsi Strategi Neurosimbolik Google?
Selama bertahun-tahun, Google telah mengejar jalur ini, menciptakan model-model seperti AlphaGeometry dan AlphaGo untuk unggul dalam tugas-tugas penalaran kompleks seperti dalam Olimpiade Matematika Internasional (IMO) dan permainan strategi Go. Model-model ini menggabungkan pengenalan pola intuitif dari jaringan saraf seperti large language models (LLMs) dengan logika terstruktur dari mesin penalaran simbolik. Hasilnya adalah kombinasi yang kuat di mana LLM menghasilkan wawasan cepat dan intuitif, sementara mesin simbolik memberikan pemikiran lebih lambat, lebih delibratif, dan rasional.
Pergeseran Google ke sistem neurosimbolik dipicu oleh dua tantangan utama: keterbatasan ketersediaan dataset besar untuk melatih jaringan saraf dalam penalaran lanjutan dan kebutuhan untuk mencampur adukkan intuisi dengan logika yang ketat untuk memecahkan masalah yang sangat kompleks. Sementara jaringan saraf luar biasa dalam mengidentifikasi pola dan menawarkan solusi yang mungkin, mereka sering gagal memberikan penjelasan atau menangani kedalaman logis yang diperlukan untuk matematika tingkat lanjut. Mesin penalaran simbolik mengatasi kesenjangan ini dengan memberikan solusi terstruktur, logis—meskipun dengan beberapa pengorbanan dalam hal kecepatan dan fleksibilitas.
Dengan menggabungkan pendekatan ini, Google telah berhasil memperluas modelnya, memungkinkan AlphaGeometry dan AlphaGo bersaing di level tertinggi tanpa campur tangan manusia dan mencapai prestasi luar biasa, seperti AlphaGeometry meraih medali perak di IMO dan AlphaGo mengalahkan juara dunia dalam permainan Go. Keberhasilan ini dari Google menunjukkan bahwa OpenAI mungkin mengadopsi strategi neurosimbolik yang serupa, mengikuti langkah Google dalam bidang pengembangan AI yang berkembang ini.
### o1 dan Frontier Berikutnya dari AI
Meskipun cara kerja yang tepat dari model o1 dari OpenAI masih dirahasiakan, satu hal yang jelas: perusahaan ini sangat fokus pada adaptasi kontekstual. Ini berarti mengembangkan sistem AI yang dapat menyesuaikan respons mereka berdasarkan kompleksitas dan spesifik dari setiap masalah. Daripada menjadi pemecah masalah yang umum, model-model ini dapat menyesuaikan strategi berpikir mereka untuk lebih baik menangani berbagai aplikasi, dari penelitian hingga tugas sehari-hari.
Salah satu perkembangan yang menarik bisa menjadi munculnya AI introspektif. Berbeda dengan model-model tradisional yang hanya mengandalkan data yang ada, penekanan o1 pada pemikiran yang lebih berpikir menunjukkan bahwa AI masa depan mungkin belajar dari pengalaman mereka sendiri. Seiring waktu, hal ini bisa mengarah pada model-model yang menyempurnakan pendekatan pemecahan masalah mereka, membuat mereka lebih dapat beradaptasi dan tangguh.
Kemajuan OpenAI dengan o1 juga memberi petunjuk tentang pergeseran dalam metode pelatihan. Kinerja model dalam tugas-tugas kompleks seperti ujian kualifikasi IMO menunjukkan kita mungkin akan melihat pelatihan yang lebih khusus, berfokus pada masalah tertentu. Kemampuan ini bisa menghasilkan dataset dan strategi pelatihan yang lebih terarah untuk membangun kemampuan kognitif yang lebih dalam dalam sistem AI, memungkinkan mereka unggul dalam bidang umum dan khusus.
Kinerja model ini dalam bidang matematika dan pemrograman juga membuka kemungkinan menarik untuk pendidikan dan penelitian. Kita bisa melihat tutor AI yang memberikan jawaban dan membantu memandu siswa melalui proses penalaran. AI bisa membantu ilmuwan dalam penelitian dengan mengeksplorasi hipotesis baru, merancang eksperimen, atau bahkan berkontribusi pada penemuan di bidang fisika dan kimia.
### Kesimpulan
Seri o1 dari OpenAI memperkenalkan generasi baru model AI yang dirancang untuk menangani tugas-tugas yang kompleks dan menantang. Meskipun banyak detail tentang model-model ini masih dirahasiakan, mereka mencerminkan pergeseran OpenAI ke pemrosesan kognitif yang lebih dalam, melampaui sekadar peningkatan skala jaringan saraf. Saat OpenAI terus menyempurnakan model-model ini, kita mungkin memasuki fase baru dalam pengembangan AI di mana AI menyelesaikan tugas dan terlibat dalam pemecahan masalah yang berpikir, yang potensial mengubah pendidikan, penelitian, dan di luar itu.