Kembalinya Kecerdasan Buatan Sumber Terbuka dengan Llama 4 dari Meta
Dalam beberapa tahun terakhir, dunia kecerdasan buatan telah bergeser dari budaya kolaborasi terbuka menjadi dominasi sistem properti yang dijaga ketat. OpenAI – sebuah perusahaan yang secara harfiah didirikan dengan “terbuka” dalam namanya – beralih untuk menyimpan model-model terkuatnya secara rahasia setelah tahun 2019. Pesaing seperti Anthropic dan Google juga membangun kecerdasan buatan terdepan di balik tembok API, hanya dapat diakses sesuai dengan ketentuan mereka. Pendekatan tertutup ini sebagian dijustifikasi oleh kepentingan keamanan dan bisnis, namun meninggalkan banyak orang dalam komunitas meratapi kehilangan semangat sumber terbuka yang awal.
Sekarang, semangat tersebut kembali bangkit. Model-model Llama 4 yang baru dirilis oleh Meta menandakan upaya berani untuk menghidupkan kembali kecerdasan buatan sumber terbuka pada level tertinggi – dan bahkan pemain yang biasanya dijaga ketat pun sedang memperhatikannya. CEO OpenAI Sam Altman baru-baru ini mengakui bahwa perusahaan tersebut “berada di sisi yang salah dari sejarah” mengenai model terbuka dan mengumumkan rencana untuk varian GPT-4 yang “berbobot baru.” Singkatnya, kecerdasan buatan sumber terbuka melakukan perlawanan, dan makna serta nilai dari “terbuka” sedang berkembang.
Llama 4: Tantangan Terbuka dari Meta untuk GPT-4o, Claude, dan Gemini
Meta mengungkapkan Llama 4 sebagai tantangan langsung terhadap model-model baru dari para pemain berat kecerdasan buatan, menempatkannya sebagai alternatif berbobot terbuka. Llama 4 hadir dalam dua varian yang tersedia saat ini – Llama 4 Scout dan Llama 4 Maverick – dengan spesifikasi teknis yang memukau. Keduanya adalah model “mixture-of-experts (MoE)” yang mengaktifkan hanya sebagian kecil dari parameter mereka per kueri, memungkinkan ukuran total yang besar tanpa menimbulkan biaya runtime yang besar. Scout dan Maverick masing-masing memiliki 17 miliar parameter “aktif” (bagian yang bekerja pada setiap input yang diberikan), tetapi berkat MoE, Scout menyebar di 16 pakar (total 109 miliar parameter) dan Maverick di 128 pakar (total 400 miliar). Hasilnya: model Llama 4 memberikan kinerja yang tangguh – dan melakukannya dengan keunggulan unik yang bahkan beberapa model tertutup pun tidak miliki.
Sebagai contoh, Llama 4 Scout memiliki jendela konteks token 10 juta terbaik di industri, berbeda jauh dari kebanyakan pesaing. Ini berarti dapat menyerap dan merasionalkan dokumen atau basis kode yang benar-benar besar dalam satu proses. Meskipun berskala besar, Scout cukup efisien untuk berjalan pada satu GPU H100 ketika sangat dikuantisasi, memberi petunjuk bahwa pengembang tidak perlu superkomputer untuk bereksperimen dengannya.
Sementara Llama 4 Maverick disetel untuk kepiawaian maksimum. Uji awal menunjukkan bahwa Maverick sebanding atau bahkan mengungguli model tertutup teratas dalam tugas penalaran, pemrograman, dan visi. Bahkan, Meta sudah meramalkan adik yang lebih besar, Llama 4 Behemoth, yang masih dalam pelatihan, yang secara internal “lebih unggul dari GPT-4.5, Claude 3.7 Sonnet, dan Gemini 2.0 Pro dalam beberapa benchmark STEM.” Pesan ini jelas: model terbuka tidak lagi jenis kedua; Llama 4 sedang berusaha untuk meraih status terbaik.
Sama pentingnya, Meta telah membuat Llama 4 langsung tersedia untuk diunduh dan digunakan. Pengembang dapat mengunduh Scout dan Maverick dari situs resmi atau Hugging Face di bawah Lisensi Komunitas Llama 4. Ini berarti siapa pun – mulai dari peretas garasi hingga perusahaan Fortune 500 – dapat masuk ke dalamnya, menyetel model sesuai kebutuhan mereka, dan mendeploynya di perangkat keras atau cloud mereka sendiri. Ini merupakan kontras yang tajam dengan penawaran properti seperti GPT-4o dari OpenAI atau Claude 3.7 dari Anthropic, yang disajikan melalui API berbayar tanpa akses ke bobot yang mendasarinya.
Meta menekankan bahwa keterbukaan Llama 4 adalah tentang memberdayakan pengguna: “Kami membagikan model-model pertama di kawanan Llama 4, yang akan memungkinkan orang untuk membangun pengalaman multimodal yang lebih personal.” Dengan kata lain, Llama 4 adalah seperangkat alat yang dimaksudkan untuk berada di tangan pengembang dan peneliti di seluruh dunia. Dengan merilis model yang dapat menyaingi GPT-4 dan Claude dalam kemampuan, Meta menghidupkan kembali gagasan bahwa kecerdasan buatan kelas atas tidak harus berada di balik tembok pembayaran.
Idealisme Otentik atau Permainan Strategis?
Meta memperkenalkan Llama 4 dalam istilah yang agung, hampir altruistik. “Model kecerdasan buatan sumber terbuka kami, Llama, telah diunduh lebih dari satu miliar kali,” CEO Mark Zuckerberg mengumumkan baru-baru ini, menambahkan bahwa “membuka sumber model kecerdasan buatan penting untuk memastikan bahwa orang di mana saja memiliki akses ke manfaat kecerdasan buatan.” Framing ini menggambarkan Meta sebagai pembawa obor kecerdasan buatan yang terdemokratisasi – sebuah perusahaan yang bersedia membagikan model-model mahkota mereka untuk kebaikan yang lebih besar. Dan memang, popularitas keluarga Llama mendukung hal ini: model-model tersebut telah diunduh dalam skala yang mengagumkan (melonjak dari 650 juta menjadi 1 miliar total unduhan dalam beberapa bulan saja), dan mereka sudah digunakan dalam produksi oleh perusahaan seperti Spotify, AT&T, dan DoorDash.
Meta dengan bangga mencatat bahwa pengembang menghargai “transparansi, kustomisabilitas, dan keamanan” dari memiliki model-model terbuka yang dapat mereka jalankan sendiri, yang “membantu mencapai tingkat kreativitas dan inovasi yang lebih tinggi,” dibandingkan dengan API kotak hitam. Pada prinsipnya, ini terdengar seperti etos perangkat lunak sumber terbuka lama (pikirkan Linux atau Apache) yang diterapkan pada kecerdasan buatan – kemenangan yang tidak meragukan bagi komunitas.
Namun, kita tidak bisa mengabaikan kalkulasi strategis di balik keterbukaan ini. Meta bukan badan amal, dan “sumber terbuka” dalam konteks ini datang dengan catatan kaki. Terutama, Llama 4 dirilis di bawah lisensi komunitas khusus, bukan lisensi permissive standar – jadi meskipun bobot model dapat digunakan secara gratis, ada pembatasan (misalnya, beberapa kasus penggunaan sumber daya tinggi mungkin memerlukan izin, dan lisensi tersebut “properti” dalam artian bahwa itu dibuat oleh Meta). Ini bukan definisi sumber terbuka yang disetujui oleh Open Source Initiative (OSI), yang telah membuat beberapa kritikus berpendapat bahwa perusahaan sedang menyalahgunakan istilah tersebut.
Dalam praktiknya, pendekatan Meta sering dijelaskan sebagai kecerdasan buatan “berbobot terbuka” atau “tersedia sumbernya”: kode dan bobotnya terbuka, tetapi Meta masih mempertahankan sebagian kontrol dan tidak mengungkapkan semuanya (misalnya, data pelatihan). Hal ini tidak mengurangi manfaat bagi pengguna, tetapi menunjukkan bahwa Meta terbuka secara strategis – menyimpan kendali yang cukup untuk melindungi dirinya sendiri (dan mungkin keunggulan kompetitifnya). Banyak perusahaan menempelkan label “sumber terbuka” pada model-model kecerdasan buatan sementara menyembunyikan detail penting, menggoyahkan semangat sejati dari keterbukaan.
Mengapa Meta membuka diri sama sekali? Lanskap persaingan memberikan petunjuk. Melepaskan model-model kuat secara gratis dapat dengan cepat membangun basis pengguna pengembang dan perusahaan yang luas – Mistral AI, sebuah startup Prancis, melakukan hal yang sama dengan model-model terbukanya untuk mendapatkan kredibilitas sebagai laboratorium kelas atas. Dengan menyebarkan pasar dengan Llama, Meta memastikan teknologinya menjadi fondasi dalam ekosistem kecerdasan buatan, yang dapat memberikan manfaat jangka panjang. Ini adalah strategi pelukan-dan-perpanjang klasik: jika semua orang menggunakan model “terbuka” Anda, Anda secara tidak langsung menetapkan standar dan bahkan mungkin mengarahkan orang ke platform Anda (misalnya, produk asisten kecerdasan buatan Meta memanfaatkan Llama). Ada juga elemen PR dan posisi. Meta bisa berperan sebagai inovator yang baik hati, terutama jika dibandingkan dengan OpenAI – yang telah dihadapi kritik atas pendekatannya yang tertutup. Bahkan, perubahan hati OpenAI tentang model terbuka sebagian menunjukkan seberapa efektifnya langkah Meta telah dilakukan.
Setelah model terbuka China yang inovatif, DeepSeek-R1 muncul pada Januari dan melonjakkan model-model sebelumnya, Altman mengindikasikan bahwa OpenAI tidak ingin ditinggalkan di “sisi yang salah dari sejarah.” Sekarang OpenAI berjanji akan merilis model terbuka dengan kemampuan penalaran yang kuat di masa depan, menandai pergeseran sikap. Sulit untuk tidak melihat pengaruh Meta dalam pergeseran itu. Pengeposan sumber terbuka Meta adalah baik otentik maupun strategis: ini benar-benar memperluas akses ke kecerdasan buatan, tetapi juga adalah permainan cerdas untuk mengalahkan pesaing dan membentuk masa depan pasar sesuai dengan keinginan Meta.
Implikasi bagi Pengembang, Perusahaan, dan Masa Depan Kecerdasan Buatan
Bagi pengembang, kebangkitan model-model terbuka seperti Llama 4 adalah angin segar. Alih-alih terkunci dalam ekosistem dan biaya satu penyedia, sekarang mereka memiliki opsi untuk menjalankan kecerdasan buatan yang kuat pada infrastruktur mereka sendiri atau menyesuaikannya dengan bebas.
Ini adalah keuntungan besar bagi perusahaan di industri sensitif – pikirkan finansial, kesehatan, atau pemerintahan – yang waspada untuk memberikan data rahasia ke dalam kotak hitam orang lain. Dengan Llama 4, sebuah bank atau rumah sakit bisa mendeploy model bahasa terbaru di balik tembok api mereka sendiri, menyetelnya pada data pribadi, tanpa berbagi token dengan entitas luar. Ada juga keuntungan biaya. Sementara biaya API berbasis pengguna untuk model teratas dapat melonjak, model terbuka tidak memiliki biaya penggunaan – Anda hanya membayar untuk daya komputasi untuk menjalankannya. Bisnis yang meningkatkan beban kerja kecerdasan buatan berat berpotensi menghemat secara signifikan dengan memilih solusi terbuka yang dapat mereka perbesar sendiri.
Tidak mengherankan jika kita melihat minat yang lebih besar pada model-model terbuka dari perusahaan; banyak telah mulai menyadari bahwa kontrol dan keamanan kecerdasan buatan sumber terbuka lebih cocok dengan kebutuhan mereka daripada layanan tertutup satu-ukuran-untuk-semua.
Pengembang juga mendapat manfaat dalam inovasi. Dengan akses ke internal model, mereka dapat menyetel dan meningkatkan kecerdasan buatan untuk domain-niche (hukum, bioteknologi, bahasa regional – Anda sebutkan) dengan cara yang mungkin tidak pernah dilayani oleh API tertutup. Ledakan proyek yang didorong oleh komunitas seputar model-model Llama sebelumnya – dari chatbot yang disesuaikan dengan pengetahuan medis hingga aplikasi smartphone hobi yang menjalankan versi mini – membuktikan bagaimana model-model terbuka dapat mendemokratisasi eksperimen.
Namun, kebangkitan model-model terbuka juga menimbulkan pertanyaan sulit. Apakah “demokratisasi” benar-benar terjadi jika hanya mereka dengan sumber daya komputasi yang signifikan yang dapat menjalankan model 400 miliar parameter? Meskipun Llama 4 Scout dan Maverick menurunkan batas keras dibandingkan dengan model monolitik, mereka masih berat – sebuah poin yang tidak hilang pada beberapa pengembang yang PC mereka tidak bisa menangani tanpa bantuan cloud. Harapan adalah bahwa teknik-teknik seperti kompresi model, distilasi, atau varian pakar yang lebih kecil akan mengalirkan kekuatan Llama 4 ke ukuran yang lebih mudah diakses. Sebuah kekhawatiran lain adalah penyalahgunaan. OpenAI dan yang lainnya sudah lama berpendapat bahwa melepaskan model-model yang kuat secara terbuka bisa memungkinkan pelaku jahat (untuk menghasilkan disinformasi, kode malware, dll.).
Kekhawatiran itu tetap: model Claude atau GPT yang terbuka bisa disalahgunakan tanpa filter keamanan yang perusahaan berlakukan pada API mereka. Di sisi lain, para pendukung berargumen bahwa keterbukaan juga memungkinkan komunitas untuk mengidentifikasi dan memperbaiki masalah, membuat model lebih kokoh dan transparan dari waktu ke waktu daripada sistem rahasia manapun. Ada bukti bahwa komunitas model terbuka menganggap keselamatan serius, mengembangkan pagar pengaman mereka sendiri dan berbagi praktik terbaik – tetapi ini adalah ketegangan yang berkelanjutan.
Yang semakin jelas adalah bahwa kita menuju ke arah lanskap kecerdasan buatan hibrida di mana model-model terbuka dan tertutup hidup berdampingan, masing-masing saling memengaruhi. Penyedia tertutup seperti OpenAI, Anthropic, dan Google masih unggul dalam kinerja absolut – untuk saat ini. Memang, pada akhir 2024, penelitian menunjukkan bahwa model-model terbuka tertinggal sekitar satu tahun dari model tertutup terbaik dalam kemampuan. Tetapi kesenjangan itu sedang menutup dengan cepat.
Di pasar saat ini, “kecerdasan buatan sumber terbuka” tidak lagi hanya berarti proyek hobi atau model-model lama – sekarang menjadi inti strategi kecerdasan buatan untuk raksasa teknologi dan startup sama. Peluncuran Llama 4 dari Meta adalah pengingat kuat akan nilai yang terus berubah dari keterbukaan. Ini sekaligus menjadi sikap filosofis untuk mendemokratisasikan teknologi dan langkah taktis dalam pertempuran industri yang berisiko tinggi. Bagi pengembang dan perusahaan, ini membuka pintu baru untuk inovasi dan otonomi, bahkan saat membuat keputusan yang lebih rumit dengan kompromi baru. Dan bagi ekosistem lebih luas, ini menimbulkan harapan bahwa manfaat kecerdasan buatan tidak akan terkunci di tangan beberapa perusahaan – jika etos sumber terbuka dapat bertahan.