Bespoke LLMs untuk Setiap Bisnis? DeepSeek Menunjukkan Jalan Bagi Kita
Pada suatu waktu, teriakan tekno adalah “ponsel untuk semua” – dan memang komunikasi seluler telah merevolusi bisnis (dan dunia). Hari ini, setara dengan teriakan itu adalah memberikan akses kepada semua aplikasi AI. Namun, kekuatan sebenarnya dari AI adalah dalam memanfaatkannya untuk kebutuhan khusus bisnis dan organisasi. Langkah yang ditempuh oleh startup China, DeepSeek, menunjukkan bagaimana AI memang dapat dimanfaatkan oleh semua orang, terutama mereka dengan anggaran terbatas, untuk memenuhi kebutuhan mereka secara spesifik. Memang, kemunculan AI dengan biaya lebih rendah menjanjikan untuk mengubah pola solusi AI yang seringkali tetap tidak terjangkau bagi banyak bisnis kecil dan organisasi karena persyaratan biaya.
LLMs – atau dahulu – adalah usaha yang mahal, membutuhkan akses ke jumlah data yang besar, jumlah komputer yang kuat untuk memproses data, dan waktu serta sumber daya yang diinvestasikan untuk melatih model. Namun, aturan tersebut sedang berubah. Beroperasi dengan anggaran minim, DeepSeek mengembangkan LLM sendiri, dan aplikasi tipe ChatGPT untuk pertanyaan – dengan investasi yang jauh lebih kecil daripada sistem serupa yang dibangun oleh perusahaan-perusahaan Amerika dan Eropa. Pendekatan DeepSeek membuka jendela ke pengembangan LLM untuk organisasi kecil yang tidak memiliki miliaran untuk dihabiskan. Bahkan, tidak lama lagi, kebanyakan organisasi kecil mungkin dapat mengembangkan LLM mereka sendiri untuk melayani tujuan khusus mereka, biasanya memberikan solusi yang lebih efektif daripada LLM umum seperti ChatGPT.
Sementara perdebatan tetap berlangsung mengenai biaya sebenarnya DeepSeek, bukan hanya biaya yang membedakannya dari model serupa: Yang terpenting adalah fakta bahwa DeepSeek mengandalkan chip yang kurang canggih dan pendekatan yang lebih fokus untuk pelatihan. Sebagai perusahaan Tiongkok yang tunduk pada pembatasan ekspor AS, DeepSeek tidak dapat mengakses chip Nvidia canggih yang umumnya digunakan untuk komputasi berat yang dibutuhkan untuk pengembangan LLM, dan oleh karena itu terpaksa menggunakan chip Nvidia H-800 yang kurang kuat, yang tidak dapat memproses data dengan cepat atau efisien.
Untuk mengompensasi kekurangannya tersebut, DeepSeek mengambil pendekatan pengembangan LLM yang berbeda, lebih fokus dan langsung. Alih-alih melemparkan tumpukan data pada model dan mengandalkan kekuatan komputasi untuk memberi label dan menerapkan data, DeepSeek mempersempit pelatihan, memanfaatkan sejumlah kecil data “cold-start” berkualitas tinggi dan menerapkan IRL (pembelajaran penguatan iteratif, dengan algoritma menerapkan data pada berbagai skenario dan belajar dari itu). Pendekatan yang difokuskan ini memungkinkan model untuk belajar lebih cepat, dengan lebih sedikit kesalahan dan lebih sedikit pemborosan daya komputasi.
Sama seperti bagaimana orangtua dapat membimbing gerakan spesifik bayi, membantunya berhasil berguling untuk pertama kalinya – daripada membiarkan bayi itu mencoba memahami sendiri, atau mengajarkan bayi gerakan yang lebih bervariasi yang pada teorinya dapat membantu berguling – para ilmuwan data yang melatih model AI yang lebih difokus mengzoom pada apa yang paling diperlukan untuk tugas dan hasil tertentu. Model-model seperti itu kemungkinan tidak memiliki aplikasi yang luas seperti LLM yang lebih besar seperti ChatGPT, tetapi mereka dapat diandalkan untuk aplikasi tertentu, dan menjalankannya dengan presisi dan efisiensi. Bahkan para kritikus DeepSeek mengakui bahwa pendekatan mereka yang disederhanakan dalam pengembangan secara signifikan meningkatkan efisiensi, memungkinkan mereka melakukan lebih banyak dengan lebih sedikit.
Pendekatan ini tentang memberikan AI input terbaik sehingga ia dapat mencapai tonggak-tonggaknya dengan cara yang paling cerdas, paling efisien, dan dapat berharga bagi setiap organisasi yang ingin mengembangkan LLM untuk kebutuhan dan tugas spesifiknya. Pendekatan seperti ini semakin berharga bagi bisnis kecil dan organisasi. Langkah pertama adalah memulai dengan data yang tepat. Sebagai contoh, sebuah perusahaan yang ingin menggunakan AI untuk membantu tim penjualan dan pemasarannya harus melatih modelnya pada kumpulan data yang dipilih secara hati-hati yang menitikberatkan pada percakapan penjualan, strategi, dan metrik. Hal ini menjaga model dari membuang waktu dan daya komputasi pada informasi yang tidak relevan. Selain itu, pelatihan perlu terstruktur dalam tahapan, memastikan model menguasai setiap tugas atau konsep sebelum beralih ke yang berikutnya.
Ini juga memiliki paralel dalam mengasuh bayi, seperti yang saya pelajari sendiri sejak menjadi seorang ibu beberapa bulan yang lalu. Dalam kedua skenario tersebut, pendekatan berpandu, langkah demi langkah, menghindari pemborosan sumber daya dan mengurangi gesekan. Akhirnya, pendekatan seperti ini dengan manusia bayi dan model AI menghasilkan perbaikan secara iteratif. Saat bayi tumbuh, atau model belajar lebih banyak, kemampuannya meningkat. Ini berarti model dapat disempurnakan dan ditingkatkan untuk lebih baik menangani situasi dunia nyata.
Pendekatan ini mempertahankan biaya rendah, mencegah proyek AI menjadi beban sumber daya, menjadikannya lebih mudah diakses bagi tim dan organisasi yang lebih kecil. Ini juga mengarah pada kinerja yang lebih baik dari model AI dengan lebih cepat; dan, karena model tidak terbebani dengan data eksternal, mereka juga dapat disesuaikan untuk beradaptasi dengan informasi baru dan perubahan kebutuhan bisnis – kunci dalam pasar yang kompetitif.
Kedatangan DeepSeek dan dunia AI yang lebih efisien dan lebih murah – meskipun awalnya menimbulkan kepanikan di dunia AI dan pasar saham – pada akhirnya adalah perkembangan positif bagi sektor AI. Efisiensi yang lebih besar dan biaya lebih rendah AI, setidaknya untuk aplikasi yang difokuskan, pada akhirnya akan mengakibatkan lebih banyak penggunaan AI secara umum, yang mendorong pertumbuhan bagi semua orang, mulai dari pengembang hingga pembuat chip hingga pengguna akhir. Bahkan, DeepSeek mengilustrasikan Paradox Jevons – di mana efisiensi yang lebih tinggi kemungkinan akan menghasilkan lebih banyak penggunaan sumber daya, bukan kurang. Saat tren ini terus berlanjut, bisnis kecil yang fokus pada menggunakan AI untuk memenuhi kebutuhan spesifik mereka juga akan lebih siap untuk pertumbuhan dan keberhasilan.