Generative AI Bukan Kalimat Mati bagi Bahasa-bahasa yang Terancam Punah
Menurut UNESCO, hingga separuh dari jumlah bahasa di dunia bisa punah pada tahun 2100. Banyak orang mengatakan bahwa generative AI berkontribusi pada proses ini. Penurunan keragaman bahasa tidak dimulai dengan AI atau Internet. Namun, AI berada dalam posisi untuk mempercepat kepunahan bahasa-bahasa asli dan berdaya yang kurang. Sebagian besar dari 7.000 lebih bahasa di dunia tidak memiliki sumber daya yang cukup untuk melatih model AI, dan banyak di antaranya tidak memiliki bentuk tertulis. Hal ini berarti bahwa beberapa bahasa besar mendominasi stok data pelatihan AI manusia, sementara sebagian besar berisiko ditinggalkan dalam revolusi AI dan bisa hilang sepenuhnya.
Alasannya sederhana, sebagian besar data pelatihan AI yang tersedia berada dalam bahasa Inggris. Bahasa Inggris adalah penggerak utama dari model bahasa besar (LLMs), dan orang-orang yang berbicara dalam bahasa yang kurang umum merasa diri mereka kurang diwakili dalam teknologi AI. AI menjadi semakin terintegrasi dalam kehidupan sehari-hari kita, kita semua harus memikirkan tentang kesetaraan bahasa. AI memiliki potensi luar biasa untuk memecahkan masalah dalam skala besar, dan janjinya tidak boleh dibatasi hanya untuk dunia berbahasa Inggris. AI menciptakan kepraktisan dan alat yang meningkatkan kehidupan pribadi dan profesional masyarakat di negara-negara kaya dan maju.
Pembicara bahasa yang berdaya rendah terbiasa menemukan kekurangan representasi dalam teknologi, mulai dari tidak menemukan situs web dalam bahasa mereka hingga tidak memiliki dialek mereka diakui oleh Siri. Sebagian besar teks yang tersedia untuk melatih AI dalam bahasa yang berdaya rendah adalah kualitas buruk (sendiri diterjemahkan dengan akurasi yang meragukan) dan sempit dalam cakupan.
Bagaimana masyarakat dapat memastikan bahwa bahasa yang berdaya rendah tidak tertinggal dalam persamaan AI? Bagaimana kita dapat memastikan bahwa bahasa bukanlah penghalang bagi janji AI?
Dalam upaya untuk mencapai inklusivitas bahasa, beberapa perusahaan teknologi besar memiliki inisiatif untuk melatih model bahasa multibahasa besar (MLMs). Microsoft Translate, misalnya, telah berjanji untuk mendukung “setiap bahasa, di mana pun.” Dan Meta memiliki janji “Tidak Ada Bahasa yang Ditinggalkan”. Hal-hal ini patut diacungi jempol, tetapi apakah realistis?
Berusaha menuju satu model yang menangani setiap bahasa di dunia mendukung yang berkecukupan karena ada volume data yang jauh lebih besar dari bahasa-bahasa besar di dunia. Ketika kita mulai berurusan dengan bahasa berdaya rendah dan bahasa dengan skrip non-Latin, melatih model AI menjadi lebih sulit, memakan waktu, dan lebih mahal. Pikirkan itu sebagai pajak tidak disengaja pada bahasa yang kurang diwakili.
Kemajuan dalam Teknologi Ucapan
Model AI sebagian besar dilatih pada teks, yang secara alami menguntungkan bahasa dengan lebih banyak konten teks. Keragaman bahasa akan lebih baik didukung dengan sistem yang tidak bergantung pada teks. Interaksi manusia pada suatu waktu sepenuhnya berbasis ucapan, dan banyak budaya masih mempertahankan fokus lisan tersebut. Untuk lebih melayani audiens global, industri AI harus berkembang dari data teks menjadi data ucapan.
Penelitian telah membuat kemajuan besar dalam teknologi ucapan, tetapi masih kalah dengan teknologi berbasis teks. Penelitian dalam pemrosesan ucapan sedang berlangsung, tetapi teknologi langsung dari ucapan ke ucapan masih jauh dari matang. Kenyataannya adalah bahwa industri cenderung bergerak dengan hati-hati, dan hanya ketika suatu teknologi mencapai tingkat tertentu.
Platform interpretasi GlobalLink Live yang baru dirilis oleh TransPerfect menggunakan bentuk teknologi ucapan yang lebih matang – pengenalan ucapan otomatis (ASR) dan teks-ke-ucapan (TTS) – sekali lagi, karena sistem langsung dari ucapan ke ucapan belum cukup matang pada titik ini. Dengan demikian, tim penelitian kami bersiap untuk hari ketika jalur ucapan-ke-ucapan sepenuhnya siap untuk ditayangkan.
Model terjemahan ucapan-ke-ucapan menawarkan harapan besar dalam pelestarian bahasa lisan. Pada tahun 2022, Meta mengumumkan sistem terjemahan ucapan-ke-ucapan AI pertama untuk Hokkien, bahasa yang sebagian besar lisan yang digunakan oleh sekitar 46 juta orang dalam diaspora Tiongkok. Ini bagian dari proyek Penerjemah Ucapan Universal Meta, yang mengembangkan model AI baru yang diharapkan akan memungkinkan terjemahan ucapan-ke-ucapan secara real-time di banyak bahasa. Meta memilih untuk membuka sumber daya model terjemahan Hokkien, kumpulan data evaluasi, dan makalah penelitian sehingga orang lain dapat mereproduksi dan membangun karya mereka.
Belajar dengan Lebih Sedikit
Fakta bahwa kita sebagai komunitas global kekurangan sumber daya seputar beberapa bahasa bukanlah kalimat mati bagi bahasa-bahasa tersebut. Di sinilah model multi-bahasa memiliki keunggulan, yaitu bahasa-bahasa belajar satu sama lain. Semua bahasa mengikuti pola. Karena transfer pengetahuan antar bahasa, kebutuhan akan data pelatihan berkurang.
Misalkan Anda memiliki model yang belajar 90 bahasa dan Anda ingin menambahkan Inuit (kelompok bahasa asli Amerika Utara). Karena transfer pengetahuan, Anda akan membutuhkan lebih sedikit data Inuit. Kita menemukan cara untuk belajar dengan lebih sedikit. Jumlah data yang diperlukan untuk menyetel mesin lebih rendah.
Saya optimis tentang masa depan dengan AI yang lebih inklusif. Saya tidak percaya kita ditakdirkan untuk melihat banyak bahasa menghilang – juga tidak percaya bahwa AI akan tetap menjadi domain dunia berbahasa Inggris. Sudah, kita melihat lebih banyak kesadaran seputar masalah kesetaraan bahasa. Dari pengumpulan data yang lebih beragam hingga membangun model yang lebih spesifik bahasa, kita sedang membuat kemajuan.
Pertimbangkan Fon, bahasa yang digunakan oleh sekitar 4 juta orang di Benin dan negara-negara Afrika tetangga. Tidak terlalu lama yang lalu, model AI populer menggambarkan Fon sebagai bahasa fiksi. Seorang ilmuwan komputer bernama Bonaventure Dosseau, yang ibunya berbicara dalam Fon, terbiasa dengan jenis eksklusi ini. Dosseau, yang berbicara dalam bahasa Prancis, tumbuh tanpa program terjemahan untuk membantunya berkomunikasi dengan ibunya. Saat ini, dia dapat berkomunikasi dengan ibunya berkat terjemahan Fon-Prancis yang dibangunnya dengan teliti. Saat ini, ada juga Wikipedia Fon yang masih dalam tahap awal.
Dalam upaya menggunakan teknologi untuk melestarikan bahasa, seniman Turki Refik Anadol telah memulai pembuatan alat AI sumber terbuka untuk suku-suku pribumi. Pada Pertemuan Ekonomi Dunia, dia bertanya: “Bagaimana kita bisa menciptakan AI yang tidak mengenal seluruh umat manusia?”
Kita tidak bisa, dan kita tidak akan melakukannya.