Kendaraan Otonom LLM: Terobosan dalam Komunikasi Manusia-AV
Kendaraan otonom (AV) semakin mendekati adopsi secara luas, namun tantangan yang signifikan masih tersisa: menjembatani kesenjangan komunikasi antara penumpang manusia dan sopir robotik mereka. Meskipun AV telah membuat kemajuan luar biasa dalam menavigasi lingkungan jalan yang kompleks, mereka sering kesulitan untuk menginterpretasikan perintah bahasa alami yang rumit yang begitu mudah bagi pengemudi manusia.
Masuklah sebuah studi inovatif dari Sekolah Teknik Sipil dan Konstruksi Universitas Purdue. Dipimpin oleh Asisten Profesor Ziran Wang, sebuah tim insinyur telah memimpin pendekatan inovatif untuk meningkatkan interaksi AV-manusia menggunakan kecerdasan buatan. Solusi mereka adalah dengan mengintegrasikan model bahasa besar (LLM) seperti ChatGPT ke dalam sistem pengemudi otonom.
Kekuatan Bahasa Alami dalam AV
LLM mewakili lompatan ke depan dalam kemampuan kecerdasan buatan untuk memahami dan menghasilkan teks mirip manusia. Sistem kecerdasan buatan canggih ini dilatih pada jumlah data teks yang besar, memungkinkan mereka untuk memahami konteks, nuansa, dan makna tersirat dengan cara yang tanggapan terprogram tradisional tidak bisa.
Dalam konteks kendaraan otonom, LLM menawarkan kemampuan transformatif. Berbeda dengan antarmuka AV konvensional yang bergantung pada perintah suara tertentu atau masukan tombol, LLM dapat menginterpretasikan berbagai instruksi bahasa alami. Hal ini berarti penumpang dapat berkomunikasi dengan kendaraan mereka dengan cara yang sama seperti mereka akan dengan sopir manusia.
Peningkatan dalam kemampuan komunikasi AV sangat signifikan. Bayangkan memberitahu mobil Anda, “Saya terlambat,” dan membuatnya secara otomatis menghitung rute paling efisien, menyesuaikan gaya mengemudi untuk meminimalkan waktu perjalanan dengan aman. Atau pertimbangkan kemampuan untuk mengatakan, “Saya merasa agak mual,” mendorong kendaraan untuk menyesuaikan profil gerakannya untuk perjalanan yang lebih halus. Interaksi yang rumit ini, yang pengemudi manusia pahami secara naluriah, menjadi mungkin bagi AV melalui integrasi LLM.
Studi Purdue: Metodologi dan Temuan
Untuk menguji potensi LLM dalam kendaraan otonom, tim Purdue melakukan serangkaian eksperimen menggunakan kendaraan otonom level empat – hanya satu langkah dari otonomi penuh seperti yang didefinisikan oleh SAE International.
Para peneliti mulai dengan melatih ChatGPT untuk merespons berbagai perintah, mulai dari instruksi langsung seperti “Tolong berkendara lebih cepat” hingga permintaan yang lebih tidak langsung seperti “Saya merasa agak mual sekarang.” Mereka kemudian mengintegrasikan model yang dilatih ini dengan sistem yang sudah ada pada kendaraan, memungkinkannya untuk mempertimbangkan faktor-faktor seperti aturan lalu lintas, kondisi jalan, cuaca, dan data sensor saat menginterpretasikan perintah.
Penyiapan eksperimen ini ketat. Sebagian besar tes dilakukan di lapangan uji di Columbus, Indiana – landasan bandara bekas yang memungkinkan pengujian kecepatan tinggi yang aman. Tes parkir tambahan dilakukan di area parkir Ross-Ade Stadium Purdue. Sepanjang eksperimen, AV yang dibantu LLM merespons perintah dari penumpang yang telah dipelajari sebelumnya dan baru.
Hasilnya menjanjikan. Peserta melaporkan tingkat ketidaknyamanan yang signifikan lebih rendah dibandingkan dengan pengalaman tipikal di level empat AV tanpa bantuan LLM. Kendaraan secara konsisten melampaui metrik keselamatan dan kenyamanan dasar, bahkan ketika merespons perintah yang belum secara eksplisit dilatih.
Mungkin yang paling mengesankan, sistem menunjukkan kemampuan untuk belajar dan beradaptasi dengan preferensi penumpang individu selama perjalanan, menunjukkan potensi untuk transportasi otonom yang benar-benar personal.
Implikasi untuk Masa Depan Transportasi
Bagi pengguna, manfaatnya banyak. Kemampuan berkomunikasi secara alami dengan AV mengurangi kurva pembelajaran yang terkait dengan teknologi baru, membuat kendaraan otonom lebih mudah diakses oleh berbagai orang, termasuk mereka yang mungkin merasa terintimidasi oleh antarmuka yang kompleks. Selain itu, kemampuan personalisasi yang ditunjukkan dalam studi Purdue menyarankan masa depan di mana AV dapat beradaptasi dengan preferensi individu, memberikan pengalaman yang dikepaskan untuk setiap penumpang.
Interaksi yang ditingkatkan ini juga dapat meningkatkan keselamatan. Dengan lebih memahami niat dan kondisi penumpang – seperti mengenali ketika seseorang sedang terburu-buru atau merasa tidak enak badan – AV dapat menyesuaikan perilaku mengemudi mereka secara sesuai, potensial mengurangi kecelakaan yang disebabkan oleh ketidaknyamanan atau kesalahpahaman penumpang.
Dari perspektif industri, teknologi ini bisa menjadi pembeda kunci dalam pasar AV yang kompetitif. Produsen yang dapat menawarkan pengalaman pengguna yang lebih intuitif dan responsif bisa mendapatkan keuntungan yang signifikan.
Tantangan dan Arah Masa Depan
Meskipun hasilnya menjanjikan, beberapa tantangan masih tersisa sebelum AV yang terintegrasi LLM menjadi kenyataan di jalan raya umum. Salah satu isu kunci adalah waktu pemrosesan. Sistem saat ini rata-rata 1,6 detik untuk menginterpretasikan dan merespons perintah – dapat diterima untuk skenario non-kritis namun potensial bermasalah dalam situasi yang memerlukan respons cepat.
Masalah signifikan lainnya adalah potensi bagi LLM untuk “halusinasi” atau salah menginterpretasikan perintah. Meskipun studi telah mencakup mekanisme keselamatan untuk mengurangi risiko ini, menangani masalah ini secara komprehensif sangat penting untuk implementasi di dunia nyata.
Menghadapi masa depan, tim Wang sedang menjelajahi beberapa jalur untuk penelitian lebih lanjut. Mereka sedang mengevaluasi LLM lain, termasuk asisten AI Gemini dari Google dan Llama dari Meta, untuk membandingkan kinerja. Hasil awal menunjukkan bahwa ChatGPT saat ini lebih unggul dalam metrik keselamatan dan efisiensi, meskipun temuan yang dipublikasikan akan segera menyusul.
Sebuah arah masa depan yang menarik adalah potensi untuk komunikasi antar kendaraan menggunakan LLM. Hal ini bisa memungkinkan manajemen lalu lintas yang lebih canggih, seperti AV bernegosiasi hak lintas di persimpangan.
Selain itu, tim sedang menjalankan proyek untuk mempelajari model visi besar – sistem kecerdasan buatan yang dilatih pada gambar daripada teks – untuk membantu AV menavigasi kondisi cuaca ekstrem musim dingin yang umum di Midwest. Penelitian ini, didukung oleh Pusat Transportasi Terhubung dan Otomatis, dapat lebih meningkatkan adaptabilitas dan keselamatan kendaraan otonom.
Kesimpulan
Penelitian terobosan Universitas Purdue dalam mengintegrasikan model bahasa besar dengan kendaraan otonom menandai saat penting dalam teknologi transportasi. Dengan memungkinkan interaksi manusia-AV yang lebih intuitif dan responsif, inovasi ini mengatasi tantangan kritis dalam adopsi AV. Meskipun hambatan seperti kecepatan pemrosesan dan potensi kesalahan interpretasi masih ada, hasil yang menjanjikan dari studi ini membuka jalan bagi masa depan di mana berkomunikasi dengan kendaraan kita bisa sama alaminya seperti berbicara dengan sopir manusia. Saat teknologi ini berkembang, ia memiliki potensi untuk merevolusi tidak hanya bagaimana kita bepergian, tetapi juga bagaimana kita mempersepsikan dan berinteraksi dengan kecerdasan buatan dalam kehidupan sehari-hari kita.