Intel’s Masked Humanoid Controller (MHC): Pendekatan Baru dalam Pembangkitan Gerakan Manusia yang Realistis dan Dapat Diarahkan
Peneliti dari Intel Labs, bekerja sama dengan pakar akademik dan industri, telah memperkenalkan teknik revolusioner untuk menghasilkan gerakan manusia yang realistis dan dapat diarahkan dari input multi-modal yang terbatas. Karya mereka, yang disorot di Konferensi Eropa tentang Visi Komputer (ECCV 2024), berfokus pada mengatasi tantangan dalam menghasilkan perilaku manusia yang alami berbasis fisik dalam karakter humanoid berdimensi tinggi. Penelitian ini merupakan bagian dari inisiatif lebih luas Intel Labs untuk memajukan visi komputer dan pembelajaran mesin.
Intel Labs dan mitra mereka baru-baru ini mempersembahkan enam paper terkini di ECCV 2024, sebuah konferensi utama yang diselenggarakan oleh European Computer Vision Association (ECVA).
Paper “Generating Physically Realistic and Directable Human Motions from Multi-Modal Inputs” memamerkan inovasi termasuk strategi pertahanan baru untuk melindungi model teks-ke-gambar dari serangan red teaming berbasis prompt dan pengembangan dataset berskala besar yang dirancang untuk meningkatkan konsistensi spasial dalam model-model ini. Di antara kontribusi-kontribusi ini, paper tersebut menyoroti dedikasi Intel dalam memajukan pemodelan generatif sambil memprioritaskan praktik AI yang bertanggung jawab.
Menghasilkan Gerakan Manusia yang Realistis Menggunakan Input Multi-Modal
Masked Humanoid Controller (MHC) Intel adalah sistem terobosan yang dirancang untuk menghasilkan gerakan mirip manusia dalam lingkungan fisika simulasi. Berbeda dengan metode tradisional yang sangat bergantung pada data pemantauan gerakan lengkap, MHC dibangun untuk menangani data input yang terbatas, tidak lengkap, atau parsial dari berbagai sumber. Sumber-sumber ini dapat mencakup pengontrol VR, yang mungkin hanya melacak gerakan tangan atau kepala; input joystick yang hanya memberikan perintah navigasi tingkat tinggi; pelacakan video, di mana bagian tubuh tertentu mungkin terhalangi; atau bahkan instruksi abstrak yang berasal dari prompt teks.
Inovasi teknologi ini terletak pada kemampuannya untuk menafsirkan dan mengisi kesenjangan di mana data hilang atau tidak lengkap. Hal ini dicapai melalui apa yang Intel sebut sebagai kemampuan Catch-up, Combine, and Complete (CCC):
– Catch-up: Fitur ini memungkinkan MHC untuk memulihkan dan menyelaraskan kembali gerakannya ketika gangguan terjadi, misalnya ketika sistem dimulai dalam keadaan gagal, seperti karakter humanoid yang terjatuh. Sistem dapat dengan cepat memperbaiki gerakannya dan melanjutkan gerakan alami tanpa perlu pelatihan ulang atau penyesuaian manual.
– Combine: MHC dapat mencampurkan berbagai urutan gerakan bersama, seperti menggabungkan gerakan tubuh bagian atas dari satu aksi (misalnya, melambaikan tangan) dengan gerakan tubuh bagian bawah dari yang lain (misalnya, berjalan). Fleksibilitas ini memungkinkan untuk menghasilkan perilaku baru sepenuhnya dari data gerakan yang sudah ada.
– Complete: Ketika diberikan input yang terbatas, seperti data gerakan tubuh parsial atau direktif tingkat tinggi yang samar, MHC dapat secara cerdas menyimpulkan dan menghasilkan bagian yang hilang dari gerakan. Misalnya, jika hanya gerakan lengan yang ditentukan, MHC dapat secara otonom menghasilkan gerakan kaki yang sesuai untuk menjaga keseimbangan fisik dan realisme.
Hasilnya adalah sistem pembangkit gerakan yang sangat fleksibel yang dapat menciptakan gerakan yang mulus, realistis, dan akurat secara fisik, bahkan dengan direktif yang tidak lengkap atau tidak spesifik. Hal ini membuat MHC ideal untuk aplikasi dalam gaming, robotika, realitas virtual, dan situasi di mana gerakan manusia berkualitas tinggi diperlukan namun data input terbatas.
Dampak MHC pada Model Gerakan Generatif
Masked Humanoid Controller (MHC) merupakan bagian dari upaya lebih luas oleh Intel Labs dan mitra-mitra mereka untuk membangun model-model generatif secara bertanggung jawab, termasuk yang menggerakkan tugas teks-ke-gambar dan generasi 3D. Seperti yang dibahas di ECCV 2024, pendekatan ini memiliki dampak signifikan pada industri seperti robotika, realitas virtual, gaming, dan simulasi, di mana pembangkitan gerakan manusia yang realistis sangat penting. Dengan menggabungkan input multi-modal dan memungkinkan pengontrol untuk beralih dengan lancar antar gerakan, MHC dapat menangani kondisi dunia nyata di mana data sensor mungkin berisik atau tidak lengkap.
Karya ini oleh Intel Labs berdampingan dengan penelitian lanjutan lain yang dipresentasikan di ECCV 2024, seperti pertahanan baru mereka untuk model teks-ke-gambar dan pengembangan teknik untuk meningkatkan konsistensi spasial dalam generasi gambar. Bersama-sama, kemajuan-kemajuan ini menunjukkan kepemimpinan Intel dalam bidang visi komputer, dengan fokus pada pengembangan teknologi AI yang aman, skalabel, dan bertanggung jawab.
Kesimpulan
Masked Humanoid Controller (MHC), yang dikembangkan oleh Intel Labs dan mitra akademik, merupakan langkah penting ke depan dalam bidang pembangkitan gerakan manusia. Dengan menangani masalah kontrol yang kompleks dalam menghasilkan gerakan yang realistis dari input multi-modal, MHC membuka jalan untuk aplikasi baru dalam VR, gaming, robotika, dan simulasi. Penelitian ini, yang ditampilkan di ECCV 2024, menunjukkan komitmen Intel dalam memajukan AI yang bertanggung jawab dan pemodelan generatif, berkontribusi pada teknologi yang lebih aman dan adaptif di berbagai domain.
Dengan demikian, teknologi Masked Humanoid Controller (MHC) dari Intel Labs memberikan terobosan penting dalam pembangkitan gerakan manusia yang realistis dan dapat diarahkan, membuka peluang baru dalam berbagai industri yang memerlukan simulasi gerakan manusia yang berkualitas tinggi.