Terkait Keamanan Terkait Keamanan Satu Model AI untuk Mengatur Semua Robot

Satu Model AI untuk Mengatur Semua Robot

Satu Model AI untuk Mengatur Semua Robot



Satu Model AI untuk Mengatur Semua Robot

Perangkat lunak yang digunakan untuk mengendalikan robot biasanya sangat disesuaikan dengan pengaturan fisik spesifiknya. Namun kini para peneliti telah menciptakan kebijakan kendali robot serba guna yang dapat mengoperasikan lengan robot, robot beroda, hewan berkaki empat, dan bahkan drone.

Salah satu tantangan terbesar dalam penerapan pembelajaran mesin pada robotika adalah kurangnya data. Meskipun visi komputer dan pemrosesan bahasa alami dapat mendukung sejumlah besar data gambar dan teks yang ditemukan di Internet, pengumpulan data robot memerlukan biaya dan waktu yang lama.

Untuk menyiasati hal ini, semakin banyak upaya yang dilakukan untuk mengumpulkan data yang dikumpulkan oleh berbagai kelompok tentang berbagai jenis robot, termasuk kumpulan data Open X-Embodiment dan DROID. Harapannya adalah bahwa pelatihan mengenai beragam data robotika akan mengarah pada “transfer positif,” yang mengacu pada ketika keterampilan yang dipelajari dari pelatihan pada satu tugas membantu meningkatkan kinerja pada tugas lain.

Masalahnya adalah robot sering kali memiliki perwujudan yang sangat berbeda—istilah yang digunakan untuk menggambarkan tata letak fisik serta rangkaian sensor dan aktuator—sehingga data yang dikumpulkan bisa sangat bervariasi. Misalnya, lengan robot mungkin bersifat statis, memiliki susunan sendi dan jari yang rumit, dan mengumpulkan video dari kamera di pergelangan tangannya. Sebaliknya, robot berkaki empat secara teratur bergerak dan mengandalkan umpan balik kekuatan dari kakinya untuk bermanuver. Jenis tugas dan tindakan yang dilatih untuk dilakukan oleh mesin ini juga beragam: Lengan dapat mengambil dan menempatkan objek, sedangkan hewan berkaki empat membutuhkan navigasi yang tajam.

Hal ini membuat pelatihan model AI tunggal pada kumpulan data yang besar ini menjadi menantang, kata Homer Walke, Ph.D. mahasiswa di Universitas California, Berkeley. Sejauh ini, sebagian besar upaya berfokus pada data dari sejumlah kecil robot serupa atau peneliti telah mengubah data secara manual untuk membuat pengamatan dari robot yang berbeda menjadi lebih mirip. Namun dalam penelitian yang akan dipresentasikan pada Konferensi Pembelajaran Robot (CoRL) di Munich pada bulan November, mereka meluncurkan model baru yang disebut CrossFormer yang dapat melatih data dari beragam robot dan mengendalikannya serta kebijakan kontrol khusus.

“Kami ingin dapat melatih semua data ini untuk mendapatkan robot yang paling mumpuni,” kata Walke. “Kemajuan utama dalam makalah ini adalah mencari tahu jenis arsitektur apa yang paling cocok untuk mengakomodasi semua masukan dan keluaran yang berbeda-beda.”

Cara mengendalikan beragam robot dengan model AI yang sama

Tim menggunakan arsitektur model yang sama yang mendukung model bahasa besar, yang dikenal sebagai transformator. Dalam banyak hal, tantangan yang coba dipecahkan oleh para peneliti serupa dengan tantangan yang dihadapi chatbot, kata Walke. Dalam pemodelan bahasa, AI harus memilih pola serupa dalam kalimat dengan panjang dan susunan kata berbeda. Data robot juga dapat disusun dalam urutan seperti kalimat tertulis, namun bergantung pada perwujudan tertentu, observasi dan tindakan juga bervariasi panjang dan urutannya.

“Kata-kata mungkin muncul di lokasi berbeda dalam sebuah kalimat, namun maknanya tetap sama,” kata Walke. “Dalam tugas kami, gambar observasi mungkin muncul di lokasi berbeda dalam rangkaian, namun pada dasarnya gambar tersebut masih berupa gambar dan kami tetap ingin memperlakukannya seperti gambar.”

UC Berkeley/Universitas Carnegie Mellon

Sebagian besar pendekatan pembelajaran mesin bekerja melalui urutan satu elemen pada satu waktu, namun transformator dapat memproses seluruh aliran data sekaligus. Hal ini memungkinkan mereka menganalisis hubungan antara berbagai elemen dan menjadikannya lebih baik dalam menangani rangkaian yang tidak terstandarisasi, seperti beragam data yang ditemukan dalam kumpulan data robotika berukuran besar.

Walke dan rekan-rekannya bukanlah orang pertama yang melatih transformator pada data robotika skala besar. Namun pendekatan sebelumnya hanya melatih data dari lengan robot dengan perwujudan yang sangat mirip atau secara manual mengubah data masukan ke format umum agar lebih mudah diproses. Sebaliknya, CrossFormer dapat memproses gambar dari kamera yang diposisikan di atas robot, setinggi kepala atau di pergelangan tangan robot, serta data posisi gabungan dari hewan berkaki empat dan lengan robot, tanpa penyesuaian apa pun.

Hasilnya adalah kebijakan kendali tunggal yang dapat mengoperasikan satu lengan robot, sepasang lengan robot, hewan berkaki empat, dan robot beroda pada berbagai tugas seperti mengambil dan menempatkan objek, memotong sushi, dan menghindari rintangan. Yang terpenting, teknologi ini cocok dengan performa model khusus yang dirancang untuk setiap robot dan mengungguli pendekatan sebelumnya yang dilatih pada beragam data robot. Tim tersebut bahkan menguji apakah model tersebut dapat mengontrol perwujudan yang tidak termasuk dalam kumpulan data—sebuah quadcopter kecil. Meskipun mereka menyederhanakan banyak hal dengan membuat drone terbang pada ketinggian tetap, CrossFormer masih mengungguli metode terbaik sebelumnya.

“Itu sungguh keren,” kata Ria Doshi, seorang mahasiswa sarjana di Berkeley. “Saya pikir ketika kita meningkatkan kebijakan kita untuk dapat melatih kumpulan data yang lebih beragam, akan lebih mudah untuk melihat transfer zero shot seperti ini ke robot yang belum pernah terlihat sama sekali dalam pelatihan.”

Keterbatasan satu model AI untuk semua robot

Namun tim mengakui masih ada pekerjaan yang harus dilakukan. Model ini terlalu besar untuk chip yang tertanam di robot mana pun dan harus dijalankan dari server. Meski begitu, waktu pemrosesan hanya cukup cepat untuk mendukung pengoperasian real-time, dan Walke mengakui bahwa hal tersebut dapat terganggu jika mereka meningkatkan modelnya. “Saat Anda mengemas begitu banyak data ke dalam sebuah model, ukurannya harus sangat besar dan itu berarti menjalankannya untuk kontrol real-time menjadi sulit.”

Salah satu solusi potensial adalah dengan menggunakan pendekatan yang disebut distilasi, kata Oier Mees, seorang peneliti pascadoktoral di Berkley dan bagian dari tim CrossFormer. Hal ini pada dasarnya melibatkan pelatihan model yang lebih kecil untuk meniru model yang lebih besar, dan jika berhasil dapat menghasilkan performa serupa dengan anggaran komputasi yang jauh lebih kecil.

Namun yang lebih penting daripada masalah sumber daya komputasi adalah tim gagal melihat adanya transfer positif dalam eksperimen mereka, karena CrossFormer hanya menyamai performa sebelumnya, bukan melampauinya. Walke berpendapat bahwa kemajuan dalam visi komputer dan pemrosesan bahasa alami menunjukkan bahwa pelatihan tentang lebih banyak data bisa menjadi kuncinya.

Yang lain mengatakan mungkin tidak sesederhana itu. Jeannette Bohg, seorang profesor robotika di Universitas Stanford, mengatakan kemampuan untuk melatih kumpulan data yang beragam merupakan kontribusi yang signifikan. Namun dia bertanya-tanya apakah salah satu alasan mengapa para peneliti tidak melihat transfer positif adalah karena desakan mereka untuk tidak menyelaraskan data masukan. Penelitian sebelumnya yang melatih robot dengan observasi dan data tindakan serupa telah menunjukkan bukti adanya persilangan tersebut. “Dengan menghilangkan keselarasan ini, mereka mungkin juga menghilangkan transfer positif signifikan yang telah kita lihat dalam penelitian lain,” kata Bohg.

Juga tidak jelas apakah pendekatan ini akan meningkatkan kinerja pada tugas-tugas khusus untuk perwujudan tertentu atau aplikasi robotik, kata Ram Ramamoorthy, seorang profesor robotika di Universitas Edinburgh. Pekerjaan ini merupakan langkah yang menjanjikan dalam membantu robot menangkap konsep-konsep umum pada kebanyakan robot, seperti “menghindari rintangan ini,” katanya. Namun hal ini mungkin kurang berguna untuk mengatasi masalah kontrol khusus pada robot tertentu, seperti cara menguleni adonan atau menavigasi hutan, yang seringkali merupakan hal yang paling sulit dipecahkan.

Dari Artikel Situs Anda

Artikel Terkait di Seluruh Web

Leave a Reply

Your email address will not be published. Required fields are marked *

Related Post