Google telah meluncurkan RT-2, model AI baru yang dapat menerjemahkan perintah Anda menjadi tindakan robot tanpa memerlukan pelatihan eksplisit.
Meskipun chatbot AI yang didukung oleh model bahasa besar (LLM) mendominasi berita utama akhir-akhir ini karena popularitasnya yang meroket. ObrolanGPT, Obrolan Bing, Llama Meta, Dan Google Penyair, ini hanyalah sebagian kecil dari lanskap AI. Area lain yang telah dieksplorasi secara aktif selama bertahun-tahun adalah perangkat keras robotik yang memanfaatkan teknik kompleks untuk menggantikan atau membantu manusia. Google kini telah mengumumkan kemajuan dalam domain ini, dalam bentuk model AI baru.
Google punya diresmikan Robotics Transformer 2 (RT-2), model AI terbaru dengan tujuan yang sangat spesifik: mengomunikasikan tindakan yang Anda inginkan kepada robot. Ini menggunakan teknik baru untuk mencapai tujuan ini, didukung oleh tindakan bahasa visual (VLA) unik yang diklaim Google sebagai yang pertama dari jenisnya. Meskipun beberapa model sebelumnya seperti RT-1 dan PaLM-E telah membuat kemajuan dalam meningkatkan kemampuan penalaran robot dan memastikan mereka belajar Dari satu sama lain, dunia yang didominasi robot yang ditampilkan dalam film-film fiksi ilmiah masih tampak seperti sesuatu yang berasal dari masa depan yang sangat jauh.
RT-2 bertujuan untuk mengurangi kesenjangan antara fiksi dan kenyataan dengan memastikan robot sepenuhnya memahami dunia di sekitar mereka dengan sedikit atau tanpa dukungan. Pada prinsipnya, ini sangat mirip dengan LLM, yang menggunakan model berbasis Transformer untuk mempelajari dunia dari tekstual dan visual. informasi yang tersedia di web dan kemudian menerjemahkannya ke dalam tindakan robot, bahkan pada kasus uji yang tidak dilakukan secara eksplisit terlatih.
Google telah menjelaskan beberapa kasus penggunaan untuk menjelaskan kemampuan RT-2. Misalnya, jika Anda meminta robot bertenaga RT-2 untuk membuang sampah ke tempat sampah, robot tersebut akan dengan mudah memahami apa itu sampah, bagaimana membedakannya dengan benda lain. ada di lingkungan, cara memindahkan dan mengambilnya secara mekanis, dan cara membuangnya ke tempat sampah, semuanya tanpa dilatih secara khusus tentang salah satu dari hal ini. kegiatan.
Google juga telah membagikan beberapa hasil yang cukup mengesankan dari pengujian RT-2. Dalam lebih dari 6.000 uji coba, RT-2 terbukti sama mahirnya dengan pendahulunya dalam tugas-tugas "terlihat". Yang lebih menarik lagi, dalam skenario yang belum pernah terjadi sebelumnya, ia memperoleh skor sebesar 62% dibandingkan dengan RT-1 yang memperoleh skor sebesar 32%, peningkatan kinerja hampir dua kali lipat. Meskipun penerapan teknologi tersebut sudah tampak nyata, penerapannya memerlukan waktu yang cukup lama Dapat dimengerti bahwa untuk menjadi kasus penggunaan di dunia nyata memerlukan pengujian yang ketat dan bahkan persetujuan peraturan di waktu. Untuk saat ini, Anda dapat membaca selengkapnya tentang mekanisme backend RT-2 di Blog Google DeepMind di sini.