Google paziņo par RT-2, AI modeli sarunām ar robotiem

Google ir atklājis RT-2 — jaunu AI modeli, kas var pārvērst jūsu komandas robotu darbībās, neprasot īpašu apmācību.

Lai gan mūsdienās virsrakstos dominē AI tērzēšanas roboti, kurus darbina lielie valodu modeļi (LLM), jo strauji pieaug popularitāte. ChatGPT, Bing tērzēšana, Metas lama, un Google Bard, šī ir tikai neliela daļa no AI ainavas. Vēl viena joma, kas ir aktīvi pētīta gadiem ilgi, ir robotu aparatūra, kas izmanto sarežģītas metodes, lai aizstātu vai palīdzētu cilvēkiem. Google tagad ir paziņojis par progresu šajā jomā jauna AI modeļa veidā.

Google ir atklāta Robotics Transformer 2 (RT-2), tā jaunākais mākslīgā intelekta modelis ar ļoti konkrētu mērķi: jūsu vēlamās darbības paziņošana robotam. Lai sasniegtu šo mērķi, tajā tiek izmantotas jaunas metodes, ko nodrošina unikāla vizuālās valodas darbība (VLA), kas, pēc Google domām, ir pirmā šāda veida darbība. Lai gan vairāki iepriekšējie modeļi, piemēram, RT-1 un PaLM-E, ir guvuši panākumus, uzlabojot robotu spriešanas spējas un nodrošinot, ka viņi mācās Viena no otras robotu dominētā pasaule, ko demonstrē zinātniskās fantastikas filmas, neapšaubāmi joprojām šķiet kaut kas no ārkārtīgi tālās nākotnes.

RT-2 mērķis ir samazināt šo plaisu starp fikciju un realitāti, nodrošinot, ka roboti pilnībā izprot apkārtējo pasauli ar minimālu atbalstu vai bez tā. Principā tas ir ļoti līdzīgs LLM, kur tas izmanto transformatora modeli, lai uzzinātu par pasauli no teksta un vizuālā. tīmeklī pieejamo informāciju un pēc tam pārvērst to robotizētās darbībās, pat pārbaudes gadījumos, kad tas nav skaidri norādīts apmācīts.

Google ir izskaidrojis vairākus lietošanas gadījumus, lai izskaidrotu RT-2 iespējas. Piemēram, ja jūs lūgtu RT-2 darbināmam robotam izmest atkritumus, tas viegli saprastu, kas ir miskaste un kā to atšķirt no citiem objektiem. atrodas vidē, kā to mehāniski pārvietot un pacelt, un kā to izmest atkritumu tvertnē, bez īpašas apmācības nevienā no šiem aktivitātes.

Google ir arī dalījies ar dažiem diezgan iespaidīgiem RT-2 testēšanas rezultātiem. Vairāk nekā 6000 izmēģinājumos RT-2 izrādījās tikpat prasmīgs kā tā priekšgājējs "redzētos" uzdevumos. Vēl interesantāk ir tas, ka neredzētos scenārijos tas ieguva 62%, salīdzinot ar RT-1 32%, kas ir gandrīz divkāršs veiktspējas pieaugums. Lai gan šādas tehnoloģijas pielietojums jau šķiet ļoti taustāms, tas prasa ievērojamu laiku lai nobriest, jo reāli lietošanas gadījumi, saprotami, prasa stingru testēšanu un pat reglamentējošu apstiprinājumu plkst. reizes. Pagaidām varat lasīt vairāk par RT-2 aizmugursistēmas mehānismu Google DeepMind emuārs šeit.