Google avalikustas RT-2, uudse tehisintellekti mudeli, mis võib muuta teie käsud robotitoiminguteks ilma selgesõnalist koolitust nõudmata.
Ehkki suurte keelemudelite (LLM) toel töötavad tehisintellekti vestlusbotid domineerivad nende päevade pealkirjades, kuna nende populaarsus on järsult kasvanud. ChatGPT, Bingi vestlus, Meta laama, ja Google Bard, on see vaid väike osa AI maastikust. Teine valdkond, mida on aastaid aktiivselt uuritud, on roboti riistvara, mis kasutab inimeste asendamiseks või abistamiseks keerulisi tehnikaid. Google on nüüd teatanud edusammudest selles valdkonnas uue AI mudeli näol.
Google'il on avalikustati Robotics Transformer 2 (RT-2), selle uusim tehisintellekti mudel, millel on väga konkreetne eesmärk: edastada soovitud tegevus robotile. See kasutab selle eesmärgi saavutamiseks uudseid tehnikaid, mida toetab kordumatu visuaalne keeletegevus (VLA), mis Google'i väitel on esimene omataoline. Kuigi mitmed varasemad mudelid, nagu RT-1 ja PaLM-E, on teinud edusamme robotite arutlusvõime suurendamisel ja nende õppimise tagamisel. ulmefilmide demonstreeritud robotite domineeritud maailm näib vaieldamatult endiselt midagi äärmiselt kaugest tulevikust.
RT-2 eesmärk on vähendada seda lõhet väljamõeldiste ja tegelikkuse vahel, tagades, et robotid mõistavad täielikult ümbritsevat maailma minimaalse või ilma toetuseta. Põhimõtteliselt on see väga sarnane LLM-idega, kus see kasutab Transformeri-põhist mudelit, et õppida tundma maailma tekstilisest ja visuaalsest veebis saadaolevat teavet ja seejärel tõlkida see robotiteks toiminguteks, isegi katsejuhtumitel, kus seda pole selgesõnaliselt kasutatud koolitatud.
Google on RT-2 võimaluste selgitamiseks selgitanud mitmeid kasutusjuhtumeid. Näiteks kui palute RT-2 jõul töötaval robotil prügi prügikasti visata, saab ta hõlpsasti aru, mis on prügikast ja kuidas seda teistest objektidest eristada. keskkonnas viibimine, kuidas seda mehhaaniliselt liigutada ja üles korjata ning prügikasti visata, ilma et oleksite kummaski neist spetsiaalselt välja õpetanud. tegevused.
Google on jaganud ka mõningaid muljetavaldavaid tulemusi RT-2 testimisest. Rohkem kui 6000 katses osutus RT-2 "nähtud" ülesannete osas sama osavaks kui tema eelkäija. Veelgi huvitavam on see, et nähtamatute stsenaariumide korral saavutas see 62%, võrreldes RT-1 32% -ga, mis tähendab jõudluse peaaegu kahekordset kasvu. Kuigi sellise tehnoloogia rakendused tunduvad juba väga käegakatsutavad, võtab see siiski palju aega küpseks, kuna tegelikud kasutusjuhtumid nõuavad arusaadavalt ranget testimist ja isegi regulatiivset heakskiitu korda. Praegu saate RT-2 taustamehhanismi kohta rohkem lugeda Google DeepMindi ajaveeb siin.