„Google“ pristato RT-2, AI modelį, skirtą kalbėtis su robotais

„Google“ pristatė RT-2 – naują AI modelį, kuris gali paversti jūsų komandas robotų veiksmais nereikalaujant aiškaus mokymo.

Nors šiais laikais antraštėse dominuoja dirbtinio intelekto pokalbių robotai, veikiantys didelių kalbų modelių (LLM), dėl sparčiai augančio kalbų populiarumo. ChatGPT, Bing Chat, Metos lama, ir Google Bard, tai tik nedidelė AI kraštovaizdžio dalis. Kita sritis, kuri buvo aktyviai tyrinėjama daugelį metų, yra robotų aparatinė įranga, naudojanti sudėtingas technologijas, skirtas pakeisti arba padėti žmonėms. „Google“ paskelbė apie pažangą šioje srityje – naują AI modelį.

„Google“ turi atidengta Robotics Transformer 2 (RT-2), naujausias AI modelis, turintis labai konkretų tikslą: pranešti apie jūsų norimą veiksmą robotui. Šiam tikslui pasiekti naudojamos naujos technologijos, paremtos unikaliu vaizdo kalbos veiksmu (VLA), kuris, kaip teigia „Google“, yra pirmasis tokio pobūdžio. Nors keli ankstesni modeliai, tokie kaip RT-1 ir PaLM-E, padarė pažangą didindami robotų mąstymo gebėjimus ir užtikrindami, kad jie mokytųsi. vienas nuo kito, robotų dominuojamas pasaulis, demonstruojamas mokslinės fantastikos filmų, be abejonės, vis dar atrodo kaip kažkas iš itin tolimos ateities.

RT-2 siekia sumažinti šį atotrūkį tarp fantastikos ir realybės užtikrinant, kad robotai visiškai suprastų juos supantį pasaulį su minimalia parama arba be jokios paramos. Iš esmės jis labai panašus į LLM, kur jis naudoja transformatoriumi pagrįstą modelį, kad sužinotų apie pasaulį iš teksto ir vaizdo žiniatinklyje prieinamą informaciją, o tada paverskite ją robotų veiksmais, net bandomaisiais atvejais, kai tai nėra aiškiai treniruotas.

„Google“ paaiškino keletą naudojimo atvejų, kad paaiškintų RT-2 galimybes. Pavyzdžiui, jei paprašysite RT-2 varomo roboto išmesti šiukšles į šiukšliadėžę, jis lengvai supras, kas yra šiukšlės, kaip atskirti jas nuo kitų objektų. esantis aplinkoje, kaip mechaniškai jį perkelti ir pasiimti bei išmesti į šiukšliadėžę, ir visa tai nėra specialiai apmokytas nė vieno iš šių dalykų. veikla.

„Google“ taip pat pasidalino gana įspūdingais RT-2 bandymų rezultatais. Per daugiau nei 6000 bandymų RT-2 pasirodė esąs toks pat gabus kaip ir jo pirmtakas atliekant „matytas“ užduotis. Dar įdomiau, kad neregėtais scenarijais jis surinko 62%, palyginti su RT-1 32%, o tai yra beveik dvigubai didesnis našumas. Nors tokios technologijos pritaikymas jau atrodo labai apčiuopiamas, tam reikia nemažai laiko kad būtų galima subręsti, nes suprantama, kad realaus naudojimo atvejai reikalauja griežtų bandymų ir net reguliavimo patvirtinimo laikai. Kol kas daugiau apie RT-2 užpakalinį mechanizmą galite perskaityti „Google DeepMind“ tinklaraštis čia.