Google julkistaa RT-2:n, tekoälymallin robottien kanssa puhumiseen

Google on julkistanut RT-2:n, uuden tekoälymallin, joka voi muuntaa komentosi robottitoimiksi ilman erityistä koulutusta.

Vaikka suurilla kielimalleilla (LLM) toimivat AI-chatbotit hallitsevat otsikoita näinä päivinä, koska suosio on lisääntynyt hurjasti. ChatGPT, Bing Chat, Metan laama, ja Google Bard, tämä on vain pieni osa tekoälymaisemasta. Toinen vuosia aktiivisesti tutkittu alue on robottilaitteisto, joka hyödyntää monimutkaisia tekniikoita joko korvaamaan tai auttamaan ihmisiä. Google on nyt ilmoittanut edistymisestä tällä alalla uuden tekoälymallin muodossa.

Googlella on paljastettiin Robotics Transformer 2 (RT-2), sen uusin tekoälymalli, jolla on hyvin erityinen tarkoitus: välittää haluamasi toiminto robotille. Se hyödyntää uusia tekniikoita tämän tavoitteen saavuttamiseksi ainutlaatuisen visuaalisen kielitoiminnon (VLA) avulla, jonka Google väittää olevan ensimmäinen laatuaan. Vaikka useat aiemmat mallit, kuten RT-1 ja PaLM-E, ovat edistyneet robottien päättelykyvyn parantamisessa ja niiden oppimisen varmistamisessa. toisistaan, tieteiselokuvien esittelemä robottien hallitsema maailma näyttää todennäköisesti edelleen olevan jotain erittäin kaukaisesta tulevaisuudesta.

RT-2 pyrkii kaventamaan fiktion ja todellisuuden välistä kuilua varmistamalla, että robotit ymmärtävät täysin ympäröivää maailmaa vähäisellä tuella tai ilman tukea. Periaatteessa se on hyvin samanlainen kuin LLM: t, joissa se käyttää Transformer-pohjaista mallia oppiakseen maailmasta tekstin ja visuaalisen verkossa saatavilla olevaa tietoa ja muuntaa ne sitten robottitoimiksi jopa testitapauksissa, joissa sitä ei ole nimenomaisesti käytetty koulutettu.

Google on selittänyt useita käyttötapauksia selittääkseen RT-2:n ominaisuuksia. Jos esimerkiksi pyydät RT-2-robottia heittämään roskat roskakoriin, se voisi helposti ymmärtää, mitä roska on ja miten se erottaa muista esineistä. ympäristössä, kuinka se siirretään ja poimitaan mekaanisesti ja kuinka se hävitetään roskakoriin ilman erityistä koulutusta kumpaankaan näistä toimintaa.

Google on myös jakanut joitain melko vaikuttavia tuloksia RT-2-testauksestaan. Yli 6 000 kokeessa RT-2 osoittautui yhtä taitavaksi kuin edeltäjänsä "nähdyissä" tehtävissä. Mielenkiintoisempaa on, että ennennäkemättömissä skenaarioissa se sai 62 % verrattuna RT-1:n 32 %:iin, mikä on lähes kaksinkertainen suorituskyvyn kasvu. Vaikka tällaisen tekniikan sovellukset näyttävät jo hyvin konkreettisilta, se vie huomattavasti aikaa kypsyä, sillä todelliset käyttötapaukset edellyttävät ymmärrettävästi tiukkaa testausta ja jopa viranomaishyväksyntää ajat. Toistaiseksi voit lukea lisää RT-2:n taustamekanismista Google DeepMindin blogi täällä.