Google hat RT-2 vorgestellt, ein neuartiges KI-Modell, das Ihre Befehle in Roboteraktionen umsetzen kann, ohne dass eine explizite Schulung erforderlich ist.
Obwohl KI-Chatbots, die auf großen Sprachmodellen (LLMs) basieren, aufgrund der kometenhaften Popularität von Chatbots heutzutage die Schlagzeilen dominieren ChatGPT, Bing-Chat, Metas Lama, Und Google BardDies ist jedoch nur ein kleiner Teil der KI-Landschaft. Ein weiterer Bereich, der seit Jahren aktiv erforscht wird, ist Roboterhardware, die komplexe Techniken nutzt, um Menschen entweder zu ersetzen oder zu unterstützen. Google hat nun eine Weiterentwicklung in diesem Bereich in Form eines neuen KI-Modells angekündigt.
Google hat enthüllt Robotics Transformer 2 (RT-2), sein neuestes KI-Modell mit einem ganz bestimmten Zweck: die Übertragung Ihrer gewünschten Aktion an einen Roboter. Um diesen Zweck zu erreichen, werden neuartige Techniken eingesetzt, die auf einer einzigartigen Visual-Language-Action (VLA) basieren, von der Google behauptet, sie sei die erste ihrer Art. Obwohl mehrere Vorgängermodelle wie RT-1 und PaLM-E Fortschritte bei der Verbesserung der Denkfähigkeit von Robotern und der Sicherstellung ihres Lernens erzielt haben Wenn man sie voneinander unterscheidet, scheint die von Robotern dominierte Welt, die in Science-Fiction-Filmen dargestellt wird, immer noch wie etwas aus einer extrem fernen Zukunft zu sein.
RT-2 zielt darauf ab, diese Kluft zwischen Fiktion und Realität zu verringern, indem sichergestellt wird, dass Roboter die Welt um sie herum mit minimaler oder keiner Unterstützung vollständig verstehen. Im Prinzip ist es LLMs sehr ähnlich, wo es ein Transformer-basiertes Modell verwendet, um die Welt anhand von Texten und Bildern kennenzulernen Im Web verfügbare Informationen zu analysieren und sie dann in Roboteraktionen umzusetzen, selbst in Testfällen, in denen dies nicht explizit der Fall ist ausgebildet.
Google hat mehrere Anwendungsfälle erläutert, um die Fähigkeiten von RT-2 zu erläutern. Wenn Sie beispielsweise einen RT-2-Antriebsroboter bitten, Müll in den Mülleimer zu werfen, wäre er leicht in der Lage zu verstehen, was Müll ist und wie er ihn von anderen Objekten unterscheiden kann in der Umwelt vorhanden ist, wie man es mechanisch bewegt und aufnimmt und wie man es im Mülleimer entsorgt, und das alles, ohne dass eine spezielle Schulung dazu erforderlich ist Aktivitäten.
Google hat auch einige ziemlich beeindruckende Ergebnisse seiner RT-2-Tests veröffentlicht. In mehr als 6.000 Versuchen erwies sich RT-2 bei „bekannten“ Aufgaben als genauso geschickt wie sein Vorgänger. Noch interessanter ist, dass es in bisher unbekannten Szenarien 62 % erzielte, verglichen mit 32 % bei RT-1, was einer fast zweifachen Leistungssteigerung entspricht. Auch wenn die Anwendungen einer solchen Technologie bereits sehr greifbar erscheinen, dauert es doch noch lange Um zu realen Anwendungsfällen zu reifen, sind verständlicherweise strenge Tests und sogar die behördliche Genehmigung erforderlich mal. Im Moment können Sie mehr über den Backend-Mechanismus von RT-2 lesen Den Blog von Google DeepMind finden Sie hier.