Ez még nem a Terminátor, de a banánteszten már átment a robot – videó

A mesterséges intelligencia vezérelte robot sikerrel teljesítette azt a tesztet, amelynek lényege, hogy megértse a valós környezetet, és gondolkodás után cselekedjen.

  • HVG

A Google mesterséges intelligenciát kutató részlege, a DeepMind egy olyan videót tett közzé, ami azt mutatja, a robotok – egész pontosan a humanoid robotok – mostantól képesek a több lépésből álló összetett feladatok végrehajtására multimodális gondolkodás segítségével. A gépek átmentek az úgynevezett banánteszten, vagyis képese voltak a gyümölcsöket színük szerint szétválogatni.

A robotok gondolkodása a Gemini Robotics 1.5 robotcsaládra épült, amit lehetővé tette a gépek számára, hogy önállóan érzékeljenek, gondolkodjanak és összetett, valós feladatokat hajtsanak végre.

A Gemini Robotics 1.5 család két modellből áll: a Gemini Robotics 1.5-ből, amely vizuális elemeket és utasításokat cselekvéssé alakít, valamint a Gemini Robotics-ER 1.5-ből, amely a világról gondolkodik, és lépésről lépésre terveket készít a feladatok megoldására – írja az Interesting Engineering.

A korábbi tesztek során a feladat annyiból állt a robot számára, hogy fel kellett vennie egy banánt, és egy tálba kellett azt helyeznie. Ez lehetővé tette a humanoidok számára, hogy egyszerre egy utasítást kövessenek és hajtsanak végre.

A Gemini Robotics 1.5 segítségével a humanoidok három különböző gyümölcsöt, köztük egy banánt is, színük alapján különböző tányérokra válogattak. A tesztet Jie Tan, a Google DeepMind vezető kutatója szemléltette.

Gemini Robotics 1.5: Enabling robots to plan, think and use tools to solve complex tasks

We’re powering an era of physical agents with Gemini Robotics 1.5 – enabling robots to perceive, plan, think, use tools and act to better solve complex, multi-step tasks. 🤖 Gemini Robotics 1.5 is our most capable vision-language-action (VLA) model that turns visual information and instructions into motor commands for a robot to perform a task.

Egy másik tesztben az Apptronik humanoidja, Apollo kapta azt a feladatot, hogy válogasson ruhákat. Ekkor a humanoid két különböző kosárban – fehérben és feketében – szín alapján válogatta szét a textileket.

Az első kör után a mérnökök megváltoztatták a kosarak pozícióját, hogy megnézzék, a robot felismeri-e a változásokat. Kiderült, a tesztet így is sikerült végrehajtani.

Az új MI-modellek speciális feladatokat is elvégezhetnek így. Például kaphatnak olyan utasítást, hogy a helyi szabályok alapján válogassák szét a tárgyakat a megfelelő hulladéktárolókba. Ehhez először online kell keresnie az adott térség újrahasznosítási irányelveit, majd vizuálisan meg kell vizsgálnia a tárgyakat, el kell döntenie, hová tartoznak az egyes elemek, végül pedig végre kell hajtania a teljes lépéssorozatot.

A Google szerint a robotok képességének alapja a biztonság: a gépek értékelik, milyen veszéllyel járhat, ha rosszul végzik a feladatukat. A fő cél, hogy védjék az embert és elkerüljék a baleseteket.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások