A Google mesterséges intelligenciát kutató részlege, a DeepMind egy olyan videót tett közzé, ami azt mutatja, a robotok – egész pontosan a humanoid robotok – mostantól képesek a több lépésből álló összetett feladatok végrehajtására multimodális gondolkodás segítségével. A gépek átmentek az úgynevezett banánteszten, vagyis képese voltak a gyümölcsöket színük szerint szétválogatni.
A robotok gondolkodása a Gemini Robotics 1.5 robotcsaládra épült, amit lehetővé tette a gépek számára, hogy önállóan érzékeljenek, gondolkodjanak és összetett, valós feladatokat hajtsanak végre.
A Gemini Robotics 1.5 család két modellből áll: a Gemini Robotics 1.5-ből, amely vizuális elemeket és utasításokat cselekvéssé alakít, valamint a Gemini Robotics-ER 1.5-ből, amely a világról gondolkodik, és lépésről lépésre terveket készít a feladatok megoldására – írja az Interesting Engineering.
A korábbi tesztek során a feladat annyiból állt a robot számára, hogy fel kellett vennie egy banánt, és egy tálba kellett azt helyeznie. Ez lehetővé tette a humanoidok számára, hogy egyszerre egy utasítást kövessenek és hajtsanak végre.
A Gemini Robotics 1.5 segítségével a humanoidok három különböző gyümölcsöt, köztük egy banánt is, színük alapján különböző tányérokra válogattak. A tesztet Jie Tan, a Google DeepMind vezető kutatója szemléltette.
Egy másik tesztben az Apptronik humanoidja, Apollo kapta azt a feladatot, hogy válogasson ruhákat. Ekkor a humanoid két különböző kosárban – fehérben és feketében – szín alapján válogatta szét a textileket.
Az első kör után a mérnökök megváltoztatták a kosarak pozícióját, hogy megnézzék, a robot felismeri-e a változásokat. Kiderült, a tesztet így is sikerült végrehajtani.
Az új MI-modellek speciális feladatokat is elvégezhetnek így. Például kaphatnak olyan utasítást, hogy a helyi szabályok alapján válogassák szét a tárgyakat a megfelelő hulladéktárolókba. Ehhez először online kell keresnie az adott térség újrahasznosítási irányelveit, majd vizuálisan meg kell vizsgálnia a tárgyakat, el kell döntenie, hová tartoznak az egyes elemek, végül pedig végre kell hajtania a teljes lépéssorozatot.
A Google szerint a robotok képességének alapja a biztonság: a gépek értékelik, milyen veszéllyel járhat, ha rosszul végzik a feladatukat. A fő cél, hogy védjék az embert és elkerüljék a baleseteket.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.