Míg a robotikában nagy előrelépések történtek a járás, a mozgás, a finom mozdulatok, a fogások terén, az arckifejezések, de különösen a szájmozgatás területe egyfajta fehér foltnak számít. Még a legfejlettebb humanoidok is (ha egyáltalán van arcuk) merev, bábuszerű szájmozgásokat mutatnak. Ettől azután élettelennek, sőt hátborzongatónak tűnnek. Ez viszont hamarosan megváltozhat.
A Columbia Egyetem mérnöki csapata bejelentette, hogy olyan robotot készítettek, amelyik képes megtanulni az ajakmozgásokat olyan feladatokhoz, mint a beszéd és az éneklés.
A valósághű robot-ajakmozgatás elérése két okból is kihívást jelent: Először is, speciális, rugalmas arcbőrt tartalmazó hardverre van szükség, amelyet számos apró, csendben és együttesen működő motor hajt. Másodszor, az ajakdinamika specifikus mintázata egy összetett funkció, amelyet a vokális hangok és fonémák szekvenciái határoznak meg.
https://www.youtube.com/watch?v=nhFU5KHA2fw
Mindennek elérésére a kutatók egy egészen új megközelítést alkalmaztak. Ahelyett, hogy minden egyes magánhangzóra vagy fonémára kézzel kódolt szabályokat követett volna, a robot kísérletezéssel és utánzással tanulta meg az ajakmechanikát. Az arca, amely 26 miniatürizált motorra feszített puha szintetikus bőrből áll, képes reprodukálni a beszéd alapjául szolgáló finom izommozgásokat.
A robot először a tükörképét figyelve sajátította el 26 arcmotorjának használatát. Ahogy egy gyerek először vág grimaszokat a tükörbe, a robot több ezer véletlenszerű arckifejezést és ajakgesztust mutatott. Idővel megtanulta, hogyan mozgassa a motorjait, hogy bizonyos arckifejezéseket érjen el. Ezt a megközelítést „látásból cselekvésbe” nyelvi modellnek (VLA) nevezik.
Ezután beszélgetésről és éneklésről készült YouTube-videókat kellett néznie a robotnak, így az őt vezérlő mesterséges intelligencia megtanulhatta, hogyan mozog pontosan az emberek szája a kibocsátott különféle hangoknak megfelelően. E két modell birtokában a robot mesterséges intelligenciája közvetlenül az ajkak motoros mozgásává tudta alakítani a hangokat.
Jelenleg az ajakmozgás messze nem tökéletes. „Különös nehézségeink voltak az olyan kemény hangokkal, mint a 'B', és az ajakfixálást igénylő hangokkal, mint például a 'W'. De ezek a képességek valószínűleg idővel és gyakorlással, illetve az emberi interakciókkal fejlődni fognak” – mondta Hod Lipson, az egyetem Kreatív Gépek Laboratóriumának igazgatója, a gépészmérnöki tudományok professzora, kiemelve, hogy egy ilyen munka a robotika egy elhanyagolt dimenzióját, a robotika hiányzó láncszemét célozza meg.
A kutatók a Science Robotics folyóiratban azt jósolják, hogy az élethű arcok egyre fontosabbá válnak, ahogy a humanoid robotok olyan területeken találnak alkalmazást, mint a szórakoztatás, az oktatás, az orvostudomány és az idősgondozás is. Viszont egyúttal elismerik az ilyen technológia pszichológiai és etikai összetettségét. Ahogy a robotok egyre rokonszenvesebbé válnak, elmosódó érzelmi határok alakulhatnak ki. Lipson, aki éveket töltött a robotikus empátia tanulmányozásával, visszafogottságra int: „Lassan és óvatosan kell haladnunk, hogy az előnyöket learassuk, miközben minimalizáljuk a kockázatokat”.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.