Nem, ez még nem az igazi gondolatolvasó mesterséges intelligencia, de már bontogatja a szárnyait
Az emberi agy túlságosan bonyolult ahhoz, hogy legyen egy általános mesterséges intelligencia, ami bárki fejében képes olvasni. A jelenlegi technológia egyelőre inkább csak hangzatos, mint használható, de a fejlődés már elindult. Az eredményre viszont még évtizedeket kell várni. Minimum.
hvg.hu: Nagy visszhangot váltott ki nemrég, hogy amerikai kutatók egy olyan mesterséges intelligenciát fejlesztettek, amely képes megszólaltatni egy olyan zenét, amit csak magának, a fejében játszik le az ember. Tényleg ennyire közel vagyunk a gondolatolvasáshoz?
Lévay György: Régóta próbálkoznak már a gondolatolvasással a tudósok, de továbbra is csak a felszínt kapargatják. Bár a hír valóban izgalmasan hangzik, a probléma az, hogy épp a lényeg nem derül ki belőle. Mondok egy példát: ha a Bugatti bejelent egy 1000+ lóerős autót, a hír azonnal elér az olvasóhoz. Ha viszont ugyanezt a motort áttennénk egy másik autóba, nem lehetne ugyanazt a teljesítményt kipréselni belőle. Azért nem, mert nagyon sok más tényezőt számításba kell még venni ahhoz, hogy a végeredmény jó legyen.
Ugyanez igaz az ilyen fejlesztésekre is: a kulcs a fenti eredmény eléréséhez az, hogy hosszú időn át tanítsák meg felismerni az adott ember agyi jeleit az algoritmusnak. Ez több hónapos, ha nem éves munka eredménye, ami jó eséllyel nem, vagy nem ugyanúgy fog működni egy másik ember esetében.
A híreket figyelve kiderül, vannak már biztató eredmények, de ez a gondolatolvasás még mindig nem az, amiket például a filmekből ismerünk.
hvg.hu.: Hogyan tanítanak be egy algoritmust arra, hogy olvasni tudjon az ember gondolataiban?
L.Gy.: Többféle megoldás létezhet. Nem mindegy például, hogy absztrakt módon rekonstruál valamit a mesterséges intelligencia, vagy van egy nagy adathalmaz, amiből kiválasztja a megfelelő információt, amit aztán visszaad eredményként. Utóbbi sem könnyű, de talán ez a könnyebb megoldás.
Például adott egy kép, aminek az egyik sarkában van egy bozót, a másik sarkában egy másik tárgy, a harmadikban és a negyedikben megint mást és mást látni. Megmutatják az adott alanynak a képet, majd rögzítik, milyen jeleket ad az agya. Aztán mutatnak egy másikat, amin csak picit vannak másként elrendezve a dolgok, és azt az agyi jelet is rögzítik. És így tovább, mindezt akár több ezer képpel. Végül mutatnak neki egy olyat, amin valamilyen formában rajta van az összes eddig látott elem, de olyan elrendezésben, amilyen elrendezésben nem került bele a kép a tanulóhalmazba. Ekkor megnézik, az algoritmus mennyire tudja rekonstruálni azt, a korábban látott dolgok hol találhatók a képen.
De ha olyan képet lát az illető, amilyet korábban még nem, akkor az algoritmus vagy nem, vagy nem a fentihez hasonló hatékonysággal fogja tudni megadni a kívánt eredményt.
Ilyen elven működik egyébként a ChatGPT is. Ha csak azt nézzük, hogy milyen válaszokat ad egy kérdésre, az egészen elképesztő. De ha olyan kérdést teszünk fel, ami a tanulóhalmazon kívül van, azzal nagyon nehezen tud mit kezdeni.
hvg.hu: A gondolatolvasáshoz, például egy kép vagy zene visszaadására nem lehet úgy betanítani a mesterséges intelligenciát, mint a ChatGPT-t a válaszadásra?
L.Gy.: A kettő között az a legnagyobb különbség, hogy a ChatGPT-t egy óriási halmazon lehetett betanítani. Ezt a halmazt úgy hívjuk, hogy internet. Mivel azonban minden ember egyedi, az agyi hullámok is egyediek lehetnek. Ehhez több ezer, vagy több tízezer embernél kellene megismételni a fenti képes példát, és még akkor sem biztos, hogy a maradék sokmilliárd embernél hatékonyan működne.
hvg.hu: Vagyis korai még attól tartanunk, hogy a mesterséges intelligencia turkáljon az agyunkban?
L.Gy.: Egyelőre igen, és az egyelőre ebben az esetben azt jelenti, hogy több évtizednyire vagyunk attól, hogy egy ilyen technológia általánosságban is használható legyen.
Először oda kellene eljutni, hogy már ne csak egy tanulóhalmazból származó képet lehessen rekonstruálni, hanem egy tetszőleges fotót is, mondjuk egy 600x800 pixelest, ahol minden képkockánál pontos színt ad vissza a rendszer. De, ahogy mondtam, ettől még évtizedekre vagyunk. Minimum.
hvg.hu: Mi a fejlesztések legnagyobb hátráltató tényezője?
L.Gy.: A legfőbb probléma az, hogy
az elmúlt 30 évben nem nagyon kerültünk közelebb ahhoz, hogy megértsük, hogyan működik az agyunk.
Rendkívül komplex dologgal állunk szemben. Mi szeretnénk külön kezelni olyan dolgokat, mint például a memória, az érzékelés vagy a mozgás, ám az agyban ezek összemosódnak, és nem tudni, hogy pontosan hol, hogyan.
Van egy érzékelési módja az embernek, amit úgy hívnak, hogy propriocepció. Egyszerűen ez annyit tesz, hogy van egy dinamikus térkép az agyunkban a testünkről, ami folyamatosan változik az érzékszervektől kapott információ alapján. Ha becsukod a szemed, és megpróbálsz odanyúlni az asztalodon lévő telefonhoz, akkor nemcsak, hogy sikerül megfognod, de valószínűleg fel tudod oldani a képernyőzárat, és el tudsz indítani egy adott alkalmazást, mindezt anélkül, hogy a szemed ki kellene nyitni.
Az agyunkban lévő térkép alapján úgy látjuk a dolgokat, mintha előttünk lennének. Azt viszont, hogy ezt hogyan képezi le az agy, és miként frissíti, fogalmunk sincs. Évek óta próbáljuk megérteni, hogy mennyi információ jön a perifériáról, és mennyi információt kezel az agy, de még mindig nem tudjuk pontosan.
hvg.hu: Ezek szerint egyelőre az is álom marad, hogy például a virtuális valóság használatához elég egy ilyen szemüveg, és minden mást a gondolatainkkal irányítsunk?
L.Gy.: Igen. Amíg ezt az egy dolgot nem fejtjük meg, addig nem lesz olyan sem, mintha a mátrixban lennénk. Az aggyal ugyanis el kell hitetni, hogy valóban az adott környezet vesz körül bennünket. Az érzékeket át lehet ugyan verni, de az agyat nem lehet megtéveszteni.
Az elmúlt 30 év alapján nagyjából 1–2 százalékot adnék annak, hogy a következő 50 évben eljutunk erre a szintre, de lehet, hogy még 100 éves távlatot nézve is nagyjából ennyivel számolhatunk.
***
Lévay György a HVG Kiadó által szervezett MetaUniversity képzés egyik előadója, az Infinite Biomedical Technologies cég kutatási vezetője, valamint kutatómérnökként dolgozik a Széchenyi István Egyetemen.
Átfogó képzés a mesterséges intelligenciáról. Milyen területeken használható a mesterséges intelligencia? Milyen lehetőségek vannak benne? Hogy lehet az MI-megoldásokat saját vállalkozásom vagy céljaim elérése érdekében felhasználni?
A képzés hallgatói esettanulmányokon keresztül nyerhetnek betekintést az MI alkalmazásának iparági összefüggéseibe a következő területeken: XR, VR, IoT, robotika, NFT, Blockchain és kriptovaluta, Ipar 4.0, BI, WEB 3.0.
A megismert eljárásokat és eszközöket a hallgatók nemcsak elméleti, hanem gyakorlati szinten is elsajátíthatják, hogy egyes elemeit be tudják építeni a cégük működésébe már közvetlenül a képzés után.
A szeptemberben induló MetaUniversity képzésről részletes információkat ide kattintva olvashat.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.