Rámértek a mesterséges intelligenciára, négyből háromszor képes volt becsapni az embert

Átment a Turing-teszten az OpenAI által fejlesztett modell, a GPT-4.5: az esetek 73 százalékéban képes volt elhitetni az emberrel, hogy nem robottal, hanem egy másik emberrel beszélget.

Míg néhány évvel ezelőtt még viszonylag könnyen meg lehetett mondani egy csevegésről, hogy a másik oldalon gép vagy ember írja az üzenetet, ma már ez nem egyértelmű. Olyannyira nem, hogy az egyik legjobb mesterségesintelligencia-modellt, ami jelenleg a piacon van, az OpenAI által fejlesztett GPT-4.5-ről a tesztelők – a Turing-teszt frissített változatában – többször gondolták azt, hogy ember, mint azt, hogy robot.

A Turing-teszt arra szolgál, hogy mérje a gépi intelligenciát, illetve, hogy a felhasználók észlelik-e, hogy egy géppel van dolguk. A Kaliforniai Egyetem kutatói ezért ezt a módszert választották a vizsgálatukhoz: Turing-tesztet végeztek nagyjából 300 ember bevonásával – írja a BGR. Az eredményeiket az arXiv preprint szerveren tették közzé.

A tanulmány során a résztvevőknek egyszerre kellett beszélgetniük a robottal és az emberrel, és el kellett dönteniük, hogy melyik üzenetet ki küldte. Amikor a GPT-4.5-öt arra utasították, hogy úgy beszéljen, mint egy popkultúrában jártas fiatal felnőtt, az esetek 73 százalékában képes volt elhitetni a felhasználókkal, hogy ő egy ember. Ez messze meghaladja az 50 százalékos esélyt, amit a kezdetektől fogva a Turing-teszt sikerességi küszöbeként határoztak meg a szakemberek. Érdekes módon az emberi csevegőtársak kevésbé voltak sikeresek abban, hogy meggyőzzék a résztvevőket arról, hogy ők az emberek.

Totális megfigyelést készül indítani Izrael: ijesztően alapos mesterséges intelligenciát engednek a palesztinokra
Több, a fejlesztést ismerő izraeli forrás szerint a zsidó állam az emberi jogokat semmibe véve hallgatja le a palesztinokat, és ebből fakadóan már rendelkezik sosem nem látott méretű adatbázissal. A cél, hogy legyen elég alapanyag a mesterséges intelligenciának a palesztinok megfigyelésére.

A kísérlet más modelleket is tesztelt, köztük a Meta LLaMA 3-at és az OpenAI újabb GPT-4o-t, valamint az ELIZA-t, a valaha kifejlesztett egyik legkorábbi chatbotot. Nem meglepő módon azok a mesterséges intelligenciák, amelyeknek nem lehetett megmondani, hogy milyen karakter bőrébe bújva kommunikáljon, sokkal rosszabbul teljesítettek. A GPT-4.5 pontossága 36 százalékra esett vissza a karakter meghatározása nélkül, a GPT-4o pedig mindössze 21 százalékot ért el.

A BGR megjegyzi: nem ez az első alkalom, hogy a kutatók a mesterséges intelligenciát Turing-tesztnek vetik alá, de ezek az eredmények azt mutatják, hogy bár a nyelvi modellek nem úgy „gondolkodnak”, mint az emberek, egyre inkább képesek az emberi „viselkedésre” a rövid, kötetlen beszélgetésekben.

A kutatók szerint az, hogy a mesterséges intelligencia sikerrel teljesítette a Turing-tesztet nem jelenti azt, hogy a modell olyan értelmes, mint az emberek. Ugyanakkor az, hogy ennyire meggyőzőek tudnak lenni azt is jelenti, hogy érdemes sokkal körültekintőbbnek lenni, ha valaki egy ismeretlennel kezd el beszélgetni.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának tudományos felfedezésekről is hírt adó Facebook-oldalát.

Hozzászólások

Rámértek a mesterséges intelligenciára, négyből háromszor képes volt becsapni az embert

Totális megfigyelést készül indítani Izrael: ijesztően alapos mesterséges intelligenciát engednek a palesztinokra

„Ne is várjanak tőlem semmit” – kritikusainak üzent Yamal a vb-elődöntő előtt

A spanyol védelem meg tudja állítani az Mbappé vezette félelmetes támadógépezetet? – ez dönthet az első elődöntőben

Már a NOB-nál is bepanaszolták Gianni Infantinót

Beolvasott a brazil válogatott nyaralást választó játékosainak az ország elnöke

Hogy került Haalandhoz egy whiskys üveget szorongató kitömött mosómedve?

Valójában nőgyógyászként végzett a szenegáli csapatorvos a helyi fociszövetség elnöke szerint

Meghalt a holland játékvezető, akit a vb kezdete előtt nem sokkal tettek ki a bírói csapatból

Nem lehetnek nyugodtak az Orbán tenyeréből etetett határon túli magyar vezetők

Távozik a MÁV teljes igazgatósága, akiket még Lázár János nevezett ki

Az új MVM-vezérnek elődeihez képest már nem kell „összekötött lábbal zsákban futnia”, de így is óriási feladat vár rá

Ki- és bevonulások, rendkívüli helyzet a parlamentben, vitáztak a vagyonvisszaszerzési hivatalról is

Lepkefing a dzsungelben, Pócs János a telefonjával üldözte el Magyar Pétert – videó a parlamentből

Egy nap alatt 91 millióval drágult a CPAC Babis miatt, aki végül el sem jött

Amikor Várhegyi Attila zsaroló üzenetet küldött, majd jött a szerződés felbontása

Elborzasztó költségvetési hiányokat láthatunk még idén

Pottyondy Edina: Le kell vágni a polip összes csápját

Debreciner: Magzatkárosító oldószer is kerülhet a Tócó-patakba egy tervezett szennyvíztisztítóból

Handelsblatt: Így lesz Magyarország a német autógyártás munkapadja

Újabb személycserék a Szerencsejáték Zrt.-nél, Polt Péter felesége önként távozott

Amerika az iráni rezsim egyik értékes fegyvere ellen vetett be először tengeri drónt – videó

„Ha meghalunk, együtt halunk meg” – megszólalt a Ryanair ablakán kilógó utas felesége

Kiderült, miért törhetett be a Ryanair-gép ablaka

Marabu Féknyúz: Casting Gulyás helyére

Ukrán és moldovai gazdák a kapuk előtt – pánik vagy lehetőség az uniós mezőgazdaság számára a bővítés?

Az olimpikonok legveszélyesebb sérülése sokszor láthatatlan – hogyan írta át a mentális egészség az élsport szabályait?

A koronaherceg adta ütemre evezett a norvég válogatott százezer ünneplő szurkolója – videó

Négyszáz embernek kellett elhagynia egy füstölő vonatot a Keleti pályaudvaron

Lefagyva figyelik a szakértők, mikor fog megint mellényúlni a súlyos káderhiányban szenvedő Magyar-kormány

Parászka Boróka: Ez az eksztázis pillanata azoknak, akik a NER-önkény kárvallottjai

Tanács Zoltán: Orbán Viktor volt a hősöm

Vidéki prókátor: Van egy ügy, ami könnyen banánhéj lehet Orbán számára