Rámértek a mesterséges intelligenciára, négyből háromszor képes volt becsapni az embert
Átment a Turing-teszten az OpenAI által fejlesztett modell, a GPT-4.5: az esetek 73 százalékéban képes volt elhitetni az emberrel, hogy nem robottal, hanem egy másik emberrel beszélget.
HVG
Míg néhány évvel ezelőtt még viszonylag könnyen meg lehetett mondani egy csevegésről, hogy a másik oldalon gép vagy ember írja az üzenetet, ma már ez nem egyértelmű. Olyannyira nem, hogy az egyik legjobb mesterségesintelligencia-modellt, ami jelenleg a piacon van, az OpenAI által fejlesztett GPT-4.5-ről a tesztelők – a Turing-teszt frissített változatában – többször gondolták azt, hogy ember, mint azt, hogy robot.
A Turing-teszt arra szolgál, hogy mérje a gépi intelligenciát, illetve, hogy a felhasználók észlelik-e, hogy egy géppel van dolguk. A Kaliforniai Egyetem kutatói ezért ezt a módszert választották a vizsgálatukhoz: Turing-tesztet végeztek nagyjából 300 ember bevonásával – írja a BGR. Az eredményeiket az arXiv preprint szerveren tették közzé.
A tanulmány során a résztvevőknek egyszerre kellett beszélgetniük a robottal és az emberrel, és el kellett dönteniük, hogy melyik üzenetet ki küldte. Amikor a GPT-4.5-öt arra utasították, hogy úgy beszéljen, mint egy popkultúrában jártas fiatal felnőtt, az esetek 73 százalékában képes volt elhitetni a felhasználókkal, hogy ő egy ember. Ez messze meghaladja az 50 százalékos esélyt, amit a kezdetektől fogva a Turing-teszt sikerességi küszöbeként határoztak meg a szakemberek. Érdekes módon az emberi csevegőtársak kevésbé voltak sikeresek abban, hogy meggyőzzék a résztvevőket arról, hogy ők az emberek.
Több, a fejlesztést ismerő izraeli forrás szerint a zsidó állam az emberi jogokat semmibe véve hallgatja le a palesztinokat, és ebből fakadóan már rendelkezik sosem nem látott méretű adatbázissal. A cél, hogy legyen elég alapanyag a mesterséges intelligenciának a palesztinok megfigyelésére.
A kísérlet más modelleket is tesztelt, köztük a Meta LLaMA 3-at és az OpenAI újabb GPT-4o-t, valamint az ELIZA-t, a valaha kifejlesztett egyik legkorábbi chatbotot. Nem meglepő módon azok a mesterséges intelligenciák, amelyeknek nem lehetett megmondani, hogy milyen karakter bőrébe bújva kommunikáljon, sokkal rosszabbul teljesítettek. A GPT-4.5 pontossága 36 százalékra esett vissza a karakter meghatározása nélkül, a GPT-4o pedig mindössze 21 százalékot ért el.
A BGR megjegyzi: nem ez az első alkalom, hogy a kutatók a mesterséges intelligenciát Turing-tesztnek vetik alá, de ezek az eredmények azt mutatják, hogy bár a nyelvi modellek nem úgy „gondolkodnak”, mint az emberek, egyre inkább képesek az emberi „viselkedésre” a rövid, kötetlen beszélgetésekben.
A kutatók szerint az, hogy a mesterséges intelligencia sikerrel teljesítette a Turing-tesztet nem jelenti azt, hogy a modell olyan értelmes, mint az emberek. Ugyanakkor az, hogy ennyire meggyőzőek tudnak lenni azt is jelenti, hogy érdemes sokkal körültekintőbbnek lenni, ha valaki egy ismeretlennel kezd el beszélgetni.
Érkezik a magyar fesztiválkultúra történetét feldolgozó dokumentumfilm. Arról, hogy miért és hogyan rendeződik át manapság a hazai fesztiválpiac és hogy szeretnek-e egyáltalán a fiatalok fesztiválozni és sörözni, a rendezővel, Csizmadia Attilával beszélgettünk.