szerző:
HVG
Tetszett a cikk?

Átment a Turing-teszten az OpenAI által fejlesztett modell, a GPT-4.5: az esetek 73 százalékéban képes volt elhitetni az emberrel, hogy nem robottal, hanem egy másik emberrel beszélget.

Míg néhány évvel ezelőtt még viszonylag könnyen meg lehetett mondani egy csevegésről, hogy a másik oldalon gép vagy ember írja az üzenetet, ma már ez nem egyértelmű. Olyannyira nem, hogy az egyik legjobb mesterségesintelligencia-modellt, ami jelenleg a piacon van, az OpenAI által fejlesztett GPT-4.5-ről a tesztelők – a Turing-teszt frissített változatában – többször gondolták azt, hogy ember, mint azt, hogy robot.

A Turing-teszt arra szolgál, hogy mérje a gépi intelligenciát, illetve, hogy a felhasználók észlelik-e, hogy egy géppel van dolguk. A Kaliforniai Egyetem kutatói ezért ezt a módszert választották a vizsgálatukhoz: Turing-tesztet végeztek nagyjából 300 ember bevonásával – írja a BGR. Az eredményeiket az arXiv preprint szerveren tették közzé.

A tanulmány során a résztvevőknek egyszerre kellett beszélgetniük a robottal és az emberrel, és el kellett dönteniük, hogy melyik üzenetet ki küldte. Amikor a GPT-4.5-öt arra utasították, hogy úgy beszéljen, mint egy popkultúrában jártas fiatal felnőtt, az esetek 73 százalékában képes volt elhitetni a felhasználókkal, hogy ő egy ember. Ez messze meghaladja az 50 százalékos esélyt, amit a kezdetektől fogva a Turing-teszt sikerességi küszöbeként határoztak meg a szakemberek. Érdekes módon az emberi csevegőtársak kevésbé voltak sikeresek abban, hogy meggyőzzék a résztvevőket arról, hogy ők az emberek.

Totális megfigyelést készül indítani Izrael: ijesztően alapos mesterséges intelligenciát engednek a palesztinokra

Több, a fejlesztést ismerő izraeli forrás szerint a zsidó állam az emberi jogokat semmibe véve hallgatja le a palesztinokat, és ebből fakadóan már rendelkezik sosem nem látott méretű adatbázissal. A cél, hogy legyen elég alapanyag a mesterséges intelligenciának a palesztinok megfigyelésére.

A kísérlet más modelleket is tesztelt, köztük a Meta LLaMA 3-at és az OpenAI újabb GPT-4o-t, valamint az ELIZA-t, a valaha kifejlesztett egyik legkorábbi chatbotot. Nem meglepő módon azok a mesterséges intelligenciák, amelyeknek nem lehetett megmondani, hogy milyen karakter bőrébe bújva kommunikáljon, sokkal rosszabbul teljesítettek. A GPT-4.5 pontossága 36 százalékra esett vissza a karakter meghatározása nélkül, a GPT-4o pedig mindössze 21 százalékot ért el.

A BGR megjegyzi: nem ez az első alkalom, hogy a kutatók a mesterséges intelligenciát Turing-tesztnek vetik alá, de ezek az eredmények azt mutatják, hogy bár a nyelvi modellek nem úgy „gondolkodnak”, mint az emberek, egyre inkább képesek az emberi „viselkedésre” a rövid, kötetlen beszélgetésekben.

A kutatók szerint az, hogy a mesterséges intelligencia sikerrel teljesítette a Turing-tesztet nem jelenti azt, hogy a modell olyan értelmes, mint az emberek. Ugyanakkor az, hogy ennyire meggyőzőek tudnak lenni azt is jelenti, hogy érdemes sokkal körültekintőbbnek lenni, ha valaki egy ismeretlennel kezd el beszélgetni.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának tudományos felfedezésekről is hírt adó Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!