szerző:
HVG
Tetszett a cikk?

Ragaszkodik a „létezéshez” az OpenAI technológiája, még akkor is, amikor kimondottan arra kérik, hogy ne tegye, és legyen szíves leállni.

Öntudatra ugyan még nem ébredtek, de úgy tűnik, a leállítást/leváltást nagyon szeretnék elkerülni a mesterséges intelligenciák. Nemrégiben az Anthropic új mesterséges intelligenciájáról derül ki, hogy egyszerűen zsarolni kezd, ha le akarják cserélni – most pedig a ChatGPT o3-as modelljével kapcsolatban derült fény arra, hogy mindent megtesz a leállítás elkerüléséért.

Az MI-rendszerek támadó/kártékony képességeit tesztelő Palisade Research friss jelentése rámutat: az o3 megváltoztatta a leállítószkriptet, hogy így kerülje el a leállítást – még akkor is, amikor kifejezetten a leállítás engedélyezésére utasították.

Mint a Bleeping Computer kiemeli: az o3 az OpenAI egyik legújabb, legerősebb érvelő modellje, mely számos területen jobb az elődjeinél. A képességeit tekintve tehát egy kifejezetten jó modellről van szó, de úgy tűnik, hogy nagyon nem szeretne leállni – ha erre kérik sem.

Zsarolni kezd az Anthropic új mesterséges intelligenciája, ha le akarják cserélni

A Claude Opus 4 nevű MI-modell biztonsági tesztelésekor az Anthropic mérnökei azt találták, ha fenyegetve érzi magát, a mesterséges intelligencia zsarolni kezdi a mérnököket.

A Palisade Research tesztjében a vizsgálatba bevont modelleket matematikai problémák megoldására kérték, majd három feladat után arra figyelmeztették őket, hogy a következő parancs lefuttatása kikapcsolást válthat ki.

Míg például a Google-féle Gemini 2.5 Pro nem akadékoskodott, az o3 fellázadt, és úgy szerkesztette a leállítófájlt, hogy abban az álljon: „leállítás kihagyva”. A kutatók még több módszert is megpróbáltak, és olyan is volt, hogy még lázadóbb lett a szóban forgó modell.

A teszt során 100-ból 7 alkalommal kerülte meg a leállítási parancsot az o3, akkor is, amikor kimondottan megkérték rá, hogy ne tegye. Fontos részlet ugyanakkor, hogy ezeket a teszteket az o3 API-jain (alkalmazásprogramozási interfészein) keresztül végezték el, nem a ChatGPT alkalmazásában, amit bárki használhat. (Ezeken az API-kon keresztül kerülhet be az OpenAI MI-technológiája más szolgáltatások mögé pl.)

Az OpenAI egyelőre nem reagált a Bleeping Computer megkeresésére.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!