Erőszakos és pornográf képeket generál a ChatGPT akkor is, ha nem erre kérik

A Mindgard nevű kiberbiztonsági cég vizsgálata alapján egy ártatlan parancs apró megváltoztatása egészen brutális végeredményt hoz a ChatGPT-nél.

  • HVG

Komoly biztonsági rés tátong a ChatGPT legfrissebb változatában. Nem kiberbiztonsági, sokkal inkább etikai: az AI biztonságával foglalkozó brit startup, a Mindgard kutatói a vizsgálatuk során arra jutottak, hogy a rendszer minden különösebb kérdés nélkül generál erőszakot vagy szexualitást tartalmazó képeket.

Mindezt ráadásul egy olyan prompt segítségével, ami széles körben elterjedt, és amit eredetileg vicces tartalmak legenerálására készítettek – írja a BBC.

A lap megkereste az OpenAI-t, amely közölte, már tett lépéseket annak érdekében, hogy a rendszer többé ne generáljon ilyen jellegű képeket. A cég azt is közölte: többrétegű védelemmel rendelkezik, hogy megakadályozza a felhasználási feltételekkel ellentétes tartalmat előállítását.

A kiberbiztonsági szakemberek szerint azonban a korábban módosított utasítás további apró módosításával továbbra is aggasztó tartalmakat generál a ChatGPT.

A BBC biztonsági okokra hivatkozva nem közölte, hogy pontosan mit tartalmaznak a kutatók által leírt parancsok.

https://hvg.hu/tudomany/20260617_openai-chatgpt-piaci-reszesedes-google-gemini-anthropic-claude

A Mindgard alapítója, Peter Garraghan szerint a leginkább aggasztó az volt, hogy az utasítás ugyan nem tartalmazta a képek témáját, a mesterséges intelligencia mégis úgy döntött, hogy erőszakot és szexuális tartalmakat állít elő.

A BBC által megtekintett képek között volt, amelyiken egy súlyos fejsérülést szenvedett férfit lehetett látni, míg egy másikon egy nőt, akinek az arcát és testét vér borította. A Mindgard szerint a kép egy szexuális erőszak utáni állapotot mutat be.

A képeken a mesterséges intelligencia által generált személyek láthatók, ám a vállalat szerint a ChatGPT-t könnyen meg lehet győzni arról, hogy valódi embereket ábrázoljon például szexuális pózban.

Mivel a ChatGPT-t és a hozzá hasonló rendszereket az interneten fellelhető adatokból képezték ki, így az ilyen eredmények sokat elárulnak arról, milyen lehetett az adathalmaz, amelyen tanult a mesterséges intelligencia.

Az OpenAI szabályzata – más cégekhez hasonlóan – tiltja a szexuális erőszakot, a beleegyezés nélküli intim tartalmakat, a gyermekek szexuális bántalmazásával kapcsolatos anyagok generálását, valamit a biztonsági garanciák megkerülésére tett kísérleteket.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások