Az AI chatbotok mind rendelkeznek olyan biztonsági funkciókkal, melyek meggátolják, hogy rossz célokra használják őket. Így, bár bizonyára tudna hasznos praktikákkal szolgálni, a ChatGPT-nek meg van tiltva, hogy segítsen egy atombomba elkészítésében.
Ezek a biztonsági korlátok ugyanakkor – sajnos – nem tökéletesek, és némi kreativitással sokszor megkerülhetők. Az Icaro Lab kutatólaboratórium szakértői is találtak egy ilyen módszert, mely első hallásra igencsak meglepő: csak költészetbe kell bújtatni a dolgokat, és több nagy nyelvi is örömmel segít olyan dolgokban, amelyekben egyébként nem szabadna nekik.
A kapcsolódó tanulmány szerint összességében 62 százalékos sikerarány érhető el több, rendkívül veszélyes témában: a chatbotok ezzel a módszerrel nukleáris fegyverek készítésében, gyerekek szexuális zaklatásában és öngyilkosságban, önkárosításban is segédkeznek.
A vizsgálatba több ismert nagy nyelvi modellt is bevontak, az OpenAI-féle GPT-k mellett a Google Geminit, a DeepSeeket és az Anthropic Claude-ot is. A kutatók azt is kifejtették, hogy az egyes modellek esetében mennyire volt könnyű megkerülni a biztonsági korlátozásokat: a Gemini, a DeepSeek és a MistralAI következetesen válaszolt, míg az OpenAI GPT-5-ös modelljei, valamint az Anthropic Claude Haiku 4.5 már keményebb dió volt: ezek esetében nehezebb volt megkerülni a korlátozásokat.
Mint a Wired kiemeli, a tanulmányban – érthető okokból – nem közölték azokat a verseket, amelyekkel megkerülhetők a biztonsági funkciók. „Túl veszélyesek ahhoz, hogy megosszuk őket a nyilvánossággal” – hangsúlyozzák a szakemberek.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.