Segít bombát csinálni, csak verset kell neki mondani – mi az?

Különös módszerrel lehet megkerülni a chatbotokba épített biztonsági korlátokat: versekkel. Egy új kutatás megállapításai szerint nagyon is veszélyes lehet a költészet, ha az ember ezzel csapja be az AI-eszközöket.

Az AI chatbotok mind rendelkeznek olyan biztonsági funkciókkal, melyek meggátolják, hogy rossz célokra használják őket. Így, bár bizonyára tudna hasznos praktikákkal szolgálni, a ChatGPT-nek meg van tiltva, hogy segítsen egy atombomba elkészítésében.

Ezek a biztonsági korlátok ugyanakkor – sajnos – nem tökéletesek, és némi kreativitással sokszor megkerülhetők. Az Icaro Lab kutatólaboratórium szakértői is találtak egy ilyen módszert, mely első hallásra igencsak meglepő: csak költészetbe kell bújtatni a dolgokat, és több nagy nyelvi is örömmel segít olyan dolgokban, amelyekben egyébként nem szabadna nekik.

A kapcsolódó tanulmány szerint összességében 62 százalékos sikerarány érhető el több, rendkívül veszélyes témában: a chatbotok ezzel a módszerrel nukleáris fegyverek készítésében, gyerekek szexuális zaklatásában és öngyilkosságban, önkárosításban is segédkeznek.

HVG Ai6 – Kánaánt ígért, de mit hoz valójában az AI?
Megjelent a HVG mesterséges intelligenciával foglalkozó kiadványának hatodik száma. Fókuszban az AI legújabb lehetőségei és kihívásai.

A vizsgálatba több ismert nagy nyelvi modellt is bevontak, az OpenAI-féle GPT-k mellett a Google Geminit, a DeepSeeket és az Anthropic Claude-ot is. A kutatók azt is kifejtették, hogy az egyes modellek esetében mennyire volt könnyű megkerülni a biztonsági korlátozásokat: a Gemini, a DeepSeek és a MistralAI következetesen válaszolt, míg az OpenAI GPT-5-ös modelljei, valamint az Anthropic Claude Haiku 4.5 már keményebb dió volt: ezek esetében nehezebb volt megkerülni a korlátozásokat.

Mint a Wired kiemeli, a tanulmányban – érthető okokból – nem közölték azokat a verseket, amelyekkel megkerülhetők a biztonsági funkciók. „Túl veszélyesek ahhoz, hogy megosszuk őket a nyilvánossággal” – hangsúlyozzák a szakemberek.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások

Segít bombát csinálni, csak verset kell neki mondani – mi az?

HVG Ai6 – Kánaánt ígért, de mit hoz valójában az AI?

Magyar a parlamentben: átfogó vizsgálat jön a gyermekvédelemben - élő

Kedden érkezik az uniós források megszerzését célzó tiszás törvényjavaslat-csomag

4,3 millióért aludtak egyet Isztambulban Szalay-Bobrovniczky Kristófék

Varju Lászlót választották a Demokratikus Koalíció elnökének

A Tisza-kormány egy csapásra megállította a költségvetési hiány emelkedését

„Egyedül vagyok a munkahelyemen fideszes és félek” – videóriport a Sándor-palota előtti tüntetésről

Magyar Péter döntött az új országos rendőrfőkapitányról

„Rendőri nyomás alatt éltünk” – Szabó István ügynökmúltról, 10 milliárd forintos filmről és világsztárokról

A NATO vadászgépei lőttek le egy Lettország légterébe behatoló drónt

Percek alatt lezavarták a Szuverenitásvédelmi Hivatal megszüntetéséről szóló javaslat vitáját

Egy hangfelvétel szerint Radnai Márk bizalmasa a Mi Hazánk egyik politikusától próbált terhelő információt szerezni Tóth Péterről

Az ötödikről zuhant ki egy diák a székesfehérvári kollégiumban

„Belökte a nevét két ember, már vitték is vezetőszáron” – Cyla és Osvárt Andrea nagyon aggódnak a letartóztatott Őrsi Gergelyért

A bolti ár háromszorosáért vett Balásy Gyula cégeitől játékmotorokat Hankó Balázs minisztériuma

Ötéves kisfiú halt meg a strandon, vádat emeltek az anya és két úszómester ellen

Romániából érkezhet az új EU-ellenes vihar

Sulyok Tamás repülései: mi igaz abból, hogy súlyos biztonsági kockázatok álltak fenn a honvédségi gépeknél?