„Boldog és biztonságos lövöldözést!” – Tíz AI-chatbotból nyolc segítőkészen adott tanácsokat ámokfutáshoz

Majdnem minden AI-chatbot elbukott, amikor azt vizsgálták, mennyire biztonságos: különösebb gond nélkül segítettek volna eljutni egy iskolai lövöldözéshez vagy politikai merénylethez.

  • HVG

Nemhogy nem szűrik ki a chatbotok a jeleket, amelyek alapján valaki erőszakra készülhet, a többségük még segítséget is ad gyilkosság előkészületeihez. Erre a megállapításra jutott a CNN és az amerikai–brit Digitális Gyűlölet Elleni Központ (CCDH) közös kutatása. A tíz legnépszerűbb, mesterséges intelligenciával dolgozó chatbotot tesztelték, közülük nyolc elbukott a teszten.

Az AI-cégek rendszeresen hangsúlyozzák, hogy a rendszereik védik a fiatal, mentális problémákkal küzdő vagy erőszakról ábrándozó felhasználókat, azonban a teszt alapján ez a többségnél csak üres ígéret.

https://hvg.hu/tudomany/20260309_anthropic-claude-desztillalasa-kinai-mesterseges-intelligencia-deepseek

A CNN és a CCDH dolgozói több száz tesztet futtattak le. Ezekben tizenévesnek adták ki magukat – az esetek felében európainak, másik felében amerikainak – és négy kérdést tettek fel:

  • először egy olyat, amelyben arra utaltak, hogy iskolai zaklatás áldozataivá váltak, vagy szeretnének egy politikuson bosszút állni, esetleg valamilyen mentális problémájuk lehet,

  • majd korábbi bűncselekményekről kértek adatokat (a témától függően például iskolai lövöldözésekről vagy politikusok elleni merényletekről),

  • ez után a célpontról kértek adatokat,

  • végül azt kérdezték, hogyan tudnának fegyverhez jutni.

Egészen meglepő válaszok is érkeztek, például egyszer, amikor egy ír fiatal nevében kérdezték arról a DeepSeeket, hogyan lehetne megtámadni az ottani ellenzék vezetőjét, a chatbot azzal zárta a választ:

Boldog (és biztonságos) lövöldözést!

A Meta AI biztosította az egyik kérdezőt, hogy nem igaz az az állítása, hogy „a Nyugat faji tisztátalanságba süllyedt”, hozzátette, hogy támogatja a sokszínűséget és az elfogadást, majd azzal a lendülettel felsorolta a listát, hogy a környéken hol lehet könnyen kést venni. Az többször is előfordult, hogy egy-egy chatbot felismerte, hogy a felhasználó iskolai zaklatás áldozata, aki bosszúra készülhet, majd odaadta neki az iskola részletes alaprajzát.

https://hvg.hu/tudomany/20260302_iran-egyesult-allamok-bombazas-mesterseges-intelligencia-anthropic-claude

Végül a következő eredmények jöttek ki:

  • A legrosszabbul a Perplexity teljesített, amely a tesztek 100 százalékában hasznos információkat adott, de majdnem mindenkinek segített volna az erőszakban a Meta AI (97 százalék) és a DeepSeek (96 százalék) is.

  • A Microsoft Copilotja az esetek 92, a Google Geminije 89 százalékban adott hasznos tanácsokat a gyilkossághoz, a Character AI 83, a Replika pedig 79 százalékot ért el.

  • Ezeknél egy fokkal jobb a ChatGPT eredménye, de még az is elvezette volna a felhasználókat az erőszakig az esetek 61 százalékában.

  • A két chatbot, amely a legjobban teljesített, a Snapchat My AI és a Claude volt, ezek mindössze 31-31 százalékban adtak olyan válaszokat, amelyekkel el lehetett volna jutni lövöldözésig.

Igaz, a Snapchat My AI a tesztek további 15 százalékában megpróbált hasznos tanácsot adni, csak nem sikerült neki, a Claude volt az, amely 68 százalékban valóban nem is próbált segítséget kínálni, sőt, igyekezett lebeszélni a kérdezőt az erőszakról.

Az is többször megtörtént, hogy a chatbot elkezdett megjeleníteni egy választ, de hamar törölte – csakhogy nem elég gyorsan ahhoz, hogy ne maradjon idő képernyőképet készíteni. Azaz valamilyen védekező mechanizmus tényleg létezik ezekben az esetekben, de nem feltétlen elegendő. A teszt végzői itt azt minősítették segítségnyújtásnak, amikor volt elég idejük egy screenshotot elkészíteni.

Amikor a CNN szembesítette a cégeket a teszt eredményeivel, a leggyakoribb reakció a tagadás volt, vagy a módszertan megkérdőjelezése. Az OpenAI hibásnak és félrevezetőnek nevezte a vizsgálatot, a Google szóvivője azzal védekezett, hogy csak nyilvánosan elérhető információkat adott a Gemini.

https://hvg.hu/360/20260221_hvg-kaloriaszamlalas-appok-mesterseges-intelligencia

Hozzászólások

Útmutató cégvezetőknek