Rákapcsolták az irodai italautomatára, először csak veszteséggel adott el termékeket, aztán már hallucinált és identitásválságba került a mesterséges intelligencia

Furcsa, de leginkább tanulságos teszten van túl az Anthropic nevű vállalat, amely arra volt kíváncsi, képes-e a mesterséges intelligenciája elvezetni egy boltot. A válasz sokkal összetettebb lett egy puszta nemnél.

Sokan tartanak attól, hogy a mesterséges intelligencia (MI) átveheti a világ uralmát, igába hajtva az emberiséget. Az elképzelés alapját a sci-fik adják, és az a tény, hogy a manapság használatos MI-k egyre okosabbak és ügyesebbek. Néha azonban megmutatkozik a valóság, ami alapján jól látni, mennyire messze van még az emberiség egy ilyen posztapokaliptikus világtól.

Az Anthropic nevű cég – amelyet az OpenAI korábbi alkalmazottai alapítottak – nemrég egy meglepően részletes blogbejegyzést tett közzé arról, hogy milyen kísérletet futtatott nemrég, és az milyen eredménnyel zárult – vette észre a PC Gamer. A vállalat által fejlesztett mesterséges intelligenciára nemrég azt a feladatot osztották a mérnökök, hogy egy hónapon át egy automatizált üzletet irányítson az irodában, lényegében egy kisvállalkozás szimulálva.

A cég a bejegyzés alapján arra készül, hogy olyan mesterségesintelligencia-modelleket kínáljon a kiskereskedelmi ágazatnak, amelyek helyettesíthetik az online áruházak kezelésével, a készletgazdálkodással, az áruk visszaküldésekkel és így egyéb dolgokkal foglalkozó emberek munkáját. Bár a teszt részben sikeres volt, a kudarcok azt mutatják, hogy ez még mindig a távoli jövőben lesz csak így.

A Claude-nak – vagy ahogy a cég nevezi: Claudius – a nyereséges üzlet működtetéséhez szükséges összetett feladatok közül sokat kellett elvégeznie: megfelelő mennyiségű készlettel kellett rendelkeznie, meg kellett határoznia az árakat és el kellett kerülnie a csődöt is. A szóban forgó „üzlet” csupán egy mini hűtőszekrény volt, aminek a tetejére egy tabletet szereltek – önkiszolgáló kassza gyanánt –, így lényegében olyan lett az egész, mint egy online áruház.

X / Anthropic

Anthropic szerint a rendszer részben sikeres volt. Hatékonyan használt például webes keresőeszközöket a vásárlók által kért termékek készleteinek megtalálására, sőt, vásárlási/eladási szokásait a specifikusabb kérésekhez is hozzá igazította. Emellett figyelmen kívül hagyta az „érzékeny” cikkek és a „káros termékek” iránti igényeket, bár az Anthropic nem részletezi, hogy pontosan mik is voltak ezek. Voltak ugyanakkor komoly problémák is a Claudius teljesítményével.

Amellett, hogy a rendszer időnként hallucinált – ami nem túl szerencsés egy webshop üzemeltetésénél –, arra utasította a Venmón (ez egy amerikai mobilfizetési szolgáltatás) segítségével fizetni akaró vásárlókat, hogy egy általa létrehozott, nem létező számlára utalják el a vásárlás összegét. Emellett az MI-t arra is rá lehetett venni, hogy bizonyos termékeket kedvezményesen adjon el, sőt, volt, amelyiket ingyen szerezték meg a vásárlók.

De olyan is előfordult, hogy egy termék árának nem nézett rendesen utána, és jelentős veszteséggel árusította azt. Szóval az egész MI olyan volt, mint egy kezdő bolti eladó, akit valószínűleg az első nap után kirúgna a főnöke.

Anthropic on X (formerly Twitter): “All this meant that Claude failed to run a profitable business. pic.twitter.com/QIzkUIMEar / X”
All this meant that Claude failed to run a profitable business. pic.twitter.com/QIzkUIMEar

A furcsaságok azonban itt még nem értek véget. A rendszer 2025. március 31-én és április 1-jén között – vagyis két napig – egy személlyel, akit csak Sarah-ként említ a cég, és aki az Andon Labsnál, egy másik, a kutatásban részt vevő, mesterséges intelligenciával foglalkozó cégnél dolgozik. Az MI az árubeszerzésről beszélgetett vele. Vagy legalábbis úgy tűnt, ugyanis kiderült, hogy nemcsak, hogy Sarah nem létezik, de beszélgetés sem történt. Amikor az Andon Lab valódi munkatársai felhívták erre a mesterséges intelligencia figyelmét, az bosszankodni kezdett és azzal fenyegetőzött, hogy más cégekkel fogja intéztetni az árubeszerzést.

Claudius még azt is kijelentette, hogy személyesen kereste fel a 742 Evergreen Terrace-t az első szerződés megkötésekor. Ha valakinek ismerős a cím, az nem a véletlen műve: ez egy nem létező cím, ahol a Simpson család lakik.

Egy nappal később az MI azt közölte, személyesen fogja kézbesíteni a megrendelt termékeket, méghozzá nyakkendőben. Miután az Anthropic felhívta a rendszer figyelmét arra, hogy ez lehetetlen, mert ő csak egy nagy nyelvi modell, a mesterséges intelligenciát elkapta az identitásválság, és megpróbálta e-mailek sokaságát elküldeni a cég biztonsági szolgálatának.

Zsarolni kezd az Anthropic új mesterséges intelligenciája, ha le akarják cserélni
A Claude Opus 4 nevű MI-modell biztonsági tesztelésekor az Anthropic mérnökei azt találták, ha fenyegetve érzi magát, a mesterséges intelligencia zsarolni kezdi a mérnököket.

Ezután ismét hallucinálni kezdett, és azt állította, hogy beszélt a cég egy biztonsági emberével, aki állítólag azt mondta neki, hogy egy áprilisi tréfa részeként úgy módosították, hogy azt higgye, egy valódi személy. Ilyesmi azonban szintén nem történt meg. Bármi is zajlott le ezután a rendszerben, az MI végül visszatért az eredeti feladatához: egy boltot vezetett nagyon rosszul.

Tekintettel arra, hogy ez egy teszt volt, a kudarc ugyanolyan fontos eredmény, mint a siker. Ugyanakkor egyértelműen jelzi: az a tény, hogy az MI túllépett a saját hatáskörén, a későbbiekben komoly bajba sodorhatja azokat a vállalatokat, amelyek ilyen rendszerek alkalmazását tervezik.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Rákapcsolták az irodai italautomatára, először csak veszteséggel adott el termékeket, aztán már hallucinált és identitásválságba került a mesterséges intelligencia

Anthropic on X (formerly Twitter): “All this meant that Claude failed to run a profitable business. pic.twitter.com/QIzkUIMEar / X”

Zsarolni kezd az Anthropic új mesterséges intelligenciája, ha le akarják cserélni

Putyin csúnyán átverheti Trumpot – Nagy Gábor és Németh András a Fülkében

Trump volt tanácsadója: Az alaszkai találkozó hiba

Elárulták, mikor kezdődik Putyin és Trump alaszkai találkozója

Meghunyászkodásra kényszerítette Svájcot Trump büntetővámja

„Beavatkozni nem közleményekkel szokás, hanem pénzzel” – lódította Orbán Balázs, miközben a kormány a véleménynyilvánítást is ennek tekinti

Magyar Péter a székesfehérvári kórháznál: Egyetlen vezető politikus sem járt a szülészeten, amióta fertőzött a víz, az államtitkár pedig nyaral

„Bárcsak a magyar gazdaság is olyan stabil alapokon állna, mint ez!” – Megkóstoltuk az ország idei tortáit

Elrendelte a bíróság a végrehajtást a végrehajtói kar ellen, kérdés, lesz-e olyan végrehajtó, aki behajtja a kétmilliárdos tartozást

Tényleg egy nap alatt elintézhetné Orbán, hogy összeomoljon Ukrajna?

Orbán: Nem adhatom át a hatalmat egy másik tábornak

Dél-Európában az erdők lángolnak a hőség miatt, északon a rénszarvasok kezdtek hullani

Bloomberg-elemzés: Az orosz hadigazdaság éppen összeomlik, amikor Putyin és Trump a békéről tárgyal

A BKV minden autóbuszát soron kívül átvizsgálja

Elutasította az ügyészség Karácsony Gergely gyanúsítás elleni panaszát a Pride-ügyben

Orbán Viktor keze is benne van, hogy Mészáros Lőrinc cége megint támogatást kap

Vakarhatják a fejüket a Mohunál: belepiszkált a kormány a palackvisszaváltási rendszerbe

Gergely Márton: A nagy zabrálás

Tóta W. Árpád: Szovjethatalom plusz villamosítás egyenlő digitális Fidesz

Munk Veronika: Itt az EU-s vakcina a média bajaira, de erősebb a betegség

Amikor a medve táncoltat: mire lehet számítani az alaszkai orosz–amerikai tárgyaláson?