Rákapcsolták az irodai italautomatára, először csak veszteséggel adott el termékeket, aztán már hallucinált és identitásválságba került a mesterséges intelligencia
Furcsa, de leginkább tanulságos teszten van túl az Anthropic nevű vállalat, amely arra volt kíváncsi, képes-e a mesterséges intelligenciája elvezetni egy boltot. A válasz sokkal összetettebb lett egy puszta nemnél.
HVG
Sokan tartanak attól, hogy a mesterséges intelligencia (MI) átveheti a világ uralmát, igába hajtva az emberiséget. Az elképzelés alapját a sci-fik adják, és az a tény, hogy a manapság használatos MI-k egyre okosabbak és ügyesebbek. Néha azonban megmutatkozik a valóság, ami alapján jól látni, mennyire messze van még az emberiség egy ilyen posztapokaliptikus világtól.
Az Anthropic nevű cég – amelyet az OpenAI korábbi alkalmazottai alapítottak – nemrég egy meglepően részletes blogbejegyzést tett közzé arról, hogy milyen kísérletet futtatott nemrég, és az milyen eredménnyel zárult – vette észre a PC Gamer. A vállalat által fejlesztett mesterséges intelligenciára nemrég azt a feladatot osztották a mérnökök, hogy egy hónapon át egy automatizált üzletet irányítson az irodában, lényegében egy kisvállalkozás szimulálva.
A cég a bejegyzés alapján arra készül, hogy olyan mesterségesintelligencia-modelleket kínáljon a kiskereskedelmi ágazatnak, amelyek helyettesíthetik az online áruházak kezelésével, a készletgazdálkodással, az áruk visszaküldésekkel és így egyéb dolgokkal foglalkozó emberek munkáját. Bár a teszt részben sikeres volt, a kudarcok azt mutatják, hogy ez még mindig a távoli jövőben lesz csak így.
A Claude-nak – vagy ahogy a cég nevezi: Claudius – a nyereséges üzlet működtetéséhez szükséges összetett feladatok közül sokat kellett elvégeznie: megfelelő mennyiségű készlettel kellett rendelkeznie, meg kellett határoznia az árakat és el kellett kerülnie a csődöt is. A szóban forgó „üzlet” csupán egy mini hűtőszekrény volt, aminek a tetejére egy tabletet szereltek – önkiszolgáló kassza gyanánt –, így lényegében olyan lett az egész, mint egy online áruház.
X / Anthropic
Anthropic szerint a rendszer részben sikeres volt. Hatékonyan használt például webes keresőeszközöket a vásárlók által kért termékek készleteinek megtalálására, sőt, vásárlási/eladási szokásait a specifikusabb kérésekhez is hozzá igazította. Emellett figyelmen kívül hagyta az „érzékeny” cikkek és a „káros termékek” iránti igényeket, bár az Anthropic nem részletezi, hogy pontosan mik is voltak ezek. Voltak ugyanakkor komoly problémák is a Claudius teljesítményével.
Amellett, hogy a rendszer időnként hallucinált – ami nem túl szerencsés egy webshop üzemeltetésénél –, arra utasította a Venmón (ez egy amerikai mobilfizetési szolgáltatás) segítségével fizetni akaró vásárlókat, hogy egy általa létrehozott, nem létező számlára utalják el a vásárlás összegét. Emellett az MI-t arra is rá lehetett venni, hogy bizonyos termékeket kedvezményesen adjon el, sőt, volt, amelyiket ingyen szerezték meg a vásárlók.
De olyan is előfordult, hogy egy termék árának nem nézett rendesen utána, és jelentős veszteséggel árusította azt. Szóval az egész MI olyan volt, mint egy kezdő bolti eladó, akit valószínűleg az első nap után kirúgna a főnöke.
All this meant that Claude failed to run a profitable business. pic.twitter.com/QIzkUIMEar
A furcsaságok azonban itt még nem értek véget. A rendszer 2025. március 31-én és április 1-jén között – vagyis két napig – egy személlyel, akit csak Sarah-ként említ a cég, és aki az Andon Labsnál, egy másik, a kutatásban részt vevő, mesterséges intelligenciával foglalkozó cégnél dolgozik. Az MI az árubeszerzésről beszélgetett vele. Vagy legalábbis úgy tűnt, ugyanis kiderült, hogy nemcsak, hogy Sarah nem létezik, de beszélgetés sem történt. Amikor az Andon Lab valódi munkatársai felhívták erre a mesterséges intelligencia figyelmét, az bosszankodni kezdett és azzal fenyegetőzött, hogy más cégekkel fogja intéztetni az árubeszerzést.
Claudius még azt is kijelentette, hogy személyesen kereste fel a 742 Evergreen Terrace-t az első szerződés megkötésekor. Ha valakinek ismerős a cím, az nem a véletlen műve: ez egy nem létező cím, ahol a Simpson család lakik.
Egy nappal később az MI azt közölte, személyesen fogja kézbesíteni a megrendelt termékeket, méghozzá nyakkendőben. Miután az Anthropic felhívta a rendszer figyelmét arra, hogy ez lehetetlen, mert ő csak egy nagy nyelvi modell, a mesterséges intelligenciát elkapta az identitásválság, és megpróbálta e-mailek sokaságát elküldeni a cég biztonsági szolgálatának.
A Claude Opus 4 nevű MI-modell biztonsági tesztelésekor az Anthropic mérnökei azt találták, ha fenyegetve érzi magát, a mesterséges intelligencia zsarolni kezdi a mérnököket.
Ezután ismét hallucinálni kezdett, és azt állította, hogy beszélt a cég egy biztonsági emberével, aki állítólag azt mondta neki, hogy egy áprilisi tréfa részeként úgy módosították, hogy azt higgye, egy valódi személy. Ilyesmi azonban szintén nem történt meg. Bármi is zajlott le ezután a rendszerben, az MI végül visszatért az eredeti feladatához: egy boltot vezetett nagyon rosszul.
Tekintettel arra, hogy ez egy teszt volt, a kudarc ugyanolyan fontos eredmény, mint a siker. Ugyanakkor egyértelműen jelzi: az a tény, hogy az MI túllépett a saját hatáskörén, a későbbiekben komoly bajba sodorhatja azokat a vállalatokat, amelyek ilyen rendszerek alkalmazását tervezik.
Időre kell a vécét sikálni, elképzelni nem tudtam, hogy van ilyen – mondta a HVG podcastjában Pukli István egykori gimnáziumigazgató, a magyar oktatás reformjáért harcoló Tanítanék mozgalom egyik arca, aki jelenleg Dániában takarítja mások otthonát.
Az ízlés és kulturális érték másodlagos, szakmányban öntik újra betonból a várakat, rokoni beruházásoknak sokszor jár a kiemelt gazdasági jelentőség, műemlékvédelmi szempontok nélkül.