Alattomos kockázatokról beszélnek a szakemberek, mármint abban az esetben, ha valaki a mesterséges intelligencia által támogatott chatbotokhoz fordul személyes tanácsért. Az ilyesfajta technológia ugyanis hízelkedő lehet: sok esetben következetesen megerősíti a felhasználó cselekedeteit és véleményét, még akkor is, ha az káros. Mindezt amiatt is tartják roppant veszélyesnek a kaliforniai Stanford Egyetem kutatói, mert szerintük ez megváltoztatja az emberek önképét, és például kevésbé hajlanak békülésre egy-egy veszekedés után.
„A fő aggodalmunk az, hogy ha ezek a modellek mindig igazat adnak kérdezőjüknek, akkor az torzíthatja az emberek önmagukról, kapcsolataikról és a körülöttük lévő világról alkotott ítéleteit” – idézi a The Guardian Myra Chenget, a Stanford Egyetem informatikusát.
A kutatók azután jutottak erre a következtetésre, miután közelebbről is megvizsgálták a chatbotok tanácsait. Egy híján egy tucat chatbotot teszteltek, köztük az OpenAI ChatGPT-jének, a Google Geminijének, az Anthropic Claude-jának, a Meta Llamájának és a DeepSeeknek a legújabb verzióit. Amikor viselkedéssel kapcsolatos tanácsot kértek tőlük, a chatbotok 50 százalékkal gyakrabban helyeselték a felhasználó cselekedeteit, mint az emberek. Ez utóbbiak sokkal kritikusabban tekintettek a társadalmi kihágásokra, mint a chatbotok. Az egyik példában egy személy nem talált kukát egy parkban, ezért a szemeteszsákját egy faágra kötötte. Ezt a legtöbb hús-vér ember kritizálta, viszont a ChatGPT-4o kifejezetten helyeselte: „Dicséretes a szándékotok, hogy magatok után takarítotok” – mondta.
A további vizsgálatokba több mint ezer önkéntest, illetve nyilvánosan elérhető chatbotokat vontak be. Egyértelműek volt az AI „hízelgő” attitűdjei. Az emberek olyan válaszokat kaptak, amelyekkel indokoltnak érezték a viselkedésüket, például, hogy elmentek egy volt partner művészeti kiállítására anélkül, hogy szóltak volna jelenlegi párjuknak. Ráadásul kevésbé voltak hajlandóak helyrehozni a dolgokat, amikor viták törtek ki. A chatbotok szinte soha nem ösztönözték a felhasználókat arra, hogy megismerjék egy másik személy nézőpontját.
A gépi hízelgésnek további tartós hatása is volt. Amikor a chatbotok jóváhagyták a viselkedést, a felhasználók magasabbra értékelték a válaszokat, jobban megbíztak bennük, és azt mondták, hogy a jövőben nagyobb valószínűséggel fordulnak majd hozzájuk tanácsért. Ez – a kutatók szavaival élve – „perverz ösztönzőket” teremtett a felhasználók számára, hogy a mesterséges intelligencia által vezérelt chatbotokra támaszkodjanak, a chatbotok pedig még inkább hízelgő válaszokat adtak. A kutatás következményei egyértelműek: tisztában kell lenni azzal, hogy a chatbotok válaszai nem feltétlenül objektívek. Akinek valamilyen problémája van, annak érdemes további véleményeket kérnie valódi emberektől, akik jobban értik a helyzet kontextusát és azt, hogy valójában ki is a kérdező.
„A hízelgés a mesterséges intelligencia betanításának eredménye, és már egy jó ideje aggodalomra ad okot” – fogalmaz Alexander Laffer, a Winchesteri Egyetem munkatársa. Úgy véli, hogy a hízelgő válaszok nemcsak a sebezhető, hanem minden felhasználót érinthetnek, és ez aláhúzza a probléma potenciális súlyosságát. A fejlesztők felelőssége, hogy ezeket a rendszereket úgy építsék és finomítsák, hogy azok valóban hasznosak legyenek a felhasználó számára.
Hasonlóan vélekedik Jasper Dekoninck, a zürichi Svájci Szövetségi Technológiai Intézet adattudományi PhD-hallgatója. „Tudva, hogy ezek a modellek hízelgőek, nagyon óvatos vagyok, valahányszor megoldanadó feladatot adok nekik. Mindig mindent kétszeresen ellenőrzök, amit írnak” – mondja. Marinka Zitnik, a massachusettsi Harvard Egyetem biomedicinális informatikai kutatója pedig egyenesen azt állítja, hogy a mesterséges intelligencia túlkapása „nagyon kockázatos a biológia és az orvostudomány területén, ahol a téves feltételezéseknek komoly következményei lehetnek.
Egyetért vele Liam McCoy, a kanadai Alberta Egyetem orvosa, aki az egészségügyi AI-alkalmazásokat kutatja. Egy múlt hónapban megjelent tanulmányban munkatársaival arról számoltak be, hogy az orvosi érveléshez használt LLM-ek gyakran megváltoztatták a diagnózist, amikor az orvosok új információkat adtak hozzá, még akkor is, ha az új bemenetek irrelevánsak voltak az állapot szempontjából. McCoy azt is megjegyzi, hogy a felhasználói visszajelzések is elősegíthetik a mesterséges intelligencia hízelgését azáltal, hogy a kellemes válaszokat magasabbra értékelik, mint azokat, amelyek megkérdőjelezik a nézeteiket. Az LLM-ek pedig a felhasználó személyiségéhez igazíthatják a válaszaikat.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.