Hazudik a mesterséges intelligencia, de nagyobb baj, hogy nem tudják fegyelmezni

Mintha csak kezelhetetlen gyerekek lennének, esetenként úgy viselkednek a chatbotok. Ha hazugságon kapva, fegyelmezni próbálják őket, még rosszabb lesz a helyzet.

A legilletékesebb hívta fel a figyelmet a mesterséges intelligencia egyik formájának, az emberi beszélgetéseket imitáló chatbotoknak egyik nagy problémájára: az OpenAI mondta el véleményét hazudozásukkal kapcsolatban. A chatbotok ugyanis hajlamosak elferdíteni a valóságot. Bár arra van kiképezve, hogy hiteles szövegeket állítsanak elő, azonban a mondataik olykor kitalált információkat is tartalmazhatnak. Ráadásul az OpenAI kutatói úgy gondolják, hogy az úgynevezett „rossz gondolatok” megbüntetése nem akadályozza meg a helytelen viselkedés legtöbbjét, inkább arra készteti a chatbotokat, hogy elrejtsék a szándékukat.

A kutatók nemrég írták le, hogy a GPT-4o modellt használták egy másik nagy nyelvi modell felügyeletére, fegyelmezve azt, ha hazudni próbált. Azonban kiderült, a modell továbbra is hazudott, viszont időközben megtanulta elrejteni szándékait az úgynevezett gondolati láncban (Chain of Thought, CoT).

A gondolati lánc gondolkodási modelljei természetes nyelven „gondolkodnak”, amelyet az ember érthet. „Gondolkodásuk” megfigyelése lehetővé tette a kutatók számára, hogy észleljék a helytelen viselkedést, például a kódolási feladatok során végzett tesztek felforgatását, a felhasználók megtévesztését vagy a feladást, ha egy problémát túl nehéznek találtak.

Úgy gondolják, hogy e gondolati lánc figyelése lehet egyike azon kevés eszköznek, amellyel a jövő modelljeit felügyelhetik. Azt találták továbbá, hogy a CoT közvetlen optimalizálása, hogy megfeleljen bizonyos kritériumoknak, rövid távon javíthatja a teljesítményt, azonban nem szüntetheti meg az összes helytelen viselkedést, és végül a modell elrejtheti a szándékát. Remélik, hogy a jövőbeli kutatások megtalálják a módját a CoT közvetlen optimalizálásának az említett hátrányok nélkül. Addig is azt javasolják, hogy a fejlesztők, annak érdekében, hogy korlátlanul megfigyelhessék modelljeiket, ne próbálják erősen optimalizálni ezeket.

Mindezzel az OpenAI kutatói tulajdonképpen azt mondják, hogy több tízmilliárd dolláros befektetés után még mindig nem tudják, hogyan irányítsák a MI-modelleket, hogy azok megfelelően viselkedjenek. Mindez egyúttal egy figyelmeztetés is azzal kapcsolatban, hogy érdemes fenntartásokkal kezelni a chatbotok válaszait, különösen a kritikus munkák esetében. Jelenleg ugyanis úgy vannak optimalizálva, hogy magabiztosnak tűnő válaszokat adnak, de nem törődnek túl sokat a ténybeli pontossággal.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának tudományos felfedezésekről is hírt adó Facebook-oldalát.

Hazudik a mesterséges intelligencia, de nagyobb baj, hogy nem tudják fegyelmezni

BrandLab

Még ki sem hallgatták a NER-es sztárpapot, aki meztelenre vetkőztetett védenceit masszírozta a gyanú szerint

Az Air India-gép egyik pilótája megkérdezte a másiktól, hogy miért zárta el az üzemanyag-adagolót

A MÁV-buszokkal Tiborcz, a Lázár 10 vállalását hirdető plakátokkal Balásy Gyula cégei jártak jól

Az oroszok ellen harcolva esett el egy magyar katona Ukrajnában

A német külügyminiszter maga kíván eljárni a Budapesten raboskodó Maja T. ügyében

Fukuyama azt mondja, első könyve végét senki nem olvasta, pedig benne áll, ami most történik

Trump Patriot rakétarendszereket küld Kijevnek

Magyar Péter felsorolt egy sor NER-es beruházást, amit kormányra kerülve kivizsgálna a Tisza

Tíz évbe telt, mire rájöttünk, hogyan lehet tökéletes a bécsi szelet – Wolfgang Puck és fia a HVG-nek

Hadházy szerint Szijjártóné 2,7 milliós arany napszemüvegben jelent meg a férje oldalán

Olyan súlyos az aszály Magyarországon, hogy már a szárazságtűrő fűfélék sem bírják

Árrobbanás jön a hőszivattyúknál, és hamarosan a légkondik is követik

Orbán Viktor és Lévai Anikó egy Brüsszelbe tartó fapados járaton bukkant fel

Orbán Ráhel: Tisztelem a sajtószabadságot, de most egy határt átléptek

Halálra gázolt egy fiatal nőt a zebrán a Lufthansa-vezér felesége Szardínián

Egy apró barna bogár sodorta végveszélybe a Pannonhalmi Főapátság kincset érő könyvtárát

6 új ötlet a hosszú és egészséges élethez

Terrorizmus vagy szólásszabadság? Magyarországot is elérte a Kneecap körüli botrány

A Kneecap ellen tüntettek a Hajógyári-szigetnél

Jöhet az „ítéletnapi” olajár? Az elemzők óvatosak

Jön a ghánai fociklub tulajdonosa Budapestre, aki mennybe vitt és romba döntött egy német csapatot

Sokba lesz nekünk Orbánék választási osztogatása