Az AI írta, de vajon ki tudja leleplezni?

Diákok, újságírók, marketingesek, jogászok egyre gyakrabban fordulnak a mesterséges intelligenciához, hogy az vegye át tőlük a fogalmazás gyakran fárasztó feladatát. Ez persze nem mindig etikus, és léteznek módszerek az AI-fogalmazó leleplezésére. Azonban valamennyi eljárásnak vannak korlátai, hátrányai.

  • HVG

Olyan szabályokat írni, hogy ki és mikor használhat mesterséges intelligencia által írt szöveget, nem túl nagy kihívás, az viszont annál inkább az, hogy miként lehet leleplezni az ilyen írásokat. Korábban ez még nem volt probléma, hiszen a gépi szövegnek sokszor mesterkélt, ismétlődő volt a nyelvezete, mára viszont olyan nagy fejlődésen mentek át a generatív mesterséges intelligencia modellek, hogy bár nem gondolkoznak az emberek módjára, mégis kreatívan képesek használni az emberek nyelvét.

Több kutatás is vizsgálta már, hogy mennyire képesek az emberek felismerni az AI-generálta szövegeket. Ezek kiderítették, hogy azok, akik maguk is gyakran használnak ilyen írásokat, pontosan felismerik az AI „keze nyomát”. Egy emberi értékelőkből álló testület felülmúlhatja ebből a szempontból az automatizált eszközöket, azonban az ilyen szakértelem nem terjedt el széles körben, ráadásul az egyéni megítélés olykor következetlen lehet. Éppen ezért sokak számára a mesterséges intelligencia hajtotta szövegellenőrzők maradnak. De vajon mennyire megbízhatók ezek?

A kérdést Ambuj Tevari, a Michigani Egyetem statisztikusa boncolgatta a The Conversation folyóirat hasábjain. A mesterséges intelligencia általi szövegészlelés mögött álló alapvető munkafolyamat könnyen leírható – állítja a szakember. Van egy szöveg, amelynek meg szeretnénk határozni az eredetét. Kell egy észlelő eszköz, általában egy AI-vezérelte rendszer, ami elemzi a szöveget, és egy pontszámot – általában valószínűséggel kifejezve – ad. Ez a pontszám jelzi, hogy mennyire valószínű, hogy a szöveget mesterséges intelligencia generálta.

Ez így egyszerűen hangzik, azonban a háttérben számos feltevés, felvetés, kérdés húzódhat. Csak néhány példa: Tudjuk-e, hogy milyen AI-eszközöket használhatták valószínűsíthetően a szöveg előállításához? Milyen hozzáférésünk van ezekhez az eszközökhöz? Futtathatjuk-e őket, ellenőrizhetjük-e a belső működésüket? Mennyi szöveggel rendelkezünk? Egyetlennel vagy az idők során összegyűjtött írások gyűjteményével? Az, hogy mit tudnak és mit nem tudnak megmondani az AI-észlelőeszközök, épp az ilyen kérdésekre adott válaszoktól függ.

https://hvg.hu/tudomany/20260102_mesterseges-intelligencia-ceges-levelezeseben

Egy kézenfekvő megközelítésnek tűnik az, hogy magát a mesterséges intelligenciát használjuk a mesterséges intelligencia által írt szöveg észlelésére. Az ötlet egyszerű. Először is gyűjtsünk össze egy nagy írásgyűjteményt olyan példákból, amelyeket ember által írtnak vagy mesterséges intelligencia által generáltnak ismerünk. Ezután tanítsunk be egy modellt a kettő megkülönböztetésére (kicsit hasonlóan a spamszűrő tanításához). A betanítás után a detektor megvizsgálja az új szöveget, és jelzi, hogy az jobban hasonlít-e a mesterséges intelligencia által generált példákra vagy a korábban látott, ember által írt példákra. Ez a megközelítés akkor is működhet, ha keveset tudunk arról, hogy mely AI-eszközök generálhatták a szöveget. A fő követelmény, hogy a betanításra használt adatok elég változatos legyenek, az AI-rendszerek széles skálájának kimeneteit tartalmazzák.

Azoknak, akik hozzáférnek azokhoz a mesterséges intelligencia eszközökhöz, amelyek miatt aggódnak, egy másik megközelítést javasol a professzor. Ez a stratégia statisztikai jeleket keres a szövegben, gyakran azzal kapcsolatban, hogy az egyes AI-modellek hogyan generálják a nyelvet. Például egyes módszerek azt vizsgálják, hogy egy AI-modell milyen valószínűséget rendel egy szövegrészhez. Ha ez szokatlanul magas, az annak a jele lehet, hogy a szöveget valójában az a modell generálta.

A vízjelet beágyazó mesterséges intelligencia rendszer által generált szöveg esetében a probléma az észlelésről az ellenőrzésre helyeződik át. A mesterséges intelligencia gyártója által biztosított titkos kulcs segítségével egy ellenőrző eszköz felmérheti, hogy a szöveg összhangban van-e a vízjelzett rendszer által generált szöveggel. Ez a megközelítés, ahelyett, hogy magából a szövegből levont következtetésekre támaszkodna, olyan információkra alapoz, amelyek nem kizárólag a szövegből állnak rendelkezésre.

Hogy e módszerek közül melyik a leghatékonyabb, azt nem lehet egyértelműen eldönteni. A tanulásalapú detektorok például érzékenyek arra, hogy az új szöveg mennyire hasonlít azokhoz az adatokhoz, amelyeken betanították őket. Pontosságuk csökken, ha a szöveg jelentősen eltér a betanítócsomagtól, amelyik gyorsan elavulttá válhat az új AI-modellek megjelenésével. A friss adatok folyamatos gyűjtése és a detektorok újratanítása költséges, és a detektorok elkerülhetetlenül elmaradnak azoktól a rendszerektől, amelyeket azonosítani hivatottak.

A statisztikai tesztek másfajta korlátokkal szembesülnek. Sokan közülük olyan feltételezéseken alapulnak, amelyek arra vonatkoznak, hogy az egyes AI-modellek hogyan generálnak szöveget, vagy hogy hozzáférnek-e ezeknek a modelleknek a valószínűségi eloszlásaihoz. Amikor a modellek zártkörűek, gyakran frissülnek vagy egyszerűen ismeretlenek, és akkor ezek a feltételezések nem működnek. Ennek eredményeként a kontrollált környezetben jól működő módszerek megbízhatatlanná vagy alkalmazhatatlanná válhatnak a való világban.

Végül a vízjelezés, miközben a problémát az észlelésről az ellenőrzésre helyezi át, saját függőségeket vezet be. A mesterséges intelligencia szállítóinak együttműködésére támaszkodik, és csak az így megjelölt szövegekre használható.

Úgy tűnik, az AI általi AI-szövegfelismerés egyfajta fegyverkezési versenyhez hasonlít. A detektáló eszközöknek nyilvánosan elérhetőnek kell lenniük ahhoz, hogy hasznosak legyenek, de ugyanez az átláthatóság lehetővé teszi a kijátszásukat is. Ahogy a mesterséges intelligencia által generált szöveggenerátorok egyre hatékonyabbak, a kijátszási technikák pedig kifinomultabbak lesznek, a detektorok valószínűleg nem fognak tartós fölénybe kerülni. A helyzet az, hogy egyre nehezebb lesz megkülönböztetni az AI-generálta szöveget az emberétől. Így talán a feladat sem az, hogy ezt mindenáron leleplezzük, sokkal inkább annak az elsajátítása, hogy miként tudunk majd együtt élni ezzel az új kommunikációs valósággal. Talán a jövőben már nem is az lesz a kérdés, hogy ki írt egy szöveget, hanem az, hogy mit akar vele mondani, függetlenül alkotójának esetleges nem-emberi mivoltától.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások