Az AI írta, de vajon ki tudja leleplezni?

Diákok, újságírók, marketingesek, jogászok egyre gyakrabban fordulnak a mesterséges intelligenciához, hogy az vegye át tőlük a fogalmazás gyakran fárasztó feladatát. Ez persze nem mindig etikus, és léteznek módszerek az AI-fogalmazó leleplezésére. Azonban valamennyi eljárásnak vannak korlátai, hátrányai.

Olyan szabályokat írni, hogy ki és mikor használhat mesterséges intelligencia által írt szöveget, nem túl nagy kihívás, az viszont annál inkább az, hogy miként lehet leleplezni az ilyen írásokat. Korábban ez még nem volt probléma, hiszen a gépi szövegnek sokszor mesterkélt, ismétlődő volt a nyelvezete, mára viszont olyan nagy fejlődésen mentek át a generatív mesterséges intelligencia modellek, hogy bár nem gondolkoznak az emberek módjára, mégis kreatívan képesek használni az emberek nyelvét.

Több kutatás is vizsgálta már, hogy mennyire képesek az emberek felismerni az AI-generálta szövegeket. Ezek kiderítették, hogy azok, akik maguk is gyakran használnak ilyen írásokat, pontosan felismerik az AI „keze nyomát”. Egy emberi értékelőkből álló testület felülmúlhatja ebből a szempontból az automatizált eszközöket, azonban az ilyen szakértelem nem terjedt el széles körben, ráadásul az egyéni megítélés olykor következetlen lehet. Éppen ezért sokak számára a mesterséges intelligencia hajtotta szövegellenőrzők maradnak. De vajon mennyire megbízhatók ezek?

A kérdést Ambuj Tevari, a Michigani Egyetem statisztikusa boncolgatta a The Conversation folyóirat hasábjain. A mesterséges intelligencia általi szövegészlelés mögött álló alapvető munkafolyamat könnyen leírható – állítja a szakember. Van egy szöveg, amelynek meg szeretnénk határozni az eredetét. Kell egy észlelő eszköz, általában egy AI-vezérelte rendszer, ami elemzi a szöveget, és egy pontszámot – általában valószínűséggel kifejezve – ad. Ez a pontszám jelzi, hogy mennyire valószínű, hogy a szöveget mesterséges intelligencia generálta.

Ez így egyszerűen hangzik, azonban a háttérben számos feltevés, felvetés, kérdés húzódhat. Csak néhány példa: Tudjuk-e, hogy milyen AI-eszközöket használhatták valószínűsíthetően a szöveg előállításához? Milyen hozzáférésünk van ezekhez az eszközökhöz? Futtathatjuk-e őket, ellenőrizhetjük-e a belső működésüket? Mennyi szöveggel rendelkezünk? Egyetlennel vagy az idők során összegyűjtött írások gyűjteményével? Az, hogy mit tudnak és mit nem tudnak megmondani az AI-észlelőeszközök, épp az ilyen kérdésekre adott válaszoktól függ.

https://hvg.hu/tudomany/20260102_mesterseges-intelligencia-ceges-levelezeseben

Egy kézenfekvő megközelítésnek tűnik az, hogy magát a mesterséges intelligenciát használjuk a mesterséges intelligencia által írt szöveg észlelésére. Az ötlet egyszerű. Először is gyűjtsünk össze egy nagy írásgyűjteményt olyan példákból, amelyeket ember által írtnak vagy mesterséges intelligencia által generáltnak ismerünk. Ezután tanítsunk be egy modellt a kettő megkülönböztetésére (kicsit hasonlóan a spamszűrő tanításához). A betanítás után a detektor megvizsgálja az új szöveget, és jelzi, hogy az jobban hasonlít-e a mesterséges intelligencia által generált példákra vagy a korábban látott, ember által írt példákra. Ez a megközelítés akkor is működhet, ha keveset tudunk arról, hogy mely AI-eszközök generálhatták a szöveget. A fő követelmény, hogy a betanításra használt adatok elég változatos legyenek, az AI-rendszerek széles skálájának kimeneteit tartalmazzák.

Azoknak, akik hozzáférnek azokhoz a mesterséges intelligencia eszközökhöz, amelyek miatt aggódnak, egy másik megközelítést javasol a professzor. Ez a stratégia statisztikai jeleket keres a szövegben, gyakran azzal kapcsolatban, hogy az egyes AI-modellek hogyan generálják a nyelvet. Például egyes módszerek azt vizsgálják, hogy egy AI-modell milyen valószínűséget rendel egy szövegrészhez. Ha ez szokatlanul magas, az annak a jele lehet, hogy a szöveget valójában az a modell generálta.

A vízjelet beágyazó mesterséges intelligencia rendszer által generált szöveg esetében a probléma az észlelésről az ellenőrzésre helyeződik át. A mesterséges intelligencia gyártója által biztosított titkos kulcs segítségével egy ellenőrző eszköz felmérheti, hogy a szöveg összhangban van-e a vízjelzett rendszer által generált szöveggel. Ez a megközelítés, ahelyett, hogy magából a szövegből levont következtetésekre támaszkodna, olyan információkra alapoz, amelyek nem kizárólag a szövegből állnak rendelkezésre.

Hogy e módszerek közül melyik a leghatékonyabb, azt nem lehet egyértelműen eldönteni. A tanulásalapú detektorok például érzékenyek arra, hogy az új szöveg mennyire hasonlít azokhoz az adatokhoz, amelyeken betanították őket. Pontosságuk csökken, ha a szöveg jelentősen eltér a betanítócsomagtól, amelyik gyorsan elavulttá válhat az új AI-modellek megjelenésével. A friss adatok folyamatos gyűjtése és a detektorok újratanítása költséges, és a detektorok elkerülhetetlenül elmaradnak azoktól a rendszerektől, amelyeket azonosítani hivatottak.

A statisztikai tesztek másfajta korlátokkal szembesülnek. Sokan közülük olyan feltételezéseken alapulnak, amelyek arra vonatkoznak, hogy az egyes AI-modellek hogyan generálnak szöveget, vagy hogy hozzáférnek-e ezeknek a modelleknek a valószínűségi eloszlásaihoz. Amikor a modellek zártkörűek, gyakran frissülnek vagy egyszerűen ismeretlenek, és akkor ezek a feltételezések nem működnek. Ennek eredményeként a kontrollált környezetben jól működő módszerek megbízhatatlanná vagy alkalmazhatatlanná válhatnak a való világban.

Végül a vízjelezés, miközben a problémát az észlelésről az ellenőrzésre helyezi át, saját függőségeket vezet be. A mesterséges intelligencia szállítóinak együttműködésére támaszkodik, és csak az így megjelölt szövegekre használható.

Úgy tűnik, az AI általi AI-szövegfelismerés egyfajta fegyverkezési versenyhez hasonlít. A detektáló eszközöknek nyilvánosan elérhetőnek kell lenniük ahhoz, hogy hasznosak legyenek, de ugyanez az átláthatóság lehetővé teszi a kijátszásukat is. Ahogy a mesterséges intelligencia által generált szöveggenerátorok egyre hatékonyabbak, a kijátszási technikák pedig kifinomultabbak lesznek, a detektorok valószínűleg nem fognak tartós fölénybe kerülni. A helyzet az, hogy egyre nehezebb lesz megkülönböztetni az AI-generálta szöveget az emberétől. Így talán a feladat sem az, hogy ezt mindenáron leleplezzük, sokkal inkább annak az elsajátítása, hogy miként tudunk majd együtt élni ezzel az új kommunikációs valósággal. Talán a jövőben már nem is az lesz a kérdés, hogy ki írt egy szöveget, hanem az, hogy mit akar vele mondani, függetlenül alkotójának esetleges nem-emberi mivoltától.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

generatív AI

Hozzászólások

„Ez igazán acélos, én is büszkén kitenném a kirakatba!” – három év alatt 26 ezer forinttal nőtt az IKEA-dolgozók fizetése

Kollégáira vallott és beismerő vallomást tett a Szőlő utcai javítóintézet volt rendészeti vezetője, aki véresre verte és még a betegágyán is bántotta áldozatát

Az AI írta, de vajon ki tudja leleplezni?

Miért mutogatják ennyit Gianni Infantinót a vb-s közvetítésekben, és miért lehet ez kontraproduktív?

Kane és Bellingham nevét kapta meg két megálló Londonban

A vb játékosa is lehet, pedig sokan a kezdőből is kihagyták volna

Megpróbáltak betörni Lamine Yamal luxusvillájába a vb-elődöntő után

Kritikusan értékelt a kiesés után Mbappé: Technikailag nagyon gyengék voltunk, semmilyen veszélyt nem jelentettünk

Még mindig nem tudni, pontosan milyen hosszú lesz a foci-vb-döntő félidei show-műsora, de egy dolog már biztos

Medián: Ők a Tisza-kormány legnépszerűbb és legmegosztóbb politikusai

„Ez igazán acélos, én is büszkén kitenném a kirakatba!” – három év alatt 26 ezer forinttal nőtt az IKEA-dolgozók fizetése

Folytatódik az IKEA dolgozóinak sztrájkja, délután 3-ig nem veszik fel a munkát

Óriási dráma a vb-elődöntőben: Messi két gólpasszával fordított Argentína, és ismét döntős

Provokatív transzparenssel ünnepelték a vb-döntőbe jutást az argentinok

Mikor lehet visszafordítani a fogszuvasodást, és mitől függ, mennyit fúr a fogorvos?

Amerikai professzor: Magyar nacionalizmusa nem jobb Orbánénál

Másfél-két éven belül jöhet az új választási törvény Melléthei-Barna Márton szerint

Több tízmilliárd forint közpénzt hálál meg Szijjártó Péter kinevezésével a BYD

A BYD budapesti központjának dolgozóit is meglepte Szijjártó kinevezése

Gyönyörű és lélegzetelállító képeskönyv az Odüsszeia Christopher Nolan kezében

Magyar Péter: A Fidesz mára a múlt

Drogkereskedelem gyanújával őrizetbe vettek egy pécsi önkormányzati képviselőt

Évek óta közpénzből szervezik azt a rendezvényt, amelyen Ábrahám Róbert Kátai-Németh Vilmost becsmérelte

Az Operettszínház társulatának tagjai is megdöbbenve értesültek az Orbán János Dénesnek fizetett összegekről

L. Simon László: Orbán János Dénes pénzügyei joggal sokkolták a teljes magyar irodalmi életet

20 év után sikerült kilakoltatni a természetkárosító óbudai földbitorlót

Miért jönnek fel könnyebben a kilók menopauza alatt? A koplalás csak ronthat a helyzeten

Marabu Féknyúz: Önkény

Már birodalmi perzsa ambíciók jelei is mutatkoznak a Hormuzi-szorosnál

Megint Iránt támadták az amerikaiak, egy tartályhajóra is rakétákat lőttek ki

Háromszáz halott, negyvenezer letartóztatott ellenzéki, rendkívüli állapot éveken át – kinek használt a török puccs?

Látványos akciók az MTVA-nál, de hétpecsétes titokként őrzik, mi zajlik a falak mögött

A kormánytól kér azonnali intézkedéseket a közbiztonság javítására négy kerületi polgármester

Tóta W. Árpád: Alkotmányozás? Eddig minden rendben

A Tisza faék egyszerűségű módszerrel távolítja el Sulyokot, bár ezt intézhette volna jogilag tisztábban és elegánsabban

Sulyok Tamás hosszú haláltusája a Fidesz érdeke

Kollégáira vallott és beismerő vallomást tett a Szőlő utcai javítóintézet volt rendészeti vezetője, aki véresre verte és még a betegágyán is bántotta áldozatát