A napokban fejezheti be tanulmányait az a három egyetemista, akik a múlt év tavaszán forrásmegjelölés nélküli idézetekkel dúsított szakdolgozatot adtak be a Kaposvári Egyetem gazdaságtudományi karán. A plagizálás enyhe szankcionálásával (a diákoknak új dolgozatot kellett készíteniük, s így az államvizsgájukat sem tehették le időben) az egyetem meglehetősen jószívű volt, hiszen csalásért akár büntetőeljárást is indíthatott volna a megtévedt hallgatók ellen. Korábban ugyanis ők is nyilatkozatot adtak arról, hogy szakdolgozatuk elkészítése során tartózkodnak a plagizálástól, aláírásukkal is megerősítve: „a felhasznált irodalmat korrekt módon kezelem”.
A legtöbb egyetem, főiskola igyekszik házon belül elintézni a plágiumügyeket, amelyeket – a körkérdésünkre adott válaszok szerint – nemigen követ súlyosabb büntetés. Leginkább az internet terjedésével függ össze, hogy az elmúlt években általános gyakorlattá vált a szakdolgozatot készítő hallgatókkal „tisztasági” nyilatkozatot aláíratni, azaz kimondatni, hogy a dolgozat a saját szellemi termékük. Az viszont még korántsem általános, hogy a diplomamunka papírváltozata mellé a digitalizáltat is bekérik, jóllehet ez jelentősen egyszerűsítené az esetleges plágiumgyanú ellenőrzését. A Miskolci Egyetemen vagy a Corvinus kertészettudományi karán – szemben például az ELTE bölcsészkarával – már cd-n is kérik a szakdolgozatot, és a Debreceni Egyetem karainak is több mint a fele ezt az utat követi.
Ennek híján csak a szaktanárok szemfülességén múlik, kiderül-e, ha egy dolgozatban túlzott mértéket öltött a forrásmegjelölés nélküli szövegátvétel. Pedig már többféle technikai segítség is rendelkezésre áll az efféle nyomozáshoz. Bár a legáltalánosabb szövegszerkesztők is rendelkeznek szöveg-összehasonlító funkcióval, több mű összevetésénél ez igencsak időigényes feladat. Az ellenőrzés eggyel magasabb szintjét az internetes kereső- és plágiumszűrő programok – például Google, Copyscape, PCheck – használata jelenti. Ám még így sem biztos a vizsgált dolgozat eredetisége, hiszen ezek csak a világhálón fellelhető, nyilvános dokumentumokkal való hasonlóságot figyelik. A „hozott anyagok” további kiszűrésének lehetőségét kínálja az MTA SZTAKI munkatársai által öt évvel ezelőtt kifejlesztett, az interneten ingyen használható plágiumkereső (http://kopi.sztaki.hu). A Kopi program használata azonban – mint a HVG körkérdésére kiderült – még korántsem általános a felső- és még kevésbé a középfokú oktatásban.
„A keresési statisztikákból is jól látszik, hogy főleg a vizsgaidőszakok idején használják a programunkat” – mondta a HVG-nek Pataki Máté, a Kopi fejlesztőmérnöke. Noha azt a felhasználók anonimitása miatt ő sem tudta megmondani, mely intézmények a fő ügyfelek, a telefonos megkeresésekből azonban azt szűrte le, hogy „a dolgozatíró diákok is rendszeresen próbálgatják, mennyi átfedés az, ami még belefér”.
A rendszer használatához nem kell különösebb szakértelem. Gyors regisztráció után máris feltölthető a vizsgálandó dokumentum. A rendszer elektronikus üzenetet küld a vizsgálat eredményéről. Egyezés esetén az azonosságok – például a szavak száma – mellett a hasonlóság mértéke is megjelenik, százalékban kifejezve.
 Pataki Máté © Végel Dániel |
Kísérletképpen egy korábbi, Kádár János bukásáról szóló HVG-cikket, valamint egy általunk kicsit megmásított Petőfi-verset futtattunk át a rendszeren. A tesztelés csupán öt percet vett igénybe, ám a keresés mindkét esetben „a rendszer nem talált hasonló dokumentumot” megállapítással zárult. „Egyelőre csak az adatbázisunkba már feltöltött dokumentumokkal való egyezéseket tudjuk vizsgálni, az internetre még nem terjed ki a kutatás” – adott magyarázatot értetlenkedésünkre a fejlesztő, hozzátéve, hogy így is közel 5 millió szöveggel, szövegtöredékkel (300 ezer könyvoldalnyi dokumentummal) dolgozik a rendszer. A vizsgálandó anyagokat összevetik egy digitális adattárral is, amelyben helyet kapott több bibliotéka – köztük az Országos Széchényi Könyvtár – szakkatalógusa. Szépséghibája a dolognak, hogy például utóbbiból nem maguk a dokumentumok, hanem csak azok címe van meg a program agyában. „Ha viszont egy egyetem tanulmányi osztálya vagy könyvtára legalább a már elektronikus formában lévő anyagokat feltölti, néhány év alatt egészen megbízható keresési eredményt kaphat” – bizakodik Pataki, aki szerint a program alkalmas lenne arra, hogy az interneten elérhető dokumentumokat is bevonja a vizsgálatba, csakhogy nincs pénz az ehhez szükséges szerverbővítésre. A rendszer beindításához nyújtott 16 millió forintos állami támogatás után a működtetésre már egyetlen fillért sem kaptak.
A Kopi valahogy úgy működik, ahogyan a digitalizált ujjlenyomatokat azonosítják. A szöveget a szoftver először kisebb egységekre bontja, ezeket a töredékeket pedig számsorokká formálja át, majd megkezdődik az egyezések keresése. A program érzékenységét úgy állították be, hogy pár szavas azonosságnál még ne riasszon, hiszen akkor tartalmukban akár teljesen idegen szövegek is hasonlónak tűnnének fel. A más tollával ékeskedni akaró diáknak azonban még így is minden ötödik-hatodik szót szinonimával kellene behelyettesítenie ahhoz, hogy kicsússzon a „radarok” látómezejéből, ami az olyan szűk kutatási területet érintő témákban, amit egy diplomamunka lefedni hivatott, szinte lehetetlen. Vagy jóval több munkát igényel a nyelvi bűvészkedés, mint a becsületes kutatás.
Mivel a program nyelvfüggetlen matematikai algoritmusra épül, idegen nyelvű dolgozatok ellenőrzésére is alkalmas. Igaz, egyelőre a magyar nyelvű szöveget csak magyarokkal, az angolt csak angolokkal tudja összevetni. A következő lépés – most épp ezen dolgozik a fejlesztő –, hogy a plágiumkeresőt, egy fordítóprogrammal kombinálva, különböző nyelvű szövegek szűrésére is használni lehessen.
De a plágiumkereső szoftverek valószínűleg jó ideig nem tudják még helyettesíteni az embert. A szóazonosságon kívül számos olyan lehet egy szövegben, amely plágiumról árulkodik, ám felismeréséhez több kell, mint egy algoritmus. Ilyen lehet például a stílustörés, az igeidők, személyes névmások használatának hirtelen és következetlen megváltozása; az írásművek szerkezetének, felépítésének hasonlósága, vagy például az, ha a szerző elavult adatokat használ fel olyan kutatáshoz, ahol már könnyen hozzáférhetők lennének a frissebb számok is. Külföldi forrásból fordított szöveg átvételét sejteti, ha sok a szenvedő szerkezet, a germanizmus. Alapos gyanú esetén ezért is javallott a szövegtesztelés, amihez – igaz, még csak külföldön – olyan programok is léteznek, amelyek bizonyos kulcsszavakat törölnek a dolgozatból, és azokat a szerzőnek kell visszaállítania. Már ha tudja, miről van szó. Utóbbi technikával nem is csak a plagizálókat, hanem azokat is le lehet buktatni, akik „négermunkával”, azaz másokkal íratták meg a dolgozatukat.
DOBSZAY JÁNOS