Fizetős tankönyvekből lophatott az OpenAI, hogy betanítsa a ChatGPT-t

Egy friss jelentés szerint a ChatGPT GPT-4o modelljét tesztelve egyértelműnek látszik, hogy az OpenAI részben vagy egészben a nyilvánosan nem elérhető tartalmakon képezte ki a mesterséges intelligenciáját.

Számos kiadó és szerző vádolta már meg az OpenAI-t azzal, hogy a vállalat szerzői joggal védett tartalmakon képezte ki a mesterséges intelligenciáját. Ezzel kapcsolatban már pert is akasztottak a cég nyakába, az OpenAI viszont a méltányos használat elvét lobogtatva nyilatkozott úgy, hogy muszáj lopni, ha valaki mesterséges intelligenciát akar csinálni.

Egy, a mesterséges intelligencia működését felügyelő nonprofit szervezet, az AI Disclosures Project most újabb komoly vádakat fogalmazott meg: a szakemberek szerint a vállalat egyre inkább a fizetőfalak mögé rejtett könyvekre támaszkodva trenírozta a kifinomult MI-modelljeit, miközben erre nem kapott engedélyt.

Az MI-modellek alapvetően összetett előrejelző motorok. Rengeteg adaton – könyveken, filmeken, tévéműsorokon és egyebeken – tanulnak, mintákat és újszerű módszereket sajátítanak el, hogy egy egyszerű felszólításból valamilyen produktumot nyújtsanak. Amikor egy modell „ír” egy esszét egy görög tragédiáról, vagy Ghibli-stílusú képeket „rajzol”, akkor az addig tanultakból egy megközelítő merítést végez el, vagyis lényegében semmi újat nem talál ki.

Van egy kis gond: olyan gyorsan tanul a mesterséges intelligencia, hogy 2026-ra már nem lesz mivel tovább tanítani
Az előrejelzések szerint már nincs olyan sok adat, amellyel jó minőségű mesterséges intelligenciát lehetne fejleszteni. Ötlet van arra, hogyan lehetne megoldani a helyzetet, de az kérdéses, hogy mikorra sikerülhet.

A Tim O’Reilly médiaguru és Ilan Strauss közgazdász által 2024-ben közösen alapított AI Disclosures Project nevű nonprofit szervezet legfrissebb elemzésében arra jutott, hogy az OpenAI valószínűleg a fizetőfal mögé rejtett O’Reilly-könyveken taníthatta be a GPT-4o modelljét. Tim O’Reilly a könyveket kiadó O’Reilly Media vezérigazgatója – jegyzi meg a TechCrunch. A ChatGPT-ben jelenleg a GPT-4o az alapértelmezett modell.

A jelentés szerint a GPT-4o esetében erőteljesen felismerhető, hogy a rendszer a fizetőfal mögé tett könyvekből tanult. A GPT-3.5 Turbohoz képest a szakemberek szerint érezhető a különbség, utóbbi kapcsán pedig azt állítják, az a nyilvánosan elérhető könyvekben lévő tudásra támaszkodik.

A vizsgálatot a DE-COP nevű módszerrel végezték el. Ez azt teszteli, hogy egy modell képes-e megbízhatóan megkülönböztetni az ember által írt szövegeket ugyanazon szöveg átfogalmazott, mesterséges intelligencia által generált változataitól. Ha lehetséges, az azt sugallja, hogy a modell előzetesen ismerte a szöveget a betanítási adataiból.

A jelentés szerint 34 O’Reilly-könyv 13 962 bekezdésrészletét használták fel a vizsgálathoz, amelynek eredménye egyértelműen azt mutatta, hogy az OpenAI jogosulatlanul használta fel a tartalmakat. A szakemberek ugyanakkor megjegyezték: a rendszer abból is tanulhatott, ha egy felhasználó egy könyv egy részletét bemásolta a csevegőmezőbe.

A cég egyelőre nem reagált a vádakra.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások

Fizetős tankönyvekből lophatott az OpenAI, hogy betanítsa a ChatGPT-t

Van egy kis gond: olyan gyorsan tanul a mesterséges intelligencia, hogy 2026-ra már nem lesz mivel tovább tanítani

„Freddie-t nem lehetett nem szeretni” – a Queen legendás frontemberéről meséltek a HVG-nek a legközelebbi barátai

A Fitch szkeptikus a Tisza által tervezett költségvetési megtakarításokat illetően

Putyin nem hajlandó találkozni Zelenszkijjel

Átnéztük a NER kampány cégeinek beszámolóit. Mi lehet a sok milliárd forint "egyéb bevétel"?

Új szervezeti felépítésre állhat át a Fidesz és Navracsics küldene egy embert az elnökségbe

Tarr Zoltán bejelentette, hogy visszavonják a Mága Zoltán körének adott 500 milliós támogatást

Felmondott Papp Dániel, az MTVA vezérigazgatója

Önkormányzati kenőpénzbotrány: Pécsen milliárdos Hungast-szerződéseket vizsgálnak

Úgy érzi, semmin sem tud változtatni? Lehet, hogy a tanult tehetetlenség csapdájában él

Rosszul lett a Budapest Parkban koncertező Loophia zenekar énekesnője, a szervezők szerint újra kellett éleszteni

Varga Barnabás duplájával legyőzte a finneket a magyar fociválogatott

Fásy Ádám e-mail-címéről érkezhettek utasítások a Fullánk nevű győri lejáratóújsághoz

Lemondásra szólította fel a Corvinust fenntartó közalapítvány kuratóriumi tagjait a Felsőoktatási Dolgozók Szakszervezete

Szabó István: Jó messzire kell kerülni a hatalomtól, erről szólnak a filmjeim

Bükki szarvastatár, malacfejes pacal és vízikefír: több mint 7 tipp az idei Gourmet Fesztiválról

Direkt a választás után tartotta esküvőjét a meleg főkonzul, aki korábban a Fidesz jelöltje volt

Belefulladt egy 15 éves fiú a Bánki-tóba iskolai kiránduláson