szerző:
HVG
Tetszett a cikk?

Minden jel szerint az illegális adatbeszerzéstől sem riadt vissza a Meta annak érdekében, hogy minőségi adatokkal táplálja a mesterséges intelligenciáját.

A ChatGPT megjelenése óta a mesterséges intelligenciát fejlesztő cégek folyamatosan a kritikák kereszttüzében állnak. Ahhoz ugyanis, hogy a nagy nyelvi modellek megfelelően működjenek, rengeteg jó minőségű adatra van szükség, amin ezeket be lehet tanítani. Csakhogy ezek száma nemcsak korlátozott, de a legtöbbet a szerzői jog is védi – ugyanis filmekről, videókról, cikkekről vagy épp könyvekről van szó.

Az egyik kritizált vállalat az OpenAI, amelyet számos kiadó és szerző perelt be a szerzői jogok megsértése miatt. A vállalat szerint ugyanakkor muszáj lopni, ha valaki mesterséges intelligenciát akar csinálni, a felhasználást pedig méltányos használatnak nevezi. Más kérdés, hogy a cég igencsak kettős mércét alkalmaz, a kínai DeepSeek kapcsán – amely az R1 fejlesztésével alaposan felforgatta a piacot – maga is arról panaszkodott, hogy a mesterséges intelligencia kiképzéséhez az ő technológiáját használta a vállalat.

Az amerikai cégek közül azonban nemcsak az OpenAI fejleszt MI-t, hanem például a Google és a Meta is. Utóbbi kapcsán most egy igen kellemetlen részlet látott napvilágot a cég ellen folyó szerzői jogi per részeként.

Riadót fújt a Meta: négy csapattal próbálja megfejteni a DeepSeek titkát

Pár nap alatt felforgatta a mesterséges intelligencia piacát a DeepSeek, és egy friss jelentés szerint az új, olcsóbb kínai modell már most jobb, mint a Meta idén érkező legújabb fejlesztése. A cégnél nagyon szeretnék megérteni, hogyan.

A PC Gamer azt írja, e-mailek tucatjai kerültek elő, amelyeket a jelek szerint a Meta alkalmazottai küldtek egymásnak arról, hogy hatalmas mennyiségben töltenek le illegális forrásból könyveket, hogy a cég be tudja tanítani a mesterségesintelligenci-modelljeit. A képzéshez használt anyagokat a levélváltások alapján a LibGenről töltötte le a cég. Ez egy nagy torrentoldal, ahol a tudományos cikkektől a könyvekig minden anyag kalózverziója megtalálható.

Az ügyészség szerint a Meta 80 terrabájtnyi illegális adatot töltött le a LibGenről és egy másik forrásból, a Z-Libraryből. A szerzői jogot védő ügyvédek szerint az e-mailek bizonyítják, hogy a Meta pontosan tudta, hogy illegális forrásból dolgozik.

Az egyik dolgozó például nemtetszését fejezte ki az eljárással kapcsolatban, mert szerinte a kalózanyagok használata átlép egy etikai határt. Volt olyan dolgozó, aki azt javasolta, VPN-en keresztül töltsék le a tartalmakat, míg más azon viccelődött, hogy céges laptopon torrentezni nem túl szerencsés dolog.

A dolgozók összességében úgy látták, a LibGen használata szükséges, az MI-képzés ugyanis lényegében fegyverkezési versenynek tekinthető.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!