Brazíliából érkező forgalomnövekedésre figyelt fel a Wikipédiát működtető nonprofit szervezet, a Wikimedia Foundation. Amikor – egy új logikát bevetve – az okok nyomába eredtek, kiderült, hogy valójában botok állnak a keresések nagy része mögött. Ez azután arra sarkallta az alapítványt, hogy felülvizsgálja az emberi és a botforgalom közötti különbségtételt, annak érdekében, hogy jobban megértse a valódi olvasóköröket, és korlátozza, hogy harmadik féltől származó botok gyűjtsenek adatokat kereskedelmi keresési és mesterséges intelligencia eszközökhöz. Persze sok olyan bot, amely a Wikipediához hasonló webhelyeken gyűjt adatokat, egyre kifinomultabbá válik, és megpróbál emberinek tűnni. Annak érdekében, hogy a mérőszámaik a lehető legpontosabbak legyenek, a Wikipédiánál folyamatosan frissítik a forgalom osztályozásának módjait.
Amit legutóbb találtak talán nem is volt annyira meglepő: csökkent az emberi forgalom, méghozzá mintegy nyolc százalékkal 2024 azonos időszakához képest. „Úgy véljük, hogy ezek a visszaesések a generatív mesterséges intelligencia és a közösségi média hatását tükrözik azzal kapcsolatban, ahogyan az emberek információt keresnek” – írja egy blogbejegyzésben Marshall Miller, az alapítvány termékfejlesztési igazgatója.
Azt is hozzáteszi, hogy a csökkenés mögött megfigyelhető, hogy a keresőmotorok egyre inkább mesterséges intelligenciát használnak a válaszok közvetlen megjelenítésére a találati oldalakon, ahelyett, hogy külső oldalakra, például a Wikipédiára mutató linkeket helyeznének el. Ugyanakkor a fiatalabb felhasználók olyan közösségi videós platformokhoz fordulnak információkért, mint a YouTube és a TikTok.
Miller arra is figyelmeztet, hogy a jelenség összességében negatív hatással lehet a Wikipédiára. Ha kevesebb a látogatás, zsugorodhat a Wikipédia önkéntes bázisa, a közösség, amely a tartalmakat írja és szerkeszti, és persze a nonprofit szervezetet működtető egyéni adományok is csökkenhetnek. A jelen helyzet fintora, hogy szinte az összes nagy nyelvi modell betanításához a Wikipedia adatkészleteit használják, azonban éppen ezzel árthatnak az egyik legmegbízhatóbb információforrásuknak.
A termékfejlesztési igazgató arra is felhívja a figyelmet, hogy a Wikipédia az egyetlen ilyen méretű oldal, amely az ellenőrizhetőség, a semlegesség és az átláthatóság szabványait alkalmazza az információk terjesztésében az egész interneten, és továbbra is nélkülözhetetlen az emberek mindennapi információs igényeinek kielégítéséhez. Ahhoz, hogy a felhasználók megbízzanak az interneten megosztott információkban, a platformoknak egyértelművé kell tenniük, hogy honnan származik az információ, és növelniük kell a lehetőségeket ezen források meglátogatására és az azokban való részvételre.
A probléma megoldása érdekében a nonprofit szervezet most azon dolgozik, hogy harmadik felek felelősségteljesen és nagy mennyiségben hozzáférhessenek és újra felhasználhassák a Wikipédia-tartalmakat azáltal, hogy betartatják a szabályzataikat és egyértelműbb szabványokat dolgoznak ki. Emellett új módszerekkel is kísérleteznek a fiatalabb közönség elérésére olyan platformokon, mint a YouTube, a TikTok és az Instagram, videók, játékok és chatbotok segítségével. A Wikimedia amúgy nem ellenzi a mesterséges intelligenciát – mutat rá a Gizmodo.
Az alapítvány nemrégiben el is indított egy projektet (Wikidata Embedding Project), amely nagyjából 120 millió nyílt adatpontot alakított át a Wikidatában egy olyan formátumba, amelyet a nagy nyelvi modellek könnyebben használhatnak. A cél az, hogy a mesterséges intelligencia által támogatott rendszerek ingyenes, jobb minőségű adatokhoz férjenek hozzá, és javítsák válaszaik pontosságát.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.