Szeretne azonnal értesülni a legfontosabb hírekről?
Az értesítések bekapcsolásához kattintson a "Kérem" gombra!
Az értesítés funkció az alábbi böngészőkben érhető el: Chrome 61+, Firefox 57+, Safari 10.1+
Köszönjük, hogy feliratkozott!
Hoppá!
Valami hiba történt a feliratkozás során, az oldal frissítése után kérjük próbálja meg újra a fejlécben található csengő ikonnal.
Már feliratkozott!
A böngészőjében az értesítés funkció le van tiltva!
Ha értesítéseket szeretne, kérjük engedélyezze a böngésző beállításai között, majd az oldal frissítése után kérjük próbálja meg újra a fejlécben található csengő ikonnal.
[{"available":true,"c_guid":"af7b85e7-c0f8-4a2f-9d39-ff3e804708b0","c_author":"hvg.hu","category":"itthon","description":"A főpolgármester szerint a Mini-Dubaj beruházáshoz kiszemelt rákosrendezői területek jogi helyzete bonyolultnak tűnhet, de valójában nem az. Szerinte a fővárosnak elővásárlási joga van rájuk, és élni is fognak vele.","shortLead":"A főpolgármester szerint a Mini-Dubaj beruházáshoz kiszemelt rákosrendezői területek jogi helyzete bonyolultnak tűnhet...","id":"20250126_karacsony-gergely-fopolgarmester-rakosrendezo-elovasarlasi-jog-fovaros-mini-dubaj-parkvaros","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/af7b85e7-c0f8-4a2f-9d39-ff3e804708b0.jpg","index":0,"item":"c78cb285-8c32-4955-a25d-620c2fc99398","keywords":null,"link":"/itthon/20250126_karacsony-gergely-fopolgarmester-rakosrendezo-elovasarlasi-jog-fovaros-mini-dubaj-parkvaros","timestamp":"2025. január. 26. 13:51","title":"Budapest, vagy Bindzsisztán – Karácsony szerint erről döntenek szerdán a fővárosi képviselők","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"7cbfe1d2-df67-4f1d-b211-da01f5defaeb","c_author":"Kovács István","category":"itthon","description":"Kevés meglepetés, annál több öntömjénezés jellemzi a kormány „dokumentumfilmjét”, amelyet a koronavírus-járványról készítettek. Harmadik hullám említés szintjén sem volt, csak 8 ezer lélegeztetőgépről beszélnek, arról pedig szó sem esik, hogy milyen borzalmas statisztika jött ki a pandémia végére.","shortLead":"Kevés meglepetés, annál több öntömjénezés jellemzi a kormány „dokumentumfilmjét”, amelyet a koronavírus-járványról...","id":"20250126_orbanek-film-covid-sikersztori","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/7cbfe1d2-df67-4f1d-b211-da01f5defaeb.jpg","index":0,"item":"250e1da7-2404-4fdd-9ab1-32ba94710452","keywords":null,"link":"/itthon/20250126_orbanek-film-covid-sikersztori","timestamp":"2025. január. 26. 21:57","title":"Orbánék filmre vitték a koronavírus-járvány erősen cenzúrázott történetét","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"152c2ce4-125b-4ed4-8c5e-46a060010ace","c_author":"hvg.hu","category":"kkv","description":"„Az a tervünk, hogy 2025 fantasztikus év legyen a magyar kisvállalkozók számára is”– kezdte a miniszterelnök.","shortLead":"„Az a tervünk, hogy 2025 fantasztikus év legyen a magyar kisvállalkozók számára is”– kezdte a miniszterelnök.","id":"20250125_orban-viktor-kisvallalkozok-adomentesseg","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/152c2ce4-125b-4ed4-8c5e-46a060010ace.jpg","index":0,"item":"bc7f2ff4-af1e-4827-b9f8-3a0f8534e037","keywords":null,"link":"/kkv/20250125_orban-viktor-kisvallalkozok-adomentesseg","timestamp":"2025. január. 25. 12:08","title":"„Repülőrajt: a mai nap sem múlhat el jó hír nélkül” – Orbán Viktor újabb bejelentést tett","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"20bd5138-303a-4446-8fec-580d271f64b2","c_author":"Németh András","category":"tudomany","description":"Az amerikai hírszerző ügynökség, a CIA szerint az a legvalószínűbb, hogy egy kínai laboratóriumból jutott ki a Covid-19 világjárványt okozó vírus, így a pandémiát nem egy beteg állatról emberre átvitt fertőzés indította el. A CIA korábban azt ismételgette, nem tudja biztosan megállapítani, honnan indult a világjárvány.","shortLead":"Az amerikai hírszerző ügynökség, a CIA szerint az a legvalószínűbb, hogy egy kínai laboratóriumból jutott ki a Covid-19...","id":"20250126_A-CIA-szerint-laborszokeveny-a-Covid-pandemiat-okozo-virus","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/20bd5138-303a-4446-8fec-580d271f64b2.jpg","index":0,"item":"a3e31c9b-d4fd-4faa-af36-81c9098f45a0","keywords":null,"link":"/tudomany/20250126_A-CIA-szerint-laborszokeveny-a-Covid-pandemiat-okozo-virus","timestamp":"2025. január. 26. 11:48","title":"A CIA szerint „laborszökevény” a Covid-pandémiát okozó vírus","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"d015c1d0-86d1-4c6c-a00e-ef55051024b7","c_author":"Szentgyörgyi Rita","category":"360","description":"Különös módon örökíti meg a holokauszt traumáját Gilles Ségal A bábjátékos című darabja, amelyet a Holokauszt 80 emlékév alkalmából mutat be közösen a debreceni Csokonai Nemzeti Színház és a Maladype Színház. A budapesti ősbemutató január 27-én lesz a Rumbach Sebestyén utcai zsinagógában. A több dimenziójú, asszociatív, generációkat megszólító előadás rendezőjével, Balázs Zoltánnal beszélgettünk.","shortLead":"Különös módon örökíti meg a holokauszt traumáját Gilles Ségal A bábjátékos című darabja, amelyet a Holokauszt 80...","id":"20250126_Balazs-Zoltan-rendezo-Gilles-Segal-A-babjatekos-Csokonai-Nemzeti-Szinhaz-Maladype-Szinhaz-holokauszt","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/d015c1d0-86d1-4c6c-a00e-ef55051024b7.jpg","index":0,"item":"bfcd84d7-cd8b-47c0-986a-2f1a20dcec11","keywords":null,"link":"/360/20250126_Balazs-Zoltan-rendezo-Gilles-Segal-A-babjatekos-Csokonai-Nemzeti-Szinhaz-Maladype-Szinhaz-holokauszt","timestamp":"2025. január. 26. 16:30","title":"„A kép, amelyen sonderkommandósként várandós felesége hulláját kénytelen elégetni, örökre a lelkébe vésődött”","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":true,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"ff0e132a-c9d1-4c33-8422-3de230d957db","c_author":"hvg.hu","category":"itthon","description":"A lángokat több mint negyven tűzoltó fékezte meg.","shortLead":"A lángokat több mint negyven tűzoltó fékezte meg.","id":"20250125_Videon-a-nagy-tuzoltas-tobb-robbanas-utan-gyulladt-ki-egy-9-keruleti-lakas","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/ff0e132a-c9d1-4c33-8422-3de230d957db.jpg","index":0,"item":"839ad49e-8034-447a-9e30-c2f24d68ec7d","keywords":null,"link":"/itthon/20250125_Videon-a-nagy-tuzoltas-tobb-robbanas-utan-gyulladt-ki-egy-9-keruleti-lakas","timestamp":"2025. január. 25. 13:30","title":"Videón a nagy tűzoltás – több robbanás után gyulladt ki a IX. kerületi lakás","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"1bd6311a-87da-48bb-b4a4-08bc911c81b8","c_author":"HVG","category":"tudomany","description":"Nem kerül gyakran sor arra, hogy szinte teljesen „beteljen” egy felhőalapú szolgáltatás, mégis ilyesmi történt az Nvidia játékplatformjával. A magyarázat az óriási kereslet.","shortLead":"Nem kerül gyakran sor arra, hogy szinte teljesen „beteljen” egy felhőalapú szolgáltatás, mégis ilyesmi történt...","id":"20250125_nvidia-geforce-now-elofizetesek-befagyasztas-telt-haz-korlatozas","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/1bd6311a-87da-48bb-b4a4-08bc911c81b8.jpg","index":0,"item":"698bcd39-17c2-4fad-8e08-48510c4860d3","keywords":null,"link":"/tudomany/20250125_nvidia-geforce-now-elofizetesek-befagyasztas-telt-haz-korlatozas","timestamp":"2025. január. 25. 10:03","title":"Elfogytak a helyek a felhőben – felkerült a tábla az Nvidia GeForce Now-tagságik nagy részére","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null},{"available":true,"c_guid":"ab6765c9-6202-46ee-a329-4d5e78dfd92d","c_author":"hvg.hu","category":"hvgkonyvek","description":"Az evészavarok az emberek közel tizedét érintik világszerte. Mivel a betegek gyakran nem hajlandók bevallani, hogy problémát okoz számukra az egészséges testsúly fenntartása, a diagnózis néha sokáig várat magára vagy elmarad. Részlet a Bél című könyvből.","shortLead":"Az evészavarok az emberek közel tizedét érintik világszerte. Mivel a betegek gyakran nem hajlandók bevallani...","id":"20250125_eveszavarok-felismerese-gyakori-tipusok-tunetek","image":"https://img.hvg.hu/Img/ffdb5e3a-e632-4abc-b367-3d9b3bb5573b/ab6765c9-6202-46ee-a329-4d5e78dfd92d.jpg","index":0,"item":"c7bd0ced-8cee-450e-a407-89787a103a86","keywords":null,"link":"/hvgkonyvek/20250125_eveszavarok-felismerese-gyakori-tipusok-tunetek","timestamp":"2025. január. 25. 19:15","title":"Ismerjük fel az evészavarokat: ezek a leggyakoribb típusok és tüneteik","trackingCode":"RELATED","c_isbrandchannel":false,"c_isbrandcontent":false,"c_isbrandstory":false,"c_isbrandcontentorbrandstory":false,"c_isbranded":false,"c_ishvg360article":false,"c_partnername":null,"c_partnerlogo":"00000000-0000-0000-0000-000000000000","c_partnertag":null}]
Az előrejelzések szerint már nincs olyan sok adat, amellyel jó minőségű mesterséges intelligenciát lehetne fejleszteni. Ötlet van arra, hogyan lehetne megoldani a helyzetet, de az kérdéses, hogy mikorra sikerülhet.
Ahogy a mesterséges intelligencia (MI) egyre népszerűbbé válik, a kutatók egyre inkább arra figyelmeztetnek, hogy az iparág kifogyhat abból a (minőségi) adatkészletből, melyen ezeket a rendszereket be lehet tanítani. Ez nemcsak lelassítja az MI-modellek – különösen a nagy nyelvi modellek – növekedését, de
akár az MI-forradalmat is letérítheti a pályájáról.
De miért jelent problémát az adatok esetleges hiánya, tekintve, hogy mennyi új keletkezik folyamatosan? És van-e mód a kockázat kezelésére? Erről írt a The Conversationön megjelent cikkében Rita Matulionyte, az ausztrál Macquarie Egyetem tudósa.
Ami biztos: sok adatra van szükségünk a hatékony, pontos és kiváló minőségű algoritmusok betanításához. A ChatGPT-t például 570 GB szöveges adaton, azaz körülbelül 300 milliárd szón képezték ki. Hasonló a helyzet a stabil diffúzió (Stable Diffusion) – ez egy gépi tanulási modell – esetében, melyet az 5,8 milliárd kép-szöveg párból álló LIAON-5B adatkészleten tanítanak be. Ilyen algoritmus dolgozik az olyan képgeneráló MI-k mögött, mint a DALL-E, a Lensa vagy a Midjourney.
Megjelent a HVG mesterséges intelligenciával foglalkozó kiadványának második száma.
Ezek mind jó minőségű adatok, ami azért fontos, mert ha az adatkészlet rossz, akkor az MI is silány lesz. A rossz minőségű adatok – például Facebook-bejegyzések, vagy elmosódott képek – egyszerűen nem elegendők a tanításhoz.
A közösségi oldalakról vett bejegyzések szövegei elfogultak lehetnek, hamis információt vagy illegális anyagot tartalmazhat jelentős mennyiségben. Ezeket a modell azután reprodukálná. (Például ez történt akkor, amikor a Microsoft próbálta a Twitter-bejegyzésekkel kiképezni a rendszerét: az MI nőgyűlölő és rasszista lett.)
Ez az oka annak, hogy az MI fejlesztői csak kiváló minőségű adatokkal dolgoznak. Ilyenek lehetnek a könyvek, tudományos cikkek, Wikipédia-oldalak, vagy bizonyos megbízhatónak minősített – például újságírói elvek mentén készülő – weboldalakról származó tartalmak. A Google digitális asszisztensét 11 ezer romantikus regényen képezték ki, amit a Smashwords nevű oldalról vettek át.
Ezek alapján joggal merülhet fel a kérdés: van elég adatunk?
Hétfőn tartotta nagyszabású fejlesztői konferenciáját a ChatGPT mögött álló OpenAI. Ott mutatták be az új, GPT-4 Turbo nyelvi modellt is. Ez, fedélzetén megannyi újítással és fejlesztéssel, már elérhető a fejlesztők számára.
Matulionyte szerint az MI fejlesztői egyre nagyobb adatkészleten tanítják a rendszereiket, ezért tudnak olyan eszközök megjelenni, mint a ChatGPT vagy a Dall-E 3. Ugyanakkor a kutatások azt mutatják, hogy az online adatállományok sokkal lassabban nőnek, mint amire szükség lenne.
Egy, az arXiv preprint szerveren 2022-ben megjelent tanulmányban a kutatók azt jósolták, hogy akár már 2026 előtt kifogyunk a jó minőségű szöveges adatokból, ha a jelenlegi képzési trendek folytatódnak. Becslések szerint az alacsony minőségű nyelvi adatok valamikor 2030 és 2050 között, a gyenge minőségű képadatok pedig 2030 és 2060 között merülnek ki.
A PwC becslései szerint a mesterséges intelligencia 2030-ig akár 15,7 billió amerikai dollárral járulhat hozzá a világgazdasághoz. A használható adatok hiánya azonban csökkentheti a fejlesztés ütemét.
Matulionyte ugyanakkor arra is emlékeztet: mindezek ellenére a helyzet talán nem olyan rossz, mint elsőre tűnik. Egyelőre sok ismeretlen tényező van azzal kapcsolatban, hogy az MI-modellek hogyan fognak fejlődni, és van néhány módszer arra, hogy kezeljük az adathiány jelentette esetleges kockázatot.
A Kansasi Egyetem kutatói ahelyett, hogy általános megoldást kerestek volna a mesterséges intelligencia kiszűrésére a tudományos munkákban, olyan algoritmust fejlesztettek, ami a kémiával kapcsolatos cikkekre fókuszál. Az eredmény lenyűgöző.
Az egyik lehetőség, hogy az algoritmusok hatékonyabban használják fel az adatokat. A jövőben valószínűleg kevesebb adat is elég lehet a nagy modellek képzéséhez – ezzel mindenképpen nyerni lehet még egy kis időt. És egyébként az MI karbonlábnyoma is csökkenne.
A másik lehetőség, hogy szintetikus adatokat használnak, vagyis a fejlesztők saját maguk állítják össze az adatkészletet, amivel az MI-t tanítani lehet. Emellett szintén egy lehetőség, hogy azokat az adatokat, szövegeket használják fel a modellek, amik még az internet előtt jelentek meg. Ehhez a nagy tudományos kiadókkal kell megegyezni.
Hogy melyik lesz a járható út, egyelőre nem tudni. Az viszont biztos, hogy valamit gyorsan kell lépni az ügyben, hogy az MI fejlődése ne kerüljön veszélybe.