Milliárdok helyett alig 19 500 forintból készítettek olyan MI-t, ami majdnem azt tudja, mint a ChatGPT

Néhány kutató fillérekből készített egy olyan nyelvi modellt, ami majdnem ott tart tudásban, mint a nagyok.

A mesterséges intelligencia drága műfaj – vallotta mindenki, egészen addig, míg a kínai DeepSeek nem lépett a porondra, állítva, hogy az ő MI-jük nem került több százmillió dollárba, „csak” 5,6 millióba. A fillérekből faragott DeepSeek sikere dollármiliárdokat fújt ki a leggazdagabb techguruk zsebéből, akik nagyon szeretnék megérteni, mi lehet a titok.

Ehhez adódhat még hozzá, hogy a Stanford és a Washingtoni Egyetem MI-kutatói azt állítják egy friss publikációjukban, hogy kevesebb mint 50 dollárból tudtak betanítani egy úgynevezett érvelő MI-modellt. Ez körülbelül 19 500 forint – ami két fő nem fényűző vacsorája egy átlagos magyarországi étteremben. (És akkor a desszert már nem is biztos, hogy belefér.)

A kutatók elmondása szerint „felhőalapú számítási krediteket” használtak a betanítás során, az s1 nevű modell pedig hasonló fejlett érvelési képességekkel bír, mint az OpenAI o1-es és a DeepSeek R1-es modellje. Aki kíváncsi rá, meg is találja az s1-et a GitHubon, ahol a betanításához használt adatok és kódok is elérhetők.

Az OpenAI állítja: bizonyítékot talált arra, hogy a technológiájával is fejlesztették a DeepSeek MI-t
A technológiája jogszerűtlen felhasználásával vádolja a DeepSeek fejlesztőjét a ChatGPT mögött álló OpenAI.

A szakemberek elmondták: egy készen kapható alapmodellel indítottak, majd hangolták tovább a desztillációnak nevezett eljárással. Ez az a folyamat, melynek során egy másik nyelvi modell válaszain gyakorol. Ennek az alkalmazásával már az OpenAI is megvádolta a DeepSeeket. Az s1 azonban a Google Gemini 2.0 Flash Thinking Experimental nevű modelljéből lett desztillálva.

Mindez, jegyzi meg a TechCrunch, sok kérdést felvet. Egyrészt mi lesz az irány, ha egy drága, sok-sok dollármillióba kerülő modellt fillérekből le lehet másolni, ráadásul pontosan? Nem meglepő módon a nagy szerelők nem túl lelkesek emiatt, elvégre dollármilliárdokat költöttek a megoldásaik kifejlesztésére.

Azt ugyanakkor fontos kiemelni, hogy a Google ingyenes hozzáférést biztosít a nevezett modelljéhez, némi korlátozással. Az ugyanakkor szembemegy a feltételeikkel, hogy valaki visszafejtse azt, és egy konkurens eszközt készítsen.

Az egyik legnépszerűbb mesterséges intelligencia fejlesztője azt kéri a munkára jelentkezőktől, hogy ne használjanak MI-t
Az Anthropic szeretné felmérni a céghez jelentkezők „nem MI-asszisztált kommunikációs készségeit is”, ezért kérik, ne használjanak MI-t. Ez azért visszás, mert a cég azzal hirdeti a termékeit, hogy mennyire emberi válaszokat adnak.

Az s1 betanítása kevesebb mint 30 perc volt, és tizenhat darab Nvidia H100 GPU-ra volt szükség hozzá. Ennek ellenére a képességeit tekintve kifejezetten erős a kutatók szerint. A desztilláció használatával azonban bizonyos, hogy nem lehet sokkal jobb modelleket készíteni, így ha mindenki csak a másikon tanítaná be az eszközeit, érdemi előrelépés nem történne a területen.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Milliárdok helyett alig 19 500 forintból készítettek olyan MI-t, ami majdnem azt tudja, mint a ChatGPT

Az OpenAI állítja: bizonyítékot talált arra, hogy a technológiájával is fejlesztették a DeepSeek MI-t

Az egyik legnépszerűbb mesterséges intelligencia fejlesztője azt kéri a munkára jelentkezőktől, hogy ne használjanak MI-t

Putyin a Donbaszt kéri Ukrajnától a békéért, cserébe egy ígéretet adna, hogy többé nem fog támadni

Trump: Nagy előrelépést értünk el Putyinnal, azt tanácsolnám Zelenszkijnek, hogy kössön alkut

Itt van Orbán megfejtése az alaszkai csúcsról: A háborúpárti erők hiteltelenítik a találkozót

Putyin az egész Donbaszt akarja, Zelenszkij azt, hogy ne döntsenek a feje fölött – percről percre az alaszkai egyeztetés után

Putyin elérte fő célját: rehabilitálták a világ egyik vezetőjeként – lapok az amerikai-orosz csúcsról

Mire lehet következtetni Trump és Putyin testbeszédéből?

A Macskák megalapozta Webber bizalmát, így kapott szabad kezet Az operaház fantomjánál – interjú Szirtes Tamással

Vége a Gyarapodásnak, de már árad a Duna, pártot alapított a Trombitás, készül 2026-ra Gődény és Gattyán pártja is

Földes András bunkerben nyaralt, pedig egy idilli horvát szigetre készült - videó

Mentsétek meg Orbán Viktort, épp megalázza magát a hatalomért

Elesett a pécsi vonal, egy lerobbant motorvonat miatt pótlóbuszok közlekednek

Elárulta a MÁV, honnan van pénz a késések utáni jegyár-visszatérítésre

Egy elméleti fizikus vezetésével ért a csúcsra a Ferrari, de az igazi kihívás még csak most jön

Kiadta a kormány, mire költenének a következő tíz évben

Nagy Feró a Tabánban: „Azahriah, olyan, mint a malária”

Amihez a South Park Jézus Krisztusának is volt pár szava: mi jöhet az amerikai média gigafúziója után?

Egy tízéves brit lány rekordot döntött, legyőzött egy sakk nagymestert

Aláírásgyűjtésbe kezdtek Nagymaroson, hogy ne épülhessen szállodahajó-kikötő a Duna-parton

Gergely Márton: A nagy zabrálás

Tóta W. Árpád: Szovjethatalom plusz villamosítás egyenlő digitális Fidesz

Munk Veronika: Itt az EU-s vakcina a média bajaira, de erősebb a betegség

Amikor a medve táncoltat: mire lehet számítani az alaszkai orosz–amerikai tárgyaláson?