A kínai nagy csel, vagy csak az attól tartó USA vádja: megkerüli az exporttilalmat a DeepSeek?
Súlyos vádakat fogalmazott meg egy magas rangú amerikai tisztviselő a kínai mesterséges intelligencia vállalattal, a DeepSeekkel szemben: segítette Kína hadseregét, exporttilalom alá eső GPU-kat szerzett be. Ez utóbbit tagadja az Nvidia.
HVG
Segíti Kína katonai és hírszerzési műveleteit a hangcsoui székhelyű DeepSeek mesterséges intelligencia cég – mondta egy meg nem nevezett magas rangú amerikai külügyminisztériumi tisztviselő a Reutersnek, hozzátéve, hogy ez „túlmutat” a DeepSeek MI-modelljeihez való nyílt forráskódú hozzáférésen.
A tisztviselő szerint a DeepSeek kerülő megoldásokat, délkelet-ázsiai fiktív cégeket használ a fejlett Nvidia chipekhez való hozzáféréshez, kivédve az exportkorlátozásokat. „Nagy mennyiségű” Nvidia H100 chiphez fér hozzá, amelyre 2022 óta vonatkoznak a washingtoni tilalmak.
A Reuters szerint három, az ügyhöz közel álló forrás is megerősítette, hogy a DeepSeek valóban rendelkezik H100 chipekkel, amelyeket a tilalom után szerzett be. A Reuters természetesen nem tudta ellenőrizni, hogy a DeepSeeknek hány H100 chipje van, mindenesetre az Nvidia tagadja ezt az állítást. „Vizsgálatunk azt mutatja, hogy a DeepSeek legálisan megszerzett H800 termékeket használt, nem H100-at” – nyilatkozta az Nvidia a Reutersnek. A H800 chip a H100 egy továbbfejlesztett változata, amelyet kifejezetten kínai exportra terveztek. Gyengített NVLink sávszélességgel rendelkezik és hiányoznak belőle az FP64 képességek.
Mindez egybecseng a DeepSeek kutatói által korábban publikált tudományos cikkekkel, amelyek szerint a vállalat 2048 Nvidia H800 chipet használt a DeepSeek-V3 nagy nyelvi modell betanításához. Ehhez összesen 2,788 millió H800 GPU órára volt szükség, ami azt jelenti, hogy a teljes betanítási idő körülbelül 56,7 nap volt. A cég azt is állította, hogy a modell betanítási költsége mindössze 5,58 millió dollár volt. Csak összehasonlításképpen: a Meta 500 millió dollárt költött a Llama 3.1 betanítására.
A „hogyan kell használni?” kérdésből bő két év alatt „most akkor melyiket használjam?” lett. Végigmentünk a mesterséges intelligencia magyarul elég jól tudó chatbotjain, hogy kiderüljön, melyiket mikor és mivel érdemes megszólítani.
Visszatérve az amerikai következtetésekre, ezek jelenleg azt a washingtoni meggyőződést tükrözik, hogy a Kína egyik üstökösének számító mesterséges intelligencia-vállalat gyors felemelkedése mögött álló képességeket esetleg eltúlozták, és nagymértékben az amerikai technológiára támaszkodtak. A tisztviselő nem kívánt nyilatkozni arról, hogy vezet-e be az Egyesült Államok további exportkorlátozásokat vagy szankciókat a DeepSeekkel szemben.
Nagyot ment Londonban Emmanuel Macron francia államfő, konkrét megállapodásainak jelentőségét majd az idő dönti el. Hazai ellenfeleinek inkább múltbéli tevékenységük miatt van most feladva a lecke.