A kínai nagy csel, vagy csak az attól tartó USA vádja: megkerüli az exporttilalmat a DeepSeek?

Súlyos vádakat fogalmazott meg egy magas rangú amerikai tisztviselő a kínai mesterséges intelligencia vállalattal, a DeepSeekkel szemben: segítette Kína hadseregét, exporttilalom alá eső GPU-kat szerzett be. Ez utóbbit tagadja az Nvidia.

  • HVG HVG
A kínai nagy csel, vagy csak az attól tartó USA vádja: megkerüli az exporttilalmat a DeepSeek?

Segíti Kína katonai és hírszerzési műveleteit a hangcsoui székhelyű DeepSeek mesterséges intelligencia cég – mondta egy meg nem nevezett magas rangú amerikai külügyminisztériumi tisztviselő a Reutersnek, hozzátéve, hogy ez „túlmutat” a DeepSeek MI-modelljeihez való nyílt forráskódú hozzáférésen.

A tisztviselő szerint a DeepSeek kerülő megoldásokat, délkelet-ázsiai fiktív cégeket használ a fejlett Nvidia chipekhez való hozzáféréshez, kivédve az exportkorlátozásokat. „Nagy mennyiségű” Nvidia H100 chiphez fér hozzá, amelyre 2022 óta vonatkoznak a washingtoni tilalmak.

A Reuters szerint három, az ügyhöz közel álló forrás is megerősítette, hogy a DeepSeek valóban rendelkezik H100 chipekkel, amelyeket a tilalom után szerzett be. A Reuters természetesen nem tudta ellenőrizni, hogy a DeepSeeknek hány H100 chipje van, mindenesetre az Nvidia tagadja ezt az állítást. „Vizsgálatunk azt mutatja, hogy a DeepSeek legálisan megszerzett H800 termékeket használt, nem H100-at” – nyilatkozta az Nvidia a Reutersnek. A H800 chip a H100 egy továbbfejlesztett változata, amelyet kifejezetten kínai exportra terveztek. Gyengített NVLink sávszélességgel rendelkezik és hiányoznak belőle az FP64 képességek.

Mindez egybecseng a DeepSeek kutatói által korábban publikált tudományos cikkekkel, amelyek szerint a vállalat 2048 Nvidia H800 chipet használt a DeepSeek-V3 nagy nyelvi modell betanításához. Ehhez összesen 2,788 millió H800 GPU órára volt szükség, ami azt jelenti, hogy a teljes betanítási idő körülbelül 56,7 nap volt. A cég azt is állította, hogy a modell betanítási költsége mindössze 5,58 millió dollár volt. Csak összehasonlításképpen: a Meta 500 millió dollárt költött a Llama 3.1 betanítására.

A Pride-tól a bevásárláson át az írásig – kipróbáltunk öt MI-t, hogy megmutassuk, melyik mire (nem) jó

A „hogyan kell használni?” kérdésből bő két év alatt „most akkor melyiket használjam?” lett. Végigmentünk a mesterséges intelligencia magyarul elég jól tudó chatbotjain, hogy kiderüljön, melyiket mikor és mivel érdemes megszólítani.

Visszatérve az amerikai következtetésekre, ezek jelenleg azt a washingtoni meggyőződést tükrözik, hogy a Kína egyik üstökösének számító mesterséges intelligencia-vállalat gyors felemelkedése mögött álló képességeket esetleg eltúlozták, és nagymértékben az amerikai technológiára támaszkodtak. A tisztviselő nem kívánt nyilatkozni arról, hogy vezet-e be az Egyesült Államok további exportkorlátozásokat vagy szankciókat a DeepSeekkel szemben.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.