szerző:
HVG
Tetszett a cikk?

A DeepSeek R1 modelljét az Nvidia H100 segítségével képezték ki, az érvelési képességét azonban a Huawei saját fejlesztésű processzora támogatja.

Pár nap leforgása alatt alaposan felforgatta a mesterséges intelligencia piacát a kínai DeepSeek. A vállalat által készített nyílt forráskódú érvelő modell, az R1, amiről Marc Andreessen kockázatitőke-befektető úgy nyilatkozott: ez az egyik legelképesztőbb, leglenyűgözőbb áttörés, amit valaha látott. A fejlesztést nemrég mi magunk is teszteltük.

Az R1 nemcsak a képességei miatt különleges, hanem azért is, mert a DeepSeek fillérekből fejlesztette ki – legalábbis ahhoz képest, hogy az amerikai cégekben dollármilliárdokat öntöttek az ilyen modellek miatt. Ráadásul úgy, hogy a cég a korlátozások miatt nem fért hozzá az amerikai technológiához.

Emiatt fel is merült a kérdés, hogy ha nem amerikai fejlesztésű hardver szolgálja ki a kínai mesterséges intelligenciát, akkor vajon milyen.

A választ az X-re felkerült egyik bejegyzés adhatta meg – szúrta ki a GSMArena. A beszámoló szerint az R1 ugyan az Nvidia H100 segítségével lett betanítva, de a Huawei által fejlesztett Ascend 910C nevű chipet használja a következtetésekhez, ami a betanított modell használatával generál válaszokat.

Alexander Doria on X (formerly Twitter): “I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou / X”

I feel this should be a much bigger story: DeepSeek has trained on Nvidia H800 but is running inference on the new home Chinese chips made by Huawei, the 910C. pic.twitter.com/6IAgQlQ3ou

Mivel az Ascend-chip nem foglalkozik a rendszer képzésével, így a GPU energiafelhasználása is alacsonyabb. A Huawei Central megjegyzi: a Huawei még 2024-ben jelentette be az Ascend 910C-t, de nem kapott különösebben nagy hírverést a dolog.

A lap megjegyzi: az Ascend 910C viszonylagos alacsonyabb teljesítménye korlátot jelent a rendszer képzésében. A Huawei ezt a 920C lapka megjelenésével szeretné orvosolni, ami az Nvidia Blackwell B200 lapkájával kíván versenyezni – vagyis azzal a chippel, amit az iparág a legszélesebb körben használ a mesterséges intelligencia működtetéséhez.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!