szerző:
HVG
Tetszett a cikk?

A kínai DeepSeek az R1 nyelvi modell után egy képek generálására létrehozott modellcsalád teljesítményét mutatta meg, az eredmények pedig igen meggyőzők.

Hétfőig valószínűleg csak nagyon keveseknek volt ismerős a kínai DeepSeek cég neve, néhány óra leforgása alatt azonban nemcsak világhírűvé vált, de az amerikai technológiai szektor legyőzhetetlenségébe vetett hitet is megingatta. A mesterséges intelligencián (MI) dolgozó vállalat R1 modellje nagyságrendekkel olcsóbb betanítás után képes arra, mint a kategóriát vezető OpenAI fejlesztése, sőt, olyan is van, amiben túlszárnyalja azt.

A cég egy újabb fejlesztéssel is előállt: olyan multimodális MI modellekkel állt elő, amelyek állítása szerint felülmúlhatják az OpenAI képgenerátorát, a Dall-E-t.

A Hugging Face nevű platformról letölthető modellek egy új modellcsalád részei, amelyet a DeepSeek Janus-Pro néven emleget, a modellek mérete pedig 1–7 milliárd paraméteres. A paraméterek lényegében egy modell problémamegoldó készségeit hivatottak mutatni, így minél nagyobb a számuk, annál jobban tudnak dolgozni.

Így regisztrálhat ingyenesen és azonnal az egész világot lázban tartó új mesterséges intelligenciára – belépés a kínai DeepSeek chatbothoz

A tőzsdéken és a mesterséges intelligencia képességei iránt érdeklődők körében is meglepetést és felfordulást okozott hétfőn egy új kínai szolgáltatás, a DeepSeek. A chatbotot bárki kipróbálhatja, csak egy gyors regisztráció kell hozzá. Az érdeklődés óriási, a szerverek leterheltek – mutatjuk a gyorsítósávot.

Az alábbi képeken azt mutatta meg a DeepSeek, hogy a modell elődjéhez, a Janushoz képest a Janus-Pro-7B modell milyen teljesítményre képes, amikor szövegből kell képet generálni.

A Janus-Prót a DeepSeek „autoregresszív keretrendszerként” ír le, ami képes felvételeket elemezni és új képeket létrehozni. A cég szerint a tesztek alapján a legnagobb modell, a Janus-Pro-7B képes legyőzni a DALL-E 3-at, vagy épp a Stability AI fejlesztését, a Stable Diffusion XL-t.

DeepSeek

A lap megjegyzi, a modellek egy része csak kisméretű, 384 x 384 pixel felbontású képeket tud elemezni, a teljesítménye azonban így is lenyűgöző.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!