szerző:
HVG
Tetszett a cikk?

Minden eddiginél valósághűbb tartalmakat képes készíteni akár egyetlen fénykép alapján az új kínai mesterséges intelligencia, az OmniHuman.

A DeepSeek után most a TikTok tulajdonosa, a szintén kínai ByteDance állt elő egy új mesterséges intelligenciával – számolt be róla a Venture Beat. Az OmniHuman nevű rendszer képes az egyes fényképeket valósághű videókká alakítani, amelyeken emberek beszélnek, énekelnek és természetesen mozognak. A lap szerint egy olyan áttörésről van szó, ami átalakíthatja a szórakoztatást és a kommunikációt.

A rendszer túlszárnyalja a korábbi, hasonló eredményeket produkáló mesterséges intelligenciákat. Azok ugyanis eddig csupán az arc, vagy legfeljebb a felsőtest mozgását generálták le, az OmniHuman azonban a teljes testtel megteszi ezt. Az ábrázolt személynél még a gesztikulációt is elkészíti.

No Title

Uploaded by None on 2025-02-04.

Az arXiv preprint szerveren megjelent publikáció szerint a ByteDance mérnökei 18 700 órányi videóval képezték ki a rendszert, ami többféle adatot – szöveget, hangot és testmozgást – kombinál. Ez lehetővé teszi a mesterséges intelligencia számára, hogy sokkal nagyobb és változatosabb adatkészletből dolgozzon, mint a korábbi fejlesztések.

A megoldás jelentős előrelépést jelent a mesterséges intelligencia által generált tartalmak terén, amellyel beszélő embert és hangszeren játszó zenészt is meg lehet jeleníteni. A tesztelés során az OmniHuman felülmúlta a meglévő rendszereket több minőségi benchmark tekintetében is.

ByteDance OmniHuman-1 sample

Uploaded by Kyle Wiggers on 2025-02-04.

Iparági szakértők szerint egy ilyen technológia átalakíthatja a szórakoztatóipart, az oktatási anyagok készítését és a digitális kommunikációt is. Ugyanakkor aggodalomra ad okot, mert rossz kezekbe kerülve átverésre, álhírgyártásra és egyéb csalásokra használhatják fel.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!