szerző:
HVG
Tetszett a cikk?

A Google DeepMind egy YouTube-ra feltöltött videóban mutatta meg, mire képes a V2A néven emlegetett mesterséges intelligenciája. A szakemberek szerint nincs szükség a felhasználó által megadott utasításokra, hogy elvégezze a feladatát.

Újfajta mesterséges intelligencia (MI) kifejlesztésén dolgozik a Google MI-re szakosodott részlege, amivel a videókat turbóznák fel a szakemberek. A technológia hangsávot – többek között párbeszédet – hozna létre a felvételekhez, hogy ezzel gyorsítsa fel az anyagok létrejöttét.

A DeepMind a YouTube-on osztott meg egy videót a V2A néven említett fejlesztés működéséről. Ezt a tervek szerint párosítani lehet majd a Google saját fejlesztésével, a Veóval, de az OpenAI eszközével, a Sorával is össze lehet kapcsolni. Ezek olyan rendszerek, amelyek néhány utasítás segítségével képesek realisztikus videók létrehozására.

A DeepMind szakemberei szerint a V2A képes elemezni a pixeleket, majd szöveges utasítást készít, amit aztán a megfelelő hanghatásokká konvertál át. A fejlesztők szerint a rendszert akár a némafilmekhez is fel lehet használni. Az eredmény egészen lenyűgöző:

V2A Horror

Uploaded by Google DeepMind on 2024-06-17.

V2A Dinosaur

Uploaded by Google DeepMind on 2024-06-17.

No Title

Uploaded by None on 2024-06-17.

V2A Cowboy

No Description

A rendszert videókon, hangokon és a mesterséges intelligencia által generált tartalmakon képezték ki. Ennek köszönhetően megtanulta, hogy bizonyos hangokat milyen vizuális elemekhez társítson. A TechCrunch megjegyzi: nem a Google az első, ami ilyen rendszert fejlesztett, és minden bizonnyal nem is az utolsó. A DeepMind szakemberei szerint az ő megoldásuk azzal emelkedik ki a tömegből, hogy a felhasználó döntheti el, akar-e szöveges parancsokat adni a hang elkészítéséhez.

Ez utóbbi – mármint a szöveges prompt – használható arra is, hogy a felhasználó finomhangolja a kapott végeredményt.

A szakemberek jelenleg azon dolgoznak, hogy a generált párbeszéd szinkronban legyen a beszélő ajkának mozgásával, valamint a létrehozott hang jó minőségű legyen és ne torzítson.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!