szerző:
hvg.hu
Tetszett a cikk?

Ami a ChatGPT a szövegnek vagy a DALL-E a művészeteknek, az a Voicebox a hangnak. A Meta nemrégiben bejelentett mesterségesintelligencia-alapú beszédgeneráló eszközének képességei lenyűgözők, viszont még a Meta is túlságosan veszélyesnek tartja ahhoz, hogy rászabadítsa a világra. Ez most vagy egy remek marketingfogás, vagy elgondolkodhatunk a jövőn, ami előtt állunk.

A Meta a napokban mutatta be egy blogbejegyzésben MI-alapú újdonságát, a Voiceboxot, amely elvileg lehetővé teszi, hogy egyetlen gombnyomással hozzanak létre vagy utánozzanak hangokat. A Meta szerint a Voicebox a legsokoldalúbb beszédgeneráló eszköz az iparágban. A MI-modellt több mint 50 ezer óra szűretlen hanganyag segítségével képezték, angol, francia, spanyol, német, lengyel és portugál nyelven.

Különféle alkalmazások képzelhetők el vele az internet és a technológiai ipar számára, beleértve a tartalomkészítést, vagy olyan otthoni videók elkészítését, amelyekhez hangkitöltés, vagy a nem kívánt háttérzajok eltüntetése szükséges. Ezen túlmenően ez a technológia egy gombnyomással mesterséges intelligencia által generált hangokat is képes megszólaltatni a szövegekből, és azonnali kimenetet biztosít, akárcsak a ChatGPT vagy a DALL-E a maguk területén.

A Meta szavaival élve, a Voicebox „fontos előrelépés a generatív mesterségesintelligencia-kutatásukban”, de emellett mindenképpen említést érdemel, hogy akár a fogyatékkal élők segítségére is lehet. Lehetővé teheti például a látássérültek számára, hogy a barátok, családtagok írott üzeneteit azok hangján hallják. A Voicebox valós idejű fordítást is végezhet, egy lépéssel közelebb hozva az „univerzális fordító” eszközt, amelyek jelenleg csak a sci-fiben létezik.

Mindez remekül hangzik, és már viszketne is a tenyerünk, hogy kipróbáljuk, azonban még maga a Meta is elismeri, hogy az újdonság „nem szándékos károkat” okozhat. Ez egyben azt is jelenti, hogy a vállalat nem fogja megosztani a nyilvánossággal, mert annak katasztrofális következményei lehetnek. Az óvatosság érthető, mivel – fogalmaz a TechRadar – ez az a fajta technológia, ami elindíthat egy háborút.

A legtöbb jelentős közéleti személyiséghez, köztük politikusokhoz kapcsolódóan is rengeteg hangfelvétel található az interneten. Nem lenne nehéz összegyűjteni néhány beszédrészletet egy hivatalban lévő politikai vezetőről, és a Voicebox segítségével megdöbbentően valósághű másolatot készíteni a hangjáról, amit azután aljas célokra is fel lehetne használni. Persze már léteznek ilyen eszközök, és bár felismerhetők, hogy kit akarnak helyettesíteni, de egyelőre még nem elég jók ahhoz, hogy valóban hitelt lehessen nekik adni.

Mindenesetre úgy tűnik, a Meta felismerte a Voiceboxban rejlő kockázatokat, és – szemben a Microsofttal (aki mindenbe beleerőltetné a Bing AI-t) vagy a ChatGPT furcsaságival – egyelőre még házon belül tartja, mintegy kutatási célra használja a Voiceboxot. Persze hogy meddig, abba valószínűleg a részvényeseknek is lesz majd beleszólásuk.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!