15 mp-ig hallgat, utána bárki hangján megszólal az új MI, és persze bármit a szájába lehet adni

Lenyűgöző teljesítményt mutat az OpenAI új, mesterséges intelligencián alapuló hangklónozó eszköze. A Voice Engine aggályokat is felvet, annyira élethűen utánozza egy ember hangját.

hvg.hu

Az OpenAI újdonsága egy olyan új modell, amely képes emberi hangon felolvasni szövegeket (sőt le is fordítja azokat). A Voice Engine nevű, 2022 óta fejlesztett modellnek ugyanis most már elég egyetlen 15 másodperces hangminta ahhoz, hogy természetes hangzású beszédet generáljon a mintát adó hangja alapján.

A szöveg-beszéd modell jelenleg korlátozott próbaidőszakban van néhány tesztelővel – a hozzáféréssel rendelkező vállalatok közé tartozik az Age of Learning oktatástechnológiai vállalat, a HeyGen vizuális történetmesélés platform, a Dimagi egészségügyiszoftver-gyártó, a Livox AI kommunikációs alkalmazásokat létrehozó és a Lifespan egészségügyi rendszer. Az OpenAI, a politikai döntéshozóktól és oktatóktól kapott visszajelzések után, inkább az óvatos megközelítést választotta a széles körű kiadás helyett, különösen olyan kényes időszakban, mint a mostani (amerikai és európai) választási év.

Hasonló megoldások persze régóta elérhetők, ám az OpenAI-féle Voice Engine azoknál sokkal élethűbb eredményt produkál. Ennek bizonyítékai meghallgathatók a vállalat oldalán közzétett demókban.

A Google tavaly olyan szolgáltatást mutatott be, amely 3 másodpercnyi mintából képes hanggenerálásra, szintén elég meggyőző, de azért egy picit gépi beszédnek hangzó eredménnyel.

3 mp-ig hallgatózik a Google mesterséges intelligenciája, aztán megszólal a beszélő hangján – de más nyelven
Valahol fantasztikus, valahol ijesztő a Google nyelvi modelljének azon képessége, hogy képes a beszélő hangján megszólaltatni egy hangzó szöveg fordítását. Érdemes meghallgatni, milyen eredménnyel dolgozik.

Az OpenAI néhány korai felhasználási példát is említ a Voice Engine alkalmazására. Segítséget nyújthat például az olvasásban az olvasni nem tudóknak, köztük a gyerekeknek a természetesnek ható hangokon keresztül, amelyek a beszélők sokkal szélesebb körét képviselhetik, mint ami az előre beállított hangokkal lehetséges. A modell emellett segíthet tartalmak, például videók és podcastok fordításában, hogy az alkotók a saját hangjukon minél többeket érhessenek el a világon, akár a hallgatók anyanyelvén (erre egyébként már a Spotify is felfigyelt). Terápiás alkalmazások is elképzelhetők olyan személyek számára, akiknek az állapota befolyásolja a beszédet és speciális tanulási igényeik vannak. Emellett az új rendszer segíthet a degeneratív beszédbetegségben szenvedőknek a hangjuk visszanyerésében.

Az OpenAI persze azzal is tisztában van, hogy az emberi hangra emlékeztető beszéd generálása komoly kockázatokkal jár, ezért is mondtak le a széles körű bevezetésről. A vállalat partnerei állítólag megállapodtak abban, hogy nem fogják használni a Voice Engine-t mások megszemélyesítésére a beleegyezésük nélkül. Ez azt is megköveteli, hogy a partnerek megkapják az eredeti beszélő „kifejezett és tájékozott beleegyezését”, ne építsenek módokat az egyes felhasználók számára saját hangjuk létrehozására, és közöljék a hallgatókkal, hogy a hangokat mesterséges intelligencia generálja. Az OpenAI „audiovízjelet” is hozzáadott a hangklipekhez, hogy nyomon lehessen követni azok eredetét.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

Hozzászólások

15 mp-ig hallgat, utána bárki hangján megszólal az új MI, és persze bármit a szájába lehet adni

3 mp-ig hallgatózik a Google mesterséges intelligenciája, aztán megszólal a beszélő hangján – de más nyelven

Ilyen még egyik foci-vb-n sem történt: tényleg a négy legjobb csapat jutott be az elődöntőbe

64 csapat vehet majd részt a következő foci vb-döntőn – Infantino a jövőről

A franciáknak eddig alig kellett utazniuk, az angolok már bőven 20 ezer kilométer felett repültek – mutatjuk a foci-vb légirangsorát

Diego Forlán lett az uruguayi válogatott ideiglenes kapitánya

A FIFA új szabálya okozta a svájciak vesztét: Embolót nem állították volna ki, ha az argentinok nem kapnak sárga lapot

Argentin szövetségi kapitány: Tudtuk, hogy szenvedni fogunk, ez a vérünkben van, a DNS-ünk része

Vicces fogadást kötött egymással a norvég és a brit légitársaság a foci-vb negyeddöntőjére

Abszolút Országgyűlés: miben különbözik Magyar Péter parlamenti stílusa a Fidesz karaktergyilkosságától?

Balásy Gyula cége még behúzta az idei augusztus 20-át, az előleget is megkapta, most az utolsó pillanatban keresnek új vállalkozót a tűzijátékhoz

Balásyék helyett már egy Tisza-közeli céggel kötötte kormányváltás utáni első szerződését a Nemzeti Rendezvényszervező Ügynökség

Magyar Péter Bohár Dánielnek: A családom pihenését és az utazásunkat magam fizettem

Meghalt a Jurassic Park-filmek sztárja, Sam Neill

Brüsszelben járt hivatalosan, de egy antwerpeni luxusszállodában is béreltek szobát Nagy Mártonnak

Magyar szerint a Fidesz már megírta Sulyoknak a beadványt, amivel megtámadhatná saját leváltását

Hegedűs Zsolt: Sulyok Tamás a hallgatásával bukott meg

Kell egy sztori, hogy összeálljon az emberek fejében: Mizsei Jani csak egy van a városban

Orbán Viktor úton van Amerikába és elmondta azt is, ki a vb legjobbja

Történészek követelik, hogy ne kapjanak támogatást a Fidesz-kormány alatt politikai megrendeléseket végrehajtó kutatóintézetek

Különös fordulat: szinte megállt a lakbéremelkedés júniusban, pedig ilyenkor meg kéne ugraniuk az áraknak

A Tisza-kormány vak miniszterét becsmérelte Ábrahám Róbert, Magyar Péter válaszolt

Welt-kommentár: Ha nem jön alapvető változás Németországban, az AfD előbb-utóbb kormányra kerül

A legnagyobb orosz LNG-projekt majdnem teljes termelését az EU vásárolta fel

Milliókat érint a gyógyíthatatlan autoimmun kór, egy úttörő terápia először ért el remissziót a betegeknél

Egy poros parkolóban jártunk, ahol lehúzott ablakkal hagyják a sok százmillió forintos hiperautókat is

Korea visszavág Kínának: teszten a vadonatúj Kia Seltos és a frissített Niro, XCeed

„Köszönöm, kedves Magyarország, hogy bebizonyítottad, bármi lehetséges még egy olyan országban is, ahol mindent elbarikádoznak”

Lángokban áll a Párizshoz közeli fontainebleau-i erdő - fotók

Majdnem frontális ütközés lett a rendőrautó előzéséből – videón a jelenet

Lefagyva figyelik a szakértők, mikor fog megint mellényúlni a súlyos káderhiányban szenvedő Magyar-kormány

Parászka Boróka: Ez az eksztázis pillanata azoknak, akik a NER-önkény kárvallottjai

Tanács Zoltán: Orbán Viktor volt a hősöm

Vidéki prókátor: Van egy ügy, ami könnyen banánhéj lehet Orbán számára