szerző:
hvg.hu

Az egyik kanadai cég olyan, mesterséges intelligencián alapuló megoldáson dolgozik, amellyel pillanatok alatt leutánozható bárki hangja. Kétségesek a következmények.

Képzelje el, hogy egyszer csak azt hallja, hogy Donald Trump bejelenti az atomcsapást. Ijesztő forgatókönyv, különösen akkor, ha ehhez nem is kell, hogy ténylegesen az amerikai elnök beszéljen, ugyanis most már megdöbbentő pontossággal leutánozható, mondhatnánk klónozható a hangja. De nemcsak az övé, hanem bárkié, akitől van egy kis hangminta. A vitatható etikájú megoldás mögött egy kanadai cég, a Lyrebird áll. A cég és szolgáltatása az Ausztráliában őshonos lantfarkú madár (Lyrebird) után kapta a nevét, ez az állat a legkülönfélébb hangokat (fűrész, rádió, fényképezőgép) képes utánozni.

A kanadaiak hangklónozó újdonsága egy mindössze egyperces hangmintából (amelyet rossz esetben a hang tulajdonosának beleegyezése nélkül is meg lehet szerezni) egy felhőalapú API (alkalmazásprogramozási interfész) segítségével tudják olyan módon szintetizálni a hangot, hogy a továbbiakban azzal bármilyen szöveget elmondathatnak, méghozzá úgy, hogy abban érzelmek is lehetnek. A Lyrebird ki isposztolt néhány hangmintát a weboldalára, itt meg lehet hallgatni, hogyan beszél(ne) Barack Obama, Donald Trump és Hillary Clinton.

Hangszintetizálásban nem a Lyrebird az első cég, tavaly már az Adobe is foglalkozott hasonlóval (Project VoCo), azonban az ő megoldásukhoz 20 percnyi hangmintára volt szükség, és a feldolgozás sem felhőben, hanem a rendszer erőforrásait igénybe véve zajlott. A Google is tavaly jelentette be a WaveNetet, illetve kínai fejlesztők is készítettek beszédszintetizátort, azonban ennél a megoldásnál hiányoznak az érzelmek.

Ami az etikai kétségeket illeti, a Lyrebird huszárosan kivágja magát. Szerintük ugyanis a képszerkesztő eszközök elterjedésével az embereket már sokkal kevésbé lehet félrevezetni egy-egy manipulált fotóval, hiszen tisztában vannak a mögöttes technológiával. Ha a Lyrebird felszabadítja (egyelőre béta állapotú) technológiáját, akkor hasonlóan tudatosodhatna az, hogy mennyire megbízhatatlanok a hangfelvételek.

Egyébként lenne kifejezetten hasznos alkalmazás is, neves művészek hangján lehetne megjelentetni hangoskönyveket, sőt a Lyrebird szolgáltatás a beszédjükben korlátozott embereknek is segíthetne.