szerző:
hvg.hu
Tetszett a cikk?

Az algoritmus a hangok visszaverődéseit is figyelembe veszi, hogy csak a beszélő szavait különítse el a felvételeken.

„Koktélparti problémának” nevezik azt, amikor egy emberekkel teli szobában próbálunk egy beszélgetést követni, miközben mások is beszélnek körülöttünk. Bár mi, emberek meglepően jól abszolváljuk ezt a feladatot, a technológia eddig nem volt képes hatékonyan megoldani a dolgot – áll a BBC cikkében. Ez komoly probléma lehet, ha hangfelvételek kerülnek bizonyítékként a bíróság elé, hiszen a háttérzajok érthetetlenné tehetik, hogy ki mit mondott.

Keith McElveen, a Wave Sciences nevű cég alapítója és műszaki igazgatója szembesült ezzel a problémával, amikor egy háborús bűnökkel kapcsolatos ügyben kutatott az amerikai kormány megbízásából. A cél az volt, hogy kiderítsék, ki rendelt el egy civilek ellen elkövetett mészárlást, de a bizonyítékok között szereplő felvételeken több hang keveredett egymással, ami megnehezítette a beszélgetések érthetőségét.

McElveen felismerte, hogy egy beszédhang eltávolítása egy másik beszédhangból az egyik legnehezebb akusztikai probléma. A megoldás az volt, hogy mesterséges intelligenciát használtak a hangok eredetének beazonosítására és kiszűrésére. Az algoritmus a hangok visszaverődéseit is figyelembe vette, hogy csak azokat a hangokat erősítse fel, amelyek valóban a beszélőtől származtak.

A technológia először egy amerikai gyilkossági ügyben bizonyított, ahol a felvétel kulcsfontosságú bizonyítékká vált. Az FBI két bérgyilkost vett őrizetbe, és a Wave Sciences algoritmusával sikerült bizonyítani, hogy megbízást kaptak egy családi viszály során. Az eredetileg felhasználhatatlan hangfelvétel így fontos szerepet kapott a bíróságon.

Azóta más kormányzati laboratóriumok is tesztelték a technológiát, és az amerikai hadsereg is alkalmazza a szonárjelek elemzésére. A technológia széles körű felhasználási lehetőségeket nyújthat túsztárgyalások során, vagy akár öngyilkossági helyzetekben, hogy minden beszélő hangját tisztán lehessen hallani.

A Wave Sciences most arra törekszik, hogy a technológiát más területeken is alkalmazza, például okoshangszórókban és autós hangfelismerő rendszerekben, így a környezeti zajok ellenére is képesek lesznek pontosan értelmezni az emberi beszédet.

Az MI a bűnügyi elemzések más területein is egyre nagyobb szerepet kap. A mesterséges intelligencia képes felismerni a manipulációkat a hangfelvételeken, és biztosítja, hogy a bíróságokon bemutatott bizonyítékok hitelesek legyenek.

Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!