szerző:
hvg.hu
Tetszett a cikk?

Gyakran előfordul, hogy egy olyan számot dúdolunk melynek legnagyobb bánatunkra nem jut eszedbe a neve és az előadója? Ilyen helyzetben segít a Midomi nevű oldal keresője, mely képes felismerni a keresett számot nem több mint tíz másodperc alatt.

A Midomi múlt hét végén bemutatott béta verziója lehetővé teszi a felhasználónak, hogy az énekelt, dúdolt vagy fütyült számrészlet alapján azonosítsa a kívánt zenét és előadóját. A hangminta után listát dob ki az oldal, melyen a zeneszámból fellelhető különböző felvételek, vagy a többi felhasználó által feltöltött verziók hallgathatóak vissza az adott zenéből. A technológia segítségével, az internetező által dúdolt rész külön is meghallgatható eredetiben.

A hangbevitelen kívül lehetőség van a számok címe vagy előadóik alapján történő keresésre is, ráadásul, ha helytelenül írjuk be a nevet, akkor is kisegít a rendszer.

A Melodis mögött álló cég két millió zeneszám digitális változatát vette meg, melyhez 12000 felhasználó saját hangmintáját adta hozzá. A zenerajongó megszállottak saját profilt hozhatnak létre az oldalon, és értékelhetik egymás produkcióit is a reklámbevételekből élő weboldalon.

A rendszer alapját adó hang és zeneszám felismerő a Multimodal Adaptive Recognition System (MARS), abban különbözik a hasonló technológiáktól, hogy számos tulajdonságát figyeli a zenének a felismerés érdekében. Így a hangmagasság mellet, sebességváltozást, a szüneteket és a szöveg tartalmát is figyeli – avat be a részletekbe Keyvan Mohajer cégvezető, a Stanfordi Egyetem hang- és szövegfelismeréssel foglalkozó Ph.D.-s hallgatója.

A Melodis kereső ötlete a Google-hoz hasonlóan egy egyetemi kollégium szobájában született meg, csak valamivel később 2004-ben.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!

Háló

Visszabeszélő gépek

A számítástechnika hőskorszakától fogva igyekeznek a szakemberek olyan gépeket és szoftvereket megalkotni, amelyek emberi hangot és beszédet ismernek fel, végrehajtják az így kapott utasításokat, illetve maguk is képesek intelligens módon mondatokat alkotni és emberi beavatkozás nélkül párbeszédeket folytatni.