szerző:
techline.hu
Tetszett a cikk?

A képrögzítési funkció manapság már alapkövetelmény sok...

A képrögzítési funkció manapság már alapkövetelmény sok hordozható eszközben, más kérdés, hogy a rögzített „műsor” minősége jócskán hagy még kívánnivalókat maga után. Nem véletlen, hogy a keresőmotorok sem nagyon boldogulnak akkor, amikor tárgyakat, sőt emberi arcokat kell azonosítaniuk például egy szemcsés YouTube videón.
Hamarosan azonban változhat a helyzet, legalábbis ezt ígéri egy új szoftver, amelyet a Carnegie Mellon Egyetem kutatói fejlesztettek. 

Mindenekelőtt  tüzetesen megvizsgálták a jelenlegi arcfelismerő rendszereket, és arra a megállapításra jutottak, hogy semmi gond sincs addig ezekkel, amíg egy minden szempontból optimális felvételen kutakodnak, másként fogalmazva: az ilyen esetekben igen jó a találati pontosságuk. Csakhogy az ilyen felvételek meglehetősen ritkák, s bizony a mai rendszerek máris zavarba jönnek, ha a vizsgálandó felvétel felbontása rosszabb, mint amire kitanították őket.

Az arcfelismerő rendszereket ugyanis legelőször tanítani kell, mégpedig úgynevezett arc adatbázisok segítségével. A rendszer tulajdonság-meghatározó algoritmusokat használ, így hamarosan megkülönbözteti az olyan jellegzetességeket, mint például egy mandulavágású szem vagy egy sasorr. A megbízhatóbb arcfelismerés érdekében kétféleképpen járhatnak el a szakemberek, mondjuk alacsonyabb felbontású képekre is „megtanítják” a rendszereiket, ami nem is rossz ötlet, csak épp leragad egy fejlettségi szinten.

A másik, jóval korszerűbb megoldás, hogy tovább finomítják a vizsgálandó képet, úgynevezett szuperfelbontású algoritmusok segítségével. Ez utóbbiak az eddiginél élesebb képet fognak létrehozni az emberi szem számára, azonban (minthogy szemmel nem érzékelhető torzításokat is létrehoznak) nincsenek összhangban azzal, amire az arcfelismerő rendszereket trenírozzák.

A megoldást végül a kétféle rendszer kombinációjában vélik megtalálni a szakemberek: szoftverük kombinálja a szuperfelbontást és az arcfelismerő rendszer tulajdonság-meghatározó algoritmusát. Ez az úgynevezett közvetítő algoritmus kiértékeli a képnek azokat a részeit, amelyek értelmezhetők számára (azaz amire megtanították), és csak utána veti be a felbontás-javító eljárást. Így elkerülhetők azok a torzítások, amelyeket a csak önmagában használt szuperfelbontású algoritmusok okoznak.

A Carnegie Mellon egyetem kutatóinak újdonsága ugyan még csak kísérleti fázisban van (a fejlesztők állítják: van még mit javítani a szuperfelbontású algoritmuson), azonban általános a vélekedés, hogy hamarosan a keresőmotorok már arcok után is tudnak majd kutatni.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!