szerző:
hvg.hu
Tetszett a cikk?

Rádióműsorokból kivett beszédmintákat használ az az internetes ellenőrzőrendszer, ami a gyengénlátókat ellenőrzi: tényleg emberek ülnek a monitor előtt vagy olyan programok, amelyeket a spamküldők használnak adatgyűjtésre.

A Gmail, Facebook és számos más netes szolgáltatás felhasználói ismerhetik a CAPTCHA típusú védelmi rendszereket: különféle grafikai elemekkel kevert betűkből álló ábráról kell kiolvasniuk, pontosan milyen szöveget is látnak, ezt kell azonosításképpen begépelniük: ellenkező esetben a rendszer valószínűsíti: nem emberek vagyunk, hanem olyan szoftverek, amelyeket a spamküldők az automatikus regisztráció (és ennek folyományaként a spamküldés) miatt írtak meg.

A CAPTCHA-n alapul a Carnegie-Mellon Egyetem által fejlesztett reCAPTCHA is, amely a fenti védelmi szisztémát úgy valósítja meg, hogy közben a New York Times archívumát segít digitalizálni, valamint olyan könyveket, amelyekkel a hagyományos szövegfelismerő (OCR) szoftverek nem tudnak megbirkózni: amikor ugyanis valaki azonosítja magát egy ilyen rendszerben, gépek által fel nem ismert szöveget kell kiolvasnia. Az egyetem számadatai szerint naponta 3000 munkaórányi ingyenes munkát végez a reCAPTCHA szolgáltatása.

A reCAPTCHA mögött álló csoport most új fejlesztéséről számolt be. A beléptetőrendszert gombnyomásra látáskárosultak is használhatják, a rendszer az ő kedvükért hallható, egyszerűbb megoldást kínál fel: általában 0 és 9 közti számjegyeket, vagy számjegyek és betűk kombinációit olvassa fel egy hang, amelyhez különféle háttérhangokat kevernek.

A fejlesztők ezer hangos belépést vizsgáltak meg, hogy meglássák, mennyire könnyen lehet feltörni a rendszert - azaz gépi szoftverek mennyire képesek értelmezni az eltorzított hangokat. A kísérlet a Digg és a Google által használt rendszereken zajlott, ezer különböző beléptetési szöveggel. A beszédhangok kigyűjtéséhez három módszert is használtak (ugyanis ezek megfordított szöveg vagy vízcsobogáshoz hasonló hangfüggöny mellett hangzottak el), amiből az SVM (support vector machine) típusú bizonyult a legsikeresebbnek: ez az esetek 66-70 százalékában adott pontos választ.

A reCAPTCHA új verziója annyiban különbözik a régitől, hogy már nemcsak számjegyeket, hanem konkrét számokat is használ, amelyeket régi rádióműsorokból vágtak ki: így különböző hangokon 0 és 99 közti számokat kell a látáscsökkenteknek visszagépelniük. A fejlesztők szerint a spammerek számára ez a megszorítás sem fog sok problémát okozni, ugyanis az SVM hiába tudott csak maximum 50 százalékos eredményt elérni, a több száz vagy ezer számítógépet is használó spammerhasználatok legfeljebb csak lassabban fognak spamkampányokat lebonyolítani. A több azonban jobbnak bizonyul, így a többféle beszédhang, több torzítás (a beszédhangokra) és a több szám mind javítja a rendszerbiztonságot.

HVG

HVG-előfizetés digitálisan is!

Rendelje meg a HVG hetilapot papíron vagy digitálisan, és olvasson minket bárhol, bármikor!