szerző:
hvg.hu

Rádióműsorokból kivett beszédmintákat használ az az internetes ellenőrzőrendszer, ami a gyengénlátókat ellenőrzi: tényleg emberek ülnek a monitor előtt vagy olyan programok, amelyeket a spamküldők használnak adatgyűjtésre.

A Gmail, Facebook és számos más netes szolgáltatás felhasználói ismerhetik a CAPTCHA típusú védelmi rendszereket: különféle grafikai elemekkel kevert betűkből álló ábráról kell kiolvasniuk, pontosan milyen szöveget is látnak, ezt kell azonosításképpen begépelniük: ellenkező esetben a rendszer valószínűsíti: nem emberek vagyunk, hanem olyan szoftverek, amelyeket a spamküldők az automatikus regisztráció (és ennek folyományaként a spamküldés) miatt írtak meg.

A CAPTCHA-n alapul a Carnegie-Mellon Egyetem által fejlesztett reCAPTCHA is, amely a fenti védelmi szisztémát úgy valósítja meg, hogy közben a New York Times archívumát segít digitalizálni, valamint olyan könyveket, amelyekkel a hagyományos szövegfelismerő (OCR) szoftverek nem tudnak megbirkózni: amikor ugyanis valaki azonosítja magát egy ilyen rendszerben, gépek által fel nem ismert szöveget kell kiolvasnia. Az egyetem számadatai szerint naponta 3000 munkaórányi ingyenes munkát végez a reCAPTCHA szolgáltatása.

A reCAPTCHA mögött álló csoport most új fejlesztéséről számolt be. A beléptetőrendszert gombnyomásra látáskárosultak is használhatják, a rendszer az ő kedvükért hallható, egyszerűbb megoldást kínál fel: általában 0 és 9 közti számjegyeket, vagy számjegyek és betűk kombinációit olvassa fel egy hang, amelyhez különféle háttérhangokat kevernek.

A fejlesztők ezer hangos belépést vizsgáltak meg, hogy meglássák, mennyire könnyen lehet feltörni a rendszert - azaz gépi szoftverek mennyire képesek értelmezni az eltorzított hangokat. A kísérlet a Digg és a Google által használt rendszereken zajlott, ezer különböző beléptetési szöveggel. A beszédhangok kigyűjtéséhez három módszert is használtak (ugyanis ezek megfordított szöveg vagy vízcsobogáshoz hasonló hangfüggöny mellett hangzottak el), amiből az SVM (support vector machine) típusú bizonyult a legsikeresebbnek: ez az esetek 66-70 százalékában adott pontos választ.

A reCAPTCHA új verziója annyiban különbözik a régitől, hogy már nemcsak számjegyeket, hanem konkrét számokat is használ, amelyeket régi rádióműsorokból vágtak ki: így különböző hangokon 0 és 99 közti számokat kell a látáscsökkenteknek visszagépelniük. A fejlesztők szerint a spammerek számára ez a megszorítás sem fog sok problémát okozni, ugyanis az SVM hiába tudott csak maximum 50 százalékos eredményt elérni, a több száz vagy ezer számítógépet is használó spammerhasználatok legfeljebb csak lassabban fognak spamkampányokat lebonyolítani. A több azonban jobbnak bizonyul, így a többféle beszédhang, több torzítás (a beszédhangokra) és a több szám mind javítja a rendszerbiztonságot.

Állj mellénk!

Tegyünk közösen azért, hogy a propaganda mellett továbbra is megjelenjenek a tények!

Ha neked is fontos a minőségi újságírás, kérjük, hogy támogasd a munkánkat.

Állj mellénk!

Tegyünk közösen azért, hogy a propaganda mellett továbbra is megjelenjenek a tények!

Ha neked is fontos a minőségi újságírás, kérjük, hogy támogasd a munkánkat.
Bekapcsolta a robotpilótát a Tesla sofőrje, 10 másodperc múlva halálos balesetet szenvedett

Bekapcsolta a robotpilótát a Tesla sofőrje, 10 másodperc múlva halálos balesetet szenvedett

Sem a genetika, sem a hormonvizsgálat nem képes eldönteni, mennyire lehet férfi egy nő

Sem a genetika, sem a hormonvizsgálat nem képes eldönteni, mennyire lehet férfi egy nő

Mégsem sértett törvényt az államtitkár

Mégsem sértett törvényt az államtitkár

Még több fájdalomcsillapító lesz vényköteles

Még több fájdalomcsillapító lesz vényköteles

És akkor Mészáros nem tudott őszintén örülni a remek magyar GDP-adatnak

És akkor Mészáros nem tudott őszintén örülni a remek magyar GDP-adatnak

A tények makacs dolgok, de Orbánék ugyanilyen makacsul hallgatják el azokat

A tények makacs dolgok, de Orbánék ugyanilyen makacsul hallgatják el azokat