Mesterséges intelligencia bevetésével próbálja elemezni az ügyfélszolgálati telefonbeszélgetéseket egy magyar cég és a mögötte álló magán-kutatócsoport.

Csak gyakorlott viccmesélő képes ütős poénnal lezárni a régi sztorit, amelynek interpretációjához nemcsak a szavak számítanak, hanem a hangsúly és az érzelem is. Dióhéjban: a bíróság rágalmazás miatt bocsánatkérésre kötelezi a vádlottat, a vétkes viszont leírhatatlan hangsúlyokkal fordítja visszájára a verdikt szerinti mea culpát: "Kohn egy becsületes ember?! Már bocsánatot kérek!..." Ami viszont nem vicc: újabban már számítógép is képes fölfogni a puszta szavakon túl az élőbeszéd érzelmi árnyalatait, ez pedig nagyban javíthatja a telefonos ügyfélszolgálatok, a call centerek hatékonyságát.

A csodaszoftver a mesterséges intelligencia eszközeit alkalmazva azt fürkészi, mennyire ideges, elégedetlen vagy éppen nyugodt az ügyfél telefonálás közben. Az ügyes program emellett természetesen képes felismerni azokat a kulcsszavakat, amelyek a hangulati elemekkel együtt meglehetős biztonsággal jelzik, kik azok a "problémás" ügyfelek, akikkel egy menedzsernek azonnal fel kell venni a kapcsolatot, különben felháborodásukban faképnél hagyhatják a szolgáltatót.

A rendszer kidolgozásához összegyűjtött valódi ügyfélszolgálati beszélgetések elemzésekor a Nextent Informatika Zrt. munkatársai úgy tapasztalták, hogy a betelefonálók nagyjából nyolc százaléka súlyosan negatív érzésekkel eltelve reklamál. A szolgáltatónak elemi érdeke, hogy próbálják mihamarabb leszerelni őket, ám ez könnyen elmaradhat. A cég által megkérdezett néhány tucatnyi hazai vállalatnál ugyanis saját bevallásuk szerint a rögzített beszélgetéseknek csupán egy százalékát hallgatják vissza, azt is inkább csak szúrópróbaszerűen. A kliensekkel beszélő ügyfélszolgálati munkatársak pedig állítólag többnyire fáradtak és motiválatlanok ahhoz, hogy alaposabban elemezzék az általuk folytatott beszélgetéseket. A fenti sommás megállapítást Bódogh Attila, a Voice Miner (hangbányász) rendszert kidolgozó Nextent üzletfejlesztési igazgatója arra alapozza, hogy egy korábbi, még nem a hangbányászattal összefüggő megbízatásuk közben azt tapasztalták, hogy miután a telefonkezelőket megkérték a beszélgetések tipizálására, azok többnyire a legegyszerűbb megoldást választották: a hat lehetőség közül feltűnő gyakorisággal az "egyéb" gombot nyomták meg. Jó hír azonban, hogy a Voice Miner nemcsak az ügyfél, hanem az ügyintéző hangulatát, szavait is képes ellenőrizni; például azt, felmondta-e az ügyfélnek a kötelező leckét, de akár azt is, nem használt-e a céghez méltatlan kifejezéseket.

Az idézett vicchez hasonló példával magyarázta el Bódogh a HVG-nek az érzelemelemzés fontosságát. Nem elég ugyanis, ha a számítógép kiszűri az ügyfél beszédéből például a "nagyon jó" szóösszetételt. Korántsem mindegy, hogy milyen összefüggésben hangzik el: "Az ajánlat nagyon jó, akkor elő is fizetek" vagy "Még hogy én fizessek maguknak?! Hát ez nagyon jó!"

Több mint ötszáz órányi élőbeszéd feldolgozása után jutottak el odáig a Kocsor András vezette, másfél éve alakult magánlaboratóriumban, a szegedi Mesterséges Intelligencia Kutatócsoportban, hogy a szoftver már alig hibázik az érzelmek felismerésében. A szakemberek sok mintán mutatták be a gépnek, mi számít dühös vagy nyugodt beszédnek, aztán próbára tették, hogy a további mintákat már egyedül ismerje fel. A programozók ezután "megmondták" a mesterséges intelligenciának, hol hibázott; ha ezt a folyamatot elég sokszor ismétlik meg, a szerkentyű ugyanúgy megtanulja, mi a helyes megoldás, ahogyan a kisgyerek is a környezet reakciói alapján osztályozza sokrétű tapasztalatait.

A Voice Miner hátterét adó szegedi szoftver alaposabb képet alkot magának - és kezelőinek -, mint a számítógépes hangrögzítő programokból ismert, csak a hang frekvenciáját mutató egyszerű hullámvonal. Kétdimenziósnak mondja Kocsor azt a képet (spektrogramot, lásd illusztrációnkat), amely azt is mutatja, melyik pillanatban melyik frekvencia (vagyis hangmagasság) milyen arányban van jelen a beszédben. Ezek a részek világosabbak, sárgák vagy pirosak az ábrán. Ilyen alapon a szoftver képes megkülönböztetni az ügyintézők és az ügyfelek hangját, majd szókapcsolatokra bontja a szöveget, azokból pedig kibányássza az egyes hangokat, és azonosítja a szavakat.

A gépi beszédfelismerés önmagában nem új, bár viszonylag fiatal számítógépes "trükk". A legtöbb esetben azonban egy vagy néhány felhasználó hangjához kötődik: az orvosok diktálta kórismét írott szöveggé lehet alakítani, a mobiltelefonba mondott neveket a készülék kiválasztja saját telefonkönyvéből, és nyomban hívja is az illetőt. A Voice Miner annyival tud többet, hogy bárkinek - legalábbis a lehetséges ügyfelek nagy többségének - a hangját képes kezelni. Ami már csak azért is bravúros, mert a spontán beszéd gépi felismerése jóval nehezebb, mint a felolvasott vagy legalábbis szándékosan tagoltan kimondott szavaké. Igaz, a Voice Miner sem tökéletes: a mássalhangzókat akadozottabban ismeri fel, mint a magánhangzókat.

Örömre adhat viszont okot, hogy a tájszólással beszélők nem tudják összezavarni a mesterséges füleket: amint azt Kocsor a HVG-nek kifejtette, a gép számára még a magyarban szélsőségesnek számító békési kiejtésben is az é helyett mondott í (a Békésből például Bíkís lesz) még mindig a hibahatáron belül lehet. Ha pedig elég sok hangmintával trenírozzák a masinát, az még azt is képes lehet megkülönböztetni, hogy valaki azért kapkod, mert ideges, vagy csak szimplán hadar.

Ha a számítógép árgus szemekkel figyel a kulcsszavakra - az ügyfélszolgálat tevékenységének megfelelően összeválogatott 500-600 szavas szótár alapján -, és az érzelemnyilvánításokra is ügyel, akkor Bódogh szerint idejében riasztani tudja az illetékes főnököket. A nehezebb ügyfeleket a számítógép akár már a beszélgetés elején felismerheti, és javasolhatja, hogy adják át őket a gyakorlottabb ügyintézőknek. Magyarországon egyelőre két nagy, meg nem nevezett ügyfélszolgálatnál - egy energiaszolgáltatónál és egy távközlési társaságnál - kísérleteznek a szoftverrel.

Hasonló hangbányászati megoldásokat néhány külföldi cég - köztük az amerikai CallMiner és az izraeli Nice - is kínál, de a külföldi rendszerek egyelőre nem értenek magyarul. Egészen másfajta hangfelismerés is van a piacon: szintén a hangbányászat cégére alatt az izraeli PerSay cég titkosszolgálatoknak ajánlja szoftverét, amely nem a beszélgetések tartalmára összpontosít, hanem a keresett személyek hangját szűri ki a lehallgatott telefonokból.

BEDŐ IVÁN

Állj mellénk!

Tegyünk közösen azért, hogy a propaganda mellett továbbra is megjelenjenek a tények! Ha neked is fontos a minőségi újságírás, kérjük, hogy támogasd a munkánkat.
A fülöp-szigeteki "Jézus Krisztus" belefáradt a keresztre feszítésekbe, várja az utódját

A fülöp-szigeteki "Jézus Krisztus" belefáradt a keresztre feszítésekbe, várja az utódját

A szocialisták várták Ferihegyen a húsvétra hazatérő magyarokat

A szocialisták várták Ferihegyen a húsvétra hazatérő magyarokat

Vekerdy Tamás: Ha békén hagyod a gyereket, magától megtalálja az útját

Vekerdy Tamás: Ha békén hagyod a gyereket, magától megtalálja az útját

Megdöbbentek a kutatók: ott találtak magas mikroműanyag-koncentrációt, ahol senki sem számított rá

Megdöbbentek a kutatók: ott találtak magas mikroműanyag-koncentrációt, ahol senki sem számított rá

Nyuszibunyót vettek fel a mentők

Nyuszibunyót vettek fel a mentők

Kellemetlen meglepetést hozott a nyuszi a Tojásszövetségnek

Kellemetlen meglepetést hozott a nyuszi a Tojásszövetségnek