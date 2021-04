„Ragyogó hideg nap volt áprilisban, és az órák tizenhármat csaptak.“

Hát ez nem jó kezdés. Nem azért, mintha George Orwell nem jól írta volna meg az 1984-et, hanem azért, mert a valószínűleg legszélesebb körben használt internetes fordító, a Google programja kissé melléfogott. Nem így a konkurens, a DeepL, amelynél a magyar változat: „Ragyogóan hideg áprilisi nap volt, és az órák tizenhármat ütöttek.“ Tegyük hozzá nyomban, hogy ez is csak megközelíti, de nem üti meg a műfordítás színvonalát, amelyre Szíjgyártó László szövege a példa: „Derült, hideg áprilisi nap volt, az órák éppen tizenhármat ütöttek.“

Azért tettünk próbát, mert nemrég jelentették be, hogy 12 másik európai nyelv mellett a magyarral is kiegészítették a DeepL szolgáltatását, amely eddig jórészt a nagyobb nyelvekre szorítkozott. A nyelvek száma a mostani bővítéssel is 30 alatt marad. A DeepL kölni székhelyű vállalkozás, 2017 óta kínál online fordítást, és minőségben eddig is felülmúlta a Google fordítóját, amely azonban toronymagasan – 109-cel – vezet a kínált nyelvek számában.

Más internetes fordítókhoz hasonlóan a DeepL is mesterséges intelligenciára, gépi tanulásra épít. Egészen pontosan konvolúciós neurális hálózatra. A mesterséges intelligencia munkahelye egy igen nagy teljesítményű (5,1 petaflop) szuperszámítógép Izlandon, ahol kedvező árú vízenergiával nyerik az áramot.

A céget idehaza eddig leginkább szótárszerű szolgáltatásáról ismerhették. A Linguee (eredetileg ez volt a cég neve is) 2008 óta működik, és lassacskán 25 nyelvű – közte magyar – fordítási segédletté vált. Aki rákeres egy szóra, nem a (például) magyar megfelelőjét kapja, hanem olyan szövegrészleteket, amelyekben a szó előfordul. Azt lehet tehát megtudni, hogy hús-vér fordítók milyen összefüggésben hogyan fordították a kifejezést. Ez a hatalmas szövegmennyiség (szaknyelven korpusz) is segít abban, hogy a DeepL jobb fordításokat ad, mint konkurensei.

Magasra tettük a lécet, amikor próbára tettük a DeepL és a Google magyarra fordító képességeit. Arra gondoltunk, hogy egy újságcikk vagy használati utasítás megértése nem jelenthet nagy gondot. Ehelyett klasszikus (és emiatt jogdíjmentesen letölthető) regények első majdnem ötezer karakterét másoltuk be a két szolgáltató majdnem teljesen egyforma felületén a bal oldali ablakba, és a jobb oldali mezőben pár másodperc múlva megjelent a magyar szöveg.

A bevezetőben idézett melléfogáshoz hasonlóak mindkét fordítónál becsúsztak, de a DeepL esetében ritkábban. Sőt, a DeepL időnként meglepően választékos szóhasználattal lepett meg. Ahol a Google ezt írta: „A folyosón főtt káposzta és régi rongyszőnyeg szaga volt“, ott a DeepL így írt: „A folyosón főtt káposzta és régi rongyszőnyegek szaga terjengett“. A Szíjgyártó-szöveggel egyezően Egyes leszállópályának fordította az Airstrip One kifejezést, amelyhez a Google hozzá sem nyúlt. A DeepL tudta, mi az a liftakna, amit a Google felvonótengelynek értelmezett.

A különbségek ellenére mindkét szolgáltatás bőségesen példázta a gépi fordítás korlátait. A feledékeny DeepL egyszer már rájött, hogy a pig iron nyersvasat jelent, később mégis disznóvasat emlegetett. A regény ikonikus mondatát elsőre jól megközelítette: „A nagy testvér néz téged“, hogy aztán később minden ok nélkül erre váltson: „A nagytestvér téged vigyázol“. A bluebottle (dongólégy) szóval egyikük sem birkózott meg, kékbolygónak vagy kékpalacknak fordították.

Még nagyobb meglepetésekkel szolgált Kafka A per című regényének magyarítása. A Google itt bizony már értelmetlen mondattöredékeket is a szövegbe illesztett, és több helyen értelmetlenül fordított. Ahol ez szerepel: „háziasszonyának, Grubachnénak a szakácsnője“ (Szabó Ede fordítása), ott mindkét szolgáltatót megtévesztette a bonyolult birtokos szerkezet, és egyikük sem jött rá, ki a szakácsnő és ki a háziasszony. Az egyébként jobb DeepL minden ok nélkül váltogatni kezdte a tegezést és önözést az eredetiben természetesen állandó önözés helyett.

Minden hiba ellenére a gépi fordítás sokat fejlődött. Az angolról vagy németről készített fordítások majdnem alkalmasak nyersfordításnak, amely a DeepL esetében kis ellenőrzés után használhatóvá tehető. A hibák ugyanakkor azt is egyértelműen jelzik, hogy az utómunka nem végezhető el olyan fordító vagy szerkesztő nélkül, aki érti az eredeti szöveget.

A DeepL használata közben az utóbbi években azt tapasztaltuk, hogy nagy nyelvek között (például németről angolra) egészen elfogadható szövegek jönnek létre. Láthatólag gyengébb az eredmény kisebb nyelvek esetén. A mostani kínálatbővítést kihasználva megnéztünk egy észt-magyar fordítást is, szintén klasszikust, Anton Hansen Tammsaare Igazság és jog regényciklusának elejét, egy olyan művet, amely Kafkáéval nagyjából egyidős. A magyar szöveg színvonala még a DeepL esetében is érezhetően gyengébb, mint az angolról vagy németről fordított irodalom esetében.

Még mindig nem mondhatjuk tehát, hogy nincs szükség a mű- vagy szakfordítókra. De az igaz, hogy a futószalagon készülő – például webáruházak áruit leíró – szövegek fordításánál már csábító lehetőség gépre bízni a munkát (és gyakran látható, hogy ez így is történik). A DeepL esetében többfajta fizetős modellt is ajánlanak. Az ingyenes fordítás határa a Google esetében is ötezer karakter. Annak persze egyik szolgáltatónál sincs határa, hogy valaki hányszor ötezer karaktert másol be, majd ki egymás után, de ha nagyobb mennyiségről van szó, a gyakorlatban ez nyilván nehezen kivitelezhető.

