Skip to main content
informatikaművelődés

A soknyelvű Európa és a nyelvtechnológia: META-Forum 2011

Szerző: 2011. július 7.No Comments

„„Megoldások a soknyelvű Európának” alcímmel tartották Budapesten a második META-Forum konferenciát, melyen az európai nyelvtechnológia élvonalába tartozó kutatók és az EU döntéshozói találkoztak. Beszámoló a konferenciáról.

…beszámolunk a június 27-28-án rendezett META-Forum konferenciáról, melynek központi témáját a soknyelvű Európa kihívásaira megoldást nyújtó nyelvtechnológiai alkalmazások szolgáltatták…Solutions for Multilingual Europe (Megoldások a soknyelvű Európának). Brüsszel után most Budapest adott otthont a konferenciának, az – akkor még – magyar EU-elnökség alatt. A helyi szervezők az MTA Nyelvtudományi Intézetének munkatársai voltak.

Google és IBM
Az első napon két meghívott előadót is hallhattunk: az első előadásban Thomas Hofmann, a Google munkatársa beszélt arról, hogy milyen nyelvtechnológiai eszközöket alkalmaznak a Google-nál az internetes szolgáltatások fejlesztéséhez.

Főleg a Google Translate-ről beszélt, mint a cég leginkább ismert és alkalmazott nyelvtechnológiai alkalmazásáról, de az is egyértelműen kiderült, hogy az ilyen nagy keresőcégeknek, mint a Google sem nagyon van más választása, mint az interneten található nyelvi információ intelligens feldolgozása és prezentálása. Ehhez pedig olyan eszközöket használnak, mint a morfológiai elemző, a tulajdonnév-felismerő, az anaforafeloldó vagy a jelentésegyértelműsítő.

A másik nagy előadást Bran Boguraev tartotta, aki úgy lett felkonferálva, mint az ember Watson mögött, mivel ő az IBM nyelvtechnológiai kutatócsoportjának a vezetője, akik idén év elején durrantottak nagyot az intelligens géppel, amely megverte az embereket egy amerikai kvízműsorban. A Jeopardy! hasonló a Mindent vagy semmit! műsorhoz, vagyis a játékosoknak nagy lexikális tudást igénylő, a témakörök széles spektrumát lefedő kérdésekre kell választ adniuk. A meghatározások már önmagukban becsapósak, általában valami kis vicc, ironikus fordulat található bennük, aminek a dekódolása a gép számára még nehezebb feladat, mint magukra a kérdésekre jól válaszolni. Felmerülhet a laikus olvasóban, hogy Watsonnak előre megadott kérdésekre kellett esetleg válaszolni, vagy valamilyen módon meg volt könnyítve a helyzete: nos, nem. Sőt még internetet sem használhatott, vagyis mindent a gép memóriájában kellett tárolni, ami viszont 15 terabájtos volt, szóval elég sok adat elfért benne. Watson kulcsszavakkal dolgozik, vagyis a műsorvezető által megadott információból kiemel pár kulcsszót, és azok mentén halad tovább, így próbálja meg kitalálni a megfejtést. Mindehhez a természetesnyelv-feldolgozás minden szintjét mozgósítja: a szavakra bontástól a mondat szerkezetének feltárásán át a szemantikai elemzésig.

MT@EC
A két nagy előadáson kívül a két nap alatt további 9 szekcióban ismerkedhettünk meg a soknyelvű Európa kihívásaira megoldást nyújtó nyelvtechnológiai fejlesztésekkel és projektekkel. Ha soknyelvűség, akkor értelemszerűen a gépi fordítás jut rögtön az ember eszébe mint megoldás a nyelvi korlátok ledöntésére. Több nagyvállalat (Vodafone, Daimler) képviselője is beszámolt arról, hogy hozzájuk már elért az innováció szele, és lelkesen alkalmazzák a nyelvtechnológia fejlesztéseit, de legfőképpen a gépi fordítást. Egy nemzetközi vállalatnál rengeteg szöveges információ termelődik nap mint nap, melyek egyrészt strukturálatlanok, másrészt több nyelven íródtak. Ezekben a dokumentumokban nagyon sok értékes információ bújik meg, melyek lefordítása, rendszerezése és feldolgozása nagy előnyhöz juttathatja a céget.

A soknyelvűség természetesen nem csak a multinacionális cégeket érinti, hanem az Európai Unió mindennapi ügymenetében is nagy szerepet játszik. Gondoljunk csak arra, hogy minden európai intézmény által alkotott jogszabályt le kell fordítani az EU mind a 23 hivatalos nyelvére.”

Forrás:
A soknyelvű Európa és a nyelvtechnológia: META-Forum 2011, Nyelv és Tudomány, 2011. július 7.
Korábbi cikkünk:
Veszélyben vannak Európa nyelvei?