• Tudomány
Vági Barbara
Vági Barbara

Agyhullámokkal mozgatták a számítógép egerét - interjú Prószéky Gáborral

Az informatikusok és az agykutatók közös munkájával előfordulhat, hogy újra mozdíthatja valaki a kezét vagy a lábát, amit mondjuk egy gerincsérülés miatt már évek óta nem tudott megmozdítani. Erre már van esély - ezt mondta Prószéky Gábor, számítógépes nyelvész, a Morphologic ügyvezető igazgatója, a PPKE Információs Technológiai és Bionikai Karának egyetemi tanára. Azt is mondta, hogy az agyhullámokról már sokat lehet tudni, és már van olyan kutatás, ahol agyhullámokból levett jelekkel meg tudták mozdítani egy számítógép egérmutatóját. Szerinte valószínűleg soha nem lesz olyan fordítóprogram, amely tökéletesen, hangosan kimondva fordít szimultán egy beszélgetést, ugyanis a emberi agy bonyolult: tele van emlékekkel, érzésekkel, a számítógép pedig soha nem volt ember, így nincsenek emlékei, nem tudja a szöveg környezetét értelmezni és felismerni - csak algoritmusokat, kódokat ismer.

"A számítógép egy szobában volt, és akkora volt, mint egy szekrény."

"A számítógép egy szobában volt, és akkora volt, mint egy szekrény."

Fotó: Talán Csaba

A hetvenes évek közepén járt egyetemre. Akkor milyen volt egy számítógép?

A számítógép egy szobában volt, és nagyjából akkora volt, mint egy szekrény. A számítógéppel foglalkozó hallgatóknak – nekünk – az volt a dolgunk, hogy lyukkártyán leadjuk a megoldott feladatot. Átvették, és körülbelül másnap-harmadnap kiderült, hogy van benne egy hiba. Akkor visszaadták, javítottuk, és megint leadtuk. Ha pedig végre sikerült, lefutott a gépen a program, amit lyukkártyán leadtunk, akkor örültünk nagyon. De ez akár egy hétig is eltarthatott. Nos, akkor ilyen volt a kommunikációs sebesség. Számos programozási nyelvet úgy kellett megtanulni, hogy nem is tudtuk lefuttatni az azokon megírt programokat.  Mi megírtuk, az oktató leosztályozta, de nem volt mód arra, hogy ki is próbáljuk, amit megírtunk. A kapacitás ugyanis véges volt.

EZT IS AJÁNLJUK:

    Akkor tényleg csak a szigorú feladatokat lehetett csak elvégezni, ha ennyire kicsi volt a kapacitás. Nem volt sok terük játszani, vagy élvezni a számítástechnikát.

    Azért próbálkoztunk. Akkor volt egy népszerű játék, a Mastermind, amiben színek sorrendjét kellett kitalálni. Két csoporttársam írt erre egy-egy programot, és az egyik minden nap eldugott egy színsort, a másik meg kitalálta. Reggel, amikor bejöttek, megnézték, hogy ki nyert. Mondtam nekik, hogy ez nagyon érdekes, de ki lehetne találni valami hasznosabb, okosabb dolgot is, amire programot lehetne írni. Akkor kezdtünk el beszélgetni a nyelvről, és kitaláltuk, hogy írunk egy emberi nyelvek közötti fordító programot. Úgy terveztük, hogy nyár végére elkészülünk vele.. persze, nem készültünk el.

    Angol-magyar fordító program volt?

    Igen. Vagyis: azt gondoltuk, hogy az lesz. A lényeg az volt, hogy valami nagyon komplex feladatot akartunk keresni. Akkor egyébként ez nagyon álomszerű volt, ugyanis nem volt semmiféle interakció. Nem volt képernyő, ami előtt ültünk, hanem a másik szobában volt az említett doboz – a számítógép.

    "1978-ban elkezdtük az első angol-magyar fordítóprogram írását."

    "1978-ban elkezdtük az első angol-magyar fordítóprogram írását."

    Fotó: Talán Csaba

    Mekkora volt a memóriája annak a doboznak?

    Ezek valahány kilobájt memóriájúak voltak. Most, hogy visszagondolok erre, egészen furcsa… Az én édesapám mesélt az ő nagyapjáról nekem, aki az első hazai lóvasúton utazott… Nagyjából így érzem magam, csak egyetlen személyben.  Az én életemben megadatott a szoba nagyságú számítógép, néhány száz kilobájttal, és most meg mindent átsző az internet és az informatika más ágai.  Történelmi matuzsálemnek tűnhetek, hogy én ezt láttam annak idején…

    Pedig csak a technika fejlődik ilyen ütemben...

    Igen.

    Végül aztán elkészült a fordítóprogram?

    Nem, végül nem –  az akkor csak egy álom volt. Később azért készített cégünk, a MorphoLogic ilyet.

    Egyébként hogyan találta akkor ezt ki? Volt már korábban ilyen? Vagy hallott egyáltalán róla?

    Természetesen nem én találtam ki a fordítóprogramot. Volt már korábban. A hidegháború hozta magával, hogy az amerikaiak orosz katonai szövegeket akartak fordítani. Az oroszok meg nyilván angolt. A gond csak az volt, hogy Amerikában sokkal több volt a lehetőség – meg hát később a számítógép-, a Szovjetunióban meg – bár ugyanannyi okos ember volt – kevesebb. A szovjetek extrém kihívásokat kerestek – végül valaki rátalált a Varsói Szerződés egy különleges nyelvére, a magyarra,  és úgy gondolta: ez elég extrém nyelv ahhoz, hogy kipróbálják,  a nyelvi komplexitást hogyan bírják az akkori algoritmusok. Létrehoztak egy csoportot, amelynek az volt a dolga, hogy magyar-orosz fordítóprogramot készítsen. Ez a hatvanas évek elején volt. Amerikában ezalatt folyt a munka: nem számított a pénz, a Pentagon, a haditengerészet meg a többi nagy intézmény azon dolgozott, hogy legyen jó fordító program. Azt várták, hogy az ember nem csinál semmit, a gép pedig pontosan fordít. Nem sikerült. Az Egyesült Államok ezek után leállította a gépi fordítási kutatásokat – ez 1966-ban volt. Ennek hatására a Szovjetunióban és Kelet-Európában  sem kutatták tovább, ugyanis úgy tűnt, nem működik a gépi fordítás.  Így a magyarországi  csoport tagjai szétszéledtek, és többnyire híres informatikusok vagy nyelvészek lettek belőlük.

    Úgy tudom, találkozott is egyetemistaként ennek a csoportnak az egyik tagjával.

    Igen, Dömölki Bálinttal, aki szakmai életem fontos pillanataiban máskor is megjelent. A nyolcvanas évek elején egyébként megkeresett a Műszaki Könyvkiadó, hogy ez a számítógépes nyelvészet nagyon érdekes terület, írjak róla egy könyvet. Látja, ott a könyvespolcon.. ott van az a nagy szürke… azt a könyvet írtam meg végül, amit 1989-ben adott ki végül a Számalk. Amit akkor lehetett tudni erről a szakterületről, én mindent összeszedtem. Elkezdtem levelezni a világ minden táján élő kutatókkal, akik sokat segítettek a könyv megírásában. Én azt gondoltam, hogy annyira alapos voltam és mindent összeszedtem, hogy én már soha többé nem írok erről a témáról. (Nem így lett, azóta még két könyvet írtam a számítógépes nyelvészetről.)  Dömölki Bálint szobájában egy holland kutató  meglátta a könyvet, de nem tudott magyarul és engem sem ismert, viszont azt látta, hogy jó vastag. Azt mondta, hogy éppen keres egy számítógépes nyelvészt a kutatócsoportjába. Érdekes volt, hogy semmit sem tudott rólam, nem tudta elolvasni a könyvet, mégis hívott, mert azt látta, hogy jó vaskos a könyv. Így kerültem a rendszerváltozás táján Hollandiába egy kutatócsoportba. Kint ért a rendszerváltás, ami nagyon érdekes volt, ugyanis nem nagyon tudtam, hogy itthon mi folyik.

    Az első könyve a számítógépes nyelvészetről

    Az első könyve a számítógépes nyelvészetről

    Fotó: Talán Csaba

    Persze, mert még nem volt internet, és nem tudta követni a híreket.

    Bizony, nem volt. Később, amikor visszajöttem Magyarországra, akkor kezdtünk el egy helyesírás-ellenőrző programot készíteni. Ez nagyon érdekes munka volt. Kisebb feladat volt, mint a fordítás, de konkrét és jól definiálható. Ráadásul magyar nyelven nem készült még ilyen. Aztán 1990 végén elkezdett működni a program – az én ötleteim alapján. Akkor valaki megsúgta, hogy létre kellene hozni erre egy céget, mert csak úgy tudjuk magunkat megvédeni a különféle szakmai és jogi támadásoktól, amiben akkor volt részünk, hiszen üzletileg és tudományosan is jelentősnek számított, amit csináltunk. Így 1991-ben négyen létrehoztuk a MorphoLogic nevű céget – éppen 25 éve. A cég nyelvi szoftvereket gyárt, és a mai napig sikeresen működik.

    A legjobbkor jött létre a cég.

    Így van, és ráadásul a külföldi tapasztalataimból már nagyjából sejtettem, hogy hogyan működik egy vállalkozás, itthon meg végre lehetett már alapítani cégeket.  Akkor persze másként működtek a dolgok. Nem úgy volt, mint ma, hogy profi emberek bonyolítják az üzletet, a szoftveres pedig máshol van. Dehogyis. Én egy személyben voltam kutató is, meg üzletember is. Persze, akkor mindenhol így volt, nemcsak Magyarországon.  Ezért hamar meg is tudtunk állapodni a nagy nemzetközi cégekkel. Jött az IBM, a Microsoft, a Xerox, és mind vásároltak tőlünk.

    Azon gondolkodtam, hogy a számítástechnika egészen más terület, mint a nyelvészet. Az egyik humán, a másik reál. Hogyan lehet összeegyeztetni a kettőt?

    A nyelv egy furcsa dolog, az ember sajátja...

    Ami tele van érzelemmel – és szerintem ezt nem lehet számítógépre vinni. Nem lehet programozni, nem lehet géppel érzékeltetni.

    Tele van érzelemmel, valóban – amikor beszéli az ember. Amikor élőbeszédben használja az ember. De maga az írásbeli  rendszer, amit használok, az egy kódrendszer.

    Lehet algoritmusokat felállítani a nyelvre?

    Igen, lehet különböző algoritmusokat felállítani.

    Az ilyen nehéz nyelvekre is, mint például a magyar?

    Igen. Ha már a magyarra létrehoztunk valamit, az már átvihető – az angol felől nézve igen bonyolult -  nyelvekre is: lengyelre, románra vagy csehre. Megpróbálom elmagyarázni. Ha egy zongorához odaül valaki, és egy ujjal pötyög valamit, akkor is szól valamilyen dallam. De ha öt év múlva is csak ennyit tudok, akkor joggal mondhatják, hogy semmit sem fejlődtem, ez nem zongorázás.  Ilyen az angol nyelv gépi feldolgozása is. Mert az angol viszonylag könnyű nyelv – legalábbis az elején. Sikerélményt ad. Megtanulja az ember a szavakat, és kész. Ez olyan, mint amikor leütöm a zongora billentyűit. Később, jóval később jönnek csak ki a nehézségek – mint ahogy a zongora tanulása során is. A magyar nyelv feldolgozását pedig a hegedüléshez hasonlítanám. Az elején össze-vissza nyekereg, tisztességes hang sem jön ki rajta. Néhány év múlva viszont dallamot lehet rajta játszani, ha valaki gyakorol. Persze nyilván szereti az ember azt hinni, hogy az ő nyelve a legnehezebb. És erre büszkék is vagyunk. De a japánok még büszkébbek, mert szerintük az ő nyelvük végképp nehezen tanulható. Persze, ezek csak hiedelmek, mert minden nyelvben máshol van a bonyolultság. Mindenesetre, ha programokat próbál írni az ember ezeknek a nyelveknek a feldolgozására, valami azért érződik ezekből a hiedelmekből.

    "Soha nem lesz tökéletes egy fordítóprogram, mert a gép soha nem volt ember."

    "Soha nem lesz tökéletes egy fordítóprogram, mert a gép soha nem volt ember."

    Fotó: Talán Csaba

    A fordító- és a helyesírás-ellenőrző programról jutott eszembe: ön hogy látja, hogyan befolyásolhatja az emberek tanulását az, hogy vannak ilyen programok? Elkényelmesedne és az lesz a jellemző, hogy „ó, hát a gép majd lefordítja”, és az sem lesz már fontos, hogy az ember tudjon helyesen írni, mert a gép úgyis kijavítja?  

    Azt gondolom, hogy ez nem így van. Ezek a programok segítik az ember munkáját – de nem végzik el helyette. Többféle hozzáállás van az ilyen típusú programokhoz. Két extrém példa viszont nagyon jellemző. Az egyik az, amit ön is mondott, hogy „majd a gép megoldja, és én elhiszem neki.” A másik pedig az, hogy „én jobban tudok helyesen írni, én jobban le tudom fordítani szöveget, nem kell nekem segítség egy géptől.” A fordító- vagy helyesírás-ellenőrző programok nem arra valók, hogy mindent megoldjanak, viszont nagyon sokszor segítik az embert. Mankónak nagyon jók, de ne hagyatkozzunk rájuk. Nyilván, aki nagyon jól tud például angolul, az sokszor kineveti a fordítóprogramot.

    De abba gondoljunk bele, hogy ha belefutunk valamiért egy albán weboldalba, és mondjuk 10 percen belül kell valamilyen információt megtudnom az oldalról, akkor nem kérdés, hogy a fordítóprogramot veszi igénybe az ember, és akkor segít is. Nem arra gondol az ember, hogy most gyorsan keresek valakit, aki jobban tud albánul, mint a fordító, hanem örülök annak, hogy van egyáltalán bármilyen lehetőségem arra, hogy perceken belül megtudjak bármilyen információt az albán oldalról. A minőség ebben az esetben nem a legfontosabb. De visszatérve a kérdésére: azoknak segítenek ezek a programok azért többnyire, akiknek van tudás a birtokukban. Gyorsítja és egyszerűsítheti a munkát. Én egyébként nemzetközi környezetben nem is fordítóprogramnak hívom ezeket, hanem megértést támogató rendszernek.

    Azért még mindig azon gondolkodom, hogy persze, a gép így vagy úgy lefordít egy szöveget.. De a szöveg környezetét nem tudja értelmezni…

    Ez valamennyire így is van.  Gondoljon bele: adunk egymás után egy dimenzióban néhány betűt egymás után. Leírjuk például, hogy „kutya”. Önnek eszébe jut erről sok minden. A szomszéd kutyája, hogy mennyire ugat, esetleg a sajátja, tudja, hogy van német juhász, foxterrier, hogy szőrös, hogy szaglászik, és még sorolhatnám. A gépnek pedig mindössze a k-u-t-y-a  betűk vannak meg. Ezzel kell kezdenie valamit. Mázlija van, mert erre a betűsorra pont van egy megoldás,  - angolul ennek felel meg a d-o-g. De abban igaza van, hogy a fordítás nem arról szól, hogy betűket, szavakat fordítsunk.  Csakhogy a gép sosem volt ember. Nincsenek emlékei, nincsenek benyomásai, nem élt soha. Nekünk pedig – embereknek – mindez megvan, és ez is kell ahhoz, hogy tudjunk beszélni. A gép a betűk egymásutánját kapja csak meg, és fordítja.  Itt jön a számítógépes nyelvész, aki trükköket alkalmaz. Olyan ismereteket ad a gépnek, amelyből az a látszat keletkezik, mintha az is kicsit értené a szöveget. Erről szól valójában a számítógépes nyelvész élete. Amikor elkezdtük a dolgot, negyed évszázada, akkor még kizárólag szabály-orientált volt ez a terület. A nyelvi szabályokat ültettük bele a programba.

    Az sem lehetett egyszerű a magyar nyelvnél. Rengeteg szabály van – és most csak a helyesírás-ellenőrző programra gondolok.

    Igen. Nagyon sok mindenre figyelni kellett a program írása során. Csak egy példát mondok: vannak például az összetett szavak.  Szekrényajtó. Ezzel nincs is semmi gond. De az első programnál, amit megírtunk, kiderült hogy az ő számára az „ingyen” szó egy összetett főnév.

    Micsoda? Ezt hogy dobta ki a gép?

    „Ing” és „yen”. Erre ugye az ember nem is gondolt volna. Úgyhogy gyorsan ki kellett zárni, hogy ilyenek előforduljanak – ki kellett zárni a pénznemeket. De ilyen típusú dologból ezer volt.

    Van olyan, hogy elkészült a program, és nem lehet már rajta javítani?

    Nincs. De az biztos, hogy ezt a programot, amit mi csináltunk immár  25 éve, több millió ember teszteli naponta. Minden Microsoft termékben és sok másban a mi algoritmusunk van benne. Azt lehet mondani, hogy bár biztosan vannak még mindig hibái, de soha nem jött még olyan jelzés, hogy elszállt ez a  program, vagy nem működne megfelelően. Persze, azért a Microsoft meg a többiek is komolyan tesztelik ezeket, nem lehet a partnernek olyan programot írni, ami miatt az ő programjuk megbotlik. Szóval: azt lehet mondani: ilyen sok magyar felhasználót még nem ért el egyetlen program se.  

    Hogyan fejlesztik tovább a nyelvelemző programjaikat?

    Jelenleg akadémiai kutatócsoportommal  egy olyan fajta algoritmikus leírást csinálunk a magyar nyelvről, ami eddig még nem készült. Eddig informatikus, számítógépes és matematikus határozza meg, hogy hogyan kell elemezni. A nyelvi adatot pedig egyszerűen alátettük. Mi most azt mondjuk:  megfigyeljük azokat az algoritmusokat, amelyeket az ember használ. Nem olyat, amit a gép. Emberi módon próbáljuk megközelíteni a kérdést. Ehhez kezdtünk most el információkat gyűjteni: a magyar nyelvű webről legyűjtöttünk több mint egymilliárd szónyi magyar szöveget, ami valamilyen képet ad arról, hogy mit írnak az emberek magyarul 2016-ban. Ezekből a szövegekből a programjaink megtanulják, hogy milyen összefüggések vannak a mai magyar nyelvben.

    Sok érdekességet láthatnak. Ma ugyanis minden felkerül az internetre, függetlenül attól, hogy az fontos-e vagy sem, átnézte-e valaki, van-e benne hiba? Jó az, ha ezeket elemzik?

    Megpróbáljuk elkülöníteni a norma szerint írtakat a nem norma szerint írtaktól. A hírportáloknál, amiket önök írnak, többé-kevésbé mindig van kontroll. Azok többnyire igényesek. De vannak blogok, fórumok, kommentek, ahol mindenki ír mindenfélét. Van ugyanis az „igazi” írott nyelv, és van az olyan típusú szöveg, ami valójában  az élő beszéd írott formája. Ez két különböző dolog. Mondok egy példát: gyerekkoromban az iskolai óra alatt egy cetlit küldözgettünk egymásnak, amelyben üzengettünk az osztály másik végén ülő társunknak. Ez volt az email előde. Ennek tartalma nem tartozott a tanárra, és egyáltalán nem volt szempont a helyesírás. A mostani fórumozóknál, kommentelőknél, chatelőknél is ez van. Írva beszélnek. A beszédre pedig sosem vonatkozott semmilyen helyesírási szabály, mert a beszéd az beszéd.

    Sajnos, ilyenkor kevésbé érünk rá igényesnek lenni, és kicsit arra tolódik ez a dolog, hogy egyre inkább megjelenik az igénytelenség. Nem a nyelvvel van a baj, hanem a nyelvet használó emberrel, aki siet, és egyre igénytelenebb. Az iskolában nemcsak nyelvtant kellene tanítani, hanem igényességet is. Egyszóval: elemezzük ezeket az írásbeli megnyilvánulásokat, különválasztjuk a norma szerint írottaktól, és megpróbáljuk a programba beültetni az ebből szerzett ismereteket. Azzal foglalkozunk, ami létezik. Nem gondolkozunk azon, hogy büszkék vagyunk-e egy-egy megnyilvánulásra, vagy hogy szeretjük-e őket, hanem feldolgozzuk őket, mert léteznek. Muszáj velük foglalkozni. Nádasdy Ádám nyelvészkollégámtól idézek: a biológus sem mondhatja, hogy ez egy gusztustalan állat, ezzel én nem akarok foglalkozni. Kell vele foglalkozni, mert létezik.

    Térjünk vissza a fordítóprogramra. Előfordulhat-e az, hogy elkészül egy olyan fordítóprogram, amely tökéletesen fordít szimultán élő, beszélt nyelvet?

    Beszédfelismerő programok már vannak.  Egy korrekten megírt és felolvasott szöveget képes szöveggé átírni. Ezt többé-kevésbé le is tudjuk fordítani.  De gondoljon bele, ha mi beszélgetünk, csupa félmondat vagy akár fél szó hangzik el. Nézzünk például egy időpont megbeszélést. Ez így hangzik: „igen, ja, nem.. fi… holnap? Ja, nem.. nem jó..csüt….ja, holnap már csütörtök? Nem jó, fi… nem.. inkább tegyük át jövő hétre.” Ez kéne fordítania a gépnek. Ezt lehetetlen. Vannak félrevezető hírek, hogy tökéletesen működik a speech to speech translation, ami abban az értelemben persze igaz, hogy korrekten lefordít egy felolvasott szöveget, de az élő beszédet, amit az imént említettem, nem tudja.. Nem is tudom, hogy lesz-e valaha ilyen. Az emberi agy ugyanis nagyon komplex, sok szálon működik.

    Ha már az agynál tartunk: lesz-e valaha olyan, hogy agykutatókkal együtt dolgozva informatikusokkal kialakítanak valamiféle  „gondolkodó számítógépet?”

    Itt, a Pázmány Információs Technológiai és Bionikai Karán a bionika-oktatásunk éppen arról szól, hogy létezik az emberközpontú informatika. Itt agykutatók és informatikusok vannak együtt. Néhány napja volt egyébként pont a doktori iskolánkba a felvételi, és hárman is olyan feladatot tűztek ki célul, ahol az agy és a számítógép közös kutatása volt valahol a dologban. Az agyhullámokról sok mindent tudunk már, és még több mindent nem. Az biztos, hogy már gondolattal meg tudtak mozdítani egy kurzort. Az a célunk, hogy segítsünk, ahol csak lehet. Hogy az informatika és az agykutatás közös munkájával, közös kutatásaival újra mozdíthassa valaki a végtagját, amit mondjuk egy gerincsérülés miatt már évek óta nem tudott megmozdítani. És erre már – döbbenetes – de van esély.

    A 70-es években, amikor egyetemista volt és egy szobában volt a szekrény nagyságú számítógép, gondolta volna, hogy néhány évtized múlva ez lesz?

    Á, dehogyis. (nevet.) Az jut az eszembe, hogy 1987-ben Kaliforniában voltunk egy nyári egyetemen. Akkor már az Egyesült Államokban egész komolyan működött az itthon még alig ismert email.  Az első napon volt egy bevezető, egy ismertető, hogy milyen lesz a nyári egyetem. Aztán az előadás közben elhangzott az, hogy ha valaki „natural mail”-t akarna küldeni, azt hogyan lehet. Mi nem értettük ezt a szóösszetételt. Fogalmunk sem volt, hogy mit jelent az, hogy „natural mail”. Megkérdeztük. Az előadó pedig elmagyarázta, hogy boríték meg bélyeg.. szóval, hogy a natural mail az  a tradicionális papír-levél. Annyira természetes volt már Amerikában az elektronikus levelezés, hogy már akkor azt nevezték „mail”-nek, és a hagyományosnak új nevet kellett kitalálni, ez lett a „natural mail.” Ők azt hitték, hogy mi olyan országból jöttünk, ahol már annyira elterjedt az elektronikus levelezés, hogy el kell magyarázni, hogy mi az a boríték. Közben pedig mi szinte még  azt is alig tudtuk, hogy van másmilyen, mint a hagyományos… Ez volt 1987-ben.. most pedig szinte már csak emailt használ mindenki.

    Top 16