A fejezetben a következő, igen fontos KÉRDÉSEKre keressük a választ:
1. KÉRDÉS: Ha a helyesírás-ellenőrzőm hibásnak ítél egy amúgy tökéletesen írt szót, és felvetetem vele a szótárba, utána miért kell felvennem az összes toldalékolt alakját külön-külön? Miért nem ismeri fel azokat automatikusan?
Mindenki kipróbálhatja! Másolja be egy új dokumentumba a szövegszerkesztőjében a következő szöveget, és futtasson rajta helyesírás-ellenőrzést! A helyesírás-ellenőrző által hibásnak ítélt szavakat vagy javítsa vagy vegye fel a szótárba! (A gönnye szó forrása: Fiatal Nyelvészek Munkaközössége 1976, IV. fejezet, 7. feladat)
A gönnye borjastól a patakra ment vizet inni, majd kérődzött egy sort. A gönnyék igen félénkek: nem könnyű egy gönnyét megközelíteni. A félénksége mellett a gönnyének hihetetlenül kifinomultak az érzékszervei: ha egy gönnyétől ötven méterre megzizzen egy fűszál, már azt is meghallja.
2. KÉRDÉS: Miért küld a helyesírás-ellenőrző ilyen üzeneteket: „A mint elé vesszőt kell tenni, ha nem -ként értelemben használja”.
Ellenőriztesse a szövegszerkesztőbe másolva a következő mondatot! Milyen más értelemben használhatnám itt a mint-et?
Az adatbázis mint dinamikus korpusz működhet a természetes nyelvi lekérdezések fejlesztésekor.
3. KÉRDÉS: Miért könnyebb az interneten pl. a Google segítségével megtalálni valamit, aminek nem tudjuk teljesen pontosan a címét vagy egyéb adatát, mint akár a szakkönyvtár keresőjében, akár egy oktatástámogató programban?
Nézzük az alábbi példát: tegyük fel, hogy nem emlékszem pontosan az alábbi forrás címére vagy szerzőjére: Kis Balázs, Prószéky Gábor: Számítógéppel emberi nyelven. Tudom, hogy volt a címben számítógép meg emberi nyelven, és ezekre próbálok keresni.
-
ábra: a Google keresőjének találati listája: rögtön az első helyen szerepel a keresett könyv
-
ábra: egy könyvtár keresőjének találati listája: nincs találat
-
ábra: egy távoktatási rendszer keresőjének találati listája: a találatként megjelenő dokumentumokban valójában szerepel a keresett könyv, de a találati listában ez nem látszik rögtön, ehhez az eredményre rá kell klikkelni
Ahhoz, hogy erre a három kérdésre (illetve később majd a diákjaink sok-sok kérdésére) válaszolni tudjunk, meg kell ismerkednünk azzal, hogyan is kezeli a számítógép a nyelvet. Ehhez először leírok hat, önállóan elvégzendő VIZSGÁLATOT (néhol több részletre bontva), amelyekkel tapasztalatokat kell gyűjteni a nyelvtechnológia mindennapi működéséről. Ezekre a tapasztalatokra hivatkozom majd a tankönyv szövegében. De előbb példákon keresztül illusztrálom, hogyan is okoskodik a számítógép, aztán más példákon keresztül, hogy hogyan is okoskodik a nyelvész, valamint hogy hogyan történik a nyelvelsajátítás, és kitérünk arra is, hogy mi a jelentés a számítógép számára. Ezután kerülnek szóba a vizsgálatok elvégzése során nyert tapasztalatok. Hogy miért érdemes mégis előre elvégezni a hat vizsgálatot? Mert az általuk megtapasztaltak segíteni fognak megérteni a számítógép okoskodásának, működésének leírását.
Lássuk tehát a VIZSGÁLATOKAT!