Skip navigation

3.2. Célkitűzés: KÉRDÉSEK

A fejezetben a következő, igen fontos KÉRDÉSEKre keressük a választ:

1. KÉRDÉS: Ha a helyesírás-ellenőrzőm hibásnak ítél egy amúgy tökéletesen írt szót, és felvetetem vele a szótárba, utána miért kell felvennem az összes toldalékolt alakját külön-külön? Miért nem ismeri fel azokat automatikusan?

Mindenki kipróbálhatja! Másolja be egy új dokumentumba a szövegszerkesztőjében a következő szöveget, és futtasson rajta helyesírás-ellenőrzést! A helyesírás-ellenőrző által hibásnak ítélt szavakat vagy javítsa vagy vegye fel a szótárba! (A gönnye szó forrása: Fiatal Nyelvészek Munkaközössége 1976, IV. fejezet, 7. feladat)

A gönnye borjastól a patakra ment vizet inni, majd kérődzött egy sort. A gönnyék igen félénkek: nem könnyű egy gönnyét megközelíteni. A félénksége mellett a gönnyének hihetetlenül kifinomultak az érzékszervei: ha egy gönnyétől ötven méterre megzizzen egy fűszál, már azt is meghallja.

2. KÉRDÉS: Miért küld a helyesírás-ellenőrző ilyen üzeneteket: „A mint elé vesszőt kell tenni, ha nem -ként értelemben használja”.

Ellenőriztesse a szövegszerkesztőbe másolva a következő mondatot! Milyen más értelemben használhatnám itt a mint-et?

Az adatbázis mint dinamikus korpusz működhet a természetes nyelvi lekérdezések fejlesztésekor.

3. KÉRDÉS: Miért könnyebb az interneten pl. a Google segítségével megtalálni valamit, aminek nem tudjuk teljesen pontosan a címét vagy egyéb adatát, mint akár a szakkönyvtár keresőjében, akár egy oktatástámogató programban?

Nézzük az alábbi példát: tegyük fel, hogy nem emlékszem pontosan az alábbi forrás címére vagy szerzőjére: Kis Balázs, Prószéky Gábor: Számítógéppel emberi nyelven. Tudom, hogy volt a címben számítógép meg emberi nyelven, és ezekre próbálok keresni.

google

  1. ábra: a Google keresőjének találati listája: rögtön az első helyen szerepel a keresett könyv

könyvtár

  1. ábra: egy könyvtár keresőjének találati listája: nincs találat

coospace

  1. ábra: egy távoktatási rendszer keresőjének találati listája: a találatként megjelenő dokumentumokban valójában szerepel a keresett könyv, de a találati listában ez nem látszik rögtön, ehhez az eredményre rá kell klikkelni

Ahhoz, hogy erre a három kérdésre (illetve később majd a diákjaink sok-sok kérdésére) válaszolni tudjunk, meg kell ismerkednünk azzal, hogyan is kezeli a számítógép a nyelvet. Ehhez először leírok hat, önállóan elvégzendő VIZSGÁLATOT (néhol több részletre bontva), amelyekkel tapasztalatokat kell gyűjteni a nyelvtechnológia mindennapi működéséről. Ezekre a tapasztalatokra hivatkozom majd a tankönyv szövegében. De előbb példákon keresztül illusztrálom, hogyan is okoskodik a számítógép, aztán más példákon keresztül, hogy hogyan is okoskodik a nyelvész, valamint hogy hogyan történik a nyelvelsajátítás, és kitérünk arra is, hogy mi a jelentés a számítógép számára. Ezután kerülnek szóba a vizsgálatok elvégzése során nyert tapasztalatok. Hogy miért érdemes mégis előre elvégezni a hat vizsgálatot? Mert az általuk megtapasztaltak segíteni fognak megérteni a számítógép okoskodásának, működésének leírását.

Lássuk tehát a VIZSGÁLATOKAT!