Várhelyi Tamás (szerk.): Korunk technikája 1966 (Budapest, 1966)

Ambrózy Denise: Tanul az ember, tanul a gép

Nyelv és statisztika A gépi fordítás szükségessé tette a nyelv rendszerének új módszerekkel va­ló kutatását is. E módszerek közös vo­nása, hogy nem annyira a nyelv törté­neti fejlődésére, mint inkább élő sajá­tosságaira fordítanak figyelmet, és a törvényszerűségeket matematikai pon­tossággal, matematikai képletek segít­ségével fogalmazzák meg, hiszen a gép csak így értheti meg őket. (Strukturális, matematikai nyelvészet.) Az új kutatá­sok során egyre több olyan vizsgálatot végeznek, amelyekkel a nyelv bizonyos statisztikailag is jellemezhető sajátossá­gait igyekeznek feltárni. Vizsgálják, hogy melyik szó milyen gyakorisággal fordul elő a nyelvben, tanulmányozzák egy-egy szakterület vagy egy-egy szerző különleges szókincsét, hogy milyen gyakran fordul elő egy-egy betű, ho­gyan oszlanak meg a szavak hosszúság szerint stb. Hogy a statisztika valóban reális legyen, nagy terjedelmű szövegrészie­teket kell tanulmányozni. Erre a célra nyilvánvalóan sokkal alkalmasabb a gyors működésű számológép, mint az ember. A próbafelvételnek bizonyos szabvá­nyai is kialakultak. Sokszor csak „vakon” választanak ki bizonyos oldalakat, és rajtuk számlálják meg a szavakat, betű­ket stb. Máskor a találomra kijelölt oldalak első vagy utolsó tíz sorának szövegét elemzik.'S mind gyakrabban alkalmazzák ezen a területen a való­színűségszám ítást. Nagy érdeklődésre tarthatnak számot azok a számítások, amelyekkel egyes írók, költők stílusát jellemzik számsze­rű, statisztikai adatokkal. Hogy egy-egy író milyen szavakat használ gyakrabban, s milyeneket ritkábban, a rövid vagy a hosszabb mondatokat kedveli-e, mek­kora szavainak átlagos szótagszáma, valóban elárul egyet és mást a stílusáról. Az ilyen statisztikai vizsgálatok útján kapott adatok annyira jellemzőek lehet­nek, hogy kétes esetekben bizonyíték­ként is felhasználhatók a szerzőség mellett vagy ellen is. Az irodalomtörténet hasznát láthatja ennek. Gondoljunk csak századunk első éveire, amikor íróink nagy része újság­írói munkát is végzett, és cikkeik jelen­tékeny része névtelenül jelent meg. Kovalovszky Miklós például statisztikai úton vizsgálta, milyen névtelen cikkek köszönhetők Ady publicisztikai mun­kásságának. Számok vallanak József Attila költészetéről Wacha Imre ugyanilyen statisztikai alapon vizsgálta József Attila költői stílusát és — ami ezzel szorosan össze­függ — költői felfogásának változásait. József Attila egyik kedvelt szava a „csend — csönd”, amelyet hol egyik, hol másik alakjában használ. A „csend” formát mindig emelkedettebb, költő­­ibb, légiesebb hangulat, mondanivaló kifejezésére használja verseiben, a csönd forma jelentése viszont általában reáli­sabb, „konkrétabb” hangulatú. Wacha kimutatja, hogy József Attila költészetében 1921—23 között — tá­­gabb értelemben vett zsengéinek korá­ban —, a „csend” és a „csönd" formák használatában nagyjából egyensúly van, az útkeresés időszakában, 1924—27 között a „csönd” alak uralma figyelhető meg, 1928—34 között, a nagy proletár ver­sek korszakában pedig ismét a "csönd" szerepel nagyobb számban, míg végül József Attila életének utolsó szakaszában a „csend” jut túlsúlyba. Ugyanilyen jellemző adatokat szol­gáltat József Attila stílusának és költői felfogásának elemzéséhez az is, milyen arányban fordulnak elő verseiben az új, korábban a költészetben nem alkalma­zott, a poézis birodalmában jórészt 143

Next