Jékel Pál: Ady Endre összes költői műveinek fonémastatisztikája (Budapest, 1974)
I. Technikai megjegyzések a kötetről
"vektor" feliratú oszlop értékei az alább, a C) pont alatt tárgyalandó távolságlisták megalkotásához szükségesek. Ezek a számok a fonémák megoszlását a konkrét ciklus nagyságától független (normalizált) módon tükröző adatok, e funkciójukat tekintve tehát hasonlítanak a százalékos adatokra. (A százalék funkciója is az, hogy a fonémák megoszlását a konkrét ciklus nagyságától függetlenül reprezentálja.) Fontos végül megjegyezni, hogy mind ezeken a táblázatokon, mind a (iii) alatt tárgyalandókon, két idegen jel van: a [ahosszú i helyett és a_ (aláhúzás) a hosszú ü helyett. Csak a betűkar kicserélésén múlik, hogy a megfelelő lyukkombinációnak (ez a tartalmi, lényegi oldal) e két esetben is a szokásos magyar helyesírási jelek feleljenek meg. (iii) A csökkenő gyakoriság szerinti mutató. - Minden páratlan oldalon találunk egy-egy ilyen listát. Az egyes oszlopok értelme: a sorszám megmutatja, hogy a 66 szóba jöhető elem közül az illető elem előfordulási számát tekintve hányadik volt az adott szövegben. (A leggyakrabban például az e az 1. sorszámú, de nem egy esetben éppen az a 1-es és az e a 2-es stb.) Ezt követően a "hang" oszlop olyan értelmű, mint a (ii) alatt.Megjegyzendő csupán, hogy helykímélés céljából itt már sem sorszám szerint, sem másként nem soroljuk fel azokat a fonémákat, amelyek az adott szövegen belül nulla darabbal voltak képviselve, vagyis amelyekből nem volt egy sem.- A "db", illetőleg a "% " feliratú oszlop természetesen ugyanaz, mint a páros oldalon volt. Külön magyarázatra szorul viszont a "szumma db" és az ennek megfelelő "szumma % " feliratú két oszlop. Az előzőben mindig összeadjuk az addigiakat, az utóbbiban ezen összeg százalékát képezzük az összes fonémához. Ez az "összeadjuk az addigiakat" azt jelenti, hogy előbb vesszük az 1-es sorszámú, tehát leggyakoribb elemet - ha rögtön az elején, a teljes Adynál maradunk, a 3. lapról leolvashatóan ez az e a maga 55383-as darabszámával, ez önmagában 55383. A 2. alatt viszont már hozzáadjuk a 2. sorszám alatt szereplő a 50132-es darabszámát: az 105515, vagy az egész 19,09 %-a; azután a 3-as sorszámú darabszámát adjuk ehhez hozzá - és így tovább, egészen a legritkább fonémákig, melyekkel együtt az egész végül kiadja az 552788-at, vagyis az egész 100,00 %-át. - Ennek a listának részben az az értelme és haszna, hogy a sorszámból világossá válik: az adott szövegen belül melyik a leggyakoribb fonéma, melyik az ezt követő stb. Az egyes szövegek között összehasonlítást végezhetünk azon az alapon, hogy egy adott fonéma, például az a vagy az e mikor 1-es, mikor 2-es sorszámú, mikor kerül esetleg hátrébb. Másrészt e lista értelme éppen a "szumma db" és "szumma % " oszlopokban, a kumulált abszolút és százalékos értékek oszlopában van. Ezekből ugyanis közvetlenül leolvasható, hogy a legelső, az első két, az első három stb. fonéma az egész szöveg hány százalékát tette ki. Hadd adjunk Ízelítőt ezen oszlopok hasznából már itt. Belőlük derül ki például egészen közvetlenül, hogy a) Gulyás Pál, József Attila, Juhász Ferenc érezhetően mélyhangúbb, mint Ady (nálunk ui. majdnem mindig az a és nem az e az 1-es sorszámú-, a többi magánhangzó esetében is többször előbb jön a mély, ezután a magasabb); hogy b) ha "zengőségen" a magánhangzók, a zöngés mássalhangzók és az ún. 18