+ All Categories
Home > Documents > UvA-DARE (Digital Academic Repository) De frequentie van … · Amsterdam: Pegasus. General rights...

UvA-DARE (Digital Academic Repository) De frequentie van … · Amsterdam: Pegasus. General rights...

Date post: 26-Feb-2019
Category:
Upload: trandang
View: 214 times
Download: 0 times
Share this document with a friend
25
UvA-DARE is a service provided by the library of the University of Amsterdam (http://dare.uva.nl) UvA-DARE (Digital Academic Repository) De frequentie van flexieklassen van het substantief in het Russisch Honselaar, W.J.J. Published in: To the point: Festschrift for Eric de Haard on the occasion of his 65th birthday Link to publication Citation for published version (APA): Honselaar, W. (2014). De frequentie van flexieklassen van het substantief in het Russisch. In W. Honselaar, J. Stelleman, & W. G. Weststeijn (Eds.), To the point: Festschrift for Eric de Haard on the occasion of his 65th birthday (pp. 119-142). (Pegasus Oost-Europese studies; No. 22). Amsterdam: Pegasus. General rights It is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons). Disclaimer/Complaints regulations If you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, stating your reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Ask the Library: http://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam, The Netherlands. You will be contacted as soon as possible. Download date: 26 Feb 2019
Transcript

UvA-DARE is a service provided by the library of the University of Amsterdam (http://dare.uva.nl)

UvA-DARE (Digital Academic Repository)

De frequentie van flexieklassen van het substantief in het RussischHonselaar, W.J.J.

Published in:To the point: Festschrift for Eric de Haard on the occasion of his 65th birthday

Link to publication

Citation for published version (APA):Honselaar, W. (2014). De frequentie van flexieklassen van het substantief in het Russisch. In W. Honselaar, J.Stelleman, & W. G. Weststeijn (Eds.), To the point: Festschrift for Eric de Haard on the occasion of his 65thbirthday (pp. 119-142). (Pegasus Oost-Europese studies; No. 22). Amsterdam: Pegasus.

General rightsIt is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s),other than for strictly personal, individual use, unless the work is under an open content license (like Creative Commons).

Disclaimer/Complaints regulationsIf you believe that digital publication of certain material infringes any of your rights or (privacy) interests, please let the Library know, statingyour reasons. In case of a legitimate complaint, the Library will make the material inaccessible and/or remove it from the website. Please Askthe Library: http://uba.uva.nl/en/contact, or a letter to: Library of the University of Amsterdam, Secretariat, Singel 425, 1012 WP Amsterdam,The Netherlands. You will be contacted as soon as possible.

Download date: 26 Feb 2019

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH Wim Honselaar

Inleiding In Janssen (te versch.) is onderzoek beschreven dat een relatie legt tussen frequen-tie van flexieverschijnselen bij Russische en Poolse substantieven en hun leerbaar-heid. Daarbij werd een onderscheid gemaakt tussen frequenties in algemeen taal-gebruik en in z.g. Child Directed Speech. Dit onderzoek is aanleiding voor het on-derhavige onderzoek, dat een gedetailleerd en systematisch beeld wil geven van de frequentie van flexieverschijnselen bij substantieven in algemeen, modern Russisch.

Bij frequentie kan men denken aan twee verschillende interpretaties: 1) Hoe frequent komt een bepaalde flexieklasse voor in de Russische woordenschat, ofwel: hoeveel verschillende woorden behoren tot de verschillende flexieklassen? 2) Hoe frequent komt een bepaalde flexieklasse in het taalgebruik voor, ofwel: hoe vaak leest of hoort men een vorm van een bepaalde flexieklasse?

Om de eerste vraag te beantwoorden kan men het aantal woorden binnen elke flexieklasse tellen; voor de tweede vraag moet een frequentiewoordenboek van het Russisch worden gebruikt. In het onderhavige artikel wordt een antwoord gezocht op de tweede vraag. Dit wordt gedaan op basis van het Grammaticaal woordenboek van de Russische taal van Zaliznjak (Зализняк 2003), het Groot Russisch-Neder-lands Woordenboek (Honselaar 2005) en het meest recente en omvangrijke woord-frequentieonderzoek van het Russisch, Ljaševskaja en Šarov (Ляшевская & Шаров 2009). In het onderstaande zal eerst een korte schets worden gegeven van de wijze waar-op de flexieklassen in het Grammaticaal Woordenboek en het Groot Russisch-Neder-lands Woordenboek zijn gecodeerd en hoe het gebruikte frequentiewoordenboek is gestructureerd. Vervolgens wordt beschreven hoe al deze data aan elkaar zijn ge-koppeld, waarna een analyse van het resultaat wordt gegeven.

WIM HONSELAAR

Het Grammaticaal Woordenboek van Zaliznjak Het Grammaticaal woordenboek omvat een retrograde geordende, geaccentueerde woordenlijst van het Russisch van ongeveer 110000 woorden en een aparte lijst van eigennamen (persoonsnamen, steden, gebergtes, rivieren, …) van ongeveer 8600 woorden. Elk van deze items is voorzien van een code voor de woordsoort, zoals adverbium en adjectief; bij substantieven wordt volstaan met een geslachts-aanduiding voor mann., vrouw. en onz. Bij substantieven wordt een code voor de flexieklasse gegeven en worden, zo nodig, bijzonderheden verstrekt betreffende onregelmatige vormen (bijv. 2pl. van кухня: кухонь), ontbrekende vormen (bijv. 2pl. bij мгла), speciale vormen (bijv. locatief-2 bij борт) en semantische en/of sti-listische explicatie.

De wijze van coderen die door Zaliznjak is ontwikkeld is uiterst systematisch en tot op zekere hoogte mnemonisch. Flexiecodes bestaan in principe uit een cij-fer en een letter, bijv. 1a, 3b, 4b, etc., waarbij het cijfer bepaald wordt door de gra-fische slotconsonant van een woord: - 1 = harde consonant - 2 = zachte consonant - 3 = gutturale consonant (г, к, х) - 4 = ruisklank (ж, ч, ш, щ) - 5 = ц - 6 = vocaal (behalve и) of й - 7 = и - 8 = ь De letter in een code geeft het accentpatroon aan: - a = stamaccent in sg. en pl. - b = eindaccent in sg. en pl. - b’ = als b, maar stamaccent in 5sg. - c = stamaccent in sg., eindaccent in pl. - d = eindaccent in sg., stamaccent in pl. - d’ = als d, maar stamaccent in 4sg. - e = stamaccent in sg. en in 1/4pl., eindaccent in overige vormen van pl.

120

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

- f = eindaccent in sg. en pl., maar stamaccent in 1/4pl. - f’ = als f, maar stamaccent in 4sg. - f” = als f, maar stamaccent in 5sg. - g = stamaccent, maar in pl. trekt het accent één lettergreep in de stam terug. De cijfer-letter-codes kunnen uitgebreid worden met allerlei extra codes in de vorm van letters, cijfers en symbolen.

“Geslacht” verwijst bij Zaliznjak zowel naar het “morfologisch” als het “syntac-tisch” geslacht. Wanneer die samenvallen, zoals bij книга, wordt volstaan met de code ж. 1a; wanneer er verschil is, zoals bij папа, wordt dat apart aangegeven: мо. жо.1a.1 Het Groot Russisch-Nederlands Woordenboek Het Groot Russisch-Nederlands Woordenboek maakt gebruik van deze Zaliznjak-codes maar met een aantal aanpassingen (Honselaar 2005: 1574-1579). Zo zijn veel ab-stracte symbolen omgezet in inzichtelijkere coderingen, bijv. het symbool ⊠, dat bij adjectiva aangeeft dat er geen korte vorm mannelijk bestaat (en dat de overige korte vormen moeilijk te vormen zijn), is in het woordenboek vervangen door kv.m. ø. Daarnaast zijn onregelmatige paradigmata omgezet in codes, bijv. bij чудо, dat bij Zaliznjak gecodeerd is als “с 1c (△ мн. чуд|еса', -е'с, -еса'м)”, d.w.z. onzijdig 1c met onregelmatige pluralisvormen met -ес-, wordt in het woordenboek de code 1c(s) gebruikt. In sommige gevallen is zelfs een nieuw cijfer ingevoerd, bijv. 9 voor het onregelmatige paradigma van дети.2 Frequentiewoordenboek Het frequentiewoordenboek van Ljaševskaja en Šarov (Ляшевская & Шаров 2009) is gebaseerd op het Nationaal Corpus van de Russische taal (Национальный корпус русского языка),3 dat op het moment van de frequentietelling 92 miljoen woord-vormen omvatte (Шаров & Ляшевская 2009: ii). Het frequentiewoordenboek is deels op internet beschikbaar; zie Tabel 1 voor de eerste regels daarvan:

121

WIM HONSELAAR

Lemma PoS Freq (ipm) R D Doc а conj 8198.0 100 97 32332 а intj 19.8 99 90 757 а part 6.1 59 79 128 а s 2.7 59 85 160 аа intj 1.5 47 80 68 а-а intj 17.8 79 74 627 ааа intj 1.1 37 78 61 а-а-а intj 6.7 76 79 325 а-а-а-a intj 0.8 35 82 54 Tabel 1: fragment van het frequentiewoordenboek

In de eerste kolom zijn de lemma’s genoteerd, de grondvorm van elk woord. Naast de kolommen Lemma en PoS (= Part of speech) staan de kolommen Freq (ipm) (= frequentie per miljoen tokens), R (= Range, het aantal segmenten van het cor-pus waarin het woord voorkomt), D (= de Juilland’s coëfficiënt, die aangeeft hoe gelijkmatig de frequentie van een woord over de verschillende segmenten van het corpus is) en Doc (= het aantal documenten waarin het betreffende woord voor-komt). Dat laatste kan van belang zijn om een onverwacht hoge frequentie van een bepaald woord te verklaren zoals bijvoorbeeld bij хоббит (Шаров & Ляшевская 2009: iv). De waarde van Doc geeft aan of het woord in veel teksten van het Natio-naal Corpus voorkomt; dat is bij хоббит niet het geval. De conclusie is dat хоббит in feite niet echt frequent is, maar alleen als gevolg van een paar specifieke teksten in het corpus.

De woorden in de frequentielijst zijn niet beaccentueerd; er wordt dus helaas geen onderscheid gemaakt tussen woorden als за'мок en замо'к. De letter ё is weer-gegeven als е. Verwerking van het Frequentiewoordenboek Als eerste bewerking is de frequentielijst van Ljaševskaja en Šarov gesorteerd op basis van de kolom PoS. Hierdoor kwamen alle substantieven bij elkaar te staan (code s), direct gevolgd door alle eigennamen (code s.PROP); tegelijk werd de ko-lom Lemma naar rechts verplaatst en een lege kolom X toegevoegd met het oog op verdere bewerkingen, zie Tabel 2. De kolommen R, D en Doc zijn verwijderd omdat ze in het onderhavige onderzoek geen rol spelen.

122

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

PoS Freq (ipm) X Lemma s 2.7 а s 4.9 абажур s 1.6 аббат s 0.9 аббатство s 3.5 аббревиатура s 2.7 абвер s.PROP 4.4 Абдулла Tabel 2: fragment van de op woordsoort gesorteerde frequentielijst

De aanwezigheid van eigennamen in de frequentielijst is van belang omdat deze veelvoorkomende sub-woordsoort flecteert als substantieven en dus bij het bepa-len van de frequentie van substantivische flexieklassen moet worden meegenomen. In het Russisch-Nederlands Woordenboek is deze subklasse echter – uiteraard – nauwelijks vertegenwoordigd.

Het aldus verkregen totale Frequentiebestand van substantieven en eigennamen omvatte 24468 lemma’s. Hun frequenties liepen uiteen van 3727,5 per miljoen voor het meest frequente woord, год, gevolgd door человек (2723,0), время (2015,7), дело (1412,1), жизнь (1389,8) en день (1258,4) tot 0000,4 per miljoen voor een groep van 1789 woorden, waaronder мамашка, девелопмент, фотобиеннале en жал-кость; frequenties lager dan 0000,4 per miljoen waren niet vermeld in de frequen-tielijst. Verwerking van het Groot Russisch-Nederlands Woordenboek Uit de computerbestanden van het Groot Russisch-Nederlands Woordenboek wer-den alle woorden geselecteerd die als substantief zijn gemarkeerd, dat wil zeggen als m., f. of n., al dan niet met de toevoeging an. voor “animate”. Hieronder be-vond zich een beperkt aantal eigennamen, die niet als zodanig waren gecodeerd maar als gewone substantieven. In het Woordenboekbestand werden ook de woor-den opgenomen die in de volgende druk toegevoegd zullen worden. Om het ontbreken van eigennamen in het Woordenboekbestand te compense-ren is de lijst van eigennamen uit het Grammaticaal woordenboek gedigitaliseerd en gesystematiseerd, en aangevuld met een bewerking van een lijst van mannelijke en vrouwelijke vadersnamen (site Путь Света), waardoor het gecodeerde Woor-

123

WIM HONSELAAR

denboekbestand kon worden uitgebreid met ongeveer 10000 eigennamen; bij woor-den uit de laatste bron zijn de Zaliznjak-codes handmatig toegevoegd. Na het elimi-neren van doublures omvatte het gecodeerde Woordenboekbestand 57495 woor-den. In Tabel 3 wordt hiervan een indruk gegeven: абонеме'нт m. 1a абони'рование n. 7a аборда'ж m. 4a абориге'н m.an. 1a абориге'нка f.an. 3*a аборти'вность f. 8a аборто'рий m. 7a абра'зия f. 7a Абра'м m.an. 1a Абра'мцево n. 1a / 0 pl. ? Tabel 3: fragment van het Woordenboekbestand

Een laatste bewerking hield in dat de linker kolom gekopieerd werd, dat de oorspron-kelijke kolom werd ontdaan van accenttekens en de cyrillische letter ё vervangen door een gewone e, zodat het Woordenboekbestand eruit kwam te zien als afgebeeld in Tabel 4: абонеме'нт абонемент m. 1a абони'рование абонирование n. 7a аборда'ж абордаж m. 4a абориге'н абориген m.an. 1a абориге'нка аборигенка f.an. 3*a аборти'вность абортивность f. 8a аборто'рий аборторий m. 7a абра'зия абразия f. 7a Абра'м Абрам m.an. 1a Абра'мцево Абрамцево n. 1a / 0 pl. ? Tabel 4: fragment van het Woordenboekbestand met extra kolom zonder accenten/ë Fusering van Frequentiebestand en Woordenboekbestand De volgende stap was om het aantal kolommen van het Frequentiebestand en het Woordenboekbestand gelijk te maken en ervoor te zorgen dat de kolom woord in beide bestanden op dezelfde plaats kwam. Daarna zijn ze verenigd in één bestand, het voorlopig Totaalbestand, en gesorteerd op grond van de kolom woord. Vervol-

124

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

gens werd dit bestand geladen in een speciaal ontwikkeld programma Regelfusie4 dat twee opeenvolgende regels samenvoegde tot één regel als de inhoud van woord identiek was. Dit proces is afgebeeld in Tabel 5 (vóór de fusie) en 6 (na de fusie): freq. woord+accent woord woordsoort flexiecode bijzonderheden Абаку'мовна Абакумовна f.an. 1*a абандо'н абандон m. 1a 0001.6 аббат абба'т аббат m.an. 1a аббати'са аббатиса f.an. 1a 0000.9 аббатство абба'тство аббатство n. 1a 0003.5 аббревиатура аббревиату'ра аббревиатура f. 1a аббревиа'ция аббревиация f. 7a 0003.7 Абрамов Tabel 5: fragment van het voorlopig Totaalbestand vóór de fusie freq. woord+accent woord woordsoort flexiecode bijzonderheden Абаку'мовна Абакумовна f.an. 1*a абандо'н абандон m. 1a 0001.6 абба'т аббат m.an. 1a аббати'са аббатиса f.an. 1a 0000.9 абба'тство аббатство n. 1a 0003.5 аббревиату'ра аббревиатура f. 1a аббревиа'ция аббревиация f. 7a 0003.7 Абрамов Tabel 6: fragment van het voorlopig Totaalbestand na de fusie

Het voorlopig Totaalbestand omvatte in totaal 57380 regels, waarvan sommige al-leen tekst uit het Woordenboekbestand bevatten (Абакумовна, абандон, аббатиса, аббревиация in Tabel 7), andere alleen tekst uit het Frequentiebestand (Абрамов), terwijl de overige regels informatie bevatten die zowel uit het Frequentiebestand als het Woordenboekbestand afkomstig was, zoals аббат, аббатство en аббревиатура. Het voorlopig Totaalbestand werd vervolgens gesorteerd op de kolom frequen-tie; toegepast op Tabel 6 leverde dat een rangschikking op als in Tabel 7:

125

WIM HONSELAAR

freq. woord+accent woord woordsoort flexiecode bijzonderheden Абаку'мовна Абакумовна f.an. 1*a абандо'н абандон m. 1a аббати'са аббатиса f.an. 1a аббревиа'ция аббревиация f. 7a 0000.9 абба'тство аббатство n. 1a 0001.6 абба'т аббат m.an. 1a 0003.5 аббревиату'ра аббревиатура f. 1a 0003.7 Абрамов Tabel 7: fragment van het voorlopig Totaalbestand, gesorteerd op frequentie

De 57380 regels omvatten 32912 woorden die alleen in het Woordenboekbestand voorkwamen (dat zijn dus woorden met een frequentie onder de 4 per miljoen) en 24468 die uit het Frequentiebestand kwamen, waarvan de meeste ook in het Woor-denboekbestand voorkwamen. Omdat alleen de laatste verzameling voor dit onder-zoek relevant is, is deze afgesplitst; zij wordt verder aangeduid als Totaalbestand. Toegepast op Tabel 7 levert dat Tabel 8 op: freq. woord+accent woord woordsoort flexiecode bijzonderheden 0000.9 абба'тство аббатство n. 1a 0001.6 абба'т аббат m.an. 1a 0003.5 аббревиату'ра аббревиатура f. 1a 0003.7 Абрамов Tabel 8: fragment van het opgeschoonde Totaalbestand

In het Totaalbestand van 24468 regels waren er 22910 gevallen waarin alle kolom- men (de kolom bijzonderheden niet meegerekend) gevuld waren. In Tabel 8 zijn dat аббатство, аббат en аббревиатура.5 Als de kolommen woordsoort, flexie-code en bijzonderheden leeg waren, betrof dat woorden die niet in het Woorden-boekbestand zaten; het ging om 1558 woorden, waaronder veel achternamen en afkortingen, zoals Абрамов in Tabel 8. Omdat we uiteindelijk de frequentie wil-den weten waarmee flexieklassen voorkomen, moesten de ontbrekende flexieklas-sen in de genoemde 1558 gevallen worden toegevoegd. Dat is handmatig gedaan.6

Voordat de opsplitsing in mannelijk, vrouwelijk en onzijdig kon worden ge-maakt, en vervolgens een analyse per flexieklasse, was nog een aantal bewerkingen noodzakelijk. Pluralia tantum hebben in het Woordenboekbestand de codering pl.t. als “woordsoort” en als flexieklasse een combinatie van geslacht + flexieklasse,

126

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

dus bij bijv. выборы resp. pl.t. en m.1a. Met het oog op een sorteerbare vulling van de kolom woordsoort is m.(an.), f.(an.) of n.(an.) naar een plaats vóór pl.t. gezet, zodat “woordsoortcodes” als m. pl.t. ontstonden; het voorbeeld выборы pl.t. | m.1a werd daardoor выборы m. pl.t. | 1a.

Samenstellingen die uit twee substantieven bestaan die beide geflecteerd wor-den, zoals баба-яга, zijn opgesplitst in een regel met het eerste woord en een regel met het tweede woord, beide met dezelfde frequentie als het samengestelde woord.

Achternamen zijn in Zaliznjaks woordenboek gemarkeerd met fam. in de kolom woordsoort, en in veel gevallen met een samengestelde code, bijv. m.an.1a ~ 0. Hiermee wordt bedoeld dat wanneer de betreffende naam voor mannen wordt ge-bruikt, de flexieklasse m.an.1a is en voor vrouwen f.an.0. Voor ons onderzoek is dit storend. Daarom is iedere achternaam in het Totaalbestand uitgesplitst in een achternaam voor mannen en een voor vrouwen, waarbij de frequentie is gedeeld, uitgaande van het idee dat achternamen net zo vaak voor mannen worden gebruikt als voor vrouwen; ook hier is het geslacht gekopieerd naar de kolom woordsoort. Tabel 9 en 10 geven daarvan een indruk: 0002.7 Ре'зник Резник fam. m.an.3a ~ f.an.0 0002.7 Дэ'вис Дэвис fam. m.an.1a ~ f.an.0 Tabel 9: fragment van het Totaalbestand met samengestelde codes

is omgezet in: 0001.35 Ре'зник Резник an. m. fam. 3a 0001.35 Ре'зник Резник an. f. fam. 0 0001.35 Дэ'вис Дэвис an. m. fam. 1a 0001.35 Дэ'вис Дэвис an. f. fam. 0 Tabel 10: fragment van het Totaalbestand met uitgesplitste samengestelde codes

In Tabel 10 is tevens te zien dat (on)bezieldheid in het Totaalbestand afgesplitst is en in een separate kolom geplaatst, waardoor ook deze categorie geteld kon worden.

Woorden die meerdere geslachten kennen, zoals сирота, zijn op vergelijkbare manier bewerkt, evenals woorden die verschillende accentposities kennen (met verschillende flexieklassen), zoals бро'ня f.2a en броня' f.2b, en woorden die zowel bezield als onbezield voorkomen. Indien stilistische varianten waren vermeld, is

127

WIM HONSELAAR

(zijn) alleen de neutrale variant(en) in aanmerking genomen, bijv. bij боль 8a / prof. 8e is alleen боль 8a behouden en bij грудь 8f”/ 8e alleen 8f”.

Na deze voorbereidingen was het Totaalbestand gereed voor sortering op ge-slacht en daarbinnen op flexiecode. Het Totaalbestand in cijfers In totaal omvatte het Totaalbestand na alle bewerkingen 26734 woorden. Eén woord was onbegrijpelijk (ребе)7, een ander had geen geslacht (шуры-муры) en zeven waren pluralia tantum zonder flexie en zonder geslacht (o.a. граффити). Met Excel zijn tellingen verricht voor geslacht en bezieldheid, zie Tabel 11. gesl. aantal percent. freq. bezield onbezield flexiekl. mann. 12989 48,5% 129876,8 5.651 (= 43,5%) 7.338 (= 56,5%) 130 vrouw. 9995 37,4% 107630,7 2.368 (= 23,7%) 7.627 (= 76,3%) 087 onz. 3741 14,0% 053094,4 39 (= 01,0%) 3.702 (= 99,0%) 073 geen gesl. 9 0,1% 000008,4 2 (= 22,2%) 6 (= 66,6%) - totaal 26734 100,0% 290610,3 8.060 (= 30,1%) 18.673 (= 69,9%) 290 Tabel 11: verdeling der geslachten, (on)bezieldheid en flexieklassen in het Totaalbestand

Uit Tabel 11 blijkt dat het mannelijk een groter aantal verschillende woorden (12989) en een hogere totaalfrequentie (129876,8) heeft dan het vrouwelijk (9995 resp. 107630,7), dat op zijn beurt aanzienlijk groter is dan het onzijdig (3741, resp. 53094,4). Bijna de helft van alle woorden is mannelijk (48,5%); iets meer dan een derde is vrouwelijk (37,4%), terwijl onzijdige woorden een zevende deel vormen (14,0%). Van de 26734 woorden zijn er 8060 “bezield” en 18673 “onbezield”; bij het woord ребе is dat niet te bepalen. Het totaal aantal onbezielde woorden is aanzien-lijk groter dan de bezielde; de verhouding is ongeveer 2:5 (8060 (= 30,1%) vs. 18673 (= 69,9%)). Onzijdige woorden zijn bijna altijd onbezield; er zijn bijna evenveel onbezielde mannelijke woorden als vrouwelijke, maar er zijn meer dan twee maal zoveel bezielde mannelijke woorden als vrouwelijke (5651 vs. 2368). Onbezielde woorden zijn bij het mannelijk talrijker dan de bezielde (7338 vs. 5651); de verhouding is ongeveer 9:7. Ook bij het vrouwelijk zijn er meer onbezielde dan bezielde woorden, maar hier is de verhouding sterker in het voordeel van de onbe-

128

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

zielde (7627 vs. 2368). Absoluut genomen zijn er overigens meer onbezielde vrou-welijke woorden dan mannelijke. Bij het onzijdig zijn er bijna geen bezielde woor-den; de verhouding tussen onbezield en bezield is 99:1 (3702 vs. 39).

Het mannelijk is met 130 klassen morfologisch ook het meest divers; het vrou-welijk en het onzijdig volgen op ruime afstand met 87 en 73 klassen.

Om duidelijkheid te krijgen in de frequenties van de verschillende flexieklassen per geslacht is een frequentielijst opgesteld waarin de drie klassen elk in aflopende frequentie zijn afgebeeld, zie Tabel 12, 13 en 14 voor resp. het mannelijk, vrouwe-lijk en onzijdig. In de kolom voorb. is telkens een voorbeeld gegeven. klasse mannelijk aant. bez. onbez. freq. voorb. 1a 5802 1719 4083 53312,0 член 3a 1917 0889 1028 14635,4 мальчик 1c(1) 0125 0032 0093 06855,9 директор 2a 0571 0325 0246 04979,1 писатель 3*a 0229 0040 0189 03114,1 порядок 1c 0088 0006 0082 03062,8 мир 1b 0181 0068 0113 02924,1 хвост 6a 0194 0080 0114 02657,1 случай 3b 0336 0166 0170 02526,2 враг 1e 0013 0002 0011 02193,1 год 5*a 0345 0304 0041 02047,5 владелец 4a 0240 0114 0126 01949,3 товарищ pron.1a 0516 0514 0002 01891,6 Хрущев 3*b 0343 0070 0273 01824,5 сапожок 0 0347 0177 0170 01818,6 СССР 2b 0102 0043 0059 01721,4 рубль 2*b 0013 0003 0010 01458,2 день 1c(2) 0002 0000 0002 01132,7 раз 4b 0133 0055 0078 01117,3 врач 7a 0107 0046 0061 01021,5 критерий 5*b 0055 0028 0027 01019,5 конец 1*b 0044 0013 0031 00998,6 угол 3c(1) 0024 0001 0023 00922,3 век 3c(j) 0001 0001 0000 00874,2 друг 1c(1)(2) 0001 0000 0001 00857,6 глаз f.1a 0093 0090 0003 00764,3 мужчина 1°a 0059 0059 0000 00688,5 крестьянин adj.1a 0113 0098 0015 00674,2 знакомый 3c 0013 0000 0013 00582,1 шаг

129

WIM HONSELAAR

f.3*a 0130 0130 0000 00580,8 дядюшка f.2a 0028 0028 0000 00577,5 Петя 2*a 0046 0009 0037 00512,7 уровень 3e 0005 0004 0001 00474,7 бог 2*e 0015 0002 0013 00445,9 парень 5a 0022 0009 0013 00413,3 месяц adj.4a 0069 0069 0000 00407,0 рабочий adj.3a 0088 0088 0000 00372,9 русский 6c 0010 0000 0010 00358,4 чай 8b 0001 0000 0001 00357,3 путь 2e 0018 0010 0008 00339,6 гость 1a(j) 0010 0004 0006 00338,0 брат f.4a 0020 0020 0000 00319,8 Саша 1*a 0019 0004 0015 00298,1 Павел 1c(j) 0002 0002 0000 00288,2 сын adj.1b 0044 0037 0007 00263,4 больной 4c(j) 0001 0001 0000 00262,9 муж 2c(1) 0033 0011 0022 00236,2 учитель 1a(2) 0023 0009 0014 00226,7 солдат 6c(1) 0001 0000 0001 00194,0 край f.3a 0060 0060 0000 00183,8 владыка 1°c(1) 0001 0001 0000 00154,6 господин 1e(2) 0001 0000 0001 00141,8 волос 1c(1)(ë) 0004 0000 0004 00128,2 счет 1b(ë) 0006 0004 0002 00124,9 Петр - 0020 0000 0020 00115,4 полстакана 1a[(2)] 0029 0013 0016 00115,4 помидор 1e(ë)(z) 0001 0001 0000 00110,2 черт f.1d 0004 0004 0000 00099,3 глава 2c(j) 0003 0003 0000 00098,6 князь 1a(z) 0001 0001 0000 00097,5 сосед 2f 0006 0003 0003 00092,4 конь 3°a 0040 0038 0002 00090,8 медвежонок f.1b 0014 0014 0000 00088,0 тамада f.2a(2) 0007 0006 0001 00087,4 батя f.6*d 0001 0001 0000 00085,2 судья 1g(j) 0004 0000 0004 00082,7 повод 5b 0018 0017 0001 00077,5 близнец 1d(j) 0004 0000 0004 00074,7 лист 4b(ë) 0011 0001 0010 00070,3 платеж 1*e 0001 0000 0001 00070,2 ветер 3*a(2) 0006 0001 0005 00064,3 валенок 3b(2) 0001 0000 0001 00062,0 сапог f.6*b 0001 0001 0000 00058,0 Илья

130

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

6*b 0005 0003 0002 00056,4 воробей f.4a(2) 0004 0004 0000 00047,1 магараджа 1b(1) 0003 0001 0002 00045,1 рукав 4e 0006 0000 0006 00042,5 обруч pron.1b 0016 0016 0000 00042,3 Кузьмин f.5a 0010 0010 0000 00033,1 умница f.4d' 0001 0001 0000 00028,4 душа f.2c(j) 0001 0001 0000 00026,9 дядя adj.2a 0005 0005 0000 00020,5 ближний 3*d(2) 0004 0000 0004 00019,1 глазок 1c(ë) 0001 0000 0001 00018,5 мед 4c(1) 0003 0002 0001 00017,9 сторож f.3d 0001 0001 0000 00017,8 слуга adj.1*a 0008 0008 0000 00015,8 влюбленный f.8e 0002 0002 0000 00013,5 сволочь 3*b[(2)] 0001 0000 0001 00012,6 носок 3d 0001 0001 0000 00011,7 казак 3d(j) 0003 0000 0003 00011,2 клок 3°d 0001 0001 0000 00010,4 щенок 6b 0005 0002 0003 00009,2 бугай 3c(1)(ë) 0001 0000 0001 00008,4 шелк 3b(1) 0004 0000 0004 00008,2 обшлаг n.3*a(1)(f) 0005 0000 0005 00008,1 домишко adj.3b 0005 0005 0000 00007,6 глухой f.8a 0004 0004 0000 00006,1 блядь 3*b(2) 0001 0000 0001 00006,0 чулок f.0 0001 0001 0000 00005,8 Ра 1*c(1) 0001 0000 0001 00004,8 промысел f.7a 0003 0003 0000 00004,8 пария pron.1c 0001 0001 0000 00004,2 Киров n.1*d 0001 0001 0000 00004,0 говно n.4a(1)(f) 0002 0002 0000 00003,9 дружище n.4a[(1)] 0004 0000 0004 00003,9 пожарище f.4b 0005 0005 0000 00003,7 чукча n.4a(1) 0004 0001 0003 00003,7 глазище 6*a 0002 0000 0002 00003,2 улей f.3*b 0001 0001 0000 00003,1 кишка adj.4b 0002 0000 0000 00002,8 старшой 4c 0002 0001 0001 00002,7 харч 5a(2) 0002 0000 0002 00002,7 герц n.0 0001 0001 0000 00002,3 …-Данченко 2e(ë) 0001 0000 0001 00001,7 желудь 9 0002 0002 0000 00001,7 дети-… n.6*a(2) 0001 0001 0000 00001,5 подмастерье

131

WIM HONSELAAR

f.3b 0002 0002 0000 00001,1 брюзга f.7b 0001 0001 0000 00001,0 судия f.2a[(2)] 0001 0001 0000 00000,9 тихоня 1°c(j) 0001 0001 0000 00000,8 шурин f.2*b 0002 0002 0000 00000,7 размазня 7b(3) 0001 0000 0001 00000,6 кий 7c 0001 0000 0001 00000,6 кий f.1f 0002 0002 0000 00000,6 голова 3a[(2)] 0001 0000 0001 00000,3 парсек f.2*a(2) 0001 0001 0000 00000,3 ровня f.2*d(2) 0001 0001 0000 00000,3 ровня f.6*a 0001 0001 0000 00000,3 каналья n.1b(1)(2) 0001 0001 0000 00000,1 трепло Tabel 12: frequenties van de flexieklassen van het mannelijk

Bij de mannelijke woorden komt klasse 1a veruit het meeste voor: met een frequen-tie van 53312,0 op een totaal van 129869,2 hebben de woorden van deze klasse dus een aandeel van niet minder dan ongeveer 41%. klasse vrouwelijk aant. bez. onbez. freq. voorb. 1a 1605 0272 1333 24401,6 газета 8a 1702 0025 1677 13749,9 связь 7a 1175 0031 1144 13298,5 Россия 3*a 2383 0514 1869 12883,4 установка 8e 0090 0011 0079 05759,6 часть 3a 0476 0096 0380 05143,6 собака 1d 0141 0009 0132 03616,6 страна 4a 0160 0055 0105 02390,0 тысяча 5a 0350 0199 0151 02257,8 улица 1f' 0010 0000 0010 02052,7 сторона 2a(2) 0009 0001 0008 02024,5 пеня 3f' 0005 0000 0005 01696,9 нога pron.1a 0500 0500 0000 01575,4 Бехтерева 2a[(2)] 0008 0005 0003 01473,5 тетя 1b 0145 0010 0135 01452,6 черта 0 0448 0336 0112 01437,8 фрейлейн 2a 0091 0052 0039 01370,3 неделя 1d' 0008 0000 0008 01333,0 вода 2b 0008 0001 0007 01294,7 заря 2*a 0059 0003 0056 00728,9 песня 6a 0046 0008 0038 00583,0 идея 1*a 0043 0035 0008 00539,3 кукла 1d(ë) 0012 0008 0004 00534,1 жена

132

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

3*e 0001 0000 0001 00512,4 деньги 2*d' 0002 0000 0002 00494,8 земля 6*b 0011 0001 0010 00415,1 статья 8*b' 0005 0001 0004 00368,3 ложь adj.1a 0082 0026 0056 00345,0 знакомая 4d' 0002 0001 0001 00328,4 душа 1*d 0005 0000 0005 00321,3 судьба 6*d 0003 0001 0002 00307,0 семья adj.3a 0091 0079 0012 00246,7 парикмахерская 1*d(ë) 0008 0003 0005 00241,8 весна 8f" 0009 0000 0009 00226,0 степь 1f 0015 0001 0014 00221,1 губа 8*e 0001 0000 0001 00178,6 церковь 3d 0013 0002 0011 00151,0 строка 2*b 0031 0003 0028 00136,2 Чечня 6*a 0019 0014 0005 00133,9 колдунья 1f(ë) 0002 0000 0002 00128,9 слеза 2*e 0001 0000 0001 00125,1 деревня 2e 0002 0000 0002 00114,4 доля adj.1b 0029 0008 0021 00108,3 кладовая 3b 0026 0006 0020 00097,7 тоска 3d' 0002 0000 0002 00065,9 дрога adj.4a 0015 0009 0006 00054,9 заведующая 4b 0021 0006 0015 00051,0 госпожа 3*b 0007 0001 0006 00047,7 тайга pron.1b 0016 0016 0000 00042,3 Фомина 6d 0002 0001 0001 00040,8 змея adj.3b 0007 0004 0003 00040,5 мастерская 3*d 0003 0000 0003 00037,5 доска 1*b 0007 0001 0006 00037,1 тьма 4f 0002 0000 0002 00035,8 свеча 3f(ë) 0001 0000 0001 00035,6 щека 3f 0005 0001 0004 00034,6 слега 3*f' 0001 0000 0001 00033,6 доска 2f 0002 0000 0002 00030,8 простыня m.1a 0004 0003 0001 00029,9 начмед 5*a 0003 0000 0003 00029,1 дверца 1e 0001 0000 0001 00027,7 похороны - 0015 0000 0015 00020,4 полтонны 2*d 0001 0000 0001 00019,4 петля 6b 0007 0002 0005 00018,5 колея 5*d 0001 0001 0000 00017,5 овца 1b(ë) 0003 0000 0003 00015,8 пелена adj.2a 0002 0000 0002 00009,6 передняя

133

WIM HONSELAAR

5*b 0006 0000 0006 00008,3 пыльца pron.6*a 0001 0000 0001 00007,7 третья 2*a[(2)] 0005 0000 0005 00006,8 пригоршня pron.6*b 0001 0000 0001 00006,0 ничья 4a(2) 0002 0001 0001 00004,8 чукча pron.1c 0001 0001 0000 00004,2 Кирова 3*f 0001 0000 0001 00002,9 серьга 7b 0003 0000 0003 00001,9 алия 8a(j) 0001 0000 0001 00001,9 гроздь 1*f 0001 0000 0001 00001,5 копна 2*a(2) 0002 0001 0001 00001,5 ровня 8e(ë) 0001 0000 0001 00001,4 щелочь 2*f 0001 0000 0001 00001,3 сопля 5b 0002 0000 0002 00001,2 маца 4d 0001 0000 0001 00001,1 межа m.4a 0002 0002 0000 00000,8 помреж 1f'(ë) 0001 0000 0001 00000,6 середа 3*a(1) 0001 0000 0001 00000,5 лычка 1*e 0001 0000 0001 00000,4 бубна 2*d(2) 0001 0001 0000 00000,2 ровня Tabel 13: frequenties van de flexieklassen van het vrouwelijk

Ook bij de vrouwelijke woorden is klasse 1a het meest frequent; hun aandeel is met 24401,6 echter veel bescheidener dan bij de mannelijke woorden, namelijk slechts ongeveer een kwart van het totaal van 102981,7. klasse onzijdig aant. bez. onbez. freq. voorb. 7a 2176 0002 2174 27547,7 отношение 1a 0538 0010 0528 08078,3 средство 1c 0014 0000 0014 04279,7 дело 8°c(ë) 0007 0000 0007 02487,6 время 0 0369 0003 0366 01601,7 шоу 1*d 0014 0000 0014 01105,6 письмо 5d 0004 0003 0001 00879,1 лицо adj.1a 0049 0005 0044 00843,9 прошлое 6*a 0180 0000 0180 00733,6 счастье 1b 0038 0002 0036 00655,9 большинство 2c 0004 0000 0004 00341,1 биополе 4a 0062 0005 0057 00296,2 чудовище 1c(s) 0003 0000 0003 00274,9 небо 1*d(ë) 0009 0000 0009 00270,4 стекло adj.4a 0026 0003 0023 00260,0 будущее 5*c 0001 0000 0001 00245,1 сердце

134

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

4f(1) 0001 0000 0001 00236,4 плечо 6*b 0035 0000 0035 00204,5 жилье 1d 0018 0000 0018 00182,6 вино 1g(j) 0001 0000 0001 00171,9 дерево 5a 0007 0000 0007 00171,5 солнце 1d(ê) 0009 0001 0008 00162,2 колесо 3*a(1) 0043 0002 0041 00156,8 окошко 3e(p) 0002 0000 0002 00152,6 око 1d(j) 0004 0000 0004 00130,3 крыло 1*a 0006 0000 0006 00121,9 кресло 3c 0001 0000 0001 00119,4 войско 5*d 0004 0000 0004 00118,4 кольцо 1*b 0003 0000 0003 00098,1 зло 3a(1) 0004 0000 0004 00086,7 яблоко 6*a(2) 0007 0000 0007 00083,4 платье 1*c 0001 0000 0001 00073,0 масло 1a(j) 0003 0000 0003 00060,1 колено 3a 0004 0000 0004 00058,7 благо 7b 0005 0000 0005 00058,6 бытие adj.3a 0005 0001 0004 00058,1 шампанское 3d(1) 0001 0000 0001 00057,4 молоко 1g(ë) 0001 0000 0001 00054,9 озеро 1a(z) 0001 0000 0001 00051,4 колено 2a 0001 0000 0001 00048,3 горе 3c(2) 0001 0000 0001 00043,0 облако 9 0001 0001 0000 00041,8 дитя 5*a 0008 0000 0008 00037,9 полотенце 3*b(1)(2) 0006 0000 0006 00036,0 очко 1*d(j) 0001 0000 0001 00035,9 дно adj.2a 0004 0000 0004 00035,6 среднее 6*d 0002 0000 0002 00033,3 ружье 8°c 0003 0000 0003 00032,3 семя 8°a(ë) 0001 0000 0001 00027,8 знамя adj.1b 0007 0000 0007 00025,1 второе 5*f 0001 0000 0001 00017,9 крыльцо 1c(n) 0001 0000 0001 00016,6 судно 3a(1)(2) 0003 0000 0003 00015,1 личико 5*a[(2)] 0008 0000 0008 00013,2 оконце 6*a[(2)] 0004 0000 0004 00011,2 подполье - 0007 0000 0007 00010,4 полнеба 5*b 0004 0000 0004 00006,9 словцо 7b(2) 0001 0000 0001 00006,5 острие 3*c(2) 0001 0000 0001 00005,6 облачко 5*c[(2)] 0001 0000 0001 00004,9 деревце

135

WIM HONSELAAR

2b 0001 0001 0000 00002,8 дите pron.6*a 0001 0000 0001 00002,6 третье adj.4b 0001 0000 0001 00002,4 чужое 5b 0002 0000 0002 00001,8 письмецо 1b(ë) 0001 0000 0001 00001,6 письмена 3*a(1)(2) 0001 0000 0001 00001,5 древко 3*d(1) 0001 0000 0001 00001,5 ушко 5*a(2) 0001 0000 0001 00001,2 болотце adj.3b 0001 0000 0001 00001,0 жаркое 1f 0002 0000 0002 00000,9 ярмо 3b 0001 0000 0001 00000,9 погранвойска 5*d(ë) 0001 0000 0001 00000,8 озерцо 6*d(2) 0001 0000 0001 00000,4 жнивье Tabel 14: frequenties van de flexieklassen van het onzijdig

Bij de onzijdige woorden neemt klasse 1a met 8078,3 de tweede plaats in. De meest voorkomende klasse is hier 7a, die een frequentie heeft van 27548,1, wat iets meer is dan de helft van het totaal van 53094,4.

Tot slot is een algemene frequentielijst opgesteld waarin de Tabellen 12, 13 en 14 zijn verenigd en vervolgens geordend op frequentie, zie Tabel 15. klasse aant. freq. m. 1a 5802 53312,0 n. 7a 2176 27547,7 f. 1a 1605 24401,6 m. 3a 1917 14635,4 f. 8a 1702 13749,9 f. 7a 1175 13298,5 f. 3*a 2383 12883,4 n. 1a 0538 08078,3 m. 1c(1) 0125 06855,9 f. 8e 0090 05759,6 f. 3a 0476 05143,6 m. 2a 0571 04979,1 n. 1c 0014 04279,7 f. 1d 0141 03616,6 m. 3*a 0229 03114,1 m. 1c 0088 03062,8 m. 1b 0181 02924,1 m. 6a 0194 02657,1 m. 3b 0336 02526,2 n. 8°c(ë) 0007 02487,6

f. 4a 0160 02390,0 f. 5a 0350 02257,8 m. 1e 0013 02193,1 f. 1f' 0010 02052,7 m. 5*a 0345 02047,5 f. 2a(2) 0009 02024,5 m. 4a 0240 01949,3 m. pron.1a 0516 01891,6 m. 3*b 0343 01824,5 m. 0 0347 01818,6 m. 2b 0102 01721,4 f. 3f' 0005 01696,9 n. 0 0369 01601,7 f. pron.1a 0500 01575,4 f. 2a[(2)] 0008 01473,5 m. 2*b 0013 01458,2 f. 1b 0145 01452,6 f. 0 0448 01437,8 f. 2a 0091 01370,3 f. 1d' 0008 01333,0 f. 2b 0008 01294,7

136

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

m. 1c(2) 0002 01132,7 m. 4b 0133 01117,3 n. 1*d 0014 01105,6 m. 7a 0107 01021,5 m. 5*b 0055 01019,5 m. 1*b 0044 00998,6 m. 3c(1) 0024 00922,3 n. 5d 0004 00879,1 m. 3c(j) 0001 00874,2 m. 1c(1)(2) 0001 00857,6 n. adj.1a 0049 00843,9 m. f.1a 0093 00764,3 n. 6*a 0180 00733,6 f. 2*a 0059 00728,9 m. 1°a 0059 00688,5 m. adj.1a 0113 00674,2 n. 1b 0038 00655,9 f. 6a 0046 00583,0 m. 3c 0013 00582,1 m. f.3*a 0130 00580,8 m. f.2a 0028 00577,5 f. 1*a 0043 00539,3 f. 1d(ë) 0012 00534,1 m. 2*a 0046 00512,7 f. 3*e 0001 00512,4 f. 2*d' 0002 00494,8 m. 3e 0005 00474,7 m. 2*e 0015 00445,9 f. 6*b 0011 00415,1 m. 5a 0022 00413,3 m. adj.4a 0069 00407,0 m. adj.3a 0088 00372,9 f. 8*b' 0005 00368,3 m. 6c 0010 00358,4 m. 8b 0001 00357,3 f. adj.1a 0082 00345,0 n. 2c 0004 00341,1 m. 2e 0018 00339,6 m. 1a(j) 0010 00338,0 f. 4d' 0002 00328,4 f. 1*d 0005 00321,3 m. f.4a 0020 00319,8 f. 6*d 0003 00307,0 m. 1*a 0019 00298,1

n. 4a 0062 00296,2 m. 1c(j) 0002 00288,2 n. 1c(s) 0003 00274,9 n. 1*d(ë) 0009 00270,4 m. adj.1b 0044 00263,4 m. 4c(j) 0001 00262,9 n. adj.4a 0026 00260,0 f. adj.3a 0091 00246,7 n. 5*c 0001 00245,1 f. 1*d(ë) 0008 00241,8 n. 4f(1) 0001 00236,4 m. 2c(1) 0033 00236,2 m. 1a(2) 0023 00226,7 f. 8f" 0009 00226,0 f. 1f 0015 00221,1 n. 6*b 0035 00204,5 m. 6c(1) 0001 00194,0 m. f.3a 0060 00183,8 n. 1d 0018 00182,6 f. 8*e 0001 00178,6 n. 1g(j) 0001 00171,9 n. 5a 0007 00171,5 n. 1d(ê) 0009 00162,2 n. 3*a(1) 0043 00156,8 m. 1°c(1) 0001 00154,6 n. 3e(p) 0002 00152,6 f. 3d 0013 00151,0 m. 1e(2) 0001 00141,8 f. 2*b 0031 00136,2 f. 6*a 0019 00133,9 n. 1d(j) 0004 00130,3 f. 1f(ë) 0002 00128,9 m. 1c(1)(ë) 0004 00128,2 f. 2*e 0001 00125,1 m. 1b(ë) 0006 00124,9 n. 1*a 0006 00121,9 n. 3c 0001 00119,4 n. 5*d 0004 00118,4 m. - 0020 00115,4 m. 1a[(2)] 0029 00115,4 f. 2e 0002 00114,4 m. 1e(ë)(z) 0001 00110,2 f. adj.1b 0029 00108,3 m. f.1d 0004 00099,3

137

WIM HONSELAAR

m. 2c(j) 0003 00098,6 n. 1*b 0003 00098,1 f. 3b 0026 00097,7 m. 1a(z) 0001 00097,5 m. 2f 0006 00092,4 m. 3°a 0040 00090,8 m. f.1b 0014 00088,0 m. f.2a(2) 0007 00087,4 n. 3a(1) 0004 00086,7 m. f.6*d 0001 00085,2 n. 6*a(2) 0007 00083,4 m. 1g(j) 0004 00082,7 m. 5b 0018 00077,5 m. 1d(j) 0004 00074,7 n. 1*c 0001 00073,0 m. 4b(ë) 0011 00070,3 m. 1*e 0001 00070,2 f. 3d' 0002 00065,9 m. 3*a(2) 0006 00064,3 m. 3b(2) 0001 00062,0 n. 1a(j) 0003 00060,1 n. 3a 0004 00058,7 n. 7b 0005 00058,6 n. adj.3a 0005 00058,1 m. f.6*b 0001 00058,0 n. 3d(1) 0001 00057,4 m. 6*b 0005 00056,4 f. adj.4a 0015 00054,9 n. 1g(ë) 0001 00054,9 n. 1a(z) 0001 00051,4 f. 4b 0021 00051,0 n. 2a 0001 00048,3 f. 3*b 0007 00047,7 m. f.4a(2) 0004 00047,1 m. 1b(1) 0003 00045,1 n. 3c(2) 0001 00043,0 m. 4e 0006 00042,5 m. pron.1b 0016 00042,3 f. pron.1b 0016 00042,3 n. 9 0001 00041,8 f. 6d 0002 00040,8 f. adj.3b 0007 00040,5 n. 5*a 0008 00037,9 f. 3*d 0003 00037,5

f. 1*b 0007 00037,1 n. 3*b(1)(2) 0006 00036,0 n. 1*d(j) 0001 00035,9 f. 4f 0002 00035,8 f. 3f(ë) 0001 00035,6 n. adj.2a 0004 00035,6 f. 3f 0005 00034,6 f. 3*f' 0001 00033,6 n. 6*d 0002 00033,3 m. f.5a 0010 00033,1 n. 8°c 0003 00032,3 f. 2f 0002 00030,8 f. m.1a 0004 00029,9 f. 5*a 0003 00029,1 m. f.4d' 0001 00028,4 n. 8°a(ë) 0001 00027,8 f. 1e 0001 00027,7 m. f.2c(j) 0001 00026,9 n. adj.1b 0007 00025,1 m. adj.2a 0005 00020,5 f. - 0015 00020,4 f. 2*d 0001 00019,4 m. 3*d(2) 0004 00019,1 m. 1c(ë) 0001 00018,5 f. 6b 0007 00018,5 m. 4c(1) 0003 00017,9 n. 5*f 0001 00017,9 m. f.3d 0001 00017,8 f. 5*d 0001 00017,5 n. 1c(n) 0001 00016,6 m. adj.1*a 0008 00015,8 f. 1b(ë) 0003 00015,8 n. 3a(1)(2) 0003 00015,1 m. f.8e 0002 00013,5 n. 5*a[(2)] 0008 00013,2 m. 3*b[(2)] 0001 00012,6 m. 3d 0001 00011,7 m. 3d(j) 0003 00011,2 n. 6*a[(2)] 0004 00011,2 m. 3°d 0001 00010,4 n. - 0007 00010,4 f. adj.2a 0002 00009,6 m. 6b 0005 00009,2 m. 3c(1)(ë) 0001 00008,4

138

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

f. 5*b 0006 00008,3 m. 3b(1) 0004 00008,2 m. n.3*a(1)(f) 0005 00008,1 f. pron.6*a 0001 00007,7 m. adj.3b 0005 00007,6 n. 5*b 0004 00006,9 f. 2*a[(2)] 0005 00006,8 n. 7b(2) 0001 00006,5 m. f.8a 0004 00006,1 m. 3*b(2) 0001 00006,0 f. pron.6*b 0001 00006,0 m. f.0 0001 00005,8 n. 3*c(2) 0001 00005,6 n. 5*c[(2)] 0001 00004,9 m. 1*c(1) 0001 00004,8 m. f.7a 0003 00004,8 f. 4a(2) 0002 00004,8 m. pron.1c 0001 00004,2 f. pron.1c 0001 00004,2 m. n.1*d 0001 00004,0 m. n.4a(1)(f) 0002 00003,9 m. n.4a[(1)] 0004 00003,9 m. f.4b 0005 00003,7 m. n.4a(1) 0004 00003,7 m. 6*a 0002 00003,2 m. f.3*b 0001 00003,1 f. 3*f 0001 00002,9 m. adj.4b 0002 00002,8 n. 2b 0001 00002,8 m. 4c 0002 00002,7 m. 5a(2) 0002 00002,7 n. pron.6*a 0001 00002,6 n. adj.4b 0001 00002,4 m. n.0 0001 00002,3 f. 7b 0003 00001,9 f. 8a(j) 0001 00001,9 n. 5b 0002 00001,8 m. 2e(ë) 0001 00001,7

m. 9 0002 00001,7 n. 1b(ë) 0001 00001,6 m. n.6*a(2) 0001 00001,5 f. 1*f 0001 00001,5 f. 2*a(2) 0002 00001,5 n. 3*a(1)(2) 0001 00001,5 n. 3*d(1) 0001 00001,5 f. 8e(ë) 0001 00001,4 f. 2*f 0001 00001,3 f. 5b 0002 00001,2 n. 5*a(2) 0001 00001,2 m. f.3b 0002 00001,1 f. 4d 0001 00001,1 m. f.7b 0001 00001,0 n. adj.3b 0001 00001,0 m. f.2a[(2)] 0001 00000,9 n. 1f 0002 00000,9 n. 3b 0001 00000,9 m. 1°c(j) 0001 00000,8 f. m.4a 0002 00000,8 n. 5*d(ë) 0001 00000,8 m. f.2*b 0002 00000,7 m. 7b(3) 0001 00000,6 m. 7c 0001 00000,6 m. f.1f 0002 00000,6 f. 1f'(ë) 0001 00000,6 f. 3*a(1) 0001 00000,5 f. 1*e 0001 00000,4 n. 6*d(2) 0001 00000,4 m. 3a[(2)] 0001 00000,3 m. f.2*a(2) 0001 00000,3 m. f.2*d(2) 0001 00000,3 m. f.6*a 0001 00000,3 f. 2*d(2) 0001 00000,2 m. n.1b(1)(2) 0001 00000,1

Tabel 15: algemene frequentielijst van mann., vrouw. en onz. flexieklassen

De tien meest frequente klassen zijn m.1a, n.7a, f.1a, m.3a, f.8a, f.7a, f.3*a, n.1a, m.1c(1), f.8e en f.3a. Tezamen tellen zij 17513 woorden, met een totale frequentie van 180522,3.

139

WIM HONSELAAR

Bij alle geslachten is te zien dat bij klassen die een groot aantal woorden omvat-ten, de totale frequentie ook hoog is: een groot aantal verschillende woorden bin-nen een bepaalde klasse correleert vrij hoog met een hoge totale frequentie van die klasse. De meest frequente klassen 1a en 7a bij het mannelijk en het onzijdig tellen dan ook beide het hoogste aantal woorden, resp. 5802 en 2175. Bij het vrouwelijk is klasse 8a met 1701 woorden echter groter dan de aanzienlijk frequentere klasse 1a, die slechts 1605 woorden telt. Er zijn nog meer opvallende uitzonderingen op deze correlatie tussen omvang en frequentie: – n.8°c(ë) telt slechts zeven woorden maar staat met een frequentie van 2487,6 op een zeer hoge vierde plaats; het veelgebruikte woord время is daar debet aan; – n.5d telt slechts vier woorden en staat met 879,1 op de zevende plaats, vooral door het frequente лицо; – m.1e scoort hoog met een frequentie van 2193,1, terwijl deze klasse een om-vang heeft van slechts veertien woorden, waaronder het frequente год. Andersom zijn er relatief omvangrijke klassen die toch niet erg hoog scoren qua frequentie, bijvoorbeeld m.3b, m.0, m._adj.1a, m._f.3*a, f.5a en f.0; deze klassen tellen veel laagfrequente woorden.

Uit Tabel 15 is al af te lezen dat woorden met stamaccent (accenttype a) de acht meest frequente klassen vormen. Wanneer we de accenttypen (a-g) apart bezien, zoals in Tabel 16, blijkt dat accenttype a over het geheel genomen ook verreweg het meest frequent is; het is ongeveer drie zo frequent als de typen b t/m g samen! Type g komt nauwelijks voor. accenttype freq. mann. vrouw. onz. a 214672,3 92576,8 83292,8 38802,7 c 024020,9 16093,5 00004,2 07923,2 b 020137,0 14891,7 04143,2 01102,1 d 010850,4 00362,1 07510,4 02977,9 e 010705,4 03833,2 06719,6 00152,6 f 004850,5 00093,0 04502,3 00255,2 g 000309,5 00082,7 00000,0 00226,8 geen accenttype 005055,9 01943,8 01458,2 01653,9 Tabel 16: frequentie van accenttypen

140

DE FREQUENTIE VAN FLEXIEKLASSEN VAN HET SUBSTANTIEF IN HET RUSSISCH

De rangorde van de frequentie der accenttypen verschilt per geslacht. Waar die voor alle geslachten samen a-c-b-d-e-f-g is, is die bij het mannelijk a-c-b-e-d-f-g, bij het vrouwelijk a-d-e-f-b-c-g en bij het onzijdig a-c-d-b-f-g-e.

Wanneer we de stamtypen (1-8) tezamen nemen, zie Tabel 17, blijkt dat stam-type 1 verreweg het meest frequent is; dit type is bijna net zo frequent als alle andere stamtypen tezamen (131919,9 vs. 153618,7). Type 3 komt op ruime afstand op de tweede plaats, direct gevolgd door type 7. De typen 4, 5 en 6 zijn het minst fre-quent, maar elk niet echt zeldzaam. stamtype freq. 1 (harde consonant) 131919,9 3 (gutturaal) 048250,7 7 (и) 041942,1 8 (ь) 023210,3 2 (zachte consonant) 018860,1 4 (ruisklank) 007945,0 5 (ц) 007406,2 6 (vocaal - behalve и - of й) 006004,3 Tabel 17: frequentie van stamtypen Conclusie De opzet van de codering van Zaliznjak doet in hoge mate recht aan de frequentie van flexieklassen in die zin dat frequente klassen ongecompliceerde codes hebben (zoals m./f._1a of n.7a) en weinig frequente klassen juist codes met modificaties (zoals f.2*d(2) of m._n.1b(1)(2)). Onder de tien meest frequente klassen zijn er slechts twee met modificatie: f.3*a en m.1c(1); onder de vijftig meest frequente klassen zijn er iets meer, te weten achttien, maar de grote meerderheid is ongecom-pliceerd. Er zijn echter ook klassen met ongecompliceerde codes die heel laag sco-ren, zoals n.1f, n.3b en m.7c. Qua verdeling van stamaccent en eindaccent zijn de resultaten van het onder-zoek globaal genomen vergelijkbaar met die van Janssen (te versch.); ook daar was stamaccent veel frequenter dan eindaccent; 87/88% vs. 13/12%, d.w.z. ongeveer 7:1. Als we alleen kijken naar de homogene accenttypen a/g en b liggen de verhou-dingen in ons onderzoek echter verder uit elkaar, te weten ongeveer 10:1. De an-

141

WIM HONSELAAR

dere accenttypen omvatten verschillende combinaties van stam- en eindaccent en zijn dan ook niet goed inpasbaar in de tegenstelling “stamaccent-eindaccent”. Al met al is het Russisch minder onregelmatig dan men bij eerste beschouwing zou denken! Universiteit van Amsterdam/ACLC Noten 1 ж., мо. en жо. staan voor resp. “vrouwelijk-niet-bezield”, “mannelijk-bezield” en “vrouwelijk-bezield”. 2 In de uitgave van 2003 is de codering nog zoals bij Zaliznjak; bij de volgende druk zal de code 1c(s) worden gebruikt, waardoor de body van het woordenboek minder belast zal zijn met morfolo-gische informatie; deze verhuist naar het Grammaticaal Compendium. Naast (s) worden gebruikt: (f) = vrouw. uitgangen als alternatief voor mann. uitgangen in sg., bijv. медведище, медведища / медведищи, медведищу /медведище, …; (j) = pl. met ‘j’, bijv. кол – колья; (n) = verlies van ‘n’ in pl., bijv. судно – суда; (p) = gutturaal in sg. wordt palataal in pl., bijv. око – очи; (z) = palatalisatie in pl., bijv. черт – черти. 3 Zie http://ruscorpora.ru. In het Russisch Nationaal Corpus zijn zowel geschreven als gesproken teksten opgenomen, waardoor van een gebalanceerde en representatieve steekproef van het Russisch kan worden gesproken. 4 Ik ben mijn collega Dirk J. Vet bijzonder erkentelijk voor het ontwikkelen van dit programma. 5 Op basis van deze bewerking kan worden nagegaan welke woorden kandidaat zijn om in het Groot Russisch-Nederlands Woordenboek opgenomen te worden, bijv. фитнесс-клуб, энергоноситель, эстроген, янтра. 6 Voor het geslacht van afkortingen en hun flexiecodes was Skljarevskaja (2004) zeer nuttig. 7 In de tekst van het Russisch Nationaal Corpus is deze vorm niet aangetroffen.

Bibliografie Зализняк, А.А. 2003. Грамматический словарь русского языка. Москва: Русские словари. Ляшевская, О.Н., С.А. Шаров 2009. Новый частотный словарь русской лексики, Электронная

версия издания: О.Н. Ляшевская, С.А. Шаров, Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). Москва: Азбуковник. Digitale versie op http://dict.ruslang.ru/freq.php

Национальный корпус русского языка, http://ruscorpora.ru Путь Света, http://www.waylux.ru/imena_otchestva.html Скляревская, Г.Н. 2004. Словарь сокращений современного русского языка. Москва: Эксмо. Шаров, С.А., О.Н. Ляшевская 2009. ‘Введение к частотному словарю современного русского

языка’. Digitale versie op http://dict.ruslang.ru/freq.php Honselaar, W. 2005. Groot Russisch-Nederlands Woordenboek. Amsterdam: Pegasus. Janssen, Bibi (te versch.) ‘Frequency effects on the acquisition of Polish and Russian gender morphology’.

142


Recommended