+ All Categories
Home > Documents > Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference...

Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference...

Date post: 31-Oct-2015
Category:
Upload: mediae-et-infimae-latinitas-polonorum-lexicon-utiliaque
View: 210 times
Download: 2 times
Share this document with a friend
Description:
Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French
Popular Tags:
45
Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French Nicolas Mazziotta Université de Liège/Universität Stuttgart, ILR COST Workshop, Cracovie, 25-26 avril 2013
Transcript
Page 1: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Base de Français MédiévalNouveau Corpus d’Amsterdam

Syntactic Reference Corpus of Medieval French

Nicolas Mazziotta

Université de Liège/Universität Stuttgart, ILR

COST Workshop, Cracovie, 25-26 avril 2013

Page 2: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Plan

IntroductionPlanSpécificités de l’ancien français

Base de Français Médiéval

Nouveau Corpus d’Amsterdam

Syntactic Reference Corpus of Medieval French

Page 3: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Spécificités de l’ancien français

Exemple

DesDès

lorslors

teà toi

toliprit

li anemisle Diable (sujet)

la veuela vue (objet)

« Dès cet instant, le Diable t’a dépouillé de ta vue » (Queste 190a, 1)

Principales caractéristiques

I Ancêtre du français (en simplifiant)I Ordre des mots exprime informations énonciatives plutôt que

syntaxiquesI Moins synthétique que le latin (vue classique)I Morphologie nominale pauvre et peu fiable

Page 4: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Spécificités de l’ancien français

Exemple

DesDès

lorslors

teà toi

toliprit

li anemisle Diable (sujet)

la veuela vue (objet)

« Dès cet instant, le Diable t’a dépouillé de ta vue » (Queste 190a, 1)

Principales caractéristiques

I Ancêtre du français (en simplifiant)I Ordre des mots exprime informations énonciatives plutôt que

syntaxiquesI Moins synthétique que le latin (vue classique)I Morphologie nominale pauvre et peu fiable

Page 5: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

IntroductionPlanSpécificités de l’ancien français

Base de Français MédiévalPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Nouveau Corpus d’AmsterdamPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions

Page 6: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS

I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)

I Serge Heiden, Alexei Lavrentiev, Sophie Prévost

ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers

AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)

Page 7: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS

I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)

I Serge Heiden, Alexei Lavrentiev, Sophie Prévost

ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers

AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)

Page 8: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

École Normale Supérieure Lyon – Laboratoire ICARUMR5191 ENS LSH / CNRS

I Base créée par Christiane Marchello-Nizia (dir. actuelle : CélineGuillot)

I Serge Heiden, Alexei Lavrentiev, Sophie Prévost

ÉtendueI 3.3 mill. occurrences-motsI de 842 à 1467I Domain d’oïl, genres variés, prose/vers

AnnotationsI Métadonnées fourniesI CATTEXI Discours cité (en cours)

Page 9: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Format : Métadonnées

<profileDesc><creation><name type="author">anonyme</name><title>Queste del saint Graal</title><date type="compo" when="1220-01-01" n="13">vers 1220</date><date type="compo_periode">ancien</date><date type="compo_sous_siecle" n="13_1">début</date><region type="dialecte_auteur">non_defini</region>

</creation><langUsage><language ident="fr" usage="100">. . .</language>

</langUsage><textDesc n="roman"><channel mode="w">manuscript</channel><constitution type="single"/><derivation type="original"/><domain type="litteraire"/>. . .<purpose type="narrative"/>

</textDesc>

Page 10: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Format : Textes

<p n="1"><lb n="1"/><s n="1" xml:id="s_fro_1">

<supplied resp="cmn" source="#ms_Z" reason="arraché"><w type="PRE" xml:id="w_fro_000001">A</w><w type="DETdef" xml:id="w_fro_000002">la</w><w type="NOMcom" xml:id="w_fro_000003">veille</w><w type="PRE" xml:id="w_fro_000004">de</w><w type="DETdef" xml:id="w_fro_000005">la</w><w type="NOMpro" xml:id="w_fro_000006">Pentecoste</w><lb n="2"/><w type="CONsub" xml:id="w_fro_000007">quant</w><w type="DETdef" xml:id="w_fro_000008">li</w><w type="NOMcom" xml:id="w_fro_000009">compaignon</w><w type="PRE" xml:id="w_fro_000010">de</w><w type="DETdef" xml:id="w_fro_000011">la</w><w type="NOMcom" xml:id="w_fro_000012">table</w><w type="ADJqua" xml:id="w_fro_000013">reonde</w>

Page 11: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation de l’interface web

FonctionnalitésI Concordances (mots, parties du discours)I Recherche syntaxique (données SRCMF)I GUI en ligne TXM (ANR Textométrie)

Page 12: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Accueil

Page 13: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Menu contextuel (sélection du corpus et des actions)

Page 14: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Concordance

Page 15: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Recherche syntaxique

Page 16: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Plusieurs couches d’annotation

Page 17: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

IntroductionPlanSpécificités de l’ancien français

Base de Français MédiévalPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Nouveau Corpus d’AmsterdamPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions

Page 18: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Universität Stuttgart

I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and

Martin-Dietrich Gleßgen

ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits

AnnotationsI POS DeesI POS TreeTagger

Page 19: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Universität Stuttgart

I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and

Martin-Dietrich Gleßgen

ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits

AnnotationsI POS DeesI POS TreeTagger

Page 20: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Universität Stuttgart

I Créateur : Antonijn Dees et Piet Van ReenenI Enrichi par Achim Stein (dir. actuel), Pierre Kuntsmann and

Martin-Dietrich Gleßgen

ÉtendueI ca 3 millions de motsI 11th-14th C.I Domaine d’oïlI Principalement littéraireI Quelques manuscrits

AnnotationsI POS DeesI POS TreeTagger

Page 21: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Format : Métadonnées

<subcorpusid="abe"deaf="JMeunAbC*". . .manuscritDees="Paris, Bibl. Nat., fr. 920"regionDees="Région parisienne"coefficientRegionDees="84 (Région parisienne)"dateMoyenneDees="1325*". . .vers="non"ponctuation="non"mots="18183"passage="intégral"commentairePhilologique="ms. Paris, BN fr. 920"qualite="ms3"sourceQualite="XG (éd.)"commentaireForme="243 ff."auteur="Jean de Meun"dateComposition="1280ca"dateManuscrit="1395ca" . . .>

Page 22: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Format : Textes

(simplifié)

<s line="178"><word pos="PREDET:a:obj:masc:sg" taggerpos="PREDET:a" lemma="a+le|le" >al</word><word pos="NOM:obj:masc:sg" taggerpos="NOM" lemma="jor">jor</word><word pos="PRE" taggerpos="PRE" lemma="de" >de</word><word pos="NOM:obj:femi:sg" taggerpos="NOM" lemma="pentecoste" >pentecouste</word><word pos="PROCON" taggerpos="PROCON" lemma="ni" >ne</word>

</s><s line="179"><word pos="PREDET:a:obj:femi:pl" taggerpos="PREDET:a" lemma="a+le|le" >as</word><word pos="NOM:obj:femi:pl" taggerpos="NOM" lemma="fait2|feste|festre" >festes</word><word pos="ADV" taggerpos="ADV" lemma="plus" >plus</word><word pos="ADJ:obj:femi:pl" taggerpos="ADJ" lemma="haut" >hautes</word>

</s>

Page 23: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation de l’interface web

FonctionnalitésI Concordances (mots, parties du discours)I GUI en ligne TWICI TigerSearch

Page 24: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Accueil

Page 25: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Requête

Page 26: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Référence

Page 27: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Concordance

Page 28: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

IntroductionPlanSpécificités de l’ancien français

Base de Français MédiévalPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Nouveau Corpus d’AmsterdamPrésentation généraleFormat

MétadonnéesTextes

Présentation de l’interface web

Syntactic Reference Corpus of Medieval FrenchPrésentation généraleModèle syntaxique dépendancielConnexions

Page 29: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 30: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieurs

I Ressources similaires mais pas identiquesI Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 31: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 32: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 33: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation commune

I annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 34: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentes

I démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 35: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)

I Note : impossible projeter automatiquement annotations syntaxiquesd’un corpus à l’autre

Page 36: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Présentation générale

Corpus de baseEnrichissement de la BFM et du NCA

Enrichissements antérieursI Ressources similaires mais pas identiques

I Descripteurs bibliographiques (titre, auteur, éditeur, etc).I Métadonnées spécifiques aux textes médiévaux (date de composition, du

manuscrit, lieu de rédaction, etc.)I annotations morphosyntaxiques (POS) des occurrences-mots.

I Ressources spécifiquesI NCA : lemmatisation automatique (TreeTagger)I BFM : discours direct en cours

Annotation communeI annotation syntaxique s’ajoute aux informations présentesI démarche unifiée (6= idiosyncrasie)I Note : impossible projeter automatiquement annotations syntaxiques

d’un corpus à l’autre

Page 37: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Modèle syntaxique dépendanciel

toli

des

lors te

li

anemis

la

veue

CIRC

CM

PL SUJ

OBJ

MO

D

MO

D

MO

D

Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée

I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)

I Autres niveaux : modifieur (Mod).

Page 38: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Modèle syntaxique dépendanciel

toli

des

lors te

li

anemis

la

veue

CIRC

CM

PL SUJ

OBJ

MO

D

MO

D

MO

D

Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée

I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)

I Autres niveaux : modifieur (Mod).

Page 39: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Modèle syntaxique dépendanciel

toli

des

lors te

li

anemis

la

veue

CIRC

CM

PL SUJ

OBJ

MO

D

MO

D

MO

D

Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée

I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)

I Autres niveaux : modifieur (Mod).

Page 40: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Modèle syntaxique dépendanciel

toli

des

lors te

li

anemis

la

veue

CIRC

CM

PL SUJ

OBJ

MO

D

MO

D

MO

D

Classes de dépendants pour l’afr.Relation étiquetée du nom de la fonction représentée

I Principaux dépendants du verbe :I sujet (abrégé Suj)I objet (Obj)I complément régi autre que l’objet (Cmpl)I attribut du sujet (AtSj)I circonstant (Circ)

I Autres niveaux : modifieur (Mod).

Page 41: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Page 42: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Textes centraux encodés en XML (NCA et BFM). Avec les annotations et laterminologie SRCMF = ressource primaire produite

Page 43: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Annotation sans tenir compte des annotations déjà présentes, mais en recou-rant aux éditions qui fondent les bases

Page 44: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

SRCMF fusionné à NCA et BFM pour exploitation

Page 45: Nicolas Mazziotta, Base de Français Médiéval, Nouveau Corpus d’Amsterdam, Syntactic Reference Corpus of Medieval French

Introduction Base de Français Médiéval Nouveau Corpus d’Amsterdam Syntactic Reference Corpus of Medieval French

Merci !www.srcmf.org


Recommended