Linux I II III Res WN/TT NLTK BNC/XML XLE I
XLE
Nicolas Bellm
3. April 2008
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I
Inhalt
8 XLE IVorbereitungGrammatik IExkurs: LFGGrammatik IIParsen Dateien
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Vorbereitung
Vorbereitung und Starten
$ ssh -X ellaPassword:$ cd Vorkurs$ mkdir xle$ cd xle$ cp /home/public/skel.lfg deutsch.lfg$ . /resources/processors/parser/xle/setup$ emacs &
Offnen einer Datei
C-x C-f (zuerst Ctrl X und danach Ctrl F )˜/xle/deutsch.lfg ←↩
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Aufbau der XLE-Dateien
jede LFG-Datei besteht aus mindestens drei Teilen:CONFIG: hier konnen verschiedene Einstellungenvorgenommen werdenRULES: hier befinden sich die Phrasenstruktur-RegelnLEXICON: hier befindet sich das Lexikon
in diesem Vorkurs sind hauptsachlich die Teile RULES undLEXICON fur uns interessant.
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Phrasenstrukturregeln
Unterhalb von TOY GERMAN RULES (1.0)
S --> NP VP.NP --> (Det) N.VP --> V (NP).
Hinweise
Um die Textzeilen schon einzurucken, druckt M-q ( Alt Q )
Sollte irgendetwas im Emacs nicht so funktionieren, wie erwartet,druckt C-g ( Ctrl G ) um den momentanen Befehl abzubrechen
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Lexikon
Unterhalb von TOY GERMAN LEXICON (1.0)
der Det *.den Det *.
Student N *.Studenten N *.
arbeitet V *.arbeiten V *.
Erganzt noch die Artikel ”die“ und ”das“, die Nomina ”Studentin“ und
”Geschenk“ jeweils im Nominativ/Akkusativ im Singular/Plural, dasVerb ”sehen“ in der 3. Person Singular und Plural.
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Parsen von Satzen
Starten von XLE
C-x C-s ( Ctrl X und danach Ctrl S ) → speichern
C-x 2 ( Ctrl X und danach 2 ) → Bildschirm teilt sich
C-c C-f ( Ctrl C und danach Ctrl F ) → XLE wird gestartet
Parsen
create-parser deutsch.lfg→ LFG-Datei wird geladenparse {der Student arbeitet} → vier Fenster offnensich, im linken oberen ist die BaumansichtNun parst weitere Satze wie ”die Studentinnen arbeiten“, ”dieStudenten sehen die Studentinnen“, aber auch ”das Studentarbeiten“ und ”der Student arbeitet das Geschenk“ → was falltbei den beiden letzten Satzen auf?
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die Studentin
PRED StudentinDET +CASE nomNUM plGEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentinPRED Studentin
DET +CASE nomNUM plGEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentinPRED StudentinDET +
CASE nomNUM plGEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentinPRED StudentinDET +CASE nom
NUM plGEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentinPRED StudentinDET +CASE nomNUM pl
GEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentinPRED StudentinDET +CASE nomNUM plGEND f
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Studentin ↑=↓
PRED StudentinCASE nomNUM plGEND f
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die Student
PRED StudentDET +CASE nomNUM plGEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentPRED Student
DET +CASE nomNUM plGEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentPRED StudentDET +
CASE nomNUM plGEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentPRED StudentDET +CASE nom
NUM plGEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentPRED StudentDET +CASE nomNUM pl
GEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Exkurs: LFG
die StudentPRED StudentDET +CASE nomNUM plGEND ???
rrrrrrrrrrrrrrrr
LLLLLLLLLLLLLLLL
die ↑=↓DET +CASE nomNUM plGEND f
Student ↑=↓
PRED StudentCASE nomNUM plGEND m
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
F-Struktur (Regeln)
Unterhalb von TOY GERMAN RULES (1.0)
S --> NP: (ˆSUBJ) = ! (!CASE) = nom;VP: ˆ = !.
NP --> Det: ˆ = !;N: ˆ = !.
VP --> V: ˆ = !;(???).
Den Code fur das Akkusativ-Objekt durft ihr selbst erganzen.Beachtet, daß am Ende kein Semikolon stehen darf, da dieschließende Klammer schon das Ende des Ausdrucks kennzeichnet.
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
F-Struktur (Lexikon)
Unterhalb von TOY GERMAN LEXICON (1.0)
der Det * (ˆDET) = +(ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = m.
den Det * (ˆDET) = +(ˆCASE) = acc (ˆNUM) = sg (ˆGEND) = m.
die Det * (ˆDET) = +{ (ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = f| (ˆCASE) = acc (ˆNUM) = sg (ˆGEND) = f| (ˆCASE) = nom (ˆNUM) = pl (ˆGEND) = m[...]}
Student N * (ˆPRED) = ’Student’(ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = m.
arbeitet V * (ˆPRED) = ’arbeiten<(ˆSUBJ)>’(ˆSUBJ NUM) = sg..
Vervollstandigt noch die restlichen Worter!
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Aufgaben
Fugt noch ein Dativobjekt hinzu!Erganzt den unbestimmten Artikel im Singular (Plural)!
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Parsen von ganzen Dateien
Konsole und XLE-Shell
$ cp /home/public/testfile1 .$ mkdir output1% parse-testfile testfile1 -outputPrefix output1/$ cd output1$ ls$ less S1.pl
Aufgabe
Parst den ersten Satz (Der Student arbeitet) auf die herkommlicheArt und Weise und vergleicht die C-Struktur und F-Struktur mit demProglog-Output.Hinweis: In der Baumansicht konnt ihr euch mit dem p-Knopf(partials) den ganzen Baum anzeigen lassen.
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Deutsche Grammatik verwenden
Emacs beenden
C-x C-f ( Ctrl X und danach Ctrl F )
Konsole
$ cp /home/public/testfile2 .$ mkdir output2$ xle-german -noTk -e ’parse-testfile testfile2-outputPrefix output2/; exit’
$ cd output2$ less S1.pl
Nicolas Bellm XLE
Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien
Danke
Vielen Dankfur eure Aufmerksamkeit!
Nicolas Bellm XLE