+ All Categories
Home > Documents > XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I...

XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I...

Date post: 14-Jul-2020
Category:
Upload: others
View: 7 times
Download: 0 times
Share this document with a friend
25
Linux I II III Res WN/TT NLTK BNC/XML XLE I XLE Nicolas Bellm 3. April 2008 Nicolas Bellm XLE
Transcript
Page 1: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I

XLE

Nicolas Bellm

3. April 2008

Nicolas Bellm XLE

Page 2: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I

Inhalt

8 XLE IVorbereitungGrammatik IExkurs: LFGGrammatik IIParsen Dateien

Nicolas Bellm XLE

Page 3: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Vorbereitung

Vorbereitung und Starten

$ ssh -X ellaPassword:$ cd Vorkurs$ mkdir xle$ cd xle$ cp /home/public/skel.lfg deutsch.lfg$ . /resources/processors/parser/xle/setup$ emacs &

Offnen einer Datei

C-x C-f (zuerst Ctrl X und danach Ctrl F )˜/xle/deutsch.lfg ←↩

Nicolas Bellm XLE

Page 4: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Aufbau der XLE-Dateien

jede LFG-Datei besteht aus mindestens drei Teilen:CONFIG: hier konnen verschiedene Einstellungenvorgenommen werdenRULES: hier befinden sich die Phrasenstruktur-RegelnLEXICON: hier befindet sich das Lexikon

in diesem Vorkurs sind hauptsachlich die Teile RULES undLEXICON fur uns interessant.

Nicolas Bellm XLE

Page 5: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Phrasenstrukturregeln

Unterhalb von TOY GERMAN RULES (1.0)

S --> NP VP.NP --> (Det) N.VP --> V (NP).

Hinweise

Um die Textzeilen schon einzurucken, druckt M-q ( Alt Q )

Sollte irgendetwas im Emacs nicht so funktionieren, wie erwartet,druckt C-g ( Ctrl G ) um den momentanen Befehl abzubrechen

Nicolas Bellm XLE

Page 6: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Lexikon

Unterhalb von TOY GERMAN LEXICON (1.0)

der Det *.den Det *.

Student N *.Studenten N *.

arbeitet V *.arbeiten V *.

Erganzt noch die Artikel ”die“ und ”das“, die Nomina ”Studentin“ und

”Geschenk“ jeweils im Nominativ/Akkusativ im Singular/Plural, dasVerb ”sehen“ in der 3. Person Singular und Plural.

Nicolas Bellm XLE

Page 7: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Parsen von Satzen

Starten von XLE

C-x C-s ( Ctrl X und danach Ctrl S ) → speichern

C-x 2 ( Ctrl X und danach 2 ) → Bildschirm teilt sich

C-c C-f ( Ctrl C und danach Ctrl F ) → XLE wird gestartet

Parsen

create-parser deutsch.lfg→ LFG-Datei wird geladenparse {der Student arbeitet} → vier Fenster offnensich, im linken oberen ist die BaumansichtNun parst weitere Satze wie ”die Studentinnen arbeiten“, ”dieStudenten sehen die Studentinnen“, aber auch ”das Studentarbeiten“ und ”der Student arbeitet das Geschenk“ → was falltbei den beiden letzten Satzen auf?

Nicolas Bellm XLE

Page 8: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die Studentin

PRED StudentinDET +CASE nomNUM plGEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 9: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentinPRED Studentin

DET +CASE nomNUM plGEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 10: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentinPRED StudentinDET +

CASE nomNUM plGEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 11: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentinPRED StudentinDET +CASE nom

NUM plGEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 12: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentinPRED StudentinDET +CASE nomNUM pl

GEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 13: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentinPRED StudentinDET +CASE nomNUM plGEND f

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Studentin ↑=↓

PRED StudentinCASE nomNUM plGEND f

Nicolas Bellm XLE

Page 14: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die Student

PRED StudentDET +CASE nomNUM plGEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 15: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentPRED Student

DET +CASE nomNUM plGEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 16: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentPRED StudentDET +

CASE nomNUM plGEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 17: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentPRED StudentDET +CASE nom

NUM plGEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 18: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentPRED StudentDET +CASE nomNUM pl

GEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 19: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Exkurs: LFG

die StudentPRED StudentDET +CASE nomNUM plGEND ???

rrrrrrrrrrrrrrrr

LLLLLLLLLLLLLLLL

die ↑=↓DET +CASE nomNUM plGEND f

Student ↑=↓

PRED StudentCASE nomNUM plGEND m

Nicolas Bellm XLE

Page 20: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

F-Struktur (Regeln)

Unterhalb von TOY GERMAN RULES (1.0)

S --> NP: (ˆSUBJ) = ! (!CASE) = nom;VP: ˆ = !.

NP --> Det: ˆ = !;N: ˆ = !.

VP --> V: ˆ = !;(???).

Den Code fur das Akkusativ-Objekt durft ihr selbst erganzen.Beachtet, daß am Ende kein Semikolon stehen darf, da dieschließende Klammer schon das Ende des Ausdrucks kennzeichnet.

Nicolas Bellm XLE

Page 21: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

F-Struktur (Lexikon)

Unterhalb von TOY GERMAN LEXICON (1.0)

der Det * (ˆDET) = +(ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = m.

den Det * (ˆDET) = +(ˆCASE) = acc (ˆNUM) = sg (ˆGEND) = m.

die Det * (ˆDET) = +{ (ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = f| (ˆCASE) = acc (ˆNUM) = sg (ˆGEND) = f| (ˆCASE) = nom (ˆNUM) = pl (ˆGEND) = m[...]}

Student N * (ˆPRED) = ’Student’(ˆCASE) = nom (ˆNUM) = sg (ˆGEND) = m.

arbeitet V * (ˆPRED) = ’arbeiten<(ˆSUBJ)>’(ˆSUBJ NUM) = sg..

Vervollstandigt noch die restlichen Worter!

Nicolas Bellm XLE

Page 22: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Aufgaben

Fugt noch ein Dativobjekt hinzu!Erganzt den unbestimmten Artikel im Singular (Plural)!

Nicolas Bellm XLE

Page 23: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Parsen von ganzen Dateien

Konsole und XLE-Shell

$ cp /home/public/testfile1 .$ mkdir output1% parse-testfile testfile1 -outputPrefix output1/$ cd output1$ ls$ less S1.pl

Aufgabe

Parst den ersten Satz (Der Student arbeitet) auf die herkommlicheArt und Weise und vergleicht die C-Struktur und F-Struktur mit demProglog-Output.Hinweis: In der Baumansicht konnt ihr euch mit dem p-Knopf(partials) den ganzen Baum anzeigen lassen.

Nicolas Bellm XLE

Page 24: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Deutsche Grammatik verwenden

Emacs beenden

C-x C-f ( Ctrl X und danach Ctrl F )

Konsole

$ cp /home/public/testfile2 .$ mkdir output2$ xle-german -noTk -e ’parse-testfile testfile2-outputPrefix output2/; exit’

$ cd output2$ less S1.pl

Nicolas Bellm XLE

Page 25: XLE - Heidelberg University · 2008-04-03 · Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien Parsen von Satzen¨ Starten

Linux I II III Res WN/TT NLTK BNC/XML XLE I Vorbereitung Grammatik I Exkurs: LFG Grammatik II Parsen Dateien

Danke

Vielen Dankfur eure Aufmerksamkeit!

Nicolas Bellm XLE


Recommended