Das 2-Ebenen-Modell #21
Closed
raykyn
started this conversation in
Suggestions
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
Vorschlag
Ich möchte in diesem Beitrag ein "2-Ebenen-Modell" zur Diskussion stellen. Dieses macht seit der Etablierung von Deskriptoren Sinn und kann (bis auf ein Problem, das ich gleich erläutern werde) auch super so adoptiert werden.
Die Idee ist, eine BeNASch-Annotation grundsätzlich als aus zwei Ebenen bestehend zu verstehen, die sich mehrfach wiederholen können.
Die Ebene 1 ist dabei die Erwähnungs- und Ereignisebene. Sie ist dadurch definiert, dass hier nur Erwähnungen (und zwar spezifisch Referenzen), Werte und Ereignisse annotiert werden können. Die erste solche Ebene stellt immer die Dokument- bzw. Satzebene dar, aber weitere solche Ebenen finden sich z.B. innerhalb von Deskriptoren. Diese Ebene ist mehr oder weniger bereits schon so definiert.
Die Ebene 2 ist hingegen die Beschreibungsebene. Auf dieser befinden wir uns, sobald wir eine Erwähnung (egal ob Attribut oder Referenz) annotieren. Die Beschreibungsebene definiert sich dadurch, dass auf ihr nur Heads, Attribute und Deskriptoren stehen können.
Die Ebenen wechseln sich nicht zwingend ab, denn ein Attribut innerhalb einer Referenz kann auch zwei Beschreibungsebenen nacheinander folgen lassen.
Vorteile
Strengere Regeln - Weniger Fehler:
Wenn auf der Ebene 2 nur Heads, Attribute und Deskriptoren zugelassen sind, ist es leichter, fehlerhafte Annotationen zu erkennen. Eine Referenz innerhalb einer Beschreibungsebene würde sofort auf eine vergessene Annotation hinweisen. Wir könnten auf der Beschreibungsebene sogar einen Annotationszwang vorschreiben, d.h. jedes Token darin muss Teil entweder des Heads, der Attribute oder der Deskriptoren sein. Ein Token, welches nicht darin ist, muss wohl vergessen worden sein und kann im Postprocessing identifiziert werden.
Einfachere Erklärungen / Einführung ins Schema:
Dieses Modell ist einfacher zu erklären als ein komplett offenes Modell, in dem sich auch jederzeit mal eine Referenz in einer anderen Referenz befinden kann.
Machine Learning:
Auch wenn es keine Priorität sein sollte, hilft diese zusätzliche Konsistenz in der Annotation uns voraussichtlich die ML-Modelle zu verbessern. (Daraus ist die Idee erwachsen ;-))
Probleme
Listen:
Die Stellung von Listen ist im Schema noch immer nicht abschliessend geklärt, aber sie nehmen schon jetzt die wichtige Funktion wahr, Attribute auf eine Konjunktivphrase beziehen zu können ("Hans und Fritz, die Müller"). Listen verhalten sich meistens wie Entitäten, in ihnen stehen aber direkt Referenzen, welche effektiv die Heads der Listen sind. Sie stellen daher einen Spezialfall der Ebene 1 dar und es wäre höchstens fraglich ob wir für Listen weitere Elemente definieren möchten um Heads der Listen speziell zu markieren.
Nominal- und Pronominalphrasen mit Erwähnungspräzisionen:
Dies trifft insbesondere bei Personen zu. Als Beispiel: "der Bürger zu Basel" enthält eine Referenz "Basel" direkt innerhalb der Nominalphrase, ohne dieses durch einen Deskriptor zu trennen. Dies würde gegen die oben vorgeschlagenen Regeln für Ebene 2 verstossen. Hier wäre sicher zu erwägen, ob der Phrase "zu Basel" nicht ohnehin eine spezielle Bedeutung zukommt, da sie direkt den Head modifiziert (oder sogar beinahe Teil des Heads ist?). Mögliche Lösungen, die ich sehen würde:
A) "zu Basel" als Deskriptor mit selbem Typus wie die Spanne selbst annotieren
B) Ein spezielles Element einführen, welche das Objekt der im Head beschriebenen Beziehung bezeichnet z.B. Target.
Auch bei Pronominalphrasen mit Erwähnungspräzisionen begegnet uns dieses Problem: "[...], das zinst 5 lb dem obgenannten Kloster". Sowohl Ereignis wie Referenzen und Werte stehen direkt in der Pronominalphrase und damit dort, wo die Beschreibungsebene sein sollte. Bei Attributiv-Pronominalphrasen frage ich mich aber sowieso des öfteren ob sie nicht einfach als Deskriptoren zu erfassen wären.
Beta Was this translation helpful? Give feedback.
All reactions