Das 2-Ebenen-Modell #21

raykyn · 2024-05-15T09:47:27Z

raykyn
May 15, 2024
Maintainer

Vorschlag

Ich möchte in diesem Beitrag ein "2-Ebenen-Modell" zur Diskussion stellen. Dieses macht seit der Etablierung von Deskriptoren Sinn und kann (bis auf ein Problem, das ich gleich erläutern werde) auch super so adoptiert werden.

Die Idee ist, eine BeNASch-Annotation grundsätzlich als aus zwei Ebenen bestehend zu verstehen, die sich mehrfach wiederholen können.

Die Ebene 1 ist dabei die Erwähnungs- und Ereignisebene. Sie ist dadurch definiert, dass hier nur Erwähnungen (und zwar spezifisch Referenzen), Werte und Ereignisse annotiert werden können. Die erste solche Ebene stellt immer die Dokument- bzw. Satzebene dar, aber weitere solche Ebenen finden sich z.B. innerhalb von Deskriptoren. Diese Ebene ist mehr oder weniger bereits schon so definiert.

Die Ebene 2 ist hingegen die Beschreibungsebene. Auf dieser befinden wir uns, sobald wir eine Erwähnung (egal ob Attribut oder Referenz) annotieren. Die Beschreibungsebene definiert sich dadurch, dass auf ihr nur Heads, Attribute und Deskriptoren stehen können.

Die Ebenen wechseln sich nicht zwingend ab, denn ein Attribut innerhalb einer Referenz kann auch zwei Beschreibungsebenen nacheinander folgen lassen.

Vorteile

Strengere Regeln - Weniger Fehler:
Wenn auf der Ebene 2 nur Heads, Attribute und Deskriptoren zugelassen sind, ist es leichter, fehlerhafte Annotationen zu erkennen. Eine Referenz innerhalb einer Beschreibungsebene würde sofort auf eine vergessene Annotation hinweisen. Wir könnten auf der Beschreibungsebene sogar einen Annotationszwang vorschreiben, d.h. jedes Token darin muss Teil entweder des Heads, der Attribute oder der Deskriptoren sein. Ein Token, welches nicht darin ist, muss wohl vergessen worden sein und kann im Postprocessing identifiziert werden.

Einfachere Erklärungen / Einführung ins Schema:
Dieses Modell ist einfacher zu erklären als ein komplett offenes Modell, in dem sich auch jederzeit mal eine Referenz in einer anderen Referenz befinden kann.

Machine Learning:
Auch wenn es keine Priorität sein sollte, hilft diese zusätzliche Konsistenz in der Annotation uns voraussichtlich die ML-Modelle zu verbessern. (Daraus ist die Idee erwachsen ;-))

Probleme

Listen:
Die Stellung von Listen ist im Schema noch immer nicht abschliessend geklärt, aber sie nehmen schon jetzt die wichtige Funktion wahr, Attribute auf eine Konjunktivphrase beziehen zu können ("Hans und Fritz, die Müller"). Listen verhalten sich meistens wie Entitäten, in ihnen stehen aber direkt Referenzen, welche effektiv die Heads der Listen sind. Sie stellen daher einen Spezialfall der Ebene 1 dar und es wäre höchstens fraglich ob wir für Listen weitere Elemente definieren möchten um Heads der Listen speziell zu markieren.

Nominal- und Pronominalphrasen mit Erwähnungspräzisionen:
Dies trifft insbesondere bei Personen zu. Als Beispiel: "der Bürger zu Basel" enthält eine Referenz "Basel" direkt innerhalb der Nominalphrase, ohne dieses durch einen Deskriptor zu trennen. Dies würde gegen die oben vorgeschlagenen Regeln für Ebene 2 verstossen. Hier wäre sicher zu erwägen, ob der Phrase "zu Basel" nicht ohnehin eine spezielle Bedeutung zukommt, da sie direkt den Head modifiziert (oder sogar beinahe Teil des Heads ist?). Mögliche Lösungen, die ich sehen würde:
A) "zu Basel" als Deskriptor mit selbem Typus wie die Spanne selbst annotieren
B) Ein spezielles Element einführen, welche das Objekt der im Head beschriebenen Beziehung bezeichnet z.B. Target.

Auch bei Pronominalphrasen mit Erwähnungspräzisionen begegnet uns dieses Problem: "[...], das zinst 5 lb dem obgenannten Kloster". Sowohl Ereignis wie Referenzen und Werte stehen direkt in der Pronominalphrase und damit dort, wo die Beschreibungsebene sein sollte. Bei Attributiv-Pronominalphrasen frage ich mich aber sowieso des öfteren ob sie nicht einfach als Deskriptoren zu erfassen wären.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Das 2-Ebenen-Modell #21

Uh oh!

{{title}}

Uh oh!

Replies: 0 comments

Select a reply

Uh oh!

Das 2-Ebenen-Modell #21

Uh oh!

raykyn May 15, 2024 Maintainer

Vorschlag

Vorteile

Probleme

Replies: 0 comments

raykyn
May 15, 2024
Maintainer