Überarbeitung der Heads #41
raykyn
started this conversation in
Suggestions
Replies: 1 comment 1 reply
-
Beschluss vom 12.12.2024Das Konzept der Entitätenbeschreibung kann als System aus zwei Layern betrachtet werden. Einerseits ist jedes beschreibende Element einer grammatikalischen Kategorie zuzordnen: Head, Apposition, Attribute (Adjektivattribut, Genitivattribut, Präpositionalattribut, Relativsatz), Numeralia. Andererseits ist jedes beschreibende Element einer semantischen Kategorie zuzordnen ("durch welche Eigenschaft wird die Entität beschrieben?"), z.B. Eigenname, Beruf, Topographie, Familienbeziehung, etc. |
Beta Was this translation helpful? Give feedback.
1 reply
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
[aus interner Diskussion...]
Eine weitere Möglichkeit wäre es, das Konzept des Heads an sich in Frage zu stellen. Wenn wir die Kategorie "Head" auf dieselbe Ebene stellen wie "Attribute" und "Deskriptor", und nur als ein "beschreibendes Element" (mit wichtiger linguistischer und semantischer Bedeutung für die Spanne natürlich) interepretieren, wäre es möglich, folgendes zu tun:
"das Kloster zu Klingental" (ORG)
"Kloster" => head.type
"zu Klingental" => head.name
und analog dazu bei Personen:
"Der Schneider Hans Müller" (PER)
"Schneider" => head.occ
"Hans Müller" => head.name
Die Idee ist hier, dass wir enge Appositionen + Kerne der Nominalphrasen also als "head"-Elemente erfassen, aber sie semantisch trennen (occ, type, name). Laut Wikipedia können enge Appositionen und Kerne als "Kerngruppe" interpretiert werden, das würde quasi dieser Logik folgen. Wir haben durch dieses System semantische Konsistenz (sowohl in "Schneider Hans Müller" wie auch "Hans Müller, der Schneider" wird "Schneider" als OCC annotiert).
Wenn ich darüber nachdenke gefällt mir diese Option eigentlich sogar am besten. NAME als eine semantische Kategorie zu definieren bietet sogar den Raum um Unterkategorien zu definieren um die Herkunft des Namens festzuhalten. Z.B. könnte "zu Klingental" als NAME_LOC annotiert werden.
Speziell, und abweichend von den grammatischen Kategorien, wäre noch immer unsere Annotation von Organisationen, die durch ihre Mitglieder genannt werden.
"Die Pfleger des Predigerklosters"
"Die Herren zu Barfüssen"
"Die Frowen an den Steinen"
Ich denke weiterhin, dass es mehr Sinn macht, hier semantisch vorzugehen, und nicht die Nennung des Klosters weiter in der Nennung einer Gruppe zu verschachteln. Die vorgeschlagene Art heads zu setzen gäbe uns aber auch ohne Verschachtelung mehr Möglichkeiten, die Spanne zu annotieren.
"Die Pfleger des Predigerklosters"
"Pfleger" => head.repr
"Predigerkloster" => head.name;head.type (wir könnten hier festhalten, dass der Typ "Kloster" Teil desselben Tokens wie der Name ist)
Beta Was this translation helpful? Give feedback.
All reactions