CUTE | Proceedings | Programm | Call for Submissions | Infos zur Einreichung | Wichtige Termine | Kontakt und Organisation | Datenmaterial

Call for Submissions

Konkret rufen wir dazu auf, gemeinsam an einem heterogenen Korpus zu arbeiten, in dem Entitätenreferenzen annotiert wurden (siehe unten). Das Korpus besteht aus:

  • Jeweils einer Rede aus insgesamt vier Parlamentsdebatten des Deutschen Bundestags (S. Leutheuser-Schnarrenberger am 28.10.99, A. Merkel am 16.12.04, A. Ulrich am 15.11.07 und A. Karl am 17.03.11)
  • Briefen aus Goethes Die Leiden des jungen Werther (Ausgabe von 1787) vom 4. Mai bis einschließlich 16. Juni
  • Dem Abschnitt Zur Theorie des Kunstwerks aus Adornos Ästhetischer Theorie
  • Den Bücher 3 bis 6 von Wolframs von Eschenbach Parzival (mittelhochdeutsch)

Auch wenn jede Textsorte ihre eigenen Besonderheiten hat, wurden alle nach einheitlichen Annotationsrichtlinien annotiert, die wir ebenfalls veröffentlichen und zur Diskussion stellen möchten.

Wir laden ein, Beiträge zu folgenden Aufgaben einzureichen:

  1. Automatische Erkennung von Entitätenreferenzen: Experimente zum automatischen Erkennen von Annotationen auf noch nicht annotierten Texten, mit regelbasierten und/oder statistischen Systemen
  2. Visualisierung von Entitätenreferenzen im Text: Visualisierungsmöglichkeiten zur (interaktiven) Exploration der vorhandenen oder neuer Annotationen
  3. Annotationsanalyse: Qualitative oder quantitative Analyse der vorhandenen Annotationen oder der Annotationsrichtlinien; Annotationsexperimente zur Anwendbarkeit der Richtlinien auf neue Texte
  4. Freestyle: Kreative Ideen, die sich nicht direkt einem der obigen Tasks zuordnen lassen

Beiträge zu Aufgabe 1 werden quantitativ evaluiert und im Wettbewerb mit den Evaluationsergebnissen der anderen Beiträge verglichen (Shared Task). Beiträge für die Aufgaben 2 bis 4 werden vom Organisationskomitee qualitativ evaluiert (Unshared Task).

Das Korpus sowie das Annotationsschema wurden vor dem Hintergrund von Fragestellungen aus Geistes- und Sozialwissenschaften zusammengestellt bzw. entwickelt. Die Einreichenden können diese Fragen miteinbeziehen (oder sich von ihnen inspirieren lassen), auch wenn das keine Voraussetzung für die Teilnahme ist.

  • Entitäten-Netzwerke
    • Wie sind unterschiedliche Personen innerhalb eines bestimmten Textkorpus verbunden?
    • Sind zentrale Figuren identifizierbar?
    • Wurden in Theodor W. Adornos Texten abstrakte Konzepte – wie Adorno es selbst forderte – hinreichend definiert bzw. in bestimmten Konstellationen eingeführt (und benutzt)?
  • Wie können Strukturen oder Netzwerke der Entitäten-Erwähnungen textübergreifend verglichen werden (auch unter Einbezug unterschiedlicher Sprachen)?
    • Wie unterscheiden sich beispielsweise die Figurenbeziehungen des deutschen Parzival von seiner französischen Vorlage oder von anderen Artusromanen?
    • Ist die Werther-Dreiecksbeziehung (Werther, Lotte, Albert) in Werther-Adaptionen identifizierbar, auch wenn die Namen anders lauten?
  • Tauchen Entitäten in sich wiederholenden Kontexten oder Kontextkategorien auf?
    • Wie relevant sind nationale, trans- oder internationale Organisationen in Parlamentsdebatten zu bestimmten Politikbereichen, wie z.B. der deutschen Außenpolitik?
    • Tauchen bestimmte Figuren-Erwähnungen (immer/oft/nie) in einem gesuchten thematischen Kontext auf?
  • Kommt es zu Interaktionen zwischen Entitäten desselben Typs bzw. typübergreifend?
    • Welche politischen Parteien neigen in politischen Debatten dazu, sich auf welche Organisationen zu beziehen?
    • Erscheinen manche Figuren (nur/immer) an bestimmten Orten?
  • Sind zu manchen der oben genannten Aspekte Veränderungen im Zeitverlauf feststellbar?
    • Sind manche (politische) Organisationen im parlamentarischen Diskurs vor oder nach einem Ereignis stärker präsent, z.B. im Zuge der Deutschen Wiedervereinigung?
    • Wie ändert sich der Kontext von Figuren-Erwähnungen innerhalb eines einzelnen Texts?