Forschungsziele

Wir haben uns im CRETA e.V. zusammengeschlossen, da wir – obwohl über verschiedene Standorte verteilt – gemeinsam daran arbeiten, reflektierte Praktiken der Textanalyse in den Geistes- und Sozialwissenschaften zu entwickeln, zu untersuchen, zu beschreiben und zu verankern. Dabei sehen wir drei große und wiederkehrende Herausforderungen:

  1. Die Operationalisierung geisteswissenschaftlicher Fragestellungen und damit zusammenhängender Begriffe, also die formale und ggf. technische Umsetzung und Messbarmachung der Begriffe. Wir fassen darunter sowohl Fragen der operationalen Definition und manuellen Annotation bzw. Annotierbarkeit als auch Fragen der automatischen Erkennung. Viele Fragen stellen sich z.B. im Bereich der Qualitätssicherung bzw. Validierung von Operationalisierungen, die auch den Vergleich von Operationalisierungen ermöglichen würde. Hier fehlen noch allgemein anerkannte Strategien, die den Untersuchungsgegenständen gerecht werden. Auch die Re-Integration quantitativer Ergebnisse in hermeneutische Workflows und Arbeitsprozesse sorgt regelmäßig für neue Herausforderungen, denen es sich zu stellen gilt.
  2. Die problem-adäquate Nutzung der technischen Möglichkeiten: Für die maschinell unterstützte Textanalyse kann auf ein breites technisches Inventar von Möglichkeiten zurückgegriffen werden — von regelbasierten Systemen bis hin zu künstlichen neuronalen Netzen („deep learning“). Neben rein technische Anforderungen an die Performanz treten in den Digital Humanities aber weitere, die sich nicht direkt in Evaluationsmetriken abbilden lassen. Eine Transparenz/Interpretierbarkeit der Modelle etwa kann ‚blinde Flecken‘ der Modelle erkennen helfen, ist aber auch jenseits dessen für eine hermeneutische Einbindung zentral. Auch die Integration existierenden Wissens über die Domäne in die Modelle ist in vielen Fällen ein Desiderat.
  3. Die Auswirkungen des Einsatzes maschineller Verfahren für den geisteswissenschaftlichen Forschungsprozess für die Menschen, die ihn betreiben: Auch wenn Computer Beiträge zum Erkenntnisgewinn liefern, bleiben es Menschen, die den Erkenntnisgewinn haben, ihn formulieren und auch kommunizieren. Die dritte Herausforderung ist also die Interdisziplinarität als solche, wobei damit sowohl die Zusammenarbeit zwischen D- und H-Disziplinen gemeint ist als auch die Entwicklung von Lösungen über verschiedene H-Disziplinen hinweg. Auch die Frage, was eigentlich die Standardverfahren oder -werkzeuge mündiger Textwissenschaftler/innen sind, spielt hier eine Rolle, weil ihre Antwort mitentscheidet, welche Verfahren noch erklärungsbedürftig sind und welche nicht.

Projekte

An diesen drei großen Herausforderungen, die der Einsatz maschineller Verfahren in den Geistes- und Sozialwissenschaft mit sich bringt, arbeiten die Mitglieder von CRETA in unterschiedlichen konkreten Projekten.

QuaDramA:
Tracking Character Knowledge
Literatur digital erforschen
SANTA Systematic Analysis of Narrative Texts through Annotation
EvENT Evaluating Events in Narrative Theory
QUOTE Comprehensive Modeling of Conversational Contributions in Prose Texts
SEAT Strukturierte Emotionsanalyse in Text in verschiedenen Domänen