Abstract
Es wird ein inkrementeller Ansatz zur Koreferenzanalyse
deutscher Texte vorgestellt. Wir zeigen
anhand einer breiten empirischen Untersuchung,
dass ein inkrementelles Verfahren einem nichtinkrementellen
überlegen ist und dass jeweils die
Verwendung von mehreren Klassifizierern bessere
Resultate ergibt als die Verwendung von nur einem.
Zudem definieren wir ein einfaches Salienzmass,
dass annähernd so gute Ergebnisse ergibt wie ein
ausgefeiltes, auf maschinellem Lernen basiertes
Verfahren. Die Vorverarbeitung erfolgt ausschliesslich
durch reale Komponenten, es wird nicht - wie
so oft - auf perfekte Daten (z.B. Baumbank statt
Parser) zurückgegriffen. Entsprechend tief sind die
empirischen Ergebnisse. Der Ansatz operiert mit
harten linguistischen Filtern, wodurch die Menge
der Antezedenskandidaten klein gehalten wird. Die
Evaluierung erfolgt anhand der Koreferenzannotationen
der TüBa-D/Z.