Header

UZH-Logo

Maintenance Infos

Inkrementelle Koreferenzanalyse für das Deutsche


Klenner, M; Tuggener, D; Fahrni, A (2010). Inkrementelle Koreferenzanalyse für das Deutsche. In: KONVENS 2010, Saarbrücken, 6 September 2010 - 8 September 2010, 37-46.

Abstract

Es wird ein inkrementeller Ansatz zur Koreferenzanalyse
deutscher Texte vorgestellt. Wir zeigen
anhand einer breiten empirischen Untersuchung,
dass ein inkrementelles Verfahren einem nichtinkrementellen
überlegen ist und dass jeweils die
Verwendung von mehreren Klassifizierern bessere
Resultate ergibt als die Verwendung von nur einem.
Zudem definieren wir ein einfaches Salienzmass,
dass annähernd so gute Ergebnisse ergibt wie ein
ausgefeiltes, auf maschinellem Lernen basiertes
Verfahren. Die Vorverarbeitung erfolgt ausschliesslich
durch reale Komponenten, es wird nicht - wie
so oft - auf perfekte Daten (z.B. Baumbank statt
Parser) zurückgegriffen. Entsprechend tief sind die
empirischen Ergebnisse. Der Ansatz operiert mit
harten linguistischen Filtern, wodurch die Menge
der Antezedenskandidaten klein gehalten wird. Die
Evaluierung erfolgt anhand der Koreferenzannotationen
der TüBa-D/Z.

Abstract

Es wird ein inkrementeller Ansatz zur Koreferenzanalyse
deutscher Texte vorgestellt. Wir zeigen
anhand einer breiten empirischen Untersuchung,
dass ein inkrementelles Verfahren einem nichtinkrementellen
überlegen ist und dass jeweils die
Verwendung von mehreren Klassifizierern bessere
Resultate ergibt als die Verwendung von nur einem.
Zudem definieren wir ein einfaches Salienzmass,
dass annähernd so gute Ergebnisse ergibt wie ein
ausgefeiltes, auf maschinellem Lernen basiertes
Verfahren. Die Vorverarbeitung erfolgt ausschliesslich
durch reale Komponenten, es wird nicht - wie
so oft - auf perfekte Daten (z.B. Baumbank statt
Parser) zurückgegriffen. Entsprechend tief sind die
empirischen Ergebnisse. Der Ansatz operiert mit
harten linguistischen Filtern, wodurch die Menge
der Antezedenskandidaten klein gehalten wird. Die
Evaluierung erfolgt anhand der Koreferenzannotationen
der TüBa-D/Z.

Statistics

Altmetrics

Downloads

250 downloads since deposited on 24 Jan 2011
12 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Conference or Workshop Item (Speech), refereed, original work
Communities & Collections:06 Faculty of Arts > Institute of Computational Linguistics
Dewey Decimal Classification:000 Computer science, knowledge & systems
410 Linguistics
Scopus Subject Areas:Physical Sciences > Software
Language:German
Event End Date:8 September 2010
Deposited On:24 Jan 2011 10:51
Last Modified:10 Mar 2022 08:10
ISBN:978-3-86223-004-4
OA Status:Green
  • Content: Accepted Version