UZH-Logo

Maintenance Infos

Zur Problematik der maschinellen Übersetzung von Nebensätzen zwischen den Sprachen Englisch und Deutsch


Mehl, S; Heidemann, B; Volk, M (1998). Zur Problematik der maschinellen Übersetzung von Nebensätzen zwischen den Sprachen Englisch und Deutsch. In: Evaluation of the Linguistic Performance of Machine Translation Systems. Proceedings of the Workshop at the KONVENS-98, Bonn, Germany, 1998 - 1998.

Abstract

Kommerziell verfügbare Maschinelle Übersetzungssysteme können auf den ersten Blick eine erstaunliche Vielzahl syntaktischer Konstruktionen verarbeiten. Erst eine detaillierte Analyse zeigt die spezifischen Defizite auf.

Wir haben deshalb eine spezielle Testsuite mit 384 Sätzen (226 EN -> DE, 158 DE -> EN) zusammengestellt, die jeweils unterschiedliche Nebensätze enthalten. Dazu gehören indirekte Aussagesätze und Fragesätze, Adverbialsätze, Relativsätze, sowie Infinitiv-, Partizipial- und Gerundium-Konstruktionen.

Nebensätze eignen sich für eine solche Untersuchung besonders gut, weil bei ihrer Übersetzung zahlreiche syntaktische Faktoren eine Rolle spielen. Dazu gehören:

* das Problem der Abgrenzung einer Konstituente
* das Problem der Funktionsbestimmung des Nebensatzes
* das Problem des syntaktischen Transfers in der Übersetzung

Da die Struktur und Funktion von Nebensätzen im Deutschen anhand äusserlicher Merkmale (Satzzeichen, Konjunktionen) deutlicher erkennbar ist als im Englischen, treten Probleme vor allem bei der Übersetzung vom Englischen ins Deutsche auf. Unsere Untersuchung behandelt deshalb vor allem diese Übersetzungsrichtung.

Untersucht wurden die PC-Systeme Langenscheidts T1 (GMS), Personal Translator Plus (IBM, von Rheinbaben & Busch), Power Translator (Globalink) und Systran (MySoft). Nur in wenigen Fällen scheinen bestimmte Konstruktionen allen Systemen gänzlich unbekannt zu sein (z.B. englische Partizipial-Nebensätze). Bei den anderen Fällen zeigt mindestens ein System, dass es prinzipiell möglich ist, dieses Phänomen korrekt zu behandeln. Die meisten Übersetzungsfehler beruhen auf fehlerhafter Abgrenzung des Nebensatzes vom Hauptsatz, Verwechslung der Nebensatztypen, fehlende semantische Analyse und im Bereich der Synthesefehler die fehlerhafte Wortstellung in der Zielsprache.

Kurz zusammengefasst erbrachte die Untersuchung die folgenden Ergebnisse:

1. Die schwierigsten Nebensatzkonstruktionen für die Übersetzungssysteme sind Infinitivkonstruktionen, partizipiale Adverbialsätze und Gerundien. Relativsätze werden gut übersetzt, auch wenn das Relativpronomen fehlt.
2. Von den untersuchten Systemen beherrscht Personal Translator Plus die meisten Nebensatzkonstruktionen. Langenscheidts T1 arbeitet sehr uneinheitlich, manchmal erstaunlich gut und manchmal vollkommen falsch.
3. Die Resultate der Nebensatz-Übersetzungen vom Deutschen ins Englische sind tendenziell besser als in der umgekehrten Richtung.

Abstract

Kommerziell verfügbare Maschinelle Übersetzungssysteme können auf den ersten Blick eine erstaunliche Vielzahl syntaktischer Konstruktionen verarbeiten. Erst eine detaillierte Analyse zeigt die spezifischen Defizite auf.

Wir haben deshalb eine spezielle Testsuite mit 384 Sätzen (226 EN -> DE, 158 DE -> EN) zusammengestellt, die jeweils unterschiedliche Nebensätze enthalten. Dazu gehören indirekte Aussagesätze und Fragesätze, Adverbialsätze, Relativsätze, sowie Infinitiv-, Partizipial- und Gerundium-Konstruktionen.

Nebensätze eignen sich für eine solche Untersuchung besonders gut, weil bei ihrer Übersetzung zahlreiche syntaktische Faktoren eine Rolle spielen. Dazu gehören:

* das Problem der Abgrenzung einer Konstituente
* das Problem der Funktionsbestimmung des Nebensatzes
* das Problem des syntaktischen Transfers in der Übersetzung

Da die Struktur und Funktion von Nebensätzen im Deutschen anhand äusserlicher Merkmale (Satzzeichen, Konjunktionen) deutlicher erkennbar ist als im Englischen, treten Probleme vor allem bei der Übersetzung vom Englischen ins Deutsche auf. Unsere Untersuchung behandelt deshalb vor allem diese Übersetzungsrichtung.

Untersucht wurden die PC-Systeme Langenscheidts T1 (GMS), Personal Translator Plus (IBM, von Rheinbaben & Busch), Power Translator (Globalink) und Systran (MySoft). Nur in wenigen Fällen scheinen bestimmte Konstruktionen allen Systemen gänzlich unbekannt zu sein (z.B. englische Partizipial-Nebensätze). Bei den anderen Fällen zeigt mindestens ein System, dass es prinzipiell möglich ist, dieses Phänomen korrekt zu behandeln. Die meisten Übersetzungsfehler beruhen auf fehlerhafter Abgrenzung des Nebensatzes vom Hauptsatz, Verwechslung der Nebensatztypen, fehlende semantische Analyse und im Bereich der Synthesefehler die fehlerhafte Wortstellung in der Zielsprache.

Kurz zusammengefasst erbrachte die Untersuchung die folgenden Ergebnisse:

1. Die schwierigsten Nebensatzkonstruktionen für die Übersetzungssysteme sind Infinitivkonstruktionen, partizipiale Adverbialsätze und Gerundien. Relativsätze werden gut übersetzt, auch wenn das Relativpronomen fehlt.
2. Von den untersuchten Systemen beherrscht Personal Translator Plus die meisten Nebensatzkonstruktionen. Langenscheidts T1 arbeitet sehr uneinheitlich, manchmal erstaunlich gut und manchmal vollkommen falsch.
3. Die Resultate der Nebensatz-Übersetzungen vom Deutschen ins Englische sind tendenziell besser als in der umgekehrten Richtung.

Additional indexing

Item Type:Conference or Workshop Item (Paper), refereed, original work
Communities & Collections:06 Faculty of Arts > Institute of Computational Linguistics
Dewey Decimal Classification:410 Linguistics
000 Computer science, knowledge & systems
Language:English
Event End Date:1998
Deposited On:22 Jun 2009 11:41
Last Modified:05 Apr 2016 13:15

Download

Full text not available from this repository.

TrendTerms

TrendTerms displays relevant terms of the abstract of this publication and related documents on a map. The terms and their relations were extracted from ZORA using word statistics. Their timelines are taken from ZORA as well. The bubble size of a term is proportional to the number of documents where the term occurs. Red, orange, yellow and green colors are used for terms that occur in the current document; red indicates high interlinkedness of a term with other terms, orange, yellow and green decreasing interlinkedness. Blue is used for terms that have a relation with the terms in this document, but occur in other documents.
You can navigate and zoom the map. Mouse-hovering a term displays its timeline, clicking it yields the associated documents.

Author Collaborations