Header

UZH-Logo

Maintenance Infos

Linguistisch unterstütztes Redigieren: Konzept und exemplarische Umsetzung basierend auf interaktiven computerlinguistischen Ressourcen


Mahlow, C. Linguistisch unterstütztes Redigieren: Konzept und exemplarische Umsetzung basierend auf interaktiven computerlinguistischen Ressourcen. 2011, University of Zurich, Faculty of Arts.

Abstract

Schreiben und Redigieren stellen hohe kognitive Anforderungen an Autoren. Selbst publizierte Texte sind nie ganz fehlerfrei. Für viele Fehler kann man die Entstehung rekonstruieren: Funktionen in Textbearbeitungsprogrammen sind zeichenbasiert und berücksichtigen nicht die Elemente und Strukturen der jeweiligen verwendeten Sprache. Autoren müssen ihre Redigierabsichten in eine lange, komplexe Folge solcher zeichenbasierten Funktionen übersetzen.

Editoren für Programmierer hingegen bieten seit langem sprachspezifische Editierfunktionen, die auf den Elementen und Strukturen der verwendeten Programmiersprache operieren. Diese Funktionen tragen dazu bei, das Ändern von Programmcode zu erleichtern und Fehler zu vermeiden.

In dieser Arbeit übertragen wir das Prinzip solcher sprachspezifischen Funktionen in Programmiereditoren auf Funktionen für die Bearbeitung natürlichsprachlicher Texte. Wir entwickeln das Konzept der linguistisch unterstützten Redigierfunktionen unter Berücksichtigung aktueller Erkenntnisse der Schreibforschung. Wir definieren Informations-, Bewegungs- und Modifikationsfunktionen, die auf Elementen und Strukturen natürlicher Sprache operieren. Solche Funktionen sollen Autoren entlasten und helfen, typische Fehler zu vermeiden.

Sprachspezifische Funktionen beruhen auf Methoden zur Erkennung und Bestimmung relevanter Elemente und Strukturen. Wir verwenden dazu computerlinguistische Ressourcen zur morphologischen Analyse und Generierung und zur automatischen Wortartenbestimmung. Die Evaluation verfügbarer Ressourcen ergibt, dass die Situation für die Behandlung des Deutschen nicht so vielversprechend ist, wie ursprünglich angenommen und üblicherweise in der Literatur dargestellt.

Unsere prototypische Implementierung linguistisch unterstützter Redigierfunktionen für die Bearbeitung deutscher Texte zeigt die Möglichkeiten und Grenzen des Konzepts unter Berücksichtigung der Leistungsfähigkeit heute verfügbarer computerlinguistischer Ressourcen und der Eigenschaften des Deutschen.



(english abstract)

Composing, revising, and editing are highly demanding tasks. Even in polished and published texts from professional writers we can observe errors and mistakes. For many errors, we can infer how they came to be: Word processors offer character-based functions only. These functions do not take into account elements and structures of the language the author is using. Authors are thus forced to translate their high-level goals into long and complex sequences of low-level character-based functions. Both the translation process and the execution of such sequences of functions are error-prone.

However, in text editors for programmers we find so-called language-aware editing functions. These functions operate on the elements and structures of a programming or mark-up language and help to avoid errors, as language-aware functions make revising and editing less tedious and error-prone.

We argue that the concept of language awareness can be transferred to writing natural language texts using word processors. We propose functions that take the structures of natural languages into consideration. We distinguish information functions, movement functions, and operations to support revising and editing. The design is based on current findings from writing research.

Language-aware editing functions rely on the recognition and categorization of relevant elements and structures with respect to a certain language. We use methods and resources from computational linguistics for morphological analysis and generation, and for part-of-speech tagging. When evaluating respective resources we face a rather disappointing situation: NLP resources for German are less suitable than assumed and less applicable for real-world applications than usually claimed in the literature.

Our prototypical implementation of language-aware functions for revising and editing of German texts serves as a proof of concept. The implementation illustrates opportunities and limits of current NLP resources for German.

Abstract

Schreiben und Redigieren stellen hohe kognitive Anforderungen an Autoren. Selbst publizierte Texte sind nie ganz fehlerfrei. Für viele Fehler kann man die Entstehung rekonstruieren: Funktionen in Textbearbeitungsprogrammen sind zeichenbasiert und berücksichtigen nicht die Elemente und Strukturen der jeweiligen verwendeten Sprache. Autoren müssen ihre Redigierabsichten in eine lange, komplexe Folge solcher zeichenbasierten Funktionen übersetzen.

Editoren für Programmierer hingegen bieten seit langem sprachspezifische Editierfunktionen, die auf den Elementen und Strukturen der verwendeten Programmiersprache operieren. Diese Funktionen tragen dazu bei, das Ändern von Programmcode zu erleichtern und Fehler zu vermeiden.

In dieser Arbeit übertragen wir das Prinzip solcher sprachspezifischen Funktionen in Programmiereditoren auf Funktionen für die Bearbeitung natürlichsprachlicher Texte. Wir entwickeln das Konzept der linguistisch unterstützten Redigierfunktionen unter Berücksichtigung aktueller Erkenntnisse der Schreibforschung. Wir definieren Informations-, Bewegungs- und Modifikationsfunktionen, die auf Elementen und Strukturen natürlicher Sprache operieren. Solche Funktionen sollen Autoren entlasten und helfen, typische Fehler zu vermeiden.

Sprachspezifische Funktionen beruhen auf Methoden zur Erkennung und Bestimmung relevanter Elemente und Strukturen. Wir verwenden dazu computerlinguistische Ressourcen zur morphologischen Analyse und Generierung und zur automatischen Wortartenbestimmung. Die Evaluation verfügbarer Ressourcen ergibt, dass die Situation für die Behandlung des Deutschen nicht so vielversprechend ist, wie ursprünglich angenommen und üblicherweise in der Literatur dargestellt.

Unsere prototypische Implementierung linguistisch unterstützter Redigierfunktionen für die Bearbeitung deutscher Texte zeigt die Möglichkeiten und Grenzen des Konzepts unter Berücksichtigung der Leistungsfähigkeit heute verfügbarer computerlinguistischer Ressourcen und der Eigenschaften des Deutschen.



(english abstract)

Composing, revising, and editing are highly demanding tasks. Even in polished and published texts from professional writers we can observe errors and mistakes. For many errors, we can infer how they came to be: Word processors offer character-based functions only. These functions do not take into account elements and structures of the language the author is using. Authors are thus forced to translate their high-level goals into long and complex sequences of low-level character-based functions. Both the translation process and the execution of such sequences of functions are error-prone.

However, in text editors for programmers we find so-called language-aware editing functions. These functions operate on the elements and structures of a programming or mark-up language and help to avoid errors, as language-aware functions make revising and editing less tedious and error-prone.

We argue that the concept of language awareness can be transferred to writing natural language texts using word processors. We propose functions that take the structures of natural languages into consideration. We distinguish information functions, movement functions, and operations to support revising and editing. The design is based on current findings from writing research.

Language-aware editing functions rely on the recognition and categorization of relevant elements and structures with respect to a certain language. We use methods and resources from computational linguistics for morphological analysis and generation, and for part-of-speech tagging. When evaluating respective resources we face a rather disappointing situation: NLP resources for German are less suitable than assumed and less applicable for real-world applications than usually claimed in the literature.

Our prototypical implementation of language-aware functions for revising and editing of German texts serves as a proof of concept. The implementation illustrates opportunities and limits of current NLP resources for German.

Statistics

Downloads

3990 downloads since deposited on 08 Aug 2011
666 downloads since 12 months
Detailed statistics

Additional indexing

Item Type:Dissertation
Referees:Hess M, Zock M
Communities & Collections:06 Faculty of Arts > Institute of Computational Linguistics
Dewey Decimal Classification:000 Computer science, knowledge & systems
410 Linguistics
Uncontrolled Keywords:computational linguistics, writing research, authoring aids, writing processes
Language:German
Date:2011
Deposited On:08 Aug 2011 08:35
Last Modified:05 Apr 2016 14:58
Number of Pages:358
Related URLs:http://www.lingured.info

Download

Preview Icon on Download
Preview
Content: Published Version
Filetype: PDF
Size: 7MB

TrendTerms

TrendTerms displays relevant terms of the abstract of this publication and related documents on a map. The terms and their relations were extracted from ZORA using word statistics. Their timelines are taken from ZORA as well. The bubble size of a term is proportional to the number of documents where the term occurs. Red, orange, yellow and green colors are used for terms that occur in the current document; red indicates high interlinkedness of a term with other terms, orange, yellow and green decreasing interlinkedness. Blue is used for terms that have a relation with the terms in this document, but occur in other documents.
You can navigate and zoom the map. Mouse-hovering a term displays its timeline, clicking it yields the associated documents.

Author Collaborations