Abstract
Die Verfügbarkeit von Parsern mit einem hohen Abdeckungsgrad weckt das Bedürfnis nach systematischer und breiter Evaluation der Leistungsfähigkeit dieser Programme. Um linguistisch interpretierbare Masse zu erhalten, schlagen wir eine selektive Methode vor, die relevante Analysemerkmale aus dem Parsebaum projiziert, misst und robusten Resultaten so ein robustes Messverfahren beistellt. Dies erlaubt mit vertretbarem Aufwand zwei Parser fürs Deutsche gegenüber einem syntaktisch annotierten Korpus zu evaluieren, obwohl alle drei Komponenten auf unterschiedlichen Grammatikmodellen beruhen.