Das Paronymkorpus

In unserem Projekt werden alle Paronyme auf der Basis umfangreicher Sprachdaten untersucht. Dazu wurde ein spezielles Korpus (das sogennante ParonymKernKorpus) aufgebaut, das Texte aus dem Zeitraum von 1990 bis 2015 mit einem Umfang von ca. 2,3 Milliarden Textwörtern umfasst und auch als erstes lexikografische Korpus komplett der Öffentlichkeit zur Verfügung steht. Unser Ziel ist es, Paronyme im öffentlichen Sprachgebrauch zu analysieren. Konventionalisierter Sprachgebrauch ist besonders gut in redigierten Texten, wie z. B. in Zeitungen zu beobachten. Daher enthält das Korpus vor allem Zeitungstexte und Zeitschriften, von großen überregionalen bis hinzu kleineren regionalen Auflagen. Das Besondere an diesem Korpus ist:

  1. es ist öffentlich zugänglich und macht unsere Arbeit damit transparent,
  2. es ist in seiner regionalen Verteilung relativ ausgewogen.

Diese Vorteile können erstmals für ein lexikografisches Projekt genutzt werden und wurden nur durch die kontinuierliche Textakquisition des IDS möglich.

Über das Korpusrecherchetool COSMAS II gelangen Sie zu unserem Korpus: https://cosmas2.ids-mannheim.de/cosmas2-web/

Die folgenden Quellen befinden sich im Paronymkorpus:

 

(Die Grafik wurde von David Liuzzo erstellt, lizenziert unter  Creative-Commons-Lizenz und von Fr. Wiebke Schulte bearbeitet worden)

Das Paronymkorpus

Die leicht verwechselbaren Ausdrücke werden auf der Basis umfangreicher Sprachdaten untersucht. Speziell zu diesem Zweck wurde ein Korpus aufgebaut. Dieses steht in Kürze auch der Öffentlichkeit zur Verfügung. Da das Ziel des projekt die Dokumentation der paronyme im öffentlichen Sprachgebrauch ist, enthält es vor allem Zeitungstexte und Zeitschriften, sowohl überregionale als auch regionale.

 

Zwei Besonderheiten zeichnen das Paronymkorpus aus:

1. Es ist öffentlich zugänglich, unsere Beschreibungen werden somit transparent.

2. Es ist hinsichtlich der sprachregionalen Verteilung relativ ausgewogen.