Presse-Information, Juli 1999

Institut für Deutsche Sprache:
Zentrum für elektronische Texte

Mit Unterstützung des Ministeriums für Wissenschaft, Forschung und Kunst arbeiten drei bedeutende Einrichtungen in Baden-Württemberg bei dem Aufbau eines deutschen Referenzkorpus zusammen, d.h. einer großen Sammlung deutscher Texte, die elektronisch ausgewertet werden.

Das Institut für Deutsche Sprache (IDS), Mannheim, das Institut für Maschinelle Sprachverarbeitung (IMS) der Universität Stuttgart und das Seminar für Sprachwissenschaft (SfS) der Universität Tübingen, wollen gemeinsam eine elektronische Textsammlung verschiedener Textsorten aufbauen und erweitern, die den Entwicklungsstand der deutschen Gegenwartssprache dokumentiert. Das Vorhaben soll bis Ende 2001 abgeschlossen und die Daten zentral im IDS zugänglich sein. Gesammelt werden beispielsweise Zeitungstexte, Fachtexte und literarische Texte ab Mitte der Fünfzigerjahre. Diese Textsammlung soll in- und ausländischen Sprachwissenschaftlern als Materialgrundlage für Forschungsprojekte wie z. B. die Erstellung von Wörterbüchern und Grammatiken, Konzepte zur maschinellen Übersetzung und Beobachtungen über den Sprachgebrauch zur Verfügung stehen.

Mit dieser Datenbasis können Wörterbücher und Grammatiken für die Benutzer wirklichkeitsnah gestaltet werden, da sie den tatsächlichen Sprachgebrauch zur Grundlage haben.

Die Texte für den Korpusaufbau werden von Zeitungen, Fachzeitschriften, Verlagen, Unternehmen, politischen, gemeinnützigen und anderen öffentlichen Institutionen bezogen. Das Vorhaben ist darauf angewiesen, dass möglichst viele Einrichtungen Texte für diesen wissenschaftlichen, nicht-kommerziellen Zweck zur Verfügung stellen.

Schon jetzt kann das Institut für Deutsche Sprache mit dem Online-System COSMAS in über 400 Millionen Textwörtern recherchieren. Davon sind 60 Millionen über die Internetadresse <http://www.ids-mannheim.de/> unter dem Stichwort "Service" öffentlich verfügbar. Mit der Erweiterung der elektronischen Textsammlung kommt das IDS einer seiner Aufgaben als zentraler außeruniversitärer Einrichtung zur Erforschung und Dokumentation der deutschen Sprache in ihrem gegenwärtigen Gebrauch und in ihrer neueren Geschichte nach; Baden-Württemberg erweist sich mit der Kooperation der drei Institutionen als bedeutender Standort für moderne Sprachforschung.