IDS-Logo

Projektteam

Projektleitung

MitarbeiterInnen

Studentische MitarbeiterInnen

  • Nagehan Cetin
  • Oskar Jabs
  • Anna Konovalova

Computerlinguistische Unterstützung


Ehemalige MitarbeiterInnen

Doktorandin

Korpusgrammatik -

grammatische Variation im standardsprachlichen und standardnahen Deutsch


Projektbeschreibung, Projektziele

Aufgabe des Projekts sind systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax und die Dokumentation der Resultate in einer neuen, "variationssensitiven" Grammatik des Standarddeutschen. Das Projekt befindet sich bereits in seiner Hauptphase, in der die eigentliche Grammatik erarbeitet wird. Zurzeit werden Kapitel verfasst, die sich der Wortbildung im Allgemeinen und der Syntax der Nominalphrase widmen. Daneben wird kontinuierlich an der Weiterentwicklung der korpuslinguistischen Methodik (vgl. Fuß/Konopka/Wöllstein (Hrsg.) im Ersch.) und an der Erweiterung und optimalen Aufbereitung der Datenbasis gearbeitet (vgl. etwa Bildhauer/Schäfer 2017).

Die aktuellen Arbeiten bauen auf der ersten, explorativen Phase des Projekts auf. In dieser wurden zunächst die theoretischen und methodologischen Grundlagen erarbeitet und eine geeignete Korpusbasis geschaffen (vgl. Bubenhofer/Konopka/Schneider 2013). Danach wurden passende korpuslinguistisch-statistische Analyseroutinen und Werkzeuge entwickelt und in Pilotstudien erprobt. Die Arbeiten sollten folgende Zielsetzungen möglich machen:

  • Deskription: Präzise Beschreibung grammatischer Phänomene auf der Basis großer Korpora.
  • Exploration: Aufdeckung bislang unerkannter grammatischer Muster und Generalisierungen.
  • Inferenz: Bereitstellung einer transparenten, quantitativ-statistischen Basis für die Validierung theoretischer Hypothesen.

In den Pilotstudien wurden Variationsphänomene verschiedener grammatischer Ebenen (Wortbildung, Morphologie, Syntax, Textgrammatik) untersucht. Alle relevanten Ergebnisse wurden umfassend in Printpublikationen aufbereitet:

  • Pilotstudien zu den V2- und dass-Sätze einbettenden Partizipien angenommen und vorausgesetzt (Volodina im Ersch.)

Zu den evaluierten korpuslinguistischen Methoden gehören kanonische statistische Verfahren der Berechnung von Signifikanzen und Effektstärken, aber auch Techniken des maschinellen Lernens, wie sie sonst im Text- und Data-Mining zur Anwendung kommen. Grundlegende Verfahren, die sich standardisieren ließen, wurden im webbasierten Werkzeug KoGra-R (Hansen-Morath/Schmitz/Wolfer) bereitgestellt.


Ein Teil der bisherigen Projektergebnisse ist in der Komponente Korpusgrammatik von grammis 2.0 dokumentiert.