IDS-Logo

Projektteam

Projektleitung

MitarbeiterInnen

Studentische MitarbeiterInnen

  • Nagehan Cetin
  • Oskar Jabs
  • Tanja Marx

Computerlinguistische Unterstützung


Assoziiertes Projekt

Univerbierung


Ehemalige MitarbeiterInnen

Doktorandin

Korpusgrammatik -

grammatische Variation im standardsprachlichen und standardnahen Deutsch


Projektbeschreibung, Projektziele

Aufgabe des Projekts sind systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax und die Dokumentation der Resultate in einer neuen, "variationssensitiven" Grammatik des Standarddeutschen. Aktuell befindet sich das Projekt in seiner Hauptphase, in der bereits die eigentliche Grammatik erarbeitet wird. Zurzeit werden Kapitel vorbereitet, die sich der Wortbildung, der Deklination und der Syntax der Nominalphrase widmen. Daneben wird kontinuierlich an der Erweiterung und optimalen Aufbereitung der Datenbasis gearbeitet hierzu gehören die Untersuchungen zur automatischen Register- und Domänenklassifikation der Korpustexte (vgl. Bildhauer/Schäfer im Ersch.).

Die aktuellen Arbeiten bauen auf der ersten, explorativen Phase des Projekts auf. In dieser wurden zunächst die theoretischen und methodologischen Grundlagen erarbeitet und eine geeignete Korpusbasis geschaffen (vgl. Bubenhofer/Konopka/Schneider 2013). Danach wurden passende korpuslinguistisch-statistische Analyseroutinen und Werkzeuge entwickelt und in Pilotstudien erprobt. Die Arbeiten sollten folgende Zielsetzungen möglich machen:

  • Deskription: Präzise Beschreibung grammatischer Phänomene auf der Basis großer Korpora.
  • Exploration: Aufdeckung bislang unerkannter grammatischer Muster und Generalisierungen.
  • Inferenz: Bereitstellung einer transparenten, quantitativ-statistischen Basis für die Validierung theoretischer Hypothesen.

In den Pilotstudien wurden Variationsphänomene verschiedener grammatischer Ebenen (Wortbildung, Morphologie, Syntax, Textgrammatik) behandelt. Alle relevanten Ergebnisse werden umfassend in Printpublikationen aufbereitet:

  • Pilotstudien zur Variation von Relativpronomina (u. a. Brandt/Fuß 2014, Brandt/Fuß (Manuskript))
  • Pilotstudien zur Variation der Subkategorisierung und Distribution von finiten vs. infiniten Komplementsätzen (u.a. Wöllstein 2015, Brandt (Manuskript))

Zu den evaluierten korpuslinguistischen Methoden gehören kanonische statistische Verfahren der Berechnung von Signifikanzen und Effektstärken, aber auch Techniken des maschinellen Lernens, wie sie sonst im Text- und Data-Mining zur Anwendung kommen. Grundlegende Verfahren, die sich standardisieren ließen, wurden im webbasierten Werkzeug KoGra-R (Hansen-Morath/Schmitz/Wolfer) bereitgestellt.


Ein Teil der bisherigen Projektergebnisse ist in der Komponente Korpusgrammatik von grammis 2.0 dokumentiert.