Erweiterung des Datenbankangebots im Korpusgrammatik-Projekt

Datensatz zu zu-/dass-Komplementen, Datenbank zu attributiven Adjektiven, Genitivdatenbank (GenitivDB)

Im Projekt Korpusgrammatik der Abteilung Grammatik werden systematische korpusorientierte Untersuchungen zu Variationsphänomenen in Morphologie und Syntax durchgeführt, die die Grundlage für eine neue, "variationssensitive" Grammatik des Standarddeutschen bilden. Im Rahmen der einzelnen Untersuchungen zu den Phänomenen werden Daten extrahiert, inner- und außersprachliche Merkmale zu den Belegen annotiert und quantitativ ausgewertet. Die annotierten Daten werden online als durchsuchbare Ressourcen in grammis (Grammatisches Informationssystem) zur Verfügung gestellt: https://grammis.ids-mannheim.de/korpusgrammatik/6475

Kürzlich wurde das Angebot um zwei Datenbanken erweitert. Derzeit befinden sich drei Datenbanken im System:

  1. In der Genitivdatenbank (GenitivDB) lassen sich ca. 9.5 Millionen klassifizierte Korpusbelege zur starken Genitivmarkierung des Nomens finden. Darunter befinden sich ca. 7 Millionen Belege, die sich primär als Genitivnomen betrachten lassen. Die GenitivDB enthält zu jedem Beleg neben dem Satzkontext eine Reihe von Metadaten. Insgesamt werden über 80 Angaben morphologischer, lexikalischer, prosodischer, phonologischer und extralinguistischer Art erfasst.

  2. Der Datensatz zu zu-/dass-Komplementen enthält 7.685 Korpusbelege zur Alternation zwischen infiniten und finiten Satzkomplementen, die mit zu (infinit) bzw. dass (finit) eingeleitet werden. Die Belege sind danach klassifiziert, welchen Typ von Kontrollstruktur das im Matrixsatz enthaltene Verb prototypisch projiziert und daraufhin annotiert, ob zwischen einem nominalen Argument des Matrixprädikats und dem Subjekt des Komplementsatzes eine Koreferenzbeziehung besteht. Darüber hinaus sind v.a. Merkmale annotiert, die bekanntermaßen an der Etablierung bzw. Veränderung von Kontrollbeziehungen beteiligt sind (z.B. Passivierung des Matrix- bzw. Komplementsatzes). Hinzu kommen extralinguistische Metadaten zu Erscheinungsjahr, Medium, Register, Domäne, Region und Land.

  3. In der Datenbank zu attributiven Adjektiven finden sich 1.598 Belege zu artikellosen Nominalphrasen mit je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum. Der Datensatz enthält zu jedem Beleg neben extralinguistischen Metadaten wie Register und regionale Zuordnung auch Annotationen zur Phonologie, Morphosyntax, Semantik und Frequenz. Anhand dieser Annotationen lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen.

zum Vergrößen klicken