IDS-Logo
Startseite : : Organisationsstruktur : : Lexik : : Usuelle Wortverbindungen : : Wissenschaftlicher Ansatz

Wissenschaftlicher Ansatz

Theoretischer Rahmen/Forschungsperspektive

 Bislang existiert noch kein Basisinventar an Wortverbindungen des Deutschen auf der Basis sehr großer Korpora, was zu einer oft beklagten Fortschreibung tradierter, nicht immer am Usus orientierter phraseologischer Kernbestände, z. B. in Lehrwerken und Wörterbüchern, führt. Auch eine systematische Beschreibung von Wortverbindungen auf der Basis sprachlicher Massendaten und mit Hilfe einer elaborierten Empirie steht noch aus.

Das Projekt hat das Ziel, rekurrente Sprachgebrauchsmuster, wie sie sich u.a. in Kookkurrenzprofilen im hochfrequenten Bereich von sehr großen Korpora manifestieren, als usuelle Wortverbindungen linguistisch zu beschreiben. Ergebnisse dieser Arbeiten sollen zur linguistischen Mehrwort- und Konstruktionsforschung am IDS beitragen sowie für praxisnahe Bereiche von Nutzen sein.

Usuelle Wortverbindungen sind als konventionalisierte, kontextuell restringierte und vor allem pragmatisch motivierte syntagmatische Entitäten (funktionale Chunks) zu interpretieren. Die UWV-Komponenten können unterschiedliche Ausformungen haben, von der lexikalischen Wortform bis zur abstrakten Ausdrucksklasse. Folgenden zentralen Forschungsfragen wird dabei besonders nachgegangen: (i) Welcher Natur sind die korpusanalytisch zu ermittelnden Restriktionen, denen UWV unterliegen müssen, um sie von beliebig miteinander kombinierbaren Zeichenketten zu unterscheiden? (ii) Welche Abstraktionsstufen sind anzusetzen zwischen konkreten festen lexikalischen Ausprägungen einzelner Wortverbindungen einerseits und Konstruktionsmodellen, bei denen nur noch abstrakte Ausdrucksklassen in einer festen syntaktischen Struktur miteinander korrelieren, andererseits? (iii) Welche Interdependenz besteht zwischen den ermittelten Konstruktionsmustern und den mit ihnen realisierten pragmatischen Funktionen?

Methodisches Paradigma

Das Projekt folgt primär einem korpusgesteuerten Ansatz ('corpus-driven')  (verwandte Konzepte: Corpus Pattern Analysis CPA und Corpus Driven Linguistics CDL (u.a. Tognini-Bonelli 2001)). Im Mittelpunkt steht die qualitative Analyse vor allem solcher Phänomene des sprachlichen Usus, die zwar konstitutiv für einen angemessenen Sprachgebrauch sind, aber erst durch die Analyse großer Datenmengen hervortreten. Wir gehen von Kookkurrenzdaten aus, die mit Hilfe der statistischen Kookkurrenzanalyse (Belica 1995) ermittelt wurden. Die linguistische Interpretation erfolgt a posteriori. Dieser methodische Zugang unterscheidet sich von Ansätzen der automatischen Sprachverarbeitung dahingehend, dass unsere Befunde nicht einer weiteren automatischen Verarbeitung dienen sollen und daher nicht das Kriterium einer strenge Formalisierbarkeit erfüllen müssen. Unser korpusgesteuerter Ansatz unterscheidet sich aber auch von solchen Zugängen, bei denen das Korpus konsultiert wird, um a priori formulierte Hypothesen zu verifizieren ('corpus-based').

Für die Erarbeitung der lexikografischen Mehrwortartikel in OWID und der Kurzstudien in "Wortverbindungen online" kommen korpusgesteuerte und korpusbasierte Methoden gleichermaßen zur Anwendung.