Direktion und zentrale Forschung

Kontakt:
    <korpuslinguistik (at) ids-...>
 
Leitung:
    Dr. Marc Kupietz <kupietz (at) ids-...>
 
Wissenschaftliche Mitarbeiter:
    Cyril Belica <belica (at) ids-...>
    Dr. Harald Lüngen <luengen (at) ids-...>
    Rainer Perkuhn <perkuhn (at) ids-...>
 
Kooperationen:
    siehe hier
 
Ehemalige am Korpusaufbau beteiligte Mitarbeiter des IDS:
    siehe hier
 
Studentische Hilfskräfte:

  • Anna Konovalova
  • Theresa Sick

Korpora der geschriebenen Sprache

Aktuelles Korpusarchiv

Umfang

Das IDS begann Mitte der Sechzigerjahre mit dem Aufbau elektronischer Textkorpora. Der Umfang der Korpora hat sich seit 1992 von ca. 28 Millionen auf 28 Milliarden Textwörter im Jahre 2015 erhöht (das entspricht etwa 70 Millionen Buchseiten, wenn man durchschnittlich 400 Wörter/Seite zugrunde legt). Am Aufbau der weltweit größten Sammlung dieser Art waren viele Mitarbeiter beteiligt. Das Korpusarchiv wird fortlaufend erweitert und bestehendes Korpusmaterial im Sinne eines Qualitätsmanagements überarbeitet. Die Ergebnisse dieser Arbeiten werden in regelmäßigen Abständen veröffentlicht, indem sie an das Projekt COSMAS II übergeben werden (s. Release-Chronik).

Geographische Herkunft der DeReKo-Zeitungsquellen

Ähnlichkeitsbeziehungen unter den DeReKo-Quellen

Archivierte Korpora

Aus urheber- und lizenzrechtlichen Gründen ist leider ein kleiner Teil der archivierten Korpora von außerhalb des IDS unzugänglich. In den letzten Jahren konnte der Anteil jedoch auf unter 5% gesenkt werden. Generell dürfen die IDS-Korpora nur zu wissenschaftlichen, nichtkommerziellen Zwecken genutzt werden. Welche Möglichkeiten Ihnen dafür zur Verfügung stehen, erfahren Sie auf der Seite Hinweise zur Verfügbarkeit.

Sigle Name von bis Lizenz Tokens