IDS-Logo
Startseite : : Organisationsstruktur : : Lexik : : Abgeschlossene Projekte : : Historisches Korpus

Titelblatt der Berlinischen
Privilegirten Zeitung

vom 2. Februar 1737.

Historisches Korpus

Das Historische Korpus umfasst schwerpunktmäßig Texte des Zeitraums von 1700 bis etwa 1918 und ergänzt die im Projekt "Ausbau und Pflege der Korpora geschriebener Sprache" erstellten Korpora, die überwiegend das Deutsch von der Nachkriegszeit bis zur Gegenwart dokumentieren. 

Es bietet für Forschungen zur Grammatik und Lexik des Gegenwartsdeutschen eine historische Vergleichsgrundlage für die jüngere Vergangenheit seit dem 18. Jahrhundert. Insbesondere wird mit ihm den Wörterbuchprojekten des IDS  eine historische Quellenbasis geschaffen.

Das Historische Korpus ist in COSMAS II recherchierbar (Archiv HIST - Archiv der historischen Korpora) und enthält aktuell ca. 70.000.000 Textwörter. Aus urheberrechtlichen Gründen kann allerdings nur eine eingeschränkte Auswahl der Texte außerhalb des IDS zur Recherche angeboten werden.

Die Korpussigle für das Gesamtkorpus lautet HIST-gesamt - alle historischen Korpora des Archivs HIST. Es setzt sich aus folgenden Unterkorpora zusammen:

 

Sigle

Beschreibung

Wörter

hik

Querschnittkorpus mit Texten der Sach- und Gebrauchsliteratur (z.B. Wörterbuch- und Lexikonartikel, Zeitungen und Zeitschriften, wissenschaftliche Texte, Gesetzestexte)

3.375.610

dgb (db1, db2, db45)

Korpus auf der Basis von Textsammlungen aus der Reihe "Digitale Bibliothek". Unterkorpora:

  • db1: Deutsche Literatur von Lessing bis Kafka 
  • db2: Philosophie von Platon bis Nietzsche
  • db45: Deutsche Literatur von Frauen

57.487.072

marx (meg, mew, mwa)

Marx-Engels-Korpus. Unterkorpora:

  • meg: Korpus Marx-Engels-Gesamtausgabe (ausgewählte Texte)
  • mwe: Korpus Marx-Engels-Werke (ausgewählte Texte)
  • mwa: Korpus Herausgeber-Anmerkungstexte zum Korpus Marx-Engels-Werke

2.485.394

gri

Brüder Grimm: Sagen, Kinder- und Hausmärchen, Kinderlegenden

426.236

goe

Goethes Werke

1.414.095

khzm (khz, khm)

Mannheimer Korpus Historischer Zeitungen und Zeitschriften. Unterkorpora:

  • khz: Mannheimer Korpus Historischer Zeitungen
  • khm: Mannheimer Korpus Historischer Zeitschriften

Dieses Korpus steht auch im IDS-Repository zur Verfügung, wo weitere Informationen hinterlegt sind.

4.093.636

gmc

repräsentatives Korpus des geschriebenen Deutsch aus den Jahren 1650-1800, beruhend auf Daten des GerManC-Projekts. Genauere Beschreibung

676.508