Titelblatt der Berlinischen
Privilegirten Zeitung

vom 2. Februar 1737.

GerManC

GerManC ist ein repräsentatives Korpus des Deutschen von 1650-1800 und umfasst 676.508 Wortformen. Es ist in das Historische Korpus des IDS integriert und verfügbar über COSMAS II, Archiv "HIST - Archiv der historischen Korpora", vordefinierte Korpora "gmc".

GerManC wurde an der University of Manchester unter der Leitung von Prof. Dr. Martin Durell erarbeitet.  Auf den dortigen Projektseiten findet sich eine ausführliche Dokumentation und das Korpus selbst wird in verschiedenen Formaten zum Download angeboten. Das Korpus ist daneben auch im Oxford Text Archive achiviert.

Metainformationen

GerManC wurde als repräsentatives Korpus zusammengestellt und ist nach dem folgenden Kriterien balanciert:

PeriodsRegionsGenres
Drama

North

Humanities
1650-1700West Central

Legal texts

1700-1750East CentralLetters
1750-1800West UpperNarrative prose
East UpperNewspapers
Scientific texts
Sermons

 In der Ergebnisansicht von COSMAS II sind diese Aufteilungen folgendermaßen kodiert:

  • Periods: Unter Ergebnisse, Quellenansicht sind die Treffer nach Perioden aufgelistet
  • Regions: Unter Ergebnisse, Länderansicht sind die Treffer nach Regionen (und zusätzlich Städten) aufgelistet
  • Genres: Unter Ergebnisse, Textsortenansicht sind die Treffer nach Genres aufgelistet

Die Quellennachweise beim Export von Belegen enthalten Verweise auf die entsprechenden Dateien im Ursprungskorpus.

Textuelle Anpassungen

Die Version, die in COSMAS II integriert wurde, beruht auf dem TEI-Format. Folgende Anpassungen wurden vorgenommen:

  •  Die Satzendeerkennung wurde mit den Werkzeugen von COSMAS II neu durchgeführt.
  • Häufige typopgraphische Sonderzeichen wurden ersetzt, um die Suche im Korpus zu erleichtern. Im Detail handelt es sich um folgende Zeichen:
OriginalErsetzung
ä
ö
ü
Ä
Ö
Ü
ů ü
æ ae
œ oe
œ oe
Æ AE
ΠOE

 

Weitere Sonderzeichen wurden unverändert aus der TEI-Version in COSMAS II übernommen. Die Dokumentation des GerManC-Projekts enthält auf Seite 4 eine vollständige Liste mit den verwendeten SGML-Codes.

Nach Wörtern mit diesen Sonderzeichen kann in COSMAS II unter Verwendung der SGML-Codes gesucht werden (z.B. dē für dē).