Digitale Sprachwissenschaft

Kontakt:
    <korpuslinguistik@ids-...>
 
Leitung:
    Dr. Marc Kupietz <kupietz@ids-...>
 
Wissenschaftliche Mitarbeiter:
    Cyril Belica <belica@ids-...>
    Dr. Harald Lüngen <luengen@ids-...>
    Rainer Perkuhn <perkuhn@ids-...>
 
Kooperationen:
    siehe hier
 
Ehemalige am Korpusaufbau beteiligte Mitarbeiter des IDS:
    siehe hier
 
Studentische Hilfskräfte:

  • Theresa Sick
  • Daniel Wachter

Corpora of Written Language

Mannheim Corpus 1 (mk1)

 

Development:

  • IDS

Extent:

  • 293 texts; about 2.2 million current word forms

Time frame:

  • 1950 - 1967

Content:

  • Belles Lettres

    • Heinrich Böll: Ansichten eines Clowns
    • Werner Bergengruen: Das Tempelchen
    • Max Frisch: Homo faber
    • Günter Grass: Die Blechtrommel
    • Uwe Johnson: Das dritte Buch über Achim
    • Thomas Mann: Die Betrogene
    • Erwin Strittmatter: Ole Bienkopp

  • Memoirs

    • Theodor Heuss: Erinnerungen 1905-1933

  • scientific and popular scientific literature
  • light fiction
  • articles from newspapers and magazines

 

Mannheim Corpus 2 (mk2)

 

Development:

  • IDS

Extent:

  • 52 texts; about 0.3 million current word forms

Time frame:

  • 1949, 1952, 1960 - 1974

Content:

  • decrees, statutes, resolutions
  • manuals, textbooks
  • news, brochures, light fiction
  • scientific and popular scientific literature
  • articles from newspapers and magazines