IDS-Logo
Startseite : : Organisationsstruktur : : Direktion : : Korpuslinguistik Korpuslinguistik : : Projekte : : Korpusausbau : : Archiv : : Mannheimer Morgen
Mannheimer MorgenMannheimer MorgenMannheimer MorgenMannheimer MorgenMannheimer MorgenMannheimer Morgen
Direktion und zentrale Forschung

Kontakt:
    <korpuslinguistik@ids-...>
 
Leitung:
    Dr. Marc Kupietz <kupietz@ids-...>
 
Wissenschaftliche Mitarbeiter:
    Cyril Belica <belica@ids-...>
    Dr. Harald Lüngen <luengen@ids-...>
    Rainer Perkuhn <perkuhn@ids-...>
 
Kooperationen:
    siehe hier
 
Ehemalige am Korpusaufbau beteiligte Mitarbeiter des IDS:
    siehe hier
 
Studentische Hilfskräfte:

  • Anna Konovalova
  • Theresa Sick

 

 

Korpora der geschriebenen Sprache

Mannheimer Morgen (mmm)

 

Das Korpus beinhaltet eine außerordentlich große Menge von Zeitungsartikeln, die in elektronischer Form vom Verlagshaus der Tageszeitung Mannheimer Morgen bezogen wurde bzw. wird (ohne Anzeigenteil). Das gesamte Textmaterial wurde bzw. wird im IDS vollautomatisch aufbereitet. Das Korpus ist ein sog. Monitorkorpus, für das kennzeichnend ist, dass sich seine Zusammensetzung mit der Zeit ändert, und zwar in diesem Fall durch regelmäßiges Hinzufügen von Zeitungsartikeln jüngeren Datums.

Fehlende Jahrgänge und größere Abweichungen in der Anzahl der Texte und Wortformen von Jahrgang zu Jahrgang bis 1997 sind einerseits darin begründet, dass nur die Zeitungsartikel aufgenommen wurden, die zu Beginn der Datenübernahme per Modem (Anfang 1995) im Verlagshaus in vollautomatisch verarbeitbarer Datenform vorhanden waren. Andererseits verursachte die im Verlagshaus 1997 vorgenommene Umstellung der Computertechnik weitere Lücken im ansonsten großzügig auch für externe Nutzer zur Verfügung gestellten Bestand. Seit 1998 sind die Ausgaben des Mannheimer Morgens lückenlos in den Korpora enthalten.

Zu beachten ist, dass das im Quellennachweis eines Artikels enthaltene Datum das Datum der Zeitungsausgabe ist, für die der jeweilige Artikel vorgesehen war. Tatsächlich jedoch kann er in einer anderen Ausgabe, also zu einem anderem Datum, erschienen sein.

 

Jahrgang

Anzahl Artikel

Anzahl laufende Wortformen (ca.)

M89       1989

45626

10.29 Mill.

M91       1991

12755

2.78 Mill.

M94       1994

12485

2.46 Mill.

M95       1995

34946

6.42 Mill.

M96       1996

19988

3.56 Mill.

M97       1997

6633

1.64 Mill.

M98       1998

78651

19.30 Mill.

M99       1999

64885

14.36 Mill.

M00       2000

68925

18.92 Mill.

M01       2001

83980

23.49 Mill.

M02       2002

86664

24.31 Mill.

M03       2003

88052

25.35 Mill.

M04       2004

94867

26.85 Mill.

M05       2005

99351

27.14 Mill.

M06       2006

92624

25.18 Mill.

M07       2007

42516

12.14 Mill.

mmm    gesamt

932948

244.20 Mill.