Korpora der geschriebenen Sprache

Mannheimer Morgen (mmm)

Das Korpus beinhaltet eine außerordentlich große Menge von Zeitungsartikeln, die in elektronischer Form vom Verlagshaus der Tageszeitung Mannheimer Morgen bezogen wurde bzw. wird (ohne Anzeigenteil). Das gesamte Textmaterial wurde bzw. wird im IDS vollautomatisch aufbereitet. Das Korpus ist ein sog. Monitorkorpus, für das kennzeichnend ist, dass sich seine Zusammensetzung mit der Zeit ändert, und zwar in diesem Fall durch regelmäßiges Hinzufügen von Zeitungsartikeln jüngeren Datums. Fehlende Jahrgänge und größere Abweichungen in der Anzahl der Texte und Wortformen von Jahrgang zu Jahrgang bis 1997 sind einerseits darin begründet, dass nur die Zeitungsartikel aufgenommen wurden, die zu Beginn der Datenübernahme per Modem (Anfang 1995) im Verlagshaus in vollautomatisch verarbeitbarer Datenform vorhanden waren. Andererseits verursachte die im Verlagshaus 1997 vorgenommene Umstellung der Computertechnik weitere Lücken im ansonsten großzügig auch für externe Nutzer zur Verfügung gestellten Bestand. Seit 1998 sind die Ausgaben des Mannheimer Morgens lückenlos in den Korpora enthalten. Zu beachten ist, dass das im Quellennachweis eines Artikels enthaltene Datum das Datum der Zeitungsausgabe ist, für die der jeweilige Artikel vorgesehen war. Tatsächlich jedoch kann er in einer anderen Ausgabe, also zu einem anderem Datum, erschienen sein.
Jahrgang Anzahl Artikel Anzahl laufende Wortformen (ca.)
M89       1989 45626 10.29 Mill.
M91       1991 12755 2.78 Mill.
M94       1994 12485 2.46 Mill.
M95       1995 34946 6.42 Mill.
M96       1996 19988 3.56 Mill.
M97       1997 6633 1.64 Mill.
M98       1998 78651 19.30 Mill.
M99       1999 64885 14.36 Mill.
M00       2000 68925 18.92 Mill.
M01       2001 83980 23.49 Mill.
M02       2002 86664 24.31 Mill.
M03       2003 88052 25.35 Mill.
M04       2004 94867 26.85 Mill.
M05       2005 99351 27.14 Mill.
M06       2006 92624 25.18 Mill.
M07       2007 42516 12.14 Mill.
mmm    gesamt 932948 244.20 Mill.