IDS-Logo
Startseite : : Organisationsstruktur : : Direktion : : Korpuslinguistik Korpuslinguistik : : Projekte : : Korpusausbau
KorpusausbauKorpusausbauKorpusausbauKorpusausbauKorpusausbauKorpusausbau
Direktion und zentrale Forschung

Kontakt:
    <korpuslinguistik@ids-...>
 
Leitung:
    Dr. Marc Kupietz <kupietz@ids-...>
 
Wissenschaftliche Mitarbeiter:
    Cyril Belica <belica@ids-...>
    Dr. Harald Lüngen <luengen@ids-...>
    Rainer Perkuhn <perkuhn@ids-...>
 
Kooperationen:
    siehe hier
 
Ehemalige am Korpusaufbau beteiligte Mitarbeiter des IDS:
    siehe hier
 
Wissenschaftliche Hilfskräfte:

  • Xiaoxi Pang

 
Studentische Hilfskräfte:

  • Anna Schächtele
  • Katharina Sowa
  • Jani Takhsha

 

 

Ausbau und Pflege der Korpora geschriebener Gegenwartssprache

Das Deutsche Referenzkorpus – DeReKo

die weltweit größte Sammlung deutschsprachiger Korpora als empirische Basis für die linguistische Forschung

Die Korpora geschriebener Gegenwartssprache des IDS

  • bilden mit 24 Milliarden Wörtern (Stand 15.04.2014) die weltweit größte linguistisch motivierte Sammlung elektronischer Korpora mit geschriebenen deutschsprachigen Texten aus der Gegenwart und der neueren Vergangenheit.
  • enthalten belletristische, wissenschaftliche und populärwissenschaftliche Texte, eine große Zahl von Zeitungstexten sowie eine breite Palette weiterer Textarten und werden kontinuierlich weiterentwickelt.
  • werden im Hinblick auf Umfang, Variabilität, Qualität und Aktualität akquiriert und erlauben in der Nutzungsphase über COSMAS II die Komposition virtueller Korpora, die repräsentativ oder auf spezielle Aufgabenstellungen zugeschnitten sind.
  • enthalten ausschließlich urheberrechtlich abgesichertes Material.

Informationen zum Download

  • Infomaterialien des Programmbereichs Korpuslinguistik
  • aktuelle Publikationen zur Konzeption von DeReKo
    • Kupietz, Marc / Belica, Cyril / Keibel, Holger / Witt, Andreas (2010): The German Reference Corpus DeReKo: A primordial sample for linguistic research. In: Calzolari, Nicoletta et al. (eds.): Proceedings of the 7th conference on International Language Resources and Evaluation (LREC 2010). Valletta, Malta: European Language Resources Association (ELRA), 1848-1854.   http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf
    • Kupietz, Marc / Keibel, Holger (2009): The Mannheim German Reference Corpus (DeReKo) as a basis for empirical linguistic research. In Minegishi, Makoto / Kawaguchi, Yuji (Eds.): Working Papers in Corpus-based Linguistics and Language Education, No. 3. Tokyo: Tokyo University of Foreign Studies (TUFS), 53-59.   http://cblle.tufs.ac.jp/assets/files/publications/working_papers_03/section/053-059.pdf

Themenüberblick

Kontakt:

<korpuslinguistik@ids-...>