Kontakt:
<korpuslinguistik@ids-...>
Leitung:
Dr. Marc Kupietz <kupietz@ids-...>
Wissenschaftliche Mitarbeiter:
Cyril Belica <belica@ids-...>
Dr. Harald Lüngen <luengen@ids-...>
Rainer Perkuhn <perkuhn@ids-...>
Kooperationen:
siehe hier
Ehemalige am Korpusaufbau beteiligte Mitarbeiter des IDS:
siehe hier
Studentische Hilfskräfte:
- Anna Konovalova
- Theresa Sick
Ausbau und Pflege der Korpora geschriebener Gegenwartssprache
Das Deutsche Referenzkorpus – DeReKo
die weltweit größte Sammlung deutschsprachiger Korpora als empirische Basis für die linguistische Forschung
Die Korpora geschriebener Gegenwartssprache des IDS
- bilden mit 42 Milliarden Wörtern (Stand 03.02.2018) die weltweit größte linguistisch motivierte Sammlung elektronischer Korpora mit geschriebenen deutschsprachigen Texten aus der Gegenwart und der neueren Vergangenheit.
- sind über COSMAS II kostenlos abfragbar
- enthalten belletristische, wissenschaftliche und populärwissenschaftliche Texte, eine große Zahl von Zeitungstexten sowie eine breite Palette weiterer Textarten und werden kontinuierlich weiterentwickelt.
- werden im Hinblick auf Umfang, Variabilität, Qualität und Aktualität akquiriert und erlauben in der Nutzungsphase über COSMAS II die Komposition virtueller Korpora, die repräsentativ oder auf spezielle Aufgabenstellungen zugeschnitten sind.
- enthalten ausschließlich urheberrechtlich abgesichertes Material.
Aktuelle DeReKo-Erweiterungen
- Fußball-Liveticker-Korpora (vielen Dank an Simon Meier-Vieracker, siehe fussballlinguistik.de) – DeReKo-2017-II
Geplante DeReKo-Erweiterungen
- Publikumszeitschriften (Stern, HÖRZU, Frau im Spiegel, Brigitte, Essen und Trinken, …) – DeReKo-2018-I
Aktuelle Veröffentlichungen zu DeReKo
- Kupietz, Marc/Lüngen, Harald (2014): Recent Developments in DeReKo. In: Calzolari, Nicoletta et al. (eds.): Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). Reykjavik: ELRA, 2378-2385. http://www.lrec-conf.org/proceedings/lrec2014/pdf/842_Paper.pdf
- Kupietz, Marc / Belica, Cyril / Keibel, Holger / Witt, Andreas (2010): The German Reference Corpus DeReKo: A primordial sample for linguistic research. In: Calzolari, Nicoletta et al. (eds.): Proceedings of the 7th conference on International Language Resources and Evaluation (LREC 2010). Valletta, Malta: European Language Resources Association (ELRA), 1848-1854. http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf
- Kupietz, Marc / Keibel, Holger (2009): The Mannheim German Reference Corpus (DeReKo) as a basis for empirical linguistic research. In Minegishi, Makoto / Kawaguchi, Yuji (Eds.): Working Papers in Corpus-based Linguistics and Language Education, No. 3. Tokyo: Tokyo University of Foreign Studies (TUFS), 53-59. http://cblle.tufs.ac.jp/assets/files/publications/working_papers_03/section/053-059.pdf
Themenüberblick
- Einsatzgebiete
- Korpusakquisition - Vom Originaltext zum Korpustext
- Das IDS-Textmodell
- Aktuelles Korpusarchiv
- Chronik der DeReKo-Ausgaben (mit Angabe der Zitierweise)
- Morphosyntaktische Annotationen
- Verfügbarkeit
- Textgeber
- Ehemalige Mitarbeiter
- Kooperationen
- DeReKo-Bibliographie 1 (Publikationen von IDS-Mitarbeitern)
- DeReKo-Bibliographie 2 (externe Lehr- und Forschungsaktivitäten)