Digitale Sprachwissenschaft

Programmbereich Korpuslinguistik - Aktuelles 



7th Workshop on the Challenges in the Management of Large Corpora

Cardiff, 22nd of July, 2019

during the Corpus Linguistics 2019 conference.





Dr. Lydia-Mai Ho-Dac (Université de Toulouse 2)
"The WikiDisc corpus: In the backstage of Wikipedia"

18. Juni 2019, 10 Uhr
IDS Mannheim, Vortragssaal

Wikipedia constitutes a popular and extremely useful resource for studies in both linguistics and natural language processing. This presentation introduces a language resource based on the French Wikipedia online discussion pages: the WikiDisc corpus. The corpus includes 439,638 talk pages that corresponds to a sort of discussion forum associated with each article where contributors may discuss, interact, and sometimes negotiate, thereby collaboratively improving the article. The total corpus comprises more than 210 million words, structured in more than 3 million posts and more than 1 million threads (thematic sections). This talk will describe the building and the composition of the WikiDisc corpus which is publicly available.

The WikiDisc Corpus: .
Webseite Mai Ho-Dac:




Neologismen: Korpuslinguistische Ermittlung und lexikographische Bearbeitung

Workshop am Leibniz-Institut für Deutsche Sprache, Mannheim
3. - 4. Juni 2019

Thema dieses Workshops waren korpuslinguistische Methoden der Neologismendetektion und die lexikographische Praxis im Umgang mit den korpuslinguistisch ermittelten Daten in verschiedenen Wörterbuchprojekten. Er wurde gemeinsam von den Projekten „Methoden der Korpusanalyse und –erschließung“ und „Neuer Wortschatz“ am Leibniz-Institut für Deutsche Sprache organisiert.


Annette Klosa-Kückelhaus und Harald Lüngen