14. Vortrag im Rahmen des internationalen Gästeforums

Margo Blevins (The University of Texas, Austin):

Die orthographische Normalisierung deutschsprachiger Kontaktvarietät-Daten

Montag, 08. Juli 2019, 14.30 Uhr, IDS Vortragssaal

ZUR PERSON:

Margo Blevins hat ihren Bachelor-Abschluss an dem Allegheny College in Pennsylvania 2012 erhalten. 2015 erhielt sie dann ihren Master an der Universität von Texas in Austin. Zurzeit arbeitet sie an ihrer Dissertation mit dem Thema „The Orthographic Normalization of Spoken Mixed Language Corpora“ unter der Leitung von Dr. Hans Boas. Während ihres Aufenthalts an der Universität von Texas hat sie als Forschungsassistentin an dem „Texas German Dialect Project“ gearbeitet, dessen Ziel es ist, die Forschung zu dem Dialekt der Texas-Deutschen zu fördern.

ABSTRACT:

Dieser Vortrag befasst sich mit der orthographischen Normalisierung deutschsprachiger Kontaktvarietäten. Orthographische Normalisierung zielt darauf hinaus, lexikalisches Material so zu erfassen, dass lautliche Äußerungen uniform und (gewissermaßen) präskriptiv-korrekt festgehalten werden können. Es wurde in der Forschung bereits mehrfach versucht, einzelne Kontaktvarietät-Daten individuell zu normalisieren (z.B. Rehbein et al. 2013, Götze et al. 2017, Frick 2018), jedoch existiert insbesondere im Bereich der mehrsprachigen Korpora kein systematisches, weitverbreitetes System.

Orthographische Normalisierung ist nichts Triviales. Besonders mit Bezug auf Kontaktvarietät-Daten lassen sich einige Problemfälle, z.B. aufgrund von ursprungsdialektalem Material oder Sprachkontaktphänomenen (sprachliche Innovationen, Konvergenz, etc.), ausfindig machen.

Ein Sprecher kann bspw. das lexikalische Material zweier (oder mehrerer) Sprachen innerhalb einer Äußerung (intrasententielles Code-Switching) oder nur innerhalb eines Wortes benutzen (intralexikalisches Code-Mixing/Lehnübersetzungen). In dieser Präsentation schlage ich ein Multiebenen-System zur orthographischen Normalisierung deutschsprachiger Kontaktvarietäten vor. Meine Studie konzentriert sich vorerst auf die Übersetzungsdaten des Texas-German-Dialect-Projects (Boas et al. 2010). Im Rahmen dieses Forschungsprojekts soll ein System entwickelt werden, das a) auf verschiedene Kontaktvarietäten und Kontaktvarietät-Korpora allgemein anwendbar ist, b) die (semi-) automatische POS-Tagging und Lemmatisierung Kontaktvarietät-Daten erleichtert und c) die vergleichende Forschung von Kontaktvarietäten begünstigt.

LITERATUR

Boas, Hans, C., Marc Pierce, Karen Roesch, Guido Halder & Hunter Weilbacher. 2010. The Texas German Dialect Archive: A Multimedia Resource for Research, Teaching, and Outreach. Journal of Germanic Linguistics 22.3, 277–296.

Frick, Elena. 2018. Online Recherche- und Informationsangebot „Russlanddeutsch“
prowiki.ids-mannheim.de/bin/view/Russlanddeutsch/WebHome

Götze, Angelika, Siegwalt Lindenfelser, Salome Lipfert, Katharina Neumeier, Werner König & Péter Maitz. 2017. Documenting Unserdeutsch (Rabaul Creole German). A workshop report. In: Maitz, Péter / Volker, Craig A. (Hrsg.): Language Contact in the German Colonies: Papua New Guinea and beyond (= Special issue of Language and Linguistics in Melanesia. Journal of the Linguistic Society of Papua New Guinea), 65–90.

Rehbein, Ines & Sören Schalowski. 2013. STTS goes Kiez ‐ Experiments on Annotating and Tagging Urban Youth Language. Journal for Language Technology and Computational Linguistics 28, 199–227.