IDS-Logo

Pragmatik

< Neu: Handreichungen zur Benutzung der DGD
06.12.2016 12:12 Alter: 1 year
Kategorie: Pragmatik-intern

Neue Version der DGD

Datenbank für Gesprochenes Deutsch 2.7


Seit dem 05.12.2016 steht die neue Version 2.7 der DGD unter dgd.ids-mannheim.de zur Verfügung.

Wichtigste Neuerungen sind die Erweiterung der Korpora 'Deutsche Mundarten: DDR' (DR) und 'Deutsche Mundarten' (ZW – Zwirner-Korpus):

- Das Korpus 'Deutsche Mundarten: DDR' (DR) wurde um Transkripte zu 117 Sprechereignissen (rund 200.000 Tokens) – vornehmlich aus dem sächsischen Sprachraum – erweitert, die nun erstmals für das Browsing und die Volltext- und strukturierte Tokensuche genutzt werden können.

- Das Korpus 'Deutsche Mundarten' (ZW – Zwirner-Korpus) wurde um Transkripte zu 85 Sprechereignissen (rund 130.000 Tokens) – vornehmlich aus dem niederdeutschen Sprachraum – erweitert, die ebenfalls für Browsing und die Volltext- und strukturierte Tokensuche genutzt werden können.

Beide Erweiterungen sind das Ergebnis von Kooperationen: Die DGD dankt den Kooperationspartnern Dr. Sven Grawunder und Mitarbeiter(inne)n (MPI für Evolutionäre Anthropologie Leipzig, 'Korpus Deutsche Mundarten: DDR') und Prof. Dr. Jörg Peters und Mitarbeiter(inne)n (Universität Oldenburg, Korpus 'Deutsche Mundarten' (ZW-Zwirner-Korpus) für die gute Zusammenarbeit.

 

Alle Neuerungen der Version 2.7. im Detail:

1) Das Korpus 'Deutsche Mundarten: DDR' (DR) wurde um Transkripte zu 117 Sprechereignissen - vornehmlich aus dem sächsischen Sprachraum - im Gesamtumfang von gut 200.000 Tokens erweitert. Damit stehen für dieses Korpus nun erstmalig alignierte und strukturierte Transkripte zur Verfügung, mit denen beim Browsing und bei der Volltext- und strukturierten Tokensuche gearbeitet werden kann. Die Transkripte sind im Rahmen einer Kooperation des AGD mit dem MPI für Evolutionäre Anthropologie in Leipzigentstanden. Bitte beachten Sie bei der Arbeit mit diesen Transkripten die Hinweise im Zusatzmaterial zum Korpus DR.

2) Das Korpus 'Deutsche Mundarten' (ZW - Zwirner-Korpus) wurde um Transkriptezu 85 Sprechereignissen - vornehmlich aus dem nordniederdeutschen Sprachraum - im Gesamtumfang von gut 130.000 Tokens erweitert. Diese Transkripte stehen nun für das Browsing und die Volltext- und strukturierte Tokensuche zur Verfügung. Die Transkripte sind im Rahmen einer Kooperation des AGD mit der Universität Oldenburg entstanden. Bitte beachten Sie bei der Arbeit mit diesen Transkripten die Hinweise im Zusatzmaterial zum Korpus ZW.

3) Die Ortsdaten des Korpus 'Deutsche Mundarten' (ZW - Zwirner-Korpus) wurden umfassend überarbeitet. Insbesondere wurden an vielen Stellen Planquadratangaben ergänzt oder korrigiert und bei zweisprachigen Ortsnamen die Namen in der heutigen Landessprache ergänzt.

4) Beim Download von Ausschnitten aus den DGD-Daten gibt es nun zusätzlich dieMöglichkeit, Transkripte im Format ISO (TEI) herunterzuladen. Dabei handelt es sich um ein auf den Richtlinien der Text Encoding Initiative (TEI) basierendes Format, das im August 2016 von der International Standards Organisation (ISO) als internationaler Standard für die digitale Repräsentation von Transkripten gesprochener Sprache verabschiedet wurde. Siehe dazu auch: http://www1.ids-mannheim.de/prag/muendlichekorpora/isodin.html.

5) Für Korpora, Ereignisse, Transkripte und Audioaufnahmen in der DGD wurden über das Langzeitarchiv für Germanistische Primärdaten persistene Identifizierer (PIDs) bereitgestellt. PIDs dienen der dauerhaften Zitierbarkeit digitaler Ressourcen. Mit einer PID können Objekte aus der DGD unabhängig von ihrer aktuellen Internetadresse zitiert werden. So bleibt die Referenz auf das Objektüber zukünftige Änderungen in der DGD hinweg stabil. Beispielsweise verweist die PID http://hdl.handle.net/10932/00-0332-D40A-3CEE-B901-4 auf das Zwirner-Korpus. PIDs für einzelne DGD-Objekte können Sie an der betreffenden Stelle im Browsing-Modus der DGD abrufen.

Darüber hinaus enthält die neue Version der DGD einige kleinere Korrekturen an den Daten und Verbesserungen an der Funktionalität. Wir hoffen, dass diese Erweiterungen für Ihre Arbeit nützlich sind und freuen uns über Verbesserungsvorschläge, Fehlerberichte und andere Rückmeldungen an die Adresse dgd@ids-mannheim.de.

Bitte beachten Sie außerdem, dass wir bereits im November 2016 folgende neue Hilfestellungen für die Arbeit mit der DGD bereitgestellt haben: 

* ein Video-Tutorial, das einen Überblick über grundlegende Funktionender DGD gibt

* drei Handreichungen, die in die Benutzung von DGD und FOLK für gesprächsanalytische Zwecke einführen

Das Video und die Handreichungen sind über die Adresse http://agd.ids-mannheim.de/datenbanken.shtml zugänglich.