TextGrid

Aktuell zum Download verfügbares Morphisto-Lexikon

Im Rahmen des Projektes TextGrid hat das Institut für Deutsche Sprache eine morphologische Lexikonkomponente Morphisto entwickelt, die hiermit der linguistischen Community frei zur Verfügung gestellt werden kann.
Morphisto basiert auf den freiverfügbaren SFST-Tools der Universität Stuttgart (Schmid 2005), die bereits erfolgreich mit der Morphologiekomponente SMOR (Schmid, Fitschen, Heid 2004) eingesetzt wurden und eine minimale Basisgrammatik bestehend aus den wesentlichen deutschen morphotaktischen und orthographisch/phonologischen Regeln beinhaltet. Das Morphisto-Lexikon enthält derzeit ca. 30.000 lexikalische Einträge mit Informationen zum Lemma, der Wortklasse und dem Paradigma. Die Lemmaauswahl orientiert sich an der DeReWo-Liste, einer Liste der 30.000 häufigsten Wörter bezogen auf das Deutsche Referenzkorpus (DeReKo). Für diese hochfrequenten Wörter der deutschen Sprache liefert der Transducer eine korrekte Analyse, was durch eine manuelle Verifizierung sichergestellt wurde. Die eigentliche Abdeckungsrate des Morphologietools ist dank der Wortbildungsanalyse jedoch wesentlich höher.

BezeichungTypAnzahl Einträgeveröffentlicht am
morphisto-2008-12-31-0.1xml-kodiertes Morphisto-Lexikon 18.000 12. Dezember 2008      download
  • Das Morphisto-Lexikon steht derzeit unter der Attribution Non-commercial Share Alike (by-nc-sa) frei zur Verfügung.
  • Installationshinweise: Für die Kompilierung des Transducers müssen die SFST-Tools installiert sein. Es wird ein Rechner mit mindestens 8 GB RAM empfohlen.

Bei Fragen oder Anregungen senden Sie bitte eine E-Mail an morphisto (at) ids-mannheim.de.