IDS-Logo

 lexpan – Lexical Pattern Analyzer

Ein Analysewerkzeug zur Untersuchung syntagmatischer Strukturen auf der Basis von Korpusdaten

Was ist lexpan?

Das einzelsprachenunabhängige Analyseprogramm lexpan wurde im Projekt „Usuelle Wortverbindungen“ des Instituts für Deutsche Sprache (Mannheim) zur Unterstützung der linguistischen Interpretation großer Sprachdatenmengen aus Korpora entwickelt. Ursprünglich als heuristisches Werkzeug zur Untersuchung von usuellen Wortverbindungen (Steyer 2013) und für neuartige lexikografische Darstellungsformen (Steyer & Brunner 2009-2012) gedacht, ist es mittlerweile für die Rekonstruktion sprachlicher Verfestigung und Musterbildung generell einsetzbar.

lexpan dient der explorativen Untersuchung von Festigkeit, Varianz, Slotbesetzungen und kontextuellen Einbettungsmustern syntagmatischer Strukturen.  Es ermöglicht, aus Korpora exportierte Daten in einer eigenen Arbeitsumgebung weiter zu bearbeiten, zu strukturieren und zu kommentieren sowie die Ergebnisse in gesonderten Dateien darzustellen.  Derzeit können mithilfe von lexpan zwei Datentypen untersucht werden: 

a) KWICs (Keyword in Context)

b) Kookkurrenzlisten

lexpan stellt keine direkte Schnittstelle zu einem Korpus dar, sondern basiert auf der Abspeicherung der exportierten Daten auf einem lokalen Rechner. Das Programm ist nicht darauf ausgelegt, Textblöcke oder ganze Korpora zu konvertieren und zu bearbeiten.

lexpan zeichnet sich dadurch aus, dass seine Entwicklung von Beginn an von einem linguistischen Vorgehensmodell und von lexikografischen Bedürfnissen geleitet war. Daher ist für die Handhabung keine besondere computerlinguistische Kompetenz vonnöten.

lexpan hat mehrere Funktionalitäten, die sich mit den Stichworten EINLESEN, ARCHIVIEREN, STRUKTURIEREN, ZÄHLEN, GRUPPIEREN, KOMMENTIEREN und DARSTELLEN zusammenfassen lassen, und zwar: 

  • Einlesen von KWIC-Dateien und Kookkurrenzlisten-Dateien in lexpan-Stores und Archivieren dieser Daten auf dem lokalen Rechner (lexpan-Archive)
  • Strukturieren und Bündeln von KWIC-Zeilen nach bestimmten Oberflächenmerkmalen (auf der Basis von flexibel formulierbaren Suchanfragen)
  • Formulieren von Suchanfragen zur Ermittlung von Slotbesetzungen in vordefinierten Mustern, Zählung der Lückenfüller und Darstellung in  Tabellen
  • Manuell-inhaltliches Annotieren von Kookkurrenzpartnern und Lückenfüllern mit Tags und Kommentaren und entsprechende Sortierungsmöglichkeiten
  • Export der Ergebnisse im XML- oder HTML-Format

Projektpublikationen im Zusammenhang mit lexpan

 

Entwicklungsteam

Kathrin Steyer (Leitung und Konzeption)

steyer (at) ids-mannheim.de

Annelen Brunner (Technische Konzeption und Implementierung)

brunner (at) ids-mannheim.de

Katrin Hein (Mitarbeit)

hein (at) ids-mannheim.de

 

lexpan verwenden

lexpan ist ein Java-Programm, das betriebssystemunabhängig, also unter Windows, Linux und MacOS, läuft.

Das Programm dient primär der Arbeit im Projekt „Usuelle Wortverbindungen“ und wird laufend weiterentwickelt. Wir stellen es jedoch auf Anfrage interessierten Kollegen zur Verfügung.

Wenn Sie lexpan für Ihre Forschungen nutzen wollen, wenden Sie sich bitte an

lexpan (at) ids-mannheim.de

Bei der Veröffentlichung von Forschungsergebnissen, die auf Analysen mit lexpan aufbauen, bitten wir um folgende Quellenangabe [XXX ist durch die jeweilige Versionsnummer zu ersetzen]:

lexpan – Lexical Pattern Analyzer (Version XXX). Ein Analysewerkzeug zur Untersuchung syntagmatischer Strukturen auf der Basis von Korpusdaten. Entwickelt vom Projekt "Usuelle Wortverbindungen", Institut für Deutsche Sprache, Mannheim, www.ids-mannheim.de/lexik/uwv/lexpan.html