Lexik
elexiko-Module
Der Ausbau von elexiko erfolgt nicht linear und alphabetisch, sondern in Wortschatzausschnitten, so genannten Modulen. Eine Publikation der Wortartikel in alphabetischer Reihenfolge scheint für elexiko, ein im Aufbau befindliches Online-Wörterbuch, wenig angemessen, da bei der Fülle der enthaltenen Stichwörter und Angaben mit einer langen Publikationsdauer zu rechnen ist. So werden derzeit im elexiko-Korpus besonders häufige Wörter redaktionell behandelt (im "Lexikon zum öffentlichen Sprachgebrauch"), "niedrig frequente Stichwörter" dagegen nur mit automatischen Angaben versehen. Andere Auswahlkriterien waren für die Auswahl des elexiko-Demonstrationswortschatzes maßgebend.
Lexikon zum öffentlichen Sprachgebrauch
Mit dem "Lexikon zum öffentlichen Sprachgebrauch" veröffentlicht die elexiko-Projektgruppe nach dem Demonstrationswortschatz ein weiteres Modul von elexiko. Es handelt sich hierbei um einen Wortschatz, der sowohl Themen aus Politik und Gesellschaft, als auch speziellere Sachverhalte abdeckt. Gut die Hälfte der insgesamt rund 2.700 frequenzbasiert ausgewählten Wörter (jeweils zwischen 10.000 und 500.000 mal im elexiko-Korpus belegt) sind Nomen, die den zentralen politischen gesellschaftlichen Diskursen, wie sie im elexiko-Korpus präsent sind, angehören. Sie werden hauptsächlich ergänzt durch Verben und Adjektive, die zu einem geringeren Teil selbst diskursgebunden sind (z. B. verabschieden, reformieren, global, sozialverträglich), die aber auch einfach zur Formulierung der Diskurse benötigt werden (z. B. feststellen, abstimmen). Die Veröffentlichung der Stichwörter des "Lexikons zum öffentlichen Sprachgebrauch" hat 2005 begonnen und erfolgt weiterhin kontinuierlich.
Beim "Lexikon zum öffentlichen Sprachgebrauch" handelt es sich nicht um ein Wörterbuch zum Fach- oder Spezialwortschatz der Politik, sondern um ein Lexikon, in dem der allgemein geläufige Wortschatz der öffentlichen Diskussion um politische und gesellschaftliche Themen semantisch und pragmatisch angemessen, d. h. hinreichend differenziert und sprachreflektierend dargestellt wird.
Niedrig frequente Stichwörter
90 % der Stichwortliste in elexiko besteht aus so genannten niedrig frequenten Stichwörtern, d. h. Wörtern, die weniger als 500 mal im elexiko-Korpus belegt sind. Neben der Erarbeitung des "Lexikons zum öffentlichen Sprachgebrauch" wird elexiko auch durch die (teil-)automatische Ermittlung verschiedener Angaben für diese niedrig frequenten Stichwörter gefüllt.
Zusätzlich zu den orthografischen Angaben werden in diesem elexiko-Modul die niedrig frequenten Stichwörter um automatisch ermittelte Belege aus dem elexiko-Korpus ergänzt wie um Angaben dazu, in wie vielen verschiedenen Quellen und Jahrgängen das Stichwort im Korpus belegt ist und welcher Frequenzschicht es angehört. Grammatische Angaben zur Wortart und (bei Wörtern, die durch Wortbildung entstanden sind) zu den Bildungsbestandteilen ergänzen das Angebot.
Da für elexiko eine möglichst gute Qualität der Angaben angestrebt wird, wird auf die Präsentation rein automatisch ermittelter Angaben verzichtet. So werden z. B. automatisch erstellte Wortbildungsanalysen redaktionell überprüft, bevor sie online erscheinen. Belege werden nicht nach rein statistischen Zufallskritierien aus dem Korpus ermittelt, sondern nach redaktionellen Kriterien. Dies bedeutet leider aber auch, dass die Füllung der niedrig frequenten Stichwörter langsamer vorangeht, als dies bei einer ausschließlich automatischen Methode der Fall wäre.
elexiko-Demonstrationswortschatz
Der elexiko-Demonstrationswortschatz stellt die erste Stichwortmenge dar, die in elexiko bearbeitet wurde. Er enthält knapp 250 Stichwörter, die die Bandbreite und Strukturierung der Informationen in elexiko illustrieren: Die Stichwörter des Demonstrationswortschatzes sind umfassend in ihrer Bedeutung und Verwendung, in ihrer Orthografie und Grammatik beschrieben. (Für eine Übersicht über den Demonstrationswortschatz klicken Sie bitte hier.)
Bei der Auswahl dieser knapp 250 Stichwörter kamen zwei Kriterien zur Anwendung: Ausgewählt wurden erstens die mithilfe der Kookkurrenzanalyse ermittelten statistisch signifikanten Kookkurrenzpartner, also "Mitspielerwörter" des Nomens Mobilität. Das zentrale Wort Mobilität wurde gewählt, weil die Diskussion hierum, vor allem im beruflichen Kontext, im elexiko-Korpus einen breiten Raum einnimmt und auch allgemein wichtig und aktuell ist, ohne zu sehr religiös oder weltanschaulich gefärbt zu sein. Zweitens wurde diese Menge systematisch ergänzt nach den aus Wörterbüchern bekannten Proportionen von Wortarten, Alphabetstrecken und diversen Wortbildungstypen. Durch diese Auswahl bzw. ihre systematische Ergänzung war es möglich, Schätzungen für die Bearbeitungsdauer des "Lexikons zum öffentlichen Sprachgebrauch" anzufertigen.
Die Stichwörter des elexiko-Demonstrationswortschatzes sind zugleich in überwiegender Zahl Teil des "Lexikons zum öffentlichen Sprachgebrauch", dessen Bearbeitung nach Fertigstellung des Demonstrationswortschatzes begonnen wurde und zurzeit noch andauert.
