Digitale Sprachwissenschaft

COSMAS-I-Rückblick
Corpus Search, Management and Analysis System

Morphosyntaktische Annotationen

In den automatisch morphosyntaktisch analysierten und annotierten (getaggten) Korpora sind den Textwörtern Annotationen als (dem Benutzer unsichtbare) Attribute zugefügt worden:

Textwort#ANA#WORTKLASSE#Merkmal_1#Merkmal_2#...#,

z.B.: Tisch#ANA#NOU#com#sg#m#dat#.

Die morphosyntaktischen Annotationen sind gültige Suchobjekte (eine diesbezügliche Liste ist abrufbar). Das bedeutet, dass sie sich direkt suchen lassen, dass Elemente in einer Annotationskette durch den Platzhalteroperator * ersetzt werden können und dass sie mit anderen Suchobjekten kombinierbar sind.

Zur einfachen Formulierung von Annotationssuchbegriffen steht in der WWW-Version von COSMAS I ein interaktiver CosmasAnnotationsAssistent zur Verfügung. In einem Java-fähigen Browser wird an dieser Stelle eine Demonstration des AnnotationsAssistenten gestartet. In Ihrem Browser ist Java leider nicht aktiviert.

 

Beispiel-Suchanfragen in Bezug auf morphosyntaktische Annotationen:

#ANA#AUX#pl#*#1#*
sucht nach Hilfs-/Modalverben in der 1. Person Plural, z.B.:
 
wir müssen / können / sollen / konnten
haben / wollen / hatten / werden
könnten / sollten / hätten
 
#ANA#VRB*fut*
sucht nach Verbformen im Futur I und II, z.B.:
 
..., später werde ich dir alles erzählen.
... wird die Umstellung am 14. April abgeschlossen sein ...
 
#ANA#ADJ*sup*gen*
sucht nach allen Adjektiven im Superlativ und dazu im Genitiv, z.B.:
 
einer der beliebtesten deutschen Filmstars
 
wertvollen /+w1 #ANA#NOU*pl*acc*
sucht nach der Wortform wertvollen, gefolgt von Substantiven im Akkusativ Plural, z.B.:
 
für seine wertvollen Informationen
 
zu /w0 #ANA#AUX*
sucht nach Infinitiven mit zu, z.B.:
 
... die Chance zu nutzen.
 ... Schulden beglichen zu haben ...
 
#ANA#ADV*pref* /w0 auf
sucht nach dem abgetrennten Verbpräfix auf, z.B.:
 
wies ... auf  [aufweisen]
rufen ... auf [aufrufen]
 
&nehmen /+s0 #ANA#ADV*pref*
sucht nach Verbformen von nehmen und nachgestellten abgetrennten Verbpräfixen innerhalb eines Satzes, z.B.:
 
nahmen ... ein [einnehmen]
nimm ... hoch  [hochnehmen]
 
für /+w2 (#ANA#NUM#* #ANA#NOU#*#pl#*#acc#*)
sucht nach der Präposition für und - im Abstand von ein bis zwei Wörtern ihr nachgestellt - nach Numeralia, gefolgt von Substantiven im Akkusativ Plural, z.B.:
 
für mindestens zwei Tage für 50 Pfennige

 

Die Wortklassen, Merkmale und deren Wertebereiche basieren auf dem MECOLB-Minimal-Tagset, s. Jan Cloeren, Morphosyntaktische Annotationen in einem mehrsprachigen Umfeld (in LDV-Info, Heft 8, IDS Mannheim, 1996).

 

zu COSMAS I