[IDS-Logo] Textorganisation unter COSMAS II - STTS-Tagset

STTS-Tagset

Vorbemerkung

STTS bezeichnet das Stuttgart-Tübingen-Tagset, das im TreeTagger Einsatz findet. Die folgende Übersicht über das STTS-Tagset und die Beispiele wurden in Auszügen aus den vorläufigen Guidelines für das Tagging deutscher Textcorpora mit STTS1 entnommen.

Mit Hilfe des TreeTaggers wurden die Texte in den Archiven TAGGED-T und TAGGED-T2 annotiert.

Das STTS-Tagset bietet die drei folgenden Annotationskategorien an:

In der gegenwärtigen Version des eingesetzten TreeTaggers sind allerdings nur die POS-Informationen verfügbar.

Hier geht es zur Übersicht über das STTS-Tagset.

Eingabe

Manuelle Eingabe

Die linguistischen Annotationen des STTS-Tagsets lassen sich einerseit manuell mit dem MORPH-Operator in der Zeileneingabe einsetzen (COSMAS IIwin und COSMAS IIweb). Um zu erfahren, welche Annotationen Sie eingeben können, müssen Sie die hier angegebene STTS-Dokumentation konsultieren.

Wortklasse, lexikalische Kategorie und morph. Merkmale können in beliebiger Reihenfolge notiert werden. Außer Wortklasse sind alle anderen Angaben fakultativ. Zu beachten ist, dass alle Werte großgeschrieben werden müssen und dass sie intern von COSMAS II mit einem logischen UND verknüpft werden, also nicht als Alternativen verstanden werden.

Beispiele:

MORPH(VAFIN)
MORPH(VAFIN 1 SG PRES KONJ)

Eingabe-Assistent

COSMAS IIweb stellt einen MORPH-Assistenten bereit, mit dem sich die Annotationen bequem eingeben lassen.

COSMAS IIwin verfügt (im Gegensatz zum MECOLB-Tagset, das im Archiv TAGGED-M eingesetzt wird) für das STTS-Tagset leider über keinen MORPH-Assistenten.

Anzeige der linguistischen Annotationen

COSMAS IIweb: in den Optionen für die Anzeige der Volltexte bzw. Belege und in den Optionen für den Export können Sie die linguistischen Annotationen ein- und ausblenden.

COSMAS IIwin: in den Optionen für die Anzeige der Volltexte bzw. Belege und in den Optionen für den Export können Sie die linguistischen Annotationen ein- und ausblenden.


1 Vorläufige Guidelines für das Tagging deutscher Textcorpora mit STTS; Anne Schiller, Simone Teufel, Christine Stöckert, Universität Stuttgart, Institut für maschinelle Sprachverarbeitung, Christine Thielen, Universität Tübingen, Seminar für Sprachwissenschaften; Draft, 14. November 1995.

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018