zeilenorientierte Eingabe → themenspezifische Fragestellungen → adjektivische Konstruktion »nicht ... un-ADJ« |
Die adjektivische Konstruktion »nicht ... un-ADJ«
Das vorliegende Beispiel zeigt zugleich Anwendungsfälle der folgenden Ergebnispräsentationen:
- Ansicht nach Wort-Types
- Anischt nach Mehrwortspanne
Die grundlegende Suchanfrage
Wir interessieren uns für Adjektive mit Präfix un-, die mit dem Adverb nicht gebildet werden, also z.B. nicht von ungefähr, nicht eindeutig, etc.
Die Suchanfrage wird in einem morpho-syntaktisch annotierten Archiv wie TAGGED-C durchgeführt. Zwischen nicht und dem Adjektiv wollen wir maximal 3 Wörter zulassen. Die Suchanfrage läßt sich wie folgt formulieren, wobei "nicht" zwischen Hochkommata geschrieben werden muss, wenn es als Suchbegriff und nicht als Operator verstanden werden soll:
"nicht" /+w1:4,s0 (MORPH(A) /w0 &un-) |
Die Grundform aller Wörter mit Präfix un wird mit &un- formuliert, außerdem muss die Lemmatisierungsoption sonstige Wortbildungsformen eingeschaltet werden.
Der Ausdruck (MORPH(A) /w0 &un-)
schließlich findet alle Adjektive mit
Präfix un.
Das Ergebnis zählt 103.000 adjektivische Konstruktionen (KWIC-Zeilen), die im folgenden KWIC auszugsweise dargestellt werden:
Abb. 1: KWIC-Ausschnitt für Suchanfrage "nicht" /+w1:4,s0 (MORPH(A) /w0 &un-) |
Die Liste der gesuchten un-Adjektive
Möchte man nun die Adjektive sortieren und nach Wort-Types zusammenfassen, so
geht man wie folgt vor: Die obige Suchanfrage wird so erweitert, dass die Treffer im KWIC
nur noch aus dem Adjektiv bestehen. Dass das Adjektiv in den gefundenen Konstruktionen
immer das letzte Trefferwort ist, erreichen wir, indem wir den Operator
#END
(bzw. #RECHTS
) auf die obige Suchanfrage ansetzen
mit der Auswirkung, dass die Referenz auf das letzte Wort verschoben wird:
#END( "nicht" /+w1:4,s0 (MORPH(A) /w0 &un-) ) |
Nun liefert das neue KWIC nur noch die gefundenen Adjektive auf:
Abb 2.: KWIC-Ausschnitt für Suchanfrage "#END(nicht" /+w1:4,s0 (MORPH(A) /w0 &un-)) |
Die Ansicht nach Wort-Types
Nun können die Adjektive mittels der Ansicht nach Wort-Types zusammengefasst und nach ihrer relativen Häufigkeit sortiert werden. In der folgenden Abbildung sind die häufigsten zu sehen:
Abb 3.: Ansicht nach Wort-Types für "#END(nicht" /+w1:4,s0 (MORPH(A) /w0 &un-)) |
Die Wörter innerhalb von »nicht ... un-ADJ«
Als nächstes könnte man ähnlich verfahren, um sich die häufigsten Wörter zwischen nicht und den Adjektiven auf un- anzeigen zu lassen. Die obige Suchanfrage wird zu diesem Zweck wie folgt angepasst:
#NHIT( "nicht" /+w2:4,s0 (MORPH(A) /w0 &un-) ) |
In diesem Fall wird der Operator #NHIT
eingesetzt, weil er die
Referenz auf die Wörter zwischen den Treffern setzt, die in der Wort-Type-Ansicht
zusammengefasst werden sollen. Außerdem wird der minimale Abstand zwischen
nicht und dem Adjektiv auf 2 gesetzt, um die Fälle auszuschließen, bei denen
das Adjektiv unmittelbar auf nicht folgt.
Von den obigen 103.000 Treffer werden durch die neue Suchanfrage 31.474 KWIC-Zeilen ausgewählt. Diese wiederum lassen sich in der Ansicht nach Wort-Types auf 10.413 Einzelwörter oder Wortkombinationen zusammenfassen. Die häufigsten davon werden in der nächsten Abbildung gezeigt:
Abb 4.: Ansicht nach Wort-Types für die häufigsten Wörter zwischen 'nicht'
und dem Adjektiv, |
Aus der Tabelle kann man somit die in den IDS-Korpora häufigsten Einzelwörter und Wortkombinationen, die in der adjektivischen Konstruktionen nicht ... un-ADJ auftreten, ablesen. Zum Beispiel:
nicht ganz un-ADJ | 11,8% | |
nicht mehr un-ADJ | 5,6% | |
... | ... | |
nicht mehr so un-ADJ | 0,689% |
Die Konstruktion »nicht … un-ADJ« für ausgewählte Adjektive
Interessiert man sich für die adjektivischen Konstruktion eines bestimmten Adjektivs, z.B. für nicht … ...unbedingt, so kann man mit folgender Suchanfrage arbeiten:
#NHIT( "nicht" /+w4,s0 (MORPH(A) /w0 unbedingt) ) |
Die Ansicht nach Wort-Types, angewendet auf das auf diese Weise erzielte Ergebnis, liefert die Einzelwörter und Wortgruppen, die in dieser Konstruktion auftreten.
Die Größe der Konstruktion »nicht … un-ADJ« für ausgewählte Adjektive
Bleiben wir bei unserem Adjektiv unbedingt. Wir möchten wissen, wie groß die Konstruktion nicht … unbedingt in den IDS-Korpora ist. Dazu formulieren wir folgende Suchanfrage:
"nicht" /+w4,s0 (MORPH(A) /w0 unbedingt) ) |
Mittels der Ergebnisauswertung stat. KWIC-Auswertung erfahren wir folgendes:
Abb 5.: statistische KWIC-Auswertung von »nicht … unbedingt« |
Die berechnete Größe umfasst die beiden Treffer nicht und unbedingt und alle Wörter dazwischen. Mit über 95% der Fälle ist somit nicht unbedingt am häufigsten anzutreffen.