Zeileneingabe → Problemstellungen und Lösungen |
Problemstellungen und Lösungen
Übersicht
Auf den folgenden Seiten werden zumeist einfache sprachwissenschaftliche
Problemstellungen betrachtet, die in nachvollziehbare Suchanfrage-Beispiele
umgesetzt werden.
Erläuterungen und Rückverweise auf die zugehörigen Seiten der Syntax (der
zeilenorientierten Suchanfragesprache) runden die Sammlung ab:
- Suche mit Flexionsformen
- Suche mit Komposita (Wortbildungformen)
- Suche mit Ableitungen (Wortbildungsformen)
- Suche mit oder ohne Berücksichtigung der Groß-/Kleinschreibung
- Suche nach trennbar zusammengesetzten Verben
- Logische Operatoren als Suchbegriffe
- Suche nach Satzzeichen bzw. Wörtern mit Satzzeichen
- Suche nach orthografischen Varianten
- Suche nach Wortgruppen
- Suche innerhalb eines Satzes
- Suche mit morphosyntaktischen Annotationen
- Eine Sammlung komplexerer, themenspezifischer Problemstellungen und deren Lösung ist ebenfalls für die zeilenorientierte Syntax verfügbar.
Suche mit Flexionsformen
Beispiele
Die nachfolgenden Beispiel-Suchanfragen stellen Anwendungen des Grundformoperators dar. In den Optionen zur Lemmatisierung ist lediglich Flexionsformen aktiviert.
Beispiel 1
&Mond
|
Nach Starten dieser Suchanfrage werden sämtliche ermittelten Flexionsformen des Substantivs Mond in einer temporären Wortformenliste präsentiert.
Beispiel 2
Wenn Sie an Wortformen verschiedener Wortarten zu einem bestimmten Wortstamm interessiert sind, ist es ratsam, mit den einzelnen Grundformen der verschiedenen Wortarten (insbesondere mit dem Substantiv und dem Verb) suchen zu lassen.
&Spiel &spielen
|
Bei der ersten Suchanfrage erhalten Sie alle vorhandenen Flexionsformen des Substantivs Spiel, bei der zweiten alle des Verbs spielen.
- Die Groß-/Kleinschreibung am Wortanfang ist für den Grundformoperator
von Bedeutung. Substantive als Grundformen müssen am Wortanfang groß
geschrieben werden, für alle anderen Wortklassen gilt die Kleinschreibung.
Die Einstellungen zur Groß-/Kleinschreibung in den Optionen zur Suche sind dagegen beim Grundformoperator wirkungslos.
Beispiel 3
Wortformen zu gleichlautenden Grundformen verschiedener Wortarten sind in einer einzigen temporären Wortformenliste zusammengefasst.
&sein
|
In der temporären Wortformenliste sind alle im aktiven Korpus vorhandenen Wortformen zum Verb "sein" und zum Possessivpronomen "sein" aufgelistet.
- Wenn Sie mit einer Grundform einer bestimmten Wortart arbeiten
wollen, die in ihrer Schreibweise mit Grundformen anderer
Wortarten identisch ist, müssen Sie in der temporären Wortformenliste
die eindeutig nicht zu der interessierenden Grundform
gehörenden Wortformen abwählen.
Gleichlautende Wortformen verschiedener Wortarten (z.B. sein als Infinitiv des Verbs und als Possessivpronomen) sind in der Wortformenliste nur einmal aufgeführt und müssen angewählt sein. COSMAS II kann bei gleichlautenden Wortformen die Wortarten nicht unterscheiden.
Suche mit Komposita (Wortbildungsformen)
- Detaillierte Informationen zur Wortbildung und den erwähnten Wortbildungstypen finden Sie in grammis, dem grammatischen Informationssystem des IDS.
- Für die Generierung von Komposita können die erweiterten Lemmatisierungsoptionen eingesetzt werden.
Beispiele
Die nachfolgenden Beispiel-Suchanfragen stellen Anwendungen des Grundformoperators dar. In den Optionen zur Lemmatisierung ist neben Flexionsformen zusätzlich Komposita aktiviert.
Beispiel 1
&trinken
|
In der Wortformliste erhalten Sie Einträge aus verschiedenen Wortklassen, darunter probetrinken und Zaubertrank, aber auch trinkfest, Trinkgeld und Plastiktrinkbecher mit ihren sämtlichen vorkommenden Flexionsformen.
Beispiel 2
&gescheit
|
In der Wortformliste finden sich u.a. die Komposita blitzgescheit, dreimalgescheit oder auch siebengescheit.
Beispiel 3
Für diese Suchanfrage ist in den Optionen zur Lemmatisierung neben Flexionsformen und Komposita zusätzlich Spezialfälle aktiviert.
Bei den Spezialfällen werden Wortformen mit Besonderheiten in der Schreibweise ermittelt, mit Binde-/Schrägstrichen, aber auch mit Apostrophen, numerischen Einheiten oder sogar Satzzeichen, wo die Wortgrenzen von COSMAS II nicht eindeutig erkannt werden.
&trinken
|
In der Wortformliste werden daher solche Einträge wie Trinken/Essen, "Trink"wasser, Trink-Brüderlein-trink-Animier-Schmäh oder trinken?"Doch aufgelistet.
- Da bei den Spezialfällen unter anderem auch korrekte Komposita
(mit abweichender Schreibweise) gefunden werden, sollte diese Option mit
Komposita kombiniert werden, um eine möglichst umfangreiche Liste
von Wortformen dieses Wortbildungstyps zu erhalten.
Unsinnige Wortformen (z.B. mit Satzzeichen) können problemlos für die nachfolgende Suche deaktiviert werden.
Suche mit Ableitungen (Wortbildungsformen)
- Detaillierte Informationen zur Wortbildung und den erwähnten Wortbildungstypen finden Sie in grammis, dem grammatischen Informationssystem des IDS.
Beispiele
Die nachfolgenden Beispiel-Suchanfragen stellen Anwendungen des Grundformoperators dar. In den Optionen zur Lemmatisierung ist neben Flexionsformen zusätzlich Sonstige Wortbildungsformen aktiviert.
Beispiel 1
&trinken
|
In der Wortformliste erhalten Sie beispielsweise als Einträge die Verben antrinken, austrinken und wegtrinken, aber auch die Adjektive trinkbar und untrinkbar (eine zweifache Ableitung) mit ihren sämtlichen vorkommenden Flexionsformen.
Beispiel 2
&gescheit
|
In der Wortformliste finden Sie nun die Ableitungen pseudogescheit oder auch urgescheit.
Die dort ebenfalls vorhandenen obergescheit, mittelgescheit und supergescheit sind - was ihren Wortbildungstyp angeht - dagegen in Fachkreisen etwas umstritten, da sie je nach Auffassung entweder den Komposita (ober, ... super sind eigenständige Wortformen) oder den Ableitungen (ober-, ... super- sind Präfixe) zugeordnet werden.
-
Das Auftreten der Wortformen mit den Morphemen ober, ... super ist
ein guter Beleg dafür, dass die Lemmatisierung in COSMAS
II über kein festes abgeschlossenes Regelinventar oder eine feste
Wortliste verfügt, mit deren Hilfe die Zuordnung von Wortformen zu Grundformen
hergestellt wird.
Die Zuordnung der Lemmatisierungsoptionen zu bestimmten Wortbildungstypen ist daher ebenfalls nur in Grenzen möglich.
Suche mit Affixen
- Um die Suche mit Affixen zu aktivieren, schalten Sie bitte die Lemmatisierungsoption
sonstige Wortbildungsformen ein. Die anderen Lemmatisierungsoptionen
können ebenfalls dazugeschaltet werden, sie sind jedoch optional.
Außerdem müssen Sie einen Bindestrich an der geeigneten Stelle einsetzen, um Präfixe und Suffixe zu kennzeichnen.
Beispiel 3
&-heit &zer-
|
Durch den Einsatz des Grundformoperators können auch Präfixe (mit nachgestelltem Bindestrich) und Suffixe (mit vorangehendem Bindestrich) als Suchbegriffe eingegeben werden.
Die erste Suchanfrage liefert eine sehr große Anzahl an Wortformen (in der Regel Substantive) mit dem Suffix -heit, die zweite alle vorkommenden Wortformen (Substantive, Verben und Adjektive), in denen das Präfix zer- auftritt, von alleszerstörende bis Unzerbrechlichkeit.
- Siehe die Liste der suchbaren Affixe
- Falls über den Grundformoperator auch solche Wortformen
ermittelt werden sollen, die durch
mehrfache Wortbildungen unterschiedlichen Typs entstanden sind
(alleszerstörende ist beispielsweise ein Kompositum,
dessen zweite Einheit aus einer Ableitung hervorgegangen ist),
dann ist es ratsam, die verschiedenen Lemmatisierungsoptionen
miteinander zu kombinieren.
Es ist nicht immer vorhersehbar, welcher Wortbildungstyp bei Kombinationen als relevant für eine angewählte Option angesehen wird.
Suche mit oder ohne Berücksichtigung der Groß-/Kleinschreibung
Beispiele
Wenn Ihre Suchanfrage grundsätzlich die Groß-/Kleinschreibung nicht beachten soll, reicht es, die Suchoption Groß-/Kleinschreibung beachten zu deaktivieren, andernfalls muss diese Option aktiviert sein.
Beispiel 1
sein Sein
|
Bei deaktivierter Suchoption Groß-/Kleinschreibung beachten
sind die obigen Suchanfragen identisch.
Bei aktivierter Suchoption Groß-/Kleinschreibung beachten
liefert die erste Anfrage nur Treffer für "sein", die zweite Anfrage
nur Treffer für "Sein".
Beispiel 2
Die Suchanfrage nach dem Wort "Sein" soll trotz aktivierter Suchoption Groß-/Kleinschreibung beachten die Groß-/Kleinschreibung ignorieren:
$Sein |
In diesem Fall setzen Sie den
Ignorierungsoperator $
an den Anfang des Suchbegriffs.
Beispiel 3
Ihre Suchanfrage setzt sich aus den Suchbegriffen "Tag", "offenen" und "Tür" zusammen. Sie möchten aber für den Suchbegriff "offenen" die Groß/Kleinschreibung ignorieren, während für die übrigen Suchbegriffe die Groß-/Kleinschreibung beachtet werden soll.
(Tag /+w2 $offenen) /+w1 Tür |
Durch das Setzen des Ignorierungsoperators vor "offenen" werden sowohl Treffer für "Tag der offenen Tür" als auch für "Tag der Offenen Tür" ermittelt.
- Der Ignorierungsoperator
$
ist nur dann wirksam bzw. sinnvoll, wenn die Suchoption Groß-/Kleinschreibung beachten aktiviert ist.
Suche nach trennbar zusammengesetzten Verben
Beispiele
Beispiel 1
Sie möchten alle Belege für das Verb "herausfordern" erhalten, bei dem das Präfix vom Verbstamm abgetrennt ist.
fordern /+s0 heraus |
Benutzen Sie dazu den Satzabstandsoperator
/s0
, damit für beide Suchbegriffe nur
Belege in ein und demselben Satz gefunden werden. Gehen Sie davon aus, dass das Präfix
nach dem Verb vorkommt, benützen Sie den gerichteten Satzabstand /+s0
.
Beispiel 2
Möchten Sie zusätzlich Treffer für alle Konjugationsformen von "fordern"
erhalten, fügen Sie den Grundformoperator
&
am Wortanfang von "fordern" ein.
&fordern /+s0 heraus
|
Beispiel 3
Zu guter Letzt erhalten Sie auch noch das zusammengesetzte Verb
"herausfordern" mit allen Konjugationsformen, indem Sie
die bisherige Suchanfrage um eine ODER
-Verknüpfung
mit dem Suchbegriff "herausfordern", das seinerseits mit dem Grundformoperator
versehen ist, erweitern.
&herausfordern oder (&fordern /+s0 heraus)
|
Logische Operatoren als Suchbegriffe
Beispiele
Sollen die Wörter "und, "oder", "nicht", "and", "or", "not", die in der Suchanfragesprache logische Operatoren darstellen, selbst Suchbegriffe sein, sind sie in Anführungsstriche zu setzen.
Beispiel 1
bevor /+w5 "nicht" |
In diesem Beispiel wird nach dem Wort "bevor" mit einem Wortabstand von höchstens 5 Wörtern zum nachfolgenden Wort "nicht" gesucht.
Beispiel 2
groß "oder" klein Kind "und" Kegel
|
In diesen beiden Suchanfragen findet je nach Einstellung der Suchoption
Weggelassener Operator bedeutet entweder eine
logische ODER
-Verknüpfung
der drei Suchbegriffe "groß", "oder", "klein" bzw. "Kind", "und", "Kegel"
oder eine Verknüpfung mittels Wortabstand
/+w1
statt.
Suche nach Satzzeichen bzw. Wörtern mit Satzzeichen
Beispiel 1
Zielt Ihre Suche auf ein Suchwort mit unmittelbar nachgestelltem
Satzzeichen ab, können Sie den
Wortabstandsoperator in der Form
/w0
(im Abstand von 0 Wörtern) einsetzen:
heißt /w0 ,
|
Ihr Suchergebnis enthält die gewünschten Treffer.
(+
und -
sind beim Abstand
von 0 Wörtern nicht wirksam.)
Beispiel 2
Wenn Sie den Wortabstandsoperator in der Form /+w1
einsetzen, sucht COSMAS II implizit mit dem Abstand
/+w0:1
, d.h. mit einem Wortabstand von 0 bis 1 Wort.
Ihr Suchergebnis enthält somit zum einen Treffer, in denen
zwischen heißt und
Komma ein weiteres Wort steht, z.B. "... heißt auch, ...".
heißt /+w1 ,
|
Zum anderen sind auch die Treffer der Suchanfrage "heißt /w0 ,
" in
der Ergebnismenge enthalten.
Beispiel 3
Wollen Sie tatsächlich, dass das Komma im obigen Beispiel nur dem Nachfolgewort von heißt angehängt ist, muss die Suchanfrage wie folgt lauten:
heißt /+w1:1 ,
|
Beispiel 4
Zielt Ihre Suche auf ein Suchwort mit unmittelbar vorangestelltem
Satzzeichen ab, erbringt der Wortabstandsoperator in
der Form /w0
nicht die gewünschten Treffer.
Korrekt ist ein Abstand von minimal und maximal 1 Wort, wie in den
beiden folgenden Suchanfrage-Beispielen.
Beide Bespiele liefern im Übrigen dieselbe Trefferliste:
, /+w1:1 daß daß /-w1:1 ,
|
Beispiel 5
Suchen Sie nach einem "wenn", das nicht auf ein Komma folgt, muss die Suchanfrage wie folgt mit dem trefferausschließenden Abstandsoperator formuliert werden:
wenn %-w1:1 ,
|
In diesem Fall muss man mit dem negativen Abstand arbeiten (siehe auch nächstes Beispiel).
Beispiel 6
Versucht man in Umkehrung von Beispiel 5 die Suchanfrage mit dem positiven Abstand zu formulieren, erhält man als Treffermenge alle Kommas, die nicht vor einem "wenn" stehen.
, %+w1:1 wenn
|
Beispiel 7
Wenn Sie nach "das heißt," oder der entsprechenden Abkürzung "d. h. (oder der Variante "d.h.")," suchen möchten, kann folgende Suchanfrage verwendet werden:
((das /+w1 heißt) oder (d. /+w1 h.) oder d.h.) /w0 ,
|
Beachten Sie die Klammerung für die Varianten "das heißt" bzw. "d. h."
bzw. "d.h.", da alle drei Suchbegriffe den Wortabstand
/w0
zum nachfolgenden Komma haben sollen.
Beispiel 8
Anführungszeichen müssen mir einem \ vorangestellt werden.
Suchen Sie nach einem Wort wie z.B. nicht, dass in der COSMAS II-Suchanfragesprache ein Operator ist, müssen Sie es zwischen Anführungszeichen schreiben, damit COSMAS II es als Suchbegriff erkennt. Aus diesem Grund haben Anführungszeichen selber auch eine Art Operatorfunktion. Wenn Sie nach Anführungszeichen suchen, sollen die Anführungszeichen also selber von COSMAS II als Suchbegriff verstanden werden, müssen sie mit einem \ vorangestellt werden:
"nicht" /w0 \"
|
Beachten Sie hierbei außerdem, dass der Wort-0-Abstand ungerichtet ist. Sie können mit ihm nicht festlegen, ob das Anführungszeichen am Anfang oder am Ende des Wortes steht. Die Trefferliste enthält sowohl nicht" als auch "nicht und "nicht".
Suche nach orthografischen Varianten
Beispiele
Beispiel 1
Möchten Sie nach einem Wort wie "Schiffahrt" suchen, dessen Schreibweise im Zuge der Rechtschreibreform zu "Schifffahrt" geändert wurde, hilft Ihnen folgende Suchanfrage:
Schif+fahrt
|
Mit Hilfe des Platzhalteroperators
+
(0 oder 1 Zeichen)
erhalten sie dennoch Treffer für beide Schreibweisen.
Oder etwas aufwändiger notiert mit Hilfe des
logischen Operators
ODER
:
Schiffahrt Schifffahrt Schiffahrt ODER Schifffahrt
|
Beispiel 2
Suchen Sie nach einem Wort wie "Fluß", dessen Schreibweise
im Zuge der Rechtschreibreform zu "Fluss" geändert wurde, gibt es
ebenfalls mehrere Möglichkeiten.
Entweder mit dem logischen Operator
ODER
:
Fluss Fluß Fluss ODER Fluß
|
Oder man macht sich die Besonderheit des Grundformoperators & hinsichtlich des ß zunutze:
&Fluss
|
Hierbei erhalten Sie allerdings neben der jeweiligen Grundform auch alle Flexionen von "Fluss" bzw. "Fluß" als Treffer.
Suche nach Wortgruppen
Beispiele
Beispiel 1
Angenommen, Sie brauchen Belege für die Wortgruppe "Willkommen und Abschied". Ihre Suchanfrage könnte heißen:
Willkommen /+w2 Abschied
|
Selbstverständlich können Sie auch das "und" (in diesem Fall kein logischer Operator) in die Suchanfrage einbringen, müssen dann aber mit einem längeren Suchlauf rechnen. Ihre Suchanfrage könnte heißen:
(Willkommen /+w1 "und") /+w1 Abschied
|
Enthält die Suchanfrage wie in diesem Fall mehr als einen Abstandsoperator, müssen Sie runde Klammern setzen.
Wenn Sie außerdem die Wortgruppe "Willkomm und Abschied" berücksichtigt wissen wollen, könnte Ihre Suchanfrage heißen:
(Willkommen oder Willkomm) /+w2 Abschied
|
Auch möglich, aber zeitaufwändiger:
((Willkommen oder Willkomm) /+w1 "und") /+w1 Abschied
|
Beispiel 2
Angenommen, Sie brauchen Belege für die Wortgruppe "Tag der offenen Tür". Ihre Suchanfrage könnte heißen:
(Tag /+w2 offenen) /+w1 Tür
|
Wenn Sie außerdem Flexionsformen zu "Tag" und eventuell auch zu "Tür" berücksichtigen wollen und vermuten, dass "offenen" auch groß geschrieben vorkommen könnte, benutzen Sie den Grundformoperator:
(&Tag /+w2 $offenen) /+w1 &Tür
|
Auch möglich, aber zeitaufwändiger, weil das hochfrequente der auch gesucht werden muss:
((&Tag /+w1 der) /+w1 $offenen) /+w1 &Tür
|
Suche innerhalb eines Satzes
Beispiele
Beispiel 1
Angenommen, Sie brauchen Belege für das Adverb "offen" im Zusammenhang mit dem Verb "sprechen" (einschließlich konjugierter Formen) innerhalb eines Satzes. Ihre Suchanfrage könnte heißen:
offen /s0 &sprechen
|
Verwenden Sie dazu den Satzabstandsoperator
/s0
, wobei mit dem Wert "0" der Bereich für beide
Suchbegriffe auf jeweils denselben Satz beschränkt wird.
Beispiel 2
Angenommen, Sie brauchen Belege für "Landschaft" und "schauen" oder "Gegend" und "schauen" innerhalb eines Satzes. Ihre Suchanfrage könnte heißen:
(Landschaft oder Gegend) /s0 &schauen
|
Beispiel 3
Der 0-Satzabstand kann auch mit dem +
oder
-
eingesetzt werden. Die Treffer werden dann
innerhalb eines Satzes in der gewünschten Reihenfolge gesucht.
&fordern /+s0 heraus
|
Es werden konsequenterweise nur Treffer ermittelt, bei denen eine konjugierte Form von "fordern" vor der Partikel "heraus" auftritt.
Suche mit morphosyntaktischen Annotationen im Archiv TAGGED-M
Beispiele
- Die in den nachfolgenden Beispielen verwendete Reihenfolge bei der Erstellung der Suchanfrage ist nicht zwingend.
Beispiel 1
Gesucht wird nach aktiven Verben im Tempus Präteritum oder Perfekt, deren Genus nicht Neutrum ist.
Im morphosyntaktischen Assistenten wählen Sie die Wortklasse Verb an und dort nacheinander
- im Merkmal Genus Verbi den Wert aktiv mit Schalter ,
- im Merkmal Tempus den Wert Präteritum/Perfekt mit Schalter und
- im Merkmal Genus den Wert Neutrum mit Schalter .
Der morphosyntaktische Assistent generiert daraus den Suchausdruck
MORPH(VRB npas past -n)
|
Beispiel 2
Gesucht wird nach dem Wort der als Relativpronomen im Dativ.
In diesem Beispiel ist das Wort der mit mehreren Bedingungen, die über einen Annotations-Suchausdruck formuliert werden können, verknüpft. Als Verknüpfungsoperator wird daher der Wortabstandsoperator verwendet:
der /w0
|
Anschließend muss noch der fehlende Annotations-Suchausdruck generiert werden.
Im morphosyntaktischen Assistenten wählen Sie die Wortklasse Pronomen an und dort nacheinander
- im Merkmal Art den Wert relativ mit Schalter und
- im Merkmal Kasus den Wert Dativ mit Schalter .
Der morphosyntaktische Assistent generiert daraus den Suchausdruck
MORPH(PRN rel dat)
|
und kopiert ihn nach Verlassen des Assistenten in die Suchanfrage:
der /w0 MORPH(PRN rel dat)
|
Beispiel 3
Gesucht werden alle Substantive im Dativ, denen in einem maximalen Abstand von drei Wörtern ein Relativpronomen im Dativ folgt.
Im morphosyntaktischen Assistenten wählen Sie die Wortklasse Substantiv an und dort
- im Merkmal Kasus den Wert Dativ mit Schalter .
Der morphosyntaktische Assistent generiert daraus den Suchausdruck
MORPH(NOU dat)
|
An die bestehende Suchanfrage hängen Sie nun den
Wortabstandsoperator
/+w3
an und rufen anschließend erneut den
morphosyntaktischen
Assistenten auf. Wählen Sie die
Wortklasse Pronomen an und dort nacheinander
- im Merkmal Art den Wert relativ mit Schalter und
- im Merkmal Kasus den Wert Dativ mit Schalter .
Der morphosyntaktische Assistent generiert daraus den Suchausdruck
MORPH(PRN rel dat)
|
und kopiert ihn nach Verlassen des Assistenten in die Suchanfrage:
MORPH(NOU dat) /+w3 MORPH(PRN rel dat)
|