Syntax der Zeileneingabe → Suchoperatoren → Wortformoperatoren → Wortformlistenoptionen |
Listenoptionen
Allgemeine Beschreibung
Suchbegriffe, die Wortformlisten erzeugen, können mit verschiedenen Listenoptionen versehen werden. Somit können die folgenden Suchbegriffe Listenoptionen enthalten:
- Wortformen mit Platzhaltern;
- Lemma-Suche mit dem Grundformoperator;
- Lemma-Suche mit den erweiterten Lemma-Optionen;
- reguläre Ausdrücke auf Wortformen.
Zu den Listenoptionen gehören die folgenden Angaben:
- Angabe eines Wortfrequenzfilters;
- Angabe eines Wortlistensegments;
- Angabe von Textpositionen.
Wortfrequenzfilter und Wortlistensegmente sind reine Wortformlistenoptionen: sie beziehen sich direkt auf die aufzubauende Wortformliste und beeinflussen ihren Inhalt.
Textpositionen hingegen beeinflussen die Wortformliste nicht, sondern wirken sich erst auf die danach stattfindende Recherche im Text aus. Außerdem lassen sich Textpositionen nicht nur auf Wortformen anwenden, sondern auch auf Annotationen und komplexere Suchanfragen1.
Formulierung von Listenoptionen
Listenoptionen werden mittels einer der beiden folgenden Formen spezifiziert, wobei der ':' als Trennzeichen dient.
Dabei bildet, unter den Wortformoperatoren, der #REG-Operator eine Ausnahme, da ihm nur mittels des #BED-Operators Listoptionen angehängt werden können.
Allgemeine Formulierung
|
Bei opt1, opt2,
etc. handelt es sich um die oben aufgeführten
Listenoptionen. Alle Optionen sind optional und können in beliebiger Reihenfolge
angegeben werden, wobei jede Option sinnvollerweise höchstens 1 Mal erscheinen
sollte.
Beispiele
*geachtet*:F>10:sa,-se:#2 |
Der Suchbegriff wird in diesem ersten Beispiel durch ein Frequenzfilter, zwei Bedingungen über die Textposition und eine Listsegmentnummer ergänzt.
#BED(#REG(^[A-Z][a-z]{2,10}$), :F>10:sa,-se:#2) |
In diesem 2. Beispiel wird dieselbe Sequenz von Listenoptionen auf einen
regulären Ausdruck mittels des #BED
-Operators angewandt.
Nicht realisierte Formulierungen
Für reguläre Ausdrücke müssen die Listenoptionen notwendigerweise mittels des #BED-Operators, wie oben vorgestellt, eingegeben werden. Anbei zwei Formulierungen ohne #BED, die von COSMAS II nicht verstanden werden:
#REG(^[A-Z][a-z]{2,10}$:F>10:sa,-se:#2) |
Bemerkung: innerhalb von #REG können keine Listenoptionen an den regulären Ausdruck angehängt werden.
#REG(^[A-Z][a-z]{2,10}$):F>10:sa,-se:#2 |
Bemerkung: an den Operator #REG können keine Listenoptionen angehängt werden.
1: Textpositionen werden der Einfachheit halber zu den Listenoptionen gezählt, da in der Suchanfragesprache rein syntaktisch nicht zwischen ihnen unterschieden wird.