Syntax der grafischen Eingabe → Suchoperatoren → Wortformoperatoren → Operator WORT |
Operator WORT
deutsche Bezeichnung | interne Bezeichnung |
WORT | STR(<S>) |
Allgemeine Beschreibung
- Suchoperator für Wortformen.
- Als Wortformen werden Zeichenketten basierend auf dem Zeichensatz ISO Latin1 akzeptiert.
- Es können gleichzeitig mehrere Suchbegriffe eingegeben werden, die implizit als Alternativen (ODER-Verknüpfung) hehandelt werden.
- Siehe auch:
WORT-UND
,WORT-ODER
.
Platzhalter
- Der Platzhalter * steht für 0, 1, 2, … beliebige Zeichen.
- Der Platzhalter + steht für 0 oder 1 beliebiges Zeichen.
- Der Platzhalter ? steht für genau 1 beliebiges Zeichen.
- Die Platzhalter können mehrmals innerhalb einer Wortform eingesetzt werden,
- und sie können an jede beliebige Stelle einer Wortform plaziert werden.
- Beim Einsatz des Platzhalters * müssen mindestens zwei Buchstaben spezifiziert werden.
- Die Platzhalterfunktion kann aufgehoben werden, indem ein \ vorangestellt wird.
Berücksichtigung von Groß- und Kleinschreibung sowie von diakritischen Zeichen
- Standardmäßig gelten die voreingestellten globalen Optionen.
- Hinzu kommt, dass Sie die Optionen für Suchbegriffe einzeln verändern können.
Eingabe von Sonderzeichen
- Sonderzeichen, die nicht im Standardzeichensatz von COSMAS II liegen, also nicht in ISOLat1 bzw. ISO-8859-1, können als XML-Zeichen mit dezimalem UNICODE-Wert eingegeben werden. Beispiel: "…" für Auslassungspunkte '…'.
- Eine Ausnahme innerhalb ISOlat1 bildet das Et-Zeichen '&', das wegen seiner Funktion in HTML- und UNICODE-Zeichenkodierungen ebenfalls als & kodiert ist und als solches gesucht werden muss (siehe folgendes Beispiel).
Angabe einer Textposition
Durch Angabe einer oder mehrerer Textposition(en) kann festgelegt werden, an welchen Stellen eines Satzes, Absatzes oder Textes das Wort gesucht oder nicht gesucht werden soll. Siehe Beispiele.
- Die nachfolgenden Beispiele werden der Klarheit halber ohne Apostrophe angegeben. Damit sollen bei Beispielen mit Apostrophen Mehrdeutigkeiten vermieden werden.
Beispiel 1
WORT(gehen) |
Suche nach gehen, und je nachdem, wie die Suchoptionen eingestellt sind, auch nach Gehen, GEHEN, etc.
Beispiel 2
WORT(geh* ging gegangen) |
Suche nach ging, gegangen
und Zeichenketten, die mit geh beginnen.
Um eine vollständige Liste von Flexionsformen von gehen zu erhalten,
benutzt man am besten den Lemmatisierungsoperator.
Beispiel 3
WORT(Eg: *arbeit*) |
Suche nach großgeschriebenen Zeichenketten (man beachte die lokale Option Eg: für Erstes Zeichen groß), die die Teilkette arbeit enthalten. Siehe auch die Beispiele von Kombinationen von globalen Optionen mit Optionen, die in die Suchausdrücke geschrieben werden.
Beispiel 4
WORT(Schif++fahrt) |
Suche nach Schiffahrt mit 0-2 Zeichen zwischen den beiden
fs.
Liefert Textstellen mit: Schiffahrt,
Schifffahrt, Schiffsfahrt, Schiff-fahrt, etc.
Beispiel 5
WORT(Schif+fahrt?*) |
Suche nach Schiffahrt mit 0-1 Zeichen zwischen den beiden fs und mindestens 1 Zeichen (man beachte die Kombination ?*) am Ende von Schiffahrt.
Suchanfragen an bestimmten Textpositionen (neu)
Beispiel 1
WORT(wenn:pa) |
Die spezifizierte Textposition :pa gibt an, dass das Wort wenn nur am Anfang von Absätzen gesucht werden soll.
Beispiel 2
WORT(aber:se) |
Die spezifizierte Textposition :se gibt an, dass das Wort aber nur am Ende von Sätzen gesucht werden soll.
Beispiel 3
WORT(aber:-sa,-se) |
Die spezifizierten Textpositionen :-sa,-se geben an, dass das Wort aber weder am Satzanfang noch am Satzende gesucht werden soll.
Suchanfragen mit dem rückwärtsgeschriebenen Schrägstrich \
Der rückwärtsgeschriebene Schrägstrich (engl. backslash) wird dazu
benutzt, die Funktion von Zeichen wie den Platzhalteroperatoren
*?+
aufzuheben. Soll er als Suchzeichen eingesetzt werden, muss seine
Aufhebungsfunktion ihrerseits auch aufgehoben werden. Dies wird durch
Verdoppelung des Schrägstrichs erreicht.
Beispiel 1
WORT(\?) |
Suche nach dem Fragezeichen.
Beispiel 2
WORT(\\) |
Suche nach dem rückwärtsgeschriebenen Schrägstrich.
Beispiel 3
WORT(\\\\*) |
Suche nach einer Folge von mindestens zwei rückwärtsgeschriebenen Schrägstrichen.
Suchanfragen mit Sonderzeichen wie Satzzeichen und Apostrophe
Die Wortformanfragen werden intern über bereinigte Wortformen
ausgeführt, d.h. solche Wortformen, die an beiden Enden von Sonderzeichen
wie Satzzeichen und Apostrophen bereinigt wurden. Damit erzielt COSMAS II
zusätzlich auch dort Treffer, wo die gesuchte Wortform im Text mit
einer beliebigen Kombination dieser Zeichen auftritt.
Bei der Bereinigung werden die Sonderzeichen innerhalb der Wortformen
hingegen nicht entfernt.
- Ausnahme: Bei Abkürzungen wird der Punkt nicht bereinigt, muss also im Suchbegriff eingegeben werden.
Beispiel
WORT(88) |
Damit werden Textstellen wie 88, 88', '88, »88'«, »88'«!, etc. gefunden.
Suche nach Wortformen mit einem bestimmten Sonderzeichen
Suchen Sie gezielt nach Wortformen mit einem bestimmten Sonderzeichen, z.B. einem Wort mit Komma oder Punkt, sollten Sie das Sonderzeichen nicht mit der Wortform, sondern getrennt davon mit Hilfe des 0-Wortabstands wie in den nachfolgenden Beispielen angeben. Dabei können Sie leider nicht bestimmen, ob das Sonderzeichen vorne oder hinten vorkommt.
Beispiel 1
ABSTAND(WORT(88),w0,WORT(')) |
Suche nach 88 mit Apostroph. Gefundene Textstellen sind z.B. 88', '88, »88'«, »88'«!, etc.
Beispiel 2
ABSTAND(WORT(88),w0,WORT(,)) |
Suche nach 88 mit Komma. Gefundene Textstellen sind z.B. "… am Ende von 88, als…"
Beispiel 3
WORT(88!) |
Formulierung falsch: liefert keine Treffer, weil das Sonderzeichen intern in der bereinigten Form nicht mehr vorkommt.
Beispiel 4
WORT(Rock'n'Roll) |
Suche nach Rock'n'Roll. Formulierung korrekt, da innerhalb der bereinigten Wortformen die Sonderzeichen (hier die Apostrophe) nicht entfernt werden.
Beispiel 5
WORT(Dr.) |
Suche nach der Abkürzung Dr.
Formulierung korrekt, da bei Abkürzungen der Punkt
nicht bereinigt wird.
Beispiel 6: Suchanfrage mit Et-Zeichen '&'
WORT(H&M-Kette) |
Das Et-Zeichen wird als & kodiert und muss als solches gesucht werden, um z.B. H&M-Kette zu finden.
Suche nach Wortformen ohne bestimmte Sonderzeichen
Suchen Sie gezielt nach Wortformen, die ohne ein bestimmtes Sonderzeichen auftreten, z.B. nach einem Wort ohne einem bestimmten Satzzeichen, sollten Sie dieses ähnlich wie in den obigen Beispielen mit dem ausschließenden 0-Wortabstand formulieren:
Beispiel
ABSTAND(WORT(88),%w0,WORT(')) |
Suche nach 88 ohne Apostroph. Davon ausgeschlossen sind Textstellen wie 88's, bei denen der Apostroph innerhalb des Wortes vorkommt.
Suche nach Wortformen mit Sonderzeichen außerhalb von ISOLat1
COSMAS II nutzt als Standard-Zeichensatz ISOLat1 (entspricht ISO8859-1). Zeichen, die sich nicht in diesem Zeichensatz befinden bzw. Zeichen, von denen man nicht genau weiss, wie man sie über die Tastatur eingeben soll, können als XML-Zeichen mit dezimalem UNICODE-Wert eingegeben werden.
Beispiel: Auslassungspunkte
Zeichen | Symbol | HTML-Zeichen | UNICODE-Wert dezimal |
UNICODE-Wert hexadezimal |
---|---|---|---|---|
Auslassungspunkte | … | … | #8230 | #x2026 |
Beispiel: Suchanfrage nach dem Sonderzeichen allein
WORT(…) |
Beispiel: Suchanfrage nach dem Sonderzeichen innerhalb eines Suchbegriffs
WORT(*…) WORT(*…*) WORT(…*) |
Wie lautet die Kodierung meines Sonderzeichens
Der Dezimalwert vieler Sonderzeichen läßt sich z.B. in Wikipedia nachschlagen. Siehe zum Beispiel den Wikipedia-Eintrag für die Auslassungspunkte.
Wortliste
Der WORT
-Operator verfügt außerdem über eine
globale Wortformliste, die
Sie aufrufen können, um sich die Wortformen im momentan aktiven
Archiv präsentieren zu lassen und gegebenenfalls eine davon
auszuwählen.