Die Ergebnis-Ansicht nach Wort-Types
In dieser Darstellungsform werden die Treffer nach ihren Wort-Types zusammengefasst und sortiert. Dabei werden unter Berücksichtigung der unten beschriebenen Optionen identische Treffer auf denselben Type abgebildet.
Die 4-spaltige Ergebnispräsentation, bei der jede Spalte auf- und absteigend sortiert werden kann, enthält die folgenden Daten:
- Anzahl Treffer für jeden Wort-Type
- Anzahl Texte für jeden Wort-Type
- prozentualer Anteil eines Wort-Types am Gesamtergebnis, bezogen auf die Gesamtheit der Treffer
- der Wort-Type
Treffer der Suchanfrage *ameise in der Wort-Type-Ansicht |
Optionen
Die Wort-Types-Ansicht wird von den hier beschriebenen Optionen gesteuert und kann je nach Kombination dieser Optionen länger oder kürzer ausfallen:
Option: WortType | ||
---|---|---|
Einstellung | Bedeutung | Erscheinungsbild in der Tabelle |
Ei bzw. Eb |
Erstes Zeichen: Groß-/Kleinschreibung ignorieren bzw. beachten |
Erstes Zeichen: groß |
Ri bzw. Rb |
restliche Zeichen: Groß-/Kleinschreibung ignorieren bzw. beachten |
restliche Zeichen: groß |
Di bzw. Db |
diakritische Zeichen: ignorieren bzw. beachten |
diakritische Zeichen: entfernt |
Si bzw. Sb |
Sonderzeichen an den Wortenden: ignorieren bzw. beachten |
Sonderzeichen an den Wortenden: entfernt |
Worttype-Endlänge = Zahl | bei Zahl > 0 wird die Länge der Wort-Type-Endungen festgelegt. | die Wort-Types werden nach ihrer Endung sortiert. |
Worttype-Endlänge = 0 | die Sortierung nach der Endung der Wort-Types wird ausgeschaltet. |
Die zum Aufbau der Wort-Type-Ansicht genommenen Einstellungen
werden zur Information sowohl bei der Anzeige als auch beim Export im Kopf der Spalte
Wort-Types angezeigt (hier Ei+Ri+Di+Si
).
Das Erscheinungsbild der angezeigten Wort-Types richtet
sich, wie in der obigen Tabelle beschrieben, nach den eingestellten Optionen.
Die Originalschreibweise der Treffer kann im KWIC, in den Sub-KWICs und den Belegen
eingesehen werden.
Setzen der Optionen
Diese Optionen werden mit dem #SET
-Kommando im
Suchanfrage-Fenster wie folgt gesteuert bzw. ein- und ausgeschaltet.
Hierzu wird das Kommando in das Suchanfrage-Fenster geschrieben und
mit dem Schalter Suchen ausgeführt.
#SET Worttype = Ei+Ri+Db+Si |
Setzen der erwünschten Beachtungs-/Ignorierungsoptionen für das erste Zeichen und die restlichen Zeichen eines Wortes, die diakritischen Zeichen und die Sonderzeichen. |
#SET Worttype-Endlänge = 2 |
Setzen der Endungslänge auf 2 Zeichen und Einschalten der Sortierung nach Wort-Type-Endungen. |
#SET Worttype-Endlänge = 0 |
Ausschalten der Sortierung nach Wort-Type-Endungen. |
Interpretation der Types
Beispiele für Suchanfrage würde | ||
---|---|---|
Einstellung | Types | Frequenz |
Eb |
Würde würde |
25 20 |
Ei |
Würde | 37 |
Rb |
Würde WÜRDE WürDE |
25 10 1 |
Ri |
WÜRDE | 36 |
Db |
Würde Wurde |
25 32 |
Di |
Wurde | 57 |
Sb |
Wurde (wurde) "wurde" |
2 3 7 |
Si |
Wurde | 12 |
Beispiel
Ein ausführliches Beispiel über die adjektivische Konstruktion nicht … un-Adjektiv zeigt zwei Anwendungsfälle der Ansicht nach Wort-Types auf.
Wort-Types, die sich nicht eindeutig zuordnen lassen
Textstellen, aus denen mehrere suchbare Begriffe extrahiert wurden, führen zu einem besonderen Problem. COSMAS II kann in diesem Fall nachträglich, also beim Aufbau der Ansicht nach Wort-Types, die Zuordnung vom Suchbegriff zu seinem Wort-Type nicht mehr eindeutig durchführen, wie das folgende Schema ausführt:
Vorbereitung der Suche:
Textstelle → Tokenisierung → mehrere Suchbegriffe → mehrere Wort-Types.
Aufbau der Wort-Type-Ansicht:
KWIC → Textstelle → 1 Default-Wort-Type.
Für diese Fälle findet COSMAS II nur den Default-Wort-Type. Dieser besteht aus der links stehenden Wortform der Zeichenkette, bereinigt von Sonderzeichen. In der folgenden Tabelle werden einige Fälle genannt:
Textstelle | suchbare Begriffe | angezeigter Wort-Type |
---|---|---|
»... Studentin.Die ...« | Studentin die | Studentin |
»... Mutter.Studentin...« | Mutter Studentin | Mutter |
»... elternbriefe@ane.de.Berlin.Studenten ...« | elternbriefe@ane de Berlin Studenten | elternbriefe@ane |
»... (Ex)Studentinnen ...« | Ex Studentinnen | Ex |
Es gibt außerdem einige wenige fehlerhafte Zuordnungen, in dem Sinne, als dass eine Textstelle irrtümlicherweise auf ein beliebiges Sonderzeichen als Wort-Type abgebildet wird, das im Text nicht vorkommt. Dies ist auf einen Systemfehler zurückzuführen. Die Fundstelle bzw. der Treffer ist allerdings korrekt. Beispiele für fehlerhafte Wort-Types: "#", "+", "%", etc.