Sonderzeichen in Suchanfragen
Zeichensatz Latin-1
Für die Formulierung von Suchanfragen in COSMAS II wird der allgemein bekannte Zeichensatz Latin-1 (offiziell: ISO 8859-1) eingesetzt, mit dessen Hilfe sich die 12 westeuropäischen Sprachen kodieren lassen1.
Zeichen in Latin-1 werden direkt über die Tastatur eingeben. Sofern ein Zeichen nicht auf der Tastatur abgebildet ist, kann es über den Zahlenblock anhand seines numerischen Codes in Latin-1 eingegeben werden.
Hinweis: die in HTML verwendeten Zeichennamen bzw. Entitäten wie z.B. É oder der numerische UNICODE-Wert wie z.B. É können für die Zeichen von Latin-1 nicht verwendet werden.
Beispiel
Das Zeichen großes E mit accent aigu, also É, kann über seinen numerischen Code ALT-0201 eingegeben werden. Im Eingabefenster von COSMAS II erscheint das gewünschte Zeichen.
Zeichen außerhalb von Latin-1
Zeichen und Sonderzeichen, die nicht durch Latin-1 abgedeckt sind, werden in COSMAS II mit Hilfe ihrer numerischen2 UNICODE-Kodierung verwaltet. Sie müssen dementsprechend auch so eingegeben werden.
Beispiel
Die französische Ligatur œ wird als Zeichenkette mit ihrem numerischen UNICODE-Wert œ eingegeben.
Beispiel
Für das Wort Œuvre wird die Eingabe "œuvre" zwischen Anführungszeichen geschrieben, da das & zu Beginn des Wortes ansonsten von COSMAS II als Lemmatisierungsoperator verstanden wird.
Siehe auch
Siehe auch das ausführliche Beispiel zu Apostrophen in Suchanfragen.
Kodierung von Sonderzeichen
Die Kodierung der Sonderzeichen und wie man sie über die Tastatur eingibt, kann man oft über ihre Artikelseite in Wikipedia erfahren. Z.B. die Artikelseite zum Auslassungszeichen bzw. den Auslassungspunkten enthält sowohl die Kodierung in dezimaler Schreibweise (verträglich mit COSMAS II) im Abschnitt Kodierung als auch im Abschnitt Tastatur, wie es direkt über die Tastatur eingegeben werden kann.
Das Et-Zeichen &
Eine Ausnahme innerhalb ISOlat1 bildet das Et-Zeichen '&', das wegen seiner Funktion in HTML- und UNICODE-Zeichenkodierungen als & kodiert ist und als solches gesucht werden muss.
H&M-Kette |
Diese Suchanfrage findet Vorkommnisse von H&M-Kette.
Wird das & als freistehendes Zeichen und nicht als Bestandteil eines Wortes gesucht, muss es zwischen " und " geschrieben werden:
Bang "&" Olufsen |
1Im Gegensatz zum unter WINDOWS verwendeten Zeichensatz WINDOWS-1252 sind die französischen Ligaturen œ und Œ nicht Teil von Latin-1.
2UNICODE-Kodierung: in COSMAS II wird die dezimale Schreibweise benutzt, z.B. É und nicht die hexadezimale, z.B. É, wo der Hexadezimalwert xc9 dem Dezimalwert 201 entspricht.