Kurzreferenz zu COSMAS IIscript
- Die Referenz im PDF-Format zum Herunterladen
Allgemeines
Die Applikation wird mit entsprechenden Parametern über
das Bash-Skript c2.sh
ausgeführt.
COSMAS IIscript liest von der Standardeingabe. Durch Umleitung der
Standardeingabe in c2.sh
( ...< test.scr
)
wird es skriptfähig.
Die Datei test.scr
enthält den kompletten Befehlssatz und
Beispielskripte als Kommentar.
Konventionen
Die Konventionen für eine skriptbasierte COSMAS II-Sitzung sind wie folgt:
- Jede Zeile enthält genau ein Kommando.
- Kommentare werden durch # eingeleitet, Leerzeilen werden ignoriert.
- Genau ein beliebiges Trennzeichen (z.B. Space) zwischen Befehl und Parameter.
- Wertzuweisung an Optionen mit
Option=Wert
(ohne Leerzeichen). - Befehlsreihenfolge gemäß Ablaufdiagramm.
Anweisungen
Der von der Applikation unterstützte Befehlssatz gliedert sich in 4 Gruppen (Parameter sind durch < > gekennzeichnet):
- Kommunikation mit der Datenbank
- Öffnen eines Archivs:
openArchiv <Archiv-Name>
, - Auflisten aller Archive/Korpora:
listArchives
,listCorpora
,listUserCorpora
- Laden eines virtuellen Korpus:
loadCorpus | loadUserCorpus <Name des virt. Korpus>
- Erstellen einer Suchanfrage:
bodyQuery <Query>
(Syntax der Suchanfragesprache)
- Öffnen eines Archivs:
- Setzen von Optionen:
set <Option=Wert>
(Übersicht) - Ergebnis bezogene Befehle
- Export der Treffer-Statistik:
statistics [<Dateiname>]
- Kookkurenzanalyse:
collocation
- Export der Anfrage-Ergebnisse in eine Datei:
export <Dateiname>
- Export der Treffer-Statistik:
- Sonderbefehle
- Einbinden einer Datei mit weiteren Befehlen:
include <Dateiname>
- Abbruch der Befehlsverarbeitung:
exit
- Einbinden einer Datei mit weiteren Befehlen:
Ablaufsteuerung
![]() |
Ablaufdiagramm einer skriptbasierten COSMAS II-Sitzung |
Jede Anfrage beginnt mit einem openArchiv
-Befehl
und endet mit dem Eingabeende (Dateiende bzw. STRG+D bei direkter Eingabe)
oder einem neuen openArchiv
-Befehl.
Die Befehle listArchives
, listCorpora
und
listUserCorpora
liefern Listen aller zur Verfügung stehenden
Archive bzw. aller zugehörigen (benutzerdefinierten) Korpora.
Mit dem load(User)Corpus
-Befehl holt man ein
(benutzerdefiniertes) virtuelles Korpus aus einem geöffneten Archiv.
Mit dem Befehl bodyQuery
generiert man eine
Suchanfrage
auf dem geladenen Korpus.
Der collocation
-Befehl führt auf dem Ergebnis der
bodyQuery
eine Kookkurrenzanalyse durch.
Der export
-Befehl schreibt das Ergebnis der Recherche in eine
Datei. Man kann nach jedem Export zu einem beliebigen Befehl zurückkehren
und von dort aus das Skript fortsetzen.
Jede mit dem set
-Befehl gesetzte
Option bleibt bis zum Ende
der Anfrage gültig (außer der Wert wird durch erneutes Setzen verändert).
Jede Option muss vor (!) Ausführung des zugehörigen Befehls gesetzt sein.
Optionen
Jede Option kann mit set Option=
auf seinen default-Wert
(innerhalb der Spalte 'Wert' fett gedruckt) zurückgesetzt werden.
Falls bei numerischen Werten nichts anderes angegeben ist, ist der
default-Wert gleich 0.
Alle Wertebereiche werden in der Tabelle als reguläre Ausdrücke dargestellt, wobei
- '_' für ein Leerzeichen,
- [a,b] für a oder b,
- [a,b]x für eine Zeichenkette der Länge x, bestehend aus a's und b's steht (x=* steht für eine beliebige Länge >=0).
Fakultative Werte sind durch {...} gekennzeichnet.
Falls die Werte einer Option kumulativ sind, können sie mit
set Option=Wert1+Wert2+...
gesetzt werden.
In (runden) Klammern stehende Optionen sind für einen XML-Export
nicht verfügbar.
Option | Wert | Bemerkungen | Referenz |
---|---|---|---|
Suche | |||
SearchCase | [everythingInsensitive,
allCaseInsensitive, allCaseInsensitiveButFirst, allCaseSensitiveButFirst, allUpperCaseButFirst, allLowerCaseButFirst, firstCaseInsensitive, firstCaseSensitive, firstUpperCase, firstLowerCase, diacriticSensitivityOn, diacriticSensitivityOff] |
Das Setzen der Werte für diese Option ist kumulativ. Der Wert everythingInsensitive entspricht allCaseInsensitive + diacriticSensitivityOff. Die Werte ...UpperCase... und ...LowerCase... sind als Optionen weder in COSMAS IIweb noch in COSMAS IIwin verfügbar. | Suche |
SearchLimit | [off, linear, random] | Der Wert linear bezieht sich auf die ersten n, random auf n zufällig ausgewählte Treffer. Beide Werte benötigen die Option SearchCutValue. | |
SearchCutValue | [0..9]*, default: 10000 | Diese Option wird nur in Verbindung mit der Option SearchLimit [linear, random] verwendet. | |
SearchLemma | [inflexionOnly, compounds, otherWordBuildingForms, specialWordForms] |
Das Setzen der Werte für diese Option ist kumulativ. Der Wert inflexionOnly ist (auch implizit) immer gesetzt bzw. nicht abwählbar. |
Lemmatisierung |
SearchExpansionLists | [freqDesc, freqAsc, alphaDesc, alphaAsc, retroDesc, retroAsc] |
Suche | |
Kollokationsanalyse | |||
CollocClustering | [unique, multiple] | Kookkurrenzanalyse | |
CollocConfidence | [normal, high, analytical] | ||
CollocGranularity | [medium, coarse, fine] | ||
CollocGliedrigkeit | [3, 4, 5, 6] | "maximale Gliedrigkeit", neu seit 1.5 | |
CollocLemmatization | [off, on] | ||
CollocAutofocus | [off, on] | ||
CollocIgnoreFunctionWords | [off,on] | ||
CollocSentenceBoundaries | [off, on] | ||
CollocLLR | [off, on] | ||
CollocWordLeft | [0-9]*, default: 5 | ||
CollocWordRight | [0-9]*, default: 5 | ||
Export | |||
ExportFormat | [xml, ascii, rtf, rtf (neu), pdf, append] | - append (nur Ausgabeformat text) bedeutet,
dass Dateien beim Export nicht überschrieben werden. - rtf (neu): einzig für Kollokationsanalyse nützlich: erzeugt eine Tabelle analog zu der HTML-Tabelle in COSMAS II-Web. - pdf: erzeugt eine PDF aus dem RTF-Format. Kann bei einer größeren Kookkurrenztabelle mehrere Minuten in Anspruch nehmen. - rtf (neu) und pdf: seit Version 1.5 |
Export |
ExportOrient | [A4quer, A4hoch] | ||
ExportFontHeight | [0-9]*, default: 10 | ||
(ExportMaxLines) | [0-9]*, default: 10000 | '0' steht für eine unbegrenzte Anzahl. | |
(ExportKwicLeftContext) | [0-9]*, default: 10 | ||
(ExportKwicRightContext) | [0-9]*, default: 10 | ||
(ExportFullTextLeftContext) | [0-9]*, default: 0 | ||
(ExportFullTextRightContext) | [0-9]*, default: 0 | ||
(ExportKwicDistanceType) | [characters, words, sentences, paragraphs] | ||
(ExportFullTextDistanceType) | [characters, words, sentences, paragraphs] | ||
ExportExpansionLists | [off, on] | (siehe auch SearchExpansionLists) | |
(ExportDocumentList) | [off, on] | ||
ExportOverview | [off, on] | Ergebnisübersicht (siehe auch SortOverview). | |
(ExportKwic) | [off, on] | KWIC (siehe auch SortHits). | |
(ExportFullText) | [off, on] | Volltext (siehe auch SortHits). | |
Sortierungen | |||
Sort | [off, on] | Sortierung aus- / einschalten. | |
SortDocumentList | [ bySource, byCorpus, byDoc, byCountry,
byDecade, byYear, byMonth, byDay, aroundYear_..., byThema, byTextsort ] distribTexts, distribWords, distribGray |
'...' in aroundYear_... steht für ein 4-stelliges Jahr (angezeigt werden alle Ergebnisse vor/nach dem 1. Januar). | Korpusansichten
Export |
SortOverview | [ bySource, byCorpus, byDoc, byCountry,
byDecade, byYear, byMonth, byDay, aroundYear_..., byThema, byTextsort ] [rel_Freq_proz, rel_Freq_pMW, diffKoeff, haeufKlass_einzelwort_CS, haeufKlass_einzelwort, haeufKlass_Lemma, haeufKlass_automatisch] |
'...' in aroundYear_... steht für ein 4-stelliges Jahr (angezeigt werden alle Ergebnisse vor/nach dem 1. Januar). | Ergebnisansichten
Export |
SortHits | [unsorted, alphabetical_..., chronological] | chronological bedeutet 'chronologisch aufsteigend' '...' in alphabetical_... steht für 'a+b+c{+iSC}' mit a,b,c ∈ {[[[L,R][1,2,3]],0][A,D]}, z.B.: alphabetical 0A+L1A+R2D 'iSC' steht für 'Sonderzeichen ignorieren'. |
KWIC-Sortierung
Export |
Optionen zur Suche
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-suche.gif)
Dialogfenster "Optionen zur Suche" aus COSMAS IIwin
Optionen zur Lemmatisierung
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-lemma.gif)
Dialogfenster "Optionen zur Lemmatisierung" aus COSMAS IIwin
Alphabetische Sortierung des KWIC
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-kwic.gif)
Dialogfenster "Sortierung des KWIC" aus COSMAS IIwin
Fenster "Ergebnispräsentation"
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-ergebnis.gif)
"Fenster für die Suchergebnisse" aus COSMAS IIwin
Optionen zum Export
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-export.gif)
Dialogfenster "Optionen zum Export" aus COSMAS IIwin
Optionen zur Kookkurrenzanalyse
Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.
![[Bildausschnitt]](c2scr-kook.gif)
Fenster "Optionen zur Kookkurrenzanalyse" aus COSMAS IIwin