[IDS-Logo] Kurzreferenz zu COSMAS II/script - Druckversion

Kurzreferenz zu COSMAS IIscript

Allgemeines

Die Applikation wird mit entsprechenden Parametern über das Bash-Skript c2.sh ausgeführt.
COSMAS IIscript liest von der Standardeingabe. Durch Umleitung der Standardeingabe in c2.sh ( ...< test.scr ) wird es skriptfähig. Die Datei test.scr enthält den kompletten Befehlssatz und Beispielskripte als Kommentar.

Konventionen

Die Konventionen für eine skriptbasierte COSMAS II-Sitzung sind wie folgt:

Anweisungen

Der von der Applikation unterstützte Befehlssatz gliedert sich in 4 Gruppen (Parameter sind durch < > gekennzeichnet):


Ablaufsteuerung

[Flußdiagramm]
Ablaufdiagramm einer skriptbasierten COSMAS II-Sitzung

Jede Anfrage beginnt mit einem openArchiv-Befehl und endet mit dem Eingabeende (Dateiende bzw. STRG+D bei direkter Eingabe) oder einem neuen openArchiv-Befehl.

Die Befehle listArchives, listCorpora und listUserCorpora liefern Listen aller zur Verfügung stehenden Archive bzw. aller zugehörigen (benutzerdefinierten) Korpora.

Mit dem load(User)Corpus-Befehl holt man ein (benutzerdefiniertes) virtuelles Korpus aus einem geöffneten Archiv.

Mit dem Befehl bodyQuery generiert man eine Suchanfrage auf dem geladenen Korpus.

Der collocation-Befehl führt auf dem Ergebnis der bodyQuery eine Kookkurrenzanalyse durch.

Der export-Befehl schreibt das Ergebnis der Recherche in eine Datei. Man kann nach jedem Export zu einem beliebigen Befehl zurückkehren und von dort aus das Skript fortsetzen.

Jede mit dem set-Befehl gesetzte Option bleibt bis zum Ende der Anfrage gültig (außer der Wert wird durch erneutes Setzen verändert). Jede Option muss vor (!) Ausführung des zugehörigen Befehls gesetzt sein.


Optionen

Jede Option kann mit set Option= auf seinen default-Wert (innerhalb der Spalte 'Wert' fett gedruckt) zurückgesetzt werden.
Falls bei numerischen Werten nichts anderes angegeben ist, ist der default-Wert gleich 0.

Alle Wertebereiche werden in der Tabelle als reguläre Ausdrücke dargestellt, wobei

Fakultative Werte sind durch {...} gekennzeichnet.
Falls die Werte einer Option kumulativ sind, können sie mit set Option=Wert1+Wert2+... gesetzt werden.
In (runden) Klammern stehende Optionen sind für einen XML-Export nicht verfügbar.


Option Wert Bemerkungen Referenz
Suche
SearchCase [everythingInsensitive, allCaseInsensitive,
allCaseInsensitiveButFirst,
allCaseSensitiveButFirst,
allUpperCaseButFirst,
allLowerCaseButFirst,
firstCaseInsensitive,
firstCaseSensitive,
firstUpperCase, firstLowerCase,
diacriticSensitivityOn,
diacriticSensitivityOff]
Das Setzen der Werte für diese Option ist kumulativ.

Der Wert everythingInsensitive entspricht allCaseInsensitive + diacriticSensitivityOff.

Die Werte ...UpperCase... und ...LowerCase... sind als Optionen weder in COSMAS IIweb noch in COSMAS IIwin verfügbar.
Suche
SearchLimit [off, linear, random] Der Wert linear bezieht sich auf die ersten n, random auf n zufällig ausgewählte Treffer. Beide Werte benötigen die Option SearchCutValue.
SearchCutValue [0..9]*, default: 10000 Diese Option wird nur in Verbindung mit der Option SearchLimit [linear, random] verwendet.
SearchLemma [inflexionOnly,
compounds,
otherWordBuildingForms,
specialWordForms]
Das Setzen der Werte für diese Option ist kumulativ.

Der Wert inflexionOnly ist (auch implizit) immer gesetzt bzw. nicht abwählbar.
Lemmatisierung
SearchExpansionLists [freqDesc,
freqAsc,
alphaDesc,
alphaAsc,
retroDesc,
retroAsc]
  Suche
Kollokationsanalyse
CollocClustering [unique, multiple]   Kookkurrenzanalyse
CollocConfidence [normal, high, analytical]  
CollocGranularity [medium, coarse, fine]  
CollocGliedrigkeit [3, 4, 5, 6] "maximale Gliedrigkeit", neu seit 1.5
CollocLemmatization [off, on]  
CollocAutofocus [off, on]  
CollocIgnoreFunctionWords [off,on]  
CollocSentenceBoundaries [off, on]  
CollocLLR [off, on]  
CollocWordLeft [0-9]*, default: 5  
CollocWordRight [0-9]*, default: 5  
Export
ExportFormat [xml, ascii, rtf, rtf (neu), pdf, append] - append (nur Ausgabeformat text) bedeutet, dass Dateien beim Export nicht überschrieben werden.
- rtf (neu): einzig für Kollokationsanalyse nützlich: erzeugt eine Tabelle analog zu der HTML-Tabelle in COSMAS II-Web.
- pdf: erzeugt eine PDF aus dem RTF-Format. Kann bei einer größeren Kookkurrenztabelle mehrere Minuten in Anspruch nehmen.
- rtf (neu) und pdf: seit Version 1.5
Export
ExportOrient [A4quer, A4hoch]  
ExportFontHeight [0-9]*, default: 10  
(ExportMaxLines) [0-9]*, default: 10000 '0' steht für eine unbegrenzte Anzahl.
(ExportKwicLeftContext) [0-9]*, default: 10  
(ExportKwicRightContext) [0-9]*, default: 10  
(ExportFullTextLeftContext) [0-9]*, default: 0  
(ExportFullTextRightContext) [0-9]*, default: 0  
(ExportKwicDistanceType) [characters, words, sentences, paragraphs]  
(ExportFullTextDistanceType) [characters, words, sentences, paragraphs]  
ExportExpansionLists [off, on] (siehe auch SearchExpansionLists)
(ExportDocumentList) [off, on]  
ExportOverview [off, on] Ergebnisübersicht (siehe auch SortOverview).
(ExportKwic) [off, on] KWIC (siehe auch SortHits).
(ExportFullText) [off, on] Volltext (siehe auch SortHits).
Sortierungen
Sort [off, on] Sortierung aus- / einschalten.  
SortDocumentList [ bySource, byCorpus, byDoc, byCountry,
byDecade, byYear, byMonth, byDay, aroundYear_...,
byThema, byTextsort ]

distribTexts, distribWords, distribGray
'...' in aroundYear_... steht für ein 4-stelliges Jahr (angezeigt werden alle Ergebnisse vor/nach dem 1. Januar). Korpusansichten

Export
SortOverview [ bySource, byCorpus, byDoc, byCountry,
byDecade, byYear, byMonth, byDay, aroundYear_...,
byThema, byTextsort ]

[rel_Freq_proz, rel_Freq_pMW, diffKoeff, haeufKlass_einzelwort_CS, haeufKlass_einzelwort, haeufKlass_Lemma, haeufKlass_automatisch]
'...' in aroundYear_... steht für ein 4-stelliges Jahr (angezeigt werden alle Ergebnisse vor/nach dem 1. Januar). Ergebnisansichten

Export
SortHits [unsorted, alphabetical_..., chronological] chronological bedeutet 'chronologisch aufsteigend'
'...' in alphabetical_... steht für 'a+b+c{+iSC}' mit a,b,c ∈ {[[[L,R][1,2,3]],0][A,D]}, z.B.: alphabetical 0A+L1A+R2D
'iSC' steht für 'Sonderzeichen ignorieren'.
KWIC-Sortierung

Export

Optionen zur Suche

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

Dialogfenster "Optionen zur Suche" aus COSMAS IIwin

Optionen zur Lemmatisierung

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

Dialogfenster "Optionen zur Lemmatisierung" aus COSMAS IIwin

Alphabetische Sortierung des KWIC

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

Dialogfenster "Sortierung des KWIC" aus COSMAS IIwin

Fenster "Ergebnispräsentation"

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

"Fenster für die Suchergebnisse" aus COSMAS IIwin

Optionen zum Export

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

Dialogfenster "Optionen zum Export" aus COSMAS IIwin

Optionen zur Kookkurrenzanalyse

Die nachstehende Grafik stellt die skriptbasierten Optionen den entsprechenden (bekannten) aus COSMAS IIwin gegenüber.

[Bildausschnitt]

Fenster "Optionen zur Kookkurrenzanalyse" aus COSMAS IIwin

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018