[IDS-Logo] COSMAS II - Einfrieren von Benutzerkorpora

Einfrieren eines virtuellen Korpus

Zielsetzung

Das Einfrieren eines gespeicherten, virtuellen Korpus, d.h. eines Benutzer- oder Projektkorpus, hat zum Ziel, aus der intendierten Korpusdefinition eine Liste der Texte zu erstellen, die nach jeder Aktualisierung eines COSMAS II-Archivs unverändert bleibt.

Aktualisierbare und eingefrorene virtuelle Korpora

Mit der Definition eines virtuellen Korpus können Benutzer und Projektgruppen zwei Vorhaben verfolgen:

Aktualisierbare virtuelle Korpusdefinition

In diesem Fall wird ein Korpus so allgemein definiert, dass es bei jeder Aktualisierung des COSMAS II-Archivs automatisch erweitert wird. Z.B. wird durch Angabe der Quelle = 'Mannheimer Morgen' in der Korpusdefinition nichts über eine zeitliche Begrenzung ausgesagt. Da der Mannheimer Morgen mit jedem neuen DeReKo-Release um die Texte des letzten Halbjahres erweitert wird, wird im selben Zug das auf diese Weise definierte Korpus in COSMAS II automatisch erweitert.

Diese dynamische Korpusdefinition ist immer dann willkommen, wenn eine Zunahme der Treffer innerhalb eines festgelegten Rahmens erwünscht ist.

Einfrieren eines virtuellen Korpus

Falls sich die Zusammensetzung eines Korpus nicht mehr verändern darf, so muss dies den Administratoren von COSMAS II mitgeteilt werden, damit die gewünschten Korpora eingefroren werden. Dies bedarf der Entscheidung des Nutzers und kann nicht automatisch ausgeführt werden. Beim Einfrieren eines Korpus wird die Liste seiner Texte gespeichert, dies ist die extendierte Definition des Korpus. Genau diese Texte sollten nach einer Aktualisierung eines Archivs aktiv sein und keine weiteren.

Einschränkungen beim Einfrieren der Korpora

Ein eingefrorenes Korpus kann sich trotz allem aus COSMAS II-externen Gründen geringfügig verändern.

Zum einen werden immer wieder einzelne Texte, häufig Zeitungsartikel, in der Folge einer juristischen Auseinandersetzung gesperrt. Diese Texte dürfen nicht mehr verfügbar sein und verschwinden aus den Korpora.

Zum andern können im Zuge der Pflege der DeReKo-Korpora Korrekturen an den Texten anfallen, so dass sie entweder länger oder kürzer werden.

die technische Umsetzung

Mit dem Tool c2test -d2b (Definition → Bitmap) wird die editierte Korpus-Definition von einem Administrator üblicherweise in eine interne Korpus-Repräsentation umgewandelt, die vom COSMAS II-Server für schnelle Operationen benutzt wird. In dieser Repräsentation sind genau die Texte aktiv, die in der originalen Definition referenziert werden.

Vor der Datenbankaktualisierung

Das Einfrieren des Korpus wird vor der Datenbankaktualisierung vorgenommen. Zu diesem Zweck dient das Tool c2test -b2d (Bitmap → Definition) diesmal in der anderen Richtung: aus der internen Korpus-Präsentation wird die extendierte (rote) Korpus-Definition erzeugt und gespeichert.

Nach der Datenbankaktualisierung

Nach der Datenbankaktualisierung wird die interne Korpus-Präsentation wieder von demselben Tool c2test -d2b erzeugt. Diesmal nimmt es automatisch die extendierte Definition als Grundlage für das virtuelle Korpus. Die ursprüngliche Definition wird nicht mehr konsultiert, ist aber nach wie vor vorhanden.

Das Einfrieren eines Korpus ist auf dem Server ein aufwändiger Schritt und wird deshalb nur auf Anfrage durchgeführt.

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018