[IDS-Logo] [IDS-Logo]
Seite drucken Thema drucken Sitemap Suche Impressum Datenschutz Kontakt

Fenster "Korpusanzeige"

Die verschiedenen Darstellungsformen (Ansichten) der Korpuszusammensetzung

Seit der Serverversion 4.2 (Juli 2012) werden die Korpusansichten durch optionale1 Angaben zur prozentualen Verteilung der Anzahl Texte und Anzahl laufende Wortformen ergänzt. Man kann außerdem wählen, ob diese Werte grau oder normal dargestellt werden sollen.

Quellenansicht

Aufruf: Menü Ansicht / Quellenansicht

In dieser Darstellungsform werden die im aktuellen Korpus aktiven Texte korpusübergreifend zu Quellen zusammengefasst und aufgelistet. Für jede Quelle wird folgende Information angezeigt:

Wirkungsweise

Die Quellenansicht wirkt sich korpusübergreifend wie folgt aus:

Hinweis

Die Quellenansicht befindet sich noch im Aufbau. Für einige gemischte Korpora wie MK1 und MK2 können noch nicht für alle Texte die Quelle angegeben werden. Da wo die Quelle noch nicht angezeigt werden kann, erscheint die übergeordnete Korpusbezeichnung (in diesem Fall MK1 Mannheimer Korpus 1 oder MK2 Mannheimer Korpus 2.

Korpusansicht

Aufruf: Menü Ansicht / Korpusansicht

In dieser Darstellungsform werden die Korpussiglen aufgelistet, die im aktuellen Korpus mindestens einen aktiven Text enthalten. Für jede Korpussigle werden folgende Daten angezeigt:

Wirkungsweise

Die Korpusansicht fasst Texte nach ihrem Korpusbezeichner, der verschiedene Funktionen haben kann, zusammen:

Dokumentansicht

Aufruf: Menü Ansicht / Dokumentansicht

In dieser Darstellungsform werden die im aktuellen Korpus aktiven Dokumente aufgelistet. Für jedes Dokument wird folgende Information angezeigt:

Wirkungsweise

Ein Dokument in der Dokumentansicht fasst Texte (von 1 Text bis zu mehreren Tausend) je nach Korpuszugehörigkeit nach unterschiedlichen Kriterien zusammen. Anbei seien einige Beispiele zur Veranschaulichung aufgeführt:

Bei Zeitungskorpora wird üblicherweise eine Monatsausgabe zu einem Dokument zusammengefasst.

Bei gemischten Korpora kann das Gliederungskriterium eins der folgenden sein:

Diverse Datumsansichten

Aufruf: Menü Ansicht / Datumsansicht X

Unter dem Begriff Datumsansicht X stehen 5 verwandte Ansichten zur Verfügung:

Für jede dieser Darstellungsarten werden folgende Daten angezeigt:

Wirkungsweise

Die Ansicht vor/nach Zeitpunkt teilt die Texte in die Zeiten vor und nach einem vom Benutzer freiwählbaren Zeitpunkt ein.

Die Ansicht nach Jahrzehnt fasst die Texte zu Jahrzehnten zusammen (siehe Entstehungsjahr).

Die Ansicht nach Entstehungsjahr fasst die Texte nach dem Jahr ihres Entstehens zusammen. Für die Texte ist diese Angabe in der Regel immer bekannt.

Die Ansicht nach Entstehungsmonat ist eine Verfeinerung der Ansicht nach Entstehungsjahr auf der Monatsebene. Die Monatsangabe ist allerdings nicht immer bekannt oder sinnvoll.

Die Ansicht nach Entstehungstag ist eine Verfeinerung der Ansicht nach Entstehungsjahr auf der Tagesebene. Die tagessangabe ist allerdings nicht immer bekannt oder sinnvoll.

Länderansicht

Aufruf: Menü Ansicht / Länderansicht

In dieser Darstellungsform werden Länder des deutschsprachigen Raums aufgelistet, die im aktuellen Korpus mindestens einen aktiven Text enthalten. Für jedes Land werden folgende Daten angezeigt:

Wirkungsweise

Die Länderansicht wirkt sich korpusübergreifend aus und erfasst D füer Deutschland, A für Österreich und CH fü die Schweiz.

Hinweis

Die Länderansicht befindet sich noch im Aufbau. Für einige Texte kann sich die Zuordnung zu einem Land noch ändern.

Textsortenansicht

Aufruf: Menü Ansicht / Textsortenansicht

Die Textsortenansicht ist eine der beiden Textklassifikationen, die in COSMAS II ab der Serverversion 4.2 (Juli 2012) angeboten wird.

Für jede Textsorte werden folgende Daten angezeigt:

Themenansicht

Aufruf: Menü Ansicht / Themenansicht

Die Themenansicht ist eine der beiden Textklassifikationen, die in COSMAS II ab der Serverversion 4.2 (Juli 2012) angeboten wird.

Für jedes Thema werden folgende Daten angezeigt:

Wirkungsweise

Im Gegensatz zu den Textsorten wurde die thematische Klassifizierung eines Teils der Texte maschinell erstellt: jedem der von diesem Algorithmus analysierten Texte wurde mit einem Thema und einem Wert zwischen 1-100%, der ausdrückt, wie sicher die Zuordnung aus der Sicht des Algorithmus erfolgt ist, versehen. Die Anzeige dieser Ansicht lässt sich über eine eigene Option Zuverlässigkeitswert steuern. Texte, die den eingestellten Zuverlässigkeitswert unterschreiten oder die vom maschinellen Prozess nicht erfasst wurden, werden unter dem Eintrag »undefiniert« zusammengefasst.

Option Zuverlässigkeitswert

Die Option Zuverlässigkeitswert verfügt über kein Menü in der grafischen Oberfläche von COSMAS IIwin, sondern muss mit dem Kommando:

#SET Thema-Prob = Wert (Wert zwischen 0 … 100)

gesetzt werden.

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018