Textorganisation unter COSMAS II
Übersicht
In den nachfolgenden Dokumenten wird die aktuelle Organisation des Textmaterials unter COSMAS II beschrieben. Auch die Grundbegriffe des COSMAS-Datenmodells (Archiv, Korpus, Dokument, Text, aktives Korpus, vordefiniertes und benutzerdefiniertes virtuelles Korpus) werden hier kurz erläutert.
Die eingesetzten Tagsets sind die folgenden:
Daran schließt sich die Chronologie der wichtigsten Änderungen an.
- Zur besseren Unterscheidung haben die Bezeichnungen für
Archive, Korpora und virt. Korpora
auf den nachfolgenden Seiten ein unterschiedliches Schriftbild:
Archiv W (monospace fett), Korpus bio (monospace normal), Virt. Korpus bio-öffentlich (monospace kursiv).
- Anlässlich der Umstellung der Korpus-Codierung ist eine Zusammenfassung der wesentlichen Änderungen verfügbar.
- Allgemeine und/oder fachspezifische Wort- und Frequenzlisten können in COSMAS II nicht erzeugt werden. Diese Themen werden in einem eigenen Arbeitsschwerpunkt am IDS erforscht.
Archive
Allgemeines
Archive sind eine Art Sammelstellen, denen Korpora zur Lagerung zugeführt werden. Archive stellen zugleich den maximalen Suchraum einer Recherche dar, d.h. mit einer Recherche kann lediglich ein einziges Archiv durchsucht werden. Suchanfragen, die über mehrere Archive ausgewertet werden sollen, müssen wiederholt für jedes relevante Archiv gestartet werden.
Die Aufteilung unserer Korpora in verschiedene Archive spiegelt die Unterschiede in der Zusammensetzung, im Bearbeitungszustand, im Format und in anderen grundlegenden Merkmalen der Korpora wieder.
Die COSMAS II-Korpora sind in Archiven organisiert:
- Archiv der geschriebenen Korpora (das Hauptarchiv)
- drei Archive der geschriebenen Korpora mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
- Archiv der Wikipedia-Artikel und -Diskussionen (2015/2017/2019)
- Archiv der englischsprachigen Wikipedia-Artikel und -Diskussionen (2015)
- Archiv der fremdsprachigen Wikipedia-Artikel und -Diskussionen (2015)
- Archiv morphosyntaktisch annotierter Korpora (CONNEXOR-Tagset) (1994-2009)
- Archiv morphosyntaktisch annotierter Korpora (CONNEXOR-Tagset) (2010-2014)
- Archiv morphosyntaktisch annotierter Korpora (TreeTagger-Tagset) (1994-2009)
- Archiv morphosyntaktisch annotierter Korpora (TreeTagger-Tagset) (2010-2014)
- Archiv morphosyntaktisch annotierter Korpora (MECOLB-Tagset)
- Archiv der historischen Korpora
- Archiv des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts"
- Korpus-Kartei der Gesellschaft für deutsche Sprache
- Archiv der phasengegliederten Wendekorpora
- Archiv der aussortierten geschriebenen Korpora
- Archiv der Süddeutschen Zeitung
Umfang der Archive im Laufe der Zeit
Die wichtigsten Archive wachsen mit jeder Aktualisierung von DeReKo. Hier erfahren Sie mehr über den Umfang der Archive für verschiedene DeReKo-Releases.
Hintergrundinformationen zu den Archiven
Das Archiv W der geschriebenen Korpora
ist das größte
dieser Archive. Es umfasst Texte vom 18. Jahrhundert bis heute und enthält auch
die größte Bandbreite an Textsorten. Die darin enthaltenen Zeitungen und Zeitschriften
werden regelmäßig mit Neuerscheinungen ergänzt. Andere neuakquirierte Quellen gelangen
hingegen in die anderen Archive W2
-W4
.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Beachten Sie bei einigen Korpora dieses Archivs die spezielle Codierung.
Die Archive W2, W3 und W4 der geschriebenen Korpora
enthalten die Neuakquisitionen der GBI-Genios Deutsche Wirtschaftsdatenbank GmbH. Zurzeit sind das Zeitschriften aus Deutschland, Österreich und der Schweiz ab dem Jahr 2000, die in alphabetischer Reihenfolge der Quellen auf die drei Archive verteilt wurden.
Außerdem ergänzen sie die geografische Abdeckung der Quellen von W
. Sie werden
kontinuierlich mit den neuesten Ausgaben aufgefüllt.
Die Archive W
bis W4
wurden nur aus technischen
Gründen in separate Archive aufgeteilt und lassen sich für Recherchen nicht
verbinden.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
Das Wikipedia-Archiv WP
enthält zusätzlich zu den Wikipedia-Artikeln Artikel- und Benutzerdiskussionen aus den Jahren 2013 und 2015. Bitte beachten Sie die Hinweise zu Fußnoten.
Herausgeber der Korpora: de.wikipedia.org
Das Wikipedia-Archiv WPE
enthält zusätzlich zu den englischsprachigen Wikipedia-Artikeln Artikel- und Benutzerdiskussionen aus dem Jahr 2015. Bitte beachten Sie die Hinweise zu Fußnoten und Tokenisierung.
Herausgeber der Korpora: en.wikipedia.org
Das Wikipedia-Archiv WP_FS
enthält fremdsprachige Wikipedia-Artikel, -Artikeldiskussionen und -Benutzerdiskussionen, Stand 2015. Französisch, Ungarisch, Norwegisch, Spanisch, Kroatisch, Italienisch, Polnisch. Bitte beachten Sie die Hinweise zu Fußnoten und Tokenisierung.
Herausgeber der Korpora: wikipedia.org
Das Archiv TAGGED-C (ehemals W-TAGGED)
enthält zurzeit etwa 40% der Texte mit Erscheinungsdatum bis Ende 2009 aus dem Archiv W, die mit Hilfe des CONNEXOR-Taggers morphosyntaktisch annotiert wurden.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Lesen Sie hierzu die Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora.
Das Archiv TAGGED-C2
enthält zurzeit Texte mit Erscheinungsdatum ab Anfang 2010 aus dem Archiv W, die mit Hilfe des CONNEXOR-Taggers morphosyntaktisch annotiert wurden.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Lesen Sie hierzu die Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora.
Das Archiv TAGGED-T
enthält die gleichen Korpora wie TAGGED-C und wurde mit Hilfe des TreeTaggers und aufgrund des STTS-Tagsets morphosyntaktisch annotiert.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Lesen Sie hierzu die Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora.
Das Archiv TAGGED-T2
enthält die gleichen Korpora wie TAGGED-C2 und wurde mit Hilfe des TreeTaggers und aufgrund des STTS-Tagsets morphosyntaktisch annotiert.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Lesen Sie hierzu die Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora.
Das Archiv TAGGED-M (ehemals TAGGED)
Diese auf der Grundlage des MECOLB-Minimal Tagsets morphosyntaktisch annotierten Korpora wurden schon vor einigen Jahren in einer ersten Versuchsreihe über COSMAS II verfügbar gemacht. Mit ca. 30 Mio. laufenden Wortformen umfassen sie nicht ganz 1% des gegenwärtigen Archiv W (Stand: Januar 2011).
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
- Lesen Sie hierzu die Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora.
Das Archiv HIST der historischen Korpora
enthält Texte von der zweiten Hälfte des 17. Jahrhunderts bis 1962. Darunter fallen zum einen die Texte, die vom Projekt Historisches Textkorpus zusammengestellt oder angeworben wurden. Zum anderen werden dort Korpora aufgeführt, die auch im Hauptarchiv W verfügbar sind, deren Texte dem Entstehungsdatum nach aber eher den historischen Korpora zugeordnet werden können.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo, Projektgruppe Historisches Korpus
- Beachten Sie bei einigen Korpora dieses Archivs die spezielle Codierung.
Das Archiv UMB des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts"
enthält Texte von 1945 bis 1969.
Das Korpus UMB45 umfasst Texte, die den Schulddiskurs der ersten Nachkriegsdekade (1945-1955) repräsentieren. Autoren und Autorinnen sind Opfer, Täter oder Nichttäter. Das Korpus der Opfertexte besteht aus monographischen Erzählungen über Verfolgung, Zuchthauserlebnisse und Lagererfahrungen. Die Beiträge der Täter stammen aus Gerichtsprotokollen, Tagebüchern und Autobiographien. Das Korpus der Nichttäter-Texte besteht aus Aufrufen, Reden, Regierungserklärungen, Ansprachen, Briefen, Tagebuchaufzeichnungen, Artikeln, Vorträgen, Gründungsprotokollen, programmatischen Schriften, Predigten, Hirtenworten, Essays, zeitkritischen monografischen Analysen, Dramen, Romanen und Kongressprotokollen.
Im Korpus UMB68 sind vor allem solche Texte der späten 1960er Jahre enthalten, die Demokratiekonzepte der Kritischen Theorie und die Rezeption dieser Konzepte durch die studentische Linke repräsentieren. Die Autoren dieser Texte sind nach den beiden Beteiligtenrollen 'intellektuelle Linke' (Adorno, Horkheimer, Habermas u.a.) und 'studentische Linke' (Dutschke, Rabehl, Negt, Krahl u.a.) unterschieden.
Herausgeber der Korpora: Projektgruppe Sprachliche Umbrüche des 20. Jahrhunderts
Das Archiv GFDS, Korpus-Kartei der Gesellschaft für deutsche Sprache, Wiesbaden (GfdS)
enthält Wörter und Wortgruppen der Sprachdokumentation der GfdS, zum großen Teil mit Verweisen auf die beiden von der GfdS herausgegebenen Zeitschriften Der Sprachdienst und Muttersprache.Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
Das Archiv WK-PH der phasengegliederten Wendekorpora
enthält Texte des Wendekorpus (der Zeit der Wende um 1989-1990), die für eine zeitliche Analyse in kurze Phasen gegliedert wurden.
Die Zusammensetzung der Korpora in ihrer Gesamtheit sowie die Vergabe der Korpus-, Dokument- und Textsiglen entsprechen nicht mehr denen des Wendekorpus im Hauptarchiv. Falls auf die Phasengliederung kein Wert gelegt wird, sollte bei der Recherche besser das virtuelle Korpus wk im Archiv W verwendet werden.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
In das Archiv W-ÜBRIG der aussortierten geschriebenen Korpora
wurden Korpora geschriebener Sprache wegen erheblicher Qualitätsmängel aussortiert, die sich früher im Archiv W befanden.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
Das Archiv SZ der Süddeutschen Zeitung
enthält mehrere Jahrgänge dieser Zeitung, die alle vom Hauptarchiv in dieses Archiv verlagert wurden, um die besonderen Zugriffsrechte verwalten zu können. Dies sind: nur IDS-intern recherchierbar und nur 1 Benutzersitzung gleichzeitig.
Herausgeber der Korpora: Deutsches Referenzkorpus - DeReKo
Übersicht über die aktuellen Archive
Spezielle Codierung älterer Korpora
Bei "älteren" Korpora, die in den 70er und 80er Jahren vom IDS erworben oder erstellt wurden, weicht die Kodierung am Satzanfang aus technischen Gründen vom Original ab:
Außer den Nomen werden Wörter am Satzanfang ungeachtet ihrer Schreibweise im Originaltext klein kodiert. Dieser Umstand muss bei Wortrecherchen in COSMAS II beachtet werden.
Beispiel
Im folgenden Beispiel aus dem LIMAS-Korpus sieht man, wie der Artikel der auf Kleinbuchstaben konvertiert wurde, während der Eigenname Wolfgang groß belassen wurde.
LIM/LI1.00001 Jäger, Renate: Mutti, komm doch wieder, [Trivialroman]. - Hamburg, 1970
[...] schenkte sie Viktor einen Erben. der kleine Wolfgang hatte die Großeltern versöhnt. Wolfgang war ein Rotenhoff, [...]
Betroffene Korpora
- Bonner Zeitungskorpus (BZK)
- Goethe Korpus (GOE)
- Grammatik-Korpus (GR1)
- Handbuchkorpora (H85, H86, H87, H88)
- LIMAS-Korpus (LIM)
- Mannheimer Korpus 1 (MK1)
- Mannheimer Korpus 2 (MK2)
- Thomas Mann-Korpus (THM)
- Wendekorpus Ost (WKD)
- Wendekorpus West (WKB)
Korpora
Allgemeines
COSMAS II-Korpora sind Sammlungen von Textmaterialien in elektronischer Form, die überwiegend vom Deutschen Referenzkorpus - DeReKo, vereinzelt aber auch von Projektgruppen des IDS zur Verfügung gestellt und in COSMAS II eingespeist werden. Die Zusammensetzung eines solchen Korpus wie auch die Gliederung in Dokumente und Texte wird zur Zeit der Korpusakquisition festgelegt.
Während der "Einspeisung" eines Korpus in COSMAS II (dieser Prozess wird auch Indizierung genannt) wird eine Reihe von Aufbereitungsarbeiten durchgeführt. Neben den rein technischen Arbeiten, die z.B. für den effizienten Zugriff auf die Daten sorgen, erfolgen hier auch die Lemmatisierung, Erstellung von diversen Wortlisten, Regelung von Zugriffsrechten und vieles andere mehr.
Jedes Korpus wird bei der Indizierung in ein sogenanntes Archiv aufgenommen.
- BenutzerInnen können sich eigene virtuelle Korpora über die Funktionalität Eigene Korpora editieren in der Korpusverwaltung zusammenstellen. Die resultierenden benutzerdefinierten Korpora können innerhalb von COSMAS II sitzungsübergreifend gespeichert und durchsucht werden.
- Wer mit Hilfe der erweiterten Kriterien bzw. Korpusbildung eigene Korpora bilden möchte, kann sich mit den Administratoren in Verbindung setzen.
In COSMAS II werden zurzeit etwa
laufende Wortformen (oder etwa
Buchseiten bei ca. 400 Wörtern/Seite) in
Korpora verwaltet.
Die Korpusgröße ist in Millionen von laufenden Wortformen angegeben.
Korpora in ungetaggten Archiven
Korpora im Archiv TAGGED-C
Korpora im Archiv TAGGED-C2
Korpora im Archiv TAGGED-T
Korpora im Archiv TAGGED-T2
Korpora im Archiv TAGGED-M
Dokumente und Texte
Allgemeines
Jedes Korpus besteht aus einem oder mehreren Dokumenten; jedes Dokument setzt sich wiederum aus einem oder mehreren Texten zusammen. Die Gliederung eines Korpus in Dokumente und Texte wird zur Zeit der Korpusakquisition festgelegt.
In einem Dokument können mehrere Texte nach bestimmten Gesichtspunkten
zusammengefasst sein, z.B. nach Quellen, chronologischer
Abfolge, Themenbereichen und/oder Textarten.
Ein Text beinhaltet je nach Korpusstruktur z.B. einen einfachen
Zeitungsartikel bis hin zu einer als Ganzes aufgenommenen
Zeitung/Zeitschrift, einen Auszug aus einem selbstständigen Werk bis
hin zu einem selbstständigen Werk als Ganzem (Roman, Reportage,
Erlass, wissenschaftliche Abhandlung, Rede usw.).
Beispiele:
- Das Thomas-Mann-Korpus (Sigle thm, Archiv W) enthält 14 Dokumente ("Die Buddenbrooks", "Der Erwählte", "Erzählungen", "Doktor Faustus", "Königliche Hoheit" usw.).
- Das Dokument "Erzählungen" (Dokumentsigle THM/AME) enthält 32 Texte, z.B. die Prosa-Skizze "Vision" (Textsigle THM/AME.00001).
- Das virtuelle Korpus "VDI Nachrichten" (Sigle vdi, Archiv W) besteht aus 35 Dokumenten mit den Ausgaben der VDI Nachrichten für jeweils einen Monat des Zeitraums Feb. 2006 - Dez. 2008.
- Das Dokument mit der Sigle VDI07/JUL enthält 381 Texte mit jeweils einem Artikel vom Juli 2007, z.B. den Artikel "Mobilfunk in China" vom 27.07.2007 (Textsigle VDI07/JUL.00419).
Ein Text in COSMAS II ist sowohl die kleinste recherchierbare Einheit wie auch die kleinste bibliographisch dokumentierte Einheit. Zum Beispiel gibt COSMAS II beim Exportieren von Belegen die bibliographischen Angaben der Texte aus, in denen Treffer erzielt wurden.
- BenutzerInnen können sich eigene virtuelle Korpora zusammenstellen, indem sie eine beliebige Auswahl aus den im jeweiligen Archiv befindlichen Dokumenten treffen.
Übersicht über die aktuellen Dokumente und Texte
Zur Zeit werden in COSMAS II Dokumente bzw. Texte verwaltet.
Virtuelle Korpora
Allgemeines
Eine COSMAS II-Recherche wird immer in einem sogenannten aktiven Korpus durchgeführt. Das aktive Korpus wird dadurch bestimmt, dass man noch vor der Suche einen Eintrag aus der Liste der vordefinierten virtuellen Korpora wählt oder ein benutzerdefiniertes virtuelles Korpus lädt.
Ein virtuelles Korpus in COSMAS II ist ein beliebiger Ausschnitt aus einem einzigen Archiv (genauer: eine beliebige Auswahl aus den Dokumenten beliebiger Korpora eines einzigen Archivs). Das virtuelle Korpus legt also fest, welche Dokumente welches Archivs durchsucht werden sollen, wenn dieses virtuelle Korpus aktiviert wird. Das einfachste virtuelle Korpus enthält nur ein einziges Dokument, das maximale virtuelle Korpus umfasst alle Dokumente aller Korpora eines Archivs.
Virtuelle Korpora können
- mit Korpora (oder bereits definierten virtuellen Korpora)
übereinstimmen
(z.B. wird über das virtuelle Korpus wkb genau das Korpus Wendekorpus/West wkb angesprochen), - beliebig viele Korpora (oder bereits definierte virtuelle Korpora)
nach verschiedenen Kriterien zusammenfassen
(z.B. werden über das virtuelle Korpus wk die Korpora Wendekorpus/West wkb und Wendekorpus/Ost wkd angesprochen), - eine beliebige Auswahl aus den im Archiv befindlichen
Dokumenten festlegen
(z.B. werden über das virtuelle Korpus bio-öffentlich nur die öffentlichen Dokumente des ansonsten nicht-öffentlichen Korpus "Biografische Literatur" bio angesprochen).
Vordefinierte virtuelle Korpora
COSMAS II stellt automatisch für jedes verfügbare Archiv mindestens ein vordefiniertes virtuelles Korpus bereit: dieses virtuelle Korpus umfasst das gesamte Archiv. Darüber hinaus werden vom COSMAS II-Administrator für jedes Archiv je nach Bedarf weitere virtuelle Korpora definiert.
Alle vordefinierten virtuellen Korpora der jeweils verfügbaren Archive werden (unter Berücksichtigung der Zugriffsrechte) in der COSMAS II-Korpusauswahlliste zur Aktivierung angeboten.
Zur Zeit sind in COSMAS II 1412 virtuelle Korpora vordefiniert. Weitere virtuelle Korpora können jederzeit definiert werden.
Benutzerdefinierte virtuelle Korpora
Die BenutzerInnen können sich aber auch eigene virtuelle Korpora zusammenstellen, indem sie eine beliebige Auswahl aus den im jeweiligen Archiv befindlichen Dokumenten treffen. Siehe dazu die Funktion Eigene Korpora editieren bzw. zusammenstellen in der Korpusverwaltung. Die resultierenden Korpora können innerhalb von COSMAS II als benutzerdefinierte virtuelle Korpora sitzungsübergreifend gespeichert, geladen und durchsucht werden.
- Wer mit Hilfe der erweiterten Kriterien bzw. Korpusbildung eigene Korpora bilden möchte, kann sich mit den Administratoren in Verbindung setzen.
Übersicht über die aktuellen virtuellen Korpora
Der aktuelle Stand der Organisation der virtuellen Korpora unter
COSMAS II ist in der folgenden Übersicht
dokumentiert.
Die Korpusgröße ist in Millionen von laufenden Wortformen angegeben.
- Die detaillierte Anzeige der virtuellen Korpora mit mehr als 1 Mrd. Wortformen nimmt etwas Zeit in Anspruch.
Virtuelle Korpora im Archiv W der geschriebenen Korpora
Virtuelle Korpora im Archiv W2 der geschriebenen Korpora
Virtuelle Korpora im Archiv W3 der geschriebenen Korpora
Virtuelle Korpora im Archiv W4 der geschriebenen Korpora
Virtuelle Korpora im Archiv WP der Wikipedia-Artikel und -Diskussionen
Virtuelle Korpora im Archiv WPE der englischsprachigen Wikipedia-Artikel und -Diskussionen
Virtuelle Korpora im Archiv WP_FS der fremdsprachigen Wikipedia-Artikel und -Diskussionen
Virtuelle Korpora im Archiv TAGGED-C
Virtuelle Korpora im Archiv TAGGED-C2
Virtuelle Korpora im Archiv TAGGED-T
Virtuelle Korpora im Archiv TAGGED-T2
Virtuelle Korpora im Archiv TAGGED-M
Virtuelle Korpora im Archiv HIST der historischen Korpora
Virtuelle Korpora im Archiv UMB des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts"
Virtuelle Korpora im Archiv GFDS, Korpus-Kartei der Gesellschaft für deutsche Sprache, Wiesbaden (GfdS)
Virtuelle Korpora im Archiv WK-PH der phasengegliederten Wendekorpora
Virtuelle Korpora im Archiv W-ÜBRIG der aussortierten geschriebenen Korpora
Die Korpora in diesem Archiv wurden wegen Mängel aus ihrem angestammten Archiv W (Archiv der geschriebenen Korpora) aussortiert. Sie stehen den Benützern von COSMAS II hier nach wie vor für Recherchen oder zum Überprüfen von älteren Recherchen zur Verfügung.
Virtuelle Korpora im Archiv SZ der Süddeutschen Zeitung
Die Süddeutsche Zeitung wird ab Sep. 2007 wieder über COSMAS II angeboten, befindet sich nun aber in einem gesonderten Archiv, auf welches die folgenden Zugriffsbeschränkungen gelten: nur IDS-intern und nur eine Benutzersitzung gleichzeitig.
Morphosyntaktische Annotationen
Ein Teil der Texte aus Archiv W liegt mittlerweile mit morphosyntaktischen Annotationen aufbereitet vor. Die Annotationen wurden von verschiedenen Taggern generiert und liegen unterschiedlichen Tagsets zugrunde.
Um Ihnen den Einstieg bei der Recherche in morphosyntaktisch annotierten Korpora zu erleichtern wurden auf den nachfolgenden Seiten Auszüge der jeweiligen offiziellen Dokumentation aufgenommen.
Archiv | Tagset | Tagger | aktualisiert |
---|---|---|---|
TAGGED-C | CONNEXOR | CONNEXOR | 2010 |
TAGGED-C2 | 2014 | ||
TAGGED-T | STTS | TreeTagger | 2011 |
TAGGED-T2 | 2014 | ||
TAGGED-M | MECOLB | LOGOS | 1998 |
- Informieren Sie sich bitte vor dem Beginn Ihrer Recherche auch über den Umgang mit morphosyntaktisch annotierten Korpora.
Bemerkungen zum Umgang mit morphosyntaktisch annotierten Korpora
Über COSMAS II werden mehrere Archive angeboten,
die mit Hilfe von automatischen Verfahren (man spricht von Taggern)
morphosyntaktisch annotiert wurden.
Tagsets und Tagger wurden unabhängig voneinander außerhalb
des IDS entwickelt und lassen sich wenig bis gar nicht aufeinander
abstimmen.
Diese automatischen Verfahren sind notwendig, um umfangreiche Textsammlungen überhaupt annotieren zu können. Der Nachteil besteht darin, dass selbst die besten Tagger heutzutage nicht um einen konstanten Anteil von Restfehlern umhinkommen. Ihre Erfolgsquote liegt bei ca. 97% pro annotiertes Wort. Man könnte sogar sagen, je exotischer die Syntax an einer Stelle im Satz ist, desto schwieriger ist es für einen Tagger, den Text an dieser Stelle korrekt zu analysieren.
Wegen des damit verbundenen enormen manuellen Aufwandes werden Annotationen nicht überprüft bzw. korrigiert.
Eine Erfolgsquote von 97% bedeutet, dass eine Sequenz von 4 annotierten Wörtern mit einer Wahrscheinlichkeit von 97% x 97% x 97% x 97% = 88,5% korrekt ist; oder ein Satz von 9-10 Wörtern zu 75% korrekt annotiert ist; oder jeder 2. Satz von ca. 22 Wörtern korrekt annotiert ist.
Die Erfolgsquote dürfte bei den annotierten Korpora des ältesten Archivs TAGGED-M (Stand: 1998) niedriger liegen.
Ob die erreichte Annotationsgüte für Ihre Untersuchung in COSMAS II ausreichend ist, müssen Sie selber zu Beginn Ihrer Arbeit mit einer oder mehreren Stichproben prüfen.
Wir empfehlen, die annotierten Korpora der neueren Archive TAGGED-C oder TAGGED-T (Stand: 2010 bzw. 2011) bzw. TAGGED-C2 oder TAGGED-T2 (Stand: 2014) zu verwenden.
- Fragen zu den eingesetzten Taggern, Tagsets und der Güte der
Korpusannotierungen richten Sie bitte an:
Programmbereich Korpuslinguistik,
Projekt: Ausbau und Pflege der Korpora geschriebener Gegenwartssprache
Thema: morphosyntaktische Annotationen
Textklassifikation in COSMAS II
Auf dieser Seite werden die beiden Textklassifikationen Textsorte und thematische Klassifikation vorgestellt, die mit der Server-Version 4.2 von COSMAS II (Juli 2012) freigegeben werden. Anhand dieser Metadaten lassen sich
- die Präsentationen der Korpuszusammensetzung (siehe COSMAS IIweb und COSMAS IIwin),
- die Präsentation der Ergebnisse (siehe COSMAS IIweb und COSMAS IIwin), und
- die Bildung von vituellen (Benutzer-)Korpora (mehr...)
um zwei neue Dimensionen erweitern.
Diese Daten werden zu einem späteren Zeitpunkt ebenfalls in die virtuelle Korpusbildung integriert.
Textsorten
In den meisten DeReKo-Zeitungskorpora und -Korpora mit Pressemeldungen sind die Texte (Artikel) mit einer Textsorte ausgezeichnet. Wir weisen darauf hin, dass das Inventar der Textsorten historisch gewachsen ist und keiner linguistisch definierten Systematik von Textsorten folgt. Die meisten Textsorten-Klassifikationen werden automatisch aus den Metadaten der Originaldaten extrahiert, die auch fehlerhafte Zuweisungen enthalten können. Nicht in allen Zeitungskorpora und nicht für alle Jahrgänge sind die Texte mit Textsorten ausgezeichnet. Einen Überblick erhalten Sie in der Textsorten-bezogenen Präsentation der Korpuszusammensetzung ihres ausgewählten Korpus in COSMAS II.
Derzeit (Release DeReKo-2012-II) umfasst die Textsorten-Taxonomie folgende Kategorien:
Abstract | Analyse | Anzeigentext |
Beilage | Bericht | Bericht:Augenzeugenbericht |
Bericht:Bilanzbericht | Bericht:Erfahrungsbericht | Bericht:Kurzbericht |
Bericht:Prozessbericht | Bericht:Reisebericht | Bericht:Schicksalsbericht |
Bericht:Sportbericht | Bericht:Tagungsbericht | Bericht:Testbericht |
Bericht:Unternehmensbericht | Bericht:Vorbericht | Bericht:Wetterbericht |
Bericht:Wettkampfbericht | Bildbeischrift | Buchauszug |
Chronologie | Dokumentation | Dossier |
Essay | Expertenmeinung | Fall |
Fall:Kurioser Fall | Fall:Spektakulärer Fall | Fall:Tragischer Fall |
Feuilleton | Fragebogen | Gegendarstellung |
Gerichtsurteil | Gespräch | Grafik |
Historisches | Interview | Klatsch |
Kolumne | Kommentar | Kontaktdaten |
Leserbrief | Literaturhinweis | Lokales |
Medienseite | Meldung | Meldung:Agenturmeldung |
Nachruf | Offener Brief | Personalie |
Personalienprofil | Porträt | Porträt:Firmenporträt |
Porträt:Länderporträt | Porträt:Stadtporträt | Rangliste |
Ratgeber | Rede | Reportage |
Reportage:Homestory | Rezension | Rezension:Buchrezension |
Rezension:Fernsehrezension | Rezension:Filmrezension | Rezension:Kunstrezension |
Rezension:Musikrezension | Rezension:Theaterrezension | Satire |
Serie | Sportergebnis | Statistik |
TippsService | Umfrage | Veranstaltungsinformation |
Vorspann | Zitat | Überblick |
Thematische Klassifikation
Die Texte aller DeReKo-Zeitungskorpora und Pressemeldungskorpora sind mit einem Thema ausgezeichnet, d.h. mit einer thematischen Kategorie nach einer für DeReKo entwickelten Themen-Taxonomie.
Die Themen-Taxonomie umfasst 12 Hauptkategorien und 52 Unterkategorien, welche ursprünglich auf Kategorien des Open Directory zurückgehen (vgl. Weiß 2005).
Die Themen-bezogene Ansicht von Korpora und Ergebnissen in COSMAS II basiert auf der durch einen Naive-Bayes-Klassifikator automatisch ermittelten wahrscheinlichsten Themenkategorie für jeden Text. Die Performanz dieses Klassifikators lag bei 83% durchschnittlicher Präzision und 82% durchschnittlicher Vollständigkeit auf einem Testkorpus von 30 Zeitungsartikeln je Unterkategorie aus dem Jahre 2003 (vgl. Weiß 2005).
Hauptkategorie | Unterkategorien |
Fiktion | Vermischtes |
Freizeit/Unterhaltung | Reisen Rundfunk Vereine/Veranstaltungen |
Gesundheit/Ernährung | Gesundheit Ernährung |
Kultur | Bildende Kunst Darstellende Kunst Film Literatur Mode Musik |
Natur/Umwelt | Garten Tiere Wetter/Klima |
Politik | Ausland Inland Kommunalpolitik |
Sport | Ballsport Fußball Motorsport Radsport Tennis Vermischtes Wintersport |
Staat/Gesellschaft | Arbeit/Beruf Bildung Biographen/Interviews Drittes Reich/Rechtsextremismus Familie/Geschlecht Kirche Recht Tod Verbrechen |
Technik/Industrie | EDV/Elektronik Kfz Transport/Verkehr Umweltschutz Unfälle |
Wirtschaft | Banken Bilanzen Öffentliche Finanzen Sozialprodukt Währung |
Wissenschaft | Populärwissenschaft |
Rest | Börsenkurse Geburt/Tod/Heirat Impressum Inhaltsverzeichnisse Ligatabellen Tabellen Veranstaltungshinweise |
Literatur und weiterführende Links
- Fragen zur Textauszeichnung nach Textsorten und Themen sowie zu den
Taxonomien richten Sie bitte an:
Programmbereich Korpuslinguistik,
Projekt: Ausbau und Pflege der Korpora geschriebener Gegenwartssprache
Chronologie der wichtigsten Änderungen
März 2024
Archiv W
Das Archiv W wurde mit dem DeReKo-Release 2024-I aktualisiert:
517,6 Mio. laufende Wortformen in 0,9 Mio. neuen Texten zwischen 1949 und Ende 2023.*
Archiv W2
Das Archiv W2 wurde mit dem DeReKo-Release 2024-I aktualisiert:
618,5 Mio. laufende Wortformen in 1,9 Mio. neuen Texten zwischen 2020 und Ende 2023.*
Archiv W3
Das Archiv W3 wurde mit dem DeReKo-Release 2024-I aktualisiert:
718,6 Mio. laufende Wortformen in 2,5 Mio. neuen Texten aus 2023.*
Archiv W4
Das Archiv W4 wurde mit dem DeReKo-Release 2024-I aktualisiert:
452,5 Mio. laufende Wortformen in 1,5 Mio. neuen Texten aus 2023.*
*: die Neuakquisitionen können in COSMAS II in den jeweiligen Archiven im virtuellen Korpus N-gesamt bzw. N-öffentlich konsultiert werden.
Februar 2024
Archiv SNA
Das Archiv wurde mit dem erweiterten Projekt-Korpus "HetWik" ergänzt.
Archiv ZEITB
Das Archiv wurde mit dem Schulbuchkorpus sbk und dem erweiterten "HetWik"-Korpus ergänzt.
März 2023
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde mit dem DeReKo-Release 2023-I um den Jahrgang 2022 ergänzt.
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde mit dem DeReKo-Release 2023-I um den Jahrgang 2022 ergänzt.
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde mit dem DeReKo-Release 2023-I um den Jahrgang 2022 ergänzt.
Februar 2023
Archiv W der geschriebenen Korpora
Die Mehrzahl der im Archiv vorhandenen Korpora wurde mit dem DeReKo-Release 2023-I um den Jahrgang 2022 ergänzt.
Mai 2022
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Ergänzungen:
- 31 der 39 in Archiv W4 befindlichen Korpora wurden mit dem DeReKo-Release 2022-I um den Jahrgang 2021 ergänzt.
Insgesamt beläuft sich der Zuwachs auf 480 Mio. laufende Wortformen aus 1,6 Mio. Texten.
Mai 2022
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Ergänzungen:
- 47 der 52 in Archiv W3 befindlichen Korpora wurden mit dem DeReKo-Release 2022-I um den Jahrgang 2021 ergänzt.
Insgesamt beläuft sich der Zuwachs auf 738 Mio. laufende Wortformen aus 2,5 Mio. Texten.
April 2022
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Ergänzungen:
- 137 der in Archiv W2 befindlichen Korpora wurden mit Texten von Januar 2021 - Dezember 2021 ergänzt.
Drei kleinere Korpora von GBI-Genios wurden in W2 aufgenommen:
- Stern Gesund leben 2018
- iX 2020-2021
- Le Monde diplomatique 2020-2021
Zwei weitere kleinere Korpora aus dem Gingko-Projekt wurden ebenfalls aufgenommen:
- Automobiltechnische Zeitschrift 2007-2016
- Motortechnische Zeitschrift 2007-2016
Insgesamt beläuft sich der Zuwachs auf 615 Mio. laufende Wortformen aus 2 Mio. Texten.
März 2022
Archiv W mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Ergänzungen:
- 39 der in Archiv W befindlichen Korpora wurden mit Texten von Januar 2020 - Dezember 2021 ergänzt.
- Der Zuwachs beläuft sich auf 432 Mio. laufende Wortformen aus 1,3 Mio. Texten.
August 2021
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das u.g. im Archiv vorhandene Korpus wurde um Texte von 2020 ergänzt:
- Diverses
Archiv WP der Wikipedia-Artikel und -Diskussionen
Das Archiv wurde um die folgenden Korpora ergänzt:
- Wikipedia-Artikel 2019
- Wikipedia-Diskussionen zu Artikeln 2019
- Wikipedia-Benutzerdiskussionen 2019
Juni 2021
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte von 2020 ergänzt:
- Bersenbrücker Kreisblatt
- Freie Presse
- Sonntag Aktuell
- Stuttgarter Nachrichten
- Stuttgarter Zeitung
- Tauber-Zeitung
- Torgauer Zeitung
- WirtschaftsBlatt
- Wiesbadener Tagblatt
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte von 2020 ergänzt:
- Bramscher Nachrichten
- Ems-Zeitung
- Lingener Tagespost
- Main-Taunus-Kurier
- Meppener Tagespost
Mai 2021
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgende neue Akquisition ergänzt:
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte von 2020 ergänzt:
- Bayerische Staatszeitung
- Grenz-Echo
- Format
- Gelnhäuser Tageblatt
- NEON
- Neue Kärntner Tageszeitung
- Psychologie Heute
April 2021
Archiv W der geschriebenen Korpora
Die u.g. im Archiv vorhandenen Korpora wurden um Texte von 2020 ergänzt:
- Berliner Morgenpost
- Berliner Zeitung
- Meldungen der Deutschen Presse-Agentur
- Die Presse
- Falter
- FOCUS
- Hannoversche Allgemeine
- Hamburger Morgenpost
- Luxemburger Tageblatt
- Mannheimer Morgen
- NEWS
- Nordkurier
- Niederösterreichische Nachrichten
- Nürnberger Nachrichten
- Nürnberger Zeitung
- NZZ Folio
- NZZ am Sonntag
- Neue Zürcher Zeitung
- profil
- Die Rheinpfalz
- Rhein-Zeitung
- Sonntagsblick
- St. Galler Tagblatt
- Der Spiegel
- Spiegel-Online
- Stern Gesund leben
- Süddeutsche Zeitung
- SonntagsZeitung (Tages-Anzeiger)
- Tages-Anzeiger
- die tageszeitung
- VDI Nachrichten
- Weltwoche
- Zeit Campus
- ZEIT Christ und Welt
- Die Zeit
- Zeit Geschichte
- Zeit Wissen
Januar 2020
Archiv W der geschriebenen Korpora
Die u.g. im Archiv vorhandenen Korpora wurden um Texte aus der zweiten Jahreshälfte 2019 ergänzt:
- Berliner Morgenpost
- Berliner Zeitung
- Meldungen der Deutschen Presse-Agentur
- Die Presse
- c't
- Falter
- FOCUS
- Hannoversche Allgemeine
- Hamburger Morgenpost
- iX
- Le Monde diplomatique
- Luxemburger Tageblatt
- Mannheimer Morgen
- NEWS
- Nordkurier
- Niederösterreichische Nachrichten
- Nürnberger Nachrichten
- Nürnberger Zeitung
- NZZ Folio
- NZZ am Sonntag
- Neue Zürcher Zeitung
- profil
- Die Rheinpfalz
- Rhein-Zeitung
- Sonntagsblick
- St. Galler Tagblatt
- Der Spiegel
- Spiegel-Online
- Stern
- Stern Gesund leben
- Süddeutsche Zeitung
- SonntagsZeitung (Tages-Anzeiger)
- Tages-Anzeiger
- die tageszeitung
- VDI Nachrichten
- Weltwoche
- Zeit Campus
- ZEIT Christ und Welt
- Die Zeit
- Zeit Geschichte
- Zeit Wissen
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der zweiten Jahreshälfte 2019 ergänzt:
- Bayerische Staatszeitung
- Grenz-Echo
- Format
- Gelnhäuser Tageblatt
- NEON
- Neue Kärntner Tageszeitung
- Psychologie Heute
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Die Glocke: 2019
- Hessische Niedersächsische Allgemeine: 2019
- Kieler Nachrichten: 2019
- Lübecker Nachrichten: 2019
- Ruhr Nachrichten: 2019
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgende Ausnahme, um Texte aus der zweiten Jahreshälfte 2019 ergänzt:
- Frankfurter Rundschau
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der zweiten Jahreshälfte 2019 ergänzt:
- Sonntag Aktuell
- Stuttgarter Nachrichten
- Stuttgarter Zeitung
- Tauber-Zeitung
- Torgauer Zeitung
- WirtschaftsBlatt
April 2019
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- c't Magazin für Computertechnik: 2017 - 2018
- iX Magazin für professionelle Informationstechnik: 2017 - 2018
- Le Monde diplomatique: 2017 - 2018
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Europäische Zeitschrift für Wirtschaftsrecht: 2017 - 2018
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
November 2019
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Am Erker: 2004 - 2017
- Kinder- und Jugendliteratur: 2009 - 2013, 2015, 2016
Die u.g. im Archiv vorhandenen Korpora wurden um Texte aus der ersten Jahreshälfte 2019 ergänzt:
- Berliner Morgenpost
- Berliner Zeitung
- Die Presse
- c't
- Falter
- FOCUS
- Hannoversche Allgemeine
- Hamburger Morgenpost
- iX
- Le Monde diplomatique
- Luxemburger Tageblatt
- Mannheimer Morgen
- NEWS
- Nordkurier
- Niederösterreichische Nachrichten
- Nürnberger Nachrichten
- Nürnberger Zeitung
- NZZ Folio
- NZZ am Sonntag
- Neue Zürcher Zeitung
- profil
- Die Rheinpfalz
- Rhein-Zeitung
- Sonntagsblick
- St. Galler Tagblatt
- Der Spiegel
- Spiegel-Online
- Stern
- Stern Gesund leben
- Süddeutsche Zeitung
- SonntagsZeitung (Tages-Anzeiger)
- Tages-Anzeiger
- die tageszeitung
- VDI Nachrichten
- Weltwoche
- Zeit Campus
- ZEIT Christ und Welt
- Die Zeit
- Zeit Geschichte
- Zeit Wissen
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgende neue Akquisition ergänzt:
- Grenz-Echo: 1999 - 2019
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der ersten Jahreshälfte 2019 ergänzt:
- Bayerische Staatszeitung
- Format
- Gelnhäuser Tageblatt
- NEON
- Neue Kärntner Tageszeitung
- Psychologie Heute
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgende Ausnahme, um Texte aus der ersten Jahreshälfte 2019 ergänzt:
- Frankfurter Rundschau
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der ersten Jahreshälfte 2019 ergänzt:
- Sonntag Aktuell
- Stuttgarter Nachrichten
- Stuttgarter Zeitung
- Tauber-Zeitung
- Torgauer Zeitung
- WirtschaftsBlatt
April 2019
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- c't Magazin für Computertechnik: 2017 - 2018
- iX Magazin für professionelle Informationstechnik: 2017 - 2018
- Le Monde diplomatique: 2017 - 2018
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Europäische Zeitschrift für Wirtschaftsrecht: 2017 - 2018
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Die Mehrzahl der im Archiv vorhandenen Korpora wurde um Texte aus der zweiten Jahreshälfte 2018 ergänzt.
November 2018
Archiv W der geschriebenen Korpora
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der ersten Jahreshälfte 2018 ergänzt:
- Oberösterreichische Nachrichten: 1998 - 2000
- Stern Gesund leben: 2018
- Tages-Anzeiger (ehem. Archiv W4): 2001 - 2018
- SonntagsZeitung (Tages-Anzeiger) (ehem. Archiv W4): 2000 - 2018
Die u.g. im Archiv vorhandenen Korpora wurden um Texte aus der ersten Jahreshälfte 2018 ergänzt:
- Berliner Morgenpost
- Berliner Zeitung
- Meldungen der Deutschen Presse-Agentur
- Die Presse
- Falter
- FOCUS
- Hannoversche Allgemeine
- Hamburger Morgenpost
- Luxemburger Tageblatt
- Mannheimer Morgen
- NEWS
- Nordkurier
- Niederösterreichische Nachrichten
- Nürnberger Nachrichten
- Nürnberger Zeitung
- NZZ Folio
- NZZ am Sonntag
- Neue Zürcher Zeitung
- profil
- Die Rheinpfalz
- Rhein-Zeitung
- Sonntagsblick
- St. Galler Tagblatt
- Die Südostschweiz
- Der Spiegel
- Spiegel-Online
- Stern
- Süddeutsche Zeitung
- die tageszeitung
- VDI Nachrichten
- Weltwoche
- Zeit Campus
- ZEIT Christ und Welt
- Die Zeit
- Zeit Geschichte
- Zeit Wissen
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
- BLAU - das Kunstmagazin: 2018
- BRIGITTE Mom: 2018
- Business Punk: 2018
- frau aktuell: 2018
- Häuser: 2018
- Herzstück: 2018
- Hörzu Wissen: 2018
- Ostsee-Zeitung: 2016 - 2018
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der ersten Jahreshälfte 2018 ergänzt:
- Berner Zeitung
- Bayerische Staatszeitung
- Dogs
- Gelnhäuser Tageblatt
- Neue Kärntner Tageszeitung
- Psychologie Heute
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden um Texte aus der ersten Jahreshälfte 2018 ergänzt.
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Alle im Archiv vorhandenen Korpora wurden, bis auf die folgenden Ausnahmen, um Texte aus der ersten Jahreshälfte 2018 ergänzt:
- Sonntag Aktuell
- Stuttgarter Nachrichten
- Stuttgarter Zeitung
- Tauber-Zeitung
- Torgauer Zeitung
- WirtschaftsBlatt
- Westfalen-Blatt
Änderungen (ins Archiv W verschoben):
- Tagesanzeiger: 2001 - 2017
- SonntagsZeitung (Tages-Anzeiger): 2000 - 2017
Oktober 2018
Archiv WP der Wikipedia-Artikel und -Diskussionen
Das Archiv wurde um die folgenden Korpora ergänzt:
- Wikipedia-Artikel 2017
- Wikipedia-Diskussionen zu Artikeln 2017
- Wikipedia-Benutzerdiskussionen 2017
September 2018
Archiv W der geschriebenen Korpora
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
- Berliner Zeitung: Jan. 2009 - Dez. 2017
- Berliner Morgenpost: Jan. 2000 - Dez. 2017
- Fußball-Liveticker, kicker.de: 2006 - 2016
- Fußball-Spielberichte, kicker.de: 2006 - 2016
- Fußball-Liveticker, Sport-Informations-Dienst: 2010 - 2016
- NZZ Folio (Neue Züricher Zeitung Folio): Apr. 1994 - Dez. 2017
- Spiegel Online: Jan. 1999 - Dez. 2017
- Stern: Jan. 1996 - Dez. 2017
- ZEIT Christ und Welt: Apr. 2015 - Dez. 2017
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
- Kölner-Stadtanzeiger: Okt. 2000 - Dez. 2017
- Main-Spitze: Jan. 1998 - Dez. 2017
- Straubinger Tagblatt: Jul. 2014 - Dez. 2017
- Die Welt: Mrz. 1999 - Dez. 2017
- Welt am Sonntag: Jan. 1997 - Dez. 2017
- Welt Online: Jan. 2009 - Dez. 2017
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
- Kölnische Rundschau: Jan. 2002 - Dez. 2017
- Kölner Express: Jan. 2000 - Dez. 2017
- Main-Post: Aug. 1997 - Dez. 2017
- Mitteldeutsche Zeitung: Jan. 2000 - Dez. 2017
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde u.a. um die folgenden neuen Akquisitionen ergänzt:
- Hamburger Abendblatt: Jan. 1999 - Dez. 2017
- Freie Presse: Aug. 2011 - Dez. 2017
- Schwäbische Zeitung: Jul. 2011 - Dez. 2017
- Westfalen-Blatt: Apr. 2010 - Okt. 2015
Mai 2018
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- St. Galler Tagblatt: Jan. 2017 - Dez. 2017
- Meldungen der Deutschen Presse-Agentur: Jan. 2017 - Dez. 2017
- Die Presse: Jan. 2017 - Dez. 2017
- Falter: Jan. 2017 - Dez. 2017
- FOCUS: Jan. 2017 - Dez. 2017
- Hannoversche Allgemeine: Jan. 2017 - Dez. 2017
- Hamburger Morgenpost: Jan. 2017 - Dez. 2017
- Luxemburger Tageblatt: Jan. 2017 - Dez. 2017
- Mannheimer Morgen: Jan. 2017 - Dez. 2017
- NEWS: Jan. 2017 - Dez. 2017
- Nordkurier: Jan. 2017 - Dez. 2017
- Niederösterreichische Nachrichten: Jan. 2017 - Jun. 2017
- Nürnberger Nachrichten: Jan. 2017 - Dez. 2017
- Nürnberger Zeitung: Jan. 2017 - Dez. 2017
- NZZ am Sonntag: Jan. 2017 - Dez. 2017
- Neue Züricher Zeitung: Jan. 2017 - Dez. 2017
- profil: Jan. 2017 - Dez. 2017
- Die Rheinpfalz: Jan. 2017 - Dez. 2017
- Rhein-Zeitung: Jan. 2017 - Dez. 2017
- Sonntagsblick: Jan. 2017 - Dez. 2017
- Die Südostschweiz: Jan. 2017 - Dez. 2017
- Der Spiegel: Jan. 2017 - Dez. 2017
- Süddeutsche Zeitung: Jan. 2017 - Dez. 2017
- die tageszeitung: Jan. 2017 - Dez. 2017
- VDI Nachrichten: Jan. 2017 - Dez. 2017
- Weltwoche: Jan. 2017 - Dez. 2017
- Zeit Campus (02-04,06,08,10-12): Feb. 2017 - Dez. 2017
- Zeit Geschichte (Feb.,Mai,Aug.,Nov.): Feb. 2017 - Nov. 2017
- Die Zeit: Jan. 2017 - Dez. 2017
- Zeit Wissen (unvollst.): Apr. 2017 - Dez. 2017
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Aachener Nachrichten: Jan. 2017 - Dez. 2017
- Aachener Zeitung: Jan. 2017 - Dez. 2017
- Aar-Bote: Jan. 2017 - Dez. 2017
- Abendzeitung: Jan. 2017 - Dez. 2017
- Basler Zeitung: Jan. 2017 - Dez. 2017
- Badische Zeitung: Jan. 2017 - Dez. 2017
- Berliner Kurier: Jan. 2017 - Dez. 2017
- Blick: Jan. 2017 - Dez. 2017
- Börsen-Zeitung: Jan. 2017 - Dez. 2017
- Bayerische Rundschau: Jan. 2017 - Dez. 2017
- Bayerische Staatszeitung: Jan. 2017
- Der Bund: Jan. 2017 - Dez. 2017
- Coburger Tageblatt: Jan. 2017 - Dez. 2017
- Döbelner Allgemeine Zeitung: Jan. 2017 - Dez. 2017
- Darmstädter Echo: Jan. 2017 - Dez. 2017
- Die Kitzinger: Jan. 2017 - Dez. 2017
- Dresdner Neueste Nachrichten: Jan. 2017 - Dez. 2017
- Der Prignitzer: Jan. 2017 - Dez. 2017
- Format: Jan. 2017 - Dez. 2017
- Frankfurter Neue Presse: Jan. 2017 - Dez. 2017
- FOCUS-MONEY: Jan. 2017 - Dez. 2017
- Fränkischer Tag: Jan. 2017 - Dez. 2017
- General-Anzeiger Bonn: Jan. 2017 - Dez. 2017
- Gelnhäuser Tageblatt: Jan. 2017 - Mrz. 2017
- Handelsblatt: Jan. 2017 - Dez. 2017
- Hofheimer Zeitung: Jan. 2017 - Dez. 2017
- Hochheimer Zeitung: Jan. 2017 - Dez. 2017
- Höchster Kreisblatt: Jan. 2017 - Dez. 2017
- Heilbronner Stimme: Jan. 2017 - Dez. 2017
- Hohenloher Tagblatt: Jan. 2017 - Dez. 2017
- Hohenzollerische Zeitung: Jan. 2017 - Dez. 2017
- Kleine Zeitung: Jan. 2017 - Dez. 2017
- Kreis-Anzeiger: Jan. 2017 - Dez. 2017
- Kurier (Österreich): Jan. 2017 - Dez. 2017
- Lauterbacher Anzeiger: Jan. 2017 - Dez. 2017
- Lampertheimer Zeitung: Jan. 2017 - Dez. 2017
- Lausitzer Rundschau: Jan. 2017 - Dez. 2017
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Leipziger-Volkszeitung: Jan. 2017 - Dez. 2017
- Märkische Allgemeine: Jan. 2017 - Dez. 2017
- Allgemeine Zeitung: Jan. 2017 - Dez. 2017
- Main-Taunus-Kurier: Jan. 2017 - Dez. 2017
- Metzinger Uracher Volksblatt: Jan. 2017 - Dez. 2017
- Salzburger Nachrichten: Jan. 2017 - Dez. 2017
- Neue Kronen-Zeitung: Jan. 2017 - Dez. 2017
- Neue Luzerner Zeitung: Jan. 2017 - Dez. 2017
- Norddeutsche Neueste Nachrichten: Jan. 2017 - Dez. 2017
- Nassauische Neue Presse: Jan. 2017 - Dez. 2017
- Neues Volksblatt: Jan. 2017 - Dez. 2017
- Neue Vorarlberger Tageszeitung: Jan. 2017 - Dez. 2017
- Neue Westfälische: Jan. 2017 - Dez. 2017
- Die Nordwestschweiz: Jan. 2017 - Dez. 2017
- Neue Württembergische Zeitung: Jan. 2017 - Dez. 2017
- Oschatzer Allgemeine Zeitung: Jan. 2017 - Dez. 2017
- Oberhessische Zeitung: Jan. 2017 - Dez. 2017
- Osterländer Volkszeitung: Jan. 2017 - Dez. 2017
- Potsdamer Neuste Nachrichten: Jan. 2017 - Dez. 2017
- Passauer Neue Presse: Jan. 2017 - Dez. 2017
- Reutlinger Nachrichten: Jan. 2017 - Dez. 2017
- Rheinische Post: Jan. 2017 - Dez. 2017
- Rundschau für den Schwäbischen Wald: Jan. 2017 - Dez. 2017
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Oberösterreichische Nachrichten: Jan. 2017 - Dez. 2017
- Ostthüringer Zeitung: Feb. 2017 - Dez. 2017
- Saale-Zeitung: Jan. 2017 - Dez. 2017
- Saarbrücker Zeitung: Jan. 2017 - Dez. 2017
- Südkurier: Jan. 2017 - Dez. 2017
- Der Standard: Jan. 2017 - Dez. 2017
- Schweriner Volkszeitung: Jan. 2017 - Dez. 2017
- Südwest Presse: Jan. 2017 - Dez. 2017
- Sächsische Zeitung: Jan. 2017 - Dez. 2017
- Tagesanzeiger: Jan. 2017 - Dez. 2017
- SonntagsZeitung (Tages-Anzeiger): Jan. 2017 - Dez. 2017
- Thüringer Allgemeine: Feb. 2017 - Dez. 2017
- Thüringische Landeszeitung: Feb. 2017 - Dez. 2017
- Taunus Zeitung: Jan. 2017 - Dez. 2017
- Der Tagesspiegel: Jan. 2017 - Dez. 2017
- Tiroler Tageszeitung: Jan. 2017 - Dez. 2017
- Trierischer Volksfreund: Jan. 2017 - Dez. 2017
- Usinger Anzeiger: Jan. 2017 - Dez. 2017
- Vorarlberger Nachrichten: Jan. 2017 - Dez. 2017
- Westdeutsche Zeitung: Jan. 2017 - Dez. 2017
- Wiener Zeitung: Jan. 2017 - Dez. 2017
- Wiesbadener Kurier: Jan. 2017 - Dez. 2017
- Wiesbadener Tagblatt: Jan. 2017 - Dez. 2017
Juli 2017
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- St. Galler Tagblatt: Jul. 2015 - Dez. 2016
- Meldungen der Deutschen Presse-Agentur: Jul. 2015 - Dez. 2016
- Die Presse: Jul. 2015 - Dez. 2016
- Falter: Jul. 2015 - Dez. 2016
- FOCUS: Jul. 2015 - Dez. 2016
- Hannoversche Allgemeine: Jul. 2015 - Dez. 2016
- Hamburger Morgenpost: Jul. 2015 - Dez. 2016
- Luxemburger Tageblatt: Jul. 2015 - Dez. 2016
- Mannheimer Morgen: Jul. 2015 - Dez. 2016
- NEWS: Jul. 2015 - Dez. 2016
- 'de.*'-Usenet-Newsgruppen: Jan. 2015 - Dez. 2016
- Nordkurier: Jul. 2015 - Dez. 2016
- Niederösterreichische Nachrichten: Feb. 2016 - Dez. 2016
- Nürnberger Nachrichten: Jul. 2015 - Dez. 2016
- Nürnberger Zeitung: Jul. 2015 - Dez. 2016
- NZZ am Sonntag: Jul. 2015 - Dez. 2016
- Neue Züricher Zeitung: Jul. 2015 - Dez. 2016
- profil: Jul. 2015 - Dez. 2016
- Die Rheinpfalz: Jul. 2015 - Dez. 2016
- Rhein-Zeitung: Jul. 2015 - Dez. 2016
- Sonntagsblick: Jul. 2015 - Dez. 2016
- Die Südostschweiz: Jul. 2015 - Dez. 2016
- Süddeutsche Zeitung: Jul. 2015 - Dez. 2016
- die tageszeitung: Jul. 2015 - Dez. 2016
- VDI Nachrichten: Jul. 2015 - Dez. 2016
- Weltwoche: Jul. 2015 - Dez. 2016
- Zeit Campus (02-04,06,08,10-12): Aug. 2015 - Dez. 2016
- Zeit Geschichte (Feb.,Mai,Aug.,Nov.): Aug. 2015 - Dez. 2016
- Die Zeit: Jul. 2015 - Dez. 2016
Das Archiv wurde um die folgenden Korpora ergänzt:
- Der Spiegel: 1947 - 1992, 1995 - 2016
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Aachener Nachrichten: Jul. 2015 - Dez. 2016
- Aachener Zeitung: Jul. 2015 - Dez. 2016
- Aar-Bote: Jul. 2015 - Dez. 2016
- Abendzeitung: Jul. 2015 - Dez. 2016
- Basler Zeitung: Jul. 2015 - Dez. 2016
- Badische Zeitung: Jul. 2015 - Dez. 2016
- Berliner Kurier: Jul. 2015 - Dez. 2016
- Blick: Jul. 2015 - Dez. 2016
- Börsen-Zeitung: Jul. 2015 - Dez. 2016
- Bayerische Rundschau: Jul. 2015 - Dez. 2016
- Bayerische Staatszeitung: Jul. 2015 - Jun. 2015
- Der Bund: Jul. 2015 - Dez. 2016
- Coburger Tageblatt: Jul. 2015 - Dez. 2016
- Döbelner Allgemeine Zeitung: Jul. 2015 - Dez. 2016
- Darmstädter Echo: Jul. 2015 - Dez. 2016
- Die Kitzinger: Jul. 2015 - Dez. 2016
- Dresdner Neueste Nachrichten: Jul. 2015 - Dez. 2016
- Der Prignitzer: Jul. 2015 - Dez. 2016
- Format: Jul. 2015 - Dez. 2016
- Frankfurter Neue Presse: Jul. 2015 - Dez. 2016
- FOCUS-MONEY: Jul. 2015 - Dez. 2016
- Fränkischer Tag: Jul. 2015 - Dez. 2016
- General-Anzeiger Bonn: Jul. 2015 - Dez. 2016
- Gelnhäuser Tageblatt: Jul. 2015 - Dez. 2016
- Handelsblatt: Jul. 2015 - Dez. 2016
- Hofheimer Zeitung: Jul. 2015 - Dez. 2016
- Hochheimer Zeitung: Jan. 2015 - Dez. 2016
- Höchster Kreisblatt: Jul. 2015 - Dez. 2016
- Heilbronner Stimme: Jul. 2015 - Dez. 2016
- Hohenloher Tagblatt: Jul. 2015 - Dez. 2016
- Hohenzollerische Zeitung: Jul. 2015 - Dez. 2016
- Kleine Zeitung: Jul. 2015 - Dez. 2016
- Kreis-Anzeiger: Jul. 2015 - Dez. 2016
- Kurier (Österreich): Jul. 2015 - Dez. 2016
- Lauterbacher Anzeiger: Jul. 2015 - Dez. 2016
- Lampertheimer Zeitung: Jul. 2015 - Dez. 2016
- Lausitzer Rundschau: Jul. 2015 - Dez. 2016
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Frankfurter Rundschau: Jul. 2015 - Dez. 2016
- Leipziger-Volkszeitung: Jul. 2015 - Dez. 2016
- Märkische Allgemeine: Jul. 2015 - Dez. 2016
- Allgemeine Zeitung: Jul. 2015 - Dez. 2016
- Main-Taunus-Kurier: Jul. 2015 - Dez. 2016
- Metzinger Uracher Volksblatt: Jul. 2015 - Dez. 2016
- Salzburger Nachrichten: Jul. 2015 - Dez. 2016
- Neue Kronen-Zeitung: Jan. 2014 - Dez. 2016
- Neue Luzerner Zeitung: Jul. 2015 - Dez. 2016
- Norddeutsche Neueste Nachrichten: Jul. 2015 - Dez. 2016
- Nassauische Neue Presse: Jul. 2015 - Dez. 2016
- Neues Volksblatt: Jul. 2015 - Dez. 2016
- Neue Vorarlberger Tageszeitung: Jul. 2015 - Dez. 2016
- Neue Westfälische: Jul. 2015 - Dez. 2016
- Die Nordwestschweiz: Jul. 2015 - Dez. 2016
- Neue Württembergische Zeitung: Jul. 2015 - Dez. 2016
- Oschatzer Allgemeine Zeitung: Jul. 2015 - Dez. 2016
- Oberhessische Zeitung: Jul. 2015 - Dez. 2016
- Osterländer Volkszeitung: Jul. 2015 - Dez. 2016
- Potsdamer Neuste Nachrichten: Jul. 2015 - Dez. 2016
- Passauer Neue Presse: Jul. 2015 - Dez. 2016
- Reutlinger Nachrichten: Jul. 2015 - Dez. 2016
- Rheinische Post: Jul. 2015 - Dez. 2016
- Rundschau für den Schwäbischen Wald: Jul. 2015 - Dez. 2016
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Saale-Zeitung: Jul. 2015 - Dez. 2016
- Saarbrücker Zeitung: Jul. 2015 - Dez. 2016
- Südkurier: Jul. 2015 - Dez. 2016
- Sonntag Aktuell: Jul. 2015 - Dez. 2016
- Der Standard: Jul. 2015 - Dez. 2016
- Stuttgarter Nachrichten: Jul. 2015 - Dez. 2016
- Stuttgarter Zeitung: Jul. 2015 - Dez. 2016
- Schweriner Volkszeitung: Jul. 2015 - Dez. 2016
- Südwest Presse: Jul. 2015 - Dez. 2016
- Sächsische Zeitung: Jul. 2015 - Dez. 2016
- SonntagsZeitung (Tages-Anzeiger): Jul. 2015 - Dez. 2016
- Tagesanzeiger: Jul. 2015 - Dez. 2016
- Taunus Zeitung: Jul. 2015 - Dez. 2016
- Torgauer Zeitung: Jul. 2015 - Dez. 2016
- Der Tagesspiegel: Jul. 2015 - Dez. 2016
- Tiroler Tageszeitung: Jul. 2015 - Dez. 2016
- Trierischer Volksfreund: Jul. 2015 - Dez. 2016
- Usinger Anzeiger: Jul. 2015 - Dez. 2016
- Vorarlberger Nachrichten: Jul. 2015 - Dez. 2016
- WirtschaftsBlatt: Jul. 2015 - Dez. 2016
- Westdeutsche Zeitung: Jul. 2015 - Dez. 2016
- Wiener Zeitung: Jul. 2015 - Dez. 2016
- Wiesbadener Kurier: Jul. 2015 - Dez. 2016
- Wiesbadener Tagblatt: Jul. 2015 - Dez. 2016
- Oberösterreichische Nachrichten: Jul. 2015 - Dez. 2016
November 2016
Archiv WP_FS der fremdsprachigen Wikipedia-Artikel und -Diskussionen
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Wikipedia-Artikel (französisch) 2015
- Wikipedia-Diskussionen (französisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (französisch) 2015
- Wikipedia-Artikel (ungarisch) 2015
- Wikipedia-Diskussionen (ungarisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (ungarisch) 2015
- Wikipedia-Artikel (norwegisch) 2015
- Wikipedia-Diskussionen (norwegisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (norwegisch) 2015
- Wikipedia-Artikel (spanisch) 2015
- Wikipedia-Diskussionen (spanisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (spanisch) 2015
- Wikipedia-Artikel (kroatisch) 2015
- Wikipedia-Diskussionen (kroatisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (kroatisch) 2015
- Wikipedia-Artikel (italienisch) 2015
- Wikipedia-Diskussionen (italienisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (italienisch) 2015
- Wikipedia-Artikel (polnisch) 2015
- Wikipedia-Diskussionen (polnisch) zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen (polnisch) 2015
Juni 2016
Archiv WPE der englischsprachigen Wikipedia-Artikel und -Diskussionen
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Wikipedia-Artikel 2015
- Wikipedia-Diskussionen zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen 2015
April 2016
Archiv WP der Wikipedia-Artikel und -Diskussionen
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Wikipedia-Artikel 2013
- Wikipedia-Diskussionen zu Artikeln 2013
- Wikipedia-Artikel 2015
- Wikipedia-Diskussionen zu Artikeln 2015
- Wikipedia-Benutzerdiskussionen 2015
März 2016
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- St. Galler Tagblatt: Aug. 2014 - Jul. 2015
- Burgenländische Volkszeitung: Jul. 2014 - Jul. 2015
- Meldungen der Deutschen Presse-Agentur: Jul. 2014 - Jul. 2015
- Die Presse: Jan. 2002 - Jul. 2015
- FOCUS: Jul. 2014 - Jun. 2015
- Hannoversche Allgemeine: Aug. 2014 - Jul. 2015
- Hamburger Morgenpost: Jul. 2014 - Jul. 2015
- Luxemburger Tageblatt: Jul. 2014 - Jul. 2015
- Mannheimer Morgen: Aug. 2014 - Jul. 2015
- NEWS: Jul. 2014 - Jun. 2015
- Nordkurier: Jul. 2014 - Jul. 2015
- Niederösterreichische Nachrichten: Jul. 2014 - Apr. 2015
- Nürnberger Nachrichten: Aug. 2014 - Jul. 2015
- Nürnberger Zeitung: Aug. 2014 - Jul. 2015
- NZZ am Sonntag: Jul. 2014 - Jun. 2015
- Neue Züricher Zeitung: Jul. 2014 - Jul. 2015
- profil: Jul. 2014 - Jun. 2015
- Die Rheinpfalz: Aug. 2014 - Jul. 2015
- Rhein-Zeitung: Aug. 2014 - Dez. 2014
- Sonntagsblick: Jul. 2014 - Jun. 2015
- Die Südostschweiz: Aug. 2014 - Jul. 2015
- Süddeutsche Zeitung: Aug. 2014 - Jul. 2015
- die tageszeitung: Apr. 2014 - Jun. 2015
- VDI Nachrichten: Jul. 2014 - Jul. 2015
- Weltwoche: Jul. 2014 - Jul. 2015
- Zeit Campus (02-04,06,08,10-12): Aug. 2014 - Apr. 2015
- Zeit Geschichte (Feb.,Mai,Aug.,Nov.): Feb. 2015 - Mai 2015
- Die Zeit: Jan. 1953 - Jul. 2015
- Zeit Wissen (unvollst.): Aug. 2014 - Jun. 2015
Das Archiv wurde um die folgenden Korpora ergänzt:
- Falter: Jan. 2000 - Jul. 2015
- 'de.*'-Usenet-Newsgruppen: Sep. 2013 - Jun. 2015
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Aachener Nachrichten: Jul. 2014 - Jul. 2015
- Aachener Zeitung: Jul. 2014 - Jul. 2015
- Aar-Bote: Jul. 2014 - Jul. 2015
- Abendzeitung: Jul. 2014 - Jul. 2015
- Basler Zeitung: Jul. 2014 - Jul. 2015
- Badische Zeitung: Jul. 2014 - Jul. 2015
- Berliner Kurier: Jul. 2014 - Jul. 2015
- Blick: Jul. 2014 - Jul. 2015
- Börsen-Zeitung: Jul. 2014 - Jul. 2015
- Bayerische Rundschau: Jul. 2014 - Jul. 2015
- Bayerische Staatszeitung: Jul. 2014 - Jun. 2015
- Der Bund: Jul. 2014 - Jul. 2015
- Coburger Tageblatt: Jul. 2014 - Jul. 2015
- Döbelner Allgemeine Zeitung: Jul. 2014 - Jul. 2015
- Darmstädter Echo: Jul. 2014 - Jul. 2015
- Die Kitzinger: Jul. 2014 - Jul. 2015
- Dresdner Neueste Nachrichten: Jul. 2014 - Jul. 2015
- Der Prignitzer: Jul. 2014 - Jul. 2015
- Format: Jul. 2014 - Jun. 2015
- Frankfurter Neue Presse: Jul. 2014 - Jul. 2015
- FOCUS-MONEY: Jul. 2014 - Jul. 2015
- Fränkischer Tag: Jul. 2014 - Jul. 2015
- General-Anzeiger Bonn: Jul. 2014 - Jul. 2015
- Gelnhäuser Tageblatt: Jul. 2014 - Jul. 2015
- Handelsblatt: Jul. 2014 - Jul. 2015
- Hofheimer Zeitung: Jul. 2014 - Jun. 2015
- Hochheimer Zeitung: Jul. 2014 - Dez. 2014
- Höchster Kreisblatt: Jul. 2014 - Jul. 2015
- Heilbronner Stimme: Jul. 2014 - Jul. 2015
- Hohenloher Tagblatt: Jul. 2014 - Jul. 2015
- Hohenzollerische Zeitung: Jul. 2014 - Jun. 2015
- Kleine Zeitung: Jul. 2014 - Jul. 2015
- Kreis-Anzeiger: Jul. 2014 - Jul. 2015
- Kurier (Österreich): Jul. 2014 - Jul. 2015
- Lauterbacher Anzeiger: Jul. 2014 - Jul. 2015
- Lampertheimer Zeitung: Jul. 2014 - Jul. 2015
- Lausitzer Rundschau: Jul. 2014 - Jul. 2015
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Frankfurter Rundschau: Jul. 2014 - Jul. 2015
- Leipziger-Volkszeitung: Jul. 2014 - Jul. 2015
- Märkische Allgemeine: Jul. 2014 - Jul. 2015
- Allgemeine Zeitung: Jul. 2014 - Jul. 2015
- Main-Taunus-Kurier: Jul. 2014 - Jul. 2015
- Metzinger Uracher Volksblatt: Jul. 2014 - Jul. 2015
- Salzburger Nachrichten: Jul. 2014 - Jul. 2015
- Neue Kronen-Zeitung: Jul. 2014 - Jul. 2015
- Neue Luzerner Zeitung: Jul. 2014 - Jul. 2015
- Norddeutsche Neueste Nachrichten: Jul. 2014 - Jul. 2015
- Nassauische Neue Presse: Jul. 2014 - Jul. 2015
- Neues Volksblatt: Jul. 2014 - Jul. 2015
- Neue Vorarlberger Tageszeitung: Jul. 2014 - Jul. 2015
- Neue Westfälische: Jul. 2014 - Jul. 2015
- Die Nordwestschweiz: Jul. 2014 - Jul. 2015
- Neue Württembergische Zeitung: Jul. 2014 - Jul. 2015
- Oschatzer Allgemeine Zeitung: Jul. 2014 - Jul. 2015
- Oberhessische Zeitung: Jul. 2014 - Jul. 2015
- Osterländer Volkszeitung: Jul. 2014 - Jul. 2015
- Potsdamer Neuste Nachrichten: Jul. 2014 - Jul. 2015
- Passauer Neue Presse: Jul. 2014 - Jul. 2015
- Reutlinger Nachrichten: Jul. 2014 - Jul. 2015
- Rheinische Post: Jul. 2014 - Jul. 2015
- Rundschau für den Schwäbischen Wald: Jul. 2014 - Jul. 2015
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Saale-Zeitung: Jul. 2014 - Jul. 2015
- Saarbrücker Zeitung: Jul. 2014 - Jul. 2015
- Südkurier: Jul. 2014 - Jul. 2015
- Sonntag Aktuell: Jul. 2014 - Jun. 2015
- Der Standard: Jul. 2014 - Jul. 2015
- Stuttgarter Nachrichten: Jul. 2014 - Jul. 2015
- Stuttgarter Zeitung: Jul. 2014 - Jul. 2015
- Schweriner Volkszeitung: Jul. 2014 - Jul. 2015
- Südwest Presse: Jul. 2014 - Jul. 2015
- Sächsische Zeitung: Jul. 2014 - Jul. 2015
- SonntagsZeitung (Tages-Anzeiger): Jul. 2014 - Jun. 2015
- Tauber-Zeitung: Jul. 2014 - Apr. 2015
- Taunus Zeitung: Jul. 2014 - Jul. 2015
- Torgauer Zeitung: Jul. 2014 - Jun. 2015
- Der Tagesspiegel: Jul. 2014 - Jul. 2015
- Trierischer Volksfreund: Jul. 2014 - Jul. 2015
- Usinger Anzeiger: Jul. 2014 - Jul. 2015
- Vorarlberger Nachrichten: Jul. 2014 - Jul. 2015
- WirtschaftsBlatt: Jul. 2014 - Jul. 2015
- Westdeutsche Zeitung: Jul. 2014 - Jul. 2015
- Wiener Zeitung: Jul. 2014 - Jul. 2015
- Wiesbadener Kurier: Jul. 2014 - Jul. 2015
- Wiesbadener Tagblatt: Jul. 2014 - Jul. 2015
Das Archiv wurde um die folgenden Korpora ergänzt:
- Oberösterreichische Nachrichten: Jan. 2001 - Jul. 2015
- Osttühringer Zeitung: Jan. 2000 - Jun. 2012
- Tagesanzeiger: Jan. 2001 - Jul. 2015
- Thüringer Allgemeine: Jan. 2000 - Jun. 2012
- Thüringische Landeszeitung: Jan. 2000 - Jun. 2012
- Tiroler Tageszeitung: Jan. 2001 - Jul. 2015
Die Ostthüringer Zeitung, die Thüringer Allgemeine und die Thüringische Landeszeitung wurden neu akquiriert. Die restlichen aufgeführten Korpora, welche zum Teil im W-Archiv vorhanden sind, wurden um Texte von Anfang 2000/2001 bis Mitte 2015 ergänzt.
März 2015
Archiv W2 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Aachener Nachrichten: 2004 - 2014,
- Aachener Zeitung: 2003 - 2014,
- Aar-Bote: 2002 - 2014,
- Abendzeitung: 2005 - 2014,
- Basler Zeitung: 2000 - 2014,
- Badische Zeitung: 2003 - 2014,
- Berner Zeitung: 2001 - 2013,
- Berliner Kurier: 2000 - 2014,
- Blick: 2004 - 2014,
- Börsen-Zeitung: 2004 - 2014,
- Bayerische Rundschau: 2009 - 2014,
- Bayerische Staatszeitung: 2004 - 2014,
- Der Bund: 2000 u. 2004 - 2014,
- Coburger Tageblatt: 2009 - 2014,
- Döbelner Allgemeine Zeitung: 2013 - 2014,
- Darmstädter Echo: 2000 - 2014,
- Die Kitzinger: 2011 - 2014,
- Dresdner Neueste Nachrichten: 2013 - 2014,
- Der Prignitzer: 2013 - 2014,
- Format: 2000 - 2014,
- Frankfurter Neue Presse: 2000 - 2014,
- FOCUS-MONEY: 2000 - 2014,
- Fränkischer Tag: 2000 - 2014,
- General-Anzeiger Bonn: 2000 - 2014,
- Gelnhäuser Tageblatt: 2004 - 2014,
- Handelsblatt: 2000 - 2014,
- Hofheimer Zeitung: 2003 - 2014,
- Hochheimer Zeitung: 2004 - 2014,
- Höchster Kreisblatt: 2014,
- Heilbronner Stimme: 2009 - 2014,
- Hohenloher Tagblatt: 2014,
- Hohenzollerische Zeitung: 2014,
- Kleine Zeitung: 2002 - 2014,
- Kreis-Anzeiger: 2004 - 2014,
- Neue Kärntner Tageszeitung: 2004 - 2014,
- Kurier (Österreich): 2002 - 2014,
- Lauterbacher Anzeiger: 2004 - 2014,
- Lampertheimer Zeitung: 2007 - 2014,
- Lausitzer Rundschau: 2000 - 2014.
Archiv W3 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Frankfurter Rundschau: 2000 - 2014,
- Leipziger-Volkszeitung: 2000 - 2014,
- Märkische Allgemeine: 2007 - 2014,
- Allgemeine Zeitung: 2000 - 2014,
- Main-Taunus-Kurier: 2002 - 2014,
- Metzinger Uracher Volksblatt: 2014,
- Main-Taunus-Kurier: 2002 - 2014,
- Salzburger Nachrichten: 2001 - 2014,
- Neue Kronen-Zeitung: 2002 - 2014,
- Neue Luzerner Zeitung: 2000 - 2014,
- Norddeutsche Neueste Nachrichten: 2013 - 2014,
- Nassauische Neue Presse: 2014,
- Neues Volksblatt: 2000 - 2014,
- Neue Vorarlberger Tageszeitung: 2000 - 2014,
- Neue Westfälische: 2003 - 2014,
- Die Nordwestschweiz: 2000 - 2004 u. 2009 - 2014,
- Neue Württembergische Zeitung: 2007 - 2014,
- Oschatzer Allgemeine Zeitung: 2013 - 2014,
- Oberhessische Zeitung: 2007 - 2014,
- Osterländer Volkszeitung: 2013 - 2014,
- Potsdamer Neuste Nachrichten: 2005 - 2014,
- Passauer Neue Presse: 2001 - 2014,
- Reutlinger Nachrichten: 2014,
- Rheinische Post: 2001 - 2014,
- Rundschau für den Schwäbischen Wald: 2014.
Archiv W4 mit Neuakquisitionen der "GBI-Genios Deutsche Wirtschaftsdatenbank GmbH"
Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Saale-Zeitung: 2011 - 2014,
- Saarbrücker Zeitung: 2000 - 2014,
- Südkurier: 2000 - 2014,
- Sonntag Aktuell: 2000 - 2014,
- Der Standard: 2000 - 2014,
- Stuttgarter Nachrichten: 2004 - 2014,
- Stuttgarter Zeitung: 2000 - 2014,
- Schweriner Volkszeitung: 2004 - 2014,
- Südwest Presse: 2007 - 2014,
- Sächsische Zeitung: 2000 - 2014,
- SonntagsZeitung (Tages-Anzeiger): 2000 - 2014,
- Tauber-Zeitung: 2014,
- Taunus Zeitung: 2014,
- Torgauer Zeitung: 2013 - 2014,
- Der Tagesspiegel: 2000 - 2014,
- Trierischer Volksfreund: 2000 - 2014,
- Usinger Anzeiger: 2004 - 2014,
- Vorarlberger Nachrichten: 2002 - 2014,
- WirtschaftsBlatt: 2000 - 2014,
- Westdeutsche Zeitung: 2009 - 2014,
- Wiener Zeitung: 2000 - 2014,
- Wiesbadener Kurier: 2000 - 2014,
- Wiesbadener Tagblatt: 2000 - 2014,
- Oberösterreichische Nachrichten: 2014.
Dezember 2014
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Burgenländische Volkszeitung: Jan. - Jun. 2014,
- dpa: Jan. - Jun. 2014
- Hamburger Morgenpost: Jan. - Jun. 2014,
- Hannoversche Allgemeine: Jan. - Jul. 2014,
- Mannheimer Morgen: Jan. - Jul. 2014,
- Niederösterreichische Nachrichten: Jan. - Jun. 2014,
- Nürnberger Nachrichten: Jan. - Jul. 2014,
- Nürnberger Zeitung: Jan. - Jul. 2014,
- Die Rheinpfalz: Jan. - Jul. 2014,
- Rhein-Zeitung: Jan. - Jul. 2014,
- St. Galler Tagblatt: Jan. - Jul. 2014,
- Die Südostschweiz: Jan. - Jul. 2014,
- die tageszeitung: Jan. - Mär. 2014,
- VDI Nachrichten: Jan. - Jun. 2014,
- Die Zeit: Jan. - Jul. 2014.
Ergänzend zu den o.g. Neuaqkuisitionen werden ab sofort auch alle Ausgaben der Süddeutschen Zeitung von 1992 bis aktuell 2014 ein fester Bestandteil des W-Archivs sein und ebenfalls bei zukünftigen Releases des W-Archivs um neu akquirierte Texte erweitert:
- Süddeutsche Zeitung: Jan. 2010 - Jul. 2014.
Weiterhin wurden die folgenden Neuakquisitionen der GBI-Genios Deutsche Wirtschaftsdatenbank GmbH, einem Tochterunternehmen der Frankfurter Allgemeinen Zeitung und der Verlagsgruppe Handelsblatt, akquiriert und in das vorliegende Release des W-Archivs mit aufgenommen:
- foc - FOCUS: Jan. 2000 - Jun. 2014,
- ltb - Luxemburger Tageblatt: Jan. 2008 - Jun. 2014,
- news - NEWS (Verlagsgruppe NEWS GmbH; Wien, Österreich): Jan. 2002 - Jun. 2014,
- nku - Nordkurier: Jan. 2000 - Jun. 2014,
- nzs - NZZ am Sonntag: Mär. 2002 - Jun. 2014,
- nzz - Neue Züricher Zeitung: Jan. 2000 - Jun. 2014,
- prf - profil (Verlagsgruppe NEWS GmbH; Wien, Österreich): Jan. 2000 - Jun. 2014,
- sbl - Sonntagsblick (Zürich, Schweiz): Jan. 2005 - Jun. 2014 (zus. Feb. 2001),
- wwo - Weltwoche: Jan. 2005 - Jun. 2014 (zus. Apr. 2008; Jan. 2010 n.v.),
- zca - Zeit Campus (Feb.-Apr., Jun., Aug., Okt.-Dez.): Feb. 2009 - Jun. 2014 (Dez. 2013 n.v.),
- zge - Zeit Geschichte (Feb., Mai, Aug., Nov.): Feb. 2010 - Mai 2014,
- zwi - Zeit Wissen (unvollst.): Feb. 2009 - Jun. 2014.
November 2014
Archiv TAGGED-T2 mit einer Auswahl Tree Tagger-getaggter Korpora (2010-2014)
Das Archiv hat denselben Inhalt wie TAGGED-C2, siehe weiter unten. Verwendet wurde das STTS-Tagset (Stuttgarter-Tübinger Tagset).
Archiv TAGGED-C2 mit einer Auswahl CONNEXOR-getaggter Korpora (2010-2014)
Verwendet wurde das Connexor-Tagset. Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Braunschweiger Zeitung: Jan. 2010 - Jun. 2013,
- Burgenländische Volkszeitung: Jan. 2010 - Jun. 2014,
- dpa: Apr. 2010 - Jun. 2014
- Hamburger Morgenpost: Jan. 2010 - Jun. 2014,
- Hannoversche Allgemeine: Jan. 2010 - Jul. 2014,
- Mannheimer Morgen: Jan. 2010 - Jul. 2014,
- Niederösterreichische Nachrichten: Jan. 2010 - Jun. 2014,
- Nürnberger Nachrichten: Jan. 2010 - Jul.2014,
- Nürnberger Zeitung: Jan. 2010 - Jul.2014,
- Die Rheinpfalz: Aug. 2010 - Jul. 2014,
- Rhein-Zeitung: Jan. 2010 - Jul. 2014,
- St. Galler Tagblatt: Jan. 2010 - Dez. 2013,
- Süddeutsche Zeitung: Jan. 2010 - Jul. 2014,
- Die Südostschweiz: Jan. 2010 - Juli 2014,
- die tageszeitung: Jan. 2010 - Mär. 2014,
- VDI Nachrichten: Jan. 2010 - Jun. 2014,
- Die Zeit: Jan. 2010 - Jul. 2014.
August 2014
Archiv W der geschriebenen Korpora
Wegen Kündigung der Lizenzvereinbarung von Seiten des Verlags müssen ab sofort die folgenden Ausgaben der Zeit aus dem Archiv entfernt werden:
- z94 - z99 : Die Zeit 1994 - 1999
Juli 2014
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Burgenländische Volkszeitung: Aug. - Dez. 2013,
- Hamburger Morgenpost: Jul. - Dez. 2013,
- Hannoversche Allgemeine: Aug. - Dez. 2013,
- Mannheimer Morgen: Sept. - Dez. 2013,
- Niederösterreichische Nachrichten: Aug. - Dez. 2013,
- Nürnberger Nachrichten: Aug. - Dez. 2013,
- Nürnberger Zeitung: Aug. - Dez. 2013,
- Die Rheinpfalz: Aug. - Dez. 2013,
- Rhein-Zeitung: Mär. - Dez. 2013,
- St. Galler Tagblatt: Aug. - Dez. 2013,
- Die Südostschweiz: Aug. - Dez. 2013,
- VDI Nachrichten: Jan. - Dez. 2013,
- Die Zeit: Sept. - Dez. 2013.
Juni 2014
Archiv HIST der historischen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- gmc - GerManC
Dezember 2013
Archiv HIST der historischen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Mannheimer Korpus historischer Zeitungen
- Mannheimer Korpus historischer Zeitschriften
November 2013
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jan. - Jun. 2013,
- Burgenländische Volkszeitung: Jan. - Jul. 2013,
- dpa: Jan. - Jul. 2013
- Hamburger Morgenpost: Jan. - Jun. 2013,
- Hannoversche Allgemeine: Jan. - Jul. 2013,
- Mannheimer Morgen: Jan. - Aug. 2013,
- Niederösterreichische Nachrichten: Jan. - Jul. 2013,
- Nürnberger Nachrichten: Jan. - Jul. 2013,
- Nürnberger Zeitung: Jan. - Jul. 2013,
- Die Rheinpfalz: Jan. - Jul. 2013,
- Rhein-Zeitung: Jan. - Feb. 2013,
- St. Galler Tagblatt: Jan. - Jul. 2013,
- Die Südostschweiz: Jan. - Jul. 2013,
- die tageszeitung: Jan. - Mär. 2013,
- Die Zeit: Jan. - Aug. 2013.
Juni 2013
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jul. - Dez. 2012,
- Burgenländische Volkszeitung: Jul. - Dez. 2012,
- dpa: Jul. - Dez. 2012
- Hamburger Morgenpost: Jul. - Dez. 2012,
- Hannoversche Allgemeine: Jul. - Dez. 2012,
- Mannheimer Morgen: Jul. - Dez. 2012,
- Niederösterreichische Nachrichten: Jul. - Dez. 2012,
- Nürnberger Nachrichten: Jul. - Dez. 2012,
- Nürnberger Zeitung: Jul. - Dez. 2012,
- Die Rheinpfalz: Jul. - Dez. 2012,
- Rhein-Zeitung: Jul. - Dez. 2012,
- St. Galler Tagblatt: Jul. - Dez. 2012,
- Die Südostschweiz: Jul. - Dez. 2012,
- VDI Nachrichten: Aug. - Dez. 2012,
- Die Zeit: Aug. - Dez. 2012,
- Plenarprotokolle
Dezember 2012
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jan. - Jul. 2012,
- Burgenländische Volkszeitung: Jan. - Jun. 2012,
- dpa: Jan. - Jun. 2012
- Hamburger Morgenpost: Jan. - Jul. 2012,
- Hannoversche Allgemeine: Jan. - Jul. 2012,
- Mannheimer Morgen: Jan. - Jul. 2012,
- Niederösterreichische Nachrichten: Feb. - Jun. 2012,
- Nürnberger Nachrichten: Jan. - Jul. 2012,
- Nürnberger Zeitung: Jan. - Jul. 2012,
- Die Rheinpfalz: Jan. - Jul. 2012,
- Rhein-Zeitung: Jan. - Jul. 2012,
- St. Galler Tagblatt: Jan. - Jul. 2012,
- Die Südostschweiz: Jan. - Jul. 2012,
- spektrumdirekt: Jan. - Aug. 2012,
- die tageszeitung: Jan. - Mär. 2012,
- VDI Nachrichten: Jan. - Jul. 2012,
- Die Zeit: Jan. - Aug. 2012.
April 2012
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Sep. - Dez. 2011,
- dpa: Okt. - Dez. 2011
- Hamburger Morgenpost: Jul. - Dez. 2011,
- Hannoversche Allgemeine: Sep. - Dez. 2011,
- Mannheimer Morgen: Okt. - Dez. 2011,
- Nürnberger Nachrichten: Sep. - Dez. 2011,
- Nürnberger Zeitung: Sep. - Dez. 2011,
- Die Rheinpfalz: Sep. - Dez. 2011,
- Rhein-Zeitung: Sep. - Dez. 2011,
- St. Galler Tagblatt: Aug. - Dez. 2011,
- Die Südostschweiz: Sep. - Dez. 2011,
- spektrumdirekt: Jan. - Sep. 2011,
- VDI Nachrichten: Sep. - Dez. 2011,
- Die Zeit: Okt. - Dez. 2011.
Dezember 2011
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jan. - Aug. 2011,
- Burgenländische Volkszeitung: Jan. - Jul. 2011,
- dpa: Jan. - Sep. 2011
- Hamburger Morgenpost: Jan. - Jun. 2011,
- Hannoversche Allgemeine: Jan. - Aug. 2011,
- Mannheimer Morgen: Jan. - Sep. 2011,
- Nürnberger Nachrichten: Jan. - Aug. 2011,
- Nürnberger Zeitung: Jan. - Aug. 2011,
- Die Rheinpfalz: Jan. - Aug. 2011,
- Rhein-Zeitung: Jan. - Aug. 2011,
- St. Galler Tagblatt: Jan. - Jul. 2011,
- Die Südostschweiz: Jan. - Aug. 2011,
- die tageszeitung: Jan. - Mär. 2011,
- VDI Nachrichten: Jan. - Aug. 2011,
- Die Zeit: Jan. - Sep. 2011.
Juli 2011
Archiv TAGGED-T mit einer Auswahl TreeTagger-getaggter Korpora
Das Archiv hat denselben Inhalt wie TAGGED-C, siehe weiter unten. Verwendet wurde das STTS-Tagset (Stuttgarter-Tübinger Tagset).
Juni 2011
Archiv W der geschriebenen Korpora
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jan. - Dez. 2010,
- Burgenländische Volkszeitung: Jan. - Dez. 2010,
- dpa: Jan. - Dez. 2010
- Hamburger Morgenpost: Jan. - Dez. 2010,
- Hannoversche Allgemeine: Jan. - Dez. 2010,
- Mannheimer Morgen: Jan. - Dez. 2010,
- Niederösterreichische Nachrichten: Jan. - Dez. 2010,
- Nürnberger Nachrichten: Jan. - Dez. 2010,
- Nürnberger Zeitung: Jan. - Dez. 2010,
- Die Rheinpfalz: Jan. - Dez. 2010,
- Rhein-Zeitung: Jan. - Dez. 2010,
- St. Galler Tagblatt: Jan. - Dez. 2010,
- Die Südostschweiz: Jan. - Dez. 2010,
- VDI Nachrichten: Jan. - Dez. 2010,
- Die Zeit: Jan. - Dez. 2010.
September 2010
Archiv N der Neuakquisitionen
Das gesamte Archiv wurde in das Archiv W der geschriebenen Korpora integriert. Nach Ablauf einer Übergangszeit von vier Wochen wird das Archiv N geschlossen.
Archiv W der geschriebenen Korpora
Die im Archiv N der Neuakquisitionen befindlichen Neuakquisitionen wurden hierher verschoben und ergänzen die folgenden Korpora:
- Braunschweiger Zeitung: Jul. - Dez. 2009,
- Burgenländische Volkszeitung: Jul. - Dez. 2009,
- dpa: Jul. - Dez. 2009
- Hamburger Morgenpost: Aug. - Dez. 2009,
- Hannoversche Allgemeine: Jul. - Dez. 2009,
- Mannheimer Morgen: Jan. - Dez. 2009,
- Niederösterreichische Nachrichten: Jul. - Dez. 2009,
- Nürnberger Nachrichten: Jul. - Dez. 2009,
- Nürnberger Zeitung: Jul. - Dez. 2009,
- Die Rheinpfalz: Aug. - Dez. 2009,
- Rhein-Zeitung: Aug. - Dez. 2009,
- St. Galler Tagblatt: Aug. - Dez. 2009,
- Die Südostschweiz: Aug. - Dez. 2009,
- VDI Nachrichten: Aug. - Dez. 2009,
- die tageszeitung: Jan. - Dez. 2009,
- Die Zeit: Jan. - Dez. 2009.
Das folgende Korpus wurde ebenfalls ergänzt:
- spektrumdirekt: 2008 - 2009
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jan. - Jul. 2010,
- Burgenländische Volkszeitung: Jan. - Jun. 2010,
- dpa: Apr. - Jul. 2010
- Hamburger Morgenpost: Jan. - Jul. 2010,
- Hannoversche Allgemeine: Jan. - Jul. 2010,
- Mannheimer Morgen: Jan. - Jul. 2010,
- Niederösterreichische Nachrichten: Jan. - Jul. 2010,
- Nürnberger Nachrichten: Jan. - Jun. 2010,
- Nürnberger Zeitung: Jan. - Jul. 2010,
- Die Rheinpfalz: Jan. - Jul. 2010,
- Rhein-Zeitung: Jan. - Jun. 2010,
- St. Galler Tagblatt: Jan. - Jul. 2010,
- Die Südostschweiz: Jan. - Jul. 2010,
- die tageszeitung: Jan. - Mär. 2010,
- VDI Nachrichten: Jan. - Jun. 2010,
- Die Zeit: Jan. - Jul. 2010.
Die Neuakquisitionen sind zukünftig in den virtuellen Korpora N-gesamt bzw. N-öffentlich zusammengefasst.
April 2010
Allgemein
Alle Archive wurden auf der Basis des XCES-Formats (XML-basiertes CES-Format) umgestellt.
Archiv N der Neuakquisitionen
Das Archiv wurde um die folgenden neuen Akquisitionen ergänzt:
- Braunschweiger Zeitung: Jul. - Dez. 2009,
- Burgenländische Volkszeitung: Jul. - Dez. 2009,
- dpa: Jul. - Dez. 2009
- Hamburger Morgenpost: Aug. - Dez. 2009,
- Hannoversche Allgemeine: Jul. - Dez. 2009,
- Mannheimer Morgen: Jan. - Dez. 2009,
- Niederösterreichische Nachrichten: Jul. - Dez. 2009,
- Nürnberger Nachrichten: Jul. - Dez. 2009,
- Nürnberger Zeitung: Jul. - Dez. 2009,
- Die Rheinpfalz: Aug. - Dez. 2009,
- Rhein-Zeitung: Aug. - Dez. 2009,
- St. Galler Tagblatt: Aug. - Dez. 2009,
- Die Südostschweiz: Aug. - Dez. 2009,
- VDI Nachrichten: Aug. - Dez. 2009,
- Die Zeit: Jan. - Dez. 2009.
Archiv UMB des Projekts "Sprachliche Umbrüche des 20. Jahrhunderts"
Das Archiv wurde um folgendes Korpus ergänzt:
- Protestdiskurs 1967/68
Das vorhandene Korpus Textsammlung der frühen Nachkriegszeit wurde umbenannt in Schulddiskurs 1945-1955. Anschließend erhielt das Archiv seinen obigen Namen (früher: FNZ - Archiv der frühen Nachkriegszeit).
Das Archiv ist weiterhin nur intern zugänglich.
März 2010
Archiv TAGGED-C mit einer Auswahl CONNEXOR-getaggter Korpora
Verwendet wurde das Connexor-Tagset. Das Archiv wurde mit den folgenden Korpora neu geöffnet:
- Berliner Zeitung: Aug. 1997 - Sep. 2008
- Herausgebertexte zum Korpus bio
- Biografische Literatur
- Braunschweiger Zeitung: Sep. 2005 - Jun. 2009
- Burgenländische Volkszeitung: 2007, Jan. - Jul. 2009
- dpa: Jan. - Jun. 2009
- Hamburger Morgenpost: Jan. - Jul. 2009
- Hannoversche Allgemeine: Jan. - Jun. 2009
- Niederösterreichische Nachrichten: Jan. - Jun. 2009
- Nürnberger Nachrichten: Jan. - Jun. 2009
- Nürnberger Zeitung: Jan. - Jun. 2009
- Oberösterreichische Nachrichten: 1999
- Reden und Interviews: 2002 - 2006
- Rheinpfalz: Jan. - Jul. 2009
- Rhein-Zeitung: Jan. - Jul. 2009
- spektrumdirekt: 1997 - 2007
- Der Spiegel: 1994
- Die Südostschweiz: Jan. - Jul. 2009
- St. Galler Tagblatt: Apr. 1997 - Dez. 2001, Aug. 2007 - Jul. 2009
- die tageszeitung: 2008
- Thomas-Mann-Korpus
- VDI Nachrichten: Jan. 2008 - Jul. 2009
- Vorarlberger Nachrichten: 1999
- Wikipedia
- Die Zeit: 2008
September 2009
Archiv N der Neuakquisitionen
Neu aufgenommen wurden:
- dpa: Jan. - Jun. 2009
Juli 2009
Archiv N der Neuakquisitionen
Das Archiv wurde mit den folgenden neuen Akquisitionen wieder geöffnet:
- Braunschweiger Zeitung: Jan. - Jun. 2009,
- Burgenländische Volkszeitung: Jan. - Jun. 2009,
- Hamburger Morgenpost: Jan. - Jul. 2009,
- Hannoversche Allgemeine: Jan. - Jun. 2009,
- Niederösterreichische Nachrichten: Jan. - Jun. 2009,
- Nürnberger Nachrichten: Jan. - Jun. 2009,
- Nürnberger Zeitung: Jan. - Jun. 2009,
- Die Rheinpfalz: Jan. - Jul. 2009,
- Rhein-Zeitung: Jan. - Jul. 2009,
- St. Galler Tagblatt: Jan. - Jul. 2009,
- Die Südostschweiz: Jan. - Jul. 2009,
- die tageszeitung: Jan. - Mär. 2009,
- VDI Nachrichten: Jan. - Jul. 2009.
Archiv W der geschriebenen Korpora
Die seit dem Mai 2009 im Archiv N der Neuakquisitionen befindlichen Neuakquisitionen wurden hierher verschoben und ergänzen die folgenden Korpora:
- Berliner Zeitung: Aug. - Dez. 2008,
- Braunschweiger Zeitung: Aug. - Dez. 2008,
- Burgenländische Volkszeitung: Sep. - Dez. 2008,
- dpa: Aug. - Dez. 2008,
- Hamburger Morgenpost: Aug. - Dez. 2008,
- Hannoversche Allgemeine: Aug. - Dez. 2008,
- Niederösterreichische Nachrichten: Aug. - Dez. 2008,
- Nürnberger Nachrichten: Aug. - Dez. 2008,
- Nürnberger Zeitung: Aug. - Dez. 2008,
- Die Rheinpfalz: Aug. - Dez. 2008,
- Rhein-Zeitung: Aug. - Dez. 2008,
- St. Galler Tagblatt: Aug. - Dez. 2008,
- Die Südostschweiz: Aug. - Dez. 2008,
- die tageszeitung: Apr. 2008 - Dez. 2008,
- VDI Nachrichten: Aug. - Dez. 2008.
- Die Zeit: Jahrgänge 2006 - 2008.
Mai 2009
Archiv N der Neuakquisitionen
Das Archiv wurde mit den folgenden neuen Akquisitionen wieder geöffnet:
- Berliner Zeitung: Aug. - Dez. 2008,
- Braunschweiger Zeitung: Aug. - Dez. 2008,
- Burgenländische Volkszeitung: Sep. - Dez. 2008,
- dpa: Aug. - Dez. 2008,
- Hamburger Morgenpost: Aug. - Dez. 2008,
- Hannoversche Allgemeine: Aug. - Dez. 2008,
- Niederösterreichische Nachrichten: Aug. - Dez. 2008,
- Nürnberger Nachrichten: Aug. - Dez. 2008,
- Nürnberger Zeitung: Aug. - Dez. 2008,
- Die Rheinpfalz: Aug. - Dez. 2008,
- Rhein-Zeitung: Aug. - Dez. 2008,
- St. Galler Tagblatt: Aug. - Dez. 2008,
- Die Südostschweiz: Aug. - Dez. 2008,
- die tageszeitung: Apr. 2008 - Mrz. 2009,
- VDI Nachrichten: Aug. - Dez. 2008.
- Die Zeit: Jahrgänge 2006 - 2008.
Archiv W der geschriebenen Korpora
Die seit dem Juli 2008 im Archiv N2 der Neuakquisitionen befindlichen Neuakquisitionen wurden hierher verschoben und ergänzen die folgenden Korpora:
- Berliner Zeitung: Jan. - Jul. 2008,
- Braunschweiger Zeitung: Mrz. 2005 - Jul. 2008,
- dpa: Jan. - Jul. 2008,
- Hamburger Morgenpost: Jan. - Jul. 2008,
- Hannoversche Allgemeine: Aug. 2007 - Jul. 2008,
- Nürnberger Nachrichten: Jan. 1990 - Jul. 2008,
- Nürnberger Zeitung: Jun. 2002 - Jul. 2008,
- Die Rheinpfalz: Jan. 1996 - Apr. 2008,
- Rhein-Zeitung: Jan. - Jul. 2008,
- St. Galler Tagblatt: Aug. 2007 - Jul. 2008,
- Die Südostschweiz: Mrz. 2005 - Jul. 2008,
- die tageszeitung: Jan. - Mrz. 2008,
- VDI Nachrichten: Jan. 2007 - Jul. 2008.
Archiv N2 der Neuakquisitionen
Dieses Archiv ist nun leer und wird aufgelöst.
November 2008
Allgemein
Die Archive W und N2 wurden neu aufgebaut, da das CES-Format für die bibliografischen Daten erweitert wurde.
Archiv N2 der Neuakquisitionen
Neu aufgenommen wurden:
- Burgenländische Volkszeitung: Jan. 2007 - Aug. 2008,
- Niederösterreichische Nachrichten: Jan. 2007 - Aug. 2008,
Oktober 2008
Allgemein
Es wurden alle Archive (Ausnahme: W und N2) neu aufgebaut, da das CES-Format für die bibliografischen Daten erweitert wurde.
Archiv HIST der historischen Korpora
Neuaufgenommen wurden:
- Historisches Korpus/Digitale Bibliothek: Deutsche Literatur von Lessing bis Kafka,
- Historisches Korpus/Digitale Bibliothek: Philosophie von Platon bis Nietzsche,
- Historisches Korpus/Digitale Bibliothek: Deutsche Literatur von Frauen.
25. Juli 2008
Archiv N2 der Neuakquisitionen
Neu aufgenommen wurden:
- Berliner Zeitung: Jan. - Jul. 2008,
- Braunschweiger Zeitung: Jan. - Jul. 2008,
- dpa: Jan. - Jul. 2008,
- Hamburger Morgenpost: Jan. - Jul. 2008,
- Hannoversche Allgemeine: Jan. - Jul. 2008,
- Nürnberger Nachrichten: Jan. - Jul. 2008,
- Nürnberger Zeitung: Jan. - Jul. 2008,
- Die Rheinpfalz: Jan. - Apr. 2008,
- Rhein-Zeitung: Jan. - Jul. 2008,
- St. Galler Tagblatt: Jan. - Jul. 2008,
- Die Südostschweiz: Jan. - Jul. 2008,
- die tageszeitung: Jan. - Mrz. 2008,
- VDI Nachrichten: Jan. - Jul. 2008.
18. Juli 2008
Allgemein
Es wurden alle Archive auf der Basis des CES-Formates neu aufgebaut. Dies hat zur Folge, dass sich in jedem Archiv geringfügige Abweichungen in Bezug auf die Anzahl Texte und Wörter bemerkbar machen.
Die Archive im veralteten Format wurden aufgelöst.
Archiv W der geschriebenen Korpora
Die seit dem September 2007 im Archiv N der Neuakquisitionen befindlichen Neuakquisitionen wurden hierher verschoben und ergänzen die folgenden Korpora:
- Berliner Zeitung: Jahrgang 2007,
- dpa: Jahrgang 2007,
- Hamburger Morgenpost: Jahrgang 2007,
- Mannheimer Morgen: Jahrgang 2007,
- die tageszeitung: Jahrgänge 2006 und 2007,
- VDI Nachrichten: Jahrgang 2007.
Archiv N der Neuakquisitionen
Dieses Archiv ist nun leer und wird aufgelöst.
Mai 2008
Archiv N2 der Neuakquisitionen
Es wurden fast 1 Mrd. Textwörter in diesem neuen Archiv auf der Basis des CES-Formates generiert:
- Rhein-Zeitung: Jan. 1996 - Dez. 2007
- St. Galler Tagblatt: Aug. - Dez. 2007
- VDI Nachrichten: Jahrgang 2007
Neu aufgenommen wurden:
- Braunschweiger Zeitung: Sep. 2005 - Dez. 2007,
- Die Südostschweiz: Mrz. 2005 - Dez. 2007,
- Hannoversche Allgemeine: Aug. - Dez. 2007,
- Nürnberger Nachrichten: Jahrgänge 1990 - 2007,
- Nürnberger Zeitung: Jun. 2002 - Dez. 2007,
- Rheinpfalz: Aug. - Dez. 2007.
Januar 2008
Archiv FNZ der frühen Nachkriegszeit
Das Archiv wird für den internen Zugang freigegeben.
September 2007
Allgemein
Es wurden alle Archive neu aufgebaut. Dies hat zur Folge, dass sich in jedem Archiv geringfügige Abweichungen in Bezug auf die Anzahl Texte und Wörter bemerkbar machen.
Archiv W der geschriebenen Korpora
Die seit dem April im Archiv N der Neuakquisitionen befindlichen Neuakquisitionen wurden hierher verschoben und ergänzen die folgenden Korpora:
- Berliner Zeitung: Jahrgang 2006,
- dpa: Jahrgang 2006,
- Fachsprachenkorpus,
- Hamburger Morgenpost: Jahrgang 2006,
- Korpora der Belletristik loz-div und loz-wam,
- Mannheim Morgen: Jahrgang 2006,
- spektrumdirekt: Jahrgang 2006,
- VDI Nachrichten: Jahrgang 2006.
Archiv N der Neuakquisitionen
Das Archiv wurde mit den folgenden neuen Akquisitionen wieder aufgefüllt:
- Berliner Zeitung: Jahrgang 2007,
- dpa: Jahrgang 2007,
- Hamburger Morgenpost: Jahrgang 2007,
- Mannheimer Morgen: Jahrgang 2007,
- die tageszeitung: Jahrgänge 2006 und 2007,
- VDI Nachrichten: Jahrgang 2007.
Neu aufgenommen wurde:
- Rhein-Zeitung: Jahrgang 2006-2007
Archiv SZ der Süddeutschen Zeitung
Neueröffnung dieses Archivs mit besonderen Zugriffsberechtigungen.
April 2007
Archiv N der Neuakquisitionen
Dieses Archiv wurde mit folgenden neuen Korpora oder Ergänzungen wieder geöffnet:
- Berliner Zeitung: Jahrgang 2006
- Meldungen der Deutschen Presse-Agentur: um Okt.-Dez. 2006 ergänzt
- Fachsprachenkorpus: 2 Texte ergänzt
- Hamburger Morgenpost: um Okt.-Dez. 2006 ergänzt
- Belletristik des 20./21. Jahrhunderts, diverse Schriftsteller: 4 neue Texte
- Belletristik des 20./21. Jahrhunderts, Martin Walser: 5 neue Texte
- Mannheimer Morgen: Jahrgang 2006 neu
- spektrumdirekt: um Jahrgang 2006 ergänzt
- VDI Nachrichten: ergänzt um Sep.-Dez. 2006
März 2007
Archiv W der geschriebenen Korpora
Die folgenden Korpora, die sich bis dahin im Archiv N der Neuakquisitionen befanden, wurden in dieses Archiv übernommen.
- Biografische Literatur: ergänzt um 2 Texte
- Berliner Zeitung: ergänzt um Jahrgang 2005
- dpa: Jan. - Sep. 2006
- Frankfurter Allgemeine: die ungeraden Monate der Jahre 1997, 1999, 2001, 2003, 2005
- Fachsprachenkorpus: 21 Texte aus den Jahren 1991-2003
- Hamburger Morgenpost: Apr. 2005 - Sep. 2006
- Belletristik des 20./21. Jahrhunderts loz-div: um 47 Texte ergänzt
- Mannheimer Morgen: ergänzt um Jahrgang 2005
- Reden der Bundestagsfraktion Bündnis 90/DIE GRÜNEN: Jahrgänge 2002-2006
- spektrumdirekt: Jahrgänge 1997-2005
- die tageszeitung: ergänzt um Jan. 2005 - Mrz. 2006
- VDI Nachrichten: Feb. - Sep. 2006
- Wikipedia: Stand von 2005
Die Zusammenfassung aller öffentlichen Korpora in diesem Archiv, das virtuelle Korpus public, wurde in W-public umbenannt; die Zusammenfassung der öffentlichen und nicht-öffentlichen Korpora dieses Archivs, das virtuelle Korpus geschr, wurde in W-gesamt umbenannt.
Außerdem konnten einige Texte, die bisher nicht öffentlich waren, auch für die öffentliche Recherche freigegeben werden: 2 Texte aus bio, 10 Texte aus fsp, 45 Texte aus loz-div und 3 aus loz-wam.
Archiv N der Neuakquisitionen
Dieses Archiv ist nun leer und wird vorübergehend abgeschaltet.
Oktober 2006
Archiv N der Neuakquisitionen
Die folgenden Korpora wurden neu aufgenommen:
- Berliner Zeitung: Jahrgang 2005
- Meldungen der Deutschen Presse-Agentur (dpa): Jan. - Sep. 2006
- Frankfurter Allgemeine: die ungeraden Monate der Jahre 1997, 1999, 2001, 2003, 2005
- Hamburger Morgenpost: Jan. - Sep. 2006
- Mannheimer Morgen: Jahrgang 2005
- die tageszeitung: Apr. 2005 - Mrz. 2006
- VDI Nachrichten: Feb. - Jun. 2006
Die folgenden schon vorhandenen Korpora desselben Archivs wurden ergänzt:
- Biografische Literatur
- Belletristik des 20./21. Jahrhunderts, diverse Schristeller
Mai 2006
Archiv N der Neuakquisitionen
Die folgenden erweiterten Korpora werden in diesem Archiv angeboten:
- Biografische Literatur: erweitert
- Fachsprachen-Korpus: erweitert
- Bellestristik des 20./21. Jahrhunderts, diverse Schriftsteller: erweitert
April 2006
Archiv N der Neuakquisitionen
Die folgenden neuakquirierten Korpora werden erstmals im diesem Archiv angeboten:
- Hamburger Morgenpost: Jahrgang 2005
- Reden und Interviews
- spektrumdirekt
- Wikipedia, Stand 2005
November 2005
Archiv W der geschriebenen Korpora
Der Inhalt des Archivs N der Neuakquisitionen wurde in dieses Archiv verschoben:
- Berliner Zeitung: Jahrgang 2003 wurde ergänzt, 2004 hinzugefügt
- Mannheimer Morgen: Jahrgang 2003 wurde ergänzt, 2004 hinzugefügt
- die tageszeitung: Jahrgang 2003 wurde ergänzt, 2004 - Mrz. 2005 wurden hinzugefügt
- Die Zeit: Jahrgang 1999 wurde ergänzt, 2000-2004 wurden hinzugefügt
Viele ältere Korpora wurden revidiert und erhebliche Verbesserungen eingebracht (z.B. wurden Quellennachweise revidiert und ergänzt).
Alle Korpora: Textdubletten wurden eliminiert. Dies erklärt, warum trotz der Neuakquisitionen das Hauptarchiv nicht wesentlich größer geworden ist.
Archiv N der Neuakquisitionen
Dieses Archiv ist nun leer und wird vorübergehend abgeschaltet.
Archiv W-ÜBRIG der aussortierten geschriebenen Korpora
Folgende Korpora wurden wegen Mängel aus dem Archiv W der geschriebenen Korpora aussortiert und in dieses neu geschaffene Archiv verschoben:
- Mannheimer Morgen: Jahrgänge 1989, 1991 und 1994
- Oberösterreichische Nachrichten: Jahrgänge 1998-2000
September 2005
Archiv N der Neuakquisitionen
Dieses Archiv wird mit den folgenden neuerworbenen oder überarbeiteten virtuellen Korpora wiedereröffnet:
- Berliner Zeitung: Jahrgänge 2003-2004
- Mannheimer Morgen: Jahrgänge 2003-2004
- die tageszeitung: Jahrgänge 2003-2005 (bis Mrz.)
- Die Zeit: Jahrgänge 1994-2004
März 2004
Archiv W der geschriebenen Korpora
Die Jahrgänge 2002-2003
- der Berliner Zeitung,
- des Mannheimer Morgens,
- der tageszeitung
werden vom Archiv N der Neuakquisitionen in das Hauptarchiv transferiert.
Archiv N der Neuakquisitionen
Dieses Archiv ist nun leer und wird aufgelöst.
Juni 2003
Archiv N der Neuakquisitionen
Ergänzung
- der tageszeitung,
- der Berliner Zeitung,
- des Mannheimer Morgen
mit Texten bis April 2003.
Mai 2003
Archiv GESPR der gesprochenen Korpora
Die Korpora
- Dialogstrukturenkorpus dsk,
- Freiburger Korpus fko,
- Pfeffer-Korpus pfe
werden dem Deutschen Spracharchiv übergeben, wo sie über das dort angebotene Recherchesystem verfügbar sind.
Das Archiv ist leer und wird aufgelöst.
Archiv TAGGED-M der morphosyntaktisch annotierten Korpora
Das Archiv TAGGED-M ist wieder verfügbar. Für den Zugriff ist die COSMAS II-Zugangssoftware Version 3.2 oder höher notwendig. Ein Annotationsassistent unterstützt die Formulierung von Suchanfragen mit Annotationen.
April 2003
Archiv W der geschriebenen Korpora
Der Inhalt des Archivs N der Neuakquisitionen, bis auf die Jahrgänge 2002 von
- die tageszeitung,
- Berliner Zeitung,
- Mannheimer Morgen,
werden in das Hauptarchiv verschoben.
Codierung der Korpora im XCES-Format
Seit Mitte Juli 2008 diente als Grundlage für die Indizierung der Korpora nicht mehr wie bisher ein vereinfachtes TEI-Format, sondern das CES-Format (Corpus Encoding Standard). Die Umstellung auf das im Rahmen des IDS-Textmodells verwendete XCES-Format erfolgte im April 2010.
Als Benutzer von COSMAS II müssen Sie sich deswegen nicht in das neue Format vertiefen, denn die Handhabung der neuen Korpora geschieht bis auf wenige Punkte wie bisher.
Wesentliche Änderungen
- Einige Konventionen, die ausschließlich für ältere
IDS-Korpora galten, fallen nun weg. Dies betrifft folgende virtuellen Korpora:
- bzk, goe, gr1, hbk, lim, mk, thm, wk (Archiv W),
- gfds (Archiv GFDS),
- marx (Archiv HIST),
- lim-TAGGED (Archiv TAGGED),
- WK-PH-gesamt (Archiv WK-PH),
in welchen die Satzzeichen bisher mit einem Leerzeichen vom Wort getrennt codiert waren.
Beispiel: " was soll ich in einem Krieg ? " fragte ich ihn . (Korpus lim).
In diesen Korpora können nun Suchanfragen mit Satzzeichen einheitlich wie in den übrigen Korpora formuliert werden, d.h. Wort und Satzzeichen sind einheitlich mit einem Wortabstand von 0 voneinander getrennt (vorher Wortabstand 1).
Falls Sie dies bisher nicht berücksichtigt haben, werden Sie nun feststellen, dass Sie mit Suchanfragen wieKrieg /w0 \?
(der Schrägstrich ist notwendig, um das Satzzeichen vom Platzhalteroperator zu unterscheiden) vermehrt Treffer in diesen Korpora erhalten. - Die Anzahl der Texte ist im Wesentlichen bis auf einige Schwankungen gleich geblieben. In Folge von Bereinigungen sind im Korpus taz (die tageszeitung) ca. 10.000 Texte weniger zu verzeichnen, in einigen weiteren XCES-Korpora insgesamt nochmals 1.200 Texte weniger.
- Die Anzahl der Textwörter ist um ca. 9 Mio.
gesunken. Die Hälfte davon ist auf die Konvertierung der alten
Konventionen (in den oben aufgezählten Korpora) in das neue
Format zurückzuführen. In den anderen Fällen wird Information,
die nicht unbedingt zum Primärtext gehört, in Annotationen
verlagert (z.B. URL-Adressen, Fußnoten, usw.), was wiederum einem
Mehrwert an Information in den Korpora gleichkommt.
Insgesamt bedeutet die Reduzierung der Textwörter kein Verlust an recherchierbarem Material. Bei den alten Konventionen handelt es sich um eine andere Zählweise, da Wort und Satzzeichen als 2 getrennt auftretende Textwörter gezählt wurden (siehe Beispiel oben). Die Verlagerung von Text in die Annotationen bereinigt den Primärtext von zum Teil unerwünschten Nebeneffekten bei der Recherche. - Auszeichnung der Textstruktur: Überschriften auf diversen Ebenen, Vorspanntext, Fußnoten usw. werden nun als solche im XCES-Format gekennzeichnet. Dies bewirkt, dass bei der Anzeige von KWICs und Belegen der Kontext unter Umständen anders berechnet wird als vorher: Zählten z.B. Überschriften vorher als Sätze, werden sie nun als Absätze gezählt.
Das XCES-Format bildet die Grundlage für kommende Erweiterungen in COSMAS II.