COSMAS II für Einsteiger
Was ist COSMAS II?
Eine am IDS konzipierte Volltextdatenbank für das linguistisch motivierte Recherchieren in den Textsammlungen (= Korpora) des IDS.
COSMAS II steht für Corpus Search, Management and Analysis System und ist das Nachfolgesystem von COSMAS I (1991-2003) am IDS.
Suchanfragen werden u.a. gebildet aus
- Wörtern, Teilwörtern, Wortgrundformen,
- Wortklassen (z.B. Verb, Artikel) und grammatikalischen Mustern,
- Angaben zu Wort- und Satzabstand,
- Angaben zu Textbereichen (z.B. Überschriften) und Position (z.B. erstes Wort eines Satzes).
Ergebnisse können u.a.
- nach Entstehungszeit, Erscheinungsland und Thematik sortiert werden,
- durch Statistiken auf häufig verwendete Gebrauchsmuster hin analysiert werden.
Belege werden
- hinsichtlich ihrer Herkunft (Verlag, evtl. Autor, Entstehungszeit, Seitenangabe) dokumentiert,
- mit unterschiedlichen Kontextgrößen exportiert.
Das stetig wachsende Deutsche Referenzkorpus (Umfang von ca. 61 Mrd. Wörtern, Stand Januar 2025), das COSMAS II zugänglich macht, umfasst Zeitungen, Sach-, Fach- sowie schöngeistige Literatur aus Deutschland, Österreich, der Schweiz und den deutschsprachigen Nachbarregionen von 1650 bis heute.
Was ist COSMAS II nicht?
COSMAS II ist keine Suchmaschine (wie z.B. Google, Yahoo! o.ä.),
- die fremde Texte oder Textbestände liest, indiziert und sie der Öffentlichkeit nach erfolgter Suchanfrage per Mausklick verfügbar macht,
- die die Inhalte von WWW-Servern oder sonstigen Anbietern im Internet durchsuchen kann,
- die zu kommerziellen Zwecken entwickelt und betrieben wird oder benutzt werden kann,
- mit der man archivierte Texte in ungekürzter Form lesen oder ausdrucken kann.