COSMAS II für Einsteiger
Was ist COSMAS II?
Eine am IDS konzipierte Volltextdatenbank für das linguistisch motivierte Recherchieren in den Textsammlungen (= Korpora) des IDS.
COSMAS II steht für Corpus Search, Management and Analysis System und ist das Nachfolgesystem von COSMAS I (1991-2003) am IDS.
Suchanfragen werden u.a. gebildet aus
- Wörtern, Teilwörtern, Wortgrundformen,
- Wortklassen (z.B. Verb, Artikel) und grammatikalischen Mustern,
- Angaben zu Wort- und Satzabstand,
- Angaben zu Textbereichen (z.B. Überschriften) und Position (z.B. erstes Wort eines Satzes).
Ergebnisse können u.a.
- nach Entstehungszeit, Erscheinungsland und Thematik sortiert werden,
- durch Statistiken auf häufig verwendete Gebrauchsmuster hin analysiert werden.
Belege werden
- hinsichtlich ihrer Herkunft (Verlag, evtl. Autor, Entstehungszeit, Seitenangabe) dokumentiert,
- mit unterschiedlichen Kontextgrößen exportiert.
Das stetig wachsende Deutsche Referenzkorpus (Umfang von ca. 42 Mrd. Wörtern, Stand April 2018), das COSMAS II zugänglich macht, umfasst Zeitungen, Sach-, Fach- sowie schöngeistige Literatur aus Deutschland, Österreich und der Schweiz von 1772 bis heute.
Was ist COSMAS II nicht?
COSMAS II ist keine Suchmaschine (wie z.B. Google, Yahoo! o.ä.),
- die fremde Texte oder Textbestände liest, indiziert und sie der Öffentlichkeit nach erfolgter Suchanfrage per Mausklick verfügbar macht,
- die die Inhalte von WWW-Servern oder sonstigen Anbietern im Internet durchsuchen kann,
- die zu kommerziellen Zwecken entwickelt und betrieben wird oder benutzt werden kann,
- mit der man archivierte Texte in ungekürzter Form lesen oder ausdrucken kann.