Korpora
Übersicht
Archiv: |
TAGGED-T - Archiv morphosyntakt. annotierter Korpora (TreeTagger) |
Korpus: |
RHZ09 - Rhein-Zeitung 2009 |
Dokumente: |
12 |
Zugang: |
öffentlich |
Enthalten in: |
TAGGED-T-gesamt | TAGGED-T-öffentlich | rhz |
Gliederung nach Dokumenten
Die Dokument- bzw. Korpusgrößen sind in Millionen
von laufenden Wortformen angegeben.
Sigle |
Bezeichnung |
Texte |
Größe |
RHZ09/JAN |
Rhein-Zeitung, Januar 2009 |
17237 |
4,12 |
RHZ09/FEB |
Rhein-Zeitung, Februar 2009 |
16364 |
3,94 |
RHZ09/MAR |
Rhein-Zeitung, März 2009 |
20979 |
5,11 |
RHZ09/APR |
Rhein-Zeitung, April 2009 |
19068 |
4,59 |
RHZ09/MAI |
Rhein-Zeitung, Mai 2009 |
19266 |
4,55 |
RHZ09/JUN |
Rhein-Zeitung, Juni 2009 |
18220 |
4,22 |
RHZ09/JUL |
Rhein-Zeitung, Juli 2009 |
18489 |
4,23 |
RHZ09/AUG |
Rhein-Zeitung, August 2009 |
16918 |
4,05 |
RHZ09/SEP |
Rhein-Zeitung, September 2009 |
19599 |
4,66 |
RHZ09/OKT |
Rhein-Zeitung, Oktober 2009 |
19900 |
4,69 |
RHZ09/NOV |
Rhein-Zeitung, November 2009 |
19865 |
4,74 |
RHZ09/DEZ |
Rhein-Zeitung, Dezember 2009 |
17924 |
4,09 |
|
RHZ09 |
|
223829 |
52,99 |
Gliederung nach Textsorten
Die Textsortenklassifizierung wurde mehr nach
formalen als nach inhaltlichen Kriterien vorgenommen.
Textsorte |
Wortformen |
anteilig |
nicht klassifiziert |
19.005.512 |
35,87 % |
nicht klassifiziert |
n. bekannt |
n. bekannt |
|
Gesamt |
52.990.339 |
100,00 % |