Korpora
Übersicht
Archiv: |
TAGGED-T - Archiv morphosyntakt. annotierter Korpora (TreeTagger) |
Korpus: |
T08 - die tageszeitung 2008 |
Dokumente: |
12 |
Zugang: |
nicht öffentlich |
Enthalten in: |
TAGGED-T-gesamt | taz |
Gliederung nach Dokumenten
Die Dokument- bzw. Korpusgrößen sind in Millionen
von laufenden Wortformen angegeben.
Sigle |
Bezeichnung |
Texte |
Größe |
T08/JAN |
die tageszeitung, Januar 2008 |
4926 |
1,44 |
T08/FEB |
die tageszeitung, Februar 2008 |
4726 |
1,39 |
T08/MAR |
die tageszeitung, März 2008 |
4455 |
1,33 |
T08/APR |
die tageszeitung, April 2008 |
4760 |
1,41 |
T08/MAI |
die tageszeitung, Mai 2008 |
4513 |
1,40 |
T08/JUN |
die tageszeitung, Juni 2008 |
4584 |
1,36 |
T08/JUL |
die tageszeitung, Juli 2008 |
4847 |
1,45 |
T08/AUG |
die tageszeitung, August 2008 |
4865 |
1,47 |
T08/SEP |
die tageszeitung, September 2008 |
4716 |
1,43 |
T08/OKT |
die tageszeitung, Oktober 2008 |
4835 |
1,44 |
T08/NOV |
die tageszeitung, November 2008 |
4537 |
1,36 |
T08/DEZ |
die tageszeitung, Dezember 2008 |
4511 |
1,34 |
|
T08 |
|
56275 |
16,82 |
Gliederung nach Textsorten
Die Textsortenklassifizierung wurde mehr nach
formalen als nach inhaltlichen Kriterien vorgenommen.
Textsorte |
Wortformen |
anteilig |
Bericht |
9.089.889 |
54,04 % |
Kommentar |
3.659.246 |
21,76 % |
Gespräch, Interview |
1.235.095 |
7,34 % |
Agenturmeldung |
1.110.243 |
6,60 % |
Porträt |
662.561 |
3,94 % |
Dokumentation |
625.173 |
3,72 % |
Leserbrief |
302.303 |
1,80 % |
nicht klassifiziert |
54.110 |
0,32 % |
|
Gesamt |
16.819.875 |
100,00 % |