Korpora
Übersicht
Archiv: |
TAGGED-T - Archiv morphosyntakt. annotierter Korpora (TreeTagger) |
Korpus: |
B05 - Berliner Zeitung 2005 |
Dokumente: |
12 |
Zugang: |
nicht öffentlich |
Enthalten in: |
TAGGED-T-gesamt | bzt |
Gliederung nach Dokumenten
Die Dokument- bzw. Korpusgrößen sind in Millionen
von laufenden Wortformen angegeben.
Sigle |
Bezeichnung |
Texte |
Größe |
B05/JAN |
Berliner Zeitung, Januar 2005 |
8526 |
1,53 |
B05/FEB |
Berliner Zeitung, Februar 2005 |
8320 |
1,50 |
B05/MAR |
Berliner Zeitung, MÄrz 2005 |
8589 |
1,57 |
B05/APR |
Berliner Zeitung, April 2005 |
8418 |
1,55 |
B05/MAI |
Berliner Zeitung, Mai 2005 |
8155 |
1,50 |
B05/JUN |
Berliner Zeitung, Juni 2005 |
8459 |
1,62 |
B05/JUL |
Berliner Zeitung, Juli 2005 |
7159 |
1,36 |
B05/AUG |
Berliner Zeitung, August 2005 |
8356 |
1,57 |
B05/SEP |
Berliner Zeitung, September 2005 |
8496 |
1,59 |
B05/OKT |
Berliner Zeitung, Oktober 2005 |
6721 |
1,26 |
B05/NOV |
Berliner Zeitung, November 2005 |
7536 |
1,39 |
B05/DEZ |
Berliner Zeitung, Dezember 2005 |
7875 |
1,47 |
|
B05 |
|
96610 |
17,91 |
Gliederung nach Textsorten
Die Textsortenklassifizierung wurde mehr nach
formalen als nach inhaltlichen Kriterien vorgenommen.
Textsorte |
Wortformen |
anteilig |
nicht klassifiziert |
15.339.889 |
85,66 % |
Feuilleton |
1.026.927 |
5,73 % |
Veranstaltungsinformation |
225.940 |
1,26 % |
Leserbrief |
156.581 |
0,87 % |
Veranstaltungsinformation |
n. bekannt |
n. bekannt |
|
Gesamt |
17.908.080 |
100,00 % |