Korpora
Übersicht
Gliederung nach Dokumenten
Die Dokument- bzw. Korpusgrößen sind in Millionen
von laufenden Wortformen angegeben.
Sigle |
Bezeichnung |
Texte |
Größe |
THA10/JAN |
Thüringer Allgemeine, Januar 2010 |
16465 |
3,61 |
THA10/FEB |
Thüringer Allgemeine, Februar 2010 |
14696 |
3,22 |
THA10/MAR |
Thüringer Allgemeine, März 2010 |
15948 |
3,61 |
THA10/APR |
Thüringer Allgemeine, April 2010 |
14316 |
3,25 |
THA10/MAI |
Thüringer Allgemeine, Mai 2010 |
14481 |
3,23 |
THA10/JUN |
Thüringer Allgemeine, Juni 2010 |
15492 |
3,38 |
THA10/JUL |
Thüringer Allgemeine, Juli 2010 |
15705 |
3,44 |
THA10/AUG |
Thüringer Allgemeine, August 2010 |
15719 |
3,46 |
THA10/SEP |
Thüringer Allgemeine, September 2010 |
15886 |
3,52 |
THA10/OKT |
Thüringer Allgemeine, Oktober 2010 |
15639 |
3,44 |
THA10/NOV |
Thüringer Allgemeine, November 2010 |
15240 |
3,35 |
THA10/DEZ |
Thüringer Allgemeine, Dezember 2010 |
14963 |
3,23 |
|
THA10 |
|
184550 |
40,74 |
Gliederung nach Textsorten
Die Textsortenklassifizierung wurde mehr nach
formalen als nach inhaltlichen Kriterien vorgenommen.
Textsorte |
Wortformen |
anteilig |
nicht klassifiziert |
n. bekannt |
n. bekannt |
|
Gesamt |
40.735.324 |
100,00 % |