Korpora
Übersicht
Gliederung nach Dokumenten
Die Dokument- bzw. Korpusgrößen sind in Millionen
von laufenden Wortformen angegeben.
Sigle |
Bezeichnung |
Texte |
Größe |
THA20/JAN |
Thüringer Allgemeine, Januar 2020 |
8347 |
1,85 |
THA20/FEB |
Thüringer Allgemeine, Februar 2020 |
9126 |
2,07 |
THA20/MAR |
Thüringer Allgemeine, März 2020 |
8069 |
1,90 |
THA20/APR |
Thüringer Allgemeine, April 2020 |
6208 |
1,51 |
THA20/MAI |
Thüringer Allgemeine, Mai 2020 |
6486 |
1,57 |
THA20/JUN |
Thüringer Allgemeine, Juni 2020 |
7104 |
1,73 |
THA20/JUL |
Thüringer Allgemeine, Juli 2020 |
8199 |
1,94 |
THA20/AUG |
Thüringer Allgemeine, August 2020 |
7786 |
1,85 |
THA20/SEP |
Thüringer Allgemeine, September 2020 |
8232 |
1,94 |
THA20/OKT |
Thüringer Allgemeine, Oktober 2020 |
7933 |
1,87 |
THA20/NOV |
Thüringer Allgemeine, November 2020 |
7537 |
1,79 |
THA20/DEZ |
Thüringer Allgemeine, Dezember 2020 |
5570 |
1,30 |
|
THA20 |
|
90597 |
21,34 |
Gliederung nach Textsorten
Die Textsortenklassifizierung wurde mehr nach
formalen als nach inhaltlichen Kriterien vorgenommen.
Textsorte |
Wortformen |
anteilig |
nicht klassifiziert |
n. bekannt |
n. bekannt |
|
Gesamt |
21.340.201 |
100,00 % |