Einfluss der Trefferreduzierung auf die Kookkurrenzanalyse
Wenn der Benutzer für eine Suchanfrage die Zufallsauswahl einschaltet oder die Treffermenge eine interne Obergrenze überschreitet, wird eine zufällig reduzierte Treffermenge als Ergebnis zurückgeliefert.
Es kann aber auch im Hinblick auf eine Kookkurrenzanalyse eine Hilfe sein, die Treffer zu reduzieren, denn ab einer Treffermenge von einigen Millionen Treffern werden die von der Kookkurrenzanalyse durchgeführten Berechnungen so aufwändig, dass sie einige Stunden dauern können.
COSMAS II weist auf eine Reduzierung durch folgende Formulierung hin: »10.000 Treffer aus 7.596.026 (Zufallsauswahl)«.
Bei der Betrachtung der Kookkurrenzen von reduzierten Treffern sind deshalb unter anderem die folgenden Aspekte zu berücksichtigen.
- eine Kookkurrenzanalyse über eine unreduzierte Treffermenge ist einer reduzierten Analyse vorzuziehen.
- je weniger die Treffer reduziert werden, desto mehr erhöht sich die Anzahl der gefundenen Kookkurrenzen (siehe Tabelle des Beispiels).
- betrachtet man die Kookkurrenzen über unterschiedliche Ergebnisreduktionen, so
- können die LLR-Werte einer Kookkurrenz variieren: dieser Umstand lässt sich allerdings sprachlich/linguistisch nicht deuten;
- werden einige Kookkurrenzen innerhalb der Liste nach oben oder unten verschoben;
- können einige Kookkurrenzen sogar aus der Liste verschwinden, neue können auftreten.
Beispiel
Der Suchbegriff »für« wurde in W-öffentlich gesucht, das 29 Mio. Treffer zählende Ergebnis 3 Mal unterschiedlich stark reduziert und 3 Mal mit den selben Parametern analysiert.
Reduzierung auf | |||
---|---|---|---|
500.000 T. | 1 Mio. T. | 10 Mio. T. | |
Anz. Kook.: | 313 | 474 | 2.301 |
Tabelle: Anzahl der errechneten Kookkurrenzen für verschiedene Reduktionswerte
Die Anzahl der Kookkurrenzen für die unreduzierte Trefferzahl von 29 Mio. wurde bislang nicht bestimmt, da die Ausführungszeit für diese Datenmenge zu viel Zeit beansprucht.