[IDS-Logo] COSMAS II: Kookkurrenzanalyse: weitere Anmerkungen

Einfluss der Trefferreduzierung auf die Kookkurrenzanalyse

Wenn der Benutzer für eine Suchanfrage die Zufallsauswahl einschaltet oder die Treffermenge eine interne Obergrenze überschreitet, wird eine zufällig reduzierte Treffermenge als Ergebnis zurückgeliefert.

Es kann aber auch im Hinblick auf eine Kookkurrenzanalyse eine Hilfe sein, die Treffer zu reduzieren, denn ab einer Treffermenge von einigen Millionen Treffern werden die von der Kookkurrenzanalyse durchgeführten Berechnungen so aufwändig, dass sie einige Stunden dauern können.

COSMAS II weist auf eine Reduzierung durch folgende Formulierung hin: »10.000 Treffer aus 7.596.026 (Zufallsauswahl)«.

Bei der Betrachtung der Kookkurrenzen von reduzierten Treffern sind deshalb unter anderem die folgenden Aspekte zu berücksichtigen.

Beispiel

Der Suchbegriff »für« wurde in W-öffentlich gesucht, das 29 Mio. Treffer zählende Ergebnis 3 Mal unterschiedlich stark reduziert und 3 Mal mit den selben Parametern analysiert.

Reduzierung auf
500.000 T. 1 Mio. T. 10 Mio. T.
Anz. Kook.: 313 474 2.301

Tabelle: Anzahl der errechneten Kookkurrenzen für verschiedene Reduktionswerte

Die Anzahl der Kookkurrenzen für die unreduzierte Trefferzahl von 29 Mio. wurde bislang nicht bestimmt, da die Ausführungszeit für diese Datenmenge zu viel Zeit beansprucht.

COSMAS II, Zentrale DV-Dienste - 18. 04. 2018