[IDS-Logo] Online-Hilfe zu COSMAS II: Themenspezifische Fragestellungen mit Hilfe der zeilenorientierten Eingabe
zeilenorientierte Eingabethemenspezifische FragestellungenMuster einer Suchanfrage für die indirekte Rede

Muster einer Suchanfrage für die indirekte Rede

In den IDS-Korpora können Textstellen mit indirekter Rede nicht direkt abgefragt werden, da diese nicht annotiert ist. Vorgeschlagen wird hier ein Suchanfragemuster, bei dem ein Typus von indirekter Rede approximativ recherchiert werden kann. Dabei kann nicht ausgeschlossen werden, dass falsche Belege gefunden und korrekte Belege nicht gefunden werden.

Problemstellung

Es werden Belege von indirekter Rede gesucht, die folgendes Muster aufweisen:

"sagte" + Komma + "dass" + einige Wörter frei + ("habe" oder "hätte" oder "sei" oder "ist" oder "wäre")
wobei wir zwischen "dass" und dem Verb Satzzeichen wie Komma, Doppelpunkt, etc. ausschließen wollen.

Für ein besseres Verständnis wird die gesamte Suchanfrage in Teilsuchanfragen (Q1 bis Q5), die nacheinander ausgeführt werden können, aufgebaut.

Beispiel eines gewünschten Beleges

Eugster sagte, dass die Gemeinde keinen Zeitdruck habe.

Aufbau der Suchanfrage

Q1 = sagte /w0 ,
Q2 = Q1 /+w1 dass

Mit Q2 erhalten wir die Einleitung der indirekten Rede.

Q3 = #END(Q2)

Mit Q3 behalten wir das Wort "dass" (das am weitesten rechts in Q2 auftretende Wort) für die folgenden Recherchen. Dies ist wichtig für Q5.

Q4 = Q3 /+s0,min (habe hätte sei ist wäre)

Mit Q4 schränken wir nun die Belege auf Wortfolgen innerhalb eines Satzes, in denen links "dass" steht, rechts eines der Wörter "habe", "hätte", etc... (alle gewünschten Varianten können hintereinander ohne Operator oder geschrieben werden, wenn die Option weggelassener Operator auf oder gesetzt ist).

Im Abstandsoperator wird außerdem das Schlüsselwort min spezifiziert. Das ist wichtig, damit ein Fall wie F1 als mehrere unabhängige Belege behandelt wird:

F1 = " ... sagte, dass er viele davon schon habe und, da sei er sich sicher, keines jemals gelesen habe."

Für F1 erzeugt Q4 durch Anwendung des Schlüsselwortes min drei unabhängige Belege:

B1 = " ... sagte, dass er viele davon schon habe ...."
B2 = " ... sagte, dass er viele davon schon habe und, da sei ...."
B3 = " ... sagte, dass er viele davon schon habe und, da sei er sich sicher, keines jemals gelesen habe."

Jeder dieser Belege wird einzeln in Q5 ausgewertet, wobei nur Beleg B1 die Bedingung erfüllt.
Ohne Anwendung von min würde Q4 statt drei Belegen nur einen einzigen Beleg weiterreichen, welcher von Q5 als ganzes herausgefiltert werden würde. Im Endeffekt hätten wir einen korrekten Beleg ausgeschlossen.

Q5 = Q4 %w0 ,

Mit Q5 werden nun alle bisherigen Belege ausgeschlossen, bei denen ein Komma zwischen dass und dem Verb vorkommt (einschließlich dass und Verb).
Das Komma kann an dieser Stelle ersetzt werden durch eine Liste von Satzzeichen, die man ausschließen möchte. Der Satzendepunkt braucht nicht in der Liste aufgenommen zu werden, da in Q4 gewährleistet wird, dass alle Wörter eines Beleges innerhalb eines Satzes gefunden werden.

Die gesamte Suchanfrage Q5 lautet also:

Q5 = (#END((sagte /w0 ,) /+w1 dass) /+s0,min (habe hätte sei ist wäre)) %w0 ,

Einschränkung

Diese Suchanfrage hat eine Ungenauigkeit: Ein Beleg wird in Q5 auch dann ausgeschlossen, wenn ein Komma genau hinter dem Verb ("hätte,", "habe,", etc.) auftritt. Um dies zu verhindern, müssen wir auf eine Erweiterung der Suchmaschine warten.

COSMAS II, Zentrale DV-Dienste - 18. 01. 2018