zeilenorientierte Eingabe → themenspezifische Fragestellungen → Muster einer Suchanfrage für die indirekte Rede |
Muster einer Suchanfrage für die indirekte Rede
In den IDS-Korpora können Textstellen mit indirekter Rede nicht direkt abgefragt werden, da diese nicht annotiert ist. Vorgeschlagen wird hier ein Suchanfragemuster, bei dem ein Typus von indirekter Rede approximativ recherchiert werden kann. Dabei kann nicht ausgeschlossen werden, dass falsche Belege gefunden und korrekte Belege nicht gefunden werden.
Problemstellung
Es werden Belege von indirekter Rede gesucht, die folgendes Muster aufweisen:
"sagte" + Komma + "dass" + einige Wörter frei +
("habe" oder "hätte" oder "sei" oder "ist" oder "wäre")
wobei wir zwischen "dass" und dem Verb Satzzeichen wie Komma, Doppelpunkt, etc.
ausschließen wollen.
Für ein besseres Verständnis wird die gesamte Suchanfrage in Teilsuchanfragen (Q1
bis Q5
),
die nacheinander ausgeführt werden können, aufgebaut.
Beispiel eines gewünschten Beleges
Eugster sagte, dass die Gemeinde keinen Zeitdruck habe.
Aufbau der Suchanfrage
Q1 = sagte /w0 , |
Q2 = Q1 /+w1 dass |
Mit Q2
erhalten wir die Einleitung der indirekten Rede.
Q3 = #END(Q2) |
Mit Q3
behalten wir das Wort "dass" (das am weitesten
rechts in Q2
auftretende Wort) für die folgenden
Recherchen. Dies ist wichtig für Q5
.
Q4 = Q3 /+s0,min (habe hätte sei ist wäre) |
Mit Q4
schränken wir nun die Belege auf
Wortfolgen innerhalb eines Satzes, in denen links "dass" steht,
rechts eines der Wörter "habe", "hätte", etc... (alle gewünschten
Varianten können hintereinander ohne Operator oder geschrieben werden,
wenn die Option weggelassener Operator auf oder gesetzt ist).
Im Abstandsoperator wird außerdem das Schlüsselwort min spezifiziert. Das ist wichtig, damit ein Fall wie F1 als mehrere unabhängige Belege behandelt wird:
F1 = " ... sagte, dass er viele davon schon habe und, da sei er sich sicher, keines jemals gelesen habe."
Für F1 erzeugt Q4
durch Anwendung des Schlüsselwortes min
drei unabhängige Belege:
B1 = " ... sagte, dass er viele davon schon
habe ...."
B2 = " ... sagte, dass er viele davon schon habe und,
da sei ...."
B3 = " ... sagte, dass er viele davon schon habe und,
da sei er sich sicher, keines jemals gelesen habe."
Jeder dieser Belege wird einzeln in Q5
ausgewertet, wobei nur
Beleg B1 die Bedingung erfüllt.
Ohne Anwendung von min würde Q4
statt drei Belegen nur einen einzigen Beleg weiterreichen,
welcher von Q5
als ganzes herausgefiltert werden würde. Im Endeffekt hätten
wir einen korrekten Beleg ausgeschlossen.
Q5 = Q4 %w0 , |
Mit Q5
werden nun alle bisherigen Belege ausgeschlossen, bei denen ein Komma
zwischen dass und dem Verb vorkommt (einschließlich dass und Verb).
Das Komma kann an dieser Stelle ersetzt werden durch eine Liste von Satzzeichen,
die man ausschließen möchte. Der Satzendepunkt braucht nicht in der Liste aufgenommen zu werden,
da in Q4
gewährleistet wird, dass alle Wörter eines Beleges innerhalb
eines Satzes gefunden werden.
Die gesamte Suchanfrage Q5
lautet also:
Q5 = (#END((sagte /w0 ,) /+w1 dass) /+s0,min (habe hätte sei ist wäre)) %w0 , |
Einschränkung
Diese Suchanfrage hat eine Ungenauigkeit: Ein Beleg
wird in Q5
auch dann ausgeschlossen, wenn ein Komma genau hinter dem Verb ("hätte,", "habe,", etc.)
auftritt. Um dies zu verhindern, müssen wir auf eine Erweiterung der Suchmaschine warten.