Operator LEM
deutsche Bezeichnung |
interne Bezeichnung |
LEM |
LEM(<S>) |
Allgemeine Beschreibung
- Grundformoperator für lemmatisierte Wortformen.
- Steht nur für Korpora geschriebener deutscher Sprache
zur Verfügung.
- Als Grundformen werden Zeichenketten basierend auf dem
Zeichensatz ISO Latin 1 akzeptiert.
- Es können gleichzeitig mehrere Suchbegriffe eingegeben
werden, die implizit als Alternativen (ODER-Verknüpfung)
hehandelt werden.
Berücksichtigung von Groß- und Kleinschreibung sowie von
diakritischen Zeichen
- Die globalen
Optionen für die Groß-/Kleinschreibung
sind bei diesem Operator nicht wirksam.
- Die Groß-/Kleinschreibung wird immer beachtet, d.h.
LEM('Machen')
und LEM('machen')
stellen zwei unterschiedliche Grundformen dar, die zwei verschiedene
Wortformlisten liefern.
- Bei Wörtern mit ß werden automatisch beide Schreibvarianten
(mit ß und mit ss) herangezogen, d.h.
LEM('groß')
und LEM('gross')
liefern die gleichen
Wortformlisten.
Die Lemmatisierungsoptionen
- Die
Lemmatisierungsoptionen
lassen sich in einem eigenen Dialogfeld einstellen.
- Die Flexionsformen sind zwar als Option dabei, dienen allerdings einzig
und allein der Dokumentation und können nicht ausgeschaltet werden.
- Bei der Eingabe von Wortpräfixen (siehe die Beispiele für un-
und -heit) muss zusätzlich die
Option sonstige Wortbildungsformen eingeschaltet werden.
- Für kurze Wörter aus der Kategorie der Artikel und Pronomen muss als
Grundform der längste gemeinsame Stamm gefolgt von einem Bindestrich
eingegeben werden (siehe die Beispiele für d- und
all-).
Hierzu braucht die Option sonstige Wortbildungsformen nicht
eingeschaltet werden.
Angabe einer Textposition
Durch Angabe einer oder mehrerer Textpositionen
kann festgelegt werden, an welchen Stellen eines Satzes, Absatzes oder Textes
die Wörter gesucht oder nicht gesucht werden soll. Siehe Beispiele.
Beispiele
Beispiel 1
Suche nach den Flexionsformen von gehen
Beispiel 2
Suche nach Wortformen mit dem Präfix un-.
Die Lemmatisierungsoption Sonstige Wortbildungsformen
muss eingeschaltet sein.
Beispiel 3
Suche nach Wortformen mit dem Postfix -heit.
Die Lemmatisierungsoption Sonstige Wortbildungsformen
muss eingeschaltet sein.
Beispiel 4
Suche nach Wortformen zum Stamm all, der als Grundform für
alle Pronomen alle, allen, alles, etc. steht.
Die Lemmatisierungsoption Sonstige Wortbildungsformen
sollte in diesem Fall nicht eingeschaltet werden.
- Eine solche Suchanfrage muss vorsichtig eingesetzt werden, weil die
zurückgelieferte Wortformliste u.a. nicht alle gewünschten bzw.
ableitbaren Wortformen enthält.
Beispiel 5
Suche nach Wortformen zum Stamm d, der als Grundform für
alle Artikel der, die, das, des, dessen, etc. steht.
Die Lemmatisierungsoption Sonstige Wortbildungsformen
sollte in diesem Fall nicht eingeschaltet werden.
- Eine solche Suchanfrage muss vorsichtig eingesetzt werden, weil die
zurückgelieferte Wortformliste u.a. nicht alle gewünschten bzw.
ableitbaren Wortformen enthält.
Beispiel 1
Suche nach den Flexionsformen von sein als erstes Wort eines Absatzes.
Beispiel 2
Suche nach den Flexionsformen von gehen innerhalb von Sätzen, d.h. weder als
erstes noch als letzes Wort eines Satzes.