Seite für die Optionen zur Lemmatisierung
Ein Lemma ist die Grundform eines Wortes, das man beispielsweise in einem Wörterbuch findet. Die Bestimmung eines Lemmas basiert auf der Lemmatisierung, das heißt, die Grundform eines Wortes geht aus den dazugehörigen verschiedenen Wortformen hervor.
Die Lemmatisierung in COSMAS II versucht,
möglichst viele Wortformen einer Grundform zuzuweisen, so dass
Sie als BenutzerIn bei Eingabe einer Grundform die zugeordneten
Wortformen erhalten.
Die Lemmatisierung verfügt über kein abgeschlossenes Regelwerk und
keine festgelegten Wortlisten, sondern ist daraufhin ausgelegt, auch für neue
oder sich im Lauf der Zeit verändernde Wortformen eine Grundform zu
ermitteln, mit anderen Worten: korpusbasiert zu arbeiten.
Diese Funktionalität ist nicht nur auf Flexionen von Grundformen beschränkt, sondern bezieht auch die gängigen Wortbildungstypen inklusive ihrer Flexionsformen mit ein.
- Hintergrundinformationen zur Lemmatisierung finden Sie auf der entsprechenden Projektseite des Programmbereichs Korpuslinguistik, dessen Mitarbeiter Cyril Belica für die Entwicklung des Moduls verantwortlich zeichnet.
Wenn Sie die Funktionalitäten der Lemmatisierung in Ihren Suchanfragen
nutzen wollen, müssen Sie den Grundformoperator &
-
dem jeweiligen Suchbegriff vorangestellt - verwenden. Informationen
zum Grundformoperator und Beispiele zu seiner Anwendung finden Sie in der
Syntaxhilfe.
Die Grundoptionen bieten Ihnen die Möglichkeit, individuelle Einstellungen zur Lemmatisierung, insbesondere
abzuändern und diese für die laufende Sitzung zu übernehmen.Außerdem kann der Lemmatisierungsoperator direkt in der Suchanfrage mit
eingesetzt werden.Aufruf
Grundsätzlich: Menü Optionen → Lemmatisierung
Allgemeine Funktionalitäten
Schalter zu den Optionen |
Schalter Übernehmen
Mit diesem Schalter übernehmen Sie die zuvor geänderten Einstellungen für Ihre laufende Sitzung.
Durch alleiniges Ändern werden die Einstellungen nicht aktiviert!
- Wenn Sie eine Suchanfrage mit Grundformoperatoren durchgeführt haben und anschließend die eine oder andere Option zur Lemmatisierung geändert haben, muss die Suchanfrage erneut gestartet werden, sollen die vorgenommenen Änderungen darin berücksichtigt werden.
- Übernommene Einstellungen werden auch sitzungsübergreifend gespeichert, wenn Sie Ihre Sitzung korrekt beenden, d.h. sich über Abmeldung → Logout abmelden.
Mit der Übernahme der Änderungen kehren Sie sofort auf die aufrufende Applikationsseite zurück.
Schalter Eingaben zurücksetzen
Mit dem Schalter Eingaben zurücksetzen machen Sie geänderte Einstellungen wieder rückgängig, wenn diese nicht zuvor übernommen wurden.
Die Grundoptionen
Optionen zur Lemmatisierung |
Alle hier vorgestellen Optionen können miteinander kombiniert werden.
Die ermittelten Wort- bzw. Wortbildungsformen zu einer Grundform werden in einer temporären Wortformliste angezeigt, falls Sie die Option Expansionslisten anzeigen in den Optionen zur Suche aktiviert haben.
- Beachten Sie, dass die Optionen zur Suche, wie beispielsweise die Einstellungen zur Groß-/Kleinschreibung, Ihre Suchanfrage und damit auch die Lemmatisierung direkt beeinflussen können.
- Zusätzlich zu den auf dieser Seite beschriebenen Grundoptionen können Sie den Lemmatisierungsoperator mit erweiterten Optionen einsetzen.
- Die korpus-, aber nicht regelbasierte Arbeitsweise der
Lemmatisierung in COSMAS II liefert bisweilen
auch unkorrekte oder unsinnige Wortformen zurück, was auf eben
diese Arbeitsweise zurückzuführen ist.
Solche Wortformen lassen sich in einer angezeigten Wortformliste problemlos deaktivieren und damit aus der Suche ausschließen.
Option Flexionsformen
Diese Option ist eine feste und unveränderbare Grundeinstellung, die sie weder ab- noch anwählen können.
Option Komposita
Bei Aktivierung dieser Option werden Wortbildungsformen des Typs Komposita ermittelt.
Option Sonstige Wortbildungsformen
Bei Aktivierung dieser Option werden vor allem Wortbildungsformen des Typs Ableitungen ermittelt. Die weiteren ermittelten Wortformen lassen sich nicht von vornherein einem bestimmten Wortbildungstyp zuordnen.
Option Spezialfälle
Bei den Spezialfällen werden Wortformen (in der Regel des Wortbildungstyp Komposita) mit Besonderheiten in der Schreibweise mit einbezogen,
- mit Binde-/Schrägstrichen,
- mit Apostrophen, numerischen Einheiten oder sogar
- mit Satzzeichen,
in Wortformen, in denen die Wortgrenzen von COSMAS II nicht eindeutig erkannt werden.
- Beispiele zur Suche mit Komposita (Beispiel 3)