Stemming: Unterschied zwischen den Versionen
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
Zeile 1: | Zeile 1: | ||
'''Definition''' | '''Definition''' | ||
Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto. | Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto. | ||
Damit ist es einfacher | Damit ist es einfacher eine große Datenmenge zu durchsuchen, z.B. Bibliotheksverzeichnisse arbeiten mit Stemming. | ||
'''Nutzen von Stemming in der Informatik''' | '''Nutzen von Stemming in der Informatik''' | ||
Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche einer [[ Suchmaschine ]] genutzt. Dieses ist bereits in | Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche einer [[ Suchmaschine ]] genutzt. Dieses ist bereits in dem komplexen Suchalgorithmus | ||
integriert, so mit werden effizientere Suchergebnisse ermittelt und Speicherplatz gespart. | integriert, so mit werden effizientere Suchergebnisse ermittelt und Speicherplatz gespart. | ||
Gleichzeitig werden die angezeigten Ergebnisse optimiert, d.h. es werden ähnliche Begriffe, die dem Themenfeld des Hauptbegriffes entsprechen angezeigt und die Relevanz wird erhöht. | Gleichzeitig werden die angezeigten Ergebnisse optimiert, d.h. es werden ähnliche Begriffe, die dem Themenfeld des Hauptbegriffes entsprechen angezeigt und die Relevanz wird erhöht. Der Nutzer kann die Anwendung des Stemmingverfahrens vermeiden, in dem er die Begriffe in Anführungszeichen setzt. | ||
Quelle #[ https://www.seo-kueche.de/lexikon/stemming/ ] | Quelle #[ https://www.seo-kueche.de/lexikon/stemming/ ] | ||
Zeile 15: | Zeile 15: | ||
-AOL-Search | -AOL-Search | ||
-Ask.com | -Ask.com | ||
'''Porter-Stemmer-Verfahren''' | |||
Am verbreitetsten ist der Porter-Stemmer-Algoritmus in der Computerlinguistik. Dieser basiert auf einer großen Anzahl von Reduzierungsregeln, d.h. ein Wort wird so lange verkürzt bis die kleinste Menge von Silben erreicht ist. Dieser kann für verschiedene Länder und Sprachen genutzt werden, dabei muss die Plausibilität der Suchergebnisse entsprechend angepasst werden. | |||
Weiterführend: # [ https://www.cl.uni-heidelberg.de/~mujdricz/software/hunPort/IR_Referat_Stemming_MujdriczaSyrota.pdf ] | |||
'''Alternative''' | |||
Bei Suchmaschinen ohne Stemmingverfahren kann mittels Trunkierung nach dem Wortstamm gesucht werden, d.h. es wird nach Zeichenketten bzw. Silben gesucht, die mit Sternchen markiert und abgekürzt werden. So wird die Suche erweitert. | |||
Weiterführende Tipps und Tricks : # [ https://blog.hslu.ch/ikwerkzeugkasten/was-ist-mit-informationskompetenz-gemeint/recherchetricks-suchfunktionen/ ] |
Aktuelle Version vom 20. Dezember 2020, 22:49 Uhr
Definition Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto. Damit ist es einfacher eine große Datenmenge zu durchsuchen, z.B. Bibliotheksverzeichnisse arbeiten mit Stemming.
Nutzen von Stemming in der Informatik Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche einer Suchmaschine genutzt. Dieses ist bereits in dem komplexen Suchalgorithmus integriert, so mit werden effizientere Suchergebnisse ermittelt und Speicherplatz gespart. Gleichzeitig werden die angezeigten Ergebnisse optimiert, d.h. es werden ähnliche Begriffe, die dem Themenfeld des Hauptbegriffes entsprechen angezeigt und die Relevanz wird erhöht. Der Nutzer kann die Anwendung des Stemmingverfahrens vermeiden, in dem er die Begriffe in Anführungszeichen setzt. Quelle #[ https://www.seo-kueche.de/lexikon/stemming/ ]
Beispiele für Suchmaschinen mit einer Stemming-Anwendung
-Google -Lucene -Yahoo! -AOL-Search -Ask.com
Porter-Stemmer-Verfahren Am verbreitetsten ist der Porter-Stemmer-Algoritmus in der Computerlinguistik. Dieser basiert auf einer großen Anzahl von Reduzierungsregeln, d.h. ein Wort wird so lange verkürzt bis die kleinste Menge von Silben erreicht ist. Dieser kann für verschiedene Länder und Sprachen genutzt werden, dabei muss die Plausibilität der Suchergebnisse entsprechend angepasst werden. Weiterführend: # [ https://www.cl.uni-heidelberg.de/~mujdricz/software/hunPort/IR_Referat_Stemming_MujdriczaSyrota.pdf ]
Alternative Bei Suchmaschinen ohne Stemmingverfahren kann mittels Trunkierung nach dem Wortstamm gesucht werden, d.h. es wird nach Zeichenketten bzw. Silben gesucht, die mit Sternchen markiert und abgekürzt werden. So wird die Suche erweitert. Weiterführende Tipps und Tricks : # [ https://blog.hslu.ch/ikwerkzeugkasten/was-ist-mit-informationskompetenz-gemeint/recherchetricks-suchfunktionen/ ]