Stemming: Unterschied zwischen den Versionen

Aus Social Media Manager
Zur Navigation springen Zur Suche springen
 
(6 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
'''Definition'''
'''Definition'''
Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto.
Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto.
Damit ist es einfacher eine4 große Datenmenge zu durchsuchen, z.B. ein Bibliotheksverzeichnisse arbeiten mit Stemming.
Damit ist es einfacher eine große Datenmenge zu durchsuchen, z.B. Bibliotheksverzeichnisse arbeiten mit Stemming.


'''Nutzen von Stemming in der Informatik'''
'''Nutzen von Stemming in der Informatik'''
Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche von(( Suchmaschinen )) genutzt. Dieses ist bereits in den komplexen Suchalgorithmus integriert.
Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche einer [[ Suchmaschine ]] genutzt. Dieses ist bereits in dem komplexen Suchalgorithmus  
integriert, so mit werden effizientere Suchergebnisse ermittelt und Speicherplatz gespart.
Gleichzeitig werden die angezeigten Ergebnisse optimiert, d.h. es werden ähnliche Begriffe, die dem Themenfeld des Hauptbegriffes entsprechen angezeigt und die Relevanz wird erhöht. Der Nutzer kann die Anwendung des Stemmingverfahrens vermeiden, in dem er die Begriffe in Anführungszeichen setzt.
Quelle #[ https://www.seo-kueche.de/lexikon/stemming/ ]
 
'''Beispiele für Suchmaschinen mit einer Stemming-Anwendung'''
-Google
-Lucene
-Yahoo!
-AOL-Search
-Ask.com
 
'''Porter-Stemmer-Verfahren'''
Am verbreitetsten ist der Porter-Stemmer-Algoritmus in der Computerlinguistik. Dieser basiert auf einer großen Anzahl von Reduzierungsregeln, d.h. ein Wort wird so lange verkürzt bis die kleinste Menge von Silben erreicht ist. Dieser kann für verschiedene Länder und Sprachen genutzt werden, dabei muss die Plausibilität der Suchergebnisse entsprechend angepasst werden.
Weiterführend: # [ https://www.cl.uni-heidelberg.de/~mujdricz/software/hunPort/IR_Referat_Stemming_MujdriczaSyrota.pdf ]
 
'''Alternative'''
Bei Suchmaschinen ohne Stemmingverfahren kann mittels Trunkierung nach dem Wortstamm gesucht werden, d.h. es wird nach Zeichenketten bzw. Silben gesucht, die mit Sternchen markiert und abgekürzt werden. So wird die Suche erweitert.
Weiterführende Tipps und Tricks : # [ https://blog.hslu.ch/ikwerkzeugkasten/was-ist-mit-informationskompetenz-gemeint/recherchetricks-suchfunktionen/ ]

Aktuelle Version vom 20. Dezember 2020, 22:49 Uhr

Definition Stemming bedeutet übersetzt Stammformreduktion. Das ist ein wichtiges Verfahren in der Sprachwissenschaft und Informatik, das heißt Worte oder Suchbegriffe auf Ihren grammatikalischen Wortstamm zurückzuführen, zum Beispiel: Auto, Automobil, Autos und Autohaus auf den Wortstamm Auto. Damit ist es einfacher eine große Datenmenge zu durchsuchen, z.B. Bibliotheksverzeichnisse arbeiten mit Stemming.

Nutzen von Stemming in der Informatik Stemming wird zur Verbesserung, Erweiterung und schnelleren Suche einer Suchmaschine genutzt. Dieses ist bereits in dem komplexen Suchalgorithmus integriert, so mit werden effizientere Suchergebnisse ermittelt und Speicherplatz gespart. Gleichzeitig werden die angezeigten Ergebnisse optimiert, d.h. es werden ähnliche Begriffe, die dem Themenfeld des Hauptbegriffes entsprechen angezeigt und die Relevanz wird erhöht. Der Nutzer kann die Anwendung des Stemmingverfahrens vermeiden, in dem er die Begriffe in Anführungszeichen setzt. Quelle #[ https://www.seo-kueche.de/lexikon/stemming/ ]

Beispiele für Suchmaschinen mit einer Stemming-Anwendung

-Google
-Lucene
-Yahoo!
-AOL-Search
-Ask.com

Porter-Stemmer-Verfahren Am verbreitetsten ist der Porter-Stemmer-Algoritmus in der Computerlinguistik. Dieser basiert auf einer großen Anzahl von Reduzierungsregeln, d.h. ein Wort wird so lange verkürzt bis die kleinste Menge von Silben erreicht ist. Dieser kann für verschiedene Länder und Sprachen genutzt werden, dabei muss die Plausibilität der Suchergebnisse entsprechend angepasst werden. Weiterführend: # [ https://www.cl.uni-heidelberg.de/~mujdricz/software/hunPort/IR_Referat_Stemming_MujdriczaSyrota.pdf ]

Alternative Bei Suchmaschinen ohne Stemmingverfahren kann mittels Trunkierung nach dem Wortstamm gesucht werden, d.h. es wird nach Zeichenketten bzw. Silben gesucht, die mit Sternchen markiert und abgekürzt werden. So wird die Suche erweitert. Weiterführende Tipps und Tricks : # [ https://blog.hslu.ch/ikwerkzeugkasten/was-ist-mit-informationskompetenz-gemeint/recherchetricks-suchfunktionen/ ]