Text Mining
Inhaltsverzeichnis
Begriffsdefinition
Unter Text Mining versteht man die Extraktion von Mustern und Strukturen aus großen Textdatenbeständen mittels bestimmter, überwiegend automatisiert ablaufender Analyseverfahren. Hierdurch wird eine qualitative Textaufbereitung erzeugt, die in vielen Anwendungsfeldern der Wirtschafts- und Sozialwissenschaften genutzt wird. In der Wissenschaft wird es oft als Unterkategorie des Data Mining beschrieben.
Ziele
Folgende Ziele werden hierbei verfolgt:
- Mehrwerte aus vorhandenen Datenbeständen generieren.
- Datenstrukturierung und -analyse bei großen Datenbeständen, sog. Big Data durchführen.
- effiziente und zukunftsweisende Werkzeuge intelligenter Systeme nutzen, um große Datenbestände aufzubereiten, z.B. mittels Künstlicher Intelligenz.
Anwendungsbeispiele
Medizinwissenschaft
In der medizinischen Forschung kann durch die Systematik des Text Mining nach Forschungsergebnissen oder Behandlungsmethoden recherchiert werden, sodass dem Medizinpersonal hier geeignete Behandlungsansätze vorgeschlagen werden.
Sozialwissenschaft
Im sozialwissenschenschaftlichen Bereich gibt es Entwicklungen, das Text Mining als Rechercheinstrument zur Analyse von Stimmungen und Einstellungen zu nutzen. Hier kann beispielsweise analysiert werden, wie Kunden ein bestimmtes Produkt bewerten.
Prozess
Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen:
- Aufgabendefinition
- Dokumentenselektion
- Dokumentaufbereitung
- (Text) Mining Methoden
- Interpretation / Evaluation
- Anwendung
Die Aufgabenstellung wird konkret definiert. Dokumente, die der Recherche unterliegen, werden selektiert. Die jeweiligen Dokumente werden zur Analyse aufbereitet.
Begründer
Im Jahr 1995 von Ronen Feldman und Ido Dagan erstmals als Knowledge Discovery in Texts (KDG), First International Conference on Knowledge Discovery, begründet.
Ausblick
Die Systematik des Text Mining wird stetig weiterentwickelt. Durch die Technologien der Künstlichen Intelligenz (KI), sowie des Internet of Things (IoT) lassen sich hier sehr erfolgversprechende Techniken implementieren, die sowohl eine weitere Reduktion der Bearbeitungszeit als auch einen effizienteren Einsatz dieser Methode möglich machen.
Weiterführende Links
[1] https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle/