Text Mining
Begriffsdefinition
Unter Text Mining versteht man die Extraktion von Mustern und Strukturen aus großen Textdatenbeständen mittels bestimmter, überwiegend automatisiert ablaufender Analyseverfahren. Hierdurch wird eine qualitative Textaufbereitung erzeugt, die in vielen Anwendungsfeldern der Wirtschafts- und Sozialwissenschaften genutzt wird. In der Wissenschaft wird es oft als Unterkategorie des Data Mining beschrieben.
Ziele
Folgende Ziele werden hierbei verfolgt:
- Mehrwerte aus vorhandenen Datenbeständen generieren.
- Datenstrukturierung und -analyse bei großen Datenbeständen, sog. Big Data durchführen.
- effiziente und zukunftsweisende Werkzeuge intelligenter Systeme nutzen, um große Datenbestände aufzubereiten, z.B. mittels Künstlicher Intelligenz.
Anwendungsbeispiele
Medizinwissenschaft
In der medizinischen Forschung kann durch die Systematik des Text Mining nach Forschungsergebnissen oder Behandlungsmethoden recherchiert werden, sodass dem Medizinpersonal hier geeignete Behandlungsansätze vorgeschlagen werden.
Sozialwissenschaft
Im sozialwissenschenschaftlichen Bereich gibt es Entwicklungen, das Text Mining als Rechercheinstrument zur Analyse von Stimmungen und Einstellungen zu nutzen. Hier kann beispielsweise analysiert werden, wie Kunden ein bestimmtes Produkt bewerten. Inhärente Meinungen, die nicht so offenkundig wie in Bewertungsportalen dargestellt werden, sondern in diversen Textformaten, werden durch das Text Mining in ähnlicher Form auswertbar gemacht.
Prozess
Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen1:
- Aufgabendefinition
- Dokumentenselektion
- Dokumentaufbereitung
- (Text) Mining Methoden
- Interpretation / Evaluation
- Anwendung
Die Aufgabenstellung wird konkret definiert. Dokumente, die der Recherche unterliegen, werden selektiert. Die jeweiligen Dokumente werden zur Analyse aufbereitet.
Begründer
Im Jahr 1995 von Ronen Feldman und Ido Dagan erstmals als Knowledge Discovery in Texts (KDG), First International Conference on Knowledge Discovery, begründet.
Ausblick
Die Systematik des Text Mining wird stetig weiterentwickelt. Durch die Technologien der Künstlichen Intelligenz (KI), sowie des Internet of Things (IoT) lassen sich hier sehr erfolgversprechende Techniken implementieren, die sowohl eine weitere Reduktion der Bearbeitungszeit als auch einen effizienteren Einsatz dieser Methode möglich machen. Trotzdem bleibt nach wie vor der Mensch ein wichtiger Protagonist zur Steuerung der Analyseprozesse, um Missverständnisse durch rein automatisierte Verfahren zu vermeiden. Auch für das Social Media Marketing kann das Text Mining zunehmend an Bedeutung gewinnen, um Kundenreaktionen auswertbar zu machen.
Weiterführende Links
Thamm, Alexander, Blogartikel zum Thema "Textmining: Grundlagen, Methoden und Anwendungsfälle" https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle/
Literatur
Thomas Paulsen: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020
Einzelnachweise
1 Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, Zugriff am 02.08.2020