Text Mining

Aus Social Media Manager
Zur Navigation springen Zur Suche springen

Begriffsdefinition

Unter Text Mining versteht man die Extraktion von Mustern und Strukturen aus großen Textdatenbeständen mittels bestimmter, überwiegend automatisiert ablaufender Analyseverfahren. Hierdurch wird eine qualitative Textaufbereitung erzeugt, die in vielen Anwendungsfeldern der Wirtschafts- und Sozialwissenschaften genutzt wird. In der Wissenschaft wird das Text Mining oft als Unterkategorie des Data Mining beschrieben. Es stellt eine wichtige Grundlage für das Wissensmanagement im Web 2.0 dar.

Ziele

Folgende Ziele werden hierbei verfolgt:

  • Mehrwerte aus vorhandenen Datenbeständen generieren.
  • Datenstrukturierung und -analyse bei großen Datenbeständen, sog. Big Data durchführen.
  • effiziente und zukunftsweisende Werkzeuge intelligenter Systeme nutzen, um große Datenbestände aufzubereiten, z.B. mittels Künstlicher Intelligenz.

Anwendungsbeispiele

Medizinwissenschaft

In der medizinischen Forschung kann durch die Systematik des Text Mining nach Forschungsergebnissen oder Behandlungsmethoden recherchiert werden, sodass dem Medizinpersonal hier geeignete Behandlungsansätze vorgeschlagen werden.

Sozialwissenschaft

Im sozialwissenschenschaftlichen Bereich gibt es Entwicklungen, das Text Mining als Rechercheinstrument zur Analyse von Stimmungen und Einstellungen zu nutzen. Hier kann beispielsweise analysiert werden, wie Kunden ein bestimmtes Produkt bewerten. Inhärente Meinungen, die nicht so offenkundig wie in Bewertungsportalen dargestellt werden, sondern in diversen Textformaten, werden durch das Text Mining in ähnlicher Form auswertbar gemacht.

Prozess

Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen1:

  1. Aufgabendefinition
  2. Dokumentenselektion
  3. Dokumentenaufbereitung
  4. Text Mining Methoden
  5. Interpretation / Evaluation
  6. Anwendung

Aufgabendefinition

Die Problemstellung wird erörtert und die Ziele werden festgelegt.

Dokumentenselektion

Dokumente, die der Recherche unterliegen sollen, werden identifiziert.

Dokumentenaufbereitung

Die jeweiligen Dokumente werden zur Analyse aufbereitet. Die Analysemöglichkeiten reichen hier von einer morphologischen Analyse (Worte, Wortstämme) über eine Syntaxanalyse (Satzbau) bis hin zu einer semantischen Analyse, die sich auf den Kontext bezieht.

Text Mining Methoden

Der Textinhalt wird mit den Methoden der Klassifikation (=Zuordnung zu vordefinierten Kategorien), der Segmentierung (=Ähnliches wird gruppiert und/ oder zusammengeführt) und einer Abhängigkeitsanalyse (= Analyse gemeinsam auftretender Kriterien und Beziehungen) aufbereitet. Man spricht auch von einer sog. Informationsextraktion (IE).

Interpretation / Evaluation

Um die Datenqualität vor der Anwendung zu überprüfen, existiert mit der Interpretation / Evaluation ein Verarbeitungsschritt, der explizit die Evaluation der Datenqualität unter dem Gesichtspunkt der Lösungsrelevanz für eine konkrete Problemstellung als Gegenstand hat.2 In diesem Arbeitsschritt werden demnach die relevanten von den irrelevanten Ergebnissen getrennt.

Anwendung

Wie zuvor erwähnt gibt es Anwendungsfälle im unternehmerischen Kontext, insbesondere zu den Themenstellungen der Kundenzufriedenheits- und Konkurrenzanalyse sowie im (Trend-)Forschungsbereich. Auch für den Bereich des Social Media Monitoring sind derartige Textanalysen äußerst wertvoll.

Begründer

Im Jahr 1995 von Ronen Feldman und Ido Dagan erstmals als Knowledge Discovery in Texts (KDG), First International Conference on Knowledge Discovery, begründet.

Ausblick

Die Systematik des Text Mining wird stetig weiterentwickelt. Durch die Technologien der Künstlichen Intelligenz (KI), sowie des Internet of Things (IoT) lassen sich hier sehr erfolgversprechende Techniken implementieren, die sowohl eine weitere Reduktion der Bearbeitungszeit als auch einen effizienteren Einsatz dieser Methode möglich machen. Trotzdem bleibt nach wie vor der Mensch ein wichtiger Protagonist zur Steuerung der Analyseprozesse, um Missverständnisse durch rein automatisierte Verfahren zu vermeiden. Auch für das Social Media Marketing kann das Text Mining zunehmend an Bedeutung gewinnen, um Kundenreaktionen auswertbar zu machen.

Weiterführende Links

[1], www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle, abgerufen am 03.08.2020

[2] gi.de/informatiklexikon/text-mining/, abgerufen am 08.08.2020

[3] www.datenbanken-verstehen.de/lexikon/text-mining/, abgerufen am 08.08.2020

[4] www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 03.08.2020

[5] www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert, abgerufen am 03.08.2020

[6] www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining, abgerufen am 08.08.2020

Literatur

Feldman, Ronan, Sanger, James: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, 1. Auflage, Cambridge, 2007

Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020

Buch, Bastian:Text Mining: Zur automatischen Wissensextraktion aus unstrukturierten Textdokumenten, 2008

Zai, Chengxiang, Massung, Sean :Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining, 2016

Einzelnachweise

1 Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020

2 Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 08.08.2020