Text Mining: Unterschied zwischen den Versionen

Aktuelle Version vom 13. Oktober 2020, 19:39 Uhr

Begriffsdefinition

Unter Text Mining versteht man die Extraktion von Mustern und Strukturen aus großen Textdatenbeständen mittels bestimmter, überwiegend automatisiert ablaufender Analyseverfahren. Hierdurch wird eine qualitative Textaufbereitung erzeugt, die in vielen Anwendungsfeldern der Wirtschafts- und Sozialwissenschaften genutzt wird. In der Wissenschaft wird das Text Mining oft als Unterkategorie des Data Mining beschrieben. Es stellt eine wichtige Grundlage für das Wissensmanagement im Web 2.0 dar.

Ziele

Folgende Ziele werden hierbei verfolgt:

Mehrwerte aus vorhandenen Datenbeständen generieren.

Datenstrukturierung und -analyse bei großen Datenbeständen, sog. Big Data durchführen.

effiziente und zukunftsweisende Werkzeuge intelligenter Systeme nutzen, um große Datenbestände aufzubereiten, z.B. mittels Künstlicher Intelligenz.

Anwendungsbeispiele

Medizinwissenschaft

In der medizinischen Forschung kann durch die Systematik des Text Mining nach Forschungsergebnissen oder Behandlungsmethoden recherchiert werden, sodass dem Medizinpersonal hier geeignete Behandlungsansätze vorgeschlagen werden.

Sozialwissenschaft

Im sozialwissenschenschaftlichen Bereich gibt es Entwicklungen, das Text Mining als Rechercheinstrument zur Analyse von Stimmungen und Einstellungen zu nutzen. Hier kann beispielsweise analysiert werden, wie Kunden ein bestimmtes Produkt bewerten. Inhärente Meinungen, die nicht so offenkundig wie in Bewertungsportalen dargestellt werden, sondern in diversen Textformaten, werden durch das Text Mining in ähnlicher Form auswertbar gemacht.

Prozess

Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen¹:

Aufgabendefinition
Dokumentenselektion
Dokumentenaufbereitung
Text Mining Methoden
Interpretation / Evaluation
Anwendung

Aufgabendefinition

Die Problemstellung wird erörtert und die Ziele werden festgelegt.

Dokumentenselektion

Dokumente, die der Recherche unterliegen sollen, werden identifiziert.

Dokumentenaufbereitung

Die jeweiligen Dokumente werden zur Analyse aufbereitet. Die Analysemöglichkeiten reichen hier von einer morphologischen Analyse (Worte, Wortstämme) über eine Syntaxanalyse (Satzbau) bis hin zu einer semantischen Analyse, die sich auf den Kontext bezieht.

Text Mining Methoden

Der Textinhalt wird mit den Methoden der Klassifikation (=Zuordnung zu vordefinierten Kategorien), der Segmentierung (=Ähnliches wird gruppiert und/ oder zusammengeführt) und einer Abhängigkeitsanalyse (= Analyse gemeinsam auftretender Kriterien und Beziehungen) aufbereitet. Man spricht auch von einer sog. Informationsextraktion (IE).

Interpretation / Evaluation

Um die Datenqualität vor der Anwendung zu überprüfen, existiert mit der Interpretation / Evaluation ein Verarbeitungsschritt, der explizit die Evaluation der Datenqualität unter dem Gesichtspunkt der Lösungsrelevanz für eine konkrete Problemstellung als Gegenstand hat.² In diesem Arbeitsschritt werden demnach die relevanten von den irrelevanten Ergebnissen getrennt.

Anwendung

Wie zuvor erwähnt gibt es Anwendungsfälle im unternehmerischen Kontext, insbesondere zu den Themenstellungen der Kundenzufriedenheits- und Konkurrenzanalyse sowie im (Trend-)Forschungsbereich. Auch für den Bereich des Social Media Monitoring sind derartige Textanalysen äußerst wertvoll.

Begründer

Im Jahr 1995 von Ronen Feldman und Ido Dagan erstmals als Knowledge Discovery in Texts (KDG), First International Conference on Knowledge Discovery, begründet.

Ausblick

Die Systematik des Text Mining wird stetig weiterentwickelt. Durch die Technologien der Künstlichen Intelligenz (KI), sowie des Internet of Things (IoT) lassen sich hier sehr erfolgversprechende Techniken implementieren, die sowohl eine weitere Reduktion der Bearbeitungszeit als auch einen effizienteren Einsatz dieser Methode möglich machen. Trotzdem bleibt nach wie vor der Mensch ein wichtiger Protagonist zur Steuerung der Analyseprozesse, um Missverständnisse durch rein automatisierte Verfahren zu vermeiden. Auch für das Social Media Marketing kann das Text Mining zunehmend an Bedeutung gewinnen, um Kundenreaktionen auswertbar zu machen.

Weiterführende Links

[1], www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle, abgerufen am 03.08.2020

[2] gi.de/informatiklexikon/text-mining/, abgerufen am 08.08.2020

[3] www.datenbanken-verstehen.de/lexikon/text-mining/, abgerufen am 08.08.2020

[4] www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 03.08.2020

[5] www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert, abgerufen am 03.08.2020

[6] www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining, abgerufen am 08.08.2020

Literatur

Feldman, Ronan, Sanger, James: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, 1. Auflage, Cambridge, 2007

Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020

Buch, Bastian:Text Mining: Zur automatischen Wissensextraktion aus unstrukturierten Textdokumenten, 2008

Zai, Chengxiang, Massung, Sean :Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining, 2016

Einzelnachweise

¹ Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020

² Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 08.08.2020

@@ Zeile 26: / Zeile 26: @@
 Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen<sup>1</sup>:
-# [[Aufgabendefinition#Aufgabendefinition]
+# '''[[#Aufgabendefinition|Aufgabendefinition]]'''
-# Dokumentenselektion
+# '''[[#Dokumentenselektion|Dokumentenselektion]]'''
-# Dokumentaufbereitung
+# '''[[#Dokumentenaufbereitung|Dokumentenaufbereitung]]'''
-# (Text) Mining Methoden
+# '''[[#Text Mining Methoden|Text Mining Methoden]]'''
-# Interpretation / Evaluation
+# '''[[#Interpretation / Evaluation|Interpretation / Evaluation]]'''
-# Anwendung
+# '''[[#Anwendung|Anwendung]]'''
-====Aufgabendefinition====
+===Aufgabendefinition===
-Die Aufgabenstellung wird konkret definiert.
+Die Problemstellung wird erörtert und die Ziele werden festgelegt.
-Dokumente, die der Recherche unterliegen, werden selektiert.
-Die jeweiligen Dokumente werden zur Analyse aufbereitet.
+===Dokumentenselektion===
+Dokumente, die der Recherche unterliegen sollen, werden identifiziert.
+===Dokumentenaufbereitung===
+Die jeweiligen Dokumente werden zur Analyse aufbereitet. Die Analysemöglichkeiten reichen hier von einer morphologischen Analyse (Worte, Wortstämme) über eine Syntaxanalyse (Satzbau) bis hin zu einer semantischen Analyse, die sich auf den Kontext bezieht.
+===Text Mining Methoden===
+Der Textinhalt wird mit den Methoden der Klassifikation (=Zuordnung zu vordefinierten Kategorien), der Segmentierung (=Ähnliches wird gruppiert und/ oder zusammengeführt) und einer Abhängigkeitsanalyse (= Analyse gemeinsam auftretender Kriterien und Beziehungen) aufbereitet. Man spricht auch von einer sog. Informationsextraktion (IE).
+===Interpretation / Evaluation===
+Um die Datenqualität vor der Anwendung zu überprüfen, existiert mit der Interpretation / Evaluation ein Verarbeitungsschritt, der explizit die Evaluation der Datenqualität unter dem Gesichtspunkt der Lösungsrelevanz für eine konkrete Problemstellung als Gegenstand hat.<sup>2</sup>
+In diesem Arbeitsschritt werden demnach die relevanten von den irrelevanten Ergebnissen getrennt.
+===Anwendung===
+Wie zuvor erwähnt gibt es Anwendungsfälle im unternehmerischen Kontext, insbesondere zu den Themenstellungen der Kundenzufriedenheits- und Konkurrenzanalyse sowie im (Trend-)Forschungsbereich. Auch für den Bereich des [[Social Media Monitoring]] sind derartige Textanalysen äußerst wertvoll.
 == Begründer ==
@@ Zeile 47: / Zeile 61: @@
 == Weiterführende Links ==
-Tiedemann, Michaela: Blogartikel zum Thema "Textmining: Grundlagen, Methoden und Anwendungsfälle"
+[https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle], www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle, abgerufen am 03.08.2020
-[https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle], abgerufen am 03.08.2020
+[https://gi.de/informatiklexikon/text-mining/] gi.de/informatiklexikon/text-mining/, abgerufen am 08.08.2020
+[https://www.datenbanken-verstehen.de/lexikon/text-mining/] www.datenbanken-verstehen.de/lexikon/text-mining/, abgerufen am 08.08.2020
+[https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining] www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 03.08.2020
+[https://www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert] www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert, abgerufen am 03.08.2020
+[https://www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining] www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining, abgerufen am 08.08.2020
 == Literatur ==
+Feldman, Ronan, Sanger, James: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, 1. Auflage, Cambridge, 2007
 Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020
@@ Zeile 59: / Zeile 84: @@
 == Einzelnachweise ==
 <sup>1</sup> Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020
+<sup>2</sup> Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 08.08.2020

Text Mining: Unterschied zwischen den Versionen

Aktuelle Version vom 13. Oktober 2020, 19:39 Uhr

Inhaltsverzeichnis

Begriffsdefinition

Ziele

Anwendungsbeispiele

Medizinwissenschaft

Sozialwissenschaft

Prozess

Aufgabendefinition

Dokumentenselektion

Dokumentenaufbereitung

Text Mining Methoden

Interpretation / Evaluation

Anwendung

Begründer

Ausblick

Weiterführende Links

Literatur

Einzelnachweise

Navigationsmenü

Text Mining: Unterschied zwischen den Versionen

Aktuelle Version vom 13. Oktober 2020, 19:39 Uhr

Begriffsdefinition

Ziele

Anwendungsbeispiele

Medizinwissenschaft

Sozialwissenschaft

Prozess

Aufgabendefinition

Dokumentenselektion

Dokumentenaufbereitung

Text Mining Methoden

Interpretation / Evaluation

Anwendung

Begründer

Ausblick

Weiterführende Links

Literatur

Einzelnachweise

Navigationsmenü

Suche