Text Mining: Unterschied zwischen den Versionen
TGß (Diskussion | Beiträge) |
TGß (Diskussion | Beiträge) |
||
(34 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
Zeile 26: | Zeile 26: | ||
Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen<sup>1</sup>: | Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen<sup>1</sup>: | ||
# [[Aufgabendefinition | # '''[[#Aufgabendefinition|Aufgabendefinition]]''' | ||
# Dokumentenselektion | # '''[[#Dokumentenselektion|Dokumentenselektion]]''' | ||
# | # '''[[#Dokumentenaufbereitung|Dokumentenaufbereitung]]''' | ||
# | # '''[[#Text Mining Methoden|Text Mining Methoden]]''' | ||
# Interpretation / Evaluation | # '''[[#Interpretation / Evaluation|Interpretation / Evaluation]]''' | ||
# Anwendung | # '''[[#Anwendung|Anwendung]]''' | ||
===Aufgabendefinition=== | |||
Die | Die Problemstellung wird erörtert und die Ziele werden festgelegt. | ||
Dokumente, die der Recherche unterliegen, werden | |||
Die jeweiligen Dokumente werden zur Analyse aufbereitet. | ===Dokumentenselektion=== | ||
Dokumente, die der Recherche unterliegen sollen, werden identifiziert. | |||
===Dokumentenaufbereitung=== | |||
Die jeweiligen Dokumente werden zur Analyse aufbereitet. Die Analysemöglichkeiten reichen hier von einer morphologischen Analyse (Worte, Wortstämme) über eine Syntaxanalyse (Satzbau) bis hin zu einer semantischen Analyse, die sich auf den Kontext bezieht. | |||
===Text Mining Methoden=== | |||
Der Textinhalt wird mit den Methoden der Klassifikation (=Zuordnung zu vordefinierten Kategorien), der Segmentierung (=Ähnliches wird gruppiert und/ oder zusammengeführt) und einer Abhängigkeitsanalyse (= Analyse gemeinsam auftretender Kriterien und Beziehungen) aufbereitet. Man spricht auch von einer sog. Informationsextraktion (IE). | |||
===Interpretation / Evaluation=== | |||
Um die Datenqualität vor der Anwendung zu überprüfen, existiert mit der Interpretation / Evaluation ein Verarbeitungsschritt, der explizit die Evaluation der Datenqualität unter dem Gesichtspunkt der Lösungsrelevanz für eine konkrete Problemstellung als Gegenstand hat.<sup>2</sup> | |||
In diesem Arbeitsschritt werden demnach die relevanten von den irrelevanten Ergebnissen getrennt. | |||
===Anwendung=== | |||
Wie zuvor erwähnt gibt es Anwendungsfälle im unternehmerischen Kontext, insbesondere zu den Themenstellungen der Kundenzufriedenheits- und Konkurrenzanalyse sowie im (Trend-)Forschungsbereich. Auch für den Bereich des [[Social Media Monitoring]] sind derartige Textanalysen äußerst wertvoll. | |||
== Begründer == | == Begründer == | ||
Zeile 47: | Zeile 61: | ||
== Weiterführende Links == | == Weiterführende Links == | ||
[https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle], www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle, abgerufen am 03.08.2020 | |||
[https://www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle], abgerufen am 03.08.2020 | |||
[https://gi.de/informatiklexikon/text-mining/] gi.de/informatiklexikon/text-mining/, abgerufen am 08.08.2020 | |||
[https://www.datenbanken-verstehen.de/lexikon/text-mining/] www.datenbanken-verstehen.de/lexikon/text-mining/, abgerufen am 08.08.2020 | |||
[https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining] www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 03.08.2020 | |||
[https://www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert] www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert, abgerufen am 03.08.2020 | |||
[https://www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining] www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining, abgerufen am 08.08.2020 | |||
== Literatur == | == Literatur == | ||
Feldman, Ronan, Sanger, James: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, 1. Auflage, Cambridge, 2007 | |||
Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020 | Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020 | ||
Zeile 59: | Zeile 84: | ||
== Einzelnachweise == | == Einzelnachweise == | ||
<sup>1</sup> Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020 | <sup>1</sup> Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020 | ||
<sup>2</sup> Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 08.08.2020 |
Aktuelle Version vom 13. Oktober 2020, 20:39 Uhr
Begriffsdefinition
Unter Text Mining versteht man die Extraktion von Mustern und Strukturen aus großen Textdatenbeständen mittels bestimmter, überwiegend automatisiert ablaufender Analyseverfahren. Hierdurch wird eine qualitative Textaufbereitung erzeugt, die in vielen Anwendungsfeldern der Wirtschafts- und Sozialwissenschaften genutzt wird. In der Wissenschaft wird das Text Mining oft als Unterkategorie des Data Mining beschrieben. Es stellt eine wichtige Grundlage für das Wissensmanagement im Web 2.0 dar.
Ziele
Folgende Ziele werden hierbei verfolgt:
- Mehrwerte aus vorhandenen Datenbeständen generieren.
- Datenstrukturierung und -analyse bei großen Datenbeständen, sog. Big Data durchführen.
- effiziente und zukunftsweisende Werkzeuge intelligenter Systeme nutzen, um große Datenbestände aufzubereiten, z.B. mittels Künstlicher Intelligenz.
Anwendungsbeispiele
Medizinwissenschaft
In der medizinischen Forschung kann durch die Systematik des Text Mining nach Forschungsergebnissen oder Behandlungsmethoden recherchiert werden, sodass dem Medizinpersonal hier geeignete Behandlungsansätze vorgeschlagen werden.
Sozialwissenschaft
Im sozialwissenschenschaftlichen Bereich gibt es Entwicklungen, das Text Mining als Rechercheinstrument zur Analyse von Stimmungen und Einstellungen zu nutzen. Hier kann beispielsweise analysiert werden, wie Kunden ein bestimmtes Produkt bewerten. Inhärente Meinungen, die nicht so offenkundig wie in Bewertungsportalen dargestellt werden, sondern in diversen Textformaten, werden durch das Text Mining in ähnlicher Form auswertbar gemacht.
Prozess
Der Prozess des Text Mining lässt sich in insgesamt sechs Schritte kategorisieren, die strukturell aufeinander aufbauen1:
- Aufgabendefinition
- Dokumentenselektion
- Dokumentenaufbereitung
- Text Mining Methoden
- Interpretation / Evaluation
- Anwendung
Aufgabendefinition
Die Problemstellung wird erörtert und die Ziele werden festgelegt.
Dokumentenselektion
Dokumente, die der Recherche unterliegen sollen, werden identifiziert.
Dokumentenaufbereitung
Die jeweiligen Dokumente werden zur Analyse aufbereitet. Die Analysemöglichkeiten reichen hier von einer morphologischen Analyse (Worte, Wortstämme) über eine Syntaxanalyse (Satzbau) bis hin zu einer semantischen Analyse, die sich auf den Kontext bezieht.
Text Mining Methoden
Der Textinhalt wird mit den Methoden der Klassifikation (=Zuordnung zu vordefinierten Kategorien), der Segmentierung (=Ähnliches wird gruppiert und/ oder zusammengeführt) und einer Abhängigkeitsanalyse (= Analyse gemeinsam auftretender Kriterien und Beziehungen) aufbereitet. Man spricht auch von einer sog. Informationsextraktion (IE).
Interpretation / Evaluation
Um die Datenqualität vor der Anwendung zu überprüfen, existiert mit der Interpretation / Evaluation ein Verarbeitungsschritt, der explizit die Evaluation der Datenqualität unter dem Gesichtspunkt der Lösungsrelevanz für eine konkrete Problemstellung als Gegenstand hat.2 In diesem Arbeitsschritt werden demnach die relevanten von den irrelevanten Ergebnissen getrennt.
Anwendung
Wie zuvor erwähnt gibt es Anwendungsfälle im unternehmerischen Kontext, insbesondere zu den Themenstellungen der Kundenzufriedenheits- und Konkurrenzanalyse sowie im (Trend-)Forschungsbereich. Auch für den Bereich des Social Media Monitoring sind derartige Textanalysen äußerst wertvoll.
Begründer
Im Jahr 1995 von Ronen Feldman und Ido Dagan erstmals als Knowledge Discovery in Texts (KDG), First International Conference on Knowledge Discovery, begründet.
Ausblick
Die Systematik des Text Mining wird stetig weiterentwickelt. Durch die Technologien der Künstlichen Intelligenz (KI), sowie des Internet of Things (IoT) lassen sich hier sehr erfolgversprechende Techniken implementieren, die sowohl eine weitere Reduktion der Bearbeitungszeit als auch einen effizienteren Einsatz dieser Methode möglich machen. Trotzdem bleibt nach wie vor der Mensch ein wichtiger Protagonist zur Steuerung der Analyseprozesse, um Missverständnisse durch rein automatisierte Verfahren zu vermeiden. Auch für das Social Media Marketing kann das Text Mining zunehmend an Bedeutung gewinnen, um Kundenreaktionen auswertbar zu machen.
Weiterführende Links
[1], www.alexanderthamm.com/de/blog/text-mining-grundlagen-methoden-und-anwendungsfaelle, abgerufen am 03.08.2020
[2] gi.de/informatiklexikon/text-mining/, abgerufen am 08.08.2020
[3] www.datenbanken-verstehen.de/lexikon/text-mining/, abgerufen am 08.08.2020
[4] www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 03.08.2020
[5] www.wirtschaftsforum.de/expertenwissen/was-ist-denn-data-science/text-mining-weil-lesen-einfach-zu-lange-dauert, abgerufen am 03.08.2020
[6] www.digitalwelt.org/themen/social-media/social-media-monitoring/text-mining, abgerufen am 08.08.2020
Literatur
Feldman, Ronan, Sanger, James: The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data, 1. Auflage, Cambridge, 2007
Paulsen, Thomas: Text Mining in der Szenarioanalyse, Eine methodische Erweiterung zur Reduktion des Aufwands und der Subjektivität bei der Sammlung von Einflussfaktoren, Hamburg, 2020
Buch, Bastian:Text Mining: Zur automatischen Wissensextraktion aus unstrukturierten Textdokumenten, 2008
Zai, Chengxiang, Massung, Sean :Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining, 2016
Einzelnachweise
1 Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 02.08.2020
2 Prof. Dr. Michaela Geierhos, https://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/technologien-methoden/text-mining/text-mining, abgerufen am 08.08.2020