Interview mit dem Informationswissenschaftler David Schönhalz
Wie beurteilen Sie die Relevanz der Social-Media-Analyse?
Schönhalz: Im März diesen Jahres konnte Facebook erstmals mehr Visits auf seiner Website verzeichnen als Google. Das ist eine Entwicklung, die man vor einigen Jahren kaum für möglich gehalten hätte. Gleichzeitig gewinnt auch die Analyse und Auswertung der auf derartigen Plattformen generierten Inhalte verstärkt an Bedeutung. Die Social Networks erwiesen sich als eine zentrale Quelle für Markt- und Trendforschung. Vor allem die automatische Analyse von Stimmungen und Meinungen, die Sentiment-Analyse, stellt eine Herausforderung dar.
Was genau versteht man unter einem »Sentiment«?
Im Web 2.0 vorliegende Informationen lassen sich in zwei grundlegende Kategorien einordnen: Fakten und Meinungen. Während Fakten objektive Aussagen über eine andere Person, ein Objekt oder einen Prozess sind, stellen Meinungen subjektive und häufig emotionsbasierte Aussagen dar. Zu diesen gehören auch Sentiments, die auch als »Semantic Orientations« bezeichnet werden. Es handelt sich hierbei um eine Stimmung, eine Empfindung oder eine auf einer Emotion basierende Meinung, die eine Person hat. Das kann zum Beispiel in Bezug auf ein Unternehmen, ein Produkt oder eine bestimmte Dienstleistung sein. Dabei drückt ein Sentiment eine Haltung aus, die sich auch grob in drei Kategorien »positiv«, »negativ« und »neutral« zuordnen lässt.
Wie wichtig ist die Auswertung von Sentiments für Unternehmen?
Da Sentiments das subjektive Empfinden und die persönliche Meinung einer Person in Bezug auf ein Produkt, eine Dienstleistung usw. ausdrücken, sind diese Daten für Unternehmen von besonderem Interesse. Aus diesem Grund zählt die Auswertung der Dokumente bezüglich der vorkommenden Sentiments zu den zentralen Kriterien bei der Analyse von Web 2.0-Daten.
Welche Bedeutung hat die Informationswissenschaft in diesem Kontext?
Da beispielsweise Unternehmen, die Dienstleistungen in den Bereichen Webmonitoring oder Online-Marktforschung anbieten, bei der Analyse häufig mit sehr großen Datenvolumina konfrontiert sind, besteht ein stetiger Bedarf an neuen und optimierten Verfahren und Technologien, die eine zusätzliche intellektuelle Auswertung der Dokumente möglichst überflüssig machen. Aber auch in anderen Bereichen bietet die automatische Sentiment-Analyse weitreichende Einsatzmöglichkeiten, zum Beispiel bei der Moderation von Foren oder der Auswertung von E-Mail-Schriftverkehr, um nur zwei Beispiele zu nennen.
Der Forschungszweig in der Informationswissenschaft, welcher sich explizit mit dieser Thematik befasst, wird als »Sentiment Analysis« oder »Opinion Mining« bezeichnet. Ziel ist es, geeignete Verfahren zu erforschen und zu entwickeln, die eine effiziente und automatische Analyse von Sentiments im Netz ermöglichen.
Handelt es sich bei der Sentiment-Analyse um eine spezielle Technologie?
Sentiment-Analyse bezeichnet nicht eine gesonderte Technologie, sondern impliziert vielmehr unterschiedliche Modelle und Verfahren aus verschiedenen Bereichen, wie dem Information Retrieval, der Informationslinguistik (Natural Language Processing), des Machine Learning und des Data Mining.
Wie gut kann man Sentiment-Analysen automatisieren?
Hier stellt sich die entscheidende Frage, ob die automatisierte Auswertung von Sentiments Resultate erzielen kann, welche den Anforderungen der unterschiedlichen Nutzergruppen gerecht werden. Häufig hört man von Unternehmen die Forderung, dass mindestens 80% der Sentiments korrekt klassifiziert werden müssen, um den Einsatz rechtzufertigen.
Viele der derzeit verfügbaren Sentiment-Analysis-Anwendungen und -Dienste nutzen aber ausschließlich einfache lexikonbasierte Verfahren, die lediglich nach bestimmten positiv oder negativ gefärbten Schlüsselbegriffen suchen und auf diese Weise versuchen, Dokumente in Bezug auf vorkommende Sentiments zu klassifizieren. Die menschliche Sprache ist jedoch sehr komplex und die Anzahl einfach zu analysierender Sätze wie: »Ich finde Produkt x gut.« oder »Der Service der Firma y ist schlecht.« sind deutlich in der Unterzahl. Aus diesem Grund weisen derart rudimentäre Systeme häufig Fehlerraten von weit über 50% auf und sind meines Erachtens für seriöse Analysen nicht geeignet.
Wie beurteilen Sie die Möglichkeit, mit derartigen Verfahren zukünftig doch noch wertvolle Analyse betreiben zu können?
Die Forschung auf dem Gebiet der Sentiment Analyse konnte gerade in den vergangenen zwei Jahren deutliche Fortschritte machen und es gibt mittlerweile einige weitaus elaboriertere Ansätze bei der automatischen Sentiment-Analyse. Doch ist es durchaus fraglich, ob die geforderte hohe Treffsicherheit mittels algorithmischer und statistischer Verfahren überhaupt erreicht werden kann. Schließlich stellt nicht nur die Größe des Datenvolumens im Web ein Problem dar, sondern auch die Heterogenität der Dokumente in Social Media. Heterogenität bezieht sich dabei nicht nur auf die verschiedenen Strukturen der Dokumente, sondern vor allem auch auf die Inhalte selbst.
In den unterschiedlichen Internet Communities gibt es, neben kulturellen und sprachlichen Differenzen, einen regen Gebrauch von Umgangssprache, Ironie oder Metaphern. Selbst für Menschen ist die Interpretation von Texten nicht immer einfach und es gibt zahlreiche Situationen, in denen bestimmte Sentiments ohne zusätzliche Hintergrundinformationen nicht eindeutig klassifizierbar sind. Auch zukünftig wird man meines Erachtens auf intellektuelle Auswertungen nicht verzichten können.
Über den Autor
David Schönhalz, M.A., studierte Informationswissenschaft, Philosophie und Medienwissenschaft an der Heinrich-Heine-Universität Düsseldorf, wo er anschließend
als Lehrbeauftragter im Fachbereich für Informationswissenschaft tätig war. Zurzeit promoviert er mit einer Arbeit über Information-Retrieval-Verfahren und Suchmaschinentechnologien. Beruflich ist er in den Bereichen Online-Marketing und
Web-Entwicklung tätig und publiziert regelmäßig Artikel zum Themenbereich Suchmaschinen, Information Retrieval und Web 2.0. Kontakt:
Diese E-Mail-Adresse ist gegen Spambots geschützt! JavaScript muss aktiviert werden, damit sie angezeigt werden kann.
Social Media Magazin bestellen:
>> Bezugsquellen


