Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam

In seiner Funktionalität auf die Lehre in gestalterischen Studiengängen zugeschnitten... Schnittstelle für die moderne Lehre

Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam mehr erfahren

Visualisierung von ortsbezogenen  Emotionen auf der Basis von Tweets

Visualisierung von ortsbezogenen Emotionen auf der Basis von Tweets

Motivation

Wir untersuchen in zwei Gruppen den emotionalen Gehalt von Tweets um geografisch die Stimmung der Nutzer verorten zu können. Dies geschah anhand einea konkreten tagesaktuellen, politischen Ereignisses, da hier sachliche Fragestellungen unterschiedliche Emotionen mit teilweise hohem Erregungsgrad auslösen.

Beispiel: Das Referendum von Schottland

Als konkretes Beispiel für unsere Analyse wählten wir das Referendum über die schottische Unabhängigkeit aus. Am 18. September dürfen die Bürger dort über die weitere Zugehörigkeit zum Vereinigten Königreich entscheiden. Dieses politische Ereignis erschien für unsere Analyse günstig, da es folgende günstige Merkmale aufwies: 1. Politische Aktualität: Das Referendum ist ein politisches Ereignis, dass immer wieder in den britischen Medien Erwähnung findet. Es ist nicht nur für einen gewissen Zeitpunkt, sondern für eine ganze Periode aktuell. Das macht es leichter eventuelle Schwankungen bei den Stimmungen und den einzelnen Fraktionen zu erkennen und sie eventuell auf akute Ereignisse zurück zu führen, wie z. B. Zeitungsmeldungen.

2. Englische Sprache: Die englische Sprache macht die Auswertung für das Online-Tool einfacher, da hier die Sprachtechnologie ausschließlich auf Englisch ausgelegt ist.

3. Polarisierung der Meinungen: Bei diesem Referendum gibt es zwei klare Fraktionen: eine die für die Unabhängigkeit Schottlands ist und ein Fraktion, die dagegen ist. Der Anteil der Gegner und der Befürworter des Referendums schwankt dabei.

Diese politische Debatte wird außerdem hochemotional geführt und eignet sich deshalb sehr für unsere Darstellung von visualisierten Emotionen.

Gruppenunterteilung

Für die unterschiedlichen Methodik zur Erhebung der Daten teilten wir uns in zwei Gruppen auf. Eine Gruppe versuchte Daten mithilfe eines digitalen Tools online zu untersuchen. Die andere erhob Daten manuell und wertete sie aus. Hiermit sollte der Unterschied in der Quantität und Qualität bei der Erhebung der Daten stichpunktartig festgestellt werden.

1. Gruppe: Digital

Das Ziel war es ein digitales Tool zu entwickeln, das ortsbezogene Emotionen aus sozialen Netzwerken visualisiert. Als Datenbasis verwendeten wir geolokalisierte Tweets, die wir über die Twitter API auslesen.

Die Tweets wurden mit Hilfe einer externen Datenbank durch eine Sentiment Analyse auf ihre Emotionalität hin untersucht und so in negative und positive Tweets kategorisiert. Anschließend wurden sie auf einer Karte ortsgebunden visualisiert. Es sollte möglich sein, die Visualisierung nach bestimmten Hashtags (und eventuell anderen Kriterien) zu filtern.

2. Gruppe: Manuell

Bezogen auf ein konkretes Ereignis werteten wir Tweets mit dem Hashtag „#indyref“ händisch aus, um dann am Ende zu vergleichen, inwiefern unsere Auswertungen voneinander abweichen und wie sinnvoll eine automatisierte Emotionsanalyse wie durch das Kartentool ist, da sich über das Tool z. B. nur die zwei Dimensionen positiv und negativ ablesen lassen.

Als zu untersuchendes Fallbeispiel haben wir das Referendum zur Unabhängigkeit in Schottland gewählt (hohe Kontroversen, englischsprachig für größere Datenmengen).

Referenzen

Bildschirmfoto 2014-07-02 um 17.10.55.pngBildschirmfoto 2014-07-02 um 17.10.55.png

[We Feel](http://wefeel.csiro.au/#/ „We Feel“) We feel analysiert verschiedene Zeitzonen auf ihre aktuelle Stimmung und stellt diese auf prozentual in einem Kuchendiagramm und in einem Zeitstrahl dar.

Bildschirmfoto 2014-07-02 um 17.41.55.pngBildschirmfoto 2014-07-02 um 17.41.55.png

[The Geography of Hapiness](http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0064417 „The Geography of Hapiness“) Sentimentanalyse anhand von Tweets in Nordamerika, Blau = traurig, Rot = fröhlich.

_0009_Twitter Tokyo.jpg_0009_Twitter Tokyo.jpg
_0003_Locals and Tourists Berlin.jpg_0003_Locals and Tourists Berlin.jpg
_0000_Locals and Tourists London.jpg_0000_Locals and Tourists London.jpg
_0010_Twitter euro.jpg_0010_Twitter euro.jpg

Visuelle Inspirationen links: Race and Ethnicity von Erik Fischer rechts: All geotagged Tweets von Twitter

Prozess

S3.jpgS3.jpg

Digital

In unseren ersten Screen-Designs planten wir die Begriffssuche auf einer Karte von der Makro Ansicht (für ein allgemeines Stimmungsbild eines Landes beispielsweise) bis zum Zoom in die Straßenansicht, um einzelne Tweets bis zum Entsender zurück verfolgen zu können und somit persönlicher zu gestalten.

S1.jpgS1.jpg
S2.jpgS2.jpg
s4.jpgs4.jpg

Testscreens v.l.n.r.: mögliche Visualisierung einzelner Zoomstufen, für die farbliche Codierung dient die Übersicht (Rot = Negativ, Blau = Positiv), als Wertungsdimensionen gelten „Valenz“ und „emotionaler Gehalt“.

140703_GBR-XX-782386-2_web.jpg140703_GBR-XX-782386-2_web.jpg

Manuelle Gruppe:Karte mit Verortung der Tweets. Der emotionale Gehalt der Tweets wurde dabei farbig dargestellt.

Manuell

Bei der Suche benutzten wir die Seite „geochirp.com“, bei der nach bestimmten Hashtags in einer ausgewählten Region gesucht werden kann. Diese Tweets wurden händisch auf Emotion und Zustimmung ausgewertet und in einer Karte verortet.

balkendiagramme.jpgbalkendiagramme.jpg

Auswertungen v.l.n.r..: Auswertung nach Zustimmung und Ablehnung des Referendums nach Datum; Veränderung des emotionalen Gehalts der Tweets nach Datum

Zwischenstand

stand.pngstand.png

Digital

Aktuell läuft eine interaktive Karte auf einem Server mit über 100.000 gesammelten Tweets. Die Tweets sind einzeln anwählbar und zeigen den Score (–10 bis +10, negativ bis positiv) und die Lokation. Die Farben ergeben sich aus der angelegten Farbskala. Das Problem: Positionen sind nicht exakt geotagged und überlagern sich.

Lösungsidee: Städte nach Stimmungen clustern und eine zweite Ansicht für die Detailbetrachtung entwickeln.

chronologisches-diagramm.jpgchronologisches-diagramm.jpg

Manuell

Zur Auswertung und Verortung standen 112 Tweets aus dem Zeitraum vom 11. bis zum 20. Juni 2014 aus den verschiedensten Regionen Großbritanniens zur Verfügung. Es entstand daraus ein Plakat (siehe oben), bei dem die Stimmungen der Tweets den einzelnen Ortschaften zugeordnet konnten. Auch der Verlauf und die Veränderung der Stimmungen im Laufe des Erhebungszeitraums wurde visualisiert.

Ausblick

Scribble.jpgScribble.jpg

Digital

Bei der neuen Planung gibt es eine Kartenübersicht bei der man einen Suchbegriff eingeben kann, woraufhin die Städte nach Stimmung geclustert werden.

Wählt man nun einen Cluster aus wandelt dieser sich in eine zweite Ansicht, bei sich alle vorhanden Tweets in einer Art Koordinatensystem verteilen werden mit den Achsen Stimmung (positiv–negativ) und Intensität (stark–schwach). Die finale Visualisierung steht nocht aus.

Manuell

Vergleicht man unsere Stichprobe mit Ergebnissen vom britischen Umfrage­institut ICM, ergeben sich hier interessante Unterschiede (s. Grafik unten). Der Anteil der Befürworter des Referendums, war relational gesehen bei den Tweets sehr viel höher als bei der Umfrage des ICM. Eine größere Erhebung von Tweets könnte hier auf­schlußreichere Ergebnisse liefern.

balken-diagramme2.jpgbalken-diagramme2.jpg

Frage: In the referendum on independence for Scotland on 18th September 2014 voters will be asked, „Should Scotland be an independent country“. Do you think you will vote Yes or No?

Quelle: Scotland Independence Reference Poll von ICM Research; 16.06.2014 für die Zeitung „The Scotsman/ Scotland on Sunday“ URL: http://www.icmresearch.com/data/media/pdf/ScotPoll_Jun2014_Post-Vote-Weig.pdf

Vergleich der manuellen und digitalen Erhebung

Bei der Erhebung der Daten stellte sich heraus, dass die digitale Erhebung vor allem in der Quantität der manuellen Erhebung vorzuziehen ist. Während in mühsamer Kleinarbeit nur 113 Datensätze manuell erfasst wurden, konnte das digitale Tool ca. 100 000 Daten erfassen . Allerdings ist die manuelle Methode insbesondere bei der qualitativen Erhebung genauer. Der Mensch kann bei einzelnen Tweets auch Redewendungen, Zynismus oder Sprichwörter erkennen, die von einer Maschine missverstanden werden können. Ein Beispiel hierfür ist der Tweet_ „ So according to George Galloway, you’re not a good catholic if you aren’t influenced by the Popes view on #indyref“_. [Wenn es nach George Galloway [brit. Politiker] geht, dann ist man kein guter Katholik , wenn man nicht von der Sicht des Papstes auf #indyref beeinflusst wird.] Während das Tool hier z. B. aufgrund des Wort „good“ einen Tweet mit eher positiver Stimmung erkennt, erscheint der Tweet für einen Menschen eher zynisch und sarkastisch. Eventuell kann hier eine verbesserte Programmierung bei der Spracherkennung oder eine Erweiterung der Wortdatenbank die Qualität der Auswertung beim Online-Tool verbessern.

Fachgruppe

Sonstiges

Art des Projekts

Studienarbeit im zweiten Studienabschnitt

Betreuung

foto: Prof. Dr. Marian Dörk foto: Prof. Dr. Tobias Schröder

Entstehungszeitraum

Sommersemester 2014