Kategorien
Allgemein Analyse Besser Wissen! Big Data DataKrimi

Cambridge Analytica. Oder wie man neue Werbemöglichkeiten erfindet.

7.12.2016      Welche Chancen haben Unternehmen, die das Verhalten von Menschen über die Schaltung von Werbung im Web (Adds)  – oder das „Injizieren“ von Kommentaren und Posts – mit ausreichender Wucht zu beeinflussen versuchen?

Als Data Scientist, Autor und Unternehmer interessiert mich dieses Thema aus professioneller Sicht. Und endlich gibt es einen Use Case dazu: Titel „Cambridge Analytica, Trump, Brexit und noch ganz viel mehr!“.

Hier die wichtigsten Ergebnisse.

In „Das Magazin“ erscheint am 3.12.2016 der folgende Artikel über Michal Kosinski, einen Data Scientist, der herausragende Grundlagenforschung betrieben hat.  https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/

Michal  Konsinski hat an der Cambridge University ein Verfahren entwickelt, wie man aus auch kurzen schriftlichen oder symbolischen Äusserungen von Personen auf die Persönlichkeit dieser Person schliessen kann. Diese Texte können unterschiedliche Quellen haben – und auch aus  dem Web (Bsp. Texte oder „Likes“ bei Facebook) bezogen werden. Das klingt wundersam und genial – und ist wie üblich mit einer sehr guten Idee, Fleiss und Forscherdrang umzusetzen.

Es empfiehlt sich, das Ergebnis der Forschungsarbeit im Web zu besuchen. Auf der Website https://applymagicsauce.com/demo.html kann man sich mit eigenen Texten versuchen. Zwischenergebnis nach meinen Recherchen: Das was die Cambridge UNIVERSITY (nicht die Firma!!) macht, ist wirklich fundiert und sehr interessant.

Forschen Sie selbst. Vielleicht mit mit eigenen Texten. Sie werden sehen – ein paar Zeilen eigenen Textes – und sie können „psychografiert“ werden. Vielleicht entdecken Sie auch den „Schwager Effekt“, von Statistikern „n=1“ Effekt genannt: Schwager Effekt:  Zu jeder Statistik findet man einen Schwager, auf den diese Statistik nicht zutrifft. Das „n=1“ bedeutet – der Schwager ist nur eine einzelne Person, und damit kein Beweis „gegen“ die Statistik, die wurde (hoffentlich) an einer repräsentativen Stichprobe erhoben.

Das bedeutet: Die Ergebnisse der Tests werden nicht  immer 100% zutreffend für Sie sein. Sie sind auch nur „n=1“ – also eine einzelne Person. Beim weiteren Erforschen der Seite bekommen Sie aber  Informationen, wie es zu diesem Instrument kam und wie exakt dieses messen kann. Beim Klicken der an den Indikatoren positionierten „?“  wird u.a. erklärt:  „The predictive model was built using a sample of 260,000 participants’ scores on the 100-item long International Personality Item Pool Questionnaire (IPIP), arguably the most popular personality assessment in use today“. Prediction Accuracy (Area Under the Curve) : Between .35 and .50″ (Anmerkung: perfekt wäre eine Güte von 1 = 100%ig richtige Vorhersage, ganz mies 0 = 0%).

Wie hat Herr Kosinski (und seine Kolleg*innen) das also gemacht? In einer Studie mit 260.000 Menschen werden Zusammenhangsmaße zwischen den Ergebnissen von psychologischen / psychiatrischen Tests (Big 5) und „anderen“ Variablen ermittelt. Ziel ist es,  die Fragen des wissenschaftlichen Tests „Big 5“ gar nicht mehr stellen zu müssen, sondern sogenannte „Proxies“ (Stellvertreter) zu finden, die hoch korrelieren. Statt 100 Fragen beantworten zu lassen,  braucht man nur noch diese Proxies (Bilder, Formulierungen, Likes) als Indikator. Dieses Verfahren wird auch bei der Entwicklung von Persönlichkeitstest genutzt, um handhabbare (z.B. kurze),  valide (genaue) und reliable (verlässliche) Messverfahren zu entwickeln.

Die Bildung von Proxies kann mit dem Verlust der Güte eines Test einhergehen – die Vorhersagegenauigkeit leidet. Aber: Wenn ich statt der 100 Fragen der Persönlichkeitstest nur die Anzahl der Likes auswerten muss, um z.B. Neurotizismus zu erkennen, geht’s schneller, man muss nicht Fragebogen ausfüllen lassen, es ist preiswerter. Aber halt nicht so genau.

Herr Kosinski zeigt auf, dass dies auch mit öffentlich zugänglichen Proxies geht: Diese Art der Äusserungen findet man man bei Facebook in jedem Profil. Nun, eine Vorhersagegenauigkeit von .35 bis .50  ist nicht sonderlich hoch, im wissenschaftlichen Sinne. Aber schon nutzbar, wenn man ansonsten nichts weiss über ein Gegenüber oder eine Person hinter einem Facebook Profil. Und, wenn man nichts weiss, aufgrund von Selbstauskünften wie Wohnort und Beziehungsstatus mit der Giesskanne Werbung ausschütten müsste.

Es wird so gut nutzbar sein, dass tatsächlich die ein oder andere Person gefunden wird, die von ihrer Persönlichkeitsstruktur für definierte politische Botschaften oder Produktwerbung aufgeschlossener ist.

Zwischenbemerkung – die sogenannten „Big 5“ zu nehmen, ist der richtige Ansatz: Alle anderen Persönlichkeits-Tests sind eher auf dem Mess-Niveau von Horoskopen. Siehe: https://databerata.de/anleitung-zum-wahrsagen/.

Die Firma Cambridge Analytica (CA) nutzt dieses Vorgehen kommerziell und posaunt: Wir haben nicht nur Trump gekrönt, sondern bereits dem „Brexit“ den Weg  bereitet.

Wie genau soll das gehen?

  1. Cambridge Analytica ermittelt „auf Vorrat“ Persönlichkeitsprofile aus Facebook Profilen
  2. CA bekommt den Auftrag, potentielle Trump-Wähler zu finden und zu beeinflussen
  3. Eine Analyse der Zielgruppe „potentielle Wähler von Trump“ hätte ergeben, dass diese eher zu einer selbstunsicheren Persönlichkeitsstörung  neigen („… ist gekennzeichnet durch Gefühle von Anspannung und Besorgtheit, Unsicherheit und Minderwertigkeit. Es besteht eine andauernde Sehnsucht nach Zuneigung und Akzeptiertwerden, eine Überempfindlichkeit gegenüber Zurückweisung und Kritik mit eingeschränkter Beziehungsfähigkeit. Die betreffende Person neigt zur Überbetonung potentieller Gefahren oder Risiken alltäglicher Situationen bis zur Vermeidung bestimmter Aktivitäten.
    Quelle Wikipedia, https://de.wikipedia.org/wiki/Selbstunsicher-vermeidende_Persönlichkeitsstörung vom 17.1.2017 11:05)
    .
  4. Cambridge Analytica  selektiert aus den gespeicherten Persönlichkeitsprofilen die zutreffenden Zielprofile (a la Kosinski)
  5. und postet auf deren Timeline in Facebook entsprechende Meldungen
  6. … und kann tatsächlich, nicht perfekt, aber ganz gut, Meinungen beeinflussen.

Beim genaueren Hinsehen entsprechen diese Schritte auch einem „traditionellen“, durch  Tracking und Tracing generierten Profiling von Zielpersonen im Web. „Personalisierte Werbung“ heisst der Fachbegriff.   Nur ist dieses Profiling meistens nicht so gut ….

Mit den Veröffentlichungen von und über Cambridge Analytica entstand eine Welle von Kommentaren, die wie einander zitierend sich zumindest an einem Wortspiel probierten: „Big Data – Big Schwindel“ wurde z.B.  am 6.12.16 die Meldungen in der WELT getitelt. Wobei diese nicht-Fach-Artikel mit wenig statistischer und analytischer Fachkenntnis aufwarten konnten.

Hat nun CA Trump auf den Thron geholfen? Dem Brexit zur Mehrheit verholfen? Ob das Schwindel war – das könnten exakte Analysen und Befragungen beantworten. Auf jeden Fall ist Cambridge Analytica ist ein echter PR Coup gelungen. Sehr lautstark krönen sie sich zu den Königsmachern. Und es stimmt: Ihre Werkzeuge greifen auf der Basis Psychografie besser, als es anderen Verfahren des Tracking und Tracing tun (die üblicherweise auf Grund einer Surf-Historie  einer Person ein „Profil“ zuweisen, um dann individuelle Werbung zu schalten).

Meine Meinung ist: Das Ziel von CA dürfte nicht der nächste Auftrag von der AfD oder Herrn Wilders sein, sondern Fuß zu fassen in der lukrativen Welt des Tracking und Tracing: Ein echter Clou! Kategorisiere psychografisch ein Facebookprofil auf Basis der Likes und Statements, spiele „passgenaue“ Werbung (Adds) hinzu, und revolutioniere den Markt der Online Werbung. Damit wäre CA ein idealer „Partner“ für Facebook, Google & Co..

TL; DR

Cambridge ANALYTICA nutzt eine fundierte wissenschaftliche Entwicklung der Cambridge University, um Personen zu „psychografieren“. Diese „Psychografien“ können genutzt werden, um leicht beeinflussbare Menschen zu finden um diese zu „informieren“.

Nutzbar ist dies sowohl für Politiker – aber eher noch für Werbetreibende. Das Big Business mit Big Data könnte erklären, warum Cambridge ANALYTICA so laut mögliche Erfolge rausposaunt.

______________

Stand der Informationen: 17-01-17

Schreibe einen Kommentar