„This Is The Beginning!“
Jetzt scheint das Thema Big Data endgültig „kommunikabel“ zu sein: Der Titel im SPIEGEL 20/2013 lässt Big Data als gelungene Melange aus CSI, dem Orakel von Delphi und den römischen Auguren vergären. Fazit: Wir Menschen werden vorhersehbar – weil berechenbar. Ergebnis: Verbrechen werden verhindert, Käufern werden die Wünsche aus den Daten ablesen. Na gut – eine Prise Kritik am System, das den Menschen gläsern werden lässt, ist auch enthalten. Meine Meinung dazu: Der Artikel weckt Interesse und Erstaunen – läßt aber Tiefe vermissen und ist sehr beschreibend.
Dann mach’s doch besser!
Die 100.000€-Frage: „Big Data – brauchen wir es auch?“ Stellen Sie die Frage doch jemandem, der sich auskennt. Vielleicht Ihrem Marktforscher, dem BI-Spezialisten, Ihrem Marketing – oder dem Controlling. Die Antworten reichen voraussichtlich über die gesamte Palette: „Ja!“ „Nein!“ „Vielleicht!?“.
OK, fragen sie uns, die Analysten, die Spezialisten. Wir haben den Status der Ratlosigkeit meist schon überwunden und fragen präziser nach. Denn: Aufklärung ist gefragt.
Dem Buzz-Word auf der Spur
Big Data bedeutet eigentlich nur, dass man sehr viele Daten gesammelt hat, dass man sich derer mit Methoden des exzessiven Data-Mining nähert. Oder einfacher:
Man sucht irgendwas im Heuhaufen. Das können Nadeln, Münzen, Werkzeug, ein Nugget oder auch eine Schatzkarte sein. Findet irgend welche Muster. Das ist der erste Schritt.
Im zweiten Schritt verbindet man mathematisch die Muster oder einzelne Dinge aus dem Heuhaufen miteinander, um Zusammenhänge zu finden. Zusammenhänge können sein:
- „Insassen von Gefängnissen haben einen niedrigeren Ruhepuls“.
- „In Orten mit einer hohen Dichte an Storchennestern werden mehr Kinder geboren.“
- „Die Schadenshöhe bei einem Brand nimmt proportional mit der Anzahl an Feuerwehrleuten vor Ort zu“.
Übrigens – alle diese Aussagen sind richtig und statistisch bedeutsam belegt. Zusammenhänge sagen allerdings nichts über Kausalitäten aus – oder bringen doch die Dorfstörche die Kinder? Sollte man lieber keine Feuerwehr rufen, wenn es brennt, um den Schaden zu begrenzen? Oder einfach alle Menschen mit einem niedrigen Ruhepuls wegsperren, weil sie kriminell werden könnten?
Quatsch, das glaubt doch keiner, meinen Sie? Wir kommen später darauf zurück.
Das Spektrum der Big Data Analyse
Auch das ist Big Data: Die FAZ interviewte Markus Morgenroth: „Wir können herausfinden, wer loyal ist“, sagt er. Herr Morgenroth arbeitet bei Cataphora. Diese Firma beobachtet das Verhalten von Mitarbeitern in Unternehmen. Dazu werten sie auch die anonymisierten Mails von Mitarbeitern aus. Echte Big Data Analyse, weil Unmengen an Daten zu durchforsten sind, um irgendwas im Heuhaufen zu finden. Echtes Data Mining. Ein mögliches Ergebnis: Performanceanalysen und Loyalitätsanalysen einzelner Mitarbeiter. Im Interview werden auch die Fallstricke solcher Analysen aufgezeigt. Und deutlich gemacht, wie wichtig das Wissen von Sprachwissenschaftler, Psychologen, Sozialwissenschaftler bei der Interpretation dieser Daten sind. Wirklich lesenswert: http://www.faz.net/aktuell/feuilleton/bilder-und-zeiten/interview-mit-einem-datenanalysten-wir-koennen-herausfinden-wer-loyal-ist-12124514.html
Übrigens: Teile der Arbeit von Cataphora sind Beispiel für eine in Deutschland aus Datenschutzgründen verbotene Anwendung von Big Data Analyse.
Ich lasse meine E-Mails nicht öffentlich rumliegen
Sowieso nicht mit Ihnen? Auch aus Ihren Mails kann ein Profil erstellt werden. OK, an Ihre Mails kommt keiner ran? Nutzen Sie Twitter? Facebook? Xing? LinkedIn? Die Dataminer auch. Was kann da passieren? Nicht nur die Themen, über die sie schreiben, auch Wörter, die Emotionen (Sentiment) ausdrücken und in Sätzen mit Faktenaussagen stehen, können Sie kennzeichnen. Big Data bedeutet in diesem Fall: Mustererkennung und Korrelation.
Das ist dann in Ordnung, wenn der Schutz Ihrer Person gewährleistet ist. Nennt man ja „Datenschutz“. Das ist dann fragwürdig, wenn Sie persönlich als „Target“ aus der Analyse rauspurzeln und aufgestellt werden.
Oh, da habe ich Sie missverstanden
Soso, Analysen von riesigen Datenmengen machen Unternehmen und Behörden schlauer. Muss man denn Big Data haben, um heutzutage richtig entscheiden zu können? Nein. Ja. Es kommt darauf an, was Sie machen wollen.
Quantitative Marktforschung
Anwendung: Ich möchte fundierte Aussagen haben zu den Marktchancen meines Produkts, des Relaunches meines Produkts oder zu Produkteigenschaften. Ich möchte Zielgruppen identifizieren und deren Needs, möchte verstehen, was der Grund für diese Zielgruppen ist, mein Produkt zu kaufen oder nicht zu kaufen. Das gibt mir die Chance, Veränderungen vorzunehmen, die mein Produkt besser vermarkten lassen. Über weitere Informationen, die ich habe oder beschaffe, weiss ich, wie und wo ich die Zielgruppen erreiche (TV, Print, BTL, PoS, PoI, Social Media, Web). Die genauere Auswertung der Storch / Kinderzahl Korrelation zeigt mir, dass ich in ländlichen Gebieten und ähnlichen Stadtbezirken (auch ohne Storchennester) mit einer höheren Kinderzahl rechnen kann und eher Babyartikel anbieten könnte.
Marktforschung mit right-sized-Data ist notwendig, wenn ich auch theoretisch fundierte Aussagen haben möchte, die sich auf ähnliche Szenarien übertragen lassen und zeitlich kurz- bis mittelfristig gültig sind. Mit Mafo wird die Fabrik gläsern, die Wirkzusammenhänge werden sichtbar.
Big Data Analyse – Wat is en Dampfmaschin?
Anwendung: In der Analyse von Big Data geht es mehr um das „Was“ als um das „Weshalb“: Ich möchte adhoc direkt Menschen mit meiner Botschaft erreichen. Mit geringem Streuverlust, möglichst in einer 1:1 Situation und mit der Aussage, welches der Medien dafür wann genutzt werden sollte. Mich interessiert nicht, dass dieses Wissen kurzfristig unnütz werden kann, weil sich Medien und Nutzung durch Menschen schnell verändern können. Mich interessieren keine Gründe, Einstellungen von Menschen, weil ich kein Modell des Verhaltens in Bezug auf meine Produkte oder Produktgruppen brauche, sondern schnell Erfolge. Selbst um den Preis, das die Ergebnisse Artefakte sind, die bei einer Analyse großer Datenmengen schnell entstehen können. Beispiel: Die Zahl der Störche auf den Dächern nehme ich als Indikator dafür, ob ich einen Babyartikel-Markt auf der grünen Wiese neben dem Dorf baue – oder nicht. Die Zahl der Feuerwehrleute am Brandort ist für mich als Versicherung ein Indikator für den Schaden, den ich regulieren muss – oder sogar ein Indikator für Betrug, wenn niemand da war.
Big Data Analysen mit den richtigen Tools analysiert ist nützlich, um Zusammenhänge schnell zu erkennen und handeln zu können. Big Data Analyse ist notwendig, wenn das mit Echtzeitdaten erfolgen soll. Mit Big Data wird der Einzelne gläsern – die Wirkmaschine ist eine schwarze Kiste. Oder mit den Worten von Heinrich Spoerl (Die Feuerzangenbowle): „lso, wat is en Dampfmaschin? Da stelle mehr uns janz dumm. Und da sage mer so: En Dampfmaschin, dat is ene jroße schwarze Raum, der hat hinten un vorn e Loch. Dat eine Loch, dat is de Feuerung. Und dat andere Loch, dat krieje mer später.“
Lehrer Bömmel aus der Feuerzangenbowle – ein Protagonist von Big Data. Da hätte auch DER SPIEGEL d’rauf kommen können. Wenn er aus dem Rheinland käme 🙂
Weitere Informationen: Da gab’s doch hier im Blog was zu?
- Size doesn’t matter, Mr Big.
- „Big Data“, sehr intensiv (Hier geht’s hoch her): Deutschland braucht Eier!
- Wozu. Das. Alles?