Was kommt nach Big Data? Nein, nein, Sie haben nichts verpasst, Big Data boomt noch eine Weile, wird den Kennern und Könnern wertvolle Informationen liefern – aber einer Menge in dieses Buzzword Verknallte enttäuscht mit einem welken Riesenrosenstrauß zurücklassen.
Ohne Zweifel sind geeignete Modelle in der Lage, große Datenmengen auf Zusammenhänge zu untersuchen. Was man dazu braucht, gibt es schon länger im Repertoire derjenigen, die Empirie und Statistik beherrschen. Das sind Physiker, Biologen, Chemiker, Astronomen, Ingenieure, Statistiker, Marktforscher, Sozialwissenschaftler, …
Was jeder Wissenschaftler lernt, ist, nicht einfach zu suchen, sondern Hypothesen zu testen. Eine Hypothese ist eine Regel, eine Idee eines Zusammenhangs, eine Kausalität. Mit Hilfe der Statistik können diese Hypothesen auf der „Testbank“ überprüft werden.
Los geht’s – wir spielen das Thema durch
Eine Supermarktkette möchte das Sortiment neu in den Regalen präsentieren. Statt Produkt zu ähnlichem Produkt (Wasser zu Wasser, Wein zu Wein) sollen Events, Lebensereignisse, Situationen als „Klebstoff“ zwischen Produkten erkannt werden. Ein Test soll im Sommer stattfinden, Situationen sind: z.B. „Strand / Baggersee / Schwimmbad“. Wie finden wir das raus?
Teilnehmende Beobachtung: Mit Papier und Bleistift mischen wir uns unter die Leute, führen Strichlisten und ergänzen diese um das, was die Menschen am Baggersee, am Strand und im Schwimmbad dabei haben. Oder besser, was sie offen dabei haben. Die Hygieneartikel werden nur selten offen rumliegen. Das ist der Nachteil dieses Verfahrens – man guckt den Beobachteten weder in den Kopf noch in die Tasche. Ein weiterer Nachteil: Wir wissen nicht genau, wie repräsentativ so eine Location ist. Ausser wir wählen Locations nach Stichprobe aus (siehe auch diesen Blogbeitrag zu Stichproben).
Befragung: Persönlich-mündlich (vielleicht noch am Strand), per schriftlichem Fragebogen, per Befragung im Web oder per Telephon können wir Menschen danach fragen, was sie alles so an den Strand, ins Schwimmbad, an den Baggersee mit nehmen. Und weil wir Hintergrundinformationen erfragen (Alter, Geschlecht, Wohnort, Häufigkeit Besuch Schwimmbad, Strand, Baggersee, „habituelle“ (gewohnheitsmäßige) Einkaufsstätten für die Produkte), weiss die Supermarktkette bald mehr.
Bonanalyse: Der Kassenbon ist inzwischen weit mehr als eine Rechnung und Quittung. Über die Auswertung der Kassenbons werden Lagerbestände erfasst, es wird nachbestellt, Schnelldreher und Regalschläfer werden ermittelt. Und es geht noch mehr: Jeder Kassenbon enthält die Informationen zu einer Geschichte des Einkaufenden. Gucken Sie mal in den Wagen vor sich, hinter sich, neben sich, wenn Sie wieder mal in der längsten Schlange warten (oder stellen Sie sich nie an der längsten Schlange an?). Fröhliche und traurige Geschichten, Partys und lange Familienwochenenden offenbaren sich. Am traurigsten finde ich die Geschichten, deren Einkaufswagen eine Flasche Korn, Zigaretten, Fleischsalat und ein Bund Möhren zum kaschieren enthalten.
Jetzt kommt Big Data ins Spiel (nicht nur bei dem traurigen Beispiel, sondern bei der Analyse der Kassenbons): Mittels statistischer Methoden (z.B. Clusteranalysen, Faktoranalysen) können aus allen Bons mit den Tausenden von Produkten und den Millionen von Käufern „Haufen“ gebildet werden. In jedem Haufen sind einige wenige bis viele Produkte. Manche Produkte können in mehreren Haufen – zumindest virtuell – liegen.
Was tun damit? Nun ja – wir suchen uns sogenannte „Markierprodukte“. Markierprodukte stehen als Indikatoren für eine bestimmte Situation. Die können wir aus einer teilnehmenden Beobachtung (s.o.) gewonnen haben. Das könnten Sonnenmilch oder eine Sonnenbrille oder ein Einmalgrill sein. Dann schauen wir uns an, was sonst in diesen Produkthaufen mit dem Markierprodukt steckt. Und ob das reicht, eine Situation zu erkennen und zu beschreiben.
Haben wir dann alles, um die Ausstattung für Strand, Baggersee oder Schwimmbad dem Kunden im Supermarkt an einem Platz, in einem Regal zu präsentieren? Nein. Was fehlt?
Naja, zum Beispiel die Information, welches Wetter zum Zeitpunkt und am Ort des Einkaufs für die nächste Zeit prognostiziert wurde.
Wie repräsentativ dieser Tag für alle relevanten Tage ist. Aber auch, ob Menschen zum schönen Wetter hinfahren – raus aus dem Regen.
Oder eine Hypothese, was Menschen alles einkaufen, wenn ein kühles verregnetes Sommerwochenende ohne Baggersee voraus ist.
Um dann dafür die geeigneten Produkte zusammen zu packen und zu präsentieren.
Aber dazu haben wir bestimmt eine Befragung gemacht, die uns die Hypothesen liefert, nicht wahr?
Fazit
Wenn Ihnen demnächst im Supermarkt eine Aktionsfläche auffällt, die ständig gerade für Ihre Situation im Moment passende Produkte anbietet, freuen Sie sich. Hier nutzt jemand wirklich das Orchester der Analysemöglichkeiten. Und zählt nicht nur die Instrumente.
Was kommt nach Big Data? Nichts, wenn sich Big Data nicht einem Konzept, einer Strategie, Hypothesen und einem echten Interesse am Forschungsgegenstand unterordnet. Eine Menge Einsichten und Erkenntnisse, wenn man damit sauber arbeitet.
Prognose: Nach der Enttäuschung mit Big Data kommt das saubere Arbeiten mit repräsentativen Stichproben, Hypothesen, Modellen. Big Data ist nicht wie das Suchen im Heuhaufen. Denn da weiss man, dass man eine Stecknadel sucht.