
Kann man Big Data einfach erklären?
Ja – das geht!
Dieser Beitrag erklärt Dir an einem konkreten Beispiel, wie Du aus Big Data im Unternehmen Gewinn generieren kannst.
Beginnen wir!
- 1 Was ist Big Data (Analytics)?
- 2 Welche Fragen können wir heute mit Big Data beantworten?
- 3 Warum nutzen Unternehmen Ihre Daten nicht für die Analyse?
- 4 Big Data erklärt am Beispiel – Von Daten zu mehr Geld
- 5 Was sind die Herausforderungen mit Big Data?
- 6 Was sind die kommerziellen Vorteile aus Big Data?
Was ist Big Data (Analytics)?

Big Data nennen sich Datenmengen, die folgende Kriterien erfüllen müssen:
- Volume – Die Größe liegt zwischen Terabyte bis Exabyte an Daten
- Variety – Die Daten sind buntgemischt und nicht einheitlich
- Volocity – Für die Verarbeitung sind schnelle, leistungsstarke Computer notwendig
- Value – Die Menge an Daten müssen einen wirtschaftlichen Wert besitzen
Big Data Analytics befasst sich mit der aktiven Erforschung von den Datenmengen, um aus den gespeicherten 0en und 1en eine verwertbare Erkenntnis zu extrahieren. Basierend auf der Erkenntnis kann eine Handlung angestoßen werden, die dem Unternehmen einen wirtschaftlichen Vorteil bringt.
Die Erkenntnis kann dabei helfen, eine begründete und bessere Entscheidung zu treffen: Soll das Unternehmen mehr in Produkt X oder Y investieren? Sollen mehr Geschmacksrichtungen von Produkt B entwickelt werden?
Welche Fragen können wir heute mit Big Data beantworten?
Data Scientist können durch die Abfrage und Analyse von großen Datenmengen ein „neues Kaliber“ an Fragen beantworten, die Jahre zu vor als „kaum beantwortbar“ galten:
Steffen Lippke
- Welche Produkte kauft der Kunden im nächsten Monat bei uns ein? Hierbei geht es nicht nur um saisonelle Produkte, sondern vielleicht Produkte die mit Großereignissen wie Olympia gepuscht werden (z.B. Schwimmbrillen, Laufschuhe, …)
- Wie ändert sich der Absatz von Smartphone X, wenn Wireless Charging als Feature hinzukommt? Einige Killerfeatures führen dazu, dass der Absatz von einer Modellreihe explodiert, weil nicht jeder das beste Smartphone mit allen besten Optionen braucht. Diese Erkenntnis senkt die Kosten und die Kunden sparen Geld.
- Wann ist der optimale Zeitpunkt für den Werbespot im Fernsehen, sodass der größte Teil unserer Zielgruppe den Spot sehen wird? Kameras und Mikrofone vermessen unsere heutigen Wohnzimmer, um passende Online-Werbespots anzuzeigen.
- Sind mit dem Klimawandel (Sensordaten) unsere Kosten für Heizung in allen Bürogebäude des Konzerns (Transaktionsdaten) gesunken? Absurde Frage – aber diese ist jetzt möglich zu beantworten.
Der Computer antwortet – bevor Du die Frage dazu kanntest!
Big Data ermöglicht noch weiteres:
Die Algorithmen beantworten uns Fragen, an die wir noch nicht gedacht haben. Mit Statistik und etwas Mathematik können die Server-Farmen

- Kundengruppen nach Verhalten gruppieren (Cluster)
- Zukunftsprodukte voll-automatisch designen (Personas)
- Mit einer hohen Genauigkeit die Absatzmengen vorhersagen (Neuronale Netze)
Der Data Scientist weist den Server an: „Zeige mir, was mich interessieren könnte!“
Steffen Lippke
- Produkt Y und R zusammengekauft (in 10 % aller Warenkörbe befinden sich Bier und Windeln)
- Die meisten Kunden nutzen die Infrarotkamera am Handy nicht – diese kostet aber in der Produktion das Dreifache, wie eine normale Linse.
- Im Raum Köln haben ungewöhnlich viele Deine Webseite aufgerufen
Warum nutzen Unternehmen Ihre Daten nicht für die Analyse?
Viele Unternehmen haben Tausende oder Millionen von Datenquellen, bei denen nutzbare Daten anfallen:
- Sensoren (Temperatur, Gewicht, Lichtschranken)
- Intranet-Seiten (Steckbriefe, Beschreibungen)
- Forschungsdokumente
- Klassische Office Dokumente (Word, Excel, PowerPoint usw.)
- Transaktionsdaten (Überweisungen, Konten)
- Kundendaten (Adressen, Einkäufe, Historien, Suchverläufe)
- Personaldaten (Gehalt, Name)
Die meisten Unternehmen sammeln ihre Daten fleißig, weil sie zum Teil von Gesetz her dies tun müssen und zum Teil, weil sie „irgendwann irgendetwas“ mit den Daten machen wollen.

Die meisten Unternehmen lassen ihre Daten auf den Festplatten verschimmeln.
Diese 4 Schritte sind notwendig, um Big-Data-Analysen durchzuführen (ETL-Prozess):
- Extrahieren – Mögliche Datenquellen erkennen und anzapfen.
- Transformation (Bereinigung und Vereinheitlichung) – voll-automatisch oder manuell in mühevoller Arbeit + Umwandlung in ein einheitlich lesbares Format
- Laden – Zentrierung aller Datenquellen in einen großen Datenspeicher (Data Warehouse)
Wenn die Zeit-intensive „Drecksarbeit“ getan ist, kann der Data Scientist beginnen zu arbeiten.
Big Data erklärt am Beispiel – Von Daten zu mehr Geld
Wenn die Datensätze bereinigt und vorbereitet sind, können die Algorithmen verwertbare Informationen aus den Daten extrahieren, die die Businessanalysten in Erkenntnisse, Handlungen und zum Schluss in einen wirtschaftlichen Wert umwandeln.
Um die Theorie etwas anschaulicher darzustellen, schaue Dir das folgende Beispiel an:

- Big Data: Du erhältst eine große Datei mit Server-Logs und Zugriffszeiten auf die Webseite von den letzten 6 Monaten. Du lädst die Daten in die Big Data Analyse Software Splunk.
- Information: Nachdem Du die Daten bereinigt hast, und Du die Zugriffszeit betrachtest, fällt Dir auf, dass „50 % der Kunden die Webseite A, Z und Y innerhalb von 10s wieder verlassen“.
- Frage: Du überlegst und denkst „Ist ein Softwareproblem an dem schnellen Verlassen schuld?“.
- Grund: Du durchsuchst die Logs mit der neuen Information im Hinterkopf erneut und Dir fällt auf, dass „50 % der Kunden nutzen einen macOS mit Safari“ – Bingo! Oder nicht?
- Überprüfung der These: Damit Du sicher gehen kannst, dass Du nicht auf einen unrichtigen Grund gestoßen bist, berechnest Du die Schnittmenge der Gruppen –> 91 % der Kunden mit Safari verlassen die Seite innerhalb 10s wieder – Bingo! Bingo!
- Erkenntnis: Du denkst Dir: „Die Webseite ist nicht für Safari optimiert!“.
- Handlung: Prompt gibst Du die Safari-Optimierung an die PR-Abteilung als To-do weiter.
- Ausführung: Nach einer Woche sind die Safari-Optimierung online.
- (1 Monat warten)
- Wirtschaftlicher Wert: Die Zugriffszeiten sind im letzten Monat gestiegen und Dein Unternehmen verzeichnet 81 % mehr Verkäufe pro Tag, weil die doppelte Anzahl an Nutzern unsere Webseite unbeschwert nutzen kann. Barrierefreiheit ist bei Webseiten wichtig.

Du konntest über einen Big Data Ansatz einen kommerziellen Mehrwert schaffen!
Was sind die Herausforderungen mit Big Data?
Die große Herausforderung bei Big Data ist die „Drecksarbeit“ und die Limitierung durch die Hardware.
Die Datenbereinigung kann Monate bis Jahre dauern, um die Datenqualität auf einen Stand zu heben, der ausreicht, um eine gute Analysen durchzuführen.
Die Analysten messen die Datenqualität, indem die Analysten eine Stichprobe untersuchen…
- … , ob Dubletten vorkommen
- … , ob gleiche Werte unterschiedlich kodiert sind
- … , ob starke Ausreißer Tippfehler sind
- … , ob die Inhalte stimmig sind
- … , ob die gleichen Speicherformate und die gleichen Variablen Benennungen eingehalten wurden
Wenn die Sachbearbeiter oder Studenten die Daten aufgearbeitet haben, können die Analysen anlaufen. Die meisten Unternehmen haben kein riesiges Rechencluster zur Verfügung und manche Analysen dauern Wochen. Die Cloud kann kurzfristige Leistungsspitzen abfangen.
Was sind die kommerziellen Vorteile aus Big Data?
Nur wenn die Daten bereinigt sind und die Analysen neue Erkenntnisse generiert haben, sieht das Unternehmen, ob sich der Aufwand gelohnt hat.
Weil die Daten unübersichtlich sind, kann keiner den Erfolg abschätzen…
- Die Analyse schlägt fehl wegen noch zu schlechter Datenqualität.
- Die Analyse ist erfolgreich und bringt Erkenntnisse, die vorher schon bekannt waren.
- Die Analyse ist vom Ansatz fehlerhaft und bringt die falschen Erkenntnisse und Handlungen, die wiederum zu finanziellen Verlust führt.
Das Unternehmen kann seine Erkenntnisse und Datensätze an andere Unternehmen verkaufen. Das Marketing interessiert sich wie folgt für Personen-Infos:
Max Mustermann, 30-40 Jahre, Nettomonatseinkommen zwischen 3.000 und 4.000 €, verheiratet, 1 Kind, Hobby Motorrad, Klavier
Beispiel
Gehört der Interessensgruppe:
- /Vehicles & Transportation/Auto Enthusiasts
- /Sports & Fitness/Sports Fans/Baseball Fans
- /Media & Entertainment/Music Lovers/Pop Music Fans

Gehört den kaufbereiten Gruppen:
- /Autos & Vehicles/Motor Vehicles/Motor Vehicles by Type/Diesel Vehicles
- /Travel/Trips by Destination/Trips to North America/Trips to Canada
- /Software/Business & Productivity Software
… nach Google Ads / Analytics: https://support.google.com/google-ads/answer/2497941?hl=de
Google unterscheidet in über 140 Interessengruppen und 780 kaufbereite Gruppen. Die feinteilige Gliederung ermöglicht eine perfekt zu geschnittene Marketing-Kampagnen und Werbematerialien
Steffen Lippke
Die Gesellschaft für Konsumforschung (GfK) in Deutschland arbeitet an ähnlichen Konzepten wie Google. Die GfK-Analysen können mit hoher Wahrscheinlichkeit vorhersagen, welches Smartphone Du für welchen Preis und mit welchen Featuren in 2 Jahren kaufen wirst.










Schreibe einen Kommentar