Big Data einfach erklärt – Beispiel aus der Praxis [2024]

Big Data einfach erklärt- Steffen Lippke

Kann man Big Data einfach erklärt erläutern?

Ja – das geht!

Dieser Beitrag erklärt Dir an einem konkreten Beispiel, wie Du aus der Big Data im Unternehmen Gewinn generieren kannst.

Beginnen wir!

Was ist Big Data (Analytics)?

04 Zusammenhänge erkennen - Big Data einfach erklärt Steffen Lippke Coding Lab
04 Zusammenhänge erkennen

Big Data nennen sich Datenmengen, die folgende Kriterien erfüllen müssen:

  • Volume – Die Größe liegt zwischen Terabyte bis Exabyte an Daten
  • Variety – Die Daten sind buntgemischt und nicht einheitlich
  • Volocity – Für die Verarbeitung sind schnelle, leistungsstarke Computer notwendig
  • Value – Die Menge an Daten müssen einen wirtschaftlichen Wert besitzen

Big Data Analytics befasst sich mit der aktiven Erforschung von den Datenmengen, um aus den gespeicherten 0en und 1en eine verwertbare Erkenntnis zu extrahieren. Basierend auf der Erkenntnis kann eine Handlung angestoßen werden, die dem Unternehmen einen wirtschaftlichen Vorteil bringt.

Welche Fragen können wir heute mit Big Data beantworten?

Data Scientist können durch die Abfrage und Analyse von großen Datenmengen ein „neues Kaliber“ an Fragen beantworten, die Jahre zu vor als „kaum beantwort-bar“ galten:

Steffen Lippke
  • Welche Produkte kauft der Kunde „Max Mustermann“ im nächsten Monat bei uns ein?
  • Wie ändert sich der Absatz von Smartphone X, wenn Wireless Charging als Feature hinzukommt?
  • Wann ist der optimale Zeitpunkt für den Werbespot im Fernsehen, sodass der größte Teil unserer Zielgruppe den Spot sehen wird?
  • Sind mit dem Klimawandel (Sensordaten) unsere Kosten für Heizung in allen Bürogebäude des Konzerns (Transaktionsdaten) gesunken?

Der Computer antwortet – bevor Du die Frage dazu kanntest!

Big Data ermöglicht noch weiteres:

Die Algorithmen beantworten uns Fragen, an die wir noch nicht gedacht haben. Mit Statistik und etwas Mathe-Magie können die Server-Farmen

02 Analysen auf Aktiendaten - Big Data einfach erklärt Steffen Lippke Coding Lab
02 Analysen auf Aktiendaten
  • Kundengruppen nach Verhalten gruppieren (Cluster)
  • Zukunftsprodukte voll-automatisch designen (Personas)
  • Mit einer hohen Genauigkeit die Absatzmengen vorhersagen (Neuronale Netze)

Der Data Scientist weist den Server an: „Zeige mir, was mich interessieren könnte!“

Steffen Lippke
  • Produkt Y und R zusammengekauft (in 10 % aller Warenkörbe)
  • Die meisten Kunden haben Feature Y nie genutzt
  • Im Raum Köln haben ungewöhnlich viele Deine Webseite aufgerufen

Warum nutzen Unternehmen Ihre Daten nicht für die Analyse?

Viele Unternehmen haben Tausende oder Millionen von Datenpunkten, bei denen nutzbare Daten anfallen:

  • Sensoren (Temperatur, Gewicht, Lichtschranken)
  • Intranet-Seiten (Steckbriefe, Beschreibungen)
  • Forschungsdokumente
  • Klassische Office Dokumente (Word, Excel, PowerPoint usw.)
  • Transaktionsdaten (Überweisungen, Konten)
  • Kundendaten (Adressen, Einkäufe, Historien)
  • Personaldaten (Gehalt, Name)

Die meisten Unternehmen sammeln ihre Daten fleißig, weil sie zum Teil von Gesetz her dies tun müssen und zum Teil, weil sie „irgendwann irgendetwas“ mit den Daten machen wollen.

05 Daten in Tabellenform - Big Data einfach erklärt Steffen Lippke Coding Lab
05 Daten in Tabellenform

Die meisten Unternehmen lassen die Daten auf den Festplatten verschimmeln.

Diese 4 Schritte sind notwendig, um Big-Data-Analysen durchzuführen (ETL-Prozess):

  1. Extrahieren – Mögliche Datenquellen erkennen und anzapfen.
  2. Transformation (Bereinigung und Vereinheitlichung) – voll-automatisch oder manuell in mühevoller Arbeit + Umwandlung in ein einheitlich lesbares Format
  3. Laden – Zentrierung alle Datenquellen in einen großen Datenspeicher (Data Warehouse)

Wenn die Zeit-intensive „Drecksarbeit“ getan ist, kann der Data Scientist beginnen zu arbeiten.

Big Data erklärt am Beispiel – Von Daten zu mehr Geld

Wenn die Datensätze bereinigt und vorbereitet sind, können die Algorithmen verwertbare Informationen aus den Daten extrahieren, die die Businessanalysten in Erkenntnisse, Handlungen und zum Schluss in einen wirtschaftlichen Wert umwandeln.

Um die Theorie etwas anschaulicher darzustellen, schaue Dir das folgende Beispiel an:

00 Logs für Big Data
00 Logs für Big Data
  1. Big Data: Du erhältst eine große Datei mit Server-Logs und Zugriffszeiten auf die Webseite von den letzten 6 Monaten. Du lädst die Daten in die Big Data Analyse Software Splunk.
  2. Information: Nachdem Du die Daten bereinigt hast, und Du die Zugriffszeit betrachtest, fällt Dir auf, dass „50 % der Kunden die Webseiten innerhalb von 10s wieder verlassen“.
  3. Frage: Du überlegst und denkst „Ist ein Softwareproblem an dem schnellen Verlassen schuld?“.
  4. Grund: Du durchsuchst die Logs mit der neuen Information im Hinterkopf erneut und Dir fällt auf, dass „50 % der Kunden nutzen einen Mac mit Safari – Bingo! Oder nicht?
  5. Überprüfung der These: Damit Du sicher gehen kannst, dass Du nicht auf einen unrichtigen Grund gestoßen bist, berechnest Du die Schnittmenge der Gruppen –> 91 % der Kunden mit Safari, verlassen und verlassen die Seite innerhalb 10s wieder – Bingo! Bingo!
  6. Erkenntnis: Du denkst Dir: „Die Webseite ist nicht für Safari optimiert!“.
  7. Handlung: Prompt gibst Du die Safari-Optimierung an die PR-Abteilung als To-do weiter.
  8. Ausführung: Nach einer Woche sind die Safari-Optimierung online.
  9. (1 Monat warten)
  10. Wirtschaftlicher Wert: Die Zugriffszeiten sind im letzten Monat gestiegen und Dein Unternehmen verzeichnet 81 % mehr Verkäufe pro Tag, weil die doppelte Anzahl an Nutzern unsere Webseite unbeschwert nutzen kann.
03 Clusterung
03 Clusterung

Du konntest über einen Big Data Ansatz einen kommerziellen Mehrwert schaffen!

Was sind die Herausforderungen mit Big Data?

Die große Herausforderung bei Big Data ist die „Drecksarbeit“ und die Limitierung durch die Hardware.

Die Datenbereinigung kann Monate bis Jahre dauern, um die Datenqualität auf einen Stand zu heben, der ausreicht, um eine erste Analyse durchzuführen.

Die Analysten messen die Datenqualität, indem die Analysten eine Stichprobe untersuchen…

  • … , ob Dubletten vorkommen
  • … , ob gleicher Werte unterschiedlich kodiert sind
  • … , ob starke Ausreißer Tippfehler sind
  • … , ob die Inhalte stimmig sind
  • … , ob die gleichen Speicherformate und die gleichen Variablen Benennungen eingehalten wurden

Wenn die Sachbearbeiter oder Studenten die Daten aufgearbeitet haben, können die Analysen anlaufen.

Die meisten Unternehmen haben kein riesiges Rechencluster zur Verfügung und manche Analysen dauern Wochen.

Was sind die kommerziellen Vorteile aus Big Data?

Nur wenn die Daten bereinigt sind und die Analysen neue Erkenntnisse generiert haben, sieht das Unternehmen, ob sich der Aufwand gelohnt hat.

Weil die Daten unübersichtlich sind, kann keiner den Erfolg abschätzen…

  • Die Analyse schlägt fehl wegen noch zu schlechter Datenqualität.
  • Die Analyse ist erfolgreich und bringt Erkenntnisse, die vorher schon bekannt waren.
  • Die Analyse ist vom Ansatz fehlerhaft und bringt die falschen Erkenntnisse führen zu falschen Handlungen, die wiederum zu finanziellen Verlust führen

Das Unternehmen kann seine Erkenntnisse und Datensätze an andere Unternehmen verkaufen. Das Marketing interessiert sich wie folgt für Personen-Infos:

Max Mustermann, 30-40 Jahre, Nettomonatseinkommen zwischen 3.000 und 4.000 €, verheiratet

Beispiel

Gehört der Interessensgruppe:

  • /Vehicles & Transportation/Auto Enthusiasts
  • /Sports & Fitness/Sports Fans/Baseball Fans
  • /Media & Entertainment/Music Lovers/Pop Music Fans
06 Google Analytics
06 Google Analytics

Gehört den kaufbreiten Gruppen:

  • /Autos & Vehicles/Motor Vehicles/Motor Vehicles by Type/Diesel Vehicles
  • /Travel/Trips by Destination/Trips to North America/Trips to Canada
  • /Software/Business & Productivity Software

… nach Google Ads / Analytics: https://support.google.com/google-ads/answer/2497941?hl=de

Google unterscheidet in über 140 Interessengruppen und 780 kaufbereite Gruppen. Die feinteilige Gliederung ermöglicht eine perfekt zu geschnittene Marketing-Kampagnen und Werbematerialien

Steffen Lippke

Die Gesellschaft für Konsumforschung (GfK) in Deutschland arbeitet an ähnlichen Konzepten wie Google. Die GfK-Analysen können mit hoher Wahrscheinlichkeit vorhersagen, welches Smartphone Du für welchen Preis und mit welchen Featuren in 2 Jahren kaufen wirst.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert


Jeden Monat teile ich mit Mitgliedern
4 neue praxisnahe Tutorials (je 1000+ Wörter).


Trage Deine Mail, damit Du
Deine Coding + Hacking Skills erweitern kannst!

Die Webseite nutzt nur technisch notwendige Cookies.