Die zunehmende Digitalisierung in den letzten Jahrzehnten führt dazu, dass Unternehmen und öffentliche Einrichtungen unmengen an Daten generieren und speichern. Hierbei reden wir weltweit von 2,5 Billionen Bytes pro Tag (dies entspricht einer Speicherkapazität von 36 Millionen iPads). Die explosionsartige Vermehrung digitaler Daten wird besonders deutlich, wenn man sich bewusst macht, dass 90 % der weltweit verfügbaren Daten in den letzten zwei Jahren erzeugt wurden.
Mit immer weiter entwickelten Software-Systemen und einer steigenden Anzahl der weltweiten Internet- und Social-Media-Nutzer wird sich dieser Wachstumstrend auch in Zukunft fortsetzen.
50% der Weltbevölkerung sind aktive Internetnutzer – Das entspricht ca. 4 Mrd. Menschen. Social Media wird von 40% der Weltbevölkerung genutzt.
Wie mit den Datenmengen umgegangen wird, ist heutzutage eine entscheidende Frage für Unternehmen. Mit der richtigen Analyse können wichtige Erkenntnisse gewonnen werden, die als Basis für strategische Unternehmensentscheidungen dienen. In diesem Artikel beschreiben wir welchen Nutzen Unternehmen aus den ihnen zur Verfügung stehenden Datenmengen ziehen können, um in der digitalen Wirtschaft wettbewerbsfähig zu bleiben.
Was ist Big Data?
Big Data sind große Datenmengen, die von Unternehmen und Privatpersonen tagtäglich produziert werden. Auf Konsumentenebene umfassen diese Daten u.a. Informationen zum Online-, Such-, und Kaufverhalten. Auf Unternehmensebene sind beispielsweise Transport- und Produktionsdaten betroffen.
Big Data bezieht sich auf Datensätze, deren Größe und Form dazu führen, dass sie mit traditionellen und relationalen Datenbanken nicht mehr erfasst, verwaltet und verarbeitet werden können – IBM
Es gibt 3 Merkmale, die die Eigenschaften von Big Data komprimiert zusammenfassen:
- Volume – beschreibt das enorme Datenvolumen bzw. die riesige Datenmenge.
- Velocity (Geschwindigkeit) – beschreibt die Geschwindigkeit, mit der Daten entstehen. Immer mehr Daten werden in immer kürzerer Zeit generiert.
- Variety (Vielfalt) – beschreibt die unterschiedlichen Datenquellen und -formen. Daten können strukturiert oder unstrukturiert sein und z. B. als Audio- oder Videodatei vorliegen.
Die komplexe Charakteristik von Big Data wird laut Jules Berman besonders gut deutlich, wenn man sich anschaut, inwiefern sich Big Data von Small Data in der Praxis unterscheidet.
Die Unterschiede zwischen Big Data und Small Data
1. Ziele: Während Small Data für ein bestimmtes Ziel genutzt wird, entwickelt sich die Nutzung von Big Data oftmals in eine unerwartete Richtung.
2. Ort: Small Data liegt grundsätzlich an einem Ort (in einer Computerdatei); Big Data verteilt sich oft auf viele Dateien auf mehreren Servern in unterschiedlichen Ländern.
3. Datenstruktur: Small Data ist normalerweise geradlinig strukturiert; Big Data kann unstrukturiert sein, viele Dateiformate aus unterschiedlichen Fachrichtungen umfassen und auf verschiedene Quellen verweisen.
4. Datenvorbereitung: Small Data wird vom Endnutzer für seine Zwecke vorbereitet; Big Data wird oft von einer Gruppe vorbereitet, von einer Zweiten analysiert und von einer Dritten genutzt. Jede Gruppe kann einen anderen Zweck verfolgen.
5. Langlebigkeit: Small Data wird üblicherweise nach dem Projektabschluss für einen begrenzten Zeitraum (ca. 5-7 Jahre) aufbewahrt. Bei Big Data bleiben die Daten unbegrenzt gespeichert, da die Datenprojekte in weiterführende Projekte übergehen.
6. Messungen: Small Data wird mit einem einzigen Protokoll in festgelegten Maßeinheiten innerhalb kurzer Zeit aufgezeichnet. Big Data stammt von unterschiedlichen Orten, Zeiten, Organisationen und Ländern. Dies bringt aufwändige Konvertierungen mit sich.
7. Reproduzierbarkeit: Für den Fall, dass etwas fehlschlägt, lässt sich Small Data in der Regel voll reproduzieren. Big Data liegt in so vielen Formen vor und stammt aus so vielen Quellen, dass es unmöglich ist, bei Problemen wieder neu zu beginnen.
8. Risiko: Bei Analyse-Problemen mit Small Data bleibt das Projekt finanziell überschaubar. Bei ähnlichen Schwierigkeiten mit Big Data können finanzielle Schäden in Höhe von mehreren hundert Millionen entstehen.
9. Introspektion: (inwiefern können die Daten sich aussagekräftig selbst beschreiben): In einem Small Data Datensatz ist alles gut organisiert und die Bedeutungen sind eindeutig. Big Data ist komplexer und kann Informationen enthalten, die nicht identifizierbar oder auch bedeutungslos sind. Dies kann die Datenqualität mindern.
10. Analyse: Small Data kann in einem einzelnen Prozess aus einer einzelnen Computerdatei analysiert werden. Bei Big Data müssen die umfangreichen Daten u.a. Extraktionen, Prüfungen, Reduktionen, Normalisierungen und Transformationen durchlaufen.
Analytics & DSGVO = Piwik PRO
Wir sorgen dafür, dass Sie sich wegen der DSGVO nicht mehr den Kopf zerbrechen müssen. Wir bieten Ihnen professionelle Analytics – DSGVO compliant.
Was versteht man unter Big Data Analytics?
Durch das bewusste oder unbewusste Sammeln von Big Data stellt sich für Unternehmen die Frage, ob und wie man diese Informationen für sich nutzen kann. Der alleinige Besitz dieser Daten bringt keine unternehmerischen Vorteile mit sich. Hier kommt Big Data Analytics ins Spiel und ermöglicht, große Datenmengen verschiedener Quellen zu analysieren.
Big Data Analytics beschreibt die Nutzung von erweiterten analytischen Techniken für sehr große und vielfältige Datensätze. Diese Datensätze beinhalten strukturierte, semi-strukturierte und unstrukturierte Daten aus unterschiedlichen Quellen und in unterschiedlichen Größen – von Terabytes bis zu Zettabytes. – IBM
Ziel ist es, nützliche Informationen und insbesondere Muster und Korrelationen aus den Datenmengen abzulesen. Mit den gewonnenen Erkenntnissen können Unternehmensprozesse optimiert und Wettbewerbsvorteile erzielt werden. Die abgeleiteten Optimierungsmaßnahmen tragen in den meisten Fällen zu einer Kostensenkung, einem Zeitersparnis sowie einer Produkt- und Dienstleistungsoptimierung bei.
Die Auswertung von Big Data
Im ersten Schritt des Analyseprozesses muss die Datenmenge erfasst und für die weitere Verarbeitung aufbereitet werden. Herausforderungen sind hierbei die unterschiedlichen strukturellen Gegebenheiten, Formate und Quellen. Zudem ist es essentiell, die vorhandenen Daten auf ihre Relevanz zu prüfen, um deren Aussagekraft sicherzustellen.
Die große Menge an Daten erfordert aufwändige Prozesse zur Erfassung, Extraktion und Transaktion. Die anschließende Analyse erfolgt mit Hilfe von Big Data Software und statistischen Methoden. Anschließend werden die gewonnenen Informationen aufbereitet und visualisiert.
Big Data Analytics ermöglicht es, mit Daten zu arbeiten, die vorher nicht zugänglich bzw. nicht nutzbar waren. Ein weiterer Unterschied zu einem herkömmlichen Analytics-Verfahren ist, dass die Analysen nicht (nur) dazu dienen, aus vergangenen Ereignissen zu lernen.
Das primäre Ziel ist, einen Blick in zukünftige Entwicklungen zu werfen und zu erfahren, wie das Kundenverhalten und die Kundenwünsche von Morgen aussehen.
Big Data Tools und Methoden
Große Datenmengen bringen Komplexität mit sich und daher ist es nicht verwunderlich, dass herkömmliche Datenbanken für Big Data nicht mehr ausreichen. Vielmehr kommen erweiterte Analytics-Techniken wie Data Mining, Text Mining, Process Mining und Machine Learning zum Einsatz. Diese und andere statistische Methoden können Vorhersagen über die Wahrscheinlichkeit von zukünftigen Ereignissen treffen.
Ein kurzer Überblick über beliebte Big Data Analytics-Techniken:
- Data Mining – große Datenmengen werden auf Muster, Trends und Zusammenhänge hin untersucht.
- Machine Learning – Computerprogramme erwerben selbständig neues Wissen und erzeugen Datenmodelle, die für Prognosen und Entscheidungen eingesetzt werden.
- Process Mining – Hier werden keine einzelnen KPIs, sondern Prozesse end-to-end und auf ihre Effizienz hin analysiert – und dabei exakt so dargestellt, wie sie in der Realität ablaufen.
- Text Mining – extrahiert analysierbare Informationen aus Texten (z.B. Worthäufigkeiten).
Bei der Begriffserklärung fällt auf, dass die Techniken mehrheitlich darauf abzielen, Prognosen und zukünftige Trends zu erkennen. Dies fällt in den Bereich von Predictive Analytics und gibt Antwort auf die Fragestellung “Was wird passieren?”. Doch auch wenn Big Data für Predictive Analytics Verfahren geeignet ist, gibt es zusätzliche Anwendungen in Descriptive und Prescriptive Analytics.
Der Einsatz von Big Data in unterschiedlichen Analytics-Methoden
Descriptive Analytics ist mit ca. 80 % die am häufigsten genutzte Methode im Bereich von Business Analytics. Diese Methode fasst zusammen, was in der Vergangenheit passiert ist. Descriptive Analytics hilft also bei der Komprimierung von Big Data in kleinere und überschaubare Daten.
Die nächste Stufe bei der Datenreduktion ist Predictive Analytics. Ziel ist es, mit der Prüfung von vergangenen und aktuellen Daten, Prognosen über die Zukunft zu treffen. Es werden also Vorhersagen über Daten getroffen, die noch nicht zur Verfügung stehen. Hier kommen u.a. die aufgeführten Techniken wie Data Mining und Machine Learning zu Einsatz.
Prescriptive Analytics lehnt sich an Predictive Analytics an und trifft Vorhersagen über die Konsequenzen, die gewisse Handlungen mit sich ziehen. Somit wird die Fragestellung “Wie können wir etwas geschehen lassen?” beantwortet.
Aufgrund der riesigen Datenmenge ist Big Data im Vergleich zu Small Data insbesondere für das Aufdecken von zukünftigen Trends und Mustern geeignet. Speziell für CEOs und andere Manager mit Entscheidungsgewalt sind diese Informationen von immenser Bedeutung, um richtig auf Veränderungen im Markt und im Kundenverhalten zu reagieren.
Piwik PRO vs. Google Analytics – Der ultimative Vergleich
Was sind die Vorteile, Nachteile, Gemeinsamkeiten und Unterschiede? Wir liefern Ihnen Antworten und einen vollständigen Überblick.
Big Data in der Praxis
Das Potenzial von Big Data Analytics für eine fundierte wirtschaftliche Entscheidungsfindung ist unumstritten. Die unterschiedlichen Branchen setzen Big Data ein, um Wettbewerbsvorteile zu generieren und ihr Geschäft zu stärken. Folgend werden die Vorteile von Big Data für verschiedene Unternehmensabteilungen und Branchen beleuchtet.
Vertrieb & Marketing
Die Big Data Analyse wird im Marketing am häufigsten eingesetzt, um eine Kostenreduzierung herbeizuführen. Erreicht werden kann das durch ein maßgeschneidertes Produkt- und Dienstleistungsangebot, verbunden mit individuellen Marketingmaßnahmen. Ausgewertet werden alle bekannten Kundeninformationen (z. B. zu Demographie, Standort, Transaktionen und Interessen). Auf dieser Grundlage können Muster bei Kaufentscheidungen abgeleitet werden.
Diese werden genutzt, um neue Kundensegmente anzulegen und zu targeten. Ein weiterer Nutzen bieten das Cross-Selling auf Basis detaillierter Kundeninformationen. Gleichzeitig können aber auch Kunden identifiziert werden, die unzufrieden sind und gegebenenfalls abwandern könnten. Eine rechtzeitige Reaktion (z. B. durch Rabattaktionen) kann dieser Situation entgegenwirken.
Produktentwicklung
Die Produktentwicklung kann Big Data verwenden, um Kundenbewertungen zu erfassen und auszuwerten. So kann herausgefunden werden, wo die Produktschwächen liegen und welche Trends oder Marktlücken noch unentdeckt sind. Mit Hilfe dieser Informationen können neue Produkte entwickelt bzw. verbessert werden. Dies wirkt sich direkt auf die Umsatzzahlen aus und gibt zudem Aufschluss über die allgemeine Markenwahrnehmung des Unternehmens.
Produktion & Support
In der Produktion trägt Big Data dazu bei, Verzögerungen und Ausfälle zu verhindern. Dies geschieht durch das Sammeln und Zusammenführen von allen Informationen zu den einzelnen Produktionsprozessen. Sensoren an allen entscheidenden Maschinen übermitteln Daten an große Datenbanken und melden Probleme und Störungen in Echtzeit. So kann bei Notfällen direkt in den Produktionsprozess eingegriffen werden und wertvolle Zeit und Ressourcen eingespart werden.
Supply Chain Management
Die Analyse von Lieferketten ist sehr komplex, da hier unterschiedliche Daten zu Produktionsstandorten, Lagerung und Transportwegen zusammengeführt werden müssen. Big Data Analytics hilft dabei, diese Informationen zu ordnen und die Kommunikation zwischen Unternehmen und Transport zu unterstützen. Mit dem Erhalt von Positionsdaten eines Fahrzeuges kann das Unternehmen beispielsweise Alternativrouten senden und somit verkürzte Fahrzeiten erreichen.
Finanzen & Versicherungen
Big Data wird in der Versicherungs- und Finanzbranche insbesondere für die Risikokalkulation eingesetzt. Banken können z. B. durch gewonnene Datenmuster Faktoren identifizieren, die sich negativ auf eine Kreditrückzahlung auswirken. Die Vergabe von Krediten kann somit hinsichtlich dieser Risikofaktoren optimiert werden.
Versicherungen nutzen hingegen beispielsweise Patientendaten, um Versicherungskosten besser kalkulieren zu können. So kann ein erfasster Gesundheitszustand darüber Aufschluss geben, ob und in welcher Höhe eine Versicherung abgeschlossen werden kann.
Welche Herausforderungen durch Big Data entstehen
“Von Big Data zu Big Brother” titeln so manche Kritiker und Skeptiker über das Thema Big Data. Der Vorwurf liegt auf der Hand – Bei den unmengen an Daten, die über uns Menschen gesammelt werden, bleibt die Privatsphäre und der Datenschutz auf der Strecke.
Ein beliebtes Beispiel sind digitale Fitnessarmbänder, die unsere sportlichen Aktivitäten aufzeichnen und von Krankenkassen gefördert werden. Doch welches Interesse steckt seitens der Unternehmen dahinter? Eine gewisse Gesundheitsdiktatur sagen manche, die davon ausgehen, dass sich der Krankenkassenbeitrag zukünftig anhand der gesammelten Kundendaten orientieren wird. Ganz nach dem Motto “Wieso sollte ein Blutdrucksenker finanziert werden, wenn der Kunde nur 3.000 Schritte pro Tag läuft?”.
Diese Kategorisierung von Menschen – nur auf Grundlage von Daten und nicht auf Basis eines gesunden Menschenverstands und individuellen Gegebenheiten – ist wohl die größte Sorge in der Debatte um Big Data. Fakt ist, die Angst, dass Menschen durch erweiterte Technologien auf der Strecke bleiben, kann nicht gänzlich zurückgewiesen werden.
Daher ist es wichtig, die Datenerhebung offen zu legen, den Datenschutz ernst zu nehmen und Menschen eine gewisse Kontrolle über ihre Informationen zurückzugeben. Nur so kann der Vorbehalt schrittweise abgebaut werden und das riesige Potenzial von Big Data, das insbesondere beim Thema Sicherheit nicht von der Hand zu weisen ist, ausgeschöpft werden.
Fazit
Mit einer fortschreitenden Digitalisierung und der damit verbundenen Menge an gesammelten Daten wird auch die Bedeutung und Relevanz von Big Data in Zukunft weiter steigen. Big Data nutzt den Unternehmen jedoch nur etwas, wenn die Informationen richtig analysiert werden können. Die Möglichkeiten scheinen grenzenlos und Unternehmen können sich einen großen Wettbewerbsvorteil verschaffen, indem sie Märkte, Kunden und ihre Veränderungen richtig einschätzen können und auf diese mit entsprechenden Maßnahmen reagieren.
Die Komplexität und der Aufwand von Big Data Analytics darf jedoch nicht außer Acht gelassen werden. Heutzutage müssen Unternehmen über ein erweitertes technisches Wissen und ein großes Budget verfügen, um die richtigen Analysen durchführen zu können.
Und dennoch: Es gibt immer wieder Kritik und Skepsis, da die Datenqualität oft nicht ausreicht und auch datenschutzrechtliche Probleme diskutiert werden. Es gilt also zukünftig, in die Entwicklung von verbesserter Software zu investieren und das Thema auch für kleinere und mittelständische Unternehmen zugänglich zu machen.
Gehen Sie mit uns den nächsten Schritt im Data-Driven Marketing
Gerne zeigen wir Ihnen in einer persönlichen Demo die Piwik PRO Analytics Suite: Analytics, Tag Manager, Personalisierung & Customer Data Platform in einer Software vereint – DSGVO compliant.