So nutzen Sie Rohdaten in der Webanalyse richtig

,

Geschrieben von Paweł Socha

Veröffentlicht Februar 23, 2024

Rohdaten sind der grundlegende Baustein präziser Webanalyse. Allerdings verwenden sie viele Unternehmen nach wie vor nicht ausreichend. Sie entscheiden sich eher für gesampelte Daten – aufgrund ihrer Einfachheit und leichten Verwaltung.

Dieser Artikel untersucht die Vorteile und Probleme beim Gebrauch von Rohdaten in der Webanalyse und erörtert mögliche Anwendungsfälle für die Gewinnung wertvoller Einblicke.

Was sind Rohdaten?

Rohdaten sind unstrukturierte und unformatierte Daten, die ein Unternehmen aus verschiedenen Quellen sammelt: Datenbanken, Dateien, soziale Medien, Webseiten, Bilder usw.

Rohdaten werden weder gefiltert noch verarbeitet und bieten daher einen vollständigen Überblick über die Informationen. Sie erlauben tiefgreifende Analysen und exakte Einblicke, können aber auch sehr umfangreich und schwer zu handhaben sein. Mit geeigneten Tools geben jedoch Rohdaten mehr Optionen, Dateneinsichten zu erforschen und nutzbar zu machen.

Rohdaten, verarbeitete Daten und gesampelte Daten: Hauptunterschiede

Rohdaten liegen typischerweise in ihrer einfachsten und unorganisierten Form vor und stellen die ursprünglichen Einblicke, Messwerte oder Antworten dar.

Verarbeitete Daten sind dagegen die transformierte oder analysierte Form von Rohdaten. Verarbeitete Daten sind durch Konvertieren und Analysieren besser interpretierbar, sodass Sie Muster, Trends oder Zusammenhänge leichter erkennen. Diese Daten sind besser organisiert als Rohdaten, werden aber in der Regel komprimiert oder zusammengefasst. Verarbeitete Daten findet man u. a. in Analyseberichten.

Gesampelte Daten (Stichprobendaten) bilden nur eine Teilmenge eines größeren Datensatzes ab. Datenstichproben liefern eine überschaubare, aber repräsentative Momentaufnahme des Ganzen. Sie sind besonders nützlich in Szenarien, in denen Geschwindigkeit und Ressourceneffizienz im Vordergrund stehen.

Zwar bieten sie nicht die Detailgenauigkeit von Rohdaten, doch sind gesampelte Daten strukturiert und auf erweiterte Analysen zugeschnitten. So lassen sich Analysen optimieren und zeitnahe Einblicke gewinnen.

Aufgrund dieser inhärenten Unterschiede zwischen den Datentypen ergeben sich bestimmte Vor- und Nachteile. Dazu hat jeder Datentyp eigene Anwendungsfälle.

Rohdaten

Vorteile:

  • Bieten einen vollständigen und umfassenden Datensatz, sodass eine gründliche Analyse möglich ist.
  • Erlauben den Einsatz von Filtern und Visualisierungen, um neue Einblicke und Perspektiven zu gewinnen.
  • Bieten die Flexibilität, um die Daten für verschiedene Berichtkriterien nochmals zu überprüfen und zu analysieren.

Nachteile:

  • Erfordern erheblichen Zeit- und Arbeitsaufwand, um sie in umsetzbare Einblicke umzuwandeln.
  • Die Verarbeitung großer Datensätze oder der Gebrauch von APIs, um Rohdaten zu gewinnen, ist ressourcenintensiver, insbesondere bei fortgeschrittenen Analysen.

Verarbeitete Daten

Vorteile:

  • Bereinigt, organisiert und in einer Form präsentiert, die leicht zu interpretieren und zu analysieren ist.
  • Sie lassen sich leicht verwenden, um einen fundierten Beschluss zu fassen und Einblicke zu gewinnen.

Nachteile:

  • Unter Umständen fehlen Details, da die Daten aggregiert und konzentriert sind.

Gesampelte Daten

Vorteile:

  • Benötigen weniger Rechenleistung und Zeit und sind daher ideal für schnelle Analysen.
  • Einfacherer Umgang aufgrund des geringeren Umfangs gegenüber Rohdaten.
  • Allgemein weniger kostspielig in Bezug auf Speicher- und Verarbeitungsbedarf.

Nachteile:

  • Repräsentieren möglicherweise nicht den ganzen Datensatz, sodass Zerrbilder oder unvollständige Einblicke entstehen können.
  • Gesampelte Daten bieten weniger detaillierte Analysen, sodass Sie evtl. nuancierte Datenpunkte übersehen.

Erfahren Sie mehr über die Unterschiede zwischen beiden Datentypen: Rohdaten und gesampelte Daten: Wie Sie genaue Daten erhalten.

Datensampling in verschiedenen Analytics-Plattformen

Bei einigen Plattformen, wie Google Analytics, führt man standardmäßig ein Datensampling durch, insbesondere bei großen Datensätzen. Bei anderen, wie Matomo und Snowplow, sampelt man die Daten nicht standardmäßig, sondern man führt eine umfassendere Datenanalyse durch. Ob das Datensampling standardmäßig angewendet wird, hängt von den Kapazitäten der Plattform, der Größe der zu verarbeitenden Datensätze und den spezifischen Bedürfnissen der Nutzer ab.

Werfen wir einen Blick auf die Standardwerte für das Datensampling, die Analytics-Anbietern liefern:

Datensampling
Piwik PRO Führt standardmäßig kein Datensampling durch. Datensampling ist jedoch auf Anfrage möglich.
Google Analytics 4 (GA4) Führt evtl. Datensampling durch, sofern die Ereignisanzahl für Berichte die Quotengrenzen überschreitet.
Mixpanel Datensampling für bestimmte Funktionen wie Gesamtzahlen und Uniques.
Matomo Verwendet kein Datensampling.
AT Internet Verwendet Datensampling, sofern die Ereignisanzahl für Berichte die Quotengrenzen überschreitet.
Amplitude Upsampling lässt sich für genaue Schätzungen aktivieren.
Snowplow Führt kein Datensampling durch.
Heap Verwendet Datensampling, sofern die Ereignisse für Berichte die Quotengrenzen überschreiten.
Adobe Analytics Führt kein Datensampling durch, außer in ausgewählten Berichten oder bei Überschreitung von Grenzwerten.
Countly Führt kein Datensampling durch, außer beim Visualisieren von Flow Reports.

Gebrauch von Rohdaten in Analytics

Daten sind in erster Linie dann wertvoll, wenn Sie sie verarbeiten und interpretieren. Es hat wenig Sinn, Rohdaten zu behalten, ohne sie zu nutzen. Rohdaten öffnen die Tür zu anspruchsvolleren und präziseren Analysen. Sie ermöglichen ein besseres Verständnis von Informationen, die in zusammengefassten Datenformaten oft ungenutzt bleiben.

Einer der praktischen Vorteile beim Gebrauch von Rohdaten in der Webanalyse besteht darin, dass sie sich von Analytics-Plattformen mit anderen Tools exportieren lassen. Dadurch ebnen Sie den Weg für umfangreichere und aufschlussreiche Analysen. Diese Vorgehensweise entspricht der technischen Komplexität, die von Fachleuten in diesem Bereich verlangt wird. Gleichzeitig bleibt er auch für Personen mit geringerem technischem Wissen zugänglich. Dies gewährleistet ein ausgewogenes Verständnis auf verschiedenen Niveaus.

Der reguläre Arbeitsablauf beim Verwenden von Rohdaten umfasst Folgendes:

  1. Rohdatenquellen identifizieren – bevor Sie das richtige Analytics-Tool auswählen, ist es wichtig zu bestimmen, woher die Daten kommen sollen. Hierzu gehören interne Quellen (wie CRM-Systeme, Vertriebsdaten usw.) und externe Quellen (Marktforschung, Social Media usw.).
  2. Rohdaten sammeln und integrieren – sammeln Sie Daten aus den identifizierten Quellen und integrieren diese, um sie weiterzuverwenden.
  3. Daten bereinigen und aufbereiten – dazu gehört das Sortieren, Bereinigen und Organisieren der Rohdaten, um sie für die Analyse oder Visualisierung aufzubereiten.
  4. Daten in andere Tools exportieren – durch Datenexporte lässt sich der Umfang der Analyse erweitern und ein detaillierterer Einblick gewinnen.
  5. Datenanalyse – mit verschiedenen Techniken zur Datenanalyse lassen sich Muster, Trends und Erkenntnisse aufdecken. Hierzu gehören statistische Analysen, Prognosemodellierung, Datenvisualisierung und vieles mehr.
  6. Interpretation der Ergebnisse – um zu verstehen, was die Daten aussagen und sie mit den Unternehmenszielen verknüpfen.

Wie Analytics-Anbieter mit Rohdaten umgehen

Das Umwandeln von Rohdaten in verwertbare Einblicke ist das Rückgrat einer präzisen Analyse. Allerdings unterscheiden sich die Funktionen für den Zugriff, Export und Gebrauch der Rohdaten von einer Analytics-Plattform zur anderen.

Hier ist ein kurzer Überblick:

Zugang zu Rohdaten Limits für den Datenexport Datenzugang und Tools
Piwik PRO Ja Keine Limits für den Datenexport. Vollständiger Zugriff auf Rohdaten über API, BigQuery und CSV.
Adobe Analytics Zugriff auf Rohdaten über vordefinierte Tools. Keine explizit angegebenen Limits für den Datenexport. Mehrere Optionen, auf Rohdaten zuzugreifen und sie zu nutzen, einschließlich Analysis Workspace, Analytics Dashboards, Activity Map, Report Builder, Analytics APIs und Reports & Analytics.
Google Analytics 4 (GA4) Zugriff auf Rohdaten auf Ereignis- und Nutzerebene über BigQuery. Exportlimit von 5.000 Zeilen, wenn Sie einen Bericht als CSV herunterladen. Rohdaten lassen sich über Reports oder Explorations in der GA4-Weboberfläche, Analytics Data API und BigQuery abrufen und exportieren.
Countly Ja Keine explizit angegebenen Datenlimits. Mehrere Optionen, auf Daten zuzugreifen und sie zu nutzen, einschließlich über den Server, ein mobiles SDK für mobile Analysen oder ein Web-SDK für Webanalysen.
Mixpanel Ja Höchstens zwei wiederkehrende Pipelines und eine einmalige Pipeline für Ereignisexport-Pipelines pro Projekt. Die Rohexport-API hat ein Limit von 60 Abfragen pro Stunde, 3 Abfragen pro Sekunde und maximal 100 gleichzeitigen Abfragen. Der Datenzugriff erfolgt über die HTTP-API oder den direkten Export aus der Datenbank. Die Rohdaten lassen sich in Mixpanel anzeigen.
Matomo Ja Kein festgelegtes Limit für den Datenexport. Die Daten lassen sich vollständig exportieren. Auf die Daten lässt sich über eine HTTP-API oder einen direkten Export aus der Datenbank zugreifen. Die Rohdaten sind in Matomo einsehbar.
Amplitude Ja 5.000 Benutzer von der Seite Benutzer, 100.000 Datenzeilen pro Metrik von der Ansicht „Diagramme”. Über 20 SDKs, HTTP API v2, Batch API und SQL-Zugriff.
Snowplow Ja Kein festgelegtes Limit für den Datenexport. Speicheroptionen für Data Warehouses und Seen, Laden von Daten in Redshift, BigQuery, Snowflake und Databricks sowie Datenabfragen.
Heap Ja CSV-Bericht: 5.000 Benutzer von der Seite Benutzer, 100.000 Datenzeilen pro Metrik von Diagrammen und Funnels. Tracking von Ereignissen, Datenabfrage und Verwendung eines Datenmodells zur Datenaggregation.

Vorteile von Rohdaten und Anwendungsfälle

Rohdaten sind von Vorteil, da sie hochrelevant und spezifisch für die durchgeführte Analyse sind und frische Informationen liefern. Daher eignen sie sich dazu, datenbasierte Beschlüsse zu unterstützen.

Sie bieten mehr Freiheit bei der Datenverarbeitung, da sie einen ersten Einblick in den Datensatz ermöglichen. Zudem haben Sie mit Rohdaten ein Backup, auf das Sie zurückgreifen können, falls Sie nach der Verarbeitung und Analyse Ihrer Daten auf Probleme stoßen sollten.

Lassen Sie uns nun auf typische Anwendungsfälle von Rohdaten eingehen.

Tracking kompletter Customer Journeys

Mit Rohdaten verschiedener Quellen lässt sich die gesamte Customer Journey über verschiedene Plattformen hinweg tracken. Dazu gehören Online- und Offline-Daten sowie Daten verschiedener Herkunft wie einer Website und einer mobilen App.

Diese Art Daten repräsentiert die unveränderten Stimmen und Verhaltensweisen der Verbraucher. Unabhängig davon, ob es sich um die Mitschrift einer Fokusgruppendiskussion oder das Aufzeichnen von Online-Käufen während des Weihnachtsgeschäfts handelt: Rohdaten erfassen den Markt in seinem natürlichsten Zustand. Unternehmen verstehen, wie sich Nutzer zwischen Plattformen bewegen und wie ihre Kampagnen zu Conversions führen, indem sie diese Datenpunkte verknüpfen.

Attributionsmodellierung

Unternehmen verwenden Rohdaten zur Attributionsmodellierung, indem sie diese entweder selbst durchführen oder Agenturen beauftragen, die Algorithmen nutzen. Bei der Attributionsmodellierung werden Datenanalysen und statistische Modellierungstechniken eingesetzt. So lässt sich der Beitrag der einzelnen Marketing-Touchpoints ermitteln, was ermöglicht, Conversions oder Verkäufe zu fördern.

Benutzerdefinierte Dashboards

Im Gegensatz zu verarbeiteten oder zusammengefassten Daten wurden Rohdaten noch nicht interpretiert oder durch Tools verändert. Das heißt, dass Unternehmen sie mit verschiedenen Analytics-Tools bearbeiten und je nach Bedarf unterschiedliche Einblicke gewinnen können.

Unternehmen verwenden Rohdaten etwa dazu, Dashboards in BI-Tools oder Business-Apps für interne oder externe Zwecke zu erstellen. So lassen sich auch für Agenturen aus Rohdaten Berichte für ihre Kunden erstellen. Diese Dashboards helfen Unternehmen, ihre Daten zu visualisieren und aussagekräftige Einblicke zu gewinnen.

Compliance mit Vorschriften

Gewisse Kundensegmente, wie staatliche Stellen oder Medien, müssen Vorschriften einhalten, die sie dazu verpflichten, Daten an Aufsichts- und Kontrollbehörden zu übermitteln. Mit Rohdaten lassen sich Kriterien für folgende Organisationen erfüllen:

  1. Gesundheitsdienstleister müssen häufig Rohdaten an staatliche Stellen übermitteln, damit diese in der Lage sind, die öffentliche Gesundheit zu überwachen, Forschungszwecke zu fördern und Vorschriften einzuhalten. Dazu gehören Daten zur Demografie der Patienten, zu Diagnosen, Behandlungen und Behandlungsergebnissen.
  2. Banken, Versicherungsgesellschaften und andere Finanzinstitute sind gezwungen, Rohdaten an Aufsichtsbehörden zu übermitteln, um die Compliance mit Finanzvorschriften zu gewährleisten. Hierzu zählen Daten über Transaktionen, Kundenverhalten, Risikobewertungen und vieles mehr.
  3. Telekommunikationsunternehmen senden unter Umständen Rohdaten an Aufsichtsbehörden, um Vorschriften in Bezug auf Netzleistung, Kundenservice, Preisgestaltung usw. einzuhalten.
  4. Einzelhändler benötigen unter Umständen Rohdaten, um sie an Partner in der Lieferkette oder an Aufsichtsbehörden zu übermitteln. Dazu zählen Daten über Verkäufe, Bestände, Kundenverhalten und vieles mehr.
  5. Staatliche Stellen senden häufig Rohdaten an andere staatliche Stellen, um diese zu beaufsichtigen, zu koordinieren und die Compliance mit Gesetzen und Vorschriften zu gewährleisten.
  6. Medienunternehmen übermitteln unter Umständen Rohdaten an Aufsichtsbehörden, insbesondere wenn sie in Ländern mit strengen Medienvorschriften agieren. Dies können Daten über Zuschauerzahlen, Inhalte, Werbung und mehr sein.

Zugriff auf Berichte außerhalb von Analytics-Plattformen

Unternehmen wünschen möglicherweise Zugriff auf Rohdaten, ohne Konten in ihrer Analytics-Plattform anzulegen. In diesen Fällen lassen sich heruntergeladene Rohdaten als Berichte in Tools wie Power BI bereitstellen, auf die jeder im Unternehmen zugreifen kann.

Fazit

Auch wenn das Datensampling für Effizienz und Leistung nützlich ist, sind Rohdaten in bestimmten Kontexten nach wie vor unverzichtbar. Rohdaten ermöglichen es, eine genauere und aufschlussreichere Wahl zu treffen, indem sie Präzision und Tiefe bieten. Sowohl gesampelte Daten als auch Rohdaten haben ihren Platz in der Datenanalyse. Beide unterstützen Entscheidungsprozesse und spielen eine wichtige Rolle für das nachhaltige Wachstum und den Erfolg eines Unternehmens.

Doch letztlich sind es präzise Daten, die zu präzisen Entscheidungen führen. Rohdaten sind eine praktikable Quelle für eine tragfähige Zukunft Ihres Unternehmens.

Möchten Sie mehr darüber erfahren, wie Sie Rohdaten in Piwik PRO nutzen, um mehr mit fortgeschrittenen Analysen zu erreichen, dann kontaktieren Sie uns: