Damit Du die gespeicherten Datenmengen innerhalb Deines Data Warehouses (DWH) in konkrete Informationen zur Entscheidungsunterstützung in Deinem Unternehmen verwandelst, ist es wichtig, die Daten mit geeigneten Analyse- und Auswertungsmethoden zielgruppengerecht aufzubereiten und bereitzustellen. Wir zeigen Dir in diesem Blogbeitrag drei Möglichkeiten zur Analyse und Bereitstellung von Daten, die Dir hierfür zur Verfügung stehen und geben Dir einen genauen Einblick, welche Methode sich wann am besten eignet.
Reporting
Unter Reporting lassen sich jegliche systematisch generierten Berichte einordnen, die relevante Daten für spezifische Stakeholder zielgruppengerecht darstellen. Typische Adressaten für Reports sind die Unternehmensbereiche Controlling, Marketing oder Finanzen. Dabei kannst Du zwischen klassischen, vordefinierten Standardberichten und ad-hoc Reports, welche die Generierung von benutzerdefinierten Berichten und Analysen durch Endanwender ermöglichen, unterscheiden.
Mithilfe derartiger Standardberichte lassen sich Kennzahlen nach vorab definierten, kontext-spezifischen und relevanten Dimensionen analysieren. Typische Fragestellungen hierfür sind beispielsweise:
- Wie hoch war der Umsatz für die Produkte X, Y und Z im vergangenen Monat?
- Wer hat Produkt X im vergangenen Monat gekauft?
OLAP (Online Analytical Processing)
Während Du anhand von Reports überwiegend statische Berichte erstellst, kannst Du mittels OLAP interaktive Analysen durchführen. Die Grundlage Deiner Analysen bilden hier Deine multidimensionalen Daten, welche anhand verschiedener Kriterien bzw. Dimensionen ausgewertet werden. Die Dimensionen stellen dabei die multidimensionale Struktur der Daten auf sogenannten OLAP-Würfeln dar. Ein solcher Datenwürfel kann aus beliebig vielen Dimensionen und Kennzahlen bestehen. Datenwürfel mit mehr als drei Zugrunde liegenden Dimensionen werden auch als Hypercubes bezeichnet.
Zur Speicherung der multidimensionalen Daten im DWH können verschiedene Technologien zum Einsatz kommen: Während beim sogenannten MOLAP („multidimensionales OLAP“) Daten in multidimensionalen Datenbanken gespeichert werden, erfolgt die Datenspeicherung beim ROLAP („relational OLAP“) in einer relationalen Datenbank. Zudem steht mit HOLAP („hybrid OLAP“) eine Kombinationsmöglichkeit von ROLAP und MOLAP zur Verfügung.
Es gibt verschiedene OLAP-Operationen, die sich zur Navigation durch die multidimensionalen Daten nutzen lassen. Beispielsweise kann eine konsolidierte Sicht (via Roll-Up) oder eine verfeinerte Sicht auf den Datenbestand (via Drill-Down) angewendet werden, um Kennzahlen in unterschiedlicher Granularität abzubilden. Zudem ermöglichen Dir die Operationen Slicing und Dicing die schichtweise Darstellung des Datenbestands. Beim Slicing wird der dreidimensionale Datenwürfel auf eine zweidimensionale Sicht begrenzt (Betrachtung einer Kennzahl nur in zwei Dimensionen für einen ausgewählten Wert der dritten Dimension), wohingegen beim Dicing der dreidimensionale Datenraum auf einen kleineren Würfel reduziert wird (Betrachtung einer Kennzahl für ausgewählte Werte aller drei Dimensionen). Eine weitere zentrale OLAP-Operation ist die Pivotierung oder Rotation, die es durch das Drehen des Würfels ermöglicht, eine andere Perspektive auf die Daten zu erhalten. Typische Fragestellungen zielen beispielweise auf die Identifikation bestimmter Kunden- oder Absatzsegmente ab:
- Wie hoch war das durchschnittliche Einkommen von Personen, die Produkt X im vergangenen Monat in der Region Y gekauft haben?
- Welche Produkte haben unter 25-jährige Männer in Jahr X gekauft?
Noch mehr Informationen zur OLAP-Modellierung kannst Du in unserem Blogbeitrag ‚OLAP Modellierung: Lohnt sich das?!‘ nachlesen.
Data Mining
Mit Data Mining stehen Dir weitere Analysemethoden für Daten aus einem DWH zur Verfügung, welche Du nutzen kannst, um neue Erkenntnisse aus den bereits bestehenden Daten durch die Identifikation von neuartigen und nützlichen Zusammenhängen, Mustern und Trends zu generieren. Per Definition wird Data Mining häufig mit der Knowledge Discovery in Databases (KDD) gleichgesetzt. Demzufolge ist Data Mining der nicht triviale Prozess der Identifikation gültiger, neuartiger, potenziell nützlicher und klar verständlicher Muster in Datenmengen. Im Gegensatz zu OLAP lassen sich durch Data Mining bisher verborgene Zusammenhänge aufdecken. Typische Fragestellungen untersuchen vor allem Zusammenhänge und Ursachen in großen Datenmengen und befassen sich mit der Vorhersage von Eintrittswahrscheinlichkeiten sowie Segmentierungen.
Beispielhafte Fragestellungen sind demzufolge:
- Lassen sich die Kunden anhand soziodemographischer Merkmale in unterschiedliche Gruppen einteilen?
- Welche Produkte werden besonders häufig gemeinsam gekauft?
- Wie hoch ist die Wahrscheinlichkeit, dass bestimmte Kunden Produkt X auch zukünftig kaufen werden?
Im Data Mining kommen verschiedene Methoden und Verfahren zur Lösung unterschiedlicher Problemstellungen zum Einsatz. Dabei handelt es sich insbesondere um mathematisch-statistische Algorithmen und Verfahren der künstlichen Intelligenz und des Machine Learnings. Eine kurze Einführung ins Thema Künstliche Intelligenz und Machine Learning findest Du in unserem Blogbeitrag Machine Learning – schnell und einfach erklärt.
Die drei Datenbereitstellungsformen im Vergleich
Reporting, OLAP und Data Mining im direkten Vergleich
Die drei genannten Analysemethoden und Darstellungsformen der Daten aus dem DWH unterscheiden sich maßgeblich hinsichtlich der grundlegenden Zielsetzung, der Vorgehensweise, der Rolle des Anwenders und des Ergebnisses. Der wesentliche Unterschied zwischen den tiefer gehenden Analysemöglichkeiten, die OLAP und Data Mining gegenüber dem Reporting bieten, ist, dass Analysen im Rahmen von OLAP hypothesengestützt durchgeführt werden, wohingegen beim Data Mining keine konkreten Fragestellungen vorab notwendig sind. Demzufolge erfolgt die Analyse bei OLAP abfragegesteuert, indem der Anwender mit dem System interagiert und wiederholt konkrete Annahmen durch OLAP-Operationen prüft. Im Data Mining läuft die Analyse eher entdeckungsgesteuert ab, da der Anwender z. B. alle möglichen Einflussfaktoren für eine Kennzahl untersucht. Die Interaktion mit dem Data Mining Tool beschränkt sich dabei auf die Selektion des passendsten Algorithmus und den geeigneten Parametern.
Obwohl OLAP und Data Mining unterschiedliche Zielsetzungen verfolgen und durch eine unterschiedliche Vorgehensweise gekennzeichnet sind, so muss keine „Entweder-oder-Entscheidung“ zwischen beiden Methoden getroffen werden. Je nach Situation können die Analyseansätze in beliebiger Reihenfolge durchlaufen werden. Der Bottom-Up Ansatz der Data Mining Methoden stellt dabei eine gute Ergänzung des Top-Down Ansatzes von OLAP dar. Beispielsweise können OLAP-Operationen dabei helfen, generelle Umsatzrückgänge in einem Jahr auf einzelne Kundengruppen, Produktsegmente oder Regionen zurückzuführen. Im Anschluss können Data Mining Verfahren, z. B. eine Regressionsanalyse, angewendet werden, um Einflussgrößen auf die Umsatzentwicklung für das relevante Segment ausfindig zu machen und damit potenzielle Ursachen für den Umsatzrückgang zu identifizieren. Darüber hinaus lassen sich weitere Data Mining Verfahren aus dem Bereich Predictive Analytics nutzen, um die zukünftige Umsatzentwicklung vorherzusagen und Handlungsmaßnahmen zur Umsatzoptimierung anhand relevanter Einflussfaktoren abzuleiten.
Der kombinierte Einsatz von OLAP und Data Mining Verfahren erlaubt Dir somit ein ganzheitliches Bild auf Deine Unternehmensdaten zur Entscheidungsunterstützung zu generieren: Als Ergebnis von OLAP-Operationen resultieren Analysen, die Erkenntnisse über aktuelle und vergangene Geschäftsereignisse liefern, wohingegen der Einsatz von Data Mining Verfahren Prognosen für zukünftige Geschehnisse ermöglicht und damit auch Ansatzpunkte für konkrete Maßnahmen liefert.
Dein Weg zur Data-Driven Company
Gerne unterstützen wir Dich bei der Entwicklung Deiner individuellen Datenmanagementstrategie, mit der auch Du das volle Potential Deiner Daten ausschöpfen kannst. Mit unserem Tool Innovator geben wir Dir die notwendige Software an die Hand, um Datenmodelle und Datenbanken in einem Data Warehouse aufzubauen. Zugleich begleiten Dich unsere Consultants bei der Entwicklung und Umsetzung Deiner nachhaltigen Datenmanagementstrategie. Gemeinsam mit Dir entwickeln wir einen Lösungsansatz, der individuell auf Deine Anforderungen zugeschnitten ist. Nimm jetzt Kontakt mit unseren Data Spezialisten auf und erfahre, wie Dein Weg zur Data-Driven Company aussehen kann.
MID Blog Newsletter abonnieren