Beim Aufbau und später auch beim Betrieb eines Data Warehouse Systems hat ein OLAP Modell verschiedene Vorteile. Zum einen bietet ein Modell einen guten Überblick über die oft große Anzahl an Elementen und deren Zusammenhänge, zum anderen ist es eine gute Basis für die Kommunikation mit den Fachbereichen.
OLAP: Wichtiger Bestandteil eines BI Systems
Oft stellt sich die Frage, welche Teile ein zweckmäßiges und zielführendes DWH-Modell beinhalten muss.
In komplexen Systemen ist die Modellierung des Datenmodells unabkömmlich. Auch die Modellierung der Versorgungsprozesse bzw. der ETL-Prozesse ist oft sehr hilfreich.
Aber was ist am Ende das Resultat eines jeden Datawarehouse-Systems? Bzw. was ist das Produkt, welches der Fachbereich oder das Management am Ende auch wirklich sieht, erwartet und somit auch beauftragt?
Es sind die Kennzahlen, Dimensionen und Hierarchien, die für die Auswertung zur Verfügung stehen.
Elemente eines OLAP Modells
Dimensionen
Dimensionen stellen in einer Baumstruktur den Zusammenhang der verschiedenen Ebenen dar. Für jede Ebene können folgende Eigenschaften hinterlegt werden:
- Identifikatorattribut: Schlüsselattribut, welches über eine Fremdschlüsselbeziehung mit der nächsten Ebene verbunden ist.
- Anzeigeattribut: Attribute, die im Würfel oder Bericht zur Auswertung angezeigt werden.
- Sortierattribut: Attribute, die die Reihenfolge der Ausprägungen für die Anzeige bestimmt.
- Sichtbarkeit: Eigenschaft, ob die Ebene für die Auswertung angezeigt wird oder nicht.
- Rekursiv: Eigenschaft, ob die Ebene rekursiv für die Auswertung verwendet werden kann.
Hierarchien
Pfade durch diesen Dimensionsbaum bilden die Hierarchien. Verschiedene Hierarchien innerhalb eines Dimensionsbaums können bei der Auswertung als Parallelhierarchien und in unterschiedlichen Rollen verwendet werden.
Kennzahlen
Bei Kennzahlen kann man zwischen Basiskennzahlen, abgeleiteten Kennzahlen und berechneten Kennzahlen unterscheiden:
- Unter Basiskennzahlen versteht man relationale Kennzahlen, die bei der Erstellung einer Faktentabelle erstellt werden (z.B. „Gesamtanzahl“ oder „Kosten“).
- Abgeleitete Kennzahlen sind ebenfalls relational berechnete Kennzahlen. Sie werden in der Faktentabelle berechnet und verwenden Basiskennzahlen als Grundlagen für die Berechnung (z.B. bestimmte Filterungen aus Basiskennzahlen wie zum Beispiel „Anzahl Frauen“).
- Berechnete Kennzahlen hingegen sind nicht in der Faktentabelle relational vorberechnet. Sie existieren nur in den Würfeln oder Berichten und werden erst zur Laufzeit der Abfrage berechnet (z.B. „Anteil Frauen in Prozent“).
Und um hier für den Fachbereich, die Konzeptzionisten und die Entwickler ein gemeinsames Bild über die komplexen Zusammenhänge dieser Elemente darstellen zu können, sind Diagramme die wirkungsvollste Methode.
Kommunikation mit dem Fachbereich
In großen Systemen mit verschiedenen Teilverfahren bzw. Fachbereichen sowie hunderten Kennzahlen und Hierarchien ist es essentiell, den Überblick zu bewahren. Die Gefahr ist hoch, dass fachlich identische Kennzahlen oder Hierarchien redundant angelegt werden. Das Folgeproblem besteht dann darin, dass sich Kennzahlberechnungen oder Hierarchieeinträge unterscheiden oder mit der Zeit auseinanderlaufen.
Später eine Vereinheitlichung zu schaffen, ist dann meist sehr teuer.
Beispielsweise ein Fachbereich beauftragt eine neue Gebietshierarchie. Ein Dimensionsdiagramm kann hier eine gute Diskussionsgrundlage sein, um darzustellen, welche Ebenen im aktuellen Dimensionsbaum zur Verfügung stehen und welche Hierarchien bereits existieren. Bei Systemen an denen verschiedene Fachbereiche beteiligt sind, ist die Vereinheitlichung von Dimensionen oft ein schwieriges Thema.
Modellierungswerkzeug hilft
Innovator von MID bietet hier die Möglichkeit, alle relevanten OLAP-Elemente zu modellieren und über verschiedene Diagrammtypen logisch und visuell miteinander in Beziehung zu bringen. Hierbei orientiert man sich an der multidimensionalen Modellierungsnotation ADAPT. Bei dieser konzeptionellen Modellierung ist man komplett unabhängig von bestimmten Frontend-Tools und auch der Technologie (ROLAP, MOLAP oder HOLAP).
Innovator bietet außerdem den großen Vorteil, neben der OLAP-Modellierung sowohl das Datenmodell als auch die ETL-Prozesse integriert in einem Modell abzubilden. Somit ist der direkte Zusammenhang der OLAP-Elemente mit dem darunterliegenden Datenmodell abgebildet und greifbar. Jede Dimensionsebene ist direkt mit einer Dimensionsentität verbunden. An dieser Entität können dann sogar die Dimensionsausprägungen gespeichert werden. Die Kennzahlen sind direkt mit einer Faktenentität verbunden.
Fazit
Aufgrund der aufgezeigten Risiken und der Komplexität der Auswertungsebene, ist eine OLAP-Modellierung oft sehr sinnvoll. Vor allem in der Diskussion mit dem Fachbereich dienen die OLAP-Diagramme, um ein gemeinsames Verständnis über Kennzahlen und Hierarchien zu bekommen.
MID Blog Newsletter abonnieren