Datenvisualisierung mit Microsoft Power BI – Ein Einblick

Dieser Blogbeitrag behandelt den Analysedienst Power BI von Microsoft und zeigt die Möglichkeiten für Auswertungen anhand eines Beispiels auf. Als Einführung wird kurz die grundlegende Funktionsweise von Power BI beschrieben.

Funktionsweise von Power BI

Power BI ist ein cloudbasierter Analysedienst, der es Benutzern ermöglicht Daten einfach zu visualisieren und zu analysieren. Es können Daten aus mehreren Datenquellen z.B. aus Excel- oder CSV-Dateien sowie aus SQL Server Datenbanken geladen und strukturiert werden. Hierfür werden in Power BI Funktionen von Power Query, Power Pivot und Power View kombiniert. Der Dienst steht in der Grundversion als Cloud- und Desktop-Anwendung kostenfrei zur Verfügung. Mit Power BI ist es möglich Abfragesammlungen, Datenverbindungen und Berichte zu erstellt und zu verwalten sowie diese mit anderen Benutzern zu teilen.

Datenimport in Power BI

In Power BI werden neue Daten über das Menüband und die Schaltfläche Daten abrufen z.B. als Excel-Datei hinzugefügt. Hierbei kann zwischen verschiedenen Dateitypen ausgewählt werden.

 

 

Anschließend öffnet sich ein Fenster für die Dateiauswahl. Wird hier eine Datei angegeben und über die Schaltfläche Öffnen bestätigt, öffnet sich eine Datenvorschau. Im Beispiel erfolgt der Import einer Datei mit der Bezeichnung „Verkäufe“. Diese beinhaltet Verkaufszahlen von Kunden. Wenn die Daten in der Datei bereits aufbereitet sind, können diese über die Schaltfläche Laden direkt geöffnet werden. Es empfiehlt sich i.d.R. zunächst die Daten über die Schaltfläche Bearbeiten im Power BI Abfrage Editor zu öffnen und zu überprüfen. Neben Formatierungen und Bearbeitungen von Zeilen und Spalten kann im Editor auch der Datentyp angepasst werden.

 

 

Power BI weist den Spalten auf Grundlage der enthaltenen Daten automatisch einen Datentyp zu. Aufbauend auf den Datentypen bildet die Anwendung anschließend die Dimensionen und Kennzeichen für die Auswertungen. In unserem Beispiel entfernen wir an dieser Stelle die Spalte Referenz, da diese nicht benötigt wird, und ändern den Datentyp der Spalte Auftragsnummer auf Text, damit die führenden Nullen erhalten bleiben.

 

 

Vorgenommene Änderungen werden hierbei protokolliert und können in den Abfrageeinstellungen > ANGEWENDETE SCHRITTE verwaltet und rückgängig gemacht werden.

 

 

Durch die automatische Zuweisung der Datentypen für jede Spalte, wird ein entsprechender Schritt Geänderter Typ angelegt. Wird der Schritt entfernt, erhalten alle Spalten den Datentyp „Beliebig“, so dass die Kennzahlen anschließend nicht automatisch gebildet werden können.

 

Es ist möglich zeitgleich an mehreren Dateien zu arbeiten und diese parallel zu öffnen. Alle geöffneten Dateien werden unter Abfragen angezeigt.

 

Über die Schaltfläche Schließen und übernehmen im Menüband am Reiter Start wird die Bearbeitung abgeschlossen. In unserem Beispiel wird neben der Datei mit den Verkaufszahlen auch eine Datei mit den Kundendaten geladen.

 

Visualisierung der Daten

Durch das Beenden des Abfrage Editors werden die Daten als Dimensionen oder Kennzahlen im Hauptfenster geöffnet. Die Anzeige der vorhandenen Daten erfolgt unter Felder. Eine Bearbeitung ist per Drag and Drop möglich. Dafür sind die Dimensionen oder Kennzahlen entsprechend auf die Spalten und Werte des Visualisierungsbereichs zu ziehen. Im Beispiel wurde eine Matrix mit den Dimensionen Auftrags-, Kunden- und Artikelnummer sowie den Kennzahlen Auftragsmenge, Verkaufspreis und Auftragsbetrag erstellt. Eine Aufwertung der Darstellung erfolgt durch das Hinzufügen eines Säulendiagramms.

 

 

Die Anzeige der Daten in der Matrix kann durch das Anklicken einer Säule gesteuert werden. Auf diese Weise lassen sich die Verkaufszahlen für einen ausgewählten Kunden anzeigen. Des Weiteren können die Ergebnisse über die Filter im Visualisierungsbereich eingeschränkt werden und hierüber beispielsweise auch ein Kunde ausgewählt werden. In der Matrix werden die Zwischensummen für jede Dimension angezeigt. Ist dies nicht gewünscht, so kann die Matrixeinstellung Zeile mit Gesamtmenge deaktiviert werden.

 

 

Im nächsten Schritt erfolgt in unserem Beispiel eine Erweiterung um eine Kundendimension sowie eine Datumsdimension.

 

Die Kundendimension liegt als weitere Datei vor und kann wie zuvor am Reiter Start über Daten abrufen importiert werden. Das Hinzufügen der Datumsdimension ist auch direkt in Power BI über eine entsprechende Abfrage möglich. Hierfür wird im Menüband über den Reiter Modellierung eine Neue Tabelle erstellt.

 

 

Durch Anklicken der Schaltfläche Neue Tabelle erscheint eine Eingabezeile in der DAX Ausdrücke eingegeben werden können. Über DAX (Data Analysis Expressions) können Funktionen, Operatoren und Konstanten verwendet und über Formeln/ Ausdrücke aufgerufen werden. Folgender Ausdruck ermöglicht die Erstellung einer Datumsdimension mit den Spalten Datum, Jahr und Monat.

 

 

Datum =
ADDCOLUMNS (
CALENDAR (DATE(2000;1;1); DATE(2025;12;31));
„Datum“; FORMAT ( [Date]; „YYYY-MM-DD“ );
„Jahr“; YEAR ( [Date] );
„Monat“; FORMAT ( [Date]; „MM“ )
)

 

Um diese Datumsdimension mit den vorhandenen Daten zu verknüpfen muss ggf. eine Beziehung zwischen den Tabellen erstellt werden. Dies kann im Menüband über den Reiter Modellierung und die Schaltfläche Beziehungen verwalten erfolgen. Im sich öffnenden Fenster kann über die Schaltfläche Neu eine Beziehung zwischen den Tabellen hergestellt werden, indem die Tabellen über Dropdown Listen ausgewählt werden. Anschließend kann eine Verknüpfung zwischen den Tabellen über entsprechende Schlüsselspalten, durch Auswahl der Spalten direkt in den Tabellen, hergestellt werden. Nach Auswahl der Tabellen und Spalten muss die Kardinalität der Beziehung, Eins-zu-Eins (1:1), Eins-zu-Viele (1:n), etc., angegeben werden. Ist die Checkbox Diese Beziehung aktivieren gesetzt, so kann über die Schaltfläche OK die Beziehung erstellt werden.

 

 

Anschließend kann das Datum per Drag and Drop auf die Spalten der Matrix gezogen werden. Mit dem Hinzufügen der Datumsdimension erhalten wir die fertige Auswertung in diesem Beispiel. Die Auswertung kann anschließend im Menüband über die Schaltfläche Veröffentlichen mit anderen Benutzern geteilt werden.

 

 

Auch wenn mit Power BI einfach und schnell verschiedene Datenquellen eingebunden und ausgewertet werden können, empfiehlt sich die Datenhaltung in einem Data Warehouse, um aktuelle und historische Unternehmensdaten performant und sicher zu verwalten. Für die Anbindung eines Data Warehouse stehen in Power BI ebenfalls Möglichkeiten zur Verfügung. Die Thematik rund um das Data Warehouse wird in einem weiteren Blogbeitrag behandelt.