Xtract: Auf der Basis der Anzahl von Datensätzen soll die prozentuale Verteilung unterschiedlicher Werte einer Spalte (hier die Fraktionendes Bundestages) berechnet werden.
Wissensstand: Level 2 ⇒ Solides Basiswissen in Excel, etwas Erfahrung in PQ
Prozentuale Verteilung nach Zeilen-Anzahl oder Werten
In meinen Schulungen habe ich (gefühlt viel zu oft) erleben dürfen, dass auch für „gestandene” Excel-User die Berechnung von prozentualen Anteilen eine immer wieder auftretende Hürde darstellt. Das gilt für Plain Excel und natürlich auch für Power Query und ebenfalls PivotTable. Laden Sie idealerweise die jeweils genannten Dateien von unserem Server herunter, sie dienen als Vorlage für die hier diskutierten Aufgaben.
Basis: Zeilen (Power Query)
Wie schon im plain-Excel-Abschnitt werden Sie die Datei mit den Bundestag-Mitgliedern verwenden, allerdings (natürlich) in unveränderter Form, also „jungfräulich” 😉. Dass Sie die Werte über den Weg Daten | Aus Tabelle/Bereich in den Power Query-Editor importieren, sollte Ihnen geläufig sein. Natürlich achten Sie dabei darauf, dass bei der Festlegung des Tabellen-Bereichs festgelegt wird, dass die Daten eine Überschrift haben. – Nach dem Import benenne ich die Query gleich zu RawData um, damit die Zuordnung der Daten auch durch die Namensgebung deutlich wird.
Löschen der ausgeschiedenen Bundestags-Mitglieder
In der PQ-Umgebung ist das Entfernen der ausgeschiedenen Mitglieder aus der Tabelle/Abfrage deutlich komfortabler als in Plain Excel (sofern Sie etwas Erfahrung mit PQ haben). Erweitern Sie die Spalte Fraktion und wählen Sie im Kontextmenü Textfilter | Endet nicht mit… Fügen Sie in das erste Eingabefeld ausschließlich den * ein. Nach einem OK ist das Wunschergebnis gegeben. Die Daten der nicht mehr im Bundestag vertretenen Personen sind tatsächlich gelöscht und nicht nur „unsichtbar” gemacht/gefiltert.
Berechnung der prozentualen Anteile
Wie in der Excel-Umgebung praktisch Standard gibt es mehrere unterschiedliche Wege zum Ziel. Ich zeige Ihnen hier eine Möglichkeit auf, die auch für Nicht-Profis gut nachvollziehbar sein sollte. Markieren Sie die Spalte Fraktion. Rechtsklick in die Überschrift und dann Als neue Abfrage hinzufügen. Automatisch wird eine Liste mit dem Namen Fraktion erstellt. Ein Klick auf das Symbol Statistiken unddanach Werte zählen. – Für mich ist Transparenz wichtiger als etwas mehr Tipp-Arbeit, darum benenne ich jetzt die eben erstellte Liste zu Anzahl um.
Wechseln Sie nun zur Abfrage RawData, indem Sie im linken Seitenfenster auf diesen Eintrag Klicken. Rechtsklick in Fraktion und Gruppieren nach… Den folgenden Dialog können Sie so belassen, denn es sollen ja aus der Spalte Fraktion die Anzahl des jeweiligen Fraktionsnamens berechnet werden:
Die Query „schrumpft” auf 4 Zeilen, je eine mit dem Namen der Fraktion (in der Reihenfolge des erstmaligen Auftretens) in der ersten Spalte; und der zweiten Spalte sind die berechnete Anzahl der Einträge aufgeführt, also die der jeweiligen Abgeordneten der Fraktion. Damit haben Sie alle erforderlichen Werte für die Berechnung der prozentualen Anteile. Markieren Sie die Spalte Anzahl. Wechseln Sie zum Menü Spalte hinzufügen | Standard | Division und tragen Sie als Divisor erst einmal eine beliebige Zahl ein; ich verwende 999, die kann ich leicht identifizieren 😉.
Power Query berechnet nun den prozentualen Anteil für jede Fraktion unter der Annahme, dass die Gesamtzahl der Abgeordneten 999 sei; so haben Sie es ja auch im Dialog eingegeben. Natürlich ist die Berechnung aus mathematischer Sicht richtig, das gewünschte Ergebnis aber nicht, denn es sind ja 631 Abgeordnete. Hinweis: PQ hat ja schon genau diese Zahl in der Liste Anzahl berechnet und abgelegt. Um den Wert (dynamisch) zu verwenden, markieren Sie in der Editier-Eingabezeile den Wert 999 und überschreiben diesen mit dem Namen der (Berechnungs-) Abfrage: Anzahl (Achtung, exakte Groß- Kleinschreibung!). Nach einem Klick in den Bereich unterhalb der Editier-Zeile oder einem einfachen Return werden die berechneten Werte umgehend auf die korrekten Werte angepasst. Ändern Sie nun die Überschrift der Spalte Division zu prozentualer Anteil und passen den Datentyp dieser Spalte auf Prozentwert an.
Das war’s. Nun noch Datei | Schließen & laden und beide Queries (RawData und Anzahl) werden in ein neues Tabellenblatt geschrieben. Es wäre gewiss eine gute Idee, die Abfrage RawData im Vorwege in beispielsweise prozentuale Anteile umzubenennen, da beim Speichern automatisch der Name der Abfrage als Bezeichnung für das Registerblatt übernommen wird. Über den Weg Schließen & laden in… hätten sie bequem erreichen können, dass beispielsweise die Liste Anzahl als Nur Verbindung gesichert wird und somit kein separates Tabellenblatt erstellt und genutzt wird. Nachträglich können Sie das Speichern-Verhalten wie hier beschrieben ändern.
Obwohl in Power Query das Zahlenformat der Berechnung die Prozent-Schreibweise ist, wird im Tabellenblatt die normale Fließkomma-Schreibweise verwendet. Formatieren Sie hier die entsprechende Spalte im Zahlenformat „Prozent Format” und passen Sie eventuell die Nachkommastellen auf eine oder zwei Stellen an. – Damit ist die Aufgabe auch in Power Query gelöst.
Teil 1 dieser Serie können Sie hier ansehen.
Rückmeldungen / Feedback gerne per Mail an mich (G.Mumme@Excel-ist-sexy.de)
Hat Ihnen der Beitrag gefallen?
Erleichtert dieser Beitrag Ihre Arbeit?
Dann würde ich mich über einen Beitrag Ihrerseits z.B. 1,50 € freuen … (← Klick mich!)