Alteryx anwenden Teil 1: Mehrere Excel-Files einlesen und zusammen weiterverarbeiten

Author Image

Von Arno Bürgin

26 September 2019

Wir haben uns drei häufige Probleme im Bereich der Datenverarbeitung ausgesucht und präsentieren euch in drei aufeinanderfolgenden Blogeinträgen, wie man jeweils eines dieser Probleme im Alteryx Designer angehen kann. Heute ist nun Blogeintrag #1 an der Reihe, in welchem wir uns Excel ein bisschen zur Brust nehmen.

Eines ist klar: Excel ist ein super Tool für Datenbearbeitung. Entsprechend ist Excel überall anzutreffen. Und wo Excel verbreitet ist, da wird viel von Hand erledigt. Spreadsheets und Copypaste; das geht Hand in Hand. Moderne Unternehmen führen eine etwas feinere Klinge und automatisieren Aufgaben, die a) ziemlich langweilig sind und b) in hohem Masse aus CTRL+C und CTRL+V bestehen. Dadurch bleiben die Köpfe der Arbeitnehmer frei für die wirklich spannenden Aufgaben – das Kopieren von Daten von A nach B gehört nicht dazu.

Anwendungsfall: Mehrere Excel-Files einlesen und gemeinsam weiterverarbeiten

Ein konkretes Beispiel: Nehmen wir an, du bist mit der Aufgabe betreut worden jeden Monat den durchschnittlichen Energieverbrauch über verschiedene Produktionsstätten hinweg zu berechnen. Die Daten werden von deinen Kolleginnen und Kollegen in der Produktion extrahiert und dir als Excel-File geschickt:

Leider enthält jedes der Files fünf Sheets:

Als geübter Excel-Krieger ist das natürlich kein Problem. Nach einem halben Arbeitstag präsentierst du stolz diese eine Kennzahl, die eigentlich das Ziel deiner Aufgabe war. Und das ist genau der springende Punkt: Die Kennzahl und die dazugehörige Analyse verkommt zur Nebensache.

In Alteryx Designer ist das Ganze etwas einfacher und sieht von Anfang bis Ende so aus:

Das sieht jetzt auf den ersten Blick vielleicht komplizierter aus, als es ist. Nachfolgend erklären wir dir die einzelnen Schritte etwas genauer.

Schritt 1

Im Input-Tool wird der Dateipfad angegeben, um die Excel-Files einzulesen.

 Schritt 2

Im Macro-Tool lässt sich derselbe Arbeitsschritt beliebig oft wiederholen. Hier ist es so konfiguriert, dass Alteryx ein Excel-File einliest und die Daten Sheet für Sheet importiert werden. Danach fährt das Macro mit dem nächsten File weiter und arbeitet auch dort ein Sheet nach dem anderen ab. Anstelle von fünf Files mit jeweils fünf Sheets haben wir schliesslich nur noch eine einzige Tabelle in Alteryx, die sämtliche Daten enthält:

Schritt 3

Im Dynamic Rename-Tool wird die Referenztabelle verbunden:

Dadurch werden die Spaltennamen automatisch neu benannt. Auch falls beim nächsten Excel-File die Reihenfolge der Spalten anders sein sollte oder andere Namen vorkommen sollten.

Schritt 4

Das RegEx-Tool bereinigt Daten in Windeseile. In diesem Beispiel werden dadurch diverse Störzeichen in der dritten Spalte entfernt. das Potential dieses Tools ist riesig: RegEx erlaubt die Datenbereinigung langer Zeichenketten, die Extraktion gewisser Zeichenfolgen aus komplexen XML-Strukturen und vieles mehr.

Schritt 5

Das Select-Tool bringt die Spalten in die gewünschte Reihenfolge und benennt diese auf Wunsch um. Auch das Datenformat lässt sich mit dem Tool wechseln (bspw. von numerischen Daten zu Stringdaten):

Schritt 6

Auch das Summarize-Tool bietet eine Vielzahl von Möglichkeiten. In diesem Fall berechnet es den Minimum, Maximum und Durchschnitt der Spalte Energieverbrauch:

Schritt 7

Das Output-Tool exportiert die Daten im gewünschten Format an den gewünschten Speicherort, beispielsweise im Excel-Format xlsx. Fertig!

Bonus! Einmal erstellt - für immer erledigt

All diese Arbeitsschritte hätte man natürlich auch in Excel erledigen können – in Alteryx geht das ganze allerdings wesentlich schneller, entspannter, mit mehr Funktionalitäten, mit dokumentierter Nachvollziehbarkeit, mit der Möglichkeit des Einfügens von Arbeitsschritten sowie deutlich geringerer Fehleranfälligkeit. Ausserdem: Alteryx bietet die Möglichkeit des Automatisierens. Mit wenigen Klicks ist festgelegt, wann und wie oft der Workflow gerechnet werden soll:

Das heisst solange die Ausgangsdaten im gewünschten Ordner sind, ist diese Arbeit zukünftig erledigt – kein CTRL+C mehr, kein CTRL+V mehr, kein Suchen & Ersetzen – und du kannst dich den wichtigen Aufgaben widmen.

Und, konnten wir dein Interesse für Alteryx wecken? Falls ja, kannst du eine kostenlose Testversion herunterladen und das Tool einfach mal selbst ausprobieren. Und solltest du Fragen haben, zeigen wir dir gerne, was Alteryx so alles kann.

Content


Twitter


Adresse

St. Jakobs-Strasse 3, 4052 Basel, CH

Telefonnummer

+41 (0)61 551 0012

Linkedin

banian-ag

Wir freuen uns, von dir zu hören