c't 19/2021
S. 132
Praxis
Excel Power Query
Bild: Rudolf A. Blaha

Mit spitzen Fingern

Mit Power Query Daten aus PDF-Dateien in Excel importieren

Tabellen aus PDF-Dokumenten zu fischen und in Excel zu übertragen, ist normalerweise ein mühseliges Unterfangen – mit Excels Power Query hingegen ein Kinderspiel.

Von Stefan Wischner

Der wöchentliche Vertriebsbericht liegt als hübsch formatiertes PDF-Dokument im Postfach. Das ist zwar schön anzusehen, system- und softwareunabhängig, aber leider auch eine Sackgasse für die Daten. Wollen Sie Inhalte daraus mit Excel weiterverarbeiten, wirds mühsam: PDF-Datei in einen Editor laden (zum Beispiel Foxit, Acrobat oder Microsoft Word), die Tabelle(n) ausfindig machen, mit Maus oder Tastatur markieren, in die Zwischenablage kopieren und in ein Excel-Arbeitsblatt einsetzen. Dann folgt meist langwierige Nacharbeit.

Ob das überhaupt klappt, hängt unter anderem vom Format der PDF-Datei ab – zum Beispiel davon, ob die Tabelle dort als Tabellenobjekt oder nur in Form einzelner Textblöcke gespeichert ist. Oft scheitert das Unterfangen schon am Markieren im PDF-Editor. Viel eleganter geht es mit Excels Power Query, einem Bestandteil des Power-BI-Add-ins in jüngeren Excel-Versionen.

Kommentare lesen (3 Beiträge)