c't 26/2020
S. 138
Wissen
PySummarization
Bild: Albert Hulm

Kürze Würze

PySummarization kürzt lange Texte automatisch

Die Python-Bibliothek ­pysummarization wählt aus ­beliebigen Texten vollauto­matisch die relevantesten Sätze für eine Zusammen­fassung. Das dafür nötige KI-Modell ­installiert sich fertig trainiert mit der Bibliothek.

Von Pina Merkert

Die To-do-Liste ist länger als die Chinesische Mauer und die Deadline war gestern. Just in dieser Hektik kommt ein neues Memo vom Chef. Ein schneller Blick zwischen den dringenden Aufgaben offenbart: Es füllt vier Bildschirmseiten – ohne Bilder! Ein als Antwort gechattetes „tl;dr“ („too long; didn’t read“) kommt beim Chef nicht gut an. Da wäre es sozial verträg­licher, erst mal nur eine kurze Zusammenfassung zu lesen und später, wenn der Stress abgeklungen ist, den Rest. Aber wer schreibt die Zusammenfassung?

Die Antwort ist: der Rechenknecht, der auch sonst alle nervigen Aufgaben abnimmt! Konkret: die Python-Bibliothek pysummarization. Das Erstellen automatischer Zusammenfassungen ist schon seit vielen Jahren Forschungsgegenstand beim Natural Language Processing (NLP), zuletzt gern mit lernfähigen Modellen aus der KI. Die Python-Bibliothek bringt die bewährtesten Methoden aus dem Werkzeugkasten der NLP-Forscher mit und kredenzt sie so, dass man sie mit wenigen Python-Zeilen benutzen kann. Die nötige KI ist fertig trainiert und funktioniert nicht nur mit englischen, sondern auch mit deutschen Texten. Um die Installation in die virtuelle Python-Umgebung kümmert sich der Python-Paketmanager pip:

Kommentare lesen (8 Beiträge)