c't 3/2017
S. 70
Trend
Automatische Texterstellung
Aufmacherbild

Den Unterschied merkt man nicht

Automatische Texterstellung setzt sich durch

Algorithmen schreiben schneller und billiger als Menschen. Ihr Hauptvorteil ist jedoch: Sie können ihre Texte dynamisch an die Leser anpassen. Den Online-Handel wird das schneller verändern als den Journalismus.

Vor acht Jahren wurde Saim Alkan plötzlich klar, dass er sein Unternehmen umbauen musste. Die Redakteure seiner Stuttgarter Agentur Aexea verfassten damals Texte für die Webseiten von Kunden, zu rund einem Euro pro Wort. Dann entdeckte Alkan auf einer Messe einen Konkurrenten, der nur 20 Cent pro Wort verlangte: einen Online-Marktplatz, der Aufträge an freie Texter statt an angestellte Redakteure vermittelte.

Alkan dachte als Wirtschaftsingenieur direkt weiter: Er entschied, seine Dienstleistung zu automatisieren, um im Wettbewerb zu bestehen. Doch für die Software-Entwicklung fand er keinen Kreditgeber. „Die Banken sagten mir, kein Mensch braucht 100.000 Texte in der Woche“. Er verkaufte sein Haus und seine fünf Porsche 911, um die Entwicklung seiner Anwendung AX Semantics zu finanzieren. Aexea musste „ein Tal durchschreiten“, sagt er, aber heute erstellt seine Software fünf Millionen Texte pro Woche für 30 Kunden, mehrere Verlage haben in seine Firma investiert, er hat wieder 45 Mitarbeiter, wie vor der Umstellung. Die Redakteure texten nicht mehr für die Kunden, sondern schreiben Vorlagen für die Software und richten sie ein.

Neben Aexea haben sich weitere Anbieter etabliert: Retresco aus Berlin, Arria aus Großbritannien, Automated Insights und Narrative Science aus den USA plus einige kleinere Anbieter. Narrative Science ist mit 70 Kunden und 30 Millionen Dollar Investorenkapital der größte Player.

Bekannt wurden die Firmen vor allem durch den Einsatz ihrer Software im Journalismus. Zum Beispiel generiert die Nachrichtenagentur AP mit dem Automated-Insights-Programm Wordsmith jährlich 15.000 Artikel über Quartalsberichte von Firmen – 14-mal mehr, als die menschlichen Redakteure zuvor schafften.

In Deutschland textet Retresco-Software Berichte über Amateurfußballspiele („Die Gäste aus der Nordheide düpierten den VfL bereits in den ersten 45 Minuten. Binnen 15 Minuten schlug es im Gehäuse von Zakaria Chergui gleich dreimal ein“). Der Anbieter Textomatic beliefert das Handelsblatt mit Börsenberichten. Bei der Berliner Morgenpost schreibt ein Programm Texte zu Feinstaubwerten.

Für Händler wichtiger als für Medien

Es sieht jedoch nicht danach aus, dass die Technik die Medienbranche umkrempelt. Nur wenige interessante Geschichten beruhen allein auf Daten, selbst in Bereichen wie Sport und Finanzen. Und dort, wo Automatisierung möglich ist, dürfte sie kaum Jobs vernichten, sondern die Berichterstattung ausweiten. In Zeitungen und Sendern wandelt praktisch niemand hauptberuflich Tabellen in Fließtext um, höchstens in Agenturen tun das einige Mitarbeiter. Die AP zieht jedenfalls ein rundum positives Zwischenfazit zur Automatisierung: Sie habe den beteiligten Redakteuren etwa 20 Prozent ihrer Arbeitszeit freigeschaufelt, sodass diese nun mehr recherchieren und kommentieren.

„Mit journalistischen Anwendungen verdienen die Software-Anbieter nicht das große Geld“, sagt der Medienwissenschaftler Konstantin Dörr, der über algorithmischen Journalismus promoviert. „Die Anbieter nutzen Journalismus aber gern als Werbeargument. Denn wenn hier die hohen Qualitätsanforderungen erfüllt werden, kann man die Güte leicht auch auf andere Anwendungen übertragen.“

Gründlicher und schneller als den Journalismus verändert die Software andere Branchen – zum Beispiel den Handel. Bislang stellen viele Online-Shops die Produktdaten der Hersteller unverändert online. Wer im Google-Ranking aufsteigen will, braucht jedoch Texte, die kein anderer Händler hat. Eine Aufgabe, wie geschaffen für Texterstellungssoftware.

Zum Kasten: So funktioniert Texterstellungs-Software

In ein paar Stunden kann ein Redakteur einen Standardtext schreiben, eine Tabelle mit Produktdaten zuordnen, und die Software schreibt Hunderttausende Texte von allein. Händler wie Home24, Euronics und Hornbach gehören deshalb schon zu den Kunden von AX Semantics. Narrative Science hat „Dutzende E-Commerce-Anbieter“ als Kunden.

Auch die Finanzindustrie nutzt die Software: Die Algorithmen schreiben Berichte über Geldwäsche-Verdachtsfälle und informieren Kunden über die Wertentwicklung ihrer Portfolios.

Fake-Bewertungen vom Fließband

Richtig spannend wird die Software erst, wenn sie ihre Texte dynamisch an Zielgruppen oder einzelne Leser anpasst. Diese Entwicklung steht noch am Anfang, aber die Szenarien drängen sich auf: Online-Shops zeigen jedem Nutzer individuelle Texte, zugeschnitten auf dessen Geschmack, Geldbeutel und Standort, abgeleitet aus dem Surfprofil – wie ein Verkäufer in einem Geschäft, der den Kunden anhand der Kleidung einschätzt.

Wie bei jeder Technik können die Anwendungen legitim oder verwerflich sein: Klar gekennzeichnete individuelle Beratungstexte sind genauso denkbar wie Fake-Rezensionen und Fake-News.

So oder so wüssten die meisten Leser wohl gerne, wie der Text, den sie lesen, zustande gekommen ist. Studien haben ergeben, dass Leser nicht zwischen menschlichen und maschinellen Autoren unterscheiden können. Das ist auch nicht überraschend: Schließlich schreiben Menschen die Textvorlagen, und die Software variiert diese nach von Menschen gemachten Regeln.

Maschinentexte kann man höchstens entlarven, wenn sie nur einen kleinen Datensatz beschreiben und dadurch die eigentliche Nachricht vermasseln. Schießt Robert Lewandowski fünf Tore in neun Minuten, ist das für die Textroboter nur eine „Torflut“, für menschliche Autoren aber ein „Bundesliga-Rekord“. Saim Alkan betont jedoch, dass moderne Anwendungen wie AX Semantics längst mehrere Datensätze auswerten und historische Vergleiche ziehen können. (cwo@ct.de)