c't 12/2020
S. 126
Wissen
Sprachsynthese
Bild: https://replicastudios.com/

Stimmen mit KI kopieren

Chancen und Risiken der Sprachsynthese

Durch KI lässt sich die menschliche Stimme bereits klonen und verändern. Eine neue Software geht nun einen Schritt weiter und bietet Nutzern an, die eigene Stimme zu lizenzieren und zu verkaufen.

Von Kim Sartorius

Letzte Nacht träumte ich davon, auf einer Raupe zu reiten.“ Liest man diesen oder ähnliche vorgefertigte Sätze der Sprachsynthese-Software Replica vor, erstellt sie daraus eine Kopie der eigenen Stimme. Dabei gilt: Je mehr Stimmproben man einspricht, desto realistischer klingt das Resultat. Ob die Software die Stimme noch verbessern kann, sieht man an einer Bewertungsskala von null bis fünf. Bei null gibt es noch Verbesserungspotenzial – fünf steht dafür, dass Replica genug Material hat, um einen realistischen Stimm-Klon zu erzeugen. Um die kopierte Stimme in Aktion zu erleben, gibt man Texte in ein Dialogfenster ein und klickt auf Play. Schon hört man seine eigene Stimme Sätze sagen, die man nie aufgenommen hat.

Das Programm des australischen Herstellers Replica Studios ist nicht die erste Software ihrer Art. Sprachsynthese-Programme wie Lyrebired versprechen ähnliche Ergebnisse. Die Software des gleichnamigen kanadischen Start-ups hatte mit Videos für Aufsehen gesorgt, in denen sie bekannten Politiker selbst erstellte Sätze in den Mund legten. „This night I’m happy to share with you a short announcement about a cool start-up called Lyrebird.“ verkündet etwa Ex-Präsident Barack Obama. Dass es sich dabei um eine künstlich erzeugte Stimme handelt, fällt bei genauerem Hinhören zwar auf, es klingt aber schon sehr echt. Die Beta-Version des Programmes, die bis vor Kurzem online zur Verfügung stand, gibt es allerdings nicht mehr. Auch Adobe hatte mit seiner Software VoCo bereits 2016 einen funktionierenden Prototypen präsentiert. Das Programm schaffte es aber nie über die Beta-Phase hinaus. Ein Grund hierfür könnte die negative mediale Resonanz gewesen sein, die auf die Vorstellung der Software folgte. Der Gedanke an illegal verwendete Stimmkopien erschien damals noch abschreckend.

Kommentieren