c't 18/2018
S. 72
Hintergrund
Spracherkennung
Aufmacherbild
Bild: Rudolf A. Blaha, Illustrator

Spracherkennung für alle

Mozillas Projekte Common Voice und DeepSpeech

Mozillas Versuch, mit Firefox OS ein Mobilbetriebssystem zu etablieren, endete im Fiasko, aber eines der dafür geplanten Features hat das Open-Source-Unternehmen auf eine interessante Spur geführt: Mozillas DeepSpeech hat das Zeug, das Internet zu verändern – demnächst auch das deutschsprachige.

Wenige Konzerne dominieren den Markt für Spracherkennung – insbesondere Google, Microsoft, IBM, Amazon und Apple sowie Nuance, dessen Technik hinter der Spracherkennung von Apples Siri steckt. Eine frei verfügbare Alternative zu deren etablierten Produkten wäre aus einer ganzen Reihe von Gründen interessant.

So würde ein Open-Source-System auch kleineren Herstellern und Kickstarter-Projekten ohne Lizenzgebühren offenstehen. Sie können auf diese Grundlage aufbauen und so den Vorsprung der etablierten Anbieter leichter aufholen. Denn um ein komplexes Spracherkennungssystem zu entwickeln, braucht es nicht nur Spezialisten für Maschinenlernen, sondern vor allem sehr viele Daten. Während diese bei Siri und ihren Freundinnen massenhaft auflaufen, haben es neue Marktteilnehmer bedeutend schwerer, an das begehrte Trainingsmaterial zu kommen. Die von Mozilla gesammelten Sprachdaten stehen ihnen frei zur Verfügung.