c't 16/2018
S. 174
Know-how
Keras Datengeneratoren
Aufmacherbild
Bild: Albert Hulm

Bilderstürmer

Mit Keras effizient Trainingsdaten fürs maschinelle Lernen generieren

Das Sammeln der Datensätze fürs Training von KI-Algorithmen kann ganz schön aufwendig sein. Berechnet man stattdessen die Trainingsdaten, spart das Arbeit und Speicher. Das KI-Framework Keras hilft bei der Implementierung in Python mit einer praktischen Basisklasse und parallelisiert die Berechnung für viele Prozessorkerne.

Der Urlaub ist vorbei und von der Speicherkarte wandern 4000 neue Urlaubsbilder auf die Festplatte. Der Finger am Auslöser war mal wieder nervös. Bei dieser Menge sind einige misslungene Schnappschüsse dabei: unscharf, verwackelt, verrauscht oder der Autofokus hat den falschen Bildteil ins Visier genommen. Die auszusortieren würde Stunden kosten – das muss besser gehen!

Wie schön wäre es, wenn der Rechner die unscharfen Bilder von alleine erkennen könnte. Mit einem einfachen Kantendetektor ist es aber nicht getan: Der würde auch bei verrauschten Bildern anspringen. Stattdessen sollte der Rechner auf Kanten achten, die regelmäßige Strukturen in bestimmten Bereichen bilden. Solch grobe Vorgaben in einen Algorithmus zu gießen würde monatelanges Feintuning erfordern – keine attraktive Option. Worauf es beim Bildersortieren ankommt, soll der Rechner lieber an Beispielen selbst lernen.