c't 11/2018
S. 108
Hintergrund
Fußball-WM: Big Data im Sport

Quadratur des Fußballs

Fußball und Data Mining

Fußballwetten, optimales Training und der nächste Transfercoup haben eines gemeinsam: Für den Erfolg braucht man nicht nur eine gute Nase, sondern Daten, Daten und nochmals Daten.

Bei der Datenerfassung im Profi-Fußball unterscheidet man vier große, teils überlappende Anwendungen: die Vorhersage von Spielergebnissen, die Bewertung von Spielern für Transferzwecke (Scouting) sowie Optimierung des Trainings und der Taktik. Dafür setzen Forschungsinstitute und Firmen entweder Video-Analysen oder das Tracking unter Einsatz der Satelliten-Navigation ein.

Forscher aus dem Bereich Machine Learning sehen im Fußball eine Herausforderung, neue Algorithmen zu entwickeln und zu prüfen. So liefern sie deskriptive und prädiktive Analysen zu Fußballspielen und Spielerleistungen. Ein Beispiel dafür ist die „Open International Soccer Database“. Das offene Wissenschaftsprojekt soll als Grundlage für die Vorhersage von Spielergebnissen dienen (siehe ct.de/yxgq). Um die reine Vorhersage drehen sich auch diverse Lehr-Videos wie das des KI-Experten Siraj Raval. Dafür dürften sich Kunden von Wettbüros interessieren.

Scouting

Um Geld geht es aber in allen Bereichen. Beim Scouting wollen Spielerbeobachter schlicht Investment-Fragen beantworten: Welchen Spieler sollte ein Verein verpflichten und wie viel Geld sollte ihm das wert sein? Scouts sind es auch, die das Datensammeln im Fußball Anfang der 90er Jahre begründet haben. Tabellen sollten helfen, Spieler und Mannschaften verschiedener Länder zuverlässiger zu vergleichen als nur anhand des Eindrucks von Beobachtern. Dazu gehörten zunächst die Zahl der Ballkontakte pro Spiel, Passquoten, Laufleistungen und dergleichen.

Heute werden viele dieser Daten maschinell von Dienstleistern mittels Video-Analysen erfasst, etwa Zweikämpfe oder Ballbesitzanteile. Zu den Anbietern zählen GSN, Stats (ehemals Prozone), Onsideanalysis, Opta Sports oder auch das Potsdamer Institut für Spielanalyse. Die Bundesligavereine beliefert die Münchener Firma deltatre.

Den tiefergehenden Analysen geht es um ein genaues Verständnis von Spielabläufen und um noch genauere Quantifizierung von Spielerfähigkeiten. Im kommerziellen Bereich gibt es verschiedene Bewertungssysteme – darunter etwa den GSN-Index der Sandhausener Firma GSN oder den xG-Wert. Der xG-Wert liefert zum Beispel für Stürmer das Verhältnis zwischen tatsächlich erzielten Treffern und Treffern, die sie hätten erzielen können. Grundlage sind Spielsituationen, Winkel und Entfernung zum Tor oder auch die Torwartposition. Gute xG-Werte von noch unbekannten Spielern sind ein beliebtes Handelsgut.

Handkorrigiertes

Manche Anbieter korrigieren ihre Daten per Hand, bevor sie Vereine und Forschungsgruppen erhalten. Darin suchen Spielanalysten und Scouts Querverbindungen und Trends mittels statistischen Methoden (Data Mining). Manche Sport-Universitäten, darunter die Kölner Sporthochschule, bieten daher entsprechende Studiengänge an, auch Fernstudien sind möglich (siehe ct.de/yxgq).

Data Mining ist nicht immer Big Data: Forschungsgruppen wie die von Professor Memmert an der Sporthochschule Köln erhalten von Dienstleistern simple Excel-Tabellen zur Auswertung.

Doch Data Minig ist nicht immer Big Data mit einem Rechenzentrum dahinter. Beispielsweise nutzt die Arbeitsgruppe von Professor Daniel Memmert an der Sporthochschule Köln für ihre Forschung überschaubare Excel-Tabellen, die deltatre zuliefert (ehemals Impire bzw. ran-Datenbank). Zur Auswertung genügen handelsübliche Laptops und Algorithmen in Pascal.

Dr. Robert Rein von der Sporthochschule Köln erzeugt aus großen Datenkolonnen anschauliche Heat-Maps. Um den Wirkungsbereich einzelner Spieler zu verdeutlichen, möchte er künftig auch Richtungsparameter auswerten.

Daraus gewinnen Memmert und Kollegen etwa Heat-Maps, die den Wirkungsbereich einzelner Spieler visualisieren. Auch bilden sie Strategien von Mannschaften ab, um auf deren Effektivität rückzuschließen. Computergenerierte Raster auf Standbildern helfen, Lücken in Defensivformationen zu erkennen, die zu Gegentoren führen. Auch die von TV-Sendern gelegentlich ins Feld geführte Zahl überspielter Gegner pro Pass (Packing-Rate) liefert ein Analyse-Tool der Kölner.

40 Prozent Zufall

Auch Memmert und seine Mitarbeiter wollen die Faktoren ermitteln, die über Sieg und Niederlage entscheiden. Lange galten der Ballbesitz und die Laufleistung von Mannschaften als entscheidende Faktoren für Siege. Doch „erfolgreiche Teams wie der FC Barcelona oder die Bayern haben oft eine geringere Laufleistung und sind trotzdem torgefährlich“, erklärt Memmert.

Man weiß heute immerhin, dass auch das Positionsspiel ein entscheidender Faktor sein kann. Aber 40 Prozent der Aktionen, die zu Toren führen, schreiben Forscher noch immer dem Zufall zu. Dazu gehören ungeahndete Abseitsstellungen, Eigentore und, wie Torwart-Legende Oliver Kahn weiß, auch Torwartfehler. Vor rund zehn Jahren betrug der Wert sogar 47 Prozent. So ist auch zahlenmäßig sichtbar, warum die Entschlüsselung des Fußballs ein mühsames Geschäft ist.

Jenseits der Spielanalyse bieten Firmen Trainingsunterstützung unter Einsatz von Wearables mit Fitness-Trackern auf Basis von GPS-Empfängern. Das australische Unternehmen GPSsports gehört zu den Vorreitern. Zu den Kunden, die den selbstentwickelten Brustgurt der Firma tragen, zählen die Erstliga-Klubs Chelsea und Valencia aus England und Spanien.

Trainingsoptimierung

Zum Kasten: Tracker für Freizeitkicker

Wearables liefern Daten etwa zur Geschwindigkeit, Atem- und Herzfrequenz, aber auch Bewegungsprofile und manche sogar den Hormonspiegel. Zu den Sensoren zählen Puls- und Beschleunigungsmesser, Gyroskopen und Magnetometer. Künftig könnten unter der Haut implantierte Chips hinzukommen.

Trainingswissenschaftler nutzen die Daten, um Regeneration und Heilung zu optimieren und Belastungen anzupassen. Die Hoffnung ist, Schnelligkeit, Koordination, Beweglichkeit oder Ausdauer zu verbessern. Die Versprechen sind groß, doch die Ergebnisse zumindest schwer zu überprüfen – der Heilungsfortgang des fußkranken Nationaltorwarts Manuel Neuer ist monatelang und noch kurz vor dem Start der WM in Russland Gegenstand von Spekulationen.

Die Messwerte lassen sich auch während des Spiels erheben, um quantitative Aussagen über den Ermüdungszustand von Spielern zu treffen. Die Entscheidung trifft ein Trainer natürlich weiterhin im Kontext – ein müder, aber hochmotivierter Spieler bewegt unter Umständen mehr als einer, der schon an den nächsten Verein denkt. (dz@ct.de)