Die Idee, den Fußball „berechenbar“ zu machen, ist seitens des Autoren also bereits in dessen Kindheit geboren.  Anfang der 80er Jahre wurde es, dank des Zugangs zur Großrechneranlage, der Harris, an der Freien Universität Berlin plus der allmählich angeeigneten Programmierfähigkeiten immer konkreter. Die ersten Versuche, Prognosen zu erstellen, wurden unternommen.

Als 1988 der eigene PC erworben war, wurde das Projekt in Heimarbeit fortgesetzt. Pünktlich zur WM 1990 war es so weit: das erste lauffähige Programm konnte Quoten berechnen für alle möglichen Ereignisse der anstehenden Weltmeisterschaft.

Was waren nun die Grundlagen, worauf basierte das Programm, was konnte es, wie waren die Algorithmen? Nun, als allererstes mussten vernünftige Ranglisten her, die auf dem basierten, was nun mal den Fußball ausmachten: den Toren. Diese unterteilen sich in erzielte Tore und kassierte Tore. Wenn man aus diesen beiden Werten eine Spielstärkezahl machen möchte, dann müssen es also die erwarteten zu erzielenden Tore sein gegenüber den erwarteten zu kassierenden Toren.

Die drei resultierenden Probleme aus dieser Grundidee: a) wie berechnet man die Torerwartung für eine anstehende Partie, selbst wenn diese beiden Werte bekannt sind? Und b) wie ermittelt man die Werte?  Im Anschluss wäre c) wie pflegt und verändert man die Werte anhand der dann eintretenden Ergebnisse?

Die größeren Probleme daran sind sicher die Initialisierung der Zahlen sowie die das Problem c), die Anpassungsgeschwindigkeit. Problem b) ist ein rein mathematisches, welches von daher leicht lösbar war. Es gibt einen Toreschnitt des Events (der Liga oder, wie im ersten Fall, der WM), dieser wird mit einberechnet und die Werte untereinander in eine handliche, aber schlüssige Formel gepackt. Dazu sicher an anderer Stelle mehr.

Wenn man also Spielstärken für die Teams hätte in Form von erwarteten erzielten Toren und erwarteten kassierten Tore (sozusagen ein Maß für die Offensivstärke und die Defensivstärke beider Mannschaften), dann könnte man Torerwartungen FÜR EINE ANSTEHENDE PARTIE berechnen. Sobald man diese berechnet hat, kann man daraus Wahrscheinlichkeiten für die möglichen Partieausgänge 1 – X – 2 ermitteln, was zunächst über eine Simulation erfolgen sollte.

Wie bekommt man nun aber Spielstärken für die beiden Teams? Nun, man könnte sogar so vorgehen, dass man alle Mannschaften mit einem Durchschnittswert initialisiert und das Programm dann, mithilfe der richtige Updateparameter (das unter c) geschilderte Problem, wie passt man die Spielstärken aufgrund der realen Ergebnisse optimal an?), seinen Job tun lässt, bis man nach einigen Jahren vielleicht auf vernünftigen Werten landet. Dafür könnte man sogar die Daten von vergangenen Jahren nehmen, vielleicht 10 Jahre zurück, das Programm damit füttern und es so möglichst gute, praktisch verwendbare Werte ermitteln lassen. Dieser Weg wäre jedenfalls gangbar, jedoch wurde aus praktischen Erwägungen ein anderer gewählt.

Nur kurz eingeschoben: die Idee, die Mannschaften anhand der über die Jahre hinweg erzielten Tore und Gegentore geteilt durch die Anzahl der Spiele einzustufen ist der schlechtere, ein ungeeigneter Weg, genau betrachtet. Denn: die Mannschaften haben ja alle sehr unterschiedliche Gegner gehabt. Vor allem, wenn man an Länder (für die WM ja realistisch) denkt, die weit weg liegen und gar nicht untereinander spielen. So wären beispielsweise asiatische oder afrikanische Teams nicht vernünftig einstufbar, nicht anhand dieser Werte jedenfalls.

Für die WM wurde die Einstufung weitest gehend intuitiv vorgenommen. Es war ein erster Versuch (der gar nicht mal so schlechte Ergebnisse produzierte), jedoch wurde das Programm allmählich in den Ligaalltag eingeführt. Für Ligenbetrieb ist es eh optimal ausgelegt, da man dort oftmals über Jahre ein paar Konstante (Mannschaften) hat und weiterhin Jeder gegen Jeden zuverlässig, und das gar zwei Mal spielt.

Also: man hat irgendwann gute Einschätzungen für alle Teams (auf diesen Seiten wäre das zu finden unter „Spielstärkerangliste“) und kann die Teams anhand der eintretenden realen Ergebnisse gut anpassen, denn diese Veränderungen sind unabdingbar, und zwar nicht als Spielzeug, um die Rangliste zu Leben zu erwecken, sondern deshalb, weil Dinge sich stets und ständig und überall verändern. Da es hier um möglichst realistische Annahmen geht – daraus resultierend möglichst gute Prognosen –, muss es geschehen.

Nun hat man Torerwartungen für die einzelnen anstehenden Spiele. In der ersten Version nun wurden die Spiele simuliert, indem die erwarteten Tore auf die 90 Minuten verteilt wurden. Es gab quasi jede Minute eine Torchance, für jedes Team eine (nicht unrealistisch), die mit einer Chance von Torerwartung Team1 geteilt durch 90 verwertet wurde von Team 1 und mit Torerwartung Team 2 geteilt durch 90 für Team 2.

Da man jedoch längst die Beobachtung gemacht hatte, dass sich die Mannschaften viel weniger bekämpfen, so lange es Unentschieden steht, wurden die Werte für diesen Spielstand gedämpft, hingegen bei Führung für diesen oder jenen wurden sie entsprechend erhöht. So ergaben sich die ersten ganz guten Zahlen im Sinn einer Vorausschau.

Prognosen im Übrigen möge man bitte nicht falsch verstehen. Eine Prognose gibt lediglich die möglichst realistische Chancenverteilung an, niemals jedoch die „Prognose“, dass dieser oder jener das Spiel gewinnen wird oder diese oder jene Mannschaft ein Turnier oder eine Meisterschaft gewinnen wird.

Für die Langzeitwetten – also die Fragen, wer wird Meister oder wer steigt ab oder wer kommt in die Championsleague – wird eine Simulation ALLER AUSSTEHENDEN PAARUNGEN vorgenommen und dies wiederholt (derzeit für die hier vorliegenden Zahlen sind es stets 5000 Simulations Durchläufe) und im Anschluss die Abschlusstabelle gebildet aufgrund dieser simulierten Ergebnisse. Wer dann auf 1 steht, ist für diesen Durchlauf Meister, wer auf 17 und 18 steht steigt direkt ab und so weiter.

Zunächst an dieser Stelle so viel über das verwendete Programm. Man findet weitere kurze Hinweise unter den einzelnen Punkten, genau dort, wo auch die Zahlen veröffentlicht sind.

Ihre E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind mit * markiert.

Beitragskommentare