Nachdem die Zielsetzung insoweit eingeschränkt formuliert ist, dass die „Berechenbarkeit des Fußballs“ sich lediglich mehr oder weniger exakt der Bestimmung der Höhe der Wahrscheinlichkeiten für bestimmte (die relevanten) Spielausgänge widmen kann, darf man nun dennoch sehr getrost an die Arbeit gehen, wie man denn in die Nähe einer derartigen „Wahrheit“ – man philosophiere an dieser Stelle gerne über den Begriff „Wahrscheinlichkeit“; eine scheinbare Wahrheit? – gelangen kann. Die Überprüfung der ermittelten Werte auf ihre gute Näherung wird später an anderer Stelle durchgeführt. Hier sei diese aber vorweg erwähnt, damit die Bestimmung der Werte die scheinbare (!) Beliebigkeit verliert. Dies insbesondere deshalb (wiederholt) erwähnt, da eine Wahrscheinlichkeit, die für alle Spielausgänge bestimmt wird immer nur bedeuten kann – unabhängig von ihrer Größe: „Es kommt oder es kommt nicht.“ Ergänzt durch das: „Das wusste ich vorher auch schon.“ Nein, die Werte sind ziemlich gut bestimmt und dies lässt sich überprüfen.
Also, wenn man sich über Fußball und die relevanten, für einen Spielausgang verantwortlichen Parameter Gedanken macht, dann wird recht schnell klar, dass es die Tore sind, die dafür sorgen. Für Ballbesitz, Eckballverhältnis oder Anzahl der Torschüsse/Torchancen kann man sich, auf gut deutsch, „nischt koofen“. Das Runde muss in das Eckige. Dass ausgerechnet hier die Reporterweisheit, die an anderer Stelle so sehr zur nutzlosen, eher fehlerhaften Banalität erklärt wird, argumentativ verwendet wird, mag kurios erscheinen, geht jedoch mathematisch gesehen nicht anders.
Eine wichtige Vorüberlegung ist die: das ganze vorgestellte System funktioniert am Besten im Ligabetrieb. Obwohl auch für den Europapokal und andere internationale Vergleiche, inklusive der Länderspiele und die großen Turniere EM und WM ab der Qualifikation auch eine „Lösung“ gefunden wurde, genügt hier zunächst, auf die ursprüngliche Verwendung und Einführung des Systems zu schauen. Der wichtigste Grund, warum es gerade dort so gut funktioniert, ist an sich klar: Die Mannschaften spielen jedes Jahr (mit geringen Veränderungen) wieder und wieder gegeneinander und bereits in einer einzelnen Saison hat man zwei Vergleiche pro Paarung sowie eine komplette Jeder gegen Jeden Konstellation (dies nur im Verhältnis zu Europapokal oder Länderspielen, wo dies weit und breit nicht der Fall ist).
Erwähnenswert an dieser Stelle noch, dass es zumindest einen weiteren Ansatz gäbe, um sich den Wahrscheinlichkeiten gut anzunähern. Dieser ist der Ansatz, der beispielsweise vergleichbar beim Schach verwendet wird. Nur ist es beim Schach so, dass sich das Ergebnis tatsächlich nur durch Sieg – Remis – Niederlage darstellt, während es im Fußball einen 5:1 oder einen 1:0 Sieg gibt. Würde man die Höhe völlig vernachlässigen, machte man sicher auch einen Fehler. Insofern ist der hier verwendete Ansatz schon ein logischer, da er die Höhe der Ergebnisse mit einbezieht.
Im Fußball zählen also die Tore. Dazu gibt es eine Weisheit – der gegenüber relativ wenig Vertrauen besteht –, dass sich am Ende immer alles ausgleicht. Nun gut, die Zweifel sind eher philosophischer Art, ansonsten drückt es, grob gesprochen, die Verlässlichkeit von statistischen Zahlen aus, sowie man längere Zeiträume betrachtet, was zugleich wirklich ein mathematisches Gesetz ist. Die Frage bliebe nur: was ist ein langer Zeitraum? Na ja, intuitiv gesagt hier: je mehr Ergebnisse man hat, desto besser.
Im Ligabetrieb, demnach einem geschlossenen System, ist es so, dass jedes Tor, welches eine Mannschaft erzielt, eine andere kassiert. Insofern kann man recht gut die so genannte durchschnittliche Mannschaft festlegen als jene, die genau die Hälfte der durchschnittlichen Tore pro Spiel erzielt und die andere Hälfte kassiert. Wenn langfristig 2.9 Tore pro Spiel in der 1. Liga fallen, dann müsst sie als 1.45 pro Spiel erzielen und 1.45 pro Spiel kassieren.
Am besten ist es sowieso, das ganze Konzept anhand der 1. deutschen Bundesliga zu erläutern. Interessanterweise ist dabei festzustellen, dass die größte Konstante in dieser Spielklasse der Rekordmeister Bayern München ist. Logisch, dass sich keine Mannschaft aus der Abstiegszone dafür eignet, denn diese muss doch ab und an die Spielklasse verlassen. Aber es könnte auch ein Dauerverfolger sein, eine andere Mannschaft, die durchgehend an der Spitze mitspielt.
Nun gut, Ziel des Verfahrens ist es ohnehin, zunächst einmal die Torerwartungen zu bestimmen. Wie viele Tore wird diese Mannschaft pro Spiel (in etwa) erzielen, wie viele kassieren? Dies ist bereits Ausdruck und Maß für die Spielstärke. Je mehr Tore man erzielt pro Spiel, je weniger man kassiert, umso besser ist man. Es ist die Offensivstärke und die Defensivstärke der Mannschaft(en) die so zum Ausdruck gebracht wird. Dies sind aber zunächst nur Erwartungen durchschnittlicher Art.
Darüber hinaus muss immer berücksichtigt werden, dass es individuelle Parameter gibt, und allgemein gültige. Die Spielstärken der Mannschaft, gemessen in Torerwartungen für und Torerwartungen gegen, sind individuelle. Der Toreschnitt ist allgemein gültig für die Liga. Das erläuterte Verfahren wird zunächst hier Torerwartungen bestimmen lassen für eine ganz bestimmte Paarung. Wie man daraus dann die Wahrscheinlichkeiten ermittelt, wird an anderer Stelle erläutert.
Also, die Konstante Bayern München hat im langjährigen Mittel wirklich recht nahe an 2.0 Toren pro Spiel erzielt und 1.0 Tore kassiert (laut Ewiger Tabelle haben sie vor der Saison 2010/2011 in Wahrheit in 1534 Spielen ein Torverhältnis von 3254:1781 erzielt, welches Durchschnittswerten von 2.12 : 1.16 entspricht, jedoch gab es früher mehr Tore). Man kann also ruhig davon ausgehen, dass sich das wiederholt, bestätigt, ein guter Richtwert ist. Nun ist offensichtlich, dass sie gegen Mannschaften aus der unteren Tabellenhälfte diese Erwartung auf das Spiel bezogen übertreffen würden, gegen Mannschaften aus der oberen Hälfte es nicht erreichen könnten, wohlgemerkt als Torerwartungen. Statistisch gesehen sind Ausreißerergebnisse natürlich oft genug anzutreffen.
Wenn man zunächst den Parameter Heimvorteil, der zusätzlich zur Spielstärke einbezogen und berücksichtigt werden muss, weglässt, dann könnte man die Torerwartungen sozusagen für das Hin- und Rückspiel berechnen. Der Heimvorteil, der später mit eingerechnet wird, verläuft in Analogie zu der noch recht einfachen Formel für die Berechnung der Erwartung für eine Paarung nur anhand der Torerwartungen, nur würde sie bereits recht schnell unhandlich, unübersichtlich werden.
Also, gehen wir davon aus, dass Bayern Torerwartungen von 2:1 pro Spiel hat. Dann müsste das Ergebnis bei Einsetzen in die Formel ergeben, dass sich gegen die durchschnittliche Mannschaft exakt ihre Torerwartung errechnet. Sozusagen zur Überprüfung der Formel. Eine beliebige (andere) gegnerische Mannschaft müsste natürlich je nachdem, ob sie überdurchschnittlich oder unterdurchschnittliche ist, günstigere Werte oder eben ungünstigere erzielen.
Nun also konkreter: Um zu ermitteln, wie viele Tore Bayern München gegen eine andere Mannschaft zu erzielen erwartet, und dies so zu sagen auf neutralem Platz, muss man die Gegentore, die jene zu erwarten kassiert, mit dem Bayern Wert in das geeignete Verhältnis setzen. Einfach ausgedrückt könnte man sagen, dass die Bayern 2 (ihre eigenen Torerwartung) geteilt durch 1.45 (die durchschnittliche Anzahl der Tore, die eine Mannschaft in der Liga erzielt) = 1.38 Tore mal so viele Tore erzielen wie der Schnitt aller Mannschaften.
1.38 ist also ihr Wert auf jedes Spiel bezogen. Wenn der Gegner nun beispielsweise unterdurchschnittlich gut ist, also nehmen wir an, 1.6 Tore pro Spiel kassiert, dann wirkt sich dieser Wert ungünstig für sie, im Sinne von erwarteten Gegentoren aus, zugleich günstig auf die erwarteten Tore für die Bayern. Ihr Faktor für die Gegentore ergibt eine 1.6 (ihre Gegentorerwartung) / 1.45 (die durchschnittliche Gegentorerwartung) = 1.1, sie kassieren also pro Spiel 1.1 Mal so viele Gegentore wie die durchschnittliche Mannschaft.
Die beiden ermittelten Faktoren – Bayerns 1.38 und des Gegners ermittelte 1.1 wirken in die gleiche Richtung. Sie erhöhen die erzielten Tore von Bayern und die kassierten Tore des Gegners. Wer anders als Bayern soll ihnen in dem Spiel den (Gegentor-)Schaden zufügen? Demnach multipliziert man die beiden Werte. Das ist nur logisch. Für dieses Spiel würde Bayern noch mehr Tore als „normalerweise“ (also im Schnitt) erzielen. Wie viel mehr? Na, noch einmal 1.1 Mal mehr. Also haben wir einen Faktor für dieses Spiel von 1.1 * 1.38 = 1.52. Dieser gibt an, wie viel mal mehr Tore als durchschnittlich Bayern in diesem Spiel zu erzielen erwartet. In dieser Formulierung steckt drin, dass der ermittelte Wert von 1.52 – dieser ist „nur“ ein Faktor – mit der durchschnittlich erzielten Anzahl der Tore einer Mannschaft, also wiederum der 1.45, multipliziert werden.
Herauskommt als Torerwartung für Bayern demnach eine 1.52 * 1.45 = 2.20 Tore. Dies ist auch anschaulich sofort klar: Die anderen kassieren 1.1 Mal so viele als der Schnitt, Bayern erzielt im Schnitt 2, also 2 * 1.1 = 2.2. Das stimmt, klingt logisch, leuchtet ein, das passt. Zur Überprüfung kann man noch die durchschnittliche Mannschaft einsetzen, die logischerweise an dieser Stelle einen Faktor von 1.0 ergibt, was sich auf die Erwartung von erzielten Toren für genau überhaupt nicht auswirkt.