Wenn die beiden ein Match machen würden, sagen wir über 10 Partien, dann müsste der bessere der beiden beispielsweise 60% der Punkte erzielen, also 6 aus 10. Sollte das Ergebnis ein anderes sein, so würde man darauf schließen, dass sich entweder der eine verbessert oder der andere verschlechtert hat oder beides und würde die Spielstärken versuchen, angemessen zu korrigieren.
Um ein Beispiel zu geben: Spieler 1 erzielt 7 statt 6 Punkte. Dann war er anscheinend besser als zunächst angenommen. Seine Spielstärke würde angepasst werden. Umgekehrt war Spieler 2 womöglich überschätzt und seine Spielstärke wird nach unten korrigiert. Die Spieler machen ein weiteres Match. Allerdings müsste Spieler 1 jetzt schon 6.5 aus 10 erzielen, aufgrund der Korrektur der Spielstärken. Wenn er das tatsächlich erreicht, müsste man nicht korrigieren. Wenn er jetzt aber nur 5.5 erzielt, dann müsste man ihn wieder nach unten korrigieren und Spieler 2 nach oben.
Dadurch, dass man für viele Spieler dann schon eine Einschätzung hat, geht man davon aus, dass die Zahlen sich alle irgendwann so anpassen, dass sie mehr oder weniger genau ihre Spielstärken reflektieren und dass man für das Aufeinandertreffen zweier einander gänzlich fremder Spieler dennoch eine näherungsweise gute Prognose für die Verteilung der Gewinnchancen erstellen kann.
Falls diese Prognose allerdings nicht stimmt, so ist kein Schaden entstanden. Die Spielstärken werden einfach wieder korrigiert. Das Problem besteht darin, dass hier fehlerhafte Prognosen nicht in Form von Wetten überprüft werden können. Eine fehlerhafte Prognose aufgrund des Elosystems führt nur zu einer Korrektur in den Spielstärken, niemand verliert oder gewinnt Geld damit.
Ich selber habe übrigens mal, bereits ganz früh, 1981, bei einem Turnier in San Bernardino, mit meinem Freund Christian Maier, Wetten auf Schachpartien angeboten. Es war ein sehr familiäres Turnier und alle Teilnehmer haben mitgemacht, Wir haben sämtliche Partien des Turniers in Form von Quoten auf 1-X-2 angeboten und alle haben gewettet. Jeder immer so ein bis zwei D-Mark. Wie gut unsere Quoten waren kann ich überhaupt nicht mehr beurteilen. Wir hatten aber am Ende des Turniers einen ganz guten Gewinn erzielt. Das kann natürlich auch Glück gewesen sein.
- Eignung als Vorhersagesystem
Sollte das Elosystem also als Vorhersagesystem verwendet werden, so müssten einige Dinge verbessert werden. Zunächst mal ist die Aussage „Spieler 1 erzielt gegen Spieler 2 60% der Punkte“ nicht besonders gut geeignet als Prophezeiung. 60% können sein 6 Siege und 4 Niederlagen oder 2 Siege und 8 Remis oder irgendetwas dazwischen. Es ist eine Fragestellung, die im Elosystem nicht existiert.
Offensichtlich ist die Remiswahrscheinlichkeit sowohl Spielstärke- als auch Charakterabhängig. Bei schwächeren Spielern ist allgemein die Wahrscheinlichkeit für ein Remis geringer. Der Grund ist ganz offensichtlich: Die Fehler ergeben ständig einen großen Ausschlag zugunsten des einen oder zugunsten des anderen. Warum sollte es dann am Ende ausgerechnet keinen Ausschlag mehr geben und die beiden sich bei Remis treffen (zum Beleg schauen Sie bitte noch mal in das Kapitel „Spielentwicklungen“; dort kann man das im Diagramm bestätigt sehen).
Zusätzlich gibt es aber dennoch das Kriterium, wie ein Spieler charakterlich veranlagt ist. Es gibt also auch schwächere Spieler, die eher vorsichtig und ängstlich sind, damit zwangsläufig ihre Remiswahrscheinlichkeit erhöhen (als Beweis genügt schon die Überlegung, dass sie sowohl eher geneigt sind, ein Remis anzubieten als auch ein gebotenes anzunehmen). Genauso gibt es auch unter Großmeistern Spieler, die wenig friedfertig sind und stets auf Gewinn spielen, was zwangsläufig Risiken birgt, die auch in eine höhere Verlustwahrscheinlichkeit ergeben kann.
Die Remiswahrscheinlichkeit ist also teils individuell und teils allgemein von der Höhe der Spielstärke abhängig. Das müsste man zunächst als zusätzliche(n) Parameter einführen. Dann ist es ganz offensichtlich, dass der Anziehende Spieler, also der Spieler mit den weißen Steinen, einen Vorteil hat. Man nennt ihn auch den Anzugsvorteil. Datenbanken belegen, dass von allen Gewinnpartien ca. 70% auf die weißen Steine entfallen.
iv) Das Pauli-System
Das von mir vorgeschlagene System zur Berechnung der Wahrscheinlichkeitsverteilung ist selbstverständlich das so genannte „Pauli-System“. Die Formel habe ich bereits im Kapitel über Tennis hergeleitet. Jeder Spieler bekommt eine Spielstärke in Form einer Prozentzahl zwischen 0 und 1(00%). Die Verrechnung der beiden Spielstärkezahlen erfolgt analog zum Tennis. Das ergibt letztendlich, exakt vergleichbar mit Elo jedoch geradliniger, einfacher zu berechnen und auch zuverlässig sowie exakt, die Prozentverteilung für diese Partie.
Wenn man also zwei Spieler gegeneinander antreten lässt, der eine mit der Spielstärke 0.82 (=82%), der andere mit der Spielstärke 0.64 (=64%),
dann dividieren wir zunächst beide Spielstärken durch ihre Gegenwahrscheinlichkeit. 0.82/0.18 = 4.56. Spieler 1 ist also 4.56 Mal so stark wie der Durchschnittsspieler. Spieler 2 hat einen Wert von 0.64/0.36 = 1.78. Er ist also nur 1.78 Mal so stark wie der Durchschnittsspieler.
Das Verhältnis von Spieler 1 zu Spieler 2 ist, wie man es schon so ausspricht, ein Verhältnis. Verhältnisse sind, mathematisch gesprochen, Quotienten (also Brüche; brechen Sie jetzt aber nicht, und insbesondere nicht deswegen, mit ihrem Partner, bitte!). Also dividieren wir 4.56/1.78 und erhalten das Siegverhältnis von Spieler 1 zu Spieler 2 als eine 2.56. Also Spieler 1 gewinnt gegen Spieler 2 2.56 Mal so oft wie Spieler 2 gegen Spieler 1. Das müssen wir zurückrechnen in eine Prozentzahl, also dividieren wir 2.56/3.56 und erhalten die erwartete Punktausbeute für Spieler 1 in dieser Partie als eine 71.93%. Ich sage hier auch nur „Punktausbeute“, weil beim Schach genau 1 Punkt pro Partie vergeben wird. Also 1 insgesamt, so wie auch Wahrscheinlichkeiten für ein Ereignis in der Summe 1 ergeben müssen. Und die Punktausbeute setzt sich zusammen aus einem gewissen Anteil an Remis und einem weiteren aus Siegen. Wie groß diese jeweils sind, ist eine bisher noch offenen Frage.
- Die Reaktionszeit
Beim Elosystem werden die Spielstärken einfach nach einem vorgefertigten Muster angepasst. Das einem ein gutes Ergebnis eine Verbesserung in der Zahl einbringt, ein schlechtes eine Verschlechterung scheint offensichtlich. Aber die Frage ergibt sich hier wie beim Fußball: Wie stark (oder wie schnell) muss man auf Ergebnisse reagieren, um für die nächste Partie, das nächste Spiel, das nächste Match, eine möglichst gute Prognose zu erhalten. Diese Frage ist eigentlich objektiv. Nur wenn die Fragestellung weder existiert noch überhaupt für interessant erachtet wird, wird sie logischerweise einfach ignoriert.
Die Teilnehmer, hier Schachspieler finden sich einfach mit der vorgegebenen Reaktionszeit ab. „Wie viele Punkte habe ich gewonnen bei dem Turnier, wie viele eingebüßt bei jenem.“ Das ist die einzig relevante Frage. Und die wird beantwortet von dem System nach seinen Vorgaben. Die Frage: Wie viele hätte ich denn objektiv gewinnen/verlieren müssen, um für das nächste Turnier die bestmögliche Einschätzung meiner Chancen zu erhalten in jeder einzelnen Partie existiert nicht, ist untergeordnet oder irrelevant.
Ich behaupte indes, dass die Qualität und Eignung des Systems zum Messen von Spielstärken dann am größten ist, wenn die Prognosen, die es erstellt, möglichst gut sind. Das Elo-system funktioniert, es wird verwendet, jeder hat sich mit den Missständen abgefunden, kennt sie nicht oder hält sie für irrelevant.
Beim Pauli-System habe ich natürlich Lösungen für alle diese Probleme, versteht sich (irgendwie schwanke ich immer so zwischen Größenwahn und Irrsinn, Bescheidenheit, die auch falsch sein kann, und absoluter Ahnungslosigkeit, wenn ich nur das Substantiv von „devot“ noch kännte, das Passiv Konjunktiv Perfekt von „kennen“ kenn ich jedenfalls nicht, falls es so etwas überhaupt gibt. Aber dann müsste es halt erfunden werden, warum also nicht ich?). Der gute alte Pauli hat sich also mal wieder (ein paar) Gedanken (zu viel) gemacht.
Na gut, eigentlich habe ich nur alte Ideen übertragen. Aber immerhin. Also man hat eine Erwartung für eine Partie. Die ist, wie im obigen Beispiel, 71.93% der möglichen Punkte für Spieler 1. Anschließend hat man in der Partie ein Ergebnis. Sei es Remis. Dann hat man eine Abweichung Prognose-Ergebnis. Diese wäre hier 0.2193 Punkte. Diese hat Spieler 1, der Favorit zu wenig erzielt. Spieler 2 hat seine Erwartung um diese Punktzahl übertroffen. Man sollte also jetzt die Spielstärken beider in die richtige Richtung (und was kann an einer RICHTung überhaupt falsch sein? Ach ja, die Richtung!) korrigieren. Dazu verwendet man am besten einen Faktor, den man dann in den Nenner stellt und ihn somit zum Quotienten macht. Ich rätsle nur gelegentlich, ob ich für die miesen Kalauer im Text immer eine andere Schriftart verwenden sollte. Ihre Ansicht? Also beispielsweise beim Fußball rechne ich mit einem Spielstärkeupdatefaktor von 30. Das ist der über Jahre ermittelte „beste“ Wert.
Beim Schach könnte man natürlich ähnlich eine Optimierfunktion erstellen, die einem den bestmöglichen „updatefaktor“ beim Schach errechnet. Man probiert dabei, analog zum Fußball, mit einem set von bekannten Ergebnissen, die chronologisch geordnet sein müssen, alle möglichen updatefaktoren durch und nimmt den, der die geringste Abweichung Prognose-Ergebnis über alle Ergebnisse produziert hat. Denn die Prognosen werden ja anhand der aufgrund der dann probierten unterschiedlichen updatefaktoren veränderten Spielstärken jeweils veränderte Werte für die jeweils folgende Partie ergeben. Also man wird dementsprechend unterschiedliche Abweichungen pro updatefaktor erhalten.
Allerdings wäre auch das noch nicht ganz ausreichend. Denn es gibt offensichtlich Spieler, bei denen man schneller reagieren müsste und solche, bei denen man langsamer reagieren müsste. Das ist aber kein rein individuelles Problem sondern wird allein schon durch die Anzahl der gespielten Partien mitbestimmt. Ein 40-jähriger, von dem ich schon 1000 Partien in der Datenbank habe, wird durch zwei Niederlagen in Serie weniger zurückgeworfen als ein 17-jähriger mit bisher 5 Partien. So weit einleuchtend.
Also das Alter und die Anzahl der Partien sollten (und müssten) mitberücksichtigt werden. Das wäre bereits eine kleine Herausforderung an das Optimierprogramm, da es bei Anpassung mehrerer Parameter schon eines gehörigen Maßes an künstlicher Intelligenz bedarf, um beide gleichzeitig zu optimieren. Aber dennoch müsste es gemacht werden und man würde garantiert nicht schlechter als mit dem bisher verwendeten Elo-System fahren.
Eine weitere Frage bleibt dabei aber auch noch ungeklärt: Sollte man den Parameter Spielstärkeupdatefaktor darüber hinaus noch individuell gestalten oder zulassen? Dabei stößt man auf zwei Probleme: Zunächst scheint es relativ einleuchtend, dass es unterschiedliche Charaktere von Spielern gibt. Es gibt den so genannten „soliden“ Spieler, der ohnehin das Risiko scheut und darüber hinaus auch sehr konstant spielt. So ist es einfach. Und es gibt den risikofreudigen, der noch dazu häufig genug großen Spielstärkeschwankungen ausgesetzt ist. Das kann einerseits an den Risiken selber liegen, die er eingeht, und die dann gelegentlich „backfire“n, aber auch an dem Grundcharakter selber, der ihn in einer Gewinnserie mitreißt und immer weiter gewinnen lässt, leider aber ebenso bei einer Niederlagenserie.
Man hätte aber insbesondere das Problem der Akzeptanz. Man stelle sich vor, dass zwei Spieler der gleichen Spielstärke hintereinander im Turnier den gleichen Spieler schlagen. Und der eine gewänne mehr hinzu als der andere. „Ja, das liegt daran, dass du zu konstant spielst. Du müsst größere Schwankungen in deine Ergebnisse einbauen.“ Eine etwas schwache Begründung. Allerdings zur Beruhigung: Es müsste ja aufgrund der Berücksichtigung von Alter und Partienanzahl ohnehin geschehen. Jede Spielstärkeveränderung auf ein Ergebnis wäre individuell.
Für die Berechnung der Unentschiedenwahrscheinlichkeit habe ich natürlich auch Vorschläge zu machen. Nur so viel vorweg: Diese Art der Prophezeiung wäre reine Spielerei. Für die Machbarkeit des Systems ist sie nicht Ausschlag gebend. Nur muss ich sie ja hier auch anführen um den Anspruch der „Eignung des Pauli- als Vorhersagesystem“ gerecht zu werden.
Unentschiedenhäufigkeiten hängen offensichtlich sowohl vom Charakter als auch von der Höhe der Spielstärke eines Menschen ab. Je schwächer, umso weniger Remisen treten auf, allgemein gesprochen. Je stärker die Spieler umso mehr. Aber auch hier gibt es individuelle Unterschiede. Wenn, müsste man auch diesen Parameter individuell mitführen.
Selbstverständlich müssten alle diese Parameter gepflegt und gewartet werden. Also ein Spieler, der bisher risikofreudig war und plötzlich (Alters bedingt) solide wird, müsste eine Anwachsen seines individuellen Remisfaktors erfahren. Ebenso ein Spieler, der bisher eher konstant spielte und plötzlich größere Schwankungen auftreten lässt, würde auch da individuell mit einem größeren Faktor für die Reaktion „belohnt“ werden.
Ebenso müssen die allgemeinen Parameter gepflegt und gewartet werden. Also der durchschnittliche Remiswert kann zum Beispiel weiter ansteigen oder auch wieder abfallen.
- Die Fehler im System