Vorhersageprüfung

Wie überprüft man die Qualität einer Vorhersage?

Schon allein die Fragestellung jagt einem Schauer über den Rücken. „Wie jetzt bitte? Möchte der Mann Prophet sein oder werden? Eine Vorhersage, eine Prophezeiung tritt ein oder nicht. Und an Propheten kannte ich bisher nur Jesaja und Jeremia.“ Das ist aber nicht ganz die Wahrheit. Beziehungsweise muss man zum Verständnis zunächst den Begriff der Vorhersage versuchen, zu klären.

Unter einer Vorhersage möge man verstehen, dass man eine möglichst exakte Wahrscheinlichkeitseinschätzung für ein in der Zukunft liegendes Ereignis abgibt. Wenn man das getan hat, dann wird es in dem Sinne interessant, dass man entweder für sich selber eine Einschätzung der Qualität dieser Vorhersage abgeben möchte oder aber, noch interessanter, seine eigene Vorhersage mit der eines anderen Vorhersager vergleichen. Hier wird nun nach einer wissenschaftlichen Methode gesucht.

Ich bemühe mich darum, den Leser allmählich an das Problem heranzuführen. Dabei gibt es Ereignisse, die wir prognostizieren wollen, deren Wahrscheinlichkeiten bekannt sind, oder zumindest bekannt zu sein scheinen, aber auch später von Ereignissen, deren Wahrscheinlichkeiten unbekannt sind. Wenn dann noch das Problem der Nichtwiederholbarkeit dazu kommt, dann wendet sich ein Mathematiker sowieso ab. Er kann, für sein Verständnis, darüber nichts mehr aussagen. Aber auch für andere Menschen verliert die Problematik ihre Übersichtlichkeit und man beruft sich eher, sowohl bei Eintreten als auch bei Nichteintreten, auf „Schicksal“, „alles nur Zufall“, „Glück oder Pech“ oder aber auf den Glauben, von dem man dann aber auch wieder abfallen könnte.

Dass man doch etwas aussagen kann und das sogar in mathematisch einwandfreier Form, kann der Leser nach Studium dieses Kapitels bestätigen. Und dass die gefundene Aussage sogar eine praktische Bedeutung hat.

1) Philosophische Vorüberlegungen und die Unvollkommenheit der Sprache

Der grundsätzliche Denkansatz ist, dass jedes in der Zukunft liegende Ereignis mit einer Wahrscheinlichkeit zwischen 0 und 1 belegt werden muss. Die Wahrscheinlichkeiten 0 und 1 sind nicht vergeben. Es gibt kein sicheres Ereignis (Wert 1) und kein unmögliches Ereignis (Wert 0). Es gibt immer eine Unwägbarkeit. Die beiden lächerlichsten, aber vielleicht sofort eingängigen Begründungen möchte ich hier kurz erwähnen: Eine Voraussetzung für das Eintreten eines in der Zukunft liegendes Ereignis ist das Voranschreiten der Zeit. Und obwohl es ausreichend viele Anhaltspunkte dafür gibt, dass sie es tun wird, so kann ich es dennoch ganz sicher nicht beweisen. Da man, laut dem Kapitel „Nihil ist – Nichts ist(wirklich)“, im Prinzip gar nichts beweisen kann, gilt auch hier: Wir stützen uns auf Axiome. Die kleinsten, nicht beweisbaren Aussagen werden einfach „geschluckt“, hingenommen. Dennoch darf man auch daran ruhig mal zweifeln. Wieso könnte die Zeit nicht stehen bleiben? Oder sie verläuft zyklisch? Vielleicht gibt es den parallelen Zeitstrahl aus „Zurück in die Zukunft“? Der Zeitbegriff stößt an die Grenzen menschlichen Vorstellungsvermögens. Was ist Zeit? Man schaut nachts den Himmel an und sieht Sterne. Aber die Sterne existieren gar nicht mehr oder sind irgendwo, aber nicht an dem gesichteten Ort. Zum Beleg sei nur erwähnt, dass man die Entfernung zu einem fernen Planeten gerne in Lichtjahren misst. Das Licht ist also Jahre, teilweise Millionen von Jahren, unterwegs. Und die Ausbreitungsgeschwindigkeit des Lichts scheint mitverantwortlich für das Vergehen von Zeit. Dass wir uns auf diesen Umstand stützen und verlassen – obwohl zugleich nicht verstehen – ist nichts weiter als ein Erfahrungswert. „Auch morgen wird die Sonne aufgehen.“ Ja, sie wird wohl, doch.

Das zweite, wie ich finde schlagkräftige Argument, ist, dass die Sprache keine Eindeutigkeit hergibt. Man baut darauf, dass ein gedachte Gedanke in ein Wort, die Worte in einen Satz, die Sätze in einen Sinnzusammenhang übersetzt werden können, dieses Gebilde dann vom Mund ausgesprochen werden kann, von unserem Gegenüber wieder so gehört wird, wie wir es gesagt haben, und anschließend wieder von dessen Gehirn in einen identischen Gedanken verwandelt wird. So schön diese Vorstellung auch sein mag. Es ist schlicht unmöglich, dass es so geschieht. Wie sieht eigentlich ein Gedanke aus? Man berücksichtige noch, dass ein identisch gesprochener Satz durch Gestik, Mimik und Betonung schon wieder für eine endlose Komplexität sorgen kann.
Hier ist zum Beispiel ein Begriff der Begriff der „Zukunft“. Ein menschlicher Begriff und unvollkommen wie der Mensch selber. Wann bitte ist denn die Zukunft? Findet sie überhaupt statt? Ein weiterer ist das Eintreffen von Ereignissen. Das ist schon ein Ausdruck. Wann ist denn ein Ereignis eingetreten? Und viele Begriffe wie „Liebe“, „Gott“ oder „Glück“ eignen sich ohnehin maximal für Auffassungen, nicht für fixe Definitionen.

Nur, um ein winziges Beispiel zu geben, wie wenig eindeutig Sprache sein kann, im Zusammenhang mit dem „Eintreten von Ereignissen“, dies hier als reines Märchen:

Ein Mensch wirft einen Würfel. Er möchte gerne eine 6, da er darauf gewettet hat, 10 Euro für Quote 6.0, irgendwie ein fairer Wert. Er wirft scheinbar eine 6 und jubelt bereits. Nur beanstande ich plötzlich: „Der Würfel brennt.“ Der Werfer ist empört. „Der brennt doch nicht?“ Ich frage zurück: „Wie ist brennen definiert?“ „Na, was soll der Quatsch? Die Zahl ist klar zu erkennen. Der Würfel liegt gerade auf dem Untergrund.“ Ich: „Ich habe noch nie einen gerade auf dem Untergrund liegenden Würfel gesehen. So etwas gibt es nicht. Parallel zur Zimmerdecke? Meinst du das?“ „Na, so in etwa. Ich weiß nicht, das ist eine 6. Sie liegt oben.“ Ok, obwohl ich mich keinesfalls davon abbringen lassen würde, dass der Würfel nicht gerade liegt und das das „Brennen“ nirgendwo definiert war, lenke ich ein. Aber ich frage einfach frech weiter: „Wieso ist das eigentlich eine 6?“ „Na, weil da sechs Punkte drauf sind.“ „Aha, wart mal, ich hole schnell das Mikroskop.“ Ich halte den Würfel darunter und zähle die Punkte, die ich sehe. Oh je, bei 85 höre ich auf zu zählen, das bringt nichts. „Äh, ich bin jetzt bei 85. Wie viele hast du gezählt?“ Er war erst bei 74. Aber irgendwie auch fasziniert.
Wir kommen nicht recht weiter. Erst akzeptiert er nicht, dass der Würfel brennt, er besteht förmlich darauf, dass er nicht brennt, und anschließend zählt er 74 anstatt 6 Punkte. „Ich meinte doch die großen Punkte.“ „Ab wann ist ein Punkt groß?“ Aber gut, auch hier lenke ich ein. Ok, meinetwegen, er hat eine 6 gewürfelt. Aber bitte, ich frage noch eine weitere Frage. Sicher, wir hatten gewettet und er wollte die 6 und bekommt jetzt Geld, so seine Ansicht. Ich frage: „Auf welchen Wurf hattest du denn gewettet?“ „Na, jetzt wird’s mir zu bunt. Auf den nächsten natürlich.“ „Aha, welcher Wurf ist denn der nächste?“ „Immer der, der jetzt kommt.“ „Na gut, dann würfle bitte noch einmal.“ „Jetzt hatte ich doch schon. Der vorige war vorhin, als wir die Wette gemacht hatten, mein nächster.“ Ich: „Oh, jetzt wird’s auch bei mir bunt. Die Begriffe ändern im Verlaufe der Zeit ihre Bedeutung. Du meintest den nächsten und behauptest plötzlich, dass der zurückliegende der nächste war, räumst aber zugleich ein, dass es der vorige war.“ Er ist kurz davor, mir den Würfelbecher an den Kopf zu schmeißen. Ich bemerke rechtzeitig: „Außerdem, nur um dich zum Spaß mal zu unterstützen: Für mich wäre der nächste auch jetzt noch der, den du gerade gemacht hast, also der vorherige. Er ist im Sinne ´zeitlich´ der nächste, denn seitdem hast du keinen mehr gemacht. Nur ist er in diesem Falle der nächste in der Vergangenheit liegende. Wolltest du auf den gewettet haben? Dann hätte ich vorhin schon kassieren müssen, denn da war der nächste in der Vergangenheit liegende der, den du vor zwei Wochen gemacht hast. Und das war keine 6 sondern eine 93, obwohl die großen Punkte, wie ich auch erkennen konnte, nur zu dritt oben waren. Dafür brannte der damals eindeutig. Außerdem hattest du damals aus der Hand geworfen und ich meinte, dass nur Würfe aus dem Becher zählten.“ Und obwohl er die Wette ganz klar verloren hat, zahle ich aus.

Es geht nicht. Man kann es einfach nicht schaffen, etwas Eindeutiges zu sagen. Man versucht es immer wieder, man sucht danach und hätte es gerne. Aber es existiert nicht. Am Ende ist man immer wieder auf Menschlichkeit angewiesen. Auf die Gutwilligkeit, verstehen zu wollen. Ohne geht nicht. Wenn man nicht verstehen will, dann schafft man das schon. Zur Erinnerung mal wieder die Kindergeschichte. Das Kind fragt auf jede Antwort einfach wieder: „Warum?“ Falls man meine Texte nicht kennt, wird man zwangsläufig irgendwann aggressiv.

Man sollte nur gelegentlich mal dankbar sein, dass ich nicht zufällig Jura studiert habe…

Ich erzähle aber munter weiter und baue darauf, dass ich weiterhin nicht verstanden werde. Jedes in der Zukunft liegende Ereignis hat eine Wahrscheinlichkeit zwischen 0 und 1. Ich höre schon das jetzt wieder konstruierte Beispiel: „Aber Weihnachten und Ostern können doch wirklich nicht auf einen Tag fallen.“ Darauf kann ich wirklich gelassen entgegnen: „Wart mal ab.“ Es sind nur menschliche Begriffe. Immer wieder erinnern: Man kann nichts beweisen. Man weiß nicht, ob die Zeit weiter läuft. Und man kann nichts Eindeutiges sagen.

Auch über den Tod, von dem doch einige überzeugt sind, dass er unvermeidlich sei ist noch nichts Endgültiges auszusagen…

Wie nahe Mathematik und Philosophie beieinander liegen, kann man nur eine Überschrift tiefer erkennen. Und das sind bei vorsichtiger Schätzung maximal 1.5 Zentimeter…

2) Das LaPlace Experiment

Beim LaPlace Experiment geht man grundsätzlich davon aus, dass es n Ausgänge eines Zufallsexperiments gibt und dass alle diese n Ausgänge mit der gleichen Wahrscheinlichkeit, also mit 1/n, eintreten. Man spricht dabei auch vom „idealen Wahrscheinlichkeitsraum.“

Es handelt sich hierbei um eine reine Idealisierung. Und nicht nur, dass es das in der Praxis zu keinem Zeitpunkt gibt, gibt es auch noch sehr selten die Absicht, dass es überhaupt so sein soll. Nehmen wir noch einmal das obige Beispiel: Sowie es eine Wette gibt auf ein solches Ereignis wie „Ich würfle eine 6“ oder auch beim Roulette das Ereignis „im nächsten Wurf kommt eine schwarze Zahl“ gibt es eine Absicht, dass das Ereignis nach Möglichkeit nicht mit der angenommenen Wahrscheinlichkeit eintritt, sondern man wünscht sich das Eintreten, selbst wenn es da gegensätzliche Interessen gibt. Also eine Seite wünscht sich, dass die 6 oder eine schwarze Zahl fällt, die andere das Gegenteil Wenn man also einen guten Glücksbringer hat, das Horoskop einem für heute die Maximalzahl von fünf Sternen verspricht, man sowieso wie Gustaf Gans unter dem günstigen Stern geboren wurde oder sonst wie auf das Glück gestoßen ist („heute ist mein Glückstag“; was laut Legende ja zeitgleich Pech in der Liebe mit sich bringen soll), so besteht die Möglichkeit, dass man den gegnerischen Glücksbringer oder dessen Horoskop „aussticht“ und die Chancen zu seinen eigenen Gunsten zu verlagern imstande ist.

Diese Absichten mögen also letztendlich nur, da gegensätzlich, keinen wirklichen Einfluss haben („wer hat den besseren Talisman?“ erscheint mir eine ziemlich kuriose Fragestellung), aber zumindest existieren sie, und das so gut wie immer. Wenn man Lotto spielt, dann wird einem zwar versichert, dass das Gerät „auf seinen ordnungsgemäßen Zustand überprüft wurde“, dennoch gibt es noch immer die Absicht auf der anderen Seite, dass die Chancen nicht für alle Zahlen bei 1/49 liegen. Man sucht sich zum Beispiel seine Glückszahlen aus. Und warum heißen die Zahlen Glückszahlen? Genau…

Für mich würden sich aber zwei andere Systeme anbieten: Das eine besteht darin, Zahlen zu spielen, die von anderen Menschen weniger gesetzt werden (in der Regel sind das Zahlen außerhalb der Maximalzahl an Tagen im Monat), was zwar nicht meine Chancen (erkennbar) beeinflusst, diese Zahlen richtig zu haben, aber im Falle, dass ich sie richtig habe, einen höhere Auszahlungsquote dafür zu bekommen, da man vermutlich mit weniger Spielern teilen muss. Das nennt man allgemein auch „Verbesserung der equity“.

Das andere System aber, was entgegen jeglicher herkömmlicher Ansichten „völlig primitiv“ und „unüberlegt“ erscheint — da der Mathematiker so sehr gerne auf „normale Abweichungen“ und seine geliebte „Standardabweichung“ verweist, die eine gewisse Toleranz einfach einräumt — würde ich trotzdem noch vorziehen: Ich setze auf die so genannten „relativen Häufigkeit“. Wieso auch nicht? Ich erläutere das am Beispiel:

Eine Zahl ist in den (letzten) 2000 Ziehungen (das sind immerhin ca. 20 Jahre, bei zwei Ziehungen pro Woche) 264 Mal absolut gesehen aufgetreten. Da die von einem bisher für geschickt gehaltenen Mathematiker einfache Rechenaufgabe „erwartet hätte ich 2000*6/49 = 244.9 Mal“ ergibt, so hätte er eine Abweichung von 19.1 Mal, die diese Zahl „zu häufig“ gekommen ist. Diese tolerier der Mathematiker, angesichts der geringen Abweichung als „innerhalb der einfachen Standardabweichung“ und somit, aus Mathematikersicht, als „völlig normal“. Nur ist diese Standardabweichung anhand einer absolut unrealistischen Überlegung, dass alle Zahlen „gleichwahrscheinlich sind, und entsprechend langfristig gesehen auch gleich häufig auftreten werden.“ errechnet. Die Abweichung bezieht sich also auf eine (falsche) Annahme. Bei mir gäbe es gar keine Abweichung erst, da für mich die relative Häufigkeit (eher) der Wahrscheinlichkeit entspricht.

Obwohl ich in Schule und Studium gerade an dieses Stellen besonders aufmerksam und lernwillig war, sehe ich für die Überlegung, dass eine Gleichverteilung vorliegt, kaum Anhaltspunkte. Es ist zwar gut möglich, dass es auch bei dieser Zahl nur eine „normale Abweichung“ ist, es ist sogar möglich, dass ausgerechnet diese Zahl (wesentlich) unwahrscheinlicher ist als die anderen und trotzdem in der Zeitspanne zu häufig gekommen ist. Jedoch ist auch diese Aussage selber viel unwahrscheinlicher als die Aussage „die Zahl kommt mit einer höheren Wahrscheinlichkeit als die Anderen.“ Ich schaue also auf die relativen Häufigkeiten und leite daraus ab, welche Zahlen mit welcher Wahrscheinlichkeit eintreten. Da mir der Mathematiker im ungünstigsten Falle verspricht, dass meine dann gespielten Zahlen „auch nur gleichwahrscheinlich sind“, gehe ich jedenfalls kein Risiko ein. Das aber nur in dem Falle, dass ich sowieso spielen würde. Ansonsten ist es das gleiche „Risiko“ wie für jeden anderen Spieler. Und das besteht in einer negativen equity, einer Verlusterwartung. Man spielt ein Nachteilsspiel.

Als Gewinnsystem wird es aber sicher nicht ausreichen, sich auf die relativen Häufigkeiten zu stützen. Zumal man gerade bei solchen Überlegungen immer damit rechnen müsste – Stichwort: so chaotisch verhält sich die Welt –, dass sie auf Nachahmer stößt, die sich gleich daran machen und die häufiger aufgetretenen Zahlen spielen werden, meiner Empfehlung folgend, womit sie ihre Chancen auf „überhaupt gewinnen“ zwar ebenfalls bei Befolgung der Strategie erhöhen würden, jedoch zugleich die dann erzielte Auszahlungsquote schon wieder ein ungünstigeres Verhältnis ergäbe als bei einer beliebigen anderen Zahlenkombination. In der Folge müsste womöglich der geneigte wirklich jetzt übertrieben schlaue Leser sogar die seltener auftretenden Zahlen spielen, um sich dadurch einen Gewinnvorteil zu sichern. Er hätte zwar die noch kleinere Eintrittswahrscheinlichkeit für den Sechser, aber dafür die noch wesentlich höhere Auszahlungsquote. Das Beispiel soll auch nur illustrieren, dass die Mathematik an der Stelle im Prinzip ziemlich wackelig ist. Nur schert es irgendwie keinen.

Anhand des LaPlace Raumes kann der gewiefte Mathematiker also alle möglichen theoretischen Berechnungen anstellen und sich immer zufrieden auf die Schulter klopfen (während ich mir übrigens auf die Schenkel klopfe), weil er glaubt, die Welt jetzt wirklich verstanden zu haben. Alternativ – und das tut der größere Teil – wendet er sich von dieser unbeschreiblich tückischen Wahrscheinlichkeitsrechnung ab – ich erinnere an die Wohlfühlsituation „wir beweisen jetzt, dass diese Aussage wahr ist“ als Lieblingsbeschäftigung und der von mir dem gegenüber gestellten Aussage „wahrscheinlich bedeutet nur, etwas scheint wahr“, unbeweisbar, was automatisch Unbehagen auslöst –, und macht ab jetzt „richtige Mathematik“. Also die zum Weglaufen.

Es gibt keine Gleichverteilung. Zu keinem Zeitpunkt bedeutet sogar, dass man eventuell abwarten kann, bis man mehr weiß. Also wenn der Leser gerne Lotto spielen möchte, kann er bis zum Sonnabendlichen Horoskop warten. Soll das schaden? Man kann auch warten, ob man versehentlich und absolut ungewollt tatsächlich mit dem linken Bein aufsteht und das Spielen dann folgerichtig unterlassen. Alternativ aber – und da gibt es sogar einige gern verschwiegene Belege – kann man beim Roulette warten, bis kurz vor dem „rien ne va plus“ und erst dann setzen, in der Hoffnung, am Laufe der Kugel erkennen zu können, in welchem Kesselbereich die Kugel in etwa landen dürfte, um dann auf diesen Kesselbereich zu setzen (was, als Erläuterung, tatsächlich möglich ist mit „orphelin“, „kleine Serie“ und „große Serie“). Die Chancenverschiebung vor dem Wurf ist diesem Menschen dabei im Prinzip gleichgültig. Hier ist der Zeitpunkt des Setzens entscheidend. Jedenfalls läuft es auch bei diesen Überlegungen, unter Einbeziehung der niemals einheitlichen Absichten keinesfalls auf eine Gleichverteilung hinaus. Auch beim Würfeln, wie oben aufgezeigt, gibt es Absichten, Zeitpunkte und Durchführmethoden (Hand. Becher, Untergrund). Es existiert keine Gleichverteilung, diese ist eine Erfindung. Laut LaPlace „ein Ideal“.

Als letzte Komponente sei aber erwähnt, das LaPlace selber dieser Umstand bewusst war und er darauf aufmerksam machte, dass man bei Kenntnis sämtlicher relevanter Parameter womöglich das Ergebnis bei einer einzelnen Durchführung eines Experiments vorher exakt berechnen könnte. Und selbst wenn spätestens seit Heisenberg(Unbestimmbarkeit von Ort und Geschwindigkeit bei Kleinstteilchen) auch diese Theorie zumindest mehr als fragwürdig ist, so ist doch gesichert, dass man eine teilweise Vorhersagbarkeit erzielen kann. Wenn also der Leser versuchen sollte, an einem Nachmittag möglichst mehr 6en als andere Zahlen zu würfeln und dafür bei Gelingen eine satte Belohnung kassieren würde, dann wäre es doch denkbar, dank der Zusatzmotivation, dass er nach etlichen Hundert Würfen, die allesamt auf dem gleichen Untergrund und mit dem gleichen Ablauf durchgeführt werden, aus dem Becher zum Beispiel, dennoch allmählich erkennt, dass eine 6 dann etwas häufiger kommt, wenn er den Würfel in dieser Position in den Becher packt und dann mit solcher Geschwindigkeit entlang jener Achse würfelt. Bei Interesse, gerne versuchen. Ich würde aber keine Belohnung versprechen wollen. Da müsste man sich schon an einen ehrgeizigen und sturen Mathematiker wenden.

Ich widme mich jetzt sogar noch einem weiteren Kuriosum: Den Kartenspielen. Dort gibt es ziemlich lustige und spannende Überlegungen. Man spricht zum Beispiel ganz gerne mal von einem „gut gemischten Kartenspiel“. Die große Frage die dabei auftaucht lautet: Wann ist ein Kartenspiel gut gemischt? Wenn die Karten möglichst durcheinander sind? Kurios dabei: Wenn sie wirklich sehr durcheinander sind (was an sich gar kein Kriterium ist, weil es unbestimmbar ist, was durcheinander sein soll), dann würde sich dennoch die nächste Frage anschließen: Bekommt man Karten auf die Hand? Also Ziel muss es ja bei jedem Spiel sein, dass irgendwann Karten aufgedeckt werden. Wenn man welche bekommt: Werden diese einzeln gegeben? Oder, wie beim Skat oft üblich, im Rhythmus 3-4-3? Was, wenn man einzeln gibt, die sind total durcheinander, aber dadurch, dass man so gibt, werden sie wieder zurücksortiert? Man bekommt also bessere Hände als zu erwarten wäre und das nur durch die Austeilroutine?

Vielleicht ist es aber auch das Gegenteil: Man möchte gerne gut mischen, es gelingt einem aber nicht (zum Beispiel beim Mischen in der Hand, was Gang und Gäbe ist, aber dadurch, dass das Spiel weiter gehen soll, kommt Ungeduld auf und man mischt zu kurz), man teilt in der Folge aus, und zwar einzeln. Jetzt der Effekt, dass zum Beispiel Stiche von zuvor noch zusammen liegen, also zueinander passende Karten, und dadurch, dass diese einzeln gegeben werden, kann sie ein Spieler schwerer auf die Hand bekommen. Die Folge: Schlechtere Hände als zu erwarten wären. Das reinste Chaos.

Der entscheidende Aspekt kommt aber erst noch: Nachdem die Karten gemischt sind, steht doch die Reihenfolge fest. Das heißt, zum Beispiel auf das derzeit am meisten gespielte Spiel Texas Hold´em Poker bezogen, dass es eigentlich gar keine Wahrscheinlichkeit gibt, dass als nächstes ein Ass kommt. Entweder, es ist dort ein Ass oder dort ist keines. 1 oder 0. Nur weiß man es nicht und hat vielleicht keine Chance, das zu erfahren.

Um hier mal wieder ein wenig mehr Öl ins längst lodernde Feuer der Empörung zu gießen: Es gibt auch gezinkte Karten. Vielleicht erkennt man sogar die oberste Karte wieder? Ach, die mit dem Eselsohr. Vielleicht möchte man sie erkennen? Vielleicht hat man sie markiert, als sie in der eigenen Hand war, absichtlich, versehentlich? Vielleicht – und das ist mehr als nur eine Geschichte – gibt es Kartenspiele, die eine Durchsicht erlauben und man kann diese bei geschickter Wahl vorgefertigter Kontaktlinsen sogar erkennen? Wer spricht jetzt noch von „gut gemischt“ und „1/50“ für das Kreuz Ass? Noch viel mehr hierbei: Gibt es eine Absicht?

Dennoch könnte man auch hier davon sprechen – rein theoretisch, dass bei guten Menschen ohne erkennbare Absichten die Gleichverteilung im Ansatz gegeben ist, dass also jede Karte in einem gut gemischten Spiel mir einer Chance von 1/52 auch oben liegt. Jetzt kommen wir aber…

3) zu den nicht exakt bestimmbaren Wahrscheinlichkeitsräumen

Ich halte mich bis hierher recht bewusst bei diesen scheinbar so einfachen Beispielen auf. Denn diese versprechen einem doch noch ganz klar eine recht gewisse Einschätzung, wie wahrscheinlich einzelne Ausgänge eines solchen Zufallsexperiments sind. Die Ziehung der Lottozahlen wird „überwacht“. Gut, ich habe die relative Häufigkeit angeführt als bessere Näherung zur Ermittlung der Eintrittswahrscheinlichkeit als das stupide 1/37, behaupte aber lange nicht, dass man damit gewinnen könnte. Auch beim Roulette werden die Kessel regelmäßig überprüft und gewartet. Sogar, wie Herr Rudolf Taschner in seiner Buch „Zahl, Zeit, Zufall“ schreibt, hat der Veranstalter da wirklich die Absicht, dass es ganz korrekt und fair zugeht, dass also die Eintrittswahrscheinlichkeiten möglichst gut zutreffen. Gesichert ist damit noch lange keine Gleichverteilung, aber man nähert sich bestimmt gut an. Der Faktor des Zeitpunkts spielt gerade dort wieder eine Rolle (kann man etwas beobachten?), aber ansonsten würde ich doch davon abraten, aufgrund der Permanenzen, die von allen Roulettetischen angefertigt werden, die Zahlen zu spielen, die häufiger gekommen sind als andere. Wenn man schon spielt, dann meinetwegen diese. Aber darauf verlassen würde auch ich mich nicht, dass es zum Gewinnen ausreicht.

Im privaten Kreise sieht es schon wieder etwas anders aus. Teilweise werden Dinge bewusst manipuliert, man versucht, den Spielpartner „übers Ohr zu hauen“, indem man zum Beispiel nur (wie mir mehr als einmal geschehen) die Chancen durch manipulierte Spielgeräte zu den eigenen Gunsten verschiebt. Sogar beim Backgammon Spielen ist das geschehen und vielleicht nicht einmal eine Seltenheit. Zumindest möchte jeder Spieler die besseren Zahlen würfeln. Und allein das kann ja bereits einen Einfluss haben. Wer weiß schon? Der Gegner darf natürlich seinerseits auch schlechte Würfe wünschen für einen selber oder sich gute Würfe wünschen.

Quintessenz: Bei keinem noch so gut durchgeführten Zufallsexperiment gibt es eine exakte Gleichverteilung. Es spielt sowohl der Zeitpunkt der Einschätzung als auch die Absichten der Teilnehmer eine Rolle. Aber selbst wenn man vereinbaren sollte, dass alle Teilnehmer absolut ehrlich und aufrichtig und ein reines Zufallsexperiment durchführen wollen – keiner verspricht sich einen Vorteil, keiner versucht, nicht einmal mit Gedankenkraft oder sonstigen Hilfsmittel die Chancen zu verschieben, man versucht, nicht einmal die Parameter, die man kennen könnte mit einzubeziehen und auch der Zeitpunkt wird so festgelegt, dass keinerlei Kenntnis über die Durchführung besteht, außer, dass sie, nach Vereinbarung, „möglichst gerecht“ sein sollte, existiert keine Gleichverteilung. Nach einer bestimmten Anzahl von Durchführungen des Experiments hat man lediglich relative Häufigkeiten, mit denen die einzelnen Ausgänge aufgetreten sind. Und diese sind möglicherweise bessere Anhaltspunkte, als die Angabe, „jeder der n Ausgänge tritt exakt mit der Wahrscheinlichkeit 1/n ein. Selbst wenn der Statistiker einem hinterher erklären könnte, dass die aufgetretene Abweichung für ihn „normal“ oder „tolerabel“ ist. Denn hier gilt: Abweichung wovon? Von 1/n? Wer hat 1/n vorgegeben und warum? ES GIBT KEIN 1/n!

Nachdem also kein auch noch so schön durchgeführtes Zufallsexperiment eine „exakt bestimmbare Wahrscheinlichkeit“ liefert — und man beachte bitte auch schon hierbei, dass der Begriff der Wahrscheinlichkeit etwas waghalsiges, nicht bestimmbares enthält durch die Verwendung der Einzelbegriffe „scheint“ und „wahr“ , also es scheint nur wahr –, können wir ja getrost zu den Ereignissen übergehen, bei denen wir noch viel weniger exakt als die weiter oben zugegebenermaßen guten Näherungen zulassen. Und ich nehme mal ein sehr schlichte Beispiel her, an welchem bereits Vieles deutlich werden kann: Die Wettervorhersage. Und selbst bei dieser beschränke ich mich zunächst auf ein einziges winziges Beispiel: Die Regenwahrscheinlichkeit.

Da man hier schon wieder mit exakten Definitionen kollidieren kann (wie nachweislich stets), versuche ich mal, mich darüber hinwegzusetzen. Betrachte aber zunächst die vermutliche historische Herleitung, wie man zu Wahrscheinlichkeiten übergegangen ist. Ich könnte mir vorstellen, dass ein paar überkritische Zuhörer die meteorologischen Institute mit Anrufen quälten. „Sie hatten doch gesagt, dass es regnen würde. Es war aber bei uns den ganzen Tag Sonnenschein.“ Na gut, das würde der Anrufer vielleicht noch verkraften. Aber umgekehrt? „Sie haben Sonne versprochen und bei uns hat es geregnet.“

Um dieses zu umgehen, entschied man irgendwann – in dem Bewusstsein, plötzlich schlecht zu informieren – dazu überzugehen, einfach eine Wahrscheinlichkeit anzugeben. Man kann jedem noch so empörten Anrufer, auch bei versprochenen 99% Sonnenschein, stets entgegnen, dass man doch auch mit dem Eintreten einer 1%-Chance rechnen dürfe. Der aufmerksame Leser wird gar bemerken, nach „Murphys law“, dass jedes Ereignis, auch das mit einer sehr kleinen Eintrittswahrscheinlichkeit, irgendwann mal eintreten muss, wenn man es nur oft genug probiert. Also eine 80%-ige Regenwahrscheinlichkeit garantiert keinen Regen, eine 10%-ige keine Sonnenschein. Der Zuschauer/-hörer möge sich bitte damit abfinden. Wenn Ihnen die Vorhersage nicht ausreicht – wir können einfach nicht näher herankommen.

Das Hinwegsetzen über exakte Definitionen tue ich jetzt auf folgende Art: Ich sage, dass man einen bestimmten Ort nimmt und eine bestimmte Zeitspanne, dazu eine bestimme Regenmenge, die in dem Zeitraum fallen muss, damit die Aussage „Es hat geregnet“ mit „wahr“ oder „falsch“ bewertet werden kann. Selbst wenn ich das in dem Bewusstsein tue, dass es unmöglich ist, jedes Ereignis wirklich so und nur so einzustufen. Man überlege dazu: Was ist, wenn die gemessene Regenmenge nur fast genau der Mindestmenge, von der man ausgehen muss (oder würde sich der Leser zufrieden geben, wenn sich jemand genau an den Ort stellt, wo gemessen wird, dann die Hände ausstreckt und irgendwann mal sagt: „Da, ich habe einen Tropfen abbekommen. Du auch? Für mich gilt in diesem Versuch die Aussage: Es hat geregnet.“), entspricht? Es gibt also eine Messgenauigkeit, die einer Exaktheit im Wege steht. Es gibt auch die Möglichkeit, dass es genau zum Ende der Messperiode wirklich regnet, also ein paar Tropfen, und genau zu dem Zeitpunkt die Grenzmenge überschritten wird („Hey, du hast zu lange gemessen. Und zwar genau um 0.03785 Sekunden Deshalb wolltest du den Tag als Regentag bezeichnen, obwohl er gar keiner war.“). Also, wir tun jetzt so, als ob alle diese Probleme nicht existieren. Jeder Zeitraum kann nach den angegebenen Kriterien bewertet werden als „es hat geregnet“ oder „es hat nicht geregnet“, „wahr“ oder „falsch“.

Dennoch kennt man diese Wahrscheinlichkeiten nicht. Und auch der beste Meteorologe könnte nicht näher an die Wahrheit heran, als eine Wahrscheinlichkeit, sei diese auch groß, abzugeben. Nun streiten sich ein paar Meteorologen, wer die Regenwahrscheinlichkeit besser einschätzen kann. Und für den einfachsten Fall nehmen wir sogar noch an, dass wir einen exakten Wert kennen. Nur um zu beobachten, was dann zahlenmäßig passiert. Sozusagen, um das Modell auf seine mathematische Standfestigkeit zu überprüfen. Und das ist legitim.

Ja, denn jetzt gehe ich über zu der Messbarkeit der Qualität von Vorhersagern. Es gibt dafür eine mathematisch einwandfreie Methode, um das in Zahlen auszudrücken. Einschränkend muss ich natürlich sofort sagen, dass die Aussagen, die man herauskitzeln kann, sich nicht sehr wesentlich von anderen Statistiken unterscheiden: Es gibt Interpretationsmöglichkeiten und es gibt die Möglichkeit der Fehlaussage. Und, um die Verwirrung komplett zu machen: Auch für das Ereignis „Fehlaussage“ gibt es wieder eine Wahrscheinlichkeit. So behilft sich nämlich der Statistiker.

4) Die Regenwahrscheinlichkeitsvorhersage überprüft mit einfachen Methoden

Insgesamt gibt es hier zunächst zwei Aufgaben: Man versucht, sich der Einschätzung der Wahrscheinlichkeiten anzunähern. Anschließend versucht man, seine Ergebnisse zu prüfen. Wenn man diese beiden Aufgaben zur Zufriedenheit bewältigt hat, kann man dazu übergeben, seine Werte an sich selber zu messen – auch dafür eignet sich meine Methode – und sogar dann mit denen anderer Propheten zu vergleichen.

Es ist beinahe ein Scherz, jedoch hält er mathematisch gesehen in gewisser Weise der Ernsthaftigkeit stand: Wenn man an jedem Tag für sich selber oder auch lauthals sagen sollte: „Es wird regnen oder es wird nicht regnen.“ Dann hat man – eben mathematisch gesehen – sogar sehr Recht. Es wird oder wird nicht. Man hat quasi gesagt „50 –50“ oder „ich weiß es nicht“. Aber stimmen tut es. Wie wir später sehen werden hält das sogar einer statistischen Prüfmethode stand. Jedoch fragt man sich natürlich beinahe zwangsläufig, ob man es denn nicht vielleicht doch etwas besser weiß? Witzigerweise tut man mit der Prognose 50-50 aber genau das, was oben in seiner Existenz angezweifelt wurde: Man legt die absolute Gleichverteilung zugrunde.

Man prognostiziert mit 50-50 genau das, was per se ausgeschlossen wurde: Jedes Ereignis ist gleichwahrscheinlich. Man kann oder möchte sich „nicht festlegen“. Und gerade dieser Begriff, der der Festlegung ist der, den wir herleiten und mathematisch greifbar machen wollen. Wenn ein Zufallsexperiment keinerlei „Festlegung“ erlauben sollte, also alle n Ausgänge gleichwahrscheinlich wären, dann könnte man sich gar nicht festlegen, Es wäre mathematisch gesehen ein Fehler, wie später ersichtlich. Aber man kann es doch, zumindest theoretisch, bei jedem praktisch durchgeführten Experiment, wie weiter oben ausgeführt. Die Frage ist also nicht, ob man sich festlegen kann, sondern nur wie sehr kann man sich festlegen kann. Die Höhe der möglichen Festlegung ist möglicherweise aber, wenn von unbekannten und nicht überprüfbaren, nicht wiederholbaren Ereignissen die Rede ist, sogar von der Qualität des Vorhersagers abhängig. Man sehe…

Wir haben wieder ein kleines Zeitpunktproblem, was wir einfach auch mal wieder wohlwollend ignorieren, beziehungsweise einschränken. Gemein wäre es natürlich, dass man sozusagen einen Tropfen fallen sieht und in diesem Moment sagt „die Wahrscheinlichkeit liegt bei 99%, dass es regnet.“ Also schränken wir ein – da wir sehr ernsthaft sind und sogar den Menschen eine Hilfestellung für ihre Tagesplanung geben wollen — also wir arbeiten „naturgetreu“ als echte Meteorologen –, und sagen, dass wir spätestens morgens um 5 Uhr unsere Einschätzung für den Zeitraum bis abends 20 Uhr abgeben wollen. Wird es oder wird es nicht regnen?

Nun gibt es ein paar Bauern, die sich die Wolken am Vorabend anschauen, dann gibt es eine Statistik über das letzte Jahr oder sogar die letzten 10 Jahre. Und es gibt ein Datum, an dem wir vorhersagen wollen. Die Statistik für den Oktober sagt uns, dass es dort 26% Regentage gab. Dazu noch befragen wir unsere Intuition oder die Bauern, die sagen, dass gestern ein Wolkenhimmel war, welcher auf Regen hindeutet, klopfen noch einmal gewissenhaft auf unseren Barometer und schon werfen wir eine Zahl in den Raum: „Am heutigen Tag (zwischen 5 und 20 Uhr) wird es (an jenem Ort) zu 45% Regen (eine Mindestmenge von 1 Kubikmillimeter) geben.“ Am Abend konstatieren wir, dass es wirklich geregnet hat und wir klopfen uns virtuell auf die Schulter. (Der 50%-Mann aber lacht uns aus. Denn er war besser. Das aber nur am Rande).

Wir wiederholen dieses Experiment. Dabei ist „das Experiment“ nur ein folgender Tag, der seinerseits völlig veränderte Voraussetzungen hat gegenüber dem Vortage. Wir können unsere gesammelte Erfahrung hineinlegen für diesen Tag, meinetwegen auch das Ereignis „es hat am Vortage geregnet“ mit nutzen und zugrunde legen. Aber dieser Tag, für den wir jetzt vorhergesagt haben ist vorbei. Es gibt keine Wiederholung dieses Tages, an dem wir auf lange Sicht unser Ergebnis verifizieren könnten. Wir arbeiten sozusagen „ohne Netz und doppelten Boden“. Es gibt keine Chance, eine Fehleinschätzung zu korrigieren, mithilfe der Statistik. Eine Vorhersage, ein Ereignis, ein Ergebnis. Jetzt kommt das nächste. Was können wir denn nun aussagen? Zunächst mal gehen wir das Problem praktisch an, den Erfordernissen entsprechend. Wir nehmen einfach den nächsten Tag und prognostizieren mutige 65%. Es regnet nicht. Wieso sollte es auch?

Wir wiederholen das Experiment 100 Mal. Wir nehmen 100 Tage, an denen wir uns an jahrezeitlichen Statistiken, ganzjährigen Statistiken oder auch einer intuitiven Prognose anhand der Erfahrungswerte der Himmelsbeobachtungen, Wolken- oder Windbewegungen, Tiefdruckgebieten oder was auch immer (ich war mal in Rendsburg, sommerlich, Badewetter, mit einem Freund, an einem See, als wir ein Gespräch belauschten von zwei älteren Männern. Der eine: „Meun kleunä Fingä, wenn dähr schmäärzt, dann kommtn Gewiddä. So Mountäch, Dienstäch kommtn Gewiddä. Dätt säch ik diä.“). Gut, dann haben wir 100 Tage zusammen. Nun wollen wir ein Ergebnis herauskitzeln.

Zwei Dinge sind noch zu beachten:
a) Mit der Festlegung meint man im Prinzip das Favoritenereignis, auf welches man sich festlegt beziehungsweise festlegen kann. Das kann an einem Tag das Ereignis „es regnet“ sein, an einem anderen Tag das Ereignis „es regnet nicht“. Je näher man mit dem Favoritenereignis an 100% herankommt, umso höher ist, mathematisch gesehen, die Festlegung. Aber auch intuitiv ist es deckungsgleich.
b) Bei der Prognose von Regenwahrscheinlichkeiten ist es denkbar, dass die mögliche Festlegung noch weit näher an 100% heranrückt. Das geschähe dadurch, dass man die für den Regen verantwortlichen Parameter von Seiten der das Wetter beobachtenden Stationen immer besser in den Griff bekommt und, nur um ein Beispiel zu nennen, heute bei einer möglichen Festlegung von 70% liegt und in 100 Jahren vielleicht 85% erreicht. Dieses Experiment gäbe das eventuell noch her. Wir haben heute noch nicht alles aus den relevanten Parametern herausgekitzelt, was diese uns verfügbar machen. Diese Aussage stellt aber grundsätzlich einen Gegensatz dar zum Fußball. Dort ist es denkbar, dass auch eine noch so gute Einschätzung und Kenntnis aller möglichen Parameter einem keine höhere Festlegung erlaubt. Die Ursache hierfür: Das Spiel ist eine Form von Glücksspiel. Die Spielstärken der Mannschaften können gar nicht so unterschiedlich sein, um daraus einen Sieger noch klarer zu ermitteln. Also ist es schlicht nicht möglich, sich dort noch höher festzulegen.

Der Mathematiker hat sofort eine einfache Methode entdeckt, die auch schon längst angewendet wird. Man addiert alle Wahrscheinlichkeiten auf und schaut auf die Gesamtsumme der derart prognostizierten Regentage, denn nichts anderes stellt die Summe dar (kurz nachdenken? Wenn es an zwei Tagen zu jeweils 50% regnen sollte, laut Prognose, dann würden wir eine Summe von 1 erhalten; also einen prognostizierten Regentag und intuitiv würde man den doch auch erwarten? Ist doch wie Münzwurf. Zwei Mal werfen, im Schnitt einmal Kopf, einmal Zahl). Dann vergleichen wir die Summe der prognostizierten Regentage mit der Summe der eingetretenen Regentage. Und nehmen wir mal an, dass wir trotz unserer zwei kleinen „Fehleinschätzungen“ (wer weiß das schon?) am Ende 24,3 Regentage erwatet haben (Summe der Wahrscheinlichkeiten) und es an 25 Tagen wirklich geregnet hat. Dann klopfen wir uns schon wieder auf die Schulter und diesmal nicht einmal wir allein: Der Mathematiker schließt sich an. „Gut gemacht.“

Hier jetzt aber ein paar Bedenken: Wenn man nur die Summe der prognostizierten Treffer mit der eingetretenen Anzahl vergleichen würde, dann würde ich es mir beim nächsten Mal leicht machen: Ich würde einfach den langjährigen Durchschnitt, meinetwegen sogar den von der betrachteten Periode hernehmen, und diesen dauerhaft und für jeden Tag prognostizieren. Mein Ergebnis wäre in der Summe sogar möglicherweise besser, obwohl ich mir keinerlei Mühe gemacht habe. Ich habe einen Durchschnittwert hergenommen, mich auf diesen verlassen, anschließend „die Beine baumeln lassen“ und mich zurückgelehnt, den oder die anderen Propheten schwitzen lassen über ihren Zahlen und bekomme mit einer bestimmten Form der Statistik auch noch Recht? Mag sein, dass ich ein klein wenig Glück hatte, aber dennoch erziele ich ohne Aufwand einen „vernünftigen Wert“. Diese intuitive Begründung kann man natürlich noch konkreter und später auch mit Zahlen erfassen. Konkreter wäre es so: Wenn ich an einem Tag, nicht die Wolken und das fallende Barometer in Betracht ziehend, eine lapidare, ungeprüfte „25%, wie immer im November“ hinschreibe und einer der Fachleute eine 65% hinschreibt, diese Parameter berücksichtigend, dann liegt er mit ziemlicher Sicherheit in seiner Einschätzung für diesen Tag besser. Er müsste doch irgendwie einen Lohn dafür bekommen, eine mathematische Anerkennung? Und er bekommt. Moment noch…

Ich würde mich mit meiner lächerlichen Form der „Nicht-Prognose“ oder „Durchschnittsprognose“ darauf verlassen, dass er an einem anderen Tag, ebenso schwitzend, aber schon wieder besser als ich, seine Vorhersage auf 3% Regenwahrscheinlichkeit reduziert, während ich schon wieder mit den plumpen „25%“ aufwarte. Er liegt wieder besser, aber ich gemahne: „Tja, so gleicht sich eben alles wieder aus.“ Ich mache Fehler auf Fehler und am Ende hab ich die Nase vorn?

Es muss ein Mittel geben, um diese seine Überlegenheit auszudrücken. Und es gibt eines. Die Methode stelle ich hier zunächst kurz vor und zeige dann ein paar Beispiele mit konkreten Zahlen.

Die Festlegung wird analog zu einem normalen Erwartungswert berechnet. Man multipliziert die einzelnen möglichen Ausgänge mit ihrer Eintrittswahrscheinlichkeit. Man erinnere sich, dass man zur Ermittlung des Erwartungswertes beim Werfen eines Würfels die Ausgänge mit ihrer Eintrittswahrscheinlichkeit multipliziert. Also da wir zu (angenommenen; wir ignorieren die obigen Bedenken) 1/6 jede Zahl werfen können, multiplizieren und addieren wir zugleich 1/61 + 1/62 + 1/63 +1/64 + 1/65 + 1/66. Das ergibt 1/6 + 2/6 + 3/6 + 4/6 + 5/6 + 6/6 = 21/6 = 3.5. Und man beachte auch hier, dass man den Erwartungswert nur als langfristigen Durchschnitt erreichen wird, aber niemals im einzigen Wurf. Es gibt keine 3.5 auf dem Würfel. Dennoch erwarten wir diese Augensumme, wir können nicht anders.

Hier ein Zahlenbeispiel dafür, ganz praktisch, da ich einen Würfel in die Hand nehme:

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
ZAHLENBEISPIEL WÜRFELN

Die Analogie also jetzt für das Beispiel der Regenwahrscheinlichkeit: Wir berechnen die „erwartete durchschnittliche Wahrscheinlichkeit“. Und das entspricht der längst schon intuitiv bezeichneten „Festlegung“. Die Rechenmethode ist die gleiche wie beim Würfeln. Über die Aussage, die wir erhalten, lohnt es sich schon, eine Weile nachzudenken und sie auch zu überprüfen. Ich behaupte, dass diese Methode in der Mathematik bisher noch nicht verwendet wird. Über ihre Bedeutung möge der geneigte Leser entscheiden.

Wir multiplizieren in Analogie aus und addieren auf. Da wir hier nur jeweils täglich eine Prognose haben und eine Durchführung des Experiments unter den gegebenen Umständen muss ich eine fiktive Zahl vorgeben. Nehmen wir an, wir schätzen die Zahl auf 25% Regen, 75% Nicht-Regen. Dann ergibt sich 25% * 25% + 75% * 75% oder 0.25 * 0.25 + 0.75 * 0.75. Das wäre 0.0625 + 0.5625 = 0.625. Wir würden also erwarten, dass wir eine Wahrscheinlichkeit von 62.5% als die des eingetretenen Ereignisses erhalten. Das wird sicher gleich verständlicher. Ich erwähne hier nur noch kurz, dass die Nichtfestlegung eine 0.5 * 0.5 + 0.5 * 0.5 = 0.25 + 0.25 = 0.5 ergäbe. Und wenn man in diesem Falle die erwartete Wahrscheinlichkeit mit der eingetretenen vergleicht, ergibt sich immer Übereinstimmung. Man hatte 50% erwartet und 50% sind auch eingetreten. Ich habe mich nicht festgelegt (nicht einmal festlegen können) und bekomme als Ergebnis, dass ich auch gut daran tat. Ich habe meinen Erwartungswert exakt erreicht. Besser geht es kaum?! Die Frage bleibt aber dann, ob ein anderer Mensch, auf das gleiche Ereignis angesetzt, eventuell doch eine Festlegung herauskitzeln konnte.

Ich spreche im Falle der 1/n beziehungsweise hier 50% Festlegung von der „minimalen Festlegung“, nämlich gar keiner. Alles ist gleichwahrscheinlich, alles kann passieren, so wäre die philosophische Übersetzung dieses Gedanken. Jedoch, und an diese Arbeit macht man sich jetzt sozusagen, auch ich, indem ich die dem Experiment inne liegende mögliche Festlegung auch möglichst exakt ermittle.

Zur Erläuterung der erwarteten durchschnittlichen Wahrscheinlichkeit, welche letztendlich die Festlegung misst, muss ich das oben erwähnte Beispiel noch etwas näher erläutern. Wenn man also nun die Einschätzung getroffen hat 25% Regen, 75% kein Regen, dann hat man sich zu 62.5% festgelegt. Was das bedeutet, kann man mal wieder am besten am Beispiel erkennen. Und – oh Wunder – wie immer funktioniert die Veranschaulichung dann am besten, wenn wir den doppelten Boden herausnehmen und wieder mal einen der in der Praxis nicht existierenden Idealfall betrachten. Falls man also wirklich eine Wahrscheinlichkeitsverteilung von 75% zu 25% auf den Ausgang eines Zufallsexperiments hätte, dann ließe sich das ziemlich gut überprüfen.

Auch an dieser Stelle lohnt sich mal wieder ein kleiner Exkurs: Wie erzeugt man eine bestimmte Wahrscheinlichkeit im Zufallsexperiment? Ich kann nicht oft genug erwähnen, dass sie nur scheinbar exakt ist, aber dennoch. Wir suchen theoretisch nach einer Aufteilung von einer 1/4 Chance zu einer 3/4 Chance. Wie kann man diese theoretisch erzeugen? Mir fällt für jede noch so absurde Chance immer sofort das Beispiel ein: Eine Trommel mit roten und weißen Kugeln. Man tut so viele rote rein, wie man haben möchte und anschließend so viele weiße, damit das Verhältnis möglichst exakt so aufgeht. Dieser Weg ist ziemlich zuverlässig, und – da nur theoretisch – auch so „durchführbar“. Wenn man also eine Chance von 1/10 oder 1/100 abbilden möchte und im Experiment möglichst gute Ergebnisse erzielen möchte, tue man im ersten Fall eine rote und 9 weiße in eine Trommel, im zweiten eben eine rote und 99 weiße. Dann ergeben sich zwar theoretisch wieder die gleichen Fragestellungen wie oben (wer hat welche Absicht? Wie wird das Experiment durchgeführt? Kann und möchte eine Seite die Chancen verschieben? Man sortiert die rote zum Beispiel „ganz nach unten“, Die „findet“ der garantiert nicht… etc.), aber wir bleiben ja theoretisch und da funktioniert es.

Für die Chance 1/4 könnten wir also 3 weiße und eine rote Kugel in eine Trommel legen, uns gegenseitig absolute Ehrlichkeit und Aufrichtigkeit versichern und mit dem Ziehen beginnen. Das Ereignis „es wird eine rote Kugel gezogen“ hat dann die Wahrscheinlichkeit 1/4. Wenn wir das Experiment ausreichend oft unter den vorgegebenen Bedingungen durchführen würden, dann würde jeder Mathematiker sich schon wieder die Hände reiben: Nach 100 Mal wird so etwa 25 Mal „wahr“ und 75 Mal „falsch“ herauskommen bei Bewertung des Ereignisses. Und wenn wir dann – jetzt schalte ich mich endlich mal ein – alle Wahrscheinlichkeiten des eingetretenen Ereignisses aufaddieren, dann erhalten wir in der Summe eine 6250. Wer es nicht glaubt?

75 Mal wurde eine weiße Kugel gezogen. Die Wahrscheinlichkeit für dieses Ereignis hatten wir – so gut wir eben konnten – mit 75% beziffert. Wir hätten also im Idealfall, dass wir 75 Mal in 100 Versuchen auch wirklich „weiß“ gezogen haben, jedes Mal diese 75 als Wahrscheinlichkeit des eingetretenen Ereignisses notiert. Das ergibt in der Summe eine 75 * 75 = 5625. In 25 Fällen wurde rot gezogen, so dass 25 Mal eine 25 auftaucht in der Spalte für die Wahrscheinlichkeit des eingetretenen Ereignisses. Das heißt, wir müssten in der Summenbildung 25 * 25 + 75 * 75 = 625 + 5625 zusammenzählen. Und das ergibt die vorhergesagte 6250. Im Durchschnitt wäre also unsere Erwartung von 62.5% als Wahrscheinlichkeit des eingetretenen Ereignisses aufgetreten. Und das ist nichts anderes, als das, was uns ein Erwartungswert verspricht.

Der Umstand, dass hier die für den Mathematiker gewohnte Prüfmethode ebenso wirksam ist, hat bisher verhindert, dass meine Methode überhaupt eine praktische Bedeutung bekam., beziehungsweise stand sie dem im Wege, dass sie überhaupt entdeckt wurde. Der Mathematiker überprüft herkömmlich die Anzahl der prognostizierten Treffer und würde ein sehr einfaches Ergebnis erhalten: Ich habe erwartet, dass ich 25 Mal rot und 75 Mal schwarz ziehe. Das ist auch eingetreten. Wozu noch weiter prüfen?

Ich habe für das weitere Prüfen eine Begründung, und diese bereits weiter oben geliefert: Wir prognostizieren in der Praxis nicht wiederholbare Ereignisse, welche allesamt eine unbekannte und unbeweisbare, nicht prüfbare Eintrittswahrscheinlichkeit haben. Da es sich, wie auch weiter oben erwähnt, natürlich bei jedem praktische durchgeführten Experiment um ein solches handelt, würde sich also jedes beliebige Ereignis praktisch gesehen eignen, um Vorhersager untereinander zu prüfen.

Wenn also jemand behauptete, dass er in der Lage ist, an der Wurfachse eines Würflers zu erkennen, welche Zahl mit welcher veränderten Wahrscheinlichkeit eintreten wird, so kann er mit der angegebenen Methode arbeiten. Er hat immer neue Voraussetzungen, bei jedem Wurf, und darf jedes Mal erneut seine Einschätzung abgeben. Nach etlichen Durchführungen kann man dann seine – in diesem Falle erzwungen von der Gleichverteilung abweichende – Vorhersage „auf Herz und Nieren“ prüfen. Hat er die von sich angenommene Festlegung langfristig erreicht? Beispiele gebe ich später. Sicher ist nur, dass man bei 1/n, also beim Würfeln 1/6 für jede Zahl, keine oder die minimale Festlegung hat. Je sicherer man sich mit einer Zahl, mit einer Vorhersage wird, um so höher wird der Wert der Festlegung, als messbare Größe, über die Summe der Quadrate der Einzelwahrscheinlichkeiten (bei 75 : 25 haben wir auch nur die Einzelwahrscheinlichkeiten quadriert und aufaddiert).

5) Prognose von Sportereignissen, speziell Fußballspielen

Die Ereignisse, mit denen ich über die Jahre meinen Lebensunterhalt verdient habe, waren Fußballspiele. Ich habe mich für jedes Spiel für eine bestimmte Festlegung entschieden, einfach durch die Angabe der Einzelwahrscheinlichkeiten für 1 – X – 2. Wenn ein einzelnes Spiel, wie zum Beispiel Bayern – Bochum, eine höhere Festlegung erlaubt, dann bitte schön, dann möge man sich höher festlegen. Wenn man den Sieg der Bayern als 80% einschätzt (aber wer erinnert sich nicht an das 3:3 letzte Saison?), dann notiere man eine 80% für Bayern Sieg. Man wird in der Festlegung sicher einen höheren Wert erzielen als derjenige, der 70% für Sieg notiert. Das möge man gerne nachprüfen: Je höher man das Favoritenereignis von der Chance her einstuft, umso höher wird die Summe der Quadrate der Einzelwahrscheinlichkeiten. 80% — 15% — 5% ist in der Festlegung 0.80.8 + 0.150.15 + 0.050.05 = 0.64 + 0.025 + 0.0025 = 0.665 (danke, Excel!). Bei 70% — 20% — 10% wird es zu 0.70.7 + 0.20.2 + 0.10.1 = 0.49 + 0.04 + 0.01 = 0.54. Und 0.54 ist wirklich erheblich kleiner als 0.665. Wer langfristig näher dranliegt an der Realität, hat später die Nase vorn. Und das nicht nur finanziell.

Wenn man aber ein ausgeglichenes Spiel hernimmt, welches im Prinzip „keine Festlegung“ zulässt — der Totospieler spricht da von einem „Dreiwegspie“ — dann sollte man sich auch nicht festlegen. Alle Ausgänge sind in etwa gleichwahrscheinlich, man weiß es nicht besser, die Partie ist einfach ausgeglichen, dann sollte man auch diese Wahrscheinlichkeiten notieren und nicht etwa versuchen, etwas vorherzusagen, was man nicht kann. Mathematisch würde ein solches Verhalten bestraft werden mithilfe dieser Methode.

Wie überprüft man die Qualität einer Vorhersage?

Autor: admin

Related Posts

Hier klicken, um das Antworten abzubrechen.