Dazu mal ein kleines Beispiel aus meiner Geschichte:
Mir hatte ein Mann mal Permanenzen zugeschickt (das waren aufgezeichnete „spins“, Roulettekugelwürfe von einem bestimmten Kessel, so nennt man das, wo die Kugel später drin rollt). Ich dachte zunächst: ein Witz, was soll ich da untersuchen? Immerhin war er bereit, für meine Analyse der Zahlen etwas zu bezahlen. Also ging ich forsch ans Werk, um das Geld einzustreichen, zugegeben. Ich glaubte nicht, irgendetwas Interessantes zu entdecken. Er selbst hielt sich übrigens bedeckt, sagte nichts, außer, dass ich sie mir mal anschauen sollte. Damit ich unvoreingenommen herangehe.
Aber nach einigem Forschen stellte sich tatsächlich heraus, dass in einem bestimmten Kesselbereich die Zahlen wesentlich häufiger auftraten als aus dem restlichen Kessel. Der Mann hatte wirklich lange mitgeschrieben und die Abweichung war offensichtlich. Nun beginnt man, zu spekulieren und auch zu rechnen (da fällt mir ein, dass ich früher auch mal eine Jack London Geschichte gelesen hatte, wo ein Roulettekessel direkt am Ofen stand; aus irgendeinem Grunde kamen da auch bestimmte Zahlen häufiger). Ein jeder, sei er nun Mathematiker oder nicht, hält eine bestimmte Abweichung für möglich oder für realistisch und eine andere für unrealistisch, zu groß. Antworten auf solche Fragen können auch Statistiker nur äußerst vage treffen. Also: welche Abweichung tolerieren wir, halten wir für realistisch und welche für „zu groß“? Vor allem bleibt die stets im Raum schwebende, aber dauerhaft unbeantwortete Frage nach den Voraussetzungen.
Na gut, ich versuche mich mal als Statistiker: Man berechnet also zunächst mal die Standardabweichung. Dann gibt es eine Aussage über die Standardabweichung, die da lautet: 68.3% aller Messergebnisse müssten innerhalb dieser Standardabweichung liegen, 95.4% innerhalb der doppelten Standardabweichung, 99.7% innerhalb der dreifachen. So viel die Mathematik zu diesem Thema. Wenn also ein so genannter „Ausreißer“ auftritt, dann nimmt man es eben so hin. War unwahrscheinlich, ist trotzdem passiert.
Aber was waren nun die Ergebnisse der mir zur Verfügung gestellten Permanenzen? Die Werte für diese vier Zahlen, einzeln betrachtet, also für den untersuchten Kesselbereich, lagen allesamt außerhalb, genauer gesagt oberhalb, der dreifachen Standardabweichung. Jeder einzelne Messwert hätte also nur eine Wahrscheinlichkeit von 0.3%, so weit oberhalb der Standardabweichung zu liegen. Aber vielleicht war doch alles nur Zufall? Das kann doch mal passieren? Um mir (noch größere) Gewissheit zu verschaffen, nahm ich die vier Werte zusammen. Das ist in so fern gerechtfertigt, als es sich ja um neben einander liegende Zahlen handelt. Wären es vier über den Kessel verstreute Zahlen gewesen, wäre das natürlich nicht angängig, aber bei nebeneinander liegenden Zahlen? Da kann ich doch die Werte in der Summe betrachten. Intuitiv einleuchtend?
Indem ich also diese vier Zahlen gemeinsam betrachte, vergrößere ich die Gewissheit der Aussage, dass es sich um einen Kesselfehler handelt.
Die vier zusammen genommenen Werte produzierten eine Abweichung, die außerhalb der fünffachen Standardabweichung lag! Jetzt wird meine Aussage „Kesselfehler“ schon ziemlich stabil, man sagt dann auch gerne „mit an Sicherheit grenzender Wahrscheinlichkeit.“ Aber selbst dann kann man sich eben nicht ganz sicher sein, dass die Aussage „der Kessel ist falsch“ richtig ist. Es bleibt immer eine Möglichkeit des Irrtums. So kurios und hilflos ist die Statistik. Selbst das, was man aussagen möchte gilt nur mit einer gewissen Wahrscheinlichkeit. Ich treffe eine Aussage und belege diese mit einer Irrtumswahrscheinlichkeit. Komisch, gell?
Die Geschichte ging übrigens so weiter: Ich gab dem Mann diese Antwort und errechnete ihm die Gewinnaussichten unter Berücksichtigung der Irrtumswahrscheinlichkeit und so weiter. Die Idee war selbstverständlich, mit hohen Einsätzen an diesem Spiel langfristig zu spielen und zu gewinnen, was sonst? Er hat aber dann trotzdem davon Abstand genommen. Es wäre ein hoher Kapitaleinsatz erforderlich gewesen. Diesen hätte ein außen Stehender zur Verfügung stellen müssen. Und letztendlich war die Ungewissheit (vor allem dem potenziellen Sponsor) zu hoch, ob nicht der Kessel einfach irgendwann gewartet wird (wurde) oder ausgetauscht. Meine Bemühungen waren also in diesem Sinne fruchtlos.
Jetzt habe ich mal eine kleine Simulation durchgeführt (das erledigt alles der Computer, das scheinbare „Zufallsexperiment“ nutzt die vom Computer zur Verfügung gestellten Zufallszahlen, die selbstverständlich von einer Funktion berechnet werden, eine Funktion aber folgt immer einer Rechenvorschrift. Und nur, weil ich sie nicht kenne, heißt es noch lange nicht, dass man es nicht „wissen“ kann, was als nächstes kommt. Dennoch genügt das für unsere Zwecke hier) von 1000 spins. Das Ergebnis zeigt das folgende Diagramm:
Ich drucke gerne noch eines, um den Vorwurf, ein vorgefertigtes Beispiel auszuwählen zu entkräften. Zur Deutung dieses Diagramms: Der Mittelwert ist natürlich 1000/37, also 27.02. Es wurde 1000 Mal die Kugel gerollt, alle Ereignisse sind (scheinbar) gleichwahrscheinlich, also Mittelwert 1000/37. So weit klar.
In dieser Versuchsreihe hier sind die Werte einigermaßen normal verteilt. Einer kommt öfter, einer seltener, was auch sonst. Sollten alle gleich oft kommen? Dennoch gibt es einen erkennbaren Ausreißer nach oben. Die 37 ist tatsächlich 42 Mal gekommen. Mittelwert ca. 27, ein Wert kommt 42 Mal. Tolerieren, akzeptieren oder nach Fehlern suchen? Ein Programmierfehler? Die Antwort der Statistik lautet so: Die Standardabweichung für diese Verteilung hier berechnet man mithilfe der Binomialverteilung. Diese Verteilung ist eine Sequenz von 1en und 0en. Jede einzelne Zahl gehorcht dabei deren Gesetzen, denn jede einzelne Zahl kommt oder kommt nicht, 0 oder 1. Die Standardabweichung der Binomialverteilung kann man exakt berechnen. Bei 1000 Versuchen ist sie
√1000*(1/37)*(36/37). Das ist 5.12. Die dreifache Standardabweichung ist 3*5.12, also 15.36. 27.02 + 15.36 = 42.38. Also liegt der Messwert, der Ausreißer, gerade noch innerhalb der dreifachen, aber außerhalb der doppelten Standardabweichung.
Jetzt muss man aber noch genauer hinschauen. Die Wahrscheinlichkeit, dass ein Wert oberhalb der dreifachen Standardabweichung liegt ist 0.3%. Aber wir haben ja 37 Werte. Also haben wir 37 Versuche auf 0.3%. Die Wahrscheinlichkeit, dass ein Ereignis mit einer Wahrscheinlichkeit von 0.3% bei 37 Versuchen einmal eintritt, ist bereits bei 10.5%. Also würden wir bei einer von 10 Versuchsreihen bereits einen Ausreißer erwarten, der außerhalb der dreifachen Standardabweichung liegt.
Ich habe übrigens im Anschluß das Experiment tatsächlich 100 Mal wiederholt (Glauben Sie mir, es war kein Misstrauen gegenüber meiner Gefährtin, eher Neugier). Und tatsächlich: Bei den 100 Durchläufen gab es 11 Mal einen derartigen Ausreißer.
Wie versprochen ein zweites Diagramm. Wir haben „Ausreißer“ nach oben und nach unten. Und tatsächlich noch mal die 42 als Maximum.
Jetzt zeige ich Ihnen noch ein manipuliertes Diagramm, welches in etwa dem entsprochen haben mag, was ich aus den Permanenzen erhalten habe (leider sind die Daten nicht mehr da).
Jetzt muss man sich nur noch vorstellen, dass diese 4 Ausreißer im Kessel nebeneinander liegen. Jeden einzelnen würde man noch tolerieren. Aber vier Werte nebeneinander? Wenn man die Werte zusammenfasst, dann ergibt sich folgendes Bild:
Jetzt gibt es nur noch 9 Werte. Da 9*4 nicht 37 ist, musste ich einen Wert weglassen. Die Standardabweichung für dieses Experiment wäre, nach Binomialverteilung, √10000*1/9*8/9 = 31.4. 3*31.4= 94.2. Der Mittelwert wäre 10000/9 = 1111. 1111 + 94.2 = 1205.2. Das Maximum liegt aber bei 1502. Also intuitiv gesagt: Hier muss etwas faul sein (dass die anderen Werte teilweise auch weit zu niedrig liegen hat einen offensichtlichen Grund: Ein paar Werte sind ja viel zu häufig gekommen).
Wie gesagt, dadurch, dass ich die exakten Werte nicht mehr habe und das Ergebnis hier nur durch Manipulation erzielt wurde, ist es etwas schwierig, eine exakte Aussage zu formulieren. Das Beispiel diente ja auch im Wesentlichen nur der Veranschaulichung. Möglich wäre aber selbst ein solches Ergebnis bei absolut korrekten Kesseln. Das muss man noch mal betonen. Nur ist die Wahrscheinlichkeit sehr, sehr gering.
Ich möchte nur noch abschließend versuchen, Sie für diese Begriffe und verschiedenen Formen von Zufallsexperimenten zu sensibilisieren. Es gibt also in der Theorie ein Experiment, bei dem es n (immer diese Variablen, der Mathematiker geht mit mir durch, sagen Sie einfach 6, das passt schon) Ausgänge gibt, alle n sind gleichwahrscheinlich. Das ist der idealisierte Wahrscheinlichkeitsraum, der für die LaPlace Experimente angenommen wird.
In der Praxis wird es zumindest sehr schwierig, so ein Experiment überhaupt hinzubekommen. Also meist haben wir verschieden Ausgänge, die alle irgendeine Wahrscheinlichkeit haben, die uns meist unbekannt ist, wo wir aber eine gute Schätzung haben, aufgrund des Versuchsaufbaus. Exakt zu bestimmen sind die Werte letztendlich nicht. Wenn ich in Zukunft ein LaPlace Experiment erwähne, meine ich aber eher ein „Pauli-Experiment“. Und selbst das ist noch idealisiert. Bei meinem Experiment gibt es auch n Ausgänge. Diese n Ausgänge sind allesamt bekannt aber nicht gleich. Das Pauli2- Experiment, das ist das wahre Leben. Da gibt es unendlich viele Ausgänge und keine einzige Wahrscheinlichkeit ist bekannt. Das ist aber nur ein Scherz. (Da fällt mir ein, dass ein guter Freund von mir gelegentlich anbot, um seine Chancenlosigkeit bei einem bestimmten Spiel zu dokumentieren: „Komm, wir spielen Kopf oder Zahl. Ich nehm Kante“. Soviel zum Thema „Beim Münzwurf gibt es nur zwei exakt gleichwahrscheinliche Ausgänge“).