|
Die Binomialverteilung (manchmal nicht ganz korrekt auch Bernoulli-Verteilung genannt; was das ist, siehe
unten) ist eine der wichtigsten diskreten Wahrscheinlichkeitsverteilungen. Sie beschreibt Ergebnisse von Bernoulli-Prozessen.
Ein Bernoulli-Prozess (auch: Bernoulli-Kette) besteht aus einer Abfolge mehrerer, unter
gleich bleibenden Bedingungen durchgeführter Bernoulli-Versuche.
Ein Bernoulli-Versuch (auch: Bernoulli-Experiment) ist ein Zufallsversuch mit genau zwei
möglichen Ergebnissen. Die Wahrscheinlichkeit dieser Ergebnisse wird durch die Bernoulli-Verteilung
beschrieben.
Die negative Binomialverteilung wird in
einem eigenen Artikel behandelt.
| Inhaltsverzeichnis |
|
1 Bernoulli-Versuch und
Bernoulli-Verteilung
2 Bernoulli-Prozess und
Binomial-Verteilung
3 Eigenschaften der Binomialverteilung
3.1 Symmetrische Binomialverteilung (p gleich 1/2)
3.2 Allgemeiner Fall (p?1/2)
3.2.1 Näherungen im Fall sehr vieler
Bernoulli-Versuche
4 Weitere Beispiele:
4.1 Zahlenwerte zu den Beispielen:
|
Bernoulli-Versuch und Bernoulli-Verteilung
Ein Bernoulli-Versuch ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen, die wir im folgenden als
Erfolg und Misserfolg bezeichnen werden. Die Wahrscheinlichkeit für einen Erfolg sei p; dann ist die
Wahrscheinlichkeit für einen Misserfolg q = 1 - p.
Beispiele:
- Fairer Wurf einer Münze mit p=q=0,5.
- Beim Würfeln wird nur eine "6" als Erfolg gewertet: p=1/6, q=5/6.
Die Bernoulli-Verteilung ist die Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg den Wert 1 und bei Misserfolg den Wert 0 annimmt. Die
Fallunterscheidung

kann man durch folgenden geschlossenen Ausdruck ersetzen:

denn es ist


Der Erwartungswert lautet E(X)=p, die Varianz E(X2)-E(X)2=pq.
Bernoulli-Prozess und Binomial-Verteilung
Ein Bernoulli-Prozess ist ein zeitlich diskreter stochastischer Prozess, der aus einer endlichen oder abzählbar-unendlichen Folge von
Bernoulli-Versuchen besteht. Er kann durch eine Folge von Zufallsvariablen X1, X2,
X3,..., beschrieben werden, deren jede mit der konstanten Wahrscheinlichkeit p den Wert
X=1 (Erfolg) und mit der Wahrscheinlichkeit q=1-p den Wert X=0 (Misserfolg)
annimmt. Eine Veranschaulichung der Zusammenhänge ist z.B. durch das Galtonbrett, ein mechanisches Modell für eine Bernoulli-Kette, möglich.
Je nach Fragestellung interessiert man sich für eine oder mehrere der folgenden Zufallsvariablen:
- Die Anzahl K erfolgreicher Versuche nach Durchführung von insgesamt n Versuchen; sie folgt einer
Binomialverteilung.
- Die Anzahl n von Versuchen, die benötigt werden, um eine vorgegebene Anzahl von r Erfolgen zu erzielen; sie
folgt der negativen Binomialverteilung.
Beispiele:
- Ein betrunkener Fußgänger (oder ein diffundierendes Teilchen) bewegt sich bei
jedem Schritt mit der Wahrscheinlichkeit p vorwärts, mit der Wahrscheinlichkeit q rückwärts. Man interessiert
sich für die Entfernung vom Ausgangspunkt 2K-n. Ein solches Modell wird in der Physik als eindimensionaler
Random Walk bezeichnet.
Eigenschaften:
- Ein Bernoulli-Prozess ist ein spezieller Markow-Prozess: beim
"Zeitschritt" von n nach n+1 geht das System mit der Wahrscheinlichkeit p aus dem "Zustand" k
in den Zustand k+1 über; sonst bleibt es im Zustand k.
Die Zufallsvariable K, die angibt, wie viele von n Bernoulli-Versuchen erfolgreich waren, folgt der
Binomial-Verteilung. Wir leiten diese Verteilung anhand eines Beispiels her:
- Beim Würfeln mit einem Würfel werde die Sechs als Erfolg gewertet; die Erfolgswahrscheinlichkeit ist also p=1/6, die
komplementäre Misserfolgswahrscheinlichkeit q=5/6. Gefragt sei nun nach der Wahrscheinlichkeit, in n=5 Würfen
genau k=2 Sechsen zu werfen.
Antwort: Die Wahrscheinlichkeit, erst zwei Sechsen, dann drei Nicht-Sechsen zu werfen, ist
p2q3. Da es auf die Reihenfolge aber nicht ankommt, ist diese Wahrscheinlichkeit zu
multiplizieren mit der Anzahl der Möglichkeiten, zwei (ununterscheidbare) Sechserwürfe auf fünf Würfe zu verteilen. Der Kombinatorik zufolge ist diese Anzahl durch den Binomialkoeffizienten "5 über 2" gegeben; die gesuchte Wahrscheinlichkeit lautet also:

Davon verallgemeinert, lautet die Wahrscheinlichkeit, in n Bernoulli-Versuchen genau k mal Erfolg zu
haben,

mit q=1-p. Diese Funktion heißt Binomial-Verteilung oder binomische
Verteilung. Es gibt keine einheitliche Notation; neben B(k|p, n) findet man viele
andere Schreibweisen wie zum Beispiel Pp(k|n) oder
Wpn(k).
Eigenschaften der Binomialverteilung
Die Binomialverteilung besitzt den Erwartungswert np und
die Varianz npq.
Die Binomialverteilung besitzt die Symmetrie B(k|p, n) = B(k|q,
n-k).
Symmetrische Binomialverteilung (p gleich 1/2)
Dieses Bild zeigt die Binomialverteilung für p=0,5 und verschiedene Werte von n als Funktion von
k:

Diese Funktion ist spiegelsymmetrisch um den Wert k=n/2:
- B(k|0,5, n) = B(k|0,5, n-k),
wie die folgende Auftragung zeigt:

Die Breite der Verteilung wächst proportional zur Standardabweichung ?=(?n)/2. Der Funktionswert bei
k=n/2, also das Maximum der Kurve, sinkt proportional zu ?. Dementsprechend kann man Binomialverteilungen mit
unterschiedlichem n aufeinander skalieren, indem man die Abszisse k-n/2 durch ?
teilt und die Ordinate mit ? multipliziert:

Das folgende Bild zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von n und in einer
Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem n gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, erkennt man, dass diese Kurve (im Bild schwarz durchgezogen) eine
Gaußsche Glockenkurve ist:
.
Dies ist die Wahrscheinlichkeitsdichte zur
Standard-Normalverteilung N(0,1). Im zentralen Grenzwertsatz wird dieser Befund dahingehend
verallgemeinert, dass auch Folgen anderer diskreter Wahrscheinlichkeitsverteilungen gegen die Normalverteilung konvergieren.

Und hier die gleichen Daten in einer halblogarithmischen Auftragung, die sehr zu empfehlen ist, wenn man überprüfen möchte, ob
auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung
folgen:

Allgemeiner Fall (p?1/2)
Näherungen im Fall sehr vieler Bernoulli-Versuche
Im Grenzfall großer n konvergiert die Binomialverteilung gegen eine Normalverteilung:

Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np>4 und nq>4. Je asymmetrischer die
Binomialverteilung, umso größer muss n sein, bevor die Normalverteilung eine brauchbare Näherung liefert.
Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert np für große n gegen eine von
n unabhängige Konstante ? konvergiert, kann man durch die Poisson-Verteilung nähern:

Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np?10 und n>1500p.
Weitere Beispiele:
In einem Behälter befinden sich 80 Kugeln, davon sind 16 gelb. Es wird 5-mal eine Kugel entnommen und anschließend wieder
zurückgelegt. Wegen des Zurücklegens ist die Wahrscheinlichkeit, eine gelbe Kugel zu ziehen, bei allen Entnahmen gleich groß:
16/80 = 1/5 = 0,2. Die Verteilung B(k|0,2; 5) gibt die Wahrscheinlichkeit dafür an, dass genau k der entnommenen Kugeln gelb
sind.
Die Wahrscheinlichkeit, dass eine Person in diesem Jahr an einem Wochenende Geburtstag hat, beträgt 2/7. In einem Raum halten
sich 10 Personen auf (Darunter sind keine Zwillinge). Die Verteilung B(k|2/7; 10) gibt die Wahrscheinlichkeit dafür an, dass
genau k der Anwesenden in diesem Jahr an einem Wochenende Geburtstag haben.
Zahlenwerte zu den Beispielen:
|
B(k|0,2; 5)
|
| k |
Wahrscheinlichkeit in % |
| 0 |
32,768 |
| 1 |
40,96 |
| 2 |
20,48 |
| 3 |
5,12 |
| 4 |
0,64 |
| 5 |
0,032 |
| ? |
100 |
| Erw.Wert |
1 |
| Varianz |
0.8 |
|
B(k|2/7; 10)
|
| k |
Wahrscheinlichkeit in % |
| 0 |
3,457161303360777 |
| 1 |
13,828645213443108 |
| 2 |
24,89156138419759 |
| 3 |
26,55099880981076 |
| 4 |
18,585699166867535 |
| 5 |
8,921135600096417 |
| 6 |
2,973711866698805 |
| 7 |
0,6797055695311554 |
| 8 |
0,1019558354296733 |
| 9 |
0,009062740927082069 |
| 10 |
0,0003625096370832828 |
| ? |
100 |
| Erw.Wert |
2,8571428571428568 |
| Varianz |
2,040816326530612 |
Für Anfänger zum Nachlesen im Wikibook Mathematik: Binomialverteilung
|