Inhalt
» Vorbemerkungen
» Bernoulli-Experimente
» Die Herleitung der Binomialverteilung
» Die Formel
» Beispiele
» Erwartungswert und Varianz
» Visualisierung der Binomialverteilung
Vorbemerkungen
Das Bernoulli-Experiment ist eine grundsätzliche Überlegung für eine Reihe von Versuchsausgängen. Liegt ein Bernoulli-Experiment vor, können wir die Binomialverteilung nutzen um eigentlich komplizierte, ausführliche Rechnungen mit einer kurzen Formel lösen zu können.
Bernoulli-Experimente
Ein Bernoulli-Experiment hat nur zwei Versuchsausgänge. Wir nennen einen davon oftmals "Erfolg" oder "Treffer", er tritt mit einer Wahrscheinlickeit \(p\) ein. Das Gegenereignis nennen wir analog "Niete" oder "Nichttreffer" und hat die Wahrscheinlichkeit \(1-p\), diese wird in vielen Werken mit \(q=1-p\) abgekürzt. Wiederholt man dieses Ereignis, so bleibt die Trefferwahrscheinlickeit konstant \(p\). Man nennt die einzelnen Wiederholungen des Bernoulliexperiments daher unabhängig.
Der Würfelwurf hat sechs verschiedene Ausgänge. Reduzieren wir uns jedoch auf zum Beispiel die Ereignisse \(A:=\) "eine 6 wird gewürfelt" und \(A^c:=\) "keine 6 wird gewürfelt" so erhalten wir ein Bernoulliexperiment, denn \(P(A)=\frac{1}{6}=p\) bleibt konstant gleich, der Würfel "besitzt kein Gedächtnis".
Die Herleitung der Binomialverteilung
Betrachten wir den viermaligen Würfelwurf und bezeichnen mit \(X\) die Anzahl an Sechsen, die gewürfelt werden. Es gilt dann natürlich \(X\in \{0,\dots ,4\}\) und wir können ein (sehr großes) Baumdiagramm anfertigen.
Möchten wir \(P(X=0)\) berechnen, so erhalten wir einen Ast und mit Hilfe des Multiplikationssatzes
\begin{align*}
P(X=0)=(\frac{5}{6})^4
\end{align*}
Als nächstes möchten wir \(P(X=1)\) berechnen und ein Blick auf den Baum zeigt uns vier Äste
mit dazugehörigen Wahrscheinlichkeiten
\begin{align*}
P(X=1) & =\frac{1}{6}\cdot (\frac{5}{6})^3+ \frac{5}{6}\cdot \frac{1}{6}(\frac{5}{6})^2+\\
& + (\frac{5}{6})^2 \cdot \frac{1}{6} \cdot \frac{5}{6}+(\frac{5}{6})^2 \cdot \frac{5}{6} \cdot \frac{1}{6}.
\end{align*}
Was fällt uns auf? Alle vier Summanden bestehen aus den selben vier Faktoren, einmal \(\frac{1}{6}=p\) für einen 6er und dreimal \(\frac{5}{6}=(1-p)\) für dreimal keine 6. Wir können nun aber schreiben
\begin{align*}
P(X=1) =4 \frac{1}{6}\cdot (\frac{5}{6})^3.
\end{align*}
Die selbe Überlegung führt uns bei \(P(X=2)\) auf die Erkenntnis, dass jeder Summand aus zwei mal \(\frac{1}{6}\) und zwei mal \(\frac{5}{6}\) besteht. Nun stellt sich die Frage, gibt es wieder vier Äste oder mehr? Wenn wir kurz zählen, kommen wir auf sechs Äste. Finden wir nun eine Formel für die Anzahl der Äste? Die Antwort ist natürlich Ja und wir nutzen dafür die Kombinatorik. Wie viele Anagramme gibt es mit den "Buchstaben" \(6,6,6^c\) und \(6^c\) (zweimal 6 und zweimal nicht 6)? Wir haben dieses Problem bereits im Kapitel der Kombinatorik gelöst, es sind \(\binom{4}{2}\) Möglichkeiten. Daraus können wir schließen, dass
\begin{align*}
P(X=2)=\binom{4}{2}(\frac{1}{6})^2\cdot (\frac{5}{6})^2
\end{align*}
gilt.
Für \(P(X=3)\) schließen wir dann analog auf \(\binom{4}{3}=4\) Äste bestehend aus dreimal \(\frac{1}{6}\) und einmal \(\frac{5}{6}\). Es folgt
\begin{align*}
P(X=3)=\binom{4}{3}(\frac{1}{6})^3\cdot \frac{5}{6}.
\end{align*}
Die Binomialverteilung ist also anwendbar bei einem Baumdiagramm mit zwei Versuchsausgängen (pro Ebene) und gleichbleibendem \(p\), daher haben viele Beispiele (Münzwurf, Würfelwurf) oftmals neben dem Baumdiagramm auch die Binomialverteilung als Lösungsweg. Sie ist jedoch so wichtig und tritt so häufig auf, dass sie ihren eigenen Platz in der Wahrscheinlichkeitstheorie eingenommen hat. Sie ist eine diskrete Wahrscheinlichkeitsverteilung.
Die Binomialverteilung als Urnenmodell entspricht dem wiederholten Ziehen aus einer Urne ohne Beachtung der Reihenfolge und mit Zurücklegen der Kugeln (damit \(p\) konstant bleibt). Wichtig ist auch, dass es nur zwei Versuchsausgänge gibt, "Treffer" und "Nieten". Man nennt so ein Experiment dichotom.
Die Formel
Weiß man von einer Binomialverteilung die Anzahl der Versuche \(n\) und die Trefferwahrscheinlichkeit \(p\) so lässt sich die Wahrscheinlichkeit, \(k\) Treffer zu erhalten, einfach mit der Formel
\begin{align*}
P(X=k)=\binom{n}{k}\cdot p^k\cdot (1-p)^{n-k}
\end{align*}
berechnen. Oftmals wird die Formel abgekürzt durch \(q=1-p\), aber der größere Sinn dahinter erschließt sich nicht.
Beispiele
Multiple-Choice: Ein Studierender hat nicht auf eine Prüfung gelernt. Es gibt zehn Fragen mit je vier Antwortmöglichkeiten, genau eine davon ist richtig. Er kreuzt alles komplett zufällig an. Wie hoch ist die Wahrscheinlichkeit, dass er mindestens 80 Prozent der Aufgaben richtig löst?
Lösung
Der Studierende muss also mindestens \(10\cdot 0,8=8\) Fragen von \(n=10\) richtig beantworten. Pro Frage hat er vier gleich wahrscheinliche Antwortmöglichkeiten, Laplace besagt nun, dass die Wahrscheinlichkeit, richtig anzukreuzen, \(\frac{1}{4}=p\) beträgt. Es folgt
\begin{align*}
P(X\geq 8) & =P(X=8)+P(X=9)+P(X=10)=\\
& =\binom{10}{8}\cdot (\frac{1}{4})^8\cdot (1-\frac{1}{4})^{10-8}+\binom{10}{9}\cdot (\frac{1}{4})^9\cdot (\frac{3}{4})^1 +\binom{10}{10}\cdot (\frac{1}{4})^{10}\cdot (1-\frac{1}{4})^0=\\
& \approx 0,0004.
\end{align*}
Der Studierende sollte also besser lernen.
Das Gegenereignis: Das Beispiel sei wie zuvor. Die Frage ist nun, wie hoch ist die Wahrscheinlichkeit, mindestens zwei Beispiele richtig zu lösen?
Lösung
Es gilt analog \(n=10\) und \(p=\frac{1}{4}\). Leider besteht
\begin{align*}
P(X\geq 2) & =P(X=2)+P(X=3)+\cdots +P(X=10)
\end{align*}
aus sehr vielen Fällen (neun). Auch wenn wir jeden dieser Fälle mit unserer Formel berechnen können ist es doch mühselig. Schneller sind wir mit dem Gegenereignis
\begin{align*}
P(X\geq 2) & =1-P(X<2)=1-P(X\leq 1)=\\
& 1-(P(X=0)+P(X=1))=\\
& 1-\binom{10}{0}(\frac{1}{4})^0\cdot (\frac{3}{4})^{10}-\binom{10}{1}(\frac{1}{4})^1\cdot (\frac{3}{4})^{9}=\\
& =0,756.
\end{align*}
Das Drei-Mindestbeispiel: Dieses Beispiel hat aufgrund der oftmals ähnlichen Aufgabenstellung einen Spitznamen erhalten. Es ist letztendlich aber eine Aufgabe der Algebra im "binomialen Gewand", wie viele Fragen müssen mindestens gestellt werden, damit unser Studierender mit einer Wahrscheinlichkeit von mindestens 95 Prozent mindestens eine Frage richtig hat?
Lösung
Übersetzt in die Sprache der Mathematik besagt die Frage, ab welchem \(n\) gilt
\begin{align*}
P(X\geq 1)>0,95?
\end{align*}
Wir formen ein wenig um und erhalten
\begin{align*}
& P(X\geq 1)\geq 0,95 \\
& 1-P(X=0)\geq 0,95 \\
& 0,05\geq P(X=0) \\
& 0,05\geq \binom{10}{0}(\frac{1}{4})^0\cdot (\frac{3}{4})^n.
\end{align*}
Nun gilt aber \((\frac{1}{4})^0=\binom{10}{0}=1\) und es bleibt die Ungleichung
\begin{align*}
& 0,05\geq (\frac{3}{4})^n.
\end{align*}
Wir logarithmieren und lösen damit die Gleichung
\begin{align*}
& \log (0,05)\geq n \cdot \log(\frac{3}{4}) \\
& \frac{\log (0,05)}{\log(\frac{3}{4})} \leq n \\
& 10,4133\leq n
\end{align*}
Also muss die Prüfung mindestens elf Fragen beinhalten. Natürlich kann die Angabe auch geschickter und losgelöster von drei "mindestens" erscheinen.
Erwartungswert und Varianz
Erwartungswert \(E(x)\mu\) und Varianz \(Var(X)=\sigma^2\) einer Binomialverteilung berechnen sich ganz einfach über
\begin{align*}
\mu=n\cdot p,\qquad \sigma^2=n\cdot p\cdot (1-p).
\end{align*}
Visualisierung der Binomialverteilung
Die Binomialverteilung ist das Musterbeispiel wenn man eine diskrete Zufallsvariable per Histogramm visualisiert. Deutlich sieht man den Erwartungswert als höchsten Balken und wir erkennen auch, dass sich alle Diagramme in ihrer Form ähneln.