Inhalt
» Vorbemerkung
» Formelles und Erläuterndes
» Die Formel von Bayes
» Beispiele

Vorbemerkung

Die bedingte Wahrscheinlichkeit wird oft im Gebiet der Wahrscheinlichkeitstheorie vernachlässigt, dadurch wird die Schule oft ihrer hohen Bedeutung nicht gerecht. Die Ursache ist jedoch eine simple, viele Aufgaben der bedingten Wahrscheinlichkeit können intuitiv an Baumdiagrammen oder mit Hilfe übersichtlicher Tabellen gelöst werden. Wir führen sie hier trotzdem kurz exakt ein.

Formelles und Erläuterndes

Die Wahrscheinlichkeit, dass das Ereignis \(A\) eintritt, unter der Voraussetzung, dass \(B\) bereits eingetreten ist, nennen wir bedingte Wahrscheinlichkeit \(P(A|B)\). Manchmal schreibt man auch \(P_B(A)\), diese Schreibweise tritt jedoch an wenigen Stellen der Mathematik auf, weshalb wir sie hier nicht nutzen werden.

Ganz naheliegend muss für das Ereignis \(B\) auch \(P(B)>0\) gelten, sonst könnten wir ja nicht das Eintreten des Ereignis \(A\) untersuchen, unter der Bedingung, dass \(B\) bereits eingetreten ist. Denn mit \(P(B)=0\) wäre \(B\) ja das unmögliche Ereignis.

Wir können dann für zwei beliebige Ereignisse \(A\) und \(B\), mit \(P(B)>0\), die bedingte Wahrscheinlichkeit von \(A\), vorausgesetzt \(B\), wie folgt definieren
\begin{align*}
P(A|B)=\frac{P(A\cap B)}{P(B)}.
\end{align*}

Woher kommt diese Formel? Betrachten wir als motivierendes Beispiel eine Schulklasse. Die Lehrkraft möchte eine Person für ein Beispiel an die Tafel holen. Wir teilen die Schülerinnen und Schüler in zwei Kategorienein, nämlich \(B:=\) "die ausgewählte Person ist weiblich" und \(A:=\) "die ausgewählte Person hat schwarze Haare", damit sind auch die jeweiligen Gegenereignisse \(A^c\) und \(B^c\) festgelegt. Analysiert man die Zusammensetzung der Klasse ergibt sich (zum Beispiel) folgendes Bild:

 

  \(B\) \(B^c\)  
\(A\) 4 3 7
\(A^c\) 9 8 17
  13 11 24

 

Angenommen die Auswahl ist komplett zufällig, so ist die Wahl ein Laplace-Experiment und für jedes der 24 Elementarereignisse (24 Schüler/innen) gilt \(\omega_i=\frac{1}{24}\), \(i=1,\dots, 24\). Einzelne Ereignisse können wir nun darauf aufbauend zusammensetzen. So ist \(P(B)=\frac{13}{24}\) und \(P(A)=\frac{7}{24}\). Die Wahrscheinlichkeit, dass die Person an der Tafel weiblich ist und schwarze Haare besitzt, beträgt dann \(P(A\cap B)=\frac{4}{24}\).

Gehen wir nun davon aus, dass die Lehrkraft eine weibliche Person (\(B\)) auswählen wird (da zum Beispiel am Vortag eine männliche Person ausgewählt worden war). Was ist die Wahrscheinlichkeit, dass diese schwarze Haare (\(A\)) hat? Wir schauen nun nur die Menge der weiblichen Personen an und betrachten, wie viele davon auch schwarzhaarig sind. Wir betrachten also den neuen Grundraum \(B\) mit \(|B|=13\), nicht mehr \(\Omega\), und schauen, wie viele in diesem \(B\) neben weiblich auch schwarzhaarig sind (\(A\)), also \(A\cap B\), mit \(|A\cap B|=4\). Dadurch ergibt sich nach Laplace
\begin{align*}
P(A|B)=\frac{\operatorname{guenstige}}{\operatorname{moegliche}}=\frac{4}{13}.
\end{align*}
Dieses Ergebnis erhalten wir aber auch mit unserer vorherigen Definition:
\begin{align*}
P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{\frac{4}{24}}{\frac{13}{24}}=\frac{4}{13}.
\end{align*}

Umgangssprachlich "wählen wir im Nenner einen neuen Grundraum, \(B\)".

Die Formel von Bayes

Oftmals möchten wir \(P(A|B)\) durch \(P(B|A)\) oder ähnliche bedingte Wahrscheinlichkeiten ersetzen. Hier hilft uns die Formel von Bayes:
\begin{align*}
P(B|A)=\frac{P(A\cap B)}{P(A)}=\frac{P(A\cap B)}{P(B)\cdot P(A|B)+P(B^c)\cdot P(A|B^c)}.
\end{align*}

Die Formel von Bayes erlaubt uns einen Perspektivenwechsel, mehr dazu hier.

Beispiele

 

HIV: In der Medizin ist es bei der Analyse eines Patienten nicht nur wichtig, dass ein Test \(T\) eine Krankheit erkennt, man versucht auch die Fehldiagnose möglichst gering zu halten. Eine HIV-infizierte Person wird vom Test in 99,7 Prozent der Fälle richtig diagnostiziert. Man schätzt, dass 0,15 Prozent der Menschen HIV-infiziert sind. Wie hoch ist die Wahrscheinlichkeit, dass man negativ diagnostiziert wurde und an HIV erkrankt ist?

Lösung mit einer Vierfeldertafel: Diese Lösung "existiert" nicht. Oftmals werden in Beispielen so viele Ereignisse/Wahrscheinlichkeiten gegeben, dass das Beispiel "eh mit der Vierfeldertafel lösbar ist". In unserem Beispiel definieren wir mit \(V:=\)"Viruserkrankt" und wir wissen \(P(V)=0,0015\) und dadurch \(P(V^c)=0,9985\). Zudem wissen wir, dass wenn jemand HIV-infiziert ist, der "Test auch Ja sagt"\(:=T\) und zwar in 99,7 Prozent der Fälle, also \(P(T|V)=0,997\). Diese Informationen reichen aber noch nicht für eine Vierfeldertafel

 

  \(T\) \(T^c\)
\(V\)   ? 0,0015
\(V^c\)     0,9985
      1

 

denn \(P(T|V)\) "hat dort keinen Platz" und um die Wahrscheinlichkeit des gesuchten Ereignisses \(V\cap T^c\) zu berechnen, fehlen uns weitere Informationen. Wir können uns jedoch damit eine weitere Wahrscheinlichkeit ausrechnen:

Lösung mit der bedingten Wahrscheinlichkeit: Wir bauen auf dem zuvor erarbeitetem auf. Laut der bedingten Wahrscheinlichkeit gilt
\begin{align*}
& P(T|V)=\frac{P(V\cap T)}{P(V)}=0,997\\
\Leftrightarrow & P(V\cap T)=0,997\cdot P(V)\\
& P(V\cap T)=0,997\cdot 0,0015=0,0014955.
\end{align*}


Damit können wir unsere Vierfeldertafel erweitern

  \(T\) \(T^c\)
\(V\) 0,0014955 ? 0,0015
\(V^c\)     0,9985
      1

und erhalten für \(P(V\cap T^c)=0,0015-0,0014955=0,0000045\).

Aufgabe mit Bayes: Wir bleiben in der selben Aufgabe und wollen wissen, wie hoch die Wahrscheinlichkeit ist, wirklich HIF-infiziert zu sein, wenn der Test positiv ist. Zusätzlich wissen wir, dass der Test in 0,1 Prozent der Fälle eine positive HIV-Erkrankung meldet, auch wenn der Patient gesund ist.

Lösung: Wir suchen also \(P(V|T)\). Wir wissen, dass
\begin{align*}
P(V|T)=\frac{P(V\cap T)}{P(T)}
\end{align*}
gilt. Dabei kennen wir jedoch den Nenner \(P(T)\) nicht sondern nur
\begin{align*}
& P(V)=0,0015\quad & P(V^c)=0,9985 \\
& P(T|V)=0,997 & P(T^c|V)=0,003 \\
& P(V\cap T)=0,0014955 & \\
& P(V\cap T^c)=0,0000045 & \\
& P(T|V^c)=0,001 &
\end{align*}


Wir wenden die Formel von Bayes an und erhalten
\begin{align*}
P(V|T) & =\frac{P(T|V)\cdot P(V)}{P(T|V)\cdot P(V)+P(T|V^c)\cdot P(V^c)}\\
& = \frac{0,0015\cdot 0,997}{0,0015\cdot 0,997+0,02\cdot 0,9985}\approx 0,5996.
\end{align*}


Dies ist ein Grund, weshalb oftmals zwei unabhängige Tests verwendet werden.