Banner der Website mathematik.de. Motiv: Überall ist Mathematik

Bedingte Wahrscheinlichkeiten

Bedingte Wahrscheinlichkeiten und unabhängige Ereignisse

1. Beispiel: Medizinische Tests

Als einführendes Beispiel für bedingte Wahrscheinlichkeiten wollen wir medizinische Tests betrachten. Diese liefern einem ein positives bzw. negatives Ergebnis, was auf Erkrankung oder eben Nichterkrankung schließen lassen soll. Dabei ist jedoch zu berücksichtigen, dass diese Tests jeweils nur mit einer gewissen Wahrscheinlichkeit zuverlässige Ergebnisse liefern. (Im Idealfall sollte diese Zuverlässigkeit natürlich so hoch wie möglich sein, damit der Test überhaupt sinnvoll zu benutzen ist.) Eine Sicherheit bieten sie jedoch im Normalfall nicht.
Die Konsequenz ist, dass ein positiver Test nur zu einer gewissen Wahrscheinlichkeit eine wirklich Erkrankung bedeutet.

Betrachten wir nun ein konkretes Beispiel:
Unser Test ist durch folgende Wahrscheinlichkeiten gegeben:

  • Die Wahrscheinlichkeit, dass eine erkrankte Person als krank erkannt wird liegt bei 95 %.
  • Die Wahrscheinlichkeit, dass eine nicht erkrankte Person als nicht krank erkannt wird liegt bei 93 %.

Wir wollen nun ermitteln, wie hoch die Wahrscheinlichkeit einer Erkrankung tatsächlich ist, wenn der Test positiv ausfällt.

Wir werden das Problem mit den uns bereits bekannten Baumdiagrammen zu lösen versuchen.
Hierbei setzen wir K für Erkrankung und N für Nichterkrankung, des Weiteren beschreibt (+) einen positiven Test und (-) einen negativen. P(K) ist die Wahrscheinlichkeit, dass eine Person erkrankt ist, P(N) diejenige, dass eine Person nicht erkrankt ist.
Das Baumdiagramm hat also folgende Struktur:


Wir können erkennen, dass unter der Voraussetzung eines positiven Tests, die beiden Pfade (K,(+)) und (N,(+)) möglich sind. Die Wahrscheinlichkeit für einen positiven Test ist also P((+)) = P(K)*0,95 + P(N)*0,07, wobei noch zu beachten ist, dass P(N) = 1 - P(K) gilt.
Wir erhalten also:

Da wir insgesamt berechnen wollen, wie hoch die Wahrscheinlichkeit einer Erkrankung unter der Voraussetzung eines positiven Tests ist, interessiert uns also der Anteil derjenigen Personen unter denen mit positiven Tests, die auch wirklich erkrankt sind. Das entspricht in unserem Fall der Wahrscheinlichkeit P(K(+)) = P(K)*0,95.
Die gesuchte Wahrscheinlichkeit der Personen, die bei einem positiven Test auch wirklich erkrankt sind ist also:

(Das hier verwendete Zeichen P(+)(K) beschreibt die Wahrscheinlichkeit, dass eine Erkrankung (K) vorliegt, wenn bereits bekannt ist, dass der Test positiv (+) ausgefallen ist. Dazu später mehr. Eine andere Schreibweise ist P(K|(+)).)

Natürlich ist das Ergebnis davon abhängig, wie hoch die Wahrscheinlichkeit einer Erkrankung insgesamt ist. Sagen wir beispielsweise, die Wahrscheinlichkeit für eine Erkrankung liegt bei P(K) = 0,00068 (Dies entspricht der Statistik der HIV-Infizierten Personen in Deutschland 2006).
In diesem Fall liegt die Wahrscheinlichkeit bei einem positiven Test auch wirklich erkrankt zu sein bei etwa 0,009, was 0,9% entspricht.
Dies veranschaulicht recht gut, dass positive Tests, die wie in unserem Fall eine Zuverlässigkeit von etwa 93-95% haben, bei eher seltenen Erkrankungen nicht unbedingt eine wirklich klare Aussage liefern.
(Achtung: Die hier vorgestellten Test entsprechen nicht den wirklichen. Wie hoch die Zuverlässigkeit von derzeitigen HIV-Tests ist können wir hier leider nicht klären.)
Liegt die Wahrscheinlichkeit der Erkrankung hingegen bei 0,1%, also knapp 150 mal so hoch, so ist die Wahrscheinlichkeit der Erkrankung bei positivem Test etwa 0,576..., was immerhin schon 57,6% entspricht.

Nun aber zur mathematischen Formulierung der gerade betrachteten Situationen.

2. Bedingte Wahrscheinlichkeiten:

Anhand des oben vorgestellten Beispiels wollen wir eine allgemeinere Definition für bedingte Wahrscheinlichkeiten geben:

Definition:
Ist P eine Wahrscheinlichkeitsverteilung auf einem endlichen Ereignisraum und sind A und B zwei Ereignisse aus diesem, wobei P(B)>0 gilt, so ist die bedingte Wahrscheinlichkeit von A unter der Bedingung B (d.h. die Wahrscheinlichkeit, dass Ereignis A eintritt, wenn wir bereits wissen, dass Ereignis B eintritt) gegeben durch

Die somit neu definierte Wahrscheinlichkeitsfunktion PB heißt bedingte Wahrscheinlichkeitsfunktion unter der Bedingung B.

Dass es sich bei PB wirklich wieder um eine Wahrscheinlichkeitsfunktion handelt, lässt sich leicht nachrechnen. Wir müssen ja nur die drei Bedingungen

  • PB(A) 0 für alle Ereignisse A aus dem Ereignisraum
  • PB(Ω) = 1
  • PB(AC) = PB(A) + PB(C) für alle Ereignisse A,C aus dem Ereignisraum mit der Voraussetzung AC =

nachweisen.

Beweis:

  • Da P(AB) 0 und P(B) > 0 laut Voraussetzung gelten, ist natürlich auch PB(A) 0 für alle Ereignisse A aus dem Ereignisraum.
  • Wegen P(ΩB) = P(B), gilt auch PB(Ω) = 1.
  • Gilt AC = , so gilt P(AC) = P(A) + P(C), da P eine Wahrscheinlichkeitsverteilung ist.
    Somit ist auch PB(AC) = PB(A) + PB(C).

Wie man in der Definition sieht, bekäme man ein Problem, wenn P(B) = 0 sein würde, da man dann den Fall hätte, dass man durch 0 teilen müsste, dies jedoch nicht geht. Beachte, dass deswegen in der Definition gefordert worden ist, dass das Ereignis B mit einer strikt positiven Wahrscheinlichkeit eintreffen muss.
Es ist leicht zu verdeutlichen, dass diese Forderung keine Beeinträchtigung für die Theorie darstellt, was einfach daran liegt, dass es keinen großen Sinn macht die Information verarbeiten zu wollen, dass B eingetroffen ist, wenn klar ist, dass B gar nicht eintreffen kann.
Man kann somit - ohne die eigene Theorie zu beschneiden - fordern, dass P(B) > 0 gelten muss.

3. Unabhängige Ereignisse

Mit Hilfe der obigen Definition der bedingten Wahrscheinlichkeit wollen wir nun die Unabhängigkeit zweier Ereignisse definieren.
Intuitiv soll Unabhänigigkeit bedeuten, dass die Information über ein Ereignis die Erwartungen an das andere nicht verändert.
Würfelt man beispielsweise zweimal hintereinander, so wird die Information über die "Augenzahl im ersten Wurf" keinen Einfluss auf die Erwartungen an die "Augenzahl im zweiten Wurf" haben, sehr wohl aber auf die Erwarungen an die "Summe der beiden Augenzahlen".
In diesem Fall sind also die Ereignisse "Augenzahl im ersten Wurf" und "Augenzahl im zweiten Wurf" unabhängig, die beiden Ereignisse "Augenzahl im ersten Wurf" und "Summe der beiden Augenzahlen" jedoch nicht.
Mathematisch formulieren wir das so:

Definition:
Ein Ereignis A heißt von dem Ereignis B unabhängig, wenn PB(A) = P(A) gilt.

Bemerkungen:

  • Ist A von B unabhängig, so ist auch B von A unabhänigig, denn


  • Daher sagt man in diesem Fall, dass A und B voneinander unabhängig sind.
  • A und B sind genau dann voneinander unabhängig, wenn gilt: P(AB) = P(A)*P(B), denn aus der Definition von PB(A) folgt
    P(AB) = PB(A) * P(B) und unter der Voraussetung der Unabhängigkeit folgt P(AB) = P(A)*P(B).
    Gilt andererseits P(AB) = P(A)*P(B), so ist

Somit lässt sich die Definition der Unabhängigkeit auch formulieren als:

Zwei Ereignisse A und B heißen voneinander unabhängig, wenn gilt:

Diese Definition hat auch den Vorteil, dass man nicht fordern muss, dass die beiden Ereignisse mit strikt positiver Wahrscheinlichkeit eintreten werden, wie dies bei der Definition mittels der bedingten Wahrscheinlichkeit notwendig ist.
Als Folgerung erhält man dadurch, dass Ereignisse A mit P(A) = 0 von allen anderen Ereignissen B unabhängig sind, was wiederum der Intuition entspricht, da die Information über ein unmögliches Ereignis nicht die Erwartungen an andere Ereignisse beeinflusst.

Beispiel:

Wir bleiben einfach bei dem oben schon erwähnten Beispiel des zweimaligen Würfelns.
Als Ereignisse wählen wir:

  • A: Im ersten Wurf eine 3
  • B: Im zweiten Wurf eine 2
  • C: Als Summe in beiden Würfen 5

Als Wahrscheinlichkeiten erhalten wir:

  • P(A) = 1/6
  • P(B) = 1/6
  • P(C) = 4/36 = 1/9
  • P(AB) = 1/36, da AB das Ereignis "im ersten Wurf eine 3 und im zweiten Wurf eine 2" darstellt.
  • P(AC) = 1/36, da AC das Ereignis "im ersten Wurf eine 3 und insgesamt als Summe 5" darstellt, was nur durch die Wurfkombination (3,2) zu erreichen ist.

Wegen P(AB) = 1/36 = 1/6 * 1/6 = P(A)*P(B) sehen wir, dass die Ereignisse A und B voneinander unabhängig sind, was wir auch nicht anders erwartet haben.
Wegen P(AC) = 1/36 ≠ 1/6 * 1/9 = P(A)*P(C) sehen wir, dass die Ereignisse A und C nicht voneienander unabhängig sind, was ebenfalls nicht besonders überrascht, da die Information über die Augenzahl im ersten Wurf, die Erwartungen an die Augensumme sicherlich beeinflussen kann.

4. Totale Wahrscheinlichkeit:

Ist nun eine disjunkte Vereinigung der gesamten Ergebnismenge gegeben (d.h. man habe Ereignisse B1, B2, ..., Bn mit den Eigenschaften BiBj = für alle Kombinationen i ≠ j und zusätzlich B1B2 ... Bn = Ω), dann lässt sich die Wahrscheinlichkeit eines beliebigen Ereignisses A berechnen durch:

Im einfachsten Fall der Zerlegung von Ω durch B und Ω\B bedeutet dies:

Der Beweis dieser Aussage ist ziemlich einfach:

Ein Vorteil durch diese Darstellung ergibt sich immer dann, wenn sich PBi(A) leicht berechnen lässt.

5. Der Satz von Bayes:

Mit Hilfe der obigen Betrachtungen zur totalen Wahrscheinlichkeit können wir nun einen äußerst wichtigen Satz der Wahrscheinlichkeitstheorie formulieren und beweisen:

Satz von Bayes:
Seien wie oben B1, B2, ..., Bn gegeben, die eine disjunkte Vereinigung von Ω darstellen und gelte zusätzlich P(Bi) > 0 für alle i. Sei außerdem ein weiteres Ereignis A mit P(A) > 0 gegeben, so gilt für jedes i0 {1, ..., n}:


Der Spezialfall der Zerlegung {B, Ω\B} liefert:

Beweis des Satzes von Bayes:

Beispiel:

Wir starten mit zwei ununterscheidbaren Urnen, welche beide 100 Kugeln enthalten. In der 1. Urne befinden sich 80 weiße und 20 rote, in der 2. Urne 10 weiße und 90 rote Kugeln. Jetzt wird aus einer der beiden Urnen gezogen, wobei wir nicht wissen aus welcher (es wird per Münzwurf entschieden welche der beiden Urnen gewählt wird).
Angenommen wir ziehen eine rote Kugel. Die Frage ist jetzt, wie hoch die Wahrscheinlichkeiten sind, die 1. oder die 2. Urne erwischt zu haben.
Versuchen wir nun also unsere neuen Kentnisse anzuwenden:
Wir setzen:

  • A := "Es wurde eine rote Kugel gezogen."
  • B := "Es handelt sich um die 1. Urne."
  • C := "Es handelt sich um die 2. Urne."

Was wir also berechnen wollen ist PA(B), die Wahrscheinlichkeit, dass es sich um die 1.Urne handelt, falls eine rote Kugel gezogen wird, bzw. die Wahrscheinlichkeit PA(C), dass es sich um die 2. Urne handelt.
Wir kennen folgende Wahrscheinlichkeiten:

  • P(B) = 0,5
  • P(C) = 0,5
  • PB(A) = 0,2
  • PC(A) = 0,9

Mit Hilfe der Bayes-Formel können wir nun also errechnen:

Analog erhalten wir:

6. Unabhängigkeit bei mehr als zwei Ereignissen

Hier geben wir nun noch eine Verallgemeinerung des Unabhängigkeitbegriffs.

Definition:

Seien A1, A2, ..., An Ereignisse, so heißen sie voneinander unabhängig, falls für alle Teilmengen {i1, ..., ir} von {1,2,...,n} gilt: