Banner der Website mathematik.de. Motiv: Überall ist Mathematik

Wahrscheinlichkeitsräume

Wahrscheinlichkeitsräume

1. Definition

Nachdem wir uns nun schon einige Zufallsexperimente angesehen haben, wollen wir das Ganze auf einen etwas festeren mathematischen Boden stellen. Dazu definieren wir uns den Begriff der Wahrscheinlichkeitsräume, welcher von enormer Bedeutung sein wird, da er die Grundlage für die weiteren Betrachtungen bildet.

Definition:

Ein Wahrscheinlichkeitsraum ist gegeben durch:

  1. eine Menge Ω, die Menge der Elementarereignisse,
  2. eine Menge , der Menge der Ereignisse, wobei es zunächst erlaubt ist, sich darunter alle Teilmengen von Ω vorzustellen,
  3. eine Funktion P, welche jedem Ereignis E aus der Menge eine Zahl aus dem Intervall [0,1] zuordnet.
  4. Zusätzlich soll P(EF) = P(E) + P(F) gelten, falls EF = ist.
  5. Letztendlich soll P(Ω) = 1 gelten.

Erläuterung der einzelnen Punkte:

Zu (1): Die Menge Ω ist die uns schon von den Zufallsexperimenten bekannte Ergebnismenge. Sie beinhaltet alle möglichen Elementarereignisse.
Beim Würfelbeispiel wäre also Ω = {1,2,3,4,5,6}.
Zu (2): Die Menge heißt auch System der Ereignisse. Wie schon gesagt, ist es zu Beginn erlaubt, sich diese als Potenzmenge (d.h. Menge aller Teilmengen) von Ω vorzustellen.
Im Würfelbeispiel enthält sie z.B. Ereignisse wie alle geraden Zahlen, was der Menge {2,4,6} entspricht, oder alle Zahlen, welche größer als 2 sind, was der Menge {3,4,5,6} entspricht.
Zu (3): Die Funktion P ist uns bereits als Wahrscheinlichkeitsverteilung bekannt. Ein anderer Name, welchen wir von nun an benutzen wollen, ist Wahrscheinlichkeitsmaß.
Zu (4) und (5): Diese beiden Punkte stellen nur sicher, dass es sich bei P auch wirklich um eine Wahrscheinlichkeitsverteilung handelt.

Insgesamt lässt sich ein Wahrscheinlichkeitsraum also als Tupel (Ω,,P) darstellen.

Beispiel:

Der Münzwurf:
Hierbei ist Ω = {K,Z}, wobei K für Kopf, Z für Zahl steht.
Des Weiteren sind gegeben:
= {, {K}, {Z}, {K,Z}}
und
P: → [0,1] mit P() = 0, P({K}) = 0,5, P({Z}) = 0,5, P({K,Z}) = 1.

2. Wahrscheinlichkeitsräume für Fortgeschrittene

Wie bereits oben angedeutet, ist es in den einfacheren Beispielen und gerade zu Beginn sinnvoll, sich das System der Ereignisse als Potenzmenge von Ω vorzustellen. Handelt es sich jedoch um eine nicht-endliche Menge Ω, so ist das eine Einschränkung, die eine sinnvolle Theorie zu sehr beschränkt.
Für Interessierte wollen wir hier nun andeuten, wie es in den etwas komplizierteren Fällen geht.

Definition σ-Algebra:

Sei Ω eine beliebige Menge und ein System von Teilmengen.
Dann heißt eine σ-Algebra, falls gilt:

  1. und Ω sind Elemente aus .
  2. Sind E und F in , so gehören auch EF, EF und Ω\E zu .
  3. Sind E1, E2, ... in , so gilt dies auch für E1E2...
    (Beachte: Es handelt sich hier um eine unendliche, jedoch abzählbare Vereinigung.)

Erläuterung:

Zu (1): Hierbei handelt es sich um eine naheliegende Forderung, da natürlich die beiden Ereignisse und Ω Elemente aus sein sollten.
Mit P() = 0 und P(Ω) = 1 kennen wir ja auch bereits deren Werte unter der Funktion P.
Zu (2): Diese Forderung liefert, dass es möglich sein muss, Informationen zu kombinieren. Haben wir etwa die Ereignisse "gerade Zahlen" und "Zahlen größer als 2" in , so sollten natürlich auch die Ereignisse "gerade oder größer als 2", d.h. {2,3,4,5,6}, "gerade und größer als 2", d.h. {4,6} und "nicht gerade", d.h. {1,3,5} bzw. "kleiner oder gleich 2", d.h. {1,2} Elemente aus sein.
Zu (3): Hier wird die Vereinigung von Ereignissen von endlichen vielen, wie in (2), auf unendlich aber abzählbar viele ausgeweitet.

Eine weitere Modifikation betrifft noch den Punkt (4) aus der Definition des Wahrscheinlichkeitsraumes:
Wir wollen nun nicht mehr nur P(EF) = P(E) + P(F) für EF = fordern, sondern auch diese Eigenschaft auf unendlich, aber abzählbar viele Ereignisse ausdehnen.
Für E1, E2, ... mit EiEj= für alle i≠j soll gelten: P(E1E2...) = P(E1)+P(E2)+...
(Beachte: Es handelt sich hier um eine unendliche Summe, die jedoch aufgrund der getroffenen Annahmen existiert.)

Allgemeine Definition eines Wahrscheinlichkeitsraumes

Somit können wir nun ganz allgemein defnieren:

Ein Wahrscheinlichkeitsraum (Ω,,P) ist gegeben durch:

  1. eine Menge Ω,
  2. eine σ-Algebra auf Ω,
  3. ein Wahrscheinlichkeitsmaß P: → [0,1], für welches gilt P(Ω) = 1 und P(E1E2...) = P(E1)+P(E2)+... für Ereignisse E1, E2, ... mit EiEj= für alle i≠j.

3. Eigenschaften von Wahrscheinlichkeitsräumen:

Wir wollen jetzt drei wichtige Eigenschaften in beliebigen Wahrscheinlichkeitsräumen beweisen:
(Hierbei seien E und F jeweils Ereignisse aus .)

  1. P(E) + P(Ω\E) = 1
  2. Ist E F, so gilt: P(E) P(F)
  3. P(EF) = P(E) + P(F) - P(EF)

Beweise:

  1. Da E und Ω\E disjunkt sind, d.h. EΩ\E = gilt, folgt: P(EΩ\E) = P(E) + P(Ω\E).
    Außerdem gilt EΩ\E = Ω, also P(EΩ\E) = P(Ω) = 1.
    Nimmt man diese beiden Überlegungen zusammen, so erhält man:
    P(E) + P(Ω\E) = P(EΩ\E) = P(Ω) = 1.
  2. Wegen E F gilt F = E(F\E) und E(F\E) = .
    Daraus folgt: P(F) = P(E) + P(F\E), also P(E) = P(F) - P(F\E).
    Wegen P(F\E) [0,1], also P(F\E) 0 folgt P(E) P(F).
  3. Wir schreiben EF als disjunkte Vereinigung [EF] [F\(EF)] [E\(EF)].
    Somit erhalten wir P(EF) = P(EF) + P(F\(EF)) + P(E\(EF)).
    Außerdem gilt F = (EF) [F\(EF)], was ebenfalls eine disjunkte Vereinigung ist und somit P(F) = P(EF) + P(F\(EF)) liefert.
    Daraus folgt:
    P(F\(EF)) = P(F) - P(EF).
    Analog erhält man:
    P(E\(EF)) = P(E) - P(EF).
    Zusammensetzen der Ergebnisse liefert:
    P(EF) = P(EF) + P(F) - P(EF) + P(E) - P(EF) = P(E) + P(F) - P(EF).

4. Diskrete Wahrscheinlichkeitsräume

In die Kategorie der diskreten Wahrscheinlichkeitsräume fallen unter anderem die uns bereits bekannten endlichen Wahrscheinlichkeitsräume, also diejenigen, deren Elementarereignismenge Ω endlich ist. Im Würfelbeispiel besteht Ω = {1,2,3,4,5,6} aus sechs Elementen.
Als System von Ereignissen können wir, wie bereits erläutert, problemlos die Potenzmenge wählen. hätte in diesem Fall also 26 = 64 Elemente.
Um das Wahrscheinlichkeitsmaß für diesen Wahrscheinlichkeitsraum zu bestimmen, müsste man nun also 64 Werte für P angeben.
Wie man sich schnell klar machen kann, reicht es jedoch, die Wahrscheinlichkeiten für die 6 Elementarereignisse anzugeben, da jedes Ereignis E ja eine disjunkte Vereinigung von Elementarereignissen ist und somit die Wahrscheinlichkeit für E über die Wahrscheinlichkeiten der Elementarergebnisse berechnet werden kann.
Das gleiche Prinzip funktioniert auch, wenn man sich als Elementarereignismenge Ω eine abzählbar unendliche Menge (also etwa die natürlichen Zahlen) denkt.

Genau dies sind die von uns betrachteten diskreten Wahrscheinlichkeitsräume, nämlich die Wahrscheinlichkeitsräume, deren Elementarereignismenge Ω entweder endlich oder abzählbar unendlich sind.

Beispiele:

1. n-elementige Elementarereignismenge:
Sei Ω gegeben durch Ω = {ω1, ..., ωn}.
Zusätzlich müssen natürlich noch die Werte P({ωi}) = pi für i=1,...,n mit der Eigenschaft p1+...+pn=1 gegeben sein.
In dieser Ausgangssituation wollen wir nun zwei Spezialfälle betrachten:

  • Die Gleichverteilung
    In diesem Fall gilt pi=pj für alle i,j=1,...,n.
    Jedes Elementarereignis tritt also mit gleicher Wahrscheinlichkeit pi = 1/|Ω| ein.
    Dies ist z.B. in unserem Würfelexperiment der Fall. Hier gilt pi = 1/6 für alle i=1,...,6.
    Diesen Fall haben wir ja auch schon im Artikel Zufallsexperimente unter dem Punkt Laplace-Experimente untersucht.
  • Ein weiterer Spezialfall ist der, bei dem Ω aus genau zwei Elementen besteht.
    In diesem Fall ist sogar nur eine einzige Wahrscheinlichkeit p für eines der beiden Elementarereignisse wichtig, da die andere dann bereits durch 1-p gegeben ist.
    Ein Beispiel für einen solchen Wahrscheinlichkeitsraum ist das Münzwerfen.

2. Die abzählbar unendliche Elementarereignismenge
Die häufigste Beschreibung dieses Wahrscheinlichkeitsraumes ist gegeben durch Ω = {0,1,2,...} = N0.
Diesen Raum verwendet man eigentlich immer, wenn irgendetwas gezählt wird, z.B. die Anzahl der Tippfehler auf einer Seite.
Wie an dem Beispiel "Tippfehler" ersichtlich wird, reicht es meistens aus, eine endliche Menge zu betrachten, da sich ja auch bei wirklich schlechter Rechtschreibung auf einer Seite höchstens endlich viele Fehler befinden können. Allerdings zeigt sich, dass dies nicht unbedingt eine Vereinfachung darstellen würde und es sich i.A. mit Ω = N0 besser rechnen lässt.
Auch hier werden wieder die Wahrscheinlichkeiten durch P({i}) = pi gegeben.
Da insgesamt gelten muss, dass die Summe über alle pi genau 1 ergeben muss, ist klar, dass es hier keine Gleichverteilung geben kann.
Für diesen Fall wollen wir nun auch einige Beispiele zeigen:

  • Die Poissonverteilung
    Bei der Poissonverteilung ist ein zusätzlicher Parameter λ 0 vorgegeben.
    Die Wahrscheinlichkeiten sind dann definiert als:
    Wichtig ist hierbei, dass p0 + p1 + ... = 1 gilt.
    Das folgt aber aus folgender Tatsache:
    Auch wenn die Definition zunächst nicht besonders intuitiv erscheint, ist die Poissonverteilung in vielen Fällen von großem Nutzen.
  • Die geometrische Verteilung
    In diesem Fall starten wir mit Ω = {1,2,3,...} = N und einem Parameter q, für den gilt 0 q < 1.
    Für ein solches q gilt bekanntermaßen die Gleichung
    Daher erhalten wir mit pi := qi-1(1-q) (also p1=(1-q), p2=q(1-q), p3=q2(1-q), ...) ein Wahrscheinlichkeitsmaß.
    Der somit entstandene Wahrscheinlichkeitsraum heißt die geometrische Verteilung.
    Auch hier gilt, dass dieser Wahrscheinlichkeitsraum in vielen Anwendungen sehr hilfreich sein kann.

5. Wahrscheinlichkeitsräume, die durch eine Dichtefunktion definiert sind

Jetzt kommen wir zu den Fällen, wo es sich bei der Menge der Elementarereignisse Ω nicht mehr um eine endliche oder abzählbare Menge handelt.
Das typische Beispiel hierfür ist Ω = [0,1] (bzw. ein beliebiges Intervall [a,b]).
Die Frage, die sich nun natürlich stellt ist: Wie kann man auf einem solchen Intervall ein Wahrscheinlichkeitsmaß definieren. Dabei ist natürlich auch entscheidend, wie das System der zugelassenen Ereignisse aussieht. Es ist nicht möglich zu fordern, allen möglich Teilmengen von [0,1] eine Wahrscheinlichkeit zuzuordnen. Durch eine genauere Analyse sieht man, dass es für praktisch wichtige Fragen reicht (selbst wenn man sehr viele Ereignisse zulassen will), für solche Ereignisse die Wahrscheinlichkeit zu definieren, die sich als Vereinigung endlich vieler Teilintervalle ergeben. Wir benötigen also Werte P([c,d]) für alle [c,d] [0,1].
In den meisten Fällen lässt sich das durch eine Dichtefunktion erfüllen. Dies ist eine Funktion f: Ω → [0,∞), die die Bedingung erfüllt, dass das Integral von f über ganz Ω genau 1 ist.
Dann kann man die Wahrscheinlichkeiten der Teilintervalle einfach als Wert des Integrals der Funktion f über dem jeweiligen Teilintervall definieren.
(Beachte: Da f integrierbar sein soll, ist es sinnvoll, sich f zunächst als stückweise stetig vorzustellen.)

Dass es sich durch die Vorgabe einer solchen Funktion f wirklich um einen Wahrscheinlichkeitsraum handelt, muss an dieser Stelle einfach akzeptiert werden. Für den genaueren Nachweis ist ein nicht unerhebliches Wissen in der Maßtheorie notwendig, welches an dieser Stelle nicht entwickelt werden kann.
Auch die Möglichkeit, als Grundmenge Ω ein unbeschränktes Intervall, bspw. R, zu nehmen, ist möglich. Auch für diesen Fall braucht man allerdings genauere Kenntnisse in der Integrationstheorie, da natürlich das Integral der Funktion f auf dem gesamten unbeschränkten Integral 1 ergeben muss.

Beispiele:

Auch hier gibt es wieder einige typische Beispiele:

  • Die Gleichverteilung auf [0,1]
    Es sei also Ω = [0,1] und f(x)=1 für alle x [0,1].
    Naheliegenderweise ist dann P([c,d]) = d-c für alle Teilintervalle [c,d] [0,1].
  • Die Gleichverteilung auf [a,b]
    Hier ändert sich gegenüber dem vorherigen Beispiel nicht besonders viel. Die Dichtefunktion ist in diesem Fall natürlich f(x) = 1/(b-a), damit das Integral über das gesamte Intervall [a,b] auch wirklich 1 ergibt.
    Die Wahrscheilichkeiten sind gegeben durch P([c,d]) = (d-c)/(b-a).
  • Die Exponentialverteilung
    In diesem Fall ist Ω = [0,∞) und es ist wieder ein zusätzlicher Paramerter λ > 0 gegeben.
    Die Dichtefunktion ist definiert durch: f(x) = λe-λx.
    Dieser Wahrscheinlichkeitsraum ist besonders für Warteprobleme (Wie lange dauert es, bis das die nächste Telefonzelle frei wird?, ...) von großem Nutzen.
  • Die Standard-Normalverteilung
    Hier noch ein Beispiel mit Ω = R.
    Als Dichtefunktion wählen wir die Gaußsche Glockenkurve f(x) = e-x2/2.
    Da deren Integral über ganz R die Wurzel aus 2π ergibt, muss sie also noch normiert werden und wir erhalten die Dichtefunktion
    Auch dieser Wahrscheinlichkeitsraum spielt bei vielen Problemen eine wichtige Rolle.