Zufallsvariable
Zufallsvariable, Erwartungswert und Streuung
1. Zufallsvariable
Oft kann es bei Zufallsexperimenten sein, dass gar nicht das Ergebnis des Experiments, sondern daraus ableitbare Informationen von Interesse sind. Bleiben wir bei unserem beliebten Fall des Würfelns, so kann es sein, dass bei dreimaligem Würfeln gar nicht die konkrete Ergebnisfolge interessiert, sondern nur die Summe der drei Würfe. In solchen Fällen muss man hinter das Zufallsexperiments noch eine Funktion schalten, die das Ergebnis des Experiments in die gewünschte Information umwandelt.
In unserem Beispiel würde die Funktion Tupel, welche aus drei Zahlen zwischen 1 und 6 bestehen, nehmen und ihnen ihre Summe zuweisen. Grob gesprochen ist das unsere Zufallsvariable.
(Beachte: Der Begriff Variable ist in diesem Zusammenhang vielleicht nicht sehr einsichtig, hat sich jedoch durchgesetzt. Es sollte jedoch klar sein, dass es sich dabei um eine Funktion handelt.)
Nun zur genauen Definition:
Hierbei werden Begriffe wie σ-Algebra auftauchen. Wem diese nicht bekannt sind, der kann diese Begriffe im Artikel über Wahrscheinlichkeitsräume nachlesen.
Definition:
Es sei (Ω,
,P) ein Wahrscheinlichkeitsraum. Außerdem sei B eine Menge, auf der eine σ-Algebra
gegeben ist.
Eine Zufallsvariable mit Werten in B ist dann eine Funktion X:Ω → B mit der Eigenschaft, dass für jedes F
die Menge {ω|X(ω)
F} zu
gehört.
Zur Vereinfachung ist es für Anfänger, sich den Teil mit der σ-Algebra
wegzudenken und eine Zufallsvariable einfach als eine Funktion von Ω in eine Menge B anzusehen.
Welche Menge B genau gemeint ist, hängt von der gewünschten Information ab.
In unserem Beispiel des dreimaligen Würfelns könnten wir z.B. B = {3,4,...,18} wählen, da die Summe der Augen bei dreimaligem Würfeln sicherlich zwischen 3 und 18 liegen wird. Ebenso hätten wir aber auch problemlos B = N wählen können.
Nicht erlaubt wäre natürlich eine Menge, in der einige natürliche Zahlen zwischen 3 und 18 nicht vorkommen, jedenfalls nicht, wenn unsere Zufallsvariable uns die Summe der drei Würfe liefern soll.
2. Der induzierte Wahrscheinlichkeitsraum
Wie wir nun zeigen werden, induziert eine Zufallsvariable auf einem gegebenen Wahrscheinlichkeitsraum (Ω,
,P) einen neuen Wahrscheinlichkeitsraum (B,
,PX).
Dieser hat als Elementarereignismenge nicht mehr Ω, da wir an den konkreten Werten des Experiments ja gar nicht interessiert waren, sondern eben B, die Menge der Informationen, die wir eigentlich wollen. Wir benötigen jetzt also nur noch das neue Wahrscheinlichkeitsmaß PX (der Index kennzeichnet die Zufallsvariable), welches jedem Ereignis aus
(für unsere Vorstellung erst einmal jedem Elementarereignis aus B) seine Wahrscheinlichkeit des Eintreffens zuordnet.
Definition:
Sei X:Ω → B eine Zufallsvariable wie oben definiert.
Setzt man nun

, so erhält man einen neuen Wahrscheinlichkeitsraum (B,
,PX), den durch X induzierten Wahrscheinlichkeitsraum.
Das Wahrscheinlichkeitsmaß PX heißt das zu X gehörige Bildmaß.
Das sieht zunächst einmal sehr kompliziert aus. Daher wollen wir es hier etwas genauer erklären. Dann wird auch klar, dass diese Definition sehr intuitiv ist.
Zufallsvariable auf diskreten Wahrscheinlichkeiträumen:
Ist Ω endlich oder abzählbar, so gibt es also auch nur endlich oder abzählbar viele Werte X(ω). Man kann sich folglich auch B als endlich oder abzählbar vorstellen und der induzierte Wahrscheinlichkeitsraum ist wieder diskret.
Wie in dem Kapitel über diskrete Wahrscheinlichkeitsräume gesehen, reicht es also aus, die Werte PX(b) für alle b
B zu kennen.
Hier kommen wir zu dem Ergebnis, welches wir oben bereits ausgenutzt haben:
Ist (Ω,
,P) ein diskreter Wahrscheinlichkeitsraum und X:Ω → B eine Zufallsvariable (mit endlichem oder abzählbarer Menge B), so induziert X wieder einen diskreten Wahrscheinlichkeitsraum (B,
,PX) und die Werte des Bildmaßes lassen sich berechnen durch

In unserem Beispiel bedeutet das:
Die Wahrscheinlichkeit mit drei Würfen eine Summe von 16 zu erzielen, ist gleich der Summe der Wahrscheinlichkeiten all der Tupel aus drei Zahlen zwischen 1 und 6, die in der Summe 16 ergeben. Das wären also (6,6,4),(6,5,5),(6,4,6),(5,6,5) und (5,5,6). Jedes dieser 3-Tupel hat eine Wahrscheinlichkeit von 1/216, da 216 genau der Anzahl der verschiedenen Ergebnisse beim dreimaligen Würfeln ist. Wir erhalten also PX(16) = 5/216.
Zufallsvariable auf Wahrscheinlichkeitsräumen, die durch eine Dichtefunktion gegeben sind:
Für diese Betrachtungen sind gewisse Kentnisse in der Integrationstheorie unabdingbar. Daher ist es all denen, die sich in diesem Gebiet nicht auskennen, empfohlen, den folgenden Teil einfach zu überspringen.
Wie wir wissen, ist das Wahrscheinlichkeitsmaß hier gegeben durch

Was wir hier berechnen sind also Wahrscheinlichkeiten, dass das Ergebnis des Zufallsexperiments im Intervall [c,d] liegt.
Wir betrachten nun den häufigsten Fall, nämlich, dass die Zufallsvariable X Werte in den reellen Zahlen annimmt, also eine Funktion X:[a,b] → R ist.
Weiterhin soll vorausgesetzt werden, dass es sich um eine differenzierbare Funktion mit überall positiver Ableitung handelt. In diesem Fall können wir sogar annehmen, dass X eine Funktion ist, die in das Intervall [α,β] abbildet, wobei α=X(a) und β=X(b) sind.
Es soll nun ein Wahrscheinlichkeitsmaß auf B definiert werden, das wieder durch eine Dichtefunktion gegeben ist.
Diese Dichtefunktion h:[α,β] → [0,∞) wollen wir nun bestimmen:
Da es sich bei der Zufallsvariable um eine differenzierbare Funktion mit streng positiver Ableitung handelt, ist diese Funktion also streng monoton steigend. Außerdem wissen wir, dass unser Bildmaß die Wahrscheinlichkeiten auf folgende Weise berechnen soll:

Außerdem soll nach der Definition von PX gelten: PX([γ,δ]) = P({x|X(x)
[γ,δ]}).
Wegen der Monotonie von X ist jedoch X(x) genau dann in [γ,δ], wenn x in [X-1(γ),X-1(δ)] liegt.
Das bedeutet nun aber

Somit muss unsere gesuchte induzierte Dichtefunktion h folgende Eigenschaft besitzen:

für alle Intervalle [γ,δ]
[α,β].
Ein solches h findet man, indem man eine Stammfunktion F von f wählt und dann h definiert als h := (FοX-1)', also als Ableitung der Komposition der Stammfunktion von f und der Inversen zu X.
Dieses h hat die richtigen Eigenschaften, wie folgende Rechnung zeigt:

Somit erhalten wir:
Ist ein Intervall Ω durch eine Dichtefunktion f zu einem Wahrscheinlichkeitsraum gemacht worden und ist X eine differenzierbare streng monoton steigende Zufallsvariable auf Ω, so hat der induzierte Wahrscheinlichkeitsraum eine Dichtefunktion h, die durch h := (FοX-1)' gegeben ist, wobei F eine beliebige Stammfunktion von f ist.
Beispiele:
- Wir beginnen mit dem Wahrscheinlichkeitsraum Ω = [0,1] und der Gleichverteilung f(x)=1 als Wahrscheinlichkeitsmaß. Als Zufallsvariable nehmen wir die Funktion X(x)=4x+2.
Dann ist also X-1(x)=(x-2)/4 und F(x)=x und somit (FοX-1)(x)=(x-2)/4
Wir erhalten als induziertes Wahrscheinlichkeitsmaß (FοX-1)'(x)=1/4, also die Gleichverteilung auf dem Intervall [X(0),X(1)]=[2,6]. - Sei nun der Wahrscheinlichkeitsraum Ω = [0,1] mit der Dichtefunktion f(x)=2x gegeben und die Zufallsvariable X(x)=ex.
Dann erhalten wir X-1(x)=ln(x) und F(x)=x2 und somit (FοX-1)(x) = (ln(x))2.
Als induziertes Wahrscheinlichkeitsmaß bekommen wir (FοX-1)'(x) = 2ln(x)/x auf dem Intervall [X(0),X(1)] = [1,e].
3. Die Verteilungsfunktion
Mit den bisher entwickelten Mitteln können wir nun noch ein Konzept einführen, welches uns ermöglicht, die relevanten Informationen aus Px konzentriert zusammenzufassen.
Definition:
Sei X:Ω → R eine Zufallsvariable.
Die Funktion FX(x) = P({ω|X(ω) < x}) heißt die zu X gehörige Verteilungsfunktion.
Bemerkung:
Die Verteilungsfunktion kann auch definiert werden als Fx(x) = Px(]-∞,x[).
Es ist leicht zu erkennen, dass FX monoton steigend ist und nach [0,1] abbildet, d.h. FX(x) → 1 für x → ∞ gilt.
Die Behauptung, dass uns dies die Informationen von PX konzentriert zusammenfasst, kann nun dadurch begründet werden, dass alle Informationen von PX in FX enthalten sind. Es gilt nämlich PX([a,b[) = FX(b) - FX(a).
In unseren beiden Spezialfällen, die wir oben eingeführt haben, gilt nun:
- Diskrete Wahrscheinlichkeitsräume:

- Wahrscheinlichkeitsräume mit Dichte:

Beachte, dass wir hier die ganze Zeit von Ω=R ausgegangen sind. Natürlich kann man das Ganze auch für Teilintervalle von R definieren.
4. Erwartungswert
Der im Folgenden zu entwickelnde Begriff lässt sich wieder ganz intuitiv erfassen. Wir wollen eine Größe entwickeln, die uns den zu erwartenden Mittelwert einer Zufallsvariable liefert.
Erwartungswert für endliche Wahrscheinlichkeitsräume:
Gibt uns unsere Zufallsvariable beispielsweise die Augenzahl beim Würfeln aus, so darf man erwarten, dass der Mittelwert bei 3,5 liegt, da alle Zahlen zwischen 1 und 6 mit gleicher Wahrscheinlichkeit erscheinen können.
In diesem Fall erkennen wir also selbst, wie wir diesen Mittelwert wohl errechnen werden. Wir summieren die verschiedenen möglichen Werte multipliziert mit deren Auftrittswahrscheinlichkeit und teilen durch die Anzahl der verschiedenen möglichen Werte.
In unserem Würfelbeispiel also

Die genaue Definition ist:
Sei (Ω,
,P) ein endlicher Wahrscheinlichkeitsraum und X:Ω → R eine Zufallsvariable, so definieren wir den Erwartungswert E(X) als

Beispiele:
- Wählen wir einfach einen Wahrscheinlichkeitsraum Ω = {1,2,3,4,5}, Wahrscheinlichkeiten P({1})=1/3, P({2})=1/3, P{3})=1/6, P({4})=1/12, P({5})=1/12 und eine Zufallsvariable X(ω)=ω.
Dann erhalten wir: E(X) = 1/3*1 + 1/3*2 + 1/6*3 + 1/12*4 + 1/12*5 = 27/12 = 2,25. -
Münzwurf
In diesem Fall ist der Wahrscheinlichkeitsraum gegeben durch Ω = {K,Z} mit P({K})=P({Z})=1/2. Angenommen, Sie bekommen jedes Mal, wenn Kopf fällt, einen Euro und müssen jedes Mal, wenn Zahl erscheint, einen Euro bezahlen, so kann dieser Fall durch die Zufallsvariable X:Ω → {-1,1} mit X({K})=1 und X({Z})=-1 dargestellt werden.
Nicht besonders verwunderlich ist, dass sich ein Erwartungswert von E(X) = 1/2*1 + 1/2/*(-1) = 0 ergibt, da Sie zu gleicher Wahrscheinlichkeit einen festen Betrag gewinnen oder verlieren.
Erwartungswert für abzählbare Wahrscheinlichkeitsräume:
In diesem Fall wird natürlich der gleiche Ansatz gewählt, nur handelt es sich diesmal um eine unendliche Summe. Daher kann man den Erwartungswert nur dann definieren, wenn die Summe auch konvergiert:
Sei Ω = {ω1, ω2, ...} und X:Ω → R eine Zufallsvariable.
Dann definieren wir den Erwartungswert E(X) als

Beispiel:
Die Poissonverteilung:
Hier ist Ω=N0, und wir wählen als Zufallsvariable X(ω)=ω.
Zur Erinnerung: Das Wahrscheinlichkeitsmaß ist gegeben durch

Als Erwartungswert bekommen wir also


Erwartungswert für Wahrscheinlichkeitsräume mit Dichtefunktion:
Auf analoge Weise, wie es bei den diskreten Wahrscheinlichkeitsräumen geschehen ist, definieren wir in diesem Fall:
Ist [a,b] durch eine Dichtefunktion f zu einem Wahrscheinlichkeitsraum gemacht worden und ist zusätzlich eine Zufallsvariable X:[a,b] → R gegeben, so definieren wir den Erwartungswert E(X) als

Beachte:
Wir haben hier den Fall des beschränkten Intervalls [a,b] für die Definition benutzt. Das Konzept lässt sich allerdings auch auf unbestimmte Intervalle erweitern, sofern wieder sichergestellt ist, dass das dabei auftretende Integral existiert (siehe zweites Beispiel).
Beispiel:
- Gleichverteilung auf [0,1]:
Es ist also f(x)=1.
Wir erhalten Mit dem Spezialfall X(x)=x ergibt sich also
was auch nicht gerade überrascht, da zu erwarten war, dass der Mittelwert von 0 und 1 bei Gleichverteilung 1/2 ist.
- Exponentialverteilung auf [0,∞):
Zur Erinnerung: Es ist, wie oben erwähnt Ω = [0,∞) und das Wahrscheinlichkeitsmaß ist gegeben durch die Dichtefunktion λe-λx. Außerdem wählen wir die Zufallsvariable X als X(x)=x.
Wir erhalten zunächst

Lassen wir jetzt r gegen ∞ laufen, so erhalten wir E(X) = 1/λ.
Eigenschaften von Erwartungswerten:
Satz:
Sind X und Y Zufallsvariablen, für die der Erwartungswert erklärt werden kann, so gilt:
- Für jede Zahl λ hat auch λX einen Erwartungswert und es gilt E(λX) = λ*E(X).
- Auch X+Y hat einen Erwartungswert und es gilt E(X+Y) = E(X) + E(Y).
Die Beweise folgen direkt aus den Rechenregeln für Summen und Integrale.
Vorsicht:
Die Formel E(X*Y) = E(X)*E(Y) ist im Allgemeinen leider falsch.
Nur im Spezialfall von unabhängigen Zufallsvariablen (ein Begriff, den wir an dieser Stelle nicht ausführlich erläutern möchten) ist diese Gleichung richtig.
Beweis:
Betrachten wir den Wahrscheinlichkeitsraum [0,1] mit der Dichtefunktion f(x)=1.
Seien X und Y gegeben durch X(x) = Y(x) = x.
Dann gilt:

Aus den obigen Beispielen wissen wir jedoch auch, dass E(X) = E(Y) = 1/2 ist und somit E(X)*E(Y) = 1/4.
5. Streuung
Nachdem wir also den Erwartungswert eingeführt haben, welcher uns die Möglichkeit gibt, so etwas wie ein Durchschnittsergebnis auszudrücken, wollen wir nun einen weiteren Begriff einführen, die Streuung σ(X).
Dieser Wert soll eine Aussage darüber treffen, wie weit die Ergebnisse der Zufallsvariable durchschnittlich vom Erwartungswert entfernt sind.
Das in der Definition auftauchende Quadrat und die Quadratwurzel sind, rein logisch gesehen, eher überflüssig. Sie haben sich jedoch aus mathematischen Gründen als äußerst sinnvoll erwiesen und im Laufe der Zeit durchgesetzt.
Definition:
Sei X eine Zufallsvariable, für welche der Erwartungswert erklärt werden kann.
Mit der Varianz von X bezeichnen wir den Erwartungswert der quadratischen Abweichung, d.h. V(X) = E([X-E(X)]2).
Die Streuung von X ist dann definiert als die Quadratwurzel der Varianz, d.h.

Bemerkung:
Ist die Zufallsvariable X durch eine Dichtefunktion h gegeben, so lässt sich die Varianz und somit die Streuung berechnen durch:


Wir sehen also, dass in diesem Fall die Varianz und damit auch die Streuung nur von PX abhängen.
Beispiel:
Gegeben seien Ω = {0,1} mit P({1})=p, P({0})=1-p und X(ω) = ω
Es ist dann E(X) = 0*(1-p) + 1*p = p.
Somit ist V(X) = E([X-p]2) = (0-p)2*(1-p) + (1-p)2*p = p2 - p3 + p -2p2 + p3 = p - p2 = p*(1-p).
Als Streuung ergibt sich:

Eigenschaften der Streuung:
Für die Streuung gelten leider nicht so einfache Gesetze wie für den Erwartungswert (s.o.).
Für Zahlen λ gilt in diesem Fall σ(λX) = |λ|*X, was sich wie die Eigenschaften für den Erwartungswert ebenfalls mit den Rechenregeln für Summen und Integrale beweisen lässt.
Für σ(X+Y) gibt es jedoch keine allgemein gültige Regel zur Berechnung.
Ausgenommen ist auch hier - wie schon bei den Formeln für den Erwartungswert - der Fall zweier unabhängiger Zufallsvariablen. In diesem Fall gilt nämlich: σ2(X+Y) = σ2(X) + σ2(Y).

