Inhalt
»Vorbemerkungen
»Die Normalverteilung, eine stetige Zufallsvariable
»Anmerkungen
»Die Normalverteilung als Approximation der Binomialverteilung
»Die Näherungsfläche
»Die Transformation in die Standardnormalverteilung
»Beispiele
»Anmerkungen

Vorbemerkungen

Die Normalverteilung wird oft unterschiedlich eingeführt. Sie beschreibt eine stetige Zufallsvariable, kann also als Gegenstück zu unseren diskreten Verteilungsfunktionen eingeführt werden. Auf der anderen Seite approximiert sie auch die Binomialverteilung und wird gerne als Hilfsmittel zur Berechnung aufwendiger [Hier fehlt was]

Wir halten die zwei folgenden Abschnitte daher komplett unabhängig, führen die Normalverteilung also zwei mal ein.

Die Normalverteilung, eine stetige Zufallsvariable

Erinnern wir uns, auch bei der Binomialverteilung und bei anderen diskreten Zufallsvariablen haben wir die Balken, also eigentlich die Fläche dieser, gezählt.verteilungen/binomialstetig1Bei stetigen Zufallsvariablen haben wir eine Dichtefunktion \(f\) und die Fläche darunter repräsentiert die Wahrscheinlichkeit. Viele stetige Zufallsvariablen \(X\) sind normalverteilt. Die Normalverteilung ist eine um den Erwartungswert \(\mu\) symmetrische, sogenannte Glockenkurve. Sie wird mit \(N(\mu ,\sigma )\) gekennzeichnet. Im folgenden sehen wir den Graph von \(N(2000, 50)\).

N2000_50

Diese Normalverteilung nähert sehr gut die Brenndauer von Glühbirnen mit einer erwarteten Lebensdauer von 2000 Stunden und einer Schwankung \(\sigma\) von 50 Stunden. Schraffiert ist die Fläche von \(-\infty\) bis 1975. Diese Fläche entspricht nun der Wahrscheinlichkeit, dass die Glühbirne weniger als 1975 Stunden leuchtet, also \(P(X\leq 1975)\). Wie kommen wir nun auf unseren Wahrscheinlichkeit? Sei \(f\) die Dichtefunktion und \(F\) ihre kumulative Verteilungsfunktion, dann gilt nach obiger Überlegung
\begin{align*}
P(X\leq 1975)=\int_{-\infty}^{1975} f(x)dx.
\end{align*}
Was ist nun unser \(f\) damit wir die Aufgabe lösen können? Hinter der Normalverteilung versteckt sich diese "kurze", von \(\mu\) und \(\sigma\) abhängige, Formel
\begin{align*}
f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}
\end{align*}
und die Fläche erhalten wir über
\begin{align*}
F(x)=\frac{1}{\sigma \sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{1}{2}(\frac{t-\mu}{\sigma})^2}dt.
\end{align*}
Traurigerweise ist dieses Integral nicht händisch lösbar. Man benötigt also in den Anwendungen entweder ein technisches Hilfsmittel (Geogebra, grafische Taschenrechner) oder hilft sich über einen Trick, den wir uns nun ansehen werden.

Eine spezielle Normalverteilung ist die \(N(0,1)\)-Standartnormalverteilung. Sie wird oft mit \(\phi\) abgekürzt und ihre Verteilungsfunktion dann dazu passend mit \(\Phi\).

 

N0_1

 

Die Werte der kumulativen Verteilungsfunktion sind einfach tabelliert und wir können jede andere Normalverteilung in diese umrechnen.

Anmerkungen

Wir haben zuvor bereits mehrmals behauptet, dass bei einer stetigen Zufallsvariable \(P(X=k)=0\) gilt. Nun wissen wir das Warum, denn wenn \(f\) die dazugehörige Dichtefunktion und \(F\) ihre Verteilungsfunktion sind, dann gilt
\begin{align*}
P(X=k)=\int_k^k f(x)dx=F(k)-F(k)=0.
\end{align*}

Aus gleichem Grund ist es bei stetigen Zufallsvariablen egal, ob wir \(P(X<k)\) oder \(p(X\leq k)\) berechnen wollen denn nach obiger Überlegung gilt \(p(X<k)="P(X\leq k)\) hier ist ein großer Unterschied zur diskreten zufallsvariable, wo zum Beispiel \(p(x<3)=P(X\leq2)\) gilt!

Die Normalverteilung als Approximation der Binomialverteilung

Die Binomialverteilung modelliert sehr viele Sachverhalte sehr gut. Oftmals sind, übrigens mangels expliziter kumulativer Verteilungsfunktion, Rechnungen ohne technische Hilfe sehr aufwendig. So zum Beispiel die Frage, wie hoch die Wahrscheinlichkeit ist, beim 150 maligen Würfelwurf zwischen 20 und 30 6er zu würfeln. Sei also \(n=150\), \(p=\frac{1}{6}\) dann besteht
\begin{align*}
P(20\leq X \leq 30) = P(X=20)+\dots + P(X=30)
\end{align*}
aus 11 Summanden die wir einzeln ausrechnen müssten. Betrachten wir den Graphen der Verteilungsfunktion so suchen wir die blaue Fläche.

 

verteilungen/normalbinomial1

Die Idee ist nun, eine ähnlich aussehende Funktion zu finden, welche dem Histogramm ähnelt und damit die Fläche approximiert. Diese existiert

verteilungen/normalbinomial2

und ist die sogenannte Normalverteilung \(f\) in Abhängigkeit von \(\mu\) und \(\sigma\)
\begin{align*}
f(x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2}.
\end{align*}

Die Näherungsfläche

verteilungen/normalbinomial3

erhalten wir über
\begin{align*}
\frac{1}{\sigma \sqrt{2\pi}} \int_{20}^{3} e^{-\frac{1}{2}(\frac{t-\mu}{\sigma})^2}dt=F(30)-F(20)=0,7267.
\end{align*}

Wie sieht nun die kumulierte Verteilungsfunktion \(F(x)=P(X\leq x)\) aus womit wir \(F(30)-F(20)\) berechnen können? Traurigerweise ist
\begin{align*}
P(X\leq x)=:F(x)=\frac{1}{\sigma \sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{1}{2}(\frac{t-\mu}{\sigma})^2}dt.
\end{align*}
nicht händisch lösbar. Glücklicherweise gibt es einen Trick, wir können mit einer Nebenrechnung jede Normalverteilung in eine bestimmte Normalverteilung überführen, die \(N(0,1)\)-Standartnormalverteilung. Sie wird oft mit \(\phi\) abgekürzt und ihre Verteilungsfunktion dann dazu passend mit \(\Phi\).

[Hier wird bald ein Bild eingefügt.]

Die Approximation durch die Normalverteilung funktioniert gut ab \(\sigma >3\), dies ist eine bewährte Faustregel, ansonsten ist der Fehler der Fläche oftmals zu groß

verteilungen/normaltransformation3


Die Transformation in die Standardnormalverteilung

Hat man keinen graphischen Taschenrechner zur Hand, benötigt man die Standardnormalverteilung. Umgangssprachlich verschieben und stauchen wir jede beliebige Normalverteilung \(N(\mu \sigma)\) auf \(N(0;1)\). Im Folgenden haben wir es für \(N(2;0,5)\) durchgeführt.

verteilungen/normaltransformation

Wie geschrieben kann man keine explizite Formel für die kumulative Verteilungsfunktion \(\Phi\) von \(\phi\) angeben, da dass Integral nur nummerisch lösbar ist. Die Werte der Standardnormalverteilung sind daher dann einfach tabelliert und ablesbar.

[Hier wird bald eine Tabelle eingefügt.]

Damit wir die transformierte Zufallsvariable immer eindeutig identifizieren können, bezeichnen wir sie nicht mit \(X\) sondern mit \(z\). Es gilt dann die Formel
\begin{align*}
z=\frac{X-\mu}{\sigma}.
\end{align*}

Was bedeutet dies nun genau? Haben wir eine normalverteilte Zufallsvariable mit \(\mu=1,80\) und Standardabweichung \(\sigma =0,09\), dies könnte zum Beispiel die Körpergröße von Männern in Deutschland repräsentieren, und möchten wissen, was die Wahrscheinlichkeit ist, dass ein zufällig ausgewählter Mann kleiner als 1,7 Meter ist, so interessiert uns
\begin{align*}
P(X\leq 1,7)
\end{align*}
wobei \(X\) unsere Größe in cm repräsentiert. Nun können wir die kumulative Verteilungsfunktion
\begin{align*}
P(X\leq 1,7)=\frac{1}{0,09 \sqrt{2\pi}} \int_{-\infty}^x e^{-\frac{1}{2}(\frac{t-1,7}{0,09})^2}dt
\end{align*}
wie mehrmals beschrieben nicht händisch lösen. Wir schieben also die Normalverteilung \(N(1,80;0,09)\) auf \(N(0;1)\) und erhalten unsere neue Zufallsvariable
\begin{align*}
z & =\frac{X-\mu}{\sigma}
& =\frac{1,70-1,80}{0,09}=-1,11.
\end{align*}
Nun suchen wir nicht mehr \(P(X\leq 1,7)\) sondern \(P(z\leq -1,1)=\Phi (-1,1)\) und lesen in unserer Tabelle
\begin{align*}
P(z\leq -1,1)=\Phi (-1,1)=0,13=P(X\leq 1,7)
\end{align*}
als Ergebnis ab.

verteilungen/normaltransformation2

Führt man eine Approximation der Binomialverteilung durch, verwendet man manchmal noch die sogenannte Stetigkeitskorrektur, ihr findet dazu mehr in den Beispielen.

Beispiele

Piloten: Die Lufthansa hat 2016 die erlaubte Größe für angehende Piloten definiert. Sie bildet künftig nur Piloten mit folgender Körpergröße ab, sie dürfen nicht kleiner als 1,65 oder größer als 1,98 sein. Berechnen Sie ausgehend von \(\mu= 1,80\) und \(\sigma =0,09\) wie viel Prozent der männlichen Bevölkerung aufgrund ihrer Körpergröße nicht Piloten werden können.

Lösung mithilfe eines Programmes:

Wir lösen das Beispiel zuerst (sehr schnell) mit einem grafischen Programm und im Anschluss händisch mit Hilfe der Standartnormalverteilung. Wir haben eine stetige Zufallsgröße \(X\), die die Körpergröße eines Mannes wiedergibt. Wir wollen wissen, wie viel Prozent kleiner als 1,65 sind und wie viel größer als 1,98. Wir suchen also \(P(X\leq 1,65)\) und \(P(X\geq 1,98)\).

verteilungen/normaltransformation5_1 verteilungen/normaltransformation5_2

und unser graphischer Rechner bringt uns die Ergebnisse \(P(X\leq 1,65)=0,0478\) und \(P(X\geq 1,98)=0,0228\). Alternativ könnte man auch mit dem Gegenereignis arbeiten denn es gilt
\begin{align*}
P(X\leq 1,65 \text{ oder } X\geq 1,98) & = 1-P(1,65< X < 1,98) = \\
& =1-0,9295=0,0705.
\end{align*}

normaltransformation5_3

Alternative, händische, Lösung:

Wir müssen unsere \(N(1,80;0,09)\) Normalverteilung wie zuvor auf \(\phi =N(0;1)\) "schieben". Aus \(x_1=1,65\) und \(x_2=1,98\) wird mit der Transformation
\begin{align*}
z_1=\frac{1,65-1,80}{0,09},& \qquad z_2=\frac{11,98-1,80}{0,09} \\
z_1=-1,6667,& \qquad z_2=2.
\end{align*}
Nun gilt
\begin{align*}
P(X\leq 1,65)=P(z\leq -1.6667)=\Phi (-1.6667)=0.0478
\end{align*}
sowie
\begin{align*}
P(X\geq 1,98)& =P(z\geq 2)=1-P(z<2) \\
& =1-\Phi (2)=1-0,9772=0,0228.
\end{align*}
Unsere Lösung ist dann \(0,0228+0.0478=0,0706\).

Schwarzfahrer: Laut einer Statistik aus dem Jahre 2015 fahren in einer österreichischen Metropole knapp 2 Prozent der Personen ohne Ticket, sogenannte Schwarzfahrer. Pro Tag werden knapp 22000 Personen kontrolliert. Wie hoch ist die Wahrscheinlichkeit zwischen 400 und 500 Personen zu kontrollieren?

Lösung mithilfe eines Programmes:

Wir lösen das Beispiel zuerst (sehr schnell) mit einem grafischen Programm und im Anschluss händisch mit Hilfe der Standartnormalverteilung. Zusätzlich betrachten wir noch die Stetigkeitskorrektur im händischen Fall. Für die Approximation durch die Normalverteilung benötigen wir \(\mu\) und \(\sigma\). Diese berechnen wir uns aus \(n=22000\) und \(p=0,02\):
\begin{align*}
\mu =n\cdot p,& \qquad \sigma =\sqrt{=n\cdot p\cdot (1-p)} \\
\mu = 440,& \qquad \sigma \approx 20,77.
\end{align*}
Dann interessiert uns das Ereignis \(P(400\leq X\leq 500)\) welche folgender Fläche unter der \(N(440;20,77)\) entspricht

verteilungen/normaltransformation6_1

und unser Rechenprogramm bringt uns als Ergebnis \(P(400\leq X\leq 500)=0,971\).

Alternative, händische, Lösung:

Wie zuvor stellen wir aus den Werten der Binomialverteilung die dazugehörige Normalverteilung \(N(440;20,77)\) auf. Nun schieben wir diese auf \(\phi =N(0;1)\). Aus \(x_1=400\) und \(x_2=500\) wird mit der Transformation
\begin{align*}
z_1=\frac{400-440}{20,77},& \qquad z_2=\frac{500-440}{20,77} \\
z_1=-1,92585,& \qquad z_2=2,88878.
\end{align*}
Nun gilt
\begin{align*}
P(400\leq X \leq 500) & = P(-1,92585 \leq z \leq 2,88878)\\
& = \Phi (2,88878)- \Phi (-1,92585)=\\
& = 0,9981-0,0271=0,971.
\end{align*}

Alternative, händische, Lösung, mit Stetigkeitskorrektur:

Die Stetigkeitskorrektur möchte die Approximation verbessern. Zoomen wir an die Stelle \(x_1=400\) unserer Approximation, so sehen wir, dass die berechnete Fläche der Normalverteilung ab \(x_1=400\) beginnt, die Balken des Histogramms der Binomialverteilung eigentlich aber ab 399,5. In der Sprache der Analysis "vergisst die Normalverteilung beim schraffierten Integral \(\int_{400}^{500}\) jeweils die Hälfe eines Balkens (kariert), eine bessere Näherung wäre daher intuitiv \(\int_{399,5}^{500,5}\)

verteilungen/normaltransformation7

Dies wird durch die sogenannte Stetitgkeitskorrektur bewerkstelligt. Bei der Transformation erhalten wir andere Werte \(z_1\) und \(z_2\) aufgrund der Korrektur um 0,5
\begin{align*}
z_1=\frac{(400-0,05)-440}{20,77},& \qquad z_2=\frac{(500+0,05)-440}{20,77} \\
z_1=-1,94993,& \qquad z_2=2,91286.
\end{align*}

Je größer \(n\) bei der Approximation durch die Normalverteilung ist, desto unwichtiger wird die Stetigkeitskorrektur. Sie wird daher oftmals in der Schule ausgelassen.

Anmerkungen

Bei der Normalverteilung arbeitet man fast ausschließlich mit gerundeten Werten, daher kommt es bei verschiedenen Lösungsansätzen zu Rundungsunterschieden bei den Ergebnissen.