Normalverteilung

thumb|Dichten von normalverteilten Zufallsgrößen

Die Gauß-Verteilung (nach Carl Friedrich Gauß) ist der wichtigste Typ kontinuierlicher Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß-Funktion, Gauß-Kurve, Gauß-Glocke oder Glockenkurve genannt.

Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, der besagt, dass eine Summe von n unabhängigen, identisch verteilten Zufallsvariablen in der Grenze n\rightarrow\infty normalverteilt ist.

Viele natur-, wirtschafts- und ingenieurswissenschaftliche Vorgänge lassen sich durch die Normalverteilung entweder exakt oder wenigstens in sehr guter Näherung beschreiben (vor allem Prozesse, die in mehreren Faktoren unabhängig voneinander in verschiedene Richtungen wirken).

Die Normalverteilung ist gegeben durch die Wahrscheinlichkeitsdichte

f(x)= \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2},

wobei σ die Standardabweichung und μ der Erwartungswert ist.

Inhaltsverzeichnis

Definition

Die stetige Zufallsvariable X mit der Wahrscheinlichkeitsdichte

f(x)= \frac{1}{\sigma\sqrt{2\pi}}\, e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2},

heißt μ-σ-normalverteilt, wobei μ der Erwartungswert E(X) und σ die Standardabweichung ist. In der Literatur wird auch die Bezeichnung (μ,σ2)-normalverteilt oder ähnliches verwendet (das Quadrat ² wird dabei immer explizit geschrieben). Die normalverteilte Zufallsvariable X mit dem Erwartungswert μ und der Varianz σ2 wird als X \sim \mathcal{N}(\mu, \sigma^2) geschrieben.
Anmerkung: Die Varianz V(X) = σ2, daher ist also \sigma=\sqrt{V(X)} und μ = E(X).

Somit ist die Verteilungsfunktion der Normalverteilung gegeben durch

F(x) = \frac {1}{\sigma \cdot \sqrt{2\pi}} \cdot \int_{-\infty}^{x} e^{-\frac{1}{2} \cdot \left( \frac{t-\mu}{\sigma}\right)^2} \mathrm{d}t

Die Wahrscheinlichkeitsdichte f(t) besitzt als Graphen die Gauß'sche Glockenkurve, welche symmetrisch zum Wert von μ ist und deren Höhe und Breite von σ abhängt. An der Stelle μ liegt dabei der Hochpunkt und an μ − σ und μ + σ befinden sich die Wendepunkte der Kurve (siehe hierzu auch Kurvendiskussion).

Wichtig ist, dass die gesamte Fläche unter der Kurve gleich 1 ist, also der Wahrscheinlichkeit eines sicheren Ereignisses entspricht. Somit folgt, dass wenn zwei Gauß'sche Glockenkurven dasselbe μ, aber unterschiedliche σ Werte haben, jene Kurve mit dem größeren σ breiter und niedriger ist (da ja beide zugehörigen Flächen jeweils den Wert von 1 haben und nur die Standardabweichung (oder " Streuung") höher ist). Zwei Glockenkurven mit dem gleichen σ, aber unterschiedlichen μ haben gleich aussehende Graphen, die jedoch auf auf der x-Achse zueinander um die Differenz der μ Werte zueinander verschoben sind.

Da sich das Integral der Verteilungsfunktion nicht auf eine elementare Stammfunktion zurückführen lässt, wird für die Berechnung meist auf Tabellen zurückgegriffen (siehe dazu die Tabelle der Verteilungsfunktion der Standardnormalverteilung). Diese gelten aber nicht für beliebige μ und σ Werte, sondern nur für die standardisierte Form der Gauß'schen Verteilung, bei der jeweils μ = 0 und σ = 1 ist (man spricht auch von einer 0-1-Normalverteilung, normierten Normalverteilung oder Standardnormalverteilung).

Die Tabellen sind also für die folgende Wahrscheinlichkeitsfunktion Φ ausgelegt:

\Phi(z)=\frac{1}{\sqrt{2\pi}} \cdot  \int_{-\infty}^{z} e^{-\frac{1}{2}t^2} \mathrm{d}t     (weil μ = 0 und σ = 1)

Analog dazu wird die normierte Wahrscheinlichkeitsdichtefunktion f mit φ bezeichnet.

Ist nun eine beliebige μ-σ-Verteilung gegeben, so muss diese nur in eine Standardnormalverteilung transformiert werden.

Transformation zur Standardnormalverteilung (Z-Transformation)

Ist eine Normalverteilung mit beliebigen μ und σ gegeben, so kann diese durch eine Transformation auf eine 0-1-Normalverteilung zurückgeführt werden. Dazu wird die Verteilungsfunktion F(x) der allgemeinen Normalverteilung mit u=\frac{t-\mu}{\sigma} substituiert und die Integralgrenzen werden angepasst:

Nebenrechnung für die Substitution
u=\frac{t-\mu}{\sigma}
\frac{\mathrm{d}u} {\mathrm{d}t}=\frac{\mathrm{d}} {\mathrm{d}t} \left(\frac{t-\mu} {\sigma}\right)=\frac{1}{\sigma}
\Rightarrow \mathrm{d}t=\mathrm{d}u \cdot \sigma
F(x) = \frac {1}{\sigma \cdot \sqrt{2\pi}} \cdot \int_{-\infty}^{x} e^{-\frac{1}{2} \cdot \left( \frac{t-\mu}{\sigma}\right)^2} \mathrm{d}t =
= \frac {1}{\sigma \cdot \sqrt{2\pi}} \cdot \int_{\frac{-\infty-\mu}{\sigma}}^{\frac{x-\mu}{\sigma}} e^{-\frac{1}{2}u^2} \mathrm{d}u \cdot \sigma=
= \frac {1}{\sqrt{2\pi}} \cdot \int_{-\infty}^{\frac{x-\mu}{\sigma}} e^{-\frac{1}{2}u^2} \mathrm{d}u=
=\Phi \left(\frac{x-\mu}{\sigma}\right)


Wird nun z:= \frac{x-\mu}{\sigma} definiert und u durch t ersetzt, so erhält man die Verteilungsfunktion der Standardnormalverteilung: \Phi(z)=\frac{1}{\sqrt{2\pi}} \cdot  \int_{-\infty}^{z} e^{-\frac{1}{2}t^2} \mathrm{d}t

Anmerkung: Geometrisch betrachtet entspricht die durchgeführte Substition einer flächentreuen Transformation der Glockenkurve von N(μ;σ) zur Glockenkurve von N(0;1).

Graph der Wahrscheinlichkeitsdichte

Dichtefunktion der Standardnormalverteilung
So sieht die Dichtefunktion einer Standardnormalverteilung aus. Angegeben sind die Intervalle im Abstand 1, 2 und 3 Standardabweichungen vom Erwartungswert 0, die rund 68%, 95,5% und 99,7% der Fläche unter der Glockenkurve umfassen. Die gleichen Prozentsätze gelten für alle Normalverteilungen in Bezug auf die entsprechenden Erwartungswerte und Standardabweichungen.

Die Normalverteilung ist eine Grenzverteilung, die nicht direkt beobachtet werden kann. Die Annäherung verläuft aber mit wachsendem n sehr schnell, so dass schon die Verteilung einer Summe von 30 oder 40 unabhängigen, identisch verteilten Zufallsgrößen einer Normalverteilung recht ähnlich ist.

Die Glockenkurve schmückte neben dem Portrait von Carl Friedrich Gauß von 1989 bis 2001 die 10-DM-Banknote der Bundesrepublik Deutschland.

Rechnen mit der Standardnormalverteilung

Bei Aufgabestellungen, bei denen die Wahrscheinlichkeit für normalverteile Zufallsvariablen durch die Standardnormalverteilung ermittelt werden soll, ist es nicht nötig, die oben angegebene Transformation jedesmal durchzurechnen. Stattdessen wird einfach das Ergebnis der Transformation verwendet, um die Grenzen x1, x2 und die Zufallsvariable X auf die Grenzen z1, z2 und die Zufallsgröße Z anzugleichen. Somit kann eine N(μ;σ2) Verteilung durch

z=\frac {x-\mu}{\sigma}   beziehungsweise   Z=\frac {X-\mu}{\sigma}

zu N(0;1) transformiert werden.

Die Wahrscheinlichkeit für ein Ereignis, welches z.B. innerhalb der Werte x1 und x2 (für den Erwartungswert μ und die Standardabweichung σ) liegt, ist durch folgende Umrechnung gleich der Wahrscheinlichkeit der Standardnormalverteilung mit den neuen Grenzen z1 und z2:

P( x_1 \leq X \leq x_2 ) = P\left( \frac {x_1-\mu}{\sigma} \leq Z= \frac {X-\mu}{\sigma} \leq  \frac {x_2-\mu}{\sigma}\right)= P(z_1 \leq Z \leq z_2)

(P steht für die englische Bezeichnung "propability" der Wahrscheinlichkeit)

Grundlegende Fragestellungen

Allgemein gibt die Verteilungsfunktion die Fläche unter der Glockenkurve bis zum Wert x an, d.h. es wird das bestimmte Integral von -\infty bis x berechnet.

Dies entspricht in Aufgabenstellungen einer gesuchten Wahrscheinlichkeit, bei der die Zufallsvariable X kleiner oder kleiner gleich einer bestimmten Zahl x ist. Durch die Verwendung der reellen Zahlen und der Stetigkeit der Normalverteilung macht es keinen Unterschied ob nun < oder \leq verlangt ist,

weil \int_{-\infty}^{2.999\dots99\dots} \approx \int_{-\infty}^{3} und somit ist P(X<3) \approx P(X \leq 3).

Dasselbe gilt für größer und größer gleich.

Dadurch, dass X nur kleiner oder größer einer Grenze (oder innerhalb oder außerhalb zweier Grenzen) liegen kann, ergeben sich für Aufgaben bei normalverteilten Wahrscheinlichkeitsberechungen folgende zwei grundlegende Fragestellungen:

In der Schulmathematik wird für diese Aussage auch die Bezeichnung Linker Spitz verwendet, da die Fläche unter der Gaußkurve von links bis zur Grenze verläuft. Für z sind auch negative Werte erlaubt, trotzdem haben viele Tabellen der Standardnormalverteilung nur positive Einträge. Durch die Symmetrie der Kurve und der Negativitätsregel des linken Spitz stellt dies aber keine Einschränkung dar:
(Anm.: Das Minus von z wird im folgenden explizit
ausgedrückt, d.h. z = − | z | , wenn z < 0)
Φ( − z) = 1 − Φ(z)
P(Z \geq z) = 1 - \Phi(z)
Analog wir hier oft die Bezeichnung Rechter Spitz verwendet. Ebenso gibt es eine Negativitätsregel:
P(Z \geq -z)= 1- \Phi(-z)= 1-(1-\Phi(z)) = \Phi(z)


(Da jede Zufallsvariable X der allgemeinen Normalverteilung sich in die Zufallsgröße Z der Standardnormalverteilung umwandeln lässt, gelten die Fragestellungen für beide Größen gleichbedeutend)

Streubereich und Antistreubereich

Der Streubereich gibt die Wahrscheinlichkeit wieder, dass die normalverteilte Zufallsvariable Z Werte zwischen z1 und z2 annimmt:

P(z_1 \leq Z \leq z_2) = \Phi(z_2) - \Phi(z_1)

Beim Sonderfall des symmetrischen Streubereiches ( z1 = − z2, mit z2 > 0 ) gilt:

P(-z \leq Z \leq z ) = P (|Z| \leq z) =
= Φ(z) − Φ( − z) = Φ(z) − (1 − Φ(z)) =
=2 \cdot \Phi(z)-1

Hingegen gibt der Antistreubereich die Höhe der Wahrscheinlichkeit an, dass die normalverteilte Zufallsvariable Z Werte außerhalb des Bereichs zwischen z1 und z2 annimmt:

P(Z \leq z_1) \mbox{ und } P(Z \geq z_2) = \Phi(z_1) + (1-\Phi(z_2))

Somit folgt bei einem symmetrischen Antistreubereich:

P(Z \leq -z) \mbox{ und } P(Z \geq z) = P(|Z| \geq z)=
= Φ( − z) + 1 − Φ(z) = 1 − Φ(z) + 1 − Φ(z) =
=2-2\cdot \Phi(z)

Streubereiche am Beispiel der Qualitätssicherung

Besondere Bedeutung haben beide Streubereiche z.B. bei der Qualitätssicherung von technischen oder wirtschaftlichen Produktionsprozessen. Hier gibt es einzuhaltende Toleranzgrenzen x1 und x2 , wobei es meist einen größten noch akzeptablen Abstand ε vom Erwartungswert μ (= der optimalen Sollwert) gibt. σ kann hingegen empirisch aus dem Produktionsprozess gewonnen werden.

Wurde [x1;x2] = [μ − ε;μ + ε] als einzuhaltendes Toleranzintervall angegeben, so liegt (je nach Fragestellung) ein symmetrischer Streu- oder Antistreubereich vor.

Im Falle des Streubereiches gilt:

P(x_1 \leq X \leq x_2) = P(|X-\mu|\leq\epsilon)=
=P(\mu-\epsilon \leq X \leq \mu+\epsilon) = P\left(\frac{-\epsilon}{\sigma} \leq Z \leq \frac{\epsilon}{\sigma}\right)=
=\Phi\left(\frac{\epsilon}{\sigma}\right)-\Phi\left(\frac{-\epsilon}{\sigma}\right)=
= 2 \cdot \Phi\left(\frac{\epsilon}{\sigma}\right)-1 =\gamma

Der Antistreubereich ergibt sich dann aus

P(|X-\mu|\geq \epsilon )= 1-\gamma

oder wenn kein Streubereich berechnet wurde durch

P(|X-\mu|\geq \epsilon )=2\cdot\left(1-\Phi\left(\frac{\epsilon} {\sigma}\right)\right)=\alpha .

Das Ergebnis γ ist also die Wahrscheinlichkeit für verkaufbare Produkte, während α die Wahrscheinlichkeit für Ausschuss bedeutet, wobei beides von den Vorgaben von μ, σ und ε abhängig ist.

Ist bekannt, dass die maximale Abweichung ε symmetrisch um den Erwartungswert liegt, so sind auch Fragestellungen möglich, bei denen die Wahrscheinlichkeit vorgegeben und eine der anderen Größen zu berechnen ist.

Approximation der Binomialverteilung durch die Normalverteilung

Allgemeines

Um 1900 postulierte Max Planck das Energiequantum hν um die Energieverteilung der schwarzen Strahlung erklären zu können und es wurde daraufhin in vielen anderen Erscheinungen der Natur wiederentdeckt. Der bis dahin geltende Satz 'natura non facit saltus' - die Natur macht keine Sprünge - wurde wirksam widerlegt und zeigt auch, dass viele Phänomene, die oberflächlich für stetig gehalten werden, bei sehr genauer Betrachtung doch nichtstetig bzw. sprunghaft sind. Die Normalverteilung liefert für diese Vorgänge eine sehr gute Approximation, denn viele endliche Zufallsvariablen sind näherungsweise normalverteilt. Eine in der Natur oft anzutreffende Wahrscheinlichkteitsverteilung ist die Häufigkeitsverteilung. Auch sie lässt sich in sehr guter Näherung mit der Normalverteilung beschreiben. Mathematisch wird dies durch durch den Grenzwertsatz belegt: Er besagt (in diesem Fall), dass sich die nichtstetige Wahrscheinlichkeitsverteilung, die sich aus n voneinander unabhängig Zufallsgrößen ergibt, mit steigenden n immer besser an die Normalverteilung angleicht. n ist dabei die Anzahl der voneinander unabhängigen Zufallsversuche, von denen jeder einzelne eine Zufallsgröße ergibt.

Ein Beispiel für diese Angleichung der Häufigkeitsverteilung an die Normalverteilung ist folgender Würfelversuch: Gegeben seien zwei normale Würfel, wobei jeder eine Augenzahl von eins bis sechs aufweist. Sie sollen nun n mal geworfen werden, d.h. es werden n voneinander unabhängige Zufallsversuche durchgeführt. Bei jedem Versuch berechnet sich das Ergebnis aus der Gesamtanzahl der geworfenen Augen. Insgesamt werden einige hundert Würfe gemacht, wobei die Anzahl der gleichen Ergebnisse gezählt wird. Diese Häufigkeit kann anschließend in Diagramm eingetragen werden. Die resultierende Verteilung ist bei sehr wenigen Würfen rein zufällig, bei sehr hohen n wird sie hingegen der Gauß'schen Glockenkurve (mit dem Erwartungswert von 7) immer ähnlicher, trotzdem ist sie immer noch diskret verteilt (d.h. der Graph besteht aus kleinen Stufen).

Approximation

Ist eine Binomialverteilung (siehe auch Bernoulli-Versuch) mit n voneinander unabhängigen Stufen (bzw. Zufallsversuchen) mit einer Erfolgswahrscheinlichkeit p gegeben, so lässt sich die Wahrscheinlichkeit für k Erfolge allgemein durch P(X=k)= {n \choose k} \cdot p^k\cdot q^{n-k} für k=0,1,\dots,n berechnen (wobei q = 1 − p ist).

Für sehr große Werte von n kann diese Binomialverteilung eine Normalverteilung approximiert werden. Dabei ist

Ist nun σ > 3, dann lässt sich folgende Relation aufstellen:

P(x_1 \leq X \leq x_2) = \underbrace{\sum_{k=x_1}^{x_2} {n \choose k}  \cdot p^k\cdot q^{n-k}}_{\mathrm{BV}} \approx \underbrace{\Phi\left(\frac{x_2+0,5-\mu}{\sigma}\right) -\Phi\left(\frac{x_1-0,5-\mu}{\sigma}\right)}_{\mathrm{NV}}

Bei der Normalverteilung wird die untere Grenze um 0,5 verkleinert und die obere Grenze um 0,5 vergrößert um eine bessere Approximation bei einer geringen Standardabweichung σ gewährleisten zu können. Dies nennt man auch Stetigkeitskorrektur. Nur wenn σ einen sehr hohen Wert besitzt, kann auf sie verzichtet werden.

Da die Binomialverteilung diskret ist, muss auf einige Punkte geachtet werden:

P(X_{BV}<x)=P(X_{BV}\leq x-1) bzw. P(X_{BV}>x)=P(X_{BV}\geq x+1)
damit mit der Normalverteilung weitergerechnet werden kann.
z.B. P(X_{BV}<70)=P(X_{BV}\leq 69)
P(X_{BV} \leq x) = P(0 \leq X_{BV} \leq x)
P(X_{BV} \geq x) = P(x \leq X_{BV} \leq n)
P(X_{BV} = x) = P(x \leq X_{BV} \leq x) (unbedingt mit Stetigkeitskorrektur)
und lässt sich somit durch die oben angegebene Formel berechnen.

Der große Vorteil der Approximation liegt darin, dass sehr viele Stufen einer Binomialverteilung sehr schnell und einfach bestimmt werden können.

Simulation normalverteilter Zufallsvariablen

Box-Muller-Methode

Nach der Box-Muller-Methode lässt sich eine standardnormalverteilte Zufallsvariable X aus zwei gleichverteilten Zufallsvariablen u_1,u_2 \sim U(0,1), sogenannten Standardzufallszahlen, simulieren:

X=\sqrt{(-2\log u_1)}\;cos(2\pi u_2)

Polar-Methode

Die Polar-Methode von Marsaglia ist auf einem Computer noch schneller, da sie nur einen Logarithmus benutzt:

  1. Generiere zwei gleichverteilte Zufallsvariablen u1,u2 = U(0,1)
  2. Berechne v = (2u1 − 1)2 + (2u2 − 1)2. Falls v \ge 1 wiederhole 1.
  3. x = (2u1 − 1)( − 2logv / v)1 / 2

Durch lineare Transformation lassen sich hieraus auch beliebige normalverteilte Zufallszahlen generieren: Ist die Zufallsvariable X \sim \mathcal{N}(0,1)-verteilt, so ist aX+b schließlich \mathcal{N}(b,a^2)-verteilt.

Zwölferregel

Aus dem zentralen Grenzwertsatz folgt, dass sich die Summe unabhängiger gleichverteilter Zufallszahlen einer Normalverteilung nähert.

Ein Spezialfall ist die Zwölferregel, die sich auf die Summe von 12 Zufallszahlen aus dem Intervall [0,1] beschränkt und bereits zu passablen Verteilungen führt.

Verwerfungsmethode

Normalverteilungen lassen sich mit der Verwerfungsmethode (s. dort) simulieren.

Besondere Eigenschaften

Die Normalverteilung ist invariant gegenüber Faltung, d.h. die Faltung einer Gaußkurve der Halbwertsbreite Γa mit einer Gaußkurve der Halbwertsbreite Γb ergibt wieder eine Gaußkurve mit der Halbwertsbreite \Gamma_{c} = \sqrt{\Gamma_{a}^{2} + \Gamma_{b}^{2}}

Die Normalverteilung ist ein Fixpunkt der Fourier-Transformation, d.h. die Fourier-Transformierte einer Gaußkurve ist wieder eine Gaußkurve. Das Produkt der Standardabweichungen dieser korrespondierenden Gaußkurven ist konstant, es gilt die Heisenbergsche Unschärferelation.

Die Normalverteilung hat unter den Verteilungen mit gleicher Varianz die größte Entropie.

Mehrdimensionale Normalverteilung

thumb|Dichte der zweidimensionalen Normalverteilung, die Standardabweichung der zweiten Koordinate Y ist 2, die Korrelation zwischen den Koordinaten 0.7 Das Wahrscheinlichkeitsmaß \mathcal{N}^n(0,1) auf \mathbb{R}^n, das durch die Dichtefunktion

f: \mathbb{R}^n \to \mathbb{R},\ (x_1,\ldots,x_n) \mapsto  {1 \over \sqrt{(2\pi)^n}} \exp\bigg(-{1 \over 2} \sum_{i=1}^n x_i^2 \bigg)

definiert wird, heißt Standardnormalverteilung der Dimension n. Ein Zufallsvektor X = (X_1,\ldots,X_n) ist standardnormalverteilt auf \mathbb{R}^n genau dann, wenn X_1,\ldots,X_n standardnormalverteilt und stochastisch unabhängig sind.

Ein Wahrscheinlichkeitsmaß P auf \mathbb{R}^n heißt n-dimensionale Normalverteilung, wenn eine Matrix A \in \mathbb{R}^{n \times n} und ein Vektor b \in \mathbb{R}^n existieren, so dass mit der affinen Abbildung u: \mathbb{R}^n \to \mathbb{R}^n,\ x \mapsto Ax+b gilt: u^{-1}(P) = \mathcal{N}^n(0,1).

Die multivariate Normalverteilung ist die einzige rotationssymmetrische multivariate Verteilung, deren Komponenten stochastisch unabhängig sind.

Die Dichtefunktion der zweidimensionalen Normalverteilung mit einem Korrelationskoeffizienten ρ ist

f(x_1,x_2)=\frac{1}{2\pi\sigma_1\sigma_2(1-\rho^2)} \, \cdot \, \exp \left[ \left(-\frac{1}{2(1-\rho^2)}\right) \left( \left(\frac{x_1-\mu_1}{\sigma_1}\right)^2 -2\rho\,\frac{x_1-\mu_1}{\sigma_1}\,\frac{x_2-\mu_2}{\sigma_2}+ \left(\frac{x_2-\mu_2}{\sigma_2}\right)^2\right)\right].

Siehe auch

Multivariate Verteilung, Wahrscheinlichkeitspapier, Statistik, Inversionsmethode

Weblinks

20px Wikibooks: Anschauliche Darstellung der Normalverteilung

See also: Normalverteilung, 1989, 2001, Bernoulli-Versuch, Binomialverteilung, Box-Muller-Methode, Carl Friedrich Gauß, Deutsche Mark, Diagramm