Wahrscheinlichkeitsverteilung
In der Wahrscheinlichkeitstheorie gibt die Wahrscheinlichkeitsverteilung (auch Wahrscheinlichkeitsfunktion) an, mit welcher Wahrscheinlichkeit eine Zufallsvariable X einen bestimmten Wert annimmt. Sie wird mit P(x) oder P(X=x) bezeichnet.
Die damit verwandte (kumulative) Verteilungsfunktion F(x) bzw. P(X≤x) gibt die Wahrscheinlichkeit an, dass die Zufallsvariable X einen Wert kleiner oder gleich x annimmt. In der Regel spricht man einfach von einer Verteilungsfunktion. Die explizite Kennzeichnung als kumulativ kann helfen, Verwechslungen mit der Wahrscheinlichkeitsdichte zu vermeiden. Diese ist eine rein mathematische Funktion: die Ableitung der Verteilungsfunktion.
| Inhaltsverzeichnis |
Definitionen
Wahrscheinlichkeitsverteilung diskreter Zufallsvariablen
Eine diskrete Zufallsvariable nimmt endlich oder abzählbar unendlich viele Werte xi aus R an. Jedem dieser Werte kann eine Wahrscheinlichkeit pi zugeordnet werden, mit der die Zufallsvariable diesen Wert annimmt. Die Wahrscheinlichkeitsverteilung bzw. Wahrscheinlichkeitsfunktion ist dann durch
- P(xi) = P(X = xi) = pi
gegeben.
Beispiel
Die Wahrscheinlichkeit mit einem Würfel eine Sechs zu würfeln: P(6) = P(X=6) = 1/6.
Die komplette Wahrscheinlichkeitsverteilung des Würfelns lautet:
Kumulative Verteilungsfunktion einer diskreten Zufallsvariable
Die (kumulative) Verteilungsfunktion einer diskreten Zufallsvariable berechnet sich zu
.
Der Index i der Summe durchläuft alle Zahlen 1, 2, ... für die xi ≤ x ist.
Beispiel
Die Wahrscheinlichkeit mit einem Würfel höchstens eine Drei zu würfeln:
Sonstiges
Im Falle einer kontinuierlichen Zufallsgröße ist die Wahrscheinlichkeit 0. Denn eine Zufallsgröße aus einem stetigen Intervall müsste genau die Zahl 5 treffen, d.h. die Zahl 5,0000000000... mit unendlich vielen Nullen als Nachkommastellen. Um eine kontinuierliche Wahrscheinlichkeitsverteilung zu bestimmen, fragt man nicht, mit welcher Wahrscheinlichkeit X einen bestimmten Wert annimmt, sondern mit welcher Wahrscheinlichkeit X in ein bestimmtes Intervall fällt.
Zum Beispiel kann man P(5≤X<6) angeben.
Beispielsweise fragt man nicht, wie viele Personen "genau" 1,75 Meter groß sind (d.h. 1,750000...), sondern, wie viele Personen eine Größe von 1,749 bis 1,751 haben.
Mit einem nach unten unendlichen Intervall erhält man eine kumulative Verteilungsfunktion; mit einem infinitesimalen Intervall dx eine Wahrscheinlichkeitsdichte f(x) . Also
f(x)=d F(x) / dx , nach beidseitiger Multiplikation mit dx und Integration folgt dann
.
Der Wahrscheinlichkeitsverteilung entspricht in der deskriptiven Statistik die Häufigkeitsverteilung.
Der Begriff der Verteilungsfunktion kann auch auf mehrdimensionale Zufallsvariablen, d.h. Zufallsvariablen, die Vektorwerte annehmen, erweitert werden: Hier ist in der Notation F(x) = P(X≤x) das x ein Vektor und das "≤"-Zeichen komponentenweise zu lesen. F ist also hierbei eine Abbildung von einem Vektorraum in das Intervall [0,1].
Stetige Verteilungen, Dichten
Eine Zufallsvariable X heißt genau dann stetig oder kontinuierlich verteilt, wenn die dazugehörige Verteilungsfunktion stetig ist.
Eine integrierbare Funktion f heißt Wahrscheinlichkeitsdichte oder Dichte der Zufallsvariable X, wenn
beziehungsweise
wobei B eine beliebige Lebesgue-integrierbare Menge ist.
Eine Zufallsvariable X besitzt eine Dichte genau dann, wenn
für jede Lebesgue-Nullmenge N (Satz von Radon-Nikodym).
Die Stetigkeit der Verteilungsfunktion bzw. die Eigenschaft P(X = x) = 0 für alle x ist hierfür notwendig, aber nicht hinreichend. Die Verteilung einer unendlichen Dezimalzahl zwischen 0 und 1, deren Ziffern durch einen Würfel bestimmt werden (etwa 0,5364142...), hat eine stetige Verteilungsfunktion, aber keine Dichte, da die Ziffern 7, 8, 9, 0 nicht vorkommen (vgl. Cantor-Menge).
Wenn die Zufallsvariable eine stetige Dichte f besitzt, dann ist diese eindeutig bestimmt und entspricht grob gesprochen der Ableitung der Verteilungsfunktion F:
.
Genauer sei J = F − 1(]0,1[)
Dann ist für alle
und sonst :f(x) = 0.
Jede nichtnegative, integrierbare Funktion f, die die Eigenschaft
erfüllt, definiert durch obige Identität eine Zufallsvariable X.
Im mehrdimensionalen Fall (dort, wo F also eine differenzierbare Funktion von Rn nach [0,1] ist), entsteht die Dichte durch partielle Differentiation:
dann erfüllt f die Identität
Auch für stetige Verteilungen lassen sich Momente angeben, die wichtigsten sind der Erwartungswert und die Varianz.
Rechnen mit Verteilungsfunktionen
Ist von einer Zufallsvariablen die Verteilungsfunktion bekannt, so kann man die Wahrscheinlichkeit berechnen, mit der die Zufallsvariable Werte zwischen zwei reellen Zahlen annimmt:
- P(a<X≤b) = P(X≤b) - P(X≤a) = F(b) - F(a)
Beispiel
Beim Würfeln errechnet sich die Wahrscheinlichkeit eine Zahl zwischen 3 und 5 zu würfeln zu
.
Wichtige Verteilungen
siehe auch: Alpha-stabile Verteilungen
Diskrete Verteilungen
- Diskrete Gleichverteilung
- Binomialverteilung (Bernoulli-Verteilung)
- Poisson-Verteilung
- Geometrische Verteilung
- negative Binomialverteilung
- Hypergeometrische Verteilung
- Zipf-Verteilung
Siehe auch: Näherungslösungen
Kontinuierliche Verteilungen
Über einem endlichen Intervall [a,b], im einfachsten Fall [0,1]:
- Stetige Gleichverteilung (Rechteckverteilung)
- Dreiecksverteilung (Simpson-Verteilung)
- Betaverteilung
Über einem halbseitig unendlichen Intervall, üblicherweise als [0,∞) angenommen:
- Exponentialverteilung
- Pareto-Verteilung
- Gammaverteilung
- logarithmische Normalverteilung (Log-Normalverteilung)
- χ²-Verteilung
- F-Verteilung
- Weibull-Verteilung
- Erlang-Verteilung für x aus (0,∞)
Über der ganzen Zahlengeraden:
- Fishersche z-Verteilung
- Laplace-Verteilung (Doppelexponentialverteilung)
- Normalverteilung (Gauß-Verteilung, Glockenkurve)
- Students t-Verteilung (Student-Verteilung, t-Verteilung)
- Cauchy-Verteilung
- Logistische Verteilung
- Lévy-Verteilung
Literatur
- Erich Härtter: Wahrscheinlichkeitsrechnung für Wirtschafts- und Naturwissenschaftler. Vandenhoeck & Ruprecht, Göttingen 1974, ISBN 3525031149
Weblinks
Verfügbarkeit in numerischen Bibliotheken
- Katalog der Wahrscheinlichkeitsverteilungen in der Gnu Scientific Library.
