Hypergeometrische Verteilung

Inhaltsverzeichnis

Allgemeine Problemstellung

Zu einer Menge mit N Elementen gibt es zwei voneinander unabhängige Teilmengen mit M bzw. N-M Elementen.
Die Wahrscheinlichkeitsfunktion h(x|N;M;n) der Hypergeometrischen Verteilung mit den Parametern N, M und n gibt die Wahrscheinlichkeit dafür an, dass die beiden Teilmengen genau 0, 1, 2, 3, ... Elemente gemeinsam besitzen.

Anschaulich könnte man dieses Konzept mit dem Urnenmodell erläutern. Gegeben ist eine Urne mit zwei Sorten Kugeln, also eine dichotome Grundgesamtheit. Es sind insgesamt N Kugeln in der Urne und M Kugeln erster Sorte. Es werden n viele Kugeln ohne Zurücklegen aus der Urne gezogen (Stichprobe). Man interessiert sich für die Wahrscheinlichkeit h(x|N;M;n), dass sich x viele Kugeln erster Sorte in dieser Stichprobe befinden.

Wenn man die Zufallsvariable "Zahl der Kugeln erster Sorte in der Stichprobe" als X bezeichnet, kann man die Wahrscheinlichkeit dafür angeben als

P(X = x)= h(x|N;M;n)= \frac{{M \choose x}{N-M \choose n-x}}{{N \choose n}}

für x = 0, 1, ... ,n.

Die Verteilungsfunktion H(x|N;M;n) gibt dann die Wahrscheinlichkeit an, dass höchstens x viele Kugeln erster Sorte in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe

P(X \le x)= \sum_{y=0}^{x}h(y|N;M;n).

Beispiele

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die Hypergeometrische Verteilung gibt die Wahrscheinlichkeit h(x|45;20;10) an, dass genau x = 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.

Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
h(x|49;6;6) gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.

Ausführliches Rechenbeispiel für h(4|45,20,10)

farbige Kugeln
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren
Die Wahrscheinlichkeit ergibt sich aus:

Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt

{ 20 \choose 4 } = 4845

Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt

{ 25 \choose 6 } = 177100

Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann, ergeben sich

4845 \cdot 177100 =858049500

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln. Wir erhalten also die Wahrscheinlichkeit

P(X=4)=h(4|45,20,10)=\frac{{ 20 \choose 4 }{ 25 \choose 6 }}{{ 45 \choose 10 }} = \frac{4845 \cdot 177100 }{3190187286} = 0,2690,

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

Eigenschaften der Hypergeometrischen Verteilung

Für alle natürlichen Zahlen N, M, n, x mit N ≥ M und N ≥ n gilt:

E[X]= n \frac{M}{N}
V[X]=n\frac{M}{N}(1-\frac{M}{N})(\frac{N-n}{N-1}),
wobei der letzte Bruch der so genannte Korrekturfaktor beim Modell ohne Zurücklegen ist.

Zahlenwerte zu den Beispielen

h(x|45;20;10)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3268760 0,1024
1 40859500 1,2807
2 205499250 6,4416
3 547998000 17,1776
4 858049500 26,8965
5 823727520 25,8207
6 490314000 15,3694
7 178296000 5,5889
8 37791000 1,1846
9 4199000 0,1316
10 184756 0,0058
3190187286 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|45;10;20)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3247943160 0,1024
1 40599289500 1,2808
2 204190544250 6,4416
3 544508118000 17,1776
4 852585079500 26,8965
5 818481676320 25,8207
6 487191474000 15,3694
7 177160536000 5,5889
8 37550331000 1,1846
9 4172259000 0,1316
10 183579396 0,0058
11 0 0
12 0 0
13 0 0
14 0 0
15 0 0
16 0 0
17 0 0
18 0 0
19 0 0
20 0 0
3169870830126 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|49;6;6)
x
Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 6096454 43,5965
1 5775588 41,3019
2 1851150 13,2378
3 246820 1,7650
4 13545 0,0969
5 258 0,0018
6 1 0,0000
13983816 100,0000
Erwartungswert 0,7347
Varianz 0,5776
20px Wikibooks: Hypergeometrische Verteilung

See also: Hypergeometrische Verteilung, Binomialverteilung, Dichotom, Erwartungswert, Grundgesamtheit, Mengenlehre, Natürliche Zahlen, Näherungslösungen für diskrete Verteilungen, Stichprobe