Hypergeometrische Verteilung
| Inhaltsverzeichnis |
Allgemeine Problemstellung
Zu einer Menge mit N Elementen gibt es zwei voneinander unabhängige Teilmengen
mit M bzw. N-M Elementen.
Die Wahrscheinlichkeitsfunktion h(x|N;M;n) der Hypergeometrischen Verteilung mit den Parametern N, M und n
gibt die Wahrscheinlichkeit dafür an, dass die beiden Teilmengen genau 0, 1, 2, 3, ... Elemente
gemeinsam besitzen.
Anschaulich könnte man dieses Konzept mit dem Urnenmodell erläutern. Gegeben ist eine Urne mit zwei Sorten Kugeln, also eine dichotome Grundgesamtheit. Es sind insgesamt N Kugeln in der Urne und M Kugeln erster Sorte. Es werden n viele Kugeln ohne Zurücklegen aus der Urne gezogen (Stichprobe). Man interessiert sich für die Wahrscheinlichkeit h(x|N;M;n), dass sich x viele Kugeln erster Sorte in dieser Stichprobe befinden.
Wenn man die Zufallsvariable "Zahl der Kugeln erster Sorte in der Stichprobe" als X bezeichnet, kann man die Wahrscheinlichkeit dafür angeben als
für x = 0, 1, ... ,n.
Die Verteilungsfunktion H(x|N;M;n) gibt dann die Wahrscheinlichkeit an, dass höchstens x viele Kugeln erster Sorte in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe
Beispiele
In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb.
Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die Hypergeometrische Verteilung gibt die Wahrscheinlichkeit h(x|45;20;10) an, dass genau
x = 0, 1, 2, 3, ..., 10 der entnommenen Kugeln gelb sind.
Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden
bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
h(x|49;6;6) gibt die Wahrscheinlichkeit dafür an, genau
x = 0, 1, 2, 3, ..., 6 "Treffer" zu erzielen.
Ausführliches Rechenbeispiel für h(4|45,20,10)
farbige Kugeln
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren
Die Wahrscheinlichkeit ergibt sich aus:
- Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
- geteilt durch
- geteilt durch
- Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen
Es gibt
Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt
Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede "gelbe Möglichkeit" mit jeder "violetten Möglichkeit" kombiniert werden kann,
ergeben sich
Möglichkeiten für genau 4 gelbe und 6 violette Kugeln. Wir erhalten also die Wahrscheinlichkeit
das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.
Eigenschaften der Hypergeometrischen Verteilung
Für alle natürlichen Zahlen N, M, n, x mit N ≥ M und N ≥ n gilt:
- h(x|N;M;n)= h(x|N;M=n;n=M)
- Der Erwartungswert der Hypergeometrischen Verteilung ist
- Ihre Varianz ist
- wobei der letzte Bruch der so genannte Korrekturfaktor beim Modell ohne Zurücklegen ist.
- Die Hypergeometrische Verteilung kann unter bestimmten Umständen durch die Binomialverteilung angenähert werden.
Zahlenwerte zu den Beispielen
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| h(x|49;6;6) | ||
|---|---|---|
| x | Anzahl möglicher
Ergebnisse | Wahrscheinlichkeit
in % |
| 0 | 6096454 | 43,5965 |
| 1 | 5775588 | 41,3019 |
| 2 | 1851150 | 13,2378 |
| 3 | 246820 | 1,7650 |
| 4 | 13545 | 0,0969 |
| 5 | 258 | 0,0018 |
| 6 | 1 | 0,0000 |
| ∑ | 13983816 | 100,0000 |
| Erwartungswert | 0,7347 | |
| Varianz | 0,5776 | |
