Hypergeometrische Verteilung - LinkFang.de





Hypergeometrische Verteilung


Die hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung in der Stochastik.

Einer dichotomen Grundgesamtheit werden in einer Stichprobe zufällig [math]n[/math] Elemente ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.

Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombination ohne Wiederholung). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden [math]n[/math] Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable [math]X[/math] ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.

Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei [math]N[/math] gegebenen Elementen („Grundgesamtheit des Umfangs [math]N[/math]“), von denen [math]M[/math] die gewünschte Eigenschaft besitzen, beim Herausgreifen von [math]n[/math] Probestücken („Stichprobe des Umfangs [math]n[/math]“) genau [math]k[/math] Treffer erzielt werden, d. h. die Wahrscheinlichkeit für [math]X=k[/math] Erfolge in [math]n[/math] Versuchen.

Beispiel: In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit, bei einer Stichprobe von zehn Kugeln genau vier gelbe Kugeln zu ziehen? Das Beispiel wird unten durchgerechnet.

Definition

Die hypergeometrische Verteilung ist abhängig von drei Parametern:

  • der Anzahl [math]N[/math] der Elemente einer Grundgesamtheit.
  • der Anzahl [math]M\leq N[/math] der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
  • der Anzahl [math]n\leq N[/math] der Elemente in einer Stichprobe.

Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich [math]k[/math] Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum [math]\Omega[/math] ist daher [math]\{\max\{0,n+M-N\},\dotsc,\min\{n,M\}\}[/math].

Eine diskrete Zufallsgröße [math]X[/math] unterliegt der hypergeometrischen Verteilung mit den Parametern [math]M[/math], [math]N[/math] und [math]n[/math], wenn sie die Wahrscheinlichkeiten

[math]h(k|N;M;n):= P(X = k) = \frac{\displaystyle{M \choose k}{N-M \choose n-k}}{\displaystyle{N \choose n}}[/math]

für [math]k \in \Omega[/math] besitzt. Dabei bezeichnet [math]\tbinom N n[/math] den BinomialkoeffizientenN über n“. Man schreibt dann [math] X \sim Hyp_{N,M,n} [/math] oder [math] X \sim H(N,M,n) [/math].

Die Verteilungsfunktion [math]H(k\mid N;M;n)[/math] gibt dann die Wahrscheinlichkeit an, dass höchstens [math]k[/math] Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe

[math]H(k|N;M;n) := P\left(X\le k\right)= \sum_{y=0}^k h\left(y\mid N;M;n\right) = \sum_{y=0}^k \frac{\displaystyle{M\choose y}{\displaystyle{N-M}\choose{n-y}}}{\displaystyle{N\choose n}}[/math].

Alternative Parametrisierung

Gelegentlich wird auch als Wahrscheinlichkeitsfunktion

[math] Hyp_{B_1,B_2,n}(\{k\}):= \frac{\displaystyle{B_2 \choose k}{B_1 \choose n-k}}{\displaystyle{B_1 + B_2 \choose n}}[/math]

verwendet. Diese geht mit [math] N=B_1+B_2 [/math] und [math] M=B_2 [/math] in die obige Variante über.

Eigenschaften der hypergeometrischen Verteilung

Symmetrien

Es gelten folgende Symmetrien:

  • Vertauschung von gezogenen Kugeln und Erfolgen: [math]h(k|N;M;n)=h(k|N;n;M) [/math]
  • Vertauschung von Erfolgen und Misserfolgen: [math] h(k|N;M;n) = h(n-k|N;N-M;n)[/math]

Erwartungswert

Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable [math]X[/math] ist

[math]\operatorname{E}(X)= \sum_{k=0}^n k \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} = n\frac{M}{N} [/math].

Modus

Der Modus der hypergeometrischen Verteilung ist

[math]\left \lfloor \frac{(n+1)(M+1)}{N+2} \right \rfloor[/math].

Dabei ist [math] \lfloor \cdot \rfloor [/math] die Gaussklammer.

Varianz

Die Varianz der hypergeometrisch verteilten Zufallsvariable [math]X[/math] ist

[math]\operatorname{Var}(X)=\sum_{k=0}^n k^2 \frac{\displaystyle{M\choose k}{\displaystyle{N-M}\choose{n-k}}}{\displaystyle{N\choose n}} -\left(n\frac{M}{N}\right)^2 =n \, \frac{M}{N} \left( 1-\frac{M}{N} \right) \frac{N-n}{N-1}[/math],

wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.

Schiefe

Die Schiefe der hypergeometrischen Verteilung ist

[math] \operatorname{v}(X)=\frac{(N-2M)(N-1)^\frac{1}{2}(N-2n)}{[nM(N-M)(N-n)]^\frac{1}{2}(N-2)} [/math].

Charakteristische Funktion

Die charakteristische Funktion hat die folgende Form:

[math]\phi_{X}(t) = {{{N-M \choose n}\,_2F_1(-n,-M;N-M-n+1;e^{it})}\over {N \choose n}}[/math]

Wobei [math] _2F_1(\cdot ; \cdot ; \cdot) [/math] die hypergeometrische Funktion bezeichnet.

Momenterzeugende Funktion

Auch die momenterzeugende Funktion lässt sich mittels der hypergeometrischen Funktion ausdrücken:

[math]M_X(t)=\frac{{N-M \choose n} \,_2F_1(-n, -M; N - M - n + 1; e^{t}) } {{N \choose n}} [/math]

Wahrscheinlichkeitserzeugende Funktion

Die wahrscheinlichkeitserzeugende Funktion ist gegeben als

[math]m_X(t)=\frac{{N-M \choose n} \,_2F_1(-n, -M; N - M - n + 1; t) } {{N \choose n}} [/math]

Beziehung zu anderen Verteilungen

Beziehung zur Binomialverteilung

Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang [math]n[/math] der Stichprobe relativ klein (etwa [math]n/N \lt 0{,}05[/math]) im Vergleich zum Umfang [math]N[/math] der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Approximation durch die mathematisch einfacher zu handhabende Binomialverteilung vorgenommen.

Beziehung zur Pólya-Verteilung

Die hypergeometrische Verteilung ist ein Spezialfall der Pólya-Verteilung (wähle [math]c=-1[/math]).

Beziehung zum Urnenmodell

Die hypergeometrische Verteilung entsteht aus der diskreten Gleichverteilung durch das Urnenmodell. Aus einer Urne mit insgesamt [math] N [/math] Kugeln sind [math] M [/math] eingefärbt und es werden [math] n [/math] Kugeln gezogen. Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit an, dass [math] k \leq n [/math] gefärbte Kugeln gezogen werden. Siehe hierzu auch das Beispiel.

Beziehung zur multivariaten hypergeometrischen Verteilung

Die multivariate hypergeometrische Verteilung ist eine Verallgemeinerung der hypergeometrischen Verteilung. Sie beantwortet die Frage nach der Anzahl der gezogenen Kugeln einer Farbe aus einer Urne, wenn diese mehr als zwei unterscheidbare Farben von Kugeln enthält. Für zwei Farben stimmt sie mit der hypergeometrischen Verteilung überein.

Beispiele

Diverse Beispiele

In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.

Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, …, 10 der entnommenen Kugeln gelb sind.

Ein Beispiel für die Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.

[math]h(x|49;6;6)[/math] gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, …, 6 „Treffer“ zu erzielen.

Ausführliches Rechenbeispiel für die Kugeln

Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren.

Gesamtanzahl der Kugeln [math]N=45[/math]
Anzahl mit der Eigenschaft „gelb“ [math]M=20[/math]
Umfang der Stichprobe [math]n=10[/math]
Davon angestrebt gelb [math]x=4[/math]

Also [math]h(4|45,20,10)[/math].

Die Wahrscheinlichkeit ergibt sich aus:

Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
geteilt durch
Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen

Es gibt

[math]{ M \choose x } = { 20 \choose 4 } = 4\,845 [/math]

Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.

Es gibt

[math] { {N - M }\choose {n - x }} = { 25 \choose 6 } = 177\,100[/math]

Möglichkeiten, genau 6 violette Kugeln auszuwählen.

Da jede „gelbe Möglichkeit“ mit jeder „violetten Möglichkeit“ kombiniert werden kann, ergeben sich

[math]{ M \choose x } \cdot { {N - M }\choose {n - x }} = 4\,845 \cdot 177\,100 = 858\,049\,500[/math]

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.

Es gibt insgesamt

[math] { N \choose n } = { 45 \choose 10 } = 3\,190\,187\,286[/math]

Möglichkeiten, 10 Kugeln zu ziehen.

Wir erhalten also die Wahrscheinlichkeit

[math]P(X=4)=h(4|45;20;10)=\frac{{ 20 \choose 4 }{ 25 \choose 6 }}{{ 45 \choose 10 }} = \frac{4\,845 \cdot 177\,100 }{3\,190\,187\,286} \approx 0{,}2690[/math],

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden

[math]P(X=4)=h(4|45;10;20)=\frac{{10 \choose 4 }{ 35 \choose 16 }}{{ 45 \choose 20 }} \approx 0{,}2690[/math]

Es befinden sich in der Stichprobe vom Umfang [math]n = 10[/math] nämlich 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übriggebliebenen Kugeln, die nicht zur Stichprobe gehören.

Zahlenwerte zu den Beispielen

h(x|45;20;10)
x Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3.268.760 0,1024
1 40.859.500 1,2807
2 205.499.250 6,4416
3 547.998.000 17,1776
4 858.049.500 26,8965
5 823.727.520 25,8207
6 490.314.000 15,3694
7 178.296.000 5,5889
8 37.791.000 1,1846
9 4.199.000 0,1316
10 184.756 0,0058
3.190.187.286 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|45;10;20)
x Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 3.247.943.160 0,1024
1 40.599.289.500 1,2808
2 204.190.544.250 6,4416
3 544.508.118.000 17,1776
4 852.585.079.500 26,8965
5 818.481.676.320 25,8207
6 487.191.474.000 15,3694
7 177.160.536.000 5,5889
8 37.550.331.000 1,1846
9 4.172.259.000 0,1316
10 183.579.396 0,0058
11 … 20 0 0
3.169.870.830.126 100,0000
Erwartungswert 4,4444
Varianz 1,9641
h(x|49;6;6)
x Anzahl möglicher
Ergebnisse
Wahrscheinlichkeit
in %
0 6.096.454 43,5965
1 5.775.588 41,3019
2 1.851.150 13,2378
3 246.820 1,765
4 13.545 0,0969
5 258 0,0018
6 1 0,0000072
13.983.816 100,0000
Erwartungswert 0,7347
Varianz 0,5776

Weblinks

 Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien

Kategorien: Wahrscheinlichkeitsverteilung

Quelle: Wikipedia - http://de.wikipedia.org/wiki/Hypergeometrische Verteilung (Vollständige Liste der Autoren des Textes [Versionsgeschichte])    Lizenz: CC-by-sa-3.0

Änderungen: Alle Bilder mit den meisten Bildunterschriften wurden entfernt. Ebenso alle zu nicht-existierenden Artikeln/Kategorien gehenden internen Wikipedia-Links (Bsp. Portal-Links, Redlinks, Bearbeiten-Links). Entfernung von Navigationsframes, Geo & Normdaten, Mediadateien, gesprochene Versionen, z.T. ID&Class-Namen, Style von Div-Containern, Metadaten, Vorlagen, wie lesenwerte Artikel. Ansonsten sind keine Inhaltsänderungen vorgenommen worden. Weiterhin kann es durch die maschinelle Bearbeitung des Inhalts zu Fehlern gerade in der Darstellung kommen. Darum würden wir jeden Besucher unserer Seite darum bitten uns diese Fehler über den Support mittels einer Nachricht mit Link zu melden. Vielen Dank!

Stand der Informationen: August 201& - Wichtiger Hinweis: Da die Inhalte maschinell von Wikipedia übernommen wurden, ist eine manuelle Überprüfung nicht möglich. Somit garantiert LinkFang.de nicht die Richtigkeit und Aktualität der übernommenen Inhalte. Sollten die Informationen mittlerweile fehlerhaft sein, bitten wir Sie darum uns per Support oder E-Mail zu kontaktieren. Wir werden uns dann innerhalb von spätestens 10 Tagen um Ihr Anliegen kümmern. Auch ohne Anliegen erfolgt mindestens alle drei Monate ein Update der gesamten Inhalte.