Hypergeometrische Verteilungsformeln, Gleichungen, Modell

1052
Robert Johnston

Das hypergeometrische Verteilung ist eine diskrete statistische Funktion, die zur Berechnung der Wahrscheinlichkeit in randomisierten Experimenten mit zwei möglichen Ergebnissen geeignet ist. Voraussetzung für die Anwendung ist, dass es sich um kleine Populationen handelt, bei denen die Extraktionen nicht ersetzt werden und die Wahrscheinlichkeiten nicht konstant sind.. 

Wenn daher ein Element der Population ausgewählt wird, um das Ergebnis (wahr oder falsch) eines bestimmten Merkmals zu kennen, kann dasselbe Element nicht erneut ausgewählt werden..

Abbildung 1. In einer Population solcher Schrauben gibt es sicherlich fehlerhafte Proben. Quelle: Pixabay.

Sicherlich wird das nächste ausgewählte Element mit größerer Wahrscheinlichkeit ein echtes Ergebnis erzielen, wenn das vorherige Element ein negatives Ergebnis hatte. Dies bedeutet, dass die Wahrscheinlichkeit variiert, wenn Elemente aus der Stichprobe extrahiert werden..

Die Hauptanwendungen der hypergeometrischen Verteilung sind: Qualitätskontrolle in Prozessen mit geringer Population und Berechnung von Wahrscheinlichkeiten in Glücksspielen.

Die mathematische Funktion, die die hypergeometrische Verteilung definiert, besteht aus drei Parametern:

- Anzahl der Bevölkerungselemente (N)

- Probengröße (m) 

- Anzahl der Ereignisse in der gesamten Bevölkerung mit einem günstigen (oder ungünstigen) Ergebnis des untersuchten Merkmals (n).

Artikelverzeichnis

  • 1 Formeln und Gleichungen
    • 1.1 Wichtige statistische Variablen
  • 2 Modell und Eigenschaften 
    • 2.1 Haupteigenschaften der hypergeometrischen Verteilung
    • 2.2 Approximation durch die Binomialverteilung
  • 3 Beispiele
    • 3.1 Beispiel 1
    • 3.2 Beispiel 2
  • 4 Gelöste Übungen
    • 4.1 Übung 1
    • 4.2 Übung 2
    • 4.3 Übung 3
  • 5 Referenzen

Formeln und Gleichungen

Die Formel für die hypergeometrische Verteilung gibt die Wahrscheinlichkeit an P. worüber x Es treten günstige Fälle eines bestimmten Merkmals auf. Die Art und Weise, es mathematisch zu schreiben, basierend auf den kombinatorischen Zahlen, ist:

Im obigen Ausdruck N., n Y. m sind Parameter und x die Variable selbst. 

-Gesamtbevölkerung ist N..

-Die Anzahl der positiven Ergebnisse eines bestimmten binären Merkmals in Bezug auf die Gesamtbevölkerung beträgt n.

-Menge der Musterartikel ist m.

In diesem Fall, X. ist eine Zufallsvariable, die den Wert annimmt x Y. P (x) gibt die Wahrscheinlichkeit des Auftretens von an x günstige Fälle der untersuchten Eigenschaft.

Wichtige statistische Variablen

Andere statistische Variablen für die hypergeometrische Verteilung sind:

- Hälfte μ = m * n / N.

- Varianz σ ^ 2 = m * (n / N) * (1-n / N) * (N-m) / (N-1)

- Typische Abweichung σ Das ist die Quadratwurzel der Varianz.

Modell und Eigenschaften 

Um zum Modell der hypergeometrischen Verteilung zu gelangen, gehen wir von der Wahrscheinlichkeit des Erhaltens aus x günstige Fälle in einer Stichprobengröße m. Diese Stichprobe enthält Elemente, die der untersuchten Eigenschaft entsprechen, und Elemente, die dies nicht tun.

Erinnere dich daran n repräsentiert die Anzahl der günstigen Fälle in der Gesamtbevölkerung von N. Elemente. Dann würde die Wahrscheinlichkeit folgendermaßen berechnet:

P (x) = (Anzahl der Wege, um x Anzahl der fehlgeschlagenen Wege zu erhalten) / (Gesamtzahl der Wege zur Auswahl)

Wenn wir das Obige in Form von kombinatorischen Zahlen ausdrücken, kommen wir zu folgendem Wahrscheinlichkeitsverteilungsmodell:

Haupteigenschaften der hypergeometrischen Verteilung

Sie sind wie folgt:

- Die Stichprobe muss immer klein sein, auch wenn die Population groß ist.

- Die Elemente der Stichprobe werden einzeln extrahiert, ohne sie wieder in die Population aufzunehmen.

- Die zu untersuchende Eigenschaft ist binär, dh sie kann nur zwei Werte annehmen: 1 oder 0, Ach ja sicher oder Fälschung.

In jedem Element-Extraktionsschritt ändert sich die Wahrscheinlichkeit in Abhängigkeit von den vorherigen Ergebnissen.

Approximation unter Verwendung der Binomialverteilung

Eine weitere Eigenschaft der hypergeometrischen Verteilung besteht darin, dass sie durch die Binomialverteilung angenähert werden kann, die als bezeichnet wird Bi, solange die Bevölkerung N. ist groß und mindestens 10 mal größer als die Probe m. In diesem Fall würde es so aussehen:

P (N, n, m; x) = Bi (m, n / N, x)           

Anwendbar, solange N groß ist und N> 10 m

Beispiele

Beispiel 1

Angenommen, eine Maschine, die Schrauben produziert, und die gesammelten Daten zeigen an, dass 1% fehlerhaft sind. In einer Schachtel mit N = 500 Schrauben beträgt die Anzahl der defekten Schrauben:

n = 500 * 1/100 = 5

Wahrscheinlichkeiten unter Verwendung der hypergeometrischen Verteilung

Angenommen, aus dieser Box (dh aus dieser Population) nehmen wir eine Stichprobe von m = 60 Schrauben.

Die Wahrscheinlichkeit, dass keine Schraube (x = 0) in der Probe defekt ist, beträgt 52,63%. Dieses Ergebnis wird mit der hypergeometrischen Verteilungsfunktion erreicht:

P (500, 5, 60, 0) = 0,5263

Die Wahrscheinlichkeit, dass x = 3 Schrauben in der Probe defekt sind, beträgt: P (500, 5, 60, 3) = 0,0129.

Andererseits ist die Wahrscheinlichkeit, dass x = 4 Schrauben der sechzig der Probe defekt sind, wie folgt: P (500, 5, 60; 4) = 0,0008.

Schließlich ist die Wahrscheinlichkeit, dass x = 5 Schrauben in dieser Probe defekt sind, wie folgt: P (500, 5, 60; 5) = 0.

Wenn Sie jedoch die Wahrscheinlichkeit wissen möchten, dass in dieser Stichprobe mehr als 3 defekte Schrauben vorhanden sind, müssen Sie die kumulative Wahrscheinlichkeit ermitteln und Folgendes hinzufügen:

P (3) + P (4) + P (5) = 0,0129 + 0,0008 + 0 = 0,0137.

Dieses Beispiel ist in Abbildung 2 dargestellt GeoGebra Eine freie Software, die in Schulen, Instituten und Universitäten weit verbreitet ist.

Abbildung 2. Beispiel für eine hypergeometrische Verteilung. Vorbereitet von F. Zapata mit GeoGebra.

Beispiel 2

Ein spanisches Deck hat 40 Karten, von denen 10 Gold haben und die restlichen 30 nicht. Angenommen, 7 Karten werden zufällig aus diesem Deck gezogen, die nicht wieder in das Deck aufgenommen werden.

Wenn X die Anzahl der Goldstücke ist, die in den 7 gezogenen Karten vorhanden sind, ist die Wahrscheinlichkeit, dass es bei einem 7-Karten-Ziehen x Gold gibt, durch die hypergeometrische Verteilung P (40,10,7; x) gegeben..

Sehen wir uns das so an: Um die Wahrscheinlichkeit zu berechnen, 4 Gold bei einem 7-Karten-Draw zu haben, verwenden wir die Formel der hypergeometrischen Verteilung mit den folgenden Werten:

Und das Ergebnis ist: 4,57% Wahrscheinlichkeit.

Wenn Sie jedoch wissen möchten, wie wahrscheinlich es ist, dass Sie mehr als 4 Karten erhalten, müssen Sie Folgendes hinzufügen:

P (4) + P (5) + P (6) + P (7) = 5,20%

Gelöste Übungen

Die folgenden Übungen sollen die in diesem Artikel vorgestellten Konzepte veranschaulichen und verarbeiten. Es ist wichtig, dass der Leser versucht, sie selbst zu lösen, bevor er sich die Lösung ansieht.

Übung 1

Eine Kondomfabrik hat festgestellt, dass von 1.000 Kondomen, die von einer bestimmten Maschine hergestellt werden, 5 defekt sind. Zur Qualitätskontrolle werden 100 Kondome nach dem Zufallsprinzip entnommen und die Partie wird abgelehnt, wenn mindestens ein oder mehrere defekt sind. Antworten:

a) Wie groß ist die Möglichkeit, dass viele 100 verworfen werden??

b) Ist dieses Qualitätskontrollkriterium effizient??

Lösung

In diesem Fall erscheinen sehr große kombinatorische Zahlen. Die Berechnung ist schwierig, wenn kein geeignetes Softwarepaket verfügbar ist.

Da es sich jedoch um eine große Population handelt und die Stichprobe zehnmal kleiner als die Gesamtpopulation ist, kann die Approximation der hypergeometrischen Verteilung durch die Binomialverteilung verwendet werden:

P (1000, 5, 100; x) = Bi (100, 5/1000, x) = Bi (100, 0,005, x) = C (100, x) * 0,005 ^ x (1-0,005) ^ (100-x)

Im obigen Ausdruck C (100, x) ist eine kombinatorische Zahl. Dann wird die Wahrscheinlichkeit, dass mehr als ein Defekt vorliegt, wie folgt berechnet:

P (x> = 1) = 1 - Bi (0) = 1 - 0,6058 = 0,3942

Es ist eine ausgezeichnete Annäherung, wenn es mit dem Wert verglichen wird, der durch Anwenden der hypergeometrischen Verteilung erhalten wird: 0,4102

Es kann gesagt werden, dass mit einer Wahrscheinlichkeit von 40% eine Charge von 100 Prophylaktika verworfen werden sollte, was nicht sehr effizient ist..

Da der Qualitätskontrollprozess jedoch etwas weniger anspruchsvoll ist und wir die 100er-Charge nur dann verwerfen würden, wenn zwei oder mehr Fehler vorliegen, würde die Wahrscheinlichkeit, die Charge zu verwerfen, auf nur 8% sinken..

Übung 2

Eine Kunststoffstopfenmaschine arbeitet so, dass von 10 Stück eines deformiert herauskommt. Wie wahrscheinlich ist es bei einer Stichprobe von 5 Stück, dass nur ein Stück defekt ist?.

Lösung

Bevölkerung: N = 10

Anzahl n der Defekte für jedes N: n = 1

Probengröße: m = 5

P (10, 1, 5; 1) = C (1,1) · C (9,4) / C (10,5) = 1 · 126/252 = 0,5

Daher besteht eine 50% ige Wahrscheinlichkeit, dass in einer Stichprobe von 5 ein Cue deformiert herauskommt.

Übung 3

Bei einem Treffen junger Abiturienten gibt es 7 Damen und 6 Herren. Unter den Mädchen studieren 4 Geisteswissenschaften und 3 Naturwissenschaften. In der Jungengruppe studiert 1 Geisteswissenschaften und 5 Naturwissenschaften. Berechnen Sie Folgendes:

a) Drei Mädchen nach dem Zufallsprinzip auswählen: Wie hoch ist die Wahrscheinlichkeit, dass sie alle Geisteswissenschaften studieren??.

b) Wenn drei Teilnehmer des Freundeskreises nach dem Zufallsprinzip ausgewählt werden: Wie groß ist die Möglichkeit, dass drei von ihnen, unabhängig vom Geschlecht, alle drei Naturwissenschaften studieren oder alle drei Geisteswissenschaften?.

c) Wählen Sie nun zwei Freunde nach dem Zufallsprinzip aus und rufen Sie an x auf die Zufallsvariable "Anzahl derjenigen, die Geisteswissenschaften studieren". Bestimmen Sie zwischen den beiden ausgewählten den Mittelwert oder den erwarteten Wert von x und die Varianz σ ^ 2.

Lösung für 

Bevölkerung ist die Gesamtzahl der Mädchen: N = 7. Diejenigen, die Geisteswissenschaften studieren, sind n = 4 der Gesamtzahl. Die Zufallsstichprobe der Mädchen wird m = 3 sein.

In diesem Fall ergibt sich die Wahrscheinlichkeit, dass alle drei Geisteswissenschaftler sind, aus der hypergeometrischen Funktion:

P (N = 7, n = 4, m = 3, x = 3) = C (4, 3) C (3, 0) / C (7, 3) = 0,1143

Es besteht also eine Wahrscheinlichkeit von 11,4%, dass drei zufällig ausgewählte Mädchen Geisteswissenschaften studieren..

Lösung b

Die jetzt zu verwendenden Werte sind:

-Bevölkerung: N = 14

-Die Menge, die Buchstaben studiert, ist: n = 6 und die

-Probengröße: m = 3.

-Anzahl der Freunde, die Geisteswissenschaften studieren: x

Demnach bedeutet x = 3, dass alle drei Geisteswissenschaften studieren, aber x = 0 bedeutet, dass keiner Geisteswissenschaften studiert. Die Wahrscheinlichkeit, dass alle drei gleich studieren, ergibt sich aus der Summe:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099

Dann haben wir eine Wahrscheinlichkeit von 21%, dass drei zufällig ausgewählte Besprechungsteilnehmer dasselbe lernen.

Lösung c

Hier haben wir folgende Werte:

N = 14 Gesamtbevölkerung von Freunden, n = 6 Gesamtzahl in der geisteswissenschaftlichen Bevölkerung, die Stichprobengröße beträgt m = 2.

Hoffnung ist:

E (x) = m * (n / N) = 2 * (6/14) = 0,8572

Und die Varianz:

σ (x) ^ 2 =  m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * (14-2) / (14 -1) =

= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / (13 )  = 0,4521

Verweise

  1. Diskrete Wahrscheinlichkeitsverteilungen. Wiederhergestellt von: biplot.usal.es
  2. Statistik und Wahrscheinlichkeit. Hypergeometrische Verteilung. Wiederhergestellt von: projectdescartes.org
  3. CDPYE-UGR. Hypergeometrische Verteilung. Wiederhergestellt von: ugr.es.
  4. Geogebra. Klassische Geogebra, Wahrscheinlichkeitsrechnung. Von geogebra.org wiederhergestellt
  5. Versuchen Sie es einfach. Gelöste Probleme der hypergeometrischen Verteilung. Wiederhergestellt von: probafacil.com
  6. Minitab. Hypergeometrische Verteilung. Wiederhergestellt von: support.minitab.com
  7. Universität von Vigo. Diskrete Hauptverteilungen. Wiederhergestellt von: anapg.webs.uvigo.es
  8. Vitutor. Statistik und Kombinatorik. Wiederhergestellt von: vitutor.net
  9. Weisstein, Eric W. Hypergeometrische Verteilung. Wiederhergestellt von: mathworld.wolfram.com
  10. Wikipedia. Hypergeometrische Verteilung. Wiederhergestellt von: es.wikipedia.com

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.