Poisson-Verteilungsformeln, Gleichungen, Modell, Eigenschaften

2556
Alexander Pearson

Das Poisson-Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, durch die es möglich ist, die Wahrscheinlichkeit zu kennen, dass innerhalb einer großen Stichprobengröße und während eines bestimmten Intervalls ein Ereignis auftritt, dessen Wahrscheinlichkeit gering ist.

Oft kann die Poisson-Verteilung anstelle der Binomialverteilung verwendet werden, solange die folgenden Bedingungen erfüllt sind: große Stichprobe und kleine Wahrscheinlichkeit.

Abbildung 1. Diagramm der Poisson-Verteilung für verschiedene Parameter. Quelle: Wikimedia Commons.

Siméon-Denis Poisson (1781-1840) schuf diese Distribution, die seinen Namen trägt und sehr nützlich ist, wenn es um unvorhersehbare Ereignisse geht. Poisson veröffentlichte seine Ergebnisse 1837, eine Forschungsarbeit über die Wahrscheinlichkeit des Auftretens fehlerhafter strafrechtlicher Verurteilungen.

Später passten andere Forscher die Verteilung in anderen Gebieten an, zum Beispiel die Anzahl der Sterne, die in einem bestimmten Raumvolumen gefunden werden konnten, oder die Wahrscheinlichkeit, dass ein Soldat an einem Tritt eines Pferdes starb.

Artikelverzeichnis

  • 1 Formel und Gleichungen
  • 2 Modell und Eigenschaften
    • 2.1 Unterschiede zur Binomialverteilung
  • 3 Beispiele
    • 3.1 Praktische Anwendungen
    • 3.2 Annäherung der Binomialverteilung an die Poisson-Verteilung
  • 4 Gelöste Übungen
    • 4.1 Übung 1
    • 4.2 Übung 2
  • 5 Referenzen

Formel und Gleichungen

Die mathematische Form der Poisson-Verteilung lautet wie folgt:

- μ (manchmal auch als λ bezeichnet) ist der Mittelwert oder Parameter der Verteilung

- Eulernummer: e = 2,71828

- Die Wahrscheinlichkeit, y = k zu erhalten, ist P.

- k ist die Anzahl der Erfolge 0, 1,2,3 ...

- n ist die Anzahl der Tests oder Ereignisse (die Stichprobengröße)

Diskrete Zufallsvariablen hängen, wie der Name schon sagt, vom Zufall ab und nehmen nur diskrete Werte an: 0, 1, 2, 3, 4 ..., k.

Der Mittelwert der Verteilung ergibt sich aus:

Die Varianz σ, die die Streuung der Daten misst, ist ein weiterer wichtiger Parameter. Für die Poisson-Distribution gilt:

σ = μ

Poisson stellte fest, dass bei n → ∞ und p → 0 auch der Mittelwert μ-aufgerufen wird erwarteter Wert- neigt zu einer Konstante:

μ → konstant

Wichtig:: p ist die Eintrittswahrscheinlichkeit des Ereignisses unter Berücksichtigung der Gesamtbevölkerung, während P (y) ist die Poisson-Vorhersage für die Probe.

Modell und Eigenschaften

Die Poisson-Verteilung hat die folgenden Eigenschaften:

-Die Stichprobengröße ist groß: n → ∞.

-Die betrachteten Ereignisse sind unabhängig voneinander und treten zufällig auf.

-Wahrscheinlichkeit P. dieses bestimmte Ereignis Y. tritt während eines bestimmten Zeitraums auf, ist sehr klein: P → 0.

-Die Wahrscheinlichkeit, dass mehr als ein Ereignis im Zeitintervall auftritt, beträgt 0.

-Der Durchschnittswert nähert sich einer Konstanten an, die gegeben ist durch: μ = n.p (n ist die Stichprobengröße)

-Da die Dispersion σ gleich μ ist, da sie größere Werte annimmt, wird auch die Variabilität größer.

-Die Ereignisse müssen im verwendeten Zeitintervall gleichmäßig verteilt sein.

-Die Menge der möglichen Ereigniswerte Y. ist: 0,1,2,3,4 ... .

-Die Summe von ich Variablen, die einer Poisson-Verteilung folgen, sind ebenfalls eine andere Poisson-Variable. Sein Durchschnittswert ist die Summe der Durchschnittswerte dieser Variablen.

Unterschiede zur Binomialverteilung

Die Poisson-Verteilung unterscheidet sich von der Binomialverteilung in folgenden wichtigen Punkten:

-Die Binomialverteilung wird sowohl von der Stichprobengröße n als auch von der Wahrscheinlichkeit beeinflusst P., Die Poisson-Verteilung wird jedoch nur vom Mittelwert beeinflusst μ.

-In einer Binomialverteilung die möglichen Werte der Zufallsvariablen Y. sind 0,1,2,…, N, andererseits gibt es in der Poisson-Verteilung keine Obergrenze für diese Werte.

Beispiele

Poisson wandte seine berühmte Verbreitung zunächst auf Rechtsfälle an, doch auf industrieller Ebene war eine seiner frühesten Anwendungen die Herstellung von Bier. Bei diesem Verfahren werden Hefekulturen zur Fermentation verwendet.

Hefe besteht aus lebenden Zellen, deren Population über die Zeit variabel ist. Bei der Herstellung von Bier ist es notwendig, die notwendige Menge hinzuzufügen, daher ist es notwendig, die Menge an Zellen zu kennen, die pro Volumeneinheit vorhanden sind.

Während des Zweiten Weltkriegs wurde die Poisson-Verteilung verwendet, um herauszufinden, ob die Deutschen tatsächlich von Calais aus auf London zielten oder nur zufällig feuerten. Dies war wichtig für die Alliierten, um festzustellen, wie gut die Technologie den Nazis zur Verfügung stand..

Praktische Anwendungen

Die Anwendungen der Poisson-Verteilung beziehen sich immer auf Zeitzählungen oder Raumzählungen. Und da die Eintrittswahrscheinlichkeit gering ist, wird sie auch als "Gesetz der seltenen Ereignisse" bezeichnet..

Hier ist eine Liste von Ereignissen, die in eine dieser Kategorien fallen:

-Die Aufzeichnung der Partikel in einem radioaktiven Zerfall, der wie das Wachstum von Hefezellen eine exponentielle Funktion darstellt.

-Anzahl der Besuche auf einer bestimmten Website.

-Ankunft von Personen in einer Schlange, um zu bezahlen oder besucht zu werden (Warteschlangentheorie).

-Anzahl der Autos, die in einem bestimmten Zeitintervall einen bestimmten Punkt auf einer Straße passieren.

Abbildung 2. Die Anzahl der Autos, die einen Punkt passieren, folgt ungefähr einer Poisson-Verteilung. Quelle: Pixabay.

-Mutationen in einem bestimmten DNA-Strang nach Bestrahlung.

-Anzahl der Meteoriten mit einem Durchmesser von mehr als 1 m pro Jahr gefallen.

-Defekte pro Quadratmeter Stoff.

-Anzahl der Blutzellen in 1 Kubikzentimeter.

-Anrufe pro Minute zu einer Telefonzentrale.

-Schokoladenstückchen in 1 kg Kuchenteig.

-Anzahl der von einem bestimmten Parasiten infizierten Bäume auf 1 Hektar Wald.

Beachten Sie, dass diese Zufallsvariablen die Häufigkeit darstellen, mit der ein Ereignis während eines festgelegten Zeitraums auftritt (Anrufe pro Minute an die Telefonzentrale) oder eine bestimmte Region des Raums (Defekte eines Gewebes pro Quadratmeter).

Diese Ereignisse sind, wie bereits festgestellt, unabhängig von der Zeit, die seit dem letzten Auftreten vergangen ist..

Annäherung der Binomialverteilung an die Poisson-Verteilung

Die Poisson-Verteilung ist eine gute Annäherung an die Binomialverteilung, solange:

-Die Stichprobengröße ist groß: n ≥ 100

-Wahrscheinlichkeit p ist wenig: p ≤ 0,1

- μ ist in der Reihenfolge: np ≤ 10

In solchen Fällen ist die Poisson-Verteilung ein hervorragendes Werkzeug, da die Binomialverteilung in diesen Fällen schwierig anzuwenden sein kann..

Gelöste Übungen

Übung 1

Eine seismologische Studie ergab, dass es in den letzten 100 Jahren weltweit 93 große Erdbeben gab, mindestens 6,0 auf der Richterskala -logarithmisch-. Angenommen, die Poisson-Verteilung ist in diesem Fall ein geeignetes Modell. Finden:

a) Das durchschnittliche Auftreten großer Erdbeben pro Jahr.

b) Ja P (y) ist die Wahrscheinlichkeit des Auftretens Y. Erdbeben während eines zufällig ausgewählten Jahres finden die folgenden Wahrscheinlichkeiten:

P.(0), P.(1), P. (zwei), P. (3), P. (4), P. (5), P. (6) und P. (7).

c) Die wahren Ergebnisse der Studie sind die folgenden:

- 47 Jahre (0 Erdbeben)

- 31 Jahre (1 Erdbeben)

- 13 Jahre (2 Erdbeben)

- 5 Jahre (3 Erdbeben)

- 2 Jahre (4 Erdbeben)

-  0 Jahre (5 Erdbeben)

- 1 Jahr (6 Erdbeben)

- 1 Jahr (7 Erdbeben)

Wie vergleichen sich diese Ergebnisse mit denen in Teil b? Ist die Poisson-Distribution eine gute Wahl, um diese Ereignisse zu modellieren??

Lösung für)

a) Erdbeben sind Ereignisse, deren Wahrscheinlichkeit p es ist klein und wir erwägen einen begrenzten Zeitraum von einem Jahr. Die durchschnittliche Anzahl der Erdbeben beträgt:

μ = 93/100 Erdbeben / Jahr = 0,93 Erdbeben pro Jahr.

Lösung b)

b) Um die angeforderten Wahrscheinlichkeiten zu berechnen, werden die Werte in der am Anfang angegebenen Formel eingesetzt:

y = 2

μ = 0,93

e = 2,71828

Es ist ziemlich viel weniger als P (2).

Die Ergebnisse sind unten aufgeführt:

P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P. (7) = 0,0000471.

Zum Beispiel könnten wir sagen, dass es eine Wahrscheinlichkeit von 39,5% gibt, dass in einem bestimmten Jahr kein schweres Erdbeben auftreten wird. Oder dass in diesem Jahr 5,29% von 3 großen Erdbeben auftreten.

Lösung c)

c) Die Häufigkeiten werden analysiert, multipliziert mit n = 100 Jahren:

39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 und 0,00471.

Beispielsweise:

- Eine Häufigkeit von 39,5 zeigt an, dass in 39,5 von 100 Jahren 0 große Erdbeben auftreten. Wir können sagen, dass dies dem tatsächlichen Ergebnis von 47 Jahren ohne größere Erdbeben ziemlich nahe kommt..

Vergleichen wir ein anderes Poisson-Ergebnis mit den tatsächlichen Ergebnissen:

- Der erhaltene Wert von 36,7 bedeutet, dass es in einem Zeitraum von 37 Jahren 1 großes Erdbeben gibt. Das tatsächliche Ergebnis ist, dass es in 31 Jahren 1 schweres Erdbeben gab, eine gute Übereinstimmung mit dem Modell.

- 17,1 Jahre werden mit 2 großen Erdbeben erwartet, und es ist bekannt, dass es in 13 Jahren, was ein enger Wert ist, tatsächlich 2 große Erdbeben gab.

Daher ist das Poisson-Modell für diesen Fall akzeptabel.

Übung 2

Ein Unternehmen schätzt, dass die Anzahl der Komponenten, die vor Erreichen von 100 Betriebsstunden ausfallen, einer Poisson-Verteilung folgt. Wenn die durchschnittliche Anzahl von Fehlern in dieser Zeit 8 beträgt, ermitteln Sie die folgenden Wahrscheinlichkeiten:

a) Dass eine Komponente in 25 Stunden ausfällt.

b) Ausfall von weniger als zwei Komponenten in 50 Stunden.

c) Ausfall von mindestens drei Komponenten in 125 Stunden.

Lösung für)

a) Es ist bekannt, dass der Durchschnitt der Ausfälle in 100 Stunden 8 beträgt, daher wird in 25 Stunden ein Viertel der Ausfälle erwartet, dh 2 Ausfälle. Dies wird der Parameter sein μ.

Die Wahrscheinlichkeit, dass 1 Komponente ausfällt, wird angefordert, die Zufallsvariable lautet "Komponenten, die vor 25 Stunden ausfallen" und ihr Wert ist y = 1. Durch Einsetzen in die Wahrscheinlichkeitsfunktion:

Die Frage ist jedoch, wie wahrscheinlich es ist, dass sie versagen weniger als zwei Komponenten in 50 Stunden nicht genau 2 Komponenten in 50 Stunden ausfallen, daher müssen wir die Wahrscheinlichkeiten hinzufügen, dass:

-Keiner scheitert

-Nur scheitern 1

P (weniger als 2 Komponenten fallen aus) = P (0) + P (1)

P (weniger als 2 Komponenten fallen aus) = 0,0183 + 0,0732 = 0.0915

c) Dass sie versagen mindestens 3 Komponenten in 125 Stunden bedeuten, dass 3, 4, 5 oder mehr in dieser Zeit ausfallen können.

Die Wahrscheinlichkeit, dass es auftritt mindestens Eines von mehreren Ereignissen ist gleich 1, abzüglich der Wahrscheinlichkeit, dass keines der Ereignisse eintritt.

-Das gewünschte Ereignis ist, dass 3 oder mehr Komponenten in 125 Stunden ausfallen

-Wenn das Ereignis nicht auftritt, bedeutet dies, dass weniger als 3 Komponenten ausfallen. Die Wahrscheinlichkeit dafür ist: P (0) + P (1) + P (2)

Der Parameter μ der Verteilung ist in diesem Fall:

 μ = 8 + 2 = 10 Fehler in 125 Stunden.

P (3 oder mehr Komponenten fallen aus) = 1 - P (0) - P (1) - P (2) =

Verweise

  1. MathWorks. Poisson-Verteilung. Wiederhergestellt von: es.mathworks.com
  2. Mendenhall, W. 1981. Statistik für Management und Wirtschaft. 3 .. Auflage. Grupo Editorial Iberoamérica.
  3. Stat Trek. Bringen Sie sich Statistik bei. Poisson-Verteilung. Wiederhergestellt von: stattrek.com,
  4. Triola, M. 2012. Elementare Statistik. 11 .. Ed. Pearson Education.
  5. Wikipedia. Poisson-Verteilung. Wiederhergestellt von: en.wikipedia.org

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.