Erklärung der Störregeln, Anwendungen und Beispiele

4477
Robert Johnston

Das Störe Regel Es ist ein Kriterium, mit dem die Anzahl der Klassen oder Intervalle bestimmt wird, die zur grafischen Darstellung eines Satzes statistischer Daten erforderlich sind. Diese Regel wurde 1926 vom deutschen Mathematiker Herbert Sturges ausgesprochen.

Sturges schlug eine einfache Methode vor, die auf der Anzahl der Stichproben x basiert und es uns ermöglicht, die Anzahl der Klassen und ihre Bereichsbreite zu ermitteln. Die Störregel wird insbesondere im Bereich der Statistik häufig verwendet, um insbesondere Frequenzhistogramme zu erstellen..

Artikelverzeichnis

  • 1 Erklärung
  • 2 Anwendungen
  • 3 Beispiel
  • 4 Referenzen

Erläuterung

Die Sturges-Regel ist eine empirische Methode, die in der deskriptiven Statistik häufig verwendet wird, um die Anzahl der Klassen zu bestimmen, die in einem Frequenzhistogramm vorhanden sein müssen, um einen Datensatz zu klassifizieren, der eine Stichprobe oder Population darstellt..

Grundsätzlich bestimmt diese Regel die Breite der Grafikcontainer, der Frequenzhistogramme.

Um seine Regel festzulegen, betrachtete Herbert Sturges ein ideales Frequenzdiagramm, das aus K Intervallen besteht, wobei das i-te Intervall eine bestimmte Anzahl von Abtastwerten enthält (i = 0,… k - 1), dargestellt als:

Diese Anzahl von Abtastwerten ergibt sich aus der Anzahl von Möglichkeiten, wie eine Teilmenge einer Menge extrahiert werden kann; das heißt, durch den Binomialkoeffizienten, ausgedrückt wie folgt:

Um den Ausdruck zu vereinfachen, wandte er die Eigenschaften von Logarithmen auf beide Teile der Gleichung an:

Somit stellte Sturges fest, dass die optimale Anzahl von Intervallen k durch den Ausdruck gegeben ist:

Es kann auch ausgedrückt werden als:

In diesem Ausdruck:

- k ist die Anzahl der Klassen.

- N ist die Gesamtzahl der Beobachtungen in der Probe.

- Log ist der gemeinsame Logarithmus von Basis 10.

Um beispielsweise ein Frequenzhistogramm zu erstellen, das eine Zufallsstichprobe der Größe von 142 Kindern ausdrückt, beträgt die Anzahl der Intervalle oder Klassen, die die Verteilung haben wird:

k = 1 + 3,322 * * Log10 (N)

k = 1 + 3,322* * log (142)

k = 1 + 3,322* * 2.1523

k = 8,14 ≤ 8

Somit erfolgt die Verteilung in 8 Intervallen.

Die Anzahl der Intervalle muss immer durch ganze Zahlen dargestellt werden. In Fällen, in denen der Wert dezimal ist, muss eine Annäherung an die nächste ganze Zahl vorgenommen werden.

Anwendungen

Die Sturges-Regel wird hauptsächlich in der Statistik angewendet, da sie eine Häufigkeitsverteilung durch Berechnung der Anzahl der Klassen (k) sowie der Länge jeder dieser Klassen, auch als Amplitude bezeichnet, ermöglicht..

Die Amplitude ist die Differenz der oberen und unteren Grenze der Klasse, geteilt durch die Anzahl der Klassen, und wird ausgedrückt:

Es gibt viele Faustregeln, mit denen Sie eine Häufigkeitsverteilung vornehmen können. Die Sturges-Regel wird jedoch häufig verwendet, da sie sich der Anzahl der Klassen annähert, die im Allgemeinen zwischen 5 und 15 liegt..

Daher wird ein Wert berücksichtigt, der eine Stichprobe oder Population angemessen darstellt. Das heißt, die Näherung stellt weder extreme Gruppierungen dar, noch funktioniert sie mit einer übermäßigen Anzahl von Klassen, die keine Zusammenfassung der Stichprobe ermöglichen..

Beispiel

Ein Frequenzhistogramm muss gemäß den angegebenen Daten erstellt werden, die dem Alter entsprechen, das bei einer Umfrage unter Männern ermittelt wurde, die in einem örtlichen Fitnessstudio trainieren..

Um die Intervalle zu bestimmen, muss man die Größe der Probe oder die Anzahl der Beobachtungen kennen; In diesem Fall haben Sie 30.

Dann gilt die Sturges-Regel:

k = 1 + 3,322 * * Log10 (N)

k = 1 + 3,322* * log (30)

k = 1 + 3,322* * 1,4771

k = 5,90 ≈ 6 Intervalle.

Aus der Anzahl der Intervalle kann die Amplitude berechnet werden, die diese haben werden; das heißt, die Breite jedes Balkens, der im Frequenzhistogramm dargestellt wird:

Die Untergrenze wird als kleinster Wert der Daten betrachtet, und die Obergrenze ist der größte Wert. Die Differenz zwischen der oberen und unteren Grenze wird als Bereich oder Bereich der Variablen (R) bezeichnet..

Aus der Tabelle geht hervor, dass die Obergrenze 46 und die Untergrenze 13 beträgt. Auf diese Weise beträgt die Amplitude jeder Klasse:

Die Intervalle setzen sich aus einer Ober- und Untergrenze zusammen. Um diese Intervalle zu bestimmen, zählen wir zunächst ab der Untergrenze und addieren dazu die durch Regel (6) bestimmte Amplitude wie folgt:

Dann wird die absolute Frequenz berechnet, um die Anzahl der Männer zu bestimmen, die jedem Intervall entsprechen; in diesem Fall ist es:

- Intervall 1: 13 - 18 = 9

- Intervall 2: 19 - 24 = 9

- Intervall 3: 25 - 30 = 5

- Intervall 4: 31 - 36 = 2

- Intervall 5: 37 - 42 = 2

- Bereich 6: 43 - 48 = 3

Wenn Sie die absolute Häufigkeit jeder Klasse addieren, muss diese der Gesamtzahl der Stichprobe entsprechen. in diesem Fall 30.

Anschließend wird die relative Häufigkeit jedes Intervalls berechnet, wobei die absolute Häufigkeit durch die Gesamtzahl der Beobachtungen dividiert wird:

- Intervall 1: fi = 9 ÷ 30 = 0,30

- Intervall 2: fi = 9 ÷ 30 = 0,30

- Intervall 3: fi = 5 ÷ 30 = 0,1666

- Intervall 4: fi = 2 ÷ 30 = 0,0666

- Intervall 5: fi = 2 ÷ 30 = 0,0666

- Intervall 4: fi = 3 ÷ 30 = 0,10

Dann können Sie eine Tabelle erstellen, die die Daten und auch das Diagramm aus der relativen Häufigkeit in Bezug auf die erhaltenen Intervalle widerspiegelt, wie in den folgenden Bildern zu sehen ist:

Auf diese Weise ermöglicht die Sturges-Regel die Bestimmung der Anzahl von Klassen oder Intervallen, in die eine Stichprobe unterteilt werden kann, um eine Datenstichprobe durch die Erstellung von Tabellen und Grafiken zusammenzufassen..

Verweise

  1. Alfonso Urquía, M. V. (2013). Modellierung und Simulation diskreter Ereignisse. UNED,.
  2. Altman Naomi, M. K. (2015). "Einfache lineare Regression." Naturmethoden .
  3. Antúnez, R. J. (2014). Statistik in der Bildung. Digitale EINHEIT.
  4. Fox, J. (1997). Angewandte Regressionsanalyse, lineare Modelle und verwandte Methoden. SAGE-Veröffentlichungen.
  5. Humberto Llinás Solano, C. R. (2005). Beschreibende Statistik und Wahrscheinlichkeitsverteilungen. nördliche Universität.
  6. Panteleeva, O. V. (2005). Grundlagen der Wahrscheinlichkeit und Statistik.
  7. O. Kuehl, M. O. (2001). Versuchsplanung: Statistische Grundlagen des Forschungsdesigns und der Analyse. Thomson-Redakteure.

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.