Messungen der zentralen Tendenz für gruppierte Datenformeln, Übungen

3181
Abraham McLaughlin
Messungen der zentralen Tendenz für gruppierte Datenformeln, Übungen

Das Trendmaßnahmen zentral Sie geben den Wert an, um den sich die Daten einer Verteilung befinden. Am bekanntesten ist der Mittelwert oder das arithmetische Mittel, bei dem alle Werte addiert und das Ergebnis durch die Gesamtzahl der Daten dividiert werden.

Wenn die Verteilung jedoch aus einer großen Anzahl von Werten besteht und diese nicht ordnungsgemäß dargestellt werden, ist es nicht einfach, die erforderlichen Berechnungen durchzuführen, um die darin enthaltenen wertvollen Informationen zu extrahieren..

Abbildung 1. Messungen der zentralen Tendenz für gruppierte Daten sind ein guter Hinweis auf das allgemeine Verhalten der Daten

Deshalb werden sie in Klassen oder Kategorien eingeteilt, um eine zu entwickeln Verteilung von Frequenzen. Durch Ausführen dieser vorherigen Reihenfolge der Daten ist es dann einfacher, die Maße der zentralen Tendenz zu berechnen, darunter:

-Hälfte

-Median

-Mode

-Geometrisches Mittel

-Harmonische Mittel

Formeln

Hier sind die Formeln für die Maße der zentralen Tendenz für die gruppierten Daten:

Arithmetischer Durchschnitt

Der Mittelwert wird am häufigsten zur Charakterisierung quantitativer Daten (numerische Werte) verwendet, obwohl er sehr empfindlich auf die Extremwerte der Verteilung reagiert. Es wird berechnet durch:

Mit:

-X: Durchschnitt oder arithmetisches Mittel

-F.ich: Klassenfrequenz

-mich: die Klassenmarke

-g: Anzahl der Klassen

-n: Gesamtdaten

Median

Um es zu berechnen, ist es notwendig, das Intervall zu finden, das die Beobachtung n / 2 enthält, und zu interpolieren, um den numerischen Wert dieser Beobachtung unter Verwendung der folgenden Formel zu bestimmen:

Wo:

-c: Breite des Intervalls, zu dem der Median gehört

-B.M.: Untergrenze des Intervalls

-F.m: Anzahl der im Intervall enthaltenen Beobachtungen

-n / 2: Gesamtdaten geteilt durch 2.

-F.BM: Anzahl der Beobachtungen Vor des Intervalls, das den Median enthält.

Daher ist der Median ein Maß für die Position, dh er teilt den Datensatz in zwei Teile. Sie können auch definiert werden Quartile, Dezile Y. Perzentile, das teilt die Verteilung in vier, zehn bzw. einhundert Teile.

Mode

In den gepoolten Daten wird die Klasse oder Kategorie durchsucht, die die meisten Beobachtungen enthält. Dies ist das Modellklasse. Eine Distribution kann zwei oder mehr Modi haben. In diesem Fall wird sie aufgerufen bimodal Y. multimodal, beziehungsweise.

Sie können den Modus auch in gruppierten Daten nach folgender Gleichung berechnen:

Mit:

-L.1: Untergrenze der Klasse, in der sich der Modus befindet

1: subtrahieren zwischen der Häufigkeit der Modalklasse und der Häufigkeit der Klasse, die ihr vorausgeht.

zwei: subtrahieren zwischen der Frequenz der Modalklasse und der Frequenz der nächsten Klasse.

-c: Breite des Intervalls, das den Modus enthält

Harmonische Mittel

Das harmonische Mittel wird mit H bezeichnet. Wenn Sie eine Menge von haben n x-Werte1, xzwei, x3…, Das harmonische Mittel ist die Umkehrung oder der Kehrwert des arithmetischen Mittels der Umkehrungen der Werte.

Es ist einfacher, es durch die Formel zu sehen:

Und wenn die gruppierten Daten verfügbar sind, wird der Ausdruck:

Wo:

-H: harmonisches Mittel

-F.ich: Klassenfrequenz

-mich: Klassennote

-g: Anzahl der Klassen

-N = f1 + F.zwei + F.3 +...

Geometrisches Mittel

Wenn sie haben n positive Zahlen x1, xzwei, x3…, Sein geometrisches Mittel G wird durch die n-te Wurzel des Produkts aller Zahlen berechnet:

Im Fall von gruppierten Daten kann gezeigt werden, dass der Dezimallogarithmus des geometrischen Mittelwerts log G gegeben ist durch:

Wo:

-G: geometrisches Mittel

-F.ich: Klassenfrequenz

-mich: die Klassenmarke

-g: Anzahl der Klassen

-N = f1 + F.zwei + F.3 +...

Beziehung zwischen H, G und X.

Es ist immer wahr, dass:

H ≤ G ≤ X.

Am häufigsten verwendete Definitionen

Die folgenden Definitionen sind erforderlich, um die in den obigen Formeln beschriebenen Werte zu finden:

Frequenz

Die Häufigkeit ist definiert als die Häufigkeit, mit der ein Datenelement wiederholt wird.

Rang

Dies ist die Differenz zwischen dem höchsten und dem niedrigsten Wert, die in der Verteilung vorhanden sind.

Anzahl der Klassen

Um zu wissen, in wie vielen Klassen wir die Daten gruppieren, verwenden wir einige Kriterien, beispielsweise die folgenden:

Grenzen

Die Extremwerte jeder Klasse oder jedes Intervalls werden aufgerufen Grenzen und jede Klasse kann sowohl genau definierte Grenzen haben, in welchem ​​Fall sie eine untere und eine höhere Grenze hat. Oder es kann offene Grenzen haben, wenn ein Bereich angegeben wird, beispielsweise für Werte, die größer oder kleiner als eine bestimmte Zahl sind.

Klassenzeichen

Es besteht einfach aus dem Mittelpunkt des Intervalls und wird berechnet, indem die Obergrenze und die Untergrenze gemittelt werden.

Spaltbreite

Die Daten können in Klassen gleicher oder unterschiedlicher Größe gruppiert werden. Dies ist die Breite oder Breite. Die erste Option wird am häufigsten verwendet, da sie die Berechnung erheblich vereinfacht. In einigen Fällen ist es jedoch unbedingt erforderlich, dass die Klassen unterschiedliche Breiten haben.

Die Breite c Das Intervall kann durch die folgende Formel bestimmt werden:

c = Bereich / N.c

Woc ist die Anzahl der Klassen.

Übung gelöst

Im Folgenden finden Sie eine Reihe von Geschwindigkeitsmessungen in km / h mit Radar, die 50 Autos entsprechen, die in einer bestimmten Stadt durch eine Straße fuhren:

Abbildung 2. Tabelle für die aufgelöste Übung. Quelle: F. Zapata.

Lösung

Die auf diese Weise dargestellten Daten sind nicht organisiert. Der erste Schritt besteht darin, sie in Klassen zu gruppieren.

Schritte zum Gruppieren der Daten und Erstellen der Tabelle

Schritt 1

Finden Sie den Bereich R:

R = (52 - 16) km / h = 36 km / h

Schritt 2

Wählen Sie die Anzahl der Klassen N.c, nach den angegebenen Kriterien. Da es 50 Daten gibt, können wir N wählenc = 6.

Schritt 3

Breite berechnen c des Intervalls:

c = Bereich / N.c = 36/6 = 6

Schritt 4

Formklassen und Gruppendaten wie folgt: Für die erste Klasse wird ein Wert gewählt, der geringfügig unter dem niedrigsten in der Tabelle vorhandenen Wert liegt, und dann wird der zuvor berechnete Wert von c = 6 zu diesem Wert addiert erhält die Obergrenze der ersten Klasse.

Wir gehen genauso vor, um den Rest der Klassen zu erstellen, wie in der folgenden Tabelle gezeigt:

Jede Frequenz entspricht einer Farbe in Abbildung 2. Auf diese Weise wird sichergestellt, dass kein Wert der Zählung entgeht..

Berechnung des Mittelwerts

X = (5 · 18,5 + 25 · 25,0 + 10 · 31,5 + 6 · 38,0 + 2 · 44,5 + 2 · 51,0) ≤ 50 = 29,03 km / h

Berechnung des Medians

Der Median befindet sich in Klasse 2 der Tabelle, da die ersten 30 Daten der Verteilung vorliegen.

-Breite des Intervalls, zu dem der Median gehört: c = 6

-Untere Grenze des Intervalls, in dem der Median ist: B.M. = 22,0 km / h

-Anzahl der Beobachtungen, die das Intervall f enthältm = 25

-Gesamtdaten geteilt durch 2: 50/2 = 25

-Anzahl der Beobachtungen gibt es Vor des Intervalls, das den Median enthält: fBM = 5

Und die Operation ist:

Median = 22,0 + [(25-5) ≤ 25] × 6 = 26,80 km / h

Modeberechnung

Mode ist auch in Klasse 2:

-Intervallbreite: c = 6

-Untergrenze der Klasse, in der sich der Modus befindet: L.1 = 22,0

-Subtrahieren Sie zwischen der Frequenz der Modalklasse und der Frequenz der Klasse, die ihr vorausgeht: Δ1 = 25-5 = 20

-Subtrahieren Sie zwischen der Frequenz der Modalklasse und der Frequenz der folgenden Klasse: Δzwei = 25 - 10 = 15

Mit diesen Daten ist die Operation:

Modus = 22,0 + [20 ÷ (20 + 15)] x 6 = 25,4 km / h

Berechnung des geometrischen Mittelwerts

N = f1 + F.zwei + F.3 +… = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Berechnung des harmonischen Mittelwerts

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Zusammenfassung der Maßnahmen der zentralen Tendenz

Die Einheiten der Variablen sind km / h:

-Durchschnitt: 29.03

-Median: 26,80

-Mode: 25.40

-Geometrisches Mittel: 28,13

-Harmonisches Mittel: 27,32

Verweise

  1. Berenson, M. 1985. Statistik für Management und Wirtschaft. Interamericana S.A..
  2. Canavos, G. 1988. Wahrscheinlichkeit und Statistik: Anwendungen und Methoden. Mcgraw Hügel.
  3. Devore, J. 2012. Wahrscheinlichkeit und Statistik für Ingenieurwesen und Wissenschaft. 8 .. Auflage. Engagieren.
  4. Levin, R. 1988. Statistik für Administratoren. 2 .. Auflage. Prentice Halle.
  5. Spiegel, M. 2009. Statistik. Schaum-Serie. 4 .. Auflage. Mcgraw Hügel.
  6. Behandlung von gruppierten Daten. Wiederhergestellt von: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Wahrscheinlichkeit und Statistik für Ingenieurwissenschaften und Naturwissenschaften. Pearson.

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.