Das Variabilitätsmaße, Sie werden auch als Dispersionsmaße bezeichnet und sind statistische Indikatoren, die angeben, wie nah oder fern die Daten vom arithmetischen Mittel sind. Wenn die Daten nahe am Mittelwert liegen, ist die Verteilung konzentriert, und wenn sie weit entfernt sind, handelt es sich um eine spärliche Verteilung..
Es gibt viele Variabilitätsmaße, unter den bekanntesten sind:
Diese Maßnahmen ergänzen die Maßnahmen der zentralen Tendenz und sind notwendig, um die Verteilung der erhaltenen Daten zu verstehen und daraus so viele Informationen wie möglich zu extrahieren..
Bereich oder Spanne misst die Breite eines Datensatzes. Um seinen Wert zu bestimmen, wird die Differenz zwischen den Daten mit dem höchsten Wert xmax und der mit dem niedrigsten Wert xMindest::
R = xmax - xMindest
Wenn die Daten nicht lose sind, sondern nach Intervallen gruppiert sind, wird der Bereich anhand der Differenz zwischen der Obergrenze des letzten Intervalls und der Untergrenze des ersten Intervalls berechnet.
Wenn der Bereich ein kleiner Wert ist, bedeutet dies, dass alle Daten ziemlich nahe beieinander liegen. Ein großer Bereich zeigt jedoch an, dass große Variabilität besteht. Es ist klar, dass der Bereich, abgesehen von der Obergrenze und der Untergrenze der Daten, die Werte zwischen ihnen nicht berücksichtigt. Daher wird nicht empfohlen, ihn zu verwenden, wenn die Anzahl der Daten groß ist.
Es ist jedoch eine sofortige Maßnahme zur Berechnung und hat die gleichen Einheiten der Daten, so dass es leicht zu interpretieren ist.
Nachfolgend finden Sie eine Liste mit der Anzahl der am Wochenende erzielten Tore in den Fußballligen von neun Ländern:
40, 32, 35, 36, 37, 31, 37, 29, 39
Dies ist ein nicht gruppierter Datensatz. Um den Bereich zu finden, ordnen wir sie vom niedrigsten zum höchsten:
29, 31, 32, 35, 36, 37, 37, 39, 40
Die Daten mit dem höchsten Wert sind 40 Ziele und die mit dem niedrigsten Wert sind 29 Ziele. Daher beträgt der Bereich:
R = 40-29 = 11 Tore.
Es kann davon ausgegangen werden, dass der Bereich im Vergleich zu den Mindestwertdaten, die 29 Ziele betragen, klein ist, sodass davon ausgegangen werden kann, dass die Daten keine große Variabilität aufweisen.
Dieses Maß für die Variabilität wird durch den Durchschnitt der absoluten Werte der Abweichungen in Bezug auf den Mittelwert berechnet.. Bezeichnung der mittleren Abweichung als D.M., Für nicht gruppierte Daten wird die mittlere Abweichung nach folgender Formel berechnet:
Wobei n die Anzahl der verfügbaren Daten ist, xich stellt alle Daten dar und x̄ ist der Durchschnitt, der durch Addieren aller Daten und Teilen durch n bestimmt wird:
Die mittlere Abweichung ermöglicht es, im Durchschnitt zu wissen, in wie vielen Einheiten die Daten vom arithmetischen Mittelwert abweichen, und hat den Vorteil, dass sie dieselben Einheiten haben wie die Daten, mit denen wir arbeiten.
Basierend auf den Daten aus dem Bereichsbeispiel beträgt die Anzahl der erzielten Tore:
40, 32, 35, 36, 37, 31, 37, 29, 39
Wenn Sie die mittlere Abweichung D ermitteln möchtenM. Aus diesen Daten muss zunächst das arithmetische Mittel x̄ berechnet werden:
Und jetzt, da der Wert von x̄ bekannt ist, finden wir die mittlere Abweichung D.M.::
= 2,99 ≈ 3 Tore
Daher kann festgestellt werden, dass die Daten im Durchschnitt ungefähr 3 Tore vom Durchschnitt entfernt sind, was 35 Zielen entspricht, und wie bereits erwähnt, ein viel genaueres Maß als der Bereich ist..
Die mittlere Abweichung ist ein viel feineres Maß für die Variabilität als der Bereich. Da sie jedoch anhand des Absolutwerts der Unterschiede zwischen den einzelnen Daten und dem Mittelwert berechnet wird, bietet sie aus algebraischer Sicht keine größere Vielseitigkeit..
Aus diesem Grund wird die Varianz bevorzugt, die dem Durchschnitt der quadratischen Differenz jeder Daten mit dem Mittelwert entspricht und nach folgender Formel berechnet wird:
In diesem Ausdruck szwei bezeichnet die Varianz und wie immer xich stellt jede der Daten dar, x̄ ist der Mittelwert und n sind die Gesamtdaten.
Wenn Sie mit einer Stichprobe anstelle der Grundgesamtheit arbeiten, wird die Varianz vorzugsweise wie folgt berechnet:
In jedem Fall ist die Varianz dadurch gekennzeichnet, dass sie immer eine positive Größe ist. Da es sich jedoch um den Durchschnitt der quadratischen Differenzen handelt, ist zu beachten, dass sie nicht die gleichen Einheiten wie die Daten hat..
Um die Varianz der Daten in den Beispielen für Bereich und mittlere Abweichung zu berechnen, setzen wir die entsprechenden Werte ein und führen die angegebene Summierung durch. In diesem Fall teilen wir durch n-1:
= 13,86
Die Varianz hat nicht die gleiche Einheit wie die der untersuchten Variablen. Wenn die Daten beispielsweise in Metern vorliegen, ergibt sich die Varianz in Quadratmetern. Oder im Beispiel für Ziele wäre es in quadratischen Toren, was keinen Sinn ergibt.
Daher wird die Standardabweichung definiert, auch genannt typische Abweichung, als Quadratwurzel der Varianz:
s = √szwei
Auf diese Weise wird ein Maß für die Variabilität der Daten in denselben Einheiten wie diese erhalten, und je niedriger der Wert von s ist, desto mehr gruppieren sich die Daten um den Mittelwert..
Sowohl die Varianz als auch die Standardabweichung sind die zu wählenden Variabilitätsmaße, wenn das arithmetische Mittel das Maß für die zentrale Tendenz ist, das das Verhalten der Daten am besten beschreibt..
Und es ist so, dass die Standardabweichung eine wichtige Eigenschaft hat, die als Chebyshev-Theorem bekannt ist: Mindestens 75% der Beobachtungen liegen in dem durch definierten Intervall x̄ ± 2s. Mit anderen Worten, 75% der Daten sind höchstens 2 Sekunden vom Mittelwert entfernt..
Ebenso befinden sich mindestens 89% der Werte in einem Abstand von 3 Sekunden vom Mittelwert, ein Prozentsatz, der erweitert werden kann, solange viele Daten verfügbar sind und sie einer Normalverteilung folgen..
Abbildung 2.- Wenn die Daten einer Normalverteilung folgen, liegen 95,4 von ihnen innerhalb von zwei Standardabweichungen auf beiden Seiten des Mittelwerts. Quelle: Wikimedia Commons.
Die Standardabweichung der in den vorherigen Beispielen dargestellten Daten beträgt:
s = √szwei = √13,86 = 3,7 ≈ 4 Tore
Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.