Freiheitsgrade, wie man sie berechnet, Typen, Beispiele

4602
Philip Kelley

Das Freiheitsgrade In der Statistik sind sie die Anzahl unabhängiger Komponenten eines Zufallsvektors. Wenn der Vektor hat n Komponenten und es gibt p lineare Gleichungen, die ihre Komponenten in Beziehung setzen, dann die Freiheitsgrad ist n-p.

Das Konzept von Freiheitsgrade Es erscheint auch in der theoretischen Mechanik, wo sie ungefähr der Raumdimension entsprechen, in der sich das Teilchen bewegt, abzüglich der Anzahl der Bindungen..

Abbildung 1. Ein Pendel bewegt sich in zwei Dimensionen, hat jedoch nur einen Freiheitsgrad, da es gezwungen ist, sich in einem Bogen mit dem Radius L zu bewegen. Quelle: F. Zapata.

In diesem Artikel wird das Konzept der Freiheitsgrade für Statistiken erörtert. Ein mechanisches Beispiel ist jedoch in geometrischer Form leichter zu visualisieren.

Artikelverzeichnis

  • 1 Arten von Freiheitsgraden
    • 1.1 In einem mechanischen Fall
    • 1.2 In einer Reihe von Zufallswerten
  • 2 Beispiele
    • 2.1 Varianz und Freiheitsgrade
    • 2.2 In der Chi-Quadrat-Verteilung
    • 2.3 Beim Testen von Hypothesen (mit ausgearbeitetem Beispiel)
  • 3 Referenzen

Arten von Freiheitsgraden

Abhängig vom Kontext, in dem es angewendet wird, kann die Art und Weise der Berechnung der Anzahl der Freiheitsgrade variieren, aber die zugrunde liegende Idee ist immer dieselbe: Gesamtdimensionen minus Anzahl der Einschränkungen.

In einem mechanischen Fall

Betrachten wir ein oszillierendes Teilchen, das an eine Schnur (ein Pendel) gebunden ist, die sich in der vertikalen x-y-Ebene (2 Dimensionen) bewegt. Das Teilchen ist jedoch gezwungen, sich auf dem Umfang des Radius zu bewegen, der der Länge der Sehne entspricht.

Da sich das Teilchen nur auf dieser Kurve bewegen kann, ist die Anzahl der Freiheitsgrade ist 1. Dies ist in Abbildung 1 zu sehen.

Die Anzahl der Freiheitsgrade wird berechnet, indem die Differenz aus der Anzahl der Dimensionen abzüglich der Anzahl der Einschränkungen genommen wird:

Freiheitsgrade: = 2 (Dimensionen) - 1 (Ligatur) = 1

Eine weitere Erklärung, die es uns ermöglicht, zum Ergebnis zu gelangen, ist die folgende:

-Wir wissen, dass die Position in zwei Dimensionen durch einen Koordinatenpunkt (x, y) dargestellt wird..

-Da aber der Punkt die Gleichung des Umfangs erfüllen muss (xzwei + Y.zwei = L.zwei) Für einen gegebenen Wert der Variablen x wird die Variable y durch die Gleichung oder Einschränkung bestimmt.

Somit ist nur eine der Variablen unabhängig und das System hat ein (1) Freiheitsgrad.

In einer Reihe von Zufallswerten

Um zu veranschaulichen, was das Konzept bedeutet, nehmen wir den Vektor an

x = (x1, xzwei,..., xn)

Was repräsentiert die Stichprobe von n normalverteilte Zufallswerte. In diesem Fall der Zufallsvektor x haben n unabhängige Komponenten und daher wird gesagt, dass x haben n Freiheitsgrade.

Nun bauen wir den Vektor r von Verschwendung

r = (x1 - , xzwei - ,…., X.n - )

Wo stellt den Stichprobenmittelwert dar, der wie folgt berechnet wird:

= (x1 + xzwei +…. + X.n) / n

Also die Summe

(x1 - ) + (xzwei - ) +…. + (X.n - ) = (x1 + xzwei +…. + X.n) - n= 0

Es ist eine Gleichung, die eine Einschränkung (oder Bindung) für die Elemente des Vektors darstellt r der Reste, da wenn n-1 Komponenten des Vektors bekannt sind r, Die Beschränkungsgleichung bestimmt die unbekannte Komponente.

Daher der Vektor r der Dimension n mit der Einschränkung:

∑ (xich - ) = 0

Haben (n - 1) Freiheitsgrade.

Wiederum wird angewendet, dass die Berechnung der Anzahl der Freiheitsgrade ist:

Freiheitsgrade: = n (Dimensionen) - 1 (Einschränkungen) = n-1

Beispiele

Varianz und Freiheitsgrade

Die Varianz szwei ist definiert als der Mittelwert des Quadrats der Abweichungen (oder Residuen) der Stichprobe von n Daten:

szwei = (r• •r) / (n-1)

wo r ist der Vektor der Residuen r = (x1 - , x2 - ,…., Xn - ) und die dicke Spitze (• •) ist der skalare Produktoperator. Alternativ kann die Varianzformel wie folgt geschrieben werden:

szwei = ∑ (xich - )zwei / (n-1)

In jedem Fall sollte beachtet werden, dass bei der Berechnung des Mittelwerts des Quadrats der Residuen dieser durch (n-1) und nicht durch n geteilt wird, da, wie im vorherigen Abschnitt erläutert, die Anzahl der Freiheitsgrade der Vektor r ist (n-1).

Wenn für die Berechnung der Varianz geteilt wurde durch n anstelle von (n-1) hätte das Ergebnis eine Verzerrung, die für Werte von sehr signifikant ist n unter 50.

In der Literatur erscheint die Varianzformel auch mit dem Divisor n anstelle von (n-1), wenn es um die Varianz einer Population geht.

Aber die Menge der Zufallsvariablen der Residuen, dargestellt durch den Vektor r, Obwohl es die Dimension n hat, hat es nur (n-1) Freiheitsgrade. Wenn jedoch die Anzahl der Daten groß genug ist (n> 500), konvergieren beide Formeln zum gleichen Ergebnis.

Taschenrechner und Tabellen liefern sowohl Versionen der Varianz als auch die Standardabweichung (die Quadratwurzel der Varianz)..

In Anbetracht der hier vorgestellten Analyse empfehlen wir, immer die Version mit (n-1) zu wählen, wenn die Varianz oder Standardabweichung berechnet werden muss, um verzerrte Ergebnisse zu vermeiden..

In der Chi-Quadrat-Verteilung

Einige Wahrscheinlichkeitsverteilungen in kontinuierlichen Zufallsvariablen hängen von einem aufgerufenen Parameter ab Freiheitsgrad, ist der Fall der Chi-Quadrat-Verteilung (χzwei).

Der Name dieses Parameters ergibt sich genau aus den Freiheitsgraden des zugrunde liegenden Zufallsvektors, für den diese Verteilung gilt.

Angenommen, wir haben g Populationen, aus denen Proben der Größe n entnommen werden:

X.1 = (x11, x1zwei,… X1n)

X2 = (x21, x2zwei,… X2n)

... .

X.j = (xj1, xjzwei,… Xjn)

... .

Xg = (xg1, xgzwei,… Xgn)

Eine Bevölkerung j was hat durchschnittlich und Standardabweichung Sj, folgt der Normalverteilung N (, Sj ).

Die standardisierte oder normalisierte Variable zjich ist definiert als:

zjich = (xjich - ) / Sj.

Und der Vektor Zj ist wie folgt definiert:

Zj = (zj1, zjzwei,..., zjich,..., zjn) und folgt der standardisierten Normalverteilung N (0,1).

Also die Variable:

Q. = ((z1^ 2 + z21^ 2 +…. + zg1^ 2),…., (Z1n^ 2 + z2n^ 2 +…. + zgn^ 2))

Folgen Sie der Verteilung χzwei(g) genannt die Chi-Quadrat-Verteilung mit Freiheitsgrad G.

Im Hypothesentest (Mit Beispiel ausgearbeitet)

Wenn Sie Hypothesen basierend auf einem bestimmten Satz zufälliger Daten testen möchten, müssen Sie die kennen Anzahl der Freiheitsgrade g um den Chi-Quadrat-Test anwenden zu können.

Abbildung 2. Gibt es einen Zusammenhang zwischen der Präferenz von Eiscreme FLAVOUR und dem GENDER des Kunden? Quelle: F. Zapata.

Als Beispiel werden die Daten analysiert, die zu den Vorlieben von Schokolade oder Erdbeereis bei Männern und Frauen in einer bestimmten Eisdiele erhoben wurden. Die Häufigkeit, mit der Männer und Frauen Erdbeere oder Schokolade wählen, ist in Abbildung 2 zusammengefasst.

Zunächst wird die Tabelle der erwarteten Frequenzen berechnet, die durch Multiplikation der erstellt wird Gesamtanzahl der Zeilen für ihn Gesamtspalten, geteilt durch Gesamtdaten. Das Ergebnis ist in der folgenden Abbildung dargestellt:

Abbildung 3. Berechnung der erwarteten Frequenzen basierend auf den beobachteten Frequenzen (Werte in blau in Abbildung 2). Quelle: F. Zapata.

Dann berechnen wir das Chi-Quadrat (aus den Daten) mit der folgenden Formel:

χzwei = ∑ (F.oder - F.und)zwei / F.und

Wo F.oder sind die beobachteten Frequenzen (Abbildung 2) und F.und sind die erwarteten Frequenzen (Abbildung 3). Die Summierung geht über alle Zeilen und Spalten, die in unserem Beispiel vier Begriffe ergeben.

Nach den Operationen erhalten Sie:

χzwei = 0,2043.

Nun ist es notwendig, mit dem theoretischen Chi-Quadrat zu vergleichen, das von der abhängt Anzahl der Freiheitsgrade g.

In unserem Fall wird diese Anzahl wie folgt bestimmt:

g = (# Zeilen - 1) (# Spalten - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Es stellt sich heraus, dass die Anzahl der Freiheitsgrade g in diesem Beispiel 1 ist.

Wenn Sie die Nullhypothese (H0: es besteht keine Korrelation zwischen GESCHMACK und GESCHLECHT) mit einem Signifikanzniveau von 1% überprüfen oder ablehnen möchten, wird der theoretische Chi-Quadrat-Wert mit dem Freiheitsgrad g = 1 berechnet.

Es wird der Wert gesucht, der die akkumulierte Frequenz (1 - 0,01) = 0,99, dh 99% macht. Dieser Wert (der aus den Tabellen entnommen werden kann) beträgt 6,636.

Wenn das theoretische Chi das berechnete überschreitet, wird die Nullhypothese verifiziert.

Das heißt, mit den gesammelten Daten, Nicht beobachtet Beziehung zwischen den Variablen TASTE und GENDER.

Verweise

  1. Minitab. Was sind die Freiheitsgrade? Wiederhergestellt von: support.minitab.com.
  2. Moore, David. (2009) Grundlegende angewandte Statistik. Antoni Bosch Herausgeber.
  3. Leigh, Jennifer. Berechnung von Freiheitsgraden in statistischen Modellen. Wiederhergestellt von: geniolandia.com
  4. Wikipedia. Freiheitsgrad (Statistik). Wiederhergestellt von: es.wikipedia.com
  5. Wikipedia. Freiheitsgrad (physisch). Wiederhergestellt von: es.wikipedia.com

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.