Das nicht gruppierte Daten sind solche, die aus einer Studie stammen und noch nicht nach Klassen organisiert sind. Wenn es sich um eine überschaubare Anzahl von Daten handelt, normalerweise 20 oder weniger, und es nur wenige verschiedene Daten gibt, können diese als nicht gruppierte und wertvolle Informationen behandelt werden, die daraus extrahiert werden.
Die nicht gruppierten Daten stammen aus der Umfrage oder der Studie, die durchgeführt wurde, um sie zu erhalten, und sind daher nicht verarbeitet. Schauen wir uns einige Beispiele an:
-Ergebnisse eines IQ-Tests an 20 zufälligen Studenten einer Universität. Die erhaltenen Daten waren die folgenden:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
-Alter von 20 Mitarbeitern eines bestimmten beliebten Coffeeshops:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
-Der Durchschnitt der Abschlussnote von 10 Schülern in einem Mathematikunterricht:
3,2; 3,1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4.9
Artikelverzeichnis
Es gibt drei wichtige Eigenschaften, die einen Satz statistischer Daten charakterisieren, unabhängig davon, ob sie gruppiert sind oder nicht:
-Position, Dies ist die Tendenz der Daten, sich um bestimmte Werte zu gruppieren.
-Dispersion, ein Hinweis darauf, wie verstreut oder gestreut die Daten um einen bestimmten Wert liegen.
-Gestalten, Es bezieht sich auf die Art und Weise, in der die Daten verteilt werden, was geschätzt wird, wenn ein Graph derselben erstellt wird. Es gibt sehr symmetrische Kurven, die auch links oder rechts von einem bestimmten zentralen Wert verzerrt sind.
Für jede dieser Eigenschaften gibt es eine Reihe von Maßnahmen, die sie beschreiben. Einmal erhalten, geben sie uns einen Überblick über das Verhalten der Daten:
-Die am häufigsten verwendeten Positionsmaße sind das arithmetische Mittel oder einfach der Mittelwert, der Median und der Modus.
-Bereich, Varianz und Standardabweichung werden häufig bei der Dispersion verwendet, sind jedoch nicht die einzigen Dispersionsmaße..
-Und um die Form zu bestimmen, werden der Mittelwert und der Median durch Verzerrung verglichen, wie Sie in Kürze sehen werden.
-Das arithmetische Mittel, auch als Durchschnitt bekannt und als X bezeichnet, wird wie folgt berechnet:
X = (x1 + xzwei + x3 +… X.n) / n
Wo x1, xzwei,…. xn, sind die Daten und n ist die Summe von ihnen. In Summationsnotation haben wir:
-Median ist der Wert, der in der Mitte einer geordneten Datenfolge angezeigt wird. Um ihn zu erhalten, müssen Sie die Daten zunächst sortieren.
Wenn die Anzahl der Beobachtungen ungerade ist, ist es kein Problem, den Mittelpunkt der Menge zu finden. Wenn wir jedoch eine gerade Anzahl von Daten haben, werden die beiden zentralen Daten durchsucht und gemittelt.
-Mode ist der häufigste im Datensatz beobachtete Wert. Es existiert nicht immer, da es möglich ist, dass kein Wert häufiger wiederholt wird als ein anderer. Es könnte auch zwei Daten mit gleicher Häufigkeit geben. In diesem Fall sprechen wir von einer bimodalen Verteilung.
Im Gegensatz zu den beiden vorherigen Maßnahmen kann der Modus mit qualitativen Daten verwendet werden.
Lassen Sie uns anhand eines Beispiels sehen, wie diese Positionsmaße berechnet werden:
Angenommen, wir möchten das arithmetische Mittel, den Median und den Modus in dem zu Beginn vorgeschlagenen Beispiel bestimmen: das Alter von 20 Mitarbeitern einer Cafeteria:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
Das Hälfte Sie wird einfach berechnet, indem alle Werte addiert und durch n = 20 dividiert werden. Dies ist die Gesamtzahl der Daten. Auf diese Weise:
X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =
= 22,3 Jahre.
Um das zu finden Median Sie müssen zuerst den Datensatz sortieren:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Da es sich um eine gerade Anzahl von Daten handelt, werden die beiden fett hervorgehobenen zentralen Daten erfasst und gemittelt. Da beide 22 Jahre alt sind, beträgt der Median 22 Jahre.
Endlich, das Mode Es sind die Daten, die am häufigsten wiederholt werden oder deren Häufigkeit größer ist, dh 22 Jahre.
Der Bereich ist einfach der Unterschied zwischen dem größten und dem kleinsten der Daten und ermöglicht es Ihnen, die Variabilität der Daten schnell einzuschätzen. Abgesehen davon gibt es andere Streuungsmaße, die mehr Informationen über die Verteilung der Daten bieten..
Die Varianz wird als s bezeichnet und durch den Ausdruck berechnet:
Um die Ergebnisse richtig zu interpretieren, wird die Standardabweichung als Quadratwurzel der Varianz oder auch als Quasi-Standardabweichung definiert, die die Quadratwurzel der Quasi-Varianz ist:
Es ist der Vergleich zwischen dem Mittelwert X und dem Median Med:
-Wenn Med = Mittelwert X: Die Daten sind symmetrisch.
-Wenn X> Med: nach rechts neigen.
-Und wenn X. < Med: los datos sesgan hacia la izquierda.
Finden Sie Mittelwert, Median, Modus, Bereich, Varianz, Standardabweichung und Verzerrung für die Ergebnisse eines IQ-Tests, der an 20 Studenten einer Universität durchgeführt wurde:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
Wir werden die Daten bestellen, da der Median ermittelt werden muss.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124
Und wir werden sie wie folgt in eine Tabelle einfügen, um die Berechnungen zu erleichtern. Die zweite Spalte mit dem Titel "Akkumuliert" ist die Summe der entsprechenden Daten plus der vorherigen..
Diese Spalte hilft dabei, den Mittelwert leicht zu finden, indem der zuletzt akkumulierte durch die Gesamtzahl der Daten dividiert wird, wie am Ende der Spalte "Akkumuliert" zu sehen ist:
X = 112,9
Der Median ist der Durchschnitt der rot hervorgehobenen zentralen Daten: die Zahl 10 und die Zahl 11. Da sie gleich sind, beträgt der Median 112.
Schließlich ist der Modus der Wert, der am häufigsten wiederholt wird und 112 mit 7 Wiederholungen ist..
In Bezug auf die Dispersionsmaße beträgt der Bereich:
124-106 = 18.
Die Varianz wird erhalten, indem das Endergebnis in der rechten Spalte durch n geteilt wird:
s = 668,6 / 20 = 33,42
In diesem Fall ist die Standardabweichung die Quadratwurzel der Varianz: √33,42 = 5,8.
Andererseits sind die Werte der Quasi-Varianz und der Quasi-Standardabweichung:
sc= 668,6 / 19 = 35,2
Quasi-Standardabweichung = √35,2 = 5,9
Schließlich ist die Abweichung leicht nach rechts gerichtet, da der Mittelwert 112,9 größer als der Median 112 ist.
Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.