Das kategoriale Variable Es wird in der Statistik verwendet, um einem Objekt, einer Person, einer Entität, einer Bedingung oder einer Prozedur ein nicht numerisches oder qualitatives Merkmal oder eine Eigenschaft zuzuweisen. Es ist möglich, alle Arten von kategorialen Variablen je nach Bedarf zu definieren.
Beispiele für kategoriale Variablen sind: Farbe, Geschlecht, Blutgruppe, Familienstand, Art des Materials, Zahlungsweise oder Art des Bankkontos. Sie werden täglich häufig verwendet..
Die obigen sind die Variablen, aber ihre möglichen Werte sind qualitativ, dh von Qualität oder Charakteristik und nicht von einer numerischen Messung. Zum Beispiel die möglichen Werte für die Variable Sex Sie sind: männlich , humarmen.
Wenn diese Variable in einem Computerprogramm gespeichert ist, kann sie als Textvariable deklariert werden. Die einzigen akzeptierten Werte sind die bereits genannten: Männlich , Weiblich.
Allerdings die gleiche Variable Sex kann deklariert und als Ganzzahl gespeichert werden, wenn a Männlich zugewiesen ist 1 bereits Weiblich Der Wert wird zugewiesen zwei. Aus diesem Grund werden kategoriale Variablen manchmal als Aufzählungstyp bezeichnet.
Das Hauptmerkmal kategorialer Variablen ist, dass es im Gegensatz zu anderen Variablen wie stetig und diskret nicht möglich ist, mit ihnen zu rechnen. Sie können jedoch Statistiken mit ihnen erstellen, wie später noch zu sehen sein wird.
Artikelverzeichnis
Beachten Sie die folgenden Beispiele für kategoriale Variablen und ihre möglichen Werte:
-Blutgruppe, Wertebereich: A, B, AB, O.
-Zivilstand, Kategoriale Werte: Single (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).
-Art des Materials, Kategorien oder Werte: 1 = Holz, 2 = Metall, 3 = Kunststoff
-Weg zu bezahlen, Werte oder Kategorien: (1) Bargeld, (2) Lastschrift, (3) Überweisung, (4) Gutschrift
In den vorherigen Beispielen wurde jeder Kategorie auf völlig willkürliche Weise eine Nummer zugeordnet.
Man könnte dann denken, dass diese willkürliche numerische Assoziation es gleich a macht diskrete quantitative Variable, Dies ist jedoch nicht der Fall, da mit diesen Zahlen keine arithmetischen Operationen durchgeführt werden können.
Zur Veranschaulichung der Idee in der Variablen Weg zu bezahlen, Die Summenoperation macht keinen Sinn:
(1) Bargeld + (2) Lastschrift wird niemals gleich sein (3) Übertragung
Die Rangfolge basiert darauf, ob sie eine implizite Hierarchie haben oder ob die Anzahl der möglichen Ergebnisse mehr als zwei oder zwei beträgt.
Eine kategoriale Variable mit nur einem möglichen Ergebnis ist keine Variable, sondern eine kategoriale Konstante.
Wenn sie nicht durch eine Nummer dargestellt werden können oder eine Reihenfolge haben. Zum Beispiel die Variable: Materialtyp, that Nennwerte (Holz, Metall, Kunststoff) haben sie keine Hierarchie oder Reihenfolge, selbst wenn jeder Antwort oder Kategorie eine beliebige Nummer zugewiesen ist.
Variable: Akademischeleistung
Nennwerte: Hoch Mittel Niedrig
Obwohl die Werte dieser Variablen nicht numerisch sind, haben sie eine implizite Reihenfolge oder Hierarchie.
Dies sind nominelle Variablen mit zwei möglichen Antworten, zum Beispiel:
-Variable: Antworten
-Nennwerte: Wahr, Fälschung
Beachten Sie, dass die Variable Antworten Es hat keine implizite Hierarchie und nur zwei mögliche Ergebnisse, daher ist es eine binäre kategoriale Variable.
Einige Autoren nennen diesen Typ binäre Variable, und betrachte es nicht als zu dem gehörend kategorische Variablen die auf diejenigen mit mehr als drei möglichen Kategorien beschränkt sind.
Statistiken können mit kategorialen Variablen erstellt werden, obwohl es sich nicht um numerische oder quantitative Variablen handelt. Um beispielsweise den Trend oder den wahrscheinlichsten Wert einer kategorialen Variablen zu kennen, nehmen Sie Mode.
Mode In diesem Fall ist es das am häufigsten wiederholte Ergebnis oder der am häufigsten wiederholte Wert einer kategorialen Variablen. In kategorialen Variablen ist es nicht möglich, weder den Mittelwert noch den Median zu berechnen.
Der Mittelwert kann nicht berechnet werden, da mit kategorialen Variablen keine Arithmetik möglich ist. Der Median ist es auch nicht, da die quantitativen oder kategorialen Variablen keine Reihenfolge oder Hierarchie haben und es daher nicht möglich ist, einen zentralen Wert zu bestimmen..
Bei einer bestimmten kategorialen Variablen kann die Häufigkeit oder Häufigkeit ermittelt werden, mit der ein Ergebnis dieser Variablen wiederholt wird. Wenn dies für jedes Ergebnis durchgeführt wird, kann ein Diagramm der Häufigkeit für jede Kategorie oder jedes Ergebnis erstellt werden..
Hier einige Beispiele, wie kategoriale Variablen grafisch dargestellt werden können.
Ein Unternehmen verfügt über Aufzeichnungen der Daten von 170 Mitarbeitern. Eine der Variablen in diesen Registern ist: Zivilstand. Diese Variable hat vier Kategorien oder mögliche Werte:
Single (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).
Obwohl es sich um eine nicht numerische Variable handelt, ist es möglich zu wissen, wie viele der Gesamtdatensätze sich in einer bestimmten Kategorie befinden und in Form eines Balkendiagramms dargestellt werden, wie in der folgenden Abbildung dargestellt:
Ein Schuhgeschäft verfolgt seine Verkäufe. Zu den Variablen, die ihre Datensätze verwalten, gehört die Schuhfarbe für jedes Modell. Die Variable:
Color_Shoe_Model_AW3
Es ist kategorisch und hat fünf mögliche Kategorien oder Werte. Für jede Kategorie dieser Variablen wird die Anzahl der Verkäufe summiert und der Prozentsatz davon festgelegt. Die Ergebnisse sind in der Grafik der folgenden Abbildung dargestellt:
Man kann dann sagen, dass das AW3-Schuhmodell in ist Mode, derjenige, der am häufigsten verkauft wird, ist der Weiß, dicht gefolgt von Schwarz.
Es kann auch gesagt werden, dass mit einer Wahrscheinlichkeit von 70% der nächste verkaufte Schuh dieses Modells sein wird Weiß oder Schwarz.
Diese Informationen können für das Geschäft nützlich sein, wenn Sie neue Bestellungen aufgeben, oder sie können aufgrund von Überbeständen sogar Rabatte auf die am wenigsten verkauften Farben gewähren..
Für eine bestimmte Population von Blutspendern möchten Sie die Anzahl der Personen darstellen, die zu einer bestimmten Blutgruppe gehören. Eine grafische Darstellung der Ergebnisse erfolgt über ein Piktogramm, das im Hintergrund eine Tabelle darstellt.
Die erste Spalte repräsentiert die Variable Blutgruppe und seine möglichen Ergebnisse oder Kategorien. In der zweiten Spalte wird die Anzahl der Personen in jeder Kategorie in ikonischer oder bildlicher Form dargestellt. In unserem Beispiel wird ein rotes Tröpfchen als Symbol verwendet, von denen jedes 10 Personen darstellt.
Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.