Kategoriale Variablenmerkmale und Beispiele

1866
Robert Johnston
Kategoriale Variablenmerkmale und Beispiele

Das kategoriale Variable Es wird in der Statistik verwendet, um einem Objekt, einer Person, einer Entität, einer Bedingung oder einer Prozedur ein nicht numerisches oder qualitatives Merkmal oder eine Eigenschaft zuzuweisen. Es ist möglich, alle Arten von kategorialen Variablen je nach Bedarf zu definieren. 

Beispiele für kategoriale Variablen sind: Farbe, Geschlecht, Blutgruppe, Familienstand, Art des Materials, Zahlungsweise oder Art des Bankkontos. Sie werden täglich häufig verwendet..

Abbildung 1: Farbe ist eine kategoriale Variable. Quelle: pixabay

Die obigen sind die Variablen, aber ihre möglichen Werte sind qualitativ, dh von Qualität oder Charakteristik und nicht von einer numerischen Messung. Zum Beispiel die möglichen Werte für die Variable Sex Sie sind: männlich , humarmen.

Wenn diese Variable in einem Computerprogramm gespeichert ist, kann sie als Textvariable deklariert werden. Die einzigen akzeptierten Werte sind die bereits genannten: Männlich , Weiblich.

Allerdings die gleiche Variable Sex kann deklariert und als Ganzzahl gespeichert werden, wenn a Männlich zugewiesen ist 1 bereits Weiblich Der Wert wird zugewiesen zwei. Aus diesem Grund werden kategoriale Variablen manchmal als Aufzählungstyp bezeichnet.

Das Hauptmerkmal kategorialer Variablen ist, dass es im Gegensatz zu anderen Variablen wie stetig und diskret nicht möglich ist, mit ihnen zu rechnen. Sie können jedoch Statistiken mit ihnen erstellen, wie später noch zu sehen sein wird.

Artikelverzeichnis

  • 1 Beispiele
  • 2 Klassifizierung kategorialer Variablen
    • 2.1 Nominalkategorien 
    • 2.2 Ordnungskategorien
    • 2.3 Binäre Kategorien
  • 3 Statistiken mit kategorialen Variablen
    • 3.1 Grafische Darstellung kategorialer Variablen
  • 4 Gelöste Übungen
    • 4.1 Übung 1
    • 4.2 Beispiel 2
    • 4.3 Beispiel 3
  • 5 Referenzen

Beispiele

Beachten Sie die folgenden Beispiele für kategoriale Variablen und ihre möglichen Werte:

-Blutgruppe, Wertebereich: A, B, AB, O.

-Zivilstand, Kategoriale Werte: Single (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).

-Art des Materials, Kategorien oder Werte: 1 = Holz, 2 = Metall, 3 = Kunststoff

-Weg zu bezahlen, Werte oder Kategorien: (1) Bargeld, (2) Lastschrift, (3) Überweisung, (4) Gutschrift

In den vorherigen Beispielen wurde jeder Kategorie auf völlig willkürliche Weise eine Nummer zugeordnet. 

Man könnte dann denken, dass diese willkürliche numerische Assoziation es gleich a macht diskrete quantitative Variable, Dies ist jedoch nicht der Fall, da mit diesen Zahlen keine arithmetischen Operationen durchgeführt werden können.

Zur Veranschaulichung der Idee in der Variablen Weg zu bezahlen, Die Summenoperation macht keinen Sinn:

 (1) Bargeld + (2) Lastschrift wird niemals gleich sein (3) Übertragung

Klassifizierung kategorialer Variablen

Die Rangfolge basiert darauf, ob sie eine implizite Hierarchie haben oder ob die Anzahl der möglichen Ergebnisse mehr als zwei oder zwei beträgt.

Eine kategoriale Variable mit nur einem möglichen Ergebnis ist keine Variable, sondern eine kategoriale Konstante.

Nominale Kategorien 

Wenn sie nicht durch eine Nummer dargestellt werden können oder eine Reihenfolge haben. Zum Beispiel die Variable: Materialtyp, that Nennwerte (Holz, Metall, Kunststoff) haben sie keine Hierarchie oder Reihenfolge, selbst wenn jeder Antwort oder Kategorie eine beliebige Nummer zugewiesen ist.

Ordnungszahl kategorisch

Variable: Akademischeleistung

Nennwerte: Hoch Mittel Niedrig

Obwohl die Werte dieser Variablen nicht numerisch sind, haben sie eine implizite Reihenfolge oder Hierarchie.

Binäre Kategorien

Dies sind nominelle Variablen mit zwei möglichen Antworten, zum Beispiel:

-Variable: Antworten

-Nennwerte: Wahr, Fälschung

Beachten Sie, dass die Variable Antworten Es hat keine implizite Hierarchie und nur zwei mögliche Ergebnisse, daher ist es eine binäre kategoriale Variable.

Einige Autoren nennen diesen Typ binäre Variable, und betrachte es nicht als zu dem gehörend kategorische Variablen die auf diejenigen mit mehr als drei möglichen Kategorien beschränkt sind.

Statistiken mit kategorialen Variablen

Statistiken können mit kategorialen Variablen erstellt werden, obwohl es sich nicht um numerische oder quantitative Variablen handelt. Um beispielsweise den Trend oder den wahrscheinlichsten Wert einer kategorialen Variablen zu kennen, nehmen Sie Mode.

Mode In diesem Fall ist es das am häufigsten wiederholte Ergebnis oder der am häufigsten wiederholte Wert einer kategorialen Variablen. In kategorialen Variablen ist es nicht möglich, weder den Mittelwert noch den Median zu berechnen.

Der Mittelwert kann nicht berechnet werden, da mit kategorialen Variablen keine Arithmetik möglich ist. Der Median ist es auch nicht, da die quantitativen oder kategorialen Variablen keine Reihenfolge oder Hierarchie haben und es daher nicht möglich ist, einen zentralen Wert zu bestimmen..

Grafische Darstellung kategorialer Variablen

Bei einer bestimmten kategorialen Variablen kann die Häufigkeit oder Häufigkeit ermittelt werden, mit der ein Ergebnis dieser Variablen wiederholt wird. Wenn dies für jedes Ergebnis durchgeführt wird, kann ein Diagramm der Häufigkeit für jede Kategorie oder jedes Ergebnis erstellt werden..

Hier einige Beispiele, wie kategoriale Variablen grafisch dargestellt werden können.

Gelöste Übungen

Übung 1

Ein Unternehmen verfügt über Aufzeichnungen der Daten von 170 Mitarbeitern. Eine der Variablen in diesen Registern ist: Zivilstand. Diese Variable hat vier Kategorien oder mögliche Werte:

Single (ZU), Verheiratet (B), Witwer (C) , Geschieden (D).

Obwohl es sich um eine nicht numerische Variable handelt, ist es möglich zu wissen, wie viele der Gesamtdatensätze sich in einer bestimmten Kategorie befinden und in Form eines Balkendiagramms dargestellt werden, wie in der folgenden Abbildung dargestellt:

Abbildung 2. Darstellung der Ergebnisse einer kategorialen Variablen. Quelle: selbst gemacht

Beispiel 2

Ein Schuhgeschäft verfolgt seine Verkäufe. Zu den Variablen, die ihre Datensätze verwalten, gehört die Schuhfarbe für jedes Modell. Die Variable: 

Color_Shoe_Model_AW3

Es ist kategorisch und hat fünf mögliche Kategorien oder Werte. Für jede Kategorie dieser Variablen wird die Anzahl der Verkäufe summiert und der Prozentsatz davon festgelegt. Die Ergebnisse sind in der Grafik der folgenden Abbildung dargestellt:

Abbildung 3. Kategoriale Variable Farbe _Schuh. In dieser Variablen ist der Modus Weiß. Quelle: selbst gemacht.

Man kann dann sagen, dass das AW3-Schuhmodell in ist Mode, derjenige, der am häufigsten verkauft wird, ist der Weiß, dicht gefolgt von Schwarz

Es kann auch gesagt werden, dass mit einer Wahrscheinlichkeit von 70% der nächste verkaufte Schuh dieses Modells sein wird Weiß oder Schwarz.

Diese Informationen können für das Geschäft nützlich sein, wenn Sie neue Bestellungen aufgeben, oder sie können aufgrund von Überbeständen sogar Rabatte auf die am wenigsten verkauften Farben gewähren..

Beispiel 3

Für eine bestimmte Population von Blutspendern möchten Sie die Anzahl der Personen darstellen, die zu einer bestimmten Blutgruppe gehören. Eine grafische Darstellung der Ergebnisse erfolgt über ein Piktogramm, das im Hintergrund eine Tabelle darstellt.

Die erste Spalte repräsentiert die Variable Blutgruppe und seine möglichen Ergebnisse oder Kategorien. In der zweiten Spalte wird die Anzahl der Personen in jeder Kategorie in ikonischer oder bildlicher Form dargestellt. In unserem Beispiel wird ein rotes Tröpfchen als Symbol verwendet, von denen jedes 10 Personen darstellt.

Abbildung 4. Piktogramm. Quelle: selbst gemacht

Verweise

  1. Khan Akademie. Analyse kategorialer Daten. Wiederhergestellt von: khanacademy.org
  2. Universumsformeln. Qualitative Variable. Wiederhergestellt von: univesoformulas.com
  3. Minitab. Welches sind kategoriale, diskrete und kontinuierliche Variablen. Wiederhergestellt von: support.minitab.com
  4. Excel-Tutorial. Charakterisierung von Variablen. Wiederhergestellt von: help.xlslat.com.
  5. Wikipedia. Statistische Variable. Von wikipedia.com wiederhergestellt
  6. Wikipedia. Kategoriale Variable. Von wikipedia.com wiederhergestellt
  7. Wikipedia. Kategoriale Variable. Von wikipedia.com wiederhergestellt

Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.