O variabilă categorică este una care permite clasificarea unei serii de date prin intermediul valorilor fixe asociate cu o anumită calitate sau categorie.
Variabila categorică, spre deosebire de variabilele cardinale sau continue (care permit calcule numerice), clasifică indivizii sau cazurile. În mod normal, iau valori reprezentate prin numere întregi, cum ar fi unul sau zero, dar acestea sunt doar reprezentări.
În exemplu îl vom vedea mai detaliat.
Diferențe între variabila categorică și continuă
Există unele diferențe între variabila categorică și variabila continuă sau cardinală care ar trebui cunoscute. Să vedem cele mai relevante.
- În primul rând, variabila categorică este utilizată pentru grupare și variabila continuă pentru numărare. Cu alte cuvinte, primul permite formarea categoriilor cu o serie de date. De exemplu, sexul sau numărul copiilor. Al doilea ne oferă informații numerice. De exemplu, vârsta.
- Variabila cardinală permite calcule numerice, celelalte nu. În acest fel, în primele putem cunoaște mijloacele sau variațiile, în timp ce în celelalte doar unele date, cum ar fi modul sau procentul de categorii.
- Cele categorice sunt foarte utile pentru a cunoaște informații calitative, adică o anumită calitate a datelor. Cele continue ne oferă date cantitative, adică cantități și valori reprezentate prin numere.
Tehnici statistice pentru variabilele categorice
În continuare, să vedem tehnicile statistice cele mai utilizate în variabilele categorice, comparându-le cu cele ale variabilelor continue sau cardinale.
- Statisticile descriptive: În acest tip de variabile, analizele se bazează, de obicei, pe diagrame cu bare și procente, printre altele. Cardinalii permit aplicarea tehnicilor de analiză pentru a calcula statisticile de poziție, cum ar fi cuantile, sau statisticile de dispersie, cum ar fi variațiile.
- Contrast de ipoteză: În categorie, rezultatele pot fi extrapolate prin teste de ipoteză non-parametrice. Pe de altă parte, cele continue folosesc contraste parametrice care pot fi de asemenea deduse.
- Tehnici de regresie: În acest caz, pentru prima, se utilizează regresia logistică sau similară, printre altele. Pentru celălalt tip de variabile, cea mai utilizată tehnică este regresia liniară.
Exemplu de variabilă categorică
Pentru a termina, să ne uităm la un exemplu foarte comun în marketing. Să ne imaginăm că vrem să vindem un produs și suntem interesați să cunoaștem starea civilă.
Pentru a face acest lucru, vom atribui 1 la celibatar, 2 la căsătorit, 3 la divorț, 4 la partener și 5 la alții.
Să vedem imaginea și apoi să o comentăm:
În acesta, putem vedea că cel mai mare procent de persoane este singur, căsătorit și divorțat, celelalte două opțiuni fiind doar de 5%.
După cum putem vedea, variabilele categorice sunt utile pentru grupare. Diagrama cu bare ne permite să observăm mai bine aceste procente, deoarece este mai ușor să comparăm dimensiunea barelor.