Coeficient de variație - Ce este, definiție și semnificație

Cuprins:

Coeficient de variație - Ce este, definiție și semnificație
Coeficient de variație - Ce este, definiție și semnificație
Anonim

Coeficientul de variație, cunoscut și sub numele de coeficientul de variație al lui Pearson, este o măsură statistică care ne informează despre dispersia relativă a unui set de date.

Adică ne informează, ca și alte măsuri de dispersie, dacă o variabilă se mișcă mult, puțin, mai mult sau mai puțin decât alta.

Formula coeficientului de variație

Calculul său se obține împărțind abaterea standard la valoarea absolută a mediei setului și este de obicei exprimat ca procent pentru o mai bună înțelegere.

  • X: variabilă pe care trebuie calculată varianța
  • σX: Abaterea standard a variabilei X.
  • | x̄ |: Este media variabilei X în valoare absolută cu x̄ ≠ 0

Coeficientul de variație poate fi văzut exprimat cu literele CV sau r, în funcție de manual sau de fontul utilizat. Formula sa este următoarea:

Coeficientul de variație este utilizat pentru a compara seturile de date aparținând diferitelor populații. Dacă ne uităm la formula sa, vedem că ține cont de valoarea mediei. Prin urmare, coeficientul de variație ne permite să avem o măsură de dispersie care elimină posibilele distorsiuni ale mijloacelor a două sau mai multe populații.

Rang

Exemple de utilizare a coeficientului de variație în locul abaterii standard

Iată câteva exemple ale acestei măsuri de dispersie:

Compararea seturilor de date de diferite dimensiuni

Vrem să cumpărăm dispersia între înălțimea a 50 de elevi dintr-o clasă și greutatea lor. Pentru a compara înălțimea, am putea folosi metri și centimetri ca unitate de măsură și kilogramul pentru greutate. Compararea acestor două distribuții folosind abaterea standard nu ar avea sens, deoarece încercăm să măsurăm două variabile calitative diferite (o măsură a lungimii și una a masei).

Comparați seturi cu diferență mare între medii

Imaginați-vă, de exemplu, că vrem să măsurăm greutatea gândacilor și a hipopotamilor. Greutatea gândacilor este măsurată în grame sau miligrame, iar greutatea hipopotamilor este de obicei măsurată în tone. Dacă pentru măsurarea noastră convertim greutatea gândacilor în tone, astfel încât ambele populații să fie pe aceeași scară, utilizarea abaterii standard ca măsură a dispersiei nu ar fi adecvată. Greutatea medie a gândacului măsurată în tone ar fi atât de mică încât, dacă am folosi abaterea standard, nu ar exista cu greu dispersie în date. Aceasta ar fi o greșeală, deoarece greutatea între diferite specii de gândaci poate varia considerabil.

Exemplu de calcul al coeficientului de variație

Luați în considerare o populație de elefanți și o altă populație de șoareci. Populația de elefanți are o greutate medie de 5.000 de kilograme și o abatere standard de 400 de kilograme. Populația șoarecilor are o greutate medie de 15 grame și o abatere standard de 5 grame. Dacă comparăm dispersia ambelor populații folosind abaterea standard, ne-am putea gândi că există o dispersie mai mare pentru populația de elefanți decât pentru cea a șoarecilor.

Cu toate acestea, atunci când calculăm coeficientul de variație pentru ambele populații, ne-am da seama că este exact opusul.

Elefanți: 400/5000 = 0,08
Șoareci: 5/15 = 0,33

Dacă înmulțim ambele date cu 100, avem că coeficientul de variație pentru elefanți este de numai 8%, în timp ce cel al șoarecilor este de 33%. Ca o consecință a diferenței dintre populații și greutatea medie a acestora, vedem că populația cu cea mai mare dispersie nu este cea cu cea mai mare abatere standard.

Interval de încredereCoeficient de corelație liniară