Kurtosis este o măsură statistică care determină gradul de concentrație pe care îl prezintă valorile unei variabile în jurul zonei centrale a distribuției de frecvență. Este, de asemenea, cunoscut sub numele de măsură de direcționare.
Când măsurăm o variabilă aleatorie, în general, rezultatele cu cea mai mare frecvență sunt cele din jurul mediei distribuției. Să ne imaginăm înălțimea elevilor dintr-o clasă. Dacă înălțimea medie a clasei este de 1,72 cm, cel mai normal lucru este că înălțimile restului elevilor se situează în jurul acestei valori (cu un anumit grad de variabilitate, dar fără a fi prea mari). Dacă se întâmplă acest lucru, distribuția variabilei aleatoare este considerată a fi distribuită în mod normal. Dar având în vedere infinitatea de variabile care pot fi măsurate, nu este întotdeauna cazul.
Există unele variabile care prezintă un grad mai mare de concentrație (dispersie mai mică) a valorilor în jurul valorii medii și altele, dimpotrivă, prezintă un grad mai mic de concentrare (dispersie mai mare) a valorilor lor în jurul valorii lor centrale. Prin urmare, kurtosis ne informează despre cât de ascuțită (concentrație mai mare) sau turtită (concentrație mai mică) este o distribuție.
Măsuri de tendință centralăFrecvența cumulativăTipuri de kurtosis
În funcție de gradul de kurtoză, avem trei tipuri de distribuții:
1. Leptokurtic: Există o mare concentrație de valori în jurul valorii medii (g2>3)
2. Mesocúrtic: Există o concentrație normală de valori în jurul valorii medii (g2=3).
3. Platicúrtica: Există o concentrație scăzută a valorilor în jurul valorii medii a acestora (g2<3).
Măsurători ale kurtozei conform datelor
În funcție de gruparea sau nu a datelor, se utilizează o formulă sau alta.
Date grupate:
Date grupate în tabele de frecvență:
Date grupate în intervale:
Exemplu de calcul al kurtozei pentru date negroupate
Să presupunem că dorim să calculăm curtoza următoarei distribuții:
8,5,9,10,12,7,2,6,8,9,10,7,7.
Mai întâi calculăm media aritmetică (µ), care ar fi 7,69.
Apoi, calculăm abaterea standard, care ar fi 2,43.
După ce aveți aceste date și pentru comoditate în calcul, se poate face un tabel pentru a calcula partea numărătorului (al patrulea moment al distribuției). Pentru primul calcul ar fi: (Xi-µ) 4 = (8-7,69) 4 = 0,009.
Date | (Xi-u) 4 |
---|---|
8 | 0,0090 |
5 | 52,5411 |
9 | 2,9243 |
10 | 28,3604 |
12 | 344,3330 |
7 | 0,2297 |
2 | 1049,9134 |
6 | 8,2020 |
8 | 0,0090 |
9 | 2,9243 |
10 | 28,3604 |
7 | 0,2297 |
7 | 0,2297 |
N = 13 | ∑ = 1.518,27 |
Odată ce am făcut acest tabel, ar trebui pur și simplu să aplicăm formula expusă anterior pentru a avea kurtosis.
g2 = 1.518,27/13*(2,43)^4 = 3,34
În acest caz, din moment ce g2 este mai mare de 3, distribuția ar fi leptokurtică, prezentând un punctaj mai mare decât distribuția normală.
Curtoza în exces
În unele manuale, kurtosis este prezentată ca exces de kurtosis. În acest caz, este direct comparat cu cel al distribuției normale. Deoarece distribuția normală are kurtosis 3, pentru a obține excesul, ar trebui să scădem doar 3 din rezultatul nostru.
Curtoză în exces = g2-3 = 3,34-3 = 0,34.
Interpretarea rezultatului în acest caz ar fi următoarea:
g2-3> 0 -> distribuție leptokurtică.
g2-3 = 0 -> distribuție mezocortică (sau normală).
g2-3 distribuție platicúrtică.
Statisticile descriptive