Abaterea quartilei - Ce este, definiție și concept

Cuprins:

Abaterea quartilei - Ce este, definiție și concept
Abaterea quartilei - Ce este, definiție și concept
Anonim

Abaterea quartilei este o măsură statistică a dispersiei care returnează valoarea centrală a intervalului intercuartil și este utilizată în seturi de date înclinate.

Cu alte cuvinte, deviația quartilei este de a calcula mediana intervalului interquartilei (IQR) și este utilizată în seturi de date cu destul de multe valori extreme.

Stenograma pentru deviația quartilei este DQ.

Gama interquartile

Gama intercuartilă este o măsură a dispersiei unui set de date utilizat în general în graficul cutiei. Cu alte cuvinte, intervalul interquartilei este diferența dintre penultimul și primele quartile ale unei distribuții utilizate în graficul cutiei.

IQR = Q3 - Q1

Avantajul utilizării intervalului interquartilei este că abaterea quartilei (DQ) poate fi calculată, ceea ce reprezintă o măsură foarte adecvată a dispersiei atunci când avem seturi de date părtinitoare.

Formula abaterii cuartile

Abaterea quartilei este calculată ca împărțirea intervalului intercuartil cu 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Deoarece luăm în considerare doar dispersia între al treilea și primul quartile, ignorăm toate datele în afara acelei zone. Și, prin urmare, toate valorile aproape de a fi extreme. Deci, dacă împărțim intervalul intercuartil la două, vom obține valoarea mediană a dispersiei.

Exemplu de deviație quartile

Presupunem că vrem să calculăm intervalul intercuartil și abaterea cuartilă a numărului de bicicliști care trec pe lângă noi pe parcursul anului.

  1. În primul rând, numărăm bicicliștii și colectăm informațiile într-un tabel.
  1. În al doilea rând, calculăm primul și al treilea quartile pentru a obține intervalul interquartile.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. În al treilea rând, calculăm dispersia quartilei prin simpla împărțire a intervalului interquartilei la două.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Distribuirea cuartilelor pentru acest set de date este de 175. Acest număr este valoarea centrală a intervalului intercuartil.

Este important să rețineți că datele din luna iulie sunt date extreme, deoarece sunt de câteva ori mai mari decât toate celelalte date. Deci, am putea spune că acest set de date este orientat spre luna respectivă. Datorită „ignoranței” dispersiei cuartile către date extreme, rezultatul acestei măsuri este foarte asemănător cu faptul că în luna iulie circulau doar 600 de bicicliști. Dacă ar exista doar 600 de bicicliști în iulie, dispersia cuartilelor ar fi de 162,5, foarte aproape de 175, având în vedere că numărul de bicicliști din luna respectivă este de 10 ori mai mic.