Box Plot - Ce este, definiție și concept

Cuprins:

Anonim

Un boxplot, din engleză, boxplot, este o reprezentare a unei variabile cantitative sau categorice în scopul identificării rapide a quartilelor setului de date.

Cu alte cuvinte, o diagramă box este un grafic care reprezintă o variabilă cantitativă sau calitativă prin intermediul quartilelor.

În statistici, este un instrument util pentru reprezentarea seturilor de date discrete și continue.

Este important să rețineți că variabilele calitative variabile sau care sunt destinate să reprezinte o ordine sau o categorie trebuie întotdeauna legate de un indice numeric mai mare de 0, astfel încât acestea să poată apărea pe grafic și să poată fi calculate statisticile corespunzătoare.

Graficul cutiei și histograma

Un grafic cutie nu este altceva decât o histogramă vizualizată de sus și, în același mod, o histogramă este un grafic cutie vizualizat din lateral. Un exemplu poate fi văzut mai jos.

Prima caracteristică pe care o distribuie ambele diagrame este minimul și maximul setului de date. Barele de capăt după liniuțe indică minimul (bara inferioară) și maximul (bara superioară). Valorile aberante ar fi reprezentate în afara intervalului maxim și minim. Adică dincolo de gratii după cratime. De asemenea, putem găsi parcele orizontale.

Dintr-o privire, puteți vedea că majoritatea datelor sunt centrate pe observațiile aproape de minim în ambele grafice. Acest lucru este indicat de graficul cutiei în care cutia este mai aproape de minim decât maxim. Dacă ne uităm la histogramă, vom vedea că cele mai frecvente observații sunt observațiile care sunt apropiate de minim și departe de maxim.

Informații despre complotul casetei

Informațiile furnizate de graficul cutiei sunt după cum urmează:

  1. Partea de jos a casetei este prima quartilă (Q1).
  2. Bara din mijlocul casetei este mediana sau a doua quartilă (Q2).
  3. Partea de sus a casetei este a treia quartilă (Q3).
  4. Gama intercuartilă sau IQR ar fi înălțimea cutiei, adică diferența dintre Q3 și Q1.

Cheie grafic casetă

Această reprezentare grafică se numește grafic de cutie, deoarece arată ca o cutie. Prin urmare, pentru a ne aminti acest grafic, ar trebui să ne gândim doar la un obiect pătrat sau la o cutie.

Pentru cititorii care sunt familiarizați cu prețul activelor financiare, vor vedea mai multă asemănare cu o lumânare. Lumânările pe care le vedeți în citat sunt parcele de cutii ajustate la fereastra de timp aleasă.

Avantajele și dezavantajele parcelei cutiei

Printre avantajele și dezavantajele acestei diagrame găsim următoarele:

Avantaj

  • Viziune globalizată a frecvenței absolute a unei variabile cantitative sau calitative.
  • Cunoașterea minimului, maximului și quartilelor setului de date fără a fi nevoie să le calculeze.
  • Recunoașterea valorilor extreme mai rapid decât cu o histogramă, deoarece valorile extreme sunt indicate cu cercuri în afara maximului și minimului.

Dezavantaje

  • Dacă setul de date este mic, crearea unui grafic de casetă pentru a exprima acele date va face mai dificilă înțelegerea.

Exemplu de complot box

Presupunem că vrem să reprezentăm numărul de bicicliști care trec pe lângă noi pe parcursul unui an. În primul rând, numărăm bicicliștii și colectăm informațiile într-un tabel.

Prin intermediul unor programe precum R sau Excel putem genera graficul prezentat mai jos.

Datorită reprezentării numărului de bicicliști prin graficul cutiei, putem intui rapid unde este mediana, celelalte quartile, maximul și minimul. În acest caz nu avem date atipice, deoarece dincolo de maxim și minim nu există nimic.

Aplicarea acestui tip de grafic este foarte frecventă, având în vedere simplitatea și utilitatea sa în multe domenii dincolo de finanțe și economie.