Normalizarea statistică este transformarea la scară a distribuției unei variabile pentru a putea face comparații cu privire la seturi de elemente și medie prin eliminarea efectelor influențelor.
Cu alte cuvinte, normalizarea reprezintă proporții fără unități de măsură (adimensionale sau invariante la scară) care ne permit să comparăm elemente ale diferitelor variabile și unități de măsură diferite.
În statistici și econometrie, se utilizează tabele standardizate de distribuție a probabilității pentru a găsi probabilitatea ca o observație să fie dată având în vedere funcția de distribuție pe care o urmează variabila.
Este important să nu se limiteze termenul de normalizare doar la seturi de elemente în care distribuția normală este o bună aproximare la frecvența lor.
Variabilă statisticăMasa
Următorul tabel detaliază cele mai comune standardizări în statistici aplicate finanțelor și economiei.
- Scorul tipificat sau standard normalizează erorile atunci când putem calcula parametrii eșantionului.
- Normalizarea în distribuția t a Studentului normalizează reziduurile atunci când parametrii sunt necunoscuți și facem o estimare pentru a le obține.
- Coeficientul de variație folosește media ca măsură de scară, spre deosebire de scorul standardizat și t-ul lui Student, care utilizează abaterea standard. Distribuția este normalizată pentru distribuțiile Poisson și exponențiale.
- Momentul standardizat poate fi aplicat oricărei distribuții de probabilitate care are o funcție generatoare de moment. Cu alte cuvinte, că integralele momentelor sunt convergente.
Aplicații
De câte ori am citit că distribuția normală a probabilității pare o aproximare suficient de bună la frecvența observațiilor și ni se cere să găsim probabilitatea ca variabila X să ia o anumită valoare?
Cu alte cuvinte, stabilim X ~ N (μ, σ2), și ni se cere să găsim P (X ≤ xeu)
Știm că pentru a găsi P (X ≤ xeu), trebuie să căutăm probabilitatea în tabelele de distribuție a probabilității. În acest caz, în tabelele de distribuție a distribuției normale. Cele mai utilizate tabele de distribuție a probabilităților în econometrie și finanțare cantitativă sunt: chi-pătrat, Student's t, Fisher-Snedecor's F, Poisson, exponențial, cauchy și normalul standard.
Probabilitățile calculate în tabelele de distribuție îndeplinesc proprietatea:
Adică, probabilitățile (numerele din tabel) sunt tipificate. Apoi, va trebui, de asemenea, să tastăm variabila noastră în funcție de parametrii funcției de distribuție dacă vrem să găsim probabilitatea lui P (X ≤ xeu).
Exemplu practic
Vrem să știm probabilitatea ca numărul schiorilor care merg la schi vinerea dimineață să fie de 288.
Stațiunea de schi ne spune că frecvența variabilei de schiori poate aproxima o distribuție normală a mediei 280 și a varianței 16.
Deci avem:
X ~ N (μ, σ2)
unde X este definit ca variabila „schiori”
Aceștia ne cer probabilitatea ca numărul schiorilor care merg să schieze vinerea este mai mic sau egal cu 288. Adică:
P (X ≤ 288)
Proces
Pentru a găsi probabilitatea ca numărul schiorilor să fie egal cu 288, trebuie mai întâi să tastăm variabila.
Apoi ne uităm la tabelul de distribuție al standardului continuu normal:
Z | 0 | 1 | 2 | 3 |
2,0 | 0,9772 | 0,9778 | 0,9783 | 0,9788 |
Probabilitatea ca 288 de schiori să meargă la schi vineri dimineață este de 97,72%, având în vedere parametrii de medie și varianță.