Distribuția t a studentului sau distribuția t este un model teoretic utilizat pentru a aproxima momentul de prim ordin al unei populații distribuite în mod normal atunci când dimensiunea eșantionului este mică și abaterea standard este necunoscută.
Cu alte cuvinte, distribuția t este o distribuție de probabilitate care estimează valoarea mediei unui eșantion mic extras dintr-o populație care urmează o distribuție normală și pentru care nu știm abaterea standard.
Articole recomandate: grade de libertate, grade de libertate (exemplu) și distribuție normală.
Formula de distribuție t a studentului
Având în vedere o variabilă continuă aleatoare L, spunem că frecvența observațiilor sale poate fi aproximată în mod satisfăcător la o distribuție t cu g grade de libertate astfel încât:
Reprezentarea distribuției t a studentului
Funcția de densitate a unei distribuții t cu 3 grade de libertate (df).
După cum putem vedea, reprezentarea distribuției t seamănă mult cu distribuția normală, cu excepția faptului că distribuția normală are cozi mai largi și este mai susținută. Cu alte cuvinte, ar trebui să adăugăm mai multe grade de libertate distribuției t, astfel încât distribuția „să crească” și să arate mai mult ca distribuția normală.
Specialitate
Și … De ce este atât de specială distribuția t?
Ei bine, pentru că spre deosebire de distribuția normală care depinde de medie și varianță, distribuția t depinde doar de gradele de libertate, din engleză, grade de libertate (df). Cu alte cuvinte, controlând gradele de libertate, controlăm distribuția.
Cererea studentului
Distribuția t este utilizată atunci când:
- Vrem să estimăm media unei populații distribuite în mod normal dintr-un eșantion mic.
- Dimensiunea eșantionului este mai mică de 30 de articole, adică n <30.
Din 30 de observații, distribuția t seamănă foarte mult cu distribuția normală, deci vom folosi distribuția normală.
- Abaterea standard a unei populații nu este cunoscută și trebuie estimată din observațiile eșantionului.
Exemplu
Presupunem că avem 28 de observații ale unei variabile aleatorii G care urmează distribuția t a lui Student cu 27 de grade de libertate (df).
Matematic,
Deoarece lucrăm cu date reale, va exista întotdeauna o eroare de aproximare între date și distribuție. Cu alte cuvinte, media, mediana și modul nu vor fi întotdeauna zero (0) sau exact la fel.
Reprezentăm frecvența fiecărei observații a variabilei G prin intermediul unei histograme.
Poate variabila aleatorie G să aproximeze o distribuție t?
Motive pentru a considera că variabila G urmează o distribuție t:
- Distribuția este simetrică. Adică, există același număr de observații atât la dreapta, cât și la stânga valorii centrale. De asemenea, faptul că media și mediana tind să fie aproape de aceeași valoare. Media este aproximativ zero, media = 0,016.
- Observațiile cu cea mai mare frecvență sau probabilitate sunt în jurul valorii centrale. Observațiile cu frecvență sau probabilitate mai mică sunt departe de valoarea centrală.