Modelul de probabilitate liniară este un model de alegere binară. În aceasta, așteptarea condiționată a variabilei dependente este o funcție liniară, adică relația variabilei dependente cu variabila (variabile) explicativă este constantă.
Pentru a o vedea într-un alt mod, modelul de probabilitate liniară este un model în care avem o variabilă dependentă și o variabilă (variabile) independentă (e) înmulțită cu un coeficient (e) permanent.
Trebuie să subliniem că modelul de probabilitate liniară este un model de alegere binară, adică variabila dependentă poate lua două valori. Aceste valori sunt 1 sau 0, pentru a indica succesul sau respectiv eșecul.
Modelul de probabilitate liniară este exprimat după cum urmează:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
În ecuația prezentată, așteptarea condițională a lui Y dată de X este interpretată ca fiind egală cu β0 + β1x.
În acest caz, luăm așteptarea condiționată, deoarece suntem interesați să cunoaștem probabilitatea ca o persoană să ia o decizie având în vedere caracteristicile sale, de exemplu (sau o altă variabilă independentă poate fi luată ca referință).
Dezavantaje ale modelului de probabilitate liniară
Unele dezavantaje ale modelului de probabilitate liniară sunt următoarele:
- Modelul de probabilitate liniară poate prezenta heteroskedasticitate. Și anume, varianța erorilor nu este aceeași în toate observațiile făcute. În acest caz, se utilizează erori standard.
- Nu se poate presupune că erorile sunt distribuite în mod normal.
- Variabila dependentă poate lua doar două valori.
- Se presupune că variabilele independente și dependente au o relație liniară, adică rata de schimbare este întotdeauna aceeași. Cu toate acestea, ar putea fi mai precis să construim un model în care rata de schimbare crește pe măsură ce Y atinge o valoare mai mare și opusul se întâmplă atunci când Y scade.
Având în vedere aceste dezavantaje, există modelele logit și probit.
Exemplu de model de probabilitate liniară
Un model de probabilitate liniar poate fi construit, de exemplu, în cazul în care variabila dependentă este dacă persoana are sau nu în prezent un loc de muncă formal pe care l-a deținut de un an sau mai mult. Variabilele independente ar putea fi nivelul studiilor sau nivelul educațional, sexul și vârsta.
În exemplul prezentat, variabila dependentă va fi 1 sau 0, dar trebuie interpretată calitativ, indiferent de valoarea sa numerică. Astfel, 1 înseamnă că persoana are un loc de muncă formal care a fost menținut de mai mult de 1 an și 0 ar fi situația în care acest lucru nu se întâmplă.