Variabila relevantă omisă

Omiterea unei variabile relevante este neincluderea unei variabile explicative importante într-o regresie. Având în vedere ipotezele Gauss-Markov, această omisiune ar provoca părtinire și inconsecvență în estimările noastre.

Cu alte cuvinte, omiterea unei variabile relevante apare atunci când o încorporăm în termenul de eroare u pentru că nu o luăm în considerare. Acest lucru va face să existe o corelație între variabila dependentă și termenul de eroare u.

Matematic, presupunem că:

Cov (x, u) = 0

Dacă încorporăm o variabilă relevantă în termenul de eroare sau, atunci:

Cov (x, u) ≠ 0

Având în vedere ipotezele Gauss-Markov, această corelație:

(ρ (x, u) ≠ 0)

Nu ar îndeplini acest lucru:

E (u | x) = E (u) = 0

Adică, așteptarea erorilor condiționate de cele explicative este egală cu așteptarea erorii și că este și ea zero. Acestea sunt ipotezele de imparțialitate (exogenitate strictă + medie nulă)

În caz de omisiune a variabilei relevante, estimatorul OLS este părtinitor și devine inconsecvent. Deci încalcă două dintre proprietățile estimatorului și face ca estimarea noastră să fie greșită.

Exemplu teoretic

Presupunem că dorim să studiem numărul schiorilor sezonieri (t) luând în considerare mai mulți factori: prețul permiselor de schi (permise de schi) și numărul de pârtii deschise (pârtii) și calitatea zăpezii (zăpadă).

Modelul 0

Presupunem că variabilele explicative (permise de schi, pârtii și zăpadă) sunt variabile relevante pentru Modelul 0 deoarece aparțin modelului populației. Cu alte cuvinte, variabilele explicative ale modelului nostru 0 au un efect parțial asupra schiorilor variabile dependente din modelul populației. Apoi, atât în ​​populație, cât și în modelele de eșantion (Modelul 0) vor avea coeficienți diferiți de zero.

Interpretare

O creștere a calității zăpezii (zăpadă) și a numărului de trasee deschise (piste) determină o creștere a estimărilor β2 și β3. În consecință, acest lucru se reflectă în numărul de schiori (schiori).

O creștere procentuală a prețurilor abonamentelor de schi determină o scădere a β1/ 100 în numărul de schiori (schiori)

Proces

Tratăm variabila zăpadă ca o variabilă omisă din model. Atunci:

Modelul 1

Diferențiem termenul de eroare u de modelul 0 și termenul de eroare v de modelul 1 deoarece unul nu include variabila relevantă zăpadă, iar cealaltă.

În Modelul 1 am omis o variabilă relevantă din model și am introdus-o în termenul de eroare u. Aceasta înseamnă că:

  • Cov (zăpadă, v) ≠ 0 → ρ (zăpadă, v) ≠ 0
  • E (v | zăpadă) ≠ 0

Dacă omitem variabile relevante de zăpadă în modelul nostru 1, vom determina estimatorul OLS să prezinte părtinire și inconsistență. Deci estimarea noastră a numărului de schiori sezonieri va fi greșită. Stațiunea de schi poate avea probleme financiare grave dacă luați în considerare estimarea noastră de model 1.