Multicoliniaritate - Ce este, definiție și concept

Cuprins:

Anonim

Multicoliniaritatea este relația puternică de dependență liniară între mai mult de două variabile explicative într-o regresie multiplă care încalcă ipoteza Gauss-Markov atunci când este exactă.

Cu alte cuvinte, multicoliniaritatea este corelația ridicată dintre mai mult de două variabile explicative.

Subliniem că relația liniară (corelația) dintre variabilele explicative trebuie să fie puternică. Este foarte frecvent ca variabilele explicative ale regresiei să fie corelate. Deci, trebuie subliniat că această relație trebuie să fie puternică, dar niciodată perfectă, pentru a fi considerată un caz de multicoliniaritate. Relația liniară ar fi perfectă dacă coeficientul de corelație ar fi 1.

Când această relație liniară puternică (dar nu perfectă) apare doar între două variabile explicative, spunem că este un caz de colinearitate. Ar fi multicoliniaritate atunci când relația liniară puternică apare între mai mult de două variabile independente.

Ipoteza lui Gauss-Markov despre non-multicoliniaritate exactă definește că variabilele explicative dintr-un eșantion nu pot fi constante. Mai mult, nu ar trebui să existe relații liniare exacte între variabilele explicative (nu există multicoliniaritate exactă). Gauss-Markov nu ne permite multicoliniaritatea exactă, ci aproximează multicoliniaritatea.

Analiza regresiei

Aplicații

Există cazuri foarte particulare, de obicei nerealiste, în care variabilele de regresie nu au nicio legătură între ele. În aceste cazuri vorbim de exogenitate a variabilelor explicative. Științele sociale sunt, în general, renumite pentru încorporarea multicolinearității aproximative în regresiile lor.

Multicoliniaritate exactă

Multicoliniaritatea exactă apare atunci când mai mult de două variabile independente sunt o combinație liniară de alte variabile independente în regresie.

Probleme

Când Gauss Markov interzice multicoliniaritatea exactă, se datorează faptului că nu putem obține estimatorul Ordinului celor mai mici pătrate.

Exprimând matematic beta-i-ul estimat sub formă de matrice:

Deci, dacă există multicoliniaritate exactă, aceasta determină matricea (X'X) să aibă un determinant 0 și, prin urmare, să nu fie inversabilă. A nu fi inversabil implică faptul că nu poți calcula (X'X)-1 și, în consecință, niciun sub-i Beta estimat.

Multicoliniaritate aproximativă

Multicoliniaritatea aproximativă apare atunci când mai mult de două variabile independente nu sunt exact (aproximare) o combinație liniară a altor variabile independente în regresie.

Variabila k reprezintă o variabilă aleatorie (independentă și distribuită identic (i.i.d)). Frecvența observațiilor dvs. poate fi aproximată în mod satisfăcător la o distribuție normală standard cu medie 0 și varianță 1. Deoarece este o variabilă aleatorie, implică faptul că în fiecare observație i, valoarea lui k va fi diferită și independentă de orice valoare anterioară.

Probleme

Exprimarea matematică în formă matricială:

Deci, dacă există multicoliniaritate aproximativă, aceasta determină matricea (X'X) să fie aproximativ 0 și coeficientul de determinare foarte apropiat de 1.

Soluţie

Multicoliniaritatea poate fi redusă prin eliminarea regresorilor variabilelor cu o relație liniară ridicată între ele.

Coeficient de corelație liniară