R ajustat la pătrat (coeficient de determinare ajustat)

R pătrat ajustat (sau coeficientul de determinare ajustat) este utilizat în regresie multiplă pentru a vedea gradul de intensitate sau eficacitate a variabilelor independente în explicarea variabilei dependente.

În cuvinte mai simple, pătratul R ajustat ne spune ce procent din variația variabilei dependente este explicat în mod colectiv de toate variabilele independente.

Utilizarea acestui coeficient este justificată prin faptul că, pe măsură ce adăugăm variabile la o regresie, coeficientul de determinare neajustat tinde să crească. Chiar și atunci când contribuția marginală a fiecăreia dintre noile variabile adăugate nu are nicio relevanță statistică.

Prin urmare, prin adăugarea de variabile la model, coeficientul de determinare ar putea crește și am putea crede, în mod eronat, că setul de variabile alese este capabil să explice o parte mai mare a variației variabilei independente. Această problemă este cunoscută în mod obișnuit ca „supraestimare a modelului”.

Coeficient de variațieAnaliza regresiei

Formula ajustată a coeficientului de determinare

Pentru a rezolva problema descrisă mai sus, mulți cercetători sugerează ajustarea coeficientului de determinare folosind următoarea formulă:

R2 la → R ajustat la pătrat sau coeficient de determinare ajustat

R2 → R pătrat sau coeficient de determinare

n → Numărul de observații din eșantion

k → Numărul de variabile independente

Având în vedere că 1-R2 este un număr constant și din moment ce n este mai mare decât k, pe măsură ce adăugăm variabile la model, coeficientul dintre paranteze devine mai mare. Prin urmare. de asemenea, rezultatul înmulțirii acestuia cu 1-R2 . Cu care vedem că formula este construită pentru a ajusta și penaliza includerea coeficienților în model.

În plus față de avantajul anterior, ajustarea utilizată în formula anterioară ne permite, de asemenea, să comparăm modele cu diferite numere de variabile independente. Din nou, formula ajustează numărul de variabile dintre un model și altul și ne permite să facem o comparație omogenă.

Revenind la formula anterioară, putem deduce că coeficientul de determinare ajustat va fi întotdeauna egal sau mai mic decât coeficientul lui R2. Spre deosebire de coeficientul de determinare care variază între 0 și 1, coeficientul de determinare ajustat ar putea fi negativ din 2 motive:

  • Cu cât k se apropie de n.
  • Cu cât este mai mic coeficientul de determinare.
Coeficient de corelație liniară

Vei ajuta la dezvoltarea site-ului, partajarea pagina cu prietenii

wave wave wave wave wave