Criteriul bayesian de informare

Cuprins:

Anonim

Criteriul Bayesian al informației sau criteriul Schwarz este o metodă care se concentrează pe suma pătratelor reziduale pentru a găsi numărul de perioade întârziate p care minimizează acest model.

Cu alte cuvinte, vrem să găsim numărul minim de perioade întârziate pe care le includem în autoregresiune pentru a ne ajuta cu predicția variabilei dependente.

În acest fel, vom avea control asupra numărului de perioade întârziate p că suntem incluși în regresie. Când depășim acest nivel optim, modelul Schwarz nu va mai scădea și, prin urmare, vom fi atins minimul. Adică vom fi ajuns la numărul de perioade întârziate p care minimizează modelul Schwarz.

Se mai numește și criteriul de informare Bayes (BIC).

Articole recomandate: autoregresie, suma pătratelor de reziduuri (SCE).

Formula Bayesiană a criteriului informațional

Deși la prima vedere pare o formulă complicată, vom trece prin părți pentru a o înțelege. În primul rând, în general, trebuie să:

  • Logaritmii din ambii factori ai formulei reprezintă efectul marginal al includerii unei perioade întârziate p mai mult în auto-regresie.
  • N este numărul total de observații.
  • Putem împărți formula în două părți: partea stângă și partea dreaptă.

Partea din stânga:

Reprezintă suma pătratelor reziduurilor (SCE) ale autoregresei dep perioade întârziate, împărțit la numărul total de observații (N).

Pentru a estima coeficienții folosim cele mai mici pătrate obișnuite (OLS). Deci, atunci când includem noi perioade întârziate, SCE (p) poate fi menținut sau scăzut doar.

Apoi, creșterea unei perioade întârziate în autoregresiune provoacă:

  • SCE (p): scade sau rămâne constant.
  • Coeficient de determinare: crește.
  • EFECT TOTAL: o creștere într-o perioadă întârziată determină o scădere a părții din stânga a formulei.

Acum partea corectă:

(p + 1) reprezintă numărul total de coeficienți în autoregresie, adică regresorii cu perioadele lor întârziate (p) și interceptarea (1).

Apoi, creșterea unei perioade întârziate în autoregresiune provoacă:

  • (p + 1): crește deoarece încorporăm o perioadă întârziată.
  • EFECT TOTAL: o creștere într-o perioadă întârziată determină o creștere a părții drepte a formulei.

Exemplu practic

Presupunem că vrem să facem o predicție cu privire la prețurilepermise de schi pentru următorul sezon 2020 cu un eșantion de 5 ani, dar nu știm câte perioade de întârziere să folosim: AR (2) sau AR (3)?

  • Descărcăm datele și calculăm logaritmii naturali ai prețurilor permise de schi.

1. Estimăm coeficienții folosind OLS și obținem:

Suma pătratelor de reziduuri (SCE) pentru AR (2) = 0,011753112

Coeficientul de determinare pentru AR (2) = 0,085

2. Adăugăm încă o perioadă întârziată pentru a vedea cum se schimbă SCE:

Suma pătratelor de reziduuri pentru AR (3) = 0,006805295

Coeficientul de determinare pentru AR (3) = 0,47

Putem vedea că atunci când adăugăm o perioadă întârziată în autoregresie, coeficientul de determinare crește și SCE scade în acest caz.

  • Calculăm criteriul de informare bayesiană:

Cu cât modelul BIC este mai mic, cu atât este mai preferat modelul. Apoi, AR (3) ar fi modelul preferat în raport cu AR (2), având în vedere că coeficientul său de determinare este mai mare, SCE este mai mic și modelul Schwarz sau criteriul de informare Bayesian este, de asemenea, mai mic.