Funcție simplă de autocorelare - Exemplu în R

Cu alte cuvinte, Funcția simplă de autocorelare (FAS), sau din engleză, Funcția de autocorelare, Este o funcție matematică care ne ajută să știm cât de dependente sunt datele unei perioade date de aceleași date din k perioade anterioare.

Generăm o serie de timp anual X care urmează o distribuție normală plus o inerție. Putem folosi și date reale.

Metodologie

Programele sunt esențiale pentru a lucra la analiza autocorelației. Se pot utiliza programe precum Python, dar pentru analiza statistică și gestionarea datelor recomandăm R sau versiunea sa îmbunătățită, R Studio. Aici vom lucra cu R.

Calcul

Și cum scriem formula FAS în codul R?

Atât R, cât și Python au biblioteci în care formulele sunt legate de un nume. Atunci este suficient să avem instalată biblioteca care conține formula pe care dorim să o folosim și să o numim în script.

În întrebarea lui R trebuie să scriem:

Functia acf este în interiorul bibliotecii statistici.

X -> Serii cronologice pe care le folosim ca eșantion pentru a calcula FAS.

acf (X, ylim = c (-1,1)) -> Funcție de autocorelație simplă pe X cu limite pe axa verticală între -1 și 1, care sunt valorile pe care le poate lua coeficientul de autocorelație.

Verificare

Acest pas nu este necesar dacă am folosit codul anterior deoarece calculează benzile de încredere în sine.

Pentru a determina dacă coeficienții de autocorelație calculați sunt semnificativi statistic, va trebui să stabilim benzi de încredere cu valorile critice. În acest fel, având în vedere un procent de semnificație, putem spune cu certitudine statistică dacă există sau nu prezența autocorelației în date.

În același mod ca și coeficientul de corelație, și coeficientul de autocorelație își asumă normalitatea și, prin urmare, vom calcula intervalul de încredere după cum urmează:

Definim testarea ipotezelor ca:

La 95% încredere cu un nivel de semnificație de 5%, găsim faimosul 1.96 în tabelele normale. Valoarea critică este dată de:

Unde varianța coeficienților este dată de aproximare:

Deși oferim formula, vă sfătuim să utilizați programe statistice pentru o precizie și o viteză mai mari.

Rezultat

Toate liniile care se termină în afara benzii de încredere înseamnă că seria temporală prezintă autocorelare în perioada indicată.

Deci, pe baza graficului, vedem că există prezența autocorelației în această serie de timp în perioadele în care linia iese din banda discontinuă.

Prima linie care este la 0 și se declanșează spre 1 poate fi ignorată, deoarece t trebuie să fie strict mai mare decât 0 și în acest caz nu este. Nu are prea mult sens să facem toți pașii anteriori pentru a cunoaște autocorelația de acum cu acum pentru că o știm deja: corelația unei variabile cu ea însăși este 1, deci avem deja răspunsul.