Analiza varianței - Ce este, definiție și concept

Analiza varianței sau ANOVA (analiza varianței) sunt tehnici de analiză a dependenței multivariate utilizate pentru a determina dacă există diferențe semnificative între mijloacele a trei sau mai multe grupuri de populație.

Prin urmare, cu această analiză vom afla dacă există diferențe între anumite grupuri atunci când modificăm una sau mai multe caracteristici. Pentru a afla, folosim valoarea mediei datelor.

Utilizarea sa este foarte frecventă în domenii precum economia sau medicina.

Ipoteze anterioare ale analizei varianței

Există o serie de condiții prealabile pentru efectuarea ANOVA care ar trebui cunoscute. Acestea sunt esențiale pentru ca rezultatele să fie adecvate.

  • În primul rând, populația trebuie să urmeze o distribuție normală. Prin urmare, avem de-a face cu un tip de contrast parametric, deoarece sunt cunoscuți parametrii populației media și abaterea standard.
  • În plus, probele utilizate trebuie să fie independente una de cealaltă. Aceasta înseamnă că o modificare a unuia dintre ele nu trebuie să afecteze valoarea celorlalte.
  • Pe de altă parte, variațiile populațiilor studiate trebuie să fie egale. Aceasta se numește homoscedasticitate.

Clasificarea analizei modelelor de varianță

Pentru analiza modelelor de varianță, se pot utiliza cele trei clasificări prezentate mai jos:

  • Model de efecte fixe: Populațiile sunt normale și diferă doar prin valoarea mijloacelor lor respective.
  • Model de efecte aleatorii: În acest caz, datele au o ierarhie și diferențele de populație depind de aceasta.
  • Model de efecte mixte: Ne-am confrunta cu un model care este un amestec al celor două precedente.

Exemplu ANOVA: concepte importante

Există ecuații matematice de o oarecare complexitate pentru a efectua ANOVA. Cu toate acestea, la Economy-Wiki.com optăm pentru economia simplă și, prin urmare, și profitând de tehnologie, vom arăta cum s-ar putea face într-o foaie de calcul.

Să ne imaginăm că vrem să știm dacă există diferențe semnificative între cititorii Economy-Wiki.com, pe baza afinității gradului lor cu economia.

Atenție: datele pe care le vom folosi sunt fictive.

Trebuie să mergem la Date, Analiza datelor și vom alege analiza varianței unui factor.

Gradul ar fi matricea celor trei grupuri. Poate fi mai interesant să includeți titlurile ulterior și să dați formatarea dorită. În cazul nostru, cu sigla și culoarea albastră.

Vedem că există unele concepte precum gradele de libertate și probabilitatea sau semnificația. Primul este calculat automat și este numărul de grupuri minus unul. Al doilea ne spune dacă diferențele sunt semnificative sau nu.

De obicei, pornești de la un nivel acceptat de încredere. În economie este de obicei 95% (0,95), ceea ce este legat de o semnificație de 0,05 (1-0,095). Astfel, dacă acea probabilitate sau valoare p este sub semnificația acceptată, diferențele sunt semnificative.

În acest caz, se pare că gradul nu influențează numărul de cititori (semnificație> 0,05). Prin urmare, analiza varianței pare să indice că Economy-Wiki.com îi interesează pe toți, nu doar pe cititorii specializați. Desigur, sunt sau nu date fictive?