Eroare de tip I - Ce este, definiție și concept

Eroarea de tip 1 în statistici este definită ca respingerea ipotezei nule atunci când este de fapt adevărată. O eroare de tip 1 este, de asemenea, cunoscută sub numele de fals pozitiv sau eroare de tip alfa.

A face o greșeală de tip 1 înseamnă a nega ceva atunci când este de fapt adevărat. Luați în considerare, de exemplu, situația de a testa dacă o campanie de marketing desfășurată pe rețelele de socializare crește vânzările de înghețată pentru o companie într-o săptămână de vară. Ipotezele ar fi următoarele:

H0: Vânzările nu cresc din cauza campaniei de vară

H1: Vânzările cresc datorită campaniei de marketing

După evaluarea traficului de pe site-ul companiei și a paginilor vizitate după campanie, se detectează următoarele:

  • Creșteți, deși în trafic și vizite de 50%.
  • Creștere cu 200% a vânzărilor de înghețată.

Având în vedere aceste rezultate, s-ar putea concluziona că campania publicitară a fost fructuoasă și a avut un efect knock-on, crescând vânzările. Totuși, să ne gândim că în acea săptămână a existat un val de căldură care a adus temperaturile peste 40 de grade.

Cunoscându-l pe acesta din urmă, ar trebui să luăm în considerare factorul temperaturii ridicate ca fiind cauza creșterii vânzărilor. Dacă nu luăm în considerare acest lucru, ne-am putea respinge ipoteza nulă atunci când este adevărată, adică ne-am gândi că campania noastră a avut un succes răsunător atunci când în realitate cauza creșterii vânzărilor a fost căldura puternică. Dacă am ajunge la această concluzie, am respinge ipoteza nulă atunci când este de fapt adevărată și, prin urmare, comitem o eroare de tip 1.

Cauze ale erorii de tip 1

Eroarea de tip 1 este legată de semnificația contrastului sau alfa, cu eroarea de estimare a coeficienților și poate apărea din cauza a 2 încălcări tipice ale ipotezelor inițiale ale unei regresii. Acestea sunt:

  • Heteroscedasticitate condiționată.
  • Corelația serială.

O regresie care ar prezenta oricare dintre încălcările anterioare ar subestima eroarea coeficienților. Dacă se întâmplă acest lucru, estimarea noastră a statisticii t ar fi mai mare decât statistica t reală. Aceste valori mai mari ale statisticii t ar crește probabilitatea ca valoarea să cadă în zona de respingere.

Să ne imaginăm 2 situații.

Situația 1 (estimare incorectă a erorii)

  • Semnificaţie: 5%
  • Marime de mostra: 300 de persoane.
  • Valoare critica: 1,96
  • B1: 1,5
  • Eroare de estimare a coeficientului: 0,5

T = 1,5 / 0,5 = 3

În acest fel, valoarea ar cădea în zona de respingere și vom respinge ipoteza nulă.

Situația 2 (estimarea corectă a erorii)

  • Semnificaţie: 5%
  • Marime de mostra: 300 de persoane.
  • Valoare critica: 1,96
  • B1: 1,5
  • Eroare de estimare a coeficientului: 1

T = 1,5 / 1 = 1,5

În acest fel, valoarea ar scădea în zona de non-respingere și nu am respinge ipoteza.

Pe baza exemplelor anterioare, situația 1 în care eroarea este subestimată, ne-ar determina să respingem ipoteza nulă atunci când, de fapt, este adevărată, deoarece așa cum vedem în situația 2 cu eroarea corect estimată, nu am respinge ipoteza fiind adevărat.

Posturi Populare

Erori CSI expuse

Pe 28 aprilie, alegerile generale au loc în Spania. Centrul de Cercetări Sociologice (CSI) publică diverse anchete pentru a estima rezultatele electorale, dar sunt pe deplin de încredere? Statistica este un instrument foarte puternic. La începutul timpului, statisticile au funcționat ca o colectare de date. Citeste mai mult…