Eroare de tip I - Ce este, definiție și concept

Cuprins:

Anonim

Eroarea de tip 1 în statistici este definită ca respingerea ipotezei nule atunci când este de fapt adevărată. O eroare de tip 1 este, de asemenea, cunoscută sub numele de fals pozitiv sau eroare de tip alfa.

A face o greșeală de tip 1 înseamnă a nega ceva atunci când este de fapt adevărat. Luați în considerare, de exemplu, situația de a testa dacă o campanie de marketing desfășurată pe rețelele de socializare crește vânzările de înghețată pentru o companie într-o săptămână de vară. Ipotezele ar fi următoarele:

H0: Vânzările nu cresc din cauza campaniei de vară

H1: Vânzările cresc datorită campaniei de marketing

După evaluarea traficului de pe site-ul companiei și a paginilor vizitate după campanie, se detectează următoarele:

  • Creșteți, deși în trafic și vizite de 50%.
  • Creștere cu 200% a vânzărilor de înghețată.

Având în vedere aceste rezultate, s-ar putea concluziona că campania publicitară a fost fructuoasă și a avut un efect knock-on, crescând vânzările. Totuși, să ne gândim că în acea săptămână a existat un val de căldură care a adus temperaturile peste 40 de grade.

Cunoscându-l pe acesta din urmă, ar trebui să luăm în considerare factorul temperaturii ridicate ca fiind cauza creșterii vânzărilor. Dacă nu luăm în considerare acest lucru, ne-am putea respinge ipoteza nulă atunci când este adevărată, adică ne-am gândi că campania noastră a avut un succes răsunător atunci când în realitate cauza creșterii vânzărilor a fost căldura puternică. Dacă am ajunge la această concluzie, am respinge ipoteza nulă atunci când este de fapt adevărată și, prin urmare, comitem o eroare de tip 1.

Cauze ale erorii de tip 1

Eroarea de tip 1 este legată de semnificația contrastului sau alfa, cu eroarea de estimare a coeficienților și poate apărea din cauza a 2 încălcări tipice ale ipotezelor inițiale ale unei regresii. Acestea sunt:

  • Heteroscedasticitate condiționată.
  • Corelația serială.

O regresie care ar prezenta oricare dintre încălcările anterioare ar subestima eroarea coeficienților. Dacă se întâmplă acest lucru, estimarea noastră a statisticii t ar fi mai mare decât statistica t reală. Aceste valori mai mari ale statisticii t ar crește probabilitatea ca valoarea să cadă în zona de respingere.

Să ne imaginăm 2 situații.

Situația 1 (estimare incorectă a erorii)

  • Semnificaţie: 5%
  • Marime de mostra: 300 de persoane.
  • Valoare critica: 1,96
  • B1: 1,5
  • Eroare de estimare a coeficientului: 0,5

T = 1,5 / 0,5 = 3

În acest fel, valoarea ar cădea în zona de respingere și vom respinge ipoteza nulă.

Situația 2 (estimarea corectă a erorii)

  • Semnificaţie: 5%
  • Marime de mostra: 300 de persoane.
  • Valoare critica: 1,96
  • B1: 1,5
  • Eroare de estimare a coeficientului: 1

T = 1,5 / 1 = 1,5

În acest fel, valoarea ar scădea în zona de non-respingere și nu am respinge ipoteza.

Pe baza exemplelor anterioare, situația 1 în care eroarea este subestimată, ne-ar determina să respingem ipoteza nulă atunci când, de fapt, este adevărată, deoarece așa cum vedem în situația 2 cu eroarea corect estimată, nu am respinge ipoteza fiind adevărat.