Eroarea de tip 1 în statistici este definită ca respingerea ipotezei nule atunci când este de fapt adevărată. O eroare de tip 1 este, de asemenea, cunoscută sub numele de fals pozitiv sau eroare de tip alfa.
A face o greșeală de tip 1 înseamnă a nega ceva atunci când este de fapt adevărat. Luați în considerare, de exemplu, situația de a testa dacă o campanie de marketing desfășurată pe rețelele de socializare crește vânzările de înghețată pentru o companie într-o săptămână de vară. Ipotezele ar fi următoarele:
H0: Vânzările nu cresc din cauza campaniei de vară
H1: Vânzările cresc datorită campaniei de marketing
După evaluarea traficului de pe site-ul companiei și a paginilor vizitate după campanie, se detectează următoarele:
- Creșteți, deși în trafic și vizite de 50%.
- Creștere cu 200% a vânzărilor de înghețată.
Având în vedere aceste rezultate, s-ar putea concluziona că campania publicitară a fost fructuoasă și a avut un efect knock-on, crescând vânzările. Totuși, să ne gândim că în acea săptămână a existat un val de căldură care a adus temperaturile peste 40 de grade.
Cunoscându-l pe acesta din urmă, ar trebui să luăm în considerare factorul temperaturii ridicate ca fiind cauza creșterii vânzărilor. Dacă nu luăm în considerare acest lucru, ne-am putea respinge ipoteza nulă atunci când este adevărată, adică ne-am gândi că campania noastră a avut un succes răsunător atunci când în realitate cauza creșterii vânzărilor a fost căldura puternică. Dacă am ajunge la această concluzie, am respinge ipoteza nulă atunci când este de fapt adevărată și, prin urmare, comitem o eroare de tip 1.
Cauze ale erorii de tip 1
Eroarea de tip 1 este legată de semnificația contrastului sau alfa, cu eroarea de estimare a coeficienților și poate apărea din cauza a 2 încălcări tipice ale ipotezelor inițiale ale unei regresii. Acestea sunt:
- Heteroscedasticitate condiționată.
- Corelația serială.
O regresie care ar prezenta oricare dintre încălcările anterioare ar subestima eroarea coeficienților. Dacă se întâmplă acest lucru, estimarea noastră a statisticii t ar fi mai mare decât statistica t reală. Aceste valori mai mari ale statisticii t ar crește probabilitatea ca valoarea să cadă în zona de respingere.
Să ne imaginăm 2 situații.
Situația 1 (estimare incorectă a erorii)
- Semnificaţie: 5%
- Marime de mostra: 300 de persoane.
- Valoare critica: 1,96
- B1: 1,5
- Eroare de estimare a coeficientului: 0,5
T = 1,5 / 0,5 = 3
În acest fel, valoarea ar cădea în zona de respingere și vom respinge ipoteza nulă.
Situația 2 (estimarea corectă a erorii)
- Semnificaţie: 5%
- Marime de mostra: 300 de persoane.
- Valoare critica: 1,96
- B1: 1,5
- Eroare de estimare a coeficientului: 1
T = 1,5 / 1 = 1,5
În acest fel, valoarea ar scădea în zona de non-respingere și nu am respinge ipoteza.
Pe baza exemplelor anterioare, situația 1 în care eroarea este subestimată, ne-ar determina să respingem ipoteza nulă atunci când, de fapt, este adevărată, deoarece așa cum vedem în situația 2 cu eroarea corect estimată, nu am respinge ipoteza fiind adevărat.