Bias în colectarea datelor

Cuprins:

Bias în colectarea datelor
Bias în colectarea datelor
Anonim

Biasul colectării datelor apare atunci când selectăm în mod eronat subiecții care vor aparține eșantionului aleatoriu analizat.

Avem problema când această selecție face ca eșantionul aleatoriu să nu fie reprezentativ pentru populația statistică. Și, prin urmare, orice rezultat pe care îl obținem din eșantion este părtinitor și nu am putut afirma că a fost îndeplinit în populația analizată.

Tendința de supraviețuire

Se întâmplă atunci când datele sunt excluse din analiză deoarece nu mai există în momentul analizei.

Cu alte cuvinte, ne concentrăm doar pe datele care există și le eliminăm pe cele care existau anterior în populație. În practică există multe exemple de acest tip de prejudecată. Una dintre ele este de a efectua sondaje numai clienților unei companii, excludând potențialii clienți. O alta ar fi evaluarea comportamentului indicilor bursieri eliminând din analiză companiile care erau și nu mai sunt în acel indice.

Soluția la această prejudecată este foarte simplă. Efectuați studiul cu toate datele, existente și existente anterior.

Bias de anticipare

Apare atunci când se efectuează o analiză folosind date care nu sunt disponibile în momentul analizei. Un exemplu ar fi să facem o analiză a relației prețului unei acțiuni cu o variabilă a soldului financiar. Prețul acțiunii este o variabilă dinamică, din care, dacă avem informații corecte în momentul analizei. Cu toate acestea, variabilele stabilite în bilanț sunt statice și, prin urmare, ar trebui să așteptăm publicarea situațiilor financiare pentru această analiză.

Să presupunem că vrem să studiem relația dintre preț și capitaluri proprii pentru o serie de companii la sfârșitul anului fiscal. În acest caz, nu vom avea datele despre valoarea netă până la publicarea situațiilor financiare. Publicație care se publică de obicei la câteva luni după sfârșitul anului fiscal.

Prin urmare, o soluție la această prejudecată ar fi așteptarea publicării situațiilor financiare. Și efectuați analiza cu datele publicate împreună cu prețul în momentul publicării.

Tendința perioadei de timp

Această tendință apare atunci când perioada selectată pentru date este prea scurtă sau prea lungă. Dacă este prea scurtă, analiza ar putea reflecta rezultate specifice care sunt îndeplinite doar pentru acea perioadă. Adică nu ar fi reprezentative pentru o perioadă mai lungă de timp.

Imaginați-vă un interval de timp de cinci ani în care companiile mici au depășit companiile mari de pe piața de valori. Din aceasta am putea trage concluzia că în viitor companiile mici vor depăși întotdeauna cele mari. Dar pentru o perioadă atât de scurtă de timp nu se pot trage astfel de concluzii. Datorită în principal faptului că în perioade mai lungi de timp situația s-ar putea schimba. Prin urmare, rezultatele obținute sunt influențate de această perioadă redusă de timp.