Bias de supraviețuire - Ce este, definiție și concept

Cuprins:

Anonim

Biasul de supraviețuire este un prejudecată care apare în colectarea datelor atunci când datele sunt excluse din analiză, deoarece nu mai există astăzi.

Această prejudecată apare într-o mare varietate de contexte în care ne concentrăm doar pe acele date „supraviețuitoare”. Un exemplu în acest sens este văzut atunci când companiile își chestionează clienții cu privire la unul dintre produsele lor. Dar își lasă non-clienții, care în acest caz ar fi „non-supraviețuitorii”, în uitare.

În acest caz, tragerea concluziilor din acest studiu ar fi greșită. Întrucât rezultatele ar fi influențate doar de populația „supraviețuitoare”. Și nu ar fi rezultate reprezentative.

Tendința de supraviețuire în practică

Un exemplu clar al acestei tendințe poate fi văzut în studiul rezultatelor fondurilor de investiții. Unde majoritatea bazelor de date includ doar fonduri care există astăzi. Indiferent de fondurile care existau în trecut.

Motivul pentru care nu există astăzi este că performanța lor a fost mai proastă decât „supraviețuitorii”. Sau chiar mai multe fonduri au fost fuzionate într-unul singur. Prin urmare, se efectuează analiza acelor fonduri cu cele mai bune rezultate. Și această prejudecată tinde să supraestimeze performanța eșantionului acestor fonduri.

Principala problemă cu acest lucru nu mai este doar supraestimarea performanței fondului. Mai degrabă, eșantionul selectat nu ar fi un eșantion aleatoriu al populației totale. Și, prin urmare, rezultatele studiului pot să nu fie reprezentative pentru populație. Că, în cele din urmă, asta căutăm atunci când selectăm un eșantion aleatoriu al populației.

Soluție la tendința de supraviețuire

Să ne imaginăm că vrem să selectăm un fond de investiții în care să investim, pe baza comportamentului său din trecut. Pentru a evita această tendință de supraviețuire și a optimiza această selecție, ar trebui să parcurgem următorii pași:

  • Alegeți orizontul de timp cu care intenționăm să lucrăm. De exemplu, zece, cincisprezece sau douăzeci de ani de istorie.
  • Luați toate fondurile existente de la începutul orizontului temporal, indiferent dacă există sau nu în prezent.
  • De acolo, selectați eșantionul din acea populație pentru studiul comportamentului.

Ideea este, în cele din urmă, de a obține acel eșantion aleatoriu al populației. Și de aici, concluziile obținute, dacă ar putea fi reprezentative pentru acea populație.