Kendall's Tau (II) - Ce este, definiție și concept

Este o măsură de dependență non-parametrică care identifică perechile concordante și discordante de două variabile. Odată identificate, totalurile sunt calculate și se face coeficientul.

Cu alte cuvinte, atribuim un clasament observațiilor fiecărei variabile și studiem relația de dependență dintre două variabile date.

Există două moduri de a calcula Tau-ul lui Kendall; alegem să calculăm relația de dependență odată ce observațiile fiecărei variabile au fost ordonate. În exemplul nostru, vom vedea că sortăm clasamentele din coloana X în ordine crescătoare.

Corelațiile clasificate sunt o alternativă non-parametrică ca măsură a dependenței între două variabile atunci când nu putem aplica coeficientul de corelație Pearson.

Acestea sunt rezultatele la care ne-am referit în primul articol -> Kendall's Tau (I):

Statiune de schi (eu) X Z C NC
LA 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
ȘI 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTAL
  • Perechea BC-CB este o pereche discordantă. Intrăm 1 în coloana NC și înghețăm contorul în ultima poziție până găsim din nou o pereche potrivită. În acest caz, am înghețat numărul de perechi potrivite la 5 până la stația D. Stația D poate forma doar 4 perechi potrivite: AD-DA, DE-ED, DF-FD, DG-GD.

O altă pereche discordantă ar fi EF-FE:

  • Perechea EF-FE este o pereche discordantă. Scriem 1 în coloana NC și continuăm să tragem numărul 4 de perechi concordante care se pot forma. Perechile potrivite de stație E ar fi: EA-AE, EB-BE, EC-CE, ED-DE deoarece EF-FE este discordantă.
    • Perechea FG-GF este o pereche discordantă. Scriem 1 în coloana NC și continuăm să tragem numărul 4 de perechi concordante care se pot forma. Perechile concordante ale stației F s (nu am variat în loc de 4. Perechile concordante pe care le-am putea arăta înainte (nu am variat ar fi: FA-AF, FB-BF, FC-CF, FD-DF pentru că FG-GF este discordant.

Calculăm Tau-ul lui Kendall

Tau-ul lui Kendall nu are niciun secret dincolo de a fi coeficientul perechilor concordante și discordante dintr-un eșantion de observații.

Interpretare

Întrebarea noastră inițială a fost: există o relație de dependență între preferințele schiorilor de alpinism și a schiorilor nordici din stațiunile de schi date?

În acest caz, avem o dependență între cele două variabile de 0.8695. Un rezultat foarte aproape de limita superioară. Acest rezultat ne spune că schiorii alpini (X) și schiorii nordici (Z) au clasificat stațiunile cu clasificări similare.

Fără a fi nevoie să facem niciun tip de calcul, putem vedea că primele stații (A, B, C) primesc cele mai bune scoruri de la cele două grupuri. Cu alte cuvinte, evaluările schiorilor urmează aceeași direcție.

Comparație: Pearson vs Kendall

Dacă calculăm coeficientul de corelație al lui Pearson având în vedere observațiile anterioare și îl comparăm cu Tau-ul lui Kendall, obținem:

În acest caz, Tau-ul lui Kendall ne spune că există o relație de dependență mai puternică între variabilele X și Z în comparație cu coeficientul de corelație al lui Pearson: 0,8695> 0,75.

Dacă valorile aberante ar avea o influență mare asupra rezultatelor, am găsi o diferență mare între Pearson și Spearman și, prin urmare, ar trebui să îl folosim pe Spearman ca măsură a dependenței.