Tau de Kendall (I) - Ce este, definiție și concept

Este o măsură de dependență non-parametrică care identifică perechile concordante și discordante de două variabile. Odată identificate, totalurile sunt calculate și se face coeficientul.

Corelațiile clasificate sunt o alternativă non-parametrică ca măsură a dependenței între două variabile atunci când nu putem aplica coeficientul de corelație Pearson.

Cu alte cuvinte, atribuim un clasament observațiilor fiecărei variabile și studiem relația de dependență dintre două variabile date. Există două moduri de a calcula Tau-ul lui Kendall; alegem să calculăm relația de dependență odată ce observațiile fiecărei variabile au fost ordonate. În exemplul nostru, vom vedea că am clasat clasamentele din coloana X în ordine crescătoare.

Matematic,

Definim:

Cn = numărul total de perechi potrivite.

NCn = numărul total de perechi neconcordante (discordante).

Procedură și exemplu practic

Pentru a obține Tau-ul lui Kendall, trebuie mai întâi să știm cum să identificăm perechile concordante și discordante de două variabile.

Vom folosi preferințele schiorilor. În acest exemplu presupunem că vrem să evaluăm dacă schiorii își clasifică preferințele pentru schiul alpin sau schiul nordic în aceeași ordine într-o stație i. Evaluările lor pot varia de la 1 (foarte preferabil) la 7 (foarte puțin preferabil).

Întrebarea noastră ar fi: există o dependență între preferințele schiorilor de alpinism și a schiorilor nordici în stațiunile de schi date?

Definim:

X = ratingul schiorilor pentru schiul alpin în stația i.

Y = evaluarea schiorilor pentru schiul nordic la stația i.

C = perechi concordante.

NC = perechi nepotrivite / discordante.

ȘIeu = stațiune de schi i.

Proces

  • Pornim de la un eșantion de n = 7 observațiile stațiunii de schi. Fiecare rând al tabelului este clasificări date de schiori. Fiecare pereche de stații poate fi concordantă sau discordantă. În coloanele C și NC numărăm doar perechile într-o singură direcție. De exemplu, perechea AB și BA sunt numărate ca o singură pereche pentru a evita repetările.

Observațiile obținute sunt:

Statiune de schi (eu) X Z
LA 1 1
B 2 3
C 3 4
D 4 2
ȘI 5 7
F 6 6
G 7 5
  1. Am sortat elementele coloanei X în ordine crescătoare pentru a le putea compara cu elementele coloanei Z
  2. Găsim perechile concordante și perechile discordante.
Statiune de schi (eu) X Z CNC
LA 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
ȘI 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Mai întâi ne uităm la coloana Z, deoarece coloana X este deja sortată în ordine crescătoare. În consecință, toate clasificările din coloana Z care nu sunt ascendente vor fi perechi de stații discordante.
    • Când căutăm perechi de stații (concordante și neconcordante) vom avea întotdeauna ultimul rând de observații, deoarece căutăm perechi (seturi de două observații).
    • Toți cei care se află sub o clasificare de referință vor fi perechi concordante. În primul caz, ambii schiori stabilesc această clasificare de referință la 1. Toate clasificările de sub 1 vor fi perechi concordante cu A. În total avem 7 stații de clasificat. Deci, vor exista 6 perechi concordante de A. Deoarece nu avem perechi discordante asociate cu A, vom pune un zero.

Citiți a doua parte a lui Kendall's Tau (II)

Vei ajuta la dezvoltarea site-ului, partajarea pagina cu prietenii

wave wave wave wave wave