Tau de Kendall (I) - Ce este, definiție și concept

Este o măsură de dependență non-parametrică care identifică perechile concordante și discordante de două variabile. Odată identificate, totalurile sunt calculate și se face coeficientul.

Corelațiile clasificate sunt o alternativă non-parametrică ca măsură a dependenței între două variabile atunci când nu putem aplica coeficientul de corelație Pearson.

Cu alte cuvinte, atribuim un clasament observațiilor fiecărei variabile și studiem relația de dependență dintre două variabile date. Există două moduri de a calcula Tau-ul lui Kendall; alegem să calculăm relația de dependență odată ce observațiile fiecărei variabile au fost ordonate. În exemplul nostru, vom vedea că am clasat clasamentele din coloana X în ordine crescătoare.

Matematic,

Definim:

Cn = numărul total de perechi potrivite.

NCn = numărul total de perechi neconcordante (discordante).

Procedură și exemplu practic

Pentru a obține Tau-ul lui Kendall, trebuie mai întâi să știm cum să identificăm perechile concordante și discordante de două variabile.

Vom folosi preferințele schiorilor. În acest exemplu presupunem că vrem să evaluăm dacă schiorii își clasifică preferințele pentru schiul alpin sau schiul nordic în aceeași ordine într-o stație i. Evaluările lor pot varia de la 1 (foarte preferabil) la 7 (foarte puțin preferabil).

Întrebarea noastră ar fi: există o dependență între preferințele schiorilor de alpinism și a schiorilor nordici în stațiunile de schi date?

Definim:

X = ratingul schiorilor pentru schiul alpin în stația i.

Y = evaluarea schiorilor pentru schiul nordic la stația i.

C = perechi concordante.

NC = perechi nepotrivite / discordante.

ȘIeu = stațiune de schi i.

Proces

  • Pornim de la un eșantion de n = 7 observațiile stațiunii de schi. Fiecare rând al tabelului este clasificări date de schiori. Fiecare pereche de stații poate fi concordantă sau discordantă. În coloanele C și NC numărăm doar perechile într-o singură direcție. De exemplu, perechea AB și BA sunt numărate ca o singură pereche pentru a evita repetările.

Observațiile obținute sunt:

Statiune de schi (eu) X Z
LA 1 1
B 2 3
C 3 4
D 4 2
ȘI 5 7
F 6 6
G 7 5
  1. Am sortat elementele coloanei X în ordine crescătoare pentru a le putea compara cu elementele coloanei Z
  2. Găsim perechile concordante și perechile discordante.
Statiune de schi (eu) X Z CNC
LA 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
ȘI 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Mai întâi ne uităm la coloana Z, deoarece coloana X este deja sortată în ordine crescătoare. În consecință, toate clasificările din coloana Z care nu sunt ascendente vor fi perechi de stații discordante.
    • Când căutăm perechi de stații (concordante și neconcordante) vom avea întotdeauna ultimul rând de observații, deoarece căutăm perechi (seturi de două observații).
    • Toți cei care se află sub o clasificare de referință vor fi perechi concordante. În primul caz, ambii schiori stabilesc această clasificare de referință la 1. Toate clasificările de sub 1 vor fi perechi concordante cu A. În total avem 7 stații de clasificat. Deci, vor exista 6 perechi concordante de A. Deoarece nu avem perechi discordante asociate cu A, vom pune un zero.

Citiți a doua parte a lui Kendall's Tau (II)

Posturi Populare

ValueSchool și partener pentru a stimula educația financiară

Economipedia și Value School își unesc forțele pentru a promova educația financiară și pentru a facilita înțelegerea unor subiecte de bază precum economisirea, finanțarea și investițiile. Pe de o parte, ValueSchool este un proiect axat pe promovarea culturii financiare, a economiilor și a investițiilor în Spania. Născut din nevoia de a împărtăși Citiți mai multe…

Big data modelează lumea viitorului

S-au spus multe despre Big Data și impactul pe care acesta îl are asupra unor sectoare, nu numai economice și de afaceri, ci și asupra administrației publice sau a sănătății. Dar ce înseamnă Big Data? Big Data se referă la volumul enorm de date care este generat astăzi în diferite acțiuni care Citește mai mult…

Ce tipuri de credite sunt cele mai frecvente în rândul spaniolilor?

Trăim într-o societate în care trebuie să ne confruntăm zilnic cu nenumărate cheltuieli. Cu toate acestea, lichiditatea noastră nu ne permite întotdeauna să o facem din cauza decalajului de timp care există de obicei între cât și când introducem bani și cât și când îi cheltuim. Solicitarea unui împrumut este, atunci, cea mai răspândită soluție atât pentru rezolvarea unei urgențe, cât și pentru a citi mai multe…