Rho-ul lui Spearman este o măsură de dependență non-parametrică în care se calculează ierarhia medie a observațiilor, diferențele sunt pătrate și încorporate în formulă.
Cu alte cuvinte, atribuim un clasament observațiilor fiecărei variabile și studiem relația de dependență dintre două variabile date.
Corelațiile clasificate sunt o alternativă non-parametrică ca măsură a dependenței între două variabile atunci când nu putem aplica coeficientul de corelație Pearson.
În general, litera giega este atribuită rho la coeficientul de corelație.
Estimarea rho a lui Spearman este dată de:
Procedura Rho Spearman
0. Plecăm de la un eșantion de n observații (Aeu, Beu).
1. Clasificați observațiile fiecărei variabile ajustându-le pentru legături.
- Folosim o funcție excel care clasifică observațiile pentru noi și le ajustează automat dacă găsește legături între elemente. Această funcție se numește HERARCH.MEDIA (clasificare Aeu; O clasificaren;Ordin).
- Ultimul factor al funcției este opțional și ne spune în ce ordine dorim să ordonăm observațiile. Un număr diferit de zero va ordona observațiile în ordine crescătoare. De exemplu, va atribui cel mai mic element un rang de 1. Dacă punem un zero în variabilă Ordin, va atribui cel mai mare articol un rang de 1 (ordine descrescătoare).
Exemplu practic
- În cazul nostru, atribuim variabilei de ordine un număr diferit de zero pentru a ordona observațiile în ordine crescătoare. Adică, atribuind celui mai mic element al variabilei un rang de 1.
- Verificăm dacă sumele totale ale coloanelor din Clasificarea A Da Clasificarea B sunt egali între ei și se întâlnesc:
În acest caz n = 10 pentru că avem un total de 10 elemente / observații în fiecare variabilă LA Da B.
Suma totală a clasificării A este egală cu suma totală a clasificării Y și îndeplinesc, de asemenea, formula de mai sus.
LA | B | Clasificarea A | Clasificarea B | Diferențe pătrate |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Total | 55 | 55 | 130 |
2. Adăugați diferențele dintre clasamente și păstrați-le.
- Odată ce avem toate observațiile clasificate luând în considerare legăturile dintre ele, calculăm diferența în formă:
deu = Aeu - Beu
Definim (deu) ca diferență între clasificarea lui Aeu și clasificarea lui Beu.
- Odată obținută diferența, o pătrăm. Pătratele diferențelor sunt aplicate pentru a avea doar valori pozitive.
Definim deu2 ca diferența pătrată între clasificarea lui Aeu și clasificarea lui Beu.
În coloana diferențelor pătrate vom avea:
deu2 = (Aeu - Beu)2
3. Calculați rho-ul lui Spearman:
- Calculăm suma totală a diferențelor pătrate ale formei:
În exemplul nostru:
- Incorporăm rezultatul în formula rho a lui Spearman:
În exemplul nostru:
Comparație: Pearson vs Spearman
Dacă calculăm coeficientul de corelație al lui Pearson având în vedere observațiile anterioare și îl comparăm cu coeficientul de corelație al lui Spearman, obținem:
- Pearson = 0,1010
- Spearman = 0,2121
Putem vedea că dependența dintre variabilele A și B rămâne slabă chiar și folosind Spearman în loc de Pearson.
Dacă valorile aberante ar avea o influență mare asupra rezultatelor, am găsi o diferență mare între Pearson și Spearman și, prin urmare, ar trebui să îl folosim pe Spearman ca măsură a dependenței.