Ako si mám vybrať medzi Spearmanovým koeficientom $\rho$ a Pearsonovým koeficientom $r$? Moja premenná zahŕňa spokojnosť a skóre bolo interpretované pomocou súčtu skóre. Tieto skóre by sa však mohli aj zoradiť.
Najkratšia a najsprávnejšia odpoveď je:
(niekoľko nekonečností všeobecnejší prípad, ale pre určitý výkonový kompromis).
Ak teda predpokladáte/uvažujete, že vzťah je lineárny (alebo, ako špeciálny prípad, že ide o dve miery tej istej veci, takže vzťah je $y=1\cdot x+0$) a situácia nie je príliš zlá (podrobnosti si pozrite v iných odpovediach), vyberte Pearsona. V opačnom prípade použite Spearmanovu metódu.
V štatistike sa to stáva často: existuje viacero metód, ktoré by sa dali použiť vo vašej situácii, a vy neviete, ktorú si vybrať. Pri rozhodovaní by ste mali vychádzať z výhod a nevýhod zvažovaných metód a zo špecifík vášho problému, ale aj tak je rozhodnutie zvyčajne subjektívne a neexistuje žiadna dohodnutá "správna" odpoveď. Zvyčajne je dobré vyskúšať toľko metód, koľko sa vám zdá rozumné a koľko vám vaša trpezlivosť dovolí, a zistiť, ktoré z nich vám nakoniec prinesú najlepšie výsledky.
Rozdiel medzi Pearsonovou koreláciou a Spearmanovou koreláciou spočíva v tom, že Pearsonova korelácia je najvhodnejšia pre merania z intervalovej stupnice, zatiaľ čo Spearmanova korelácia je vhodnejšia pre merania z ordinálnej stupnice. Príkladom intervalových stupníc sú "teplota vo Farenheitoch" a "dĺžka v palcoch", v ktorých majú význam jednotlivé jednotky (1 stupeň F, 1 palec). Veci ako "skóre spokojnosti" bývajú ordinálneho typu, pretože hoci je jasné, že "5 šťastia" je šťastnejšie ako "3 šťastia", nie je jasné, či by ste mohli dať zmysluplnú interpretáciu "1 jednotky šťastia". Keď však sčítate mnoho meraní ordinálneho typu, čo je to, čo máte vo vašom prípade, dostanete meranie, ktoré v skutočnosti nie je ani ordinálne, ani intervalové a ťažko sa interpretuje.
Odporúčal by som vám previesť vaše skóre spokojnosti na kvantilové skóre a potom pracovať so súčtami týchto skóre, pretože tak získate údaje, ktoré sa dajú o niečo lepšie interpretovať. Ale ani v tomto prípade nie je jasné, či by bolo vhodnejšie použiť Pearsonov alebo Spearmanov koeficient.
Hoci súhlasím s odpoveďou Charlesa, navrhol by som (z čisto praktického hľadiska), aby ste vypočítali oba koeficienty a pozreli sa na rozdiely. V mnohých prípadoch budú úplne rovnaké, takže sa nemusíte obávať.
Ak sa však líšia, musíte sa pozrieť na to, či ste splnili Pearsonove predpoklady (konštantný rozptyl a linearita), a ak nie sú splnené, pravdepodobne je lepšie použiť Spearmansov koeficient.