Как узнать, когда следует выбирать между $\rho$ Спирмена и $r$ Пирсона? Моя переменная включает удовлетворенность, и баллы были интерпретированы с помощью суммы баллов. Однако эти баллы могут быть также ранжированы.
Самый короткий и в основном правильный ответ:
Pearson определяет линейную зависимость, Spearman - монотонную зависимость (на несколько бесконечностей более общий случай, но для некоторого компромисса по мощности).
Так что если вы предполагаете/думаете, что связь линейная (или, как частный случай, что это две меры одного и того же, так что связь $y=1\cdot x+0$) и ситуация не слишком сложная (проверьте другие ответы для деталей), выбирайте Pearson. В противном случае используйте Спирмена.
Такое часто случается в статистике: существует множество методов, которые можно применить в вашей ситуации, и вы не знаете, какой из них выбрать. Вы должны основывать свое решение на плюсах и минусах рассматриваемых методов и специфике вашей проблемы, но даже в этом случае решение обычно субъективно и не имеет согласованного "правильного" ответа. Обычно хорошей идеей является опробовать столько методов, сколько кажется разумным и сколько позволит ваше терпение, и посмотреть, какие из них в конечном итоге дадут вам наилучшие результаты.
Разница между корреляцией Пирсона и корреляцией Спирмена заключается в том, что корреляция Пирсона больше подходит для измерений, проводимых по интервальной шкале, в то время как корреляция Спирмена больше подходит для измерений, проводимых по ординальной шкале. Примерами интервальных шкал являются "температура по Фаренгейту" и "длина в дюймах", в которых отдельные единицы измерения (1 градус по Фаренгейту, 1 дюйм) имеют смысл. Такие вещи, как "баллы удовлетворенности", имеют тенденцию к порядковому типу, поскольку, хотя ясно, что "5 счастья" - это больше счастья, чем "3 счастья", неясно, можно ли дать осмысленную интерпретацию "1 единицы счастья". Но когда вы суммируете много измерений порядкового типа, что и произошло в вашем случае, вы получаете измерение, которое на самом деле не является ни порядковым, ни интервальным, и его трудно интерпретировать.
Я бы рекомендовал вам преобразовать ваши оценки удовлетворенности в квантильные оценки и затем работать с их суммами, так как это даст вам данные, которые немного лучше поддаются интерпретации. Но даже в этом случае неясно, какой критерий - Пирсона или Спирмена - будет более подходящим.
Соглашаясь с ответом Чарльза, я бы предложил (с чисто практической точки зрения) вычислить оба коэффициента и посмотреть на разницу. Во многих случаях они будут совершенно одинаковыми, так что вам не стоит беспокоиться.
Если же они отличаются, то вам нужно посмотреть, выполнили ли вы предположения Пирсона (постоянная дисперсия и линейность), и если они не выполнены, то вам, вероятно, лучше использовать Спирмена.