Загрузить PDF Загрузить PDF

Коэффициент корреляции ранга Спирмена позволяет определить, существует ли между двумя переменными зависимость, выражаемая монотонной функцией (то есть при росте одной переменной увеличивается и вторая, и наоборот). Приведенные в статье простые шаги позволят вам производить расчеты вручную, а также вычислять коэффициент корреляции при помощи программ Excel и R.

Метод 1
Метод 1 из 3:

Вычисление вручную

Загрузить PDF
  1. Таким образом вы упорядочите информацию, необходимую для расчета коэффициента корреляции ранга Спирмена. При этом вам понадобится:
    • 6 колонок, озаглавленных так, как показано выше на рисунке.
    • Количество строк, соответствующее числу пар переменных.
  2. В третьей колонке запишите номера (ранги) пар переменных от 1 до n (общее число пар). Присвойте номер 1 паре с наименьшим значением в первой колонке, 2 -- следующему за ним значению, и так по возрастанию величин переменной из первой колонки.
  3. В четвертой колонке сделайте то же, что и в третьей, но на этот раз пронумеруйте пары переменных по второй колонке таблицы.
  4. В колонке "d" вычислите разность между двумя рангами из предыдущих двух колонок. Например, если ранг в третьей колонке равен 1, а в четвертой – 3, то разница между ними составит 2. Знак не имеет значения, поскольку на следующем шаге эти числа будут возведены в квадрат.
  5. Возведите каждое значение из колонки "d" в квадрат и запишите полученные величины в колонку "d 2 ".
  6. Полученное значение находится между -1 и 1.
    Реклама
Метод 2
Метод 2 из 3:

Вычисление в Excel

Загрузить PDF
  1. 1
    Создайте новые колонки с рангами, соответствующими колонкам данных. Например, если данные внесены в Колонку A2:A11, используйте функцию "=RANK(A2,A$2:A$11)" и занесите результаты для всех строк в новую колонку.
  2. 2
    Найдите ранги для одинаковых величин, как описано в шагах 3 и 4 метода 1.
  3. 3
    В новой ячейке определите корреляцию между двумя колонками рангов с помощью функции "=CORREL(C2:C11,D2:D11)". В данном случае C и D – это колонки, содержащие ранги. Таким образом, в данной ячейке вы получите коэффициент ранговой корреляции Спирмена.
    Реклама
Метод 3
Метод 3 из 3:

Вычисление в R

Загрузить PDF
  1. 1
    Если у вас еще нет программы R для обработки статистических данных, приобретите ее (см. http://www.r-project.org ).
  2. 2
    Сохраните данные в формате CSV, расположив их в двух колонках, корреляцию между которыми вы собираетесь исследовать. Сохранить файл в данном формате легко посредством опции "Сохранить как".
  3. 3
    Откройте редактор R. Если вы еще не вошли в программу R, просто запустите ее. Для этого достаточно нажать иконку R на рабочем столе.
  4. 4
    Наберите команды:
    • d <- read.csv("NAME_OF_YOUR_CSV.csv") и нажмите клавишу ввода
    • cor(rank(d[,1]),rank(d[,2]))
    Реклама

Советы

  • Как правило, набор данных должен состоять не менее чем из 5 пар для того, чтобы можно было достоверно установить какую-либо корреляцию (3 пары было использовано в примере выше для простоты).
Реклама

Предупреждения

  • Коэффициент ранговой корреляции Спирмена позволяет установить лишь то, растут ли обе переменные или уменьшаются одновременно. Если разброс данных слишком велик, этот коэффициент не даст точного значения корреляции.
  • Приведенная функция даст верный результат при отсутствии одинаковых значений в массиве данных. Если такие значения существуют, как в рассмотренном нами примере, необходимо использовать следующее определение: коэффициент корреляции, основанный на рангах.
Реклама

Об этой статье

Эту страницу просматривали 74 012 раз.

Была ли эта статья полезной?

Реклама