El coeficiente de correlación de Spearman permite identificar si dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el otro también o viceversa). Sigue las instrucciones de nuestro sencillo tutorial para hacer el cálculo a mano o para calcular el coeficiente de correlación en Excel o R.
Pasos
-
Dibuja tu tabla. Esta organizará la información que necesitas para calcular el coeficiente de correlación de Spearman. Necesitarás:
- 6 columnas con encabezados como se muestra a continuación.
- Las filas necesarias para poner los pares de datos que tengas.
-
Llena las primeras dos columnas con los pares de datos.
-
En tu tercer columna clasifica tus datos de la primera columna del 1 hasta n (el número de datos que tienes). Comienza con el más bajo, el cual debe tener el 1, el siguiente número más bajo el 2 y así sucesivamente.
-
En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la segunda columna en lugar de la primera.
- Si dos (o más) valores de de datos son iguales, halla la media del rango que hubieran tenido normalmente y clasifícalos con este promedio.
En el ejemplo que se muestra existen 2 número 5 que deberían tener el rango 2 y 3. Pero como son datos iguales, calcula el promedio del rango que les correspondería. El promedio de 2 y 3 es 2,5, por lo que se asigna a ambos números el lugar 2,5 de la clasificación.
- Si dos (o más) valores de de datos son iguales, halla la media del rango que hubieran tenido normalmente y clasifícalos con este promedio.
-
En la columna "d" calcula la diferencia del número de clasificación para cada par de datos. Esto quiere decir que si un dato es tiene el 1 y el otro el número 3, la diferencia sería de 2 (no importa el signo porque el siguiente paso es elevarlo al cuadrado).
-
Eleva al cuadrado cada número de la columna "d" y escribe estos valores en la columna "d 2 ".
-
Suma todos los valores que hay en la columna "d 2 ". Este resultado es Σd 2 .
-
Escoge alguna de las siguientes fórmulas:
- Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada del coeficiente de correlación de Spearman
y reemplaza "n" por el número de pares de datos que tienes para calcular la respuesta. - Si hay alguna relación en cualquiera de los pasos anteriores, usa más bien la fórmula estándar de coeficiente de correlación de Spearman:
- Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada del coeficiente de correlación de Spearman
-
Interpreta el resultado. Puede variar entre -1 y 1.
- Cercano a -1: correlación negativa
- Cercano a 0: sin correlación linear
- Cercano a 1: correlación positiva
- Recuerda dividir entre el total exacto de resultados, luego redúcelo a la mitad. A continuación, divídelo entre Σd 2
.
Anuncio
-
1Crea una nueva columna con los rangos de las columnas existentes. Por ejemplo, si los datos están en la columna A2:A11, deberás utilizar la fórmula "=RANK(A2,A$2:A$11)" y copiar hacia abajo y a través de todas las filas y columnas.
-
2Rompe las relaciones como hemos descrito en el paso 3 y 4 del método 1.
-
3En una nueva celda, haz una correlación entre las dos columnas de rango con algo como "=CORREL(C2:C11,D2:D11)". En este caso, C y D se corresponderían con las columnas de rango. La celda de correlación tendrá el coeficiente de correlación de Spearman.Anuncio
-
1
-
2Guarda los datos en un archivo CSV con los datos que deseas correlacionar en las dos primeras columnas. Generalmente se puede hacer en la opción "Guardar como".
-
3Abre el editor de R. Si estás en el terminal, simplemente ejecuta R. En el escritorio, debes hacer clic en el logo R.
-
4Escribe los comandos:
- d <- read.csv("NAME_OF_YOUR_CSV.csv") y pulsa "Enter".
- cor(rank(d[,1]),rank(d[,2]))
Anuncio
Consejos
- La mayoría de los conjuntos de datos deben ser al menos 5 pares para poder identificar una tendencia (se usaron 3 para el ejemplo para que fuera más sencilla la demostración).
Anuncio
Advertencias
- El coeficiente de correlación de Spearman solo identifica la fortaleza de correlación donde los datos son constantemente crecientes o decrecientes. Si se utiliza una gráfica de dispersión de datos, el coeficiente Spearman no dará una representación acertada de esta correlación.
- Esta fórmula está basada en el supuesto de que no haya relaciones entre las variables. Si hay relaciones como en el ejemplo, deberás usar la definición: momento del producto de coeficiente de correlación basado en rangos.
Anuncio
Acerca de este wikiHow
Esta página ha recibido 89 274 visitas.
Anuncio