PDF download Descargar el PDF PDF download Descargar el PDF

La covarianza es una estadística que te permite determinar la relación entre dos conjuntos de datos. Por ejemplo, digamos que un grupo de antropólogos estudia el peso y la estatura de una población que pertenece a una determinada cultura. El peso y la estatura de cada participante del estudio pueden representarse como un par de datos en el formato ( x , y ). Luego, puedes reemplazar estos valores en una fórmula estándar para calcular la covarianza entre ambos. En este artículo, primero se explicarán los cálculos que deben realizarse para encontrar la covarianza entre dos conjuntos de datos y luego se abordarán formas más automatizadas de realizar estos cálculos.

Método 1
Método 1 de 4:

Calcular la covarianza a mano usando la fórmula estándar

PDF download Descargar el PDF
  1. Esta es . Sin embargo, para poder usarla, primero debes comprender lo que significan las variables y los símbolos: [1]
    • : esta es la letra S griega y, en las funciones matemáticas, se coloca antes de una serie de números para indicar que deben sumarse. En la fórmula para la covarianza, este símbolo indica que debes calcular la suma de los valores que conforman el numerador de la fracción para luego dividirlos entre el denominador. [2]
    • : esta variable se expresa como " x sub i ". La " i " en superíndice funciona como un contador e indica que debes realizar el cálculo para cada uno de los valores dentro del conjunto de datos x .
    • : las letras "prom" se refieren al valor promedio de los valores dentro del conjunto de datos x . El promedio a veces se expresa como una x con una línea horizontal sobre ella y se refiere a él como " x barra". En cualquier caso, representa el promedio del conjunto de datos x .
    • : esta variable se expresa como " y sub i ". La " i " en superíndice funciona como un contador e indica que debes realizar el cálculo para cada uno de los valores dentro del conjunto de datos y .
    • : las letras "prom" se refieren al valor promedio de los valores dentro del conjunto de datos y . El promedio a veces se expresa como una y con una línea horizontal sobre ella y se refiere a él como " y barra". En cualquier caso, representa el promedio del conjunto de datos y .
    • : esta variable representa la cantidad de ítems que hay en un conjunto de datos. En un problema de covarianza, cada ítem está compuesto por un valor de x y un valor de y , por lo que el valor de n representa la cantidad de pares de datos, no la cantidad de números individuales.
  2. Puede serte útil reunir todos los datos en un mismo lugar antes de empezar a calcular. Para ello, elabora una tabla de cinco columnas, cada una de las cuales debe estar etiquetada de la siguiente forma:
    • : en esta columna, ingresa los valores del conjunto de datos x .
    • : en esta columna, ingresa los valores del conjunto de datos y , asegurándote de alinearlos con los valores correspondientes de x . En los problemas de covarianza, es importante colocar los pares de datos en orden y emparejar los valores de x con los valores de y .
    • : debes empezar con esta columna en blanco, ya que la llenarás después cuando calcules el promedio de los valores de x .
    • : debes empezar con esta columna en blanco, ya que la llenarás después cuando calcules el promedio de los valores de y .
    • : también debes dejar esta columna en blanco, ya que la llenarás a medida que realizas los cálculos.
  3. El conjunto de datos x en este ejemplo contiene 9 valores, por lo que, para encontrar el promedio, debes sumarlos y dividir el resultado entre 9. Esto te dará 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Si divides 44 entre 9, la respuesta será 4,89. Reemplazarás este valor por la variable x (prom) en los siguientes cálculos.
  4. El conjunto de datos y también debe tener 9 números. Para encontrar el promedio, primero tienes que sumarlos. En este caso, el resultado será 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Si divides esto entre 9, obtendrás 5,44. Reemplazarás este valor por la variable y (prom) en los siguientes cálculos.
  5. Calcula los valores de . Calcula la diferencia entre cada ítem de la columna que contenga los valores de x y el promedio que hayas calculado para esta columna. En este ejemplo, debes restar 4,89 a cada valor de x . Si el valor de x es menor que el promedio, obtendrás un resultado negativo y, si es mayor, obtendrás un resultado positivo. Ten mucho cuidado con los signos negativos. [3]
    • Por ejemplo, el primer valor de la columna " x " es 1. Por tanto, en la primera línea de la columna , debes ingresar el resultado de 1 - 4,89 o -3,89.
    • Repite el procedimiento para cada valor de x . Entonces, en la segunda línea de la columna , debes ingresar el resultado de 3 - 4,89 o 1,89. En la tercera línea, debes ingresar 2 - 4,89 o 2,89. Continúa hasta llenar toda la columna. Al terminar, debes haber obtenido los siguientes valores: -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89 y -0,89.
  6. Calcula los valores de . En esta columna, debes realizar operaciones similares pero esta vez con los valores de y y el promedio que hayas calculado para ellos. Si el valor de y es menor que el promedio, obtendrás un resultado negativo y, si es mayor, el resultado será positivo. Ten cuidado con los signos negativos. [4]
    • Por tanto, en la primera línea de la columna , debes ingresar 8 - 5,44 o 2,56.
    • En la segunda línea, debes ingresar 6 - 5,44 o 0,56.
    • Repite el procedimiento hasta llegar al final de la columna. Al terminar, debes haber obtenido los siguientes valores: 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56 y 1,56.
  7. Para llenar la columna , multiplica los valores que hayas ingresado en las dos columnas anteriores, y . Ten cuidado de multiplicar los valores de las filas correctas y de tener en cuenta los signos negativos. [5]
    • Los valores que ingresaste en la primera fila de las columnas y son -3,89 y 2,56, respectivamente. El producto de ambos es -3,89 * 2,56 = -9,96.
    • En la segunda fila, debes multiplicar -1,88 * 0,56 = -1,06.
    • Repite el procedimiento fila por fila hasta llegar al final de ambas columnas. Al terminar, debes haber obtenido los siguientes valores en la columna : -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4,51 y -1,39.
  8. Aquí es en donde aplica el símbolo Σ. Debes sumar los resultados obtenidos en el paso anterior. Para los conjuntos de datos en este ejemplo, debes sumar los nueve valores en la última columna, prestando mucha atención a los signos.
    • En este caso, el resultado es -64,57, el cual debes escribir debajo del último recuadro de la columna . Este valor corresponde al numerador en la fórmula estándar de la covarianza.
  9. El numerador es el número que acabas de calcular y el denominador es ( n - 1), lo que quiere decir que debes restarle 1 a la cantidad de pares de datos.
    • Como en este ejemplo hay nueve pares de datos, n = 9. Por tanto, el valor de ( n - 1) es 8.
  10. Por último, debes dividir el numerador, , entre el denominador, . El cociente de esta división será la covarianza de estos datos. [6]
    • En este ejemplo, debes dividir -64,57/8, lo cual da como resultado -8,07.
    Anuncio
Método 2
Método 2 de 4:

Calcular la covarianza usando una hoja de cálculo de Excel

PDF download Descargar el PDF
  1. Para comprender el significado de los resultados de la covarianza, debes calcularla a mano varias veces. Sin embargo, si utilizas la covarianza rutinariamente para interpretar datos, es probable que necesites una forma más rápida y aerodinamizada de obtener los resultados. Después de realizar los cálculos en la sección anterior, te habrás dado cuenta de que, incluso para un conjunto de solo nueve pares de datos, debes encontrar dos promedios diferentes y realizar 18 restas, 9 multiplicaciones, una suma y una división. En total, esto son 31 operaciones separadas para encontrar una sola solución, a lo largo de las cuales puedes olvidar un signo negativo o copiar mal los valores y, de esta forma, comprometer el resultado final.
  2. Puedes usar Excel (o algún otro programa de hojas de cálculo) para elaborar una tabla y calcular la covarianza. Etiqueta cada columna como lo hiciste en la sección anterior: " x ", " y ", "( x ( i )- x (prom))", "( y ( i )- y (prom))" y "Producto". [7]
    • Puedes simplificar los nombres de las columnas etiquetando la tercera como "Diferencia para los valores de x " y la cuarta como "Diferencia para los valores de y " o de alguna forma similar siempre y cuando puedas recordar a qué te refieres.
    • Si la tabla empieza directamente en la esquina superior izquierda de la hoja de cálculo, empezarás a colocar los nombres de las columnas en la celda A1 y terminarás en la celda E1.
  3. Ingresa los valores en las columnas etiquetadas como " x " e " y ". Recuerda emparejar cada valor de y con el valor de x correspondiente, ya que el orden de los datos es importante. [8]
    • Empieza a ingresar los valores de la columna " x " en la celda A2.
    • Empieza a ingresar los valores de la columna " y " en la celda B2.
  4. En Excel, puedes calcular los promedios fácilmente ingresando la fórmula "=PROMEDIO(A2:A___)" en la celda debajo del último valor de cada columna. En el espacio en blanco, coloca el nombre de la celda en donde se encuentre el último valor de la columna cuyo promedio vayas a calcular. [9]
    • Por ejemplo, si tienes 100 valores de x , la columna " x " se extenderá desde la celda A2 hasta la celda A101. Por tanto, debes ingresar "=PROMEDIO(A2:A102)".
    • De forma similar, para calcular el promedio de los valores de y , debes ingresar la fórmula "=PROMEDIO(B2:B102)".
    • Recuerda que las fórmulas en Excel siempre deben empezar con un signo de "=".
  5. Ingresa la fórmula "=A2-____" para la primera resta en la celda C2. En el espacio en blanco, coloca el nombre de la celda en donde se encuentre el promedio que hayas calculado para todos los valores de x . [10]
    • En el ejemplo con 100 pares de datos, habrás calculado el promedio en la celda A103, así que debes ingresar la fórmula "=A2-A103" para la primera resta en la columna "( x ( i )- x (prom))".
  6. En este ejemplo, ingresa la fórmula "=B2-B103" para la primera resta en la celda D2. [11]
  7. En la celda E2, en la quinta columna, debes ingresar la fórmula para calcular el producto de los valores de las dos columnas anteriores, la cual será simplemente "=C2*D2". [12]
  8. Las fórmulas que acabas de ingresar aplican únicamente para el primer par de datos en la fila 2. Por tanto, debes copiar las fórmulas de manera que apliquen para todos los pares de datos en la tabla. Selecciona las celdas C2, D2 y E2 y coloca el cursor en el recuadro pequeño que aparece en la esquina inferior derecha de la selección hasta que aparezca un signo de "+". Presiona el botón izquierdo del ratón y mantenlo presionado mientras arrastras el cursor hacia abajo hasta haber seleccionado toda la tabla. Esto copiará automáticamente las fórmulas de las celdas C2, D2 y E2 al resto de cada columna y la tabla se llenará con los valores correspondientes. [13]
  9. Para calcular la suma de los valores de la columna "Producto", debes ingresar la fórmula "=SUMA(E2:E___)" en la celda debajo del último valor de esta columna. En el espacio en blanco, coloca la celda en donde se encuentre este último valor. [14]
    • En este ejemplo, la celda debajo del último valor de esta columna es E103, por lo que debes ingresar la fórmula "=SUMA(E2:E102)".
  10. También puedes realizar este cálculo automáticamente en Excel. La fórmula que ingresaste en la celda E103 constituye el numerador en la fórmula para calcular la covarianza. Por tanto, puedes ingresar la fórmula "=E103/___" debajo de esta celda. En el espacio en blanco, ingresa la cantidad de valores que haya en cada conjunto de datos. En este ejemplo, debes ingresar el número 100. El resultado de este cálculo será la covarianza de ambos conjuntos de datos. [15]
    Anuncio
Método 3
Método 3 de 4:

Calcular la covarianza usando calculadoras en línea

PDF download Descargar el PDF
  1. Existen varias instituciones educativas, empresas de programación y otras organizaciones similares que han creado sitios web en donde puedes calcular fácilmente la covarianza. Puedes encontrarlos ingresando "calculadora de covarianza" en un motor de búsqueda.
  2. Sigue las instrucciones del sitio web para ingresar los datos correctamente. Debes mantener en orden los pares de datos o, de lo contrario, obtendrás una covarianza incorrecta. Cada sitio web tiene una forma diferente de ingresar los datos.
    • Por ejemplo, en este sitio web , debes ingresar los valores de x y de y en recuadros horizontales separados y colocar una coma entre cada valor. Por tanto, si fueras a ingresar el conjunto de datos utilizado en la primera sección de este artículo, los valores de x y de y se verían así, respectivamente: "1,3,2,5,8,7,12,2,4" y "8,6,9,4,3,3,2,7,7".
    • En este otro sitio web , debes ingresar los valores de x verticalmente en el primer recuadro, colocando un solo número en cada línea. Por tanto, se verían así:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. El principal atractivo de estos sitios web es que solo tienes que apretar un botón que diga "Calcular" después de ingresar los datos para obtener los resultados automáticamente. En la mayoría de estos sitios, puedes calcular inmediatamente los valores de " x (prom)", " y (prom)" y " n ".
    Anuncio
Método 4
Método 4 de 4:

Interpretar los resultados de la covarianza

PDF download Descargar el PDF
  1. La covarianza es una estadística que representa la relación entre dos conjuntos de datos. Volviendo al ejemplo mencionado en la introducción, al calcular la relación entre el peso y la estatura, se espera que el peso incremente si la estatura incrementa, lo cual daría una covarianza positiva. Como otro ejemplo, al estudiar la relación entre la cantidad de horas durante las cuales una persona practica golf y la puntuación que obtiene, la covarianza debería ser negativa, ya que, a medida que la cantidad de horas de práctica incrementa, la puntuación debe disminuir (en el golf se gana con una menor puntuación). [16]
    • Considera los conjuntos de datos usados en la primera sección de este artículo. La covarianza fue de -8,07. En este caso, el signo negativo quiere decir que los valores de y disminuyen a medida que los valores de x aumentan, lo cual puedes comprobar observando algunos valores. Por ejemplo, los valores 1 y 2 de x corresponden a los valores 7, 8 y 9 de y . Asimismo, los valores 8 y 12 de x corresponden a los valores 3 y 2 de y , respectivamente.
  2. Si la covarianza es alta (ya sea positiva o negativa), esto quiere decir que los dos conjuntos de datos están estrechamente relacionados de una forma ya sea positiva o negativa. [17]
    • En el ejemplo anterior, una covarianza de -8,07 es relativamente alta, ya que los valores de los datos oscilan entre 1 y 12. Esto indica una relación muy estrecha entre los conjuntos de valores de x y de y .
  3. Si la covarianza es un número igual o muy cercano a 0, esto quiere decir que los conjuntos de datos casi no tienen relación, por lo que un incremento en un valor de x no necesariamente ocasionará un incremento en un valor de y . En este caso, ambos valores están relacionados arbitrariamente. [18]
    • Por ejemplo, imagina que quieres comparar tallas de zapatos y resultados de exámenes académicos. Debido a que los resultados de los exámenes se ven afectados por una cantidad de factores, la covarianza será un valor cerca de 0, lo que indica que no existe una conexión entre ambos valores.
  4. Puedes trazar los puntos en un plano de coordenadas para ilustrar la covarianza. Por ejemplo, si trazas los conjuntos de datos del ejemplo anterior, podrás ver que, aunque los puntos no se encuentran exactamente en línea recta, se aglomeran en diagonal desde la esquina superior izquierda hasta la esquina inferior derecha. Esto indica una covarianza negativa, cuyo valor observarás que es -8,07. Como se mencionó anteriormente, este número es bastante grande en relación con los valores de los conjuntos de datos. Esto, además de la apariencia relativamente lineal de los puntos en el gráfico, indica que la covarianza es fuerte.
    Anuncio

Advertencias

  • La covarianza tiene aplicaciones limitadas en el ámbito de la estadística. Con frecuencia, es uno de los valores que debes obtener para calcular los coeficientes de correlación u otros términos similares, pero no debes interpretar un conjunto de datos basándote exclusivamente en la covarianza.
Anuncio

Acerca de este wikiHow

Esta página ha recibido 161 846 visitas.

¿Te ayudó este artículo?

Anuncio