Baixe em PDF Baixe em PDF

A covariância é um cálculo estatístico que pode ajudá-lo a entender como dois conjuntos de dados estão relacionados entre si. Por exemplo, digamos que existam antropólogos estudando as alturas e os pesos da população de um determinado local. Para cada pessoa no estudo, a altura e o peso poderão ser representados por um par de dados (x,y). Esses valores podem ser usados com uma fórmula padrão a fim de calcular a relação de covariância. Este artigo explicará primeiramente os cálculos que levam à descoberta da covariância de um determinado conjunto. A seguir, ele lidará com outras duas formas mais automatizadas para se chegar ao resultado.

Método 1
Método 1 de 4:

Calculando a covariância à mão com a fórmula padrão

Baixe em PDF
  1. A fórmula padrão para o cálculo da covariância é . Para usá-la, é preciso entender o significado das seguintes variáveis e símbolos: [1]
    • : esse símbolo representa a letra grega "sigma". Nas funções matemáticas, ela representa a soma da série de valores que a acompanha. Nessa fórmula, o sinal Σ indica que você calculará os valores seguintes no numerador da fração e os somará antes de fazer a divisão pelo denominador. [2]
    • : nesse caso, o 'i' subscrito representa um contador, ou índice. Ele indica que você realizará o cálculo de cada um dos valores de x presentes no conjunto de dados.
    • : o "med" indica que x(med) representa o valor médio de todos os pontos em x. Essa média também pode ser escrita como um x com uma pequena linha horizontal sobre ele. Nesse caso, a variável é chamada de "x barra", mas ainda representa a média do conjunto de dados.
    • : novamente, o 'i' subscrito representa um contador, ou índice. Ele indica que você fará o cálculo de cada um dos valores de y presentes no conjunto de dados.
    • : o "med" indica que y(med) representa o valor médio de todos os pontos em y. Essa média também pode ser escrita como um y com uma pequena linha horizontal sobre ele. Nesse caso, a variável é chamada de "y barra", mas ainda representa a média do conjunto de dados.
    • : essa variável representa a quantidade de itens presentes no conjunto de dados. Lembre-se de que, em um problema de covariância, um único "item" é composto tanto por um valor em x quanto por um valor em y. O valor n é um par de conjuntos de dados, não um número único.
  2. Antes de começar os cálculos, é preciso antes coletar os seus dados. Faça uma tabela com cinco colunas e dê a cada uma delas os seguintes nomes:
    • : nessa coluna, insira os valores dos pontos de dados em x.
    • : nessa coluna, insira os valores dos pontos de dados em y. Tome o cuidado de alinhar os valores em y com os valores correspondentes em x. Em um problema de covariância, a ordem dos pontos de dados e o emparelhamento entre x e y são importantes.
    • : deixe essa coluna em branco no início. Depois de calcular a média dos pontos de dados em x, ela será preenchida.
    • : deixe essa coluna em branco no início. Depois de calcular a média dos pontos de dados em y, ela será preenchida.
    • : deixe também essa última coluna em branco. Você a preencherá à medida que avançar na resolução.
  3. Esse conjunto de dados contém nove números. Para calcular a média entre eles, some-os e divida-os por 9. Como resultado, você obterá 1+3+2+5+8+7+12+2+4=44. Ao dividir esse valor por 9, a média será igual a 4,89. É esse o valor a ser usado como x(med) nos cálculos seguintes. [3]
  4. De modo similar, a coluna y consistirá de nove pontos de dados que coincidirão com os valores em x. Calcule a média desses valores. Nesse conjunto de dados, temos que 8+6+9+4+3+3+2+7+7=49. Divida esse resultado por 9 a fim de obter uma média igual a 5,44 para usá-la como y(med) nos cálculos seguintes. [4]
  5. Calcule os valores de . Para cada item na coluna x, é preciso calcular a diferença entre o número e a média. Nesse problema, é preciso subtrair 4,89 de cada ponto de dados em x. Se o valor original estiver abaixo da média, o resultado será negativo. Se, por outro lado, estiver acima da média, o resultado será positivo. Esteja atento aos sinais negativos. [5]
    • Por exemplo, os primeiros pontos de dados na coluna x são iguais a 1. O valor a ser inserido na primeira linha da coluna será igual a 1-4,89, ou -3,89.
    • Repita o processo com cada ponto de dados. Logo, a segunda linha será igual a 3-4,89, ou -1,89. A terceira linha será igual a 2-4,89, ou -2,89. Continue o processo com todos os pontos de dados. Nesse caso, os nove números da coluna equivalerão a -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89 e -0,89.
  6. Calcule os valores de . Nessa coluna, você fará subtrações parecidas, usando os pontos de dados em y e a média de valores em y. Se o ponto de dados original for menor que a média, o resultado será negativo. Se, por outro lado, for maior que a média, o resultado será positivo. Esteja atento aos sinais negativos. [6]
    • Na primeira linha, o cálculo será igual a 8-5,44, ou 2,56.
    • A segunda linha será igual a 6-5,44, ou 0,56.
    • Continue a fazer as subtrações até o fim da lista de dados. Ao terminar, os nove valores serão iguais a 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56 e 1,56.
  7. Você preencherá as linhas da coluna final multiplicando os números calculados nas colunas anteriores de e . Trabalhe sempre linha por linha, multiplicando os dois números pelos pontos de dados correspondentes. Esteja sempre atento a quaisquer sinais negativos necessários. [7]
    • Na primeira linha, o calculado será igual a -3,89, e o valor de será igual a 2,56. O produto de ambos os valores equivale a -3,89*2,56=-9,96.
    • Na segunda linha, você deve multiplicar os dois números: -1,88*0,56=-1,06.
    • Continue a multiplicar linha por linha até o final do conjunto de dados. Ao terminar, os nove valores nessa coluna serão iguais a -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4,51 e -1,39.
  8. É aqui que o símbolo Σ entra em jogo. Depois de fazer todos os cálculos necessários até aqui, você deverá somar os resultados. Com relação ao conjunto de dados do exemplo, você terá nove valores na coluna final. A seguir, some-os. Preste bastante atenção ao fato de cada número ser positivo ou negativo.
    • Com relação a esse conjunto de dados, a soma será igual a -64,57. Escreva esse total no espaço presente na base da coluna. Ele representa o valor do numerador na fórmula padrão de covariância.
  9. O numerador da fórmula padrão é representado pelo número que você acabou de calcular. O denominador, por sua vez, é representado por (n-1), ou seja, um valor uma unidade menor que a quantidade de pares no conjunto de dados.
    • Nesse exemplo, há nove pares de dados, de modo que n é igual a 9. Logo, o valor de (n-1) é igual a 8.
  10. O último passo no cálculo da covariância é dividir o numerador, , pelo denominador, . O quociente será igual à covariância dos dados. [8]
    • Nesse exemplo, o cálculo resultará em -64,57/8, que é igual a -8,07.
    Publicidade
Método 2
Método 2 de 4:

Usando uma planilha do Excel para calcular a covariância

Baixe em PDF
  1. A covariância é um cálculo que às vezes deve ser feito à mão para que você entenda o que o resultado significa. No entanto, se tiver que usar os valores de covariância rotineiramente para interpretar dados, é importante encontrar uma forma mais rápida e automatizada de se obter resultados. A essa altura, você terá observado que, para o conjunto de dados relativamente pequeno, com nove pares, os cálculos incluíram descobrir duas médias, fazer 18 subtrações individuais, nove multiplicações separadas, uma soma e uma divisão final. Foram 31 pequenos cálculos para chegar a uma única solução. Ao longo do caminho, você corre o risco de se esquecer de sinais negativos ou de copiar os resultados incorretamente, arruinando o resultado.
  2. Se você se sente confortável usando o Excel (ou outro programa de planilhas capaz de trabalhar com cálculos), fica fácil criar uma planilha que sirva para calcular a covariância. Dê os títulos das cinco colunas de acordo com o que foi feito nos cálculos à mão: x, y, (x(i)-x(med)), (y(i)-y(med)) e Produto. [9]
    • Para simplificar a rotulação, você pode dar à terceira coluna um nome como "diferença x", e à quarta, algo como "diferença y", desde que se lembre do que significam esses dados.
    • Se você começar a tabela no canto superior esquerdo da planilha, a célula A1 representará o rótulo x, acompanhada por todos os outros até chegar em E1.
  3. Insira os valores de dados nas duas colunas rotuladas de x e y. Lembre-se de que a ordem dos pontos de dados importa, sendo importante emparelhar cada valor em y com o valor em x correspondente. [10]
    • Os valores em x começarão na célula A2 e continuarão para baixo, contendo tantos pontos de dados quanto for necessário.
    • Os valores em y começarão na célula B2 e continuarão para baixo, contendo tantos pontos de dados quanto for necessário.
  4. O Excel é capaz de calcular as médias bem rapidamente. Na primeira célula vaga abaixo de cada coluna de dados, insira a fórmula =MED(A2:A___). Preencha o espaço em branco com a posição da célula correspondente ao último ponto de dados. [11]
    • Por exemplo, se você tiver 100 pontos de dados, eles preencherão o espaço que vai da célula A2 até a célula A101. Nesse caso, você escreverá =MED(A2:A101).
    • Para os valores em y, insira a fórmula =MED(B2:B101).
    • Lembre-se de que você inicia a fórmula no Excel com um sinal de =.
  5. Na célula C2, você terá que inserir a fórmula para calcular a primeira subtração. Ela será =A2-___. O espaço em branco deve ser preenchido com a posição da célula que contém a média dos valores em x. [12]
    • Para o exemplo dos 100 pontos de dados, a média estaria na célula A103, de modo que a fórmula ficaria =A2-A103.
  6. Seguindo o mesmo exemplo, ela estará na célula D2. Essa fórmula será escrita como =B2-B103. [13]
  7. Na quinta coluna, na célula E2, você terá que colocar a fórmula responsável por calcular o produto das duas células anteriores. Para isso, apenas escreva =C2*D2. [14]
  8. Até agora, você apenas programou o primeiro par de dados na linha 2. Usando um mouse, selecione as células C2, D2 e E2. A seguir, posicione o cursor sobre a pequena caixa no canto inferior direito até que um sinal de mais apareça sobre ela. Clique com o botão do mouse e, mantendo-o pressionado, arraste o cursor para baixo, expandindo a célula destacada até preencher toda a tabela. Esse passo copia automaticamente as três fórmulas presentes nas células C2, D2 e E2 para toda a tabela. A seguir, você a verá sendo preenchida automaticamente com todos os cálculos. [15]
  9. É importante encontrar a soma dos itens presentes na coluna "Produto". Na célula vazia abaixo do último ponto de dados dessa coluna, insira a fórmula =SOMA(E2:E___). Preencha o espaço em branco com a posição da célula respectiva ao último ponto de dados. [16]
    • No exemplo de 100 pontos de dados, essa fórmula irá para a célula E103. Nesse caso, você escreverá =SOMA(E2:E102).
  10. Você também pode fazer com que o Excel faça os cálculos finais. A última operação, na célula E103 de nosso exemplo, representa o numerador da fórmula de covariância. Imediatamente abaixo dela, você pode inserir a fórmula =E103/___. Preencha o espaço em branco com a quantidade de pontos de dados existentes. No exemplo, esse valor é igual a 100. O resultado representará a covariância de seus dados. [17]
    Publicidade
Método 3
Método 3 de 4:

Usando calculadoras de covariância online

Baixe em PDF
  1. Várias escolas, empresas de programação ou outras instituições criaram páginas capazes de calcular a covariância entre dados valores. Para encontrá-las, insira os termos "calculadora de covariância" em um buscador online.
  2. Leia cuidadosamente as instruções presentes na página para inserir os dados corretamente. É importante que os pares estejam bem ordenados, ou você obterá resultados de covariância incorretos. Páginas diferentes têm estilos diferentes para a inserção de dados.
    • Por exemplo, na página http://ncalculators.com/statistics/covariance-calculator.htm ( em inglês ), há uma caixa horizontal para a inserção dos valores em x e uma segunda caixa horizontal para a inserção dos valores em y. É necessário inserir os termos separados apenas por vírgulas. Desse modo, o conjunto de dados em x que foi calculado previamente seria inserido como 1,3,2,5,8,7,12,2,4. Da mesma forma, o conjunto de dados em y seria inserido como 8,6,9,4,3,3,2,7,7.
    • Em outra página, https://www.thecalculator.co/math/Covariance-Calculator-705.html ( em inglês ), você deve inserir os dados relativos ao eixo x na primeira caixa. Eles serão inseridos verticalmente, com um item por linha. Logo, a inserção nessa página ficaria da seguinte forma:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. A vantagem dessas calculadoras online é o fato de que, depois de inseridos os dados, você só precisa clicar no botão que diz "Calcular" e os resultados aparecerão automaticamente. A maioria das páginas já exibe os cálculos intermediários das variáveis x(med), y(med) e n.
    Publicidade
Método 4
Método 4 de 4:

Interpretando os resultados de covariância

Baixe em PDF
  1. A covariância é um valor estatístico único que representa de que forma dois conjuntos de dados se relacionam entre si. No exemplo mencionado na introdução, altura e peso estão sendo medidos. É de se esperar que, à medida que as pessoas crescem, suas alturas aumentam, resultando em uma covariância positiva. Em outro exemplo, suponha que sejam coletados valores relativos a quantidade de horas nas quais alguém pratica golfe e a pontuação que essa pessoa é capaz de conquistar. Nesse caso, existirá uma covariância negativa, indicando que, à medida que a quantidade de horas aumenta, a pontuação no golfe diminuirá (no golfe, quanto menor a pontuação, melhor). [18]
    • Observe o conjunto de dados calculado acima. A covariância resultante será igual a -8,07. O sinal negativo aqui indica que, à medida que os valores em x aumentam, os valores em y tendem a diminuir. Na verdade, pode-se confirmar essa veracidade observando alguns dos valores. Por exemplo, os valores em x 1 e 2 correspondem aos valores em y 7, 8 e 9. Os valores em x 8 e 12 estarão respectivamente emparelhados com os valores em y 3 e 2.
  2. Se o valor da covariância for alto, seja ele positivo ou negativo, você pode interpretá-lo como indicando que os dois elementos de dados estão fortemente conectados de forma positiva ou negativa. [19]
    • No conjunto de dados do exemplo, a covariância de -8,07 é bastante alta. Observe que os valores de dados vão de 1 a 12, de modo que 8 é um número consideravelmente alto. Isso indica uma forte conexão entre os conjuntos de dados em x e y.
  3. Se você observar uma covariância igual ou muito próxima a 0, é possível concluir que os pontos de dados podem não ter qualquer relação. Desse modo, o aumento em um valor pode ou não levar ao aumento do outro. Os dois termos estão ligados de forma quase aleatória. [20]
    • Por exemplo, suponhamos que você esteja comparando tamanhos de calçados com as notas da faculdade. Como há diversos fatores que afetam as notas da faculdade, é natural esperarmos uma covariância próxima a 0. Isso indicaria que praticamente não existe qualquer conexão entre os dois valores.
  4. Para entender a covariância de forma visual, você pode inserir os pontos de dados no plano cartesiano. Depois, será fácil observar que os pontos, apesar de não seguirem uma linha precisamente reta, tendem a formar um grupo que se aproxima de uma linha diagonal, indo do canto esquerdo superior até o canto direito inferior. Essa é a descrição de uma covariância negativa. Além disso, observe que o valor final da covariância é igual a -8,07, um número relativamente alto em comparação aos pontos de dados. O alto valor sugere que a covariância é forte, o que poderá ser constatado pela aparência linear dos pontos de dados.
    • Para rever os meios de se colocar pontos no plano cartesiano, leia " Como Representar Pontos num Plano Cartesiano ".
    Publicidade

Dicas

  • A covariância tem usos limitados na estatística. Geralmente, ela é um passo rumo ao cálculo dos coeficientes de correlação ou de outros termos. Seja cauteloso ao fazer interpretações ousadas com base em um valor de covariância.
Publicidade

Sobre este guia wikiHow

Esta página foi acessada 103 279 vezes.

Este artigo foi útil?

Publicidade