Baixe em PDF
Baixe em PDF
A covariância é um cálculo estatístico que pode ajudá-lo a entender como dois conjuntos de dados estão relacionados entre si. Por exemplo, digamos que existam antropólogos estudando as alturas e os pesos da população de um determinado local. Para cada pessoa no estudo, a altura e o peso poderão ser representados por um par de dados (x,y). Esses valores podem ser usados com uma fórmula padrão a fim de calcular a relação de covariância. Este artigo explicará primeiramente os cálculos que levam à descoberta da covariância de um determinado conjunto. A seguir, ele lidará com outras duas formas mais automatizadas para se chegar ao resultado.
Passos
-
Aprenda a fórmula padrão da covariância e quais são suas partes. A fórmula padrão para o cálculo da covariância é . Para usá-la, é preciso entender o significado das seguintes variáveis e símbolos: [1] X Fonte de pesquisa
- : esse símbolo representa a letra grega "sigma". Nas funções matemáticas, ela representa a soma da série de valores que a acompanha. Nessa fórmula, o sinal Σ indica que você calculará os valores seguintes no numerador da fração e os somará antes de fazer a divisão pelo denominador. [2] X Fonte de pesquisa
- : nesse caso, o 'i' subscrito representa um contador, ou índice. Ele indica que você realizará o cálculo de cada um dos valores de x presentes no conjunto de dados.
- : o "med" indica que x(med) representa o valor médio de todos os pontos em x. Essa média também pode ser escrita como um x com uma pequena linha horizontal sobre ele. Nesse caso, a variável é chamada de "x barra", mas ainda representa a média do conjunto de dados.
- : novamente, o 'i' subscrito representa um contador, ou índice. Ele indica que você fará o cálculo de cada um dos valores de y presentes no conjunto de dados.
- : o "med" indica que y(med) representa o valor médio de todos os pontos em y. Essa média também pode ser escrita como um y com uma pequena linha horizontal sobre ele. Nesse caso, a variável é chamada de "y barra", mas ainda representa a média do conjunto de dados.
- : essa variável representa a quantidade de itens presentes no conjunto de dados. Lembre-se de que, em um problema de covariância, um único "item" é composto tanto por um valor em x quanto por um valor em y. O valor n é um par de conjuntos de dados, não um número único.
-
Prepare a sua tabela de dados. Antes de começar os cálculos, é preciso antes coletar os seus dados. Faça uma tabela com cinco colunas e dê a cada uma delas os seguintes nomes:
- : nessa coluna, insira os valores dos pontos de dados em x.
- : nessa coluna, insira os valores dos pontos de dados em y. Tome o cuidado de alinhar os valores em y com os valores correspondentes em x. Em um problema de covariância, a ordem dos pontos de dados e o emparelhamento entre x e y são importantes.
- : deixe essa coluna em branco no início. Depois de calcular a média dos pontos de dados em x, ela será preenchida.
- : deixe essa coluna em branco no início. Depois de calcular a média dos pontos de dados em y, ela será preenchida.
- : deixe também essa última coluna em branco. Você a preencherá à medida que avançar na resolução.
-
Calcule a média dos pontos de dados em x. Esse conjunto de dados contém nove números. Para calcular a média entre eles, some-os e divida-os por 9. Como resultado, você obterá 1+3+2+5+8+7+12+2+4=44. Ao dividir esse valor por 9, a média será igual a 4,89. É esse o valor a ser usado como x(med) nos cálculos seguintes. [3] X Fonte de pesquisa
-
Calcule a média dos pontos de dados em y. De modo similar, a coluna y consistirá de nove pontos de dados que coincidirão com os valores em x. Calcule a média desses valores. Nesse conjunto de dados, temos que 8+6+9+4+3+3+2+7+7=49. Divida esse resultado por 9 a fim de obter uma média igual a 5,44 para usá-la como y(med) nos cálculos seguintes. [4] X Fonte de pesquisa
-
Calcule os valores de . Para cada item na coluna x, é preciso calcular a diferença entre o número e a média. Nesse problema, é preciso subtrair 4,89 de cada ponto de dados em x. Se o valor original estiver abaixo da média, o resultado será negativo. Se, por outro lado, estiver acima da média, o resultado será positivo. Esteja atento aos sinais negativos. [5] X Fonte de pesquisa
- Por exemplo, os primeiros pontos de dados na coluna x são iguais a 1. O valor a ser inserido na primeira linha da coluna será igual a 1-4,89, ou -3,89.
- Repita o processo com cada ponto de dados. Logo, a segunda linha será igual a 3-4,89, ou -1,89. A terceira linha será igual a 2-4,89, ou -2,89. Continue o processo com todos os pontos de dados. Nesse caso, os nove números da coluna equivalerão a -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89 e -0,89.
-
Calcule os valores de . Nessa coluna, você fará subtrações parecidas, usando os pontos de dados em y e a média de valores em y. Se o ponto de dados original for menor que a média, o resultado será negativo. Se, por outro lado, for maior que a média, o resultado será positivo. Esteja atento aos sinais negativos. [6] X Fonte de pesquisa
- Na primeira linha, o cálculo será igual a 8-5,44, ou 2,56.
- A segunda linha será igual a 6-5,44, ou 0,56.
- Continue a fazer as subtrações até o fim da lista de dados. Ao terminar, os nove valores serão iguais a 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56 e 1,56.
-
Calcule os produtos de cada linha. Você preencherá as linhas da coluna final multiplicando os números calculados nas colunas anteriores de e . Trabalhe sempre linha por linha, multiplicando os dois números pelos pontos de dados correspondentes. Esteja sempre atento a quaisquer sinais negativos necessários. [7] X Fonte de pesquisa
- Na primeira linha, o calculado será igual a -3,89, e o valor de será igual a 2,56. O produto de ambos os valores equivale a -3,89*2,56=-9,96.
- Na segunda linha, você deve multiplicar os dois números: -1,88*0,56=-1,06.
- Continue a multiplicar linha por linha até o final do conjunto de dados. Ao terminar, os nove valores nessa coluna serão iguais a -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4,51 e -1,39.
-
Calcule a soma dos valores na última coluna. É aqui que o símbolo Σ entra em jogo. Depois de fazer todos os cálculos necessários até aqui, você deverá somar os resultados. Com relação ao conjunto de dados do exemplo, você terá nove valores na coluna final. A seguir, some-os. Preste bastante atenção ao fato de cada número ser positivo ou negativo.
- Com relação a esse conjunto de dados, a soma será igual a -64,57. Escreva esse total no espaço presente na base da coluna. Ele representa o valor do numerador na fórmula padrão de covariância.
-
Calcule o denominador da fórmula de covariância. O numerador da fórmula padrão é representado pelo número que você acabou de calcular. O denominador, por sua vez, é representado por (n-1), ou seja, um valor uma unidade menor que a quantidade de pares no conjunto de dados.
- Nesse exemplo, há nove pares de dados, de modo que n é igual a 9. Logo, o valor de (n-1) é igual a 8.
-
Divida o numerador pelo denominador. O último passo no cálculo da covariância é dividir o numerador, , pelo denominador, . O quociente será igual à covariância dos dados. [8] X Fonte de pesquisa
- Nesse exemplo, o cálculo resultará em -64,57/8, que é igual a -8,07.
Publicidade
-
Observe os cálculos repetitivos. A covariância é um cálculo que às vezes deve ser feito à mão para que você entenda o que o resultado significa. No entanto, se tiver que usar os valores de covariância rotineiramente para interpretar dados, é importante encontrar uma forma mais rápida e automatizada de se obter resultados. A essa altura, você terá observado que, para o conjunto de dados relativamente pequeno, com nove pares, os cálculos incluíram descobrir duas médias, fazer 18 subtrações individuais, nove multiplicações separadas, uma soma e uma divisão final. Foram 31 pequenos cálculos para chegar a uma única solução. Ao longo do caminho, você corre o risco de se esquecer de sinais negativos ou de copiar os resultados incorretamente, arruinando o resultado.
-
Crie uma planilha para o cálculo da covariância. Se você se sente confortável usando o Excel (ou outro programa de planilhas capaz de trabalhar com cálculos), fica fácil criar uma planilha que sirva para calcular a covariância. Dê os títulos das cinco colunas de acordo com o que foi feito nos cálculos à mão: x, y, (x(i)-x(med)), (y(i)-y(med)) e Produto. [9] X Fonte de pesquisa
- Para simplificar a rotulação, você pode dar à terceira coluna um nome como "diferença x", e à quarta, algo como "diferença y", desde que se lembre do que significam esses dados.
- Se você começar a tabela no canto superior esquerdo da planilha, a célula A1 representará o rótulo x, acompanhada por todos os outros até chegar em E1.
-
Insira os pontos de dados. Insira os valores de dados nas duas colunas rotuladas de x e y. Lembre-se de que a ordem dos pontos de dados importa, sendo importante emparelhar cada valor em y com o valor em x correspondente. [10] X Fonte de pesquisa
- Os valores em x começarão na célula A2 e continuarão para baixo, contendo tantos pontos de dados quanto for necessário.
- Os valores em y começarão na célula B2 e continuarão para baixo, contendo tantos pontos de dados quanto for necessário.
-
Calcule as médias dos valores em x e y. O Excel é capaz de calcular as médias bem rapidamente. Na primeira célula vaga abaixo de cada coluna de dados, insira a fórmula =MED(A2:A___). Preencha o espaço em branco com a posição da célula correspondente ao último ponto de dados. [11] X Fonte de pesquisa
- Por exemplo, se você tiver 100 pontos de dados, eles preencherão o espaço que vai da célula A2 até a célula A101. Nesse caso, você escreverá =MED(A2:A101).
- Para os valores em y, insira a fórmula =MED(B2:B101).
- Lembre-se de que você inicia a fórmula no Excel com um sinal de =.
-
Insira a fórmula para a coluna (x(i)-x(med)). Na célula C2, você terá que inserir a fórmula para calcular a primeira subtração. Ela será =A2-___. O espaço em branco deve ser preenchido com a posição da célula que contém a média dos valores em x. [12] X Fonte de pesquisa
- Para o exemplo dos 100 pontos de dados, a média estaria na célula A103, de modo que a fórmula ficaria =A2-A103.
-
Repita a fórmula para os pontos de dados (y(i)-y(med)). Seguindo o mesmo exemplo, ela estará na célula D2. Essa fórmula será escrita como =B2-B103. [13] X Fonte de pesquisa
-
Insira a fórmula para a coluna "Produto". Na quinta coluna, na célula E2, você terá que colocar a fórmula responsável por calcular o produto das duas células anteriores. Para isso, apenas escreva =C2*D2. [14] X Fonte de pesquisa
-
Copie as fórmulas para preencher a tabela. Até agora, você apenas programou o primeiro par de dados na linha 2. Usando um mouse, selecione as células C2, D2 e E2. A seguir, posicione o cursor sobre a pequena caixa no canto inferior direito até que um sinal de mais apareça sobre ela. Clique com o botão do mouse e, mantendo-o pressionado, arraste o cursor para baixo, expandindo a célula destacada até preencher toda a tabela. Esse passo copia automaticamente as três fórmulas presentes nas células C2, D2 e E2 para toda a tabela. A seguir, você a verá sendo preenchida automaticamente com todos os cálculos. [15] X Fonte de pesquisa
-
Programe a soma da última coluna. É importante encontrar a soma dos itens presentes na coluna "Produto". Na célula vazia abaixo do último ponto de dados dessa coluna, insira a fórmula =SOMA(E2:E___). Preencha o espaço em branco com a posição da célula respectiva ao último ponto de dados. [16] X Fonte de pesquisa
- No exemplo de 100 pontos de dados, essa fórmula irá para a célula E103. Nesse caso, você escreverá =SOMA(E2:E102).
-
Encontre a covariância. Você também pode fazer com que o Excel faça os cálculos finais. A última operação, na célula E103 de nosso exemplo, representa o numerador da fórmula de covariância. Imediatamente abaixo dela, você pode inserir a fórmula =E103/___. Preencha o espaço em branco com a quantidade de pontos de dados existentes. No exemplo, esse valor é igual a 100. O resultado representará a covariância de seus dados. [17] X Fonte de pesquisaPublicidade
-
Pesquise por calculadoras de covariância na internet. Várias escolas, empresas de programação ou outras instituições criaram páginas capazes de calcular a covariância entre dados valores. Para encontrá-las, insira os termos "calculadora de covariância" em um buscador online.
-
Insira os dados. Leia cuidadosamente as instruções presentes na página para inserir os dados corretamente. É importante que os pares estejam bem ordenados, ou você obterá resultados de covariância incorretos. Páginas diferentes têm estilos diferentes para a inserção de dados.
- Por exemplo, na página http://ncalculators.com/statistics/covariance-calculator.htm ( em inglês ), há uma caixa horizontal para a inserção dos valores em x e uma segunda caixa horizontal para a inserção dos valores em y. É necessário inserir os termos separados apenas por vírgulas. Desse modo, o conjunto de dados em x que foi calculado previamente seria inserido como 1,3,2,5,8,7,12,2,4. Da mesma forma, o conjunto de dados em y seria inserido como 8,6,9,4,3,3,2,7,7.
- Em outra página, https://www.thecalculator.co/math/Covariance-Calculator-705.html ( em inglês ), você deve inserir os dados relativos ao eixo x na primeira caixa. Eles serão inseridos verticalmente, com um item por linha. Logo, a inserção nessa página ficaria da seguinte forma:
- 1
- 3
- 2
- 5
- 8
- 7
- 12
- 2
- 4
-
Calcule os resultados. A vantagem dessas calculadoras online é o fato de que, depois de inseridos os dados, você só precisa clicar no botão que diz "Calcular" e os resultados aparecerão automaticamente. A maioria das páginas já exibe os cálculos intermediários das variáveis x(med), y(med) e n.Publicidade
-
Procure por uma relação positiva ou negativa. A covariância é um valor estatístico único que representa de que forma dois conjuntos de dados se relacionam entre si. No exemplo mencionado na introdução, altura e peso estão sendo medidos. É de se esperar que, à medida que as pessoas crescem, suas alturas aumentam, resultando em uma covariância positiva. Em outro exemplo, suponha que sejam coletados valores relativos a quantidade de horas nas quais alguém pratica golfe e a pontuação que essa pessoa é capaz de conquistar. Nesse caso, existirá uma covariância negativa, indicando que, à medida que a quantidade de horas aumenta, a pontuação no golfe diminuirá (no golfe, quanto menor a pontuação, melhor). [18] X Fonte de pesquisa
- Observe o conjunto de dados calculado acima. A covariância resultante será igual a -8,07. O sinal negativo aqui indica que, à medida que os valores em x aumentam, os valores em y tendem a diminuir. Na verdade, pode-se confirmar essa veracidade observando alguns dos valores. Por exemplo, os valores em x 1 e 2 correspondem aos valores em y 7, 8 e 9. Os valores em x 8 e 12 estarão respectivamente emparelhados com os valores em y 3 e 2.
-
Interprete a magnitude da covariância. Se o valor da covariância for alto, seja ele positivo ou negativo, você pode interpretá-lo como indicando que os dois elementos de dados estão fortemente conectados de forma positiva ou negativa. [19] X Fonte de pesquisa
- No conjunto de dados do exemplo, a covariância de -8,07 é bastante alta. Observe que os valores de dados vão de 1 a 12, de modo que 8 é um número consideravelmente alto. Isso indica uma forte conexão entre os conjuntos de dados em x e y.
-
Entenda uma possível falta de relação. Se você observar uma covariância igual ou muito próxima a 0, é possível concluir que os pontos de dados podem não ter qualquer relação. Desse modo, o aumento em um valor pode ou não levar ao aumento do outro. Os dois termos estão ligados de forma quase aleatória. [20] X Fonte de pesquisa
- Por exemplo, suponhamos que você esteja comparando tamanhos de calçados com as notas da faculdade. Como há diversos fatores que afetam as notas da faculdade, é natural esperarmos uma covariância próxima a 0. Isso indicaria que praticamente não existe qualquer conexão entre os dois valores.
-
Visualize a relação graficamente. Para entender a covariância de forma visual, você pode inserir os pontos de dados no plano cartesiano. Depois, será fácil observar que os pontos, apesar de não seguirem uma linha precisamente reta, tendem a formar um grupo que se aproxima de uma linha diagonal, indo do canto esquerdo superior até o canto direito inferior. Essa é a descrição de uma covariância negativa. Além disso, observe que o valor final da covariância é igual a -8,07, um número relativamente alto em comparação aos pontos de dados. O alto valor sugere que a covariância é forte, o que poderá ser constatado pela aparência linear dos pontos de dados.
- Para rever os meios de se colocar pontos no plano cartesiano, leia " Como Representar Pontos num Plano Cartesiano ".
Publicidade
Dicas
- A covariância tem usos limitados na estatística. Geralmente, ela é um passo rumo ao cálculo dos coeficientes de correlação ou de outros termos. Seja cauteloso ao fazer interpretações ousadas com base em um valor de covariância.
Publicidade
Referências
- ↑ http://mathworld.wolfram.com/Covariance.html
- ↑ http://mathworld.wolfram.com/Sigma.html
- ↑ https://www.reference.com/math/formula-calculate-average-26e3e5148012bf52
- ↑ https://www.reference.com/math/formula-calculate-average-26e3e5148012bf52
- ↑ http://mathworld.wolfram.com/Covariance.html
- ↑ http://mathworld.wolfram.com/Covariance.html
- ↑ http://mathworld.wolfram.com/Covariance.html
- ↑ http://mathworld.wolfram.com/Covariance.html
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://www.baycongroup.com/excel2007/01_excel.htm
- ↑ http://users.ecs.soton.ac.uk/jn2/teaching/correlations.pdf
- ↑ http://users.ecs.soton.ac.uk/jn2/teaching/correlations.pdf
- ↑ http://users.ecs.soton.ac.uk/jn2/teaching/correlations.pdf
Sobre este guia wikiHow
Esta página foi acessada 106 792 vezes.
Publicidade