O coeficiente de correlação, representado por ou , é a medida da correlação linear (relação em termos tanto de força como de direção) entre duas variáveis. Ela vai de a , com os sinais indicando se a correlação é negativa ou positiva. Caso seu valor seja exatamente igual a , a relação entre as duas variáveis é perfeitamente negativa — se o coeficiente de correlação for igual a , por sua vez, trata-se de uma relação perfeitamente positiva. De outro modo, as duas variáveis podem ter uma correlação positiva ou negativa, ou nenhuma correlação. É possível calcular essa variável à mão, usando calculadoras específicas na internet ou através da função estatística de uma boa calculadora gráfica.
Passos
-
Reúna os dados. Primeiramente, para começar a calcular o coeficiente de correlação, analise os pares de dados. É útil colocá-los em uma tabela, quer vertical ou horizontalmente. Rotule cada linha ou coluna como e . [1] X Fonte de pesquisa
- Suponha, por exemplo, que você tem quatro pares de dados para
e
. A tabela ficará assim:
- Suponha, por exemplo, que você tem quatro pares de dados para
e
. A tabela ficará assim:
-
Calcule a média de . Para isso, você deve somar todos os valores de e dividir o resultado pela quantidade de valores utilizados. [2] X Fonte de pesquisa
- Observe no exemplo acima que há quatro valores para
. Para calcular a média, some todos os valores conhecidos e, a seguir, divida o resultado por
. Os cálculos ficarão assim:
- Observe no exemplo acima que há quatro valores para
. Para calcular a média, some todos os valores conhecidos e, a seguir, divida o resultado por
. Os cálculos ficarão assim:
-
Calcule a média de . Para isso, você deve seguir o mesmo procedimento do passo anterior, somando os valores de e dividindo o resultado pela quantidade de valores utilizados. [3] X Fonte de pesquisa
- No exemplo acima, também há quatro valores para
. Some-os e, a seguir, divida o resultado por
. Os cálculos ficarão assim:
- No exemplo acima, também há quatro valores para
. Some-os e, a seguir, divida o resultado por
. Os cálculos ficarão assim:
-
Calcule o desvio-padrão de . Quando as médias forem valores conhecidos, será possível calcular o desvio-padrão. Para isso, use a fórmula : [4] X Fonte de pesquisa
- Com os dados amostrais, os cálculos serão escritos da seguinte maneira:
- Com os dados amostrais, os cálculos serão escritos da seguinte maneira:
-
Calcule o desvio-padrão de . Usando os mesmos passos básicos, calcule o desvio-padrão de . Basta usar a mesma fórmula, mas agora com os pontos de dados presentes em . [5] X Fonte de pesquisa
- Com os dados amostrais, os cálculos serão escritos da seguinte maneira:
- Com os dados amostrais, os cálculos serão escritos da seguinte maneira:
-
Revise a fórmula básica usada para determinar o coeficiente de correlação. Ela faz uso de médias, desvios-padrões e da quantidade de pares presentes no conjunto de dados (representado por ). O próprio coeficiente de correlação é representado pela letra minúscula ou pela letra grega minúscula rô, ou . No presente artigo, você fará uso da fórmula conhecida como coeficiente de correlação de Pearson, que está a seguir: [6] X Fonte de pesquisa
- Você pode ter observado que há pequenas variações na fórmula, presentes aqui ou em outros textos. Por exemplo, algumas delas farão uso da notação grega, com e , enquanto outras optarão por e em seu lugar. Alguns textos podem inclusive exibir equações ligeiramente distintas, mas matematicamente equivalentes à apresentada aqui.
-
Calcule o coeficiente de correlação. Você tem agora todos os valores de médias e desvios-padrões relativos às variáveis analisadas, será possível avançar com a fórmula do coeficiente de correlação. Lembre-se de que representa a quantidade de valores que você possui. As outras informações relevantes já foram obtidas nos passos anteriores. [7] X Fonte de pesquisa
- Usando os dados amostrais, você inserirá os valores necessários na equação a fim de calculá-la da seguinte maneira:
- Usando os dados amostrais, você inserirá os valores necessários na equação a fim de calculá-la da seguinte maneira:
-
Interprete os resultados. Nesse conjunto de dados, o coeficiente de relação é igual a . Esse número indica dois pontos importantes, sendo importante observar o sinal e as dimensões do número. [8] X Fonte de pesquisa
- Como o coeficiente de correlação é positivo, você pode dizer que há uma correlação positiva entre os dados em e os dados em . Em outras palavras, à medida em que os valores em aumentam, a expectativa é de que os valores em também aumentem.
- Uma vez que o coeficiente de correlação se aproxima de , os dados tanto em como em estão muito próximos entre si. Se fosse necessário representar os pontos em um gráfico, você observaria que formam uma boa aproximação de uma linha reta.
Publicidade
-
Procure na internet por calculadoras de correlação. A medição dessa variável é algo bem cotidiano a profissionais do ramo da Estatística. Os cálculos podem se mostrar bem tediosos quando feitos à mão com grandes conjuntos de dados. Como resultado, há muitas páginas com calculadoras de correlação na internet. Entre em qualquer buscador e busque pelo termo " calculadora de correlação ".
-
Insira os dados. Leia cuidadosamente as instruções presentes na página a fim de inserir os dados da forma correta. É importante que os pares estejam sempre em ordem, ou os resultados gerados serão incorretos. Páginas diferentes usam formatos diferentes de inserção de dados.
- Na página nCalculators ( em inglês ), por exemplo, você notará uma caixa de texto para a inserção de valores em e uma segunda caixa de texto para a inserção de valores em — basta escrever os termos separados por vírgulas. Desse modo, o conjunto de dados em que foi calculado previamente no artigo deve ser escrito como , , , . O conjunto de dados em , por sua vez, será escrito como , , , .
- Já na página Alcula ( em inglês ), você pode inserir os dados tanto horizontal como verticalmente, desde que os pontos de dados sejam mantidos em ordem.
-
Calcule os resultados. Essas páginas de cálculo são populares porque, depois da inserção dos dados, você geralmente só precisa clicar no botão " calcular ", e o resultado aparecerá na tela.Publicidade
-
Insira os dados. Em uma calculadora gráfica, entre na função estatística e selecione o comando EDIT . [9] X Fonte de pesquisa
- Cada calculadora terá comandos ligeiramente distintos. O artigo trará instruções específicas para o modelo Texas Instruments TI-86 .
- Entre na função STAT pressionando [2nd]-STAT (sobre a tecla + ) e, a seguir, F2-EDIT .
-
Limpe todos os dados antigos armazenados. A maioria das calculadoras mantém dados estatísticos guardados na memória até que uma limpeza seja feita. Para garantir que os dados antigos não sejam confundidos com os novos, é preciso antes limpar as informações previamente armazenadas. [10] X Fonte de pesquisa
- Use as setas direcionais para mover o cursor, selecione o título xSTAT e pressione CLEAR e ENTER . Isso serve para limpar todos os valores ainda presentes na coluna xSTAT .
- Use as setas direcionais para selecionar o título ySTAT . Pressione CLEAR e ENTER para esvaziar também os dados dessa coluna.
-
Insira os valores desejados. Usando as setas direcionais, mova o cursor para o primeiro espaço sob o título xSTAT , digite o primeiro valor e pressione ENTER . Você verá o campo na base da tela exibindo xSTAT(1)=_ , sendo que o valor inserido substituirá o espaço em branco. Ao pressionar ENTER , os dados preencherão a tabela, o cursor passará para a próxima linha e aquela que está presente na base da tela exibirá agora xSTAT(2)=_ . [11] X Fonte de pesquisa
- Continue inserindo os valores dos dados em .
- Ao terminar, use as setas direcionais e avance para a coluna ySTAT a fim de inserir os dados em .
- Depois que todos os dados houverem sido escritos, pressione EXIT para limpar a tela e sair do menu STAT .
-
Calcule as estatísticas da regressão linear. O coeficiente de correlação é uma medida de quão bem os dados se aproximam de uma linha reta. Uma calculadora gráfica é capaz de calcular, além do coeficiente de correlação, qual é o tipo de linha que mais se aproxima do conjunto de dados analisado. [12] X Fonte de pesquisa
- Entre na função STAT e pressione o botão CALC . No modelo TI-86 , basta pressionar [2nd][STAT][F1] .
- Escolha os cálculos de regressão linear. Na TI-86 , pressione [F3] , denominado LINR . A tela gráfica exibirá a linha LINR _ , com um cursor intermitente.
- Agora, você deve inserir os nomes das duas variáveis a serem calculadas: xSTAT
e ySTAT
.
- Na TI-86 , selecione a lista NAMES pressionando [2nd][LIST][F3] .
- A base da tela agora exibirá as variáveis disponíveis. Escolha xSTAT (provavelmente o botão [F1] ou [F2] ), coloque uma vírgula e avance para ySTAT .
- Pressione ENTER para calcular os dados.
-
Interprete os resultados. Ao pressionar ENTER , a calculadora calculará instantaneamente as seguintes informações relativas aos dados inseridos: [13] X Fonte de pesquisa
- : Essa é a fórmula geral para uma linha reta. No entanto, em vez de usar a já conhecida , essa é usada na ordem inversa.
- : Esse valor equivale à raiz da linha mais próxima quando .
- : Essa é a inclinação da linha mais próxima.
- : Esse é o coeficiente de correlação.
- : Essa é a quantidade de pares de dados usada nos cálculos.
Publicidade
-
Entenda o conceito da correlação. Ela se refere à relação existente entre duas quantidades. O coeficiente é um valor único que pode ser calculado para quaisquer dois conjuntos de pontos de dados. Ele sempre estará entre e e serve para indicar quão próximos tenderão a estar. [14] X Fonte de pesquisa
- Por exemplo, se você quer mensurar alturas e idades de crianças com aproximadamente anos, a expectativa é de que exista uma forte correlação positiva. À medida em que o tempo passa, crianças tendem a ficar mais altas.
- Um exemplo de correlação negativa seria comparar dados de uma pessoa que passa tempo praticando tacadas de golfe em comparação aos pontos feitos pelo mesmo indivíduo. À medida em que a prática aumenta, a pontuação diminuirá.
- Além disso, você pode esperar uma correlação quase insignificante, quer positiva ou negativa, entre o tamanho dos calçados de alguém com, por exemplo, suas notas no ENEM.
-
Saiba como encontrar a média. A média aritmética de um conjunto de dados é calculada somando-se todos os valores em análise e dividindo o resultado pela quantidade de valores existentes. Quando o coeficiente de correlação for encontrado, será necessário calcular a média de cada conjunto de dados. [15] X Fonte de pesquisa
- A média, nesse caso, é expressa pela variável que tem uma linha horizontal acima dela. Geralmente, essa linha é chamada de " barra " ou " barra " com relação aos diferentes eixos. Em outros casos, os nomes podem apenas acompanhar a letra grega minúscula mi, ou . Para indicar a média dos pontos de dados em , por exemplo, basta escrever ou .
- Como exemplo, se você tem um determinado conjunto de dados em
(
,
,
,
,
,
), a média será calculada da seguinte maneira:
-
Observe a importância do desvio-padrão. Na Estatística, o desvio-padrão mensura o nível de variação, demonstrando como os números se espalham comparativamente à média. Um grupo de números com desvio-padrão baixo estará com grande nível de aproximação entre eles. Um grupo de números com desvio-padrão alto, por sua vez, estará bem espalhado. [16] X Fonte de pesquisa
- De forma simbólica, o desvio-padrão é expresso através da letra minúscula ou da letra grega minúscula sigma, ou . Desse modo, pode-se escrever (com relação ao eixo , por exemplo) ou .
-
Reconheça a notação da somatória. Esse é um dos operadores mais comuns na matemática, indicando a soma de um determinado conjunto de valores. Ele é representado pela letra grega maiúscula sigma, ou . [17] X Fonte de pesquisa
- Como exemplo, se você tem um conjunto de dados em
(
,
,
,
,
,
), então
indica que:
Publicidade - Como exemplo, se você tem um conjunto de dados em
(
,
,
,
,
,
), então
indica que:
Dicas
- O coeficiente de correlação é às vezes chamado de "'coeficiente de correlação produto-momento de Pearson " em homenagem ao matemático britânico Karl Pearson, que o desenvolveu.
- Geralmente, um coeficiente de correlação maior que (positivo ou negativo) representa uma forte correlação. Da mesma forma, um coeficiente de correlação menor que (novamente, quer positivo ou negativo) representará uma correlação fraca.
Avisos
- A correlação demonstra que os dois conjuntos de dados em questão estão conectados de alguma forma. No entanto, seja cuidadoso para não se confundir e interpretá-la como uma causação. Por exemplo, se você comparar o tamanho dos calçados e a altura de um grupo de pessoas, é provável que se depare com uma correlação positiva bastante forte, uma vez que indivíduos mais altos costumam ter pés maiores. No entanto, isso não significa que crescer em altura faz com que os pés também cresçam ou, ainda, que ter pés grandes faz com que a pessoa se torne mais alta. Ambas as características andam juntas.
Referências
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ https://www.youtube.com/watch?v=5YKv04PcPFY
- ↑ https://www.youtube.com/watch?v=5YKv04PcPFY
- ↑ https://www.youtube.com/watch?v=5YKv04PcPFY
- ↑ https://www.youtube.com/watch?v=5YKv04PcPFY
- ↑ https://www.youtube.com/watch?v=5YKv04PcPFY
- ↑ http://whatis.techtarget.com/definition/correlation
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://ncalculators.com/statistics/correlation-coefficient-calculator.htm
- ↑ http://www.mathsisfun.com/algebra/sigma-notation.html