O valor P é uma medida estatística que ajuda os cientistas a determinar se suas hipóteses estão ou não corretas. Esses valores são usados para determinar se os resultados das pesquisas estão dentro do intervalo normal de valores para os eventos que estão sendo observados. Geralmente, se o valor P de um conjunto de dados estiver abaixo de uma quantia pré-determinada (por exemplo, 0,05), os cientistas rejeitarão a "hipótese nula" da pesquisa - em outras palavras, eles descartarão a hipótese de que as variáveis de sua pesquisa não tinham nenhum efeito significativo sobre os resultados. Hoje, os valores p são normalmente encontrados em tabelas de referência, calculando primeiramente um valor de qui-quadrado .
Passos
-
Determine os resultados esperados da pesquisa. Normalmente, quando os cientistas realizam um experimento e observam os resultados, eles têm uma ideia antecipada de como os resultados normal ou específico serão. Essa previsão é feita com base nos resultados de pesquisas anteriores, de conjuntos de dados observacionais de confiança, na literatura científica e/ou em outras fontes. Para sua pesquisa, determine os seus resultados esperados e expresse-os em números.
- Exemplo: digamos que os estudos anteriores demonstrem que, em âmbito nacional, as multas por velocidade são aplicadas com mais frequência para carros vermelhos do que para carros azuis. Digamos que a média dos resultados nacionais mostre uma preferência de 2:1 para carros vermelhos. Analisamos as multas aplicadas em nossa cidade, para descobrir se a polícia local também apresenta essa tendência. Se pegarmos um grupo aleatório de 150 multas por velocidade, aplicadas para carros vermelhos e azuis em nossa cidade, teremos de esperar que desse total 100 sejam para carros vermelhos e 50 para carros azuis, se o patrulhamento local seguir a tendência nacional para a aplicação de multas .
-
Determine os resultados observados pela pesquisa. Agora que determinou os valores esperados, é possível realizar a pesquisa e encontrar os valores reais (ou "observados"). Novamente, expresse esses resultados na forma de números. Se manipularmos uma condição experimental e os resultados observados forem diferentes dos esperados, duas possibilidades podem ocorrer: os fatos podem ter acontecido por acaso ou a manipulação das variáveis experimentais causou a diferença. O objetivo de encontrar um valor p é basicamente determinar se os resultados observados diferem dos resultados esperados, de tal forma que a "hipótese nula" – a hipótese de que não há relação entre a(s) variável(is) experimental(is) e os resultados observados – é bastante improvável para ser rejeitada.
- Exemplo: digamos que, em nossa cidade, selecionamos aleatoriamente 150 multas aplicadas tanto para carros vermelhos como azuis. Descobrimos que 90 multas foram aplicadas para carros vermelhos e 60 para carros azuis. Esses valores estavam diferentes dos nossos resultados esperados de 100 e 50 , respectivamente. Nossa manipulação experimental (neste caso, mudar a fonte dos dados de um alcance nacional para um alcance regional) causou essa alteração nos resultados, ou a ação do patrulhamento local é tão tendenciosa quanto sugere a média nacional e, assim, estamos observando apenas uma variação na mudança? Um valor p nos ajudará a responder essas perguntas.
-
Determine o grau de liberdade da pesquisa. Esses fatores são obtidos a partir da medição da quantidade de variabilidade envolvida na pesquisa, que é determinada pelo número de categorias que você está avaliando. A equação para os graus de liberdade é Graus de liberdade = n-1 , onde n é o número de categorias ou variáveis que estão sendo analisadas em sua pesquisa.
- Exemplo: nosso experimento possui duas categorias de resultados: uma para carros vermelhos e outra para carros azuis. Assim, em nossa pesquisa temos 2-1 = 1 grau de liberdade . Se tivéssemos feito uma comparação entre os carros vermelhos, azuis e verdes teríamos 2 graus de liberdade, e assim sucessivamente.
-
Compare os resultados esperados em relação aos observados com o qui-quadrado . O qui-quadrado (escrito "x 2 ") é um valor numérico que mede a diferença entre os valores esperados e observados de uma pesquisa. A equação para qui-quadrado é: x 2 = Σ((o-e) 2 /e) , onde "o" é o valor observado e "e" é o valor esperado. [1] X Fonte de pesquisa Calcule os resultados desta equação para todos os resultados possíveis (veja abaixo).
- Observe que essa equação inclui um operador Σ (sigma). Em outras palavras, você precisará calcular ((|o-e|-,05) 2 /e) para cada resultado possível e, em seguida, somar os resultados para obter o valor de qui-quadrado. Em nosso exemplo, temos dois resultados – os carros que receberam a multa são da cor vermelha ou azul. Assim, teríamos de calcular ((o-e) 2 /e) duas vezes – uma para carros vermelhos e outra para carros azuis.
- Exemplo: vamos integrar os valores esperado e observado na equação x 2
= Σ((o-e) 2
/e). Tenha em mente que, devido ao operador sigma, precisaremos realizar a equação ((o-e) 2
/e) duas vezes – uma para carros vermelhos e outra para carros azuis. Nossa equação seria:
- x 2 = ((90-100) 2 /100) + (60-50) 2 /50)
- x 2 = ((-10) 2 /100) + (10) 2 /50)
- x 2 = (100/100) + (100/50) = 1 + 2 = 3 .
-
Escolha um nível de significância . Agora que conhecemos o grau de liberdade da pesquisa e o valor de qui-quadrado, existe apenas uma última coisa a fazer antes de encontrarmos o valor p – precisamos definir o nível de significância. Basicamente, o nível de significância é uma medida do grau de certeza que queremos ter de nossos resultados – valores baixos de significância correspondem a uma baixa probabilidade de que os resultados experimentais ocorreram por acaso e vice-versa. Os níveis de significância são expressos como decimais (tais como 0,01), o que corresponde ao percentual de chance de os resultados experimentais ocorreram ao acaso (neste caso, 1%).
- Por convenção, os cientistas normalmente definem o valor de significância para suas pesquisas em 0,05 (ou 5%). [2] X Fonte de pesquisa Isso significa que os resultados experimentais que atingem esse nível de significância têm, no máximo, 5% de chance de ser resultado do mero acaso. [3] X Fonte Confiável PubMed Central Ir à fonte . Em outras palavras, há 95% de chance de os resultados terem sido causados pela manipulação dos pesquisadores dos dados experimentais, em vez de serem causados pelo acaso. Para a maioria das pesquisas, estar 95% certo sobre a correlação entre duas variáveis é considerado como uma demonstração "bem-sucedida" de uma correlação entre os dois.
- Exemplo: para o exemplo do carro vermelho e azul, vamos seguir a convenção científica e definir nosso nível de significância em 0,05 .
-
Use uma tabela de distribuição de qui-quadrado para aproximar nosso valor p. Os cientistas e os especialistas em estatística usam tabelas grandes de valores, para calcular o valor p de suas pesquisas. Essas tabelas geralmente são configuradas com o eixo vertical no lado esquerdo da tabela, para corresponder aos graus de liberdade e o eixo horizontal na parte superior da tabela, para corresponder ao valor p. Você pode usar essas tabelas, primeiro para descobrir seus graus de liberdade e, depois, fazer a leitura da linha que cruza a tabela, da esquerda para a direita, até encontrar o primeiro valor superior ao seu valor de qui-quadrado. Observe o valor p correspondente na parte superior da coluna – seu valor p será aquele entre esse valor e o próximo valor maior (aquele imediatamente à esquerda dele).
- As tabelas de distribuição de qui-quadrado podem ser obtidas de várias fontes – você pode facilmente encontrá-las fazendo uma pesquisa na internet ou em livros de ciências ou de estatística. Se você não tiver nenhuma tabela, baixe gratuitamente um modelo disponível online.
- Exemplo: nosso qui-quadrado foi 3. Então, vamos usar a tabela de distribuição de qui-quadrado, representada na foto acima, para encontrar um valor p aproximado. Como sabemos que nosso experimento tem apenas 1 grau de liberdade, começaremos na linha mais alta. Vamos analisando a linha, começando da esquerda para a direita, até encontrar um valor maior do que 3 - nosso valor de qui-quadrado. O primeiro valor que encontramos é 3,84. Olhando para a parte de cima desta coluna, vemos que o valor p correspondente é 0,05. Isso significa que nosso valor p está entre 0,05 e 0,1 (o próximo valor p maior na tabela).
-
Decida se vai rejeitar ou aceitar a hipótese nula. Como encontrou um valor p aproximado para a pesquisa, é possível rejeitar ou não a hipótese nula (lembrando, que essa é a hipótese de que as variáveis experimentais que manipulou não afetou os resultados observados). Se o valor p de sua pesquisa for inferior ao valor de significância, parabéns – você conseguiu provar que é muito provável que haja uma correlação entre as variáveis que manipulou e os resultados que observou. Se o valor p for superior ao valor de significância, não é possível afirmar com segurança que os resultados observados foram obtidos em virtude do puro acaso ou da manipulação de sua pesquisa.
- Exemplo: o valor p está entre 0,05 e 0,1 . Isso significa que ele não é definitivamente menor do que 0,05, portanto, infelizmente, não podemos rejeitar a hipótese nula . Isso significa que não atingimos o limite mínimo de 95% de certeza, para podermos afirmar que o patrulhamento de nossa cidade aplica multas de trânsito para carros vermelhos e azuis em uma taxa significativamente diferente da média nacional.
- Em outras palavras, existe uma chance de 5% a 10% de que os resultados observados não foram um reflexo de uma mudança do local analisado (a pesquisa foi feita com índices do trânsito de nossa cidade, e não do trânsito em nível nacional), ao contrário, os resultados ocorreram por acaso. Como estávamos procurando por uma chance de menos de 5%, não podemos afirmar que temos certeza de que o patrulhamento de nossa cidade é menos tendencioso em relação aos carros vermelhos – existe uma chance pequena, mas estatisticamente significativa, de que não haja tendenciosidade.
Publicidade
Dicas
- Uma calculadora científica fará os cálculos muito mais facilmente. Elas também estão disponíveis online.
- Você pode calcular o valor p usando vários programas de computador, incluindo o programa de planilhas que é muito utilizado, como também softwares mais especializados de estatística.