La « valeur P » est une mesure statistique qui aide les scientifiques à déterminer si leurs hypothèses sont correctes. Celle-ci est utilisée pour savoir si les résultats d’une expérience se trouvent dans la gamme normale des valeurs pour un évènement observé. Généralement, si la valeur P d’un jeu de données est au-dessous d’une valeur prédéterminée (comme 0,05 par exemple), les scientifiques rejetteront l’« hypothèse nulle » de leur expérience, autrement dit, ils élimineront l’hypothèse selon laquelle les variables testées au cours de leur expérience n’ont aucun effet significatif sur les résultats. Les valeurs P sont lues dans un tableau de référence après avoir calculé la valeur du Khi-deux.
Étapes
-
Déterminez les résultats attendus de votre expérience. En général, lorsqu’un scientifique conduit une expérience, il a déjà en tête une idée des résultats « normaux » ou « typiquement observés ». Cette idée peut être basée sur des recherches menées antérieurement, sur des jeux de données fiables issus d’observations antérieures, sur de la bibliographie ou d’autres sources. Pour votre expérience, déterminez quels sont les résultats attendus et exprimez-les sous forme de nombres.
- Exemple : imaginez que des études aient déterminé qu’au niveau national, les voitures rouges prenaient plus d’amendes pour excès de vitesse que les voitures bleues. Disons que le ratio est de 2:1 pour les excès de vitesse des voitures rouges. Nous voulons déterminer si la police locale montre les mêmes tendances. Pour cela, nous allons analyser les amendes pour excès de vitesse délivrées par la police locale. Donc, si nous prenons au hasard 150 amendes données à des voitures rouges ou bleues et si nous considérons que la police locale distribue des amendes en proportions aussi biaisées que les proportions nationales , alors nous nous attendrons à ce que 100 voitures rouges reçoivent une amende contre 50 voitures bleues.
-
Déterminez les résultats observés de votre expérience. À présent que vous avez déterminé quelles doivent être les valeurs attendues, vous pouvez débuter votre expérience pour obtenir vos résultats véritables (ou observés ). Ici aussi, vous devez exprimer ces résultats sous forme de nombre. Si l’on manipule les variables expérimentales et que les résultats observés diffèrent des résultats attendus, alors il y a deux possibilités : soit cette différence est due au hasard, soit c’est la manipulation des variables expérimentales qui a est à l’origine des différences observées. De fait, le but du calcul de la valeur P est de déterminer si les résultats observés diffèrent des résultats attendus de telle façon que la probabilité de l’« hypothèse nulle », soit l’hypothèse qu’il n’existe aucune relation entre les variables expérimentales et les résultats observés, soit suffisamment faible pour être rejetée.
- Exemple : sélectionnons au hasard 150 amendes pour excès de vitesse distribuées à des voitures rouges ou des voitures bleues dans votre ville. Nous observons que 90 des amendes ont été données à des voitures rouges et 60 à des voitures bleues. Ces données diffèrent des résultats attendus de 100 amendes pour les voitures rouges et 50 amendes pour les voitures bleues. Est-ce que notre manipulation expérimentale (qui a consisté ici à changer la source des données en substituant des données locales à des données nationales) est à l’origine des changements dans les résultats, ou est-ce que la police locale est aussi biaisée que les observations à l’échelle nationale, auquel cas les différences que nous observons entre l’échelle nationale et l’échelle locale sont juste des variations dues au hasard ? Le calcul de la valeur P va nous aider à répondre à cette question.
-
Déterminez le degré de liberté . Les degrés de liberté sont une mesure du degré de variabilité présent dans la recherche, lui-même limité par le nombre de catégories examinées. La formule du degré de liberté est la suivante : degrés de liberté = n-1 , où « n » désigne le nombre de catégories ou de variables analysées dans notre expérience.
- Exemple : deux catégories de résultats sont observées au cours de notre expérience : une pour les voitures rouges et une pour les voitures bleues. Donc, nous avons 2 - 1 = 1 degré de liberté . Si nous avions dû comparer des voitures rouges, bleues et vertes, nous aurions obtenu 2 degrés de liberté, et ainsi de suite.
-
Calculez le Khi-deux pour comparer deux ensembles de données. Le Khi-deux (aussi écrit sous la forme « χ 2 ») est une valeur numérique qui mesure la différence entre valeurs attendues ou théoriques et valeurs observées au cours d’une expérience. La formule est la suivante : χ 2 = Σ((o-e) 2 /e) , où « o » correspond aux données observées ou réelles tandis que « e » correspond aux données attendues ou théoriques [1] X Source de recherche . Additionnez les résultats de cette formule pour toutes les issues possibles (voir ci-dessous).
- Il est à noter que cette dernière équation inclut un Σ (sigma). En d’autres termes, vous devrez calculer (o-e) 2 /e pour chaque issue possible, pour ensuite additionner les résultats de ces calculs afin d’obtenir la valeur du Khi-deux. Dans notre exemple, nous avons deux issues possibles, la voiture qui a reçu une amende est soit rouge, soit bleue. Ainsi, nous devrions calculer (o-e) 2 /e deux fois, une fois pour les voitures rouges, une fois pour les voitures bleues.
- Exemple : introduisons nos valeurs attendues et nos valeurs observées dans l’équation x 2
= Σ((o-e) 2
/e). N’oublions pas qu’il faut calculer (o-e) 2
/e deux fois, du fait de la présence du symbole Σ, une fois pour les voitures rouges, une fois pour les voitures bleues. Cela donne :
- x 2 = ((90-100) 2 /100) + (60-50) 2 /50)
- x 2 = ((-10) 2 /100) + (10) 2 /50)
- x 2 = (100/100) + (100/50) = 1 + 2 = 3
-
Choisissez le seuil de significativité . Maintenant que nous connaissons le degré de liberté et la valeur du Khi-deux de notre expérience, il nous reste une dernière chose à faire avant de calculer la valeur P : déterminer le seuil de significativité. Globalement, le seuil de significativité est une mesure du degré de certitude que nous voulons accorder à la fiabilité de nos résultats. Un faible degré de significativité correspond à une faible probabilité que les résultats de l’expérience soient dus au hasard, et inversement. Les seuls de significativités sont exprimés en nombres décimaux (comme 0,01), ce qui correspond au pourcentage de chance que les résultats de l’expérience soient dus au hasard (dans ce cas, le pourcentage est donc de 1 %).
- Par convention, le seuil de significativité est habituellement fixé à 0,05, soit 5 %, par les scientifiques [2] X Source de recherche . Cela signifie que les résultats scientifiques qui dépassent ce seuil ont au maximum 5 % de chances de résulter du pur hasard. En d’autres termes, il y a 95 % de chances que les résultats soient déterminés par les variables manipulées par le scientifique. Dans la plupart des cas, si on parvient à être sûr à 95 % d’une corrélation entre deux variables, alors la démonstration de cette corrélation est considérée comme valide.
- Reprenons notre exemple et fixons à 0,05 le seuil de significativité de nos résultats.
-
Utilisez un tableau de distribution du Khi-deux pour trouver la valeur P. Les scientifiques et les statisticiens utilisent de grands tableaux de données pour calculer la valeur P d’une expérience donnée. En général, l’axe vertical de ces tableaux correspond aux degrés de liberté, et l’axe horizontal correspond aux valeurs de P. Pour utiliser ces tables, trouvez d’abord votre degré de liberté, puis lisez la ligne horizontale correspondante de gauche à droite jusqu’à trouver la première valeur supérieure à votre valeur de Khi-deux. Regardez la valeur P correspondante en haut de la colonne, votre valeur P se trouve entre cette valeur et la valeur suivante la plus élevée (soit celle qui se trouve immédiatement à gauche, ou à droite selon le tableau).
- Les tableaux de distribution du Khi-deux sont faciles à trouver, ils sont disponibles sur internet, ou dans des bouquins de sciences et de statistiques. Si vous n’en avez pas sous la main, utilisez celui de l’image ci-dessus ou trouvez-en un gratuit en ligne, comme celui fourni ici par le site medcalc.org
- Exemple : nous avons précédemment obtenu un Khi-deux de 3. Vérifions le tableau de distribution du Khi-deux pour trouver la valeur approximative de P. Nous savons que nous avons obtenu un degré de liberté de 1 ; nous commençons donc par la première ligne du tableau. Ensuite, il faut lire les nombres de la ligne correspondante, de gauche à droite, jusqu’à trouver une valeur supérieure à 3 , soit notre valeur de Khi-deux. La première valeur supérieure à 3 que nous rencontrons est 3,84. En regardant en haut de la colonne correspondante, nous pouvons lire que la valeur P correspondante est de 0,05. Ainsi, notre valeur P est comprise entre 0,05 et 0,1 (soit la prochaine valeur supérieure dans le tableau).
-
Il reste à présent à décider s’il faut rejeter ou accepter l’hypothèse nulle. Maintenant que vous avez trouvé la valeur P de votre test, vous pouvez décider si vous devez ou non rejeter l’hypothèse nulle de votre expérience (pour rappel, il s’agit de l’hypothèse selon laquelle les variables que vous avez manipulées n’ont aucun effet significatif sur les résultats observés). Si votre valeur P est plus faible que votre seuil de significativité, alors félicitations, vous avez prouvé qu’il est hautement improbable qu’il existe une corrélation entre les variables que vous avez manipulées et les résultats observés. Si votre valeur P est au contraire supérieure à votre seuil de significativité, alors vous ne pouvez pas déterminer avec certitude si les valeurs observées sont le résultat du hasard ou de la manipulation des variables expérimentales.
- Exemple : notre valeur P se situe entre 0,05 et 0,1. Cela signifie que celle-ci n’est pas inférieure à 0,05. Ainsi, nous ne pouvons malheureusement pas rejeter notre hypothèse nulle . Cela signifie que nous n’avons pas atteint le seuil minimum de certitude de 95 %, seuil que nous avons établi comme nécessaire pour pouvoir affirmer que la police locale distribue des amendes aux voitures rouges et bleues dans des proportions significativement différentes de la moyenne nationale.
- En d’autres termes, il existe entre 5 et 10 % de chances que les résultats observés ne soient pas dus au changement d’échelle (analyse de données à l’échelle locale et non à l’échelle nationale), mais uniquement au hasard. Dans la mesure où nous voulions que ce taux ne dépasse pas les 5 %, nous ne pouvons affirmer que nous sommes certains que notre police locale soit moins biaisée que ce que nous observons à l’échelle nationale (soit qu’elle distribue proportionnellement moins d’amendes aux voitures rouges qu’à l’échelle nationale), les chances pour que ce ne soit pas le cas sont minces, mais significatives.
Publicité
Conseils
- Une calculatrice scientifique facilitera beaucoup le calcul. Vous pouvez également trouver des calculatrices en ligne.
- Vous pouvez calculer la valeur P en utilisant divers programmes informatiques, notamment des logiciels de calcul couramment utilisés et des logiciels statistiques plus spécialisés.
Références
- ↑ http://www.biologycorner.com/worksheets/chi_square_candy.html# .UqYlvvRDtMg
- ↑ http://www.radford.edu/rsheehy/Gen_flash/Tutorials/Chi-Square_tutorial/x2-tut.htm
- http://www.southalabama.edu/coe/bset/johnson/studyq/sq16.htm
- http://www2.lv.psu.edu/jxm57/irp/chisquar.html
- http://www.csulb.edu/~msaintg/ppa696/696stsig.htm#4) The Chi Square Test
À propos de ce wikiHow
Pour calculer la valeur p , comparez les résultats attendus de votre expérience avec les résultats observés. Le calcul de la valeur p vous permettra de voir si vos résultats se situent dans des limites acceptables. Une fois la valeur p approximative trouvée, vous pourrez décider de rejeter ou de conserver votre hypothèse nulle. Si la valeur p est inférieure à un seuil prédéterminé (par exemple 0,05), vous rejetterez alors l'hypothèse nulle de l'expérience.