Télécharger l'article
Télécharger l'article
Le coefficient de corrélation de Spearman permet d'analyser les relations non linéaires monotones (si une des variables augmente, l'autre fait de même, et inversement). Pour calculer le coefficient de Spearman, vous devez classer vos deux séries de données, calculer les différences de rangs au carré afin de trouver la somme de ces différences (Σd 2 ). Cette valeur est ensuite entrée dans la formule de calcul (standard ou simplifiée) du coefficient de corrélation de Spearman. Ce coefficient peut être établi sous Excel ou avec des commandes du langage R.
Étapes
-
Tracez un tableau de données. Ce tableau sera très pratique pour rentrer vos données et inscrire vos calculs. Vous devez faire un tableau avec :
- 6 colonnes (données 1, données 2, rang 1, rang 2, d et d 2 ),
- autant de lignes que vous avez de paires de données.
-
Remplissez les deux premières colonnes. Inscrivez vos données.
-
Dans la troisième colonne, classez vos données. Classez-y la première colonne de 1 à n , cette valeur étant le nombre de données que vous avez. Attribuez le rang 1 à la plus faible valeur, le rang 2 à la plus faible valeur suivante…
-
Dans la quatrième colonne, classez les autres données. Classez-y les valeurs de la deuxième colonne comme cela a été fait pour la troisième colonne.
-
Si dans vos colonnes, vous avez deux données (ou plus) égales, faites la moyenne des rangs des données en question. Modifiez ensuite les premiers rangs obtenus par cette moyenne.
Dans l'exemple ci-contre, vous voyez qu'il y a deux 5, classés au rang 2 et 3. Faites la moyenne de ces deux rangs : ici, ce sera 2,5 . Remplacez les premiers rangs (2 et 3) par la moyenne, soit 2,5.
-
Si dans vos colonnes, vous avez deux données (ou plus) égales, faites la moyenne des rangs des données en question. Modifiez ensuite les premiers rangs obtenus par cette moyenne.
-
Dans la colonne d , indiquez la différence des rangs. Sur la deuxième ligne, vous avez un rang 1 et un rang 3, la différence est de 2. Le signe n'a aucune importance, car la valeur sera ultérieurement élevée au carré.
-
Élevez au carré les valeurs de la colonne d . Les résultats seront inscrits dans la colonne d 2 , sur les lignes correspondantes.
-
Faites la somme de la colonne d 2 . Cette somme s'écrit ainsi : Σd 2 .
-
Choisissez une de deux formules.
- Si vous n'avez rencontré aucune corrélation, utilisez la formule de calcul simplifiée du coefficient de corrélation de Spearman ci-dessous :
et remplacez n par le nombre de paires de données de vos séries. Calculez.
- Si vous avez rencontré une quelconque corrélation, utilisez la formule standard du coefficient de Spearman ci-dessous.
- Si vous n'avez rencontré aucune corrélation, utilisez la formule de calcul simplifiée du coefficient de corrélation de Spearman ci-dessous :
-
9Interprétez le résultat obtenu. Il est obligatoirement compris entre -1 et 1.
- Si le coefficient est proche de -1, il y a une forte corrélation négative entre les deux séries.
- Si le coefficient est proche de 0, il n'y a pas de corrélation linéaire entre les deux séries.
- Si le coefficient est proche de 1, il y a une forte corrélation positive entre les deux séries.
Publicité
-
1Préparez vos colonnes. Vous n'aurez besoin que de cinq colonnes. Dans les deux premières colonnes (A et B), entrez vos données. Entrez en C2 la formule =RANK(A2,A$2:A$11) et copiez-la en dessous.
-
2Faites de même avec la colonne D. Entrez en D2 la formule =RANK(B2,B$2:B$11) et copiez-la en dessous.
-
3Tapez la formule de calcul de corrélation des rangs. Entrez en E2 la formule =CORREL(C2:C11,D2:D11) , C et D étant les colonnes des rangs. Validez et vous verrez apparaitre le coefficient de corrélation de Spearman.Publicité
Méthode 3
Méthode 3 sur 3:
Calculer le coefficient de Spearman avec le langage R
-
1Récupérez le logiciel R. Soit il est déjà installé sur votre ordinateur soit vous le téléchargez à : cette adresse .
-
2Enregistrez vos données dans un fichier CSV. Tapez les données à comparer dans les deux premières colonnes du fichier, puis enregistrez-le.
-
3Ouvrez l'éditeur de R. Sur un terminal, tapez simplement R . Si vous êtes sur le Bureau, doublecliquez sur le logo du logiciel.
-
4Tapez les commandes suivantes :
- tapez d <- read.csv("NOM_DE_VOTRE_FICHIER_CSV.csv") , puis validez,
- tapez cor(rank(d[,1]),rank(d[,2])) .
Publicité
Conseils
- Pour avoir un coefficient de Spearman qui ait un sens, vous devez utiliser au moins 5 paires de données afin de dégager une tendance. Ici, nous n'avons utilisé que trois paires pour la clarté du propos.
Publicité
Avertissements
- Le coefficient de corrélation de Spearman permet seulement de mesurer le degré de corrélation entre des données qui croissent ou décroissent en même temps. Si vous tracez un diagramme de dispersion des données, le coefficient de Spearman ne fournira pas une représentation précise de cette corrélation.
- Cette formule est basée sur l'hypothèse qu'il n'y a pas de corrélation entre les variables. Lorsqu'il existe une corrélation comme celle vue dans l'exemple, vous devez utiliser l'indice de corrélation de Pearson basé sur les rangs.
Publicité
À propos de ce wikiHow
Cette page a été consultée 33 685 fois.
Publicité