Télécharger l'article
Télécharger l'article
En statistiques, ce que l'on appelle mode d’une série est une valeur du caractère correspondant au plus grand effectif, c'est-à-dire celle qui se présente le plus grand nombre de fois dans la série en question. C'est sur cette base qu'une série peut ne comporter aucun mode, un seul, deux (série bimodale) ou plusieurs modes (série multimodale). Quand la série est discrète (valeurs individuelles), on parle de mode, mais quand elle est continue (classes), on parle de classe modale. Les valeurs sont souvent numériques, mais il est possible de déterminer le mode d'une série non numérique.
Étapes
-
Inscrivez les valeurs de la série de données. Le plus souvent, les modes se déterminent sur des séries statistiques, mais aussi sur des séries aléatoires. Quoi qu'il en soit, il vous faut une série de données au départ. Sauf si votre série contient peu de valeurs, il vous faudra dans un premier temps écrire la série pour en prendre connaissance. Si vous n'avez qu'une feuille de papier, vous l'inscrirez comme elle vous est donnée. Si vous préférez travailler sur ordinateur, le mieux est d'en passer par une feuille de calcul d'un tableur, la série sera inscrite en ligne, à raison d'une valeur par cellule [1] X Source de recherche .
- Rien ne vaut un exemple concret pour comprendre comment se détermine le mode d'une série de données. Tout au long de cet article, nous prendrons comme exemple la série suivante : {18, 21, 11, 21, 15, 19, 17, 21, 17} , laquelle pourra être le cas échéant modifiée afin d'être plus explicite.
-
Classez la suite dans l'ordre croissant. Ce n'est peut-être pas utile sur une petite série, mais sur les grandes, ce classement est obligatoire. La raison en est que vous allez devoir compter combien de fois une valeur de la série est présente : le classement croissant facilite donc la tâche. Avec une série contenant de très nombreuses valeurs de la variable, si vous ne voulez pas commettre d'erreurs ou recommencer de nombreuses fois votre décompte, le mieux est d'en passer par un classement croissant [2] X Source de recherche .
- Pour un travail sur papier, vous gagnerez à récrire la série classée. Commencez par la plus petite valeur et n'oubliez pas de l'indiquer autant de fois qu'elle est présente dans la série, puis passez à la valeur juste supérieure. Opérez ainsi jusqu'à épuisement des valeurs. À la fin de ce travail, vérifiez que vous n'avez rien oublié, car il va en aller de la justesse de votre réponse et des calculs complémentaires s'il y en a.
- Avec un tableur, la chose est beaucoup plus simple, puisqu'il existe une fonction de tri : vous trouverez dans un menu de la barre générale du tableur un menu qui contient la fonction de tri croissant. Dans Excel, elle est dans le groupe Trier et filtrer de l'onglet Données .
- Dans notre exemple, après avoir classé les valeurs par ordre croissant, nous obtenons la série suivante : {11, 15, 17, 17, 18, 19, 21, 21, 21} .
-
Comptez la fréquence de chaque nombre. Cette fréquence, aussi appelée « effectif » ou « occurrence », est simplement le nombre fois qu'un même nombre apparait dans la série. Pour connaitre le mode, il faut trouver la valeur la plus fréquente. Si la série contient peu de valeurs, un simple coup d'œil suffit (à condition d'être bien attentif !) à trouver le mode : c'est la valeur la plus souvent répétée [3] X Source de recherche .
- Sur le papier, ne perdez pas votre temps à marquer les occurrences des valeurs uniques, ne marquez que celles des valeurs qui apparaissent le plus souvent. Cela fait, regardez la valeur la plus fréquente : c'est votre mode. Par contre, si vous faites le travail dans la feuille de calcul d'un tableur (Excel, par exemple), opérez de même dans les cellules adjacentes. Si vous connaissez la manipulation des fonctions, sachez qu'il existe une fonction de recherche automatique ( =MODE( argument ) ).
- Dans notre série ({11, 15, 17, 17, 18, 19, 21, 21, 21}),11 n'apparait qu'une fois, 15 n'apparait qu'une fois, 17 apparait deux fois, 18 n'apparait qu'une fois, de même que 19, et enfin 21 apparait trois fois . Sans aucune ambigüité possible, 21 est la valeur de la série qui est la plus fréquente, et elle est la seule.
-
Repérez la valeur la plus fréquemment citée. Après ce travail de tri, ne retenez que la valeur présentant le plus grand nombre d'occurrences : ce sera le mode de votre série de données . Ne vous inquiétez pas si deux valeurs ont la même fréquence, c'est que tout simplement il y a deux modes. Si une série renferme deux modes, et cela arrive, la série sera dite « bimodale », « trimodale » s'il y en a trois, etc. toutes sont de toute façon « multimodales [4] X Source de recherche ».
- Dans notre exemple ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 21 ayant la plus grande fréquence, c'est ce nombre qui est considéré comme étant le mode . Conventionnellement, le mode est noté M 0 .
- Si une valeur, autre que 21, avait eu une fréquence identique, cette valeur aurait aussi été le mode de la série. Dans notre série, s'il y avait eu un 17 de plus, 17 et 21 auraient été les deux modes de la série.
-
Ne confondez pas mode, moyenne et médiane. En statistiques, ces trois concepts mathématiques sont fréquemment utilisés lors de l'analyse d'une série : ils ne doivent pas être confondus, même si parfois, ils ont totalement ou partiellement la même valeur. En soi, les confondre est une erreur, mais là où cela devient plus grave, c'est que ces outils sont réutilisés, à fins d'analyse, pour calculer d'autres valeurs (écart type, écart à la moyenne, etc.). Pour prendre un exemple concret, un démographe qui se tromperait sur ce point risquerait de tirer des conclusions bien hasardeuses. Ces trois concepts sont indépendants [5] X Source de recherche .
- Toute série de données a une moyenne . Par là, il s'agit d'une moyenne toute simple, arithmétique qui s'obtient en additionnant toutes les valeurs de la série, même celles apparaissant plusieurs fois, puis en divisant le résultat obtenu par le nombre de valeurs. Pour la série {11, 15, 17, 17, 18, 19, 21, 21, 21}, la moyenne s'établit ainsi : 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78 . La division se fait par 9, car il y a 9 valeurs dans la série.
- La médiane d'une série de données est la valeur de cette série qui partage la série en deux sous-séries d'effectifs égaux. Dans la série numérique {11, 15, 17, 17, 18, 19, 21, 21, 21}, 18 est la médiane, car c'est la valeur du milieu : il y a exactement autant de valeurs qui lui sont inférieures que de valeurs qui lui sont supérieures. Ici, la série contient un nombre impair de valeurs, c'est commode, mais dans le cas où la série comprendrait un nombre pair de valeurs, la médiane se définirait en prenant les deux valeurs centrales, en les additionnant et en divisant le résultat par 2.
Publicité
-
Sachez qu'il existe des séries sans mode. Cela arrive chaque fois qu'une série comprend des valeurs qui apparaissent toutes le même nombre de fois. Dans de telles séries, aucune valeur ne domine, toutes ont la même fréquence, la même occurrence. En ce cas, même si le terme est peu employé, la série est dite « amodale ». Une série qui ne contiendrait que des valeurs apparaissant une seule fois, ou deux fois, ou trois fois, etc. serait amodale [6] X Source de recherche .
- Modifions notre série de référence en sorte que chaque valeur n'apparaisse qu'une seule fois : {11, 15, 17, 18, 19, 21}. Cette série-là est amodale. Le résultat serait identique si les valeurs apparaissaient toutes deux fois ({11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}).
-
Sachez que toutes les séries ne sont pas quantitatives. Jusqu'à présent, nous n'avons utilisé que des séries quantitatives qui ne renferment que des valeurs numériques, et il est vrai qu'elles sont les plus rencontrées. Mais il existe aussi des séries qualitatives , dans lesquelles les valeurs ne sont pas numériques. Pour ce type de séries, et nous en verrons un exemple plus loin, le mode se détermine de la même façon : c'est la valeur la plus souvent représentée. Par contre, le même raisonnement ne tient pas quand il s'agit de calculer la moyenne ou la médiane de la série [7] X Source de recherche .
- Admettons qu'un ingénieur de l'ONF (Office national des forêts) fasse le décompte des espèces d'arbres poussant sur telle ou telle petite parcelle de bois. Tout en marchant, il note la série suivante : {cèdre, aulne, cèdre, pin, cèdre, cèdre, aulne, aulne, pin, cèdre}. La variable (espèce) est qualitative nominale en cela que ses valeurs sont des éléments d'une catégorie non hiérarchique. Il n'empêche que cette série a bien un mode : c'est le cèdre qui a l'effectif le plus important (cinq fois présent contre trois fois pour l'aulne et deux fois pour le pin).
- Comme nous l'avons souligné précédemment, vous seriez bien en peine de calculer la moyenne ou de déterminer la médiane de cette série forestière, vous n'avez pas de nombres pour cela.
-
Sachez que certaines séries sont étonnantes. Ce sont celles qui sont unimodales (n’ayant donc qu’un seul mode) avec une distribution parfaitement symétrique : en ce cas, le mode, la moyenne et la médiane sont une seule et même valeur. Pour mieux le voir, il suffit de représenter graphiquement la série sur deux axes avec en abscisses les valeurs uniques de la série et en ordonnées, les occurrences. Pour que les trois valeurs coïncident parfaitement, il faut absolument une distribution dite « normale », c'est-à-dire avec une symétrie parfaite (par exemple, une courbe de Gauss normale, en forme de cloche). L'abscisse du point le plus haut de la courbe est le mode. Comme la courbe est symétrique par rapport à la droite d'équation , la médiane, la valeur en plein milieu de la distribution, est aussi le mode. Quant à la moyenne de la série, elle est aussi le mode, car la moyenne de la première moitié de la série est égale à la moyenne de la seconde moitié.
- Prenons comme exemple la série de données {1, 2, 2, 3, 3, 3, 4, 4, 5}. Si vous représentiez graphiquement la distribution de cette série, vous obtiendriez une belle courbe de Gauss, bien symétrique. L'axe de symétrie, avec la plus forte fréquence, serait la droite d'équation , tandis que les fréquences les plus faibles seraient aux extrémités en et . Dans cette série, 3 est la valeur la plus fréquente, 3 est donc le mode . La série compte un nombre impair de valeurs, la courbe est symétrique : 3 est aussi la médiane (4 valeurs de chaque côté). Enfin, et pour les mêmes raisons que la médiane, 3 est aussi la moyenne ( ).
- Quand bien même vous auriez une série symétrique, ne vous avancez pas trop vite en affirmant que les trois mesures principales de tendance centrale, soit le mode, la moyenne et la médiane, se confondent : il suffit qu'il y ait deux modes pour que votre affirmation soit fausse. Prudence donc !
Publicité
Conseils
- Dans une série, il peut y avoir plusieurs modes (la série est multimodale).
- Si dans une série, les valeurs apparaissent toutes un même nombre de fois, il n'y a pas de mode.
Publicité
Éléments nécessaires
- Du papier, un crayon et une gomme
Références
- ↑ https://www.youtube.com/watch?v=o5Jn2ltB314
- ↑ https://virtualnerd.com/middle-math/probability-statistics/mean-median-mode-range/mode-data-set
- ↑ https://www.purplemath.com/modules/meanmode.htm
- ↑ https://www.mathgoodies.com/lessons/vol8/mode
- ↑ https://www.straighterline.com/blog/what-s-the-difference-between-mean-median-and-mode/
- ↑ https://virtualnerd.com/algebra-2/probability-statistics/central-tendency-dispersion/central-tendency/mode-data-set-all-different
- ↑ https://courses.lumenlearning.com/introstats1/chapter/skewness-and-the-mean-median-and-mode/
Publicité