Calculer la médiane

En statistiques, les grands volumes de données ne sont souvent évocateurs qu’à l’issue d’un traitement et d’une analyse appropriés après leur collecte. Le calcul de la médiane est une composante importante du procédé. Car en calculant la médiane, vous réduisez vos données à une ou à quelques de valeurs de mesure, de manière à pouvoir représenter de manière claire des interrelations complexes ou des situations sous la forme de tables et de diagrammes. Nous vous expliquons pas à pas comment calculer la médiane et l’interpréter.

Qu’est-ce que la médiane ?

La médiane, également nommée valeur centrale, vient du domaine de la statistique et correspond à la valeur située exactement au point milieu parmi plusieurs mesures, quand vous triez vos données selon leur grandeur. En statistiques descriptives, la médiane est également appelée paramètre de position et est utilisée pour exprimer la tendance centrale du jeu de données.

Note

Attention à ne pas confondre la médiane avec la valeur moyenne ou la moyenne arithmétique. Celle-ci est calculée en totalisant toutes les valeurs puis en divisant le total par l'effectif. Avec la médiane, on se concentre sur la valeur qui se situe au point milieu dans une suite croissante.

Quelle formule utiliser pour calculer la médiane ?

Lors du calcul de la médiane d’une série de données, vous pouvez faire appel à deux formules selon l’effectif de valeurs observées. Le symbole communément utilisé pour la médiane est (à savoir « x tilde »), correspond à l’effectif de valeurs observées et à une valeur de la série de données.

Utilisez cette formule si vous disposez d’un effectif impair de valeurs observées :

Utilisez cette formule si vous disposez en revanche d’un effectif pair de valeurs observées :

Nous vous expliquons à la suite les deux cas de figure à l’aide d’exemples simples.

Calculer la médiane : marche à suivre

Exemple nº 1 : Effectif impair de valeurs

Dans notre premier exemple, vous disposez d’un effectif impair de valeurs observées. Supposons que onze participants à un séminaire de formation continue sont interrogés sur leur âge et que les réponses des participants se déclinent comme suit :

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49

Triez les réponses par ordre croissant dans un premier temps :

19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62

Chacune des valeurs spécifiées correspond à une valeur . En d’autres termes, 19 = , 26 = , 28 = etc. L’avantage d’un effectif impair de valeurs observées est de pouvoir identifier directement la médiane. Dans ce cas, elle se situe au rang = 38, car cette valeur coupe la série de chiffres en deux moitiés. Une moitié des indications d’âge (19, 26, 28, 29, 34) est ici inférieure à la médiane et l’autre moitié (43, 45, 49, 51, 62) est supérieure à la médiane.

Vous pouvez aussi calculer la médiane en appliquant la formule mentionnée dans la section précédente. correspond ici à l’effectif de valeurs observées, à savoir 11. La formule s’apparente à ceci :

Nous obtenons donc le même résultat car correspond à 38. La médiane des indications d’âge collectées lors du séminaire est 38, car cette valeur est située précisément au milieu quand vous triez les données d’après la grandeur.

Exemple nº 2 : Effectif pair de valeurs

Dans cet exemple, il n’est pas aussi simple d’identifier la médiane car l’effectif de valeurs observées est pair, et la médiane ne se situe pas au point milieu dans la série de données.

Supposons que le séminaire de formation continue suivant soit élargi à un participant, et que donc douze personnes y soient maintenant interrogées sur leur âge. Les réponses se déclinent comme suit :

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Triez maintenant les indications à nouveau de la plus petite valeur vers la plus grande dans une série et nommez les chiffres de à .

19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

Avec = 12, la formule correspondant à un nombre pair de valeurs observées peut s’appliquer :

La médiane pour les indications d’âge collectées pour ce séminaire est donc 36.

Note

Si vous utilisez le tableur Excel, vous ne devez pas calculer manuellement la médiane. Excel offre une fonction de médiane pratique, qui retourne rapidement et sans erreur le résultat correct.

Différence avec la moyenne arithmétique et le mode

Comme déjà évoqué, la médiane ne doit pas être confondue avec la valeur moyenne. Celle-ci est également nommée « moyenne arithmétique » et utilisée quand il s’agit de trouver la valeur moyenne d’une quantité de données. Dans notre premier exemple, l’âge moyen correspond à 38,5 (somme des indications divisée par l’effectif de participants). À ceci vient encore s’ajouter le « mode ». Cette valeur indique l’indication la plus fréquente dans un jeu de données. Dans nos exemples, chaque réponse est un mode, car chacune d’elle est unique.

Utilisation de la médiane

Il reste maintenant à savoir quand vous devez calculer la médiane et quand la moyenne arithmétique ou le mode sont plus appropriés.

Ceci dépend entièrement de la situation. Bien que la moyenne arithmétique soit généralement considérée comme plus précise et témoigne d’une efficacité élevée en statistiques, elle peut toutefois réagir de manière plus sensible par rapport aux valeurs aberrantes. En d’autres termes, une indication de mesure erronée dans le jeu de données peut fausser considérablement la valeur moyenne. La médiane n’est certes pas aussi précise ou efficace que la moyenne arithmétique, elle est toutefois considérée comme plus robuste et son utilisation est appréciée quand les ensembles de données sont peu fiables.

En revanche, le mode est utilisé quand il ne s’agit plus de valeurs numériques mais d’autres caractéristiques, par exemple : vous commercialisez un produit dans différents coloris et souhaitez identifier le coloris le plus apprécié.