En sta­tis­tiques, les grands volumes de données ne sont souvent évo­ca­teurs qu’à l’issue d’un trai­te­ment et d’une analyse ap­pro­priés après leur collecte. Le calcul de la médiane est une com­po­sante im­por­tante du procédé. Car en calculant la médiane, vous réduisez vos données à une ou à quelques de valeurs de mesure, de manière à pouvoir re­pré­sen­ter de manière claire des in­ter­re­la­tions complexes ou des si­tua­tions sous la forme de tables et de dia­grammes. Nous vous ex­pli­quons pas à pas comment calculer la médiane et l’in­ter­pré­ter.

Qu’est-ce que la médiane ?

La médiane, également nommée valeur centrale, vient du domaine de la sta­tis­tique et cor­res­pond à la valeur située exac­te­ment au point milieu parmi plusieurs mesures, quand vous triez vos données selon leur grandeur. En sta­tis­tiques des­crip­tives, la médiane est également appelée paramètre de position et est utilisée pour exprimer la tendance centrale du jeu de données.

Note

Attention à ne pas confondre la médiane avec la valeur moyenne ou la moyenne arith­mé­tique. Celle-ci est calculée en to­ta­li­sant toutes les valeurs puis en divisant le total par l'ef­fec­tif. Avec la médiane, on se concentre sur la valeur qui se situe au point milieu dans une suite crois­sante.

Quelle formule utiliser pour calculer la médiane ?

Lors du calcul de la médiane d’une série de données, vous pouvez faire appel à deux formules selon l’effectif de valeurs observées. Le symbole com­mu­né­ment utilisé pour la médiane est (à savoir « x tilde »), cor­res­pond à l’effectif de valeurs observées et à une valeur de la série de données.

Utilisez cette formule si vous disposez d’un effectif impair de valeurs observées :

Utilisez cette formule si vous disposez en revanche d’un effectif pair de valeurs observées :

Nous vous ex­pli­quons à la suite les deux cas de figure à l’aide d’exemples simples.

Calculer la médiane : marche à suivre

Exemple nº 1 : Effectif impair de valeurs

Dans notre premier exemple, vous disposez d’un effectif impair de valeurs observées. Supposons que onze par­ti­ci­pants à un séminaire de formation continue sont in­ter­ro­gés sur leur âge et que les réponses des par­ti­ci­pants se déclinent comme suit :

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49

Triez les réponses par ordre croissant dans un premier temps :

19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62

Chacune des valeurs spé­ci­fiées cor­res­pond à une valeur . En d’autres termes, 19 = , 26 = , 28 = etc. L’avantage d’un effectif impair de valeurs observées est de pouvoir iden­ti­fier di­rec­te­ment la médiane. Dans ce cas, elle se situe au rang = 38, car cette valeur coupe la série de chiffres en deux moitiés. Une moitié des in­di­ca­tions d’âge (19, 26, 28, 29, 34) est ici in­fé­rieure à la médiane et l’autre moitié (43, 45, 49, 51, 62) est su­pé­rieure à la médiane.

Vous pouvez aussi calculer la médiane en ap­pli­quant la formule men­tion­née dans la section pré­cé­dente. cor­res­pond ici à l’effectif de valeurs observées, à savoir 11. La formule s’apparente à ceci :

Nous obtenons donc le même résultat car cor­res­pond à 38. La médiane des in­di­ca­tions d’âge col­lec­tées lors du séminaire est 38, car cette valeur est située pré­ci­sé­ment au milieu quand vous triez les données d’après la grandeur.

Exemple nº 2 : Effectif pair de valeurs

Dans cet exemple, il n’est pas aussi simple d’iden­ti­fier la médiane car l’effectif de valeurs observées est pair, et la médiane ne se situe pas au point milieu dans la série de données.

Supposons que le séminaire de formation continue suivant soit élargi à un par­ti­ci­pant, et que donc douze personnes y soient main­te­nant in­ter­ro­gées sur leur âge. Les réponses se déclinent comme suit :

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Triez main­te­nant les in­di­ca­tions à nouveau de la plus petite valeur vers la plus grande dans une série et nommez les chiffres de à .

19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

Avec = 12, la formule cor­res­pon­dant à un nombre pair de valeurs observées peut s’appliquer :

La médiane pour les in­di­ca­tions d’âge col­lec­tées pour ce séminaire est donc 36.

Note

Si vous utilisez le tableur Excel, vous ne devez pas calculer ma­nuel­le­ment la médiane. Excel offre une fonction de médiane pratique, qui retourne ra­pi­de­ment et sans erreur le résultat correct.

Dif­fé­rence avec la moyenne arith­mé­tique et le mode

Comme déjà évoqué, la médiane ne doit pas être confondue avec la valeur moyenne. Celle-ci est également nommée « moyenne arith­mé­tique » et utilisée quand il s’agit de trouver la valeur moyenne d’une quantité de données. Dans notre premier exemple, l’âge moyen cor­res­pond à 38,5 (somme des in­di­ca­tions divisée par l’effectif de par­ti­ci­pants). À ceci vient encore s’ajouter le « mode ». Cette valeur indique l’in­di­ca­tion la plus fréquente dans un jeu de données. Dans nos exemples, chaque réponse est un mode, car chacune d’elle est unique.

Uti­li­sa­tion de la médiane

Il reste main­te­nant à savoir quand vous devez calculer la médiane et quand la moyenne arith­mé­tique ou le mode sont plus ap­pro­priés.

Ceci dépend en­tiè­re­ment de la situation. Bien que la moyenne arith­mé­tique soit gé­né­ra­le­ment con­si­dé­rée comme plus précise et témoigne d’une ef­fi­ca­cité élevée en sta­tis­tiques, elle peut toutefois réagir de manière plus sensible par rapport aux valeurs aber­rantes. En d’autres termes, une in­di­ca­tion de mesure erronée dans le jeu de données peut fausser con­si­dé­ra­ble­ment la valeur moyenne. La médiane n’est certes pas aussi précise ou efficace que la moyenne arith­mé­tique, elle est toutefois con­si­dé­rée comme plus robuste et son uti­li­sa­tion est appréciée quand les ensembles de données sont peu fiables.

En revanche, le mode est utilisé quand il ne s’agit plus de valeurs nu­mé­riques mais d’autres ca­rac­té­ris­tiques, par exemple : vous com­mer­cia­li­sez un produit dans dif­fé­rents coloris et souhaitez iden­ti­fier le coloris le plus apprécié.

Aller au menu principal