Chapitre 4: les paramètres de dispersion


         Nous avons vu que les valeurs centrales sont nécessaires pour caractériser une série statistique, cependant elles ne sont pas en général suffisantes pour donner une conclusion sur la répartition d’un caractère, ainsi par exemple on peut rencontrer deux populations ayant même valeur centrale mais elles n’ont pas une même dispersion autour du centre.
         Soit par exemple les notes de deux étudiants dans cinq matières :


L’étudiant N° 1
L’étudiant N° 2
Philosophie
6
2
Histoire
8
6
Mathématiques
10
10
Anglais
12
14
Français
14
18
        
Les deux étudiants ont même moyenne et même médiane : 10, mais nous remarquons que leurs notes ne sont pas réparties de la même façon autour de la valeur central. On dit donc que  les deux séries n’ont pas la même répartition, et plus précisément la série 2 (notes de l’étudiant N° 2) est plus dispersée que la série 1 (note de l’étudiant N° 1).

1- L’étendue de la série :
L’étendue, appelée aussi amplitude ou intervalle maximale d’une série est égale à la différence des valeurs extrêmes de la série. Elle est notée E; Ainsi dans l’exemple précédent des notes des deux étudiants N°1 et N°2 la série {6, 8, 10, 12, 14} a pour étendue E = 14 – 6 = 8. Et la série {2, 6, 10, 14, 18} a pour étendue E = 18 – 2 = 16.

2- Les quantiles :

Définition :

         On appelle quantile d’ordre a%, on dit aussi fractiles, et qu’on note Qa, la valeur xi du caractère telle que a% des valeurs observées soient inférieures strictement à ci.
Autrement dit un quantile d’ordre n est une série ayant n groupes d’effectifs égaux. Ainsi la médiane est un quantile d’ordre 2.
                    
         Les quantiles les plus fréquemment utilisées dans la statistique descriptive sont :
-La médiane Me : est le quantile d’ordre 50%. Elle partage la série des valeurs observées en deux séries de même taille.
-Les quartiles, c’est-à-dire les quantiles d’ordre 4, notée Q1, Q2, Q3, elle partage la série en 4 séries de même taille :
25% des observations sont inférieures au 1er quartile Q25 :
50% des observations sont inférieures au 2ème quartile Q50 :

75% des observations sont inférieures au 3ème quartile Q75 :
-Les déciles ; ce sont les quartiles d’ordre 10, ils partagent l’effectif total en dix groupes égaux. Il y en a neuf déciles notés D1, D2, D3……..D9.
-Les centiles ; ce sont les quartiles d’ordre 1, ils partagent l’effectif total en quatre-vingt-dix groupes égaux. Elles sont notées C1, C2, C3……..C99.

3-Les intervalles interquantiles :
La différence Q75 – Q25 s’appelle écart interquartile.
         L’intervalle interdécile noté ID ou I.Id est la différence entre Q90 et Q10, et on a :
ID = Q90 – Q10, cet intervalle contient 80% des observations.
         La différence Q90 – Q10 s’appelle écart interdécile.
         L’intervalle interdécile noté IC ou I.IC est la différence entre Q99 et Q1, et on a :
IC = Q99 – Q1, cet intervalle contient 98% des observations.
La différence Q99 – Q1 s’appelle écart intercentile.
Tous ces écarts permettent de mesurer la dispersion de la série autour de la médiane.

Exemple :
         On donne la distribution des revenus annuels des 460 cadres d’un groupe bancaire
Classe de revenus (en dirhams)
Effectifs
de   50 000 à moins de    70 000
de   70 000 à moins de    80 000
de   80 000 à moins de    90 000
de   90 000 à moins de  100 000
de 100 000 à moins de  105 000
de 105 000 à moins de  110 000
de 110 000 à moins de  120 000
de 120 000 à moins de  130 000
de 130 000 à moins de  140 000
de 140 000 à moins de  160 000
de 160 000 à moins de  190 000
24
32
51
70
47
41
70
58
40
24
3

Déterminer l’étendre de la série, et les intervalles interquartile et interdécile.

En effet
Classe de revenus
(en milliers de dirhams)
Effectifs
Effectifs cumulés croissants ‘ECC’
[ 50 , 70 [
[ 70 , 80 [
[ 80 , 90 [
[ 90 , 100 [
[ 100 , 105 [
[ 105 , 110 [
[ 110 , 120 [
[ 120 , 130 [
[ 130 , 140 [
[ 140 , 160 [
[160 , 190 [
24
32
51
70
47
41
70
58
40
24
3
24
56
107
177
224
265
335
393
433
457
460

L’étendue de la série est E = 190 – 50 = 140 milliers de dirhams.
Le quartile Q1 correspond au  caractère du 460/4 = 115ième individu. Il appartient à la classe 90 – 100 :=90 + 8 x   10/70      = 91,14 milliers de dirhams.

Le quartile Q3 correspond au caractère du (3/4) x 460 = 345ième individu. Il appartient à la classe 110 – 120 := 120 + 10 x  10/58       = 121,72 milliers de dirhams.


L’intervalle interquartile est  IQ = Q75 – Q25 = 121,72 – 95,6 = 26,12.
         Soit 26 120 DH.
         Le décile D1 correspond au caractère du 460/10 = 46ième individu. Il appartient à la classe 70 – 80 :  70 +10 X  22/32=76,875
De même Le décile D9 correspond au caractère du 9 x 460/10 = 414ième individu. Il appartient à la classe 70 – 80 :130 + 10 X 21/40=135,525
L’intervalle interdécile est Id = D9 – D1 = 135,525 – 76,975 = 58,55
Soit 58 550 DH.

4- L’écart absolu moyen :

4-1- Ecart absolu moyen par rapport à la moyenne :
L’écart absolu moyen par rapport à la moyenne noté ec, encore appelé écart arithmétique, est la moyenne arithmétique des valeurs absolues des écarts de tous les termes de la série à leur moyenne arithmétique
Remarquons que cet écart absolu moyen est nul si les observations sont égales.

4-2- Ecart absolu moyen par rapport à la médiane :
         L’écart absolu moyen par rapport à la médiane noté eMe, est la moyenne arithmétique des valeurs absolues des écarts de tous les termes de la série à leur médiane.
Exemple :
         On considère la distribution suivante :

Classes
[15,25[
[25,35[
[35,45[
[45,55[
[55,65[
[65,75[
[75,85[
Effectifs
9
15
22
29
17
6
2
a) calculer l’écart absolu moyen par rapport à la moyenne.
b) calculer l’écart absolu moyen par rapport à la médiane.

En effet,
Classes
xi
ni
nixi
ci - c
ni  ci - c
Fi(%)
  ci - Me
ni  ci - Me
[15,25[
[25,35[
[35,45[
[45,55[
[55,65[
[65,75[
[75,85[
20
30
40
50
60
70
80
9
15
22
29
17
6
2
  180
  450
  880
1 450
1 020
  420
  160
25,6
15,6
  5,6
  4,4
14,4
24,4
34,4
  230,4
  234,0
  123,2
  127,6
  244,8
  146,4
    68,8
  9
 24
 46
 75
 92
 98
100
26,38
16,38
  6,38
  3,62
13,62
23,62
33,62
  237,42
  245,70
  140,36
  104,98
  231,54
  141,72
    67,24
å

100
4 560

1 175,2


1 168,96
å/n


45,60

1 175,2


1       168,96


 a) X= 45,6   eX= 11,75
b) Me = 45 + 10.(50 – 46)/29 » 46,38 et eMe  » 11,69.

5- Variance et écart-type
         Les paramètres de dispersion sont des nombres qui mesurent la dispersion des valeurs autour d’un paramètre de position (c, Me, …). Ils s’expriment dans la même unité que les observations et permettent de comparer des séries statistiques de même nature.
5-1- Variance :

Variance d’une série non pondérée
5-2- Ecart- type :
         On appelle écart-type la racine carrée de la variance. On note
Ecart-type d’une série pondérée
         Le calcul de l’écart-type pour les séries pondérées n’est pas fondamentalement différent de celui effectué précédemment : les écarts à la moyenne doivent être comptés autant de fois qu’ils apparaissent dans la série.
         Si la série est à caractère continu, comme pour le calcul de moyenne, on prend pour valeur du caractère le centre de chaque classe.
6- Coefficient de variation :
         Pour faciliter les comparaisons entre séries, on utilise une mesure de dispersion relative appelée coefficient de variation.
         Le coefficient de variation noté Cv est un nombre sans dimension et indépendant des unités choisies. On peut le considérer comme un indice de dispersion « absolu ». Le coefficient de variation est le rapport de l’écart-type à la moyenne arithmétique c :
           Cv=             s /  c





Chapitre 4: les paramètres de dispersion Chapitre 4: les paramètres de dispersion Reviewed by IstaOfppt on 06:05 Rating: 5

Aucun commentaire:

Fourni par Blogger.