Chapitre 3 : Les paramètres de position

Nous avons vu que les représentations graphiques sous forme de tableaux ou  sous forme de courbes donnent déjà une première analyse des phénomènes étudiés. Cependant il est plus commode de caractériser une série statistique au moyen d’un nombre représentatif de l’ensemble du phénomène.
         Cependant le choix d’une valeur centrale, par exemple la moyenne peut avoir des avantages et des inconvénients : ainsi la moyenne arithmétique permet de caractériser le niveau général d’un étudiant, mais elle masque en même temps son niveau général réel dans chaque discipline.

1- Moyenne arithmétique :
         La moyenne arithmétique d’une série statistique c1, c2, …cp est égale à la somme des valeurs observées, divisée par le nombre d’observation. On la note :
           i = p
          åci,                    
            i = 1                                i = p
c =            , avec  n = åni.
           N                     i=1

Remarque: c peut s’écrire aussi en fonction des fréquences, en effet:
i = n
å fi.
i=1
 






           i = n    ci
c  =   å,          /     =                   
            i = 1    n
i = n
å fi.
i=1                              


Si la série est pondérée, on écrit :
Exemple :
         Les performances en jet javelot de 100 joueurs sont présentées dans le tableau suivant :
Longueur en mètres
71
74
77
80
83
Effectifs
6
17
41
27
9

        71 x 6 + 74 x 17 + 77 x 41 + 80 27 + 83 x 9           7 748
c =                                                                                =              = 77,48.
                       6 + 17 + 41 + 27 + 9                                   100
c = 77,48.

Si X est une variable continue de distribution {(ëaiai, +1ë, ni) / 1 £ i £ p}, la moyenne se calcule comme précédemment, en remplaçant ci par le centre ci de la classe
                 ai + ai+1
[ai, ai +1 [   ci =                    .
                               2

Exemple :
         Soit le tableau donnant les salaires des cadres d’une entreprise et leur fréquence :
ci
fi
[5 000,7 000[
[7 000,9 000[
[9 000, 14 000[
[14 000, 20 000[
[20 000, 30 000[
0,21
0,34
0,25
0,15
0,05
Total
1,00
    ai + ai+1
   ci =              /           .
                  2

      5 000 + 7 000
Par exemple : c1 =                                  = 6 000,
                                            2

c1
fi
6 000
8 000
11 500
17 000
25 000
0,21
0,34
0,25
0,15
0,05

1,00

 

c =    
i = 5
å cifi
i=1
           = 10655.

2- Moyenne géométrique :

Définition :
         La moyenne géométrique notée G ou Mg de n observations, positives est égale à la racine nième de leur produit. Soit c1, c2, …cn une suite d’observation, alors                      G = n     c1 x … xci, …x cn.

Remarque, on peut noter la moyenne géométrique aussi   :

Ainsi la moyenne géométrique des deux nombres réels 2 et 8 est G =     2 x 8 = 4.
         Alors que la moyenne arithmétique est  c  = 5.
         Dans le cas où la série est pondérée, il faudra tenir compte des coefficients de pondération. Soit k observations distinctes c1, c2, …ck, de coefficients respectifs n1, n2,
i = k
å ni
i=1
 
 


…nk. Avec n est l’effectif total, soit n =            = n1 + n2 + …nk,

         La moyenne géométrique s’écrit d’écrit :
3- Moyenne harmonique :
         La moyenne harmonique H d’une série statistique est égale à l’inverse de la moyenne arithmétique des inverses des valeurs observées.
         Si n est le nombre d’observations c1, c2, …cn, la moyenne harmonique est :
Exemple :
         Un escargot monte un puit de longueur trente mètres en une heure, et en descendant sa vitesse double. Quelle est la vitesse moyenne de cet escargot ?
         En effet une approche intuitive conduit à dire que sa vitesse moyenne est
             30+60
vmoy =        /2        = 45 mètres à l’heure. Ce qui est manifestement faux. En effet une vitesse
est une grandeur qui dépend de deux paramètres, la distance et le temps et dans notre exemple, la distance du puit étant constante, et ce sont les temps qui varient. Soit d cette distance, v1 et v2 les deux vitesses, t1 et t2 les temps de parcours respectifs à la montée et la décente.                      
                                          D                                           d
         En montant v1 =            et en descendant v2 =          , donc,
                                           t1                                           t2

                 d + d            2d                     2
vmoy =                    =                   =                  .
                 t1 + t2         d         d        1       1
                                        +                   +
                                   v1       v2        v1      v2
         Nous remarquons donc que la vitesse moyenne est ici la moyenne harmonique des vitesses.
                            2
Soit vmoy =         /           = 40 mètres/h.
                    1           1
                          +
                  30          60
         L’usage de la moyenne harmonique est peu fréquent, cependant elle est utilisée dans les calculs des indices.

4- Moyenne quadratique :
         La moyenne quadratique d’une série statistique est la racine carrée de la moyenne arithmétique des carrées des valeurs observées. On la note



 Exemple :
         Soit la distribution de 10 groupes industriels selon le nombre de filiales délocalisées à l’extérieur du pays d’origine.

Nombre de groupes
Nombres de filiales
1
5
2
15
3
10
4
10

         Calculons les valeurs des moyennes arithmétique, harmonique, quadratique et géométrique et vérifions leurs positions respectives.

Nombre de groupes xi
Nombre de filiales ni
ni xi
ni /xi
log xi
ni log xi
xi2
ni xi2
1
5
5
5
0
0
1
5
2
15
30
7,5
0,30103
4,51545
4
60
3
10
30
3,33
0,47712
4,7712
9
90
4
10
40
2,5
0,60206
6,0206
16
160
Total
40
105
18,33

15,30725

315

         La moyenne arithmétique = 2,625
La moyenne harmonique= 2,181
Remarque :
         Si une série statistique pour laquelle les quatre moyennes définies ci-dessus existent, on a alors H <  G  <  c  < Q. Cette remarque est très utile dans les exercices, elle sert de moyen de vérification de l’exactitude des calculs effectués.

5- Le mode :

Définition :
         Si X est une variable discrète, on appelle mode toute valeur xi dont l’effectif (ou la fréquence) est maximum. Si X est une variable continue, on appelle classe modale
                                                  ni                            fi
X [ai, ai+1[ pour laquelle                        (ou                   ) est maximum (sur l’histogramme,
                                              ai+1 - ai                 ai+1 - ai
est maximum).
         Le mode permet de connaître la valeur la plus probable du caractère.
         Cette valeur centrale est simple à percevoir. Mais elle ne tient pas compte de l’ensemble des valeurs du caractère de la série étudiée. Elle ne s’intéresse qu’aux effectifs (ou fréquences) des différentes modalités.

Séries à caractère qualitatif ou à caractère quantitatif discret (discontinu)

         Pour de telles séries, la détermination du mode est immédiate.

Exemple :
         Les notes obtenues par 100 étudiants dans un examen sont indiquées dans le tableau ci-dessous :
Notes
Effectifs
Fréquences
7
8
9
10
11
12
13
14
15
4
7
14
18
26
13
10
6
2
0,04
0,07
0,14
0,18
0,26
0,13
0,10
0,06
0,02
Total
100
1,00



                 


Série à caractère continu
         La détermination du mode est plus délicate pour les séries à caractère continu.
         On perçoit immédiatement la classe correspondant à la fréquence la plus grande ou à l’effectif le plus important. Cette classe porte le nom de classe modale ; elle contient le mode.
         Pour déterminer le mode, plusieurs procédés sont possibles.
-Si on ne s’intéresse pas à une valeur plus précise, il est possible de considérer que le mode de la série correspond au milieu de la classe modale.
-Si au contraire, on désire plus de précision, le procédé le plus simple est un procédé graphique. Il consiste à estimer que le mode est déporté à l’intérieur de la classe modale en fonction des effectifs rectifié des classes encadrants la classe modale. Le mode est alors obtenu de la façon indiquée sur la figure ci-dessous.
-de manière encore plus précise, on peut calculer le mode par la formule suivante, qui correspond à la traduction mathématique de la méthode graphique :
                       k1
Mo = A +                  x a
                   k1 + k2
A est la valeur du caractère correspondant à la valeur inférieur de classe modale ; a est l’amplitude de la classe modale ; k1 et k2 sont les différences entre les effectifs (ou les fréquences) rectifiés de la classe modale et des deux classes qui l’encadrent.

Exemple :
         Une étude portant sur la durée de vie d’une espèce biologique aquatique de la même race est consignée dans le tableau ci-dessous :
Durée de vie en heures
Nombre d’espèces
[0,2 000[
[2 000, 4 000[
[4 000, 5 000[
[5 000,6 000[
[6 000, 8 000 [
[8 000,10 000[
8
26
20
22
18
6



               Déterminons la classe modale, et plus précisément le mode ;
         Les classes ne sont pas d’amplitude égales ; la classe modale n’est donc pas nécessairement celle où l’effectif est le plus élevé. En effet, la classe [2 000, 4 000[ dont l’effectif est 26 a une amplitude double de la classe [5 000,6 000[ dont l’effectif est 22 ;
         La classe dont la densité est maximum, est la classe modale. La densité est calculée à l’aide des effectifs et de l’amplitude. On a :

Durée de vie en heures
Nombre d’espèces ni
Amplitude ai
Densité di
[0,2 000[
[2 000, 4 000[
[4 000, 5 000[
[5 000,6 000[
[6 000, 8 000 [
[8 000,10 000[
8
26
20
22
18
6
2 000
2 000
1 000
1 000
2 000
2 000
0,004
0,013
0,020
0,022
0,009
0,003
         ni
di =        , on obtient alors le tableau suivant :
         ai

         La classe modale est donc [5,6[.
         En appliquant la méthode proposée ci-dessus, on aura :
                      k1
Mo = A +                x a,
                   k1 + k2
                                0,002
Mo = 5 000 +                             x 1000 = 5 133,33
                         0,002 + 0,013

Résolution graphique
Enfin le mode peut ne pas être unique. On parle alors de distribution multimodale ou (plurimodale).

6- Médiane :

Définition :
         Si X est une variable discrète prenant n valeurs : v1 £ v2 £ …vn (les valeurs prises par X ne sont pas groupées), on appelle médiane un nombre réel Me tel qu’il y ait autant de valeurs vj inférieurs ou égales à Me que de valeurs vj supérieures ou égales à Me.
Si n = 2k + 1, c’est-à-dire n est impair me = vk+1.
                                                                                         vk + vk+1,
Si n = 2k, c’est-à-dire n est pair par convention Me =                       .
                                                                                              2

Si X est une variable continue, on appelle médiane le nombre réel Me abscisse du point
                     1
d’ordonnée       de la courbe cumulative des fréquences, c’est-à-dire le nombre réel
                     2                              1
Solution de l’équation Fx(t) =         .
                                                     2
Me appartient à la première classe [aiai+1[ (dont la fréquence cumulée pi est supérieure ou égale à 0,5 (on a donc : pi-1 < 0,5 et pi ³ 0,5).


                                                                    Me – ai        0,5 – pi-1
La valeur de Me s’obtient en résolvant :                  =                   , donc
                                                                     ai+1 – ai         pi – pi-1
                0,5 – pi-1
Me = ai+                   (ai+1 - ai).
                 Pi – pi-1
La courbe cumulative des fréquence fournit graphiquement une valeur approchée de Me.

Cas des séries à caractère discret

Exemple 1 :
         Les performances en jet de javelot de 100 joueurs présentées dans le tableau suivant :
Longueur en m
71
74
77
80
83
Effectifs
6
17
41
27
9


Me= 77+77/2=77
Exemple 2 :
         Considérons une classe de 60 élèves qui ont eux les notes suivantes dans un examen de statistique :

Not ci
4    5    5,5    7   8,5   9    10   12   13
Effectif ni
5    6     3      8   10   12   10    4     2
Effectif cumulé
5   11   14    22   32   44   54   58   60

         La médiane est 8,5 car il y a autant de valeur vj inférieures ou égales à Me que de valeurs vj supérieures ou égales à Me.

Cas des séries à caractère continu

         Dans ce cas la valeur de la médiane du caractère appartient à une classe. La médiane est déterminée, soit par le calcul, soit par le graphique.

Exemple :
         Considérons le tableau suivant donnant la superficie de 100 parcelles de terrains agricoles en hectares.


Superficie c(en ha)
20 £ x < 40
40 £ x < 60
60 £ x < 80
80 £ x < 100
100 £ x < 120
Effectif
12
31
32
15
10
Effectif cumulé
12
43
75
90
100

a) résolution par calcul :
         La médiane Me correspond à l’effectif cumulé 50, donc elle appartient à la classe   60 £ x < 80.
         Par la méthode d’interpolation linéaire on a :
Me – 60       80 – 60
                =               ,
 50 – 43       75 – 43
                                                                             80 - 60
         Cela correspond à Me = 60 + (50 – 43) x        /        = 64,375.
                                                                             75 – 43
b) résolution graphique : 


 


Chapitre 3 : Les paramètres de position  Chapitre 3 : Les paramètres de position Reviewed by IstaOfppt on 05:25 Rating: 5

Aucun commentaire:

Fourni par Blogger.