Escolar Documentos
Profissional Documentos
Cultura Documentos
STATISTIQUE DESCRIPTIVE
Cours et exercices
Collection Sciences Techniques et Managements des ditions TOUBKAL
Publications du Centre de Recherche en Mathmatiques (CRM) de lIGA
STATISTIQUE DESCRIPTIVE
Cours et exercices
On dit souvent que lon peut faire dire ce quon veut aux statistiques ! Cest bien connu,
entre le verre moiti plein et le verre moiti vide la diffrence dinterprtation nous
interpelle, mais avant de pouvoir interprter un ensemble de donnes, il est indispensable de
savoir comment reprsenter, dans un tableau ou par un graphique, une srie statistique,
comment en faire les premiers traitements et surtout comment prsenter les rsultats de ces
calculs.
- Chaque chapitre est trait dune faon exhaustive pour englober tous les concepts et
toutes les dmonstrations des formules statistiques.
Il renferme, en plus, un ensemble dexemples dapplication avec solutions et surtout les
mthodes de rsolution.
- A la fin de chaque chapitre, le lecteur trouvera, ensuite un ensemble dexercices
dapplication qui lui permettra de sentraner rsoudre des problmes classiques de
statistique.
Signalons, cet effet, que pour toutes les solutions proposes pour les exemples, nous avons
utilis lordinateur avec des logiciels de graphisme et de gestionnaires de tableaux et nous
encourageons vivement autant les tudiants que les professeurs den faire de mme pour tout
problme de statistique.
Cette utilisation de lordinateur nous amne avertir nos lecteurs que les rsultats des
calculs donns dans les tableaux et ailleurs diffreront de ceux quon pourrait obtenir grce
une calculette pour la simple raison que la puissance de prcision dun ordinateur ne peut
jamais tre gale par une calculette.
Ce livre est ainsi destin aux tudiants qui dsirent acqurir une certaine adresse la
rsolution de problmes de statistique descriptive et aux professeurs qui recherchent un
ensemble dexercices didactiques de statistique descriptive proposer la rflexion de leurs
tudiants.
Les auteurs
INTRODUCTION 9
PARTIE 1- STATISTIQUE DESCRIPTIVE A UNE SEULE VARIABLE 13
CH. 1. TABLEAUX ET GRAPHIQUES 15
1.1. Tableaux statistiques 15
1.2. Reprsentations graphiques 28
1.3. Exercices dapplication 37
CH. 2. CARACTERISTIQUES DE TENDANCE CENTRALE 43
2.1. Les moyennes 43
2.2. Le mode 61
2.3. La mdiane 63
2.4. La mdiale 66
2.5. Les fractiles 69
2.6. Exercices dapplication 73
CH. 3. CARACTERISTIQUES DE DISPERSION 78
3.1. Ecart absolu moyen 78
3.2. Variance 82
3.3. Ecart type 86
3.4. Coefficient de variation 87
3.5. Indice de concentration 93
3.6. Exercices dapplication 104
PARTIE 2 - STATISTIQUE DESCRIPTIVE A DEUX VARIABLES 111
CH. 4. REGRESSION ET CORRELATION 113
4.1. Introduction 113
4.2. Rgression simple 113
4.3. Qualit de lajustement 130
4.4. Calcul des prvisions 137
4.5. Rgression non linaire simple 138
4.6. Rgression multiple 142
4.7. Exercices dapplication 153
CH. 5. LES SERIES CHRONOLOGIQUES 163
5.1. Dfinition 163
5.2. Reprsentation graphique 164
5.3. Les principaux mouvements des sries chronologiques 166
5.4. Les schmas de composition 167
5.5. Les mthodes de lissage 169
5.6. Etude du trend 178
5.7. Etude de la composante saisonnire 183
5.8. Exercices dapplication 195
CH. 6. INDICES STATISTIQUES 205
6.1. Les indices lmentaires 205
6.2. Les indices synthtiques 211
6.3. Les indices synthtiques pondrs 216
6.4. Les principaux indices synthtiques 217
6.5. Lindice des prix la consommation 220
6.6. Indices boursiers 233
6.7. Exercices dapplication 234
BIBLIOGRAPHIE 246
Statistique descriptive Introduction
INTRODUCTION
HISTORIQUE.
Lactivit qui consiste recueillir des donnes permettant de connatre la situation des tats
remonte la plus haute antiquit. On cite, dune part, lempereur chinois Yao, organisant le
recensement des productions agricoles en 2238 avant J.-C., et, dautre part, linstitution des
recensements de la population chez les gyptiens, en 1700 avant J.-C.
Au dbut du XVIe sicle, on commena tenir en Angleterre un registre des dcs et des
naissances. En France, les intendants Sully, Colbert et Vauban commandrent de nombreux
inventaires et enqutes. En 1662, l'Anglais John Graunt constata une certaine constance dans le
rapport du nombre de naissances fminines celui des naissances masculines.
Mais c'est seulement au XIXe sicle qu'on dcouvrit que la thorie des probabilits pouvait
constituer une aide prcieuse la mthode statistique. Ce rapprochement, dj peru par le
mathmaticien Laplace, fut l'uvre d'Adolphe Qutelet (1796-1874), statisticien belge qui fut
l'initiative du premier congrs international de statistiques en 1853. Ds lors, la statistique se
dveloppa dans la plupart des sciences.
Lapparition dune relle mthodologie statistique a t initie par des statisticiens anglais
autour de 1900. Cest--dire une thorie bien formalise du raisonnement qui permet, partir
des donnes observes, de tirer des conclusions sur les lois de probabilit des phnomnes.
Cest la statistique mathmatique, qui sest dveloppe entre 1900 et 1950 et dont les succs
ont impos, au cours de cette priode, une interprtation particulire du concept de probabilit.
9
Statistique descriptive Introduction
partir des annes cinquante, lapparition de calculateurs puissants a donn naissance aux
mthodes danalyse des donnes multidimensionnelles, qui ont connu une grande vogue,
parfaitement justifie par leur efficacit. Ces mthodes permettent de dcrire, de classer et de
simplifier des donnes, les rsultats auxquels elles conduisent peuvent suggrer des lois, des
modles ou des explications des phnomnes.
Aujourd'hui, les statistiques sont considres comme des outils fiables qui peuvent fournir
une reprsentation exacte des valeurs de donnes conomiques, politiques, sociales,
psychologiques, biologiques ou physiques. Elles permettent de mettre en corrlation de telles
donnes et de les analyser. Le travail du statisticien ne se limite plus recueillir des donnes et
les prsenter sous forme de tableaux, mais il consiste principalement interprter
l'information.
DEFINITION.
Statistique, une discipline qui a pour objet la collecte, le traitement et l'analyse de donnes
numriques relatives un ensemble d'individus ou d'lments. Elle constitue un outil prcieux
pour l'exprimentation, la gestion des entreprises ou encore l'aide la dcision.
Avant la collecte des donnes, on commence par dfinir la nature et la quantit des donnes
recueillir. Cette collecte s'effectue par recensement ou par sondage. Les donnes recueillies
peuvent faire l'objet d'une vrification partielle par mesure de scurit.
Les donnes recueillies sont classes et ranges dans des tableaux de faon permettre une
analyse et une interprtation directes. Ensuite, On peut reprsenter graphiquement les donnes
du tableau.
10
Statistique descriptive Introduction
Une fois les donnes recueillies et prsentes sous forme de tableaux, le travail d'analyse
commence par le calcul d'un paramtre statistique qui puisse rsumer lui seul l'ensemble des
donnes. On distingue trois types de paramtres statistiques :
Les statisticiens se sont aperus que de nombreux ensembles de mesures avaient le mme
type de distribution. Ils ont donc t amens concevoir des modles mathmatiques qui soient
le reflet des lois statistiques souvent rencontres. La comparaison des rsultats avec ces lois
statistiques permet de donner une explication du phnomne observ et en vrifier le bien
fond.
Dans le prsent ouvrage, nous nous proposons de montrer comment reprsenter les donnes
recueillies et comment en faire le traitement en exposant successivement les mthodes de calcul
des 3 paramtres statistiques que sont les paramtres de tendance centrale, ceux de dispersion et
ceux de corrlation.
11
Statistique descriptive Introduction
12
Statistique descriptive Partie 1 : statistique descriptive une variable
PARTIE 1
STATISTIQUE DESCRIPTIVE A UNE VARIABLE
La statistique descriptive une variable est lensemble des mthodes qui permet dobtenir et
de faire un 1er traitement des informations relatives un caractre particulier dindividus dune
population donne.
- classer lensemble de ces donnes selon des sries statistiques afin de permettre den
faire :
* des reprsentations graphiques pour en visualiser lallure ;
* des traitements mathmatiques pour en dterminer certaines caractristiques.
Dans cette partie, nous axerons notre propos, dabord sur la dfinition des diffrents
concepts que nous venons dintroduire, ensuite sur les premiers traitements mathmatiques en
vue de la dtermination de certaines caractristiques.
13
Statistique descriptive Partie 1 : statistique descriptive une variable
14
Statistique descriptive 1. Tableaux et graphiques
CHAPITRE 1
TABLEAUX ET GRAPHIQUES
Nous donnons dans ce qui suit la dfinition des principaux concepts de la statistique.
Exemples 1 :
Ensemble des tudiants dune cole ;
Ensemble des habitants dune ville ;
Ensemble des livres dune bibliothque ;
Ensemble de la production dune entreprise pendant un an ;
Etc.
Lchantillon doit tre choisi de faon quil soit reprsentatif, pour ce faire il existe des
mthodes de tri en vue de la constitution dchantillon. Elles font lobjet dtudes spcifiques.
Exemples 2 :
Lensemble des tudiants dune salle de classe dune cole ;
Lensemble dun millier dhabitants choisi parmi tous les habitants dune ville ;
Lensemble dune centaine de livre tri parmi tous les livres dune bibliothque ;
La production dune entreprise pendant quelques jours ;
Etc.
Exemples 4 :
n = 30 sil y a 30 tudiants dans lchantillon ;
n = 2000 sil y a 2000 habitants dans lchantillon ;
n = 125 sil y a 125 livres dans lchantillon ;
n = 15 000 sil y a 15 000 units produites constituant lchantillon ;
etc.
Exemples 5 :
Notes des tudiants dune cole ;
Situations familiales des habitants dune ville ;
Thmes des livres dune bibliothque ;
Poids des units produites par une entreprise ;
Etc.
Modalits : Ce sont les diffrentes possibilits que peut prendre le caractre, par exemple
fminin ou masculin si le caractre est le sexe et 1,50 m ou 1,70 m si le caractre est la taille,
etc.
Caractre qualitatif : Un caractre est dit qualitatif quand il ne peut pas tre mesur.
16
Statistique descriptive 1. Tableaux et graphiques
k k
Avec ni n et fi 1
i1 i1
Exemples 7 : Dans un chantillon de 2000 habitants dune ville, en relve que 900
personnes sont maries, on a ainsi, pour la modalit habitants maris :
ni = 900 et fi = 900/2000 = 45 % ;
- Dans une bibliothque constitue de 5000 livres on relve que 120 livres ont pour thme
les mathmatiques, on a ainsi pour la modalit livres de mathmatiques :
- On considre lensemble des touristes qui visitent le Maroc pendant une priode donne et
on considre comme caractre la nationalit. Si lon relve quil y a 300 Franais parmi un
ensemble de 900 touristes on a pour la modalit nationalit franaise :
Caractre quantitatif : Un caractre est dit quantitatif quand il peut tre mesur. Il peut
alors tre continu ou discret :
- il est discret dans le cas doprations de dnombrement ou de comptage ;
- il est continu dans le cas doprations de mesures.
j i
Fi : f
j 1
j frquence relative cumule croissante.
Exemple 9 : On considre le poids des habitants dune ville comme caractre, on a, pour un
chantillon, la distribution suivante :
Exemple 10 : une enqute auprs de 1000 commerants portant sur le nombre de leurs
employs, a donn les rsultats suivants :
18
Statistique descriptive 1. Tableaux et graphiques
Le nombre de commerants n'employant aucun employ est 50, ce qui reprsente 5 % des
commerants.
Les frquences absolues ou relatives cumules croissantes sont calcules en cumulant les
frquences absolues ou relatives du haut du tableau vers le bas. Elles permettent de rpondre
aux questions du genre : quel est le nombre ou la proportion au plus ?
Par contre, les frquences absolues ou relatives cumules dcroissantes sont calcules en
cumulant les frquences absolues ou relatives du bas du tableau vers le haut. Elles permettent
de rpondre aux questions du genre : quel est le nombre ou la proportion au moins (au
minimum ou plus de) ?
19
Statistique descriptive 1. Tableaux et graphiques
Si le caractre est continu : [Ci ; Ci+1[ est lintervalle ou classe des modalits avec :
Ci et Ci+1 les bornes de la classe ;
ci : centre de la classe ;
ai : amplitude de la classe ;
di : densit de la classe.
ni : effectif de la classe i, nombre dindividus dont la modalit du caractre est
comprise entre Ci et Ci+1.
C i 1 C i
ci = , ai = Ci+1 Ci et di = ni/ai
2
De la mme manire que dans le cas discret, on dfinit :
fi = ni / n : frquence relative de la modalit i.
j i
Fi : f
j 1
j frquence relative cumule croissante.
Parmi les 169 personnes, 35 mesurent entre 1,50 m et moins de 1,60 m, ce qui reprsente
20,71 % de lensemble de lchantillon.
76,92 % de lchantillon mesurent moins de 1,80 m.
Le fait de remplacer la classe Ci ; Ci+1 par ci permet de faire des calculs car on ne sait pas
faire des calculs sur des intervalles.
Srie statistique : Une srie statistique est lensemble constitu des xi et ni. On parle aussi
de distribution statistique une seule variable, comme par exemple :
Tailles et effectifs ;
Situations matrimoniales et effectifs ;
Ages et effectifs.
Etc.
20
Statistique descriptive 1. Tableaux et graphiques
Il suffit, dans ce cas, de remplacer chaque classe [Ci ; Ci+1[ par son lment central ci = ( Ci
+ Ci+1 ) / 2 auquel il faut affecter leffectif ni.
Exemple 12 : On considre la srie statistique relative aux poids dun chantillon de 120
habitants dune ville, elle se prsente comme lindique le tableau suivant :
On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalente
suivante :
Poids (kg) Effectifs Frquence relative
ci ni fi
57,5 5 4.17%
62,5 14 11.67%
67,5 20 16.67%
72,5 40 33.33%
77,5 18 15.00%
82,5 15 12.50%
87,5 8 6.67%
Total 120 100%
21
Statistique descriptive 1. Tableaux et graphiques
Exemple 13 : On considre la srie statistique relative aux notes obtenues dans une matire,
par les tudiants dune classe dcole :
Notes Effectifs
Ci ; Ci+1 ni
6 ; 8 2
8 ; 10 6
10 ; 12 12
12 ; 14 7
14 ; 16 3
Total 30
On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalente
suivante :
Remarquons que cette mthode repose sur lhypothse simple suivante qui consiste
admettre que les effectifs se rpartissent de faon rgulire dans une classe.
22
Statistique descriptive 1. Tableaux et graphiques
Notes Effectifs
Ci ; Ci+1 ni
[0 ; 6[ 6
6 ; 8 4
8 ; 14 12
14 ; 18 4
Dans cette srie, les amplitudes des diffrentes classes sont : 6 ; 2 ; 6 ; 4. Leur PGCD est 2.
On remplace chaque classe par plusieurs autres classes et on obtient alors la srie quivalente
suivante :
Notes Effectifs
Ci ; Ci+1 ni
[0 ; 2[ 2
[2 ; 4[ 2
[4 ; 6[ 2
6 ; 8 4
8 ; 10 4
10 ; 12 4
12 ; 14 4
[14 ; 16 2
16 ; 18[ 2
23
Statistique descriptive 1. Tableaux et graphiques
On remplace, aprs cette opration, chaque classe par le centre de cette classe, on obtient
alors la srie quivalente suivante :
Notes Effectifs
ci
Ci ; Ci+1 ni
[0 ; 2[ 1 2
[2 ; 4[ 3 2
[4 ; 6[ 5 2
6 ; 8 7 4
8 ; 10 9 4
10 ; 12 11 4
12 ; 14 13 4
[14 ; 16 15 2
16 ; 18[ 17 2
Remarque : Ainsi on peut considrer que toute srie statistique est donne, selon les
besoins du traitement numrique :
- Soit sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni.
- Soit sous forme dune suite de valeurs xi et deffectifs ni
k = 1 + 3,322 log10 n
Ce calcul donne un nombre rel, on prend alors pour k le nombre entier trs proche du
rsultat de calcul de la formule prcdente.
xmax et xmin tant la valeur maximale et la valeur minimale prises par le caractre, les
diffrentes classes seront alors :
La borne infrieure de la premire classe C1 est gale xmin ou une valeur lgrement
infrieure xmin.
24
Statistique descriptive 1. Tableaux et graphiques
C1 ; C1+e
C1+e ; C1+2e
C1+2e ; C1+3e
C1+(k-1)e ; C1+ke
Exemple 15 : En prenant la taille comme caractre des habitants dune ville on a les
rsultats relatifs un chantillon de 169 habitants :
N = 169
E = 1,85 1,45 = 0.40
25
Statistique descriptive 1. Tableaux et graphiques
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
26
Statistique descriptive 1. Tableaux et graphiques
ci ni Ni cr Ni d fi Fi cr Fi d
Poids
(1) (2) (3) (4) (5) (6) (7)
[52 ; 58[ 55 2 2 80 2,5% 2,5% 100%
[58 ; 64[ 61 12 14 78 15% 17,5% 97,5%
[64 ; 70[ 67 10 24 66 12,5% 30% 82,5%
[70 ; 76[ 73 19 43 56 23,75% 53,75 70%
[76 ; 82[ 79 16 59 37 20% 73,75 46,25%
[82 ; 88[ 85 9 68 21 11,25% 85% 26,25%
[88 ; 94[ 91 7 75 12 8,75% 93,75% 15%
[94 ; 100[ 97 5 80 5 6,25% 100% 6,25%
Total --- 80 --- --- 100% --- ---
Lgende du tableau :
- (1) : point central de la classe ;
- (2) : effectif de la classe, frquence absolue ;
- (3) : frquence absolue cumule croissante ;
- (4) : frquence absolue cumule dcroissante ;
- (5) : pourcentage de la classe, frquence relative ;
- (6) : frquence relative cumule croissante ;
- (7) : frquence relative cumule dcroissante.
Le nombre de personnes pesant entre 64 et moins de 70 kilogrammes est 10, ils reprsentent
12,5 % des personnes peses.
Le nombre de personnes pesant au moins 70 kilogrammes est 56, ils reprsentent 70 % des
personnes peses.
Le nombre de personnes pesant moins de 82 kilogrammes est 59, ils reprsentent 73,75 %
des personnes peses.
27
Statistique descriptive 1. Tableaux et graphiques
Pour rcapituler toute cette premire partie, donnons, dans un tableau synthtique, grce
des exemples, lensemble des concepts que nous avons introduits jusque l :
Le tri ou le choix pour constituer un chantillon se fait selon des processus bien prcis.
Il est trs courant, dans un premier traitement, pour bien visualiser lallure dune srie
statistique, de la reprsenter par un graphe. Cette reprsentation peut tre faite selon plusieurs
manires, en effet on peut citer les diffrentes reprsentations suivantes :
- le diagramme bandes ;
- le diagramme secteurs ;
- le diagramme btons ;
- lhistogramme des frquences simples ;
- le polygramme des frquences simples ;
- la courbe des frquences cumules.
Nous donnons dans ce qui suit un ensemble de possibilits de reprsentations dune srie
statistique en indiquant, chaque fois, le choix du graphe adquat selon le type de caractre ou
de la srie ainsi que les raisons de ce choix.
1.2.1. Caractre qualitatif : Rappelons quun caractre qualitatif est un caractre quon ne
peut pas mesurer. Dans ce cas, deux types de reprsentations sont conseills :
Diagramme bandes :
28
Statistique descriptive 1. Tableaux et graphiques
La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme
bandes.
45
40
35
30
Effectifs
25
20
15
10
5
Remarques : La largeur des bandes est quelconque mais identique pour toutes les bandes.
Seules les hauteurs des bandes indiquent les effectifs ou les frquences relatives.
Diagramme secteurs :
29
Statistique descriptive 1. Tableaux et graphiques
Effectifs concerns : ni
Situations familiales xi
Frquences relatives : fi
Clibataires 1 30 = 23%
Maris 2 35 = 27%
Divorcs 3 40 = 31%
Veufs 4 25 = 19%
Total --- 130 = 100%
La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme
secteurs.
veufs clibataires
19% 23%
divorcs
maris
31%
27%
Remarque 1 : le mme caractre, situation familiale a pu tre reprsent par deux types de
diagrammes.
1.2.2. Caractre quantitatif discret : Rappelons quun caractre quantitatif est discret
dans le cas doprations de comptage, dans ce cas, plusieurs types de reprsentation sont
possibles.
Diagramme btons :
Exemple 19 : On considre la srie statistique des notes obtenues dans une matire, par un
chantillon de 200 tudiants dun amphithtre de 500.
30
Statistique descriptive 1. Tableaux et graphiques
Notes : xi Effectifs : ni
10 55
12 40
14 60
16 45
Total 200
Pour reprsenter une telle srie, on a habituellement recours aux diagrammes btons.
70
60
50
Effectifs
40
30
20
10
0
10 12 14 16
Modalits de la variable
Sur laxe des x, on reporte les valeurs de xi attribues aux caractres afin de pouvoir traiter
la srie statistique.
Polygone de frquences :
Les polygones de frquences sont construits en joignant par une ligne les sommets des
btons du diagramme en btons.
31
Statistique descriptive 1. Tableaux et graphiques
70
60
50
Effectifs
40
30
20
10
0
10 12 14 16
Modalits de la variable
Exemple 20 : On reprend lexemple 18 et lon considre les notes obtenues dans une
matire, par un chantillon de 200 lves, calculons les effectifs cumuls.
250
200
Effectifs cumuls
150
100
50
0
10 12 14 16
Modalits de la variable
32
Statistique descriptive 1. Tableaux et graphiques
1.2.3. Caractre quantitatif continu : Rappelons quun caractre quantitatif est continu
dans le cas doprations de mesures, dans ce cas, plusieurs types de reprsentation sont
possibles.
Histogramme :
Quand les classes sont de mme amplitude, la hauteur des rectangles est proportionnelle aux
frquences des classes, elle est gale numriquement la frquence correspondante. Si les
classes n'ont pas la mme amplitude, il est ncessaire d'ajuster la hauteur des rectangles de telle
sorte que la surface du rectangle soit proportionnelle l'effectif correspondant, la hauteur des
rectangles est gale dans ce cas la densit de la classe.
33
Statistique descriptive 1. Tableaux et graphiques
250
200
150
ni ou fi
100
50
25 35 45 55
Xi
Remarque : On peut regrouper les valeurs discrtes par classes de mme amplitude, il suffit
alors que la hauteur de chaque rectangle soit proportionnelle ni ou fi .
Sur laxe des x, on reporte les valeurs Ci, bornes des classes
du caractre x.
On peut regrouper les valeurs discrtes par classes damplitudes diffrentes, il suffit alors
que la hauteur de chaque rectangle soit proportionnelle di, densit de la classe considre.
Sur laxe des x, on reporte les valeurs Ci, bornes des classes du caractre x.
34
Statistique descriptive 1. Tableaux et graphiques
2,5
1,5
densit di
0,5
0
10 30 50 70 90 110 130 150 170 190 210 230 250
Exemple 23 : La rpartition des soldes dun chantillon de 150 comptes bancaires est
donne par le tableau suivant :
35
Statistique descriptive 1. Tableaux et graphiques
50
45
40
35
30
ni ou fi 25
20
15
10
5
0
10 20 30 40 50
Xi
36
Statistique descriptive 1. Tableaux et graphiques
160
140
120
100
Fi 80
60
40
20
0
10 20 30 40 50
Xi
Les individus sont classs en classes, la frquence cumule associe la classe numro i
correspond la proportion dindividus dont la valeur du caractre est strictement infrieure la
limite suprieure de la classe numro i.
1.3.1. Exercice.
37
Statistique descriptive 1. Tableaux et graphiques
1.3.2. Exercice.
Une tude de march a mesur le degr de satisfaction dun chantillon de 500 clients dune
banque. Les rsultas sont prsents dans le tableau suivant :
Degr de satisfaction Effectifs
Pas du tout satisfait 223
Insatisfait 187
Indiffrent 32
Satisfait 55
Trs satisfait 3
Total 500
a) Quelle est la population tudie ?
38
Statistique descriptive 1. Tableaux et graphiques
1.3.3. Exercice.
1.3.4. Exercice.
57 60 52 49 56 46 51 63 49 57
86 93 77 67 81 70 71 91 67 82
47 87 92 55 48 90 49 50 58 62
67 89 69 72 75 48 85 90 83 66
1.3.5. Exercice.
39
Statistique descriptive 1. Tableaux et graphiques
Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes actives
1.3.6. Exercice.
Le tableau suivant donne le niveau de scolarit en nombre dannes passes lcole dun
chantillon de 200 personnes.
1.3.7. Exercice.
40
Statistique descriptive 1. Tableaux et graphiques
1.3.8. Exercice.
Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. La
direction de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombre
d'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableau
ci-aprs :
1.3.9. Exercice.
Le tableau suivant donne la distribution de frquences du nombre d'enfants dans 300 familles.
Nombre d'enfants Nombre de familles
0 13
1 22
2 46
3 49
4 58
5 42
6 39
plus de 6 31
41
Statistique descriptive 1. Tableaux et graphiques
Total 300
1.3.10. Exercice.
Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % de
matires grasses. Un institut de consommation dont le rle est de vrifier que la qualit des
produits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de
100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :
42
Statistique descriptive 2. Caractristiques de tendance centrale
CHAPITRE 2
CARACTERISTIQUES DE TENDANCE CENTRALE
Pour les caractristiques centrales, nous ne nous intressons quaux sries statistiques
relatives des caractres quantitatifs discrets ou continus, cest--dire des sries statistiques
donnes sous les formes : (xi) , (xi ; ni) ; (xi ; fi) ; (ci ; ni) ou (ci ; fi).
- la moyenne arithmtique ;
- la moyenne gomtrique ;
- la moyenne harmonique ;
- la moyenne quadratique.
43
Statistique descriptive 2. Caractristiques de tendance centrale
Dans le cas d'une suite de n observations : x1, x2, , xi, , xn la moyenne est gale, par
dfinition :
n
x x x ... x n x i
x 1 2 3 i 1
n n
n
Lintroduction du terme x
i 1
i doit tre explicite, en effet on convient habituellement
dcrire, en mathmatique :
x
i 1
i = x1 + x2 + x3 + . . . + xi + . . . + xn
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la moyenne arithmtique
simple dune telle srie se dduit de la formule prcdente :
n x i i k
x i 1
k
avec n= n i
nii 1
i 1
De mme dans le cas dune srie statistique donne par un ensemble (x i , fi) la moyenne
arithmtique simple se dduit de la formule prcdente :
k
x fi xi
i 1
k k
ni
avec n = n i 1
i ; fi
n
et f
i 1
i =1
Dans le cas d'une variable statistique continue groupe en classes, la moyenne arithmtique
simple est donne par les formules suivantes :
44
Statistique descriptive 2. Caractristiques de tendance centrale
n c i i
k
x i 1
k
f c i i
n
i 1
i
i 1
C i C i 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune classe
dune cole, dans une matire ; on a la srie statistique suivante donne sous la forme simple
(xi) et pour laquelle on demande de calculer la moyenne arithmtique simple.
12 11 13 12 13
15 13 12 13 11
13 15 11 11 12
12 12 10 12 15
La moyenne arithmtique simple de cette srie est facile calculer, elle est gale :
20
x
i 1
i
248
x 12,4
n 20
Exemple 2 : On considre la mme srie statistique quon reprsente maintenant sous la
forme (xi ; ni) pour laquelle on demande de calculer la moyenne arithmtique simple.
xi ni
10 1
11 4
12 7
13 5
15 3
45
Statistique descriptive 2. Caractristiques de tendance centrale
Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableau
suivant :
xi ni ni xi
10 1 10
11 4 44
12 7 84
13 5 65
15 3 45
Total 20 248
Moyenne --- 12,4
Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)
pour laquelle on demande de calculer la moyenne arithmtique simple.
xi ni fi
10 1 5%
11 4 20%
12 7 35%
13 5 25%
15 3 15%
Total 20 100%
Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableau
suivant :
xi ni fi fi xi
10 1 0,05 0,5
11 4 0,20 2,2
12 7 0,35 4,2
13 5 0,25 3,25
15 3 0,15 2,25
Total 20 100% 12,4
Moyenne --- --- 12,4
On voit, sur ces 3 exemples, que pour calculer la moyenne arithmtique simple, on utilise
lune des 3 formules selon la forme dans laquelle est donne la srie statistique.
46
Statistique descriptive 2. Caractristiques de tendance centrale
34 36 45 62 37 43 42 102 31 42
51 30 61 63 47 105 52 43 81 95
92 77 60 36 48 49 65 71 78 81
43 52 63 71 43 42 51 55 61 41
93 82 83 47 54 61 102 33 48 55
x i
2939
x i 1
58,78 DH / h
50 50
Chaque salari de la socit touche, en moyenne, 58,78 DH par heure.
Exemple 5 : Une enqute, chez 1000 commerants, porte sur le nombre dagents quils
emploient. Les rsultats obtenus sont reprsents dans le tableau suivant :
n x i i 8
3640
x i 1
8
f x i i 3,64 employs par commerant
n i 1 1000
i
i 1
Chaque commerant emploie, en moyenne, trois quatre employs.
47
Statistique descriptive 2. Caractristiques de tendance centrale
n c i i
6
x i 1
6
f c 6020
i i
100
60,20 m par logement
n
i 1
i
i 1
La moyenne arithmtique simple suppose que toutes les observations ont la mme
importance, ce qui n'est pas toujours le cas. La moyenne arithmtique pondre
intervient dans le cas o les observations n'ont pas la mme importance. Il s'agit
d'associer chaque observation un coefficient de pondration indiquant son poids
parmi les autres observations.
k
x i i
x i 1
k
i 1
i
48
Statistique descriptive 2. Caractristiques de tendance centrale
x i i
1 14 2 12 4 13
x i 1
12,86
3
1 2 4
i 1
i
y i (ax i b) a x i n b
y i 1
i 1
i 1
n n n
n
x i
y a i 1
b a x b
n
La moyenne d'une transformation linaire est donc une transformation linaire de la
moyenne.
Exemple 8 : Le tableau suivant prsente les prix en DH de 100 ordinateurs portables
achets dans diffrents points de vente :
49
Statistique descriptive 2. Caractristiques de tendance centrale
Pour calculer la moyenne des prix des ordinateurs, on peut utiliser la proprit de la
transformation linaire dans le but de simplifier les calculs.
b = 13500 et a = 1000
p 13500
Y=
1000
Les valeurs de y sont trs simples, on peut calculer facilement la moyenne de y.
Nombre
Point central
Prix dordinateurs yi ni yi
(ci)
(ni)
10000 11000 9 10500 -3 -27
11000 12000 10 11500 -2 -20
12000 13000 10 12500 -1 -10
13000 14000 14 13500 0 0
14000 15000 16 14500 1 16
15000 16000 14 15500 2 28
16000 17000 12 16500 3 36
17000 18000 15 17500 4 60
Total 100 83
8
n y i i
y i 1
8
83 0,83
100
n
i 1
i
50
Statistique descriptive 2. Caractristiques de tendance centrale
p 1000 y 13500 1000 0,83 13500 14330 DH
n n
(x i x) x i n x n x n x 0
i 1 i 1
* Proprit 3 : La somme des carres des carts par rapport la moyenne est
minimale.
n n
(x i a) 2 [(x i x) (x a)]2
i 1 i 1
n
[(x i x) 2 2(x i x)(x a) (x a) 2 ]
i 1
n n n
( x i x ) 2 2( x i x )( x a ) ( x a ) 2
i 1 i 1 i 1
n n n n
(x
i 1
i a ) 2 ( x i x ) 2 2( x a ) ( x i x ) ( x a ) 2
i 1 i 1 i 1
n n
( x a) ( x x)
i 1
i
2
i 1
i
2
n ( x a) 2
( x a ) 2 0 c' est dire lorsque a x
La moyenne gomtrique simple est calcule pour des observations positives. Elle est gale
la racine nme du produit de lensemble des n observations. Elle est utilise principalement
lorsqu'on raisonne en taux de croissance.
51
Statistique descriptive 2. Caractristiques de tendance centrale
La moyenne gomtrique est gale, par dfinition, dans le cas dune suite de n observations
x1, x2, , xi, , xn :
1 1
n
x g n x1 x x ( x1 x x ) n [ x ] n
2 n 2 n i
i 1
Exemple 9 : On considre une action qui a accus, en bourse, durant le 1er semestre de
lanne 2005, les taux daugmentation mensuels suivants : +2,1% ; 1,3% ; 0,5% ; 0,9% ; 1,4% ;
3,8%. Calculer le taux daugmentation mensuel moyen de laction durant le 1 er semestre 2005.
Remarque : Rappelons que pour une variable qui a accus un taux daugmentation de 2%
par exemple, on multiplie cette variable par 1,02 pour trouver la nouvelle valeur de la
variable.
Donc nous allons, tout le temps, utiliser cette remarque lorsquil sagit de taux.
Exemple 10 : La population marocaine est passe, entre 1994 et 2004 de 26 019 000
29 800 000.
52
Statistique descriptive 2. Caractristiques de tendance centrale
Le taux d'accroissement annuel moyen est t tel que :
26019 (1 t )10 29800
29800
(1 t )10 1,1453
26019
t 10
1,1453 1 0 , 0137 1, 37 %
Entre 1994 et 2004, la population marocaine a augment en moyenne, de 1,37 % par an.
De mme que pour la moyenne arithmtique simple qui suppose que toutes les
observations aient la mme importance, ce qui n'est pas toujours le cas, la moyenne
gomtrique pondre intervient dans le cas o les observations n'ont pas la mme
importance. Il s'agit d'associer chaque observation un coefficient de pondration
indiquant son poids parmi les autres observations.
x g x1 1x 22 x n n
1
x g (x11x 2 2 x n n ) n
1 k
x g [ xii ] xifi
k
i1 i1
Cest le cas de sries statistiques discrtes donnes sous la forme (xi ; ni) ou (xi ; fi), lorsque,
dans les sries, la variable xi est rpte ni fois (ou fi en %) et quil y a k observations distinctes.
53
Statistique descriptive 2. Caractristiques de tendance centrale
1
x g n c1n1 c n2 2 ... c nk k (c1n1 c n2 2 ... c nk k ) n
1
k n k
[ c i ] n c fi
i i
i 1 i 1
C i C i 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 11 : Etude du taux de variation dune action en bourse.
Quel est le taux global de variation de la valeur de laction entre janvier et dcembre 2005 ?
Quel est le taux mensuel moyen de variation de la valeur de laction entre janvier et
dcembre 2005 ?
t 12 1,2294 11,73%
2.1.2.3. Proprits de la moyenne gomtrique.
54
Statistique descriptive 2. Caractristiques de tendance centrale
Dans le cas d'une suite de n observations x1, x2, , xi, , xn, toutes distinctes et de poids
identiques, la moyenne harmonique simple est gale :
n
xh n 1
i 1 x i
Comme il sagit de vitesses moyennes, toutes relatives la mme distance de 20 km, elles
doivent avoir le mme poids. Montrons donc que la vitesse moyenne sur les 80 km est la
moyenne harmonique des vitesses.
En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formule
simple : t = d / v.
t t1 t 2 t 3 t 4
4
d d1 d 2 d 3 d 4 d
i
v V1 V2 V3 V4 i 1 Vi
v 4
n
1
1
V
i 1
C'est--dire dune faon plus gnrale : i
v n
1 1 1 1 1 1
= ( ) 0,01123
v 4 90 75 85 115
La moyenne harmonique pondre intervient dans le cas o les observations n'ont pas
la mme importance. Il s'agit d'associer chaque observation un coefficient de
pondration indiquant son poids parmi les autres observations.
* Cas d'une srie statistique discrte : dans laquelle la variable statistique xi est rpte ni
fois (ou fi en %), lorsque la srie est de la forme (xi ; ni) ou (xi ; fi).
k
n
i 1
i
1
xh = k
= k
ni
i 1 x i
fi
x
i 1 i
* Cas d'une srie statistique continue :
56
Statistique descriptive 2. Caractristiques de tendance centrale
k
ni 1
xh i 1
k n
k f
i i
i 1 c i i 1 c i
C i C i 1
ci est le point central de la classe i, il est tel que : c i
2
Exemple 13 : Calcul de la vitesse moyenne.
Comme il sagit de vitesses moyennes relatives des distances diffrentes, elles doivent tre
affectes de poids diffrents. Montrons donc que la vitesse moyenne sur les 100 km est la
moyenne harmonique pondre des vitesses.
En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formule
simple : t = d / v.
t t1 t 2 t 3 t 4
4
d d1 d 2 d 3 d 4 d
i
v V1 V2 V3 V4 i 1 Vi
57
Statistique descriptive 2. Caractristiques de tendance centrale
4
1 1 10
v
i 1
i
Vi
avec par exemple 1
100
0,10
n
1 1
C'est--dire dune faon plus gnrale :
v
i 1
i
Vi
Aprs calcul, on trouve v = 109,8 km/h.
Comme le cot est un rapport, montrons que le cot moyen est la moyenne
harmonique pondre des diffrents cots. En effet, les cots moyens auxquels les
pices de rechange ont t achetes sont relatifs des lots de diffrentes tailles, ce qui
fait que ces cots doivent tre affects de diffrents poids.
Convenons dappeler, dans ce qui suit, pour le lot i, cui le cot unitaire, cti le cot total
et ni le nombre de pices de rechange achetes.
Nous avons lgalit suivante vidente relative aux nombres de pices de rechange :
4
n n1 n 2 n 3 n 4 n i
i 1
4
ct i ct ct
Or comme ni on a : n i
cu i cu i 1 cu i
58
Statistique descriptive 2. Caractristiques de tendance centrale
4 4
1 ct 1 1
i i
cu i 1 ct cu i i 1 cu i
ct 2 25 13,12
2
4
10 12,35 25 13,12 20 13,46 45 14,07
ct
i 1
i
0,2422
Le cot moyen dapprovisionnement de la pice de rechange est, aprs calculs, gal :
13,51 DH/unit.
2.1.4. Moyenne quadratique.
n x
2
i i k
xq i 1
f x
2
k i i
n i 1
i
i 1
k k
avec n= ni et
i 1
f
i 1
i 1
59
Statistique descriptive 2. Caractristiques de tendance centrale
k k
avec n= n
i 1
i et f
i 1
i 1
Ci Ci 1
ci est le point central de la classe i, il est tel que : ci
2
Exemple 15 : Dans une entreprise produisant des pices pour lassemblage dune machine
on veut contrler si la longueur moyenne des pices est conforme la norme de 12 cm. La
production est juge comme conforme si lcart moyen par rapport la norme ne dpasse pas 1
cm. cette fin on a mesur la longueur dun chantillon de 16 pices dont les rsultats sont :
11 10 12,5 10,8 13,5 11,5 13 12,5
13 13,5 11,5 13,2 10,5 12,5 11 11,5
On voit bien que certains carts sont positifs et dautres sont ngatifs ; le calcul de la
moyenne arithmtique nest pas appropri car les carts ngatifs vont compenser les carts
positifs. La moyenne quil faut calculer est la moyenne quadratique.
Lcart moyen par rapport la norme est de 1,09 cm, il dpasse lcart moyen tolr qui est
de 1 cm, on ne peut donc admettre que le produit de lentreprise est conforme la norme.
60
Statistique descriptive 2. Caractristiques de tendance centrale
xh x g x xq
Exemple 16 : On peut aisment vrifier de telles ingalits dans lexemple simple
suivant.
On considre la srie statistique simple constitue des cinq observations suivantes : 2 ;
5 ; 6 ; 8 et 10.
On trouve, aprs un calcul facile que :
1 1 (1 1 1 1 1 ) 0,2729 x h 3,664
x h 4 2 5 6 8 10
x g 5 256810 5,448
256810
x 6,2
5
256810
xq 6,767
5
Et lon a bien :
* Cas d'une suite de n observations : Le mode d'une srie statistique est l'observation que
l'on rencontre le plus frquemment. Le mode peut ne pas exister, et s'il existe, il peut ne pas tre
unique.
a) 3; 5 ; 8 ; 8 ; 8 ; 10 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 20 ; 24 ; 24
b) 4 ; 8 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 22 ; 22 ; 22 ; 22 ; 26
c) 5, 11, 14, 17, 18, 21, 23, 26, 29, 30, 32, 35, 38
d) 12 ; 23 ; 34 ; 23 ; 35 ; 23 ; 52 ; 23 ; 33 ; 56 ; 23 ; 23 ; 40
* Cas d'une srie statistique discrte : Le mode correspond la valeur qui possde la plus
grande frquence.
Les amplitudes des classes tant ingales, il convient de calculer les densits.
62
Statistique descriptive 2. Caractristiques de tendance centrale
2.3. LA MEDIANE.
La mdiane d'une variable statistique est une valeur pour laquelle, la moiti des
observations lui sont infrieure ou gales et la moiti suprieures ou gales. La
mdiane partage donc le nombre total d'observations en deux parties gales. La
mdiane est un paramtre statistique qui ne dpend que du nombre d'observations.
Pour dterminer la mdiane, il faut raisonner en terme de frquences cumules, la
mdiane est alors la valeur de la variable qui correspond la moiti de l'effectif total.
* Cas d'une srie statistique discrte.
n 1
Si le nombre d'observations est impair, la mdiane est l'observation de rang .
2
Me x n 1
2
Si le nombre d'observations est pair, la mdiane est comprise entre l'observation de rang n
2
n
et l'observation de rang 1 . On prend comme valeur de la mdiane la moyenne arithmtique
2
simple des deux observations.
x n Me x n
1
2 2
xn xn
1
Me 2 2
2
Exemple 20 : Soit la distribution du nombre d'employs observs chez 1000 commerants.
63
Statistique descriptive 2. Caractristiques de tendance centrale
Le nombre d'observations, 1000, est pair, la mdiane est comprise entre l'observation de
rang 500 et l'observation de rang 501. On prend comme valeur de la mdiane la moyenne
arithmtique simple des deux observations.
x 500 Me x 501
x 500 x 501
Me
2
En consultant les frquences absolues cumules croissantes, x500 correspond 3 et x501
correspond 4. La mdiane est donc :
3 4
Me 3,5
2
La moiti des commerants emploient 3 employs ou moins, et la moiti emploient 4
employs ou plus.
* Cas d'une srie statistique continue.
Pour des donnes groupes en classes, la classe mdiane est la classe qui contient la
mdiane. On dtermine la mdiane par interpolation linaire.
Dsignons par :
Frquence cumule
Fi
50 % = n/2
Fi-1
Caractre
Ci Me Ci+1
Ainsi : Ci 1 Ci = Me Ci
Fi Fi 1 n Fi 1
2
Ce qui donne : Me Ci Ci 1 Ci ( n Fi 1)
Fi Fi 1 2
Exemple 21 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :
65
Statistique descriptive 2. Caractristiques de tendance centrale
40 < Me < 60
20 < 50 < 70
60 40 = Me 40
70 20 50 20
Me = 40 + 20 x 30 = 52 m
50
La moiti des logements ont une superficie infrieure ou gale 52 m et la moiti des
logements ont une superficie suprieure ou gale 52 m.
2.4. LA MEDIALE.
La mdiale est une valeur telle que la somme des observations qui lui sont infrieures
est gale la somme des observations qui lui sont suprieures. La mdiale partage
donc la somme des observations en deux parties gales. La mdiale est un paramtre
statistique qui dpend de la somme de toutes les observations.
Dsignons par :
j i
Si = n c
j1
j j : la somme des observations cumule croissante;
66
Statistique descriptive 2. Caractristiques de tendance centrale
Si
50 % = S/2
Si-1
Caractre
Ci Ml Ci+1
Ainsi : Ci 1 Ci = Ml Ci
Si Si 1 S Si 1
2
Ml Ci Ci 1 Ci (S Si 1)
Si Si 1 2
Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :
n c i i
6020
i 1
3010
2 2
67
Statistique descriptive 2. Caractristiques de tendance centrale
En consultant les sommes cumules croissantes, la classe mdiale est la classe 60 100
m. La mdiale est donc :
10060 = Ml60
41402700 30102700
Ml = 60 + 40 x 310 = 68,61 m
1440
La moiti de la superficie totale des 100 logements est rpartie sous forme de
logements dont la superficie est infrieure ou gale 68,61 m et l'autre moiti sous
forme de logements dont la superficie est suprieure ou gale 68,61 m.
Le deuxime quartile Q2 : C'est une valeur pour laquelle deux quarts des observations
(50%) lui sont infrieures ou gales et deux quarts des observations (50%) lui sont
suprieures ou gales. Il est aussi gal la mdiane.
Le troisime quartile Q3 : C'est une valeur pour laquelle trois quarts des observations
(75%) lui sont infrieures ou gales et un quart des observations (25%) lui sont
suprieures ou gales.
68
Statistique descriptive 2. Caractristiques de tendance centrale
Pour le calcul des quartiles, on utilise la mme mthode de calcul que pour la mdiane.
Pour des donnes groupes en classes, on dtermine un quartile par interpolation
linaire.
Dsignons par :
Fi
j n /4
Fi-1
Caractre
Ci Qj Ci+1
Ainsi : Ci 1 Ci = Qj Ci
Fi Fi 1 j n
Fi 1
4
j n
Qj Ci Ci 1 Ci ( Fi 1)
Fi Fi 1 4
Les trois quartiles sont :
69
Statistique descriptive 2. Caractristiques de tendance centrale
Q1 Ci Ci 1 Ci ( n Fi 1)
Fi Fi 1 4
Q2 Ci Ci 1 Ci ( n Fi 1) = Me
Fi Fi 1 2
i 1 Ci
Q3 Ci C ( n Fi 1)
3
Fi Fi 1 4
Exemple 23 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :
3 100
70
q 3 60 40 4 71,11 m
18
Les dciles partagent le nombre total des observations en dix parties gales, chaque
partie contient 10% des observations. On dfinit neuf dciles.
70
Statistique descriptive 2. Caractristiques de tendance centrale
Le premier dcile d1 : C'est une valeur pour laquelle un dixime des observations
(10%) lui sont infrieures ou gales et neuf diximes des observations (90%) lui sont
suprieures ou gales.
Le deuxime dcile d2 : C'est une valeur pour laquelle deux diximes des observations
(20%) lui sont infrieures ou gales et huit diximes des observations (80%) lui sont
suprieures ou gales.
Le kme dcile dk : C'est une valeur pour laquelle k dixime des observations lui sont
infrieures ou gales et (10 - k) dixime des observations lui sont suprieures ou
gales.
Le cinquime dcile correspond aussi la mdiane et au deuxime quartile.
Pour le calcul des dciles, on utilise la mme mthode de calcul que pour la mdiane et
les quartiles. Pour des donnes groupes en classes, on dtermine un dcile par
interpolation linaire.
Dsignons par :
71
Statistique descriptive 2. Caractristiques de tendance centrale
Frquence cumule
Fi
k n /10
Fi-1
Caractre
Ci Qj Ci+1
Ainsi : Ci 1 Ci = d k Ci
Fi Fi 1 k n Fi 1
10
d k Ci Ci 1 Ci ( k n Fi 1)
Fi Fi 1 10
Exemple 24 : La rpartition de la surface, en m, de 100 logements est reprsente dans le
tableau suivant :
72
Statistique descriptive 2. Caractristiques de tendance centrale
9 100
88
d9 100 60 10 115 m 2
8
- 10 % des logements ont une superficie infrieure ou gale 20 m.
- 90 % des logements ont une superficie infrieure ou gale 115 m.
- 80 % des logements ont une superficie comprise entre 20 m et 115 m.
2.6.1. Exercice.
k
Solution : x f i x i = 3,53 pices ; Mode = 3 pices ; Me = 2,95 soit 3 pices
i 1
q1 = 1,76 soit 2 pices ; q2 = Me = 3 pices et q3 = 4,31 soit 4 pices
73
Statistique descriptive 2. Caractristiques de tendance centrale
2.6.2. Exercice.
57 60 52 49 56 46 51 63 49 57
86 93 77 67 81 70 71 91 67 82
47 87 92 55 48 90 49 50 58 62
67 89 69 72 75 48 85 90 83 66
k
Srie des frquences : x f i x i = 68 200 DH ; Me = 66 444 Dh
i 1
Comparaison des rsultats : Les rsultats obtenus partir de la distribution des
frquences sont des rsultats approximatifs.
2.6.3. Exercice.
Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes
actives :
Tranche d'ges Effectif
[15 20[ 14
[20 25[ 70
[25 30[ 100
[30 35[ 65
[35 40[ 69
[40 45[ 56
[45 50[ 63
[50 55[ 61
55 et plus 2
k
Solution : x f i x i = 35,92 ans ; Mo = 27,5 ans ; Me = 35,07 ans
i 1
q1 = 27,05 ans ; q2 = Me = 35,07 ans et q3 = 45,08 ans
d2 = 25,8 ans ; d8 = 47,06 ans => 60 % des femmes actives sont ges entre 25,8 et 47,06 ans.
2.6.4. Exercice.
Le tableau suivant donne le niveau de scolarit, en nombre dannes passes lcole, dun
chantillon de 200 personnes.
75
Statistique descriptive 2. Caractristiques de tendance centrale
k
Solution : x f i x i = 18,28 enqutes ; Mode = 20 enqutes et Me = 15,94 soit 16
i 1
enqutes environ.
2.6.6. Exercice.
Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % de
matires grasses. Un institut de consommation dont le rle est de vrifier que la qualit des
produits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de
100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :
2.6.7. Exercice.
Si le prix d'un article double tous les quatre ans, quel est le taux moyen d'augmentation du prix
par an ?
4
Solution : Moyenne gomtrique : Taux moyen = 2 -1 = 0,189 = 18,9 %
2.6.8. Exercice.
Une enqute, abordant la crise de logement, a t ralise auprs d'un chantillon de 1000
personnes choisies dans quatre rgions diffrentes. Parmi les rsultats de cette enqute on a
relev le nombre moyen de personnes par pice pour chaque rgion.
76
Statistique descriptive 2. Caractristiques de tendance centrale
Quel est le nombre moyen de personnes par pice pour l'ensemble des quatre rgions ?
Solution : Moyenne harmonique = 2,78 personnes par pices soit 278 personnes pour 100
pices.
2.6.9. Exercice.
Le coefficient budgtaire de la consommation des mnages en services de sant est pass de 6,9
% en 1990 8,5 % en 1995, puis 9,8 % en 2000, 10,6 % en 2004 et enfin 10,9 % en 2005.
a) Calculer les taux annuels moyens de croissance pour les priodes suivantes : (1990 1995) ;
(1995 2000) ; (2000 2004) et (2004 2005).
b) Dterminer le taux de croissance annuel moyen de 1990 2005.
c) Donner une estimation du coefficient budgtaire en 2010 si la tendance relative de la priode
2000 - 2005 se maintenait.
Solution : a) t1995/1990 = 4,26 % par an ; t2000/1995 = 2,89 % par an ; t2004/2000 = 1,98 % par an et
t2005/2004 = 2,83 %. b) t2005/1995 = 3,10 % par an. c) Coefficient budgtaire estim en 2010 = 12,1
%.
2.6.10. Exercice.
Le prix la tonne d'une matire premire a volu au cours de la priode allant de 2001 2005,
comme suit :
a) Sachant que chaque anne une socit achte la mme quantit de cette matire premire,
calculer le cot moyen pour les cinq annes.
b) Quel est le cot moyen si la socit dpense, chaque anne, la mme somme : 1 00 000 DH,
pour l'achat de cette matire premire ?
77
Statistique descriptive 3. Caractristiques de dispersion
CHAPITRE 3
CARACTERISTIQUES DE DISPERSION
Les paramtres de dispersion dune srie statistique permettent de chiffrer la variation des
valeurs observes autour d'un paramtre de position. Les principaux paramtres de dispersion
sont : lcart absolu moyen, la variance, l'cart type, le coefficient de variation et le coefficient
de concentration.
Comme pour les caractristiques centrales, nous ne nous intressons ici quaux sries
statistiques relatives des caractres quantitatifs discrets ou continus, cest--dire des sries
statistiques donnes sous les formes : (xi) , (xi ; ni) , (xi ; fi) ou {[Ci ; Ci+1[ ; fi }.
Lcart absolu dune variable xi par rapport la moyenne de la srie est donn par la
formule simple : xi x o x est la moyenne de la srie.
Lcart absolu moyen Em est la moyenne de tous les carts ainsi dfinis, il est donn par la
formule simple suivante :
n
x i x
Em i 1
n
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, lcart absolu moyen se
dduit simplement de la formule prcdente :
k
n x x i i
Em i 1
k
n
i 1
i
78
Statistique descriptive 3. Caractristiques de dispersion
k n k
En effet : n = n
i 1
i et x x n
i 1
i
i 1
i x i x lorsque chaque valeur xi est rpte ni
De mme, dans le cas dune srie statistique donne par un ensemble (xi , fi) lcart absolu
moyen se dduit simplement de la formule prcdente :
k
Em f i xi x
i 1
En effet lorsque chaque valeur xi est rpt ni fois dans la srie, c'est--dire fi % , on peut
crire :
k k
ni
n= ni ;
i 1
fi
n
et f
i 1
i =1
k
ni xi x k
n
f
i 1 k
Em k
= i xi x = i xi x
i 1 n
ni i 1
i 1
Dans le cas dune srie statistique donne sous la forme de classes [Ci ; Ci+1[, sachant que
pour faire des calculs, on doit remplacer cette srie par une srie quivalente en remplaant
chaque classe [Ci ; Ci+1[ par le point central ci , la formule de lcart absolu moyen devient :
k
n i ci x k
ni k
Em i 1
k
= ci x = f i ci x
n i 1 n i 1
i
i 1
C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Remarque : On parle dcart absolu plutt que dcart tout court car lcart moyen est nul.
Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune cole, dans
une matire ; on a la srie statistique suivante donne sous la forme simple (xi) et pour laquelle
on demande de calculer lcart absolu moyen.
79
Statistique descriptive 3. Caractristiques de dispersion
12 11 13 12 13
15 13 12 13 11
13 15 11 11 12
12 12 10 12 15
La moyenne de cette srie est facile calculer, elle est gale 12,4. De l nous pouvons
calculer les carts absolus de chaque variable par rapport la moyenne :
La somme de tous ces carts absolus est 21,6 et la moyenne est 1,08 qui est lcart absolu
moyen.
Exemple 2 : On considre la mme srie statistique quon reprsente sous la forme (xi ; ni)
pour laquelle on demande de calculer lcart absolu moyen.
xi ni
10 1
11 4
12 7
13 5
15 3
La moyenne de la srie tant toujours gale 12,4, le calcul des carts absolus puis de
lcart absolu moyen peut tre facilement fait selon le tableau suivant :
xi ni ni xi xi x ni xi x
10 1 10 2,4 2,4
11 4 44 1,4 5,6
12 7 84 0,4 2,8
13 5 65 0,6 3
15 3 45 2,6 7,8
Total 20 248 --- 21,6
Moyenne --- 12,4 --- 1,08
Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)
pour laquelle on demande de calculer lcart absolu moyen.
80
Statistique descriptive 3. Caractristiques de dispersion
xi ni fi
10 1 5%
11 4 20%
12 7 35%
13 5 25%
15 3 15%
Total 20 100%
La moyenne de la srie tant toujours gale 12,4, le calcul des carts absolus des variables
xi par rapport la moyenne puis de lcart absolu moyen peut tre facilement fait selon le
tableau suivant :
xi ni fi fi xi xi x fi xi x
10 1 0,05 0,5 2,4 0,12
11 4 0,20 2,2 1,4 0,28
12 7 0,35 4,2 0,4 0,14
13 5 0,25 3,25 0,6 0,15
15 3 0,15 2,25 2,6 0,39
Total 20 100% 12,4 --- 1,08
Moyenne --- --- 12,4 --- 1,08
On remarque que sur ces 3 exemples, pour calculer lcart absolu moyen, on utilise lune
des 3 formules selon la forme sous laquelle la srie statistique est donne.
Aprs avoir remplac la srie donne sous la forme ([Ci ; Ci+1[) en une srie quivalente
reprsente sous la forme (ci ; ni), avec ci = (Ci + Ci+1) / 2, les calculs de lcart absolu moyen
peuvent tre rsums dans le tableau synthtique suivant :
81
Statistique descriptive 3. Caractristiques de dispersion
ci ni ni ci xi x ni xi x
1,55 2 3,10 0,20 0,40
1,65 4 6,60 0,10 0,40
1,75 18 31,50 0,00 0,00
1,85 5 9,25 0,10 0,50
1,95 1 1,95 0,20 0,20
Total 30 52,40 --- 1,50
Total / n 1,75 0,050
3.2. LA VARIANCE.
La variance V(x), note aussi S, est la moyenne des carrs des carts par rapport la
moyenne ; elle est donne, par dfinition, par la formule simple suivante :
n
(x i x) 2
S2 i 1
n
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsque
chaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la variance se dduit
simplement de la formule prcdente :
k
n (x i i x) 2
S2 i 1
k
n i 1
i
k n k
En effet : n = ni et
i 1
(xi x) ni (xi x) lorsque chaque valeur xi est rpte
i 1 i 1
De mme dans le cas dune srie statistique donne par un ensemble (xi , fi) la variance se
dduit simplement de la formule prcdente :
k
S 2 f i ( x i x )
i 1
82
Statistique descriptive 3. Caractristiques de dispersion
En effet lorsque chaque valeur xi est rpt ni fois dans la srie, c'est--dire fi % , on peut
crire :
k
ni
n
k
n= i ; fi et fi = 1
i 1 n i 1
n (x i i x) 2 k
ni k
S2 i 1
k
= (x i x) 2 = f (x i i x) 2
n i 1 n i 1
i
i 1
Dans le cas dune srie statistique donne sous la forme de classes [Ci ; Ci+1[, sachant que
pour faire des calculs, on doit remplacer cette srie par une srie quivalente en remplaant
chaque classe [Ci ; Ci+1[ par le point central ci , la formule de la variance devient :
k
n (c i i x) 2 k
ni k
S2 i 1
k
= (c i x ) 2 = f (c i i x) 2
n i 1 n i 1
i
i 1
C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Formule dveloppe de la variance : elle est donne, selon la forme de la srie statistique :
* Cas dune srie statistique de k observations xi distinctes dont chacune est prsentes fi fois
(en %) :
k 2 2
S f i x i x x 2 x
2
i 1
83
Statistique descriptive 3. Caractristiques de dispersion
* Cas dune srie statistique donne sous la forme de k classes [Ci ; Ci+1[ayant chacune un
effectif ni ou une frquence fi :
k 2 2
S f i c i x x 2 x
2
i 1
C i C i 1
Avec ci = centre de la classe : [Ci ; Ci+1[
2
Toutes ces formules peuvent tre crites, comme nous lavons bien montr, sous la forme
simple et condense :
2
S2 x 2 x
Transformation linaire
Pour calculer la variance des prix des ordinateurs, on peut utiliser la proprit de la
transformation linaire dans le but de simplifier les calculs.
84
Statistique descriptive 3. Caractristiques de dispersion
Il faut choisir les constantes a et b qui donnent des valeurs trs simples de y. On choisit la
constante b parmi les valeurs de p, de prfrence une valeur du milieu, pour avoir une valeur
nulle de y au milieu. On choisit la constante a comme tant le plus grand diviseur commun des
valeurs de (p - b) (le plus souvent a est l'amplitude constante des classes) pour avoir des valeurs
entires de y.
b = 13500 et a = 1000
p 13500
Y=
1000
Les valeurs de y deviennent trs simples, on peut alors calculer facilement la moyenne et la
variance de y.
Nombre
Point central
Prix dordinateurs yi niyi ni yi
(ci)
(ni)
[10000 ; 11000[ 9 10500 -3 -27 81
[11000 ; 12000[ 10 11500 -2 -20 40
[12000 ; 13000[ 10 12500 -1 -10 10
[13000 ; 14000[ 14 13500 0 0 0
[14000 ; 15000[ 16 14500 1 16 16
[15000 ; 16000[ 14 15500 2 28 56
[16000 ; 17000[ 12 16500 3 36 108
[17000 ; 18000[ 15 17500 4 60 240
Total 100 83 551
n y i i
y i 1
8
83 0,83
100
n
i 1
i
n y
2
i i
2
Sy y 551 0,83 4,82
2 i 1
8
100
n i 1
i
85
Statistique descriptive 3. Caractristiques de dispersion
p 1000 y 13500 1000 0,83 13500 14330 DH
S p 1000 S y 1000 4,82 4820000
2 2
Lcart type S est la racine carre de la variance, il est donn, par dfinition, par les
formules suivantes :
S i 1
n
* Cas dune srie statistique de k observations xi distinctes dont chacune est rptes ni fois
:
k
n (x i i x) 2
S i 1
k
n
i 1
i
* Cas dune srie statistique de k observations xi distinctes dont chacune est prsentes fi fois
(en %) :
k
S f (x
i 1
i i x)
* Cas dune srie statistique donne sous la forme de k classes [Ci ; Ci+1[ ayant chacune un
effectif ni ou une frquence relative fi :
k
S f i (c i x ) 2
i 1
C i C i 1
avec ci = centre de la classe : [Ci ; Ci+1[
2
86
Statistique descriptive 3. Caractristiques de dispersion
Dune faon gnrale, nous pouvons utiliser, quelque soit la forme sous laquelle est donne
la srie statistique, la formule condense simple :
2
S x2 x
xi ni fi fi xi xi fi xi
10 1 0,05 0,5 100 5
11 4 0,20 2,2 121 24,2
12 7 0,35 4,2 144 50,4
13 5 0,25 3,25 169 42,25
15 3 0,15 2,25 225 33,75
Total 20 100% 12,4 --- 155,6
Moyenne --- --- 12,4 --- 155,6
87
Statistique descriptive 3. Caractristiques de dispersion
Aprs avoir remplac la srie donne sous la forme ([Ci ; Ci+1[) en une srie quivalente
reprsente sous la forme (ci ; ni)
avec ci = (Ci + Ci+1) / 2, les calculs de la variance, de lcart type et du coefficient de variation
peuvent tre rsums dans le tableau synthtique suivant :
ci ni ni ci ni ci2
1,55 2 3,10 4,8050
1,65 4 6,60 10,8900
1,75 18 31,50 55,1250
1,85 5 9,25 17,1125
1,95 1 1,95 3,8025
Total 30 52,40 91,7350
Total / n 1,7467 3,0578
Le coefficient de dispersion est gal 0,08 / 1.75 = 4,57% ce qui dnote dune trs faible
dispersion de la srie autour de sa moyenne.
88
Statistique descriptive 3. Caractristiques de dispersion
Commenons dabord par reprsenter cette srie, donne sous la forme (xi) en une srie
quivalente sous la forme (xi ; ni) aprs avoir compt combien de fois chaque valeur xi est
rpte.
xi ni ni xi ni xi
107 7 749 80143
110 3 330 36300
118 5 590 69620
125 9 1125 140625
127 6 762 96774
Total 30 3556 423462
Total/n 118,53 14115,40
La moyenne de la srie se situe entre 118 et 119 journaux vendus par jour.
Le coefficient de dispersion est gal 8,13 / 118,53 = 6,86% ce qui dnote dune lgre
dispersion de la srie.
Exemple 9 : Les salaires verss, par une entreprise, ses 130 salaris sont rpartis comme
suit :
89
Statistique descriptive 3. Caractristiques de dispersion
Tranches de salaire ci ni ni ci ci ni ci
[1000 ; 2000[ 1500 12 18000 2250000 27000000
[2000 ; 3000[ 2500 21 52500 6250000 131250000
[3000 ; 4000[ 3500 16 56000 12250000 196000000
[4000 ; 5000[ 4500 24 108000 20250000 486000000
[5000 ; 6000[ 5500 19 104500 30250000 574750000
[6000 ; 7000[ 6500 14 91000 42250000 591500000
[7000 ; 8000[ 7500 12 90000 56250000 675000000
[8000 ; 10000[ 9000 7 63000 81000000 567000000
[10000 ; 15000[ 12500 4 50000 156250000 625000000
[15000 ; 20000[ 17500 1 17500 306250000 306250000
Total - 130 650500 - 4179750000
La moyenne est : x 650500 = 5003,85 DH.
130
La variance est : S = 4179750000 5003,85 = 7113446,75
130
Lcart type est : S = 7113446,75 = 2667,10 DH
90
Statistique descriptive 3. Caractristiques de dispersion
2667,10
Le coefficient de variation est : CV = x 100 = 53,3 %
5003,85
Tranches de
ci ni ni ci ci ni ci
salaire
[1000 ; 2000[ 1500 8 12000 2250000 18000000
[2000 ; 3000[ 2500 12 30000 6250000 75000000
[3000 ; 4000[ 3500 10 35000 12250000 122500000
[4000 ; 5000[ 4500 14 63000 20250000 283500000
[5000 ; 6000[ 5500 11 60500 30250000 332750000
[6000 ; 7000[ 6500 8 52000 42250000 338000000
[7000 ; 8000[ 7500 7 52500 56250000 393750000
[8000 ; 10000[ 9000 5 45000 81000000 405000000
[10000 ; 15000[ 12500 3 37500 156250000 468750000
[15000 ; 20000[ 17500 1 17500 306250000 306250000
Total - 79 405000 2743500000
La moyenne est : x 405000 = 5126,58 DH.
79
La variance est : S = 2743500000 5126,58 = 8446002,24
79
Lcart type est : S = 8446002,24 = 2906,20 DH
2906,20
Le coefficient de variation est : CV = x 100 = 56,7 %
5126,58
Calculs pour les salaris femmes.
Tranches de salaire ci ni ni ci ci ni ci
[1000 ; 2000[ 1500 4 6000 2250000 9000000
[2000 ; 3000[ 2500 9 22500 6250000 56250000
[3000 ; 4000[ 3500 6 21000 12250000 73500000
[4000 ; 5000[ 4500 10 45000 20250000 202500000
[5000 ; 6000[ 5500 8 44000 30250000 242000000
[6000 ; 7000[ 6500 6 39000 42250000 253500000
91
Statistique descriptive 3. Caractristiques de dispersion
La moyenne est : x 244500 = 4794,12 DH.
51
La variance est : S = 1436250000 4794,12 = 5178200,69
51
Lcart type est : S = 5178200,69 = 2275,57 DH
2275,57
Le coefficient de variation est : CV = x 100 = 47,47 %
4794,12
Rcapitulatif des rsultats
92
Statistique descriptive 3. Caractristiques de dispersion
0,016
0,014
0,012
densit di
0,01
0,008
0,006
0,004
0,002
0
1500
2500
3500
4500
5500
6500
7500
8500
9500
10500
11500
12500
13500
14500
15500
16500
17500
18500
19500
salaires
hommes femmes
Mdiale - Mdiane
Indice de concentration 100
Etendu
Exemple 10 : On considre lensemble des buts marqus par une quipe durant les 30
matchs du championnat de football, on a la srie statistique suivante donne sous la forme
simple (xi) et pour laquelle on demande de calculer la moyenne, la variance, lcart type, le
coefficient de variation et le coefficient de concentration.
1 2 1 2 0
3 1 3 2 4
0 2 0 1 1
2 0 1 3 2
1 3 2 0 5
5 2 1 2 3
30 30
xi = 55
i 1
x
i 1
i = 155
93
Statistique descriptive 3. Caractristiques de dispersion
La moyenne de cette srie est : x = 55 = 1,83 but par match.
30
La variance de cette srie est : S = 155 - 1,83 = 1,82
30
Lcart type de cette srie est : S = 1,82 = 1,35 but
1,35
Le coefficient de variation est : CV = x 100 = 73,77 %
1,83
Pour dterminer la mdiane de cette srie, on considre le nombre d'observations, 30 qui est
pair, la mdiane est comprise entre l'observation de rang 15 et l'observation de rang 16. On
prend comme valeur de la mdiane la moyenne arithmtique simple des deux observations. La
srie classe par ordre croissant est :
0 1 1 2 3
0 1 2 2 3
0 1 2 2 3
0 1 2 2 4
0 1 2 3 5
1 1 2 3 5
Pour dterminer la mdiale de cette srie on cumule les valeurs de la srie classe jusqu
arriver la moiti de la somme totale, cest dire 22,5. Elle correspond la valeur 2.
La mdiane est gale la mdiale, le coefficient de concentration de cette srie est donc nul.
xi ni
0 5
1 8
2 9
3 5
4 1
5 2
Total 30
94
Statistique descriptive 3. Caractristiques de dispersion
6 6
n x
i 1
i i = 55 n x
i 1
i i = 155
La moyenne de cette srie est : x = 55 = 1,83 but par match.
30
La variance de cette srie est : S = 155 - 1,83 = 1,82
30
Lcart type de cette srie est : S = 1,82 = 1,35 but
xi ni Fi ni xi ni xi cumul
0 5 5 0 0
1 8 13 8 8
2 9 22 18 26
3 5 27 15 41
4 1 28 4 45
5 2 30 10 55
Total 30 --- 55 ---
Pour dterminer la mdiane de cette srie on considre le nombre d'observations, 30 qui est
pair ; la mdiane est comprise entre l'observation de rang 15 et l'observation de rang 16. On
prend comme valeur de la mdiane la moyenne arithmtique simple des deux observations.
La mdiale de cette srie est la moiti de la somme totale, cest dire 22,5 qui correspond
la valeur 2
La mdiane est gale la mdiale, le coefficient de concentration de cette srie est donc nul.
Exemple 12 : Une cooprative laitire fabrique un fromage qui doit contenir, selon les
tiquettes, 45 % de matires grasses. Un institut de consommation dont le rle est de vrifier
que la qualit des produits est bien celle qui est affiche par l'tiquette, fait prlever et analyser
95
Statistique descriptive 3. Caractristiques de dispersion
un chantillon de 120 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant
:
ci ni fi f i ci ci fi ci
42 10 8,33% 3,4986 1764 146,9412
43 11 9,17% 3,9431 1849 169,5533
44 24 20% 8,8 1936 387,2
45 38 31,67% 14,2515 2025 641,3175
46 22 18,33% 8,4318 2116 387,8628
47 4 3,33% 1,551 2209 73,5597
48 11 9,17% 4,4016 2304 211,2768
Total 120 100% 44,8776 2017,7113
Moyenne 44,8776 2017,7113
Taux de matires
ni fi Fi f i ci fi ci cumul
grasses
[41,5 42,5[ 10 8,33% 8,33% 3,4986 3,4986
[42,5 43,5[ 11 9,17% 17,5% 3,9431 7,4417
[43,5 44,5[ 24 20% 37,5% 8,8 16,2417
96
Statistique descriptive 3. Caractristiques de dispersion
En consultant les frquences cumules croissantes, la classe mdiane qui correspond 50%,
est la classe [44,5 45,5[. La mdiane est donc :
44,5 < Me < 45,5
37,5 < 50 < 69,17
45,544,5 Ml44,5
=
30,493216,2417 22,438816,2417
Ml = 44,5 + 1 x 6,1971 = 44,93
14,2515
97
Statistique descriptive 3. Caractristiques de dispersion
Rappelons les rsultats que nous avons dj trouvs lors de ltude de lexemple 8,
savoir :
Pour dterminer la mdiane, sagissant dune srie donne sous la forme brute (xi), il nous
faudra la classer par valeurs croissantes des ventes. On obtient le tableau suivant :
Pour dterminer la mdiane, on doit consulter les frquences cumules croissantes, la valeur
mdiane est exactement 118.
Pour dterminer la mdiale, nous devons rorganiser la srie sous la forme (xi ; ni).
En consultant les sommes cumules croissantes, la moiti de la somme totale (soit 1778) se
trouve entre les valeurs 118 et 125. La mdiale est donc :
125 118
= Ml118
2794 1669 17781669
La mdiale est : Ml = 118 + 109 x 0,006 222 = 118,68
Mdiale - Mdiane
Indice de concentration 100 =3,4%
Etendu
Exemple 14 : On reprend les donnes de lexemple 9 et on demande de calculer le
coefficient de concentration des sries statistiques relatives aux salaires des hommes, des
femmes et de lensemble du personnel. Conclure.
99
Statistique descriptive 3. Caractristiques de dispersion
Mdiale - Mdiane
Indice de concentration 100
Etendu
5868,42 - 4666,67
Indice de concentration 100 = 6,33 %
19000
Mdiale - Mdiane
Indice de concentration 100
Etendu
6038,46 - 4678,57
Indice de concentration 100 = 7,16 %
19000
c) Calculs pour les salaris femmes
101
Statistique descriptive 3. Caractristiques de dispersion
102
Statistique descriptive 3. Caractristiques de dispersion
Mdiale - Mdiane
Indice de concentration 100
Etendu
5642,05 - 4650,00
Indice de concentration 100 = 7,09 %.
14000
Rcapitulatif des rsultats.
Nous reproduisons, sur un mme tableau, les rsultats de lexemple 8 et ceux trouvs dans
cet exemple.
Coefficient de Indice de
Salaris Moyenne Ecart type
variation concentration
Hommes 5126,58 2906,20 56,7 % 7,16 %
Femmes 4794,12 2275,57 47,47 % 7,09 %
Ensemble 5003,85 2667,10 53,3 % 6,33 %
La rpartition des salaires varie selon le sexe, en effet, un salari homme touche,
en moyenne, plus quun salari femme, (respectivement 5126,58 DH et 4794,12 DH).
Les salaires sont plus disperss chez les hommes que chez les femmes, 56,7 % pour
les premiers et 47,47 % pour les seconds, alors que la concentration des salaires est
lgrement moins forte chez les femmes (7,09 % contre 7,16 % pour les hommes). Ce
rsultat peut tre illustr par cette reprsentation graphique :
103
Statistique descriptive 3. Caractristiques de dispersion
0,016
0,014
0,012
densit di
0,01
0,008
0,006
0,004
0,002
0
1500
2500
3500
4500
5500
6500
7500
8500
9500
10500
11500
12500
13500
14500
15500
16500
17500
18500
19500
salaires
hommes femmes
3.6.1. Exercice.
Les relevs statistiques des tailles, en mtre, de 20 personnes sont consigns dans le tableau
suivant :
3.6.2. Exercice.
On a relev, sur 2 mois, les chiffres daffaires des ventes dun magasin, les rsultats sont
donns dans le tableau suivant :
104
Statistique descriptive 3. Caractristiques de dispersion
3.6.3. Exercice.
On a recens lanciennet, en annes par dfaut, de 45 agents dune entreprise, elle se rpartit
comme suit :
2 6 3 5 3 2 6 5 1
3 3 2 5 6 1 4 5 6
1 2 3 5 2 5 6 1 3
5 5 1 2 2 3 3 6 6
3 2 3 3 3 6 5 5 1
3.6.4. Exercice.
La srie statistique donnant les effectifs de 40 classes dune cole est reprsente par le tableau
suivant :
3.6.5. Exercice.
Les rendements lhectare dune exploitation agricole compose de 200 lots, dun hectare
chacun, sont rpartis comme suit :
3.6.6. Exercice.
On considre les notes obtenues par les tudiants dune classe, dans plusieurs matires, ayant
chacune un coefficient de pondration diffrent.
Matires Coefficients Notes Nombre dtudiants
[10 ; 12[ 8
Math 4 [12 ; 14[ 12
[14 ; 16[ 10
[7 ; 9[ 4
[9 ; 11[ 7
Economie 2
[11 ; 13[ 13
[13 ; 15[ 6
[6 ; 8[ 2
[8 ; 10[ 6
[10 ; 12[ 7
Compta 3
[12 ; 14[ 10
[14 ; 16[ 4
[16 ; 18[ 1
a) Calculer les moyennes et les carts types des notes des tudiants dans chaque matire ;
b) Calculer la moyenne gnrale et lcart type de tous les tudiants.
106
Statistique descriptive 3. Caractristiques de dispersion
3.6.7. Exercice.
a) Calculer les moyennes et les carts types des pourcentages des chiffres daffaires de chaque
dpartement ;
b) lentreprise SONFI ralise, en 2006, un chiffre daffaires de 2 524 312,36 DH dans le
dpartement micro, combien a-t-elle ralis, en moyenne, dans les 2 autres dpartements ?
3.6.8. Exercice.
3.6.9. Exercice.
Le relev statistique des poids et des longueurs des barres de fer fabriques par la socit
MARFER a donne, pour une journe de production, les rsultats suivants :
Poids Longueurs Poids Longueurs
ni ni
(Kg) (cm) (Kg) (cm)
[490 ; 500[ 12 [540 ; 550[ 2
5,80 [500 ; 510[ 25 [550 ; 560[ 4
[510 ; 520[ 5 [560 ; 570[ 8
6,20
[500 ; 510[ 4 [570 ; 580[ 12
5,90 [510 ; 520[ 36 [580 ; 590[ 6
[520 ; 530[ 9 [590 ; 600[ 2
[510 ; 520[ 8 [560 ; 570[ 1
6,00 [520 ; 530[ 41 [570 ; 580[ 5
[530 ; 540[ 10 [580 ; 590[ 4
6,30
[540 ; 550[ 3 [590 ; 600[ 20
6,10 [550 ; 560[ 14 [600 ; 610[ 10
[560 ; 570[ 2 [610 ; 620[ 4
a) Calculer la longueur moyenne et lcart type des barres de fer de 6,20 Kg de poids ;
b) Calculer le poids moyen et lcart type des barres de fer de longueurs comprises entre 560 et
570 cm ;
c) Calculer le poids moyen et lcart type dune barre de fer ;
d) Calculer la longueur moyenne et lcart type dune barre de fer ;
e) Quels sont les modes en poids et en longueur des barres de fer fabriques par la socit
MARFER ?
f) Quelle est la longueur mdiane des barres de fer ?
g) Quel est le poids mdiant des barres de fer ?
108
Statistique descriptive 3. Caractristiques de dispersion
0,1
f) Me = 526,7 cm ; g) Me = 5,9 + x 0,13 = 5,95 Kg
0,24
3.6.10. Exercice.
Le relev des entres des 5 salles dun cinma, releves au cours de la semaine passe, a donn
le tableau suivant :
a) Calculer la moyenne et lcart type des entres de lensemble des cinmas pour chaque jour
de la semaine ;
b) Calculer la moyenne et lcart type des entres de chaque cinma pendant la semaine
passe ;
c) Quel est le cinma qui affiche le meilleur taux de remplissage pour la semaine passe ?
d) Quel est le jour qui affiche le meilleur taux de remplissage global pour les 5 cinmas ?
Solution
a)
Jours Moyenne Ecart type
Lundi 236,8 62,5
Mardi 231,4 67,2
Mercredi 231,0 59,0
Jeudi 244,8 75,4
Vendredi 252,0 63,2
Samedi 226,4 68,1
Dimanche 221,2 55,6
b)
Cin N 1 Cin N 2 Cin N 3 Cin N 4 Cin N 5
Moyenne 105,7 212,0 354,9 247,7 253,7
Ecart type 7,6 10,4 17,4 18,9 39,6
c) Cest le cinma N3 qui affiche le meilleur taux de remplissage pour la semaine passe.
d) Cest le Vendredi qui affiche le meilleur taux de remplissage global pour les 5 cinmas.
109
Statistique descriptive Partie 2 : statistique descriptive deux variables
PARTIE 2
STATISTIQUE DESCRIPTIVE A DEUX VARIABLES
La statistique descriptive deux variables est lensemble des mthodes qui permet dobtenir
et de faire un 1er traitement des informations relatives deux caractres particuliers dindividus
dune population donne.
- recueillir lensemble des donnes relatives deux caractres particuliers dindividus dune
population donne ;
- classer lensemble de ces donnes selon des sries statistiques afin de permettre den
faire :
* des reprsentations graphiques pour en visualiser lallure ;
* des traitements mathmatiques pour en dterminer certaines caractristiques ;
* des traitements mathmatiques pour en dterminer les relations possibles existants entre
ces caractres.
Dans cette partie, nous axerons notre propos sur le dernier point relatif la dtermination
des relations de corrlation entre les caractres tudis.
111
Statistique descriptive Partie 2 : statistique descriptive deux variables
112
Statistique descriptive 4. Rgression et corrlation
CHAPITRE 4
REGRESSION ET CORRELATION
4.1. INTRODUCTION.
On constate, trs souvent, dans la pratique, qu'il existe des relations entre deux ou plusieurs
variables. En analyse de rgression, on cherche expliquer une variable mtrique y qui dpend
dune ou de plusieurs variables explicatives mtriques x1, x2, x3, . . . .xp. A cette fin, un modle
mathmatique peut reprsenter convenablement la relation entre y et les xi, ce modle servira
aussi pour faire des prvisions.
Sappuyant sur des donnes observes, lanalyse de rgression consiste ajuster un modle
explicatif y = f(xi).
Sil ny a quune seule variable explicative, on dira que le modle de rgression est simple.
Son but est de confirmer empiriquement une relation de cause effet entre deux variables.
Ensuite, si cette relation est confirme, il y aura lieu den valuer lintensit.
4.2.1.1. Dfinition.
113
Statistique descriptive 4. Rgression et corrlation
n
( x i x ) ( y i y)
COV( x , y) i 1
n
- Cas d'un tableau de contingences :
n p
n ij ( x i x ) ( y j y)
i 1 j1
COV ( x , y)
n
La covariance a pour but dtudier le sens de la relation entre deux variables statistiques :
- Une covariance positive indique une relation croissante, cest--dire que les deux
variables statistiques varient dans le mme sens ; les valeurs leves d'une srie correspondent
aux valeurs leves de l'autre ;
- Une covariance ngative indique une relation dcroissante, c'est--dire que les deux
variables statistiques varient en sens inverse ; les valeurs leves d'une srie correspondent aux
valeurs faibles de l'autre.
4.2.1.1. Proprits.
n
( x i x ) ( y i y)
COV ( x , y) i 1
n
n
( x i y i x i y x y i x y)
COV( x , y) i 1
114
Statistique descriptive 4. Rgression et corrlation
n n n n
x i yi y x i x yi x y
COV( x , y) i 1 i 1 i 1 i 1
n
n n
x i yi x i yi
COV ( x , y) i 1
- y x - x y x y COV( x , y) i 1
- xy
n n
La covariance est gale la diffrence entre la moyenne des produits et le produit des
moyennes.
n p
n ij x i y i
i 1 j1
COV( x , y) - xy
n
- Transformation linaire :
n
( x i ' x ' ) ( y i ' y' )
COV( x ' , y' ) i 1
n
n
(ax i b a x b) (a ' y i b'a ' y b' )
COV( x ' , y' ) i 1
n
n
a ( x i x ) a ' ( y i y)
COV( x ' , y' ) i 1
115
Statistique descriptive 4. Rgression et corrlation
n
a a ' ( x i x ) ( y i y)
COV ( x ' , y' ) i 1
COV( x, y) Sx Sy
xi 34 42 53 30 50 60 46 57 32 24 36 28
yi 12 14 15 10 15 17 12 14 10 09 11 10
xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423
116
Statistique descriptive 4. Rgression et corrlation
12 12
x i 492 et y i 149
i 1 i 1
12 12
x i 21774 et y i 1921
i 1 i 1
12
x i y i 6423
i 1
12
xi 492
x i 1
41
n 12
12
y i
y i 1
149 12,4166667 = 12,42
n 12
12
xi 21774
S x i 1
x 41 133,5
n 12
S x 133,5 11,55
12
yi 1921
S y i 1 - y - 12,4166667 = 5,91
n 12
S y 5,91 = 2,43
12
x i yi
COV ( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12
117
Statistique descriptive 4. Rgression et corrlation
La covariance est positive, il y a donc une relation croissante entre le nombre d'articles
achets et le nombre de visites au centre commercial : c'est--dire que plus il y a de visites, plus
il y a darticles achets, ce qui semble tout fait logique.
y 3 7 10 12 15
x
7 0 3 9 7 11
9 10 13 18 16 13
11 9 11 14 17 14
14 12 9 7 5 2
Distribution marginale de x
x 7 9 11 14 Total
Effectifs 30 70 65 35 200
n x i i 21865
4 S x i 1
x 10,23 4,67
nixi
2045
200 200
x
i 1
10,23
200 200
Sx 4,67 2,16
En moyenne, les candidats qui se sont prsents au concours ont obtenu une note de 10,23
sur 20 en expression et communication.
118
Statistique descriptive 4. Rgression et corrlation
Distribution marginale de Y
y 3 7 10 12 15 Total
Effectifs 31 36 48 45 40 200
5
n i yi 22323
5 S y i 1
y 9,83 14,99
n i yi
1965
200 200
y
i 1
9,83
200 200
Sy 14,99 3,87
En moyenne, les candidats qui se sont prsents au concours ont obtenu une note de 9,83
sur 20 en informatique.
4 5
n
i 1 j1
ij xi y j
COV ( x , y) -x y
200
4 5
n
i 1 j1
ij x i y j = 7x3x0+7x7x3+7x10x9+7x12x7+7x15x11
+ 9x3x10+9x7x13+9x10x18+9x12x16+9x15x13
+11x3x9+11x7x11+11x10x14+11x12x17+11x15x14
+14x3x12+14x7x9+14x10x7+14x12x5+14x15x2
4 5
n
i 1 j1
ij x i y j = 19576.
19576
COV ( x , y) - 10,23 9,83 = -2,68
200
La covariance est ngative, il y a donc une relation dcroissante entre les notes d'expression
communication et les notes d'informatique. En dautres termes, les candidats bons en
informatique sont, en moyenne, faibles en expression et communication.
119
Statistique descriptive 4. Rgression et corrlation
On doit prciser la variable dont on veut expliquer les variations (variable dpendante y),
puis celle qui est la cause de ces variations (variable explicative x).
Le diagramme de dispersion d'une variable y en fonction d'une autre variable x est form des
points moyens conditionnels de coordonnes (xi , yi), et donne une ide de la faon dont varie,
en moyenne, la variable y en fonction de la variable x.
300
200
100
Y
0 10 20 30
Bien que la relation entre deux variables ne soit pas toujours linaire, on accepte, dans une
premire approximation, de considrer que cette relation est linaire et ce pour les raisons
simples suivantes :
- On peut toujours, dans une premire approximation, approcher une courbe par la
corde qui la soutient ;
- la thorie de la rgression linaire est beaucoup plus dveloppe et surtout beaucoup
plus simple appliquer et interprter que celle de la rgression non linaire ;
La rgression linaire permet donc de dterminer la droite qui s'ajuste au mieux aux valeurs
observes. Cette droite est appele droite de rgression de y en fonction de x.
Xi 34 42 53 30 50 60 46 57 32 24 36 28
Yi 12 14 15 10 15 17 12 14 10 09 11 10
120
Statistique descriptive 4. Rgression et corrlation
Diagramme de Y en fonction de X
18
14
12
10
0
0 10 20 30 40 50 60 70
Nombre de visites
yaxb
Reprsente l'erreur alatoire, elle est non observable et comprend la fois les erreurs de
mesure sur les valeurs observes de Y et tous les autres facteurs explicatifs non pris en compte
dans le modle.
Il existe diffrentes mthodes pour ajuster une droite de rgression. La mthode la plus
utilise est la mthode des moindres carrs.
121
Statistique descriptive 4. Rgression et corrlation
La mthode des moindres carrs est une mthode d'ajustement qui consiste minimiser la
somme des carrs des diffrences entre les valeurs observes, yi, et les valeurs estimes par la
^
droite, y i diffrence appele rsidu.
Le modle empirique, estim partir des observations, sera dsign de cette faon :
^
y a 0x b0
y 4
.
e4 { ^y =a x + b
y3 .} e3
y2 e2 {.
y 1 .} e1
x 1
x 2 x 3
x 4
x
On dfinit le i-me rsidu ( not ei ) comme tant la diffrence mesure verticalement sur
^
le graphique entre la valeur observe de yi et sa valeur estime : ei yi - yi .
On remarque que :
- le rsidu est positif (ei >0) si yi se trouve au-dessus de la droite au point xi.
- le rsidu est ngatif (ei < 0) si yi se trouve au-dessous de la droite au point xi.
- le rsidu est nul (ei = 0) si yi se trouve prcisment sur la droite au point xi.
On dsire expliquer les variations observes sur la variable dpendante y, c'est pour cette
raison quil faut considrer les diffrences mesures verticalement.
122
Statistique descriptive 4. Rgression et corrlation
La mthode des moindres carres est celle qui minimise la somme des carrs des rsidus;
symboliquement, on cherche :
2
n ^
n
Minimiser l' expression : y i y i e i
2
i 1 i 1
Avec le critre des moindres carrs, tous les rsidus deviennent positifs; car sinon, en nous
limitant aux rsidus simples, il est impossible que des rsidus positifs annulent des rsidus
ngatifs.
Les dmonstrations algbriques sont facilites par le recours aux outils du calcul diffrentiel.
La minimisation dune fonction quadratique plusieurs variables seffectue en annulant les
drives partielles de premier ordre et en vrifiant le signe des drives partielles de deuxime
ordre.
Par calcul diffrentiel, on cherche les 2 valeurs a0 et b0 qui minimisent la somme des carrs
des rsidus, cette somme quadratique est note f( a0 , b0), puisquelle est fonction de 2 termes
inconnus a0 et b0 :
^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )
f(a0 , b0) est minimum lorsque les drives premires partielles de f(a0 , b0) par rapport a0
et b0 sont nulles et que les drives secondes partielles sont positives.
Appelons :
- f ' a 0 , la drive premire partielle de f par rapport a0;
- f ' ' a 0 , la drive seconde partielle de f par rapport a0
1re Condition : crivons que les drives premires partielles sont nulles, c'est--dire que :
f ' a 0 0 et f ' b 0 0 .
123
Statistique descriptive 4. Rgression et corrlation
^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )
On a :
f 'b 0 - (yi - a 0 x i b 0 ) 0
(y i - a 0 x i b 0 ) 0
yi - n b0 - a 0 x i 0
yi n b0 a 0 x i
On a aussi :
f ' a 0 - 2 x i (y i - a 0 x i b 0 ) 0
(x y i i - b 0 x i - a 0 x i ) 0
x i yi - b0 x i - a 0 x i 0
x i yi b0 x i a 0 x i
On a donc un systme de deux quations deux inconnues, ces deux quations qui sont
appeles quations normales sont :
yi n b0 a 0 x i
x i yi b0 x i a 0 x i
y i n b 0 a 0 x i => n b0 yi - a 0 x i
yi xi
b0 - a0
n n
b0 y - a 0 x
124
Statistique descriptive 4. Rgression et corrlation
x i yi b0 x i a 0 x i
x i y i (y - a 0 x) x i a 0 x i
x i yi y x i - a 0 x x i a 0 x i
2
x i y i n x y a 0 ( x i - n x )
a0
x y -n x y
i i
x -n x
2
i
x i yi - n x y COV ( x , y)
a0 2
xi - n x S 2x
^
Do y a 0 x b0 a 0 x y a 0 x a 0 x x y
Ces estimateurs sont des fonctions linaires des observations x1, x2, . . . xn.
2 Condition : montrons que les drives secondes partielles sont positives, c'est--dire
que : f ' ' a 0 0 et f ' ' b 0 0 .
^
f (a 0 , b 0 ) e i (y i - y i ) (y i - a 0 x i b 0 )
125
Statistique descriptive 4. Rgression et corrlation
On a :
f ' a 0 - 2 x i (y i - a 0 x i b 0 )
f ' 'a 0 - 2 x (y i i - a 0x i b0 ) '
2 x i2 qui est bien positif.
et :
f ' b 0 2 - (y i - a 0 x i b 0 )
f ' ' b0 2 - (y i
- a 0 x i b 0 ) ' 2 qui est bien positif.
Nous pouvons donc conclure que les valeurs de a0 et b0 que nous avons dtermines
2
^
n n
correspondent bien un minimum de lexpression : y i y i e i
2
i 1 i 1
xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423
126
Statistique descriptive 4. Rgression et corrlation
12 12
x i 492 et y i 149
i 1 i 1
12 12
x i 21774 et y i 1921
i 1 i 1
12
x i y i 6423
i 1
12 12
xi 492 yi149
x i 1
41 et y i 1 12,42
n 12 n 12
12
xi 21774
S x i 1
x 41 133,5
n 12
S x 133,5 11,55
12
y i
S y i 1
- y 1921 - 12,4166667 = 5,91
n 12
Sy 5,91 = 2,43
12
x i yi
COV( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12
127
Statistique descriptive 4. Rgression et corrlation
6423 - 12 41 12,4166667
a0 = 0,196005 = 0,20
21774 - 12 41
On peut vrifier que :
COV ( x , y) 26,17
a0 = = 0,196005 = 0,20
S x 133,5
^
y 0,20 x 4,38
1) La droite de rgression passe par le point moyen de coordonnes : ( x , y)
^ ^
2) yi yi et (yi yi ) 0
^
3) (y i y i ) 2 est la plus petite somme des carrs des carts que l'on peut obtenir.
Nous donnerons, sur des exemples pratiques, les interprtations quil y a lieu de donner des
coefficients a et b, mais dores et dj, nous pouvons dire :
Le coefficient a est le taux de croissance de la variable explique chaque fois que la variable
explicative augment dune unit.
Le coefficient b est lordonne lorigine, son interprtation requiert, dans chaque cas, de
revenir au problme pos.
128
Statistique descriptive 4. Rgression et corrlation
Exemple 5 : Reprenons les donnes de lexemple 1 et vrifions les 3 remarques quon vient de
citer.
^ ^ ^
xi yi yi (yi - y i ) (yi - y i )
34 12 11,04 0,96 0,91
42 14 12,61 1,39 1,92
53 15 14,77 0,23 0,05
30 10 10,26 -0,26 0,07
50 15 14,18 0,82 0,67
60 17 16,14 0,86 0,74
46 12 13,40 -1,40 1,95
57 14 15,55 -1,55 2,41
32 10 10,65 -0,65 0,43
24 9 9,08 -0,08 0,01
36 11 11,44 -0,44 0,19
28 10 9,87 0,13 0,02
Total 492 149 149 0,00 9,37
129
Statistique descriptive 4. Rgression et corrlation
^
2) Vrifions aussi que y i y i = 149 ce qui donne bien
^
(yi yi ) 0
^
3) Enfin, on vrifie bien que ( y i y i ) = 9,37 est la plus petite somme des carrs des
2
carts que l'on peut obtenir. Rappelons que ce minimum est assur par le choix des coefficients
a et b.
y = a x + b = a ( a y + b ) + b = a a y + a b + b
Ce qui donne, en identifiant les termes y dans les deux membres, les conditions ncessaires
suivantes :
a a = 1 et a b + b = 0
Mais comme les points de coordonnes ( xi , yi ) ne sont pas tous sur la droite de rgression
y = a x + b, la condition a a = 1 ne peut tre satisfaite avec exactitude.
130
Statistique descriptive 4. Rgression et corrlation
2 2
^
2 ^
yi y yi y yi yi
2
^
- Le premier terme y i y dsign par SCR mesure la variation autour de la droite de
rgression, on lappelle Somme des Carrs due la Rgression ;
2
^
- Le second terme, y i y i dsign par SCE, mesure la variation rsiduelle, on
lappelle la somme des carrs due lerreur.
R = SCR = ( y y)i
SCT
( yi y)
Etudions tous les cas possibles des valeurs que peut prendre R :
- Cas o R2 = 0 :
Il faut pour cela que SCR = 0, alors le modle utilis n'explique aucune variation dans la
variable dpendante y. En outre, SCR = 0 implique que toutes les valeurs prdites sont gales
^
la moyenne des y, soit y i = y pour i = 1, 2, . . . .n.
Graphiquement, dans le cas dune rgression simple, on aura la situation suivante, dans
laquelle on peut voir clairement que la variable explicative x nest daucune utilit pour
prdire y.
131
Statistique descriptive 4. Rgression et corrlation
- Cas o R2 = 1 :
Il faut pour cela que SCR = SCT, ce qui revient SCE = 0. Sil en est ainsi, le modle
utilis explique toute la variation observe sur y. En outre, SCE = 0 implique que toutes les
i
valeurs prdites sont gales aux valeurs observes correspondantes de y, cest--dire : yi = y
pour i = 1, 2, . . . n.
Exemple 6 : Reprenons les donnes de lexemple 1 et dcomposons la somme des carrs totale
et calculons le coefficient de dtermination.
132
Statistique descriptive 4. Rgression et corrlation
^ ^ ^ ^
xi yi Yi (yi - y i ) ( y i y ) (yi - y i )
34 12 11,04 0,18 1,89 0,91
42 14 12,61 2,50 0,04 1,92
53 15 14,77 6,66 5,52 0,05
30 10 10,26 5,86 4,66 0,07
50 15 14,18 6,66 3,10 0,67
60 17 16,14 20,98 13,84 0,74
46 12 13,40 0,18 0,95 1,95
57 14 15,55 2,50 9,81 2,41
32 10 10,65 5,86 3,12 0,43
24 9 9,08 11,70 11,13 0,01
36 11 11,44 2,02 0,97 0,19
28 10 9,87 5,86 6,51 0,02
Total 492 149 149,00 70,92 61,55 9,37
SCT = ( yi - y) = 70,92
2
^
SCR = y i y = 61,55
2
^
SCE = y i y i = 9,37
R = 0,93 = 0,87
133
Statistique descriptive 4. Rgression et corrlation
4.3.2.1. Dfinition.
( x i x ) ( y i y) x i yi n x y
R= =
( x i x ) ( y i y)
x i n x yi n y
COV( x , y)
R=
Sx Sy
Cette dfinition montre que le coefficient de corrlation possde le mme signe que la
covariance et qu'il est toujours compris entre -1 et +1 puisque comme on la vu : R < 1
R = +1 : dans ce cas, les points se trouvent tous sur une mme droite croissante, on
parle de corrlation linaire positive parfaite.
R = -1 : dans ce cas, les points se trouvent tous sur une mme droite dcroissante, on
parle de corrlation linaire ngative parfaite.
R = 0 : dans ce cas, il n'y a aucune dpendance linaire entre les deux variables, on
parle de corrlation linaire nulle.
-1 < R < 0 : dans ce cas, les deux variables varient en sens inverse, la relation
linaire est faible ou forte selon que le coefficient de corrlation linaire est proche de
0 ou de -1.
0 < R < 1 : dans ce cas, les deux variables varient dans le mme sens, la relation
linaire est faible ou forte selon que le coefficient de corrlation linaire est proche de
0 ou de 1.
134
Statistique descriptive 4. Rgression et corrlation
xi yi xi yi xi yi
34 12 1156 144 408
42 14 1764 196 588
53 15 2809 225 795
30 10 900 100 300
50 15 2500 225 750
60 17 3600 289 1020
46 12 2116 144 552
57 14 3249 196 798
32 10 1024 100 320
24 9 576 81 216
36 11 1296 121 396
28 10 784 100 280
Total 492 149 21774 1921 6423
12
x
12
i 492 et y i 149
i 1 i 1
12 12
x i 21774 et y i 1921
i 1 i 1
12
x i y i 6423
i 1
12 12
xi 492 yi
149
x i 1
41 et y i 1 12,42
n 12 n 12
135
Statistique descriptive 4. Rgression et corrlation
12
xi 21774
S x i 1
x 41 133,5
n 12
S x 133,5 11,55
12
y i
S y i 1
- y 1921 - 12,4166667 = 5,91
n 12
Sy 5,91 = 2,43
12
x i yi
COV( x , y) i 1
- x y = 6423 - 41 x 12,4166667 = 26,17
n 12
x i yi n x y
R=
x i n x yi n y
6423 - 12 41 12,4166667
R= = 0,93
21774 - 12 41 1921 - 12 12,4166667
COV( x , y) 26,17
R= = = 0,93
Sx Sy 11,552,43
Il y a donc une forte corrlation linaire croissante entre le nombre d'articles achets et le
nombre de visites des clients au centre commercial.
136
Statistique descriptive 4. Rgression et corrlation
a a ' COV( x , y)
R ( x ' , y' )
a Sx a ' Sy
COV( x , y)
R ( x ' , y' ) => R(x ,y) = R(x ,y)
Sx Sy
Une transformation linaire ne change pas l'intensit de la relation linaire mais elle peut
changer le sens de la relation.
Pour obtenir une prvision ponctuelle de Y pour une valeur particulire x0 de X, il suffit de
remplacer X par x0 dans le modle empirique, ce qui scrit :
^
y = a0 x0 + b0
^
y = 0,20 x 4,38
^
Si x0 = 25 alors y = 0,20 x 25 + 4,38 = 9,38 soit 9 ou 10 articles achets aprs 25 visites
au centre commercial.
137
Statistique descriptive 4. Rgression et corrlation
Dans certaines situations, il arrive que le nuage de points du diagramme ne ressemble pas
une relation linaire. La rgression linaire n'est donc pas adapte. On doit donc ajuster une
courbe non linaire. On parle de rgression non linaire.
Certains modles non linaires peuvent tre ramen des rgressions linaires grce des
transformations de variables. Cest les cas notamment du modle exponentiel en ax et du
modle polynomial en xa .
y = a0 b0x
On pose :
Le modle devient :
y' = a0 + b0 x
a0 =
x y' x y'
i i
et b0 = y' - b1 ' x
x -n x
2
i
a 0 ea '0 et b0 e b '0
138
Statistique descriptive 4. Rgression et corrlation
Exemple 9 : Le tableau suivant indique lvolution des ventes d'un produit pour
les 12 premiers mois de son lancement :
Mois : xi Ventes : yi
1 1
2 6
3 10
4 14
5 25
6 48
7 63
8 108
9 161
10 240
12 325
Diagramme de dispersion
350
300
250
200
Ventes
1 50
1 00
50
0
0 2 4 6 8 10 12 14
Mois
Le nuage de points du diagramme de dispersion indique que la relation entre le temps et les
ventes n'est pas linaire, mais exponentielle.
On pose :
12 12
xi = 67
i 1
y'
i 1
i = 38,995
12 12
xi = 529
i 1
y' = 169,223
i 1
i
12
x y'
i 1
i i = 296,773
12
x i
x i 1
67 5,58
n 12
12
y i
38,995
y' i 1
3,250
n 12
12
x i y' i
296,773
COV( x , y' ) i 1
- x y' = - 5,58 x 3,25 = 6,596
n 12
140
Statistique descriptive 4. Rgression et corrlation
- -
x i y i ' - n x y' 296,773 - 12 5,58 3,25
a0 = = = 0,509
- 529 - 12 5,58
xi - n x
- -
b0 = Y' - b1' X = 3,25 0,509 x 5,58 = 0,410
y = 1,66 x 151x
y = a0 xbo
On pose :
141
Statistique descriptive 4. Rgression et corrlation
Remarque : dans le cas du modle polynomial du second degr qui a comme quation
gnrale : y = a x + b x + c, on peut montrer, par un simple changement de variables, quon
peut revenir au modle polynomial simple du paragraphe 2.5.1., en effet, si lon pose :
x = X X0 et y = Y Y0
Le modle devient :
Y Y0 = a (X X0) + b (X X0) + c
Y = a X + b (1 2aX0) X+ a X0 b X0 + Y0 +c
Il suffit de prendre :
La rgression multiple a pour but dexpliquer les variations dune variable dpendante y et
p variables explicatives x1 , x2 , ..., xp (p > 1), ensuite, si cette relation est confirme dvaluer
son intensit.
142
Statistique descriptive 4. Rgression et corrlation
Les paramtre ai sont appels coefficients de rgression partielle, ils mesurent la variation
de y lorsque xi augmente dune unit et que les autres variables explicatives sont maintenues
constantes.
i reprsente l'erreur alatoire, elle est non observable et comprend la fois les erreurs de
mesure sur les valeurs observes de yi et tous les autres facteurs explicatifs non pris en compte
dans le modle.
Lanalyse de rgression repose sur les mmes hypothses prsentes dans la rgression
simple auxquels il faut ajouter quil ny a pas de colinarit parfaite entre les variables
explicatives xi, cest--dire que leurs coefficients de corrlation linaire doivent tre nuls ou
proches de zro.
De la mme manire que la rgression simple, la mthode des moindres carrs consiste
minimiser la somme des carrs des diffrences entre les valeurs observes, yi, et les valeurs
i diffrence appele rsidu.
estimes par le modle, y
Le modle empirique, estim partir des observations, sera dsign de cette faon :
^
y i a'1 x 1i a'2 x 2i a'3 x 3i ... a'p x pi b'0
pour : (i=1, 2, , n)
^
On dfinit le i-me rsidu e par : ei = Yi - Yi
i
La mthode des moindres carrs minimise la somme des carrs des rsidus, somme dsigne
par f(a1, a2, . . .ap, b0), une fonction de ( p + 1 ) inconnues :
f (a 1 , a 2 ,..., a p ,b 0 ) e y i y i y i a 1 x 1i ... a p x pi b 0
2
2 ^
2
i
143
Statistique descriptive 4. Rgression et corrlation
En annulant simultanment les drives partielles par rapport a1, a2, . . .ap et b0, on obtient
un systme de ( p + 1 ) quations linaires homogne (p+1) inconnues qui sont justement a1,
a2, . . .ap et b0. Ce systme est semblable celui montr dans le cas de la rgression linaire
simple.
Dans le cas de la rgression multiple, les calculs deviennent trs complexes, et pratiquement
impossibles faire sans laide de lordinateur. Il existe un nombre important de logiciels
informatiques qui traitent le problme de la rgression simple et de la rgression multiple. Les
logiciels fournissent en plus des estimations des coefficients du modle, toutes les statistiques et
tests ncessaires pour juger de la validit du modle.
Nous allons, dans ce qui suit, tudier, dans les dtails, le cas de la rgression linaire simple
deux variables explicatives.
La mthode des moindres carrs est celle qui minimise la somme des carrs des rsidus;
symboliquement, on cherche :
2
n ^
n
Minimiser l' expression : y i y i e i
2
i 1 i 1
De mme que pour la rgression simple, avec le critre des moindres carrs, tous les rsidus
deviennent positifs; car sinon, en nous limitant aux rsidus simples, il est impossible que des
rsidus positifs annulent des rsidus ngatifs.
Les dmonstrations algbriques sont facilites par le recours aux outils du calcul diffrentiel.
La minimisation dune fonction quadratique plusieurs variables seffectue en annulant les
drives partielles de premier ordre et en vrifiant que les signes des drives partielles de
deuxime ordre sont tous positifs.
Par calcul diffrentiel, on cherche les valeurs a1 a2 et b0 qui minimisent la somme des carrs
des rsidus, cette somme quadratique est note f(a1,a2,b0), puisquelle est fonction des 3 termes
inconnues : les 2 termes a1 et a2 et le 3 terme b0 :
^
f (a 1 , a 2 , b 0 ) e i (y i - y i ) (y i - a 1 x 1i a 2 x 2i b 0 )
144
Statistique descriptive 4. Rgression et corrlation
f(a1,a2,b0) est minimum lorsque les drives premires partielles de f(a1, a2, b0) par rapport
a1 , a2, et b0 sont nulles et que les drives secondes partielles sont toutes positives.
Convenons de garder les mmes notations pour ai et sont estimation a0i pour simplifier les
critures.
Appelons :
- f ' a 0 , la drive premire partielle de f par rapport a0;
- f ' ' a 0 , la drive seconde partielle de f par rapport a0.
1re Condition : crivons que les drives premires partielles sont nulles, c'est--dire que :
f ' a 0 0 , f' a 2 0 et f ' b 0 0 .
^
f (a 1 , a 2 , b 0 ) e i (y i - y i ) (y i - a 1 x 1i a 2 x 2i b 0 )
On a :
On a aussi :
f ' a1 - 2 x 1i (y i - a 1 x 1i a 2 x 2i b 0 ) 0
(x 1i y i - b 0 x 1i - a 1 x 1i - a 2 x 1i x 2i ) 0
2
x 1i y i - b 0 x 1i - a 1 x 1i - a 2 x 1i x 2i 0
2
x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2
On a enfin :
145
Statistique descriptive 4. Rgression et corrlation
f ' a 2 - 2 x 2i (y i - a 1 x 1i a 2 x 2i b 0 ) 0
(x 2i y i - b 0 x 2i - a 1 x 1i - a 2 x 1i x 2i ) 0
2
x 2i y i - b 0 x 2i - a 1 x 1i x 2i - a 2 x 2i 0
2
x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2
On a donc un systme de trois quations trois inconnues, ces deux quations qui sont
appeles quations normales sont :
y i n b 0 a 1 x 1i a 2 x 2i
x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2
x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2
y i n b 0 a1 x1i a 2 x 2i
yi x 1i x 2i
b0 - a1 a2
n n n
b 0 y - a1 x1 a 2 x 2
x 1i y i b 0 x 1i a 1 x 1i a 2 x 1i x 2i
2
x 2i y i b 0 x 2i a 1 x 1i x 2i a 2 x 2i
2
x 1i y i ( y - a 1 x 1 a 2 x 2 ) x 1i a 1 x 1i a 2 x 1i x 2i
2
x 2i y i ( y - a 1 x 1 a 2 x 2 ) x 2i a 1 x 1i x 2i a 2 x 2i
2
x 1 y ( y - a 1 x 1 a 2 x 2 ) x 1 a 1 x 12 a 2 x 1 x 2
146
Statistique descriptive 4. Rgression et corrlation
x 2 y ( y - a 1 x 1 a 2 x 2 ) x 2 a 1 x 1 x 2 a 2 x 22
Lestimation de a1, de a2 et de b par la mthode des moindres carrs conduit aux formules
suivantes :
b 0 y - a1 x1 a 2 x 2
147
Statistique descriptive 4. Rgression et corrlation
^
y a1 x1 a 2 x 2 b 0 a1 x1 a 2 x 2 y - a1 x1 a 2 x 2
do :
^
y a 1 (x 1 - x 1 ) a 2 ( x 2 x 2 ) y
2 Condition : montrons que les drives secondes partielles sont positives, c'est--dire
que : f ' ' a1 0 f ' ' a 2 0 et f ' ' b 0 0 .
f ' a1 - 2 x 1i (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' a1 2 x 12i ce qui est bien positif.
f ' a 2 - 2 x 2i (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' a 2 2 x 22i ce qui est bien positif.
f ' b 0 - (y i - a 1 x 1i a 2 x 2i b 0 )
f ' ' b0 1 ce qui est bien positif.
Nous pouvons donc conclure que les valeurs de a1 de a2 et b0 que nous avons dtermines
2
p 1
n ^
n
yi yi ei
2
correspondent bien un minimum de lexpression : x
i 1 i 1
p
Remarque : Dans le cas de la rgression polynomiale gnrale qui a pour forme : y = ap x +
p 1
ap-1 x + . . . + a2x + a1x + a0, il suffit de remplacer x k par xk pour revenir au modle
multilinaire quon vient dtudier.
Noublions pas que, dans un modle multilinaire, il est ncessaire que les variables x k
soient indpendantes pour justifier le recours plusieurs variables, mais cela nest pas tout
148
Statistique descriptive 4. Rgression et corrlation
fait le cas, dans notre modle polynomial gnral transform en modle multilinaire car les
x k ne sont pas indpendantes, en effet prenons le cas simple de x et x et montrons, par un
exemple, que ces deux variables ne sont pas indpendantes :
x1 x = x2 x1 x2 x1x2
1,1 1,21 1,21 1,4641 1,331
1,3 1,69 1,69 2,8561 2,197
1,7 2,89 2,89 8,3521 4,913
1,8 3,24 3,24 10,4976 5,832
2,4 5,76 5,76 33,1776 13,824
3,2 10,24 10,24 104,8576 32,768
3,5 12,25 12,25 150,0625 42,875
3,9 15,21 15,21 231,3441 59,319
4,2 17,64 17,64 311,1696 74,088
4,7 22,09 22,09 487,9681 103,82
Somme 27,8 92,22 92,22 1341,749 340,97
Sommes/10 2,78 9,222 9,222 134,1749 34,097
On calcule les variances, les carts types des variables et leur covariance :
COV(x1,x) = 8,45984
k l
Le mme calcul pourra montrer que les x et x ne sont pas indpendantes quels que
soient k et l mais nous admettons, dans une 1re approximation, la validit du modle malgr
cette entorse lhypothse dindpendance des variables.
Exemple 10 : Le tableau suivant regroupe les donnes relatives une variable dpendante y et 2
variables explicatives x1 et x2.
149
Statistique descriptive 4. Rgression et corrlation
x1 x2 y
15 20 90
28 15 115
40 10 120
70 9 100
120 11 130
130 8 118
160 4 98
250 7 135
Le modle empirique, estim partir des observations, sera dsign de cette faon : y = a1
x1 + a2 x2 + b.
x1 x2 y X1 X2 y x1x2 x1 y x2y
15 20 90 225 400 8100 300 1350 1800
28 15 115 784 225 13225 420 3220 1725
40 10 120 1600 100 14400 400 4800 1200
70 9 100 4900 81 10000 630 7000 900
120 11 130 14400 121 16900 1320 15600 1430
130 8 118 16900 64 13924 1040 15340 944
160 4 98 25600 16 9604 640 15680 392
250 7 135 62500 49 18225 1750 33750 945
Total 813 84 906 126909 1056 104378 6500 96740 9336
Les moyennes :
x 1 = 101,625 x 2 = 10,5 et y = 113,25
Les variances :
Les covariances :
150
Statistique descriptive 4. Rgression et corrlation
b 0 y - a1 x1 - a 2 x 2
113,25 0,1269 x101,625 0,4684 x10,5 95,4321
151
Statistique descriptive 4. Rgression et corrlation
2
^
Le premier terme y i y dsign par SCR mesure la variation autour du modle de
rgression, on lappelle Somme des Carrs due la Rgression. Lautre terme,
2
^
y i y i dsign par SCE, mesure la variation rsiduelle, on lappelle la somme des
carrs due lerreur.
2
Le coefficient de dtermination multiple R est dfinit par :
^
SCR = ( y i y)
R =
SCT
( yi y)
2
On pourrait montrer par ailleurs que R est gal au carr du coefficient de corrlation
multiple.
Le coefficient de dtermination multiple ne peut tre infrieur au plus lev des coefficients
de dtermination simple entre y et chacune des variables explicatives. Si les variables
explicatives sont parfaitement indpendantes entre elles, le coefficient de dtermination
multiple sera gal la somme des coefficients de dtermination simple entre y et chacune des
variables explicatives.
n 1
R aj2 1 (1 R 2 )
n p 1
Le R ajust est infrieur au R. Ce dernier est un estimateur biais, tandis que le premier est
non biais.
2
Le R ajust est prfrable R si la taille de lchantillon est faible. Quand n sera suprieur
30, il ny aura habituellement pas beaucoup de diffrence entre les 2 indices.
Le R ajust est plus appropri pour comparer des modles de rgression dune variable
explique Y en fonction de diffrents sous-groupes de variables explicatives.
4.7.1. Exercice.
Lentreprise SATEX dsire contrler sa consommation dnergie lectrique, pour ce faire, elle
dresse le tableau des statistiques de consommation et de production des 10 derniers mois et
essaie, dans un premier temps de voir si la consommation dpend de la production.
a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
153
Statistique descriptive 4. Rgression et corrlation
4.7.2. Exercice.
Une teinturerie consomme beaucoup deau, cette consommation est naturellement fonction du
poids des tissus teints. Le tableau des consommations deau et des poids des tissus teints est
donn ci-dessous.
a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
b) Dterminer sil y a une corrlation entre consommation deau et poids des tissus teints et si
oui tablir la relation liant ces deux variables.
c) Interprter la valeur de la coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0.
d) Donner quelle serait la consommation deau pour une production de 50 kg de tissus teints.
4.7.3. Exercice.
Un commerant dsire savoir si son chiffre daffaires dune journe est fonction du nombre de
154
Statistique descriptive 4. Rgression et corrlation
clients quil reoit pendant cette journe. Il dresse le tableau statistique de ses chiffres daffaires
et du nombre de clients quil reoit pendant les 10 derniers jours.
Nombre de clients Chiffres daffaires
xi yi (DH)
12 190
13 230
15 280
18 300
22 310
23 400
26 420
31 480
32 540
37 620
a) Tracer le nuage de points (xi , yi) et dire si cela inspire lexistence dune liaison entre y et x.
Donner une justification de cette liaison.
b) Dterminer sil y a une corrlation entre nombre de clients et chiffres daffaires et si oui
tablir la relation liant ces deux variables.
c) Interprter la valeur de b, coordonne lorigine du modle linaire, cest--dire au point
dabscisse xi = 0
d) Donner quel serait le chiffre daffaires pour 50 clients.
Solution : a) Facile faire ; b) R = 0,983 avec a = 16,0
et b = 10,5 ; c) sans aucun client, on peut raliser 10,5 DH de chiffre daffaires, ce qui semble
difficile croire. Il sagit dun rsultat aberrant ; d) 810,50 DH.
4.7.4. Exercice.
Le directeur dune filature de nylon dsire connatre la relation liant la consommation
nergtique de son usine avec la production de fil total et de fil teint. Pour ce faire, il dresse le
tableau de huit jours de production et classe ce tableau par ordre croissant. Etablir sil y a :
a) une corrlation entre consommation dlectricit et production totale de fil et si oui, tablir la
relation liant ces deux variables.
b) une corrlation entre consommation dlectricit et production totale de fil teint et si oui,
tablir la relation liant ces deux variables.
c) une corrlation entre consommation dlectricit, production totale de fil et production de fil
teint ; et, si oui, tablir la relation liant ces deux variables
d) Interprter la valeur de la coordonne lorigine du modle linaire, cest--dire au point
dabscisses x1i = x2i = 0.
e) Compte tenu des rsultats des questions a), b) et c) calculer de 3 faons diffrentes la
consommation lectrique pour une production globale de fil de 400kg et une production de fil
teint de seulement 300 kg ? Interprter chacun des 3 rsultats et dire lequel choisir et
pourquoi ?
155
Statistique descriptive 4. Rgression et corrlation
156
Statistique descriptive 4. Rgression et corrlation
4.7.6. Exercice.
Les relevs des consommations moyennes dessence dun vhicule, au 100 km, ainsi que ceux
des vitesses auxquelles ces consommations ont t enregistres sont donns dans le tableau ci-
dessous :
a) Tracer le nuage de points (vi , ci) et dire si cela inspire lexistence dune liaison entre vi et ci.
Donner une justification de cette liaison.
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement
parabolique, pour ce faire, il y a lieu dabord de faire un changement de variables pour centrer
le graphe. On pose donc : Vi = vi 90 et Ci = ci 7
Calculer le tableau des nouvelles variables.
c) Calculer les coefficients du modle exponentiel ainsi que le coefficient de corrlation
correspondant.
d) Calculer les coefficients du modle parabolique ainsi que le coefficient de corrlation
correspondant.
e) Choisir le modle qui sajuste le mieux.
f) Donner quelles seraient les consommations pour des vitesses de 50 km/h, 70 km/h et 160
km/h.
4.7.7. Exercice.
Lentreprise SATEL dsire connatre comment volue son chiffre daffaires mensuel en fonction
de la publicit quelle passe dans les journaux et des prospectus quelle distribue dans les boites
aux lettres des particuliers.
Les relevs de 10 mois des chiffres daffaires, des dpenses publicitaires et des dpenses pour
les prospectus sont rsums dans le tableau ci-dessous :
a) Etablir sil y a une corrlation entre le chiffre daffaires mensuel et la publicit que passe
lentreprise dans les journaux.
b) Etablir sil y a une corrlation entre le chiffre daffaires mensuel et les prospectus que
distribue lentreprise dans les boites aux lettres.
c) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la publicit que passe lentreprise dans les journaux.
d) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la dpense pour les prospectus que distribue lentreprise dans les boites aux lettres.
e) Calculer les lments du modle dajustement linaire du chiffre daffaires mensuel en
fonction de la dpense de la publicit que passe lentreprise dans les journaux et de celle des
prospectus que distribue lentreprise dans les boites aux lettres.
f) Interprter la valeur de la coordonne aux origines (au point de coordonnes pi = 0 et fi =
0,00 DH) du modle linaire.
g) Indiquer sur quelle variable pi ou fi doit agir le chef dentreprise pour avoir la meilleure
augmentation du chiffre daffaires.
h) Compte tenu des rsultats des questions c), d) et e) calculer, de 3 faons diffrentes, le
chiffre daffaires pour des dpenses de publicit de 185 735,32 DH et des dpenses de
prospectus de 7 245,36 DH ? Indiquer lequel des 3 rsultats choisir et dire pourquoi.
158
Statistique descriptive 4. Rgression et corrlation
e) Vi = 1,67 pi 4,08 fi + 34,79 avec R = 0,998 ; f) Sans dpense de la publicit dans les
journaux ni de dpenses dans des prospectus que distribue lentreprise dans les boites aux
lettres, on peut sattendre en moyenne un chiffre daffaires mensuel de 34790 DH ; g) La
dpense de la publicit dans les journaux est plus corrle (0,99619) la dpense dans des
prospectus que distribue lentreprise dans les boites aux lettres (0,9637). Le chef dentreprise
doit agir sur la dpense de la publicit dans les journaux pour avoir la meilleure augmentation
du chiffre daffaires ;
h) vi = 1,31 pi + 67,54 = 1,31 x 185,73532 + 67,54 = 310,853 soit 310853 DH
vi = 14,34 fi + 192,48 = 14,34 x 7,24536 +192,48 = 296,378 soit 296378 DH
vi = 1,67 pi 4,08 fi + 34,79 = 1,67 x 185,73532 4,08 x 7,24536 + 34,79 = 315,407 soit
315407 DH.
On peut retenir le troisime rsultat (315407 DH) puisque ce modle possde le coefficient de
corrlation le plus lev.
4.7.8. Exercice.
La production intrieure brute dun pays volue, avec le temps, comme indiqu, dans le tableau,
ci-dessous :
PIB en milliards de DH
annes xi
pi
1997 1 2,79
1998 2 2,87
1999 3 2,95
2000 4 3,01
2001 5 3,15
2002 6 3,25
2003 7 3,27
2004 8 3,33
2005 9 3,45
a) Tracer le nuage de points (xi , pi) et dire si cela inspire lexistence dune liaison entre pi et xi.
Donner une justification de cette liaison.
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement
parabolique, pour ce faire comparer les coefficients de corrlation des deux modles.
c) Calculer les coefficients du modle qui possde le meilleur coefficient de corrlation.
d) Donner quelles seraient les PIB pour les annes 2006 et 2007.
159
Statistique descriptive 4. Rgression et corrlation
4.7.9. Exercice.
Le nombre dabonns un service tlphonique au cours des neuf premiers mois de son
lancement sont comme suit :
a) Tracer le nuage de points (ti , yti) et dire si cela inspire lexistence dune liaison linaire ou
non linaire. Donner une justification de cette liaison ;
b) On doit choisir entre un modle dajustement exponentiel et un modle dajustement linaire,
pour ce faire comparer les coefficients de corrlation des deux modles ;
c) Calculer les coefficients du modle qui possde le meilleur coefficient de corrlation ;
d) Donner quelles seraient le nombre de nouveaux abonns pour les trois derniers mois de
lanne.
4.7.10. Exercice.
Anne x1 x2 y
1 87,9 19,6 28,37
160
Statistique descriptive 4. Rgression et corrlation
A partir de ces donnes, on cherche le modle de rgression linaire qui permet dexpliquer au
mieux le rendement en fonction des variables mtorologiques.
161
Statistique descriptive 5. Les sries chronologiques
CHAPITRE 5
LES SERIES CHRONOLOGIQUES
5.1. DEFINITION.
Une srie chronologique ou temporelle, est une suite dobservations numriques dune
grandeur effectues intervalles rguliers au cours du temps.
Les exemples dans le monde conomique et social sont donc nombreux : inflation, cours
boursiers, chmage, productions, exportations, natalit, immigration, scolarisation,
logement, chiffre daffaires, stocks, ventes, prix, vie dun produit, clientle, etc.
Si on note y la grandeur laquelle se rapportent les observations, une srie chronologique
est donc une srie statistique deux variables (t , y) dont la seconde variable est le temps t.
La spcificit de lanalyse dune srie chronologique est limportance accorde lordre
dans lequel sont effectues les observations. En sries chronologiques la dpendance
temporelle entre les variables constitue la source principale dinformation.
Lchelle de mesure de la grandeur sera toujours reprsente par une variable continue
valeurs relles.
La frquence des observations peut tre journalire, hebdomadaire, mensuelle, trimestrielle,
annuelle ou autre. Dans bien des situations conomiques, un effet saisonnier li une
priode connue est pressenti. Une srie journalire sera observe pendant plusieurs
semaines avec une priodicit de 5, 6 ou 7 jours selon le cas; pour une srie mensuelle
observe sur plusieurs annes, la priode est gale 12 ; pour une srie trimestrielle
observe sur plusieurs annes, la priode est gale 4.
La variable mesure peut tre ltat dune grandeur linstant de mesure, on parle de niveau
dun stock, du chiffre daffaires, du bilan dune activit au cours de la dernire priode
coule, etc.
163
Statistique descriptive 5. Les sries chronologiques
Exemple 1 : les ventes trimestrielles en milliers de DH ralises par une entreprise au cours
des quatre dernires annes sont regroupes dans le tableau suivant :
164
Statistique descriptive 5. Les sries chronologiques
Pour cette prsentation, les donnes doivent tre transformes en une srie statistique deux
variables, la variable y dsignant les ventes et la variable t reprsentant le temps.
Temps t Vente y
1 190
2 160
3 251
4 200
5 320
6 290
7 359
8 317
9 426
10 405
11 483
12 433
13 558
14 525
15 607
16 550
700
600
500
Ventes y
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t
165
Statistique descriptive 5. Les sries chronologiques
5.3.1. Tendance.
Le trend est une fonction variation lente, elle sera estime sous forme paramtrique ou
comme le rsultat dune opration de lissage.
La composante cyclique rend compte des fluctuations longues que la variable peut parfois
prsenter autour de la tendance. Les fluctuations cycliques qui traduisent la vie conomique
peuvent avoir une amplitude de plusieurs annes qui est souvent mal dfinie. Cette
composante est prise en compte dans la tendance sur les sries de taille moyenne et ne sera
pas tudie en tant que telle ici.
5.3.4. La composante rsiduelle.
166
Statistique descriptive 5. Les sries chronologiques
700
600
500
Ventes Yt
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t
La donne observe la date t ou donne brute dune srie chronologique, dsigne par
y(t), peut donc sinterprter comme rsultant de la superposition des quatre composantes, le
Trend dsign par Tt ; la composante saisonnire St, la composante cyclique Ct et la
composante rsiduelle Rt.
167
Statistique descriptive 5. Les sries chronologiques
Pour pouvoir sparer les quatre composantes servant dcrire la srie observe, il est
ncessaire de prciser leur mode d'interaction. La plupart des sries chronologiques entrent
dans l'un des schmas suivants :
5.4.1. Schma additif.
Selon ce schma, la srie brute rsulte de la somme du mouvement de longue dure Tt, du
mouvement saisonnier St, du mouvement cyclique Ct et du mouvement accidentel ou
rsiduel Rt :
y(t) = Tt + St + Ct + Rt
St, Ct, et Rt sont alors les lments que lon doit ajouter la valeur Tt de la tendance la
date t pour obtenir la donne observe y(t). Ce modle considre que les mouvements
saisonnier et cyclique sont indpendants du niveau de y atteint sur le trend.
On peut au contraire penser que les variations cycliques et saisonnires suivent lvolution
gnrale de la grandeur. On adopte alors un modle multiplicatif :
Y(t) = Tt x St x Ct x Rt
O St, Ct et Rt sont les coefficients par lesquels on doit multiplier Tt, position sur le Trend
la date t, pour obtenir la donne observe y.
On peut aussi noter que ces deux hypothses ne sont pas incompatibles. Le schma additif
et le schma multiplicatif peuvent tre combins pour donner un schma dit mixte .
Yt = Tt x St + Ct + Rt
Les modles sus-indiqus sont tous acceptables. Cependant, il est frquemment fait usage
du modle multiplicatif pour tudier les techniques associes lanalyse des sries
chronologiques.
168
Statistique descriptive 5. Les sries chronologiques
700
600
Ventes Yt 500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Temps t
On peut remarquer sur le graphique que les variations saisonnires suivent lvolution
gnrale de la srie, on adopte alors un modle multiplicatif :
Y(t) = Tt x St x Rt
O St et Rt sont les coefficients par lesquels on doit multiplier Tt, position sur le Trend la
date t, pour obtenir la donne observe y(t).
Les mthodes de lissage sont des mthodes de rduction ou dlimination des fluctuations
alatoires dans le but de dcouvrir lexistence dautres composantes.
5.5.1. La mthode des moyennes mobiles.
Les oprations de lissage sont ralises par le biais de moyennes mobiles. Celles-ci sont trs
utilises car elles sont la fois de conceptions simples, faciles mettre en uvre et
suffisantes dans bien des situations.
Une srie chronologique est lisse en remplaant chaque valeur y(t) par une moyenne
arithmtique des valeurs qui lentourent. Une moyenne mobile pour une priode de temps
est une moyenne arithmtique simple des valeurs de cette priode et de celles avoisinantes.
Le lissage dune srie chronologique y(t), par une moyenne mobile dordre impair n = 2k +
1 est dfini pour t = k + 1, . . . , T - k, par :
MM(y(t)) = 1 (Y + + Yt + + Yt+k)
n t-k
169
Statistique descriptive 5. Les sries chronologiques
Par exemple, pour calculer les moyennes mobiles de longueur 3 pour une priode
quelconque, nous sommons 3 valeurs de la srie chronologique : la valeur de la srie de la
priode en question, la valeur de celle qui prcde et la valeur de celle qui suit et nous
divisons par 3. Nous calculons les moyennes mobiles pour toutes les priodes excepts la
premire et la dernire.
Utilisons la prsentation des donnes sous forme dune srie statistique deux variables, la
variable y(t) dsignant les ventes et la variable t reprsentant le temps.
Pour calculer les moyennes mobiles de longueur 3 pour une priode quelconque, nous
sommons la valeur de la srie chronologique de la priode en question aux valeurs de celle
qui prcde et de celle qui suit et nous divisons par 3. Nous calculons les moyennes mobiles
pour toutes les priodes excepts la premire et la dernire.
12 433
13 558
14 525
15 607
16 550
Pour essayer de voir comment la mthode des moyennes mobiles rduit les fluctuations
alatoires, examinons les reprsentations graphiques de la srie brute, de la srie des
moyennes mobiles MM3 et de la srie des moyennes mobiles MM5.
600
500
400
300
200
100
0
3 4 5 6 7 8 9 10 11 12 13 14
On remarque bien, sur le graphique, que les moyennes mobiles de longueur 5 lissent la
srie brute plus que les moyennes mobiles de longueur 3. En gnral, plus la priode sur
laquelle nous faisons les moyennes est longue, plus la srie brute devient lisse.
Si lon dcide dadopter un nombre pair de priodes pour calculer les moyennes mobiles,
nous serons confronts au problme de la place ou position des moyennes mobiles
calcules. Obtenir des moyennes mobiles qui se situent entre deux priodes cause des
problmes notamment dinterprtation. La mthode des moyennes mobiles centres corrige
ce problme. Cette mthode consiste calculer des moyennes mobiles dordre 2 aux
moyennes mobiles dj obtenues.
Exemple 6 : Reprenons les donnes de lexemple 5 et calculons les moyennes mobiles
dordre 4.
Pour calculer les moyennes mobiles de longueur 4 nous sommons les valeurs de la srie
chronologique de 4 priodes successives et nous divisons par 4. Les moyennes mobiles ainsi
calcules se positionnent entre 2 priodes. La mthode des moyennes mobiles centres
172
Statistique descriptive 5. Les sries chronologiques
corrige ce problme. Cette mthode consiste calculer des moyennes mobiles dordre 2 aux
moyennes mobiles dj obtenues.
Des trois galits prcdentes, nous pouvons, sans calculer les moyennes mobiles dordre 4,
donner directement lexpression de la moyenne mobile centre pour la priode t :
3 251 216,50
232,75
4 200 249,00
265,25
5 320 278,75
292,25
6 290 306,88
321,50
7 359 334,75
348,00
8 317 362,38
376,75
9 426 392,25
407,75
10 405 422,25
436,75
11 483 453,25
469,75
12 433 484,75
499,75
13 558 515,25
530,75
14 525 545,38
560,00
15 607 -
16 550 -
174
Statistique descriptive 5. Les sries chronologiques
600
500
400
300
200
100
0
3 4 5 6 7 8 9 10 11 12 13 14
Ventes Yt MMC4
On remarque bien, sur le graphique, que les moyennes mobiles centres dordre 4 ont liss
la srie brute.
Deux inconvnients sont associs la mthode des moyennes mobiles pour le lissage dune
srie chronologique :
- Premirement, nous navons pas de moyennes mobiles pour le premier et le dernier
groupes de priodes de la srie. Au cas o la srie chronologique serait compose dun
nombre limit dobservations, les valeurs omises peuvent reprsenter une importante perte
dinformation ;
- Deuximement, les moyennes mobiles ngligent la plupart des valeurs prcdentes de la
srie chronologique, la moyenne mobile reflte des priodes avoisinantes mais nest pas
affecte par tout le pass.
Ces deux inconvnients sont corrigs par la mthode exponentielle dune srie qui est
dfinie de la faon suivante :
St = w yt + (1-w) S t-1 pour t 2
Avec :
175
Statistique descriptive 5. Les sries chronologiques
Cette dernire formule indique que la srie lisse la date t, dpend de toutes les
observations antrieures de la srie chronologique. Lintrt de la mthode rside dans la
facilit de mise jour lors de lacquisition dune nouvelle donne.
Le choix de la constante de lissage est important. Les valeurs proches de 0 produisent un
degr de lissage assez important et correspondent un lissage rigide, car le pass intervient
peu, alors que les valeurs proches de 1 rsultent dans un lissage assez limit de la srie et
donnent un lissage souple o le pass conserve, assez longtemps, son influence.
La particularit consiste accorder aux valeurs passes une importance qui dcrot de
manire exponentielle avec le temps, on parle de facteur doubli. Lautre point important est
que la mise jour, lors de lacquisition dune nouvelle observation yT+1, est ralise de
faon simple.
Le lissage exponentiel nest pas adapt une srie chronologique prsentant une tendance
variant fortement ou un effet saisonnier trs marqu.
Pour w = 0,2 on a :
Pour w = 0,7 on a :
Le tableau, ci-dessous, donne les rsultats de calculs pour le lissage exponentiel, pour w =
0,2 et le lissage exponentiel, pour w = 0,7 :
Lissage exponentiel Lissage exponentiel
Temps t Ventes yt
w = 0,2 w = 0,7
1 190 190,00 190,00
2 160 184,00 169,00
3 251 197,40 226,40
4 200 197,92 207,92
5 320 222,34 286,38
6 290 235,87 288,91
7 359 260,50 337,97
8 317 271,80 323,29
9 426 302,64 395,19
10 405 323,11 402,06
11 483 355,09 458,72
12 433 370,67 440,72
13 558 408,14 522,81
14 525 431,51 524,34
15 607 466,61 582,20
16 550 483,29 559,66
Pour essayer de voir comment la mthode exponentielle rduit les fluctuations alatoires,
examinons les reprsentations graphiques de la srie brute, de la srie lisse
exponentiellement 0,2 et de la srie lisse exponentiellement 0,7.
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 1 12 13 14 15 16
177
Statistique descriptive 5. Les sries chronologiques
On voit bien, sur le graphique, que le lissage exponentiel w = 0,2 lissent la srie brute
plus que le lissage exponentiel w = 0,5. En gnral, plus le coefficient de lissage est faible,
plus la srie brute devient lisse.
5.6. ETUDE DU TREND.
La rgression linaire est la mthode la plus simple pour analyser la tendance gnrale
dune srie chronologique o la variable indpendante est le temps t.
Le trend peut tre soit linaire ou non linaire et par consquent peut prendre des formes
fonctionnelles assez diverses.
5.6.1. Modle linaire.
Si nous estimons que la tendance de longue priode est essentiellement linaire, on utilisera
le modle suivant :
^
yt a t b
Lestimation de a et de b par la mthode des moindres carrs se fait par les formules
dveloppes dans le chapitre prcdent :
a t y - n t y
i i
COV(t, y)
et b y-a t
t - n t
2
i
S2t
Lquation du trend sera dtermine partir de la srie lisse par la mthode des moyennes
mobiles centres dordre 4 calcule lexemple 6.
Reprsentons graphiquement la srie lisse :
srie lisse
600
500
400
300
200
1 00
3 4 5 6 7 8 9 10 11 12 13 14
178
Statistique descriptive 5. Les sries chronologiques
t 102 8,5
12
4561,375
MMC4 380,11
12
1010
St - 8,5 11,92
12
43011,75
COV(t ; MMC4) - 8,5 380,11 353,3775
12
353,3775
a= 29,65
11,92
b = 380,11 29,65 x 8,5 = 128,08
^
Lquation du trend est : yt = 29,65 t + 128,08
Reportons la droite dquation y = 29,65 t + 128,08 sur le graphe de la srie tel que nous
lavons reprsent pour lexemple 1.
179
Statistique descriptive 5. Les sries chronologiques
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Ventes Yt trend
Y' = a + b' t
180
Statistique descriptive 5. Les sries chronologiques
180
160
140
120
100
80
60
40
20
t
1 2 3 4 5 6 7 8 9
Daprs le graphique, on voit bien que la srie prsente une tendance exponentielle de la
forme :
^
y t = a bt
Le modle logarithmique peut tre traduit en termes de log de la faon suivante :
^
Log ( yt ) = log (a) + (log b) t
181
Statistique descriptive 5. Les sries chronologiques
t yt y' t t y'
1 1 0,000 1 0,000
2 6 1,792 4 3,584
3 10 2,303 9 6,908
4 14 2,639 16 10,556
5 25 3,219 25 16,094
6 48 3,871 36 23,227
7 63 4,143 49 29,002
8 108 4,682 64 37,457
9 161 5,081 81 45,733
Total 45 --- 27,730 285 172,561
t 45 5
9
27,73
Y' 3,08
9
St 285 - 5 6,67
9
172,561
COV(t ; Y') - 5 3,08 3,773
9
3,773
b = 0,566
6,67
a = 3,08 0,566 x 5 = 0,25
b = eb = e0,566 = 1,76
a = ea = e0,25 = 1,28
^
Lquation du trend est donc : y t = 1,28 b1,76
182
Statistique descriptive 5. Les sries chronologiques
Dans le but de mesurer leffet saisonnier, on calcule des coefficients saisonniers, qui ont
pour objet de mesurer le degr de diffrence entre les saisons.
Le calcul des coefficients saisonniers repose sur une dmarche gnrale qui peut tre
dcompose en trois tapes essentielles :
^
- La premire tape consiste estimer les valeurs de la tendance y t . La dtermination de
la tendance trend consiste rduire les fluctuations et dgager une volution long terme ;
- La deuxime tape consiste, par une confrontation entre les valeurs de la srie brute et
celles de la tendance, calculer les valeurs du mouvement saisonnier. Cette confrontation peut
se faire, de deux faons :
* Par un modle multiplicatif, sous forme de rapports entre les valeurs de la srie brute et
celles de la tendance, ces rapports sont appels rapports aux trends rt :
rt = Yt
^
Yt
* Par un modle additif, on calcule les diffrences entre les valeurs de la srie brute et
celles de la tendance, on parle de diffrences aux trends.
r t
rk =
n
Avec k = 1 jusquau nombre de saisons et n est le nombre dobservations pour chaque
saison.
csk = rk
r
Exemple 10 : Reprenons les donnes de lexercice 1 et calculons les coefficients
saisonniers.
183
Statistique descriptive 5. Les sries chronologiques
^
Calculons les valeurs du trend y t laide de lquation du trend dj calcule dans
lexemple 8 savoir :
^
yt = 29,65 t + 128,08
^ ^
Yt yt yt rt
3 251 217,03 1,1565
4 200 246,68 0,8108
5 320 276,33 1,1580
6 290 305,98 0,9478
7 359 335,63 1,0696
8 317 365,28 0,8678
9 426 394,93 1,0787
10 405 424,58 0,9539
11 483 454,23 1,0633
12 433 483,88 0,8948
13 558 513,53 1,0866
14 525 543,18 0,9665
1,4
1,2
1
0,8
0,6
0,4
0,2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Le graphique des rapports aux valeurs du trend fait apparatre des fluctuations saisonnires.
Les priodes 2 ; 4 ; 6 ; 8 ; 10 ; 12 ; 14 et 16 qui correspondent aux deuxime et quatrime
trimestres sont des basses saisons, alors que les priodes 1 ; 3 ; 5 ; 7 ; 9 ; 11 ; 13 et 15 qui
correspondent aux premier et troisime trimestres sont des hautes saisons.
184
Statistique descriptive 5. Les sries chronologiques
185
Statistique descriptive 5. Les sries chronologiques
Les coefficients saisonniers du premier et troisime trimestre sont suprieurs 1 alors que
ceux du deuxime et quatrime trimestre sont infrieurs 1. Le deuxime et le quatrime
trimestre sont donc des basses saisons, alors que le premier et le troisime trimestre sont des
hautes saisons.
* dans le cas du modle multiplicatif, en divisant les valeurs de la srie brute par les
coefficients saisonniers moyens correspondants ;
* dans le cas du modle additif, en soustrayant des valeurs de la srie brute les
coefficients saisonniers moyens correspondants.
Rappelons que nous avons opt, dans lexemple 10, pour un modle multiplicatif, de ce fait
et pour dsaisonnaliser notre srie, on divise les valeurs de la srie brute par les coefficients
saisonniers moyens correspondants, on obtient, aprs calculs :
S rie dsaisonnalise
800
600
400
200
0
1 3 5 7 9 11 13 15
186
Statistique descriptive 5. Les sries chronologiques
rsiduelle. En effet, au deuxime trimestre 2002 et premier trimestre 2005 on note une
petite baisse accidentelle.
5.7.3. Calcul des prvisions.
A partir de lquation du trend et des coefficients saisonniers, on peut prvoir les valeurs de
la srie pour les priodes venir.
La prvision de la valeur de la srie la priode t+k est, pour un modle multiplicatif, la
valeur estime du trend multiplie par le coefficient saisonnier moyen de la saison
correspondante.
Exemple 12 : Reprenons les donnes de lexemple 10 et calculons les prvisions des ventes
pour les quatre trimestres de lanne 2006.
187
Statistique descriptive 5. Les sries chronologiques
Le tableau suivant regroupe la srie brute, les valeurs du trend et les diffrences au trend :
^ ^
t yt yt yt dt
3 251 217,03 33,97
4 200 246,68 -46,68
5 320 276,33 43,67
6 290 305,98 -15,98
7 359 335,63 23,37
8 317 365,28 -48,28
9 426 394,93 31,07
10 405 424,58 -19,58
11 483 454,23 28,77
12 433 483,88 -50,88
13 558 513,53 44,47
14 525 543,18 -18,18
diffrences au trend
60
40
20
-20
-40
-60
Le graphique des diffrences aux valeurs du trend fait apparatre des fluctuations
saisonnires. Les priodes 2 ; 4 ; 6 ; 8 ; 10 ; 12 ; 14 et 16 qui correspondent aux deuxime et
quatrime trimestres sont des basses saisons, alors que les priodes 1 ; 3 ; 5 ; 7 ; 9 ; 11 ;
13 et 15 qui correspondent aux premier et troisime trimestres sont des hautes saisons.
188
Statistique descriptive 5. Les sries chronologiques
Les coefficients saisonniers du premier et troisime trimestre sont suprieurs 0 alors que
ceux du deuxime et quatrime trimestre sont infrieurs 0. Le deuxime et le quatrime
trimestre sont donc des basses saisons, alors que le premier et le troisime trimestre sont des
hautes saisons.
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
189
Statistique descriptive 5. Les sries chronologiques
annes jan fv mar avr mai juin juil ao sep oct nov Dc
1998 318 281 278 250 231 216 223 245 269 302 325 347
1999 342 309 299 268 249 236 242 262 288 321 342 364
2000 367 328 320 287 269 251 259 284 309 345 367 394
2001 392 349 342 311 290 273 282 305 328 364 389 417
2002 420 378 370 334 314 296 305 330 356 396 422 452
2003 453 412 398 362 341 322 335 359 392 427 454 483
2004 487 440 429 393 370 347 357 388 415 457 491 516
2005 529 477 463 423 398 380 389 419 448 493 526 560
Reprsentation graphique :
La prsentation des donnes doit tre transforme en une srie statistique deux variables,
la variable y(t) dsignant les ventes et la variable t reprsentant le temps.
y(t)
600
500
400
300
200
100
0
1
7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
190
Statistique descriptive 5. Les sries chronologiques
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 1 12
Pour calculer les moyennes mobiles de longueur 3 pour une priode quelconque, nous
sommons la valeur de la srie chronologique de la priode en question aux valeurs de celle
qui prcde et de celle qui suit et nous divisons par 3. Nous calculons les moyennes mobiles
pour toutes les priodes excepts la premire et la dernire. La formule de calcul est donc :
191
Statistique descriptive 5. Les sries chronologiques
jan fv mars avr mai juin juil aot sept oct nov dc
292,3 269,6 232,3 223,3 245,6 298,6 324,6
- 3 7 253 3 3 228 7 272 7 7 338
332,6 316,6 242,3 246,6 290,3 342,3 357,6
7 7 292 272 251 3 7 264 3 317 3 7
338,3 311,6 259,6 264,6 312,6 340,3 368,6 384,3
353 3 7 292 269 7 7 284 7 3 7 3
378,3 314,3 291,3 281,6 286,6 332,3 360,3 408,6
3 361 334 3 3 7 7 305 3 3 390 7
389,3 360,6 339,3 314,6 310,3 330,3 360,6 391,3 423,3 442,3
405 3 7 3 7 305 3 3 7 3 3 3
390,6 341,6 332,6 338,6 392,6 424,3 454,6 474,6
439 421 7 367 7 7 7 362 7 3 7 7
420,6 397,3 386,6 454,3
470 452 7 3 370 358 364 7 420 3 488 512
507,3 489,6 454,3 400,3 418,6 453,3 526,3
3 7 3 428 3 389 396 7 3 489 3 -
Pour essayer de voir comment la mthode des moyennes mobiles rduit les fluctuations
alatoires, examinons la reprsentation graphique de la srie des moyennes mobiles MM3.
MM3
600,00
500,00
400,00
300,00
200,00
100,00
0,00
11
14
17
20
23
26
29
32
35
38
41
44
47
50
53
56
59
62
65
68
71
74
77
80
83
86
89
92
95
2
On voit bien, sur le graphique, que la srie des moyennes mobiles de longueur 3 est plus
lisse que la srie brute.
Dtermination du trend :
Daprs le graphique de la srie brute, on peut affirmer que la tendance de longue priode
est linaire, on utilisera le modle suivant :
^
yt a t b
192
Statistique descriptive 5. Les sries chronologiques
Lestimation de a et de b par la mthode des moindres carrs se fait par les formules :
a t y - n t y
i i
COV(t, y)
et b y-a t
t - n t
2
i
S2t
Les rsultats des calculs sont regroups dans le tableau suivant :
jan fv mars avr mai juin juil aot sept oct nov dc
251,8 254,0 256,2 258,4 260,6 262,8 265,0 267,2 269,4 271,6 273,8 276,0
278,2 280,4 282,6 284,8 287 289,2 291,4 293,6 295,8 298 300,2 302,4
304,6 306,8 309 311,2 313,4 315,6 317,8 320 322,2 324,4 326,6 328,8
331 333,2 335,4 337,6 339,8 342 344,2 346,4 348,6 350,8 353 355,2
357,4 359,6 361,8 364 366,2 368,4 370,6 372,8 375 377,2 379,4 381,6
383,8 386 388,2 390,4 392,6 394,8 397 399,2 401,4 403,6 405,8 408
410,2 412,4 414,6 416,8 419 421,2 423,4 425,6 427,8 430 432,2 434,4
436,6 438,8 441 443,2 445,4 447,6 449,8 452 454,2 456,4 458,6 460,8
jan fv mars
avr mai juin juil aot sept oct nov dc
- 1,151 1,053
0,979 0,892 0,850 0,860 0,919 1,010 1,100 1,186 1,225
1,196 1,129 1,033
0,955 0,875 0,838 0,846 0,899 0,982 1,064 1,140 1,183
1,159 1,103 1,009
0,938 0,858 0,823 0,833 0,888 0,970 1,049 1,129 1,169
1,143 1,083 0,996
0,931 0,857 0,824 0,833 0,880 0,953 1,027 1,105 1,151
1,133 1,083 0,997
0,932 0,859 0,828 0,837 0,886 0,962 1,037 1,116 1,159
1,144 1,091 1,006
0,940 0,870 0,843 0,853 0,907 0,978 1,051 1,120 1,163
1,146 1,096 1,015
0,953 0,883 0,850 0,860 0,909 0,982 1,057 1,129 1,179
1,162 1,116 1,030
0,966 0,899 0,869 0,880 0,926 0,998 1,071 1,148 -
Calcul des rapports moyens par mois
1,155 1,106 1,017 0,949 0,874 0,840 0,850 0,902 0,979 1,057 1,134 1,552
Calcul de la moyenne des rapports moyens
193
Statistique descriptive 5. Les sries chronologiques
0,964
Calcul des coefficients saisonniers moyens
1,198 1,148 1,055 0,985 0,907 0,872 0,882 0,936 1,016 1,097 1,177 1,610
rapports au trend
1,4
1,2
1,0
0,8
0,6
0,4
0,2
0,0
2
8
11
14
17
20
23
26
29
32
35
38
41
44
47
50
53
56
59
62
65
68
71
74
77
80
83
86
89
92
95
Le graphique des rapports aux valeurs du trend fait apparatre des fluctuations saisonnires.
Les mois 4 ; 5 ; 6 ; 7 et 8 correspondent une basse saison, alors que les mois 1 ; 2 ; 3 ; 9 ;
10 ; 11 et 12 correspondent une haute saison.
Dtermination de la srie dsaisonnalise :
jan fv mars avr mai juin juil aot sept oct nov Dc
1998 265 245 264 254 255 248 253 262 265 275 276 216
1999 285 269 283 272 275 271 274 280 283 293 291 226
2000 306 286 303 291 297 288 294 303 304 314 312 245
2001 327 304 324 316 320 313 320 326 323 332 331 259
2002 351 329 351 339 346 339 346 353 350 361 359 281
2003 378 359 377 368 376 369 380 384 386 389 386 300
2004 407 383 407 399 408 398 405 415 408 417 417 320
2005 442 416 439 429 439 436 441 448 441 449 447 348
194
Statistique descriptive 5. Les sries chronologiques
srie dsaisonnalise
500
450
400
350
300
250
200
150
100
50
0
1
7
10
13
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
61
64
67
70
73
76
79
82
85
88
91
94
La reprsentation de la srie dsaisonnalise montre clairement llimination de leffet
saisonnier. La srie dsaisonnalise fait apparatre quelques irrgularits dues la
composante rsiduelle.
5.8. EXERCICES DAPPLICATION.
5.8.1. Exercice.
Le tableau suivant indique, pour les annes 1995 2005, la production annuelle de crales en
millions de quintaux.
Anne 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Production 50 36,5 43 44,5 38,9 38,1 32,6 38,7 41,7 41,1 33,8
5.8.2. Exercice.
195
Statistique descriptive 5. Les sries chronologiques
Au cours des deux exercices 2004, 2005, les chiffres daffaires mensuels d'une entreprise de
transports ont t les suivants :
ans jan fv mar avril mai juin juil aot Sept oct nov dc
2004 50 46 64 65 63 70 85 63 59 56 49 56
2005 54 51 69 71 70 78 93 70 65 62 54 61
a) Lisser la srie, selon le modle multiplicatif, par la mthode des moyennes mobiles d'ordre 12.
b) Reprsenter graphiquement la srie lisse. Interprter.
c) Dterminer lquation du trend.
5.8.3. Exercice.
a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon un modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes trimestrielles pour lanne 6.
196
Statistique descriptive 5. Les sries chronologiques
5.8.4. Exercice.
Le tableau ci-dessous indique les ventes mensuelles, en millions de dirhams, pendant les annes
1998 2005, de lentreprise MOTEL :
ans jan fv mars avr mai juin juil aot sept oct nov Dc
1998 12,63 11,72 13,43 12,53 13,29 13,27 12,36 13,27 13,10 13,86 13,39 15,38
1999 11,84 11,74 12,74 13,40 14,85 13,81 13,40 13,45 13,62 14,82 14,01 16,91
2000 13,05 12,33 13,96 14,17 14,66 14,58 14,38 14,18 14,08 14,95 13,96 16,44
2001 12,34 12,06 13,54 14,32 14,25 14,66 14,39 13,90 14,14 14,66 14,53 17,87
2002 13,15 12,64 14,57 15,49 15,33 15,60 15,26 15,48 15,76 15,68 15,75 19,12
2003 13,73 13,55 15,72 14,89 16,11 16,58 15,38 16,19 15,58 16,13 16,49 19,38
2004 14,74 14,06 15,79 16,44 17,20 17,11 16,86 17,49 16,37 16,95 17,13 19,84
2005 15,29 13,78 15,55 16,27 17,36 16,60 16,60 17,00 16,33 17,36 17,04 21,17
a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon le modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes mensuelles pour lanne 2007.
f)
Anne 2007 Prvisions
Janvier 14,31
197
Statistique descriptive 5. Les sries chronologiques
Fvrier 13,66
Mars 15,44
Avril 15,71
Mai 16,45
Juin 16,32
Juillet 15,82
Aot 16,12
Septembre 15,88
Octobre 16,61
Novembre 16,29
Dcembre 19,44
5.8.5. Exercice.
a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon le modle multiplicatif par la mthode des moyennes mobiles
dordre 4. Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des chiffres daffaires trimestriels pour lanne 2008.
d)
Trimestres Cs
1er trimestre 0,9023
2me trimestre 0,9943
198
Statistique descriptive 5. Les sries chronologiques
5.8.6. Exercice.
Les ventes quotidiennes dune socit commerciale sont consignes dans le tableau ci-dessous :
a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute par la mthode des moyennes mobiles. Reprsenter graphiquement la
srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions des ventes pour la cinquime semaine et pour la sixime semaine.
d)
Jours Cs
Lundi 1,3395
Mardi 1,3139
Mercredi 0,8015
Jeudi 0,7217
199
Statistique descriptive 5. Les sries chronologiques
Vendredi 0,8235
f)
Semaines 5 et 6 Prvisions
Lundi 63
Mardi 63
Mercredi 39
Jeudi 36
Vendredi 42
Lundi 69
Mardi 69
Mercredi 43
Jeudi 39
Vendredi 45
5.8.7. Exercice.
Le tableau suivant donne l'volution trimestrielle des exportations par tonne denres pour une
entreprise donne.
Solution :
a)
Anne Cs
Trimestre 1 1,1202
Trimestre 2 0,9236
Trimestre 3 1,0854
Trimestre 4 0,8708
b)
Anne 2006 Prvisions
Trimestre 1 692
Trimestre 2 597
Trimestre 3 733
Trimestre 4 613
200
Statistique descriptive 5. Les sries chronologiques
5.8.8. Exercice.
ans jan fv mars avr mai juin juil aot sept oct nov Dc
1998 3661 2834 2999 3152 3977 3295 3807 3307 3312 4317 3139 2700
1999 3562 2911 2868 2912 3678 2606 2969 3149 3364 4156 3139 2672
2000 3351 2730 2801 2957 3883 3204 3758 3229 3153 4024 2797 2413
2001 2967 2462 2412 2445 3345 2730 3251 2708 2711 3629 2685 2518
2002 2505 2556 3256 2757 3754 3052 3015 3883 3148 3282 3758 2669
2003 2713 2751 3517 2971 3835 3143 2397 3700 3155 3284 3740 2641
2004 2565 2616 3446 2696 3558 2959 2708 3737 2849 2920 3223 2221
2005 2164 2108 2702 2105 2729 2489 2138 3146 2570 2733 2462 2188
a) Reprsenter graphiquement la srie brute. Quelle est la nature du trend ? Juger les
fluctuations alatoires et leffet saisonnier.
b) Lisser la srie brute, selon un modle multiplicatif, par la mthode des moyennes mobiles.
Reprsenter graphiquement la srie des moyennes mobiles et interprter.
c) Dterminer lquation du trend.
d) Calculer les coefficients saisonniers.
e) Dsaisonnaliser la srie chronologique. Reprsenter graphiquement la srie dsaisonnalise
et interprter.
f) Calculer les prvisions pour les annes 2006 et 2007.
f)
Annes 2006 Prvisions Annes 2007 Prvisions
Janvier 2006 2441 Janvier 2385
Fvrier 2189 Fvrier 2139
Mars 2518 Mars 2459
Avril 2294 Avril 2241
201
Statistique descriptive 5. Les sries chronologiques
5.8.9. Exercice.
La srie chronologique dfinie par le tableau ci-aprs reprsente l'volution, de 2002 2005, du
nombre trimestriel de mariages enregistrs dans un pays donn (donnes brutes en milliers).
Trimestres
Annes
1er trimestre 2me trimestre 3me trimestre 4me trimestre
2002 64 82 76 68
2003 60 80 70 66
2004 58 76 66 65
2005 57 73 64 63
a) Dterminer l'quation du Trend linaire ;
b) Dsaisonnaliser la srie brute ;
c) Calculer les prvisions pour lanne 2007.
^
Solution : a) Lquation du trend est : y t = - 0,60 t + 73,08
c)
Anne 2007 Prvisions
Trimestre 1 52
Trimestre 2 68
Trimestre 3 60
Trimestre 4 57
5.8.10. Exercice.
Le tableau suivant donne, pour 15 trimestres conscutifs, les valeurs des deux variables
suivantes :
202
Statistique descriptive 5. Les sries chronologiques
Annes Trimestres X Y
1 159 8,40
2 154 8,50
2002
3 161 8,40
4 187 8,16
1 175 7,96
2 186 7,70
2003
3 198 7,13
4 196 7,23
1 204 7,50
2 195 7,70
2004
3 204 7,50
4 210 7,40
1 231 7,30
2 221 7,15
2005
3 241 7,13
4 252 7,11
Etudier les deux sries chronologiques : l'indice d'offre d'emploi et le taux de chmage et
dterminer quels devraient tre l'indice d'offre d'emploi et le taux de chmage pour les 4
trimestres de 2006.
Indice de loffre demploi :
Equation du Trend : y t 5,76 t 149,43
Coefficients saisonniers :
Trimestres CS
Trimestre 1 1,014
1
Trimestre 2 0,969
2
Trimestre 3 0,999
1
Trimestre 4 1,017
6
Prvisions 2006 :
Trimestres Prvisions
Trimestre 1 251
Trimestre 2 245
Trimestre 3 259
Trimestre 4 269
Taux de chmage :
203
Statistique descriptive 5. Les sries chronologiques
Trimestres CS
Trimestre 1 1,003
5
Trimestre 2 1,011
6
Trimestre 3 0,994
7
Trimestre 4 0,990
2
Prvisions 2006 :
Trimestres Prvisions
Trimestre 1 6,9
Trimestre 2 6,9
Trimestre 3 6,7
Trimestre 4 6,5
204
Statistique descriptive 6. Indices statistiques
CHAPITRE 6
INDICES STATISTIQUES
Les indices sont des instruments de mesure de lvolution des grandeurs, ils sont
habituellement exprims en pourcentage.
Un indice est donc destin comparer deux grandeurs ou les valeurs dune mme grandeur
deux moments ou dans deux espaces diffrents. Ces grandeurs peuvent tre soit simples, et
lindice est dit lmentaire ou simple, soit des grandeurs complexes, et lindice est dit
synthtique.
6.1.1. Dfinition.
Considrons une grandeur simple, G, mesure par un nombre qui caractrise directement
une situation, si nous notons Go la valeur de la grandeur G la date 0, appele date ou priode
de base ou de rfrence et Gt sa valeur la date t, appele date ou priode courante, lindice
lmentaire de la grandeur G la date t, par rapport la date 0 est :
Gt
It / 0 100
G0
On pourra calculer les indices du prix du sucre, selon les priodes, avec comme date de
rfrence 1999, on a :
Cette faon de faire permet de remplacer la suite des prix du sucre, diffrentes priodes,
par la suite des indices, plus facile manipuler.
Ainsi, au lieu de manipuler des prix qui sont des nombres plusieurs chiffres, on se
contente, avec les indices, de ne manipuler que des pourcentages qui sont faciles transcrire
et mmoriser. Do lintrt considrable des indices.
Remarques :
1) Il ne faut jamais oublier quun indice est un pourcentage. Bien quil soit not
conventionnellement, par exemple, 121,67 ou 95,32 il faut avoir, constamment lesprit quen
fait il sagit de 121,67% c'est--dire 1,2167 ou 95,32% c'est--dire 0,9532.
3) Pour nous rsumer et tre le plus explicite possible, il est important de comprendre et
daccepter les notations suivantes, mme si elles paraissent, premire vue, incorrectes :
206
Statistique descriptive 6. Indices statistiques
Un indice na pas de dimension du fait que, par dfinition, il est le rapport dune mme
grandeur deux dates diffrentes ou dans deux endroits diffrents.
I t / 0 I t / t ' I t '/ 0
En effet, on a :
G t G t G t'
It /0 I t / t ' I t '/ 0
G 0 G t' G 0
Cette proprit de circularit est essentielle pour les indices simples car elle permet :
Le changement de date de rfrence est une opration courante dans la manipulation des
indices, nous en donnerons plusieurs exemples dans les paragraphes suivants.
Pour le moment nous allons expliquer, par un exemple simple, comment procder.
Exemple 3 : On considre les indices du prix du sucre de lexemple 1 et lon voudrait prendre
comme date de rfrence 2000 au lieu de 1999.
Pour changer la date de base, nous utilisons la proprit de circularit des indices simples et
nous essayons de calculer lindice des prix du sucre avec comme date de base 2000 partir des
indices du prix du sucre ayant comme date de base 1999.
Gt
Gt Gt G G I
I t / 2000 1999 1999 t / 1999
G 2000 G 1999 G 2000 G 2000 I 2000 / 1999
G 1999
Nous pouvons alors dresser le tableau des indices du prix du sucre, avec comme base de
rfrence 2000, partir du tableau des indices du prix ayant comme base 1999.
La proprit de circularit permet aussi de comparer deux indices, ayant les mmes dates de
base, en effet considrons lexemple suivant :
208
Statistique descriptive 6. Indices statistiques
Exemple 4 : On considre deux indices relatifs deux grandeurs diffrentes, ayant la mme
date de rfrence 2001 et ayant les valeurs suivantes ; on demande lequel des 2 indices a
augment le plus entre 2003 et 2006.
Pour faire une telle comparaison, il est ncessaire de changer de base de rfrence et de
prendre comme nouvelle base, 2003. Le tableau prcdant devient dans ce cas :
Pour calculer la valeur des indices, en 2006, on utilise la proprit de circularit des indices,
savoir :
I 2006 / 2001
I2006/2003 =
I 2003 / 2001
On voit sur ce nouveau tableau que le deuxime indice a augment plus que le premier.
La proprit de circularit permet aussi de comparer deux indices, ayant des dates de base
diffrentes, en effet considrons lexemple suivant :
209
Statistique descriptive 6. Indices statistiques
Pour calculer la valeur des indices, en 2004 avec 2000 comme date de rfrence, on utilise
la proprit de circularit des indices, savoir :
On voit, sur ce nouveau tableau, que le premier indice a augment plus que le deuxime ;
c'est--dire quentre 2000 et 2004, la quantit consomme dorge a augment, en pourcentage,
plus que celle du bl.
La dtermination dun indice simple moyen est ncessaire lorsque des donnes relatives
certaines priodes sont manquantes.
Exemple 6 : En effet prenons lexemple 2 relatif aux indices du prix du fuel domestique.
Dans cet exemple, les indices de prix relatifs aux annes 2000, 2002 et 2004 manquent ; la
question qui se pose est la suivante : Comment dterminer les indices de prix des annes 2000,
2002 et 2004 ?
Pour ce faire, nous devons faire une hypothse vraisemblable ; elle consiste supposer
quentre 1999 et 2001, le prix du fuel domestique a augment rgulirement, cest--dire quil a
subi le mme taux daugmentation entre 2000 et 2001 quentre 1999 et 2000.
Soit t ce taux moyen daugmentation annuel du prix du fuel domestique entre 2000 et 2001
puis entre 1999 et 2000.
On a, si lon se rappelle quun indice de prix est justement le taux de variation du prix entre
deux priodes et quil est donn en pourcentage :
210
Statistique descriptive 6. Indices statistiques
Le taux de variation du prix du fuel, entre 1999 et 2000 qui est suppos gal au taux de
variation du prix entre 2000 et 2001 est gal 103,11%.
Nous navons considr, dans le paragraphe prcdent, pour tudier les indices simples, que
le cas simple et particulier de grandeurs simples, comme prix, quantits, etc. Or habituellement,
dans la vie courante des affaires, on est amen considrer, en mme temps, plusieurs
grandeurs et essayer de discuter de la variation de lensemble de ces grandeurs.
Considrons alors n grandeurs simples notes Gi (avec i = 1,., n) et posons Gi0 (toujours
avec i = 1,., n) les valeurs des grandeurs simples pour les diffrentes grandeurs i releves la
date 0 et Git les valeurs des mmes grandeurs simples i relevs la date t. Pour tudier
lvolution de lensemble des grandeurs Gi, nous avons besoin de dfinir des indices globaux
ou synthtiques.
Ces grandeurs peuvent tre des prix Pi, des quantits Qi, des valeurs globales QiPi, etc. Elles
ont donc toutes la mme dimension (Kg, m, m3, l, DH, etc.).
On peut dfinir plusieurs types dindices moyens synthtiques relatifs lensemble des
grandeurs i observes aux dates 0 et t :
6.2.1.1. Dfinition.
Lexpression de lindice des moyennes est donne, par dfinition, par la formule suivante :
G it n
i 1
n
G it
It /0 n
i 1
n
G
i 1
i0 G
i 1
i0
n
211
Statistique descriptive 6. Indices statistiques
Par un tel indice des moyennes des grandeurs entre linstant t et la date de rfrence, on
estime donner une image de lvolution de lensemble des grandeurs Gi.
- de rversibilit ;
- de circularit.
On peut montrer, dune faon gnrale, que lindice synthtique simple des moyennes est
rversible, en effet, cet indice se calcule comme suit :
212
Statistique descriptive 6. Indices statistiques
G
i 1
i 2000
1
I2000 / 2004 = n
=
G
I 2004 / 2000
i 2004
i 1
Lindice synthtique simple des moyennes des grandeurs possde la proprit de circularit.
On peut montrer, dune faon gnrale, que lindice synthtique simple des moyennes
possde la proprit de circularit, en effet, cet indice se calcule comme suit :
213
Statistique descriptive 6. Indices statistiques
n n n
G
i 1
i 2006 G
i 1
i 2006 G
i 1
i 2004
I2006 / 2000 = n
n
n
G i 2000
i 1
G i 2004
i 1
G
i 1
i 2000
6.2.2.1. Dfinition.
Lexpression de lindice synthtique moyenne des indices est donne, par dfinition, par la
formule suivante :
n
1 n G
I i t/0
it
i 1
It /0
n i 1 G i 0 n
Par un tel indice moyenne des indices des grandeurs Gi entre linstant t et la date de
rfrence, on estime donner une image de lvolution de lensemble des grandeurs G i.
- ni la proprit de rversibilit ;
- ni la proprit de circularit.
Pour le calcul de lindice synthtique moyenne des indices I2000 / 2004 , nous devons, dabord,
reprendre le tableau ci-dessus et calculer les indices simples avec 2004 comme date de
rfrence :
On peut aussi montrer, dune faon gnrale, que lindice synthtique moyenne des indices
nest pas rversible, en effet, cet indice se calcule comme suit :
n n
Ii t / 0
i 1
I
i 1
i 0/ t
It /0 et I0 / t
n n
Ces deux expressions sont trs diffrentes puisque si lon a bien
n n
1
Ii t / 0
Ii 0 / t
on a, en gnral, Ii t / 0
i 1
I
i 1
i 0/ t
Pour montrer que lindice synthtique moyenne des indices ne possde pas la proprit de
circularit, nous conservons lexemple prcdent en y ajoutant les donnes de lanne 2006.
Pour le calcul de I2006 / 2004 indice moyenne des indices, pour lanne 2006, avec comme date
de rfrence 2004, nous devons changer de dates de base des indices du tableau, et prendre
lanne 2004 comme date de rfrence :
Mais de tels indices, quoique synthtiques, restent simples. On leur prfre dautres indices
plus explicites. Ce sont les indices synthtiques pondrs.
Si les grandeurs simples Gi sont de mme nature (mme unit) mais n'ont pas la mme
importance, on associe chaque grandeur Gi un poids diffrent. Si lon note i le coefficient de
pondration affect la grandeur Gi, la formule retenue pour le calcul de l'indice synthtique
devient :
216
Statistique descriptive 6. Indices statistiques
n
i G it
It /0 i 1
n
i G i0
i 1
n G it
i ( )
i 1 G i0
It /0 n
i
i 1
Nous verrons, dans la suite du cours, que le problme le plus important qui se pose au
statisticien est justement la pertinence du choix des coefficients de pondration i .
Les indices synthtiques les plus couramment utiliss sont les indices de LASPEYRES et de
PAASCHE.
217
Statistique descriptive 6. Indices statistiques
Le choix des coefficients de pondration, pour les indices LASPEYRES, ceux relatifs la
priode 0, fait que les indices de LASPEYRES ne sont reprsentatifs de la ralit que dans la
mesure o les valeurs des coefficients de pondration restent stables, avec le temps, ou varient
dans les mmes proportions ou varient trs peu. Cela nous permet de comparer des indices
des dates t1 et t2 diffrentes, bien que les indices de LASPEYRES ne possdent pas la proprit
de circularit.
Mais se pose alors la question de circularit des indices de LASPEYRES pour pouvoir
relier les indices ayant diffrentes dates de rfrence. Et, traditionnellement, bien que lon
sache pertinemment que les indices LASPEYRE ne possdent pas la proprit de circularit,
nous faisons comme sils la possdaient parce que nous ne pouvons pas faire autrement.
it
Pt / 0 n
i 1
Gi0
i 1
it (
G it
)
Remarque.
218
Statistique descriptive 6. Indices statistiques
Le choix des coefficients de pondration, pour les indices PAASCHE, ceux relatifs la
priode t, fait que les indices de PAASCHE ne sont reprsentatifs de la ralit que dans la
mesure o les valeurs des coefficients de pondration de linstant t soient les mmes que ceux
des priodes antrieures.
Dans le cas contraire, on est en droit de parler de dure de vie dun indice, c'est--dire le
temps en de duquel les coefficients de pondration sont tellement diffrents par rapport
ceux de la priode t que la situation ce moment l ne soit pas traduite assez fidlement par des
coefficients de la priode t.
Mais se pose alors la question de circularit des indices de PAASCHE pour pouvoir relier
les indices ayant diffrentes dates de rfrence. Et, traditionnellement, bien que lon sache
pertinemment que les indices PAASCHE ne possdent pas la proprit de circularit, nous
faisons comme sils la possdaient parce que nous ne pouvons pas faire autrement.
219
Statistique descriptive 6. Indices statistiques
1 1
F0 / t L 0 / t P0 / t
L t / 0 Pt / 0
1 1
F0 / t
L t / 0 Pt / 0 Ft / 0
Encore appel indice des prix de dtail ou indice du cot de la vie, lindice des prix la
consommation est calcul partir des prix dun ensemble darticles spcifiques reprsentant les
produits de consommation et les services essentiels (le panier de la mnagre). Il est utilis
pour mesurer les variations, dans le temps, des prix pays pour ces produits et services par un
mnage type et sert de mesure la plus courante linflation.
n
d 0 p i0 q i0
i 1
220
Statistique descriptive 6. Indices statistiques
n
d t p it q it
i 1
A la date t, les prix et les quantits ont vari. On peut calculer pour chaque produit :
p i0 q i0
A la date 0, i0 n
p
i 1
i0 q i0
p it q it
A la date t, it n
p q
i 1
it it
n n
Car : i 0 it 1
i 1 i 1
On peut ds lors crire les indices de LASPEYRES et de PAASCHE des prix et des
quantits.
n n
p it p q p
L pt / 0 i0 ( ) n i 0 i 0 ( it )
p i0 q i0 i0
i 1 p i0 i 1 p
i 1
n
p it q i0
Soit : L pt / 0 i 1
n
p
i 1
i0 q i0
Indice PAASCHE de prix :
1 1
Pp t / 0 n
n
p i0 p it q it p i0
it ( ) n
( )
p
i 1 p it i 1 p it
it q it
i 1
n
p it q it
i 1
Soit : Pp t / 0 n
p i 0 q it
i 1
n n
q it p q q
L qt / 0 i0 ( ) n i 0 i 0 ( it )
p i0 q i0 i0
i 1 q i0 i 1 q
i 1
n
q p it i 0
Soit : Lq t / 0 i 1
n
q
i 1
i0 i0p
222
Statistique descriptive 6. Indices statistiques
1 1
Pq t / 0 n
n
q i0 p it q it q i0
it ( ) n
( )
p
i 1 q it i 1 q it
it q it
i 1
n
q it p it
Soit : Pq t / 0 i 1
n
q
i 1
i0 p it
On demande de calculer, pour le cas de ce mnage, les indices prix et les indices quantits
de LASPEYRES relatifs aux 3 dernires annes.
On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de
LASPEYRES.
Il sagit, en fait, dun cas trs particulier de calcul de lindice du cot de la vie.
223
Statistique descriptive 6. Indices statistiques
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de prix de LASPEYRES, en effet :
Lp3/2 x Lp2/1 = 1,0787 x 1,0514 = 1,1341 or Lp3/1 = 1,1339
L p3/2 L p 2 / 1 L p 3 / 1 1,1341 1,1339
0,0002 0,02%
L p3 / 1 1,1339
On voit bien que lerreur est minime puisquelle est peine gale 0,02%.
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de quantit de LASPEYRES, en effet :
Exemple 12 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, les indices prix et les indices quantits de PAASCHE relatifs aux 3 dernires
annes.
224
Statistique descriptive 6. Indices statistiques
On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de PAASCHE.
a) Calculons les indices de prix de PAASCHE, pour ce faire, on dresse le tableau de calculs
suivant :
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de prix de PAASCHE, en effet :
On voit bien que lerreur est minime puisquelle est peine gale 0,25%.
225
Statistique descriptive 6. Indices statistiques
Pq3/2 1,0803
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice de quantit de PAASCHE, en effet :
Pq3/2 x Pq2/1 = 1,0803 x 1,2503 = 1,3507 or Pq3/1 = 1,3542
Pq3/2 Pq 2 / 1 Pq 3 / 1 1,3507 1,3542
0,26%
Pq 3 / 1 1,3542
On voit bien que lerreur est minime puisquelle est peine gale 0,26%.
Exemple 13 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, les indices prix et les indices quantits de FISCHER relatifs aux 3 dernires
annes.
On demande aussi dvaluer, pour chaque type dindice, lordre de grandeur de lerreur
quon commet en appliquant injustement la proprit de circularit aux indices de FISCHER.
a) Calculons les indices de prix de FISCHER, pour ce faire, on dresse le tableau de calculs
suivant :
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice des prix de FISCHER, en effet :
226
Statistique descriptive 6. Indices statistiques
Nous pouvons alors calculer lerreur quon commet en appliquant, injustement, la proprit
de circularit lindice des quantits de FISCHER, en effet :
On voit bien que lerreur est minime puisquelle est peine 0,11%.
On voit bien sur cet exemple que tant pour lindice prix que pour lindice quantit de
FISCHER, lapplication de la proprit de circularit induit de faibles erreurs.
Cet indice des dpenses totales est le rapport des valeurs globales aux prix et quantits de la
priode t sur les valeurs globales aux prix et quantits de la priode 0.
p it q it
Dt /0 i 1
n
p
i 1
i0 q i0
Nous pouvons calculer cet indice en fonction des indices de prix et de quantits de
LASPEYRES et de PAASCHE.
n
En effet multiplions le numrateur et le dnominateur de Dt/0 par p
i 1
it q i0 :
n n n n
p it q it p it q i0 p it q i0 p it q it
Dt /0 i 1
n
i 1
n
i 1
n
i 1
n
p
i 1
i0 q i0 p
i 1
it q i0 p
i 1
i0 q i0 p
i 1
it q i0
227
Statistique descriptive 6. Indices statistiques
n
De mme, on aurait pu multiplier le numrateur et le dnominateur de Dt/0 par p
i 1
q :
i0 it
n n n n
p q p q q
it it i0 it it pi0 p q it it
Dt / 0 i 1
n i 1
n i 1
n i 1
n
p q p q q
i 1
i0 i0
i 1
i0 it
i 1
i0 pi0 p q
i 1
i0 it
Les deux galits quon vient dtablir entre 3 indices, savoir, ceux de LASPEYRES, de
PAASCHE et des valeurs globales, permettent de calculer lun des 3 indices si lon connat les
deux autres.
En effet on a :
n n n
p it q it
i 1
p it ' q it '
i 1
p i 1
it q it
Dt/t x Dt/0 = n
n
n
= Dt/0
p
i 1
it ' q it ' p
i 1
i0 q i0 p
i 1
i0 q i0
Exemple 14 : Reprenons les donnes de lexemple 11, On demande de calculer, pour le cas
de ce mnage, lindice des valeurs globales relatif aux 3 dernires annes.
Calculons les indices de valeurs globales, pour ce faire, on utilisera lune des deux formules
quon vient dtablir comme indiqu dans le tableau de calculs suivant :
On voit bien que lindice des valeurs globales possde la proprit de circularit puisque :
228
Statistique descriptive 6. Indices statistiques
D3/2xD2/1 = D3/1
Les indices de prix servent aussi dterminer les indices de rvision de prix, dans les
marchs de travaux dont la dure de ralisation stale sur plusieurs annes. Ces marchs
comportent, la plupart du temps, des formules de rvision de prix simples ou complexes.
Une formule de rvision des prix est un indice synthtique qui permet de calculer les prix,
la date de ralisation des travaux, partir des prix la date de signature du contrat.
Le principe de rvision des prix dun march vient du fait que le contrat est sign, une
date 0 et les travaux sont raliss, des dates ultrieures t1, t2, tn, il est donc normal de
recalculer les nouveaux prix auxquels doivent tre facturs les travaux.
La formule gnrale de rvision des prix dun march est un indice synthtique qui donne le
rapport de prix Pt / Po entre les instants t et 0, elle scrit de la faon suivante :
n
I it
Pt / Po = 0 +
i 1
i0 (
I i0
)
n
Avec 0 + i0 = 1
i 1
Les rapports Iit et Ii0 donnent lvolution de lindice dun constituant du march : main
duvre, matires premires, produits finis ou semi finis, etc. Ces indices peuvent tre simples
ou synthtiques. En gnral, on admet que 10 20% du montant du march ne soit pas
rvisable et que le reste le soit au prorata des montants des diffrents corps dtat dans le
montant total du march
Intituls Montants HT
- Gnie civil : 2 358 500,00
- Electricit : 452 360,00
- Plomberie : 235 125,00
- Menuiserie : 354 750,00
- Appareillages lectriques : 175 855,00
On suppose que 15% du march ne sont pas rvisables et que le reste lest au prorata des
montants des diffrents corps dtat que sont le gnie civil, llectricit, la plomberie, la
menuiserie et lappareillage lectrique dont les indices sont respectivement I gc, Ilec, Ipl, Ime et Iap
Pour des raisons dautorisations administratives, les travaux de ce march nont dmarr
quen mai 2005, ont dur 3 mois et ont t facturs selon lavancement des travaux comme
suit :
n
Pt I it
P0
= 0 +
i 1
i0 (
I i0
)
Avec 0 = 0,15 et les autres dtermins comme suit, au prorata des montants :
Pt I gc t I lec t I pl t
= 0,15 + 0,5605 0,1075 0,0559
P0 I gc 0 I lec 0 I pl 0
I me t I ap t
0,0843 0,0418
I me 0 I ap 0
On trouve bien une formule similaire avec la somme des gale 1, en effet :
b) Pour calculer le montant total de la rvision des prix de ce march, on doit dabord
calculer les taux dvolution des diffrents indices, selon les mois de ralisation et appliquer
ces taux aux montants de factures :
231
Statistique descriptive 6. Indices statistiques
P P1 P2 P3 P0
or P1 = 1 249 965,00 x 1,0920 = 1 364 961,78 DH
P2 = 1 103 769,00 x 1,1058 = 1 220 547,76 DH
P3 = 1 222 856,00 x 1,1215 = 1 371 433,00 DH
Total = 3 956 942,54 DH
On voit l, lintrt de prvoir des formules de rvision de prix pour des marchs qui ne
sont pas raliss dans des dlais assez courts, en effet du fait que les dlais sont, parfois longs,
les prix des diffrents produits et services augmentent et il nest pas raisonnable dexiger de
lentrepreneur de raliser des travaux ou de fournir des produits des prix qui nont plus
aucune ralit.
Dans notre exemple, lentrepreneur peut facturer des rvisions de prix dun montant total de
380352,54 DH qui doit reprsenter les augmentations de prix quil a subies.
232
Statistique descriptive 6. Indices statistiques
En toute rigueur, un indice synthtique de la bourse doit tre un indice de valeurs globales,
sous la forme :
n
I it
I t / 0 N it
i 1 I i0
Avec :
- I t / 0 indice boursier t par rapport linstant 0 ;
- Nit nombre daction i existant en bourse ;
- Iit indice actuel de laction i ;
- Ii0 indice de dpart de laction i.
Dans le cas particulier de la bourse des valeurs de Casablanca, on fait appel deux types
dindices boursiers, le MASI et le MADEX.
Le MASI est un indice boursier synthtique global qui traduit lvolution de lensemble des
valeurs cotes, la bourse de Casablanca, par contre, le MADEX est un indice boursier
synthtique partiel qui, par la traduction de lvolution de quelques valeurs importantes (20)
ambitionne de traduire assez fidlement lvolution de lensemble de la place de Casablanca.
Le choix dun indice boursier synthtique partiel est intressant dans la mesure o il rsume
assez fidlement lvolution boursire de la place quil reprsente et que son calcul est assez
rapide et facile.
6.7.1. Exercice.
Les prix ainsi que les quantits consommes des produits A et B sont donns dans le tableau
suivant, selon les annes :
Quantits 25 30 31 35
Prix 112,00 121,00 126,00 137,00
B
Quantits 26 33 34 36
a) Calculer les indices lmentaires de prix des biens A et B avec lanne 2000 comme date
de base.
b) Calculer les indices de prix de LASPEYRES suivants : Lp2/0 et Lp4/0.
c) Calculer l'indice de PAASCHE suivant : Pp6/0.
Solution :
a) Indices lmentaires de prix des biens A et B avec lanne 2000 comme date de base :
Produits/Annes 2000 (t = 0) 2002 (t = 2) 2004 (t = 4) 2006 (t = 6)
A 100 94,70 91,67 98,48
B 100 108,04 112,5 122,32
6.7.2. Exercice.
On donne les relevs des prix et des quantits consomms pour deux groupes de produits,
alimentation et habillement, deux priodes diffrentes : 2002 et 2006.
234
Statistique descriptive 6. Indices statistiques
Solution :
a) Indices lmentaires de prix pour chacun des groupes :
Groupe de produits I2006/2002
Alimentation 104,76
Habillement 138,89
c) - Indice des prix LASPEYRES de lanne 2006 partir des indices calculs aux deux
questions prcdentes.
Groupe de produits pi2002qi2002 I2006/2002 pi2002qi2002 x I2006/2002
Alimentation 609 104,76 63798,84
Habillement 342 138,89 47500,38
951 - 111299,22
Lp2006/2002 117,03
- Indice des quantits PAASCHE de lanne 2006 partir des indices calculs aux deux
questions prcdentes.
Groupe de produits pi2006qi2006 I2006/2002 pi2006qi2006 / I2006/2002
Alimentation 594 93,10 6,3802
Habillement 525 110,53 4,7498
1119 - 11,1300
Pq2006/2002 100,54
6.7.3. Exercice.
Produits A B C D
Prix en 2002 35,00 15,00 93,00 278,00
235
Statistique descriptive 6. Indices statistiques
Calculer un indice de prix global base 100 en 2002. Justifier votre choix et interprter votre
rsultat.
Solution :
On calcule lindice de prix LASPEYRES puisquon ne dispose que de la consommation de
lanne de base.
Produits pi2002qi2002 pi2004qi2002
A 3255 3720
B 1650 1980
C 2790 3300
D 47538 51471
55233 60471
Lp2004/2002 109,48
6.7.4. Exercice.
On donne les relevs des prix et des quantits consomms pour deux groupes de produits,
logement et transport, deux priodes diffrentes : 2002 et 2006.
Priodes 2002 2006
Groupe de produits Prix Quantits Prix Quantits
Logement 25,00 125 26,0 125
Transport 7,25 56 7,85 60
Logement 100
Transport 107,14
6.7.5. Exercice.
237
Statistique descriptive 6. Indices statistiques
a) Calculer les indices simples pour lanne 2005 avec comme date de base 2001.
b) Calculer les indices synthtiques pour lanne 2005 avec comme date de base 2001.
c) Interprter les rsultats des questions a) et b)
d) En supposant que le 1er indice volue rgulirement, dterminer le mme indice pour les
annes 2002, 2003 et 2004.
Solution :
a) Indices simples pour lanne 2005 avec comme date de base 2001.
Cours des actions I2005/2001
X 112
Y 180
b) Indices synthtiques pour lanne 2005 avec comme date de base 2001.
- Moyenne des indices : I2005/2001 =112180 = 146
2
- Indice des moyennes : I2005/2001 = 7001800 = 153,85
6251000
c) Interprtation des rsultats des questions a) et b)
Entre le 31/12/2001 et le 31/12/2005, le cours de laction X a augment de 12 %
Entre le 31/12/2001 et le 31/12/2005, le cours de laction Y a augment de 80 %
Entre le 31/12/2001 et le 31/12/2005, les cours des action X et Y ont connu une
augmentation moyenne de 46 %
Entre le 31/12/2001 et le 31/12/2005, le cours moyen des actions X et Y a augment de
53,85 %
Solution :
a) Quantit de B enregistre en 2005 sachant que l'indice de PAASCHE des quantits de
2005 par rapport 2001 tait gal 126,27 % ?
n
q p
i2005 i2005
4215q24
Pq2005/ 2001 i n1 = = 1,2627 soit : q = 14
35151024
q
i 1
p
i2001 i2005
b) Indices de prix des 2 produits pour les annes 2003 et 2005 en prenant 2001 comme date
de rfrence.
Produits/Annes 2001 2003 2005
A 100 109,09 136,36
B 100 116,67 133,33
6.7.7. Exercice.
239
Statistique descriptive 6. Indices statistiques
Solution :
a) Valeur de lindice global de cette bourse qui tient compte de toutes les actions cotes.
2349,49
Ij/j-1 = x 100 = 101 %
2330
b) Valeur de lindice partiel de cette bourse relatif aux 4 plus fortes capitalisations.
966,89
Ij/j-1 = x 100 = 105 %
925
c) Valeur de lindice partiel de cette bourse relatif aux 4 plus fortes valeurs liquides en
valeur.
814,34
Ij/j-1 = x 100 = 101 %
805
6.7.8. Exercice.
240
Statistique descriptive 6. Indices statistiques
Le tableau suivant donne quelques produits imports par le Maroc partir de la France en 2002
et 2006.
Solution :
a) Indice de quantit selon la pondration de LASPEYRES, base 100 l'anne 2002.
Lq2006/2002 = 110,74
b) Calculer l'indice de prix selon la pondration de PAASCHE, base 100 l'anne 2002.
Pp2006/2002 = 124,38
d) Calcul des mmes indices pour lanne 2004 en supposant que les indices simples de prix
et de quantits des diffrents produits voluent rgulirement entre 2002 et 2006.
e) Calcul des mmes indices pour lanne 2004 en supposant quils voluent rgulirement
entre 2002 et 2006.
Indices 2006/2002 Indice annuel moyen 2004/2002
Lp 116 103,78 107,7
Pp 124,38 105,61 111,53
Lq 110,74 102,58 105,23
Pq 118,74 104,39 108,97
Fp 120,12 104,69 109,60
Fq 114,67 103,48 107,08
6.7.9. Exercice.
Un march pass, en mars 2002 na t excut quen octobre 2002. Calculer la rvision de
prix faire si la formule de rvision est donne par :
Pt = P0 ( 0,20 + 0,15Alt/Al0 + 0,30ACut/Cu0 + 0,35Fet/Fe0)
Les indices Fet/Fe0 , Alt/Al0 et Cut/Cu0 sont ceux du fer, de laluminium et du cuivre,
principales fournitures du march qui ont volu de mars octobre, respectivement de 5%, de
7% et de 4%.
6.7.10. Exercice.
Ladministration a sign un march avec lentreprise SOTAG pour la ralisation dun projet sur
plusieurs mois. MATAG facture ses travaux tous les deux mois.
Calculer les rvisions de prix dues pour toutes les factures que SOTAG soumet au
paiement, sachant que :
Date de signature du march : Mars 2001.
Dbut des travaux : Septembre 2001.
Fin des travaux : Mars 2002.
Base de rfrence des indices : Janvier 2000
Formule de rvision des prix : Pt = P0(0,25 + 0,25St/S0 + 0,30GOt/GO0 + 0,20CSt/CS0)
242
Statistique descriptive 6. Indices statistiques
Solution :
Formule de rvision des prix : Pt = P0(0,25 + 0,25St/S0 + 0,30GOt/GO0 + 0,20CSt/CE0)
Pour calculer le montant total de la rvision des prix de ce march, on doit dabord calculer
les taux dvolution des diffrents indices, selon les mois de ralisation et appliquer ces taux
aux montants de factures :
244
Statistique descriptive Bibliographie
BIBLIOGRAPHIE
246
Statistique descriptive Bibliographie
247
Statistique descriptive Bibliographie
248