Escolar Documentos
Profissional Documentos
Cultura Documentos
X
Effectifs
Effectifs
x1
n1
Total
Total
3
.V.C
Classes Effectifs
[; [
.
.
.
.
n1
Total
Classes
Total
Effectifs
n
4
Qualitative
Reprsentations graphiques
1. Caractres qualitatifs
1.1. Diagramme en barres (ou en tuyaux d'orgue) :
Graphique figuratif :
Caractre
Figure possible
Population humaine
Dpenses, recettes
Etres humains
Pices de monnaie ou billets de
banque
Dessins du produit concern
Dessins du produit concern
etc
10
fi
11
Caractres quantitatifs. 2
C. Discrets. 2.1
:Diagramme en btons
12
13
fi
14
25
S1 3
h1
3
b1 1
S 2 13
1
h2 4
b2 3
3
S3 9
h3 4,5
b3 2
15
16
17
VC
18
19
2.4.1. Pyramides
La pyramide est un double histogramme horizontal.
L'exemple le plus connu est la pyramide des ges.
20
21
Anne 2005
Janvier
60
Fvrier
80
Mars
100
Avril
150
Mai
200
Juin
180
Juillet
40
Aot
20
Septembre
80
Octobre
100
Novembre
110
Dcembre
130
22
23
24
25
Paramtres de position. 1
1.1. Mode
Le mode d'un chantillon est la valeur qui se rpte le plus souvent,
autrement dit celle qui apparat avec la frquence la plus leve. C'est
pour cela qu'elle est parfois aussi appele dominante.
( :discrte )Exemple1. Srie discontinue
Le nombre de frres et surs des lves d'une classe est indiqu dans
le tableau suivant
Nbre de frres et surs
5 et plus
Nbre d'lves
25
[5000;6000
[
[6000;7000
[
[7000;8000
[
[8000;9000
[
[9000;10000
[
[10000;11000[
Nombre de salaris
20
50
60
40
20
10
Le mode se trouve dans la classe [7000; 8000[. Pour connatre la valeur modale exacte,
on prend la VALEUR CENTRALE DE LA CLASSE, soit ici 7500.
[7000 ; 8000[ est la classe modale.
Srie comportant des classes d'amplitude ingale :
Dans ce cas cest le centre de la classe correspondant la densit relative )di( la plus
importante, avec
ni
di
ai
27
1.2. Mdiane
La mdiane est la valeur centrale, autrement dit celle qui partage la srie en deux
sous-sries deffectifs gaux.
Cas de variables discrtes :
Tout dabord, les valeurs de la variable doivent tre ranges par ordre croissant.
Ensuite
si le nombre dobservation est impaire [)2n+1(-observations], alors
Me = )n+1(ime observation
Exemple: soit lensemble des notes sur 20 obtenues par 9 tudiants :
E= {13 ; 14 ; 14 ; 15 ; 16 ; 18 ; 18 ; 19 ; 20}
Me = 16
si le nombre dobservation est paire )2n-observations(, alors
28
[8 ;12[ (classe
mdiane)
Notes
ni ni
[0 ; 5[
10 10
[5 ; 8[
8 18
[8 ; 12[
12 30
[12 ; 15[ 11 41
[15 ; 20[ 9 50
50
On le dtermine par interpolation linaire :
29
0,5 - FMe 1
Me LMe
. aMe
f Me
avec
LMe: la limite infrieure de la classe contenant la mdiane,
FMe-1: la frquence relative cumule jusqu la classe mdiane )excluant
la frquence de cette classe(,
fMe: la frquence relative de la classe mdiane,
aMe : lamplitude de la classe mdiane,
30
:Exemple
Me 8 25 18
12 8 30 18
Me 8 7
4
12
28
Me 8 10.33
12
31
ni
fi
Fi
155
%0
%0
Fi
Max
155 160
155
160
%4
%4
% 100
160 165
160
165
% 24
% 28
% 96
165 170
165
170
% 24
% 52
% 72
170 175
170
175
% 20
% 72
% 48
175 180
175
180
%8
% 80
% 28
180 185
180
185
%8
% 88
% 20
185 190
185
190
% 12
% 100
% 12
190
%0
25 % 100
32
les deux
courbes se
croisent juste
avant 170
Me
33
n1 x1 n2 x2 ... n p x p
1
1
x xi ni xi
n i 1
n 1
n1 n2 ... n p
N
x
i 1
i
34
Exemples :
Srie discrte
Srie continue
35
Proprits de la moyenne:
Si yi axi b alors y ax b
La moyenne de la srie S regroupant les deux sries S1 et S2 est :
x
.
nS1 x S1 nS2 x S2
nS1 nS2
36
MG
x 1 x 2 L x n
n1
x1 x 2
n2
L x p
np
P3 )1 t 2 ( P2 )1 t 1 ()1 t 2 ( P1 )1 t m ( 2 P1
)1 t m ( 2 )1 t 1 ()1 t 2 ( 1 t m
tm
)1 t 1 ()1 t 2 ( 1 34.164%
)1 t 1 ()1 t 2 (
37
MH
1
1
n
i 1 x i
:Avec la formule de MH
3
MH
13.85 min/ pice
1
1
1
10 15 20
Exemple2 : une voiture roule pendant une heure la vitesse de 80 km/h
et ensuite parcours un tronon de 60 km la vitesse de 120 km/h. Quelle
est la vitesse moyenne?
On sait que distance = vitesse x temps
dT= d1 + d2 = 80 + 60 = 140 et tT= 1.5 h
donc vm = 140/1.5 = 93.33 km/h.
Ou bien
80 60
MH
93.33km / h
80 60
80 120
39
Exemple3 : une socit marocaine doit rgler une dette auprs dun
fournisseur amricain. Elle dispose actuellement de 32000 $ quelle a
acquis au cours de 9.25 DH/$. La dette slve 78125$ ce qui ncessite
dacqurir 46125 $ pour complment dont la contrepartie globale est
440000 DH. A quel cours moyen les oprations de change ont-elles t
ralises ?
1er change : 32000 X 9.25 = 296000 DH
2e change : 46125 X i
78125 X im
= 440000 DH
i 9.54
= 736000 DH
296000 +440000
MH
296000 440000
9.25
9.54
40
1
2
xi
n i 1
1
2
ni x i
n i 1
f
i 1
2
i
Remarque
MH MG x Q
41
2. Paramtres de dispersion
But: comparer des sries entre elles en tudiant les variations ou
dispersions des donnes par rapport la tendance centrale.
2.1. Ltendue de la srie )range ou intervalle de variation(
La diffrence entre les deux valeurs extrmes dune srie statistique. soit
E x max x min
Les quartiles. 2.2
Les quartiles dcoupent la srie des observations classes en ordre
.croissant en 4 tranche de mme effectif. On les note Q1, Q2, Q3 et Q4
42
fi% ni Fi%
50 21
3936.73
Q1 3700 )4100 3700(
70 21
Calcul de Q2 = Me
4100 Q 2 4300
70 100 170
ni
200 100
Calcul de Q1
3700 Q1 4100
21 50 70
xic
100 70
4160
Q 2 4100 )4300 4100(
170 70 43
Calcul de Q 3
4100 Q3 4300
35 75 85
75 35
4260
Q3 4100 )4300 4100(
85 35
Calcul de Q4
Valeur telle que 100% des observations lui sont infrieures. Donc il
correspond la modalit maximale soit Q4 = 5300
Etendue interquartile
EIQ = Q3 Q1
il contient 50% des observations
On peut effectuer une mme analyse par dciles. On les note D1, D2,
, D10
44
A : distribution symtrique
B : distribution symtrique peu disperse
C : distribution tale vers les valeurs leves
D : distribution tale vers les valeurs faibles
45
Ex
i 1
xi x
i 1
xi x
i 1
1
2
s x
n
x
n
i 1
Population : on la note V
n x
p
i 1
ou 2 x
x
i 1
2
i
46
V
Lcart-type estime la dispersion moyenne autour de la moyenne.
Coefficient de variation. 2.5
Le coefficient de variation est une mesure de la dispersion relative )cart
type par rapport la moyenne( dune srie. Il est donn par
s
Echantillon : CV 100%
x
Population : CV 100%
47
Etalement gauche
Etalement droite
48
)Q3 Me( ) Me Q1 (
s
Q3 Q1
Si s = 0, alors il y a symtrie;
Si s > 0 la mdiane est plus Q1, alors la courbe des frquences est
tale droite;
Si s < 0 la courbe est tale gauche
49
Le coefficient de Pearson
base sur les carts entre Moyennes et Modes :
Si p = 0 la srie est symtrique
Si p>0 la srie est tale droite
Si p<0 la srie est tale gauche
x Mo
p
3 x - Md
p
x
Si 0 <
srie
unimodale
srie plurimodale ou
nayant aucun mode
Concentre
Normale
leptokurtique
platikurtique
msokurtique
3.1.2.2. Coefficients daplatissement
1
Echantillon : m r . n i x i x
n i 1
Population : on les note r
51
Coefficient de Pearson
m4
m
2
2
m4
s
Echantillon
4 4
2 2 4
Population
Coefficient de Fischer
2 = 2 3
52
Coefficient de Kurtosis
0.5 Q 3 Q 2
K
D 9 D1
Si K > 0.25 alors la distribution est leptokurtique
Si 0.25 < K < 0.25 alors la distribution est msokurtique
Si 0 < K < 0.15 alors la distribution est platikurtique
53
3600
3900
4200
4500
5000
21 10.5
49 35
100 85
24 97
6 100
75600
191100
420000
108000
30000
200
824700
9.17
32.34
83.27
96.36
100
55
L Mle
0.50 - F 'Mel 1
. aMle
f Mle
50 - 32.34
4100
. 200
50.93
4169.35
50 % du salaire total est vers des individus dont le salaire est <
4169.35
56
110
24
95,00
2640
90,71
[120 ;
140[
130
14
100
1820
100
57
Lign
itio
t
r
a
irp
u
q
d
58
Interprtation de la reprsentation
Reprsentation strictement galitaire :
59
Aire A
IG
A ire OX Z
O
Remarques :
0 IG 1
la concentration est forte lorsque IG 1
60
Calcul Pratique :
Laire sous la courbe est dcompos en triangle et trapzes.
Dans notre exemple on a 1 triangle et 6 trapzes.
1.43 0.21
Aire triangle
0.15015
2
0.21 5.71
er
Aire 1 trapze
)14.29 1.43( 38.0656
2
5.71 22.04
e
Aire 2 trapze
)37.14 14.29( 317.04375
2
22.04 50.61
e
Aire 3 trapze
)65.72 37.14( 1038.1685
2
50.61 22.61 77.24
e
Aire 4 trapze
)86.43 65.72( 1323.88675
2
Aire 5e trapze 719.66575
Aire 6e trapze 476.775
61
Donc
Aire du carr
Aire A
Aire B 5000 3913.7555 1086.2445
2
Et par suite
1086.2445
IG
0.22
5000
62
Hauteurs trapzes
Bases trapzes
Fi %
Fi%
1,43
0,20
14,29
5,71
12,86
5,92
76,09
37,14
22,04
22,86
27,76
634,40
65,71
50,61
28,57
72,65
2075,80
86,43
77,24
20,71
127,86
2648,47
95,00
90,71
8,57
167,96
1439,65
100,00 100,00
5,00
190,71
953,57
7827,99
7827,99
Aire A 5000
=1086.01
2
Aire A
IG =
0.22
5000
63
64
I. Dfinitions
y1
y2
x1
n11
n12
x2
n21
yp
yJ
n1.
n2.
xq
nq.
xI
n.j
ni.
nI.
n.1
n.2
n.p
n.J
n..
65
n i . n ij ,
j 1
n. j n ij
i 1
et
n.. n ij
j 1 i 1
66
Frquences marginales
y1
y2
x1
f11
f12
x2
f21
yp
yJ
Frquences marginales
f1.
f2.
fij
ni j
n..
xq
fq.
xI
f.j
fi.
fI.
f.1
f.2
f.p
f.J
f..=1
67
S-P
Y
X
y1
n12
x1
x2
S-P
y2 yp yJ ni.
n1.
n21
n2.
xq
nq.
xI
nI.
n.j
n.1 n.2
n.p
n.J n..
68
2. Frquences conditionnelles :
n ij
f j / X x i
: frquence conditionnelle de la valeur yj sachant xi.
ni .
f i / Y y j
n ij
n. j
n. j
ni .
1
1
f
n. j 1
f i . ni . 1 . j
n.. j
j
j n..
n.. i
i
i n..
: Frquences conditionnelles
fi / j
i
nij 1
1
nij 1 f j / i nij 1
n. j i
i n. j
ni . j
j
j ni .
nij
Frquences partielles
nij
1
1
f ij n. j n.. 1
n.. j
n..
j i
i j n..
69
i.
j /i
ij
3. Critres d'indpendance :
Pour que X et Y seront indpendantes, il faut et il suffit que l'on ait :
nij
ni.n. j
n..
70
71
1
Y . n. j y j
n.. j
1
X . n i .x i
n.. i
Variances (globales) :
1
V )X( . n i . x i X
n.. i
1
V )Y( . n. j y j Y
n.. j
72
1
X. j
n. j
1
Yi.
ni.
n x
ij i
ij
yj
1
V )X. j (
n. j
n
i
ij
x X
i
.j
1
V )Yi . ( n ij ) y j Y i . ( 2
ni . j
73
1
X
n..
.j
1
Y
n..
X. j
n Y
i.
i.
1
V )X( .
n..
1
V )Y( .
n..
n V X
1
.
n..
j n. j X. j X
1
.
n..
i ni . Yi . Y
.j
.j
n V Y
i.
i.
74
4. La covariance
La covariance est une mesure de la variance lie de deux variables.
Cov)X, Y(
n ij )x i X() y i Y(
n..
n ij x i y i
n..
XY
Proprits.
Cov) aX b, cY d ( abCov) X , Y ( , ) a, b, c, d ( IR 4
Cov) X , X ( Var) X (
Remarque. Si X et Y sont indpendantes, leur covariance est nulle. La
rciproque est fausse.
75
76
Y volue en fonction
dune variable X
X volue en fonction
dune variable Y
D y y a.x b
x
D x x a '.x b '
y
77
i b D y / x tel que:
Objectif: choix de y i ax
y i
est un mimimum
est un mimimum
Cov )X,Y(
V ar )Y(
avec
Cov )X,Y(
b Y aX
et
. y i X.Y
n
De mme
a '
Cov )X,Y(
Var )Y(
et
b ' X a 'Y
78
r a.a '
1/ 2
Cov )X, Y(
[1,1]
X . Y
Remarque.
Si 0,5 < r2 < 1 on peut dire que l'ajustement du modle y = f(x) est
satisfaisant )plus r2 est proche de 1, meilleur est l'ajustement(.
Si r2 < 0,5 l'ajustement n'est pas parfait. Le modle ne s'ajuste pas au
nuage de points.
80