Você está na página 1de 27

S1-2 Distribution statistique et

valeurs centrales

Thrse Saint-Julien
1. La notion de valeur centrale

1.1 La distribution statistique


Ensemble ordonn des valeurs prises par le caractre X pour les
lments de lensemble E
Image dune distribution statistique: le diagramme de distribution
1.2 Quappelle t-on valeur centrale dune distribution?
une valeur centrale est un rsum, par une seule valeur, de
l'ensemble des valeurs d'une distribution statistique.
La distribution statistique: exemple de la
notation de deux professeurs
notes du notes du
Elves professeur professeur
nombre X Y
d'lves /20 /20
Notes du professeur X
A 7 0
3 D B 8 5
2 E
1 A B C F G H I J
C 9 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 14 16 17 18 19 20 D 10 10
nombre E 10 10
d'lves F 10 10
G 11 11
Notes du professeur Y
3 D H 12 15
2 E I 13 20
1A B C F G H I
1 2 3 4 5 6 7 8 9 10 11 12 13 14 14 16 17 18 19 20 moyenne 10 10
mdiane 10 10
La part des ouvriers dans la population active
rsidente des arrondissements parisiens (%)

Part des
ouvriers
Diagramme de distribution des arrondissements pour la part des ouvriers Arrondissements dans la
dans la population active (%) population
active %
Nombre
Paris 5e 3,9
d'arrondissements
Paris 6e 3,9
Paris 7e 4,8
5
Paris 4e 5,1
4 15
Paris 16e 5,4
3 7 1 12 10
Paris 15e 5,6
2 5 4 14 3 13 18
Paris 1er 5,7
1 6 16 8 9 17 11 2 20 19
Paris 14e 6,3
4 5 6 7 8 9 10 11 12 13 14
Paris 8e 6,4
Part des ouvriers dans la population active totale (%) Paris 9e 6,8
Paris 12e 7,6
Paris 3e 7,9
Paris 17e 8,3
Minimum 3,9 Paris 13e 9,6
Paris 11e 10,2
Maximum 14,3 Paris 2e 12,0
Mdiane 7,2 Paris 20e 12,9
Paris 10e 13,7
Moyenne 8,2 Paris 18e 13,7
Paris 19e 14,3
1.1. Trois valeurs centrales

Le mode
La mdiane
La moyenne arithmtique
Le statisticien Yule (XIXe
1.2 Les principes devant sicle) a dfini six
guider le choix dune proprits souhaitables
pour les valeurs centrales.
valeur centrale Le tableau ci-contre
dsigne les avantages et
inconvnients de chacune
des trois valeurs centrales
Les valeurs centrales Mode Mdiane Moyenne
doivent tre:
1. dfinies de faon objective oui oui oui
2. dpendre de toutes les non non oui
valeurs observes
3. avoir une signification oui oui non
concrte
4. tre simples calculer oui oui oui
5. tre peu sensibles aux non oui non
fluctuations de l'chantillon
6. se prter aux calculs non non oui
algbriques
2. Le mode: dfinition

Le mode (ou valeur dominante pour un


caractre quantitatif, et modalit dominante
dans le cas dun caractre qualitatif), est la * caractre qualitatif et caractre discret
valeur ou modalit la plus frquente d'une
distribution. Pour un caractre qualitatif, ou pour un caractre
quantitatif discret ayant un nombre de modalits
infrieur au nombre d'lments, le mode est la
modalit ou la valeur qui a la frquence simple la
plus leve (ou l'effectif le plus lev, ce qui revient

* Caractre quantitatif continu

Les valeurs possibles tant en nombre infini, il


Le mode correspond la valeur lue en abscisse est peu probable que deux lments aient la mme
valeur. Dans ce cas, le mode ne peut pas tre dfini
du sommet du diagramme de distribution.
directement, il faut au pralable tablir une partition
Lorsque celui-ci prsente deux pics spars par en classes. Le mode est alors le centre de la cl
un creux, on dit que la distribution est bimodale,
etc..
Le mode: exemple des notes donnes par les
professeurs X et Y
nombre
d'lves

Notes du professeur X
3
2
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 14 16 17 18 19 20

Mode nombre
d'lves
Professeur X 10
Professeur Y 10 Notes du professeur Y
3
2
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 14 16 17 18 19 20
Le mode: exemple des
Part des Part des
ouvriers dans les
ouvriers dans ouvriers dans la
la population population
arrondissements parisiens
Arrondissements active % active (%)
(valeurs valeurs
arrondies
l'unit
arrondies au
1/10
Mode Sur les valeurs
Paris 5e
Paris 6e
4
4
3,9
3,9
arrondies l'unit,
Paris 7e
Paris 4e
5
5
4,8
5,1
distribution unimodale
Paris 16e 5 5,4
Paris 15e 6 5,6
mode= 6%
Paris 1er 6 5,7
Paris 14e 6 6,3 Sur les valeurs arrondies
Paris 8e 6 6,4
Paris 9e
Paris 12e
7
8
6,8
7,6
au 1/10, distribution
Paris 3e
Paris 17e
8
8
7,9
8,3
bi-modale
Paris 13e 10 9,6
Paris 11e 10 10,2 mode= 3,9% et 13,7%
Paris 2e 12 12,0
Paris 20e 13 12,9
Paris 10e 14 13,7
Paris 18e 14 13,7
Paris 19e 14 14,3
2.1 Les limites du mode

Le mode ne dpend pas de toutes les valeurs observes

Le mode est instable, en particulier pour les distributions


dcrivant des ensembles dlments peu nombreux

Le mode ne se prte pas aux calculs algbriques


2.2 Les avantages du mode

Le mode a une signification concrte, qui rend son


usage ncessaire dans un certain nombre de problmes
appliqus

exemples:
La connaissance des heures de pointe dans la gestion des transports urbains
Les jours daffluence pour les commerces
Les routes les plus frquentes (points noirs dans le rseau)
etc..
3. La mdiane

Les valeurs du caractre X tant classes par ordre croissant, la


mdiane, X md, est la valeur du caractre qui partage
l'ensemble E dcrit par X en deux sous ensembles
d'effectifs gaux :
50 % des lments ont des valeurs de X suprieures X md et
50% ont des valeurs infrieures.

La mdiane ne peut tre calcule que pour les caractres quantitatifs


3.1 Comment calculer la mdiane partir du
tableau lmentaire

On ordonne le tableau de dnombrement


On repre l'lment qui partage la distribution en
deux parties gales: soit l'lment qui a le rang
(N+1)/2 pour le caractre X.

Si la distribution a un nombre impair d'lments on trouve une


valeur unique qui est la mdiane,
si la distribution a un nombre pair d'lments, on trouve deux
valeurs qui dterminent un intervalle mdian : on prend alors
pour mdiane le centre de cet intervalle mdian.
La mdiane, exemple de Part des
la rpartition des Arrondissements,
ouvriers
dans la
ouvriers Paris E=20
population
active %
Paris 5e 3,9
Minimum 3,9 Paris 6e 3,9
Paris 7e 4,8
Maximum 14,3 Paris 4e 5,1
Mdiane 7,2 Paris 16e 5,4
Paris 15e 5,6
Moyenne 8,2 Paris 1er 5,7
Paris 14e 6,3
Paris 8e 6,4
Nombre pair d'lments: Paris 9e 6,8 7,2
*reprage de l'intervalle mdian Paris 12e 7,6 %
arrondissement occupant la 10e position dans l'ensemble ordonn des valeurs de Paris 3e 7,9
Paris 17e 8,3
X: Paris 9e, valeur de X=6,8 Paris 13e 9,6
e
arrondissement occupant la 11 position dans l'ensemble ordonn des valeurs de Paris 11e 10,2
X: Paris 12e, valeur de X=7,6 Paris 2e 12,0
Paris 20e 12,9
*calcul de la mdiane: Xmd=(7,6-6,8)/2=7,2 Paris 10e 13,7
Paris 18e 13,7
Paris 19e 14,3
tableau lmentaire avec
E=29 lments
tableau lmentaire
ordonn en fonction de La mdiane: exemple des
Pluviosit du
mois de
Pluviosit du
mois de
prcipitations au Mont-Aigoual au
Anne Anne
septembre (en
mm)
septembre
(en mm)
mois de septembre de 1896 1924
1896 119 1902 27
1897 170 1906 27
1898
1899
31
35
1898
1899
31
35
Nombre impair dlments, E=29
1900 583 1908 49 lments
1901 422 1910 70
1902 27 1911 90 On repre llment mdian. Dans cet
1903 254 1923 98
1904 153 1924 112 exemple il sagit du mois de septembre
1905 133 1896 119 qui occupe la 15e position pour les valeurs
1906 27 1905 133
1907 760 1918 150 de X dans le tableau lmentaire
1908 49 1904 153
1909 201 1915 158
ordonn, soit le mois de septembre de
1910 70 1921 160 lanne 1921, qui est llment mdian.
1911 90 1897 170
1912 252 1922 182 Cet lment coupe la distribution en deux
1913 300 1917 186
1914 200 1914 200 classes ayant le mme nombre de mois de
1915 158 1909 201 septembre: La valeur de la mdiane
1916 382 1920 211
1917 186 1912 252 correspond au total des prcipitations du
1918 150 1903 254
1919 630 1913 300
mois de septembre 1921 soit: 160 mm.
1920
1921
211
160
1916
1901
382
422
14 mois ont des valeurs infrieures 121,
1922 182 1900 583 et 14 autres des valeurs suprieures
1923 98 1919 630
1924 112 1907 760
3.2 Avantages et limites de la mdiane (proprits
de Yule)
Qualits
est dfinie de faon objective
a une signification concrte
est simple calculer
est peu sensibles aux Limites
fluctuations de l'chantillon
ne dpend pas des valeurs
observes mais de leur
ordre
ne se prte pas aux calculs
algbriques
3.3 Proprits de la mdiane

X A
I =1
i
Proprits de la mdiane

La mdiane est la valeur du


est minimum si caractre qui est la plus proche de
toutes les autres valeurs de la
distribution. C'est celle qui
minimise les distances en valeur
absolue au point Xmd
A= X md
4. La moyenne arithmtique

Elle est calcule pour les caractres quantitatifs

Calcule partir du tableau lmentaire, la moyenne


arithmtique des valeurs prises par X pour les diffrents
lments i de E est la somme des valeurs de Xi divise par
le nombre d'lments N
n
X = X i N
i =1
Ecritures

n
X = X i N
i =1

X =( X1 + X 2 + X 3 +....+ X i +...+ X n )/ N
La moyenne des taux douvriers dans la population
active des arrondissements parisiens
Part des
ouvriers dans
Arrondissements
la population
active (%)
Paris 5e 3,9 Nombre
Paris 6e 3,9 d'arrondissements
Paris 7e 4,8
Paris 4e 5,1 5
Paris 16e 5,4 4 15
Paris 15e 5,6 3 7 1 12 10
Paris 1er 5,7 2 5 4 14 3 13 18
Paris 14e 6,3 1 6 16 8 9 17 11 2 20 19
Paris 8e 6,4 4 5 6 7 8 9 10 11 12 13 14
Paris 9e 6,8 Part des ouvriers dans la population active totale (%)
Paris 12e 7,6
Paris 3e 7,9
Paris 17e 8,3 Xmed. =7,2%
Paris 13e 9,6
Paris 11e 10,2
Paris 2e 12,0
Paris 20e 12,9
Paris 10e 13,7 n
Paris 18e 13,7 X = X i N =8,2%
Paris 19e 14,3
i =1
moyenne 8,2
Pluviosit du
mois de
Anne
septembre (en
mm)
La moyenne des prcipitations
1896
1897
119
170
de septembre au Mont Aigoual
1898
1899
31
35
de 1896 1924
1900 583
1901 422
1902 27
1903 254
nombre de
1904 153
mois de
1905 133
septembre
1906 27
1907 760 11
1908 49 10
1909 201 9
1910 70 8
1911 90 7
1912 252 6
1913 300 5
1914 200 4
3
1915 158
2
1916 382
1
1917 186
0 100 200 300 400 500 600 700 800
1918 150
Total des prcipitations en mm
1919 630
1920 211
mdiane= 160
1921 160
moyenne=212
1922 182
1923 98
1924 112
4.1 Avantages et limites de la moyenne
(proprits de Yule)

Qualits
est dfinie de faon
objective
dpend de toutes les
observations
est simple calculer Limites
prte pas aux calculs na pas de signification
algbriques concrte
est sensible aux
fluctuations de
l'chantillon
4.2 Proprits de la moyenne

n
1. Si A = moyenne de X
X =n X
i =1
i

( X X )=0
n
2. La somme des carts la moyenne est gale zro. i
_ i =1

N
3. La moyenne minimise les distances au carr
( X i A )2

i =1

est minimum si ,et seulement si, A = moyenne du caractre X A= X


Exemple: le centre de gravit dun semis de lieux

Lieux x=longitude y=latitude


A 1 1
D 2 1
K 6 1
M 7 1
Centre de gravit d'un semis de lieux B 1 2
E 2 2
10 L 6 2
N
Y= latitude

9 7 2
8
T 9 2
7
6 U 9 3
5 G H 4 4
4 V 9 4
3
O 7 5
Y = 4, 8 2
1 C 1 6
0 F 3 7
0 1 2 3 4 5 6 7 8 9 10
I 4 7
X=longitude R 8 7
G 3 8
X =5,5 J 4 8
P 7 8
W 9 8
Q 7 9
S 8 9
X 9 9
Centre de gravit
moyenne 5,5 4,8
4.3 la moyenne pondre

On recourt la pondration lorsque les units n'ont pas


le mme poids. Si chaque lment i de lensemble E est
dcrit par sa mesure Xi et son poids Pi, la moyenne
pondre est :

n n
X p =(X i pi) p i
i =1 i =1
Ri=Revenu
moyen de La moyenne
Pi=Nombre
Arrond. l'arrond. par
habitant (en
d'habitants
Ri*P i
pondre: exemple du
francs, 1999)
en 1999
revenu moyen
Paris 1er 167 906 16 888 2 835 596 528
Paris 2e 109 396 19 585 2 142 520 660
Paris 3e 134 496 34 248 4 606 219 008 Moyenne= moyenne des revenus
Paris 4e 165 292 30 675 5 070 332 100 moyens par habitant des
Paris 5e 153 080 58 849 9 008 604 920 arrondissements :
Paris 6e 242 699 44 919 10 901 796 381
Paris 7e 298 195 56 985 16 992 642 075 149 077 frs
Paris 8e 252 285 39 314 9 918 332 490 Moyenne pondre= revenu
Paris 9e 128 315 55 838 7 164 852 970 moyen par habitant Paris
Paris 10e 90 993 89 612 8 154 064 716
Paris 11e 98 519 149 102 14 689 379 938 133 621 frs
Paris 12e 110 208 136 591 15 053 420 928 Les arrondissements les plus
Paris 13e 100 127 171 533 17 175 084 691 peupls sont aussi ceux qui en
Paris 14e 119 852 132 844 15 921 619 088
Paris 15e 136 470 225 362 30 755 152 140
moyenne concentrent les
Paris 16e 268 285 161 773 43 401 269 305 mnages dont les revenus sont
Paris 17e 147 961 160 860 23 801 006 460 les moins levs. Do une
Paris 18e 88 950 184 586 16 418 924 700 moyenne pondre plus faible
Paris 19e 84 504 172 730 14 596 375 920 que la moyenne par
15 369 980 472
Paris 20e 84 011 182 952
arrondissement
moyenne 149 077
somme 2 125 246 283 977 175 490

moyenne pondre 133 621


Distribution statistique
5. Valeurs centrales et dissym trique gauche

forme de la distribution 35
30

statistique 25
20
m ode=2;<<m diane=
2,2; <m oyenne=3
15
10
5
D I S T R I B U T I ON S T A T I S T I QU E S YM ET R I QU E
0
0 1 2 3 4 5 6 7 8 9 10
30 v a l e ur s d e X

25
m ode=m di
ane=m oyen
20
ne=5
15
Distribution dissym trisue droite
10
35
5 30
Moyenne=7; <m diane=7,2;
25
<m ode=8
0
0 1 2 3 4 5 6 7 8 9 10 20

15
V A LE U R S D E X
10

0
0 1 2 3 4 5 6 7 8 9 10

v a l e ur s de X

Você também pode gostar