Escolar Documentos
Profissional Documentos
Cultura Documentos
Statistiques descriptives
1. Introduction.
Pour rsoudre des problmes en gnie, des donnes doivent tre recueillies,
dcrites et analyses pour produire des informations sommaires. Le rle des
statistiques descriptives est de donner une ide sommaire sur les donnes
par le calcul dun nombre de statistiques et par des reprsentations
graphiques.
2. Concepts de base. Population, chantillon et variable.
Une tude statistique se base sur des donnes. Cependant, il est souvent
impossible davoir les donnes compltes surtout sil y a un grand nombre de
possibilits ou si lanalyse des donnes utilise un test destructif.
Par
Population.
chantillon
Variable
Exemple.
Variable : Rsistance
Type : Continue
Population : Toutes les mesures des rsistances produites.
chantillon : Mesures de 50 rsistances.
Exemple.
Variable : Nombre de paquets qui arrivent un serveur dans une priode
dune minute
Type : discrte
Population : Tout nombre possible de paquets qui arrivent dans une priode
dune minute
chantillon : Nombre de paquets qui arrivent dans une minute pendant 50
priodes dune minute.
chantillon alatoire
Statistique
Paramtre.
Moyenne dchantillon.
X
La moyenne est donne par
X
i 1
Xi
, o
est la
ime donne et n le
2 3.5 6 2 1.5
3
5
3.5
1.5 est
En gnral, le nombre de donnes est grand pour faire les calculs la main,
on utilise alors un logiciel comme Excel ou un logiciel spcialis en
statistiques.
Exemple.
Dans un procd de fabrication de cartes pour circuits imprims, on a mesur
lpaisseur en mils du placage en cuivre dun chantillon de 100 cartes et on
a obtenu :
3,468
3,428
3,516
3,509
3,461
3,492
3,478
3,482
3,49
3,467
3,519
3,498
3,504
3,469
3,497
3,466
3,458
3,478
3,5
3,443
3,449
3,525
3,461
3,5
3,561
3,506
3,479
3,444
3,524
3,531
3,501
3,539
3,481
3,497
3,513
3,461
3,528
3,496
3,533
3,496
3,512
3,55
3,541
3,441
3,569
3,531
3,468
3,513
3,505
3,523
3,47
3,475
3,457
3,536
3,528
3,458
3,469
3,461
3,502
3,431
3,491
3,506
3,439
3,443
3,517
3,481
3,535
3,515
3,46
3,575
3,488
3,495
3,51
3,483
3,467
3,467
3,502
3,471
3,516
3,556
3,482
3,512
3,45
3,516
3,476
3,515
3,495
3,518
3,523
3,564
3,522
3,52
3,474
3,489
3,514
3,47
3,477
3,536
3,491
3,484
X 3.495
Mdiane.
Exemples.
4
La mdiane de la srie ordonne 2
4 4
5 est 4.
4
4
6 est la moyenne
de 2 et 4 qui est 3.
La mdiane des donnes sur lpaisseur du placage des cartes se fait avec un
logiciel et on obtient 3.496.
La srie 1 1 2 2 3
Variance dchantillon.
2
44
50
50
98
98
56
56
Ces deux sries ont la mme moyenne qui est 50 et la mme mdiane qui
est 50. Cependant il y a une diffrence fondamentale savoir que la srie 1
set plus tendue que la srie 2. Pour mesurer cette dispersion des donnes
par rapport la moyenne, on utilise une statistique qui tient compte des
carts entre chaque donne et la moyenne. La variance est la statistique qui
mesure cette dispersion. On la calcule comme une moyenne des carres des
carts entre les donnes et la moyenne.
(X
i 1
X )2
n 1
carr. On utilise aussi la racine carre de la variance qui est une forme de
distance moyenne entre les donnes et la moyenne, cette statistique sera
appele cart type dchantillon S et a les mmes units que la variable
tudie. On a alors
n
(X
i 1
X )2
S 2
n 1
ou
(X
i 1
X )2
n 1
Exemples.
S2
Srie
1:
et
S 2304 48
S2
Srie
2:
(44 50) 2 (44 50) 2 (50 50) 2 (56 50) 2 (59 50) 2
36
4
et
S 36 6
.
La srie 1 a une plus grande variance que la srie 2.
Exemple.
La variance des donnes sur lpaisseur de placage est obtenue avec la
S 2 0.00103
Coefficient de variation.
et
S 0.0321
Pour comparer deux sries nayant pas la mme moyenne ou ayant des
units diffrentes, on utilise une statistique qui mesure la dispersion relative
qui est le coefficient de variation. On le dfinit par
CV
S
100%
X
Un rsum qui peut prendre la forme dun tableau ou dun graphique qui met
en vidence les donnes individuelles dans le cas dune variable discrte ou
sous forme de classes dans le cas dune variable continue en prcisant leurs
effectifs ou leurs frquences.
Exemple.
Les donnes suivantes reprsentent la rsistance la traction de tiges
dacier.
Rsistance la
traction
103779
103633
103779
103633
103799
97383
105087
102325
102906
102616
101162
107848
103488
101162
106395
105377
104796
106831
102470
99563
102906
98110
100872
104796
103197
102325
105232
105813
101017
104651
104360
106831
100872
104651
103924
108430
104651
102906
101453
105087
103197
105337
101744
106104
100726
106540
101744
101598
103799
100145
Exemple.
Les donnes suivantes reprsentent des dures de vie dun certain dispositif.
Dure de vie
12411
272005
108561
46684
233254
40479
93241
21491
89601
116729
16263
150011
59067
118077
33771
6171
60266
399071
82273
87592
95291
72435
28637
313879
46252
53533
173580
199458
27668
78954
162792
149432
102947
77084
137149
220413
45771
7400
50668
43911
182737
61894
10291
58526
49022
5. Graphiques.
Histogramme.
10
6. Diagramme en bote.
Une srie ordonne de donnes peut tre partage en quatre par trois
Q1
nombres appeles quartiles. Le plus petit est not
Q2
, le deuxime
qui est
Q3
la mdiane et le plus grand est
Q1
Q3
et
Q3 Q1
La quantit
Q1 1.5 IQR
infrieures
Q3 1.5 IQR
ou
suprieures
extrmes.
11
Exemples.
On reprend les exemples prcdents. Les diagrammes en bote ont t
obtenus avec Statgraphics
12
13
14
7. Densits.
Les histogrammes de la rsistance la traction et de la dure de vie
prsentent des formes diffrentes. Celui de la rsistance la traction
ressemble une cloche alors que celui de la dure de vie une forme avec
une forte asymtrie droite.
Si on construit un histogramme de telle sorte que laire de chaque rectangle
soit gale la frquence de chaque classe (se fait en prenant pour unit la
longueur de la classe et pour hauteur la frquence ou si on veut conserver les
units, on prend pour hauteur la frquence divise par la longueur de la
classe). Lhistogramme ainsi construit une aire gale 1 et laire de chaque
classe est la frquence de la classe. Cependant, avec lhistogramme on ne
peut calculer que des aires dintervalles dont les extrmits sont des
extrmits de classe.
15
16
17