Escolar Documentos
Profissional Documentos
Cultura Documentos
Mohamed DIOURI
Docteur en statistique
et informatique applique
Docteur Ingnieur
Prsident Fondateur de lIGA
STATISTIQUES DECISIONNELLES
Exercices corrigs avec rappels de cours
STATISTIQUES DECISIONNELLES
Exercices corrigs avec rappels de cours
A la mmoire de Myriam
Pour que la mmoire demeure
Lorsque une me
Pleure
Une autre me
Est-il plus grand malheur !
M. DIOURI
A ma fille Zineb
A. ELMARHOUM
SOMMAIRE
LIMINAIRE
11
11
11
15
19
22
35
37
37
38
39
39
40
41
43
55
55
56
58
71
71
72
73
74
89
91
91
93
94
98
115
115
117
117
118
129
129
129
130
131
137
143
143
145
150
156
161
183
183
184
186
188
199
199
201
203
206
208
223
223
225
226
230
TABLES STATISTIQUES
245
BIBLIOGRAPHIE
259
LIMINAIRE
Ce livre est sa 2me dition, il est le 3e dune trilogie des mmes auteurs, dont 2 livres ont dj
t dits, savoir : Statistique descriptive et Probabilits .
Dans le prsent ouvrage, les auteurs sintressent aux problmes de lchantillonnage
statistique, tant du point de vue des mthodes dchantillonnage que de celui des estimations et
de tests statistiques.
Lorsquon souhaite collecter des informations sur une population, deux possibilits soffrent :
- La premire solution consiste observer ou interroger tous les lments de la population,
cest ce quon appelle une enqute complte ou enqute exhaustive ou recensement ;
- La seconde solution consiste observer ou interroger une partie de la population, cest ce
quon appelle enqute partielle ou sondage. Les lments de la population qui sont rellement
observs constituent lchantillon et lopration qui consiste choisir ces lments est appele
chantillonnage.
Lalternative dcrite ci-dessus se prsente dans beaucoup de situations et le recours la
deuxime solution cest--dire lenqute partielle est la pratique la plus courante.
Par rapport lenqute complte, lenqute partielle offre une srie davantages :
- Le cot global de lenqute partielle est en gnral plus rduit que le cot global dune
enqute complte ;
- Lenqute par sondage est plus rapide que lenqute complte, surtout lorsque la
caractristique tudie prsente des modifications assez importantes au cours du temps ;
- Les erreurs dobservations sont plus rduites que dans lenqute exhaustive, du fait quil y
a moins de donnes manipuler ;
- Lenqute partielle est, dans certaines situations particulires, la seule solution possible,
cest le cas lorsque lobservation prsente un caractre destructif.
Ainsi, la problmatique des statistiques dcisionnelles sera tudie sous ses 3 aspects :
- Dabord, la dtermination de lchantillon (en taille et en qualit), en vue davoir les
informations sur la population mre tudier. Ceci fera lobjet de la partie 1 avec son unique
chapitre 1.
- Ensuite, la dtermination des lois de probabilit suivie par les paramtres de lchantillon
(moyenne, variance et proportion). Ceci fera lobjet de la partie 2 et de ses chapitres 2, 3 et 4.
- Enfin, une fois lchantillon et les lois de probabilit des paramtres dtermins,
ralisation des calculs sur les paramtres de la population mre tudie. Ceci fera lobjet de la
partie 3 avec ses chapitres 5, 6 et 7 et de la partie 4 avec ses chapitres 8, 9, 10 et 11.
Statistiques dcisionnelles
PARTIE 1
ECHANTILLONNAGE STATISTIQUE
Dans cette 1re partie, nous nous proposons de rsoudre tous les cas types de problmes
dchantillons extraits dune population mre en respectant un certain nombre de contraintes.
- Contraintes de prcision ;
- Contrainte de budget.
Nous aurons ainsi dterminer la taille et la nature de lchantillon qui donne les informations
souhaites sur la population mre tudier, avec la prcision, fixe, au pralable et tout en
veillant ne pas dpasser le budget allou ltude.
Statistiques dcisionnelles
10
Statistiques dcisionnelles
1. Dtermination de lchantillon
CHAPITRE 1
DETERMINATION DE LECHANTILLON
11
Statistiques dcisionnelles
1. Dtermination de lchantillon
P( X m < ) 1-
Ce qui donne :
2
2 .
avec :
n
: Taille de lchantillon ;
: Prcision souhaite ;
: Ecart- type dchantillon, il est souvent inconnu, il faut avoir des informations
antrieures ou mener une tude pilote.
1.2.1.2. Taille dchantillon pour estimer une proportion.
- La taille de lchantillon dpend de la prcision souhaite pour la gnralisation des
rsultats.
- La prcision (ou erreur dchantillonnage) sexprime en valeur absolue ou relative. Elle
reprsente la largeur de lintervalle de confiance de la proportion. Soit la moiti de cette
largeur.
12
Statistiques dcisionnelles
1. Dtermination de lchantillon
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas de
la proportion dans la population de plus de . Ceci scrit :
P( f n p < ) 1-
Ce qui donne : n
p.q
2 .
avec :
n
: Taille de lchantillon ;
: Prcision souhaite ;
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas de
la moyenne de la population de plus de . Ceci scrit :
P( X m < ) 1-
Ce qui donne : n Z 2
2
2
13
Statistiques dcisionnelles
1. Dtermination de lchantillon
1.2.2.1.2. Cas des prlvements dans une population finie sans remise.
Z
n
1-
N Z
1-
f n p < ) 1-
1.2.2.2.1. Cas des prlvements dans une population finie avec remise ou dans une population
infinie sans remise.
On trouve : n Z 2
p.q
2
avec :
n
: Taille de lchantillon ;
: Prcision souhaite ;
p
: Proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir des
informations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.
1.2.2.2.2. Cas des prlvements dans une population finie sans remise.
Z
On trouve : n
1-
pq N
N Z
1-
pq
14
Statistiques dcisionnelles
1. Dtermination de lchantillon
Statistiques dcisionnelles
1. Dtermination de lchantillon
La stratification peut entraner des gains de prcision apprciables, elle facilite en outre les
oprations de collecte des donnes et fournit des informations pour diffrentes parties de la
population.
Pour la rpartition de leffectif total, n, de lchantillon dans les diffrentes strates, la premire
solution, dite proportionnelle, consiste conserver la mme fraction dchantillonnage dans
chaque strate. Une seconde solution, dite optimale, tient compte du budget de lenqute.
1.3.1.2.1. Rpartition proportionnelle.
La rpartition proportionnelle consiste rpartir la taille de lchantillon n en utilisant la mme
fraction de sondage f dans chacune des strates. Cette solution tient compte dun seul facteur qui
est le poids de chaque strate.
Dsignons par wi le poids de la strate et par f la fraction de sondage constante.
n
N
wi
Ni
N
n i w i .n f .N i
1.3.1.2.2. Rpartition optimale.
Cette deuxime solution consiste rpartir leffort dchantillonnage de faon ingale dans les
diffrentes strates. Elle tient compte de quatre facteurs :
- Budget total de lenqute, G
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par lcart type i.
Le nombre dunits choisir dans chacune des strates est :
ni k
w i i
avec
ci
16
G
w i i
ci
Statistiques dcisionnelles
1. Dtermination de lchantillon
Lchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractriss
par un systme ramifi et hirarchis dunits.
Dans le cas de deux degrs, par exemple, on considre que la population est constitue dun
certain nombre dunits de sondage du premier degr (units primaires), chacune de ces units
tant constitue dun certain nombre dunits du second degr. (Units secondaires).
On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unit
slectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode de
slection pouvant varier dun degr lautre.
Lchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments de
toute la population et quil est possible dnumrer les units prleves au premier degr. Il
permet une concentration du travail sur le terrain et donc une rduction des cots.
Pour un mme nombre total dobservations, il faut indiquer que lchantillonnage alatoire et
simple est plus prcis que lchantillonnage par degr.
1.3.1.4. Echantillonnage systmatique.
Lchantillonnage systmatique est une technique qui consiste prlever des units
dchantillonnage situes intervalles gaux. Le choix du premier individu dtermine la
composition de tout lchantillon.
Si on connat leffectif total de la population N et quon souhaite prlever un chantillon
deffectif n, lintervalle entre deux units successives slectionner est donn par :
N
(arrondi lentier le plus proche)
n
Connaissant k, on choisit le plus souvent, pour dbuter, un nombre alatoire, i, compris entre 1
et k. Le rang des units slectionnes est alors i, i+k, i+2k, i+3k,
Lchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit le
temps consacr la localisation des units slectionnes.
Si les lments de la population se prsentent dans un ordre alatoire (pas de tendance)
lchantillonnage systmatique est quivalent lchantillonnage alatoire et simple. Par contre
si les lments de la population prsentent une tendance, lchantillonnage systmatique est
plus prcis que lchantillonnage alatoire.
17
Statistiques dcisionnelles
1. Dtermination de lchantillon
Statistiques dcisionnelles
1. Dtermination de lchantillon
Les critres servant de base la dfinition des quotas ne doivent pas tre nombreux. Au-del de
3 critres, la dmarche devient complexe. Les quotas doivent tre construits sur une base de
donnes fiables (statistiques disponibles) indiquant la rpartition de la population sur les
critres choisis. Les critres les plus utiliss dans les tudes de march sont conomiques et
sociodmographiques en particulier lge, le sexe, la catgorie socioprofessionnelle, etc.
1.4. ENONCES DES EXERCICES DAPPLICATION.
1.4.1. Une enqute sur l'emploi a pour but destimer le taux d'activit dans un pays. Dans les
statistiques disponibles, la population active du pays est estime 10 millions de personnes sur
une population totale de 40 millions de personnes.
Dterminer la taille de l'chantillon si l'on accepte une erreur de 1%, avec une probabilit de
0,95.
1.4.2. On dsire estimer le revenu mensuel moyen dans un secteur de production. Quelle doit
tre la taille de lchantillon de salaris interroger pour que la moyenne empirique ne
sloigne pas de la moyenne de la population de 100 DH avec une probabilit au moins gale
0,95 sachant que lcart type est de 500 DH par salari ?
1.4.3. On souhaite raliser une enqute sur la consommation des mnages afin destimer la
dpense moyenne par mnage. Quelle doit tre la taille de lchantillon de mnages si la
population est compose de 5 millions de mnages et que lerreur admise ne doit pas dpasser
10 DH avec une probabilit de 0,99 ?
Lcart type de la dpense des mnages est de 2000 DH.
1.4.4. On souhaite raliser une enqute sur lemploi afin destimer le taux de chmage. La
population active est de 5 millions de personnes. Quelle doit tre la taille de lchantillon pour
que la frquence empirique ne sloigne pas du vrai taux de chmage de plus de 2% et ce avec
une probabilit de 0,95 ?
Une enqute rcente avait donn un taux de chmage de 12 %.
1.4.5. Dans le cadre d'une tude socio-conomique, on s'intresse aux habitants de 18 units
urbaines, rparties en deux rgions.
a) En supposant que la variable alatoire laquelle nous nous intressons suive une loi
normale et que lenqute se droule, au sein dune population finie et nexclut pas la possibilit
de sonder la mme personne plusieurs fois, dterminer la taille n de lchantillon.
On donne comme hypothses de travail : une marge derreur admissible gale 1% avec une
probabilit de 95% et un cart type du revenu gal 0,114 calcul daprs un 1 er chantillon.
19
Statistiques dcisionnelles
1. Dtermination de lchantillon
Rgion 2
Nombres dhabitants
N Units urbaines
Nombres dhabitants
93600
45400
38900
36500
35100
32900
28100
26400
N 09
N 10
N 11
N 12
N 13
N 14
N 15
N 16
N 17
N 18
117100
107100
61200
51000
43800
38900
37800
33500
25800
25300
1.4.6. Dans une rgion regroupant environ 3 millions dhabitants runis en 1530 communes, on
dsire raliser une enqute relative la consommation moyenne des mnages pour le poste
alimentation.
a) Dterminer la taille de l'chantillon si l'on accepte une erreur de 1,16, avec une probabilit
de 0,95 et que lon estime lcart type gal 10.
b) En effectuant une stratification base sur la distribution de frquences donne dans le
tableau ci-dessous, combien dinterviews devrait-on raliser dans chacune des catgories de
communes ?
c) Si de plus pour des raisons de facilit, on dcidait de ne pas effectuer moins de 10 interviews
par commune, dans combien de communes diffrentes de chacune des catgories les
enquteurs devraient-ils se rendre ?
20
Statistiques dcisionnelles
1. Dtermination de lchantillon
Nombre dhabitants
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[10000 20000[
plus de 20000
Total
Nombre de communes
900
300
200
80
40
10
1530
1.4.7. Un sondage vise tudier la notorit dune marque. Pour cela on dispose de 12
enquteurs durant un mois.
a) Sachant que le rendement par jour et par enquteur est distribu selon une loi normale
de moyenne 5, et dcart type 1, dterminer la taille n o de l'chantillon retenu tel que : p(n
> no) = 0,025.
b) On propose de stratifier la population selon lge. Sachant que la population se rpartit
comme indiqu, dans le tableau ci-dessous, dterminer la rpartition de l'chantillon :
Age
Effectifs
Moins de 20
ans
5500000
Entre 20 et 30 Entre 30 et 60
ans
ans
2500000
1250000
Plus de 60
ans
250000
21
Statistiques dcisionnelles
1. Dtermination de lchantillon
1.4.10. Le budget allou une enqute est de 132500 DH. Cette enqute est destine estimer
le taux de chmage quon pense tre priori gal 10 %. Les frais de dplacement quotidien
sont valus 1000 DH par enquteur. La rmunration dun enquteur est de 170 DH par
jour. Les charges fixes sont de 20000 DH.
a) Dterminer la taille de lchantillon si on tolre une erreur de moins de 1 % avec un niveau
de confiance de 95%
b) Dterminer la taille maximale permise par le budget allou si le rendement par enquteur est
de 6 questionnaires par jour.
c) Quel niveau derreur faut-il accepter si on ralise lenqute avec le budget allou ?
1.4.11. Nous disposons dun montant de 10 000 dh pour enquter auprs dune population
stratifie en deux strates ayant les caractristiques suivantes :
Strates
Effectif
Poids de la
strate
Ecart type
Cot de
lobservation
Strate 1
Strate 2
2000
3000
0,4
0,6
2
0,7
25
36
avec
p.q
2 .
p = 0,25
q = 0,75
= 1% et = 5%
Statistiques dcisionnelles
1. Dtermination de lchantillon
2
2 .
= 500
avec
= 100
et
= 5%
2
2 .
avec
= 2 000
= 10
et
= 1%
Z
n
1-
N Z
1-
23
Statistiques dcisionnelles
= 2 000
avec
= 10
1. Dtermination de lchantillon
= 1%
N = 5 millions
et
Z = 2,58
1-
ce qui donne n = 252 795. Un tel chantillon reprsente environ 6,3 % de la taille de
lchantillon trouve grce lingalit de Bienaym Tchebycheff et donc une trs grande
conomie, dans son traitement, par rapport au 1er chantillon.
1.5.4. Solution de lexercice 1.4.4.
Nous sommes dans le cas o la loi de probabilit du taux de chmage nest pas connue. Nous
utilisons donc lingalit de Bienaym Tchebycheff.
p.q
2 .
avec
p = 0,12
q = 0,88
= 2%
et
= 5%
ce qui donne n = 5 280 un tel chantillon reprsente environ 1 pour mille de la population
totale de 5 millions. Dans ce cas il nest pas ncessaire de recourir au thorme central limite
pour essayer de rduire la taille de lchantillon.
1.5.5. Solution de lexercice 1.4.5.
a) Nous sommes dans le cas o la loi de probabilit de la variable alatoire est la loi normale, la
population est finie et le tirage se fait avec remise. On utilise donc lgalit :
n Z2
avec
2
2
= 0,05
= 0,114
= 0,01
et
1
2
= 1,96
24
Statistiques dcisionnelles
Rgions
Nombre
dunits total
%
Nombre
dunits de
lchantillon
1. Dtermination de lchantillon
Total
10
18
44,44%
55,56%
100%
10
25
Statistiques dcisionnelles
1. Dtermination de lchantillon
De mme, nous devons, dabord choisir les 6 units de la 2me rgion et ensuite choisir les 310
personnes dans ces 6 units. On choisira les 6 plus grandes units, nous dterminerons enfin le
nombre dhabitants interviewer, dans chaque unit, au prorata de limportance des 6 units
choisies.
Rgion N2 : Rpartition des 300 interviews sur 6 units et leurs
habitants
Nombre
Nombre
Arrondis
Units
dhabitants
%
dhabitants
10 prs
total
interviews
U09
117100
27,94%
87
90
U10
107100
25,55%
80
80
U11
61200
14,60%
45
40
U12
51000
12,17%
39
40
U13
43800
10,45%
32
30
U14
38900
9,29%
27
30
Total
419100
100%
310
310
Ainsi, on mobilisera 4 enquteurs pour la 1re rgion, 1 enquteur pour chaque unit, celui de
lunit 1 passera plus de temps, 9 jours (10 interviews par jour) ; de mme, on mobilisera 6
enquteurs pour la 2me rgion, 1 enquteur pour chaque unit, celui de lunit 09 passera plus
de temps, 9 jours (10 interviews par jour). Lopration durera donc 9 jours.
1.5.6. Solution de lexercice 1.4.6.
a) Nous sommes dans le cas o la loi de probabilit de la consommation moyenne nest pas
connue. Nous utilisons donc lingalit de Bienaym Tchebycheff.
n
avec
2
2 .
= 10
= 1,16
et
= 5%
26
Statistiques dcisionnelles
Nombre
dhabitants
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[10000 20000[
plus de 20000
Total
La fraction de sondage : f =
1. Dtermination de lchantillon
Centre de
classe
500
1500
3500
7500
15000
30000
Nombre de
communes
900
300
200
80
40
10
1530
Nombre
dhabitants
450000
450000
700000
600000
600000
300000
3100000
Nombre
dinterviews
218
218
339
290
290
145
1500
1500 = 0,00048387
3100000
c) Pour visiter le plus grand nombre de communes, on fixe le nombre dinterviews raliser
par commune 10 sauf pour la dernire catgorie de communes car elle ne contient que 10
communes qui seront toutes visites, on ralisera alors 14 interviews par commune. Pour
dterminer le nombre de communes visiter dans chacune des catgories de communes, il
suffit de diviser le nombre dinterviews par 10.
Catgories de
communes
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[ 10000 20000[
plus de 20000
Total
Nombre de
Nombre
Nombre
communes
dinterviews
dinterviews
visiter
218
22
220
218
22
220
339
34
340
290
29
290
290
29
290
145
10
140
1500
1500
n 0 1800 = Z = 1,96
0,975
19
ce qui donne : no = 1838
27
Statistiques dcisionnelles
1. Dtermination de lchantillon
b) Reprenons les donnes et calculons le poids de chaque tranche dge en effectuant une
rpartition proportionnelle des 1838 interviews.
Age
Effectifs
Poids en %
Taille
chantillon
Moins de
20 ans
5500000
57,9
1064
Entre 20
et 30 ans
2500000
26,3
484
Entre 30
et 60 ans
1250000
13,2
242
Plus de 60
Total
ans
250000 9500000
2,6
100
48
1838
n
avec
p.q
2 .
p = 0,01
q = 0,99
= 0,1% et = 5%
Z
n
1-
p.q N
N Z
1-
avec
p = 0,01
p.q
q = 0,99
= 0,1%
N = 500000
= 1%
et
Z = 1,96
1-
Statistiques dcisionnelles
1. Dtermination de lchantillon
b2) Si on choisit d'abord k sacs et on tire ensuite ni fusibles par sac, il sagit
dchantillonnage deux degrs.
b3) Si on mlange le contenu des 50 sacs, et on tire n fusibles, il sagit dchantillonnage
alatoire simple.
c) Le procd de tirage, le mieux adapt est lchantillonnage stratifi. Si le contenu des 50
sacs est homogne, on peut procder par chantillonnage deux degrs.
1.5.9. Solution de lexercice 1.4.9.
a) La rpartition optimale tient compte de quatre facteurs :
- Budget total de lenqute, G = 44 320 dh
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par lcart type i.
Le nombre dunits choisir dans chacune des strates est :
ni k
w i i
avec
ci
G
w i i
ci
R1
360
12%
225
0,2
R2
840
28%
196
0,1
R3
600
20%
400
0,2
k=
G
w i i
ci
44320
0,12.0,2. 225 0,28.0,1. 196 0,2.0,2. 400 0,4.0,4. 324
k = 10000
29
R4
1200
40%
324
0,4
Total
3000
100%
Statistiques dcisionnelles
1. Dtermination de lchantillon
ce qui donne :
n 1 10000
0,12.0,2
n 3 10000
0,2.0,2
= 16
225
= 20
400
n 2 10000
0,28.0,1
n 4 10000
0,4.0,4
= 20
196
= 89
324
R1
360
16
R2
840
20
R3
600
20
R4
1200
89
Total
3000
145
b) Nous sommes dans le cas o la loi de probabilit nest pas connue. Nous utilisons donc
lingalit de Bienaym Tchebycheff.
avec
p.q
.
p = 0,3
ce qui donne
soit
q = 0,7
n = 145
p.q
n.
= 1%
et
=?
n
avec
p.q
2 .
p = 0,1
q = 0,9
= 5%
et
= 1%
30
Statistiques dcisionnelles
1. Dtermination de lchantillon
n
6
p.q
soit
.
2
avec
p = 0,1
q = 0,9
p.q
n.
= 5%
et n = 576
ni k
w i i
ci
avec
G
w i i
ci
31
Statistiques dcisionnelles
1. Dtermination de lchantillon
Strates
Effectif
Poids de la strate
Ecart-type
Cot de lobservation
Strate 1
Strate 2
2000
3000
0,4
0,6
2
0,7
25
36
G
w i i
10000
0,4.2. 25 0,6.0,7. 36
ci
= 1533,74
ce qui donne :
n 1 1533,74
0,4.2
= 245
25
ce qui donne
n 2 1533,74
0,6.0,7
= 107
36
n = n1 + n2 = 352
37,55 37,5
37,45 37,5
) - (
) = 0,998
0,05
0,05
) - (
) = 0,998
2.(
0,05
) - 1 = 0,998
0,05
= Z0,999 = 3,09
0,05
) = 0,999
=>
= 0,016
32
Statistiques dcisionnelles
1. Dtermination de lchantillon
b) La moyenne des longueurs des pices prleves appartient lintervalle ferm [37,495 ;
37,505] et signifie que :
= (37,505 37,495) / 2 = 0,005
Nous sommes dans le cas o la loi de probabilit est la loi normale, on utilise donc lgalit :
n Z2
avec
2
2
= 0,05
ce qui donne
= 0,016
= 0,005
et Z
n = 40
33
= 1,96
Statistiques dcisionnelles
1. Dtermination de lchantillon
34
Statistiques dcisionnelles
PARTIE 2
LOI DE PROBABILITE DECHANTILLON
35
Statistiques dcisionnelles
36
Statistiques dcisionnelles
CHAPITRE 2
LOI DE PROBABILITE DE LA MOYENNE DECHANTILLON
avec
x
i 1
n
n
x'
avec
x'
i 1
Les moyennes
x ''
i
x''
i 1
On peut considrer la suite des premires observations x1, x1, x1, des diffrents
chantillons comme des valeurs observes dune mme variable alatoire X1, la suite des
deuximes observations des diffrents chantillons comme des valeurs observes dune mme
variable alatoire X2, etc.
x , x ' , x ' ' , sont alors des valeurs observes dune mme variable
alatoire
X
i 1
n
37
Statistiques dcisionnelles
Comme X1, X2, , Xn, la variable alatoire X possde une distribution de probabilit, dite
distribution dchantillonnage de la moyenne. On peut donc calculer lesprance et la variance
de cette distribution, en supposant que lchantillon est alatoire et simple, les variables
alatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la moyenne est
dsigne par m et la variance par .
E(Xi) = m
et
V(Xi) =
Xi
E( X ) = E(
i 1
)=
1 E(Xi) = 1 nm = m
n
n
i 1
V( X ) =
Lerreur standard est alors :
N n 2
N 1 n
X N n
n N 1
Dans ce cas, la loi de probabilit de la moyenne est normale de moyenne m et dcart type
Nn
.
N 1
Xi
E( X ) = E(
i 1
)=
n
1
E(Xi) = 1 nm = m
n
n i 1
Xi
V( X ) = V(
i 1
)=
n
1
V(Xi) = 1 n =
n
n
n i 1
n
38
Statistiques dcisionnelles
Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type
.
X
n
E( X ) = m
et
V( X ) =
n
n v(x) =
n 1
Avec :
(x i x)
i 1
n 1
Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type
^
X .
n
E( X ) = m
avec :
n v(x) =
n 1
et
(x i x)
i 1
n 1
^
39
V( X ) =
n
Statistiques dcisionnelles
La diffrence entre les moyennes observes des deux chantillons indpendants est :
x1 - x 2
Une distinction est faite entre le cas de deux populations de variances ingales et le cas de deux
populations de variances gales.
2.5.1. Cas de deux populations de variances ingales
E( x1 -
x 2 ) = m1-m2
V( x1 -
x 2 ) = 1 2
n1 n 2
x1 , x2 sont des variables
1 et
n1
2 . La diffrence entre les moyennes observes des deux chantillons indpendants est ellen2
mme normale de moyenne (m1-m2) et dcart type
1 2 .
n1 n 2
Si les distributions des populations mres sont inconnues, pour des effectifs suffisamment
levs, la diffrence entre les moyennes peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre comme
une variable de Student (n1 + n2 - 2) degrs de libert.
2.5.2. Cas de deux populations de variances gales
Dans le cas o les populations sont de variances gales, une estimation de la variance
commune aux deux populations est donne par :
40
Statistiques dcisionnelles
(x
x 1 )
x 2 )
E( x1
n1 n 2 2
(x
x 2 ) = m1 - m2
^
^
V( x1 - x 2 ) = = ( 1 1 )
n1 n 2
n1 n 2
Pour des populations normales, la diffrence entre les moyennes observes des deux
chantillons indpendants est elle-mme normale de moyenne (m1-m2) et dcart type
^
( 1 1 ) .
n1 n 2
Si les distributions des populations mres sont inconnues, pour des effectifs suffisamment
levs, la diffrence entre les moyennes peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre comme
une variable de Student (n1 + n2 - 2) degrs de libert.
2.6. ENONCES DES EXERCICES DAPPLICATION.
2.6.1. Quelle est l'esprance mathmatique et quelle est la variance des rsultats qu'on peut
obtenir quand on choisit au hasard et indpendamment dix nombres entiers de 1 9 et qu'on en
calcule la moyenne, en supposant que chacun des nombres de 1 9 a une mme probabilit
d'tre choisi et qu'un mme nombre peut tre choisi plusieurs fois sans aucune restriction ?
2.6.2. Une population est constitue des cinq nombres 2, 3, 6, 8, 11. On considre tous les
chantillons non exhaustifs possibles de taille deux de cette population. Trouver :
a) La moyenne de la population.
b) Lcart type de la population.
c) La moyenne de la distribution d'chantillonnage des moyennes.
d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreur
quadratique moyenne des moyennes.
e) Reprendre les mmes questions dans le cas dun chantillon exhaustif.
2.6.3. On suppose que les poids de 3000 ttes dovins d'une ferme suivent une loi normale de
moyenne 38,0 kilogrammes et dcart type 5,0 kilogrammes. Si l'on extrait 80 chantillons de
25 ttes chacun, quelle est la moyenne et lcart type thoriques de la distribution
d'chantillonnage des moyennes pour :
a) Un chantillonnage non exhaustif ?
b) Un chantillonnage exhaustif ?
41
Statistiques dcisionnelles
c) Pour combien d'chantillons peut-on s'attendre trouver une moyenne comprise entre 36,8
et 38,3 kilogrammes ?
2.6.4. Cinq cents rondelles ont un poids moyen de 5,02 grammes et un cart type de 0,30
gramme. Trouver la probabilit pour quun chantillon de 100 rondelles choisies au hasard ait
un poids total :
a) Compris entre 496 et 500 grammes.
b) Plus grand que 510 grammes.
2.6.5. Les batteries d'un fabricant A ont une dure de vie moyenne de 1400 heures avec un
cart-type de 200 heures, et celles d'un fabricant B ont une dure de vie moyenne de 1200
heures avec un cart-type de 100 heures. Si l'on teste des chantillons de 125 batteries pour
chaque marque, quelle est la probabilit pour que la marque A ait une dure de vie moyenne
qui soit au moins suprieure celle de la marque B de :
a) 160 heures ?
b) 250 heures ?
2.6.6. Les piles d'une marque donne psent 0,50 gramme avec un cart-type de 0,02 gramme.
Quelle est la probabilit pour que deux lots de 1000 piles chacun diffrent entre eux de plus de
2 grammes ?
2.6.7. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et un
cart type de 150 heures. Trois ampoules sont branches de telle manire que, si lune delles
est grille, les autres continuent fonctionner. En supposant que les dures de vie suivent une
loi de Laplace Gauss, quelle est la probabilit pour que lclairage fonctionne, en moyenne :
a) Au moins pendant 5000 heures ?
b) Au plus pendant 4200 heures ?
2.6.8. Les poids de 1500 pices suivent une loi de probabilit normale de moyenne 22,40 kg et
dcart type 0,048 kg Dterminer pour 300 chantillons alatoires de taille 36 de cette
population la moyenne et l'cart type thorique de la distribution d'chantillonnage des
moyennes :
a) L'chantillonnage tant non exhaustif.
b) Lchantillonnage tant exhaustif.
c) Combien d'chantillons alatoires ont leur moyenne comprise entre 22,39 et 22,41 kg ?
2.6.9. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un cart
type de 50 kg, Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur un
monte-charge dpassent la limite de scurit du monte-charge, qui est 8200 kilogrammes.
42
Statistiques dcisionnelles
2.6.10. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives
4000 et 4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100
cbles de la marque A et 50 cbles de la marque B, quelle est la probabilit pour que la
rsistance de rupture moyenne de B ait :
a) Au moins 600 kilogrammes de plus que A ?
b) Au moins 450 kilogrammes de plus que A ?
2.6.11. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec un
cart type de 200 heures.
a) Trouver la probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne
de vie suprieure 1825.
b) Trouver la probabilit qu'un chantillon alatoire de 100 Units de ce bien ait une moyenne
de vie de pas plus de 1775 et pas moins de 1760.
2.7. SOLUTIONS DES EXERCICES DAPPLICATION.
2.7.1. Solution de lexercice 2.6.1.
Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon est
non exhaustif.
E( X ) = m =
1 23 45 6 7 89 = 5
9
x i x 2 = 1 2 3 4 5 6 7 8 9
2
V( X ) =
= 6,67 = 0,667
n
10
X = 0,667 = 0,82
n
- 5 = 6,67
23 6811 = 6
5
43
Statistiques dcisionnelles
x i x 2 = 2 3 6 8 11
2
- 6 = 10,80
E( X ) = m = 6
d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreur standard.
Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon est
non exhaustif.
V( X ) =
= 10,80 = 5,40
n
2
X = 5,40 = 2,32
n
E( X ) = m = 6
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
N n = 5 2 10,80 = 4,05
N 1 n
51 2
4,05 = 2,01
Statistiques dcisionnelles
E( X ) = m = 38 kg
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) = =
5 = 1
25
1 = 1 kg.
E( X ) = m = 38 kg
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
Nn
N 1
= 3000 25 5 = 0,992
n
3000 1 25
c) Nombre d'chantillons dont la moyenne est comprise entre 36,8 et 38,3 kilogrammes.
Calculons la probabilit que la moyenne soit comprise entre 36,8 et 38,3 kg. La moyenne suit
une loi normale de moyenne 38 et dcart type 1 kg.
38,338
36,838
) - (
)
1
1
p(36,8 <
x < 38,3) = (
p(36,8 <
p(36,8 <
45
Statistiques dcisionnelles
Nombre d'chantillons dont la moyenne est comprise entre 36,8 et 38,3 kilogrammes =
0,5028x80 = 40,22.
On peut sattendre avoir 40 41 chantillons dont la moyenne est comprise entre 36,8 et 38,3
kilogrammes.
2.7.4. Solution de lexercice 2.6.4.
Dterminons la loi de probabilit de la moyenne.
Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.
E( X ) = m = 5,02 g
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
Nn
N 1
0,0007 = 0,027 g.
a) Un poids total compris entre 496 et 500 g est quivalent une moyenne comprise entre 4,96
et 5 g.
5 5,02
4,96 5,02
) - (
)
0,027
0,027
p(4,96 <
x < 5) = (
p(4,96 <
p(4,96 <
b) Un poids total plus grand que 510 g est quivalent une moyenne plus grande que 5,10 g.
p( x > 5,10) = 1 - (
5,10 5,02
)
0,027
Statistiques dcisionnelles
n1
n2
E( x1
V( x1 -
x2 ) =
1 2
200 100
=
= 400
125 125
n1
n2
400 = 20 h
La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
suit une loi normale de moyenne 200 heures et dcart type 20 heures.
a) Probabilit pour que la marque A ait une dure de vie moyenne qui soit au moins suprieure
celle de la marque B de 160 heures.
p( x1
p( x1 -
b) Probabilit pour que la marque A ait une dure de vie moyenne qui soit au moins suprieure
celle de la marque B de 250 heures.
p( x1
p( x1 -
47
Statistiques dcisionnelles
n1
n2
E( x1 -
x 2 ) = m1 - m2 = 0,5 0,5 = 0 g
V( x1 -
x2 ) =
1 2
0,02 0,02
=
= 0,0000008
1000 1000
n1
n2
p( x1 -
p(-0,002 < x1
p(-0,002 < x1
p(-0,002 < x1 -
x 2 < 0,002) = (
0,002
0,002
) - ()
0,00089
0,00089
48
Statistiques dcisionnelles
67500 = 259,81 h.
Lclairage Y suit une loi normale de moyenne 4500 heures et dcart type 259,81 heures.
a) Probabilit que lclairage fonctionne, en moyenne, au moins pendant 5000 heures.
p(Y >5000) = 1 - ( 5000 4500 )
259,81
259,81
E( X ) = m = 22,40 kg
49
Statistiques dcisionnelles
V( X ) = =
0,048
= 0,0001
36
E( X ) = m = 22,40 kg
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
c) Nombre d'chantillons dont la moyenne est comprise entre 22,39 et 22,41 kilogrammes.
Calculons la probabilit pour que la moyenne soit comprise entre 22,39 et 22,41 kg. La
moyenne suit une loi normale de moyenne 22,40 et dcart type 0,008 kg.
22,41 22,40
22,39 22,40
) - (
)
0,008
0,008
p(22,39 <
x < 22,41) = (
p(22,39 <
p(22,39 <
Ce qui veut dire que 78,88 % des 300 chantillons qui ont leur moyenne comprise entre 22,39
kg et 22,41 kg soit : 0,7888 x 300 = 236,64.
On peut sattendre avoir 236 ou 237 chantillons dont la moyenne est comprise entre 22,39 et
22,41
kilogrammes.
50
Statistiques dcisionnelles
E( X ) = m = 300 kg
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
= 50 = 100
n
25
100 = 10 kg.
10
E( x 2
V( x 2 -
51
1 2 .
n1 n 2
Statistiques dcisionnelles
1700 = 41,23 kg
La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
suit une loi normale de moyenne 500 kg et dcart type 41,23 kg.
a) Probabilit pour que la marque B ait une charge de rupture dau moins 600 kg de plus que la
marque A.
p( x 2
p( x 2 -
b) Probabilit pour que la marque B ait une charge de rupture dau moins 450 kg de plus que la
marque A.
p( x 2
p( x 2 -
E( X ) = m = 1800 h
- Ecart type de la distribution d'chantillonnage des moyennes.
V( X ) =
= 200 = 400
n
100
400 = 20 h.
52
Statistiques dcisionnelles
a) Probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne de vie
suprieure 1825.
20
p(1760 <
p(1760 <
p(1760 <
53
Statistiques dcisionnelles
54
Statistiques dcisionnelles
CHAPITRE 3
LOI DE PROBABILITE DE LA VARIANCE DECHANTILLON
(x i x)
v(x) i 1
(x i' x')
v(x') i 1
(x " x")
i
v(x") i 1
Ces variances peuvent tre considres comme des valeurs observes dune mme variable
alatoire :
(Xi X)
V(X) i 1
Comme X1, X2, , Xn, la variable alatoire V(X) possde une distribution de probabilit, dite
distribution dchantillonnage de la variance. On peut donc calculer lesprance mathmatique
et la variance de cette distribution, en supposant que lchantillon est alatoire et simple, les
variables alatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la
moyenne est dsigne par m et la variance par .
E(Xi) = m
et
V(Xi) =
E(V(X)) =
n 1
n
55
Statistiques dcisionnelles
2(n 1) 4
.
n
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire est simple deffectif n, lesprance mathmatique de la variance est :
E(V(X)) =
N
n 1
N 1
n
(Xi X)
i 1
56
Statistiques dcisionnelles
3.2.4. On suppose que les poids de 3000 ttes dovins d'une ferme suivent une loi normale de
moyenne 38,0 kilogrammes et dcart type 5,0 kilogrammes. Si l'on extrait 80 chantillons de
25 ttes chacun :
a) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances ?
b) Pour combien d'chantillons peut-on s'attendre trouver un cart type compris entre 4 et 7
kilogrammes ?
3.2.5. Cinq cents rondelles ont un poids moyen de 5,02 grammes et un cart type de 0,30
gramme. Trouver la probabilit pour quun chantillon de 100 rondelles choisies au hasard ait
un cart type :
a) Compris entre 0,25 et 0,35 grammes.
b) Plus grand que 0,3 grammes.
3.2.6. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et un
cart type de 150 heures. Trois ampoules sont branches de telle manire que, si lune delles
est grille, les autres continuent fonctionner. En supposant que les dures de vie suivent une
loi de Laplace Gauss, quelle est la probabilit pour que lcart type de lclairage ne dpasse
pas :
a) 260 heures ?
b) 200 heures ?
3.2.7. Les poids de 1500 pices suivent une loi de Laplace-Gauss de moyenne 22,40 kg et cart
type 0,048 kg.
a) Dterminer pour 300 chantillons alatoires de taille 36 de cette population, la moyenne et
l'cart type thoriques de la distribution d'chantillonnage des variances.
b) Combien d'chantillons alatoires ont-ils leur cart type compris entre 45 grammes et 50
grammes ?
3.2.8. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un cart
type de 50 kg
a) Dterminer pour 25 colis reus au hasard et chargs sur un monte-charge, la moyenne et
l'cart type thoriques de la distribution d'chantillonnage des variances.
b) Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur un monte-charge
aient un cart type qui dpasse 40 kg ?
3.2.9. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives 4000
et 4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100 paires
de cbles des deux marques, quelle est la probabilit pour que la diffrence de rsistance de
rupture entre les deux marques ait un cart type de :
a) Moins 350 kilogrammes ?
b) Moins 300 kilogrammes ?
57
Statistiques dcisionnelles
3.2.10. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec un
cart type de 200 heures.
a) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances pour des chantillons de taille 20 ?
b) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances pour des chantillons de taille 50 ?
c) Trouver la probabilit qu'un chantillon alatoire de 20 units de ce bien ait un cart type de
vie suprieur 220.
d) Trouver la probabilit qu'un chantillon alatoire de 50 units de ce bien ait un cart type de
vie suprieur 220.
3.3. SOLUTIONS DES EXERCICES DAPPLICATION.
3.3.1. Solution de lexercice 3.2.1.
Il sagit dune population normale de moyenne gale 15 et dcart type gal 4.
m = 15
=4
et
n = 10
E (V(X)) =
n 1
10 1
=
4 = 14,4
n
10
V(V(X)) =
2(n 1) 4 2(101) 4
=
4 = 46,08
n
10
46,08 = 6,8
58
Statistiques dcisionnelles
1 23 45 6 7 89 = 5
9
x i x 2 = 1 2 3 4 5 6 7 8 9
2
m=5
= 6,67
et
n = 10
E(V(X)) =
n 1
10 1
=
6,67 = 6,003
10
n
V(V(X)) =
2(n 1) 4 2(101)
=
.6.67 = 8,01
n
10
8,01 = 2,8
59
- 5 = 6,67
Statistiques dcisionnelles
23 6811 = 6
5
x i x 2 = 2 3 6 8 11
2
- 6 = 10,80
E(V(X)) =
= 10,8
et
n=2
n 1
2 1
=
10,8 = 5,4
n
2
2(n 1) 4 2(21)
=
.10,8 = 58,32
n
2
58,32 = 7,64
E(V(X)) =
= 10,8
et
n=2
5 2 1
N
n 1
=
10,8 = 6,75
N 1
n
5 1 2
Statistiques dcisionnelles
E(V(X)) =
= 25 et
n = 25
n 1
25 1
=
25 = 24
25
n
2(n 1) 4 2(251)
=
.25 = 48
n
25
48 = 6,9
b) Pour combien d'chantillons peut-on s'attendre trouver un cart type compris entre 4 et 8
kilogrammes ?
Dans le cas dune population normale, la variable alatoire
n.V(X)
possde une distribution
25.V(X) 25.49
<
)
5
5
61
Statistiques dcisionnelles
0,1 < p( < 16) < 0,2 aprs interpolation linaire on trouve :
p( < 16) = 0,1125
p(4 < V(X) < 7) = 0,997 0,1125 = 0,8845
Nombre d'chantillons dont lcart type est compris entre 4 et 7 kilogrammes = 0,8845x80 =
70,76.
On peut sattendre avoir 70 ou 71 chantillons dont lcart type est compris entre 4 et 7
kilogrammes.
3.3.5. Solution de lexercice 3.2.5.
Dans le cas dune population normale, la variable alatoire
n.V(X)
possde une distribution
2.99 =14.
136,1199
(
) = (2,65) = 0,9960
14
69,4499
) = (2,11) = 0,0174
p( < 69,44) = (
14
p( < 136,11) =
62
Statistiques dcisionnelles
100.V(X) 100.0,3
<
)
0 ,3
0 ,3
2.99 =14.
67500 = 260 h.
Lclairage Y suit une loi normale de moyenne 4500 heures et dcart type 260 heures.
a) Probabilit que lcart type de lclairage ne dpasse pas 260 heures.
p(V(Y) < 260) = p(
3.V(X) 3.260
<
)
260
260
63
Statistiques dcisionnelles
3.V(X) 3.200
<
)
260
260
= 0,048 kg
et
n = 36
n 1
36 1
=
0,048 = 0,022
36
n
V(V(X)) =
2.(n 1)
2.(36 1)
0,048
= 0,0005
36
b) Nombre d'chantillons qui ont leur cart type compris entre 45 grammes et 50 grammes.
Dans le cas dune population normale, la variable alatoire
n.V(X)
possde une distribution
64
Statistiques dcisionnelles
Le nombre de degr de libert est grand, de ce fait, et par application du thorme central
limite, on peut affirmer que la loi Khi deux tend vers une loi normale de paramtres k et
2k . Toutefois, la convergence vers la loi normale est relativement lente, l'approximation est
gnralement satisfaisante lorsque k est suprieur 100. Pour un nombre de degr de libert
compris entre 30 et 100, on prfre faire usage de la racine carre. On peut en effet utiliser la
transformation :
Z=
2 2k 1
m = 300 kg
et
n = 25
E(V(X)) =
n 1
25 1
=
50 = 2400
n
25
V(V(X)) =
2.(n 1)
50
= 2.(25 1)
= 693
n
25
65
Statistiques dcisionnelles
b) Probabilit pour que 25 colis reus au hasard et chargs sur un monte-charge aient un cart
type qui dpasse 40 kg.
Dans le cas dune population normale, la variable alatoire
n.V(X)
possde une distribution
25.V(X) 25.40
<
)
50
50
1 2 .
130000 = 361 kg
La diffrence de rsistance de rupture entre les deux marques suit une loi normale de moyenne
500 kg et dcart type 361 kg.
66
Statistiques dcisionnelles
a) Probabilit pour que la diffrence de rsistance de rupture entre les deux marques ait un
cart type de moins de 350 kg
p(V(X2 X1) < 350) = p(
100.V(X 2 X 1 ) 100.350
<
)
361
361
2.99 =14.
2.99 =14.
69,06 99
) = (2,14) = 0,0162
14
67
Statistiques dcisionnelles
a) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances pour des
chantillons de taille 20.
Dsignons par X la dure de vie de moyenne 1800 heures avec un cart type de 200 heures.
= 200 h
m = 1800 h
et
n = 20
E(V(X)) =
n 1
= 20 1 x 200 2 = 38000
n
20
m = 1800 h
et
n = 50
E(V(X)) =
n 1
50 1
=
200 = 40000
50
n
20.V(X) 20.220
<
)
200
200
68
Statistiques dcisionnelles
50.V(X) 50.220
<
)
200
200
2k . Toutefois, la convergence vers la loi normale est relativement lente, l'approximation est
gnralement satisfaisante lorsque k est suprieur 100. Pour un nombre de degr de libert
compris entre 30 et 100, on prfre faire usage de la racine carre. On peut en effet utiliser la
transformation :
Z=
2 2k 1
Z=
69
Statistiques dcisionnelles
n = 40
E(V(X)) =
n 1
= 401 . 0,102 = 0,00975
n
40
2
0,12
V (V(X)) 2 (n 1) x
2 x 39 x
0,0022
n
40
b) Pour des chantillons de taille 60 on a :
- Moyenne de la distribution dchantillonnage des variances
E(V(X)) =
n 1
= 60 1 x 0,102 0,00983
n
60
V (V(X)) 2 (n 1) x
2
0,12
2 x 59 x
0,0018
n
60
0,00983 0,00975
0,82 %
0,00975
- Une lasticit des cart-types de distribution dchantillonnage des variances gale :
0,0018 0,0022
18,18 %
0,0022
70
Statistiques dcisionnelles
CHAPITRE 4
LOI DE PROBABILITE DE LA PROPORTION DECHANTILLON
fn Xn
n
f n' X n'
n
fn" Xn"
n
Ces frquences peuvent tre considres comme des valeurs observes dune mme variable
alatoire :
fn Xn
n
La variable alatoire Fn possde une distribution de probabilit, dite distribution
dchantillonnage de la proportion. On peut donc calculer lesprance et la variance de cette
distribution, en supposant que lchantillon est alatoire et simple.
71
Statistiques dcisionnelles
V(Fn) = V(
Fn
1 E( X n ) = 1 n p = p
n
n
Xn
pq
1
1
n ) = n V( X n ) = n n p q = n
pq
n
pq
condition que la
n
taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p 5.
4.2.2. Echantillon exhaustif.
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire et simple deffectif n, lesprance mathmatique et la variance de la
frquence sont :
E(Fn) = E( X n ) =
V(Fn) = V( X n ) =
1 E( X n ) = 1 n p = p
n
n
1 V( X n ) = 1 N n n p q = N n pq
n
n N 1
N 1 n
pq
Nn
N 1
n
pq
Nn
N 1
n
Statistiques dcisionnelles
Statistiques dcisionnelles
c) Quelle est la taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ou
gale 4 % avec une probabilit de 98 % ? Interprter ces rsultats.
4.3.8. Une tude sur la notorit dune marque a port sur un chantillon alatoire de 400
personnes.
a) Quelle est la probabilit davoir un taux de notorit qui dpasse 55 % ?
b) Calculer cette probabilit si on pense que la notorit est de 60 %.
4.3.9. Un fournisseur affirme que le risque de vendre une pice dfectueuse est de 5 %. Pour
vrifier laffirmation du fournisseur, un contrle a port sur un chantillon alatoire de 300
pices. Laffirmation du fournisseur est-elle plausible ?
4.3.10. 80 % des clients sont satisfaits, cest ce que pense le directeur dune socit de service.
a) Quelle est la probabilit que sur un chantillon alatoire de 200 clients, moins de 70 %
soient satisfaits ?
b) Un deuxime chantillon alatoire de 300 clients est choisi indpendamment du premier
chantillon. Quelle est la probabilit davoir plus de 2 % de diffrence entre les taux de
satisfaction obtenus auprs des deux chantillons ?
4.4. SOLUTIONS DES EXERCICES DAPPLICATION.
4.4.1. Solution de lexercice 4.3.1.
Soit F la variable alatoire qui dsigne la frquence des lecteurs qui voteront pour ce
candidat.
La distribution dchantillonnage de F suit une loi normale de moyenne p et dcart type
pq
n
pq
n
pq
n
E(F) = 0,46
V(F) =
0,46.0,54
= 0,0012
200
Fn 0,0012 = 0,035
74
Statistiques dcisionnelles
0,50,46
)
0,035
0,46.0,54
= 0,0002484
1000
Fn 0,0002484 = 0,016
0,50,46
)
0,016
pq 0,5.0,5
=
= 0,0013 F
n
200
0,0013 = 0,0354
Statistiques dcisionnelles
a) Probabilit pour que parmi les 200 prochains enfants natre il y ait moins de 40 % de
garons.
p(F < 0,4) = p(Z <
0,40,5
) = (-2,82) = 1 0,9976 = 0,0024
0,0354
b) Probabilit pour que parmi les 200 prochains enfants natre il y ait entre 43 % et 57 % de
filles.
p(0,43 < F < 0,57) = p(Z <
0,57 0,5
0,430,5
) - p(Z <
)
0,0354
0,0354
0,540,5
)
0,0354
pq 0,5.0,5
=
= 0,0013
n
200
F 0,0013 = 0,0354
Statistiques dcisionnelles
0,40,5
)
0,0354
0,600,5
0,400,5
) - p(Z <
)
0,0354
0,0354
0,47 0,5
)
0,0354
77
Statistiques dcisionnelles
pq 0,65.0,35
=
= 0,0011
n
200
F1 0,0011 = 0,0337
pq 0,65.0,35
=
= 0,0011
n
200
F2 0,0011 = 0,0337
F 0,0022 = 0,0469
La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,0469.
p(
p(
Statistiques dcisionnelles
0,10
0,10
) - p(Z
)]
0,0469
0,0469
p(
p(
p(
pq 0,5.0,5
=
= 0,0071 F 0,0071 = 0,0845
n
35
0,7 0,5
)
0,0845
pq 0,5.0,5
=
= 0,0025 F1 0,0025 = 0,05
n
100
79
Statistiques dcisionnelles
pq 0,5.0,5
=
= 0,0025 F2 0,0025 = 0,05
n
100
F 0,005
= 0,0707
La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,0707.
p(
p(
p(
p(
p(
0,150
0,150
) - p(Z
)]
0,0707
0,0707
Statistiques dcisionnelles
E(F1) = p = 0,34
V(F1) =
F1 0,0022 = 0,0472
n = 100 > 30 et le produit n p = 100.0,34 = 34 > 5. La distribution dchantillonnage de F 1 suit
donc une loi normale de moyenne 0,34 et dcart type 0,0472.
p(F1 > 0,25) = 1 - (
0,250,34
)
0,0472
F2 0,0012
= 0,0346
0,200,14
)
0,0346
81
Statistiques dcisionnelles
E(F) = p = 0,05
V(F) =
pq 0,05.0,95
=
= 0,0000475
n
1000
F 0,0000475 = 0,00689
n = 1000 > 30 et le produit n p = 1000.0,05 = 50 > 5. La distribution dchantillonnage de F
suit donc une loi normale de moyenne 0,05 et dcart type 0,00689.
p(F 0,01) = p(Z <
p(F 0,02) = p(Z <
p(F 0,03) = p(Z <
p(F 0,04) = p(Z <
p(F 0,05) = p(Z <
0,010,05
) = (-5,8) = 0
0,00689
0,020,05
) = (-4,35) = 0
0,00689
0,030,05
) = (-2,90) = 0,0019
0,00689
0,040,05
) = (-1,45) = 0,0735
0,00689
0,050,05
) = (0) = 0,5
0,00689
b) Probabilit pour que le dernier test donne une frquence de pices dfectueuses infrieure ou
gale 1 %, 2 %, 3 %, 4 % et 5 % dans un chantillon de 100 pices.
Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon.
E(F) = p = 0,05
V(F) =
pq 0,05.0,95
=
= 0,000475
n
100
F 0,000475 = 0,02179
n = 100 > 30 et le produit n p = 100.0,05 = 5. La distribution dchantillonnage de F suit donc
une loi normale de moyenne 0,05 et dcart type 0,02179.
p(F 0,01) = p(Z <
0,010,05
) = (-1,84) = 0,0329
0,02179
82
Statistiques dcisionnelles
0,020,05
) = (-1,38) = 0,0838
0,02179
0,030,05
p(F 0,03) = p(Z <
) = (-0,92) = 0,1788
0,02179
0,040,05
p(F 0,04) = p(Z <
) = (-0,46) = 0,3228
0,02179
0,050,05
p(F 0,05) = p(Z <
) = (0) = 0,5
0,02179
p(F 0,02) = p(Z <
On constate que pour un chantillon de taille plus petite, les probabilits sont plus grandes.
Plus la taille de lchantillon est grande plus le risque davoir des pices dfectueuses est
grand.
c) Taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ou gal 4 %
avec une probabilit de 98 %.
Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon de taille n.
E(F) = p = 0,05
V(F) =
pq 0,05.0,95 0,0475
=
=
n
n
n
0,0475 0,2179
n
n
p(Z <
0,040,05
) = 0,98
0,2179
n
0,040,05
) = 0,98
0,2179
n
83
Statistiques dcisionnelles
0,040,05
= Z0,98 = 2,05
0,2179
n
=>
n = 1996 pices
pq 0,5.0,5
=
= 0,000625
n
400
F 0,000625 0,025
0,550,5
)
0,025
pq 0,6.0,4
=
= 0,0006 F
n
400
0,550,6
p(F > 0,55) = 1 - p(Z <
)
0,02449
V(F) =
0,0006 0,02449
84
Statistiques dcisionnelles
pq 0,05.0,95
=
= 0,00016
n
300
F 0,00016 0,01258
n = 300 > 30 et le produit n p = 300.0,05 = 15 > 5. La distribution dchantillonnage de F suit
donc une loi normale de moyenne 0,05 et dcart type 0,01258.
Laffirmation du fournisseur est plausible si la probabilit davoir plus de 5 % de pices
dfectueuses est faible.
p(F 0,06) = 1 - p(Z <
0,060,05
)
0,01258
pq 0,8.0,2
=
= 0,0008
n
200
F 0,0008 0,02828
85
Statistiques dcisionnelles
0 ,7 0 ,8
)
0,02828
pq 0,8.0,2
=
= 0,00053
n
300
F 0,00133 0,03647
La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,03647.
p(
p(
86
Statistiques dcisionnelles
0,020
0,020
) - p(Z
)]
0,03647
0,03647
p(
p(
p(
87
Statistiques dcisionnelles
88
Statistiques dcisionnelles
PARTIE 3
PRINCIPE DE LESTIMATION
Les premiers problmes dinfrence statistique auxquels sapplique la thorie des distributions
dchantillonnage sont les problmes destimations. Le but poursuivi est destimer, partir
dun chantillon, la ou les valeurs numriques dun ou de plusieurs paramtres de la population
considre et de dterminer la prcision de cette ou de ces estimations.
DEFINITION DUN ESTIMATEUR.
Soient une population quelconque, dont la distribution de probabilit L(X) est fonction dun
paramtre : L(X) = f(X, ) et un chantillon alatoire et simple deffectif n extrait de cette
population.
On appelle estimateur du paramtre , toute fonction alatoire des valeurs observes, X1, X2,
X3,, Xn, susceptibles de servir estimer
Tn = f (X1, X2, , Xn)
On appelle estimation les valeurs numriques t1, t2, de cette variable alatoire Tn.
QUALITES DUN ESTIMATEUR.
Absence de biais
La premire qualit dun bon estimateur est labsence derreur systmatique ou de biais. Cette
qualit implique que la vraie valeur doit tre retrouve en moyenne :
E(Tn) =
Tout estimateur qui satisfait cette condition est dit sans biais ou non biais.
89
Statistiques dcisionnelles
Variance minimale
Une deuxime qualit dun bon estimateur est de possder une prcision suffisante. Cette
prcision peut tre mesure par le moment dordre deux par rapport .
E[(Tn - )]
Pour les estimateurs non biaiss, ce moment se confond avec la variance :
E[(Tn - )] = V(Tn)
On peut dmonter qu tout paramtre correspond une valeur minimum de E[(Tn - )].
La fonction qui correspond ce minimum, dfinit lestimateur de variance minimum.
90
Statistiques dcisionnelles.
CHAPITRE 5
ESTIMATION DE LA MOYENNE DUNE POPULATION
m=X
La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, est
mesure par lerreur standard de la moyenne :
Signalons ds prsent, comme nous le verrons, dans le chapitre suivant, que lestimation
ponctuelle et sans biais de la variance dune population mre, partir des rsultats obtenus
dun chantillon simple et alatoire est :
n
v( x ) =
n -1
(x x)
i
i 1
n 1
lestimateur
contenir m.
Statistiques dcisionnelles.
Les limites
p ( X1 m
X2 ) = 1 -
Si on dsigne par
p (m < X1 ) = p (m > X 2 ) = /2
ou
2
les limites de confiances sont :
X1 = X - Z
12
et
X2 = X + Z
1
2
X Z
1
2
ou
;xZ
x Z1
1
n
n
2
2
n
V( x )
n 1
n
V( x )
n 1
92
Statistiques dcisionnelles.
Z
1-
T
1-
X T
12
ou
;xT
x T1
1
n
n
2
2
X Z
1-
ou
;xZ
x Z1
1
n
n
2
2
i xi
m
93
Statistiques dcisionnelles.
i
ni
Ni ni
Ni 1
x
m
La variance de
x est :
V (x)
1
N
Ni xi
Ni
2 Ni n i
1
( N i2 i
)
2
N
ni Ni 1
( N i2
i2 N i n i
)
ni Ni 1
X Z1 / 2 x
O
xm
94
Statistiques dcisionnelles.
1,05
1,35
1,25
1,15
1,08
1,32
1,35
1,05
1,15
1,25
1,30
1,10
1,25
1,15
95
Statistiques dcisionnelles.
5.3.6. On donne la rpartition des masses de 35 ressorts provenant dune mme fabrication :
masses (g)
[82 ; 84[
[84 ; 86[
[86 ; 88[
[88 ; 90[
[90 ; 92[
[92 ; 94[
[94 ; 96[
[96 ; 98[
Nombre de Ressorts
4
6
6
6
8
2
2
1
Statistiques dcisionnelles.
dure de vie moyenne de 1200 heures et un cart type de 80 heures. Dterminer les limites de
confiance 95 % de la diffrence des dures de vie moyennes des marques A et B.
5.3.12. Une compagnie fabrique des roulements billes ayant un poids moyen de 0,638 Kg et
un cart type de 0,012 Kg.
Calculer les limites de confiance des poids de lots comprenant 100 roulements chacun.
a) Avec un risque derreur de 1 %.
b) Avec un risque derreur de 10 %.
c) Discuter la sensibilit de la largeur de lintervalle de confiance par rapport au risque
derreur.
5.3.13. Dans une population de 579 individus, divise en quatre strates comprenant
respectivement 53 ; 190 ; 231 ; et 105 individus, on a prlev un chantillon de 58 individus,
dont 10 dans la premire strate, 14 dans la deuxime, 21 dans la troisime et 13 dans la
quatrime. En fonction des rsultats suivants, estimer la moyenne de la population globale et
lerreur standard de cette moyenne, en considrant lchantillon comme :
a) Alatoire et simple ;
b) Stratifi.
Strates Sommes Sommes des carrs
1
54
1004
2
127
3081
3
388
13270
4
553
39667
5.3.14. En vue destimer la note moyenne des lves dune cole, on a choisi de faon alatoire
et simple six classes, et dans chacune de ces classes on a choisi alatoirement 4 lves. En
fonction des rsultats obtenus et repris ci-dessous :
a) Estimer la note moyenne des lves de lcole ;
b) Dterminer lintervalle de confiance 95 % de cette estimation.
Classes
Elves
1
2
3
4
11,69
12,32
12,32
11,90
11,79
11,97
12,07
12,06
11,84
11,59
11,25
11,80
12,30
11,91
12,05
12,23
11,83
11,77
12,15
11,66
11,95
11,87
11,65
11,87
97
Statistiques dcisionnelles.
ni xi
x i2
n i x i2
0
53
0
1
32
32
2
11
22
3
3
9
4
1
4
Somme
100
67
Somme / n
0,67
V(x)
0
1
4
9
16
30
-
0
32
44
27
16
119
1,19
0,7411
0,86
ni
m = 0,67
Avoir 0,67 panne par jour peut sembler bizarre du fait que le nombre de pannes doit tre un
entier, mais le rsultat que nous avons obtenu veut dire quen moyenne il y a un peu plus dune
panne, tous les deux jours (exactement 2x0,67= 1,34).
b) Lcart type de la population est inconnu, on utilise comme estimation ponctuelle est
sans biais de lcart type :
n
100
V(X)
x 0,7411 0,87
n 1
100 1
0,87
100
8,7 %
98
Statistiques dcisionnelles.
(x i x) 2
27,89
27,89 soit x
8,82
n 1
n
10
Somme
Somme / n
xi
x i2
200
240
190
150
220
180
170
230
210
210
2 000
200
40 000
57 600
36 100
22 500
48 400
32 400
28 900
52 900
44 100
44 100
407 000
40 700
700
V(x)
n
x V( x )
n 1
99
27,89
Statistiques dcisionnelles.
m = 9,4
x
3,92
15
1,01
Somme
Somme / n
xi
x i2
13
6
12
10
10
16
2
4
11
12
12
5
7
8
13
141
9,40
169
36
144
100
100
256
4
16
121
144
144
25
49
64
169
1541
102,73
14,37
3,79
V(x)
(x)
n
x V( x )
n 1
3,92
b) Comme la loi de probabilit est inconnue et que nous avons un chantillon de taille n < 30,
la moyenne de lchantillon peut tre considre comme une variable alatoire T de Student
(n-1) degrs de libert, soit 14.
T 0,05 14 degrs de libert lu sur la table de Student est : 2,145
1-
100
Statistiques dcisionnelles.
X T
1 -
0 , 05
2
= 9,4
2,17
Somme
Somme / n
V(x)
(x)
1,1
1,05
1,25
1,08
1,35
1,15
1,3
1,25
1,3
1,35
1,15
1,32
1,05
1,25
1,1
1,15
19,20
1,2
n
x V( x )
n 1
0,11
16
0,03
101
1,21
1,1025
1,5625
1,1664
1,8225
1,3225
1,69
1,5625
1,69
1,8225
1,3225
1,7424
1,1025
1,5625
1,21
1,3225
23,21
1,45
0,01
0,10
0,11
Statistiques dcisionnelles.
b) Comme la loi de probabilit est inconnue et que nous avons un chantillon de taille n < 30,
la moyenne de lchantillon peut tre considre comme une variable alatoire T de Student
15 degrs de libert, (n 1).
T
1-
0,05
2
X T
1 -
0 , 05
2
= 1,2
0,06
Lintervalle de confiance de la dure de vie moyenne de larticle est alors : [1,14 ; 1,26] soit
[1140 h ; 1260 h]
c) Lintervalle de confiance 10% seulement de risque est :
T
1-
0,10
X T
1 -
0 , 05
2
= 1,2
0,05
Lintervalle de confiance de la dure de vie moyenne de larticle est alors : [1,15 ; 1,25] soit
[1150 h ; 1250 h]
d) On voit bien quen doublant le risque derreur, lintervalle de confiance ne varie pas
tellement (une variation de 16,7 %) puisque sa largeur varie de 0,12 0,10.
5.4.5. Solution de lexercice 5.3.5.
Dans le cas dune population normale les limites de lintervalle de confiance 95% sont :
X Z
0 , 05
12
102
Statistiques dcisionnelles.
0 , 05
2
1,96
De mme, lestimation ponctuelle et sans biais de lcart type est donne par :
n
. V( x ) 28,28
n 1
X Z
1
0 , 05
2
= 130 7,84
m = 88,5 g
x
0,063
xi
ni
ni xi
83
4
85
6
87
6
89
6
91
8
93
2
95
2
97
1
35
Somme
Somme / n
V(x)
(x)
332
51
522
534
728
186
190
97
3099
88,5
n
x V( x )
n 1
103
ni
x i2
27556
43350
45414
47526
66248
17298
18050
9409
274851
7852,90
13,6
3,68
3,74
Statistiques dcisionnelles.
0 , 04
2
2,05
X Z
1 -
0 , 04
2
= 88,5 1,30
2,3
0 , 05
1
2
= 0,05 =>
0 , 05
1
2
= 0,05
n
= 1,960
2,3
Somme
Somme / n
xi
x i2
1,22
1,23
1,21
1,99
1,23
1,24
1,18
1,21
9,71
1,214
1,4884
1,5129
1,4641
1,4161
1,5129
1,5376
1,3924
1,4641
11,7885
1,4736
104
Statistiques dcisionnelles.
V(x)
0,0004
n
x V( x )
n 1
0,021
Comme la loi de distribution des poids des botes nest pas connue, elle peut tre approche par
une loi de Student 7 degrs de libert (n 1).
La lecture de la table
0 ,10
2
1,895
ou
[1,2 ; 1,228]
1,214 0,013
ou
1,201 ; 1,227
c1) Si la taille de lchantillon varie, lestimateur sans biais de la moyenne varie aussi :
n
. V( x ) 0,022
n 1
0,1
2
2,132 .
1,214 0,021
ou
1,193 ; 1,235
c2) Dans le cas o la variance de la population mre est exactement celle de lchantillon,
lintervalle de confiance devient :
1,214 0,018
ou
1,196 ; 1,232
105
Statistiques dcisionnelles.
E (x)
390 520
455 g
2
La demi largeur de lintervalle de confiance est gale, en prenant pour loi de probabilit de la
distribution des poids de pamplemousse, la loi de Student 11 degrs de libert (n 1).
455 390 65 T
Avec
0 , 05
2
0 , 05
2
102,30
et pour
n 1
97,94
n
(x)
n
V( x ) x
n 1
est :
Nn
8,77
N 1
75 2,33
ou
72,67 ; 77,33
106
0 , 06
2
1,88
Statistiques dcisionnelles.
8,77
50
1 Z
0,81
0,791 0,42 .
2
m
1 m
2 1400 h 1200 h 200 h
m
1
n1
150
x 1
x 120 120,4
n1 1
150 1
n2
x 2
n2 1
Lcart
type
de
200
x 80 80,2
200 1
la
diffrence
des
dures
de
vie
moyenne
est
estim
par :
120,4
80,2
11,35
n1 n 2
150
200
2
1
2
2
ou
[177,75 ; 222,25]
107
Statistiques dcisionnelles.
a) Lintervalle de confiance 99 % est, aprs lecture sur la table normale centre rduite :
2,58
0,638 0,0031
ou
0,635 ; 0,641
1,64
0,012
0,638 0,002
ou
0,636 ; 0,64
0,99 0,90
9%
0,99
Nous obtenons une variation de lintervalle de confiance de :
0,002 0,0031
35 %
0,0031
On voit bien quune faible variation du risque derreur induit une forte variation de lintervalle
de confiance.
5.4.13. Solution de lexercice 5.3.13.
a) Echantillon alatoire simple
La meilleure estimation de la moyenne m dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la moyenne de lchantillon.
108
Statistiques dcisionnelles.
58
xi
X =
m
i 1
La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, est
mesure par lerreur standard de la moyenne :
^
=
X
Nn
N 1
n.V(X)
n -1
58
V(X)
V(X)
xi
i 1
- x
58.609,10
=24,90
58 - 1
= 24,90
X
58
579 58
= 3,10
579 1
La moyenne de la population globale peut tre estime 19,34 avec une erreur standard de
3,10.
b) Echantillon stratifi
On estime la moyenne de chaque strate par la moyenne calcule de lchantillon de la strate.
ni
i Xi =
m
xi
i 1
ni
109
Statistiques dcisionnelles.
Ni n i
N i 1
Xi = i
ni
n i.V(X)
n i -1
ni
xi
V(X)
i 1
- xi
ni
Le tableau suivant regroupe les rsultats des calculs pour chaque strate.
Strate
Ni
ni
V(X)
xi
Xi
1
2
3
4
Total
53
190
231
105
579
10
14
21
13
58
5,4
9,07
18,48
42,54
71,24
137,78
290,54
1241,79
8,9
12,18
17,47
36,68
2,56
3,14
3,64
9,57
Ni x i
m
Ni
^
53.5,4190.9,07 231.18,48105.42,54
579
m = 18,56
Lerreur standard de lestimation est :
Xi
V(x)
avec V( x ) =
V( x ) =
1 N i V(x i )
V( x ) = 6,24
110
Statistiques dcisionnelles.
Xi
6,24 = 2,5
La moyenne de la population globale peut tre estime 18,56 avec une erreur standard de 2,5.
On peut constater que lchantillonnage stratifi est plus prcis que lchantillonnage alatoire
et simple.
5.4.14. Solution de lexercice 5.3.14.
a) Estimation de la note moyenne de la classe.
On estime la moyenne de chaque classe par la moyenne calcule de lchantillon de la classe.
ni
xi
i Xi =
m
i 1
ni
Xi = i
ni
n i.V(X)
n i -1
ni
V(X)
xi
i 1
ni
- xi
111
Statistiques dcisionnelles.
Le tableau suivant regroupe les rsultats des calculs pour chaque classe.
Classe
V(X)
xi
Xi
1
2
3
4
5
6
12,06
11,97
11,62
12,12
11,85
11,84
0,07
0,01
0,05
0,02
0,03
0,01
0,32
0,13
0,27
0,18
0,21
0,13
0,16
0,06
0,13
0,09
0,11
0,06
En supposant des classes de mme effectifs, la note moyenne de lcole peut tre estime par :
xi
m
^
12,0611,97 11,6212,1211,8511,84
6
m = 11,91
Lerreur standard de lestimation est :
Xi
V(x)
avec V( x ) =
V( x ) =
1 V(x i )
V( x ) = 0,0019
Xi
0,0019 = 0,044
La note moyenne de lcole peut tre estime 11,91 avec une erreur standard de 0,044.
b) Intervalle de confiance de la note moyenne de lcole.
112
Statistiques dcisionnelles.
La loi de la population est inconnue, la taille de lchantillon est infrieure 30. Lintervalle de
confiance est :
^
X T1
2
n
Au seuil de 5 %, la valeur de T0,975 avec 23 degrs de libert lue dans la table de Student est :
T0,975 = 2,07
Lintervalle de confiance est :
11,91
113
Statistiques dcisionnelles.
114
Statistiques dcisionnelles
CHAPITRE 6
ESTIMATION DE LA VARIANCE DUNE POPULATION
E(V(X)) - =
n . On
n1
n
v( x ) =
n 1
(x
x )
i 1
n 1
E( ) = E(
n n 1
n
n
v( x ) ) =
=
E(v(x)) =
n 1
n 1
n 1 n
^
n v(x) est appele quasi-variance, cest un estimateur sans biais de la variance de
n 1
n 1
Statistiques dcisionnelles
Lerreur standard de cette estimation est, dans le cas dune population normale :
^
v( ) 2 (n 1)
2
n
(x i x)
i 1
p(
i 1
(x i x)
(x i x)
i 1
(x i x)
i 1
)=1-
1 =
i 1
(x x)
i
et
Les valeurs de
(x x)
2 =
i 1
116
possde une
Statistiques dcisionnelles
i2
xi xi
ni 1
N i i2 N i x i x
N
N
2
Statistiques dcisionnelles
118
Statistiques dcisionnelles
n
x V( x ) 0,87
n 1
V( 2 ) 2 n 1
2
0,87 2
2 100 1
0,1065
n
100
n
x V( x ) 27,89
n 1
V( )
2 x 10 1
27,89 2
18,16
10
n
x V( x ) 3,92
n 1
119
0 , 05
2
26,119 .
Statistiques dcisionnelles
Soit 12
(x i x) 2
8,25
2 0 , 05
1
et
1 2,87
et
2 6,19
20 , 05 5,629
2
Soit 22
(x i x) 2
38,29
0 , 05
2
Soit 12
(x i x) 2
6,88
2 0 , 01
1
et
1 2,62
20 , 01 4,075
2
Soit 12
(x i x) 2
52,90
20 , 01
et
2 7,27
120
Statistiques dcisionnelles
n
x V( x ) 0,11 soit 110 h.
n 1
0 , 002
2
37,698
Soit 12
(x i x ) 2
2
0,0046
et
1 0,068
0,002
2
20 , 002 3,483
2
Soit 22
(x i x ) 2
0,0499
20,002
et
2 0,223
n
V( x ) 28,28
n 1
2
2
0 ,1
2
2 x k 1
1,64
2 x 49 1
2
65,997
121
2 par la
Statistiques dcisionnelles
20 ,1
2
12
1,64
xi x
2 0 ,1
1
22
xi x
20 ,1
2 x 49 1
33,693
28 2 x 50
593,97 et 1 24,37
65,997
28 2 x 50
1163,446 et 2 34,11
33,693
n
x V(x) 14
n 1
1,96
2 x 34 1
1,96
2 x 34 1
0 , 05
2
2
0 , 05
2
2k 1
2
2
1
Soit 12
51,46
19,38
( x i x ) 2 14 x 34
9,25
2 0 , 05
51,46
1
Soit 22
et
1 3,04
et
2 4,96
( x i x ) 2 14 x 34
24,56
20 , 05
19,38
2
122
Statistiques dcisionnelles
0 , 05
2
16,013
Soit 12
(x i x) 2
0,0002
2 0 , 05
1
et
1 0,014
et
2 0,044
20 , 05 1,690
2
Soit 22
(x i x) 2
0,0019
20 , 05
2
0 , 05
2
2 4 degrs de libert :
11,143
Soit 12
(x i x) 2
0,0003
2 0 , 05
1
et
1 0,017
et
2 0,081
20 , 05 0,484
2
Soit 22
(x i x) 2
0,0066
20 , 05
2
Statistiques dcisionnelles
8,77
La valeur
2 199 degrs de libert peut tre approxime par la loi normale de moyenne 199
2 x 199 19,95 .
et dcart type
0 , 05
2
199
Z
19,95
0 , 05
2
0 , 05
2
20 , 05 199
Z 0 , 05
19,95
12
xi x
2 0 , 05
1
8,77 2 x 199
64,28
238,10
et
1 8,02
8,77 2 x 199
95,72
159,90
et
2 9,78
xi x
20 , 05
2
2
124
Statistiques dcisionnelles
0,012 kg
Les valeurs de
2 x 99 14 .
0 , 01
2
99
Z
14
0 , 01
2
0 , 01
2
2,58 x 14 99 135,12
Z 20 , 01 99
Z 0 , 01 20 , 01 2,58 x 14 99 62,88
14
12
xi x
2 0 , 01
1
22
0,012 2 x 100
0,0001 et
135,12
1 0,0103
0,012 2 x 100
0,0002 et
62,88
2 0,0151
xi x
20 , 01
0 , 05
2
99
Z
14
0 , 05
2
0 , 05
2
1,96 x 14 99 126,44
20 , 05 99
Z 0 , 05 20 , 05 1,96 x 14 99 71,56
14
xi x
2 0 , 05
2
1
0,012 2 x 100
0,00011 et
126,44
125
1 0,0107
Statistiques dcisionnelles
22
xi x
20 , 05
0,012 2 x 100
0,0002 et
71,56
2 0,0142
x
i
V(X)
x=
-x
58
x
i 1
V(X)
i 1
58.609,10
=619,79
58 - 1
b) Echantillon stratifi :
La variance de la strate peut tre estime par :
12
n i .V(X)
ni -1
126
Statistiques dcisionnelles
ni
x
i
V(X)
xi =
i 1
ni
- xi
ni
i 1
ni
Le tableau suivant regroupe les rsultats des calculs pour chaque strate.
Strate
Ni
ni
xi
V(X)
1
2
3
4
Total
53
190
231
105
579
10
14
21
13
58
5,4
9,07
18,48
42,54
71,24
137,78
290,54
1241,79
79,2
148,4
305,1
1614,3
N xi
53.5, 4 190.9,07 231.18, 48 105.42,54
i
x
=
= 18,56
Ni
579
N
N
^
53.79,2 190.148,4 231.305,1 105.1614,3
+
579
^
= 620,11
127
Statistiques dcisionnelles
n i .V(X)
ni -1
ni
x
i
V(X)
i 1
- xi
ni
ni
xi =
i 1
ni
Le tableau suivant regroupe les rsultats des calculs pour chaque classe.
Classe
xi
V(X)
1
2
3
4
5
6
12,06
11,97
11,62
12,12
11,85
11,84
0,07
0,01
0,05
0,02
0,03
0,01
0,1024
0,0169
0,0729
0,0324
0,0441
0,0169
En supposant des classes de mme effectifs, la note moyenne de lcole peut tre estime par :
x
x
x = 11,91
La variance de la population globale peut tre estime par :
^
N (x x)
= 0,07
^
Statistiques dcisionnelles
CHAPITRE 7
ESTIMATION DE LA PROPORTION DUNE POPULATION
p f n
La dispersion des diffrentes estimations possibles autour de cette proportion gnrale, est
mesure par lerreur standard de la proportion :
f
n
f n 1 f n
n
ou
Comme, la distribution de la proportion suit une loi normale de moyenne p et dcart type
Fn
pq
2
lue dans la table que les limites de lintervalle de confiance sont :
129
Statistiques dcisionnelles
p1= fn - Z
p(1 p)
n
et
p2 = fn + Z
p(1 p)
n
ou
p(1 p)
n
f n Z 1
2
p (1 p)
; fn Z
1
n
2
p (1 p)
130
Statistiques dcisionnelles
7.3.4. Sur un chantillon de 400 adultes et de 600 adolescents ayant regard un certain
programme de tlvision, 100 adultes et 300 adolescents lont apprci. Calculer les limites de
confiance 99 % de la diffrence des frquences des adultes et des adolescents qui ont regard
et apprci le programme.
7.3.5. On considre 2 chantillons tirs dune mme population et lon dsire calculer le taux
de participation un vote.
Le 1er chantillon de taille 100 a donn 45 personnes ayant vot.
Le 2e chantillon de taille 200 a donn 96 personnes ayant vot.
a) Donner les 2 estimations ponctuelles des taux de participation au vote.
b) Donner pour chaque chantillon un intervalle de confiance de taux de participation au vote
avec un risque derreur de 1 %.
c) Donner la sensibilit de lintervalle de confiance en fonction de la taille de lchantillon.
7.3.6. Sur 100 clients dun caf, 85 demandent un caf au petit djeuner.
a) Donner une estimation ponctuelle de la proportion de clients qui prennent un caf.
b) Donner lintervalle de confiance 1 % de risque derreur de cette proportion.
c) Donner lintervalle de confiance 5 % de risque derreur de cette proportion.
d) Discuter la sensibilit de lintervalle de confiance en fonction du risque derreur.
7.4. SOLUTIONS DES EXERCICES DAPPLICATION.
7.4.1. Solution de lexercice 7.3.1.
On se propose de dterminer 3 estimations ponctuelles de p.
a) Estimation partir du 1er chantillon :
p1
48
0,40
120
p
1
0,40 x 0,60
0,045
120
p2
66
0,44
150
131
Statistiques dcisionnelles
0,44 x 0,56
0,040
150
P3
48 66
114
0,42
120 150 270
0,42 x 0,58
0,030
270
On trouve bien 3 rsultats qui ne sont pas trop diffrents.
Lerreur standard est : p
3
1943
0,60
3238
0 , 01
2
Soit Z
2,575
0 , 01
2
p (1 p)
0,022
n
0 , 05
2
1,960
132
Statistiques dcisionnelles
Pour avoir un intervalle de confiance 5 % de risque derreur damplitude 0,04, on doit avoir :
p (1 p) 0,04
0,02
n
2
0 , 05
2
n Z2
0 , 05
2
p (1 p)
2305
0,02 2
320
0,80
400
On utilisera la loi normale puisque lchantillon a une taille de 400 et que np = 320 > 5.
0 , 06
2
0 , 06
2
1,88
p (1 p)
0,038
n
0 , 06
2
n Z2
p (1 p) 0,032
0,016
n
2
0 , 06
2
p (1 p)
2209
0,016 2
On voit bien que n = 2209 est suprieur 30 et que np = 1767 > 5 ce qui justifie notre
utilisation de la loi normale.
133
Statistiques dcisionnelles
p1
100
0,25
400
0,25 x 0,75
0,0217
400
p
1
p2
300
0,5
600
p
2
0,5 x 0,5
0,0204
600
La diffrence des frquences des adultes et des adolescents qui ont regard et apprci le
programme :
0 , 01
2
2,575
134
Statistiques dcisionnelles
2,575
0 , 01
2
0 , 01
2
p 1 (1 p 1 )
0,128
n1
0 , 01
2
p 2 (1 p 2 )
0,091
n2
0 , 01
2
p 1 (1 p 1 )
0,091
n2
135
Statistiques dcisionnelles
85
0,85
100
0 , 01
2
2,575
et
0 , 01
2
p (1 p)
0,092
n
0 , 05
2
1,960
et
0 , 05
2
p (1 p)
0,070
n
136
Statistiques dcisionnelles
PARTIE 4
TESTS STATISTIQUES
137
Statistiques dcisionnelles
= p (AH0/H1)
Le risque de premire espce est appel aussi seuil de signification du test, fix trs souvent
5 %. La probabilit complmentaire de dsigne le niveau de confiance du test.
138
Statistiques dcisionnelles
1- = p(AH0/H0)
La probabilit complmentaire de dsigne la puissance du test.
1- = p (RH/H1)
On peut prsenter une table de dcision comme suit :
H0
Hypothse
vraie
H1
Dcisions prises
Accepter H0
Accepter H1
1-
Niveau de confiance
erreur de premire espce
1-
erreur de deuxime
Puissance du test
espce
et
H1 : t0
139
Statistiques dcisionnelles
Un test est dit unilatral si lhypothse alternative dsigne quune caractristique est
strictement suprieure ou infrieure lautre. On parle respectivement de test unilatral droite
ou gauche.
- Test unilatral droite
Les hypothses formules du test unilatral droite sont :
H 0 : = t0
H 1 : > t0
et
> t0
Rgion de rejet de H0
A
p(t0 > A) =
et
H 1 : < t0
t0
Rgion dacceptation de H0
A
p(t0 A) = 1 -
140
Statistiques dcisionnelles
RECAPITULATIF.
Pour rcapituler, la dmarche dun test statistique se compose des tapes suivantes :
1. Formuler les hypothses H0 et H1 ;
2. Fixer le seuil de signification ;
3. Prciser la loi de probabilit de lcart observ, appel aussi variable de dcision ;
4. Calculer la valeur numrique de la variable de dcision ;
5. Dterminer les valeurs critiques qui dlimitent la rgion dacceptation ;
6. Prendre la dcision et conclure.
141
Statistiques dcisionnelles
142
Statistiques dcisionnelles
CHAPITRE 8
TESTS SUR LES MOYENNES
H0
m = m0
VD = x
Pour une population normale dcart type connu, la variable de dcision est elle-mme
143
Statistiques dcisionnelles
n
VDR est alors une variable normale rduite N(0 ; 1).
Si la distribution de la population parent est inconnue, la quasi-variance sera utilise comme
estimation de la variance de la population. Pour un effectif suffisamment lev, la variable de
dcision peut toujours tre considre comme une variable approximativement normale. Cest
gnralement le cas lorsque leffectif est suprieur 30. Dans le cas contraire (n < 30), la
variable de dcision rduite VDR peut toujours tre considre comme une variable de Student
(n-1) degr de libert.
8.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : m = m0
H1 : m m0
et
Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2
Z1 =
Z
2
Z2 = Z
].
VDR Z
144
Statistiques dcisionnelles
et
H1 : m > m0
La valeur critique qui dlimite la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR Z) = 1 -
Z=
Z1
Z1 ].
et
H1 : m < m0
La valeur critique qui dlimite la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR < Z) =
Z=
145
Statistiques dcisionnelles
H0
m1 = m2
VD = x 1 - x 2
Une distinction est faite entre le cas de deux populations de variances ingales et le cas de deux
populations de variances gales.
a) Cas de deux populations de variances ingales :
1
n1
et
n2
n1
n2
Sous lhypothse nulle, (m1-m2)=0. La variable de dcision centre rduite :
VDR =
(x 1 x 2 )
1 2
n1
n2
146
Statistiques dcisionnelles
(x
x 1 )
(x
x 2 )
n1 n 2 2
VDR =
(x 1 x 2 )
^
n1 n 2
VDR =
(x 1 x 2 )
1
1
)
n1 n 2
(x 1 x 2 )
(x
x 1 )
(x
x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i
Remarque : Si les distributions des populations parents sont inconnues, pour des effectifs
suffisamment levs, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la variable de dcision rduite VDR peut toujours tre considre
comme une variable de Student (n1 + n2 - 2) degr de libert.
8.2.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : m1 = m2
et
H1 : m1 m2
Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour des distributions
normales rduites ou asymptotiquement normales rduites, Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2
Z1 =
Z
2
147
Statistiques dcisionnelles
Z2 = Z
].
et
H1 : m1 > m2
La valeur critique qui dlimite la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR Z) = 1 -
Z=
Z1
Z1 ].
et
H1 : m1 < m2
La valeur critique qui dlimite la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR < Z) =
Z=
148
Statistiques dcisionnelles
H0
m1 = m2
VD = d
Pour une population normale, la variable de dcision est elle-mme normale et la variable de
dcision centre rduite est donc :
VDR =
d
^
n
VDR est alors une variable normale rduite N(0 ; 1).
Remarque : Si la distribution de la population parent est inconnue, pour un effectif
suffisamment lev, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque leffectif est suprieur 30.
Dans le cas contraire (n < 30), la variable de dcision rduite VDR peut toujours tre
considre comme une variable de Student (n-1) degr de libert.
8.2.2.3. Rgion dacceptation.
La rgion dacceptation est identique celle du test prcdent. Elle dpend toujours de
lhypothse alternative H1.
a) Test bilatral :
149
Statistiques dcisionnelles
H0 : m1 = m2
H1 : m1 m2
et
].
VDR > Z
et
H1 : m1 > m2
Z1 ].
et
H1 : m1 < m2
150
Statistiques dcisionnelles
(12 22 32 2j ) .
Le tableau suivant illustre la notation indice: par exemple, Y21 reprsente la deuxime
observation prleve de la premire population. Dans chaque chantillon, on a aussi calcul le
total des observations, la moyenne et la variance.
Matrice des donnes
Observation
1
POPULATION
P1: N(m1,1) P2 : N(m2,2) Pj : N(mj,j)
Y11
Y12
Y1j
Y21
Y22
yn1
yn2
ynj
151
Y2j
Statistiques dcisionnelles
T1
Total
T2
Tj
Yj
S j
Moyenne
Y1
Y2
Variance
S1
S 2
N n 1 n 2 ... n J
Grand total = T
Moyenne gnrale = Y
8.3.1.1. Equation fondamentale de l'analyse de la variance.
L'analyse de la variance dveloppe par Fisher repose sur la comparaison de deux estimateurs
de la variance commune aux J populations normales.
L'quation fondamentale de l'analyse de la variance dcompose la variabilit totale (STC) entre
les observations en une part due aux diffrences entre les modalits du facteur (SCF) et une
part de variabilit rsiduelle (SCE).
STC Yij2
ji i 1
Tj2
j i
nj
SCF
T2
N
T2
N
Somme des
carrs
Degrs de
libert
Moyenne des
carrs
SCF
J-1
MCF
F observ
MCF
MCE
152
Statistiques dcisionnelles
Erreur
Totale
SCE
SCT
N-J
N-1
MCE
MCF
obit une loi de Fisher avec (J-1) et (N-J) degrs de
MCE
libert. On devra rejeter l'hypothse nulle de l'galit des moyennes Ho : 1 = 2 = ... = J
MCF
au seuil si et seulement si la valeur de
est plus grande que la valeur critique de la
MCE
table de Fisher au seuil et avec (J-1) et (N-J) degrs de libert.
Quand Ho est vraie, le rapport
facteur est maintenu son deuxime niveau (l'indice sur lequel la sommation a t effectue est
remplac par un ).
Toutes les combinaisons possibles des modalits des facteurs donnent lieu IJ traitements.
A remarquer qu'il n'y a qu'une seule observation pour chaque traitement, c'est--dire une seule
valeur numrique dans chacune des cellules du tableau.
Matrice des donnes
Facteur B
Facteur A
1
2
3
...... etc...
I
Total
Moyenne
Total
Moyenne
Y11
Y12
Y1J
Y21
Y22
Y2J
T1
T2
Y1
Y2
Y32
YI1
YI2
YIJ
TI
YI
TJ
Y J
T1
Y1
T2
Y2
Statistiques dcisionnelles
Les rsultats d'une analyse de variance deux facteurs sans rptition se prsentent dans un
tableau comme celui-ci :
Analyse de variance deux facteurs sans rptition
Source de
variation
Facteur A
Facteur B
Erreur
Total
Somme des
carrs
SCFA
SCFB
SCE
STC
Degrs de
libert
I-1
J-1
(I-1)(J-1)
IJ-1
Moyenne des
carrs
MCFA
MCFB
MCE
F observ
MCFA / MCE
MCFB / MCE
Les diverses sommes des carrs et moyennes des carrs sont calcules l'aide des formules
suivantes :
I
J
T2
STC
Yij2
IJ
i 1 j1
Ti2 T 2
J
IJ
i 1
J
T2j T 2
SCFB
I
IJ
j1
I
SCFA
Statistiques dcisionnelles
Toutes les combinaisons possibles des modalits des facteurs donnent lieu IJ traitements.
A remarquer enfin qu'il y a ici le mme nombre d'observations dans chacune des IJ cellules,
soit K, et cette valeur est suprieure l'unit.
Matrice des donnes
Facteur B
Facteur A
2
...
I
Total
Moyenne
Y111
Y112
...
Y11K
Y211
Y212
...
Y21K
...
YI11
YI12
...
YI1K
Y121
Y122
...
Y12K
Y221
Y222
...
Y22K
...
YI21
YI22
...
YI2K
...
T1
Y1
T2
Y2
...
...
Y1J1
Y1J2
...
Y1JK
Y2J1
Y2J2
...
Y2JK
...
YIJ1
YIJ2
...
YIJK
TJ
Y J
Total
Moyenne
T1
Y1
T2
Y2
...
...
TI
YI
Somme des
carrs
SCFA
SCFB
SCI
SCE
STC
Degrs de
libert
I-1
J-1
(I-1)(J-1)
IJ(K-1)
IJK-1
155
Moyenne des
carrs
MCFA
MCFB
MCI
MCE
F observ
MCFA / MCE
MCFB / MCE
MCI / MCE
Statistiques dcisionnelles
Les diverses sommes des carrs et moyennes des carrs sont calcules l'aide des formules
suivantes :
STC
i 1
j1
k 1
i 1
T2j
IK
T2
IJK
j1
SCI
i 1
j1
Tij2
i 1
T2
IJK
Ti2
T2
JK IJK
SCFA
SCFB
Yijk2
Ti2
JK
T2j
IK
j1
T2
IJK
x 2462
350
Statistiques dcisionnelles
8.4.2. Pour savoir sil existe une diffrence dassiduit entre les filles et les garons, on a choisi
de manire alatoire et simple un premier chantillon de 10 filles et de faon indpendante, un
deuxime chantillon de 10 garons. En fonction des rsultats ci-dessous relatifs aux notes
dassiduits (note sur 100), et en supposant que les variances des deux populations sont gales,
peut-on conclure, au seuil de 5 %, lexistence dune diffrence significative entre les deux
sexes ?
Assiduit des filles
Assiduit des garons
72
66
67
59
52
54
54
57
46
63
58
55
59
61
54
55
58
66
63
75
8.4.3. Un chef de produit souhaite tester leffet dune formation sur les techniques de ventes sur
les ventes dun produit. Un chantillon alatoire de 10 commerciaux ayant reu la formation
est constitu. Les ventes ralises par les dix commerciaux avant et aprs formation sont
indiques dans le tableau ci-dessous.
a) Peut-on parler dun effet positif de la formation au seuil de 5% ?
b) Peut-on parler dun effet positif de la formation au seuil de 1 % ?
N commercial Aprs formation Avant formation
1
4580
3970
2
5190
4880
3
3940
4090
4
6320
5870
5
7680
6930
6
3480
4000
7
5720
5080
8
7040
6950
9
5270
4960
10
5840
5130
8.4.4. Un investisseur tranger songe implanter une nouvelle usine au Maroc. Il hsite entre
trois villes : Settat, Casablanca et Eljadida. Selon son point de vue, le critre le plus important
prendre en considration pour dterminer l'emplacement de cette nouvelle usine est l'assiduit
au travail des ouvriers. Linvestisseur a visit au hasard dans chacune des villes considres
cinq grandes usines de fabrication et il a obtenu des administrateurs le taux d'absentisme par
3500 journes de travail. Les rsultats sont reproduits dans le tableau ci-dessous.
Donnes numriques
Ville
Echantillon
Settat
141; 127 ; 111; 124 ; 144
Casablanca
157; 131; 105; 132 ; 163
Eljadida
183; 161; 145 ; 157 ; 189
Aux seuils de 5 %, puis de 1 % peut-on conclure que le taux d'absentisme au travail est le
mme en moyenne dans ces 3 villes?
157
Statistiques dcisionnelles
8.4.5. On a mis au point quatre techniques diffrentes, T1, T2, T3, et T4 pour la promotion
dun produit. On a alors dcid de toutes les essayer et d'utiliser les oprateurs qualifis pour
comparer les dites techniques. On s'attend ce qu'il y ait des diffrences importantes entre
oprateurs et peut-tre aussi entre techniques. 5 oprateurs ont t assigns aux 4 techniques.
Voici les nombres dunits vendues enregistres lors de ces tests.
Donnes numriques
Oprateurs \ Techniques
O1
O2
O3
O4
O5
T1
42
39
38
43
44
T2
45
41
39
45
45
T3
55
52
48
54
56
T4
50
46
42
48
49
Y a-t-il des diffrences significatives au niveau 5% entre les cinq oprateurs d'une part et entre
les quatre techniques d'autre part quant au nombre moyen dunits vendues ?
8.4.6. On a demand 24 ouvriers de prdire le nombre dheures ncessaires pour
lassemblage dune machine. Les ouvriers ont t classifis selon leur type dexprience et leur
nombre dannes dexprience. Quand le projet fut termin, tous sans exception avaient sousestim le temps effectivement requis pour accomplir cette tche. Dans le tableau qui suit, on a
ces erreurs de prvision (en heures).
Donnes numriques
TYPE DEXPERIENCE
Dans une grande entreprise
30
38
45
44
20
28
29
28
14
15
26
24
341
Total
242
149
117
508
Que ce soit sous l'angle Type d'exprience ou Nombre d'annes d'exprience, existe-t-il
globalement des diffrences significatives entre les groupes (seuil 5%)?
158
Statistiques dcisionnelles
8.4.7. Un fabricant de tubes essais pour laboratoire fonde sa publicit sur le fait que la dure
de vie de ses tubes correspond 1500 heures de chauffage laide d'un bec Bunzen. Un
laboratoire de contrle de publicit constate que sur 100 tubes essais, la dure moyenne de
vie est de 1485 heures de chauffage avec un cart-type de 110 heures. Aux risques 5%, puis de
10 %, la dure de vie des tubes essais est-elle diffrente de 1500 heures de chauffage ?
8.4.8. Les moteurs des appareils lectromnagers d'une marque M ont une dure de vie
moyenne de 3000 heures avec un cart-type de 150 heures. la suite d'une modification dans
la fabrication des moteurs, le fabriquant affirme que les nouveaux moteurs ont une dure de vie
suprieure celle des anciens. On a test un chantillon de 50 nouveaux moteurs et on a trouv
une dure de vie moyenne de 3250 heures avec un cart-type gal 150 heures. Les nouveaux
moteurs apportent-ils une amlioration dans la dure de vie des appareils lectromnagers au
risque de 1% ?
8.4.9. Dans une grande ville d'un pays donn, une enqute a t ralise sur les dpenses
mensuelles pour les loisirs. On a observ les rsultats suivants :
Sur 280 familles habitant le centre-ville, les dpenses mensuelles pour les loisirs sont en
moyenne de 640 dh avec un cart-type de 120 dh.
Sur 300 familles habitant la banlieue, les dpenses mensuelles pour les loisirs sont en
moyenne de 610 dh avec un cart-type de 100 dh. En supposant que les variances des deux
populations sont ingales, peut-on dire, aux risques de 5 % puis de 1 pour 1000 que la part du
budget familial consacr aux loisirs est diffrente suivant que la famille habite le centre-ville
ou la banlieue ?
8.4.10. On prlve dans la production d'une machine, un chantillon de 100 tiges mtalliques.
La moyenne des longueurs des tiges de cet chantillon est 100,04 cm avec un cart-type de
0,16 cm. La machine est rgle en principe pour obtenir des tiges de 100 cm.
1) Au risque de 5 %, peut-on dire que la machine est bien rgle ?
2) Reprendre la question prcdente avec un risque de 1 %.
8.4.11. Un spcialiste en marketing a fait modifier la mthode traditionnellement utilise pour
effectuer la promotion d'un certain produit. A titre exprimental, il a observ dans 10 points de
vente le nombre dunits vendues en une semaine en utilisant la mthode existante. La semaine
daprs, les mmes points de vente ont utilis la nouvelle mthode de promotion, on a observ
le nombre dunits vendues en cette semaine. Les donnes recueillies sont comme suit :
Ancienne mthode: 48, 46, 47, 43, 46, 45, 49, 46, 47, 44.
Nouvelle mthode: 56, 49, 53, 51, 48, 52, 55, 53, 49, 50.
La nouvelle mthode de promotion a-t-elle un effet positif sur les ventes ( = 5%)?
159
Statistiques dcisionnelles
8.4.12. Dans le but de contrler le poids net des sachets d'un produit alimentaire, on a prlev
deux chantillons respectivement de 10 et 12 sachets, on a obtenu les rsultats suivant (en
grammes) :
1
2
190
210
200
204
202
203
195
189
194
194
208
195
205
206
196
205
198
200
206
201
198
197
En supposant que les variances des deux populations sont gales, ces deux rsultats sont-ils
significativement diffrents en ce qui concerne le poids moyen au seuil de 5 %.
8.4.13. 24 ttes dovin ont reu 6 alimentations diffrentes pour constituer 4 rptitions et on a
enregistr les gains moyens quotidiens en poids suivants :
Alim. 1
590
760
700
640
Alim. 2
460
430
540
470
Alim. 3
600
460
610
510
Alim. 4
640
660
720
580
Alim. 5
690
600
550
480
Alim. 6
690
650
680
740
Aux seuils de 5 %, puis de 1 pour 1000, existe-t-il une diffrence significative quant leffet
des diffrentes alimentations sur le gain moyen quotidien en poids des ovins ?
8.4.14. L'exprience suivante avait pour but d'analyser l'impact des 2 facteurs Sexe et ge sur
la consommation d'un certain produit de luxe. Dans chacun des 6 groupes, le produit a t
offert 100 personnes choisies au hasard. La consommation, en nombre dunits achetes, est
donne dans le tableau qui suit :
Sexe
Fminin
Masculin
Total
Moins de 20 ans
27
32
59
Catgorie d'ge
Entre 20 et 45 ans
39
45
84
Plus de 45 ans
54
62
116
On suppose que les nombres dunits achetes obissent des lois normales, que les variances
sont gales dans ces six populations.
Quant au nombre dunits achetes en moyenne, peut-on affirmer au niveau 5% qu'il y a une
diffrence significative entre hommes et femmes d'une part, et entre les trois groupes d'ge,
d'autre part?
160
Statistiques dcisionnelles
8.4.15. Une machine fabrique des pices identiques. La moyenne des poids de 50 pices
prleves dans la production est 68,2 grammes avec un cart-type de 2,5 grammes. On effectue
un rglage sur la machine. On prlve un nouvel chantillon de 50 pices. On trouve un poids
moyen de 67, 5 grammes avec un cart-type de 2, 8 grammes. En supposant que les variances
des deux populations sont gales, peut-on affirmer, au risque 5 % que le rglage a modifi le
poids des pices ?
8.4.16. Les ventes quotidiennes d'ordinateurs ralises par une socit informatique durant les
3 premiers mois de 2003, du lundi au jeudi sont comme suit :
Lundi
Mardi
Mercredi
Jeudi
En supposant les conditions de lanalyse de la variance satisfaites, peut-on dire quil y a une
diffrence significative un seuil de 5% entre les moyennes des ventes ralises chaque mois
et entre les moyennes des ventes ralises chaque jour ?
8.5. SOLUTIONS DES EXERCICES DAPPLICATION.
8.5.1. Solution de lexercice 8.4.1.
Pour rpondre cette question, on doit vrifier si le diamtre moyen des 50 billes observes,
est conforme la norme de 6 mm. Il sagit donc de faire un test de conformit de la moyenne.
Hypothse nulle :
Il sagit dun test bilatral H0
m=6
H1 : m 6
161
Statistiques dcisionnelles
Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
x i 350
7
VD =
50
50
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.
(x
^
x )
n
50 2462
(
7) = 0,24
=
n 1
49 50
n 1
^
0,24 = 0,49
VDR =
x m0
^
76
= 14,43
0.49
50
n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ;
2
].
= Z0,975 = 1,96
Statistiques dcisionnelles
H1 : m1 m2
et
Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc:
VDR =
(x 1 x 2 )
(x
x 1 )
(x
x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i
72
66
67
59
52
54
54
57
46
63
58
55
x 2 = 61,1
x 1 = 58,3
54
55
(x
59
61
(x
x 1 ) = 514,1
VDR =
58,3 61,1
514,1 390,9 1
1
( )
10 10 2 10 10
Rgion dacceptation :
VDR = 0,88
163
x 2 ) = 390,9
= - 0,88
58
66
63
75
Statistiques dcisionnelles
Comme lchantillon ne comporte que les personnes (< 30), on peut valablement dire que la loi
de probabilit suivie par la VDR est une loi de STUDENT de 18 (n1 + n2 2) degrs de libert.
Pour = 0,05, la valeur de
VDR < t
et
H1 : m1 > m2
Variable de dcision :
Les deux chantillons sont associs par paires, la variable de dcision centre rduite est donc:
VDR =
d
^
d
n
Reprenons les donnes et calculons les diffrences di
N commercial Aprs formation Avant formation Diffrence (di)
1
4580
3970
610
2
5190
4880
310
3
3940
4090
-150
4
6320
5870
450
5
7680
6930
750
6
3480
4000
-520
7
5720
5080
640
164
Statistiques dcisionnelles
8
9
10
7040
5270
5840
6950
4960
5130
90
310
710
VDR =
d
^
320
= 2,462
410,96
10
n
Rgion dacceptation :
VDR = 2,462
Comme lchantillon ne comporte que les personnes (< 30), on peut valablement dire que la loi
de probabilit suivie par la VDR est une loi de STUDENT de 9 (n-1) degrs de libert.
a) Pour = 0,05, la valeur de t1- avec 9 degrs de libert est :
t0,95 = 1,833
VDR > t1-, on rejette donc lhypothse nulle. Cest dire, on peut conclure que la formation
a eu un effet positif sur les ventes.
b) Pour = 0,01, la valeur de T1 - avec 9 degrs de libert est :
t0,99 = 2,82
VDR t 1 , on accepte donc lhypothse nulle, cest--dire, on peut conclure que la
formation na pas eu un effet positif sur les ventes.
8.5.4. Solution de lexercice 8.4.4.
Pour rpondre cette question, il faut comparer le taux dabsentisme moyen dans les trois
villes. Il sagit de tester l'galit de plusieurs moyennes, cest une analyse de variance un
facteur (ANOVA1).
Formulation de lhypothse nulle :
Il sagit de tester globalement lhypothse de l'galit des moyennes des 3 populations
supposes normales dans lesquelles on suppose que les variances sont gales 12 22 32 .
Ho: m1 = m2 = m3
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les trois sommes des carrs:
165
Statistiques dcisionnelles
Ville
Settat
Casablanca
Eljadida
J=3
STC
nj
2
ij
ji i 1
SCF
Tj2
n
j i
Echantillon
141; 127 ; 111; 124 ; 144
157; 131; 105; 132 ; 163
183; 161; 145 ; 157 ; 189
N = 15
Total
T1 = 647
T2 = 688
T3 = 835
T = 2170
T
2170
141 127 ... 189
8149,33
N
15
T
647 688 835
2170
3908,93
N
5
5
5
15
Degrs de
libert
2
12
14
5,53
A un seuil = 5%, on ne peut pas conclure que l'assiduit des travailleurs leur travail soit
la mme en moyenne dans ces 3 villes puisque la valeur observe 5,53 de F est suprieure la
valeur critique F 0,95 2 et 12 dl = 3,89 obtenue de la distribution de Fisher 2 et 12
degrs de libert.
A un seuil de 1 % ( = 0,01), on peut conclure que lassiduit des travailleurs leur travail est
la mme en moyenne dans ces 3 villes puisque la valeur observe 5,53 de F est infrieure la
valeur critique F0,99 2 et 12 dl = 6,93.
8.5.5. Solution de lexercice 8.4.5.
Pour rpondre cette question, il faut comparer les nombres dunits vendues en moyenne par
les 5 oprateurs assigns aux 4 techniques, soit 20 combinaisons. Il sagit de tester l'galit de
plusieurs moyennes, cest une analyse de variance deux facteurs (ANOVA2) sans interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 20 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m20
166
Statistiques dcisionnelles
STC
i 1
j1
2
ij
SCFA
i 1
SCFB
T2
45
41
39
45
45
215
T3
55
52
48
54
56
265
T4
50
46
42
48
49
235
Total
192
178
167
190
194
921
T
921
42 45 ... 49
548,95
IJ
20
Ti2
T
192 ... 194
921
131,20
J
IJ
4
20
T2j
j1
T1
42
39
38
43
44
206
T
206 ... 235
921
410,15
IJ
5
20
Somme des
carrs
131,2
410,15
7,6
548,95
D.L.
4
3
12
19
Moyenne des
carrs
32,8
136,72
0,63
F
51,79
215,87
En examinant les valeurs F observes 51,79 et 215,87 qui sont toutes deux suprieures aux
valeurs thoriques F 0,95 4 et 12 dl = 3,26 et F 0,95 3 et 12 dl = 3,49 on peut rejeter les
deux hypothses nulles et conclure qu'il y a d'une part, des diffrences significatives entre les
cinq oprateurs quant au nombre dunits vendues et d'autre part, des diffrences significatives
entre les quatre techniques de vente.
167
Statistiques dcisionnelles
I J K
T
508
STC Y 2
25 22 ... 24
2737,33
24
i1 j1 k 1 ijk IJK
SCFA
i 1
Ti2
T
167 341
508
1261,50
JK
IJK
12
24
2
J T j
T
242 149 117 508
SCF
1054,08
B
8
8
8
24
j1 IK IJK
XI
1 j 1
Tj
K
T2
JK
T2j
IK
j 1
T2
IJK
168
Statistiques dcisionnelles
4
12
8
2
508
61,75
24
SCI
Somme des
carrs
1261,5
1054,08
61,75
360
2737,33
D.L.
1
2
2
18
23
Moyenne des
carrs
1261,5
527,04
30,875
20
F
63,075
26,35
1,54
En examinant en tout premier lieu le test sur linteraction, on peut vrifier que la valeur FI =
1,54 est infrieure la valeur critique de la table, soit F 0,95 2 et 18 dl = 3,55. On doit
conclure qu'il n'y a pas d'interaction significative entre les deux facteurs Type d'exprience et
Nombre d'annes d'exprience.
Cette constatation justifie la poursuite de l'analyse de la variance. Comme les valeurs FA=
63,075 et FB =26,35 sont suprieures respectivement aux valeurs critiques de la table F 0,95 1
et 18 dl = 4,41 et F 0,95 2 et 18 dl = 3,55, on doit conclure qu'aussi bien sous l'angle Type
d'exprience que Nombre d'annes d'exprience, il existe globalement des diffrences
significatives entre les groupes.
8.5.7. Solution de lexercice 8.4.7.
Pour rpondre cette question, on doit vrifier si la dure de vie moyenne des 100 tubes
essais observs, est conforme la norme de 1500 heures de chauffage. Il sagit donc de faire un
test de conformit de la moyenne.
Hypothse nulle :
Il sagit dun test unilatral gauche :
H0
m = 1500
H1 : m < 1 500
169
Statistiques dcisionnelles
Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 1485
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.
(x
^
x )
n 1
n 100
=
. 110 = 12222,22
n 1 99
12222,22 = 110,55
VDR =
x m 0
^
1485 1500
= - 1,36
110,55
100
n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
Statistiques dcisionnelles
m = 3000
H1 : m > 3000
Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 3250
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.
(x
^
x )
n 1
n 50
=
. 150 = 22959,18
n 1 49
22959,18 = 151,52
VDR =
x m0
^
3250 3000
= 11,67
151,52
50
n
Rgion dacceptation :
La rgion dacceptation est lintervalle ]- ;
Z1 ].
Statistiques dcisionnelles
et
H1 : m1 m2
Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances ingales, la variable
de dcision centre rduite est donc:
VDR =
(x 1 x 2 )
1 2
n1
n2
avec
x 1 = 640
x 2 = 610
Les variances des deux populations sont estimes par les quasi-variances.
n1 280
=
. 120 = 14451,61
n 1 279
^
n2 300
2 =
=
. 100 = 10033,44
n 1 299
640 610
VDR =
= 3,25
14451,61 10033,44
280
300
^
1 =
172
Statistiques dcisionnelles
Rgion dacceptation :
VDR = 3,25
Pour = 0,05, la valeur de
est :
Z0,975 = 1,96
VDR > Z
budget familial consacre aux loisirs est diffrente suivant que la famille habite le centre-ville
ou la banlieue.
Pour = 0,001, la valeur de
est :
Z0,9995 = 3,29
VDR Z
budget familial consacr aux loisirs est le mme pour les 2 milieux.
8.5.10. Solution de lexercice 8.4.10.
Pour rpondre cette question, on doit vrifier si la longueur moyenne des 100 tiges
mtalliques est conforme la norme de 100 cm. Il sagit donc de faire un test de conformit de
la moyenne.
Hypothse nulle :
Il sagit dun test bilatral :
H0
m = 100 H1 : m 100
Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 100,04
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.
173
Statistiques dcisionnelles
(x
^
x )
n 1
n 100
=
. 0,16 = 0,026
n 1 99
0,026 = 0,1608
VDR =
x m0
^
100,04 100
= 2,49
0,1608
100
n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ;
2
].
Z = Z0,025 = -1,96 et Z
2
= Z0,975 = 1,96
Z = Z0,005 = -2,58 et Z
2
= Z0,995 = 2,58
174
Statistiques dcisionnelles
et
H1 : m1 > m2
Variable de dcision :
Les deux chantillons sont associs par paires, la variable de dcision centre rduite est donc:
VDR =
d
^
d
n
VDR =
d
^
5,5
= 7,49
2,3214
10
n
175
Statistiques dcisionnelles
Rgion dacceptation :
VDR = 7,49
Pour = 0,05, la valeur de t1- avec 9 degrs de libert est :
t0,95 = 1,833
VDR > t1-, on rejette donc lhypothse nulle. Cest--dire, on peut conclure que la nouvelle
mthode de promotion a un effet positif sur les ventes.
8.5.12. Solution de lexercice 8.4.12.
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si le poids moyen net des sachets m1 du premier chantillon est ou
nest pas gale au poids moyen net des sachets m2 du deuxime chantillon.
Il sagit dun test bilatral :
H0 : m1 = m2
et
H1 : m1 m2
Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc:
VDR =
(x 1 x 2 )
(x
x 1 )
(x
x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i
190
210
200
204
202
203
195
189
194
194
208
195
205
206
206
201
x 2 = 200,1667
198
200
x 1 = 199,4
(x
196
205
(x
x 1 ) = 306,4
176
x 2 ) = 381,6667
198
197
Statistiques dcisionnelles
VDR =
199,4 200,1667
306,4 381,6667 1
1
( )
10 12 2
10 12
= - 0,31
Rgion dacceptation :
VDR = 0,31
Pour = 0,05, la valeur de
VDR < t
, on accepte donc lhypothse nulle. Cest--dire, ces deux rsultats ne sont pas
STC
2
ij
j i
SCF
nj
Y
J
i 1
T j2
n
j i
Alim. 6
690
650
680
740
2760
T
14450
590 760 ... 740
215595,83
N
24
T
2690 1900
2760
14450
...
139520,83
N
4
4
4
24
177
14450
Statistiques dcisionnelles
Somme des
carrs
139520,83
76075
215595,83
Degrs de
libert
5
18
23
Moyenne des
carrs
27904,17
4226,39
F obs
6,6
A un seuil = 5%, on ne peut pas conclure que le gains quotidiens en poids soit le mme en
moyenne pour les 6 alimentations puisque la valeur observe 6,6 de F est suprieure la
valeur critique F 0,95 5 et 18 dl = 2,77 obtenue de la distribution de Fisher 5 et 18
degrs de libert.
Au seuil = 0,001, on peut conclure que les gains quotidiens en poids est le mme en
moyenne pour les 6 alimentations puisque la valeur observe 6,6 de F est infrieure la valeur
critique F0,999 5 et 18 dl = 6,8.
8.5.14. Solution de lexercice 8.4.14.
Pour rpondre cette question, il faut comparer la consommation moyenne du produit de luxe
dans chacun des 6 groupes. Il sagit de tester l'galit de plusieurs moyennes, cest une analyse
de variance deux facteurs (ANOVA2) sans interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 6 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m4 = m5 = m6
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les quatre sommes des carrs:
Sexe
Fminin
Masculin
Total
Moins de
20 ans
27
32
59
Catgorie d'ge
Entre 20 et
45 ans
39
45
84
178
Plus de 45 ans
54
62
116
Total
120
139
259
Statistiques dcisionnelles
STC
i 1
j1
2
ij
SCFA
i 1
SCFB
Ti2
T
120 139
259
60,17
J
IJ
3
6
T2j
j1
T
259
27 39 ... 62
878,83
IJ
6
T
59 84 116
259
816,33
IJ
2
6
Somme des
carrs
60,17
816,33
2,33
878,83
D.L.
1
2
2
5
Moyenne des
carrs
60,17
408,17
1,17
F
51,43
348,86
En examinant les valeurs F observes 51,43 et 348,86 qui sont toutes deux suprieures aux
valeurs thoriques F 0,95 1 et 2 dl = 18,51 et F 0,95 2 et 2 dl = 19 on peut rejeter les deux
hypothses nulles et conclure qu'il y a d'une part, des diffrences significatives entre les deux
sexes quant la consommation du produit de luxe et d'autre part, des diffrences significatives
entre les trois catgories dge.
8.5.15. Solution de lexercice 8.4.15.
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si le poids moyen des pices m1 avant le rglage est ou nest pas
infrieur au poids moyen des pices m2 aprs le rglage.
Il sagit dun test bilatral :
H0 : m1 = m2
et
179
H1 : m1 m2
Statistiques dcisionnelles
Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc :
(x1 x 2 )
VDR =
(x i x 1 ) (x i x 2 ) ( 1 1 )
n1 n 2 2
n1 n 2
x1 = 68,2
x 2 = 67,5
(x x ) = 2,5 . 50 = 312,5
(x x ) = 2,8 . 50 = 392
1
VDR =
68,2 67,5
312,5 392 1
1
( )
50 50 2 50 50
= 1,3
Rgion dacceptation :
VDR = 1,3
Pour = 0,05, la valeur de
VDR < Z
Statistiques dcisionnelles
Lundi
Janvier 2003
13
9
8
7
Fvrier 2003
9
5
8
12
Mars 2003
7
15
14
10
37
8
6
6
7
34
11
4
9
5
46
17
14
12
13
112
27
6
10
7
4
29
10
2
8
3
56
6
14
12
13
95
27
1
10
7
5
23
114
23
6
10
12
9
37
123
45
10
8
4
9
31
178
Mardi
Mercredi
Jeudi
Total
Total
117
91
415
I J K
T
415
STC Y 2
13 9 ... 9
604,98
48
i1 j1 k 1 ijk IJK
SCFA
Ti2
JK
i 1
T
117 112 95 91
415
40,23
IJK
12
48
2
J T j
T
114 123 178 415
SCF
150,04
B
16
16
16
48
j1 IK IJK
181
Statistiques dcisionnelles
SCI
i j
j1
Tij2
i 1
Ti2
JK
T2j
IK
j1
T2
IJK
4
12
114 2 123 2 178 2 415 2
93,6
8
48
SCE = 604,98 40,23 150,04 93,96 = 320,75
SCI
182
Statistiques dcisionnelles
CHAPITRE 9
TESTS SUR LES VARIANCES
02 , appele norme.
H0
2 02
x
n
VD
11
02
La variable de dcision possde une distribution khi deux (n-1) degrs de libert.
9.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : =
02
et
183
H1 :
02
Statistiques dcisionnelles
Les valeurs critiques qui dlimitent la rgion dacceptation sont 1 et 2 telles que :
p (12 VD 22 ) 1
p (VD 12 ) / 2 12 2a
2
p (VD 22 ) / 2 p (VD 22 ) 1 / 2 22 2
a
2
H 0 : 2 02
et
H 1 : 2 02
p (VD 2 ) 1 2 12
H 0 : 2 02
et
H 1 : 2 02
p (VD 2 ) 2 2
La rgion dacceptation est donc lintervalle 2 ; .
9.2. TEST SUR DEUX ECHANTILLONS.
Ce test a pour but de comparer les variances de deux populations laide de deux chantillons
indpendants.
184
Statistiques dcisionnelles
12 22
H0
12 22
et
H1
12 22
Les valeurs critiques qui dlimitent la rgion dacceptation sont F1 et F2 telles que :
p(F1 VD F2) = 1 -
p(VD < F1) = /2
F1 =
F
2
185
F2 =
Statistiques dcisionnelles
x 2462
350
72
66
67
59
52
54
54
57
186
46
63
58
55
59
61
54
55
58
66
63
75
Statistiques dcisionnelles
9.3.4. Un fabricant de tubes essais pour laboratoire fonde sa publicit sur le fait que la dure
de vie de ses tubes correspond 1500 heures de chauffage laide d'un bec Bunzen avec un
cart type de 100 heures. Un laboratoire de contrle de publicit constate que sur 100 tubes
essais, la dure moyenne de vie est de 1485 heures de chauffage avec un cart-type de 110
heures. Au risque 5%, lcart type de la dure de vie des tubes essais est-il diffrent de 100
heures de chauffage ?
9.3.5. Les moteurs des appareils lectromnagers d'une marque M ont une dure de vie
moyenne de 3000 heures avec un cart-type de 150 heures. A la suite d'une modification dans
la fabrication des moteurs, le fabricant affirme que les nouveaux moteurs ont une dure de vie
suprieure celle des anciens avec un cart type plus rduit. On a test un chantillon de 50
nouveaux moteurs et on a trouv une dure de vie moyenne de 3250 heures avec un cart-type
gal 145 heures. Les nouveaux moteurs apportent-ils une amlioration dans la dispersion de
la dure de vie des appareils lectromnagers au risque de 5% ?
9.3.6. Dans une grande ville d'un pays donn, une enqute a t ralise sur les dpenses
mensuelles pour les loisirs. On a observ les rsultats suivants :
Sur 280 familles habitant le centre-ville, les dpenses mensuelles pour les loisirs sont en
moyenne de 640 dh avec un cart-type de 120 dh.
Sur 300 familles habitant la banlieue, les dpenses mensuelles pour les loisirs sont en
moyenne de 610 dh avec un cart-type de 100 dh.
Peut-on dire au risque de 5 % que la variance de la part du budget familial consacr aux loisirs
est diffrente suivant que la famille habite le centre-ville ou la banlieue ?
9.3.7. On prlve dans la production d'une machine, un chantillon de 100 tiges mtalliques. La
moyenne des longueurs des tiges de cet chantillon est 100,04 cm avec un cart-type de 0,16
cm. La machine est rgle en principe pour obtenir un cart type des longueurs des tiges de
0,12 cm.
1) Au risque de 5 %, peut-on dire que la machine est bien rgle ?
2) Reprendre la question prcdente avec un risque de 1 %.
9.3.8. Dans le but de contrler le poids net des sachets d'un produit alimentaire, on a prlev
deux chantillons respectivement de 10 et 12 sachets, on a obtenu les rsultats suivant (en
grammes) :
1
2
190
210
200
204
202
203
195
189
194
194
208
195
205
206
196
205
198
200
206
201
198
197
Ces deux rsultats sont-ils significativement diffrents en ce qui concerne les carts types des
poids %.
187
Statistiques dcisionnelles
9.3.9. Une machine fabrique des pices identiques. La moyenne des poids de 50 pices
prleves dans la production est 68,2 grammes avec un cart-type de 2,5 grammes. On effectue
un rglage sur la machine. On prlve un nouvel chantillon de 50 pices. On trouve un poids
moyen de 67, 5 grammes avec un cart-type de 2, 8 grammes. Peur-on affirmer, au risque 5 %
que le rglage a modifi lcart-type du poids des pices ?
9.3.10. Un tour oprateur veut mettre un nouveau produit son catalogue. La rentabilit de ce
produit suppose, en moyenne, 50 rservations hebdomadaires au minimum par agence avec un
cart type maximum de 2 rservations. A titre de test, il dcide de linclure au catalogue dun
chantillon alatoire de 10 de ses agences. On a not le nombre de rservations observes
durant une semaine dans les 10 agences :
51 ; 48 ; 58 ; 55 ; 52 ; 49 ; 50 ; 54 ; 53 ; 52
Peut-on conclure, au seuil de 5 %, puis de 1 % que lcart type est effectivement infrieur 2
rservations ?
9.4. SOLUTIONS DES EXERCICES DAPPLICATION.
9.4.1. Solution de lexercice 9.3.1.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test bilatral.
H0
Variable de dcision :
La variable de dcision du test correspond :
n
VD
(i )
i 1
02
6,6
3,37
1,96
Statistiques dcisionnelles
02,995 26,8
et
H0
2 0,45 2
et
2 0,45 2
H1
Variable de dcision :
n
VD
i 1 (x i x ) 2
02
50 (
2462
350 2
(
) )
50
50
59,26
0,45 2
Rgion dacceptation :
Il sagit dun test unilatral droite.
Pour
libert.
Le nombre de degrs de libert est grand (k > 30), on peut trouver lapproximation de la valeur
de 2 par la loi normale.
2
0,95
49 dl
(Z 0,95 2k 1) 2
2
189
(1,64 2 x 49 1) 2
2
66
Statistiques dcisionnelles
H0
12 22
et
H1
12 22
Variable de dcision :
VD
Rgion dacceptation :
Pour = 0,05 la valeur de F
12 57,12
1,31
22 43,43
H0
12 22
et
190
H1
12 22
Statistiques dcisionnelles
Variable de dcision :
La variable de dcision du test correspond :
100
(x
VD =
x )
i 1
2
0
110.100
= 121
10000
Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 99 et dcart type
2 99 14,07 .
et
0,975 = 126,58
Statistiques dcisionnelles
H0
H1 : < 22500
Variable de dcision :
La variable de dcision du test correspond :
50
(x
VD =
x )
i 1
145.50
= 46,7
22500
02, 05
Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 49 et dcart type
2 49 9,9 .
( Z 2k 1)
2
do :
02, 05
( Z 0 , 05 2 x 49 1) 2
2
( 1,64 2 x 49 1) 2
2
33,7
Statistiques dcisionnelles
H0
12 22
et
H1
12 22
Variable de dcision :
VD
12
22
Les variances des deux populations sont estimes par les quasi-variances.
^
n1 280
=
. 120 = 14451,61
n 1 279
n2 300
=
. 100 = 10033,44
n 1 299
1 =
2 =
VD =
14451,61
= 1,44
10033,44
Rgion dacceptation :
En consultant la table de Fisher pour = 0,05, la valeur de F
193
Statistiques dcisionnelles
= 0,12 = 0,0144
H1 : 0,0144
Variable de dcision :
La variable de dcision du test correspond :
100
(x
x )
0,16.100
=
= 177,78
0
0,0144
La variable de dcision possde une distribution khi deux 99 degrs de libert.
VD =
i 1
Rgion dacceptation :
Les valeurs critiques qui dlimitent la rgion dacceptation sont :
et 1 .
2
2 99 14,07 .
Statistiques dcisionnelles
de mme :
0,975 99 dl = Z0,975 x 14,07 + 99
0,975 99 dl = 1,96 x 14,07 + 99 = 126,58
0,025 = 71,42
et
0,975 = 126,58
2 99 14,07 .
195
Statistiques dcisionnelles
H0
H1
1 2
Variable de dcision :
^
VD =
Rgion dacceptation :
Pour = 0,05 la valeur de F
1
^
34,70
= 1,02
34,04
1 = 2et
H1
Variable de dcision :
^
VD =
1
^
196
1 2
Statistiques dcisionnelles
Les variances des deux populations sont estimes par les quasi-variances.
^
1 =
n1 50
=
. 2,5 = 6,38
n 1 49
2 =
n2 50
=
. 2,8 = 8
n 1 49
VD =
8
= 1,25
6,38
Rgion dacceptation :
En consultant la table de Fisher pour = 0,05, la valeur de
avec 49 et 49 degrs de
H1 : < 4
et
Variable de dcision :
La variable de dcision du test correspond :
10
(x x)
i
VD =
i 1
79,6
= 19,9
4
Statistiques dcisionnelles
Rgion dacceptation :
La rgion dacceptation est lintervalle [ ; +[.
Au seuil de signification de 95 % ( = 0,05)
0,05 = 3,325
La rgion dacceptation est donc lintervalle [3,325 ; +[.
On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.
Cest--dire au seuil 5 %, lcart type est effectivement infrieur 2 rservations.
Au seuil de signification de 99 % ( = 0,01)
02, 01 2,09
La rgion dacceptation est lintervalle [2,09 ; + ] on accepte lhypothse nulle.
198
Statistiques dcisionnelles
CHAPITRE 10
TESTS SUR LES PROPORTIONS
p = p0
Statistiques dcisionnelles
H1 : p p 0
et
Les valeurs critiques qui dlimitent la rgion dacceptation sont les valeurs dune variable
normale rduite Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2
Z1 =
Z
2
Z1
2
Z1 ].
2
VDR > Z1
2
et
H1 : p > p 0
La valeur critique qui dlimite la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR Z) = 1 -
200
Z1 ].
Z=
Z1
Statistiques dcisionnelles
et
H1 : p < p 0
La valeur critique qui dlimite la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR < Z) =
Z = Z
La rgion dacceptation est donc lintervalle [ Z ; +[.
10.2. TEST SUR DEUX ECHANTILLONS.
Ce test a pour but de comparer les proportions de deux populations laide de deux
chantillons indpendants.
10.2.1. Formulation de lhypothse nulle.
Ce test a pour but de vrifier si la proportion p1 dune population est ou nest pas gale la
proportion p2 dune autre population.
Lhypothse nulle est donc : H0
p1 = p2
Statistiques dcisionnelles
f n1 n 2
X 1 X 2 n 1 fn 1 n 2 fn 2
n1 n 2
n1 n 2
Sous lhypothse nulle, la variable de dcision suit une loi normale de moyenne (p 1-p2) = 0 et
dcart type :
p (1 p) p (1 p)
=
n1
n2
f n1 n 2 (1 f n1 n 2 ) (
1
1
)
n1 n 2
f n1 f n 2
VDR
f n1 n 2 (1 f n1 n 2 )(
1
1
)
n1 n 2
H1 : p 1 p 2
et
Z1 ].
2
202
Statistiques dcisionnelles
VDR > Z1
2
203
Statistiques dcisionnelles
et
H1 : p 1 > p 2
Z1 ].
et
H1 : p 1 < p 2
Echantillon
1
n11
n12
n1.
204
Echantillon
Echantillon
2
k
n21
nk1
n22
nk2
n2.
nk.
Statistiques dcisionnelles
Sous lhypothse nulle p1 = p2 = ... = pk, il y a la mme proportion inconnue p dans les k
populations. Cette proportion peut tre estime par la frquence observe f dans lchantillon
unique qui est la runion des k chantillons.
n 11 n 21 n k1
n1 n 2 n k
Echantillon 1 Echantillon 2
f n1.
f n2.
(1 f) n1.
(1 f) n2.
n1.
n2.
Echantillon k
f nk.
(1 f) nk.
nk.
On est amen confronter les effectifs observs et les effectifs thoriques. On calcule la
variable de dcision VD :
VD = (effectif observ-effectif thorique)2 / effectif thorique
On peut dmontrer que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert.
10.3.3. Rgion dacceptation.
La variable de dcision est nulle lorsque les effectifs observs sont tous gaux aux effectifs
attendus, cest--dire, lorsquil y a concordance absolue entre la distribution observe et la
distribution thorique. La valeur de la variable de dcision est dautant plus grande que les
carts entre les effectifs observs et attendus sont plus grands. La valeur critique qui dlimite la
rgion dacceptation est telle que :
p(VD < ) = 1 -
= 1-
Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1- avec (k-1) degrs de libert.
205
Statistiques dcisionnelles
Possdent le bac
ne possdent pas le bac
hommes femmes
32
26
64
78
206
Statistiques dcisionnelles
10.4.6. Dans une population, on interroge un chantillon alatoire de 400 personnes dont 160
sont ges de 18 40 ans et 240 sont ges de plus de 40 ans. On a trouv que le pourcentage
des personnes propritaires de leur logement dans les deux groupes sont respectivement 35% et
45%. Ces deux rsultats sont-ils significativement diffrents au seuil de signification de
5 % puis de 1 % ?
10.4.7. Le tableau suivant donne le nombre dtudiants qui ont t brillants et mdiocres devant
trois examinateurs :
Brillants
Mdiocres
Total
Examinateur 1
50
5
55
Examinateur 2
47
14
61
Examinateur 3
56
8
64
Total
153
27
180
207
Statistiques dcisionnelles
10.4.13. Un laboratoire annonce que l'un de ses mdicaments est efficace 95 %. Sur un
chantillon de 400 personnes le traitement s'est rvl efficace sur 368 d'entre elles. Quel
risque faut-il accepter si l'on considre que l'affirmation du laboratoire est lgitime ?
10.4.14. Une entreprise commerciale succursales multiples procde un sondage dans ses
magasins de Rabat et Casablanca. A Rabat, sur 1000 clients interrogs, 350 dclarent souhaiter
que le magasin reste ouvert jusqu 21 heures tandis qu Casablanca, sur 900 clients, 280 ont
mis ce mme vu. Lentreprise peut-elle, au seuil de signification de 5 % puis de 10 %,
considrer que sa clientle de Rabat ragit comme celle de Casablanca ?
10.5. SOLUTIONS DES EXERCICES DAPPLICATION.
10.5.1. Solution de lexercice 10.4.1.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas infrieur la norme de 52 %. Il sagit donc de faire un test de conformit de
la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche.
H0
Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn =
800
= 0,50
1600
pq
n
fn p0
p 0 (1 p 0 )
n
0,50 0,52
0,52(1 0,52)
1600
208
= - 1,60
(la
Statistiques dcisionnelles
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
a) Au seuil de signification de 95 % ( = 0,05) :
Z = Z0,05 = -1,65
Z Z 0 ,1 1,28
La rgion dacceptation est [- 1,28 ; + ]. On rejette lhypothse nulle. Ce rsultat est donc
significatif dune dsaffection des lecteurs pour ce candidat.
10.5.2. Solution de lexercice 10.4.2.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes actives dans le milieu rural est
ou nest pas gale la proportion p2 des personnes actives dans le milieu urbain.
Il sagit dun test bilatral : H0 : p1 = p2
H1 : p 1 p 2
et
Variable de dcision :
Daprs les donnes :
f n1
74
= 0,64
115
f n 2 n 2
f n2
155
= 0,70
220
209
81
= 0,77
105
Statistiques dcisionnelles
f n1 f n 2
VDR =
f n1 n 2(1 f n1 n 2)(
1
1
)
n1 n 2
0,64 0,77
VDR =
= -2,10
1
1
0,70(1 0,70)(
)
115 105
Rgion dacceptation :
Pour = 0,05 la valeur de
Rabat
73,48
260,52
334
210
Tanger
63,36
224,64
288
Oujda
68,64
243,36
312
Agadir
52,8
187,2
240
Statistiques dcisionnelles
73,48
260,52
63,36
224,64
68,64
243,36
+
= 11,65
52,8
187,2
La variable de dcision est une variable alatoire Khi deux avec 3 degrs de libert.
Rgion dacceptation :
La rgion dacceptation est donc lintervalle 0 ; 12 .
acceptera donc lhypothse nulle, cest--dire au seuil de 1 %, lintention de vote pour ce parti
est identique dans les quatre villes.
10.5.4. Solution de lexercice 10.4.4.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des hommes possdant le bac est ou nest pas
gale la proportion p2 des femmes possdant le bac.
Il sagit dun test bilatral : H0 : p1 = p2
et
H1 : p 1 p 2
211
Statistiques dcisionnelles
Variable de dcision :
Daprs les donnes :
Possdent le bac
Ne possdent pas le bac
Total
32
f n1
= 0,33
96
f n 2 n 2
58
= 0,29
200
f n1 f n 2
VDR =
f n1 n 2(1 f n1 n 2)(
1
1
)
n1 n 2
0,33 0,25
VDR =
= 1,25
1
1
0,29(1 0,29)(
)
96 104
Rgion dacceptation :
Pour = 0,05 la valeur de
significative entre la proportion des hommes possdant le bac et celle des femmes possdant le
bac.
10.5.5. Solution de lexercice 10.4.5.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas suprieur la norme de 15,6 % annonce par le gouvernement. Il sagit
donc de faire un test de conformit de la proportion.
Hypothse nulle :
Il sagit dun test unilatral droite
H0
p = 0,156
H1 : p>< 0,156
212
Statistiques dcisionnelles
Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn = 0,164
La distribution de la proportion suit une loi normale de moyenne p et dcart type
pq
(la
n
taille de lchantillon est suprieure 30 et le produit n p > 5).
La variable de dcision rduite est :
VDR =
fn p0
p 0 (1 p 0 )
n
0,164 0,156
Rgion dacceptation :
La rgion dacceptation est lintervalle ]- ;
0,156(1 0,156)
4900
= 1,54
Z1 ].
Z1 = Z0,95 = 1,65
et
H1 : p 1 p 2
Variable de dcision :
Daprs les donnes :
f n1 = 0,35
f n 2 n 2
f n2 = 0,45
160.0,35 240.0,45
= 0,41
160 240
213
Statistiques dcisionnelles
f n1 f n 2
VDR =
f n1 n 2(1 f n1 n 2)(
1
1
)
n1 n 2
0,35 0,45
VDR =
= -1,99
1
1
0,41(1 0,41)(
)
160 240
Rgion dacceptation :
- Pour = 0,05 la valeur de
diffrence significative entre les proportions de personnes propritaires de leur logement dans
les deux tranches dge.
- Pour = 0,01 la valeur de
VDR Z
27
0,15
180
214
Statistiques dcisionnelles
Brillants
Mdiocres
Total
Examinateur 2
51,85
9,15
61
Examinateur 3
54,40
9,60
64
46,75
51,85
54,40
(5 8,25) (14 9,15) (8 9,60)
8,25
9,15
9,60
VD = 4,84
La variable de dcision est une variable alatoire Khi deux avec 2 degrs de libert.
Rgion dacceptation :
La rgion dacceptation est donc lintervalle [0 ; 1-[.
- Au seuil de signification de 5 %, la valeur 0,95 2 degrs de libert est gale 5,99.
La valeur de la variable de dcision est infrieure la valeur 0,95 2 degrs de libert, on
acceptera donc lhypothse nulle, cest--dire au seuil de signification de 5 %, le nombre
dtudiants mdiocres est le mme pour chaque examinateur.
- Au seuil de signification de 10 %, la valeur
215
Statistiques dcisionnelles
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes qui voteraient pour le candidat
A, estime par linstitut X, est ou nest pas gale la proportion p 2 des personnes qui voteraient
pour le candidat A, estime par linstitut Y.
Il sagit dun test bilatral : H0 : p1 = p2
et
H1 : p 1 p 2
Variable de dcision :
Daprs les donnes :
f n1 = 0,47
f n2 = 0,50
1600.0,47 2500.0,50
= 0,49
1600 2500
f n 2 n 2
f n1 f n 2
VDR =
f n1 n 2(1 f n1 n 2)(
1
1
)
n1 n 2
0,47 0,50
VDR =
= -1,11
1
1
0,49(1 0,49)(
)
1600 2500
Rgion dacceptation :
Pour = 0,05 la valeur de
diffrence significative entre les rsultats obtenus par les deux instituts.
10.5.9. Solution de lexercice 10.4.9.
Pour rpondre cette question, on doit vrifier si le pourcentage obtenu par lexprience, est ou
nest pas gal au pourcentage thorique, cest--dire la probabilit davoir les faces 5 ou 6 lors
du jet dun d quilibr.
Probabilit davoir les faces 5 ou 6 lors du jet dun d quilibr est de 2 sur 6, soit 0,333.
Hypothse nulle :
Il sagit dun test bilatral :
H0
H1 : p 0,333
p = 0,333
216
Statistiques dcisionnelles
Variable de dcision :
La variable de dcision du test correspond la frquence fn de lexprience :
VD = fn =
106602
= 0,338
315672
pq
(la
n
taille de lchantillon est suprieure 30 et le produit n p > 5).
La variable de dcision rduite est :
fn p0
VDR =
Rgion dacceptation :
Pour = 0,05 la valeur de
p 0 (1 p 0 )
n
0,338 0,333
0,333(1 0,333)
315672
= 5,96
VDR > Z1 , on rejette donc lhypothse nulle. Cest--dire, au seuil 5 % le d nest pas
2
quilibr.
10.5.10. Solution de lexercice 10.4.10.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas infrieur la norme de 95 %. Il sagit donc de faire un test de conformit de
la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche :
H0
Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn =
182 = 0,91
200
pq
n
217
(la
Statistiques dcisionnelles
0,91 0,95
0,95(1 0,95)
200
= - 2,60
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
- Au seuil de signification de 95 % ( = 0,05) :
Z = Z0,05 = -1,65
et
H1 : p 1 p 2
Variable de dcision :
Daprs les donnes :
f n1 = 0,52
f n 2 n 2
f n2 = 0,49
450.0,52 300.0,49
= 0,51
450 300
218
Statistiques dcisionnelles
f n1 f n 2
VDR =
f n1 n 2(1 f n1 n 2)(
1
1
)
n1 n 2
0,52 0,49
VDR =
= 0,54
1
1
0,51(1 0,51)(
)
450 300
Rgion dacceptation :
Pour = 0,05 la valeur de
diffrence significative entre les intentions de vote pour le parti M dans les deux villes
Casablanca et Rabat.
10.5.12. Solution de lexercice 10.4.12.
Pour rpondre cette question, on doit vrifier si le pourcentage obtenu par le test, nest pas
infrieur la norme de 90 %. Il sagit donc de faire un test de conformit de la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche
H0
Variable de dcision :
La variable de dcision du test correspond la frquence fn du test :
VD = fn =
160 = 0,80
200
pq
n
219
(la
Statistiques dcisionnelles
fn p0
p 0 (1 p 0 )
n
0,80 0,90
0,90(1 0,90)
200
= - 4,71
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
Z = Z0,05 = -1,65
Variable de dcision :
La variable de dcision du test correspond la frquence fn du test :
VD = fn =
368
= 0,92
400
pq
n
fn p0
p 0 (1 p 0 )
n
220
0,92 0,95
0,95(1 0,95)
400
= - 2,75
(la
Statistiques dcisionnelles
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
Le seuil de signification est inconnu. Pour accepter lhypothse nulle, la variable de dcision
rduite doit appartenir la rgion dacceptation. Z doit donc tre infrieure ou gale 2,75.
Z = -2,75
= 0,003
=>
H1 : p 1 p 2
et
Variable de dcision :
Daprs les donnes :
f n1 = 350 = 0,35
1000
f n2 = 280 = 0,31
900
f n1 f n 2
f n1 n 2(1 f n1 n 2)(
VDR =
1
1
)
n1 n 2
0,35 0,31
1
1
0,33(1 0,33)(
)
1000 900
221
= 1,85
Statistiques dcisionnelles
Rgion dacceptation :
Pour = 0,05 la valeur de Z
VDR < Z1 , on accepte donc lhypothse nulle. Cest--dire lentreprise peut, au seuil de
2
signification de 5%, considrer que sa clientle de Rabat ragit comme celle de Casablanca.
Pour = 0,1 la valeur
VDR Z
est :
Z0,95 1,64
222
Statistiques dcisionnelles.
CHAPITRE 11
TESTS NON PARAMETRIQUES
p
i 1
i 1
i 1
n i = npi = n
Variable de dcision :
On distingue deux cas dapplication de ces tests, selon que la distribution thorique est ou nest
pas compltement dfinie. Dans le premier cas, la variable de dcision peut tre calcule
immdiatement. Dans le second cas, la distribution de probabilit de la population nest dfinie
quen fonction dun ou de plusieurs paramtres, ceux-ci doivent pralablement tre estims
partir des donnes de lchantillon.
223
Statistiques dcisionnelles.
VD
i 1
(n i np i ) 2
np i
On peut dmontrer que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert. k correspond au nombre de classes aprs regroupement.
La variable de dcision peut tre calcule plus facilement par :
VD
n i2
np
i 1
n
i
probabilits estimes
n i2
np
i 1
n
i
224
= 1-
Statistiques dcisionnelles.
fi
nj
ni
et f j
sont les frquences relatives marginales.
n
n
ni. et n.j sont les effectifs marginaux, et nij les effectifs conjoints.
Les effectifs attendus correspondants sont donc :
np ij nfi x fj n
ni. n. j ni. x n. j
n n
n
les effectifs observs nij et les effectifs attendus ou thoriques correspondants n pij .
Lhypothse nulle est lindpendance des deux critres de classification.
^
H0 : nij = n pij
225
Statistiques dcisionnelles.
Variable de dcision :
La comparaison des effectifs observs et attendus se fait comme pour les tests dajustement, en
calculant la variable de dcision suivante :
VD =
n ij
i 1
j1
n p ij
-n
On dmontre que la variable de dcision est une variable alatoire Khi deux avec (p-1)(q-1)
degr de libert.
Rgion dacceptation :
La valeur critique qui dlimite la rgion dacceptation est telle que :
p(VD < ) = 1 -
= 1-
Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1-.
11.3. ENONCES DES EXERCICES DAPPLICATION.
11.3.1. Le tableau suivant donne la distribution de frquences des nombres de garons observs
dans 1600 familles de 4 enfants, considres comme choisies au hasard au sein dune trs large
population. En fonction de ces rsultats, peut-on affirmer, au seuil de 5 %, puis de 1 % que le
nombre de garons suit une loi binomiale ?
Nombre de garons Nombre de familles
0
113
1
367
2
576
3
426
4
118
Total
1600
11.3.2. Au concours dentre une cole, lpreuve de culture gnrale est note de 0 50. On
tire au hasard un chantillon de 100 candidats et lon relve que les notes quils ont obtenues se
classent en cinq tranches de la manire suivante :
226
Statistiques dcisionnelles.
Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50
Nombre de candidats
10
20
30
20
20
Le jury se demande sil est justifi de considrer que la distribution des notes suit une loi
normale dans la population de tous les candidats.
a) Au seuil de 5 %.
b) Au seuil de 1 %.
11.3.3. Une enqute a t ralise auprs dun chantillon de 500 individus prlev au sein
dune population cible de 4 millions d'individus. Les donnes que l'on possde sur cette
population sont les suivantes :
Hommes 48% soit 1,92 millions dhommes
Femmes 58% soit 2,08 millions de femmes
Sexe
Niveau dinstruction
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
Total
Hommes
% Effectifs
35
672000
30
576000
15
288000
13
249600
7
134400
100 1920000
Femmes
Total
% Effectifs
50 1040000 1712000
25
520000 1096000
10
208000
496000
10
208000
457600
5
104000
238400
100 2080000 4000000
Au dpouillement, on a trouv que les individus qui ont form lchantillon ont les
caractristiques suivantes :
Sexe
Niveau dinstruction
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
Total
Hommes
Femmes
Total
% Effectifs % Effectifs
32
61
54
112
173
28
54
23
48
102
18
35
12
25
60
14
27
8
17
44
8
15
3
6
21
100
192
100
208
400
227
Statistiques dcisionnelles.
11.3.4. On a enregistr plusieurs fois de suite le nombre de personnes qui se sont prsent un
guichet automatique bancaire, pendant des temps de 5 minutes.
Nombres darrives
Frquences absolues observes
0
1
1
4
2 3 4 5 6
12 18 22 17 11
7
6
8
4
9
3
10
2
O
251
A
219
B
29
AB
26
O
44,5%
A
44%
B
8%
AB
3,5%
228
Statistiques dcisionnelles.
11.3.7. Un tour oprateur souhaite segmenter son march. Il se demande sil existe un lien
entre le choix dune destination de vacances et le niveau dinstruction. Les donnes recueillies
ont t structures sous forme de tableau de contingence.
Niveau
dinstruction
Primaire
Secondaire
Suprieur
Total
Destination de vacances
Mer
Montagne
Dsert
300
50
100
250
80
20
50
120
30
600
250
150
Total
450
350
200
1000
11.3.8. Le directeur de ventes dun laboratoire pharmaceutique veut savoir sil existe des
diffrences significatives entre les rgions en terme de niveau daccueil dun nouveau produit.
Les rsultats suivants ont t obtenus auprs dun chantillon alatoire de clients :
Rgions
Nord Est Sud Ouest
22
35
0
5
84
55
8
24
25
17 22
12
Niveau daccueil
Faible
Modr
Elev
Le niveau daccueil dpend-t-il de la rgion ?
11.3.9. Les 150 tudiants dune cole doivent choisir entre trois disciplines pour leur activit
parascolaire. Le choix des tudiants selon le sexe a t comme suit :
Sexe
Fille
Garon
Total
Sport
20
43
63
Discipline
Musique
28
16
44
Thtre
32
11
43
Total
80
70
150
Peut-on affirmer au seuil de 5 % puis de 1 % que le choix des tudiants dpend de leur sexe ?
11.3.10. Le tableau ci-dessous donne la rpartition de 10000 tudiants dune universit selon la
filire dtude et la profession des parents.
Filire
Sciences
Mdecine et
Droit
LettresSciences
PharmacieAutre Total
Profession
conomiques
dentaire
Exploitant agricole 80
35
135
99
65
28
69
511
Salari agricole
6
2
15
6
4
1
5
39
Patron
168
74
312
137
208
53
83 1035
Profession librale 470
191
806
400
876
164
124 3031
229
Statistiques dcisionnelles.
et cadre sup
Cadre moyen
236
Employ
145
Ouvriers
166
Personnel de service 16
Autres
305
Total
1592
99
52
64
6
115
638
493
281
401
27
624
3094
264
133
193
11
247
1490
281
135
127
8
301
2005
56
30
23
2
47
404
123 1552
74
850
157 1131
10
80
132 1771
777 10000
H0 : ni = npi
n = np
avec
i 1
=n
i 1
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi binomiale.
La probabilit davoir un garon est suppose gale 0,5, la loi binomiale qui caractrise le
nombre de garons dans une famille de 4 enfants a pour paramtre 4 et 0,5.
En utilisant la formule de la loi binomiale, on trouve les probabilits suivantes :
p ( x ) C nx p x q n x
Distribution de la variable B(4 , 1/2)
x
0
1
2
3
4
Total
p(x)
0,0625
0,2500
0,3750
0,2500
0,0625
1
230
Statistiques dcisionnelles.
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
x
0
1
2
3
4
Total
ni
113
367
576
426
118
1600
npi
100
400
600
400
100
1600
Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :
n i2
n
i 1 np i
k
VD
VD
1600 10,3
100
400
600
400
100
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 4 degrs de libert est : 0,95 = 9,49
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
Cest dire quau seuil de 5%, on ne peut pas affirmer que le nombre de garons suit une loi
binomiale.
Pour = 0,01 la valeur de
Cest--dire quun seuil de 1 %, on peut affirmer que le nombre de garons suit une binomiale.
11.4.2. Solution de lexercice 11.3.2.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution normale.
231
Statistiques dcisionnelles.
Hypothse nulle :
H0 : ni = npi
i 1
i 1
n i = npi = n
avec
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi normale. Pour cela, il faut estimer les
paramtres de la loi normale, savoir, la moyenne et lcart type.
La moyenne m peut tre estime par la moyenne calcule partir de la distribution observe
alors que la variance sera estime par la quasi-variance.
Reprenons les donnes et calculons la moyenne et la quasi-variance.
Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50
n x
n
i
Centres xi
5
15
25
35
45
Effectifs ni
10
20
30
20
20
n (x x)
n 1
^
10.(5 27) 20.(15 27) 30.(25 27) 20.(35 27) 20.(45 27) ^
= 157,58
100 1
^
157,58 = 12,55
La loi normale est de moyenne 27 et dcart type 12,55.
Calculons les probabilits :
10 27
) = (-1,35) = 0,0885
12,55
10 27
20 27
p(10 < X 20) = p(
<Z
)
12,55
12,55
p(10 < X 20) = (-0,56)- (-1,35) = 0,2877-0,0885 = 0,1992
p(X 10) = p(Z
232
Statistiques dcisionnelles.
20 27
30 27
<Z
)
12,55
12,55
p(20 < X 30) = (0,24)- (-0,56) = 0,5948 - 0,2877 = 0,3071
p(20 < X 30) = p(
30 27
40 27
<Z
)
12,55
12,55
p(30 < X 40) = (1,04)- (0,24) = 0,8508 0,5948 = 0,2560
p(30 < X 40) = p(
40 27
50 27
<Z
)
12,55
12,55
p(40 < X 50) = (1,83)- (1,04) = 0,9664 0,8508 = 0,1156
p(40 < X 50) = p(
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50
ni
10
20
30
20
20
pi
0,0885
0,1992
0,3071
0,2560
0,1156
npi
8,85
19,92
30,71
25,6
11,56
Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :
k
n i2
VD
n
i 1 npi
VD
10 2
20 2
30 2
20 2 20 2
100 10,91
8,85 19,92 30,71 25,6 11,56
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
a) Pour = 0,05, la valeur de 1- avec 2 (5-2-1) degrs de libert est : 0,95 = 5,991
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
Cest--dire quau seuil de 5 %, il nest pas justifi de considrer que la distribution des notes
suit une loi normale dans la population de tous les candidats.
b) Pour = 0,001, la valeur de
233
Statistiques dcisionnelles.
Cest--dire quau seuil de 1 %, il est justifi de considrer que la distribution des notes suit
une loi normale dans la population de tous les candidats.
11.4.3. Solution de lexercice 11.3.3.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution thorique.
Hypothse nulle :
H0 : ni = npi
i 1
i 1
n i = npi = n
avec
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
Sexe
Hommes
Femmes
Effectifs Effectifs Effectifs Effectifs Total
Niveau dinstruction
thoriques observs thoriques observs
Aucun
67,2
61
104
112
173
Primaire
57,6
54
52
48
102
Secondaire
28,8
35
20,8
25
60
Formation professionnelle
24,96
27
20,8
17
44
Suprieur
13,44
15
10,4
6
21
Total
192
192
208
208
400
Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :
VD
i 1
612
54 2
67,2 57,6
112 2 48 2
25 2
104
52
20,8
VD
n i2
n
npi
35 2
27 2
15 2
400 6,8
20,8 10,4
234
Statistiques dcisionnelles.
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 9 degrs de libert est : 0,95 = 16,919
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quau seuil de 5%, lchantillon prlev est reprsentatif de la population tudie.
11.4.4. Solution de lexercice 11.3.4.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution de Poisson.
Hypothse nulle :
H0 : ni = npi
i 1
i 1
n i = npi = n
avec
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi de Poisson.
p(x)
0,0120
0,0532
0,1176
0,1732
0,1914
0,1692
0,1246
0,0787
235
n pi
1,20
5,32
11,76
17,32
19,14
16,92
12,46
7,87
x.
Statistiques dcisionnelles.
8
9
10
0,0435
0,0214
0,0094
4,35
2,14
0,94
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
x
0
1
2
3
4
5
6
7
8
9
10
Total
ni
1
4
12
18
22
17
11
6
4
3
2
100
n pi
1,20
5,32
11,76
17,32
19,14
16,92
12,46
7,87
4,35
2,14
0,94
Les effectifs thoriques infrieurs 5 doivent tre regroups. On obtient les effectifs suivants :
x
0 ou 1
2
3
4
5
6
7
8 ou plus
Total
ni
5
12
18
22
17
11
6
9
100
n pi
6,52
11,76
17,32
19,14
16,92
12,46
7,87
7,43
VD
i 1
n i2
n
npi
5
12 2
18 2
22 2
100 2,34
16,92 12,46 7,87 7,43
VD
236
Statistiques dcisionnelles.
Rgion dacceptation :
La rgion dacceptation est lintervalle
0 ; .
2
1
Pour = 0,05, la valeur de 1- avec (8-1-1)=6 degrs de libert est : 0,95 = 12,592
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quon peut affirmer au seuil de signification de 5 % que le nombre de personnes
qui se prsentent un guichet automatique bancaire, pendant un intervalle de temps de 5
minutes suit une loi de Poisson.
11.4.5. Solution de lexercice 11.3.5.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution normale.
Hypothse nulle :
H0 : ni = npi
avec
i 1
i 1
n i = npi = n
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi normale.
La loi normale est de moyenne 7,75 et dcart type 0,94.
Calculons les probabilits :
5,25 7,75
5,75 7,75
<Z
)
0,94
0,94
p(5,25 < X 5,75) = (-2,13)-(-2,66)=0,0166-0,0039= 0,0127
p(5,25 < X 5,75) = p(
5,75 7,75
6,25 7,75
<Z
)
0,94
0,94
p(5,75 < X 6,25) = (-1,60)-(-2,13)=0,0548-0,0166= 0,0382
p(5,75 < X 6,25) = p(
6,25 7,75
6,75 7,75
<Z
)
0,94
0,94
p(6,25 < X 6,75) = (-1,06)-(-1,60)=0,1446-0,0548= 0,0898
p(6,25 < X 6,75) = p(
6,75 7,75
7,25 7,75
<Z
)
0,94
0,94
237
Statistiques dcisionnelles.
7,25 7,75
7,75 7,75
<Z
)
0,94
0,94
p(7,25 < X 7,75) = (0)- (-0,53) = 0,5-0,2981 = 0,2019
p(7,25 < X 7,75) = p(
7,75 7,75
8,25 7,75
<Z
)
0,94
0,94
p(7,75 < X 8,25) = (0,53)- (0) = 0,7019-0,5 = 0,2019
p(7,75 < X 8,25) = p(
8,25 7,75
8,75 7,75
<Z
)
0,94
0,94
p(8,25 < X 8,75) = (1,06)- (0,53)=0,8554-0,7019 = 0,1535
p(8,25 < X 8,75) = p(
8,75 7,75
9,25 7,75
<Z
)
0,94
0,94
p(8,75 < X 9,25) = (1,60)- (1,06)=0,9452-0,8554 = 0,0898
p(8,75 < X 9,25) = p(
9,25 7,75
9,75 7,75
<Z
)
0,94
0,94
p(9,25 < X 9,75) = (2,13)- (1,60)=0,9834-0,9452 = 0,0382
p(9,25 < X 9,75) = p(
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
longueur en mm
[5,25 ; 5,75[
[5,75 ; 6,25[
[6,25 ; 6,75[
[6,75 ; 7,25[
[7,25 ; 7,75[
[7,75 ; 8,25[
[8,25 ; 8,75[
[8,75 ; 9,25[
[9,25 ; 9,75[
ni
1
6
6
9
15
17
10
8
3
pi
0,0127
0,0382
0,0898
0,1535
0,2019
0,2019
0,1535
0,0898
0,0382
npi
0,9525
2,8650
6,735
11,5125
15,1425
15,1425
11,5125
6,735
2,865
Les effectifs thoriques infrieurs 5 doivent tre regroups. On obtient les effectifs suivants :
longueur en mm
[5,25 ; 6,75[
[6,75 ; 7,25[
[7,25 ; 7,75[
ni
13
9
15
238
npi
10,5525
11,5125
15,1425
Statistiques dcisionnelles.
[7,75 ; 8,25[
[8,25 ; 8,75[
[8,75 ; 9,75[
17
10
11
15,1425
11,5125
9,6
VD
n i2
npi n
i 1
VD
13 2
92
15 2
17 2
10 2
112
75 3,26
11,5125 9,6
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 5 degrs de libert est :
0,95 = 11,07
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quau seuil de 5 %, on peut ajuster cette distribution la loi normale de moyenne
7,75 mm, et dcart type 0,94 mm.
11.4.6. Solution de lexercice 11.3.6.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution thorique.
Hypothse nulle :
H0 : ni = npi
avec
i 1
i 1
n i = npi = n
Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
239
Statistiques dcisionnelles.
Groupes sanguins
Effectifs observs
Effectifs thoriques
O
251
233,625
A
219
231
B
29
42
AB
26
18,375
Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :
n i2
n
i 1 npi
k
VD
VD
2512
219 2 29 2
26 2
525 9,10
233,625
231
42 18,375
Rgion dacceptation :
La rgion dacceptation est lintervalle
0 ; .
2
1
H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^
n pij =
n i.n .j
n
240
Statistiques dcisionnelles.
Niveau
dinstruction
Primaire
Secondaire
Suprieur
Total
p
VD =
Destination de vacances
Mer
Montagne
Dsert
270
112,5
67,5
210
87,5
52,5
120
50
30
600
250
150
n
i 1 j1
ij
^
n pij
-n=
Total
450
350
200
1000
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(3-1) = 4.
Pour = 0,05, la valeur de 1- avec 4 degrs de libert est : 0,95 = 9,49.
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On conclut donc que le niveau dinstruction a une influence sur le choix dune destination
touristique.
11.4.8. Solution de lexercice 11.3.8.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^
H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^
n pij =
n i.n .j
n
241
Statistiques dcisionnelles.
Niveau daccueil
Faible
Modr
Elev
Total
p
VD =
i 1
j 1
n ij
^
n p ij
-n=
Rgions
Est
Sud
21,47 6,02
59,21 16,60
26,32 7,38
107
30
Nord
26,28
72,49
32,22
131
Ouest Total
8,23
62
22,69 171
10,08
76
41
309
22 35 0 5 ... 12 -309
226,28 21,47 6,02 8,23
10,08
VD = 41,15
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(4-1) = 6.
Pour = 0,05, la valeur de 1- avec 6 degrs de libert est : 0,95 = 12,59
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On conclut que le niveau daccueil dpend de la rgion.
11.4.9. Solution de lexercice 11.3.9.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^
H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^
n pij =
Sexe
Fille
Garon
Total
Sport
33,6
29,4
63
n i.n .j
n
Discipline
Musique
23,47
20,53
44
242
Thtre
29,93
20,07
43
Total
80
70
150
Statistiques dcisionnelles.
VD =
VD =
n ij
i 1
j 1
n p ij
-n
20
28
32
43
16
11
- 150
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(2-1) = 2.
- Pour = 0,05, la valeur de 1- avec 2 degrs de libert est : 0,95 = 5,99
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On peut affirmer au seuil de 5 % que le choix des tudiants dpend de leur sexe.
- Pour = 0,001, la valeur de
On peut affirmer au seuil de 1 % que le choix des tudiants est indpendant du sexe.
11.4.10. Solution de lexercice 11.3.10.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^
H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^
n pij =
n i.n .j
n
Filire
Sciences
Mdecine et
Droit
LettresSciences
PharmacieAutre Total
Profession
conomiques
dentaire
Exploitant agricole 81,4
32,6
158,1 76,1
102,5
20,6
39,7 511
Salari agricole
6,2
2,5
12,1
5,8
7,8
1,6
3,0
39
Patron
164,8
66,0
320,2 154,2
207,5
41,8
80,4 1035
243
Statistiques dcisionnelles.
Profession librale
et cadre sup
Cadre moyen
Employ
Ouvriers
Personnel de
service
Autres
Total
482,5
193,4
937,8
451,6
607,7
122,5
235,5 3031
247,1
135,3
180,1
99,0
54,2
72,2
480,2
263,0
349,9
231,2
126,7
168,5
311,2
170,4
226,8
62,7
34,3
45,7
120,6 1552
66,0 850
87,9 1131
12,7
5,1
24,8
11,9
16,0
3,2
281,9
1592
113,0
638
547,9
3094
263,9
1490
355,1
2005
71,5
404
VD =
VD =
n ij
i 1
j 1
n p ij
6,2
80
137,6 1771
777 10000
-n
80
35 135 99
65
132
- 10000
...
81,4 32,6 158,1 76,1 102,5
137,6
VD = 450,3
Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (7-1)(9-1) = 48.
Le nombre de degrs de libert tant grand, on peut utiliser lapproximation par la loi normale.
Pour amliorer lapproximation, on peut utiliser la transformation suivante :
( Z 2k 1)
2
do :
0 , 95
( Z 0 , 95 2 48 1)
2
(1,64 2 48 1)
= 64,8
2
244
Statistiques dcisionnelles.
Tables statistiques
Loi Normale
Loi de Khi deux
Loi de Student
Loi de Fischer
245
0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9987
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988
Probabilit P(Z<=z)
0,04
0,05
0,5160
0,5199
0,5557
0,5596
0,5948
0,5987
0,6331
0,6368
0,6700
0,6736
0,7054
0,7088
0,7389
0,7422
0,7704
0,7734
0,7995
0,8023
0,8264
0,8289
0,8508
0,8531
0,8729
0,8749
0,8925
0,8944
0,9099
0,9115
0,9251
0,9265
0,9382
0,9394
0,9495
0,9505
0,9591
0,9599
0,9671
0,9678
0,9738
0,9744
0,9793
0,9798
0,9838
0,9842
0,9875
0,9878
0,9904
0,9906
0,9927
0,9929
0,9945
0,9946
0,9959
0,9960
0,9969
0,9970
0,9977
0,9978
0,9984
0,9984
0,9988
0,9989
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9990
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,9990
0,00
0,99903
0,99931
0,99952
0,99966
0,99977
0,99984
0,99989
0,99993
0,99995
0,01
0,99906
0,99934
0,99953
0,99968
0,99978
0,99985
0,99990
0,99993
0,99995
0,02
0,99910
0,99936
0,99955
0,99969
0,99978
0,99985
0,99990
0,99993
0,99996
0,03
0,99913
0,99938
0,99957
0,99970
0,99979
0,99986
0,99990
0,99994
0,99996
Probabilit P(Z<=z)
0,04
0,05
0,99916
0,99918
0,99940
0,99942
0,99958
0,99960
0,99971
0,99972
0,99980
0,99981
0,99986
0,99987
0,99991
0,99991
0,99994
0,99994
0,99996
0,99996
0,06
0,99921
0,99944
0,99961
0,99973
0,99981
0,99987
0,99992
0,99994
0,99996
0,07
0,99924
0,99946
0,99962
0,99974
0,99982
0,99988
0,99992
0,99995
0,99996
0,08
0,99926
0,99948
0,99964
0,99975
0,99983
0,99988
0,99992
0,99995
0,99997
0,09
0,99929
0,99950
0,99965
0,99976
0,99983
0,99989
0,99992
0,99995
0,99997
LOI DU KHI 2
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,001
0,000
0,002
0,024
0,091
0,210
0,381
0,599
0,857
1,152
1,479
1,834
2,214
2,617
3,041
3,483
3,942
4,416
4,905
5,407
5,921
6,447
6,983
7,529
8,085
8,649
9,222
9,803
10,391
10,986
11,588
0,005
0,000
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787
0,995
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,558
46,928
48,290
49,645
50,994
52,335
53,672
0,999
10,827
13,815
16,266
18,466
20,515
22,457
24,321
26,124
27,877
29,588
31,264
32,909
34,527
36,124
37,698
39,252
40,791
42,312
43,819
45,314
46,796
48,268
49,728
51,179
52,619
54,051
55,475
56,892
58,301
59,702
LOI DE STUDENT
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Probabilit P(T<=z)=p
0,6
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,7
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,8
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,9
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
0,95
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
0,975
12,71
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
0,99
31,82
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
0,995
63,66
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
Statistiques dcisionnelles.
0,256
24
0,256
25
0,256
26
0,531
0,531
0,531
0,857
0,856
0,856
1,318
1,316
1,315
250
1,711
1,708
1,706
2,064
2,060
2,056
2,492
2,485
2,479
2,797
2,787
2,779
LOI DE STUDENT
k
27
28
29
30
40
60
80
100
200
500
Probabilit P(T<=z)=p
0,6
0,256
0,256
0,256
0,256
0,255
0,254
0,254
0,254
0,254
0,253
0,253
0,7
0,531
0,530
0,530
0,530
0,529
0,527
0,527
0,526
0,525
0,525
0,524
0,8
0,855
0,855
0,854
0,854
0,851
0,848
0,846
0,845
0,843
0,842
0,842
0,9
1,314
1,313
1,311
1,310
1,303
1,296
1,292
1,290
1,286
1,283
1,282
0,95
1,703
1,701
1,699
1,697
1,684
1,671
1,664
1,660
1,653
1,648
1,645
0,975
2,052
2,048
2,045
2,042
2,021
2,000
1,990
1,984
1,972
1,965
1,960
0,99
2,473
2,467
2,462
2,457
2,423
2,390
2,374
2,365
2,345
2,334
2,326
0,995
2,771
2,763
2,756
2,750
2,704
2,660
2,639
2,626
2,601
2,586
2,576
LOI DE FISHER
Probabilit P(F<=z) = 0,95
K2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
K1
1
161
18,5
10,1
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,30
4,26
4,23
4,20
4,17
4,03
3,94
3,89
3,86
3,84
2
200
19,0
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,44
3,40
3,37
3,34
3,32
3,18
3,09
3,04
3,01
3,00
3
216
19,2
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,05
3,01
2,98
2,95
2,92
2,79
2,70
2,65
2,62
2,60
4
225
19,2
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,82
2,78
2,74
2,71
2,69
2,56
2,46
2,42
2,39
2,37
5
230
19,3
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,66
2,62
2,59
2,56
2,53
2,40
2,31
2,26
2,23
2,21
6
234
19,3
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,55
2,51
2,47
2,45
2,42
2,29
2,19
2,14
2,12
2,10
7
237
19,4
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,46
2,42
2,39
2,36
2,33
2,20
2,10
2,06
2,03
2,01
8
239
19,4
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,40
2,36
2,32
2,29
2,27
2,13
2,03
1,98
1,96
1,94
9
241
19,4
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,34
2,30
2,27
2,24
2,21
2,07
1,97
1,93
1,90
1,88
10
242
19,4
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,30
2,25
2,22
2,19
2,16
2,03
1,93
1,88
1,85
1,83
15
246
19,4
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,15
2,11
2,07
2,04
2,01
1,87
1,77
1,72
1,69
1,67
20
248
19,4
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,07
2,03
1,99
1,96
1,93
1,78
1,68
1,62
1,59
1,57
30
250
19,5
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
1,98
1,94
1,90
1,87
1,84
1,69
1,57
1,52
1,48
1,46
50
252
19,5
8,58
5,70
4,44
3,75
3,32
3,02
2,80
2,64
2,51
2,40
2,31
2,24
2,18
2,12
2,08
2,04
2,00
1,97
1,91
1,86
1,82
1,79
1,76
1,60
1,48
1,41
1,38
1,35
100
253
19,5
8,55
5,66
4,41
3,71
3,27
2,97
2,76
2,59
2,46
2,35
2,26
2,19
2,12
2,07
2,02
1,98
1,94
1,91
1,85
1,80
1,76
1,73
1,70
1,52
1,39
1,32
1,28
1,24
200
254
19,5
8,54
5,65
4,39
3,69
3,25
2,95
2,73
2,56
2,43
2,32
2,23
2,16
2,10
2,04
1,99
1,95
1,91
1,88
1,82
1,77
1,73
1,69
1,66
1,48
1,34
1,26
1,21
1,17
500
254
19,5
8,53
5,64
4,37
3,68
3,24
2,94
2,72
2,55
2,42
2,31
2,22
2,14
2,08
2,02
1,97
1,93
1,89
1,86
1,80
1,75
1,71
1,67
1,64
1,46
1,31
1,22
1,16
1,11
254
19,5
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,78
1,73
1,69
1,65
1,62
1,44
1,28
1,19
1,11
1,00
LOI DE FISHER
K2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
2
800
39,0
16,0
10,6
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,76
4,69
4,62
4,56
4,51
4,46
4,38
4,32
4,27
4,22
4,18
3,98
3,83
3,76
3,72
3,69
3
864
39,2
15,4
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,78
3,72
3,67
3,63
3,59
3,39
3,25
3,18
3,14
3,12
4
900
39,2
15,1
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,44
3,38
3,33
3,29
3,25
3,06
2,92
2,85
2,81
2,79
5
922
39,3
14,9
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,22
3,15
3,10
3,06
3,03
2,83
2,70
2,63
2,59
2,57
6
937
39,3
14,7
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,05
2,99
2,94
2,90
2,87
2,67
2,54
2,47
2,43
2,41
7
948
39,4
14,6
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,93
2,87
2,82
2,78
2,75
2,55
2,42
2,35
2,31
2,29
8
957
39,4
14,5
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,84
2,78
2,73
2,69
2,65
2,46
2,32
2,26
2,22
2,19
9
963
39,4
14,5
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,76
2,70
2,65
2,61
2,57
2,38
2,24
2,18
2,14
2,11
10
969
39,4
14,4
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,70
2,64
2,59
2,55
2,51
2,32
2,18
2,11
2,07
2,05
15
985
39,4
14,3
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,50
2,44
2,39
2,34
2,31
2,11
1,97
1,90
1,86
1,83
20
993
39,4
14,2
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,39
2,33
2,28
2,23
2,20
1,99
1,85
1,78
1,74
1,71
30
1001
39,5
14,1
8,46
6,23
5,07
4,36
3,89
3,56
3,31
3,12
2,96
2,84
2,73
2,64
2,57
2,50
2,44
2,39
2,35
2,27
2,21
2,16
2,11
2,07
1,87
1,71
1,64
1,60
1,57
50
1008
39,5
14,0
8,38
6,14
4,98
4,28
3,81
3,47
3,22
3,03
2,87
2,74
2,64
2,55
2,47
2,41
2,35
2,30
2,25
2,17
2,11
2,05
2,01
1,97
1,75
1,59
1,51
1,46
1,43
100
1013
39,5
14,0
8,32
6,08
4,92
4,21
3,74
3,40
3,15
2,96
2,80
2,67
2,56
2,47
2,40
2,33
2,27
2,22
2,17
2,09
2,02
1,97
1,92
1,88
1,66
1,48
1,39
1,34
1,30
200
1016
39,5
13,9
8,29
6,05
4,88
4,18
3,70
3,37
3,12
2,92
2,76
2,63
2,53
2,44
2,36
2,29
2,23
2,18
2,13
2,05
1,98
1,92
1,88
1,84
1,60
1,42
1,32
1,25
1,21
500
1017
39,5
13,9
8,27
6,03
4,86
4,16
3,68
3,35
3,09
2,90
2,74
2,61
2,50
2,41
2,33
2,26
2,20
2,15
2,10
2,02
1,95
1,90
1,85
1,81
1,57
1,38
1,27
1,19
1,13
1018
39,5
13,9
8,26
6,02
4,85
4,14
3,67
3,33
3,08
2,88
2,72
2,60
2,49
2,40
2,32
2,25
2,19
2,13
2,09
2,00
1,94
1,88
1,83
1,79
1,55
1,35
1,23
1,14
1,00
LOI DE FISHER
K
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
5
5760
99,3
28,2
15,5
11,0
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,70
4,56
4,44
4,34
4,25
4,17
4,10
3,99
3,90
3,82
3,75
3,70
3,41
3,21
3,11
3,05
3,02
6
5860
99,3
27,9
15,2
10,7
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,76
3,67
3,59
3,53
3,47
3,19
2,99
2,89
2,84
2,80
7
5930
99,4
27,7
15,0
10,5
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,59
3,50
3,42
3,36
3,30
3,02
2,82
2,73
2,68
2,64
8
5980
99,4
27,5
14,8
10,3
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,45
3,36
3,29
3,23
3,17
2,89
2,69
2,60
2,55
2,51
9
6020
99,4
27,3
14,7
10,2
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,35
3,26
3,18
3,12
3,07
2,79
2,59
2,50
2,44
2,41
10
6060
99,4
27,2
14,5
10,1
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,26
3,17
3,09
3,03
2,98
2,70
2,50
2,41
2,36
2,32
15
6160
99,4
26,9
14,2
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
2,98
2,89
2,82
2,75
2,70
2,42
2,22
2,13
2,07
2,04
20
6210
99,4
26,7
14,0
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,83
2,74
2,66
2,60
2,55
2,27
2,07
1,97
1,92
1,88
30
6260
99,5
26,5
13,8
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,67
2,58
2,50
2,44
2,39
2,10
2,1,89
1,79
1,74
1,70
50
6300
99,5
26,4
13,7
9,24
7,09
5,86
5,07
4,52
4,12
3,81
3,57
3,38
3,22
3,08
2,97
2,87
2,78
2,71
2,64
2,53
2,44
2,36
2,30
2,25
1,95
1,73
1,63
1,56
1,52
100
6330
99,5
26,2
13,6
9,13
6,99
5,75
4,96
4,42
4,01
3,71
3,47
3,27
3,11
2,98
2,86
2,76
2,68
2,60
2,54
2,42
2,33
2,25
2,19
2,13
1,82
1,60
1,48
1,41
1,36
200
6350
99,5
26,2
13,5
9,08
6,93
5,70
4,91
4,36
3,96
3,66
3,41
3,22
3,06
2,92
2,81
2,71
2,62
2,55
2,48
2,36
2,27
2,19
2,13
2,07
1,76
1,52
1,39
1,31
1,25
500
6360
99,5
26,1
13,5
9,04
6,90
5,67
4,88
4,33
3,93
3,62
3,38
3,19
3,03
2,89
2,78
2,68
2,59
2,51
2,44
2,33
2,24
2,16
2,09
2,03
1,71
1,47
1,33
1,23
1,15
6370
99,5
26,1
13,5
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,31
2,21
2,13
2,06
2,01
1,68
1,43
1,28
1,16
1,00
LOI DE FISHER
Probabilit P(F<=z) = 0,995
K
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
K1
1
10
15
20
30
16200
198
55,6
31,3
22,8
18,6
16,2
14,7
13,6
12,8
12,2
11,8
11,4
11,1
10,8
10,6
10,4
10,2
10,1
9,94
9,73
9,55
9,41
9,28
9,18
8,63
8,24
8,06
7,95
7,88
20000
199
49,8
26,3
18,3
14,5
12,4
11,0
10,1
9,43
8,91
8,51
8,19
7,92
7,70
7,51
7,35
7,21
7,09
6,99
6,81
6,66
6,54
6,44
6,35
5,90
5,59
5,44
5,36
5,30
21600
199
47,5
24,3
16,5
12,9
10,9
9,60
8,72
8,08
7,60
7,23
6,93
6,68
6,48
6,30
6,16
6,03
5,92
5,82
5,65
5,52
5,41
5,32
5,24
4,83
4,54
4,41
4,33
4,28
22500
199
46,2
23,2
15,6
12,0
10,0
8,81
7,96
7,34
6,88
6,52
6,23
6,00
5,80
5,64
5,50
5,37
5,27
5,17
5,02
4,89
4,79
4,70
4,62
4,23
3,96
3,84
3,76
3,72
23100
199
45,4
22,5
14,9
11,5
9,52
8,30
7,47
6,87
6,42
6,07
5,79
5,56
5,37
5,21
5,07
4,96
4,85
4,76
4,61
4,49
4,38
4,30
4,23
3,85
3,59
3,47
3,40
3,35
23400
199
44,8
22,0
14,5
11,1
9,16
7,95
7,13
6,54
6,10
5,76
5,48
5,26
5,07
4,91
4,78
4,66
4,56
4,47
4,32
4,20
4,10
4,02
3,95
3,58
3,33
3,21
3,14
3,09
23700
199
44,4
21,6
14,2
10,8
8,89
7,69
6,88
6,30
5,86
5,52
5,25
5,03
4,85
4,69
4,56
4,44
4,34
4,26
4,11
3,99
3,89
3,81
3,74
3,38
3,13
3,01
2,94
2,90
23900
199
44,1
21,4
14,0
10,6
8,68
7,50
6,69
6,12
5,68
5,35
5,08
4,86
4,67
4,52
4,39
4,28
4,18
4,09
3,94
3,83
3,73
3,65
3,58
3,22
2,97
2,85
2,79
2,74
24100
199
43,9
21,1
13,8
10,4
8,51
7,34
6,54
5,97
5,54
5,20
4,94
4,72
4,54
4,38
4,25
4,14
4,04
3,96
3,81
3,69
3,60
3,52
3,45
3,09
2,85
2,73
2,66
2,62
24200
199
43,7
21,0
13,6
10,2
8,38
7,21
6,42
5,85
5,42
5,09
4,82
4,60
4,42
4,27
4,14
4,03
3,93
3,85
3,70
3,59
3,49
3,41
3,34
2,99
2,74
2,63
2,56
2,52
24600
199
43,1
20,4
13,1
9,81
7,97
6,81
6,03
5,47
5,05
4,72
4,46
4,25
4,07
3,92
3,79
3,68
3,59
3,50
3,36
3,25
3,15
3,07
3,01
2,65
2,41
2,30
2,23
2,19
24800
199
42,8
20,2
12,9
9,59
7,75
6,61
5,83
5,27
4,86
4,53
4,27
4,06
3,88
3,73
3,61
3,50
3,40
3,32
3,18
3,06
2,97
2,89
2,82
2,47
2,23
2,11
2,04
2,00
25000
199
42,5
19,9
12,7
9,36
7,53
6,40
5,62
5,07
4,65
4,33
4,07
3,86
3,69
3,54
3,41
3,30
3,21
3,12
2,98
2,87
2,77
2,69
2,63
2,27
2,02
1,91
1,84
1,79
50
100
200
500
25200
199
42,2
19,7
12,5
9,17
7,35
6,22
5,45
4,90
4,49
4,17
3,91
3,70
3,52
3,37
3,25
3,14
3,04
2,96
2,82
2,70
2,61
2,53
2,46
2,10
1,84
1,71
1,64
1,59
25300
199
42,0
19,5
12,3
9,03
7,22
6,09
5,32
4,77
4,36
4,04
3,78
3,57
3,39
3,25
3,12
3,01
2,91
2,83
2,69
2,57
2,47
2,39
2,32
1,95
1,68
1,54
1,46
1,40
25400
199
41,9
19,4
12,2
8,95
7,15
6,02
5,26
4,71
4,29
3,97
3,71
3,50
3,33
3,18
3,05
2,94
2,85
2,76
2,62
2,50
2,40
2,32
2,25
1,87
1,59
1,44
1,35
1,28
25400
200
41,9
19,4
12,2
8,91
7,10
5,98
5,21
4,67
4,25
3,93
3,67
3,46
3,29
3,14
3,01
2,90
2,80
2,72
2,57
2,46
2,36
2,28
2,21
1,82
1,53
1,37
1,26
1,17
25500
200
41,8
19,3
12,1
8,88
7,08
5,95
5,19
4,64
4,23
3,90
3,65
3,44
3,26
3,11
2,98
2,87
2,78
2,69
2,55
2,43
2,33
2,25
2,18
1,79
1,49
1,31
1,18
1,00
LOI DE FISHER
Probabilit P(F<=z) = 0,999
K
2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
K1
1
998
168
74,1
47,0
35,5
29,2
25,4
22,9
21,0
19,7
18,6
17,8
17,1
16,6
16,1
15,7
15,4
15,1
14,8
14,4
14,0
13,7
13,5
13,3
12,2
11,5
11,2
11,0
10,8
2
999
148
61,2
36,6
27,0
21,7
18,5
16,4
14,9
13,8
13,0
12,3
11,8
11,3
11,0
10,7
10,4
10,2
9,95
9,61
9,34
9,12
8,93
8,77
7,95
7,41
7,15
7,01
6,91
3
999
141
56,2
33,2
23,7
18,8
15,8
13,9
12,6
11,6
10,8
10,2
9,73
9,34
9,00
8,73
8,49
8,28
8,10
7,80
7,55
7,36
7,19
7,05
6,34
5,85
5,64
5,51
5,42
4
999
137
53,4
31,1
21,9
17,2
14,4
12,6
11,3
10,4
9,63
9,07
8,62
8,25
7,94
7,68
7,46
7,26
7,10
6,81
6,59
6,41
6,25
6,12
5,46
5,01
4,81
4,69
4,62
5
999
135
51,7
29,8
20,8
16,2
13,5
11,7
10,5
9,58
8,89
8,35
7,92
7,57
7,27
7,02
6,81
6,61
6,46
6,19
5,98
5,80
5,66
5,53
4,90
4,48
4,29
4,18
4,10
6
999
133
50,5
28,8
20,0
15,5
12,9
11,1
9,92
9,05
8,38
7,86
7,43
7,09
6,81
6,56
6,35
6,18
6,02
5,76
5,55
5,38
5,24
5,12
4,51
4,11
3,92
3,82
3,74
7
999
132
49,7
28,2
19,5
15,0
12,4
10,7
9,52
8,66
8,00
7,49
7,08
6,74
6,46
6,22
6,02
5,84
5,69
5,44
5,23
5,07
4,93
4,82
4,22
3,83
3,65
3,54
3,47
8
999
131
49,0
27,6
19,0
14,6
12,0
10,4
9,20
8,35
7,71
7,21
6,80
6,47
6,19
5,96
5,76
5,59
5,44
5,19
4,99
4,83
4,69
4,58
4,00
3,61
3,43
3,33
3,27
9
999
130
48,5
27,2
18,7
14,3
11,8
10,1
8,96
8,12
7,48
6,98
6,58
6,26
5,98
5,75
5,56
5,39
5,24
4,99
4,80
4,64
4,50
4,39
3,82
3,44
3,26
3,16
3,10
10
999
129
48,0
26,9
18,4
14,1
11,5
9,89
8,75
7,92
7,29
6,80
6,40
6,08
5,81
5,58
5,39
5,22
5,08
4,83
4,64
4,48
4,35
4,24
3,67
3,30
3,12
3,02
2,96
15
999
127
46,8
25,9
17,6
13,3
10,8
9,24
8,13
7,32
6,71
6,23
5,85
5,53
5,27
5,05
4,87
4,70
4,56
4,32
4,14
3,99
3,86
3,75
3,20
2,84
2,67
2,58
2,51
20
999
126
46,1
25,4
17,1
12,9
10,5
8,90
7,80
7,01
6,40
5,93
5,56
5,25
4,99
4,78
4,59
4,43
4,29
4,06
3,87
3,72
3,60
3,49
2,95
2,59
2,42
2,33
2,27
30
999
125
45,4
24,9
16,7
12,5
10,1
8,55
7,47
6,68
6,09
5,62
5,25
4,95
4,70
4,48
4,30
4,14
4,01
3,77
3,59
3,45
3,32
3,22
2,68
2,32
2,15
2,05
1,99
50
999
125
44,9
24,4
16,3
12,2
9,80
8,26
7,19
6,41
5,83
5,37
5,00
4,70
4,45
4,24
4,06
3,90
3,77
3,53
3,35
3,20
3,08
2,98
2,44
2,07
1,90
1,80
1,73
100
999
124
44,5
24,1
16,0
11,9
9,57
8,04
6,98
6,21
5,63
5,17
4,80
4,51
4,26
4,05
3,87
3,71
3,58
3,34
3,16
3,01
2,89
2,79
2,24
1,87
1,68
1,57
1,49
200
999
124
44,3
23,9
15,9
11,8
9,46
7,93
6,87
6,10
5,52
5,07
4,70
4,41
4,16
3,95
3,77
3,61
3,48
3,25
3,07
2,92
2,79
2,69
2,14
1,75
1,55
1,43
1,34
500
999
124
44,1
23,8
15,8
11,7
9,39
7,86
6,81
6,04
5,46
5,01
4,64
4,35
4,10
3,89
3,71
3,55
3,42
3,19
3,01
2,86
2,73
2,63
2,07
1,68
1,46
1,32
1,21
999
124
44,0
23,8
15,8
11,7
9,34
7,81
6,76
6,00
5,42
4,97
4,60
4,31
4,06
3,85
3,67
3,51
3,38
3,15
2,97
2,82
2,70
2,59
2,03
1,62
1,39
1,23
1,00
LOI DE FISHER
K
2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500
P(F<=z) = 0,9995
K1
1
10
15
20
30
2000
266
106
63,6
46,1
37,0
31,6
28,0
25,5
23,6
22,2
21,1
20,2
19,5
18,9
18,4
17,9
17,5
17,2
16,6
16,2
15,8
15,5
15,2
13,9
13,0
12,5
12,3
12,1
2000
237
87,4
49,8
34,8
27,2
22,8
19,9
17,9
16,4
15,3
14,4
13,7
13,2
12,7
12,3
11,9
11,6
11,4
11,0
10,6
10,3
10,1
9,90
8,88
8,21
7,90
7,72
7,60
2000
225
80,1
44,4
30,4
23,5
19,4
16,8
15,0
13,6
12,7
11,9
11,3
10,8
10,3
9,99
9,69
9,42
9,20
8,82
8,52
8,27
8,07
7,90
7,01
6,43
6,16
6,01
5,91
2000
218
76,1
41,5
28,1
21,4
17,6
15,1
13,4
12,2
11,2
10,5
9,95
9,48
9,08
8,75
8,47
8,23
8,02
7,67
7,39
7,16
6,98
6,82
6,01
5,47
5,23
5,09
5,00
2000
214
73,6
39,7
26,6
20,2
16,4
14,1
12,4
11,2
10,4
9,66
9,11
8,66
8,29
7,98
7,71
7,48
7,28
6,94
6,68
6,46
6,28
6,14
5,37
4,87
4,64
4,51
4,42
2000
211
71,9
38,5
25,6
19,3
15,7
13,3
11,8
10,6
9,74
9,07
8,53
8,10
7,74
7,44
7,18
6,95
6,76
6,44
6,18
5,98
5,80
5,66
4,93
4,44
4,23
4,10
4,02
2000
209
70,6
37,6
24,9
18,7
15,1
12,8
11,3
10,1
9,28
8,63
8,11
7,68
7,33
7,04
6,78
6,57
6,38
6,07
5,82
5,62
5,45
5,31
4,60
4,13
3,92
3,80
3,72
2000
208
69,7
36,9
24,3
18,2
14,6
12,4
10,9
9,76
8,94
8,29
7,78
7,36
7,02
6,73
6,48
6,27
6,08
5,78
5,54
5,34
5,18
5,04
4,34
3,89
3,68
3,56
3,48
2000
207
68,9
36,4
23,9
17,8
14,3
12,1
10,6
9,48
8,66
8,03
7,52
7,11
6,77
6,49
6,24
6,03
5,85
5,55
5,31
5,12
4,96
4,82
4,14
3,70
3,49
3,36
3,30
2000
206
68,3
35,9
23,5
17,5
14,0
11,8
10,3
9,24
8,43
7,81
7,31
6,91
6,57
6,29
6,05
5,84
5,66
5,36
5,13
4,94
4,78
4,65
3,98
3,54
3,34
3,21
3,14
2000
203
66,5
34,6
22,4
16,5
13,1
11,0
9,56
8,52
7,74
7,13
6,65
6,27
5,94
5,67
5,44
5,25
5,07
4,79
4,55
4,37
4,22
4,10
3,45
3,03
2,83
2,72
2,65
2000
201
65,5
33,9
21,9
16,0
12,7
10,6
9,16
8,14
7,37
6,78
6,31
5,93
5,61
5,34
5,12
4,92
4,75
4,47
4,25
4,07
3,92
3,80
3,16
2,75
2,56
2,45
2,37
2000
199
64,6
33,1
21,4
15,5
12,2
10,2
8,75
7,75
7,00
6,42
5,95
5,58
5,27
5,01
4,78
4,59
4,42
4,15
3,93
3,75
3,61
3,48
2,86
2,44
2,25
2,14
2,07
50
100
200
500
2000
198
63,8
32,5
20,9
15,1
11,8
9,80
8,42
7,43
6,68
6,11
5,66
5,29
4,98
4,72
4,50
4,31
4,15
3,88
3,66
3,48
3,34
3,22
2,59
2,18
1,98
1,87
1,79
2000
197
63,2
32,1
20,5
14,7
11,6
9,53
8,16
7,18
6,45
5,88
5,43
5,06
4,76
4,50
4,28
4,09
3,93
3,66
3,44
3,27
3,13
3,00
2,37
1,95
1,74
1,61
1,53
2000
197
62,9
31,8
20,3
14,6
11,4
9,40
8,04
7,06
6,33
5,76
5,31
4,94
4,64
4,39
4,17
3,98
3,82
3,55
3,33
3,16
3,01
2,89
2,25
1,82
1,60
1,46
1,36
2000
196
62,7
31,7
20,2
14,5
11,4
9,32
7,96
6,98
6,25
5,69
5,24
4,87
4,57
4,32
4,10
3,91
3,75
3,48
3,27
3,09
2,95
2,82
2,17
1,74
1,50
1,34
1,22
2000
196
62,6
31,6
20,1
14,4
11,3
9,26
7,90
6,93
6,20
5,64
5,19
4,83
4,52
4,27
4,06
3,87
3,70
3,44
3,22
3,04
2,90
2,78
2,13
1,67
1,42
1,24
1,00
Statistiques dcisionnelles.
BIBLIOGRAPHIE
Titres
Aide mmoire de probabilits et
statistiques
Cours de probabilits et de statistiques
Cours de probabilits et de statistiques
Formulaire de probabilits et de
statistiques
Introduction aux probabilits et la
statistique
Probabilits et statistiques
Probabilits et statistiques cours,
exercices et problmes rsolus
Probabilits et statistiques
Probabilits et statistiques
Probabilits et statistiques
Probabilits et statistiques rsum de
cours exercices et problmes corrigs
Statistique et calcul des probabilits
Statistiques et probabilits
Statistiques et probabilits
Auteurs
Editeurs - annes
J. MARCELL
ELLIPSES 92
C. LEBOEUF
J. L. ROQUE / J. GUEGAND
J. RENAULT
ELLIPSES 87
ELLIPSES 87
DUNOD 92
E. AMIOT
GAETAN MORIN 90
A. LEVINE
J. ISIAS
ELLIPSES 89
ELLIPSES 99
L. GACOGNE / G. FRUGIER
AUDET, BOUCHER
(AUMARTIN, SKEEWE)
J. FOURASTIE /
J. F. LASLIER
G. CHAUVAT / J.F. REAU
EYROLLES 90
GAETAN MORIN 93
W. MASSIERI
J. P. LECOUTRE
M. ELLATIFI
SIREY 96
DUNOD 2000
AFRIQUE ORIENT 84
259
DUNOD 87
ARMAND COLIN 99
Statistiques dcisionnelles.
260