Escolar Documentos
Profissional Documentos
Cultura Documentos
Ex er ci ces Cor r i g s
Abdelhamid El Mossadeq
P rofesseu r lE H T P
2006-2007
A. El Mossadeq
Juin 2006
45
61
95
Structure Statistique
et
Estimation
A. El Mossadeq
Exercice 1
Dterminer et tudier les proprits de lestimateur du maximum de vraisemlance
dun r-chantillon pour :
1. le paramtre p dune loi de Bernouilli
2. le paramtre p dune loi g
eom
etrique
3. le paramtre p dune loi binomiale dordre n
4. le paramtre dune loi de P oisson
5. le paramtre dune loi exponentielle
6. les paramtres et 2 dune loi normale
7. le paramtre dune loi unif orme sur lintervalle [0, ]
Solution 1
1. Soit X une variable alatoire de Bernouilli de paramtre p.
Pour tout x {0, 1}, la probabilit lmentaire p (x) de x est :
p (x) = px (1 p)1x
de plus :
E [X] = p
V [X] = p (1 p)
(a) Recherche du maximum de vraisemlance :
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout p [0, 1] et tout
(x1 , ..., xr ) {0, 1}r par :
L (p; x1 , ..., xr )
r
Y
i=1
r
P
p (xi )
i=1
xi
(1 p)
do :
r
P
xi
i=1
!
r
r
X
X
xi ln p + r
xi ln (1 p)
ln L (p; x1 , ..., xr ) =
i=1
i=1
A. El Mossadeq
Il en rsulte que :
ln L (p; x1 , ..., xr ) =
p
r
P
xi
i=1
do :
r
P
xi
i=1
1p
1X
xi
ln L (p; x1 , ..., xr ) = 0 = p =
p
r i=1
r
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Bernouilli est :
r
1X
p =
Xi
r i=1
=
=
E [X]
p
et :
V [X]
r
p (1 p)
=
r
On en dduit que p est un estimateur sans biais et convergent du paramtre
p dune loi de Bernouilli.
V [
p]
de plus :
E [X] =
1p
V [X] =
p2
4
A. El Mossadeq
r
Y
p (xi )
i=1
=
do :
ln L (p; x1 , ..., xr ) = r ln p +
Il en rsulte que :
ln L (p; x1 , ..., xr )
p
r
P
p (1 p)i=1
r
X
i=1
xi r
xi r ln (1 p)
r
P
i=1
xi r
1p
r
P
r p xi
i=1
p (1 p)
do :
r
ln L (p; x1 , ..., xr ) = 0 = p = P
r
p
xi
i=1
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure gomtrique est :
r
p = P
r
Xi
i=1
de plus :
A. El Mossadeq
E [X] = np
V [X] = np (1 p)
(a) Recherche du maximum de vraisemlance :
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout p [0, 1] et tout
(x1 , ..., xr ) {0, 1, ..., n}r par :
L (p; x1 , ..., xr )
=
=
r
Y
p (xi )
i=1
"
r
Y
C (n, xi ) p
i=1
do :
ln L (p; x1 , ..., xr ) = ln
r
Y
C (n, xi ) +
i=1
Il en rsulte que :
ln L (p; x1 , ..., xr )
p
r
X
xi ln p +
i=1
r
P
i=1
i=1
do :
r
P
xi
xi
rn
(1 p)
i=1
rn
rn
r
X
i=1
r
P
r
P
xi
i=1
xi ln (1 p)
xi
i=1
p
1p
r
P
xi rnp
p (1 p)
1 X
xi
ln L (p; x1 , ..., xr ) = 0 = p =
p
rn i=1
r
et comme :
2
ln L (p; x1 , ..., xr ) < 0
p2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de binomiale est :
r
1 X
p =
Xi
rn i=1
A. El Mossadeq
1
E [X]
n
p
=
=
et :
V [X]
rn2
p (1 p)
=
rn
on en dduit que p est un estimateur sans biais et convergent de p.
V [
p]
x
exp
x!
E [X] =
V [X] =
r
Y
p (xi )
i=1
r
P
xi
i=1
exp r
x1 !...xr !
do :
r
X
i=1
Il en rsulte que :
ln L (; x1 , ..., xr ) =
r
P
xi ln r
xi
i=1
A. El Mossadeq
do :
1X
ln L (; x1 , ..., xr ) = 0 = p =
xi
r i=1
r
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Poisson est :
r
1X
Xi
=
r i=1
=
=
E [X]
et :
V [X]
r
=
r
On en dduit que
est un estimateur sans biais et convergent de .
V [
]
si x 0
0
f (x) =
exp x si x > 0
de plus :
E [X] =
V [X] = 2
A. El Mossadeq
Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
dans Rr , tous strictement positifs, par :
L (; x1 , ..., xr )
r
Y
f (xi )
i=1
exp
do :
ln L (; x1 , ..., xr ) = r ln
Il en rsulte que :
r
X
xi
i=1
r
X
xi
i=1
r X
ln L (; x1 , ..., xr ) =
xi
i=1
r
do :
ln L (; x1 , ..., xr ) = 0 = = P
r
xi
i=1
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure exponentielle est :
= r
r
P
Xi
i=1
de plus :
E [X] =
V [X] = 2
A. El Mossadeq
f (xi )
i=1
=
do :
r
Y
r
1
1 X
(xi )2
r exp 2
2
2
i=1
1 X
ln L (, ; x1 , ..., xr ) = r ln 2 r ln 2
(xi )2
2 i=1
Il en rsulte que :
1 X
L (, ; x1 , ..., xr ) = 2
(xi )
i=1
do :
r
1 X
r
L (, ; x1 , ..., xr ) = + 3
(xi )2
i=1
L (, ; x1 , ..., xr ) = 0
L (, ; x1 , ..., xr ) = 0
r
1X
=
xi
r i=1
1X
(xi )2
=
r i=1
r
1X
=
Xi
r i=1
1X
2
=
(Xi
)2
r i=1
10
A. El Mossadeq
=
=
E [X]
et :
2
E
r1
V [X]
r
r1 2
=
r
On en dduit que
est un estimateur sans biais et convergent de , mais
si x [0, ]
f (x) =
0
si x
/ [0, ]
de plus :
E [X] = 2
V [X] =
12
Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout , > 0, et tout (x1 , ..., xr )
[0, ]r :
L (; x1 , ..., xr )
r
Y
f (xi )
i=1
1
r
La fonction :
L (; x1 , ..., xr )
est strictement dcroissante, donc elle atteint son maximum lorsque est minimum.
Et comme :
i {1, ..., r} : xi
11
A. El Mossadeq
Exercice 2
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :
1
x
exp
f (x) =
si
x>0
si
x0
Solution 2
Soit X une variable alatoire exponentielle dont la densit de probabilit f est dfinie
pour tout x, x > 0, par :
1
x
exp
f (x) =
E [X] =
si
x>0
si
x0
V [X] = 2
12
A. El Mossadeq
r
Y
f (xi )
i=1
r
P
1
exp i=1
r
xi
do :
ln L (; x1 , ..., xr ) = r ln
r
P
xi
i=1
Il en rsulte que :
r
P
xi
r i=1
ln L (; x1 , ..., xr ) = + 2
do :
1X
ln L (; x1 , ..., xr ) = 0 = =
xi
r i=1
r
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure exponentielle est :
r
X
= 1
Xi
r i=1
Cest la moyenne empirique du r-chantillon.
=
=
r
P
xi
1
i=1
exp
r
1
r (x1 , ..., xr )
r exp
13
A. El Mossadeq
et :
1
r (x1 , ..., xr )
g ; (x1 , ..., xr ) = r exp
h (x1 , ..., xr ) = 1
3. Comme :
X
= 1
Xi
r i=1
r
alors :
h i
E
E [X]
h i
V
et :
V [X]
r
2
I [X, ] = E
ln f (, X)
2
2
X
ln
= E
2X
1
= E 2+ 3
1
=
2
Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie
par le r-chantillon est :
I [X1 , ..., Xr , ]
=
=
14
rI [X, ]
r
2
A. El Mossadeq
h i
Calculons lecacit e de ..
On a :
h i
e
=
=
h i
I [X1 , ..., Xr , ] V
Exercice 3
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :
0
si x 0
f (x) =
k
o est un paramtre rel strictement positif , k un entier naturel non nul et une
constante rel.
1. Dterminer la constante .
2. Dterminer lestimateur du maximum de vraisemlance de dun r-chantillon
de variable parente X.
Solution 3
La densit de probabilit de la variable alatoire X est dfinie par :
0
si x 0
f (x) =
k
Rappelons que pour tout k N :
Z +
uk exp udu = k!
0
15
1. Ainsi :
A. El Mossadeq
f (x) dx
x
k1
x exp dx
k
(k 1)!
=
do
=
puisque :
1
(k 1)!
f (x) dx = 1
De plus :
E [X]
=
=
xf (x) dx
Z +
0
=
et :
E X2
1
x
xk exp dx
k
(k 1)!
x2 f (x) dx
=
=
1
x
xk+1 exp dx
k
(k 1)!
0
2
k (k + 1)
do :
V [X]
=
=
E X 2 E [X]2
k2
16
A. El Mossadeq
L (; x1 , ..., xr )
f (xi )
i=1
=
do :
r
Y
r
P
1
k1
exp i=1
r rk (x1 ...xr )
[(k 1)!]
k1
rk ln
xi
r
P
xi
i=1
Il en rsulte que :
r
P
xi
rk i=1
ln L (; x1 , ..., xr ) = + 2
do :
1 X
ln L (; x1 , ..., xr ) = 0 = =
xi
rk i=1
r
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
r
X
= 1
Xi
rk i=1
=
=
r
P
xi
1
i=1
k1
(x1 ...xr ) exp
[(k 1)!]r rk
1
rk (x1 , ..., xr )
k1
(x
...x
)
exp
1
r
[(k 1)!]r rk
17
A. El Mossadeq
o :
et :
1
rk (x1 , ..., xr )
g ; (x1 , ..., xr ) = rk exp
h (x1 , ..., xr ) =
4. Puisque :
1
(x1 ...xr )k1
[(k 1)!]r
X
= 1
Xi
rk i=1
r
alors :
et :
h i 1
E = E [X] =
k
h i V [X]
2
V =
=
rk 2
rk
ln f (, X)
I [X, ] = E
2
2
X
ln (k 1)! + (k 1) ln X k ln
= E
k
2X
= E 2+ 3
k
=
2
Donc la quantit dinformation de F isher, I [X1 , ..., Xr , ], concernant fournie
par le r-chantillon est :
I [X1 , ..., Xr , ]
=
=
rI [X, ]
rk
2
h i
Calculons lecacit e de ..
On a :
h i
1
h i =1
e =
I [X1 , ..., Xr , ] V
18
A. El Mossadeq
Exercice 4
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :
si x
/ [0, ]
0
f (x) =
1 si x [0, ]
Solution 4
1. La fonction de rpartition F de X est dfinie pour tout x R par :
Z x
F (x) =
f (t) dt
do :
de plus :
x
F (x) =
si
x0
si
0x
si
E [X] = 2
2. Puisque le domaine D :
D
V [X] =
12
=
=
{x R |f (x) > 0}
[0, ]
19
A. El Mossadeq
r
Y
f (xi )
i=1
1
r
La fonction :
L (; x1 , ..., xr )
est strictement dcroissante, donc elle atteint son maximum lorsque est minimum.
Et comme :
i {1, ..., r} : xi
20
A. El Mossadeq
Pour tout u R on a :
F (u)
=
=
=
=
h
i
P <u
[F (u)]r
u r
21
si
u0
si
0u
si
A. El Mossadeq
d
F (u)
du
si
r1
ru
si
r
(c) Esprance mathmatique de :
h i
E
u ]0, [
uf (u) du
R
Z
u
/ ]0, [
ur
du
r
r+1
E
=
u2 f (u) du
R
Z r+1
u
=
r r du
0
r 2
=
r+2
(e) Variance de :
h i
V
h 2i
h i2
E E
r
2
2
(r + 1) (r + 2)
=
=
=
=
r + 1
r
r + 1 hi
E
r
22
A. El Mossadeq
et :
V [T ]
=
=
2 h i
r+1
V
r
1
2
r (r + 2)
Exercice 5
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :
si x <
0
f (x) =
exp ( x) si x
Solution 5
1. La fonction de rpartition F de X est dfinie pour tout x R par :
Z x
F (x) =
f (t) dt
do :
F (x) =
de plus :
1 exp ( x)
E [X] = + 1
V [X] = 1
23
si
si
A. El Mossadeq
2. Puisque le domaine D :
D
=
=
{x R |f (x) > 0}
[, +[
L (; x1 , ..., xr )
r
Y
f (xi )
i=1
exp
r
X
i=1
La fonction :
( xi )
L (; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque est maximum.
Et comme :
i {1, ..., r} : xi
24
A. El Mossadeq
=
=
=
=
=
=
=
=
h
i
P <v
k=1
r
Y
k=1
1 [1 F (v)]r
1 exp r ( v)
si
si
=
=
d
F (v)
dv
r exp r ( v)
si
v<
si
v>
vf (v) dv
E
=
R
Z +
=
rv exp r ( v) dv
1
r
25
A. El Mossadeq
2
(d) Esprance mathmatique de :
Z
h 2i
E
=
v2 f (v) dv
ZR+
=
rv 2 exp r ( v) dv
2
1
1
=
+
+ 2
r
r
(e) Variance de :
h i2
h i
h 2i
1
V = E E = 2
r
et :
1
r
h i 1
E [T ] = E =
r
h i
1
V [T ] = V = 2
r
T est donc un estimateur sans biais et convergent de .
Exercice 6
Les lments dune population possdent un caractre X qui suit une loi de P oisson
de paramtre inconnu .
Une suite de r expriences a fourni les valeurs k1 , ..., kr .
1. Dterminer lestimateur du maximum de vraisemlance
de et tudier les
proprits de cet estimateur.
2.
est-il un rsum exhaustif ?
3. On dsire estimer la quantit :
= P [X = 0]
Dterminer lestimateur du maximum de vraisemlance de .
Que remarquez-vous ?
26
A. El Mossadeq
Solution 6
1. Soit X une variable alatoire de Poisson de paramtre .
pour tout x N, la probabilit lmentaire p (x) de x est :
p (x) =
de plus :
x
exp
x!
E [X] =
V [X] =
r
Y
p (ki )
i=1
r
P
ki
i=1
exp r
k1 !...kr !
do :
r
X
i=1
Il en rsulte que :
ln L (; k1 , ..., kr ) =
r
P
ki ln r
ki
i=1
do :
1X
xi
ln L (; k1 , ..., kr ) = 0 = p =
r i=1
r
et comme :
2
ln L (; k1 , ..., kr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune
structure de Poisson est :
r
1X
Xi
=
r i=1
Cest la moyenne empirique du r-chantillon.
27
A. El Mossadeq
=
=
E [X]
et :
V [X]
r
=
r
On en dduit que
est un estimateur sans biais et convergent de .
V [
]
r (k1 ,...,kr )
exp r
x1 !...xr !
g (;
(x1 , ..., xr )) = r(k1 ,...,kr ) exp r
h (x1 , ..., xr ) =
1
x1 !...xr !
3. On a :
=
=
P [X = 0]
exp
r
Y
p (ki )
i=1
r
P
ki
( ln )
r
k1 !...kr !
i=1
=
do :
28
r
X
i=1
ki ln ( ln ) + r ln
A. El Mossadeq
Il en rsulte que :
r
P
ki
r
i=1
ln L (; k1 , ..., kr ) =
+
ln
do :
ln L (; k1 , ..., kr ) = 0 = = exp
et comme :
1X
ki
r i=1
r
2
ln L (; k1 , ..., kr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de cette
structure est :
!
r
X
1
= exp
Xi
r i=1
exp
Exercice 7
Soit un rel appartenant ]1, +[ et X une variable alatoire telle que :
k1
1
1
1
, k N
P [X = k] =
Solution 7
1. On a :
E [X]
=
=
kP [X = k]
k=1
X
k=1
29
k1
k
1
1
A. El Mossadeq
et :
E [X (X 1)]
=
=
=
X
k=1
k (k 1) P [X = k]
k1
k (k 1)
1
1
k=1
1
22 1
do :
E X2
E [X (X 1)] + E [X]
(2 1)
=
=
et :
V [X]
E X 2 E [X]2
( 1)
=
=
r
Y
p (xi )
i=1
1
r
=
do :
ln L (; x1 , ..., xr ) = r ln +
Il en rsulte que :
ln L (; x1 , ..., xr )
r
X
30
Pr x r
1 i=1 i
1
i=1
1
xi r ln 1
r
P
xi r
r
i=1
+
( 1)
r
P
xi r
i=1
( 1)
A. El Mossadeq
do :
1X
ln L (; x1 , ..., xr ) = 0 = =
xi
r i=1
r
et comme :
2
ln L (p; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon dune structure gomtrique est :
r
1X
=
Xi
r i=1
=
Xi
r i=1
r
alors :
E [
]
=
=
E [X]
et :
V [X]
r
( 1)
=
r
On en dduit que
est un estimateur sans biais et convergent du paramtre
dune structure gomtrique.
V [
]
Exercice 8
Soit X une variable alatoire qui suit une loi de Pareto dont la densit de probabilit
f est dfinie par :
+1 si x a
x
f (x) =
0
si x < a
31
A. El Mossadeq
Solution 8
1. La densit de probabilit de la loi de Pareto est dfinie par :
+1 si x a
x
f (x) =
0
si x < a
f est bien une densit de probabilit.
En eet :
Z
f (x) dx =
R
2. On a :
E [X]
xf (x) dx
ZR+
et :
=
=
V [X]
=
=
x2 f (x) dx
ZR+
a
do :
a
dx
x
a
1
=
E X2
a
dx
x+1
1
Z
a
dx
x1
2
a
2
E X 2 E [X]2
2
2a
( 2) ( 1)
32
A. El Mossadeq
f (t) dt
0
si x a
Z x
a
dt si x a
+1
a t
si x a
1 a
si x a
x
4. Considrons un r-chantillon de cette structure.
Sa fonction de vraisemblance est dfinie pour tout a R et tout (x1 , ..., xr )
(]a, +[)r , par :
L (a; x1 , ..., xr )
r
Y
f (xi )
i=1
r ar
(x1 ...xr )+1
La fonction :
a L (a; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque a est maximum.
Et comme :
i {1, ..., r} : a xi
33
A. El Mossadeq
=
=
=
=
P [
a < x]
P [min (X1 , ..., Xr ) < x]
1 P [min (X1 , ..., Xr ) x]
1 P [X1 v, ..., Xr x]
r
Y
1
P [Xk x]
k=1
r
Y
1 [1 F (x)]r
0
r
a
1
x
k=1
si
xa
si
xa
=
=
d
Fa (x)
dv
si
x<a
ra
si x > a
xr+1
(c) Esprance mathmatique de a
:
Z
vfa (v) dv
E [a] =
R
Z +
rar
=
dv
vr
a
r
a
=
r 1
34
A. El Mossadeq
(e) Variance de a :
V [a]
2
a]2
E a
E [
r
2
2a
(r 2) (r 1)
=
=
r 1
a
r
Alors :
E [T ] = a
et :
V [T ] =
r 1
r
V [a] =
1
a2
r (r 2)
Exercice 9
Soit X une variable alatoire dont la densit de probabilit f est dfinie par :
0
si x
f (x) =
1 exp ( x) si x >
35
A. El Mossadeq
Solution 9
1. f est bien une densit de probabilit.
En eet :
Z
Z +
1
( x)
exp
dx
f (x) dx =
Z +
=
exp tdt
0
2. On a :
E [X]
xf (x) dx
ZR+
Z +
et :
E X2
Z +
(t + ) exp tdt
x2 f (x) dx
ZR+
x
( x)
exp
dx
x2
( x)
exp
dx
(t + )2 exp tdt
22 + 2 + 2
( + )2 + 2
=
=
do :
V [X]
=
=
E X 2 E [X]2
36
, de (, )
A. El Mossadeq
0
si x
Z x
=
1
( t)
exp
dt si x
0
si x
1 exp ( x) si x
r
Y
f (xi )
i=1
X ( xi )
1
exp
r
i=1
=
do :
1X
( xi )
i=1
r
ln L (; x1 , ..., xr ) = r ln +
Il en rsulte que :
ln L (; x1 , ..., xr )
r
1 X
2
( xi )
i=1
"
#
r
1
1X
r
( xi )
i=1
r
=
=
do :
ln L (; x1 , ..., xr ) = 0
1X
(xi )
r i=1
r
#
r
1X
=
xi
r i=1
37
"
A. El Mossadeq
et comme :
2
ln L (; x1 , ..., xr ) < 0
2
donc lestimateur du maximum de vraisemblance dun r-chantillon de
cette structure est :
#
" r
1X
=
Xi
r i=1
(b) On a :
E [
]
et :
V [
]
"
"
1X
Xi
r i=1
r
1X
Xi
r i=1
r
V [X]
r
2
=
r
5. On suppose connu et inconnu.
=
r
Y
f (xi )
i=1
X ( xi )
1
exp
r
i=1
=
La fonction :
L (; x1 , ..., xr )
est strictement croissante, donc elle atteint son maximum lorsque est
maximum.
38
A. El Mossadeq
Et comme :
i {1, ..., r} : xi
k=1
r
Y
k=1
1 [1 F (v)]r
1 exp r
si
si
d
F (v)
dv
exp r
39
si
v<
si
v>
A. El Mossadeq
vf (v) dv
E
=
R
Z +
r
v
=
v exp r
dv
Z +
t + exp tdt
=
r
0
+
=
r
2
v2 f (v) dv
E
=
ZR+
r 2
=
v exp r ( v) dv
2 2
+ +
=
r
r
(v) Variance de :
h i
h 2i
h i2
V
= E E
2
=
r
Lestimateur de est biais, mais il est asymptotiquement sans
biais.
(c) Considrons lestimateur :
T =
Alors :
E [T ]
h i
E
r
=
=
et :
h i
V
=
r2
T est donc un estimateur sans biais et convergent de .
V [T ]
40
A. El Mossadeq
r
Y
f (xi )
i=1
X ( xi )
1
exp
r
i=1
r
#
" r
X
1
xi
= r
i=1
(b) On a :
#
" r
X
1
Xi
=
r i=1
h i
E = +
r
et :
E [
]
=
=
h i
E [X] E
r1
41
A. El Mossadeq
T =
r1
alors :
S =
r1
E [T ] =
E [S] =
Exercice 10
Soient X et Y deux variables alatoires indpendantes, la premire prenant les
valeurs 1 et 0 avec les probabilits respectives et 1 , et la deuxime prenant les
valeurs 1 et 0 avec les probabilits respectives P et 1 P . On suppose inconnue
et P connue, P > 0.5.
On dfinit la variable alatoire Z par :
Z = 1 si X = Y
Z=0
si
X 6= Y
1
(Z1 + ... + Zn )
n
6. Voyez-vous une application de ce qui prcde dans le domaine des sondages
dopinion ?
T =
42
A. El Mossadeq
Solution 10
On a :
P [X = 0] = 1
P [X = 1] =
et :
P [Y = 0] = 1 P
P [Y = 1] = P
=
=
=
=
P [X 6= Y ]
P [{(X, Y ) = (0, 1)} {(X, Y ) = (0, 1)}]
P [X = 0] P [Y = 1] + P [X = 1] P [Y = 0]
(1 ) P + (1 P )
P [Z = 1]
=
=
=
=
P [X = Y ]
P [{(X, Y ) = (0, 0)} {(X, Y ) = (1, 1)}]
P [X = 0] P [Y = 0] + P [X = 1] P [Y = 1]
(1 ) (1 P ) + P
et :
=
=
(1 )
1. Puisque (X1 , Y1 ) , ..., (Xn , Yn ) sont indpentants et suivent la mme loi que
(X, Y ), on en dduit que (Z1 , ..., Zn ) sont indpendants et suivent la mme
loi que Z, donc cest un n-chantillon de Z.
2. Soit lestimateur :
1
T = (Z1 + ... + Zn )
n
On a :
E [T ]
=
=
E [Z]
(1 ) (1 P ) + P
43
A. El Mossadeq
et :
1
V [Z]
n
1
[(1 ) (1 P ) + P ] [(1 ) P + (1 P )]
=
n
3. T est donc un estimateur biais de sauf lorsque :
V [T ]
1
2
ou :
P =1
(a) Si :
=
1
ou P = 1
2
1
et P 6= 1
2
=
=
1
[T (1 P )]
2P 1
1
V [T ]
(2P 1)2
1
[(1 ) (1 P ) + P ] [(1 ) P + (1 P )]
n (2P 1)2
44
A. El Mossadeq
Exercice 1
A la veille dune consultation lectorale, on a intrrog cent lecteurs constituant
un chantillon au hasard. Soixante ont dclar avoir lintention de voter pour le
candidat C.
En quelles limites, au moment du sondage, la proportion du corps lectoral favorable
C se situe-t-elle ?
Solution 1
Construisons lintervalle de confiance correspondant la frquence f = 0.6 du corps
lectoral favorable C observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dfini par :
"
#
r
r
f (1 f )
f (1 f )
f t1/2
, f + t1/2
n
n
Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.504, .696]
A 95%, le candidat C serait lu.
Exercice 2
On sait que le taux de mortalit dune certaine maladie est de 30%.
Sur 200 malades tests, combien peut-on envisager de dcs ?
Solution 2
Construisons dobord lintervalle de pari, pour un chantillon de taille n = 200,
correspondant la probabilit de dcs p = 0.3.
Au seuil , cet intervalle est dfini par :
"
#
r
r
p (1 p)
p (1 p)
p t1/2
, p + t1/2
n
n
Pour = 5%, on a :
t.975 = 1.96
47
A. El Mossadeq
Exercice 3
Dans une pr-enqute, on selectionne, par tirage au sort cent dossiers.
Quinze dentre eux sont incomplets.
Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers ?
Solution 3
Construisons lintervalle de confiance correspondant la frquence f = 0.15 de
dossiers incomplets observe sur un chantillon de taille n = 100.
Au seuil , cet intervalle est dfini par :
"
#
r
r
f (1 f )
f (1 f )
f t1/2
, f + t1/2
n
n
Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.08, .22]
Il en rsulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait
compris, 95%, entre 800 et 2200 dossiers.
Exercice 4
Dans une maternit, on fait le point de la proportion de filles toutes les cent naissances.
Comment peut varier cette proportion dune fois lautre si lon admet quil nait
en moyenne 51% de filles ?
Solution 4
Construisons lintervalle de pari, pour un chantillon de taille n = 100, correspondant la probabilit dobtenir une fille p = 0.51.
48
A. El Mossadeq
Exercice 5
Une machine former des pilules fonctionne de faon satisfaisante si la proportion
de pilules non russies est de 1 pour 1000.
Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.
Que faut-il conclure ?
Solution 5
Ici on :
n = 104
f = 15 104
p = 103
f p
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
49
A. El Mossadeq
et comme :
t
=
=
f p
p (1 p)
n
1.58
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, quau seuil
= 5%, la machine fonctionne de faon satisfaisante.
Exercice 6
Sur un chantillon de 600 sujets atteints du cancer des poumons, on a trouv 550
fumeurs.
Que peut-on dire du pourcentage de fumeurs parmi les cancreux ?
Solution 6
11
Construisons lintervalle de confiance correspondant la frquence f =
des
12
cancreux parmi les fumeurs observe sur un chantillon de taille n = 600.
Au seuil , cet intervalle est dfini par :
"
#
r
r
f (1 f )
f (1 f )
f t1/2
, f + t1/2
n
n
Pour = 5%, on a :
t.975 = 1.96
on obtient alors lintervalle :
[.9, .94]
Il en rsulte que parmi, les fumeurs, la proportion des atteints par le cancer des
poumons est comprise, 95%, entre 90% et 94%.
Exercice 7
Avant de procder au lancement dun produit, une entreprise a fait procder une
enqute portant sur deux rgions gographiques A et B.
Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le
produit.
En provenance de B, 150 rponses sur 600 se dclarent favorables.
Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B
quant au produit considr.
50
A. El Mossadeq
Solution 7
Ici on :
nA = 1800 et fA = 20
n = 600 et f = 1
B
B
4
Testons, au seuil , lhypothse nulle :
H0 : les opinions des rgions A et B sont identiques
Sous cette hypothse, la quantit :
fA fB
fA (1 fA ) fB (1 fB )
+
nA
nB
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t= r
t.975 = 1.96
et comme :
t
=
=
fA fB
fA (1 fA ) fB (1 fB )
+
nA
nB
4.77
r
on rejette donc lhypothse nulle H0 95% (et mme 99.98%), cest dire, les
deux rgions A et B ont des opinions direntes.
Exercice 8
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement
par application locale du radium a donn 50 gurisons.
Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,
on a trouv 50 gurisons.
Que peut-on conclure ?
51
A. El Mossadeq
Solution 8
Ici on :
n1 = 200 , f1 = 4
n = 150 , f = 1
2
2
3
Testons, au seuil , lhypothse nulle :
H0 : les deux traitements sont quivalents
Sous cette hypothse, la quantit :
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t= r
t.975 = 1.96
et comme :
t
=
=
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
1.69
r
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les deux mthodes
sont quivalentes.
Exercice 9
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,
95 taient des billets de 1e`re classe. Sur les 250 billets vendus la matine du lundi
suivant, 55 taient de 1e`re classe.
Peut-on considrer quil y a une dirence entre les proportions de vente de parcours
en 1e`re classe pour les fins et dbuts de semaines ?
52
A. El Mossadeq
Solution 9
Ici on :
19
n1 = 350 , f1 = 70
n = 250 , f = 11
2
2
50
Testons, au seuil , lhypothse nulle :
H0 :
t.975 = 1.96
et comme :
f1 f2
= 1.45
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les taux de billets
de parcours en 1e`re classe vendus en fins et dbuts de semaines sont identiques et
quon peut estimer par :
t= r
=
=
n1 f1 + n2 f2
n1 + n2
0.25
Exercice 10
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et
quarante fois face.
Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.
53
Solution 10
Ici on :
A. El Mossadeq
n = 100
f = 0.6
f p
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
on a :
f p
t = r
p (1 p)
n
= 2
(1) Pour = 5%, on a :
t.975 = 1.96
on rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice
est truque.
(2) Pour = 1%, on a :
2.57 < t.995 < 2.58
on accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau
seuil = 1%, la pice est normale.
Exercice 11
Un chantillon de taille n a donn lieu au calcul dune frquence observe f correspondant lintervalle de confiance [.22 .34] au seuil = 5%.
1. Calculer n.
2. Par rapport la proportion p = 0.3, lcart est-il significatif au seuil = 5% ?
3. Dterminer lintervalle de confiance de |f p| au seuil = 5%.
54
A. El Mossadeq
Solution 11
1. Au seuil , lintervalle de confiance correspondant une frquence f observe
sur un chantillon de taille n est dfini par :
"
#
r
r
f (1 f )
f (1 f )
f t1/2
, f + t1/2
n
n
On en dduit :
0.22 + 0.34
f=
Pour = 5%, on a :
f (1 f )
n = t21/2
(f 0.22)2
t0.975 = 1.96
on obtient alors :
f = .28
n = 215
f p
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
f p
t = r
p (1 p)
n
= 0.64
Pour = 5%, on a :
t.975 = 1.96
on accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :
f p
r
t1/2 , t1/2
p (1 p)
n
55
A. El Mossadeq
donc, au seuil :
"
|f p| 0, t1/2
p (1 p)
n
Pour = 5%, on a :
t.975 = 1.96
do :
|f p| [0, 0.06]
Exercice 12
Ltude du taux de dfectuosits arentes aux caractristiques de traitements thermiques dune mme pice, traite par deux fours dirents, a donn lieu aux rsultats
suivants :
* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 pices
traites.
* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 pices
traites.
Que peut-on conclure ?
Solution 12
Ici on :
n1 = 200 , f1 = 0.10
n = 800 , f = 0.15
2
2
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
56
A. El Mossadeq
et comme :
t
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
2.03
r
=
=
on rejette donc lhypothse nulle H0 95%, cest dire, les deux traitements ne sont
pas quivalents.
Exercice 13
Un questionnaire auquel on ne peut rpondre que par oui ou par non, a t
rempli par un chantillon de taille n.
Lintervalle de confiance de la frquence observe f des rponses oui est (0.35 0.43)
au seuil = 5%.
1. Quelle est la taille n de lchantillon.
2. Par rapport la proportion p = 0.4, lcart est-il significatif au seuil = 5% ?
3. Dterminer lintervalle de confiance de |f p| au seuil = 5%.
Solution 13
1. Au seuil , lintervalle de confiance correspondant une frquence f observe
sur un chantillon de taille n est dfini par :
"
f t1/2
f (1 f )
, f + t1/2
n
On en dduit :
0.35 + 0.43
f=
2
Pour = 5%, on a :
f (1 f )
n = t21/2
(f 0.35)2
t0.975 = 1.96
on obtient alors :
f = 0.39
n = 571
57
f (1 f )
n
A. El Mossadeq
f p
p (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
f p
t = r
p (1 p)
n
= 0.49
Pour = 5%, on a :
t.975 = 1.96
On accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :
f p
r
t1/2 , t1/2
p (1 p)
n
donc, au seuil :
"
#
r
p (1 p)
|f p| 0, t1/2
n
Pour = 5%, on a :
t.975 = 1.96
do :
|f p| [0, 0.04]
Exercice 14
Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.
Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.
Le traitement donne-t-il une protection significative ?
58
A. El Mossadeq
Solution 14
Soient f1 la frquence de contracter la maladie pour un sujet non immunis et f2 la
frquence de contracter la maladie pour un sujet immunis.
Ici on :
14
n1 = 370 et f1 = 37
n = 100 et f = 1
2
2
4
Testons, au seuil , lhypothse nulle :
H0 : le traitements nest pas ecace
Sous cette hypothse, la quantit :
t= r
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :
t
=
=
f1 f2
f1 (1 f1 ) f2 (1 f2 )
+
n1
n2
2.56
r
On rejette donc lhypothse nulle H0 95%, cest dire, le traitement donne une
protection significative.
59
A. El Mossadeq
Exercice 1
Avant de procder au lancement dun produit, une entreprise a fait procder une
enqute portant sur deux rgions gographiques A et B.
Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par le
produit.
En provenance de B, 150 rponses sur 600 se dclarent favorables.
Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et B
quant au produit considr.
Solution 1
La rpartition observe est :
T ableau des eff ectif s observ
ees
R
egionOpinion favorable non favorable T otal
R
egion A
630
1170
1800
R
egion B
150
450
600
T otal
780
1620
2400
585
1215
1800
R
egion B
195
405
600
T otal
780
1620
2400
2 X
2
X
(oij tij )2
i=1 j=1
63
tij
A. El Mossadeq
2 X
2
X
(oij tij )2
i=1 j=1
tij
20.51
On rejette alors H0 95% (et mme 99.5%), cest dire, les deux rgions ont des
opinions direntes quant au produit considr.
Exercice 2
Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traitement
par application locale du radium a donn 50 gurisons.
Un autre groupe de 150 sujets atteints de la mme maladie a t trait par chirurgie,
on a trouv 54 gurisons.
Que peut-on conclure ?
Solution 2
La rpartition observe est :
T ableau des eff ectif s observ
ees
T raitementR
esultat gu
eri non gu
eri T otal
radium
50
150
200
chirurgie
54
96
150
T otal
104
246
350
64
A. El Mossadeq
59.4
140.6
200
chirurgie
44.6
105.4
150
T otal
104
246
350
2 X
2
X
(oij tij )2
i=1 j=1
tij
2 X
2
X
(oij tij )2
i=1 j=1
tij
4.94
On rejette alors H0 95% , cest dire, les deux traitements ne sont pas quivalents.
Exercice 3
Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,
95 taient des billets de 1e`re classe. Sur les 250 billets vendus la matine du lundi
suivant, 55 taient de 1e`re classe.
Peut-on considrer quil y une dirence entre les proportions de vente de parcours
en 1e`re classe pour les fins et dbuts de semaines ?
65
A. El Mossadeq
Solution 3
La rpartition observe est :
T ableau des eff ectif s observ
ees
1e`re classe 2e`re classe T otal
jourClasse
V endredi A.M
95
255
350
Lundi matin
55
195
250
T otal
150
450
600
JourClasse
V endredi A.M
87.5
262.5
350
Lundi matin
62.5
187.5
250
T otal
150
450
600
2 X
2
X
(oij tij )2
i=1 j=1
tij
66
A. El Mossadeq
Et comme :
2
2
2 X
X
(oij tij )2
tij
i=1 j=1
2.06
Exercice 4
On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pile et
quarante fois face.
Tester au seuil de 5% puis 1%, lhypothse de la loyaut de la pice.
Solution 4
Testons, au seuil , lhypothse nulle :
H0 : la pice est loyale
Sous cette hypothse, on a :
p = 0.5
do les rpartitions :
C ot
e
R
epartition Observ
ee R
epartition T h
eorique
pile
60
50
f ace
40
50
T otal
100
100
2
X
(oi ti )2
i=1
67
ti
A. El Mossadeq
2
X
(oi ti )2
i=1
ti
Exercice 5
On veut savoir si la russite (R) dun traitement est indpendantes du niveaux de
la tension artrielle du malade (T ).
On dispose pour cela de 250 observations rparties comme suit :
T R
echec succ`
es
basse
21
104
elev
ee
29
96
68
A. El Mossadeq
Solution 5
La rpartition observe est :
T ableau des eff ectif s observ
ees
T R
Echec Succ`
es T otal
Basse
21
104
125
Elev
ee
29
96
125
T otal
50
200
250
Echec Succ`
es T otal
Basse
25
100
125
Elev
ee
25
100
125
T otal
50
200
250
2 X
2
X
(oij tij )2
i=1 j=1
tij
69
A. El Mossadeq
Et comme :
2
2
2 X
X
(oij tij )2
tij
i=1 j=1
1.6
Exercice 6
On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon
(priphrique , non priphrique) et le ct (C) de la lsion (poumon gauche ,
poumon droit).
Ltude a port sur 1054 malades :
LC
gauche droit
p
eriph
erique
26
62
non p
eriph
erique
416
550
Solution 6
La rpartition observe est :
T ableau des eff ectif s observ
ees
LC
p
eriph
erique
26
62
88
non p
eriph
erique
416
550
966
T otal
442
612
1054
70
A. El Mossadeq
gauche
droit
T otal
p
eriph
erique
36.9
51.1
88
nonp
eriph
erique
405.1
560.9
966
T otal
442
612
1054
2
2 X
X
(oij tij )2
i=1 j=1
tij
(2 1) (2 1) = 1
degr de libert.
Pour = 5%, on a :
21;.95 = 3.84
Et comme :
2
2
2 X
X
(oij tij )2
i=1 j=1
tij
6.05
Exercice 7
De nombreuses observations cliniques ont montr que jusque l :
30%
50%
10%
10%
71
A. El Mossadeq
Solution 7
Testons, au seuil , lhypothse nulle :
H0 : le nouveau traitement nest pas actif contre la maladie M
Sous cette hypothse, on a les rpartitions :
Survie
R
epartition Observ
ee R
epartition T h
eorique
survie 1 an
12
24
56
40
T otal
80
80
4
X
(oi ti )2
i=1
ti
72
A. El Mossadeq
Et comme :
2
2
X
(oi ti )2
ti
i=1
14.4
on rejette donc lhypothse nulle H0 95% (mme 99.5%), cest dire, qu 99.5%,
le nouveau traitement est actif contre la maladie M.
Exercice 8
On suppose pouvoir classer les malades atteints dune maladie M en trois catgories
cliniques : A , B , C.
On se demande si ces trois catgories dirent par leurs survies un an.
Les eectifs observs sont les suivants :
SurvieCat
egorie
survie a
` un an
20
45
d
ec
es avant un an
15 50 145
Solution 8
La rpartition observe est :
T ableau des eff ectif s observ
ees
SurvieCat
egorie
T otal
Survie a
` un an
20
45
70
D
ec
es avant un an 15 50 145
210
T otal
20 70 190
280
73
A. El Mossadeq
T otal
Survie a
` un an
17.5
47.5
70
15 52.5 142.5
210
20
280
D
ec
es avant un an
T otal
70
190
3
2 X
X
(oij tij )2
i=1 j=1
tij
(2 1) (3 1) = 2
degrs de libert.
Pour = 5%, on a :
22;.95 = 5.99
Et comme :
3
2 X
X
(oij tij )2
i=1 j=1
tij
.65
Exercice 9
75 enfants sont vus en consultation pour un asthme. On relve chez eux les deux
symptmes suivants :
* Intensit de la maladie asmathique : lgre , moyenne , forte
* Existence ou absence dun eczma au moment de lobservation ou dans le pass.
74
A. El Mossadeq
fort moyen l
eger
pr
esent
pass
e
11
11
jamais
18
14
Solution 9
Le tableau de la rpartition observe est donne ci-aprs:
T ableau des eff ectif s observ
ees
Ecz
emaAsthme f ort moyen l
eger
T otal
pr
esent
12
pass
e
11
11
25
jamais
18
14
38
T otal
25
31
19
75
75
A. El Mossadeq
f ort
moyen l
eger
T otal
pr
esent
4.96
3.04
12
pass
e
8.33
10.33
6.34
25
jamais
12.67
15.71
9.62
38
T otal
25
31
19
75
Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq, ce qui
empche lapplication dun test du Khi-deux.On peut remdier cet tat en oprant
le groupement logique des classes pr
esent et pass
e.
Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs regroupement de ces deux classes sont donns ci-aprs.
T ableau des eff ectif s observ
ees
Ecz
emaAsthme f ort moyen l
eger
T otal
pr
esent ou pass
e
19
13
37
jamais
18
14
38
T otal
25
31
19
75
fort
moyen l
eger
pr
esent ou pass
e
12.33
15.29
9.38
37
jamais
12.67
15.71
9.62
38
T otal
25
31
19
75
3
2 X
X
(oij tij )2
i=1 j=1
76
tij
T otal
A. El Mossadeq
3
2 X
X
(oij tij )2
i=1 j=1
tij
11.84
Exercice 10
Une tude statistique relative aux rsultats dadmission du concours dune grande
cole fait ressortir la rpartition des admis selon la profession des parents lorsque
celle-ci est connue.
1. La profession des parents a-t-elle une influence sur laccs cette cole ?
2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la statistique prcdente de 961 candidats dont lorigine socio-professionnelle est inconnue et qui ont obtenus 43 succs ?
P rof ession des P arents
Candidats Admis
F ontionnaires et Assimil
es
2224
180
Commerce et Industrie
998
89
575
48
P ropri
etaires Rentiers
423
37
P ropri
etaires Agricoles
287
13
Artisans
210
18
Banques et Assurances
209
17
77
A. El Mossadeq
Solution 10
1. La rpartition observe est :
P rofession des P arents
F ontionnaires et Assimil
es
2224
180
2044
Commerce et Industrie
998
89
899
P rofessions Lib
erales
575
48
527
P ropri
etaires Rentiers
423
37
386
P ropri
etaires Agricoles
287
13
274
Artisans
210
18
192
Banques et Assurances
209
17
192
4916
402
4514
T otal
Testons, au seuil , lhypothse nulle :
F ontionnaires et Assimil
es
2224
181.9
2042.1
Commerce et Industrie
998
80.8
907.2
P rofessions Lib
erales
575
47
528
P ropri
etaires Rentiers
423
34.6
388.4
P ropri
etaires Agricoles
287
23.5
263.5
Artisans
210
17.2
192.8
Banques et Assurances
209
17.1
191.9
4916
402
4514
T otal
78
A. El Mossadeq
7 X
2
X
(oij tij )2
i=1 j=1
tij
On accepte alors H0 au seuil = 5% , cest dire, laccs lEcole est indpendant de la profession des parents.
2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle est
inconnue et qui ont obtenus 43 succs, la rpartition observe et la rpartition
thorique, sous la mme hypothse nulle, deviennent comme consogns ci-aprs.
T ableau des eff ectif s observ
ees
P rofession des P arents
F ontionnaires et Assimil
es
2224
180
2044
Commerce et Industrie
998
89
899
P rofessions Lib
erales
575
48
527
P ropri
etaires Rentiers
423
37
386
P ropri
etaires Agricoles
287
13
274
Artisans
210
18
192
Banques et Assurances
209
17
192
Autres
961
43
918
5877
445
5432
T otal
79
A. El Mossadeq
F ontionnaires et Assimil
es
2224
168.4
2055.6
Commerce et Industrie
998
74.8
913.2
P rofessions Lib
erales
575
43.5
531.5
P ropri
etaires Rentiers
423
32
391
P ropri
etaires Agricoles
287
21.7
265.3
Artisans
210
15.9
194.1
Banques et Assurances
209
15.8
193.2
Autres
961
72.8
888.2
5877
445
5432
T otal
2
8 X
X
(oij tij )2
i=1 j=1
tij
On rejette alors H0 95% (mme 99.5%) , cest dire, laccs lEcole est
indpendant de la profession des parents.
80
A. El Mossadeq
Exercice 11
Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre la
survenue dune hypoglycmie et la survenue dun ictre :
sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques
sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques
sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiques
Que peut-on conclure ?
Solution 11
La rpartition observe est donne dans le tableau :
T ableau des eff ectif s observ
ees
Ict`
ereHypoglyc
emie hypoglyc
emique non hypoglyc
emique T otal
pas d0 ict`
ere
23
20
43
ict`
ere mod
er
e
14
20
ict`
ere intense
17
21
T otal
33
51
84
16.89
26.11
43
ict`
ere mod
er
e
7.86
12.14
20
ict`
ere intense
8.25
12.75
21
T otal
33
51
84
81
A. El Mossadeq
2 X
2
X
(oij tij )2
i=1 j=1
tij
2
3 X
X
(oij tij )2
i=1 j=1
tij
7.97
On rejette alors H0 95% (mme 97.5%), cest dire, la survenue dune hypoglycmie dpend de la survenue dun ictre.
Exercice 12
Un mdicament essay sur 42 patients est contrl quant aux eets secondaires quil
peut avoir sur le poids des malades.
On peut considrer que :
quinze dentre eux ont maigri
dix sept nont pas chang de poids
dix ont grossi
En supposant que la maladie est sans eet sur les variations de poids, le mdicament
a-t-il un eet significatif sur le poids ?
Solution 12
Testons, au seuil , lhypothse nulle :
H0 : le traitement est sans eet sur les variations du poids
Si le traitement est sans eet sur les variations du poids, alors ces variations sont
des seulement au hasard.
La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaque
1
classe est la mme et est gale .
3
82
A. El Mossadeq
Do les rpartitions :
V ariations
R
epartition Observ
ee R
epartition T h
eorique
ont maigri
15
14
17
14
ont grossi
10
14
T otal
42
42
3
X
(oi ti )2
i=1
ti
2
X
(oi ti )2
i=1
ti
1.86
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, le traitement est
sans eet sur les variations du poids.
Exercice 13
Pour tudier la densit de poussires dans un gaz, on a procd une srie dobservations
de petits chantillons de gaz au moyen dun microscope.
On a ainsi eectu 143 observations et les rsultats sont les suivants :
83
A. El Mossadeq
34
46
38
19
>5
Solution 13
Testons, au seuil , lhypothse nulle :
H0 : le nombre de particules en suspension est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
k
exp
k!
o X est la variable alatoire reprsentant le nombre de particules en suspension.
On sait que :
n
1X
=
Xi
n i=1
P [X = k] =
1 X
ini
143 i=0
5
=
=
1.4336
Do les rpartitions :
84
A. El Mossadeq
P articules en suspension
R
epartition observ
ee R
epartition th
eorique
34
34.1
46
48.9
38
35.0
19
16.7
06.0
01.7
>5
00.6
T otal
143
143
R
epartition observ
ee R
epartition th
eorique
34
34.1
46
48.9
38
35.0
19
16.7
08.3
T otal
143
143
85
A. El Mossadeq
4
X
(oi ti )2
i=0
ti
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis
lestimation, et non la valeur rel, du paramtre de la loi de Poisson.
Pour = 5%, on a :
23;.95 = 7.81
Et comme :
2 = 2.97
On accepte alors H0 au seuil = 5%, cest dire, le nombre de particules en
suspension peut tre ajust par une loi de Poisson dont le paramtre est estim
par :
= 1.4336
Exercice 14
Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant atteint
la cte orientale des Etats-Unis entre 1887 et 1956 :
Nombre annuel de cyclones Nombre d0 ann
ees
0
1
1
6
2
10
3
16
4
19
5
5
6
8
7
3
8
1
9
1
>9
0
Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est une
variable de P oisson ?
86
A. El Mossadeq
Solution 14
Testons, au seuil , lhypothse nulle :
H0 : le nombre annuel de cyclones est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
k
exp
k!
o X est la variable alatoire reprsentant le nombre annuel de cyclones.
On sait que :
n
1X
=
Xi
n i=1
P [X = k] =
1 X
=
ini = 3.7286
70 i=0
9
87
A. El Mossadeq
7.95
10
11.69
16
14.53
19
13.54
10.10
6.28
5.91
T otal
70
70
7
X
(oi ti )2
i=1
ti
degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilis
lestimation, et non la valeur rel, du paramtre de la loi de Poisson.
Pour = 5%, on a :
25;.95 = 5.8948
Et comme :
2 = 5.81
On accepte alors H0 au seuil = 5%, cest dire, le nombre annuel de cyclones
peut tre ajust par une loi de Poisson dont le paramtre est estim par :
= 3.7286
88
A. El Mossadeq
Exercice 15
Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprs la
couleur de leurs yeux (Y ) et la couleur de leus cheveux (C) :
Y C
Bleus
25
Gris ou V erts
13
17
10
Marrons
13
Solution 15
La rpartition observe est :
Y C
Bleus
25
44
Gris ou V erts
13
17
10
47
Marrons
13
33
T otal
45
39
21
19
124
Bleus
16
13.8
7.4
6.8
44
Gris ou V erts
17
14.8
7.2
47
Marrons
12
10.4
5.6
33
T otal
45
39
21
19
124
89
A. El Mossadeq
3 X
4
X
(oij tij )2
i=1 j=1
tij
3
2 X
X
(oij tij )2
i=1 j=1
tij
15
On rejette alors H0 95% (mme 97.5%), cest dire, les couleurs des yeux et des
cheveux ne sont pas indpendantes.
Exercice 16
On considre les familles de quatre enfants.
Sur un chantillon de cent familles quatre enfants, la rpartition suivante a t observe :
20
41
22
10
Peut-on considrer que la probabilit quun enfant soit une fille est
90
1
?
2
A. El Mossadeq
Solution 16
Testons, au seuil , lhypothse nulle :
1
2
Sous lhypothse nulle H0 , la variable alatoire X gale au nombre de filles
parmi
1
1
les quatre enfants suit une loi binomiale dordre 4 et de paramtre : B 4,
.
2
2
Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k filles parmi les quatre
enfants est :
4
1
pk = C (4, k)
2
H0 : la probabilit davoir une fille est
6.25
20
25
41
37.5
22
25
10
6.25
T otal
100
100
4
X
(oi ti )2
i=0
ti
91
A. El Mossadeq
Et comme :
2 = 4.03
On accepte alors H0 au seuil = 5% : la probabilit davoir une fille est
1
.
2
Exercice 17
On distribue un jeu de quarante cartes quatre joueurs : A , B , C , D ; chacun
reevant dix cartes
Un statisticien a labor un programme de distribution de donnes par ordinateur.
Pour un ensemble de deux cents donnes, obtenues partir de ce programme, il
observe le nombre de donnes o le joueur A reoit k as, 0 k 4. Les rsultats
sont les suivants :
Nombre d0 as Nombre de donnes
0
64
74
52
Solution 17
Testons, au seuil , lhypothse nulle :
H0 : le programme du statisticien est fiable
Sous lhypothse nulle H0 , la variable alatoire X gale au nombre das du joueur
A suit une loi hypergomtrique.
Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k as est :
pk =
C (4, k) C (36, 10 k)
C (40, 10)
92
A. El Mossadeq
Do les rpartitions :
Nombre d0 as R
epartition observ
ee R
epartition th
eorique
0
64
59.97
74
88.85
52
42.84
7.88
0.46
T otal
200
200
64
59.97
74
88.85
52
42.84
3 ou 4
10
8.34
T otal
200
200
3
X
(oi ti )2
i=0
ti
93
A. El Mossadeq
Pour = 5%, on a :
23;.95 = 7.81
Et comme :
2 = 5.0418
On accepte alors H0 au seuil = 5%, cest dire, le programme du statisticien est
fiable.
94
A. El Mossadeq
Exercice 1
Une srie de cent mesures a donn comme rsultat :
100
X
xi = 5200
i=1
"
#2
100
X
100
P
1
xi
xj = 396
100 j=1
i=1
Solution 1
1. Soit m lestimation de la moyenne et s2 celle de la variance.
On a :
1 X
xi
100 i=1
100
=
=
52
et :
1 X
(xi m)2
99 i=1
100
=
=
m t1/2 , m + t1/2
n
n
Pour = 5%, on a :
t.975 = 1.96
do lintervalle de confiance 95% :
[51.608, 52.392]
3. Au seuil , lintervalle de confiace de la variance est dfini par :
"
(n 1) 2 (n 1) 2
s, 2
s
2n1;1/2
n1;/2
97
A. El Mossadeq
Pour = 5% :
2
99;.025 ' 2100;.025 = 74.2
2
2
99;.975 ' 100;.975 = 129.6
Exercice 2
La force de rupture dun certain type de cable peut tre assimile une variable
alatoire normale.
Des essais portant sur dix cables ont donn une variance empirique s2 de 1560 N2 .
Construire un intervalle de confiance, 95%, de lcart-type de cette force de rupture.
Solution 2
Au seuil , lintervalle de confiace de lcart-type est dfini par :
"s
Pour = 5% :
(n 1)
s,
2n1;1/2
(n 1)
s
2n1;/2
2
9;.025 = 2.7
2
9;.975 = 19
Exercice 3
Une enqute statistique eectue sur cent sujets permet de dfinir, 95%, lintervalle
de confiance de la moyenne :
[49.6 50.4]
98
A. El Mossadeq
Solution 3
Il sagit de dterminer la taille n0 de lchantillon prlever pour que lintervalle de
confiance de la moyenne 95% soit :
[49.8, 50.2]
sachant que pour un chantillon de taille n = 100, cet intervalle est :
[49.6, 50.4]
Puisque :
on en dduit :
=
=
et :
=
'
49.6 + 50.4
2
50
n (50.4 49.6)
2t1/2
2.04
Lgalit :
50.2 = m + t1/2
n0
implique :
0
=
=
t1/2
50.2 m
400
Exercice 4
Pour dterminer le point de fusion moyen dun certain alliage, on a procd neuf
observations qui ont donnes une moyenne m = 1040 C et un cart-type s = 16 C.
Construire un intervalle de confiance de la moyenne 95%.
99
A. El Mossadeq
Solution 4
Ici on a :
n
m
s
=
=
=
9
1040 C
16 C
Pour = 5%, on a :
s
s
m tn1;1/2 , m + tn1;1/2
n
n
t8;.975 = 2.31
Exercice 5
= 172 cm
La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X
et pour cart-type sX = 6 cm.
Les mmes mesures eectues sur les 250 conscrits du bureau de recrutement Y ont
donn pour moyenne Y = 170 cm et pour cart-type sX = 5 cm.
Que peut-on conclure ?
Solution 5
Testons au seuil lhypothse nulle :
H0 : les conscrits des bureaux de recrutement X et Y ont la mme taille
Sous lhypothse nulle H0 , la quantit :
Y
X
t= r 2
sX s2Y
+
n1
n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
100
A. El Mossadeq
Et comme :
t
Y
X
r 2
sX s2Y
+
n1
n2
5.547
=
=
On rejette alors lhypothse nulle H0 95% (mme 99%), cest dire, les conscrits
des bureaux de recrutement X et Y ont des tailles moyennes direntes.
Exercice 6
On se propose de comparer le poids la naissance chez une srie de primapares
(srie 1) et une srie de multipares (srie 2) :
m1 = 3197 g s21 = 210100 g2
S
erie 1 : n1 = 95
S
erie 2 : n2 = 105 m2 = 3410 g s22 = 255400 g2
Que peut-on conclure ?
Solution 6
Testons au seuil lhypothse nulle :
H0 : les primapares et les multipares ont le mme poids moyen la naissance
Sous lhypothse nulle H0 , la quantit :
m1 m2
t= r 2
s1
s22
+
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.Pour = 5%, on a :
t.975 = 1.96
Et comme :
t
=
=
m m2
r 12
s1
s2
+ 2
n1 n2
3.1256
On rejette alors lhypothse nulle H0 , 95% (mme 99%), cest dire, les primapares et les multipares nont pas le mme poids moyen la naissance
101
A. El Mossadeq
Exercice 7
Chez cent sujet normaux, on dose lacide urique, les rsultats sont :
m1 = 53.3 mg/ l
s1
=
9.1 mg/ l
Chez cent sujet atteints de la maladie de goutte, le mme dosage de lacide urique
fournit les rsultats :
m2 = 78.6 mg/ l
s2
= 13.1 mg/ l
Que peut-on conclure ?
Solution 7
Testons au seuil , lhypothse nulle :
H0 : la maladie de goutte na pas dinfluence sur la dose de lacide urique
Sous cette hypothse, la quantit :
m1 m2
t= r 2
s1
s2
+ 2
n1 n2
peut tre considre comme une ralisation dune variable alatoire normale centre
rduite.
Pour = 5%, on a :
t.975 = 1.96
et comme :
t
=
=
m m2
r 12
s1
s2
+ 2
n1 n2
15.862
Exercice 8
On admet que la valeur moyenne de la glycmie du sujet normal est 1 g/ l.
Sur 17 sujets, on a trouv une moyenne de .965 g/ l et un cart-type estim de
.108 g/ l.
Cette valeur peut-elle tre considre comme dirente du taux normal ?
102
A. El Mossadeq
Solution 8
Testons au seuil , lhypothse nulle :
H0 : la valeur est normale
Sous cette hypothse, la quantit :
t=
m
s
=
=
m
s
n
1.3362
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la valeur est normale.
Exercice 9
Dans un chantillon de 17 prmaturs, la moyenne du Na-plasmatique est :
m1 = 133
s2
1
81.2
m2 = 136
Que peut-on conclure ?
s2
2
56.57
Solution 9
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances du N aplasmatique chez les prmaturs et les dysmaturs.
103
A. El Mossadeq
s21
s22
=
=
s21
s22
1.4354
=
=
=
=
m m2
r1
1
1
s
+
n1 n2
1.17
104
A. El Mossadeq
On accepte lhypothse nulle H0 au seuil = 10%, cest dire, les prmaturs et les
dysmaturs ont la mme moyenne du Na-plasmatique estime par :
m
n1 m1 + n2 m2
n1 + n2
134.79
=
=
Exercice 10
Lorquune machine est bien rgle, elle produit des pices dont le diamtre D est
une variable gaussienne de moyenne 25 mm.
Deux heures aprs le rglage de la machine, on a prlev au hasard neuf pices.
Leurs diamtres ont pour mesure en mm :
22 23 21 25 24 23 22 26 21
Que peut-on conclure quant la qualit du rglage aprs deux heures de fonctionnement de la machine ?
Solution 10
Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet
chantillon de taille n = 9.
On a :
n
1X
m =
xi
n i=1
=
23 mm
et :
1 X
(xi m)2
n 1 i=1
n
=
=
3 mm2
m
s
105
A. El Mossadeq
=
=
m
s
n
3.4641
Exercice 11
Si lcart-type de la dure de vie dun modle de lampe lectrique est estim cent
heures, quelle doit tre la taille de lchantillon prlever pour que lerreur sur
lestimation de la dure de vie moyenne nexde pas vingt heures et ce avec une
probabilit de 95% puis 99% ?
Solution 11
Lerreur sur lestimation de la moyenne est donne par :
s
t1/2
n
(1) Pour = 5%, on a :
t1/2 = 1.96
do :
s
t1/2 20 = n 97
n
(2) Pour = 1%, on a :
t1/2 = 2.57
do :
s
t1/2 20 = n 166
n
106
A. El Mossadeq
Exercice 12
Une machine fabrique des rondelles dont le diamtre D est une variable guassienne.
On prlve au hasard un chantillon de huit rondelles.
Leurs diamtres ont pour mesure en mm :
20.1 19.9 19.7 20.2 20.1 23.1 22.6 19.8
Construire 95% puis 99% les intervalles de confiance de la moyenne et de la variance.
Solution 12
Calculons dabord les estimations m et s2 de la moyenne et de la variance sur cet
chantillon de taille n = 8.
On a :
n
1X
m =
xi
n i=1
=
20.6875 mm
et
1 X
(xi m)2
n 1 i=1
n
=
=
1.827 mm2
s
s
m tn1;1/2 , m + tn1;1/2
n
n
(a) Pour = 5%, on a :
t7;.975 = 2.36
do lintervalle :
[19.163, 22.212]
107
A. El Mossadeq
2
7;.975 = 16
[.79931, 7.5675]
(b) Pour = 1%, on a :
2
7;.005 = .989
do lintervalle :
2
7;.995 = 20.3
[.63, 12.931]
Exercice 13
On eectue un dosage par deux mthodes direntes A et B.
On obtient les rsultats suivants :
M ethode A
.6
.65
.7
.7
.7
.7
.75
.8
.8
M ethode B
.6
.6
.65
.65
.7
.6
.75
.8
.8
Solution 13
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :
1X
x1i = .71
m1 = 9
i=1
1X
(x1i m1 )2 = .004
s1 = 8
i=1
108
A. El Mossadeq
et :
1X
x2i = .68
m2 = 9
i=1
9
1X
(x2i m2 )2 = .007
s2 = 8
i=1
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
deux mthodes de dosage.
Sous cette hypothse, la quantit :
f=
s22
s21
=
=
s22
s21
1.75
=
=
109
A. El Mossadeq
Pour = 10%, on a :
t16;.95 = 1.75
et comme :
t
=
=
m m2
r1
1
1
s
+
n1 n2
0.86
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux mthodes de
dosage sont quivalentes.
Exercice 14
Dans deux types de forts, on a mesur les hauteurs de treize et quatorze peuplements choisis au hasard et indpendamment dans le but de vrifier si les hauteurs
de ces deux types darbres sont ou ne sont pas gales.
Les rsultats sont les suivants :
T ype 1 : 22.5 22.9 23.7 24.0 24.4 24.5 26.0
26.2 26.4 26.7 27.4 28.6 28.7
T ype 2 : 23.4 24.4 24.6 24.9 25.0 26.2 26.3
26.8 26.8 26.9 27.0 27.6 27.7 27.8
On admet que les hauteurs de ces deux types darbres sont des variables gaussiennes
N (1 , 21 ) et N (2 , 22 ).
Que peut-on conclure ?
Solution 14
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :
13
1 X
x1i = 25.538
m1 = 13
i=1
13
1 X
(x1i m1 )2 = 4.1576
s1 = 12
i=1
110
A. El Mossadeq
et :
14
1 X
x2i = 26.1
m2 = 14
i=1
14
1 X
(x2i m2 )2 = 1.9431
s2 = 13
i=1
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
hauteurs des deux types darbres.
Sous cette hypothse, la quantit :
f=
s21
s22
degrs de libert.
Pour = 10%, on a :
F12,13;.95 = 2.6
et comme :
f
=
=
s21
s22
2.1398
on accepte donc lhypothse dgalit des variances des hauteurs des deux types
darbres.
Calculons maintenant lestimation commune s2 de cette variance :
s2
=
=
111
A. El Mossadeq
=
=
m m2
r1
1
1
s
+
n1 n2
0.84155
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux types darbres
ont la mme hauteur moyenne estime par :
m
=
=
n1 m1 + n2 m2
n1 + n2
25.829
Exercice 15
On considre deux varits de mas M1 et M2 dont les rendements sont des variables alatoires gaussiennes N (1 , 21 ) et N (2 , 22 ).
Afin de comparer les rendements de ces deux varits de mas, on a choisi de cultiver dans neuf stations direntes des parcelles voisines encemences de lune ou
lautre des deux varits.On a observ les rendements suivants :
Station
V ari
et
e 1 39.6 32.4 33.1 27
36
32
V ari
et
e 2 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2 34.1
Que peut-on conclure ?
112
A. El Mossadeq
Solution 15
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ) :
13
1 X
x1i = 32.4
m1 = 13
i=1
et :
13
1 X
(x1i m1 )2 = 17.188
s1 = 12
i=1
14
1 X
x2i = 31.1
m2 = 14
i=1
14
1 X
(x2i m2 )2 = 21.785
s2 = 13
i=1
Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
rendements des deux varits de mas.
Sous cette hypothse, la quantit :
f=
s22
s21
=
=
s22
s21
1.2675
On accepte donc lhypothse dgalit des variances des hauteurs des deux types
darbres.
Calculons maintenant lestimation commune s2 de cette variance :
s2
=
=
=
113
A. El Mossadeq
=
=
m m2
r1
1
1
s
+
n1 n2
.42892
on accepte lhypothse nulle H0 au seuil = 10%, cest dire, les deux varits de
mas ont le mme rendement moyen estim par :
m
=
=
n1 m1 + n2 m2
n1 + n2
31.75
Exercice 16
Le relev des tempratures journalires minimales de deux stations S1 et S2 , au
cours de neuf journes conscutives a fourni les valeurs suivantes en C:
Station 1 12
Station 2
9 10 11 13 10 7 10
7 11 10
8 11 12 9
114
A. El Mossadeq
Solution 16
1. Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ).
On a :
11
1X
m
=
x1i = 10 C
i=1
et :
11
1X
(x1i m1 )2 = 3.5
s1 = 8
i=1
10
1X
m2 =
x2i = 9 C
i=1
10
1X
(x2i m2 )2 = 4.5
s2 = 8
i=1
(a) Lintervalle de confiance de 1 1 est dfini par :
s1
s1
m1 tn1;1/2 , m1 + tn1;1/2
n
n
Pour = 5%, on a :
t8;.975 = 2.31
do lintervalle :
[8.56 C, 11.44 C]
(b) Lintervalle de confiance de 21 1 est dfini par :
#
"
(n 1) s21 (n 1) s21
,
2n1;1/2 2n1;/2
Pour = 5%, on a :
2
8;.025 = 2.18
2
8;.975 = 17.5
115
A. El Mossadeq
do lintervalle :
[1.6, 12.8]
(c) Lintervalle de confiance de 2 1 est dfini par :
s2
s2
m2 tn1;1/2 , m2 + tn1;1/2
n
n
Pour = 5%, on a :
t8;.975 = 2.31
do lintervalle :
[7.37 C, 10.63 C]
(d) Lintervalle de confiance de 22 1 est dfini par :
#
"
2
2
(n 1) s2 (n 1) s2
,
2n1;1/2 2n1;/2
Pour = 5%, on a :
do lintervalle :
2
8;.025 = 2.18
2
8;.975 = 17.5
[2.06, 16.51]
2. Testons dabord, au seuil = 10%, lhypothse nulle dgalit des variances des
tempratures journalires minimales des deux stations S1 et S2 .
Sous cette hypothse, la quantit :
f=
s22
s21
s22
= 1.29
s21
116
A. El Mossadeq
=
=
=
=
=
=
n1 m1 + n2 m2
n1 + n2
m1 + m2
2
9.5
117
A. El Mossadeq
Exercice 17
On tudie leet dune substance sur la croissance dune tumeur gree.
Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de la tumeur
au 20e`me jour aprs sa gree :
Surf ace 5.5 6 6.5 7 7.5 8
T emoins 1 2 3 8 4 3
T rait
es
4 4 8 3 1 1
Le traitement a-t-il un eet significatif sur la surface tumorale ?
On suppose que la surface tumorale est distribue selon des lois normales N (1 , 21 )
et N (2 , 22 ) chez les tmoins et les traits respectivement.
Solution 17
Calculons les estimations (m1 , s21 ) de (1 , 21 ) et (m2 , s22 ) de (2 , 22 ).
On a :
1 X
m1 =
n1i xi = 7
21
i=1
et :
1 X
s1 = 20
i=1
1 X
m2 =
n2i xi = 6.4048
21 i=1
1 X
s2 = 20
i=1
Testons dabord, au seuil = 2%, lhypothse nulle dgalit des variances des
surfaces tumorales chez les populations des tmoins et des traits.
Sous cette hypothse, la quantit :
s22
f= 2
s1
est une ralisation dune variable alatoire de Fisher :
(n2 1, n1 1) = (20, 20)
degrs de libert.
118
A. El Mossadeq
Pour = 2%, on a :
F20,20;.99 = 2.94
et comme :
f
=
=
s22
s21
1.9549
=
=
=
=
m m2
r1
1
1
s
+
n1 n2
2.831
on rejette lhypothse nulle H0 98%, cest dire, le traitement a une influence sur
la croissance de la surface tumorale.
119