Você está na página 1de 2

1

Université Paris I, Panthéon - Sorbonne

Première Année Master M.A.S.S. 2005 − 2006


Statistiques I
Examen terminal, janvier 2006
Examen de 3 h 00. Tout document ou calculatrice est interdit.

1. On considère (Xk )k∈IN et (Xk0 )k∈IN deux suites indépendantes de variables aléatoires définies sur le même
espace de probabilité, indépendantes et identiquement distribuées suivant les lois respectives N (µ, σ 2 )
(pour les Xi ) et N (µ0 , σ 2 ) (pour les Xi0 ), où (µ, µ0 ) ∈ IR2 et σ 2 > 0. Le but du problème est de tester si
µ = µ0 à partir d’échantillon de chacune de ces variables.
Soit (X1 , . . . , Xn ) et (X10 , . . . , Xn0 0 ), où n ∈ IN∗ et n0 ∈ IN∗ , deux échantillons issus de (Xk )k∈IN et
(Xk0 )k∈IN . On pose Z = (Z1 , . . . , Zn+n0 ) = (X1 , . . . , Xn , X10 , . . . , Xn0 0 )

(a) Déterminer le modèle statistique associé à Z = (Z1 , . . . , Zn+n0 ).


(b) Montrer que ce modèle est exponentiel. En déduire que µ et µ0 peuvent être estimés efficacement
(on notera µ b0 leurs estimateurs respectifs).
b et µ
b 2 du maximum de vraisemblance de σ 2 . Est-il biaisé ? Est-il efficace ?
(c) Déterminer un estimateur σ
(d) Lorsque n et n0 sont ”grands”, déduire de ce qui précède, des intervalles de confiance à 95% pour
µ et µ0 .
(e) Soit le problème de test :

H0 : µ = µ0 contre H1 : µ 6= µ0

(σ 2 restant inconnu). Démontrer que la statistique Tb du rapport de vraisemblance vérifie :


0

n+n

2 1 X  2
 σ = Z − Z

!(n+n0 )/2 
j n+n0
n + n0 j=1

b2

σ
Tb = avec 0
σ2 
 1 n+n
X
 Z n+n0 = Zi


0
n + n i=1

b 2 ≥ K · σ 2 , avec K
En déduire que la région d’acceptation du test peut s’écrire sous la forme σ
dépendant du niveau du test.
(f) Pour déterminer la valeur K en fonction du niveau 1 − α du test, on peut considérer la statistique,
dite de Fisher,
(n + n0 ) · σ 2 − (n + n0 ) · σ
b2
Tb0 =  n + n0 
b2
σ
n + n0 − 2
0
i. Soit les vecteurs de IRn+n , u1 = (1, . . . , 1), u = (1, . . . , 1, 0, . . . , 0) (soit n fois 1 et n0 fois 0) et
u0 = u1 − u. Montrer que u et u0 sont orthogonaux.
ii. Sous l’hypothèse H0 , déterminer une expression plus simple de P<u1 > (Z), projeté orthogonal
de Z sur le sous-espace vectoriel (s.e.v.) engendré par u1 , et P<u,u0 > (Z), projeté orthogonal
de Z sur le s.e.v. engendré par u et u0 .
2

iii. Montrer que sous l’hypothèse H0 , le vecteur Z peut s’écrire Z = µ · u1 + σ · ε, où ε est un
vecteur aléatoire gaussien composé de n + n0 variables gaussiennes centrées réduites.
iv. Montrer que sous l’hypothèse H0 , (n + n0 ) · σ
b 2 = σ 2 · kPA (ε)k2 , où k.k est la norme euclidienne
n+n0 0
classique sur IR et A est un s.e.v. de IRn+n que vous préciserez.
v. En utilisant le Théorème de Pythagore, montrer que sous l’hypothèse H0 et avec B est s.e.v.
0
de IRn+n que vous préciserez, (n + n0 ) · σ 2 − (n + n0 ) · σ
b 2 = σ 2 · kPB (ε)k2 .
vi. En utilisant le Théorème de Cochran, montrer que sous l’hypothèse H0 , Tb0 suit une loi de
Fisher à (1, (n + n0 − 2)) degrés de liberté. Lorsque n et n0 sont ”grands”, quelle loi suit
approximativement Tb0 ?
vii. Pour finir, déterminer K en fonction d’un quantile de la loi de Fisher à (1, (n + n0 − 2)) degrés
de liberté.

2. Soit X une variable aléatoire dont la mesure de probabilité est absolument continue par rapport à la
mesure de Lebesgue sur IR et de densité :
λ
f (x) = exp ( − λ|x − m|) pour x ∈ IR,
2
avec m ∈ IR et λ > 0, des paramètres inconnus.

(a) Calculer l’espérance et la variance de X.


(b) Calculer P (X = m) et P (X < m). En déduire la médiane (théorique) de la loi de X.
(c) Soit une suite (Xi )i∈IN de variables aléatoires indépendantes et identiquement distribuées suivant
la même loi que X, dont on extrait un échantillon observé (X1 , . . . , X2n+1 ). Par ailleurs, on note
X(1) ≤ X(2) ≤ . . . ≤ X(2n+1) la statistique d’ordre associée. Soit :

2n+1
1 X
H
b n (a) = |Xi − a| pour a ∈ IR.
2n + 1 i=1

Calculer H (n+1) ) en fonction des Xi . Montrer que la fonction a 7→ Hn (a) est minimale en
b n (X b
X(n+1) (on pourra développer H b n (X
(n+k) ) en fonction des Xi pour k > 1).
(d) On suppose ici que m = 1, donc que m est connu (λ > 0 restant inconnu). Quel est alors le modèle
statistique ? Montrer que ce modèle appartient à la famille exponentielle, et en déduire une statis-
tique exhaustive dont vous montrerez qu’elle est complète. Déterminer la matrice d’information
de Fisher du modèle. Quelle est la fonction de λ (à une transformation affine près) que l’on peut
estimer efficacement ? Déterminer l’estimateur de maximum de vraisemblance de λ et montrer
qu’il vérifie un théorème de la limite centrale.
(e) On suppose désormais que m ∈ IR est inconnu, tout comme λ > 0. Quel est alors le modèle
statistique ? Montrer que ce modèle n’appartient pas à la famille exponentielle. A l’aide de la
question 2.(c), déterminer un estimateur (m
b n, λ
b n ) du maximum de vraisemblance du couple (m, λ).

(f) Pour a ∈ IR, démontrer que H b n (a) converge presque sûrement quand n → ∞ vers IE(|X − a|).
p.s.
Montrer que la fonction a ∈ IR 7→ IE(|X −a|) est minimale en a = m. En déduire que m
b n −→ m,
n→+∞
p.s.
puis que λ
bn −→ λ.
n→+∞

Você também pode gostar