Você está na página 1de 9

Aspects multidimensionnels de lestimation de densit

par

Grgoire MBOYA DE LOUBASSOU

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-ii---------------------------------------------------------------------------------------------------------------------------------------------------------------

Travaux Pratiques sur les Fentres adaptatives


----------------------------------------------------------------------------

Fentre adaptative
1) Les donnes considres sont celles de la population dArige et le package ncessaire
cette tude est le "Kernsmooth". Ainsi le programme suivant :
> pop99<-read.table("C:/Tunis/SNP/Ariege.txt")
> is.data.frame(pop99)
[1] TRUE
> ncol(pop99)
[1] 2
> nrow(pop99)
[1] 332
> popul <- pop99[,2]
> matri <- pop99[,1]
> summary (pop99)
matri
popul
Min.
:9001
Min.
:
7.0
1st Qu.:9086
1st Qu.:
64.0
Median :9170
Median : 143.5
Mean
:9171
Mean
: 411.4
3rd Qu.:9255
3rd Qu.: 319.5
Max.
:9342
Max.
:12972.0

permet de lire le fichier de la population de lArige et de constater que ledit fichier contient
deux (2) colonnes et donc variables danalyse savoir, la variable population (popul) et la
variable matricule (ou identification) (matri).
2) La reprsentation graphique de cette variable population est effective selon le programme
suivant :
> hist(popul,freq=FALSE,col=grey(0.6),xlim=range(popul),main="Frquences
de la Pop de l'Arige")
> points(popul,rep(0,332),pch=5,col="Green")

qui fait obtenir le Graphique 1 ci-aprs dont une analyse descriptive sommaire des sorties de
la procdure summary (pop99) ci-dessus permet de remarquer que la variable popul est trs
concentre vers la gauche et que les donnes de cette variables prsentent une tendue assez
difforme (7 12972). On note aussi un nombre important de donnes manquantes pouvant
se caractrises par des classes presque vide.

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-iii---------------------------------------------------------------------------------------------------------------------------------------------------------------

4e-04
0e+00

2e-04

Density

6e-04

8e-04

Graphe 1 : Frquences de la Population de l'Arige

2000

4000

6000

8000

10000

12000

popul

Selon les rsultats obtenus grce cet histogramme, les estimateurs par la mthode du
noyau amlioreront-elles cette tendance ?

2 : Estimation de la densit de la population dArige par la mthode des


noyaux
La normale scale rule permettant de calculer la fentre h optimale est dduite selon la
relation suivante :

permet de poser que pour le noyau Triweight un h optimal donn par la relation :

pour le noyau gaussien il est de :

Calcul des estimateurs noyau de Gauss et de Triweight


Calcul des fentres hi :

et n. Ces valeurs sont donnes par le code R suivant :

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-iv---------------------------------------------------------------------------------------------------------------------------------------------------------------

> sigma <- sd(popul)


> h1 <- 3.15*sigma/(length(popul)^(0.2))
> h2 <- 1.06*sigma/(length(popul)^(0.2))
> f1 <-bkde(popul,kernel="triweight",bandwidth=h1)
> f2 <-bkde(popul,kernel="normal",bandwidth=h2)
> plot(f1,type="l",col="blue",xlab="popul",ylab="La Densit")
> lines(f2,col="brown")
> plot(f1,type="l",col="red",xlab="popul",ylab="La Densit")
> lines(f2,col="blue")
> rug(popul,col="violet")
> title(main="Graphe 2: Densit de population dArige par la mthode du
noyau",col="red")
> plot(f1,type="l",col="red",xlab="popul",ylab="La Densit")
> lines(f2,col="blue")
> rug(popul,col="violet")
> title(main="Graphe 2: Densit de population par mthode de
noyaux",col="red")
> legend(mean(popul),max(f1$y),c("Estimateur du noyau
Triweight","Estimateur du noyau de Gauss","valeur de la popul")
+ ,bty="n",lwd="3", lty=2:2, col=c("red","blue","violet"))

8e-04

Graphe 2: Densit de population par mthode de noyaux

4e-04
0e+00

2e-04

La Densit

6e-04

Estimateur du noyau Triweight


Estimateur du noyau de Gauss
valeur de la population

5000

10000
popul

On peut donc, partir de ce graphique, affirmer que les ces deux estimateurs noyau
(Triweight et Gauss) pousent parfaitement les tendances et similitudes enregistres dans au
Graphique 1 reprsentant lhistogramme de la population dArige. Ainsi ces deux
estimateurs nont pas eu dimpacts substantiels sur la qualit des estimations attendues.

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-v---------------------------------------------------------------------------------------------------------------------------------------------------------------

3 : Transformation de la variable par le logarithme, et estimation de la


densit par la mthode la "normal scale rule").
Il est ici question de reprendre le calcul des estimateurs prcdents en considrant le logarithme de
la variable population (logp=log(popul))
La transformation de cette variable est opre par le code R suivant :
> logp <- log(popul)

Ainsi une nouvelle valeur de , de h1 et h2 seront recalculer pour dterminer par la suite les
nouvelles valeurs de lf1 et lf2. Le programme suivant :
> logp <- log(popul)
> lgsig <- sd(logp)
> Lh1 <- 3.15*lgsig/(length(logp)^(0.2))
> Lh2 <- 1.06*lgsig/(length(logp)^(0.2))
> lf1 <-bkde(logp,kernel="triweight",bandwidth=Lh1)
> lf2 <-bkde(logp,kernel="normal",bandwidth=Lh2)
> hist(logp,freq=FALSE,col=grey(0.6),xlim=range(logp),main="Graphe 3 :
Estimations de Log Population de l'Arige")
> lines(lf1,col="red")
> lines(lf2,col="blue")
> rug(logp,col="violet")
> legend(mean(logp),max(lf1$y),c("Estimateur du noyau
Triweight","Estimateur du noyau de Gauss","valeur de la Log population")
+ ,bty="n",lwd="3", lty=2:2, col=c("red","blue","violet"))
summary(logp)
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
1.946
4.159
4.966
5.017
5.767
9.471

Permet de gnrer le nouveau graphique suivant ci-dessous do il ressort nettement par rapport

au graphique 2 que loprateur log a eu un impact trs positif sur la transformation de la


variable population devenue normale. On note ici une parfaite symtrie des courbes de
densits avec des classes de lhistogramme presque homognes avec moins dirrgularits.
Ltendue de la logp varie entre 1.946 et 9.471 ce qui est relativement trs amlior par
rapport la situation au graphique 2

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-vi---------------------------------------------------------------------------------------------------------------------------------------------------------------

Graphe 3 : Estimations de Log Population de l'Arige

0.15
0.00

0.05

0.10

Density

0.20

0.25

0.30

Estimateur du noyau Triweight


Estimateur du noyau de Gauss
valeur de la Log population

logp

4 : Utilisation de la transformation de la fonction de densit de lexercice 3 du


TD3 et dduction dune deuxime estimation de la densit de la variable
population.
Si X dsignait la variable initiale et Y = log(X) la fonction de transformation de X par loprateur
logarithmique, et fonction bijective, il sensuit que la fonction de rpartition de la variable Y est
donne par :

FY (y) = Prob(Y

y) = Prob(log(X)

y) = Prob(X

exp(y)) = FX(exp(y)).(1)

do lon peut dduire la densit de Y :

fY (y) = FY (y) = fX(exp(y)) exp(y), y

R. (2)

Les relations (1) et (2) appliqu la fonction bijective de log (X) permettent de dcuire pour tout X
positif :

fX(x) = FX (x) = fY (log(x))


Ainsi, toute la question est de calculer lestimateur de

(x) de Triweight et de Gauss.

Les commandes
> f1$x
> f1$y
----------------------------------------------------------------------------------------------------------------------------------------------------------------

-vii---------------------------------------------------------------------------------------------------------------------------------------------------------------

montrent une liste de 421 et 401 composantes et qui permettent alors de poser :
> y1 <-f1$y/exp(f1$x)
> y2 <-f2$y/exp(f2$x)

(exp(x)

Sont des estimations de la composante

Les codes suivants : estimation


y1 <-f1$y/exp(f1$x)
> y2 <-f2$y/exp(f2$x)
> >
plot(exp(f1$x),y1,type="l",xlim=c(min(popul),max(popul)),col="red",xlab="P
opulation",ylab="Densit")
> lines(f1, col="blue")
> rug(popul, col="violet")
> legend(4000,max(g1),c("Estimateur par Log de la poulation","Estimateur
initial noyau","Population"),
+ bty="n",lwd="3",lty=2:2,col=c("red","blue","violet"))

1.0e+298
0.0e+00

5.0e+297

Densit

1.5e+298

Permettent de reproduire le graphique ci-dessous qui montrent que les estimateurs de la


densit de la population dArige sont trs diffrents.

2000

4000

6000

8000

10000

12000

Population

B - Estimation de la densit de la variable


population par lestimateur noyau fentre
adaptative
----------------------------------------------------------------------------------------------------------------------------------------------------------------

-viii---------------------------------------------------------------------------------------------------------------------------------------------------------------

Comme on la fait pour lcart quadratique moyen intgr, la minimisation de lcart


quadratique moyen ponctuel permet de calculer une fentre localement optimale dont la
formule met en vidence une dpendance par rapport la densit locale. Une des mthodes
qui permet dadapter le choix de la fentre la densit locale consiste utiliser la relation
(5.1) de lEtheme 5 dont nous allons programmer les distances sous R.

----------------------------------------------------------------------------------------------------------------------------------------------------------------

-ix---------------------------------------------------------------------------------------------------------------------------------------------------------------

Você também pode gostar