Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/4830211
CITATIONS READS
0 75
2 authors:
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Juvêncio Santos Nobre on 25 April 2017.
Resumo
Abstract
195
196 Juvêncio Nobre & Caio Azevedo
1 Introdução
Inicialmente, considere um modelo estatı́stico (X , A, P) em que X é o espaço
amostral associado a um experimento, X (vetor aleatório), A é uma σ-álgebra
de subconjuntos de X e P é uma famı́lia de medidas de probabilidades, P, no
espaço mensurável (X , A) (fixado). Em geral, assume-se que P = {Pθ ; θ ∈ Ω}
é indexada por um parâmetro (ou vetor de parâmetros) θ ∈ Ω, e que existe uma
correspondência biunı́voca entre Ω e P (identificabilidade), com Ω denominado
de espaço paramétrico. O objetivo da inferência estatı́stica consiste em pesquisar
sobre a distribuição geradora, isto é, “descobrir” qual distribuição Pθ0 ∈ P gera
os dados em questão, ou equivalentemente estimar o valor de θ.
Considere h : Ω → R uma função mensurável, X um vetor aleatório, cujo va-
lor em θ tem-se interesse em estimar e δ(X) : X → R um estimador e d = δ(x)
representando uma estimativa de h(θ). Um critério bastante utilizado para a
escolha de estimadores ótimos é tomar um estimador δ(X) que minimiza o risco
R(θ, δ) := Eθ [L(θ, δ)], ∀θ ∈ Ω, com L(θ, .) denotando uma função de perda apropri-
ada. Dada a impossibilidade de se obter tal estimador (Lehmann & Casella 1998,
pág. 5), é comum restringir a classe de estimadores, e determinar, dentro desta
classe, um estimador que minimiza o risco uniformemente em θ. Desta forma, por
exemplo, pode-se obter o ENVVUM (classe dos estimadores não viciados), BLUE
(classe dos estimadores lineares), entre outros.
Neste trabalho, temos por objetivo apresentar a classe de estimadores equivari-
antes, com ênfase nos modelos de localização-escala e lineares, além de considerar
a estimação não viciada de variância uniformemente mı́nima (NVVUM), nesta
última classe de modelos. Na Seção 2, fornecemos alguns conceitos e definições
requeridas no desenvolvimento do artigo. Na Seção 3, é discutida a estimação
equivariante no modelo de escala, enquanto que na Seção 4 é analisado é o mo-
delo de localização-escala tanto de forma marginal como conjunta. Na Seção 5,
apresentamos alguns resultados básicos sobre a estimação equivariante e NVVUM
para modelos lineares.
Definição 1.
Considere o problema de estimar h(θ) no modelo (1) que é assumido ser inva-
riante sob as transformações X ∗ = g(X) e θ∗ = g(θ), g ∈ G. Iremos supor também
que ∀g ∈ G, h(θ∗ ) dependa de θ somente através de h(θ), ou seja
O corolário seguinte é útil para generalizar o teorema 1.4 (Lehmann & Casella
1998, p. 150) para o problema de estimação equivariante por localização.
Corolário 1. Sob as suposições do teorema 1 e considerando G transitiva sob o
espaço paramétrico Ω, então tem-se que a função de risco de qualquer estimador
equivariante é constante.
3 Modelos de escala
Nesta seção, vamos aplicar os princı́pios desenvolvidos na seção anterior para
o modelo de escala. Considere que X = (X1 , . . . , Xn )> pertence à famı́lia de
escala, ou seja, que sua densidade é da forma
1 x 1 x1 xn
n
f := n f ,..., , τ ∈ (0, ∞) := R++ (16)
τ τ τ τ τ
em que f é uma função conhecida e τ é dito ser um parâmetro de escala. O
modelo (16) é invariante sob as transformações
h(τ ) → br τ r = br h(τ ) e d∗ = br d
Para mostrar que (18) implica (19) basta fazer b = τ −1 , já o recı́proco não é difı́cil
de verificar.
Exemplo 5. Funções de perda invariantes por escala.
Exemplos de função de perda que satisfazem (19) são
2
(d − τ )2 d |d − τ r | d
L(τ, d) = = −1 e L(τ, d) = = r − 1 (20)
τ 2r τr τr τ
com Z = (Z1 , . . . , Zn )> , então uma condição necessária e suficiente para que
um estimador δ satisfaça (21) é que exista uma função w(z) tal que
δ0 (x)
δ(x) = (23)
w(z)
δ0 (X)
δ ∗ (X) = (27)
w∗ (Z)
então
δ0 (X)E1 [δ0 (X) | Z]
δ ∗ (X) = (29)
E1 [δ02 (X) | Z]
Em particular, se a função de perda é dada por (28), tem-se que o EERM por
escala de τ r é dado por
X r E1 [X r ]
(33)
E1 [X 2r ]
Quando utilizamos (30) o EERM por escala de τ r é dado por X r /w∗ com wr
representando qualquer mediana-escalar da distribuição de X r para τ = 1.
Exemplo 8. Distribuição U (0, τ ).
Considere que X1 , . . . , Xn são variáveis aleatórias i.i.d. com distribuição
U (0, τ ), τ > 0 e que o interesse é estimar τ . Um estimador equivariante por
escala para τ é X(n) = max1≤i≤n Xi . Além disso tem-se que X(n) é uma es-
tatı́stica suficiente e completa para τ . Dado que Z = (X1 /Xn , . . . , Xn−1 /Xn , 1)
é uma estatı́stica ancilar, então, pelo teorema de Basu, tem-se que X(n) e Z são
independentes. Considerando a função de perda (28), tem-se que o EERM por
escala para τ é dado por
X(n) E1 [X(n) ] n+2
δ(X) = 2 ] = X(n)
E1 [X(n) n+1
que não coincide com o ENVVUM de τ , dado por [(n + 1)/n]X(n) , que é um
estimador equivariante por escala.
pois E1 [δ0 (X)] = n e E1 [δ02 (X)] = n(n + 2). Neste caso, o ENVVUM de σ 2 é dado
Xn
por Xi2 /n.
i=1
que não coincide com o ENVVUM, que é dado por X, que também é um estimador
equivariante por escala; porém, o EERM possui risco uniformemente menor do que
o ENVVUM para a função de perda (28).
4 Modelos de localização-escala
Nesta seção estudaremos o processo de construção dos estimadores equivariantes
dos parâmetros de localização-escala considerando ambos os parâmetros desco-
nhecidos. Salientamos que estaremos focados em apenas um dos parâmetros por
vez.
Primeiramente, vamos introduzir a famı́lia de localização-escala. Consideramos
que a densidade do vetor aleatório X = (X1 , . . . , Xn )> é
1 x1 − ξ xn − ξ
f ,..., (37)
τn τ τ
Sendo assim, temos que a classe dos estimadores equivariantes por escala pode
ser descrita como
δ0 (Y)
δ(X) =
w(Z)
Exemplo 11. EERM para a variância duma distribuição normal com média des-
conhecida.
Considere X1 , P. . . , Xn uma amostra aleatória duma distribuição N (ξ, τ 2 ). Te-
n
mos que T = (X, i=1 (Xi − X)2 )> é uma estatı́stica suficiente e completa para θ
e Z é ancilar.
Pn Logo, pelo teorema de Basu, T e Z são independentes e, portanto,
δ0 (X) = i=1 (Xi − X)2 e Z também o são. Além disso, δ0 é um estimador equi-
variante por escala [(39), com r = 2]. Portanto, considerando a função de perda
φ(d/τ 2 ) = [(d − τ 2 )2 ]/τ 4 , temos que,
n−1
n−1
∗ E1 [δ02 (X)|Z] E1 [δ02 (X)] 2 +1 2 4
w (z) = = = =n+1
E1 [δ0 (X)|Z] E1 [δ(X)] n−1
Pn
pois δ0 (X)τ =1 = i=1 (Xi − X)2 ∼ χ2n−1 . Portanto, o EERM de τ será
n
1 X
δ(X) = (Xi − X)2
n + 1 i=1
1 x1 xn
gτ = f , . . . ,
τn τ τ
gτ (x1 − ξ, . . . , xn − ξ) (45)
Lema 1. Suponha que para a famı́lia de localização (45) e função de perda (44),
exista um EERM, digamos δ ∗ , considerando τ conhecido e que
i) δ ∗ não é função de τ , e
Demonstração. Primeiramente, pelo lema 1.6 (Lehmann & Casella 1998, p. 150),
temos que δ satisfaz (43) se e somente se for da forma,
em que
u(a + bx) = u(x) , ∀ b > 0 e ∀a (49)
Suficiência. Considere que δ(x) = δ0 (x) − u(x)δ1 (x) e u(a + bx) = u(x).
Dessa forma, temos que
Logo, (48) e (49) são válidos. O fato de (48) ser válido se e somente se u
depender de x através de z decorre do lema 1.7 (Lehmann & Casella 1998, p.
151)e do teorema 2.
Por outro lado, um argumento semelhante ao teorema 1.10 (Lehmann & Casella
1998, p. 151) mostra que o EERM de ξ é,
Eξ=0,τ =1 [ρ (δ0 (X) − w∗ (z)δ1 (X)) | z] = E0,1 [ρ (δ0 (X) − w∗ (z)δ1 (X)) | z]
Em particular, se
2
d−ξ (d − ξ)
ρ = (51)
τ τ2
não é difı́cil ver que
E0,1 [δ1 (X)δ0 (X)|Z]
w∗ (z) = (52)
E0,1 [δ12 (X)|Z]
Exemplo 15. Exponencial deslocada Sejam X1 , . . . , Xn uma amostra aleatória
duma distribuição E(ξ, τ ) cuja densidade é dada por
Logo, o EERM de ξ é
m
1 X
δ ∗ (X) = X(1) − 2
Xi − X(1)
n i=1
O seguinte lema fornece uma caracterização das funções invariantes por loca-
lização-escala.
Lema 3. Uma função u(x) = (u1 (x), u2 (x))> é invariante para o problema de
localização-escala se e somente se
u1 (x) = g(x)w1 (z1 , . . . , zn−1 ) (58)
u2 (x) = w2 (z1 , . . . , zn−1 ) (59)
para alguma função positiva g tal que g(a + bx) = bg(x) e zi = (xi − xn )/g(x)
(i = 1, . . . , n − 1).
ii) existir um estimador equivariante δ 0 = (δ01 , δ02 )> com risco finito;
iii) para cada z = (z1 , . . . , zn−1 )> , existir uma função vetorial w∗ (z) que mini-
mize E[ρ(δ01 (X) − g(X)w1 (z), δ02 (X)/w2 (z))/z], com o operador esperança
sendo calculado quando θ = (0, 1)> .
Então um EERM δ ∗ = (δ1∗ , δ2∗ )> existe e é dado por
Demonstração.
δ(Y1 + a1 , Y2 + a2 , . . . , Ys + as , Ys+1 , . . . , Yn ) =
X s Xs Xs s
X
λi (Yi + ai ) = λi Yi + λi ai = δ(Y) + λi ai
i=1 i=1 i=1 i=1
ηb = b
ξC ⇒ (Y1 . . . YS 0 . . . 0) = (ξb1 . . . ξbn )C ⇒ b
ξ = (Y1 . . . YS 0 . . . 0)C−1 (70)
Y
X∗ = X + b b = (b1 , . . . , bn )> ∈
Ω
Y n
X
ξ∗ = ξ + b ∈ d∗ = d + bi γi (71)
Ω i=1
que resulta em
ni
1 X
ξbi = Xi. = Xij
ni j=1
ξij = µ + αi + βj + γij
Então,
ou ainda, γij = (ξij − ξ.. ) − [(ξi. − ξ.. ) + (ξ.j − ξ.. )]. Note que αi é o efeito médio do
nı́vel i do primeiro fator, βj é o efeito médio do nı́vel j do segundo fator e γij é a
diferença entre o efeito conjunto dos dois fatores e a soma dos efeitos dos fatores
separados de cada um (chamado de interação).
Os ENVVUM desses parâmetros (efeitos) seguen-se imediatamente do teo-
rema 8 e do exemplo 17. Essencialmente, os ENVVUM são obtidos calculando-se
os estimadores de mı́nimos quadrados do vetor ξ, que neste caso são (denotando
pelo ponto a média calculada num determinado ı́ndice),
µ
b = X... , α
bi = Xi.. − X... , βbj = X.j. − X... , γij = Xij. − Xi.. − X.j. + X...
b
Análogamente, o ENVVUM de σ 2 é
XXX m J I
1
(Xijk − Xij. )2
IJ(m − 1) j=1 i=1k=1
Demonstração.
Pn Este estimador também é não-viesado, nas referidas
Pn condições.
Seja i=1 ci Xi qualquer outro estimador linear não-viesado de i=1 γi ξi . Como
Pn b
i=1 γi ξi é o ENVVUM no caso normal e a variância de funções lineares dos
Xi ndependemo somente nPdo primeiroo e segundo momentos, segue que
Pn b n b Pn b
Var i=1 γi ξi ≤ Var i=1 ci ξi . Então, i=1 γi ξi é o ENNVUM entre to-
dos os estimadores lineares não-viesados.
P
Corolário 6. Sob as suposições (74) e com perda quadrática, ni=1 γi ξbi é o EERM
com respeitoPnas trasnformações (71) entre todos os estimadores equivariantes li-
neares de i=1 γi ξi .
Demonstração. Este resultado segue do lema 1.23 (Lehmann & Casella 1998,
Pn
p. 157), dado que i=1 γi ξbi é o ENVVUM (entre os estimadores lineares) e além
disso é equivariante.
Agradecimentos
Este trabalho foi apresentado na disciplina MAE 5834 - Estatı́stica Avançada I
(2004) no IME-USP. Os autores gostariam de agradecer à Profa. Dra. Silvia
Ferrari (IME/USP) que revisou paciente e cuidadosamente todo o manuscrito e
nos concedeu imprescindı́veis sugestões e ao colega de doutorado Raydonal Ospina
por sugerir a submissão do referido trabalho e aos dois árbitros pelas valiosas
sugestões para a melhoria do nosso trabalho. Gostariamos também de agradecer
ao CNPq pelo suporte financeiro ao curso de Doutorado.
Referências
Alexander, T. L. & Chandrasekar, B. (1999), ‘Equivariant Estimation for the Para-
Meters of an Exponential Model Based on Censored Sampling’, Biometrical
Journal 41, 471–481.
Casella, G. & Berger, R. L. (2002), Statistical Inference, 2nd edn, Duxbury Ad-
vanced Series, New York.
Khuri, A. I., Mathew, T. & Sinha, B. K. (1998), Statistical Tests for Mixed Linear
Models, John Wiley & Sons, New York.