Escolar Documentos
Profissional Documentos
Cultura Documentos
Modelos Assimétricos
TESE DE DOUTORADO
por
2011
Valmária Rocha da Silva Ferraz
em Estatística.
Orientador:
Fernando Moura
Instituto de Matemática
julho de 2011
Estimação em Pequenas Áreas usando
Modelos Assimétricos
Valmária Rocha da Silva Ferraz
Orientador: Fernando Moura
Aprovada por:
IM-UFRJ
a
Prof . Márcia Branco Prof. Cristiano Ferraz
IME-USP CCEN-UFPE
IM-UFRJ IM-UFRJ
(Doutorado-UFRJ/IM/DME) I. Moura, F. A. S.
Nascimento.
Talvez não tenhamos conseguido fazer o melhor,
éramos".
conança.
Ao meu esposo, Fernando Nascimento, pelo apoio, força, amor, carinho e por
À minha família maravilhosa: aos meus pais, Valmir e Maria; aos meus irmãos
Átila, Benite, Crisanto e Izamara; aos meus sobrinhos Letícia, Lara, Pedro e Izaellen;
aos meus cunhados Rafael, Jane, Elton e Roberto; e aos meus sogros Mauri e Neide.
Aos amigos da UFRJ, Marcelo, Adelmo, Marcus Vinícius, Carla, Ana Paula,
Vinícius, Fidel, Luzia, Alexandre, Luiz Ledo, Felipe, Joaquim, Mariana, Patricia,
Josiane, Thiago, Willian, Estelina, Giuseppe, Targino, Nassif, Larissa, João, Camila,
Renatinha, Carol (Jhones), Sheila e Carol (carioca). Obrigada pelas dúvidas tiradas
minhas irmãs de orientação Débora, Vera e Kelly. Guardarei em meu coração todos
também ao professor Carlos Abanto, por estar sempre pronto a ajudar e tirar umas
Aos amigos e irmãos das Igrejas Batista Betânia do Rio e Batista Nacional de
eles, Paulinho, Sissy, Xavier, Aracy, Luiz Claúdio, Helder, Kelson, Keliny, Rita e
modelo de estimação em pequenas áreas no nível de área de Fay & Herriot (1979) e
primeira extensão permite que o erro amostral seja não simetricamente distribuído.
Isso é importante para o caso em que os tamanhos das amostras das áreas não
Lida-se com isso considerando que o erro amostral segue uma distribuição normal
i
Abstract
The main aim of this work is to propose two important connected extensions of
the Fay & Herriot (1979) area level small area estimation model and an extension to
the unit level small model estimation model that might be of practical and theoretical
interests. The rst extension allows for the sampling error to be non- symmetrically
distributed. This is important for the case that the sample sizes in the areas are
not large enough to rely on the Central Limit Theorem. We deal with this by
assuming that the sample error is skew-normal distributed. The second extension
proposes to jointly model the direct survey estimator and its respective variance
estimator. Proceeding in this way, we manage to take into account all sources
that relaxes the assumption that the sampling errors are symmetrically distributed.
Results from simulation studies showed the eciency recovering the true values of
the parameters and pointing the true model. We apply the model to two real data
sets: income and educational data. We applied the unit level model to the income
data only. Our studies showed that the proposed skew models are more ecient
than the usual normal models when the data are assymetric.
ii
Sumário
1 Introdução 1
1.1 Revisão Bibliográca . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
iii
3.2.3 Distribuição a Posteriori . . . . . . . . . . . . . . . . . . . . . 26
3.3 Simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3.1 Simulação 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.3.2 Simulação 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.4 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4 Aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3.1 Simulação 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.3.2 Simulação 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4 Aplicação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.4.1 Previsão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5 Conclusões e Extensões 94
Bibliograa 96
Apêndice 100
iv
Lista de Tabelas
3.7 Medidas resumos das médias a posteriori dos parâmetros para as 500
3.9 Medidas de ajuste para estimação pontual e intervalar das médias das
assimétrico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
v
3.11 Medidas resumo para a distribuição a posteriori dos parâmetros para
3.12 Critérios de escolha de modelos para ajustes dos dados de renda nas
amostras de 5% e 10%. . . . . . . . . . . . . . . . . . . . . . . . . . . 57
vi
Lista de Figuras
2,5% e 97,5%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
vii
3.6 Histograma da distribuição a posteriori dos parâmetros β0 , β1 , β2 , σν2
e λ para os dados gerados com erro normal, considerando ajuste NA
97,5% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
97,5% . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5% e 10%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.15 Comparação dos dois ajustes: valor amostral ȳi versus sua estimativa
viii
3.16 Densidade da distribuição a posteriori dos parâmetros β0 , β1 , σν2 e
3.17 Comparação dos dois ajustes para aplicação com dados educacionais:
ix
4.9 Intervalos de Credibilidade de 95% para µi em quatro pequenas áreas
o valor verdadeiro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
área obtidos nos ajustes Normal, NAC e NAH. A barra vertical (|)
x
Capítulo 1
Introdução
considerável nos últimos anos. Este crescimento tem sido motivado, por um lado pela
populacionais, e por outro lado pela necessidade das autoridades locais em obter
1
2
domínios (áreas). Estes tipos de modelos utilizam variáveis auxiliares que estão
apenas uma medida é utilizada para representar toda a área, como por exemplo o
Neste trabalho, propõe-se modelos para pequenas áreas em que a distribuição dos
erros segue uma distribuição assimétrica. Azzalini (1985) propõe uma maneira de
na distribuição normal assimétrica dos erros amostrais do modelo, que tem como
igual a zero.
Além disso, em pequenas áreas é comum assumir que as variâncias dos erros
amostrais são conhecidas. Essa suposição parece pouco realista, e por isso,
modelo.
combinado com informações das pequenas áreas obtidas através de uma amostra
que os erros são normalmente distribuídos com médias iguais a zero e variâncias
alguma variação entre as pequenas áreas que não possam ser atribuídas a diferenças
entre valores das variáveis auxiliares. Battese & Fuller (1981) e Battese, Harter &
Battese & Fuller (1981) assume duas componentes de erro; a primeira componente
com variâncias iguais para todas as áreas e a outra com uma variância especíca
para cada área. Neste modelo, assume-se que a fração de amostragem é desprezível.
Modelos no nível da unidade não são muito utilizados porque os dados nem
modelos abrangem uma variedade de métodos utilizados para obter estimativas para
áreas geográcas ou domínios de estudo, nos quais os tamanhos das amostras são
1979), que envolve tanto os erros relacionados ao desenho amostral quanto os erros
relacionados ao modelo.
Moura & Holt (1999) propuseram um modelo de dois níveis, com o objetivo
& Fuller (1981). O uso de modelos de múltiplos níveis é justicado pelo fato de
variáveis no nível das unidades; ii) diferenças na distribuição das variáveis no nível
das áreas; e iii) a inclusão de componentes de variância especíca de cada área, para
acomodarem variações locais que não possam ser explicadas por covariáveis nos
(em vez de apenas o intercepto, como proposto por Battese & Fuller, 1981), podem
qual mostra que tais modelos são adequados para realizarem previsões no nível de
pequenas áreas. Neste estudo, as pequenas áreas foram consideradas como sendo os
setores censitários.
das probabilidades de seleção (veja Pfeermann, 2002, p. 137). Prasad & Rao
variação entre as médias das pequenas áreas e com efeitos xos e aleatórios, supondo
por meio deste modelo e, além disso, é proposto que sejam substituídas as médias
bayesianos para estimação em pequenas áreas. You & Rao (2000) propõem uma
extensão do modelo de Moura & Holt (1999), assumindo uma hierarquia para o
Moura & Migon (2002) propõem um modelo logito hierárquico para previsão
Veja Dick (2007) para mais detalhes. Uma abordagem alternativa pode ser
encontrada em Arora & Lahiri (1997) e You & Chapman (2006). Seus trabalhos
as. You & Chapman (2006), também propuseram que no modelo de Fay-Herriot
estimadas por estimadores não viesados, como a variância amostral. Foi assumido
existentes.
1.2 Objetivos
O objetivo principal deste trabalho é propor duas importantes extensões do modelo
nível de área, ii) modelo no nível da unidade. Ainda nesse capítulo, apresenta-se a
proposto. Na Seção 3.4, duas aplicações com dados reais são apresentadas, uma
Seção 4.3, um estudo de simulação e na Seção 4.4 uma aplicação. Por m, no
utilizados.
7
8
do modelo linear
0
θi = zi β + vi , i = 1, . . . , M, (2.1)
0
onde β = (β1 , . . . , βp ) é um vetor p×1 de coecientes de regressão. Além disso,
1, . . . , M .
Em algumas aplicações, nem todas as áreas são selecionadas na amostra.
Para fazer inferência sobre as médias das pequenas áreas sobre o modelo (2.1),
É comum supor que as variâncias, ψi2 , sejam conhecidas. Esta suposição pode ser
ψi2 são conhecidas, e uma forma de lidar com o fato é suavizar as variâncias estimadas
ψ̂i2 , de modo a obter maior estabilidade para ψi2 , e tratá-las como verdadeiras.
0
θ̂i = zi β + vi + ei i = 1, . . . , m. (2.4)
9
Note que (2.4) envolve tanto os erros do desenho amostral ei quanto os erros do
seguinte modelo:
com E(e∗i | θ̂i ) = 0, isto é, θ̂i∗ é não viciado. Vale a pena ressaltar que, neste caso,
os modelos amostrais e de ligação não são iguais. Pode-se combinar (2.5) com o
modelo de ligação (2.1) para produzir um modelo linear misto da forma (2.4).
Modelos do Tipo A são bastante utilizados na prática, por exemplo, para estimar
a renda, grau de escolaridade de crianças pobres numa região, etc. Esses modelos
Fay & Herriot (1979) estimaram a renda per capita em pequenas áreas nos EUA
com população menor que 1000 habitantes, utilizando como variável resposta à
média amostral. Foi suposto que as variâncias ψi2 são conhecidas, assumindo que o
0
vetor de dimensão-k das variáveis zi = (zi1 , zi2 , . . . , zik ) relaciona-se com as médias
0
µi em cada área i, e que µi 's são independentes com distribuição N (zi β, σv2 ), onde
θ̂i = θi + ei
θi = µi + vi , (2.6)
onde: θ̂i é o estimador direto (ou uma função dele) da verdadeira média populacional
iid iid
da pequena área i, θi ; vi ∼ N (0, σv2 ) e ei ∼ N (0, σi2 /ni ).
disponíveis para cada elemento populacional j na i-ésima área. Além disso, a variável
de interesse, yij , está relacionada com xij através de um modelo de regressão linear
misto:
0
yij = xij β + vi + eij ; j = 1, . . . , Ni , i = 1, . . . , m. (2.7)
Também é assumido que os efeitos de uma área especíca vi são iid com
Em (vi ) = 0 e Vm (vi ) = σv2 , eij = kij ẽij onde kij são constantes xas e ẽij são
variáveis aleatórias iid e independentes dos vi 's. Além disso, é suposto que:
simples de cada área, ou mais geralmente para desenhos amostrais que usam as
na forma matricial:
0
onde XPi é Ni × p, yiP , 1Pi e ePi são vetores Ni × 1 e 1Pi = (1, . . . , 1) . Particiona-se
yi Xi 1i ei
yiP = = β + vi + , (2.9)
yi∗ X∗i 1∗i e∗i
onde o subescrito (∗) denota as unidades não amostradas. Se o modelo é válido para
Z
f (yi |XPi , Θ) = f (yi , yi∗ |XPi , Θ)dyi∗ , i = 1, . . . , m, (2.10)
onde f (yi , yi∗ |XPi , Θ) é a distribuição conjunta de yi e yi∗ . Por outro lado, sendo
0
ai = (aij , . . . , aiNi ) com aij = 1 se j pertence a amostra, e aij = 0 caso contrário, a
11
com f (ai |yi , yi∗ , XPi ) = f (ai |XPi ), isto é, a probabilidade da amostra selecionada
P
não depende de yi , mas pode depender de XPi (uso de planos amostrais não
informativos). Neste caso, não existe viés na seleção, e pode-se assumir que os
valores da amostra também obedecem ao modelo, isto é, usa-se f (yi |XPi , Θ) para se
fazer inferência sobre Θ (Smith, 1983).
Se a amostra selecionada depende de uma variável auxiliar, digamos zPi , que não
está incluída em XPi , então a distribuição dos dados amostrais (yi , ai ) é
Z
f (yi , ai |XPi , zPi , Θ) = [f (ai |zPi , XPi )]f (yi , yi∗ |XPi , zPi , Θ)dyi∗ .
A inferência sobre Θ é baseada em f (yi |XPi , zPi , Θ), que é diferente de (2.10) a menos
que zPi seja independente de yiP dado XPi . Neste caso, não se pode assumir que o
modelo (2.8) seja válido para os valores amostrais. Pode-se estender o modelo (2.8)
então, assume-se que o modelo original (2.8) também é válido para os valores da
dois estágios nas pequenas áreas, porque os efeitos de conglomeração não são
Battese & Fuller (1981) e Battese et al. (1988) propõem o modelo (2.7) para
estado americano de Iowa, usando como variável auxiliar dados obtidos por satélite,
pequena área Ȳi é equivalente a predizer a variável aleatória Ȳi∗ sob o modelo (2.7).
12
0
Ȳi = X̄i β + vi (2.12)
0
note que Ȳi = X̄i β + vi + Ēi e Ēi ≈ 0, onde Ēi é a média dos Ni erros eij e X̄i é a
P
média conhecida dos X̄i .
Os modelos descritos acima não são adequeados para dados assimétricos. Tem-
se observado que o comportamento dos dados nem sempre possui uma forma
densidades possuem formas assimétricas. Estudos mostram que, por exemplo, dados
de renda são assimétricos, e possuem caudas pesadas em alguns casos. Por isso,
normal como caso limite, como a distribuição t de Student com ν graus de liberdade,
que incluem a normal como um de seus membros e não apenas como um caso limite.
membros desta família recebem o nome de normal assimétrica. Vê-se, ainda, que
esta família permite uma transição contínua da normalidade para a não normalidade
Azzalini & Valle (1996) denem uma família paramétrica multivariada como
são normais assimétricas. Aqui, como no caso univariado, essa família inclui a
multivariada.
Lema 2.2.1 Seja f uma f.d.p simétrica em torno de 0, e G uma f.d.a (função de
2f (x)G(λx), x∈R
assimétricas, mas a escolha mais usual é trabalhar com f.d.p e f.d.a que sejam
na Figura 2.1. Note que a medida que o parâmetro λ cresce, a assimetria também
a esquerda.
descritas abaixo.
0, N TR+ (0, 1). Se λ → −∞, φ(x|λ) converge para uma distribuição normal
√
E(Φ(hX + k)) = Φ(k/ 1 + h2 )
(t − µ)2
λ(t − µ)
Ψ(t) = 2 exp Φ √ .
2σ 2 σ 1 + λ2
Este resultado é importante para o cálculo dos momentos ímpares de X.
r
λσ 2
E(X|µ, σ, λ) = µ+ √ (2.13)
1 + λ2 π
λ2
2 2
V ar(X|µ, σ, λ) = σ 1− ·
π 1 + λ2
r r r
2 2 2
E(X 3 |µ, σ, λ) = µ3 + 3µ3 σδ + 3µσ 2 + 3σ 3 δ − σ3δ3
π π π
2 −3/2
r
4 2δ 2
γ = δ3 −1 1−
π π π
onde γ é o coeciente de assimetria com −0, 99527 < γ < 0, 99527 sendo
√
δ = λ/ 1 + λ2 .
λ 1
X=√ |U | + √ V ∼ N A(λ). (2.14)
1 + λ2 1 + λ2
Todas as propriedades acima de 1-6 podem ser encontrados em Genton (2004),
Azzalini & Valle (1996) apresentaram dois métodos para a construção desta
condicionamento.
0
fk (x) = 2φ(x; Ω)Φ(α x), com x ∈ Rk ,
0 0 0 0
onde α = (λ Ψ−1 ∆−1 )/(1 + λ Ψ−1 λ) ; ∆ = ((1 − δ12 )1/2 , . . . , (1 − δk2 )1/2 ); λ =
0 0
(λ(δ1 ), . . . , λ(δk )) ; e Ω = ∆(Ψ + λλ )∆. Então, diz-se que X tem distribuição
X ∼ N Ak (0, λ, Ψ).
posteriormente.
Proposição 2.2.4 Se X ∼ N Ak (0, Ω, α), e A é uma matriz não singular k×k tal
0
que A ΩA é uma matriz de correlação, então
0 0
A X ∼ N Ak (A ΩA, A−1 α).
17
0
ΩYi = Ai ΩAi ,
0 0
(Ai ΩAi )−1 A Ωα
α Yi = 0 0 .
{1 + α0 (Ω − ΩAi (Ai ΩAi )−1 Ai Ω)α}1/2
convergência) por:
log ((fv (y | Θi ))
PI
i=1
BIC = −2 + q log(n), (2.15)
I
onde fv (y | Θi ) é a função de verossimilhança, Θi é o vetor de parâmetros Θ na
Comparando vários modelos, o melhor, segundo o BIC, é aquele que tiver o menor
valor.
18
Para encontrar o DIC, considere uma medida D(Θ | y), dada por:
onde D̄(Θ | y) = E[D(Θ | y)] e D̂(Θ | y) = −2 log(f (y|Θ̂)), com Θ̂ sendo uma
Embora este método tenha sido utilizado com muita frequência nos últimos anos,
recomenda-se ter cuidado com algumas restrições, como por exemplo o número
efetivo de parâmetros, que em alguns casos pode ser negativo. O DIC pode
I X
n (k)
X (yi − ŷ )2 i
EQM p = ,
j=1 i=1
nI
19
(k)
onde yi é o valor observado para a i-ésima área e ŷi é a estimativa do valor esperado
I X
n (k)
X |yi − ŷ | i
EAM p = ,
j=1 i=1
nI
(k)
onde yi é o valor observado para a i-ésima área e ŷi é a estimativa do valor esperado
para a i-ésima área na j -ésima iteração do algoritmo MCMC. O modelo que obtiver
menor EAMp, é apontado como melhor modelo.
Ghosh (1998), é o Desvio Preditivo Esperado (EPD). Este critério é obtido como
têm formas fechadas desconhecidas, então técnicas de simulação Monte Carlo via
Cadeias de Markov (MCMC) são utilizadas para obter amostras das respectivas
correlação das cadeias dos parâmetros, utiliza-se o amostrador da fatia Neal (2003)
dentro do amostrador de Gibbs (Geman & Geman, 1984; Gelfand & Smith, 1990).
considera que os erros amostrais seguem uma distribuição normal assimétrica. Ainda
desconhecida e estimada.
é razoável supor que θ̂i e φ̂i = σ̂i /ni sejam condicionalmente independentes, pois os
20
21
momentos pares da distribuição normal assimétrica são iguais aos momentos pares
da distribuição normal.
ao nível de área:
√
θ̂i = µi + ei , com ei ∼ N A(0, φi , λi ),
µi = X̄0i β + νi com νi ∼ N (0, σν2 ). (3.1)
√
onde φi = σi2 /ni , λi = λ/ ni e µi é uma função das variáveis aleatórias auxiliares
se que estes sejam independentes e que νi ∼ N (0, σν2 ). Porém, pode-se assumir
uma distribuição não simétrica para os mesmos, como uma distribuição normal
assimétrica, mas preferiu-se assumir distribuição não simétrica apenas para os erros
linear das covariáveis e dos efeitos aleatórios de área. Nota-se que quando o tamanho
normal, satisfazendo o Teorema Central do Limite. Gupta & Kollo (2003) dá uma
Observe que θ̂i |µi segue uma distribuição normal assimétrica e que cada µi |X0i β
√
segue uma distribuição normal, mais precisamente: θ̂i |µi ∼ N A(µi , φi , λi ) e
µi |X0i β ∼ N (X0i β, σν2 ).
Amostras de densidade da distribuição normal assimétrica X ∼ N A(ξ, σ, λ)
podem ser hierarquicamente geradas pelo uso da seguinte representação estocástica
utilizando (2.14):
√
onde HN (0, 1) denota a distribuição Half-Normal padrão e δ = λ/( 1 + λ2 ).
conjuntamente:
p √
θ̂i |µi , φi , λ, ni ∼ N A(µi , φi , λ/ ni ), i = 1, . . . , M
φ̂i |ni , φi ∼ Ga[0, 5(ni − 1); 0, 5(ni − 1)φ−1
i ] (3.3)
da área i. Y ∼ Ga[a; b] denota que Y segue uma distribuição gama, cuja função
ba a−1
densidade de probabilidade é dada por: f (y|a, b) = Γ(a)
y exp(−by).
O estimador da variância amostral, φ̂i , em (3.3) fornece informação sobre o
s2i = (ni −1)−1 nj=1 (yij − ȳi )2 é um estimador não viesado da variância populacional
P i
parâmetro φi . Assume-se que φi segue uma distribuição Inversa Gama (IG). Para
completar o modelo, atribuiu-se prioris próprias com variância grande, de tal forma
λ, é um parâmetro que requer mais cuidado na estimação. Além disso, se quer que
O modelo (3.3) pode ser derivado de um caso particular de uma amostra aleatória
Yi ∼ N Ani (ξYi , ΩYi , αYi ) com parâmetros ξYi = 1ni µi , ΩYi = σi2 Ini e
αYi = n−1
i λ1ni , onde 1ni é um vetor ni × 1 com todas as componentes iguais a
0
fYi (yi ) = 2φni (y − ξYi ; ΩYi )Φ{αi ∆−1
i (y − ξYi )},
onde φni (z; Ωi ) denota a densidade da distribuição normal de dimensão ni com média
zero e matrix de covariância Ωi e ∆i é uma matrix diagonal com elementos iguais a
σi .
Usando uma simples extensão da proposição 5 em Azzalini & Capitanio (1999),
0
(ver também Gupta & Chen (2003)), não é difícil mostrar que ȳi = n−1
i 1ni Yi tem
Além disso, a variância amostral s2i é Ga{0, 5(ni − 1), (ni − 1)0, 5σi−2 } e
2
condicionalmente independente de ȳi dado µi , σi e λi , o que implica a formulação
do modelo para os φi como indicado em 3.3 para o caso particular de uma amostra
dos momentos não pode ser aplicado quando o coeciente de assimetria da amostra
centrada.
priori de referência com base no método citado em Berger & Bernardo (1992).
Liseo & Loperdo (2006) mostram que a distribuição a posteriori existe e propõem
uma maneira de calcula-lá numericamente. Bayes & Branco (2007) propõem uma
Os principais resultados usados neste trabalho para atribuir uma priori para
λ podem ser encontrados em Sugden, Smith & Jones (2000). Eles formalmente
(1977), página 42) arma que, para as populações em que o principal desvio da
nmin = 25γ 2 , onde γ é o coeciente de assimetria de Fisher, que é dado pela razão
distribuição da média amostral obtida por uma amostra aleatória simples, tem-se
np o−1
onde Zn = V (X̄n ) X̄n − E(X̄n ) .
√
Para o modelo 3.3, Zn tem distribuição N A(µZ(n) , σZ(n) , λ/ n), onde
25
q nq o−1 nq o−1
2 2 2 √ λ
µZ(n) = − δ
π (n)
1 − (2/π)δ(n) , σZ(n) = 1 − (2/π)δ(n) e δ(n) = n+λ2
.
temos:
−1 −1
P r(Zn ≤ 1, 96) = Φ(σZ(n) {1.96 − µZ(n) }) − 2Γ(σZ(n) {1, 96 − µZ(n) }) (3.5)
−1 −1
P r(Zn ≤ −1, 96) = Φ(σZ(n) {−1.96 − µZ(n) }) − 2Γ(σZ(n) {−1, 96 − µZ(n) }) (3.6)
R ∞ R αs
onde Γ(z, α) = z 0
φ(s)φ(t)dtds é a função estudada por Owen (1956).
Note que as desigualdades 3.5 e 3.6 são funções de λ e n.
λ > 0, encontramos Para
p
numericamente que ambas as desigualdades em (3.4) são satisfeitas se 25γ 2 < 1, 1.
p
Analogamente, se λ < 0, obtemos 25γ 2 > −1, 1. Assim, se não se tem certeza do
sinal de λ, pode-se denir a seguinte restrição:
Se assume-se uma priori normal para λ, centrada em zero, tem-se que o desvio-
padrão da priori de λ é dada por σλ = (5, 5 × a)/2, 576. Para os dados de renda, na
Aspectos Computacionais
As distribuições a posteriori de alguns parâmetros do modelo de área proposto
não podem ser obtidas de forma fechada. Portanto, é necessário utilizar métodos
distribuição normal assimétrica, estimou-se θˆi e Wi que possui forma mais tratável.
por
λ ∼ N (e, f ), e
a seção 3.2.1.
m
Y
L(Θ; D, W) = f (θ̂i |Θ)f (φ̂i |φi , ni )f (wi )
i=1
m √ !
Y 1 −(θ̂i − (µi + φi δi wi ))2
= exp
2φi (1 − δi2 )
p
2
i=1 2π(1 − δ i )φ i
−1 ni2−1 !
ni − 1 ni − 1 −(ni − 1)φ̂i
× Γ exp
2 2φi 2φi
r
wi2
2
× exp − .
π 2
3.3 Simulação
Foram feitas simulações considerando que os dados possuem erros normais e normais
assimétricos. Nas duas situações, os dois modelos foram ajustados para ns de
28
recuperar verdadeiros valores dos parâmetros. Com isso, tem-se uma base para
3.4.
chamado de Simulação 1, foram gerados valores de uma amostra com erros amostrais
chamado de Simulação 2, foram gerados valores de uma amostra com erros amostrais
dos parâmetros de interesse. Foram feitas 200000 iterações das quais as 100 000
primeiras foram descartadas e tomada uma a cada 20 para serem evitados problemas
WinBugs.
Duas covariáveis xi = (x1i , x2i ) foram geradas de uma distribuição normal padrão
N (0, 1). Utilizou-se m = 140 pequenas áreas com ni variando de 6 a 59. Estes
estudado na Seção 3.4.1 . Os φi 's foram gerados de uma distribuição Inversa Gama
IG(a, b), com a=1 e b = 10. Os valores utilizados para os parâmetros regressores
2
foram β = (8, 0.8, 3) e σν = 2. Os valores de λ utilizados nas simulações foram 8 e
−8.
3.3.1 Simulação 1
Os dados foram gerados de uma distribuição normal assimétrica com λ = 8 e λ = −8,
e ajustados os modelos normal e normal assimétrico. Utilizou-se os critérios BIC,
Nas Tabelas 3.1 e 3.3, tem-se os valores verdadeiros dos parâmetros, a média e
mediana a posteriori dos parâmetros via MCMC, os desvios padrão (dp) e os quantis
2,5% e 97,5% para os ajustes normal e normal assimétrico. Também, nas Tabelas
3.2 e 3.4 têm-se os critérios de seleção de modelos BIC, DIC e EPD. Além disso, a
cobertura citada nestas tabelas se refere à proporção dos valores estimados dos µi
nas 140 pequenas áreas, que estão dentro do intervalo de 95% de credibilidade.
parâmetros obtidos via MCMC para os dados gerados com λ = 8 sob os ajustes
assimétrico e normal são bem próximos. Na Tabela 3.2 observa-se que o DIC e
parâmetros estimados via MCMC para os dados gerados com λ = −8, através
dos ajustes normal e normal assimétrico. Também, as estimativas dos dois ajustes
parece subestimado pela média a posteriori para essa amostra. Mais uma vez o
proporção dos µi 's que estão contidos nos respectivos intervalos de credibilidade para
o ajuste normal assimétrico é maior que a referida proporção, considerando o ajuste
normal.
exceto para o parâmetro β0 , como mostra a Figura 3.2. Este efeito parece aumentar
termo adicional, que é dado pelo valor esperado do erro normal assimétrico.
30
Ajuste NA
Ajuste Normal
Tabela 3.2: Critérios de comparação de modelos para simulação com dados gerados
com erros NA e λ = 8.
Ajuste Normal Assimétrico Ajuste Normal
Medidas
θ̂i φ̂i Total θ̂i φ̂i Total
EP D 365,79 694,28
2,5% e 97,5%. Apesar do parâmetro λ está subestimado para essa amostra, todos os
parâmetros estão dentro do intervalo de credibilidade. Na Figura 3.4, os histogramas
dos parâmetros mostram que no ajuste normal os parâmetros também foram bem
A Figura 3.5 mostra os intervalos de credibilidades de 95% para os µi 's nas 140
verdadeiro. Pode-se observar que as médias a posteriori dos µi 's são próximas dos
respectivos valores verdadeiros e que a maioria dos µi 's das 140 pequenas áreas estão
dentro do intervalo de credibilidade de 95%.
32
Ajuste NA
Ajuste Normal
0.8
2.0
1.5
0.6
1.5
1.0
0.4
1.0
0.5
0.2
0.5
0.0
0.0
0.0
1.0
0.8
0.10
0.6
0.4
0.05
0.2
0.00
0.0
1.5
2.0
1.5
1.0
1.0
0.5
0.5
0.0
0.0
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
0.8
1.5
1.5
0.6
1.0
1.0
0.4
0.5
0.5
0.2
0.0
0.0
0.0
7.5 8.0 8.5 0.0 0.5 1.0 1.5 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
0.8
0.6
0.10
0.4
0.05
0.2
0.00
0.0
1.5
2.0
1.5
1.0
1.0
0.5
0.5
0.0
0.0
7.4 7.6 7.8 8.0 8.2 8.4 8.6 0.0 0.5 1.0
1.0
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.5 1.0 1.5 2.0 2.5 3.0
15
* − −
−*
− −* −−* *
* *− −*−* −−*
− * − * − −
−* − − *
* * * * −
* −
* **− * * − *
10
−* − − *
* * − − −*−* *−* − −* − −− −*− −* *
−−* − * *−−*−− − − * − −* *
* −* * *
− * * *
*− − −* −**−* −− −−
− − − − * *
− − * −*−−* −* −*−−*−*−* * − * * * −*−* * *−*−
− *
− *
− −* −*−
− −−*
* * * * − −* −*− *
* * − −** − *− *− − −−*−*− −*−*−*−−−*−*−*
− *− * − −
5
* * − − * − ** *−* * *−** *− * * −** −−*** −*
*
− −* * − −
−* −
(a) NA com λ = 8
*
−*−* * * −* **
−*
*
−*
0
1 4 7 11 15 19 23 27 31 35 39 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 104 109 114 119 124 129 134 139
−* −*
−*
15
Figura 3.5: Intervalo de Credibilidade de 95% para os
*
−*
µi
−* *
− *− * *−* −
* **
− * − −*
* − −− −−* − −
− ** −* *
−* −* −
10
−−−** −* −* *
*
−* −**−*
− −* *
−*− − − *
− −* −*
−* *
* * −−* −*− −*
* −
−*−*−*− *−*−** *−−*− − −− −− − −* −− *
* * * − **
− * * −* *−*−*−− − * −− − * * * * * *
− − −* −− −*−*
− * −* − *
−*
− − * ** * − −* * −* − −* * −
* − * * − −**− −* −*
− * − *− −− * −−*
5
−*−*
* − *
− − *−*−* * *−−* −−− −**−*−*−*
−
* *
− **
(b) NA com λ = −8
* −*−−*−−*−** *−*
−* * *−− * * * −
*− −
* *
Tabela 3.4: Critérios de comparação de modelos para simulação com dados gerados
EP D 322,95 643,71
3.3.2 Simulação 2
Foram gerados dados considerando o modelo normal. As covariáveis x1 e x2 foram
na Simulação 1.
Tabela 3.5: Medidas resumo para a distribuição a posteriori dos parâmetros para os
Ajuste Normal
0.5
1.0
1.5
0.4
0.8
1.0
0.3
0.6
0.2
0.4
0.5
0.1
0.2
0.0
0.0
0.0
7.0 7.5 8.0 8.5 −0.5 0.0 0.5 1.0 1.5 2.0 1 2 3 4 5 6
0.8
0.3
0.6
0.2
0.4
0.1
0.2
0.0
0.0
σν2 para ajuste normal, com os dados gerados com erro normal e intervalo de 95%
1.0
2.0
0.8
1.5
0.6
1.0
0.4
0.5
0.2
0.0
0.0
7.5 8.0 8.5 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
0.0
0.0
1 2 3 4 5 6 1 2 3 4
EAMp são melhores para as componentes θ̂i . A proporção de valores verdadeiros das
Tabela 3.6: Critérios de escolha de modelos para os dados simulados gerados com
Mesmo que os erros dos dados sejam normais, não há perda em considerá-los
como sendo normais assimétricos, segundo todos os critérios, com exceção do BIC.
Isso ocorre devido ao BIC penalizar o maior número de parâmetros do modelo normal
assimétrico.
43
a posteriori dos parâmetros da amostra de 10% dos dados de renda da Seção 3.4.1,
considerando não apenas uma amostra dos dados simulados. Com esse objetivo,
foram geradas 500 amostras de uma população sob o modelo normal e normal
de 10% (ver Tabela 3.11). Os tamanhos das amostras nas áreas foram os mesmos
da amostra de 10%.
Os valores das duas variáveis auxiliares também foram mantidos xos em todas
gerar apenas os valores de di = (ȳi , Si2 ) sob o modelo normal e normal assimétrico,
conforme visto em (3.1) e (3.3) para cada área i = 1, . . . , 140 e amostras simuladas
s = 1, . . . , 500.
No algoritmo MCMC fez-se 50000 iterações, das quais as 5000 primeiras foram
A Tabela 3.7 mostra a média das médias a posteriori dos parâmetros do modelo,
cobertura média dos parâmetros com intervalos de 95% de credibilidade das 500
amostras simuladas do modelo normal assimétrico. Pode ser visto que existem
poucas diferenças entre as médias das estimativas dos dois modelos, com exceção
Na Tabela 3.8 tem-se a média das médias a posteriori dos parâmetros do modelo,
média dos parâmetros com intervalos de 95% de credibilidade das 500 amostras
observa-se que as MREQMp são bem próximas, exceto para o parâmetro β0 . Isto
revela que, quando os dados são gerados a partir do modelo mais simples (normal),
ajustando-se o modelo mais complexo (normal assimétrico) não causa nenhuma piora
médias dos parâmetros, nas 500 amostras, também são bem próximas para ambos
os ajustes.
Tabela 3.7: Medidas resumos das médias a posteriori dos parâmetros para as 500
e normal assimétrico.
σν2 1,53 1,40 0,36 92,8 1,38 1,09 0,55 72,0 1,22
As medidas resumo da Tabela 3.9 são relativas às médias de todas as médias das
pequenas áreas. Por isso, vale a pena comparar o desempenho dos indicadores para
cada área na Figura 3.8. Observe a diferença entre as medidas MEQM, cobertura e
equivalência no ajuste dos dois modelos. Isso mostra que não há perda em ajustar
1,79 para o ajuste N) e a cobertura média (que é de 94,7% para o ajuste NA e 89%
45
Tabela 3.8: Medidas resumos das médias a posteriori dos parâmetros para as 500
assimétrico.
σν2 1,53 1,58 0,42 94,2 1,56 1,72 0,44 94,0 1,70
Tabela 3.9: Medidas de ajuste para estimação pontual e intervalar das médias das
pequenas áreas para as 500 amostras simuladas dos dados gerados do modelo normal
Modelo
MEQM MEAM Cobertura Comprimento MEQM MEAM Cobertura Comprimento
Média(%) Médio Média(%) Médio
NA 0,79 8,10 94,7 3,25 1.01 11,01 94,2 3,70
erro absoluto médio (REAM) quando são preditas as médias das pequenas áreas
para a i-ésima área do modelo (3.3) converge para a normal, quando o tamanho da
denidas como:
P500 N 2
P500
s=1 (µ̂i,s − µi,s ) /µi,s s=1 |µ̂N
i,s − µi,s |/µi,s
REQMi = P500 N A e REAMi = P500 ,
2
s=1 (µ̂i,s − µi,s ) /µi,s s=1 |µ̂N A
i,s − µi,s |/µi,s
onde µN
i,s e µN
i,s
A
representam, respectivamente, o preditor da média da pequena área
sob o modelo normal e normal assimétrico para uma dada área i obtida na simulação
s e µi,s denota o valor verdadeiro.
Figura 3.8: Razão do Erro Quadrático Médio (REQM) e Razão do Erro Absoluto
Médio (REAM) para as médias das pequenas áreas sob o ajuste normal e normal
assimétrico.
A Figura 3.9 mostra a média das medidas de ajuste para cada pequena área,
reta (N=NA) indicam que os valores do ajuste normal são maiores do que os valores
47
proposto medido pela MEQMp (média do erro quadrático médio), MEAMp (média
do erro absoluto médio), cobertura média e pelo comprimento médio dos intervalos
das 500 simulações para cada área. Nota-se que em (a) e (b), tanto MEQMp quanto
MEAMp estão acima da reta, indicando que o modelo normal assimétrico, em média,
Figuras (c) e (d) mostram que a cobertura média e o comprimento médio são maiores
para o ajuste normal assimétrico. Os valores da cobertura média tornam ainda mais
modelo normal.
48
médio para as 500 amostras simuladas do modelo normal assimétrico para as 140
pequenas áreas.
20
● ●
12
10
15
● ●
8
● ●
● ● ●
●●
N
N
●
●
●
●● ●
●
6
●
●●
●
●
●
●●
●
●●●
10
● ●
●●
●●
●
●●
● ●
●
●●●
●
4
●
●
●●
●
●
●●●
●
●
●●
●●
●●
●
●
●●
●●
●
●●● ●
●●
●
●
●●
●
●
●●
2
● ●●
●
●
●
●
●
● ●●
●
●
●
●●●
●
●
●●
● ●
● ●
●●
●
●
5
●
●
●
●
●● ●
2 4 6 8 10 12 5 10 15 20
NA NA
●
65 70 75 80 85 90 95
●●
●●●
●
●●
●
●●
●
●
●
●
●
●
●
●
●●●
●
●
●
●●
●●
●● ●●
● ●
●
●●
●●
●●●
●
5.0
●●
●
●
●
●
●●
●●
●
●●
●●
●
●●
●●
●●●
●●
●
●●
●
●
●
●●●●
●●
●
● ●
●
4.5
●
●
N
4.0
● ●
● ●
●
●
3.5
●●●●
●
● ●●
●
●●
●● ●●
●
●
●
●
●●
●
●
●●
●
●●
●
●● ●
●
●●
●
●
●
●●
●
●●
3.0
●●
●
●●
●
●
●
●●
●
●
●
●
●
●
● ●
NA NA
3.3.4 Conclusões
O estudo de simulação mostrou que a estimação do modelo assimétrico proposto
no nível de área é eciente, tanto para dados com assimetria positiva quanto com
comparar os modelos, pois em todos os casos o modelo com menor DIC e EPD foi
o modelo gerado.
500 amostras simuladas, que conrmam alguns resultados obtidos nas Simulações
erro absoluto médio, cobertura média e comprimento médio, para as 500 amostras
3.4 Aplicação
Este capítulo apresenta duas aplicações em pequenas áreas. Uma para dados de
140 áreas de enumeração (pequenas áreas). Essas áreas são setores censitários. A
da renda média familiar para cada uma das 140 áreas. Como em Moura & Holt
(1999), duas variáveis foram escolhidas para ser o conjunto de covariáveis auxiliares:
somente no nível de área e para todas as áreas. Como se sabe qual a verdadeira
renda média de cada área, pode-se comparar a estimativa de cada pequena área com
588. Considera-se que os dados disponíveis são a média e a variância amostral para
utilizado em Moura & Holt (1999), e foi obtido por meio de uma amostra aleatória de
10% em cada área. O segundo, foi obtido por uma subamostra de 50% pertencente
quando o tamanho das amostras, em média, são moderados, e quando eles são
Uma análise preliminar da variável renda revela que existe uma assimetria
a abordagem proposta possa ser mais adequada que aquela baseada na distribuição
maior que zero para ambas as amostras. Estes resultados estão de acordo com
assimétrico para cada uma das amostras, pode-se notar que todas as estimativas são
λ para aplicação com dados de renda com amostra de 5%, considerando os ajustes
0.6
2.0
NA N
1.0
NA
0.5
N
NA
1.5
0.8
0.4
0.6
0.3
1.0
0.4
0.2
0.5
0.2
0.1
0.0
0.0
0.0
7.0 7.5 8.0 8.5 9.0 −1.0 −0.5 0.0 0.5 1.0 1.5 2.0 1 2 3 4 5 6 7
NA
1.2
N
NA
1.0
0.10
0.8
0.6
0.05
0.4
0.2
0.00
0.0
λ para aplicação com dados de renda com amostra de 10%, considerando o ajuste
1.4
0.7
N N
NA NA
N
1.2
0.6
2.0
NA
1.0
0.5
1.5
0.8
0.4
0.6
0.3
1.0
0.4
0.2
0.5
0.2
0.1
0.0
0.0
0.0
NA
1.2
0.15
N
NA
1.0
0.8
0.10
0.6
0.4
0.05
0.2
0.00
0.0
parecem mais próximos do que para a amostra de 5%. Isso se dá devido aos tamanhos
Tabela 3.10: Medidas resumo para a distribuição a posteriori dos parâmetros para
amostra de 5%.
Ajuste Normal Assimétrico
Parâmetros
Média dp 2,5% Mediana 97,5 %
Ajuste Normal
Tabela 3.11: Medidas resumo para a distribuição a posteriori dos parâmetros para
Ajuste Normal
modelo normal assimétrico ajusta melhor os dados de renda do que o modelo normal,
Central do Limite. Foi feita uma comparação entre os modelos normal assimétrico
e normal, através dos critérios de seleção de modelos DIC, EQMp, EAMp e EPD.
Nas aplicações, o critério BIC não foi utilizado, pois ele não se mostrou eciente nas
Na Tabela 3.12 são apresentados o DIC, juntamente com a média a posteriori dos
desvios (D̄ ) e o desvio da média a posteriori (D̂ ). Como os dados são formados pelo
par (ȳi , s2i ), estas medidas foram calculadas separadamente para cada uma destas
duas estatísticas. Medidas globais são obtidas pelo somatório (ver a linha Total
em Tabela 3.12). O modelo com o menor DIC deve ser o modelo preferido. Como
para esse conjunto de dados o valor verdadeiro da média em cada pequena área é
segundo estes critérios. Além desses critérios, o EPD também foi calculado. Para
normal e normal assimétrico para dados de renda. Pode ser visto, nesta tabela,
que os critérios DIC, EQMp, EAMp e EPD apresentam resultados menores para o
modelo normal assimétrico do que para o modelo normal. Note que, de acordo com
a Tabela 3.12, as medidas de comparação de ajuste para s2i são praticamente iguais
2
em ambos os modelos, já que os modelos para si são os mesmos.
melhor modelo. O valor da medida PP na Tabela 3.12, refere-se a média dos PP's
nas 140 pequenas áreas. Observe que para o modelo normal assimétrico, o PP é
amostras de 5% e 10%.
s2 1302,94 1220,15 1137,37 82,78 3818,72 47,85 1097,92 54%
Amostra de 10%
Figura 3.12: Boxplots das Conditional Predictive Ordinates (CPOs) para os modelos
0.30
0.25
0.25
0.20
0.20
CPO
CPO
0.15
0.15
0.10
0.10
0.05
0.05
0.00
0.00
NA N NA N
predictive ordinates (CPOs), foi feita para cada i = 1, . . . , 140 do par do conjunto
de dados, di = (ȳi , s2i ). Foram considerado os dois ajustes e para as duas frações de
amostragem. A denição utilizada aqui para a CPO da i-ésima área é feita através da
com maior CPOs indica melhor ajuste dos dados observados. Usa-se leave-one-out
Figura 3.12 mostra os boxplots das CPOs calculada para cada um dos ajustes e
Na Figura 3.13 tem-se o valor predito ȳˆi versus o valor verdadeiro das médias
ajuste normal assimétrico contém mais os valores das médias verdadeiras do que do
● ●
● ●
20
20
● ●
● ● ● ●
● ●
Valores Verdadeiros
● ●
● ●
● ●
Valor Verdadeiro ●
●
15
15
● ● ● ●
● ● ●
●
● ●
● ●
● ●
● ●
● ● ●●
●
● ●● ●● ●
● ●● ●
● ●
● ● ●
● ●● ●● ●●● ●
● ●
● ●● ● ● ●● ● ●
● ●
10
● ● ● ●
10
●● ● ● ● ●● ● ●
● ● ●
● ●
● ● ● ●●
●
●
●● ●● ● ●●
● ● ●●
● ●
● ●●
●
● ● ●●● ●●●●● ●●
● ● ●● ●● ● ●●●● ●
●●
● ● ● ●●
● ●● ● ●● ●
● ● ● ● ●● ● ● ●
● ● ●●
● ● ● ●● ●
●●● ●●●●● ●● ● ●● ●●●
●
●
●
●●● ● ● ● ● ● ●●● ●
●● ● ● ●●●
● ●●● ● ●●
● ● ●●
●● ● ● ● ● ●●●●●● ● ●●
●
●●● ● ●
● ●
● ● ●● ● ● ●● ● ●●
●● ● ● ● ● ●● ●
● ● ●
5
●
5
● ●
●
●
●
0 5 10 15 20 5 10 15 20
●
●
●
●
20
●
20
●
● ●
●
●
Valores Verdadeiros
●
● ●
Valor Verdadeiro
● ● ●
●
15
●
15
● ●● ●
● ● ●
● ●
● ●
● ●
●
● ● ●●
●
● ●●
●
● ● ●● ●
● ●● ●
●
●
● ● ●
●● ● ● ●
● ●● ●●
●
● ●●● ●● ●● ● ●
10
● ●● ● ●
● ●
10
● ● ●● ●
●●● ●● ●● ● ●
● ● ● ●●
●
●● ● ● ●
● ●● ● ●● ●●●
● ● ●● ● ●
● ●● ●● ● ● ●●● ●● ●
● ● ●●● ● ● ● ● ● ●● ●
●●
●
● ● ● ●
●●
●●● ● ● ●● ● ●
● ●
●● ●● ●●
●
● ●●● ●
●● ●
● ● ● ● ●● ●● ● ●● ●
● ●● ●●●●● ●
●●● ●● ● ●● ● ●● ●● ● ● ●
●● ●●●●●●●● ● ● ●
●●
● ● ● ● ● ●● ●● ● ●● ●
●● ● ● ●● ● ●
● ●● ● ● ● ●●●
● ●
● ●
5
●
5
● ●
●
● ●
0 5 10 15 20 5 10 15 20
n_i
(a) Amostra de 5%
8
6
4
2
0
n_i
eixo das ordenadas tem-se a diferença entre os valores preditos, considerando o ajuste
quanto para amostra de 10%, os valores estão bem distribuídos em torno de zero,
isto mostra que não há vício em nenhum dos modelos. Porém, as medidas ηyi de
cada pequena área são maiores para amostra de 5% do que para amostra de 10%.
mais notório para amostra de 10%, em que os respectivos tamanhos das pequenas
mais próximas da reta identidade. Para o ajuste normal, as observações estão mais
reta, na parte superior de cada gráco, representam as áreas em que a renda média
Figura 3.15: Comparação dos dois ajustes: valor amostral ȳi versus sua estimativa
20
15
15
10
10
5
5 10 15 20 5 10 15 20
20
15
15
10
10
5
5 10 15 20 5 10 15 20
alunos por escola Ni varia de 7 a 67. O interesse deste estudo foi avaliar a prociência
média escolar de uma determinada série, por meio das notas dos alunos, obtidas nos
aplicação não se tem os dados censitários de todos os alunos. Portanto, não foi
utilizar o modelo proposto. Cada pequena área (escola) possui apenas uma variável
explicativa x1 , que representa o grau de escolaridade máximo dos pais. Para esse
os dois ajustes.
Foi utilizado o algoritmo MCMC com 200000 iterações e das quais as 100000
4,28. Observa-se que as outras medidas dos parâmetros são próximas para ambos
A Tabela 3.14 mostra os resultados dos critérios DIC e EPD utilizados para
comparação dos modelos. Aqui, o melhor modelo indicado pelo DIC e EPD é
Tabela 3.13: Medidas resumo para a distribuição a posteriori dos parâmetros para
Ajuste Normal
Tabela 3.14: Critérios de escolha de modelos para aplicação dos dados educacionais.
PP 0,50 0,49
EP D 118,90 150,00
65
0.25
N
NA
0.5
0.20
N
NA
0.4
0.15
0.3
0.10
0.2
0.05
0.1
0.00
0.0
19 20 21 22 23 24 25 0 5 10 15
(a) β0 (b) β1
0.5
0.15
N
NA
0.4
0.10
0.3
NA
0.2
0.05
0.1
0.00
0.0
Figura 3.17: Comparação dos dois ajustes para aplicação com dados educacionais:
30
28
28
26
26
24
24
22
22
20
20
20 22 24 26 28 30 20 22 24 26 28 30
próximas. A diferença das estimativas está, na maioria dos casos, na segunda casa
assimétrico, pode-se notar que o modelo que leva em conta essa assimetria foi
sugerindo que os dados não têm assimetria e que o modelo normal pode ser adequado
67
para estimar os valores esperados das observações. É importante lembrar que o DIC
educacionais.
melhor modelo foi o que considera assimetria nos dados para ambas as aplicações.
Isso também foi conrmado pelo EPD. Na primeira aplicação, em que os valores
sejam normais assimétricos. Para isso, propõe-se dois casos: i) o primeiro, modelo
ser igual ou diferente em cada pequena área. No modelo de área, só está disponível
uma observação para cada área, o que torna difícil a estimação desse parâmetro
se considerados diferentes para cada área. Nos modelos propostos neste capítulo,
se pode fazer previsão para cada unidade populacional não pertencente à amostra,
68
69
sendo normal assimétrico, pode ser escrito como: para a unidade j da pequena área
i,
p
yij |µij , λi , φi ∼ N A(µij , φi , λi ), (4.1)
0
onde µij = xij β + νi com νi ∼ N (0, σν2 ); φi |a, b ∼ IG(a, b), λi = λ para todo i.
Baseado na Propriedade 7 do Capítulo 2 pode-se inserir uma variável latente
p
yij |Wij , µij , λ, φi ∼ N [µij + φi δwij ; φi (1 − δ 2 )], (4.2)
√
onde δ = λ/ 1 + λ2 e Wij ∼ HN (0, 1) é a variável latente.
ni
m Y
Y
L(D, w|Θ) = f (yij |Θ, w).f (wij )
i=1 j=1
m Y ni √
−(yij − (µij + φi δwij ))2
Y 1
= p exp
i=1 j=1 2π(1 − δ 2 )φ
i 2φi (1 − δ 2 )
r 2
wij
2
× exp − , (4.3)
π 2
normal assimétrica. A distribuição a priori para Θ pode ser escrito como segue:
m ni
!
Y Y
π(Θ) = π(λ)π(σν2 )π(a)π(b)π(β) π(φi |a, b) [π(µij |β)] . (4.4)
i=1 j=1
hiperparâmetros com distribuição gama Ga(0, 01; 0, 10). A priori utilizada para
1
λ ∼ t(0, 2
; 2), onde t(e, f ; gl) denota a distribuição t-Student centrada em e com
escala f e gl graus de liberdade. Essa priori foi escolhida baseada em Bayes &
√
Branco (2007). Com essa priori, tem-se que a transformação de δ = λ/ 1 + λ2
fornece uma priori não informativa U (−1, 1).
Combinando (4.3) e (4.4), a distribuição conjunta dos dados D e dos parâmetros
Θ mais w é dada por:
assimetria λ seja diferente para cada pequena área. Assim, o modelo segue como
p
yij |µij , λi , φi ∼ N A(µij , φi , λi ) (4.6)
0
onde µij = xij β + νi com νi ∼ N (0, σν2 ); φi |a, b ∼ IG(a, b) e λi |λ, σλ2 ∼ N (λ, σλ2 ),
com i = 1, . . . , m e j = 1, . . . , ni . λi depende de um hiperparâmetro λ.
Note que
√ p
Pode-se escrever yij |· ∼ N [µij + φi δi wij ; φi (1 − δi2 )], onde δi = λi / 1 + λ2i e
por
ni
m Y
Y
L(D, w|Θ) = f (yij |Θ, w).f (wij )
i=1 j=1
m Y ni √
−(yij − (µij + φi δi wij ))2
Y 1
= exp
2φi (1 − δi2 )
p
i=1 j=1 2π(1 − δi2 )φi
71
r 2
wij
2
× exp − , (4.7)
π 2
com j = 1, . . . , ni , e i = 1, . . . , m, e w são os parâmetros introduzido para
C2.
estrutura hierárquica e varia de acordo com a área. Nas duas simulações, a estimação
gerados segundo uma distribuição normal com N (λ, σλ2 ). Escolhe-se σλ2 = 0, 1 por
N (0, 1). Os valores de m e dos ni foram os mesmos da amostra de 10% dos dados
4.3.1 Simulação 1
A Simulação 1, refere-se a simulações baseadas no modelo no nivel de unidades
feitas 80000 iterações, das quais as 30000 primeiras foram descartadas, e tomada
uma a cada 20. Utilizou-se os software R, Ox e Winbugs. A parte gráca foi feita
verdadeiros parâmetros. O σν2 é o único parâmetro que não está contido dentro do
dos parâmetros, representado pela linha cheia em vertical, estão dentro do intervalo
Tabela 4.1: Medidas resumo dos parâmetros da simulação para os dados assimétricos
no nível da unidade com λ comum a todas as áreas.
Valor
Parâmetros Média dp 2,5% Mediana 97,5%
Verdadeiro
MNAC: λ = −1
σν2 5 6,397 0,810 4,981 6,308 8,190
β0 9 9,396 0,234 8,949 9,387 9,864
β1 1 0,981 0,024 0,935 0,982 1,028
β2 3 3,014 0,030 2,956 3,013 3,076
λ -1 -1,22 0,120 -1,448 -1,224 -0,970
MNAC: λ=0
σν2 5 6,64 0,846 5,267 6,599 8,499
β0 9 9,555 0,878 7,952 9,563 11,05
β1 1 0,978 0,0301 0,923 0,9763 1,039
β2 3 3,002 0,039 2,918 3,005 3,078
λ 0 -0,1893 0,367 -0,843 -0,164 0,470
MNAC: λ=5
σν2 5 6,580 0,810 5,189 6,506 8,403
β0 9 9,174 0,221 8,739 9,176 9,596
β1 1 0,993 0,014 0,965 0,993 1,019
β2 3 2,997 0,019 2,959 2,998 3,035
λ 5 5,146 0,354 4,484 5,135 5,888
MNAC: λ = 10
σν2 5 6,591 0,804 5,200 6,526 8,347
β0 9 9,205 0,219 8,768 9,205 9,635
β1 1 0,991 0,011 0,969 0,991 1,014
β2 3 2,995 0,015 2,964 2,995 3,025
λ 10 9,716 0,948 8,093 9,662 11,97
74
12
15
10
1.0
8
10
6
0.5
4
5
2
0.0
8.5 9.0 9.5 10.0 0.90 0.95 1.00 1.05 2.90 2.95 3.00 3.05 3.10 3.15
3.0
2.5
0.4
2.0
0.3
1.5
0.2
1.0
0.1
0.5
0.0
0.0
10
12
10
8
0.6
6
0.4
4
4
0.2
2
2
0.0
7.5 8.0 8.5 9.0 9.5 10.0 10.5 0.90 0.95 1.00 1.05 2.90 2.95 3.00 3.05 3.10
1.5
0.3
1.0
0.2
0.5
0.1
0.0
0.0
20
1.5
20
15
1.0
15
10
10
0.5
5
5
0.0
8.5 9.0 9.5 10.0 0.94 0.96 0.98 1.00 1.02 1.04 2.94 2.96 2.98 3.00 3.02 3.04 3.06
1.4
1.2
0.4
1.0
0.3
0.8
0.6
0.2
0.4
0.1
0.2
0.0
0.0
25
1.5
30
20
1.0
20
15
10
0.5
10
5
0.0
8.5 9.0 9.5 10.0 0.96 0.98 1.00 1.02 2.94 2.96 2.98 3.00 3.02 3.04
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0.0
0.0
4 5 6 7 8 9 10 8 10 12 14
4.3.2 Simulação 2
A Simulação 2 refere-se a simulações feitas baseadas no modelo no nível de unidade
assumindo uma estrutura hierárquia para este parâmetro. Foram feitas 40000
iterações, das quais as 15000 primeiras foram descartadas, e tomada uma a cada
utilizando o WinBugs.
parâmetros.
dos parâmetros, representados pela linha cheia em vertical, estão dentro do intervalo
A Tabela 4.3 mostra as medidas de ajuste para dados gerados do modelo NAC
e NAH. Observou-se que os dois modelos assimétricos NAC e NAH têm maior
cada indivíduo da amostra, para quatro áreas com tamanhos iguais a 6, 20, 30 e 59,
se que todos os valores estão dentro do intervalo de credibilidade de 95% nas quatro
Tabela 4.2: Medidas resumo dos parâmetros da simulação para os dados assimétricos
de unidade com λi hierárquico.
Valor
Parâmetros Média dp 2,5% Mediana 97,5%
Verdadeiro
MNAH: λ = −1
σν2 5 6,02 0,8 4,63 5,94 7,81
σα2 0.1 0,05 0,06 0,01 0,03 0,23
β0 9 9,26 0,34 8,46 9,29 9,83
β1 1 1,03 0,02 0,98 1,02 1,07
β2 3 3,00 0,03 2,93 3,00 3,06
λ -1 -1,07 0,17 -1,30 -1,09 -0,64
MNAH: λ=0
σν2 5 5,84 0,86 4,26 5,8 7,63
σα2 0.1 0,08 0,11 0,00 0,04 0,36
β0 9 9,6 0,66 8,28 9,64 10,8
β1 1 1,03 0,03 0,97 1,03 1,09
β2 3 3,00 0,04 2,92 3,00 3,07
λ 0 -0,24 0,28 -0,76 -0,26 0,31
MNAH: λ=5
σν2 5 6,07 0,75 4,78 6,01 7,76
σα2 0.1 0,27 0,37 0,01 0,12 1,38
β0 9 9,26 0,21 8,84 9,26 9,69
β1 1 1,00 0,01 0,97 1,00 1,03
β2 3 3,00 0,02 2,96 3,00 3,04
λ 5 4,78 0,31 4,12 4,82 5,29
MNAH: λ = 10
σν2 5 6,11 0,75 4,80 6,06 7,78
σα2 0.1 0,79 1,31 0,01 0,26 3,84
β0 9 9,28 0,20 8,88 9,28 9,68
β1 1 0,99 0,01 0,97 0,99 1,01
β2 3 3,00 0,02 2,98 3,00 3,04
λ 10 9,12 0,63 8,09 9,09 10,57
80
2
Figura 4.5: Histograma da distribuição a posteriori dos parâmetros β0 , β1 , β2 , σν ,
σλ2 e λ = −1 com intervalo de 95% de credibilidade, para simulação com dados
assimétricos no nível da unidade com ajuste NAH.
1.4
12
1.2
15
10
1.0
8
0.8
10
6
0.6
4
0.4
2
0.2
0.0
7.5 8.0 8.5 9.0 9.5 10.0 10.5 0.95 1.00 1.05 1.10 2.90 2.95 3.00 3.05 3.10
12
2.5
0.4
10
2.0
0.3
1.5
6
0.2
1.0
4
0.1
0.5
2
0.0
0.0
0
2
Figura 4.6: Histograma da distribuição a posteriori dos parâmetros β0 , β1 , β2 , σν ,
σλ2 e λ = 0 com intervalo de 95% de credibilidade, para simulação com dados
assimétricos no nível da unidade com ajuste NAH.
10
14
0.5
12
8
10
0.4
6
8
0.3
4
0.2
2
0.1
2
0.0
8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 0.95 1.00 1.05 1.10 2.85 2.90 2.95 3.00 3.05 3.10 3.15
1.0
0.3
6
0.2
0.5
0.1
2
0.0
0.0
0
4 6 8 10 0.0 0.2 0.4 0.6 0.8 1.0 1.2 −1.0 −0.5 0.0 0.5
2
Figura 4.7: Histograma da distribuição a posteriori dos parâmetros β0 , β1 , β2 , σν ,
σλ2 e λ = 5 com intervalo de 95% de credibilidade, para simulação com dados
assimétricos no nível da unidade com ajuste NAH.
20
25
1.5
15
20
1.0
15
10
10
0.5
5
5
0.0
8.5 9.0 9.5 10.0 0.94 0.96 0.98 1.00 1.02 1.04 2.95 3.00 3.05
1.2
4
0.4
1.0
3
0.8
0.3
0.6
2
0.2
0.4
0.1
0.2
0.0
0.0
0
4 5 6 7 8 9 0.0 0.5 1.0 1.5 2.0 2.5 4.0 4.5 5.0 5.5
2
Figura 4.8: Histograma da distribuição a posteriori dos parâmetros β0 , β1 , β2 , σν ,
σλ2 e λ = 10 com intervalo de 95% de credibilidade, para simulação com dados
assimétricos no nível da unidade com ajuste NAH.
25
30
2.0
20
25
1.5
20
15
15
1.0
10
10
0.5
5
5
0.0
8.8 9.0 9.2 9.4 9.6 9.8 0.96 0.98 1.00 1.02 1.04 2.96 2.98 3.00 3.02 3.04 3.06
0.6
1.0
0.4
0.5
0.8
0.4
0.3
0.6
0.3
0.2
0.4
0.2
0.1
0.2
0.1
0.0
0.0
0.0
4 5 6 7 8 9 0 5 10 15 8 9 10 11
Tabela 4.3: Medidas de ajuste para dados gerados do modelo assimétrico com λ
comum e λi hierárquico, considerando os ajustes assimétrico e normal.
−
* −
*
25
−
*
−
*
−
*
20
15
10
−
*
1 2 3 4 5 6
(a) n117 = 6
25
−
*
20
−
* −
*
15
−
* −
* −
*
−
* −
*
−
* −
* −
* −
*
10
−
*
−
* −
*
−
* −
*
−
* −
* −
*
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
(b) n27 = 20
−
*
−
15
*
−
*
−
* −
* −
10
*
−
*
−
* −
* −
* −
* −
* −
*
−
* −
* −
*
− −
5
− * − − *
* − * *
− * −
* *
− −
0
− * *
− *
* −
*
−
−5
*
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
(c) n103 = 30
−
*
15
−
*
−
* −
* −
* −
*
10
−
* −
* −
* −
* −
* −
* −
* −
* −−
*
−
* −
* −
* * −* −
* −
*
−
* −
* −
* −
* −
*− −
* −
*−*
−
* *
−
* −
*
5
−
* −
*− −
* −
* −
* −
*
−
* * −
*
−
* −
* −
* *−
− *
−
* −
*
−
* −
* −
*−*
0
−
* −
* −
*
−
* −
*
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
(d) n67 = 59
86
NAC e NAH são ecientes, tanto para dados com assimetria positiva quanto com
comparar os modelos, pois em todos os casos o modelo com menor DIC e EPD foi o
modelo gerado. Isso mostra que estes critérios podem apontar qual o melhor modelo
para dados reais. É necessário ter cuidado ao utilizar o BIC, pois nas simulações ele
aponta como melhor modelo o mais simples, com menor número de parâmetros.
4.4 Aplicação
Esta seção apresenta uma aplicação em pequenas áreas para dados de renda. A
amostra considerada foi obtida por meio de uma amostra aleatória de 10% em cada
área. Os dados utilizados para avaliar o modelo proposto neste trabalho foram os
mesmos descritos em Moura & Holt (1999) e na Seção 3.4.1; contudo, considerou-se
BIC (Schwarz, 1978), DIC (Spiegelhalter et al., 2002), e EPD (Gelfand & Ghosh,
1998).
Os modelos propostos são como o descrito nas Seções 4.1 e 4.2 e foram utilizadas
Na Tabela 4.4, nota-se que as médias a posteriori dos dois modelos assimétricos
assimétrico que considera assimetria comum entre as áreas é melhor que os demais
modelos, embora os valores sejam bem próximos dos obtidos no modelo assimétrico
no λi . Isso indica que os dois modelos assimétricos são parecidos, tendo capacidade
preditiva similares, o que indica que existe pouca variação nas pequenas áreas em
apresentem resultados similares, não se pode concluir que para todas as aplicações
a assimetria seja comum para todas as áreas. Em algumas aplicações pode ocorrer
uma grande variação de assimetria entre as áreas. Nestas situações, espera-se que
NAC.
88
Tabela 4.4: Medidas resumo para a distribuição a posteriori dos parâmetros para os
dados de renda segundo os ajustes do modelo normal, NAC e NAH para amostra
de 10%.
Média dp 2,5% Mediana 97,5 %
Parâmetros
Ajuste Normal
β0 8,64 0,14 8,37 8.64 8.93
β1 1,08 0,05 0,97 1,08 1,19
β2 2,15 0,07 2,00 2,15 2,29
σν2 1,11 0,34 0,54 1,08 1,82
Ajuste NAC
β0 1,61 0,10 1,42 1,60 1,80
β1 0,35 0,04 0,28 0,35 0,42
β2 1,13 0,06 1,01 1,12 1,24
σν2 0,47 0,12 0,25 0,46 0,74
λ 8,82 0,73 7,56 8,78 10,29
Ajuste NAH
β0 1,62 0,09 1,44 1,62 1,81
β1 0,34 0,04 0,27 0,34 0,41
β2 1,12 0,05 1,02 1,12 1,23
σν2 0,38 0,12 0,17 0,37 0,64
λ 10,68 1,13 8,06 10,61 13,12
σλ2 11,39 5,31 3,56 10,46 24,25
Tabela 4.5: Critérios de escolha de modelos para aplicação dos dados de renda com
amostra de 10%.
Medidas Ajuste NAH Ajuste NAC Ajuste Nromal
BIC 58152,12 57037,71 58236,37
DIC 23955,18 23990,99 25197,29
D̄ 23763,35 23813,96 25020,88
4.4.1 Previsão
Nesta subseção, foi feita a previsão para valores não observados da aplicação de renda
para amostra de 10%. Como esses dados são censitários, tem-se os valores de toda
a população. Com isso, pode-se fazer comparações entre os modelos normal, NAC
com λi hierárquico) e vericar qual o modelo cujas estimativas estão mais próximas
P P (k)
(k) j∈Si / i yij
yij + j ∈S
µi = (4.10)
Ni
onde Si é o conjunto dos índices das unidades que fazem parte da amostra da pequena
área i e Ni é o tamanho da população na área i. A esperança e a variância a
1
PI (k)
posteriori são, repectivamente, estimadas por E(µi |D) = k k=1 µi , e V (µi |D) =
1
PI (k)
k k=1 [µi − E(µi |D)]2 , para k = 1, . . . , I . Assim, para o indivíduo não observado
(k) 0
onde, segundo o modelo proposto, µij ∼ N (Xij β (k) , (σν2 )(k) ). Os somatórios
P (k)
/ i yij , que é o termo utilizado para calcular a média de toda a área
j ∈S i, foram
estimados de acordo com cada modelo ajustado. Note que para fazer a previsão para
toda a população é necessário ter disponível os valores das covariáveis para todos os
indivíduos da população.
pequenas áreas, obtidos sob os ajustes Normal, NAC e NAH. A barra vertical (|)
90
não contemplam a maioria das médias verdadeiras na maioria das áreas. Isso mostra
modelo normal.
ˆN
ȳ i −Ȳi
ˆN AC −Ȳi
ȳ
Na Figura 4.11 temos o boxplot das diferenças no item (a), i no item
Ȳi Ȳi
ˆN
ȳ
AH
−Ȳi N N AC N AH
(b) e i
Ȳi
ˆi , ȳˆi
no item (c), onde Ȳi , ȳ ˆi
e ȳ denotam, respectivamente, as
e NAH para cada área i. Pode-se observar que os ajustes assimétricos apresentam
boxplot parecidos e que o modelo normal apresenta melhor previsão pontual para
Figura 4.10: Intervalo de Credibilidade de 95% para as médias de cada pequena área
obtidos nos ajustes Normal, NAC e NAH. A barra vertical (|) representa o intervalo
de 95% de credibilidade, o traço (-) representa a média a posteriori e o asterisco (∗)
representa o valor verdadeiro.
*
*
20
*
* *
*
*− * *
*
15
− * * *
− − * * * − *
− −
− *−
− *− * −−* * * −
* * *
−* * * − − − * * − * −
−−− * − *− * − * * *−
** − * −− *− *− * −− −− −
* − − −
−
*− − − * −*
10
− *− − * − −* − − − − *−− * − −* − − *
* *− * −− −−
− ** −−
*
* * − −
** − −* −
* *−* − − − − −
* *− − −−*−−
* −− −−
*
*−
* * * * − − *− − − * − −
* * − *− **−* *−*−−
−− * *−* −*
−
* *− −− − − − −−*− −*− −
−−−
* *− * * −
** *−
−
* * * * −* * − − − − * ** −*−* −*− − −− **
* * *** *** * * * **−** * ** *
5
* *
*
1 4 7 11 15 19 23 27 31 35 39 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 104 109 114 119 124 129 134 139
− − −
* *
−
20
*− −
* − * − * −
− * *
−* −
* −−− − − *− *
15
* − * − − − *
* * −
−
* *−* − *
* *− * −*− − − * −−* −
− − −*− * −−− −−− −*− − −− −
− − **−
− − − * −
*− * * * * * *
− *− * −− −
10
−* − * −
* −−* *
* −* * − * * − − − * − −
−* *− − − −
−* *− * ** − − * * * *− *− −*−** −
*** − * **− − *−* −
* − *−*
*− * * −
* *−* * − − **−* − −
*− −−* **− * * *−*−
− −*− −*−
− − −−*− *−
− −−*−*− −
** ** * − −
* −* * *** −* * −
* −
*− ** − * ***
* * * −
**−* * *−
−
* **−
**
5
* * *
1 4 7 11 15 19 23 27 31 35 39 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 104 109 114 119 124 129 134 139
− − −
−* *
20
*− −
* − * − *
− −
*
−* −
* −−−
− *− * − *
15
− * − − − *
* * * −− * − *− * −
− − − *
*−*− − − −* − −−− −− − −− −*− − −** − − −
* − * *** * − −* * * −− * * −− − * − − − −
* *
10
−* *− −
* −* *− −* *− *− *− ** − * −* −*−** − *** −
* −−* * − −
*−−*
* − − * − −
* * − *−* * ** −
*− * * −
* *−* * − − * *− −** * − − *− −
−− *− − −
*** −−* * *−*− −− − * −**−
− −− − −−
*− *−*− −−−
** * − * *** ***− * ** − * *
− ***−* −* *− *
*−
* **−*
− *−
* * ****
*−
*
5
* * *
1 4 7 11 15 19 23 27 31 35 39 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 104 109 114 119 124 129 134 139
Figura 4.11: Boxplot das diferenças relativas entre as médias das estimativas a
posteriori e os verdadeiros valores das médias.
0.6
●
0.4
0.2
0.0
−0.2
−0.4
●
●
0.25
●
0.20
● ●
●
0.15
● ●
● ●
●
● ●
●
●
0.10
●
0.05
4.5 Conclusão
Após realizar simulações e estimação do modelo assimétrico no nível de unidade,
parâmetros. O parâmetro de assimetria parece ser bem estimado, tanto pela média a
posteriori quanto pela mediana. Nas medidas de ajuste foi observado que a maioria
com o modelo normal. Em algumas situações, o BIC apontou como melhor modelo
o modelo normal.
assimétricos foram melhores do que o modelo normal. Isso mostra que há ganho em
de previsão intervalar dos modelos assimétricos, NAC e NAH são mais ecientes.
Uma outra alternativa para tentar melhorar a estimação pontual dos modelos
assimétricos, pode ser feito tornando a esperança do erro igual a zero. Assim,
r
p 2 p
yij |µij , λi , φi ∼ N A(µij − δi φi , φi , λi )
π
p
onde δi = λi / 1 + λ2i . Dessa forma, E(eij ) = 0.
Os resultados obtidos na previsão, segundo essa parametrização, mostraram
no somatório das diferenças relativas. Para o modelo assimétrico NAC, a soma das
P140 ȳˆNi AC −Ȳi
diferenças relativas i=1 ( Ȳi
) foi 11,29, enquanto considerando erro centrado,
a soma das diferenças relativas foi de 10,82. Para o modelo assimétrico NAH, a soma
P140 ȳˆNi AH −Ȳi
das diferenças relativas i=1 ( Ȳi
) foi 11,42, e passou para 10,93 ao considerar
o erro centrado em zero.
Capítulo 5
Conclusões e Extensões
• Foi desenvolvida uma nova metodologia para estimar dados em pequenas áreas,
se mais eciente que o modelo que não considera assimetria. O critério DIC,
• Nas aplicações do modelo de área, o EPD e DIC apontou como melhor modelo
simulação, que o modelo proposto é mais eciente que o modelo usual (normal)
95%.
94
95
estimado nos dois casos, tanto pela média a posteriori quanto pela mediana.
Isso se dá pelo fato de se ter mais observações disponíveis por pequena área.
Além disso, foi possível propor um modelo hierárquico, NAH onde λi varia
• Nas medidas de ajuste foi observado que a maioia delas acerta em apontar
normal.
Trabalhos futuros:
tempo para cada área i, então o modelo dinâmico proposto é dado por
√
ȳˆi,t | µi,t , λ, nit , σi2 ∼ N A(µi,t , n−1 2
it σi , λ/ nit )
2
| nit , σi2 ∼ Ga 0.5 ∗ (nit − 1), 0.5(nit − 1)σi−2
Si,t
µi,t = µi,t−1 + wi,t . (5.1)
over the blup in small area estimation problems. Statistica Sinica 7 1053
1063.
areas using survey and satellite data. Journal of the American Statistical
Association 500505.
96
97
components model for prediction of county crop areas using survey and
409.
73(3) 155163.
98
373389.
ABE.
705767.
Survey Methodology.
133142.
Sugden, R., Smith, T. & Jones, R. (2000). Cochran's rule for simple
793.
You, Y. & Chapman, B. (2006). Small area estimation using area level
100
101
Algoritmo
Num passo (s) da iteração, a atualização dos parâmetros no passo (s + 1) é
dado por:
amostrando σν2 :
" m
#
(s) (s) (s) (s)
(s+1) m X (µi − β0 − β1 x1i − β2 x2i )2
σν2 |· ∼ GI c + , d + ,
2 i=1
2
atualizando β0 :
!−1 !−1
m (s)
!
X µ − β1 (s) x1i − β2 (s) x2i a0 m 1 m 1
β0 (s+1) |· ∼ N i
+ + , +
i=1 σν2 (s+1) b0 σν2 (s+1) b0 σν2 (s+1) b0
atualizando β1 :
!−1 !−1
m (s) (s+1) (s)
! Pm Pm
x1i (µ − β − β x2i ) 2 2
(s+1) a1 i=1 x1i 1 i=1 x1i 1
X
i 0 2
β1 |· ∼ N + + , + ,
i=1 σν2 (s+1) b1 σν2 (s+1) b1 σν2 (s+1) b1
atualizando β2 :
!−1 !−1
m
!
(s+1) (s+1) Pm 2
Pm 2
(s+1)
X x2i (µi − β −β 0x1i ) 1 a2 i=1 x2i 1 i=1 x2i 1
β2 |· ∼ N + + , +
i=1 σν2 (s+1) b2 σν2 (s+1) b2 σν2 (s+1) b2
atualizando µi :
√ (s) (s) (s)
! !−1 !−1
(s+1) (θ̂i − ( φi wi δi )) X0 β 1 1 1 1
µi |· ∼N (s)
+ + , + ,
φi (s) (1 − δi2 )/ni σν2 (s+1) φi (s) (1 − δi2
(s)
) σν2 (s+1) φi (s) (1 − δi2
(s)
) σν2 (s+1)
atualizando wi :
! !−1 !−1
(s) (s+1) (s) (s)
(s+1) δ (θ̂i − µi ) δi2 δi2
wi |· ∼ N √i (s) (s)
1+ (s)
, 1+ (s)
.
φi (1 − δi2 ) (1 − δi2 ) (1 − δi2 )
λ∗ | λ(s) ∼ N (λ(s) , Vλ ),
onde Vλ é uma variância escolhida adequadamente de acordo com o
π(Θ∗ |y)
αλ = min 1, ,
π(Θ̃|y)
(s+1) (s+1) (s+1) (s+1)
Θ∗ = (σν2 , β0 , β1 , β2 , w(s+1) , λ∗ , µ(s+1) , φ(s) ) e
(s+1) (s+1) (s+1) (s+1)
Θ̃ = (σν2 , β0 , β1 , β2 , w(s+1) , λ(s) , µ(s+1) , φ(s) ).
102
( )
π(Θ∗ |y) fG (φi (s) |φi ∗ )
α φi = min 1, · ,
π(Θ̃|y) fG (φi ∗ |φi (s) )
(s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ∗ = (σν2 , β0 , β1 , β2 , w(s+1) , λ(s+1) , (σi2 )k<i , φi ∗ , (φi )k>i , µ(s+1) ) e
(s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ̃ = (σν2 , β0 , β1 , β2 , w(s+1) , λ(s+1) , (φi )k<i , (φi )k≥i , µ(s+1) );
103
i = 1, . . . , m. Observou-se que θ̂i |µi ∼ N (µi , σi2 /ni ) e µi |x0i β ∼ N (x0i β, σν2 ).
Escreveu-se π(µ, β) na forma hierárquica, e considerou-se que µi dado β e
Qm
σi2 são independentes. Desta forma, tem-se que π(µ|xβ) = i=1 π(µi |β) e
Qm 2
π(σ) = i=1 π(σi ).
parâmetro.
f (θ̂i , σ̂i2 |·) = f (θ̂i |·)f (σ̂i2 |·), com σ̂i2 |ni , σi2 ∼ Ga[0, 5(ni − 1); 0, 5(ni − 1)σi−2 ].
Detalhando o modelo normal, tem-se:
A função de verossimilhança
m
Y
L(Θ|y) = f (θ̂i |Θ)f (s2i |σi2 , ni )
i=1
m
!
Y 1 −(θ̂i − µi )2
L(Θ|y) = exp
2σi2 /ni
p
2
i=1 2πσi /n i
ni2−1
−(ni − 1)s2i
ni − 1
× exp .
2σi2 2σi2
As prioris:
π(Θ|y) ∝ L(Θ|y)π(Θ).
Condicionais Completas
Encontramos as seguintes condicionais:
m
" #
m X (µi − β0 − β1 x1i − β2 x2i )2
σν2 |· ∼ GI c + , d + ,
2 2
i=1
" m ! #
X µi − β1 x1i − β2 x2i a0 m 1 −1 1 −1
m
β0 |· ∼ N + + , +
σν2 b0 σν2 b0 σν2 b0
i=1
" m !
X x1i (µi − β0 − β2 x2i ) a1 Pm x2 −1 Pm 2 −1 #
i=1 1i 1 i=1 x1i 1
β1 |· ∼ N + + , +
σν2 b1 σν2 b1 σν2 b1
i=1
" m
X x2i (µi − β0 − β1 x1i ) a2
! P
m 2 −1 Pm 2 −1 #
i=1 x2i 1 i=1 x2i 1
β2 |· ∼ N + + , +
σν2 b2 σν2 b2 σν2 b2
i=1
" ! #
X0 β 1 −1 1 −1
θ̂i ni ni
µi |· ∼ N + 2 + , +
σi2 /ni σν σi2 σν2 σi2 σν2
" #
ni (θ̂i − µi )2 (ni − 1)s2i
σi2 |· ∼ GI a + , b + + .
2 2/ni 2
105
Algoritmo
Num passo (s) da iteração, a atualização dos parâmetros no passo (s + 1) é
dado por:
amostrando σν2 :
"m
#
(s) (s) (s) (s) 2
(s+1) m X (µ i − β 0 − β1 x 1i − β 2 x 2i )
σν2 |· ∼ GI c + , d + ,
2 i=1
2
atualizando β0 :
!−1 !−1
m (s)
!
X µ − β1 (s) x1i − β2 (s) x2i a0 m 1 m 1
β0 (s+1) |· ∼ N i
+ + , +
i=1 σν2 (s+1) b0 σν2 (s+1) b0 σν2 (s+1) b0
atualizando β1 :
!−1 !−1
m (s) (s+1) (s)
! Pm Pm
x1i (µ − β − β x2i ) 2 2
(s+1) a1 i=1 x1i 1 i=1 x1i 1
X
i 0 2
β1 |· ∼ N + + , + ,
i=1 σν (s+1)
2 b1 σν2 (s+1) b1 σν2 (s+1) b1
atualizando β2 :
!−1 !−1
m
!
(s+1) (s+1) Pm 2
Pm 2
(s+1)
X x2i (µi − β −β 0x1i ) 1 a2 i=1 x2i 1 i=1 x2i 1
β2 |· ∼ N + + , +
i=1 σν2 (s+1) b2 σν2 (s+1) b2 σν2 (s+1) b2
atualizando µi :
! !−1 !−1
(s+1) θ̂i X0 β ni 1 ni 1
µi |· ∼N (s)
+ + , + ,
σi2 /ni σν2 (s+1) σi2
(s)
σν2 (s+1) σi2
(s)
σν2 (s+1)
amostrando σi2 :
" #
(s+1) 2 2
(s+1) n i (θ̂i − µ i ) (ni − 1)s i
σi2 |· ∼ GI a(s) + , b(s) + + .
2 2/ni 2
106
a verossimilhança
ni
m Y
Y
L(Θ; y) = f (yij |µij , wij )f (wij )
i=1 j=1
m Y ni √
(yij − (µij + φi δwij ))2
Y 1
= p exp
i=1 j=1 2πφi (1 − δ 2 ) 2φi (1 − δ 2 )
r 2
wij
2
× exp − ;
π 2
prioris:
π(Θ|y) ∝ L(Θ|y)π(Θ)
.
107
Condicionais Completas
Encontrou-se as seguintes condicionais completas para os parâmetros do
modelo desagregado:
Pm m X ni 2
n i
X (µ ij − β 0 − β x
1 1ij − β x
2 2ij )
σν2 |· ∼ GI c + i=1 , d + ,
2 i=1 j=1
2
m X ni Pm −1 Pm −1
X µ ij − β x
1 1ij − β x
2 2ij a 0 i=1 in 1 i=1 in 1
β0 |· ∼ N 2
+ 2
+ , +
i=1 j=1
σ ν b 0 σ ν b 0 σν2 b0
P !−1 !−1
m X ni m Pni 2
Pm Pni 2
X x 1ij (µ ij − β 0 − β x
2 2ij ) a 1 i=1 x
j=1 1ij 1 i=1 x
j=1 1ij 1
β1 |· ∼ N 2
+ 2
+ , 2
+
i=1 j=1
σ ν b 1 σ ν b1 σ ν b1
P !−1 !−1
m X ni m Pni 2
Pm Pni 2
X x 2ij (µ ij − β 0 − β x
1 1ij ) a 2 i=1 x
j=1 2ij 1 i=1 x
j=1 2ij 1
β2 |· ∼ N 2
+ 2
+ , 2
+
i=1 j=1
σ ν b 2 σ ν b2 σ ν b2
" √ −1 −1 #
(yij − φi wij δ) x0ij β
1 1 1 1
µij |· ∼ N + 2 + , +
φi (1 − δ 2 ) σν φi (1 − δ 2 ) σν2 φi (1 − δ 2 ) σν2
" −1 −1 #
δ2 δ2
δ(yij − µij )
wij |· ∼ N √ 1+ , 1+ .
φi (1 − δ 2 ) (1 − δ 2 ) (1 − δ 2 )
estimar φi , a, b e λ.
Algoritmo
Num passo (s) da iteração, a atualização dos parâmetros no passo (s + 1) é
dado por:
amostrando σν2 :
" Pm m X ni (s) (s) (s) (s)
#
2
(s+1) n
i=1 i
X (µ ij − β0 − β1 x 1ij − β2 x 2ij )
σν2 |· ∼ GI c + ,d + ,
2 i=1 j=1
2
atualizando β0 :
!−1 !−1
ni (s)
m X µij − β1 (s) x1ij − β2 (s) x2ij
Pm Pm
a0 i=1 ni 1 i=1 ni 1
X
(s+1)
β0 |· ∼ N + + , +
i=1 j=1 σν2 (s+1) b0 σν2 (s+1) b0 σν2 (s+1) b0
108
atualizando β1 :
!−1 !−1
ni
m X (s) (s+1) (s) P m P ni Pm Pni
(s+1)
X x1ij (µij − β0 − β2 x2ij ) a1 i=1 j=1 x21ij 1 i=1 j=1 x21ij 1
β1 |· ∼ N + + , + ,
i=1 j=1 σν2 (s+1) b1 σν2 (s+1) b1 σν2 (s+1) b1
atualizando β2 :
P m P ni !−1 P m P ni !−1
ni
m X (s+1) (s+1)
(s+1)
X x2ij (µij − β0 − β1 x1ij ) a2 i=1 j=1 x22ij 1 i=1 j=1 x22ij 1
β2 |· ∼ N + + , + ,
i=1 j=1 σν2 (s+1) b2 σν2 (s+1) b2 σν2 (s+1) b2
atualizando µij :
√ (s) (s)
!−1 !−1
(s+1) (yij − φi wij δ (s) ) X0 β 1 1 1 1
µij |· ∼ N + + , + ,
φi (s) (1 − δ 2 (s) ) σν2 (s+1) φi (s) (1 − δ 2 (s) ) σν2 (s+1) φi (s) (1 − δ 2 (s) ) σν2 (s+1)
atualizando wij :
!−1 !−1
(s+1) ! (s) (s)
(s+1) δ (s) (y ij − µij ) δ2 δ2
wij |· ∼ N √ (s)
1+ , 1+ .
φi (1 −δ 2 (s) ) (1 − δ 2 (s) ) (1 − δ 2 (s) )
λ∗ | λ(s) ∼ N (λ(s) , Vλ ),
π(Θ∗ |y)
αλ = min 1, ,
π(Θ̃|y)
(s+1) (s+1) (s+1) (s+1) (s+1)
Θ∗ = (σν2 , β0 , β1 , β2 , wij , λ∗ , µ(s+1) , φ(s) ) e
(s+1) (s+1) (s+1) (s+1) (s+1)
Θ̃ = (σν2 , β0 , β1 , β2 , wij , λ(s) , µ(s+1) , φ(s) ).
a verossimilhança
ni
m Y
Y
L(Θ; y) = f (yij |µij , wij )f (wij )
i=1 j=1
m Y ni √
(yij − (µij + φi δi wij ))2
Y 1
= exp
2φi (1 − δi2 )
p
2
i=1 j=1 2πφi (1 − δi )
r 2
wij
2
× exp − ;
π 2
prioris:
π(Θ|y) ∝ L(Θ|y)π(Θ)
.
110
Condicionais Completas
Encontrou-se as seguintes condicionais completas para os parâmetros do
modelo desagregado:
Pm m X ni 2
ni X (µij − β0 − β1 x1ij − β2 x2ij )
σν2 |· ∼ GI c + i=1 , d + ,
2 i=1 j=1
2
" m
#
m X (λi − λ)2
σλ2 |· ∼ GI c + , d + ,
2 i=1
2
m X ni Pm −1 Pm −1
X µ ij − β 1 x 1ij − β 2 x 2ij a 0 i=1 n i 1 i=1 n i 1
β0 |· ∼ N 2
+ 2
+ , 2
+
i=1 j=1
σ ν b0 σ ν b 0 σ ν b 0
P !−1 !−1
m X ni m Pni Pm Pni 2
X x 1ij (µ ij − β 0 − β 2 x 2ij ) a 1 i=1 j=1 x21ij 1 i=1 j=1 x1ij 1
β1 |· ∼ N 2
+ 2
+ , 2
+
i=1 j=1
σ ν b 1 σ ν b1 σ ν b1
P !−1 !−1
m X ni m Pni Pm Pni 2
X x 2ij (µ ij − β 0 − β 1 x 1ij ) a 2 i=1 j=1 x22ij 1 i=1 j=1 x2ij 1
β2 |· ∼ N 2
+ 2
+ , 2
+
i=1 j=1
σ ν b 2 σ ν b2 σ ν b2
" √ −1 −1 #
(yij − φi wij δi ) x0ij β
1 1 1 1
µij |· ∼ N + 2 + , +
φi (1 − δi2 ) σν φi (1 − δi2 ) σν2 φi (1 − δi2 ) σν2
" −1 −1 #
δi2 δi2
δi (yij − µij )
wij |· ∼ N √ 1+ , 1+ .
φi (1 − δi2 ) (1 − δi2 ) (1 − δi2 )
para estimar φi , a, b, λ e λi .
Algoritmo
Num passo (s) da iteração, a atualização dos parâmetros no passo (s + 1) é
dado por:
amostrando σν2 :
" Pm m X ni (s) (s) (s) (s)
#
2
(s+1) i=1 ni
X (µ ij − β0 − β1 x 1ij − β2 x 2ij )
σν2 |· ∼ GI c + ,d + ,
2 i=1 j=1
2
111
atualizando σλ2 :
"
m
#
(s)
(s+1) m X (λi − λ(s) )2
σλ2 |· ∼ GI c + , d + ,
2 i=1
2
atualizando β0 :
!−1 !−1
ni (s)
m X µij − β1 (s) x1ij − β2 (s) x2ij
Pm Pm
a0 i=1 ni 1 i=1 ni 1
X
(s+1)
β0 |· ∼ N + + , +
i=1 j=1 σν2 (s+1) b0 σν2 (s+1) b0 σν2 (s+1) b0
atualizando β1 :
!−1 !−1
ni
m X (s) (s+1) (s) P m P ni Pm Pni
(s+1)
X x1ij (µij − β0 − β2 x2ij ) a1 i=1 j=1 x21ij 1 i=1 j=1 x21ij 1
β1 |· ∼ N + + , + ,
i=1 j=1 σν2 (s+1) b1 σν2 (s+1) b1 σν2 (s+1) b1
atualizando β2 :
P m P ni !−1 P m P ni !−1
ni
m X (s+1) (s+1)
(s+1)
X x2ij (µij − β0 − β1 x1ij ) a2 i=1 j=1 x22ij 1 i=1 j=1 x22ij 1
β2 |· ∼ N + + , + ,
i=1 j=1 σν2 (s+1) b2 σν2 (s+1) b2 σν2 (s+1) b2
atualizando µij :
√ (s) (s) (s)
!−1 !−1
(s+1) (yij − φi wij δi ) X0 β 1 1 1 1
µij |· ∼ N (s)
+ + , + ,
φi (s) (1 − δi2 ) σν2 (s+1) φi (s) (1 − δi2
(s)
) σν2 (s+1) φi (s) (1 − δi2
(s)
) σν2 (s+1)
atualizando wij :
!−1 !−1
(s) (s+1) ! (s) (s)
(s+1) δi (yij − µij ) δi2 δi2
wij |· ∼ N √ (s) (s)
1+ (s)
, 1+ (s)
.
φi (1 − δi2 ) (1 − δi2 ) (1 − δi2 )
λ∗ | λ(s) ∼ N (λ(s) , Vλ ),
π(Θ∗ |y)
αλ = min 1, ,
π(Θ̃|y)
(s+1) (s+1) (s+1) (s+1) (s+1) (s+1)
Θ∗ = (σν2 , σλ2 , β0 , β1 , β2 , wij , λ∗ , µ(s+1) , λ(s) , φ(s) )
(s+1) (s+1) (s+1) (s+1) (s+1) (s+1)
Θ̃ = (σν2 , σλ2 , β0 , β1 , β2 , wij , λ(s) , µ(s+1) , λ(s) , φ(s) ).
112
(s+1) (s+1)
λ∗i | λ(s+1) , σλ2 ∼ N (λ(s+1) , σλ2 ),
(s+1)
assim, λi = λ∗i com probabilidade αλ onde,
π(Θ∗ |y)
αλi = min 1, ,
π(Θ̃|y)
(s+1) (s+1)
, λ(s+1) , µ(s+1) , (λi )k<i , (λi )∗ , (λi )k>i , φ(s) )
(s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ∗ = (σν2 , σλ2 , β0 , β1 , β2 , wij
(s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ̃ = (σν2 , σλ2 , β0 , β1 , β2 , wij , λ(s+1) , µ(s+1) , (λi )k<i , (λi )k≥i , , φ(s) ).
Ga[φi (s) /Vφi , φi (s) /Vφi ]. Assim, E(φi ∗ |φi (s) ) = φi (s) e V ar(φi ∗ |φi (s) ) = Vφi .
Os φi (s+1) recebe φi ∗ com probabilidade α φi , onde
( )
π(Θ∗ |y) fG (φi (s) |φi ∗ )
αφi = min 1, · ,
π(Θ̃|y) fG (φi ∗ |φi (s) )
(s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ∗ = (σν2 , β0 , β1 , β2 , wij , λ(s+1) , (σλ2 ) , λ(s+1) , (φi )k<i , φi ∗, (φi )k>i , µ(s+
(s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s+1) (s)
Θ̃ = (σν2 , β0 , β1 , β2 , wij , λ(s+1) , (σλ2 ) , λ(s+1) , (φi )k<i , (φi )k≥i , µ(s+1) ).
113
δi = √ λi 2 .
1+λi
m
Y
π(Θ) = π(λ, λ, σλ2 )π(σν2 ) π(φ, a, b)π(µ, β)
i=1
m
Y T
Y
= π(λ)π(σν2 )π(σλ2 )π(a)π(b)π(β) [π(φi |a, b)π(λi ) π(µit |β)].
i=1 t+1
Para os parâmetros (φi |a, b) e σν2 foram escolhidas distribuições a priori Gama
λi ∼ N (λ, σλ2 )
λ ∼ t(0, 1/2; 2), e
m Y
Y T
L(Θ; y) = f (yit |µit , wit )f (wit )
i=1 t=1
m Y T √
(yit − (µit + φi δi wit ))2
Y 1
= exp
2φi (1 − δi2 )
q
i=1 t=1 2πφi (1 − δi2 )
r
2
2 wit
× exp − ;
π 2
e a Posteriori
π(Θ|y) ∝ L(Θ|y)π(Θ).
Encontrou-se as seguintes condicionais completas para os parâmetros do
modelo dinâmico de área proposto:
m X T
" #
mT X (µit − β0 − β1 x1it − β2 x2it )2
σν2 |· ∼ GI c + ,d + ,
2 i=1 t=1
2
m
" #
2 m X (αi − λ)2
σα |· ∼ GI c + , d + ,
2 i=1
2
" m T ! #
1 −1 1 −1
X X µit − β1 x1it − β2 x2it
a0 mT
β0 |· ∼ N + + , +
i=1 t=1
σν2 b0 σν2 b0 σνm T 2 b0
!−1
m X T
! Pm PT 2
! −1 Pm PT 2
X x1it (µit − β0 − β2 x2it ) a1 i=1 t=1 x1it 1 i=1 t=1 x1it 1
β1 |· ∼ N + + , +
i=1 t=1
σν2 b1 σν2 b1 σν2 b1
!−1 !−1
m X T
! P
m PT 2
Pm PT 2
X x2it (µit − β0 − β1 x1it ) a2 i=1 t=1 x2it 1 i=1 t=1 x2it 1
β2 |· ∼ N + + , +
i=1 t=1
σν2 b2 σν2 b2 σν2 b2
" √ #
x0it β 1 −1 1 −1
nit (ȳit − phii wit δi /) 1 1
µit |· ∼ N + + , +
φi (1 − δi2 ) σν2 φi (1 − δi2 ) σν2 φi (1 − δi2 ) σν2
" ! −1 −1 #
δi (ȳit − µit ) δi2 δi2
wit |· ∼ N √ 2
1+ 2
, 1+ 2
.
φi (1 − δi ) (1 − δi ) (1 − δi )
capítulo anterior.