Escolar Documentos
Profissional Documentos
Cultura Documentos
●
150
número de bactérias sobreviventes
●
100
●
50
● ●
●
●
● ●
●
2 4 6 8 10 12
tempo de exposição
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Caracterı́sticas dos dados
ind.
Yi ∼ Poisson(µi )
ln (µi ) = β0 + β1 xi , i = 1, 2, ..., 12
xi : tempo de exposição i.
ind.
Yi ∼ Poisson(µi )
Lembrando que µi = e β0 +β1 (xi −x) , assim se µi+1 = e β0 +β1 (xi −x+1)
então µi+1 = µi e β1 .
ind.
Yi ∼ Poisson(µi )
p
X Pp
βj xji
ln(µi ) = βj xji → µi = e j=1 , i = 1, 2, ..., n, j = 1, 2, ..., p
j=1
Pn Qn n
e− i=1 µi
µyi i Pn Y
L(β) = Qn i=1
∝ e− i=1 µi
µyi i
i=1 yi ! i=1
Logverossimilhança.
n
X n
X
l(β) = − µi + yi ln(µi )
i=1 i=1
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Inferência para o modelo
Como µi = e ηi , temos que a vogverossimilhança, traduz-se em
n
X n
X n
X
l(β) = − e ηi + yi ηi = (yi ηi − e ηi ) (1)
i=1 i=1 i=1
Vetor escore
n Xn
∂ X ∂ηi ∂ηi ∂ηi
S(β) = l(β) = yi − e ηi = (yi − e ηi )
∂β ∂β ∂β ∂β
i=1 i=1
n
X
= (yi − e ηi ) Xi = X0 (y − µ)
i=1
∂ηi
pois = Xi e y = (y1 , ..., yn )0 e µ = (p1 , ..., pn )0 (exercı́cio).
∂β
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Inferência para o modelo
∂ηi Pn
Além disso, S(β) = , em que gi (β) = yi − e ηi .
i=1 gi (β)
∂β
Assim, E(gi (β)) = E(Yi − e ηi ) = 0 e ∂g∂β
i (β)
= −e ηi ∂η
∂β .
i
n
l(β) X ∂ηi ∂ηi ∂hi (β)
H(β) = = gi (β) +
∂β∂β 0 i=1
∂β∂β 0 ∂β ∂β 0
n
X
I(β) = −E(H(β)) = e ηi Xi X0i = X0 VX.
i=1
η1 ηn
em que V = diag(e , ..., e ).
V(Yi ) = µi .
Desvio:
k
X
D(y, µ
b) = 2 µi ) − (yi − µ
[yi ln(yi /b bi )] I{1,2,...} (yi ) + 2b
µi 11{0} (yi ) .
i=1
z = η + V−1 (y − µ).
●
Resíduo Componente do Desvio
●
1
●
0
●
●
●
●
●
●
−1
−2
●
−3
Percentil da N(0,1)
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Gráfico da variável Z vs preditor linear
●
5.0
●
4.5
●
4.0
Variavel z
● ●
3.5
●
●
3.0
●
●
2.5
Preditor Linear
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Médias observadas e preditas pelo modelo
●
150
número de bactérias sobreviventes
● ● observado
100
●
●
● predito
●
●
●
●
50
●
● ●
●
●
●
●
●
●
● ●
●
●
2 4 6 8 10 12
tempo de exposição
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Comentários
ind.
Yij ∼ Poisson(µi ), i = 1, 2, j = 1, ...., 43
ln µi = µ + αi , α1 = 0
●
40
30
20
10
1961 1962
10 20 30 40 50
número de acidentes (1961)
percentual
20
10
0
10 20 30 40
número de acidentes (1962)
●
4
●
Residuo Componente do Desvio
●
● ●
● ● ●
●
2
● ● ●
● ● ● ● ● ●
● ●
● ●
● ● ●
● ●
● ●
● ●
●
● ●
0
●
● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ●
● ● ●
● ●
−2
● ●
●
● ● ● ● ● ● ●
●
●
−4
0 20 40 60 80
Indice
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Gráfico de envelopes para os RCD’s
Gráfico de quantil−quantil normal
●
4
●
● ●
Resíduo Componente do Desvio
● ● ●
●
2
●
●●●
●●● ● ● ● ●
●●
●● ●
●●
●●
●
●●
●●
0
●
●●●●●●●●●
●●●●●●●●
●●●●●
●●●●●●●
● ● ●●
●●●
●
●
−2
●●
●
● ● ● ● ● ● ●
●
●
−4
−2 −1 0 1 2
Percentil da N(0,1)
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Distribuições observadas e preditas pelo modelo
40
percentual
observado
20
predito
0
10 20 30 40 50
número de acidentes (1961)
percentual
40
observado
20
predito
0
10 20 30 40
número de acidentes (1962)
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Comentários
A análise de diagnóstico indicou que o modelo não se ajustou bem
aos dados, portanto ele não pode ser utilizado para analisá-los.
30
30
● ● ●
● ● ● ● ● ●
● ● ● ● ● ●● ● ● ● ●
25
25
25
número de clientes
número de clientes
número de cliente
● ● ●
● ● ●
● ● ● ● ● ● ● ● ●
20
20
20
● ● ●
● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ● ●
15
15
15
● ●● ● ● ● ●● ● ● ● ● ● ● ●●
● ● ● ● ●● ● ● ● ● ● ●
● ● ●● ● ●● ● ● ● ● ● ● ● ●
● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ●●● ●
●●
● ● ● ● ●● ●● ● ● ● ● ●● ● ●
10
10
10
● ● ●● ● ●● ●● ● ●●● ● ● ● ● ● ● ●
● ●●
● ●● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ●● ●●● ● ● ●●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ●● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ●● ●●● ●● ●●●● ● ● ●● ● ● ●● ● ●●
● ● ● ●● ● ● ● ●
5
5
● ● ● ● ●● ● ● ● ● ● ●
● ●● ● ● ● ● ● ● ● ● ● ●● ●
● ● ●
● ● ● ●● ● ● ● ●
0
0
0 200 400 600 800 1000 1200 20000 40000 60000 80000 100000 120000 0 10 20 30 40 50 60
número de domicílios renda idade
● ●
30
30
● ●
● ● ● ●
● ● ● ● ● ●●
25
25
número de clientes
número de clientes
● ●
● ●
● ● ● ● ● ●
20
20
● ●
● ●
● ● ● ●
● ● ● ● ●●
15
15
● ● ● ● ● ● ●● ● ● ● ●
● ● ● ● ● ● ● ●
●● ●● ● ● ●● ● ●
● ● ●● ● ● ● ● ●● ● ● ● ●●
● ● ●● ● ● ● ● ●● ●● ● ●
10
10
● ● ● ● ● ● ● ● ● ● ●● ● ●
● ● ●● ●●● ● ● ● ● ● ●● ● ● ●● ● ●●
●● ●● ●● ● ● ● ● ● ● ●● ● ● ● ●● ●
● ● ● ● ● ●
● ●
●● ● ● ●● ● ● ●● ● ●● ● ● ●● ● ● ●
● ●● ● ● ●
5
● ● ● ● ● ● ● ●
● ●●● ● ● ●●● ●
● ●
●● ● ●● ●
0
1 2 3 4 5 6 2 4 6 8 10
distância ao concorrente mais próximo distância à loja
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Modelo (completo)
ind.
Yi ∼ Poisson(µi )
2
● ● ● ● ● ● ● ●
● ●● ● ● ●
● ●
● ● ● ●
● ● ● ●● ● ● ● ●
●●●● ●● ●●●●●
● ● ● ● ● ●● ● ● ●●●●●●
●●
● ●
●
● ● ●● ● ● ● ● ● ●
●
●●● ● ● ● ● ●● ●
●
●● ● ●
● ●
● ● ● ●
● ● ● ● ●● ● ● ● ●● ● ● ●
●●●●
0
0
● ● ● ● ● ●● ● ●
●● ● ● ●● ● ● ● ●● ● ● ● ●● ● ●
● ● ●● ● ● ● ● ●● ●● ● ●
●● ● ● ● ● ● ● ●● ● ●● ●
● ● ●
●● ● ● ● ● ● ● ●
● ●
●
● ● ● ●● ● ● ● ● ●
●● ● ● ● ● ● ●
−2
−2
● ●
● ●
● ●
● ● ● ●●
●
−4
−4
0 20 40 60 80 100 5 10 15 20 25 30 35
●
● ●
● ●● ● ●
●
Componente do Desvio
● ●
● ●
● ● ●● ●
●
2
● ● ● ●
●●●●●●
● ●● ● ●
● ● ● ●● ● ●
2.5
●● ● ●●
● ● ● ● ●●●●● ●● ● ● ●●
Variavel z
● ● ● ●●●●●●●●
● ●
● ●● ●● ●
●● ● ● ● ●●●●●●●●●
●●● ● ●●●●●●●●●●
● ● ● ● ●●●● ● ● ●●●●●●●●
●●●●●●●●
0
● ● ●
●
●
●●●●
●●●
●●●●●●
●●
● ● ● ● ● ●● ●●
●●●●●●
● ● ●●●●●●●●
● ● ●●●●●
1.5
● ● ● ●●
● ● ●●●●●●
●● ● ●●●
−2
● ●
●
●
●
● ● ●
0.5
●● ●
−4
1.25
1.001
0.999992
●
1.20
1.000
●
0.999
1.15
0.999990
número de esperado de clientes
1.10
0.997
1.05
0.999988
●
●
0.996
1.00
0.995
0.95
0.999986
0.994
0.90
●
0.993
0.999984
0.85
núm. de domic. idade renda dist. ao conc. dist. à loja
covariável covariável covariável
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Distribuição observada e predita
50
40
percentual
observado
30
predito
20
10
0
0 10 20 30 40
número de clientes
Prof. Caio Azevedo
Modelos de regressão para dados discretos (parte 2): dados de contagens
Comentários