Escolar Documentos
Profissional Documentos
Cultura Documentos
Enrico A. Colosimo/UFMG
http://www.est.ufmg.br/~enricoc/
Departamento de Estatística
Universidade Federal de Minas Gerais
1/56
Revisão: Modelos Lineares Generalizados
2/56
Modelos Lineares Generalizados (MLG)
Distribuição de Yi .
Função de Ligação.
3/56
Modelos Lineares Generalizados (MLG)
Gráfico: envelope.
4/56
Modelo de Poisson: Resposta Contagem
Exemplos
- Número de chamadas telefônicas por dia em um call center;
- Número de acidentes em uma estrada por mês;
- Número de surtos epiléticos por paciente em dois anos;
- Número de partos cesariais por hospital/ano;
- Número de clientes chegando ao caixa de um supermercado por
hora;
- Número de gols por time na primeira rodada do campeonato
brasileiro;
- Número de ovos de um parasita por mm3 de fezes;
- etc, etc.
5/56
Resposta: Contagem
→ Suposição de Normalidade!
→ Suposição de Homocedasticidade!
2 Soluções
6/56
A distribuição de Poisson
e−λ λy
P(Y = y ) = y = 0, 1, · · ·
y!
E(Y ) = Var (Y ) = λ
7/56
Propriedades da distribuição de Poisson
np → λ e p→0
Y → Poisson (λ)
Exemplos:
8/56
Propriedades da distribuição de Poisson
9/56
Propriedades da distribuição de Poisson
10/56
Propriedades da distribuição de Poisson
11/56
Propriedades da distribuição de Poisson
12/56
Propriedades da distribuição de Poisson
13/56
EMV e Propriedades Assintóticas/Exatas
3 EMV:
b = ȳ
λ
e
b =λ
Var (λ)
n
14/56
Regressão de Poisson
Tipo de Estudo:
15/56
Regressão de Poisson
Estudo Longitudinal
Taxa de incidência
16/56
Regressão de Poisson Taxa de Incidência
17/56
Regressão de Poisson Taxa de Incidência
90
TI O = = 0, 0365/semana
2465
131
TI A = = 0, 0332/semana
3946
0, 0365
RTI = = 1, 099
0, 0332
18/56
Regressão de Poisson Taxa de Incidência
Taxa de Incidência
19/56
Regressão de Poisson Taxa de Incidência
Exemplo:
Inclusão de covariáveis
E(Yi ) = λ(xi ) i = 1, · · · , n e λi ≥ 0
Ou seja:
log(contagem ou taxa) = x 0 β
x1 = 0 → log(taxa) = β2 x2 + · · · + βp xp
x1 = 1 → log(taxa) = β1 + β2 x2 + · · · + βp xp
23/56
Regressão de Poisson Interpretação dos parâmetros
Então:
taxa1
log RT = log = β1
taxa0
RT = exp(β1 ) = 2
Inferência para β
25/56
Regressão de Poisson Adequação do Modelo
Adequação do Modelo
H0 : o modelo é adequado.
1 Estatística Qui-quadrado
2
N
X (yi − ŷi )2
X2 =
ŷi
i=1
26/56
Regressão de Poisson Adequação do Modelo
H0 : o modelo é adequado.
27/56
Regressão de Poisson Adequação do Modelo
Adequação do Modelo
Gráfico de Envelope
28/56
Regressão de Poisson Adequação do Modelo
Gráfico de envelope
Passos para a construção
Resíduos deviance;
usualmente, m = 19 sugerido por Atkison (1981);
quantis teóricos da distribuição normal x resíduos do modelo inicial;
a mediana e os percentis dos resíduos simulados formam o envelope
29/56
Regressão de Poisson Exemplos
Exemplo 1
Câncer de pele não melanoma em duas cidades em 1994
Tabela: Dados
Minneapolis Dallas
Idade Casos Pop. Casos Pop.
15-24 1 172675 4 181343
25-34 16 123065 38 146207
35-44 30 96216 119 121374
45-54 71 92051 221 111353
55-64 102 72159 259 83004
65-74 130 54722 310 55932
75-84 133 32185 226 29007
85+ 40 8328 65 7538
30/56
Regressão de Poisson Exemplos
−4
● ●
●
●
●
●
−6
●
●
●
●
log(contagem/pop)
●
−8
●
●
●
−10
●
−12
20 30 40 50 60 70 80 90
idade
31/56
Regressão de Poisson Exemplos
Exemplo 1
Câncer de pele em duas cidades em 1994
Este modelo não é adequado pois a idade não tem um comportamento linear
na escala de log(taxa).
32/56
Regressão de Poisson Exemplos
Exemplo 1
Envelope - Modelo Inadequado
8
6
●
Residuals
●
4
● ●
2
●
●
●
●
●
●
●
●
0
Theoretical quantiles
33/56
Regressão de Poisson Exemplos
Exemplo 1
Câncer de pele em duas cidades em 1994
34/56
Regressão de Poisson Exemplos
Exemplo 1
Envelope - Modelo Adequado
2.0
1.5
●
Residuals
1.0
● ●
●
●
●
0.5
●
●
●
●
●
●
●
0.0
Theoretical quantiles
35/56
Superdispersão
Superdispersão
36/56
Superdispersão
Superdispersão
Possíveis Causas
3 Excesso de zeros:
- Comumente existem situações com excesso de contagens zero;
- Lambert (1992).
37/56
Superdispersão
Superdispersão
Solução
Possível Solução
38/56
Superdispersão
E(Yi |xi , τi ) = µi τi
Ou seja:
τi = ei
39/56
Superdispersão
f (τi ) ∼ gama(α, α)
Então
40/56
Superdispersão Exemplo 2
Exemplo 2
Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)
41/56
Superdispersão Exemplo 2
Taxa de Cesarianas
−1
●
−2
●
log(Taxa)
−3
●
●
● ●
●
−4
●
● ● ● ● ●
● ●
●
● ●
−5
0 5 10 15 20
Hosp: Pub. (vermelho) e
Priv. (preto)
42/56
Superdispersão Exemplo 2
Exemplo 2
Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)
43/56
Superdispersão Exemplo 2
Exemplo 2
Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)
estimativa
intercepto -3,29
hospital(1) -1,03
bi ) = log(Partosi ) + 3, 29 − 1, 03 × Hospital
log(λ
44/56
Superdispersão Exemplo 2
●
3
●
●
● ●
Residuals
●
2
● ●
●
●
1
●
●
● ●
●
●
0
Theoretical quantiles
45/56
Superdispersão Exemplo 2
Exemplo 2
Partos cesarianos por ano em 20 hospitais (4 privados e 16 públicos)
estimativa
intercepto -3,12
hospital(1) -0,99
46/56
Superdispersão Exemplo 2
2.5
●
2.0
● ●
1.5
Residuals
●
●
●
●
● ●
1.0
● ●
●
0.5
●
●
● ●
●
0.0
Theoretical quantiles
47/56
Superdispersão Exemplo 2
1 Entender o Estudo.
48/56
Superdispersão Exemplo 2
10 Escrever o Relatório.
49/56
Exemplos Exemplo 3
50/56
Exemplos Exemplo 3
Exemplo 3
Miller Lumber Company Example (Kutner et. al., 2004)
51/56
Exemplos Exemplo 3
Exemplo 3
Miller Lumber Company Example (Kutner et. al., 2004)
● ●
● ●
● ● ● ●
● ● ●● ● ● ● ●
●
● ●
●
● ● ● ●
● ● ● ● ● ●
● ● ●
3 3
● ● ●
● ●
●
● ● ● ● ● ● ●
3 ● ● ● ● ● ●
●
● ● ● ● ● ● ● ● ● ● ●
●
● ● ●● ● ● ● ● ● ●
● ● ● ●● ● ● ● ● ● ● ● ●
● ●● ● ●
●
● ● ● ●
● ●● ● ● ● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ●
log(nº clientes)
●●
● ● ● ● ● ● ● ● ● ● ● ●
log(nº clientes)
log(nº clientes)
● ●
● ● ● ● ●
● ● ●
● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ●
●●● ●● ●
● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ●
2 2
● ● ● ● ●● ●●● ● ● ● ● ● ● ● ● ● ●
2
● ● ● ●
● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ●
● ● ●
● ● ● ● ● ● ● ●
● ● ● ●
● ● ● ● ● ● ● ● ● ●
● ●● ● ●
1 1 1
● ● ●
● ● ● ●● ● ● ● ●
0 500 1000 25000 50000 75000 100000 125000 0 20 40 60
Nº casas na região Média salarial Média idade
●
●
●
● ● ●
● ●
●
● ● ●
● ● ● ●
●
●
●
● ● ● ●
3 ● ● ●
● 3
● ●
●
● ●
● ●
● ● ●
● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ●
● ● ● ●
● ● ● ● ●
● ● ● ● ●
● ● ● ● ● ● ● ●
log(nº clientes)
●● ● ● ●
● ●●
log(nº clientes)
● ● ●● ● ● ●
● ●● ● ● ● ●
● ● ● ● ● ● ●
● ● ● ● ● ● ●
● ● ●● ●
●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●
● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
2 2
● ● ● ● ● ●
● ●
●● ● ● ●● ● ●
● ● ● ● ● ● ● ●
● ●● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ● ● ●
● ●● ● ● ● ●● ● ●
1 1
● ●
● ● ● ●● ●
52/56
Exemplos Exemplo 3
Exemplo 3
Miller Lumber Company Example (Kutner et. al., 2004)
53/56
Exemplos Exemplo 3
Exemplo 3
Miller Lumber Company Example (Kutner et. al., 2004)
3
●
● ●
●
●
Residuals
●
2
●
●● ●●
●●●●●
●
●
●●●
●
●
●●●●●
●
●
●●●●●
1
●
●●
●●●
●●●
●●●●●
●●
●
●●
●●●
●
●
●●
●
●
●●
●
●
●
●
●●
●
●●
●●
●●
●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●●
●
●●
●
●
●●
●●
0
Theoretical quantiles
54/56
Exemplos Exemplo 3
Exemplo 3
Miller Lumber Company Example (Kutner et. al., 2004)
Pacote hnp
Half-Normal Plots with Simulation Envelopes
56/56