Você está na página 1de 3

Lista 4 - MLG

Eduardo Freitas, Giulia Carlotto e Tainà ¡ Cabalheiro

25 de junho de 2019

Questão 3
Banco de Dados
Os dados sã o decorrentes de um estudo de seguimento em que doutores Britâ nicos
foram acompanhados durante a década de 50 e observado, em particular, a ocorrência
de mortes por câ ncer de pulmã o segundo o consumo médio diá rio de cigarros e a faixa
etá ria. Sobre as variá veis:
• O nú mero de casos de câ ncer;
• Total de pessoas-anos;
• Nú mero de cigarros por dia (1:nã o fumante, 2:1-9 cigarros, 3:10-30 cigarros, 4:+
30 cigarros);
• Faixa-etá ria (1:40-49 anos, 2:50-59 anos, 3:60-69 anos, 4:70-80 anos).

Análise descritiva
a) Aqui apresentaremos algumas medidas descritivas e tabelas de frequência:

Consumo Freq.
0 4

1-9 4

10-30 4

+30 4

Faixa.Etaria Freq.
40-49 4

50-59 4

60-69 4

70-80 4

Numero de mortes Pessoas anos


Media 12.562 11204.47
Mediana 3 5941.75
Desv Pad 15.895 11224.81
Var 252.662 125996258
Coef de var 1.265 1.002

b) Faça grá ficos para ver se há sobredispersã o nos dados.

Ajuste de um modelo linear generalizado


c)
## Waiting for profiling to be done...

Estimador Erro padrã o 2.5% 97.5% valor-p


(Intercept) -20.010047 6.2682887 - -8.063814 0.0014116
32.7973856
log(panos) 1.838814 0.6097733 0.6754111 3.081357 0.0025650
consumo1-9 2.386127 0.8846605 0.6370688 4.129947 0.0069920
consumo10-30 2.754778 0.4254359 2.0060080 3.703087 0.0000000
consumo+30 4.891404 0.9259268 3.1250880 6.772848 0.0000001
fetaria50-59 1.928926 0.3679055 1.2497326 2.705325 0.0000002
fetaria60-69 3.593260 0.6109600 2.4389898 4.846437 0.0000000
fetaria70-80 5.435500 1.2421954 3.0606741 7.960861 0.0000121

d) Ajuste um MLG com distribuiçã o Binomial Negativa.


## Waiting for profiling to be done...

Estimador Erro padrã o 2.5% 97.5% valor-p


(Intercept) -20.009269 6.2686827 -32.79717 -8.06253 0.0014132
log(panos) 1.838738 0.6098118 0.6752821 3.081327 0.0025676
consumo1-9 2.386049 0.8846998 0.6368848 4.129962 0.0069964
consumo10- 2.754788 0.4254448 2.0059908 3.703183 0.0000000
30
consumo+30 4.891290 0.9259831 3.1249153 6.772783 0.0000001
fetaria50-59 1.928919 0.3679205 1.2497373 2.705398 0.0000002
fetaria60-69 3.593202 0.6109927 2.4389361 4.846476 0.0000000
fetaria70-80 5.435340 1.2422759 3.0603984 7.960768 0.0000121
e) Ajuste u m MLG com se- ança.
qua verossimilh
##
## Call:
## glm(formula = nmortes ~ log(panos) + consumo + fetaria, family =
quasi(link = "log",
## variance = "mu"), data = dadosc)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.9343 -0.6322 0.1007 0.3723 1.3139
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -20.0100 6.3576 -3.147 0.013651 *
## log(panos) 1.8388 0.6185 2.973 0.017783 *
## consumo1-9 2.3861 0.8973 2.659 0.028834 *
## consumo10-30 2.7548 0.4315 6.384 0.000213 ***
## consumo+30 4.8914 0.9391 5.209 0.000814 ***
## fetaria50-59 1.9289 0.3731 5.169 0.000854 ***
## fetaria60-69 3.5933 0.6197 5.799 0.000406 ***
## fetaria70-80 5.4355 1.2599 4.314 0.002566 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for quasi family taken to be 1.028685)
##
## Null deviance: 284.7588 on 15 degrees of freedom
## Residual deviance: 9.9375 on 8 degrees of freedom
## AIC: NA
##
## Number of Fisher Scoring iterations: 5

f) Avalie os modelos apresentados acima.


## [1] 2.090562

## [1] 2.090562

## [1] 0.06947919

g) Avalie se existe sobredispersã o. Caso tenha sobredispersã o, qual modelo você


indicaria.

Você também pode gostar