Você está na página 1de 14

Modelos MLG e MAG para anlise

da associao entre poluio


atmosfrica e marcadores de
morbi-mortalidade: uma
introduo baseada em dados da
cidade de So Paulo
GLM and GAM model for analyzing
the association between
atmospheric pollution and
morbidity-mortality markers: an
introduction based on data from
the city of So Paulo

Gleice Margarete de Souza Conceio


Laboratrio de Poluio Atmosfrica Experimental
Departamento de Patologia
Faculdade de Medicina
Universidade de So Paulo.
Endereo para correspondncia/correspondence to:
Av. Dr. Arnaldo 455, So Paulo, SP, 01246-903, Brasil.
gleice@usp.br

Paulo Hilrio Nascimento Saldiva


Laboratrio de Poluio Atmosfrica Experimental

Resumo
Este estudo, descreve e compara duas classes de modelos - os Modelos Lineares Generalizados (MLG) e os Modelos Aditivos Generalizados (MAG) - que podem ser utilizadas para avaliar a associao entre poluio
atmosfrica e marcadores de morbi-mortalidade. Enfoca os MAG como uma alternativa para a modelagem de relaes no lineares no especificadas, e mostra que essa classe de modelos constitui uma boa opo para
representar tanto a sazonalidade quanto a
relao entre o desfecho e as variveis
meteorolgicas. Como exemplo de aplicao avaliada a associao entre mortalidade em idosos e poluio atmosfrica na cidade de So Paulo no perodo de 1994 a 1997.
Os dados de mortalidade foram obtidos do
Programa de Aprimoramento das Informaes de Mortalidade (PRO-AIM) e as concentraes dirias de poluentes (PM10, SO2,
CO, e oznio) foram obtidas da Companhia
de Tecnologia de Saneamento Ambiental
(CETESB). Informaes acerca da temperatura e umidade relativa do ar foram obtidas
do Instituto Astronmico e Geofsico da
Universidade de So Paulo (IAG-USP). As
duas classes de modelos produziram resultados coerentes, mas os modelos estatisticamente mais sofisticados tiveram mais poder para detectar efeitos significantes. Foram observadas associaes entre mortalidade e os nveis de CO, SO2 e, em menor
escala, PM10. As associaes observadas foram dose-dependente e evidentes aps um
curto perodo de exposio.

Departamento de Patologia
Faculdade de Medicina
Universidade de So Paulo

Julio da Motta Singer


Departamento de Estatstica,
Instituto de Matemtica e Estatstica
Universidade de So Paulo

Apoio:
Fundao de Amparo Pesquisa do Estado de So Paulo (FAPESP)
Laboratrio de Investigao Mdica do Hospital das Clnicas da Faculdade
de Medicina da Universidade de So Paulo (LIM05-HCFMUSP)

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

206

Palavras chave: Modelos lineares. Modelos aditivos generalizados. Poluio do ar.


Morbidade. Mortalidade. Idoso.

Abstract

Introduo

In this study, we have described and compared two classes of models - the Generalized Linear Models (GLM) and the Generalized Additive Models (GAM) which can be
used to evaluate the association between atmospheric pollution and morbidity and
mortality counts. We consider GAM as an
alternative for modeling unspecific nonlinear
relationships, and show that this class of
models constitute a good option to represent both seasonality and the relation between the outcome and the meteorological
variables. As an illustration, we evaluate the
association between mortality in elderly people and air pollution in So Paulo, Brazil for
the period ranging from 1994 to 1997. The
two modeling classes have produced coherent results, but the most sophisticated models were more powerful to detect significant
effects. Associations between mortality and
the levels of CO, SO2 and, in to a lesser extent, PM10 were observed.

Modelos estatsticos constituem ferramentas extremamente teis para resumir e


interpretar dados. Em particular, eles podem
facilitar a avaliao da forma e da intensidade de associaes de interesse em estudos
epidemiolgicos.
Por exemplo, consideremos estudos em
que o objetivo avaliar os efeitos da poluio atmosfrica sobre a sade dos habitantes de grandes centros urbanos. A varivel
resposta, nesses estudos, geralmente alguma contagem de eventos que representam
danos sade, como o nmero de bitos ou
o nmero de internaes por determinada
causa respiratria. A escolha da concentrao de alguns gases como NOX, SO2 ou CO
ou material particulado como candidatas a
variveis explicativas tambm bastante
comum. Alm disso, h evidncias tanto tericas quanto empricas de que as possveis
variveis respostas citadas acima so fortemente influenciadas por fatores sazonais e
pelas condies climticas, como a temperatura e a umidade do ar1-5, por exemplo.
Entretanto, a maneira como esses fatores
exercem sua influncia sob o desfecho no
to bvia. As relaes entre as diversas variveis intervenientes podem no apresentar
o mesmo comportamento ao longo de todos os valores do seu domnio e, mesmo se
o apresentarem, a intensidade da associao pode no ser constante; por exemplo, o
nmero de bitos pode variar linearmente
numa determinada faixa de valores de temperatura, e quadrtica ou exponencialmente
em outras.
Dada a complexidade das relaes de
interesse, a escolha de modelos apropriados
para a anlise se reveste de bastante importncia. Por exemplo, modelos de regresso
linear servem para investigar se uma varivel reposta Y est associada com variveis
explicativas X1, X2,..., XN, mas este tipo de
modelo avalia esta associao apenas sob a
tica linear, que nem sempre aquela que
rege os fenmenos considerados. Alm disso, importante ter em mente que as suposies usualmente empregadas na anlise

Keywords: Linear models. Generalized additive models. Air pollution. Morbidity. Mortality. Aged.

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
207 Rev.
Vol. 4, N 3, 2001

dificilmente correspondero realidade de


modo exato, por mais sofisticado que seja o
modelo em questo.
Outros aspectos a serem considerados nos
estudos que avaliam os efeitos da poluio utilizando sries de contagens so a distribuio
da varivel resposta, a presena de tendncia e
sazonalidade, variveis de confundimento (geralmente temperatura e umidade), a existncia de defasagem entre o aumento da poluio e a ocorrncia do evento, a presena de
sobredisperso e a possvel existncia
autocorrelao entre as observaes medidas
ao longo do tempo, entre outros.
Uma metodologia bastante empregada na
tentativa de solucionar os problemas citados
envolve o ajuste de Modelos Lineares Generalizados 6. Nesse caso, o controle da
sazonalidade realizado por intermdio do
emprego de variveis indicadoras para estaes do ano7, 8, meses do ano ou meses de
estudo4, 5, 9-11, ou da incluso de termos de
seno e co-seno de diferentes freqncias12 etc.
Pretendemos apresentar aqui uma classe de modelos intitulada Modelos Aditivos
Generalizados (MAG) como uma alternativa para a modelagem de relaes no lineares que no apresentam uma forma definida. Esse tipo de modelo baseia-se em funes no paramtricas, denominadas curvas de alisamento, em que a forma da associao definida pelos prprios dados, conforme a metodologia descrita por Hastie e
Tibshirani13, e amplamente utilizada para
este fim por Schwartz2, 3, 14.
Como exemplo de aplicao, analisaremos dados de um estudo em que o interesse
recai nos efeitos da poluio atmosfrica
sobre a sade dos habitantes da cidade de
So Paulo. Mostraremos que tais modelos
podem constituir boas opes para representar tanto a sazonalidade quanto a relao entre o nmero de bitos e as variveis
climticas, como temperatura e umidade.
Na seo II, descreveremos tanto os
modelos lineares generalizados quanto os
modelos aditivos generalizados que essencialmente constituem uma generalizao dos
primeiros e introduziremos alguns conceitos bsicos sobre curvas de alisamento. A

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

GLM e GAM para anlise da associao


208 Modelos
Conceio, G.M.S. et al.

seo III contm uma aplicao prtica dos


modelos descritos e alguns comentrios sobre as vantagens e desvantagens observadas
em cada abordagem.

Descrio dos modelos


Nos modelos discutidos aqui, a varivel
resposta ou a varivel de interesse uma
contagem (por exemplo, o nmero dirio
de bitos ou de internaes hospitalares).
Essa resposta supostamente influenciada
pela concentrao de poluentes na atmosfera, temperatura e umidade entre outros,
que so as variveis explicativas
explicativas.
Um modelo bastante simples, amplamente utilizado na anlise desse tipo de dados, o
modelo de regresso linear gaussiana6. Este
modelo interessante por sua simplicidade,
interpretabilidade e boas propriedades dos
estimadores de seus parmetros. Como o
nmero de bitos uma contagem, nem
sempre as suposies de normalidade e
homocedasticidade dos erros inerentes a esses modelos so satisfeitas.
O Modelo Linear Generalizado (MLG)
possvel utilizar mtodos anlogos
queles desenvolvidos para o modelo de regresso linear gaussiana, em situaes em
que a varivel resposta obedece a outras distribuies que no a Normal, ou em que a
relao entre a varivel resposta e as variveis explicativas no linear. Isto se deve,
em parte, ao conhecimento de que muitas
das boas propriedades da distribuio Normal so partilhadas por uma larga classe de
distribuies chamada de famlia exponencial de distribuies
distribuies. Muitas distribuies conhecidas pertencem a essa famlia,
como a prpria Normal, a Poisson, a
Binomial, a Gama etc6.
Os modelos lineares generalizados foram
primeiramente apresentados por Nelder e
Wedderburn15 e englobam os modelos de
regresso linear simples e mltipla, regresso logstica, regresso de Poisson e muitos
outros, como modelos log-lineares para dados categorizados. Os ingredientes bsicos

desses modelos so:


1. K valores independentes Y1, ..., YK, de uma
varivel resposta que segue uma distribuio da famlia exponencial, com valor esperado E(Yi) = i;
2. K vetores xi = (1 xi1 x12 xip)t, i=1, ..., K,
contendo os valores das p variveis
explicativas;
3. uma funo monotnica e diferencivel
g, chamada de funo de ligao, tal que
(I)
g(i) = xit, i=1, ..., K
com = (1 2 p) representando o
vetor de parmetros a serem estimados.
Se g a funo identidade, isto , se g(i)
= i, ento i = E(Yi) = xit, e o modelo resultante, com algumas suposies adicionais,
o modelo de regresso linear gaussiana citado anteriormente.
Se g a funo logartmica e Yi tem distribuio de Poisson, o modelo resultante
o modelo de regresso de Poisson,
comumente utilizado para avaliar efeitos da
poluio4,5, 7-11, entre outras aplicaes.
Cada i em (I) determina o efeito da
varivel Xi em g(i). No modelo de regresso
de Poisson, o valor e equivale ao risco relativo de ocorrncia do evento de interesse
(por exemplo, bito ou internao), quando
h um aumento unidades em Xi.
O vetor de parmetros em (I) pode ser
estimado pelo mtodo de mxima verossimilhana
milhana, e os clculos envolvem um procedimento iterativo6.
i

O modelo aditivo generalizado (MAG)


O modelo aditivo generalizado uma extenso do modelo linear generalizado, em que
o termo xit = xijj substitudo por fj(xij),
com f j(x ij) denotando uma funo no
paramtrica (i.e. cuja forma no especificada) estimada atravs de curvas de alisamento13. Com essa substituio, no necessrio assumir uma relao linear entre g(i)
e as variveis explicativas, como no MLG. De
fato, no necessrio nem mesmo conhecer
previamente a forma dessa relao, mas
possvel estim-la a partir de um conjunto de
^
dados. Essa funo estimada (f j(xij)), tambm
chamada de curva alisada, em muitas situaes, nada mais do que algum tipo de mdia dos valores Yi na vizinhana de um dado
valor xi. A curva alisada permite ento descrever a forma, e mesmo revelar possveis
no linearidades nas relaes estudadas, uma
vez que no apresenta a estrutura rgida de
uma funo paramtrica.
Os procedimentos de estimao para os
MAG so semelhantes queles adotados na
estimao sob os MLG, valendo-se basicamente de uma combinao do algoritmo
Scoring de Fisher 6 com mtodos de
alisamento.
Com fins ilustrativos, vamos descrever um
procedimento de alisamento. A Figura 1 contm o diagrama de disperso do nmero dirio de bitos por causas respiratrias em idosos, y = (y1 y2 yN)t, para o perodo de 1994 a
j

Figura 1 - Nmero dirio de bitos por causas respiratrias em idosos para o perodo 19941997.
Figure 1 - Daily deaths due to respiratory causes in the elderly, for the 1994-1997 period

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
209 Rev.
Vol. 4, N 3, 2001

1997. Para maior praticidade, vamos fazer xi


= (x1 x2 xN)t igual ao nmero de dias transcorridos desde o incio do estudo, isto , xi = i.
Desejamos ajustar uma funo que represente
a relao entre y e x, isto , f(x) tal que
yi = f(xi) + i.
No caso mais simples, vamos assumir
E(i) = 0, Var(i) = 2, i=1,...,N, e que os erros
so independentes.
Um alisador uma funo de x e y com o
mesmo domnio de x, definida para todo
ponto x0 ou, algumas vezes, apenas para os
xi da amostra. Para cada valor xi o alisador
^
associa um valor f(xi) cuja estimativa f (xi)
pode ser obtida. Os valores desta funo
devem, por definio, ser mais suaves do
que os valores de y, ou seja, devem ter menor variabilidade do que os valores de y. Uma
estimativa bastante simples para f(xi) a
mdia dos valores de y correspondentes a
valores prximos de xi ; essa estimativa usualmente chamada de mdia mvel. Esses
valores prximos podem ser definidos a
partir de um conjunto que inclui o prprio xi

alm de k pontos sua direita e k pontos


sua esquerda, quando existirem. Formal^
mente, f (xi) = mdiajV (x ), onde V S(xi) uma
vizinhana prxima simtrica de xi, isto ,
V S(x i ) = {max(i-k,1), ..., i-1, i, i+1, ...,
min(i+k,N)}. A Figura 2-b apresenta a funo f estimada para k = 90.
Hastie e Tibshirani13 apresentam uma
srie de alisadores, alguns mais refinados do
que a mdia mvel, como os cubic
smoothing splines ou o locally weighted
running line smoother (loess). Estimativas
desses alisadores para os dados da Figura 1
esto apresentadas na Figura 2.
As duas consideraes mais importantes para a escolha do alisador envolvem o
tipo de mdia dos valores de y a ser calculada e o tamanho da vizinhana (k). Este ltimo, s vezes chamado de parmetro de
alisamento, determina o compromisso entre o vis e a varincia do alisador. Intuitivamente, quanto maior o tamanho da vizinhana, mais lisa ser a curva (Figura 3) e,
em geral, maior o vis. Isto pode ser facilmente visualizado no caso da mdia mvel.
Este alisador pode ser escrito como
S

Figura 2 - Curvas de alisamento do nmero de bitos por causas respiratrias em idosos em


funo do nmero de dias transcorridos.
Figure 2 - Smoothing curves for respiratory-related deaths in the elderly as a function of the number of
days.

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

GLM e GAM para anlise da associao


210 Modelos
Conceio, G.M.S. et al.

f k ( xi ) =

yj

jVks ( xi )

2k + 1

(ii)

e tem esperana

E[f k ( xi )] =

jVks ( xi )

f( x j )
2k + 1

(iii)

e varincia

Var[fk ( xi )] =

2
.
2k + 1

(iv)

Maiores valores de k em (iv) produzem


menor varincia mas, em geral, aumentam
o vis porque a esperana em (iii) envolver
mais termos com valores de f diferentes de
f(xi). Analogamente, menores valores de k
geram maior varincia, mas devem produzir menos vis.
A Figura 3 apresenta o alisador loess
aplicado ao nmero de bitos respiratrios
em idosos em funo do nmero de dias
transcorridos para diferentes parmetros de

alisamento (ou tamanhos de vizinhana).


Neste caso, como o objetivo modelar a
sazonalidade e uma possvel tendncia, devemos definir um parmetro que apreenda
apenas o padro sazonal e a tendncia.
importante que o alisador no capture a variabilidade diria do nmero de bitos, porque esta pode ser explicada pelas demais
variveis, inclusive por aquelas que representam a poluio. Esta idia tambm vale
para a definio dos parmetros de alisamento do nmero de bitos em funo das
variveis climticas.

Exemplo
Descrio dos dados
Foram obtidos do Programa de Aprimoramento das Informaes de Mortalidade no
Municpio de So Paulo (PRO-AIM) informaes referentes a todos os bitos ocorri-

Figura 3 - Curvas de alisamento do nmero de bitos respiratrios em idosos em funo do


nmero de dias transcorridos, para diferentes parmetros de alisamento, utilizando o
alisador loess. O parmetro de alisamento, no caso do loess, corresponde proporo de
dias em cada vizinhana. Por exemplo, uma vizinhana com 180 dias corresponde a um
parmetro de alisamento aproximadamente igual a 0.12.
Figure 3 - Smoothing curves for respiratory-related deaths in the elderly as a function of the number of
days for different smoothing parameters, utilizing the loess smoother. The smoothing parameter, for
loess, corresponds to the ratio of days in each neighborhood. For example, a 180-day neighborhood
corresponds to a smoothing parameter of roughly 0.12.

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
211 Rev.
Vol. 4, N 3, 2001

dos na cidade de So Paulo, nos anos de 1994


a 1997, por causas respiratrias, para pessoas maiores de 65 anos. A causa bsica da
morte foi definida segundo a Classificao
Internacional de Doenas No. 9 (CID-9) at
o ano de 1995; a partir de 1996 a classificao
passou a obedecer as regras da CID-10.
A Companhia de Tecnologia de Saneamento Ambiental (CETESB) forneceu informaes sobre as concentraes dirias dos
poluentes PM10 (mg/m3), SO2 (mg/m3), CO
(ppm), O3 (mg/m3) e NO2 (mg/m3). Uma
vez que as concentraes de NO 2 foram
medidas em menos da metade dos dias, este
poluente foi excludo da anlise.
Foram obtidas do Instituto Astronmico e Geofsico da Universidade de So Paulo
(IAG-USP) a temperatura mnima e mxima
(oC) e a umidade relativa do ar mdia e mnima (%) por dia.
Anlise
Para fins comparativos, foram ajustados
modelos das classes MLG e MAG. Em ambos os casos, a varivel de interesse foi o
nmero dirio de bitos de pessoas maiores
de 65 anos. Os modelos foram construdos
iterativamente, sendo que a estratgia de
anlise consistiu em tentar explicar ao mximo a variabilidade da mortalidade por meio
dos controles para sazonalidade, tendncia,
clima etc., definindo um modelo bsico, antes de adicionar as concentraes de
poluentes.
Nos MLG, foram utilizados, como variveis explicativas, 12 indicadores para meses
do ano, 4 para anos de estudo e 7 para dias da
semana (a fim de controlar a sazonalidade e a
tendncia), temperatura, umidade, o nmero de bitos por outras causas que no as
respiratrias. Foram ajustados modelos com
diferentes especificaes para as variveis
meteorolgicas (envolvendo combinaes de
termos lineares e polinmios de segundo grau)
e com diferentes defasagens (foram consideradas as observaes do dia corrente, de dois
dias anteriores e mdias mveis de dois dias).
A escolha do melhor conjunto de variveis
meteorolgicas e da estrutura de defasagem

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

GLM e GAM para anlise da associao


212 Modelos
Conceio, G.M.S. et al.

mais adequada baseou-se no critrio de informao de Akaike13, na significncia dos


coeficientes das variveis meteorolgicas do
modelo em questo e no nvel descritivo do
teste da razo de verossimilhanas que compara o modelo em questo com o modelo
sem as variveis meteorolgicas.
Nos MAG, os indicadores para meses e
anos foram substitudos por uma curva alisada do nmero de bitos em funo do
nmero de dias transcorridos. Os polinmios envolvendo as medidas de temperatura e umidade foram substitudos por curvas
alisadas do nmero de bitos em funo
dessas variveis. Foram utilizadas diferentes
defasagens para as variveis meteorolgicas
e o critrio para escolha do melhor modelo foi similar ao descrito anteriormente. O
alisador utilizado foi o loess. O parmetro
de alisamento foi definido aps a investigao de grficos de alisamento como os da
Figura 3.
Uma vez que as variveis indicadoras
para dias da semana no foram significativas, foram retiradas dos modelos.
Uma vez definidos os modelos com o
melhor conjunto de controles para
sazonalidade e clima, foram includas as concentraes de poluentes, considerando as
medidas do dia corrente, defasagens at 3
dias e mdias mveis at 7 dias.
Tambm foram ajustados modelos contendo variveis indicadoras para categorias
das concentraes de poluentes em lugar das
variveis contnuas, com o objetivo de melhor visualizar o efeito da poluio medida
que a sua concentrao aumenta. Os limites
superiores de cada categoria foram os quintis.
Assim, a primeira categoria contm os 20%
dos dias menos poludos do perodo de estudo, a segunda categoria contm os 20%
seguintes, e assim por diante. A ltima categoria contm os dias mais poludos do perodo de estudo. Fixando a primeira categoria
como referncia, a exponenciao do coeficiente de cada varivel indicadora produz o
risco relativo de mortalidade em cada categoria em relao primeira. Isto permite
avaliar se existe um limite mnimo para a
concentrao de cada poluente, abaixo do

qual no h grandes alteraes no risco de


mortalidade.
Finalmente, o modelo MAG foi reajustado com a utilizao de um mtodo de estimao de quasi-verossimilhana, segundo o modelo de Zeger para anlise de sries
de contagens16, com o objetivo de controlar
uma possvel autocorrelao ou sobredisperso nos resduos dos modelos. Foram
includos parmetros autoregressivos at a
ordem 7, permanecendo no modelo apenas
os termos significantes.
A anlise foi realizada com o auxlio do
programa S-plus 417.

Resultados
O parmetro de alisamento para o nmero de bitos em funo do tempo foi fi-

xado em 0.12 (Figura 3). Isto significa que a


vizinhana em cada ponto contm 12% das
observaes, o que corresponde a 175 pontos (aproximadamente 6 meses).
Os parmetros de alisamento para a temperatura e para a umidade (mdias mveis
de dois dias) foram fixados em 0.5.
As Tabelas 1 e 2 mostram os modelos
MLG e MAG com o melhor conjunto de
controles para sazonalidade e clima. As Figuras 4 a 6 apresentam as curvas de alisamento estimadas para o nmero de bitos
em funo das variveis explicativas no melhor MAG.
Na Tabela 1, os coeficientes das variveis
indicadoras para meses e anos indicam um
aumento significativo da mortalidade nos
meses de inverno, alm de uma reduo ao
longo dos anos. Este comportamento pode

Table 1 - Estimativas para os parmetros do GLM, antes da incluso dos poluentes.


Table 1 - Estimates for GLM parameters, before including pollutants
Variveis explicativas
intercepto
meses
janeiro
fevereiro
maro
abril
maio
junho
julho
agosto
setembro
outubro
novembro
dezembro
anos
1994
1995
1996
1997
variveis meteorolgicas
temperatura - mdia mvel 2 dias
temperatura2
umidade - mdia mvel 2 dias
bitos no-respiratrios
AIC
nvel descritivo (p) #

coeficiente

erro padro

2.671**

.146

.000
.093*
.128**
.330**
.563**
.533**
.341**
.315**
.170**
.129**
.060

.044
.043
.046
.050
.054
.053
.054
.051
.047
.045
.043

-.021
-.138**
-.154**

.022
.023
.023

-.045**
.002**
-.004**
.004**

.015
.001
.001
.001
1608.67
< 0,01

* p<.05; **p<.01
# teste que compara o modelo em questo com o modelo sem as variveis meteorolgicas
# test that compares the model being assessed with the model without meteorology variables

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
213 Rev.
Vol. 4, N 3, 2001

Tabela 2 - Estimativas para os parmetros do MAG, antes da incluso dos poluentes.


Table 2 - Estimates for GAM parameters, before including pollutants.
Variveis explicativas
intercepto
f (para o No. de dias transcorridos)
variveis meteorolgicas
f (temperatura mdia mvel 2 dias)
umidade mdia mvel 2 dias
bitos no-respiratrios
AIC
nvel descritivo (p) #

coeficiente

erro padro

2.523*
-2.521*

.099
-8.083

-1.586*
-.005*
.006*

-4.784
.001
.001
1625.53
< 0,01

*p<.01
# teste que compara o modelo em questo com o modelo sem as variveis meteorolgicas
# test that compares the model being assessed with the model without meteorology variables.

ser claramente visualizado na Figura 4. O


alisador apreende a sazonalidade de modo
satisfatrio, bem como a tendncia de decrscimo da mortalidade ao longo dos anos,
sem capturar a variabilidade diria da mortalidade.
A Figura 5 mostra a curva de alisamento
ajustada para o nmero de bitos respiratrios de idosos em funo da temperatura
sob o melhor MAG. Convm interpretar
esta figura para valores de temperatura en-

tre 10 e 20 graus Celsius, onde maior o


nmero de observaes. Pode-se dizer que
para temperaturas mais baixas (na faixa de
10 a 16 graus Celsius) o nmero de bitos
decresce medida que a temperatura aumenta; para temperaturas a partir de 16 graus
Celsius, o nmero de bitos parece no sofrer alteraes considerveis.
A Figura 6 sugere que a relao entre o
nmero de bitos e a umidade deve ser linear. O modelo que inclui apenas um termo

Figura 4 - Curva alisada do nmero de bitos respiratrios em idosos em funo do nmero


de dias transcorridos no MAG. As linhas pontilhadas so uma aproximao para o intervalo
de confiana da curva de alisamento. Cada barra vertical no eixo das abscissas representa
uma observao.
Figure 4 - Smoothing curve oh respiratory-related deaths in the elderly as a function of the number of
days in GAM. The dotted lines are na approximation for the confidence interval of the smoothing curve.
Each vertical bar in the x axis represents na observation.

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

GLM e GAM para anlise da associao


214 Modelos
Conceio, G.M.S. et al.

Figura 5 - Curva alisada do nmero de bitos respiratrios em idosos em funo da


temperatura no MAG.
Figure 5 - Smoothing curve of respiratory - related deaths in the elderly as a function of temperature in
GAM.

Figura 6 - Curva alisada do nmero de bitos respiratrios em idosos em funo da


umidade relativa do ar no MAG.
Figure 6 - Smoothing curve of respiratory related deaths in the elderly as a function of relative air
humidity in GAM.
linear para a umidade foi re-estimado sem a
utilizao de um alisador.
A Tabela 3 contm os coeficientes e respectivos erros padro estimados sob os
modelos MLG e MAG para cada poluente,
quando includos separadamente ou em
conjunto no modelo. Em geral, as estimativas da magnitude do efeito da poluio foram maiores sob os MAG; este modelo tambm produziu os menores erros padro. Sob

os MLG, nenhum poluente explicou a mortalidade de forma significativa. Sob os MAG,


houve efeitos significativos para CO, SO2 e
PM10. Quando todos os poluentes foram includos simultaneamente no modelo, apenas o SO2 permaneceu significante. O Oznio no se mostrou associado mortalidade
em nenhum dos modelos ajustados. Aps o
controle da autocorrelao e da sobredisperso, o PM10 deixou de ser significante.

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
215 Rev.
Vol. 4, N 3, 2001

Tabela 3 - Coeficiente de regresso (e erro padro) para cada poluente, quando includos
separadamente ou juntos no modelo controlado para sazonalidade, clima e nmero de
bitos por causas no respiratrias.
Table 3 - Regression coefficient ( and standard error) for each pollutant, when included alone or together,
in the model controlled for seasonality, climate and number of deaths due to non-respiratory causes.
Separados
Poluentes

Juntos

MLG

MAG

MLG

MAG

PM10 a

.0000
(.0005)

.0009**
(.0004)

-.0005
(.0007)

-.0009
(.0006)

SO2 a

.0020*
(.0012)

.0051***
(.0009)

.0030*
(.0017)

.0069***
(.0013)

CO a

-.0019
(.0067)

.0177***
(.0054)

-.0008
(.0097)

.0115
(.0086)

O3 b

.0001
(.0003)

-.0002
(.0002)

.0001
(.0003)

-.0002
(.0003)

* p< 0.10 ** p< 0.05 *** p < 0.01


a
mdia mvel de cinco dias/ modile five-day mean
b
concentrao do dia corrente/b concentration of the current day

A Figura 7 apresenta o risco relativo de


mortalidade para categorias com diferentes
nveis de concentrao de poluentes, sob os
modelos MLG e MAG. Embora o padro das
curvas seja semelhante, um comportamento dose-resposta tornou-se evidente apenas
sob os MAG (convm lembrar que a poluio no foi significativamente associada
mortalidade sob os MLG).

Comentrios finais
As duas classes de modelos apresentadas produziram resultados coerentes, mas
os modelos estatisticamente mais sofisticados tiveram mais poder para detectar efeitos significativos que foram, como esperado, de pequena magnitude. Isto pode ter
ocorrido porque os MAG incorporam informaes acerca da sazonalidade, tendncia e
da relao entre mortalidade e variveis
meteorolgicas de um modo menos restritivo. A abordagem que utiliza variveis
indicadoras impe a restrio de que o nmero de bitos ao longo de todo o ms
constante e s vai se alterar no primeiro dia
do ms seguinte, quando dever permane-

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

GLM e GAM para anlise da associao


216 Modelos
Conceio, G.M.S. et al.

cer constante novamente at o final do ms


e assim por diante. Do mesmo modo, as variveis indicadoras para anos de estudo tm
o objetivo de eliminar a tendncia do nmero de bitos, mas este procedimento impe
uma restrio semelhante. A abordagem
baseada em curvas de alisamento permite
que o padro sazonal seja definido pelos prprios dados, sem a imposio de uma estrutura rgida e, talvez, menos fidedigna.
O ajuste de curvas de alisamento tambm possibilita avaliar a relao entre o nmero de bitos e a temperatura, sem a necessidade de definir previamente a forma
desta relao. A curva ajustada sugere que o
nmero de bitos aumenta consideravelmente na presena de baixas temperaturas,
mas no na presena de temperaturas muito altas.
A desvantagem da utilizao de curvas
de alisamento que os coeficientes estimados correspondentes a essas curvas nos
modelos de regresso no so interpretveis,
e a estimao do risco relativo de mortalidade associado a variaes na temperatura
envolve procedimentos computacionais intensos e que ainda no foram implemen-

Figura 7 - Risco relativo de mortalidade de idosos por causas respiratrias segundo as


concentraes de cada poluente.
Figure 7 - Relative risk of respiratory related mortality according to concentrations of each
pollutant.Tabela 1. Estimativas para os parmetros do MLG, antes da incluso dos poluentes.

tados nos pacotes estatsticos atuais. Entretanto, sempre que houver interesse direto
na estimao do risco, os alisadores podem
ser utilizados em uma primeira abordagem,
com o objetivo de sugerir ao pesquisador
que tipo de funo paramtrica (polinmios

de 2o grau, 3o grau etc.) ou varivel indicadora


seria mais adequada.
De um modo geral, as curvas estimadas
para o risco relativo de mortalidade em funo das categorias da concentrao de
poluentes apresentaram um padro seme-

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Bras. Epidemiol.
217 Rev.
Vol. 4, N 3, 2001

lhante. O padro de comportamento do efeito da poluio no parece depender da classe de modelo adotado, mas os MAG mostraram-se mais eficientes para detectar associaes.
Aparentemente, os MAG so modelos
mais parcimoniosos, ou seja, necessitam de
um menor nmero de variveis explicativas,
o que justificaria o fato de detectarem um
maior nmero de associaes. Por exemplo, excetuando a concentrao de poluentes,
foram consideradas 18 variveis explicativas
nos MLG, enquanto que apenas 4 foram
requeridas pelos MAG. Na verdade, toda
curva de alisamento est associada a um
determinado nmero de graus de liberdade13. O nmero de graus de liberdade para
as curvas de alisamento do nmero de bitos em funo do nmero de dias transcorridos foi aproximadamente 14 e, portanto,
equivalente ao nmero de graus de liberdade correspondentes s variveis indicadoras
para meses e anos.
Alguns estudos avaliaram a relao entre
poluio atmosfrica e mortalidade nos Estados Unidos, valendo-se de diferentes mtodos estatsticos e realizaram uma anlise
comparativa de tais mtodos. Entre estes podemos citar Schwartz e colaboradores18 e
Kinney e colaboradores19. Entretanto, estas
anlises envolveram basicamente o PM10.
Schwartz e colaboradores18 avaliaram a
sensibilidade da associao entre mortalidade
total e PM10 em Birmingham, comparando
modelos de regresso de Poisson com controle da autocorrelao e da sobredisperso,
modelos de regresso robusta (que so ba-

sicamente modelos de regresso linear mltipla ponderada20 e modelos de regresso de


Poisson utilizando alisadores. Foi observada
uma associao significativa entre mortalidade e PM10, sendo que essencialmente os
mesmos resultados foram obtidos nas diferentes anlises empregadas. Nenhum outro
poluente foi investigado.
Kinney e colaboradores19 avaliaram a
sensibilidade da associao entre mortalidade total e as concentraes de PM10 em Los
Angeles, comparando o risco relativo associado s concentraes do PM10 em trs classes de modelos: regresso linear mltipla,
regresso log-linear (regresso linear mltipla com o logaritmo do nmero de bitos
como varivel resposta) e regresso de
Poisson. Diferentes alternativas para controles da sazonalidade e especificaes para
variveis meteorolgicas foram consideradas. O risco relativo associado ao PM10 no
se mostrou sensvel s classes de modelos
utilizadas mas, na maioria dos modelos, os
riscos estimados foram apenas marginalmente significantes.
Embora este trabalho tenha um enfoque
de cunho metodolgico, importante ressaltar que os resultados observados reiteram a hiptese de que a poluio urbana
pode levar morte. Foi observada uma associao entre mortalidade em idosos por
causas respiratrias e poluio atmosfrica,
representada pelos nveis de CO, SO2 e, em
menor escala, PM10, na cidade de So Paulo,
para o perodo de 1994 a 1997. Essa associao dose-dependente e evidente aps um
curto perodo de exposio.

Referncias
1. Schwartz, J, Spix C, Touloumi G, Bachrov L,
Barumamdzadeh T, Tertre A et al. Methodological
issues in studies of air pollution and daily counts of
deaths or hospital admissions. J Epidemiol
Community Health 1996; 50 Suppl 1:S3-S11.
2. Schwartz J, Dockery DW, Neas LM. Is daily mortality
associated specifically with fine particles? J Air Waste
Manage Assoc 1996; 46:927-39

Rev. Bras. Epidemiol.


Vol. 4, N 3, 2001

3. Schwartz J. Air pollution and hospital admissions for


respiratory disease. Epidemiology 1996; 7:20-8.
4. Saldiva PHN, Pope III CA, Schwartz J, Dockery DW,
Lichtenfels AJFC, Salge JM et al. Air pollution and
mortality in elderly people: a time-series study in So
Paulo, Brazil. Arch Environ Health 1995; 50:159-63.

GLM e GAM para anlise da associao


218 Modelos
Conceio, G.M.S. et al.

5. Lin CA, Martins MA, Farhat SCL, Pope III CA,


Conceio GMS, Anastcio VM et al. Air pollution and
respiratory illness of children in So Paulo, Brazil.
Pediatr Perinat Epidemiol 1999; 13:475-88.

12. Katsouyanni K, Schwartz J, Spix C, Touloumi G, Zmirou


D, Zanobetti A et al. Short term effects of air pollution
on health: an European approach using epidemiologic
time series data: the APHEA protocol. J Epidemiol
Community Health 1996; 50 Suppl 1:S12-S18.

6. Dobson AJ. An introduction to generalized linear


models. 2.ed. New York:Chapman & Hall; 1990.

13. Hastie T, Tibshirani R. Generalized additive models.


London:Chapman & Hall, 1990.

7. Schwartz J, Dockery DW. Particulate air pollution and


daily mortality in Steubenville, Ohio. Am J Epidemiol
1992;135:12-9.

14. Schwartz J. Nonparametric smoothing in the analysis


of air pollution and respiratory illness. Can J Stat 1994;
22: 471-87.

8. Saldiva PHN, Lichtenfels AJFC, Paiva PSO, Barone IA,


Martins MA, Massad E et al. Association between air
pollution and mortality due to respiratory diseases in
children in So Paulo, Brazil: a preliminar report.
Environ Res 1994;65:218-25.

15. Nelder JA, Wedderburn RWM. Generalized linear


models. J R Stat Soc A 1972; 135:370-84.
16. Zeger SL. A regression model for times series of counts.
Biometrika 1988; 75:621-29.

9. Schwartz J. Air pollution and hopital admissions for the


elderly in Detroit, Michigan. Am J Respir Crit Care
Med 1994;150:648-55.

17. Mathsoft. S-PLUS 4 users guide. Seattle: Data Analysis


Products Division; 1997.

10. Pereira LAA, Loomis D, Conceio GMS, Braga ALF,


Arcas RM, Kishi H et al. Association between air
pollution and intrauterine mortality in So Paulo,
Brazil. Environ Health Perspect 1998; 106:325-29.

18. Schwartz J, Slater D, Larson TV, Pierson WE, Koenig J.


Particulate air pollution and hospital emergency room
visits for asthma in Seattle. Am Rev Respir Dis 1993;
147:826-31.

11. Braga ALF, Conceio GMS, Pereira LAA, Kishi H,


Pereira JCR, Andrade MF et al. Air pollution and
pediatric respiratory admissions in So Paulo, Brazil. J
Environ Med 1999; 1:95-102.

19. Kinney PL, Ito K; Thurston GD. A sensitivity analysis of


mortality/PM10 associations in Los Angeles. Inhal
Toxicol 1995;7:59-69.
20. Neter J, Kutner MH, Nachtsheim CJ, Wasserman W.
Applied linear statistical models. 4.ed. Chicago: Times
Mirror Higher Education Group, 1996.

Modelos GLM e GAM para anlise da associao


Conceio, G.M.S. et al.

Rev. Bras. Epidemiol.


219 Vol. 4, N 3, 2001

Você também pode gostar