Você está na página 1de 4

Uma Abordagem de Modelos Estat sticos Aplicados a Geomedicina - Casos de C ancer de F gado no Estado do Paran a

Gledson Luiz Picharski; Edicleia Furlanetto; Paulo Justiniano Ribeiro Jr.; Silvia Emiko Shimakura (LEG - Laborat orio de Estat stica e Geoinforma c ao)

Resumo
Um dos principais objetivos da Geomedicina e estudar a rela c ao entre estruturas de geologia, como elementos qu micos coletados em aguas superciais, com a ocorr encia de doen cas. Neste contexto, este trabalho busca investigar a associa c ao entre dados geoqu micos de aguas superciais em microbacias do Estado do Paran a coletados pela MINEROPAR, e o registro de casos de c ancer de f gado nas microregi oes do Paran a obtido do DATASUS no ano de 2004. Modelos estat sticos s ao apropriados para explicar estas rela c oes considerando diversos fatores, dentre eles, a espacialidade das informa c oes. Modelos lineares generalizados(GLM) e modelos aditivos generalizados(GAM) s ao duas estrat egias de modelagem u teis para explica c ao destas rela c oes. Para utiliza c ao destas abordagens faz-se necess ario primeiramente um bom entendimento das vari aveis. Isto pode ser feito atrav es de uma an alise explorat oria, que pode sugerir poss veis transforma c oes nas covari aveis e obter por exemplo mapas suavizados, indicando as regi oes de maior ou menor incid encia de casos. Atrav es do sistema R pode-se obter o variograma dos elementos geoqu micos, fazer a krigagem e obter todos os resumos de informa c ao e utilizar os modelos deste trabalho. O GAM mostrou a n ao signic ancia do componente espacial para a an alise por microregi ao, isso tamb em foi percebido na raz ao de verossimilhan ca dos res duos do GLM. O Mangan es(MN) e o Nitrato (NO3 ) foram as covari aveis mais signicativas encontradas pelo GLM.

Introdu c ao
Apesar de muitos esfor cos para cuidar da qualidade da agua doce, s ao preocupantes os casos de doen cas que surgem devido a contamina c ao das aguas. Uma das fontes fundamentais para sobreviv encia humana ea agua, e ela est a se tornando um bem escasso. Segundo Rom ao, a evolu c ao humana tem criado um modelo de desenvolvimento industrial e urbano desordenado, com explora c ao inadequada dos recursos naturais e desequil brio ambiental. A deteriora c ao da qualidade da agua nos diferentes sistemas h dricos e preocupa c ao crescente e com raz ao, os recursos de agua doce constituem um componente essencial e indispens avel ` a sobreviv encia humana. A agua pot avel, pr opria para consumo humano, segundo o artigo 40 da Portaria no 518 de 25 de mar co de 2004 do Minist erio da Sa ude, precisa estar em conformidade com par ametros 1

microbiol ogicos, f sicos, qu micos e radioativos que atendam ao padr ao de portabilidade e n ao ofere ca riscos ` a sa ude. Em se tratando de casos de doen cas, alguns m etodos de an alise espacial para dados geoestat sticos s ao necess arios para o objetivo do estudo desse trabalho, m etodos estes que visam explicar pelo menos em parte os casos de c ancer de f gado. Esses m etodos, tais como modelos lineares generalizados, variogama, krigagem e modelos aditivos generalizados s ao ferramentas cab veis para explicar o fen omeno em estudo.

Objetivo
Investigar associa c ao entre os teores de elementos geoqu micos presentes nas aguas superciais ` a ocorr encia de casos de c ancer de f gado no Estado do Paran a. As vari aveis medidas nas aguas s ao dados geoestat sticos e a doen ca (casos de c ancer de f gado) e mensurada por munic pio. Deseja-se vericar a rela c ao entre as caracter sticas das a guas com esta doen ca controlando por um poss vel efeito espacial residual.

Descri c ao do estudo
Os dados utilizados neste estudo foram disponibilizados pela MINEROPAR, os quais cont em informa c oes da qualidade das aguas superciais por microbacias do estado do Paran a. Foram medidos nas aguas a quantidade de diversos elementos e caracter sticas, entre eles Nitrato, Nitrito, Teor de Acidez, Zinco, Bromo, S odio, Ferro, Alum nio, Fosfato, Magn esio, Mangan es, C alcio, Condutibilidade, etc. Os dados sobre a doen ca foram obtidos atrav es do DATASUS. Em uma an alise explorat oria percebe-se que os dados distinguem-se em tr es grupos, sendo eles: vari aveis com clara espacializa c ao; vari aveis que talvez possam ser consideradas na an alise mas talvez agrupadas (presen ca,aus encia, ou mais grupos) pois apresentam grande n umero de valores repetidos; e vari aveis aparentemente sem potencial para serem analisadas por apresentarem quase a totalidade dos valores iguais. No primeiro grupo foi feita uma an alise geoestat stica, onde foram feitos resumos num ericos de cada covari avel, percebendo as diversas medidas resumo dos dados. Histogramas, assim como gr acos de boxcox, auxiliaram a identica c ao da transforma c ao necess aria, a seguir verica-se a varia c ao espacial atrav es dos variogramas e posteriormente e feita a krigagem, gerando os mapas das covari aveis distribu das suavemente pela superf cie do Paran a. Para os demais grupos foram usadas vari aveis dummy devido ao fato de algumas vari aveis apresentarem alta incid encia de valores iguais. Em sua maioria s ao censuras ` a esquerda que ocorrem por limites de detec c ao dos aparelhos. As t ecnicas para estimar dados com censura s ao muito mais apuradas e ser ao tratadas na seq u encia do trabalho, contudo neste momento opta-se pela simplicidade das vari aveis dummy. Todas as covari aveis foram medidas em 698 pontos do Estado do Paran a, e deseja-se obter a rela c ao com a ocorr encia do c ancer de f gado que foi observada por munic pio no ano de 2004. Como muitos dos munic pios n ao possuem incid encia da doen ca no ano, neste ponto do trabalho optou-se por tratar todas as informa c oes por microrregi ao. Foi calculada a m edia dos valores de cada covari avel para cada microrregi ao, assim busca-se agora vericar a signic ancia do componente espacial e de cada uma das covari aveis no modelo. Alguns modelos poderiam ser usados para esta situa c ao, inicia-se o estudo com os modelos lineares generalizados (GLM), com ajuda do m etodo stepwise e atrav es do AIC foi poss vel 2

identicar as covari aveis mais signicativas neste modelo. Por tratar-se de dados de contagens e adequado o uso de distribui c oes da fam lia exponencial, em particular a distribui c ao de Poisson. Usando o res duo padronizado de Pearson e os centr oides das microrregi oes, com o uso do pacote geoR, foi poss vel fazer uma an alise da raz ao de verossimilhan ca que indicou que o modelo n ao espacial era mais signicativo, de forma que pode-se considerar que as explica c oes espaciais por microrregi ao estariam contidas nas covari aveis. O modelo usado foi: Y P oisson() g () = log (M G) + M N + log (N O3) + log (CON DU ) + log (e) Onde Y e o n umero de casos de c ancer de gado. Buscando vericar poss veis suaviza c oes nas covari aveis, ou ainda a considera c ao do componente espacial, construiu-se o modelo aditivo generalizado (GAM). A diferen ca em rela c ao ao GLM e que no GAM foi usada uma fun c ao de suaviza c ao no espa co. Aqui o componente espacial e tratado como covari avel, onde se conseguiu estimar um coeciente e vericar o p-valor. Observou-se a n ao signic ancia no componente espacial, assim como observado no teste da raz ao de verossimilhan ca do res duo espacial analisado na geoR. O GAM utilizado foi: Y P oisson() g () = log (M G) + M N + log (N O3) + log (CON DU ) + s(x, y ) + log (e) Onde Y e a taxa de casos de c ancer de f gado, s(x,y) e o componente espacial do modelo e log(e) e o log do numero esperado de casos sob a hipotese nula de risco constante nas microregioes.

Resultados
Foi feita uma an alise geoestat stica nas covari aveis do grupo que possuia uma clara espacializac ao. Um dos elementos que passou por esta an alise foi o C alcio(Ca). Inicialmente utilizou-se o gr aco box-cox para vericar a necessidade de transforma c ao da vari avel, percebe-se que mesmo feito um vaestando um pouco fora do intervalo e poss vel usar transforma c ao logaritmica. E riograma com base na vari avel transformada e depois ajsutado, neste caso usando distribui c ao exponencial. Observa-se espacialmente no estado do Paran a, pontos de localiza c ao com n veis diferentes de teor de C alcio. Com o uso do variograma ajustado, foi feita a krigagem, podendo assim ver o mapa do c alcio no Estado do Paran a. Os 4 gr acos s ao representados na Figura 1. Ap os a utiliza c ao dos m etodos, por duas t ecnicas relativamente distintas, GAM e an alise espacial do res duo do modelo Poisson, o componente espacial mostrou-se n ao signicativos para microrregi oes, indicando que para essa divis ao de areas tratadas n ao parece ser necess ario usar modelos espaciais. As suaviza c oes de splines (componente suavizador) feitas para as covari aveis no GAM, n ao mostraram ser signicativas para serem usadas, pois acrescentam em complexidade e n ao em informa c ao para o modelo. O modelo que melhor explica o c ancer de f gado considerando as vari aveis usadas e: Y P oisson() g () = log (M G) + M N + log (N O3) + log (CON DU ) + log (e) A tabela 1 representa os coecientes estimados para o modelo. Dos elementos qu micos encontrados, o Mangan es, Magn esio e Nitrato foram os que melhor explicaram os casos de c ancer de f gado observados nas microregi oes do Paran a. 3

logverossimilhana

3150

semivarincia 0.3 0.1 100 200 300 400 500 600 0.1 0.3

3170

3190

0.0 0

0.2

0.4

0.6

0.8

95%

100

200 distance

300

100

300

500

10

15

20

200

400

600

800

0 200 300 400 500 600 700 800

Figura 1: An alise geoestat stica de C alcio no Paran a Intercepto log(MG) MN log(NO3) log(CONDU) Coeciente Erro padr ao p-valor 3.43971 1.89132 0.068960 0.81397 0.57861 0.159496 -0.61753 0.16391 0.000165 0.24080 0.08468 0.004461 -0.85928 0.58772 0.143724

Tabela 1: Coecientes do GLM

Discuss ao
Para a an alise de dados de geomedicina, assim como muitos outros, e necess ario excluir alguns efeitos de confundimento. Para isto pode-se usar an alise fatorial em conjunto com modelos estruturados, onde uma matriz de correla c ao pode ser o primeiro passo nesta dire c ao. Este e um procedimento que ser a adotado posteriormente para melhor aproveitamento das informa c oes das vari aveis mais correlacionadas. Outro procedimento e efetuar an alise semelhantes por munic pios, onde ser a investigada a signic ancia no componente espacial e possivelmente algumas covari aveis se tornem signicativas no modelo.

Agradecimentos
Agradecemos a equipe do Geomedicina do Instituto de Pesquisa Pel e Pequeno Principe pelas discuss oes e fornecimento dos dados, em especial Professor Bonald Cavalcante de Figueiredo, Humberto Iba nez e Otavio Augusto Boni Licht. 4

Você também pode gostar