Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUMO
A poluição atmosférica é um tema muito estudado em todo o mundo, principalmente devido
aos seus impactos à saúde humana. A avaliação do impacto da poluição atmosférica na saúde
é realizada frequentemente com o uso de regressões estatísticas. O uso de Redes Neurais
Artificiais (RNA) neste tipo de problema ainda é pouco difundido. Neste trabalho foi proposto
um estudo comparativo da aplicação de três arquiteturas de RNA do tipo Feedforward:
Perceptron de Múltiplas Camadas (MLP), Rede Neural com Função de Base Radial (RBF) e
a Máquina de Aprendizado Extremo (ELM). Informações como temperatura, umidade relativa
do ar, dia da semana, feriado e material particulado com diâmetro aerodinâmico de até 10µm
(MP10) foram as variáveis consideradas nesse estudo. Os dados foram obtidos nas estações de
monitoramento da cidade de São Paulo/SP, Brasil, pela Companhia Ambiental do Estado de
São Paulo (CETESB). O impacto que a poluição tem sobre a saúde humana pode ser
observado através do número de internações hospitalares por doenças respiratórias. Com este
cenário foi possível estimar, com o uso das citadas técnicas, o número de internações para até
sete dias após a exposição à poluição particulada. Os resultados mostraram que a rede MLP
conseguiu alcançar o melhor desempenho geral. Além disso, após 4 dias de exposição foi
encontrado o menor erro. Desta forma, destaca-se o bom desempenho das RNA na avaliação
de impacto da poluição atmosférica na saúde populacional, se caracterizando em uma nova
ferramenta para resolver tal tarefa, que ajudará os governantes na tomada de decisão em
situações de altas concentrações de poluentes.
INTRODUÇÃO
A poluição atmosférica é um tema muito estudado em todo o mundo, principalmente devido
aos seus impactos à saúde humana. A Organização Mundial da Saúde (OMS) relata que mais
de 6 milhões de mortes por ano estão relacionadas à poluição do ar [1].
Neste contexto, é de suma importância desenvolver, propor e aprimorar técnicas computa-
cionais capazes de avaliar o impacto da poluição atmosférica na saúde populacional. Os
estudos relativos aos riscos à saúde causados pela poluição atmosférica geralmente são
-275-
Track-B: Computational Mechanics
realizados utilizando técnicas de regressão estatística. Porém, se a base de dados não contiver
todos os dados temporalmente sequenciais, estes modelos acabam por não atingir
desempenhos satisfatórios devido ao processo inerente de ajuste dos coeficientes livres [2].
Por outro lado, as Redes Neurais Artificiais (RNA) podem contornar problemas como este,
por serem aproximadores universais. Isto pode levar a bons resultados, o que a torna uma
ferramenta promissora neste contexto. Tais redes são amplamente aplicadas em estudos de
previsão da poluição atmosférica [3-6]. Entretanto, no que tange à avaliação do impacto da
poluição atmosférica na saúde, sua utilização ainda é pouco difundida.
O estudo de Kassomenos et al. [7] foi desenvolvido utilizando os dados de internações
hospitalares na cidade de Atenas na Grécia. As RNA deram maior contribuição para os
parâmetros meteorológicos, capturando de forma mais eficiente o efeito combinado de
estressores químicos (poluição do ar) e físicos (temperatura e umidade) em indicadores de
resultados de saúde. O trabalho de Çapraz et al. [8] mostra de forma significativa que o
material particulado (diâmetro aerodinâmico até 2,5 µm (MP2,5) e diâmetro aerodinâmico até
10 µm (MP10)) estão diretamente relacionados às internações por problemas respiratórios.
Diante do exposto, neste trabalho foi proposto um estudo comparativo da aplicação de três
arquiteturas de RNA do tipo Feedforward: Perceptron de Múltiplas Camadas (MLP), Rede
Neural com Função de Base Radial (RBF) e a Máquina de Aprendizado Extremo (ELM), na
avaliação do impacto da polução atmosférica na saúde humana. Como estudo de caso, foi
considerado o impacto do MP10 e variáveis meteorológicas no número de internações por
Fig. 1 - Rede Feedforward de camada única. Fig. 2 - Rede Feedforward de múltiplas camadas.
-276-
Proceedings TEMM2018 / CNME2018
Fig. 3 - Perceptron de Múltiplas Camadas (MLP). Fig. 4 - Fases forward e backward da MLP.
Fonte: Adaptado de [12]. Fonte: Adaptado de [12].
-277-
Track-B: Computational Mechanics
O treinamento desta rede consiste em duas fases: a primeira está associada ao ajuste dos pesos
na camada intermediária com funções de base radial, usando do paradigma não supervisio-
nado; e a segunda é associada aos ajustes dos pesos na camada de saída, que utiliza a regra
delta generalizado similar à rede MLP [12].
ESTUDO DE CASO
O estudo de caso proposto neste trabalho foi a aplicação de Redes Neurais Artificiais do tipo
Feedforword ao problema da previsão de internações hospitalares por problemas respiratórios
devido à exposição ao MP10, na cidade de São Paulo/SP, Brasil. As previsões foram
realizadas considerando como variáveis de entrada o MP10, a temperatura média e a umidade
relativa do ar. Além disso, o dia da semana e se no dia da internação era feriado ou não
também foram considerados como variáveis de entrada - procedimento padrão em estudos
epidemiológicos, visto que o número de internações hospitalares diminui durante os finais de
semana e feriados.
A cidade de São Paulo é a capital do Estado de São Paulo e localiza-se na região sudeste do
Brasil. De acordo com o último censo realizado pelo Instituto Brasileiro de Geografia e
Estatística (IBGE), em 2010, a cidade possuía uma população de mais de 11 milhões de
habitantes, sendo estimado para o ano de 2017, ultrapassar os 12 milhões de habitantes, sendo
a mais populosa de toda a América Latina [19].
-278-
Proceedings TEMM2018 / CNME2018
Base de dados
A base de dados utilizada para o treinamento das RNA compreende dados experimentais de
01 de janeiro de 2014 até 31 de dezembro de 2016. Seu conteúdo foi o resultado da junção de
dados de poluição atmosférica e variáveis climáticas provenientes de estações de
monitoramento da qualidade do ar sob administração da Companhia Ambiental do Estado de
São Paulo (CETESB) juntamente com dados de internações por doenças respiratórias
(classificação de acordo com a Classificação Internacional de Doenças (CID-10) J00-J99)
provenientes do Sistema Único de Saúde Brasileiro (DataSUS).
Deste modo, a base de dados foi constituída por 1096 amostras que foram as entradas dos
modelos abordados, contendo os seguintes campos:
Data: Data referente ao dia da medição;
MP10: Concentração de material particulado com diâmetro aerodinâmico menor ou
igual à 10 µm;
Temperatura: Temperatura média registrada no dia da medição;
Humidade: Hmidade relativa do ar registrada no dia da medição;
Dia: Dia da semana (de domingo -1- à sábado -7-);
Feriado: Se o dia era feriado -1- ou não -0-;
Número de internações: Número de internações hospitalares devido a problemas
respiratórios (CID-10 J00-J99) no dia da medição.
-279-
Track-B: Computational Mechanics
NS
1
MAE =
NS
∑
t =1
dt − yt (2)
NS
1 dt − yt
MAPE =
NS
∑
t =1 dt
(3)
A Tabela 1 mostra os resultados obtidos pelas três arquiteturas de RNA do tipo Feedforward
(MLP, RBF e ELM) nas previsões realizadas para o conjunto de teste de 0 a 7 dias após a
exposição ao poluente, sendo “NN” a quantidade de neurônios. Note que tais resultados são a
média de 30 simulações independentes.
-280-
Proceedings TEMM2018 / CNME2018
Tabela 1 - Resultados das previsões até 7 dias após exposição para o conjunto de teste.
Dias após
RNA NN MSE MAE MAPE (%)
exposição
ELM 15 2041,898808 33,349942 46,18%
0 RBF 10 1606,672746 32,063082 35,27%
MLP 15 1523,538644 29,760663 36,85%
ELM 25 2162,972995 35,311591 48,79%
1 RBF 10 1593,28033 31,842931 35,44%
MLP 5 1569,63587 31,120483 37,95%
ELM 50 2214,593203 35,211553 48,62%
2 RBF 10 1666,646228 32,512244 37,22%
MLP 5 1565,57409 31,197129 37,60%
ELM 50 2185,821445 34,315263 47,79%
3 RBF 25 1702,122617 31,47756 37,35%
MLP 5 1503,867749 29,736454 37,31%
ELM 5 2193,067038 35,94354 50,20%
4 RBF 5 1768,107763 33,325148 37,89%
MLP 5 1479,305842 29,727494 36,57%
ELM 5 2213,636327 34,881424 48,74%
5 RBF 25 1710,674489 31,479345 36,74%
MLP 5 1480,279751 30,588676 37,31%
ELM 15 2276,543696 35,511867 49,54%
6 RBF 10 1761,524282 33,108893 36,80%
MLP 10 1486,359008 30,394615 36,19%
ELM 5 2182,15886 35,204567 48,55%
7 RBF 25 1604,961606 31,776372 36,23%
MLP 10 1494,840866 30,406635 37,03%
Pelos resultados da Tabela 1, pode ser notado que a rede com menor MAPE não é
obrigatoriamente a rede com menor MSE, como pode ser observado nos atrasos 0, 1 e 7.
Como o treinamento delas foi realizado com o objetivo de minimizar o MSE, foi adotado o
MSE como métrica absoluta para avaliação da qualidade dos resultados.
Ainda analisando os dados da Tabela 1, foi verificado que a MLP foi melhor que as demais
em todos os 8 experimentos realizados, o que confirma a superioridade da MLP nesse tipo de
problema. Cabe destacar que a rede ELM obteve os piores resultados em todos os cenários,
indicando que apesar do seu treinamento analítico garantir norma mínima dos pesos, isso não
foi suficiente para superar as demais redes.
Dentre todos os resultados obtidos, a previsão realizada para 4 dias após a exposição ao
poluente, pela MLP com 5 neurônios, foi a de menor MSE. Por sua vez, a pior previsão foi a
realizada para o atraso 6 pela ELM com 15 neurônios. A Figura 8 apresenta um gráfico
Boxplot com a dispersão dos resultados obtidos pelas 30 simulações realizadas em cada rede
para 4 dias após a exposição.
Analisando o gráfico da Figura 8 pode ser verificado que apesar dos resultados obtidos pela
MLP terem sido melhores que os obtidos pela ELM, a dispersão dos resultados foi maior que
na ELM, embora tenha sido de melhor desempenho geral. Por sua vez, a dispersão
apresentada pela RBF foi mínima.
Destaca-se ainda que foi realizado um teste de Friedman para o atraso 4 com o intuito de
verificar se os mesmos foram significativamente diferentes. Foram encontrados valores de p
próximos a 0, o que quer dizer que alterar o preditor (a rede neural aplicada) leva a resultados
distintos [22].
-281-
Track-B: Computational Mechanics
Fig. 8 - Gráfico Boxplot com a dispersão dos resultados para as previsões realizadas
com 4 dias após a exposição.
Fig. 9 - Número de internações por doenças respiratórias versus previsão realizada pela MLP com
5 neurônios para o atraso 4.
Como pode ser notado, entre os dias 60 e 80 há uma queda brusca no número total de
internações. As redes tiveram dificuldade em alcançar estes pontos, por apresentarem
comportamento diferente do geral da série. No estudo de [15], os autores já mencionaram este
tipo de dificuldade encontrada pelos modelos de previsão.
-282-
Proceedings TEMM2018 / CNME2018
CONCLUSÃO
Pelas simulações realizadas nesse estudo para a cidade de São Paulo/SP, Brasil, pode ser
concluído que as Redes Neurais Perceptron de Múltiplas Camadas (MLP) obtiveram os
melhores resultados. Além disso, os resultados para 4 dias após a exposição ao poluente
foram os de menor erro. A previsão de internações hospitalares por problemas respiratórios
devido à exposição ao MP10 é comumente tratada na literatura como um problema de
regressão estatística. A abordagem utilizando Redes Neurais Artificiais (RNA) é recente,
porém vem apresentando bons resultados. O desenvolvimento dessa abordagem pode
melhorar a análise do impacto da poluição atmosférica na saúde humana, que por sua vez
ajudará os governos a adotarem medidas de prevenção e combate a doenças respiratórias. Para
tanto, faz-se necessário a continuidade das pesquisas no tema, com a aplicação em diferentes
centros metropolitanos, o uso de outras arquiteturas de RNA, a comparação dos resultados
obtidos por esta abordagem com modelos de regressão estatísticas e a análise do impacto de
outros poluentes atmosféricos.
REFERÊNCIAS
[1]-WHO (World Health Organization), Evolution of WHO Air Quality Guidelines: Past,
Present and Future, Copenhagem, 2017, disponível em: <http://www.euro.who.int/__data/
assets/pdf_file/0019/331660/Evolution-air-quality.pdf>, acesso em 27 de março de 2018.
[2]-Tadano, Y.S., Siqueira, H.V., Antonini Alves, T., Unorganized machines to predict
hospital admissions for respiratory diseases, IEEE Computational Intelligence (LA-CCI),
2016 IEEE Latin American Conference on, 2016.
[3]-Tadano, Y.S., Antonini Alves, T., Silva, N.S.S., Siqueira, H.V., Impacto da poluição
atmosférica e das alterações climáticas na saúde populacional utilizando redes neurais
artificiais, Revista da Associação Portuguesa de Análise Experimental de Tensões 29, 2017,
p. 35-42.
[4]-Caselli, M., Trizio, L., Gennaro, G., Ielpo, P., A simple feedforward neural network for
the PM 10 forecasting: comparison with a radial basis function network and a multivariate
linear regression model, Water, air, and soil pollution, Vol. 201, Nº 1-4, 2009.
[5]-Moustris, K.P., Larissi, I.K., Nastos, P.T., Koukouletsos, K.V., Paliatsos, A.G.,
Development and application of artificial neural network modeling in forecasting PM 10
levels in a Mediterranean city, Water, air, and soil pollution, Vol. 224, Nº 8, 2013.
[6]-Sayegh, A., Munir, S., Habeebullah, T.M., Comparing the Performance of Statistical
Models for Predicting PM10 Concentrations, International journal of Aerosol and Air Quality
Research (AAQR), 2014.
[7]-Kassomenos, P., Petrakis, M., Sarigiannis, D., Gotti, A., Karakitsios, S., Identifying the
contribution of physical and chemical stressors to the daily number of hospital admissions
implementing an artificial neural network model, Air Quality, Atmosphere & Health (2011),
v.4 p. 263-272.
[8]-Çapraz, O., Deniz, A., Dogan, N., Effect of air pollution on respiratory hospital
admissions in Istanbul, Turkey, 2013 to 2015, Chemosphere, 2017.
[9]-Haykin, S., Redes neurais: princípios e prática, Bookman Editora, 2007.
-283-
Track-B: Computational Mechanics
-284-