Você está na página 1de 4

PUVR-ICEx-VFI Universidade Federal Fluminense Tópicos Especiais em Fı́sica I

Análise e Predição Epidemiológica


do Vı́rus da Dengue via Séries
Temporais
Victor Dieguez Correa victordieguez@id.uff.br

nálises epidemiológicas são estratégias da autorregressão, da integração e da média móvel

A primordiais ao entendimento do avanço


e do impacto das enfermidades tanto
em termos de saúde, quanto em termos so-
associados ao processo e ao tipo de dado que temos.

Perspectivas sobre os nossos dados e


cioeconômicos. Para isso, a principal tática estratégias
utilizada neste trabalho é a visualização de tais
ocorrências via Séries Temporais e como pode- Muitos são os problemas que podemos encon-
mos realizar predições temporais da evolução trar ao realizarmos o estudo analı́tico de Séries
de casos de Dengue em populações, afim de Temporais. Os principais encontrados estão relacio-
traçar os cenários de compreensão do vı́rus e nados às estruturas periódicas, cı́clicas e residuais de
seu espalhamento. nosso sinal, isto é, o seu caráter interpretativo para,
assim, podermos realizar a correta contextualização
e predição pela relação estreita com os momentos
O que é uma Série Temporal estatı́sticos.
Percebemos que há uma pobreza de dados relacio-
Uma Série Temporal é um conjunto de data nando os casos de Dengue em diversas regiões, tanto
points indexados temporalmente, seja a frequência do paı́s quanto do mundo. Por conta disso, tomamos
que for. O principal objetivo de realizar uma visua- dados de três locais: San Juan, Iquitos e Campinas,
lização temporal de nossas informações é a predição, que foram encontrados publicamente na plataforma
isto é, a possibilidade de dizer o comportamento kaggle. A não categorização temporal correta faz com
futuro daquele evento. que tenhamos picos e correlações de dados que não
existem ou que existiam e não estão mais expostos,
Análise da Série Temporal
modificação esta ocorrida por conta do estreito laço
temporal que nossas grandezas possam vir a ter(visto
Para analisarmos e realizarmos a predição de
pelo papel do operador defasagem em nosso modelo
nossa Série Temporal, utilizamo um modelo es-
em (1).
tatı́stico denominado ARIMA, o qual é um processo
Por conta disso, realizarmos predições essencial-
definido por
mente autorregressivas e de caráter diário, prevendo
p q
! !
1−
X
i
ϕi L d
(1 − L) Xt = 1+
X
i
θi L (1 − L)d ϵt
apenas um dia a frente do requerido. Isso fora ne-
i=1 i=1 cessário, pois o caráter de short-memory de nosso
(1) sinal com a limitação da falta de estrutura clara e
em que Li é o operador defasagem, θi , ϕi os autocorrelações perdidas, fez com que as análises
parâmetros da média móvel e da autorregressão, res- canônicas e os forecastings realizados em cima da
pectivamente, e ϵt o termo de erro associado. Ade- evolução dos dados fosse dificultado pela perda de
mais, (p, d, q) é o grau(tamanho), respectivamnte, informação estatı́stica.

UFF •Departamento de Fı́sica de Volta Redonda. página 1 of 4


PUVR-ICEx-VFI Universidade Federal Fluminense Tópicos Especiais em Fı́sica I

Resultados Conclusão

Os resultados encontrados encontram-se apre- Ao fim, percebemos que o nosso propósito de


sentados na Figura (1) para os casos internacionais realizarmos predições de casos epidemiológicos de
e na Figura (2) para o caso nacional. Ademais, Dengue teve o empecilho da própria qualidade
podemos ver na Tabela (2) as medidas de erros do dado coletado. Este é um problema comum
associada ao MSE. em que M SE é definido como em toda área que necessita de uma estatı́stica,
pois a qualidade do dado determina não só suas
Local MSE propriedades intrı́nsecas, mas também a relação e a
Iquito 6.963 evolução temporal, fatores estes primordiais para
San Juan 5.935 nós neste trabalho.
Campinas 760.140 Ainda que isto tenha vindo a ocorrer, consegui-
Tabela 1: Cidades e MSE associado por predição reali- mos realizar boas predições ao partirmos para uma
zada análise em menores escalas temporais, isto é, feito
de forma diária, e de maneira recursiva, isto é, se
n aproveitando dos dados já conseguidos e colocando
1 X 
como ponderação para as futuras predições.
M SE = Xi − X̂i
n É notória a limitação de nosso modelo, o caráter
i=1
futuro deste trabalho visa tanto a melhor coletagem
em que Xi são os dados observaos, X̂i os dados pre- de dados, como também a adaptação de nosso modelo
vistos e n o tamanho de nossa amostra prevista. De para maiores flutuações, picos e, por sua vez, uma
tal maneira, notamos que as maiores variações fo- maior memória para que assim possamos prever uma
ram para Campinas, ainda que esta cidade apresente janela temporal maior.
também o maior número de casos entre todas as cita-
das, ou seja, em termos de normalização, ainda que o Referências
número distoe consideravelmente, estamos em termos
proporcionalmente coerentes. Todavia, conforme po- (1) Wei, William WS. ”Time series analysis.”(2013).
demos visualizar na Figura (2), é perceptı́vel o atraso
temporal em nossa predição. Isso ocorre por conta (2) Chatfield, Chris. The analysis of time se-
da alta concentração de casos em épocas temporais ries: an introduction. Chapman and hall/CRC,
muito especı́ficas, o que é justificado pelo acúmulo 2003.
de casos e o lançamento no sistema em dias que não
são relacionados com a sua notificação. Casos de (3) Kirchgässner, Gebhard, Jürgen Wolters,
subnotificação e notificações tardias são um problema and Uwe Hassler. Introduction to modern time se-
muito presente no Sistema de Saúde brasileiro. Isso ries analysis. Springer Science Business Media, 2012.
provoca que os momentos estatı́sticos sofram uma
grande distorção temporal bruscamente, fazendo com (4) Pal, Avishek, and P. K. S. Prakash. Prac-
que o modelo não consiga adaptar seus fatores de tical time series analysis: master time series data
autorregressão para modelar corretamente tais picos, processing, visualization, and modeling using python.
ainda que tenhamos certo sucesso ao realizarmos isto Packt Publishing Ltd, 2017.
de forma diária.
A mesma análise pode ser feita para Iquitos, que
também encontramos um atraso temporal, ainda
que não tão acentuado, em nossa análise, e o motivo
também é o mesmo, uma vez que este apresenta picos
muito mais acentuados que aqueles encontrados em
San Juan, vistos ambos na Figura (1).
Com isso, percebemos que a correta colocação do
dado em termos temporais faz com que não tenha-
mos concentrações que perturbem as informações
estatı́sticas que cada um deles pode vir a contribuir
em nossa análise.

UFF •Departamento de Fı́sica de Volta Redonda. página 2 of 4


PUVR-ICEx-VFI Universidade Federal Fluminense Tópicos Especiais em Fı́sica I

Figura 1: Dados Previstos e esperados de casos de Dengue em San Juan e Iquito

UFF •Departamento de Fı́sica de Volta Redonda. página 3 of 4


PUVR-ICEx-VFI Universidade Federal Fluminense Tópicos Especiais em Fı́sica I

Figura 2: Dados Previstos e esperados de casos de Dengue em Campinas

UFF •Departamento de Fı́sica de Volta Redonda. página 4 of 4

Você também pode gostar