Você está na página 1de 161

81,9(56,'$'(&$7Ï/,&$'(%5$6Ë/,$

352*5$0$'(3Ï6*5$'8$d­2675,&726(168(0*(67­2'2
&21+(&,0(172('$7(&12/2*,$'$,1)250$d­2


6XSRUWHj'HFLVmRSDUD9LJLOkQFLD
(SLGHPLROyJLFDEDVHDGRHP0RGHOR3UHGLWLYR
GH6XUWRVGH'HQJXHXWLOL]DQGR5HGHV1HXUDLV
$UWLILFLDLV



Giovanni Gondim de Castro

BRASÍLIA
2005
Giovanni Gondim de Castro

6XSRUWHj'HFLVmRSDUD9LJLOkQFLD
(SLGHPLROyJLFDEDVHDGRHP0RGHOR3UHGLWLYR
GH6XUWRVGH'HQJXHXWLOL]DQGR5HGHV1HXUDLV
$UWLILFLDLV

Dissertação apresentada ao

6WULFWR6HQVX em
Programa de Pós-Graduação
Gestão do
Conhecimento e da Tecnologia da
Informação da Universidade Católica
de Brasília, como requisito parcial
para obtenção do grau de Mestre em
gestão do conhecimento e da
tecnologia da informação.

Orientador: PROF. DR. ROGÉRIO ALVARENGA


Co-orientador: PROF. DR. HÉRCULES ANTÔNIO DO PRADO

BRASÍLIA
2005
'(',&$7Ï5,$

Aos dois Anjos (,QPHPRULDP) que, passando pela minha vida, iluminaram-na com a sua
presença e deixaram saudades profundas.
Adilson Roberto Moreira – 19/08/1963 a 11/10/2001
Larissa Carelli de Araújo – 01/02/1986 a 19/10/2001
$*5$'(&,0(1726

Ao Senhor Deus pela saúde, força, iluminação e imensa proteção, sem o qual nada é
possível. Por me ter colocado em contato com pessoas fantásticas e por me agraciar com a
oportunidade de participar de algo tão belo, e que por vezes esquecemos tão facilmente o quão
maravilhoso é encontrar amigos em um ambiente de conhecimento.

À minha família pela paciência e compreensão, nas horas em que tive que me afastar em
função dos trabalhos desta dissertação. E, em especial, aos meus pais, que sempre apoiaram,
incentivaram e souberam passar aos filhos, valores de honestidade, paciência, perseverança e
fé. Ao meu irmão Rogério e à minha namorada Lenita Meireles, agradeço profundamente pelo
carinho.

Aos orientadores Rogério Alvarenga e Hércules Antônio do Prado, o meu agradecimento


pelo incentivo e apoio, sem os quais a realização desta dissertação não teria sido possível.

À Gleycione Gundim Dutra, o meu muito obrigado pelo carinho e amizade gastos com um
hóspede que esteve presente, diversas vezes, em sua residência.

À ‘Família Politec’ que, através de seus funcionários Hiraclis Nicolaidis Júnior, Nelson de
Sousa e Silva Neto, Román Dario Cuattrin e Ricardo Ajax Dias Kosloski, me cativou, na
cidade de Brasília.

Às amigas e funcionárias da Universidade Católica de Brasília, Janina Silva e Georgiane


Pessoa Alcoforado Jordão, por todo apoio e incentivo.

A todos os colegas da COMDATA e da Secretaria Municipal de Saúde, que me


auxiliaram, após a digitação de todas as tabelas, na conferência e validação dos dados.

Meus agradecimentos especiais ao Sr. Dr. Alaor Moacyr Dall'Antonia Júnior, pela
autorização de doação dos parâmetros climáticos necessários, e aos meteorologistas do 10º
DISME, pelo auxílio na adaptação da escala anemométrica de %HDXIRUW para esta dissertação.

Agradeço, também, ao Prof. Gercino Monteiro Filho, do Centro Integrado de Ensino, pela
consultoria e revisão dos cálculos nesta dissertação.
'867,17+(:,1'
3RHLUDDRYHQWR
I CLOSE MY EYES
Eu fecho os meus olhos
ONLY FOR A MOMENT AND THE MOMENT’S GONE
Somente por um momento e esse momento se vai
ALL MY DREAMS
Todos meus sonhos
PASS BEFORE MY EYES IN CURIOSITY
Passam diante dos meus olhos por curiosidade
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
SAME OLD SONG
A mesma velha canção
JUST A DROP OF WATER IN A ENDLESS SEA
Apenas uma gota d’água em um mar sem fim
ALL WE DO
Todos nós
CRUMBLES TO THE GROUND AND WE REFUSE TO SEE
Esfarelamos no chão embora recusemos a ver
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
DON´T HANG ON
Não se perca
NOTHING LAST FOREVER BUT THE EARTH AND SKY
Nada dura para sempre exceto o céu e a terra
IT SLIPS AWAY
Ela se vai
AND ALL YOUR MONEY WON´T ANOTHER MINUTE BY
E todo seu dinheiro não comprará outro minuto
DUST IN THE WIND, ALL WHE ARE IS DUST IN THE WIND
Poeira ao vento, tudo o que somos é poeira ao vento
DUST IN THE WIND
Poeira ao vento
EVERYTHING IS DUST IN THE WIND
Tudo é poeira ao vento
GRUPO: KANSAS
5(6802
A Gestão da Vigilância Epidemiológica, para Dengue, pode ser realizada, através da
inclusão de modelos preditivos que auxiliem ao gestor da área de saúde, na tomada
de decisão, para o combate a epidemias (surtos). Com esse suporte, o tomador de
decisões pode ter o apoio técnico necessário para designar seus limitados recursos

brasileiro ($HGHV DHJ\SWL) dessas doenças. Existem modelos relatados que


humanos e financeiros, ao tratamento dos pacientes e ao combate ao vetor urbano

alcançaram algum sucesso na predição, em áreas como a financeira e a


epidemiológica. Nesta dissertação, utilizou-se Descoberta de Conhecimentos em
Base de Dados com Mineração de Dados, para realizar um estudo de caso, na
construção de um modelo de predição, baseado em séries temporais, para a cidade
de Goiânia-Go, e para comparar os resultados obtidos nesse modelo, com os do
Diagrama de Controle, que é a técnica atual utilizada no Brasil.

(casos confirmados) e a média dos parâmetros climáticos (definida D SULRULde duas


Foram utilizados os dados do Sistema de Informações de Agravos de Notificação

semanas), coletados pelo 10º Distrito de Meteorologia daquela cidade, no período


de 01/01/2001 a 30/04/2004, por semana epidemiológica.
O uso das séries temporais se deve à possibilidade de previsões de novos estados,
a partir da análise dos valores passados. Consistem em medidas ou observações,
obtidas a partir de um fenômeno, e que são realizadas seqüencialmente, sob um
intervalo de tempo.

MLP – 0XOWL/D\HU 3HUFHSWURQ, com algoritmo de aprendizado de retropropagação


As séries produzidas foram representadas na forma de redes neurais artificiais, tipo

(EDFNSURSDJDWLRQ) e, nele, aplicada a técnica de janelamento. O modelo obtido


possibilita a detecção prévia do início do surto, com margem de confiança
satisfatória. Evidenciou-se a sazonalidade da série histórica de Dengue para o
período, com valores, também, satisfatórios, que possibilitam e credenciam a
aplicabilidade do modelo, na predição de surtos de Dengue, para a cidade de
Goiânia-Go.

3DODYUDV&KDYH: Mineração de Dados; Predição; Séries Temporais; Janelamento;
Dengue; Redes Neurais Artificiais.

I


$%675$&7

The management of epidemiological surveillance for Dengue or Yellow Fever can be


performed by incorporating predictive models to help the health policy makers to take
decisions concerning the control of epidemics (outbreaks). With this tool he may
have the necessary technical support to allocate his limited human and financial

($HGHV DHJ\SWL) for these diseases. Models have been reported reaching some
resources to the patients care and/or the control of the Brazilian urban vector

success in predicting financial and epidemiological fields. In our thesis we have used
Knowledge Database Discovery, with datamining, using temporal series, in order to
build up a predictive model for the city of Goiania - Goias in central Brazil to compare
results obtained by the Control Diagram that is the standard technique applied in
epidemiological studies in Brazil.
We used data from Sistema de Informações de Agravos de Notificação (confirmed
cases) and the mean of climatic parameters (defined a priori in two weeks) colleted
by 10º Distrito de Meteorologia of this city, from the period of 01/01/2001 to
30/04/2004, by epidemiological week. All confirmed cases refer to Dengue since
there was no report of Yellow Fever during the study period.
The use of temporal series aims to predict new values taking into account the
analyses of previous values. The temporal series are measures or observations
obtained from phenomena and which are sequentially produced in a time interval.

MLP – MultiLayer Perceptron as a EDFNSURSDJDWLRQ learning algorithmic using the


The temporal series were represented in artificial neural networks format such as

windowing technique. The model obtained made possible an early warning of


outbreak with reliable confidence limit. There was evidence of the seasonality of the
Dengue temporal series, for the period, with satisfactory values that made possible
to recommend this predictive model for Dengue outbreaks in municipality of Goiania-
Goias.

.H\:RUGV Datamining; prediction; forecasting; series; windowing; dengue; artificial


neural network


II
680È5,2
5(6802  ,
$%675$&7  ,,
/,67$'(),*85$6 9
/,67$'(48$'526 9,,
/,67$'(48$'526 9,,
/,67$'(7$%(/$6  9,,,
/,67$'(*5È),&26  ,;
/,67$'(6,*/$6 ;
/,67$'($%5(9,$d®(6;,,
 ,1752'8d­2 
1.1 EXPOSIÇÃO DO ASSUNTO .............................................................................................5
1.2 INTRODUÇÃO AO PROBLEMA ........................................................................................5
1.3 DEFINIÇÃO DA PESQUISA .............................................................................................7
1.4 DELIMITAÇÃO DA PESQUISA ........................................................................................7
1.5 JUSTIFICATIVA DA PESQUISA ........................................................................................8
1.6 REFERENCIAL TEÓRICO ................................................................................................8
1.7 OBJETIVOS ...................................................................................................................9
 *HUDO 
 (VSHFtILFRV 
1.8 HIPÓTESE ...................................................................................................................10
 +LSyWHVHSULQFLSDO
 +LSyWHVHVVHFXQGiULDV 
1.9 ORGANIZAÇÃO DO DOCUMENTO ................................................................................11
 5(9,6­2'(/,7(5$785$ 
2.1 DADOS, INFORMAÇÃO E CONHECIMENTO...................................................................12
2.2 GESTÃO DO CONHECIMENTO E TECNOLOGIA DA INFORMAÇÃO ..................................14
2.3 SISTEMAS DE SUPORTE À DECISÃO ............................................................................16
 $X[tOLRjGHFLVmRFRPSXWDFLRQDO 
2.4 DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS .............................................17
 ,QWURGXomR
 ÈUHDVGH$SOLFDomR 
2.5 MINERAÇÃO DE DADOS .............................................................................................20
 7pFQLFDVSUHGLWLYDVGD0' 
 3UREOHPDVGHVDILRVYDQWDJHQViUHDVGHDSOLFDomRHWpFQLFDVGD0' 
2.6 CRISP-DM PARA MINERAÇÃO DOS DADOS ................................................................29
2.7 REDES NEURAIS ARTIFICIAIS.......................................................................................31
 ,QWURGXomR
 &DUDFWHUtVWLFDVHDUTXLWHWXUDVGDV51$V
 5HGHV0XOWL/D\HU3HUFHSWURQ 
2.8 GESTÃO DO CONHECIMENTO SOBRE OS EFEITOS DO CLIMA NA SAÚDE HUMANA.........40
2.9 O MODELO DE NOTIFICAÇÃO BRASILEIRO ...................................................................43
 'LDJUDPDVGHFRQWUROH 
2.10 DENGUE E SEU VETOR................................................................................................45
 'HQJXH 
2.11 INQUÉRITOS SOROLÓGICOS.........................................................................................50
2.12 ESTUDOS RELATADOS ................................................................................................52

III
 (VWXGRDSUHVHQWDGRQD66%'0¶
 0RGHOR3DQ(XURSHXGH6D~GH 
 0RGHOR$OHPmRGH6D~GH
 2XWURVPRGHORVGHSUHGLomRHWUDEDOKRVHQFRQWUDGRV 
 7UDEDOKRVHQFRQWUDGRVUHODWLYRVDR%UDVLO 
 2XWUDVSXEOLFDo}HVUHIHUHQWHVD'HQJXH
 (VWXGRVHSLGHPLROyJLFRVHP*RLkQLD
 0(72'2/2*,$ 
3.1 CARACTERIZAÇÃO DA PESQUISA ................................................................................62
 &ODVVLILFDomRGD3HVTXLVD 
 8QLYHUVRGD3HVTXLVD 

 $ERUGDJHP$GRWDGD 


3.2 MATERIAL E MÉTODOS ..............................................................................................63

 'HVFULomRGRPpWRGR&5,63'0
 &ROHWDGH'DGRV
 5HSUHVHQWDomRGDDQiOLVHGRVGDGRV 
 $QiOLVHGRVJUiILFRVHUHVXOWDGRVHQFRQWUDGRVQDSUHGLomR 
3.3 MODELO PROPOSTO ...................................................................................................66
3.4 ENTENDIMENTO DO NEGÓCIO .....................................................................................68
 2EMHWLYRV 
 $YDOLDomRGRVUHFXUVRVDWXDLV 
 2EMHWLYRVDVHUHPDOFDQoDGRVSHODPLQHUDomRGHGDGRV 
3.5 ENTENDIMENTO DOS DADOS ......................................................................................72
 'DGRV,QLFLDLV 
 'HVFULomRGRVGDGRV 
 ([SORUDomRGRVGDGRV
 4XDOLGDGHGRVGDGRV 
 $VSHFWRVGD*&QRHQWHQGLPHQWRGRVGDGRV 
3.6 PREPARAÇÃO DOS DADOS ........................................................................................101
3.7 MODELAGEM ...........................................................................................................102
3.8 APRESENTAÇÃO DOS RESULTADOS...........................................................................116
 $1È/,6('265(68/7$'26 
 &21&/86®(6(68*(67®(63$5$75$%$/+26)878526
5.1 CONSIDERAÇÕES FINAIS ...........................................................................................121
5.2 DESTAQUES E CONTRIBUIÇÃO DA PESQUISA .............................................................121
5.3 SUGESTÕES PARA NOVOS TRABALHOS DE PESQUISA .................................................123
5()(5Ç1&,$6%,%/,2*5È),&$6 
*/266È5,2 ',&,21È5,2'(7(5026 
$1(;2$62/,&,7$d­2'('2$d­2'('$'26$26(&5(7È5,2081,&,3$/'(6$Ò'('(
*2,Æ1,$*2 
$1(;2%62/,&,7$d­2'('2$d­2'('$'26$2',5(72535(6,'(17('$&20'$7$

$1(;2&62/,&,7$d­2'('2$d­2'('$'26&/,0È7,&26$20,1,67e5,2'$
$*5,&8/785$('2$%$67(&,0(172 
$1(;2'&$/(1'È5,2(3,'(0,2/Ï*,&2'($
$1(;2((6&$/$$1(020e75,&$%($8)257$'$37$'$ 

IV
/,67$'(),*85$6
FIGURA 1 - PROCESSO DE CONSTRUÇÃO DE UMA BASE DE REGRAS DE UMA REGIÃO ADAPTADA DE
AGRAWAL E PSAILA (1995, PP.1-2, COM ALTERAÇÕES)......................................................27
FIGURA 2 - REPRESENTAÇÃO DOS QUATRO NÍVEIS DA METODOLOGIA CRISP-DM (SPSS, 2000,
P.09, TRADUÇÃO NOSSA) ....................................................................................................30
FIGURA 3 - REPRESENTAÇÃO DO NÍVEL FASES DA CRISP-DM (SPSS, 2000, P.13, TRADUÇÃO
NOSSA)...............................................................................................................................31
FIGURA 4 - COMPONENTES DO NEURÔNIO BIOLÓGICO (BRAGA; LUDERMIR; CARVALHO,
2000, P.06).........................................................................................................................31
FIGURA 5 - COMPONENTES DO NEURÔNIO DE MCCULLOCH E PITTS (BRAGA; LUDERMIR;
CARVALHO, 2000, P.09).................................................................................................32
FIGURA 6 - ARQUITETURAS DE REDES NEURAIS ARTIFICIAIS – RETIRADA DE HAYKIN (2001,
PP.47-49) ...........................................................................................................................35
FIGURA 7 - FLUXO DE PROCESSAMENTO DO ALGORITMO %$&.3523$*$7,21 ............................37
FIGURA 8 PREDIÇÃO DE VOLUME DE VENDAS DURANTE CINCO SEMANAS UTILIZANDO RNA COM
A TÉCNICA DE JANELAMENTO (BRAGA; LUDERMIR; CARVALHO, 2000, P.226) .......38
FIGURA 9 - PREDIÇÃO REALIZADA POR ALVARENGA E OLIVEIRA JUNIOR E CARVALHO (2003,
P.19) ..................................................................................................................................39
FIGURA 10 - GRÁFICO DA CURVA DE APRENDIZADO REALIZADA POR OLIVEIRA E ALVARENGA
(2003, P.10) .......................................................................................................................40
FIGURA 11 - GRÁFICO DA PREDIÇÃO REALIZADA POR OLIVEIRA E ALVARENGA (2003 P.11)......40
FIGURA 12 - MUDANÇAS CLIMÁTICAS E SEUS EFEITOS NA SAÚDE HUMANA (OMS, 2003D, P.30,
TRADUÇÃO NOSSA, COM ALTERAÇÕES) ..............................................................................41
FIGURA 13 – DIAGRAMA DE CONTROLE E CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA, GOIÂNIA – GO, 2001 (SIQUEIRA JUNIOR, 2001, P.23)......................45
FIGURA 14 - ASPECTO DE UM $('(6$(*<37, (MUNSTERMANN, 1995) ...............................46
FIGURA 15 ASPECTO DE UM $('(6$/%23,&786 (CRUZ, 2004) ...............................................46
FIGURA 16 - TIPOS DE TRANSMISSÃO INDIRETA RECONHECIDA PARA DENGUE (OMS, 2003D,
P.16, TRADUÇÃO NOSSA, COM ALTERAÇÕES)......................................................................47
FIGURA 17 – PAÍSES COM PRESENÇA DE DENGUE EM 2003 (OMS ,2004C, P.74)........................48
FIGURA 18 - SOROTIPOS CIRCULANTES DO VÍRUS DA DENGUE POR ESTADOS, BRASIL, 2004 (SVS ,
2005, P.02).........................................................................................................................49
FIGURA 19 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE
PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW , 1998)............................................54
FIGURA 20 - FORMATO DE ENVIO DE DADOS DOS HOSPITAIS AO DEPARTAMENTO DE SAÚDE
PÚBLICA ALEMÃO (SCHUMANN; LÓPEZ; GRAW, 1998).............................................54
FIGURA 21 - ÓBITOS OBSERVADOS E ESTIMADOS POR REGRESSÃO BINOMIAL NEGATIVA E REDE
NEURAL - CEARÁ, JULHO DE 1991 A DEZEMBRO DE 1995 (PENNA, 2004, P.355) .............56
FIGURA 22 - CASOS RELATADOS DE DENGUE NO BRASIL NOS ANOS DE 1986 A 2003 (SIQUEIRA
JÚNIOR, 2005, P.49).........................................................................................................57
FIGURA 23 - NÚMERO DE CASOS RELATADOS DE AGRAVO, ÓBITOS, HOSPITALIZAÇÕES E ANO DA
TIPIFICAÇÃO DOS CASOS DE DENGUE NO BRASIL (SIQUEIRA JÚNIOR, 2005, P.50).........58
FIGURA 24 -PREVALÊNCIA DE DENGUE EM GOIÂNIA, 2001 (SIQUEIRA JÚNIOR (7$/, 2004) 61
FIGURA 25 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA SEGUNDO REGIÃO, BRASIL, 2004 (SVS, 2005) P.01................................66
FIGURA 26 - DADOS PRELIMINARES DOS CASOS NOTIFICADOS DE DENGUE POR SEMANA
EPIDEMIOLÓGICA DA REGIÃO CENTRO-OESTE, BRASIL, 2003-2004 (SVS ,2005) P.5 .........67
FIGURA 27 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA,

V
2003 A 2004, (FRANÇA; ALVES SILVA; AMORIM SILVA, 2004, P.52).....................67
FIGURA 28 TOTAL ANUAL DE REGISTROS DE DENGUE, SINAN, GOIÂNIA, 2001-2004 ...............79
FIGURA 29 – PERCENTUAL ANUAL DE REGISTROS DE DENGUE, APÓS SELEÇÃO, SINAN,
GOIÂNIA, JAN/2001 A ABR/2004 .......................................................................................80
FIGURA 30 - TIPOS E PERCENTUAL DE DENGUE, GOIÂNIA, 2001 A 2004 .....................................80
FIGURA 31 – PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO DENGUE DO SINAN,
GOIÂNIA, 2001-2004 .........................................................................................................81
FIGURA 32 - PERCENTUAL DO TOTAL DAS RESPOSTAS NO CAMPO VACINADO, SINAN,
GOIÂNIA, 2001-2004 .........................................................................................................82
FIGURA 33 - PERCENTUAL POR GÊNERO EM GOIÂNIA, IBGE, 2000 (A); PERCENTUAL POR
GÊNERO NA ANÁLISE DO SINAN, GOIÂNIA, 2001 A 2004 ..................................................83
FIGURA 34 – CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE HABITANTES POR BAIRRO,
GOIÂNIA, 2001 A 2004.......................................................................................................84
FIGURA 35 – PERCENTUAL DE FAIXA ETÁRIA POR ANO, SINAN, GOIÂNIA, 2001-2004 ..............85
FIGURA 36 – PERCENTUAL POR FAIXA ETÁRIA – GOIÂNIA, IBGE, 2000 (A) E PERCENTUAL DE
CASOS CONFIRMADOS DE DENGUE – GOIÂNIA, SINAN, 2001 A 2004.................................86
FIGURA 37 – CASOS CONFIRMADOS DE DENGUE POR BAIRROS VERSUS CEMITÉRIOS EXISTENTES,
GOIÂNIA, 2001-2004 .........................................................................................................87
FIGURA 38 – CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE LOTES VAGOS POR
BAIRROS, GOIÂNIA, 2001-2004..........................................................................................87
FIGURA 39 - CASOS CONFIRMADOS DE DENGUE VERSUS PERCENTUAL DE ÁREA VERDE POR
BAIRRO, GOIÂNIA, 2001-2004............................................................................................88
FIGURA 40- CASOS CONFIRMADOS DE DENGUE VERSUS NÚMERO DE FEIRAS LIVRES SEMANAIS
POR BAIRRO, GOIÂNIA, 2001-2004.....................................................................................89
FIGURA 41 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE HOSPITAIS POR BAIRRO,
GOIÂNIA, 2001-2004 .........................................................................................................89
FIGURA 42 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE ESCOLAS, GOIÂNIA,
2001- 2004 ........................................................................................................................90
FIGURA 43 - CASOS CONFIRMADOS DE DENGUE VERSUS QUANTIDADE DE PRÉDIOS POR BAIRRO,
GOIÂNIA, 2001- 2004.........................................................................................................91
FIGURA 44 – PERCENTUAL DE CASOS CONFIRMADOS POR SEMANA EPIDEMIOLÓGICA, GOIÂNIA,
2001 A 2003.......................................................................................................................91
FIGURA 45 – SÉRIE TEMPORAL DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA, 2001 A 2004 93
FIGURA 46 – DIAGRAMA DE CONTROLE DE DENGUE POR SEMANA EPIDEMIOLÓGICA, SMSGO,
GOIÂNIA-2004 .................................................................................................................103
FIGURA 47 - ARQUITETURA DE REDE UTILIZADA, NO ($6<113/86 PARA PREDIÇÃO
EPIDEMIOLÓGICA DE DENGUE ..........................................................................................106
FIGURA 48 – GRÁFICO DA CURVA DE APRENDIZADO – RODADA 1............................................106
FIGURA 49 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 1 .....107
FIGURA 50– GRÁFICO DA CURVA DE APRENDIZADO – RODADA 2 ............................................110
FIGURA 51 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 2.....111
FIGURA 52 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 3 .....112
FIGURA 53 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 3 .....113
FIGURA 54 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 3 .....115
FIGURA 55 – CASOS CONFIRMADOS / PREVISTOS DE DENGUE, GOIÂNIA, 2004 – RODADA 3 .....116
FIGURA 56 – COMPARAÇÃO DAS PREDIÇÕES DAS TÉCNICAS: DIAGRAMA DE CONTROLE E
MINERAÇÃO DE DADOS PARA O PERÍODO DE DOAÇÃO.......................................................118

VI
/,67$'(48$'526
QUADRO 1 - QUADRO DE TÉCNICAS DE MD DESENVOLVIDO A PARTIR DOS AUTORES FAYYAD E
PIATETSKY-SHAPIRO E SMYTH (1996); TURBAN E RAINER E POTTER (2004, P.159) E
DELMATER E HANCOCK (2001)..........................................................................................22
QUADRO 2 - DICIONÁRIO DE DADOS DA TABELA DO SINAN, REFERENTE A PESQUISAS SOBRE O
DENGUE .............................................................................................................................73
QUADRO 3 - DICIONÁRIO DE DADOS SOBRE OS DADOS DO VETOR ..............................................75
QUADRO 4 - DICIONÁRIO DE DADOS DA SEPLAN......................................................................75
QUADRO 5 - DICIONÁRIO DE DADOS DA COMDATA ................................................................76
QUADRO 6 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AS SEMANAS EPIDEMIOLÓGICAS....77
QUADRO 7 - DICIONÁRIO DE DADOS DA TABELA REFERENTE AOS DADOS DO 10º DISME ..........77
QUADRO 8- CLASSIFICAÇÃO DOS PERÍODOS ENDÊMICOS E EPIDÊMICOS DE GOIÂNIA ANOS 2001 A
2004 ..................................................................................................................................98
QUADRO 9 - DICIONÁRIO DE DADOS DA TABELA CLASSIFICADORFINAL...........................101
QUADRO 10 – ANÁLISE DOS CASOS CONFIRMADOS DE DENGUE, GOIÂNIA, 2001 A 2004 .........116
QUADRO 11 – ANÁLISE DOS CASOS DE DENGUE VERSUS VARIÁVEL, GOIÂNIA, 2001 A 2004....117

VII
/,67$'(7$%(/$6
TABELA 1 - TOTAL DE REGISTROS ANTES, DEPOIS DA SELEÇÃO E A PERDA .................................79
TABELA 2 - ANÁLISE DOS RESULTADOS DA PREVISÃO FEITA ATRAVÉS DO DIAGRAMA DE
CONTROLE DA SECRETARIA MUNICIPAL DE SAÚDE DE GOIÂNIA - GOIÁS, 2004...............104
TABELA 3 – ANÁLISE DOS RESULTADOS DA PREVISÃO – TÉCNICA 1.........................................106
TABELA 4 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 2.........................................110
TABELA 5 – ANÁLISE DOS RESULTADOS DA PREVISÃO - RODADA 3.........................................113

VIII
/,67$'(*5È),&26
QUADRO DE GRÁFICOS 1 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2001..........................................................................................................94
QUADRO DE GRÁFICOS 2 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2002..........................................................................................................95
QUADRO DE GRÁFICOS 3 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2003..........................................................................................................96
QUADRO DE GRÁFICOS 4 - CASOS CONFIRMADOS DE DENGUE VERSUS MÉDIAS DE VARIÁVEIS
CLIMÁTICAS DE 2004..........................................................................................................97
QUADRO DE GRÁFICOS 5 – TREINAMENTO PROPOSTO – RODADA 2 ..........................................109

IX
/,67$'(6,*/$6
10º DISME 10º Distrito de Meteorologia
AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius)
CARESS (SLGHPLRORJLFDODQG6WDWLVWLFDO'DWD([SORUDWLRQ6\VWHP
CARLOS &DQFHU5HJLVWU\/RZHU6D[RQ\
COMDATA Companhia de Processamento de Dados do Município de Goiânia
CRISP-DM &URVV,QGXVWULDO6WDQGDUG3URFHVVIRU'DWD0LQLQJ
CSV &RPPD6HSDUDWHG9DOXH
DBF 'DWD%DVH)RUPDW
DCBD Descoberta de Conhecimento em Banco de Dados

'HFLVLRQ6XSSRUW6\VWHP
DH Dengue Hemorrágico
DSS
DW 'DWD:DUHKRXVLQJ
EI Era da Informação
EUA Estados Unidos da América
EWS (DUO\:DUQLQJ6\VWHPV
FHD Febre Hemorrágica do Dengue
FUNASA Fundação Nacional de Saúde
GC Gestão do Conhecimento
GIS *HRJUDSKLF,QIRUPDWLRQ6\VWHP
HBR +DUYDUG%XVLQHVV5HYLHZ
IA Inteligência Artificial

.QRZOHGJH'LVFRYHU\LQGDWDEDVHV
INEMET Instituto Nacional de Meteorologia
KDD
MD Mineração de Dados
MGCTI Mestrado em Gestão do Conhecimento e da Tecnologia da Informação
MLP 0XOWLOD\HU3HUFHSWURQ ouSHUFHSWURQPXOWLFDPDGDV
OMS Organização Mundial de Saúde
PD Índice pluviométrico ou precipitação (medida diária)
PIB Produto Interno Bruto
RNAs Redes Neurais Artificiais
SAMC 6RXWKHUQ$IULFD0DODULD&RQWURO
SAP Sistemas de Aviso Prévio
SEPLAN Secretaria Municipal de Planejamento
SIG Sistema de Informação Geográfica
SIG’S Sistemas de Informações Geográficas
SINAN Sistema de Informações de Agravos de Notificação
SIR 6XVFHSWLEOH,QIHFWHG,PPXQH
SMS Secretaria Municipal de Saúde
SMS-GO Secretaria Municipal de Saúde de Goiânia-GO
SSD Sistema de Suporte a Decisão
SUS Sistema Único de Saúde
TEMP Temperatura (média diária, valor em Graus Celsius)
TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius)
TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius)
UBV Ultra Baixo Volume
UCB Universidade Católica de Brasília
URA Umidade Relativa do Ar

X
URA Umidade relativa do ar (média diária, valor em percentual)
URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual)
URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual)
WHO :RUOG+HDOWK2UJDQL]DWLRQ

XI
/,67$'($%5(9,$d®(6
HJ (H[HPSOLJUDWLD), Por exemplo
i.e. Isto é


XII
5

 ,1752'8d­2

“Se GHVHQYROYLGD H DSOLFDGD FRP VXFHVVR D WHRULD H SUiWLFD GD JHVWmR GR
FRQKHFLPHQWR VH WRUQDUi XPD GLVFLSOLQD IXQGDPHQWDO SDUD HOLPLQDU HVSDoRV TXH OHYHP
DR DXPHQWR GH TXDOLGDGH QD VD~GH S~EOLFD SDUD WRGRV´ Dr. Ariel Pablos-Mendez,
Diretor do Departamento de Gestão e Compartilhamento do Conhecimento, da
Organização Mundial de Saúde, 2005.

 ([SRVLomRGR$VVXQWR

É necessário o suporte à decisão para vigilância epidemiológica, através de modelos


preditivos, que possam auxiliar o gestor da área de saúde, na tomada de decisão. Assim
ele pode designar seus limitados recursos humanos e financeiros para o tratamento dos
pacientes e para o combate ao vetor urbano de Dengue.

Existem relatos de modelos já utilizados com algum sucesso, na predição, em áreas


como a financeira (HJ ALVARENGA; OLIVEIRA JUNIOR; CARVALHO, 2003) e a
epidemiológica (HJ GILL, 1923 DSXG Organização Mundial de Saúde, 2004b) que
podem auxiliar no prognóstico de casos confirmados de Dengue através de técnicas
regressivas de Redes Neurais Artificiais.

A grande vantagem desses modelos preditivos é o preço baixo, quando não,


gratuito, das variáveis (i.e. dados eletrônicos) necessárias para predição. Justifica-se esta
afirmativa, pois os dados (HJ tomada do vetor, casos notificados) são coletados de forma
compulsória, por diversos órgãos municipais, estaduais e federais, em todo o território
brasileiro.

Nesta dissertação será abordado um modelo preditivo com a granularidade de casos


confirmados de Dengue que é maior que a convencional que trabalha com casos
notificados.

 ,QWURGXomRDR3UREOHPD

A :RUOG +HDOWK 2UJDQL]DWLRQ (WHO) ou Organização Mundial de Saúde (OMS)


(2004b, p.04) afirma que o conhecimento existente sobre a interação entre o clima e a
saúde, data da época de Aristóteles e a compreensão do assunto tem mais avançado a
6

cada ano. A habilidade de se predizer as interações entre o clima e as doenças infecciosas,


também tem melhorado nos últimos anos. Existe a tendência de se desenvolver modelos
que possibilitem a predição ou o monitoramento de epidemias. Se forem precisos, o seu
valor é inestimável.

O clima tem influência na transmissão de muitas doenças. Algumas delas estão


entre as que mais influenciam o número de óbitos, nos países em desenvolvimento (OMS,
2004b, p.08, 37). Especula-se que ondas de calor ou mudanças climáticas extremas
possam causar impactos significantes na disseminação de doenças contagiosas (OMS,
2004b, p.10).

Sabe-se que algumas doenças infecciosas, principalmente as disseminadas por


vetores (insetos), como o Dengue - estão geograficamente limitadas por padrões
ambientais (HJ clima, vegetação) (OMS, 2004b, p.10). São tradicionalmente conhecidas
como “doenças da pobreza” (PAIM, 2003, p.563) ou “doenças da modernidade”
(ANDRADE; DANTAS, 2004, p.01) e estão relacionadas a populações de baixo poder
aquisitivo e a países em desenvolvimento, (OMS, 2004b, p.37). (xistem algumas
exceções FRPR a Austrália e &ingapura. Dentre estas doenças está o Dengue que é
disseminado pelo seu vetor ($HGHV DHJ\SWL) e que possui influência sazonal (OMS,
2004b).

Na saúde pública, a epidemiologia é uma das áreas na qual o maior número de


estudos e publicações encontrados referentes ao Dengue, é realizado através de inquéritos
sorológicos e estudos estatísticos.

Os modelos de predição existentes e relatados (OMS, 2004b, 2003d, 2000, dentre


outros), utilizam, basicamente, dados históricos para detectar padrões de comportamento
e estimar seus valores no futuro. De forma genérica, empregam-se técnicas matemáticas
e/ou estatísticas para representar a realidade, na qual foram criadas. As estatísticas têm
sido usadas, com algum sucesso, para predição desses padrões.

A abordagem adotada neste trabalho visa explorar o uso das Redes Neurais
Artificiais para a construção de um modelo voltado à predição de casos confirmados de
Dengue e à comparação dos resultados obtidos com o Diagrama de Controle adotado no
Brasil.
7

Assim, a proposta é explorar o uso da técnica de janela de tempo, também


conhecida como janelamento, sobre série de dados temporais para a construção de
modelo preditivo que, com certa margem de confiança, consiga prever o número de casos
confirmados que irão ocorrer em um determinado período, a partir dos dados notificados
de Dengue, contidos no Sistema de Informações de Agravos de Notificação (SINAN) e de
medidas climáticas de uma cidade, neste caso, foi escolhido como objeto de estudo os
dados da cidade de Goiânia - Goiás.

Essa abordagem justifica-se por:

a) As instituições de saúde pública, em todo território brasileiro, notificam, ao


longo dos anos e de forma compulsória, ao Departamento de Vigilância Sanitária da
cidade a que pertencem e à Secretaria Estadual de Saúde de seu Estado, cerca de
trinta e cinco (35) doenças diferentes, determinadas por lei (dentre elas, o os casos
notificados de Dengue). As notificações são feitas na forma de registros
padronizados de prontuários médicos e digitalmente guardadas no SINAN, através
de uma coleção de dados disponíveis, na forma de banco de dados eletrônico
(FUNASA, 2002);

b) O vetor (Aedes aegypti) da doença tem influência sazonal.

 'HILQLomRGD3HVTXLVD

Predizer, por meio de um modelo baseado em Redes Neurais Artificiais, a


ocorrência de surtos urbanos causados pelos vetores: PRVTXLWR$HGHV possibilitando aos
gestores da área de saúde, suporte à decisão, para o planejamento de combate a
epidemias.

 'HOLPLWDomRGD3HVTXLVD

Cria um modelo para predição urbana de surtos de Dengue (OMS, 2004b, p.17), e
alimenta esse modelo com dados (i.e. parâmetros climáticos e pacientes confirmados)
Prediz a ocorrência de surtos em uma região, (OMS, 2004b, pp.15-16) e avalia seu valor
de predição (possibilita ao gestor, designar recursos humanos e/ou financeiros para o
tratamento dos pacientes, campanhas informativas e educativas e combate do vetor da

1
“Tipo de mosquito que pode transmitir doenças como a Febre Amarela e o Dengue” (OMS, 1996, p. 01).
8

doença em tela).

 -XVWLILFDWLYDGD3HVTXLVD

A cada dia, gera-se grande quantidade de dados médicos (registrados em


prontuários) e laboratoriais (resultados de exames) de pacientes atendidos por
profissionais de saúde em hospitais ou laboratórios. Esses dados representam as
condições médicas ou doenças que os pacientes apresentam e possibilitam a notificação
de casos de doenças transmissíveis. A notificação é importante, especialmente na
prevenção e disseminação de epidemias2 e pode ser feita de forma semanal, mensal e
anual (SCHUMANN; CHAVEZ; GRAW, 1998, p.01; OMS, 2004b, p.27).

A análise rápida dos dados assegura suporte epidemiológico a gestores de saúde


(OMS, 2004b), através de ações preventivas à disseminação ou ao surgimento de
epidemias (CUMMINGS HWDO, 2004, p.345), através do combate ao vetor ou vacinação
da população. Pode ser feita através de:

a) Técnicas de Mineração de Dados, para buscar os padrões de ocorrência e


comportamento das doenças (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,
p.37);

b) Análise estatística ou de gráficos (OMS, 2004b, p.08,09).

Essa pesquisa utiliza os dados de exames laboratoriais e avaliações médicas do


Sistema Único de Saúde Brasileiro (SUS), do qual setenta por cento (70%) da população
brasileira depende (WESTPHAL, 2000, p.46) e fornece ao gestor da área de saúde bases
para gerenciar seus limitados recursos humanos e financeiros.

 5HIHUHQFLDO7HyULFR

Os Sistemas de Suporte à Decisão fornecem alternativa computacional aos gestores,


para tomada de decisão, em problemas cuja solução não é trivial. Suas principais
vantagens são (TURBAN; RAINER; POTTER, 2004):

a) Permitir tomadas de decisões a partir de grandes fontes (bases) de dados;

b) Superar os limites humanos no processamento e armazenamento de informações;

2
“Doença que ataca ao mesmo tempo muitas pessoas da mesma região” (MICHAELIS, 1998, p.483).
9

c) Reduzir os custos de pesquisa de um projeto;

d) Prover soluções com qualidade e em curto espaço de tempo.

A Mineração de Dados apresenta a possibilidade de gerar, através de


tarefas/técnicas (HJ regressão e classificação) e aplicativos (VRIWZDUHV) específicos,
informações preditivas que possam fornecer aos gestores, subsídios para tomada de
decisão. Dentre estes VRIWZDUHV estão os que utilizam as Redes Neurais Artificiais para
este fim (predição) (BRAGA; LUDERMIR; CARVALHO, 2000; ALVARENGA;
OLIVEIRA JUNIOR; CARVALHO, 2003).

As Redes Neurais Artificiais são sistemas de processamento de informações


distribuídos, compostos por elementos computacionais simples (i.e. neurônios artificiais)
e, por serem inspiradas no cérebro humano, apresentam características como a capacidade
de aprendizagem de padrões complexos de informações ou a de generalizar uma
informação aprendida (BAETS; VENGOPAL, 1994 DSXG PASSARI, 2003; BRAGA;
LUDERMIR; CARVALHO, 2000; HAYKIN, 2001; OLIVEIRA; ALVARENGA, 2003).

A OMS (2004b, 2003e, 2000b), enfatiza a necessidade de pesquisas que possam


fornecer suporte à decisão, aos gestores da área de saúde, na predição e combate de surtos
(RXWEUHDNV) de várias doenças que estão sob influência sazonal, incluindo as causadas por
vetores. Em todo mundo, Dengue está entre as doenças que mais afetam a população dos
países em desenvolvimento.

No Brasil, o combate e a prevenção de trinta e cinco doenças diferentes, é feito


através do Modelo Brasileiro de Notificação. Esta notificação, nos hospitais públicos e
estaduais, é feita através de preenchimento de formulários específicos que são enviados à
Secretaria Municipal de Saúde e armazenados em forma digital no Sistema de
Informações de Agravos de Notificação. Em relação a Dengue, que é uma destas doenças,
o modelo é passivo e definido por lei. (FUNASA, 2002).

 2EMHWLYRV

 *HUDO

O objetivo principal deste trabalho é construir um modelo para suporte à tomada de


10

decisão no combate a epidemias de Dengue, utilizando Redes Neurais Artificiais para


predizer o número de casos confirmados dessas doenças, em menor tempo e maior
precisão do que a prática atual.

 (VSHFtILFRV

Os objetivos específicos desta pesquisa são relacionados a seguir:

• Construção de uma base de conhecimentos epidemiológicos, a partir da


análise de variáveis para diagnóstico e identificação do surto3 a partir das seguintes
fontes de dados:

a) Resultados de exames laboratoriais e avaliações médicas (Dengue),


realizados nos laboratórios e consultórios do Sistema Único de Saúde (SUS)
da cidade de Goiânia–GO, registrados no SINAN;

b) Índice pluviométrico, temperatura e umidade relativa do ar, de Goiânia,


realizado pelo 10º DISME – Distrito de Meteorologia.

• Fornecer bases para a otimização dos recursos humanos e/ou financeiros


utilizados na gestão epidemiológica de Dengue;

• Uso e avaliação da tecnologia baseada em RNAs como instrumento de


análise e predição epidemiológica.

 +LSyWHVH

 +LSyWHVHSULQFLSDO

Um modelo de predição, baseado em Redes Neurais Artificiais, aplicando séries


temporais, pode garantir maior precisão de resultados e melhor qualidade que o modelo
atual utilizado pelo Sistema Brasileiro de Notificação, vigente para Vigilância
Epidemiológica de Dengue.

 +LSyWHVHVVHFXQGiULDV

O número de casos confirmados de Dengue em Goiânia-Go, neste período,

3
Definição de Last (2001 apud OMS, 2004, p. 14, tradução nossa): “Uma epidemia (praga) limitada a um local
que aumenta na incidência de uma doença (enfermidade). e.g. em uma vila, cidade ou instituição fechada.”
11

apresenta relação com:

a) Mudanças das variáveis climáticas (i.e. apenas algumas variáveis


climáticas influenciam o surto);

b) Características urbanas (HJ percentual de área verde, número de prédios


por bairro, número de cemitérios) e populacionais (sexo, habitantes por
bairro e faixa etária) apresentadas em Goiânia-GO no período estudado.

 2UJDQL]DomRGR'RFXPHQWR

O presente trabalho está estruturado em cinco (05) capítulos, a saber:

No Capítulo 1 – Introdução – apresentação das considerações iniciais: ao


conhecimento sobre a interação entre o clima e a saúde; à definição do tema, delimitação
da pesquisa, referencial teórico, justificativa, objetivos e hipóteses desta dissertação.

No Capítulo 2 - Revisão de Literatura – apresentação do referencial teórico sobre


dados, informação e conhecimento. Na seqüência, aborda-se: Gestão do Conhecimento e
Tecnologia da Informação; Sistemas de Suporte à Decisão; Mineração de Dados; Redes
Neurais e Séries Temporais; efeitos do clima sobre a saúde humana; Modelo Brasileiro de
Predição; Dengue, assim como, também, o vetor brasileiro reconhecido ($HGHVDHJ\SWL) e
os estudos relatados, encontrados.

No Capítulo 3 – Metodologia – exposição dos procedimentos metodológicos para


elaboração do trabalho, incluindo o processo de análise e modelagem de dados, para
especificação do modelo neural e dos critérios de avaliação. Foi utilizada a metodologia
&URVV,QGXVWULDO6WDQGDUG3URFHVVIRU'DWD0LQLQJ através da aplicação de um estudo
de caso, na cidade de Goiânia–Go e posterior apresentação dos resultados encontrados no
período estudado.

No Capítulo 4 - Apresentação e Análise dos Resultados.

No Capítulo 5 - Conclusões e Sugestões para Trabalhos Futuros, listam-se, também,


as referências citadas e todos os anexos.
12

 5(9,6­2'(/,7(5$785$

“O valor do conhecimento é intangível, o que para muitos pode não ter sentido,
para outros pode ser a ‘invenção da pólvora’”. Autor desconhecido

 'DGRV,QIRUPDomRH&RQKHFLPHQWR

Os dados “são fatos brutos, não organizados para transmitir um significado


específico” (TURBAN; RAINER; POTTER, 2004, p.364). São importantes porque,
através deles, é possível a criação da informação. O que permite a eficiência da
informação é a qualidade dos dados, não a sua quantidade ou o seu conjunto.

Uma informação pode ser caracterizada através de conjunto de itens que tenham
significado (TURBAN; RAINER; POTTER, 2004, p.364) e proporcionem um novo
ponto de vista para a interpretação de eventos ou objetos, tornando visíveis, significados
antes invisíveis. A compreensão de dados (HJ fatos, textos, gráficos, imagens estáticas,
sons, etc.), por um indivíduo ou conjunto de indivíduos (organização) é uma informação.
Esta informação se completa e, sem sobrecarga, pode ser usada como vantagem
competitiva para tomada de decisão, no ambiente em que foi moldada (MORESI, 2000,
pp.17-18).

“Essa informação pode não ser a mesma do ponto de vista de quem emitiu a
mensagem, pois emissor e receptor são pessoas com experiências distintas” (LEMOS,
2003, p.07).

Pode-se considerar a informação como meio necessário para extrair ou construir o


conhecimento, alterando-o ou reestruturando-o. É o produto capaz de gerar o
conhecimento.

“Conhecimento não é dado e nem informação, mas está relacionado a ambos”


(TEIXEIRA FILHO, 2001, p.21). “É mais valioso e poderoso do que os recursos
naturais” (STEWART, 1998, p.XIII). É o resultado da interpretação, aprendizagem e
utilização da informação para algum fim, especificamente para gerar novas idéias,
resolver problemas ou tomar decisões (STEWART, 1998).

A capacidade de geração de dados, em qualquer organização, é, naturalmente,


13

superior à capacidade de mobilizar os meios e recursos necessários à transformação


desses dados, em informações e, dessas informações, em conhecimento. O significado da
tríade (dados, informações e conhecimento) é bastante contextual e subjetivo. O que é
informação para uma pessoa ou organização pode não passar de dados para outro ente
qualquer. Além do fato de que o conhecimento depende de uma série de condições e de
conceitos bastante abstratos como valor, reflexão, síntese e utilidade, entre outros
(ALVARENGA; JUNIOR; CARVALHO, 2004, p.05).

Capturar e disseminar o conhecimento de uma instituição (organização) não é tarefa


fácil. Embora existam diversos profissionais e técnicas de captura e disseminação, ambos
(profissionais e técnicas) dependem, também, do interesse, comprometimento e dedicação
das pessoas que compõe a organização, em representar e disseminar esse conhecimento.
E aquela que representa e dissemina o conhecimento, tem a capacidade de gerar
diferenciais competitivos importantes.

Por exemplo: para maximizar os lucros em pesquisas, uma organização que possua
várias filiais, desenvolve diversos projetos simultâneos. Provavelmente os profissionais
que compõem as equipes, enfrentam alguns problemas iguais ou semelhantes aos já
ocorridos em projetos anteriores. Se as informações de solução dos problemas anteriores
(técnicas aplicadas) estão mantidas e são compartilhadas dentro da organização, os
especialistas dos novos projetos localizam as soluções e as aplicam de maneira rápida e
eficaz. Outro exemplo interessante, no mesmo sentido, é o de compartilhar, vender ou
comprar informações (soluções) sobre resolução de desafios, em projetos já enfrentados
por outras organizações.

Deve-se ressaltar que o conhecimento pode ser dividido em tácito e explícito


(NONAKA; TAKEUCHI, 1997, p.62; TURBAN; RAINER; POTTER, 2004, p.389). “O
conhecimento tácito é pessoal, específico ao contexto e, assim, difícil de ser formulado e
comunicado. Já o conhecimento explícito ou ‘codificado’, refere-se ao conhecimento
transmissível em linguagem formal e sistemática” (POLANYI, 1966 DSXG NONAKA;
TAKEUCHI, 1997, p.65). O segredo para aquisição do conhecimento está, dentre outros
fatores, na experiência obtida através da convivência entre indivíduos (NONAKA;
TAKEUCHI, 1997, p.69).

Três observações são necessárias aqui. Primeira, o conhecimento, ao contrário da


14

informação, diz respeito a ‘crenças’ e ‘compromissos’. O conhecimento é uma


função de uma atitude, perspectiva ou intenção específica. Segunda, o conhecimento,
ao contrário da informação, está relacionado à ‘ação’. É sempre o conhecimento
‘com algum fim’. E terceira, o conhecimento, como a informação, diz respeito ao
‘significado’. É específico ao contexto e relacional [...] consideramos o
conhecimento como “um processo humano dinâmico de justificar a crença pessoal
com relação à ‘verdade’” (NONAKA; TAKEUCHI, 1997, p.63).

 *HVWmRGR&RQKHFLPHQWRH7HFQRORJLDGD,QIRUPDomR

A informação e o conhecimento são os diferenciais competitivos que atualmente


são considerados os produtos econômicos mais valorosos que uma organização (empresa,
instituição) pode possuir. Na verdade, o conhecimento tácito vem sendo usado nas
organizações há muito tempo embora o reconhecimento de ele que pode e deve ser
aplicado como vantagem competitiva, seja relativamente recente (TEIXEIRA FILHO
2001, p.22).

A Gestão do Conhecimento (GC), nesse sentido, atinge um campo multidisciplinar,


que possibilita amplas implicações e aplicações em diversas áreas, pois permite que os
pesquisadores possam se tornar profissionais geradores, mantenedores e disseminadores
do conhecimento, em uma instituição (organização). A Tecnologia da Informação (TI),
normalmente associada à GC, pode ser vista como o recurso básico para implantação da
GC nas organizações (DRUCKER, 1999 DSXG LEMOS, 2003, p.06).

Na verdade a GC “é um tipo de gestão pelo qual o reconhecimento do


conhecimento individual e organizacional é fator básico para atingir os resultados
desejados de uma organização” (LEMOS, 2003, p.06). Deve ser difundida entre os
funcionários (também conhecidos como multiplicadores) da organização de forma a
maximizar a confiança no processo de geração, absorção de conhecimento e
produtividade na organização (ARAUJO; FREIRE; MENDES, 1997).

Pode ser vista, através de outros conceitos similares como: D “uma coleção de
processos que governa a criação, disseminação e utilização do conhecimento para atingir
plenamente os objetivos da organização” (TEIXEIRA FILHO, 2001, p.22); E um
“processo que acumula e cria conhecimento de modo eficiente, gerenciando uma base de
conhecimentos organizacionais para armazenar o conhecimento, e facilitando o
compartilhamento desse conhecimento para permitir sua aplicação eficaz em toda
15

organização” (TURBAN; RAINER; POTTER, 2004, p.389); ou F um conjunto de


princípios e ferramentas para otimizar e integrar o processo criativo de criar, desenvolver
e disseminar o conhecimento de forma estratégica e efetiva dentro da organização (OMS,
2005, p.02).

"Existe uma relação sinergética poderosa entre gestão do conhecimento e tecnologia;


esta relação leva a retornos crescentes e sofisticação crescente, em ambas as frentes.
À medida que a tecnologia de informação se torna nossa ferramenta pessoal e nossa
conexão com os outros, aumenta nossa cobiça em acessar ainda mais informação e
conhecimento de outras pessoas, e então demandamos ferramentas de TI ainda
melhores e mais eficientes, que se tornam parte da forma como trabalhamos”
(O'DELL; GRAYSON JR, 1998, p.30).

Embora GC seja um campo novo e em discussão (TURBAN; RAINER; POTTER,


2004, p.388), existe, no mercado, uma enorme quantidade de ferramentas que procuram
gerenciar os conhecimentos das empresas. Infelizmente, nenhuma delas fornece um
modelo que se adapte a todas.

A gestão e o compartilhamento do conhecimento, no que diz respeito aos sistemas


de saúde, representam uma importante oportunidade para melhorar o atendimento e
tratamento de pacientes, particularmente nos países em desenvolvimento, pois podem
trocar experiências sobre campanhas preventivas e combate a doenças (OMS, 2005,
p.01).

A OMS (2005, p.02), no sentido de relatar e pesquisar novas ferramentas e soluções


criou o Departamento de Gestão e Compartilhamento do Conhecimento, que tem, como
tarefa, a construção de uma rede global, visando o compartilhamento de informações de
cunho médico e científico, entre todos os países. Sua estratégia é compartilhar as
abordagens da própria OMS com a perícia em saúde, de forma a encontrar ou criar novas
ferramentas e novas maneiras de se aplicar o conhecimento, aumentando, assim, em todo
o mundo, a qualidade dos sistemas de saúde pública.

Um exemplo prático da atuação desse departamento é o projeto de ligação entre


clínicas de tratamento e acompanhamento de HIV, na África, com plataformas que
disponibilizam dados (incluindo registros médicos eletrônicos) e com comunidades de
aprendizado, em busca de programas de saúde efetivos, que ajudem a aplicar e disseminar
16

campanhas ou práticas preventivas dessa doença (OMS, 2005, p.02).

 6LVWHPDVGH6XSRUWHj'HFLVmR

O decisor normalmente possui capacidade de conhecimento limitada, ao se deparar


com problemas complexos e grandes. Sua habilidade não é suficiente para fornecer
soluções que conduzam a resultados esperados e desejados (EIRMAN; NIEDERMAN;
ADAMS, 1995; TURBAN; RAINER; POTTER, 2004, p.369). Assim, a tomada de
decisão é um aspecto importante para a gerência no planejamento das atividades
operacionais das organizações. É o ato final de um processo que visa resolver um
problema ou um conjunto de problemas, em um domínio de aplicação (HENDRIKS;
VRIENS, 1995; RAFAELI NETO, 2001).

Segundo Hendriks e Vriens (1995) e Rafaeli Neto (2001), os Sistemas de Suporte à


Decisão fornecem a solução para problemas que no domínio geográfico, por exemplo,
tendem a serem novos, complexos, grandes e mal estruturados. Sua complexidade se deve
à interação de uma série de variáveis de natureza complexa (HJ natureza geográfica,
técnica, organizacional, social, temporal, etc.).

2.3.1 $X[tOLRjGHFLVmRFRPSXWDFLRQDO

Os 'HFLVLRQ6XSSRUW6\VWHP± '66 ou Sistemas de Suporte à Decisão (SSD) são


ferramentas computacionais que, através de consulta à base de dados, auxiliam aos
gerentes na tomada de decisão (ADRIAANS; ZANTIGE, 1996, p.28; DELMATER;
HANCOCK, 2001, p.88; PORTO; AZEVEDO, 1997 DSXG CARVALHO, 2003, p.23;
TURBAN; ARONSON, 1998, p.267; TURBAN; RAINER; POTTER, 2004, pp.369-
372).

Os SSD representam uma abordagem de auxílio computacional, baseada na intensa


utilização de bases e modelos de dados, que proporcionam o diálogo entre o homem e o
computador, na solução de problemas não triviais (CARVALHO, 2003, p.23;
HAMMERS, 2002, p.01; TURBAN; RAINER; POTTER, 2004, pp.369-372).

Possuem quatro características principais: D incorporam dados e modelos; E são


desenhados para auxiliar gerentes nos seus processos de decisão em tarefas semi-
estruturadas ou não estruturadas; F oferecem suporte, mas não substituem o julgamento
17

gerencial; G seu objetivo é melhorar a efetividade das decisões e não a eficiência do


processo de tomada de decisão (TURBAN; ARONSON, 1998; TURBAN; RAINER;
POTTER, 2004, pp.369-372).

Os seus usuários podem utilizá-los em três tipos de configurações: D ativas


(permite sugestões ou decisões); E passivas (não permite sugestões ou decisões); F
cooperativas (permite que o responsável pelas decisões ou um técnico sob sua orientação,
modifique, refine ou termine o processo de análise) (HÄTTENSCHWILER, 1999 DSXG
GACHET, 2001, p.215).

Em um SSD, deve haver um profissional que domine o problema, para que, através
de informações e concepção intelectual do assunto, possa obter um bom suporte à decisão
(HÄTTENSCHWILER, 1999 DSXG GACHET, 2001, p.215).

O melhor SSD não é aquele que utiliza as melhores técnicas matemáticas ou de


pesquisa a bases de dados, mas sim o que é capaz de induzir as melhores decisões. O SSD
não tem o objetivo de encontrar a solução ótima, mas, sim, auxiliar ao gestor na escolha
de uma alternativa satisfatória ao seu problema (PORTO; AZEVEDO, 1997 DSXG
CARVALHO, 2003, pp.23-24; TURBAN; RAINER; POTTER, 2004, pp.369-372).

São exemplos típicos de SSD, os Sistemas de Informações Geográficas e os


Sistemas Especialistas (TURBAN; ARONSON, 1998, TURBAN; RAINER; POTTER,
2004, p.372, 383). Citam-se como aplicações de SSD o: D Planejamento de mercado e
pesquisa; exemplo: geração de um catálogo de vendas, a partir da estimativa das decisões
de compra, que um consumidor pode fazer; E Planejamento estratégico e operações;
exemplo: monitoração, análise e geração de fazer relatos das tendências sutis de mercado,
o que pode auxiliar o gestor, a tirar proveito de campos ainda não explorados; F Suporte
a vendas; exemplo: executivos de altos escalões recebem relatórios diários de vendas de
produtos por região (TURBAN; ARONSON; 1998; TURBAN; RAINER; POTTER,
2004); e G A alocação de água para projetos de irrigação (CARVALHO, 2003).

 'HVFREHUWDGH&RQKHFLPHQWRHP%DVHGH'DGRV

“As organizações devem ser capazes de obter, organizar, analisar e interpretar os


dados, para sobreviver nos mercados globais supercompetitivos. E o gerenciamento de
dados é fundamental para todas as funções empresariais”.(TURBAN; RAINER;
18

POTTER, 2004, p.132).

“A maioria das organizações internacionais produzem mais informações em uma


semana que algumas pessoas podem ler em toda a sua vida” [...] “Existe um paradoxo no
crescimento dos dados, quanto mais dados menos informação” (ADRIAANS;
ZANTINGE, 1996, p.02, tradução nossa).

 ,QWURGXomR

A produção, coleta e armazenagem de dados, no mundo, aumentam em uma


enorme velocidade, tornando impossível a análise adequada para transformá-las em
informações úteis (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37). As bases
de dados, que podem representar de 65 a 70% do espaço existente em disco (MOORE,
1999, p.01), estão crescendo em tamanho, de duas maneiras: pelo aumento de número de
registros e pelo número de campos (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996,
p.38).

A transformação tradicional de dados em conhecimento usa análise manual e


interpretação. É realizada por especialistas que, através de teorias e ferramentas, extraem
informações úteis, a partir de dados digitais. Ao final do processo, os especialistas geram
relatórios sobre seus estudos, para decisões ou planejamentos, fornecendo suporte à
decisão. Essa maneira tradicional de gerar conhecimento é cara, lenta e altamente
subjetiva (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.37-38; TURBAN;
RAINER; POTTER, 2004, pp.130-132, 362-363).

A transformação dos dados em informação é um processo difícil, pelos seguintes


motivos (TURBAN; RAINER; POTTER, 2004, p.367): D a quantidade de dados em
grandes instituições aumenta exponencialmente com o tempo; E a coleta de dados é feita
por vários indivíduos de uma organização, usando métodos e dispositivos diversos; F os
dados brutos (sem nenhum trabalho de limpeza e em seu estado original) podem ser
armazenados em diferentes formatos, bancos, sistemas e plataformas; G somente partes
pequenas dos dados de uma organização são relevantes para uma decisão específica; H a
tomada de decisão para uma grande organização requer análise de dados externos; I
exigências legais, relacionadas aos dados, são diferentes, dependendo da região e mudam
com freqüência; J selecionar a ferramenta ideal para um trabalho pode ser um problema,
19

devido ao grande número de produtos comerciais existentes e aos requisitos para operar
essa ferramenta.

É inegável que diante das dificuldades acima listadas e do desgaste humano para
analisar, manualmente, essa grande quantidade de dados, surge o desafio de desenvolver
técnicas, ou aplicativos de automação, capazes de filtrar a informação necessária de
grandes bases de dados e disponibilizá-la em formatos visualmente compreensíveis, que
possam ser utilizados para solução de um problema (ADRIAANS; ZANTIGE, 1996,
p.02; GOEBEL; GRUENWALD, 1999, p.20; MOORE, 1999, p.01).

Nem sempre dados garantem informação e informação traz conhecimento. O


desafio é retirar a informação escondida nas bases de dados, de forma a utilizá-la em
decisões (HAN; KAMBER, 2001, p.279; TURBAN; RAINER; POTTER, 2004, p.362).
Soluções estão sendo pesquisadas e resultados estão sendo obtidos, através de técnicas
oriundas da Inteligência Artificial (IA) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH,
1996, p.37), dentre elas, a Mineração de Dados.

O termo .QRZOHGJH 'LVFRYHU\ LQ 'DWDEDVHV (KDD) ou Descoberta de


Conhecimento em Banco de Dados (DCBD) foi cunhado no primeiro encontro de
pesquisadores da área ocorrido em 1995, em Montreal (ADRIAANS; ZANTINGE, 1996,
p.05).

Foi definido como: “O processo de extração de conhecimento a partir dos dados


registrados numa base de dados, extração esta não trivial de conhecimento implícito,
previamente desconhecido e potencialmente útil, feita a partir dos dados registrados”
(FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.40, tradução nossa).

DCBD é o processo completo de descoberta de conhecimento, a partir de uma base


de dados, e estabelece uma ênfase especial em encontrar padrões de dados,
compreensíveis ou interessantes, que possam ser interpretados visando a criação de
conhecimento (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, pp.39-40;
MEDEIROS OLIVEIRA, 2005, p.01; OLIVEIRA; ALVARENGA, 2003, p.02).

É usado para explorar bases de dados, de maneira a fornecer informações


compreensíveis e úteis, no processo de tomada de decisão, de uma organização. O
problema básico de DCBD é transformar um grande volume de dados, que estão em sua
20

forma primitiva, em outras formas que serão: D mais compactas (HJ um pequeno
relatório); E mais abstratas (HJ um modelo que possa ter sido concebido a partir de
dados); F mais proveitosas (HJ um modelo de predição para estimativa de casos
futuros) (FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.37; NOON; HANKINS,
2001, p.01). “O centro do processo é a aplicação de métodos específicos de mineração de
dados, para descoberta e extração de padrões” (AGRAWAL; PSAILA, 1995 DSXG
FAYYAD; PIATETSKY-SHAPIRO, 1996).

2.4.2 ÈUHDVGH$SOLFDomR

Dentre outras áreas de aplicação de DCBD, citam-se as seguintes: D 0DUNHWLQJ


que procura identificar padrões de compras em consumidores, para a determinação dos
produtos que serão colocados em locais vizinhos, maximizando, assim, a venda (venda
cruzada); E Monitoração de fraudes eletrônicas em cartões de crédito, que possam
indicar a atividade de lavagem de dinheiro; F Predição de problemas em projetos
aéreos, através de relatos de falhas, a partir de agrupamentos; G Localização e
classificação de problemas ocorridos em telecomunicações de maneira a evitar
consultas a padrões já conhecidos; H Identificação e eliminação de redundância de
dados; I Predição epidemiológica, possibilitando ao gestor da área de saúde, o
planejamento de recursos para o atendimento a pacientes infectados ou para o combate
ao vetor de uma determinada doença (dengue) (MEDEIROS OLIVEIRA, 2005, p.01;
CASTRO; ALVARENGA; PRADO, 2004, p.83; CASTRO; ALVARENGA; PRADO,
2005, p.41; DELMATER; HANCOCK, 2001, p.270; FAYYAD; PIATETSKY-
SHAPIRO; SMYTH, 1996, pp.38-39; TURBAN; ARONSON, 1998, p.130;
TURBAN; RAINER; POTTER, 2004, p.159; WANG; WEIGEND, 2004, p.457).

Existem várias propostas para o processo de DCBD, dentre elas as de Fayyad e


Piatetsky-Shapiro e Smyth (1996), Adriaans e Zantinge (1996) e a de Kamp e Grupe
(1997).

 0LQHUDomRGH'DGRV

O termo mineração de dados, ou GDWDPLQLQJ refere-se a uma parte particular do


processo de DCBD (ADRIAANS; ZANTINGE, 1996, p.05; MEDEIROS OLIVEIRA,
2005, p.12), que aplica algoritmos específicos e técnicas próprias, para extração de
novos padrões, a partir de dados eletrônicos conhecidos (FAYYAD; PIATETSKY-
21

SHAPIRO; SMYTH, 1996, p.39).

Mineração de Dados (MD) pode ser definida como um processo automatizado


que, a partir de grandes volumes de dados, gera um conjunto de regras significativas
ou identifica informações (recursos ou tendências ou agrupamentos), que são
dificilmente perceptíveis (BOSE; SUGUMARAN, 1999 DSXG COFFIN HW DO, 2004,
p.02; FAYYAD; PIATETSKY-SHAPIRO; SMYTH, 1996, p.39; FRAWLEY;
PIATETSKY-SHAPIRO; MATHEUS, 1992 DSXG ELDER, 2004, p.02; REIFER,
2002, p.14) e que podem ser utilizadas com o objetivo de suporte à decisão (HAN;
KAMBER, 2002, p.279; WANG; WEIGEND, 2004, p.457; TURBAN; ARONSON,
1998; TURBAN; RAINER; POTTER, 2004, p.159).

Outras aplicações de MD são (TURBAN; RAINER; POTTER, 2004, p.383): D


predição automatizada de tendências e comportamentos, através da automatização do
processo de procura de informações (HJ compras realizadas por clientes no passado)
em bancos de dados, para se prever alvos futuros (HJ seleção de clientes em
potencial, para determinado produto a ser vendido); E detecção automática de
padrões desconhecidos, anteriormente, através da análise dos dados de vendas com a
identificação dos produtos, aparentemente, não relacionados, que geralmente são
vendidos em conjunto, em um determinado dia da semana (HJ fraldas e cerveja em
uma sexta-feira à noite). Existem diversos projetos em que a MD pode ser aplicada,
dentre eles (ELDER, 2004, p.04): D avaliações de crédito; E PDUNHWLQJ; F predição
de vendas; G detecção de fraudes.

Para Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), o objetivo da DM é a


extração de conhecimento de alto nível, a partir de dados de baixo nível, contidos em
grandes conjuntos de dados (HJ extrair conhecimento a partir de uma base de dados).
Já para Delmater e Hancock (2001, p.04) o desafio é bem maior: o objetivo definido é
o de extrair conhecimento de alto nível, a partir de dados de alto nível, o que é bem
mais complexo (HJ extrair conhecimento de um GDWDZDUHKRXVH).

O que deixa a MD eficaz é a aliança entre o que o ser humano faz de melhor
(avaliar/inferir as informações descobertas pela MD) e o que o computador faz de
melhor (procurar relações entre os dados existentes em uma base de dados)
(DELMATER; HANCOCK, 2001, p.09).
22

Na visão de Delmater e Hancock (2001, p.07), a análise da MD desenvolve


modelos de dois tipos: D modelos para previsão (predição), que envolvem a
utilização de uma parte ou de todo o conjunto de variáveis existentes, para prever
valores desconhecidos ou futuros, de variáveis de interesse (HJ desastres naturais,
índices de degradação ambiental, índice de reprodução de vetores, surtos); E modelos
para descrição, que busquem padrões em um sistema de forma a torná-los
interpretáveis.

Autores como Fayyad e Piatetsky-Shapiro e Smyth (1996, p.39), Medeiros


Oliveira (2005, pp.13-14) e Turban e Rainer e Potter (2004, p.159) dizem que a
mineração de dados possui várias técnicas (tarefas), dentre elas a classificação, a
regressão, a clusterização e a sumarização.

As tarefas de classificação e a regressão são preditivas, já a clusterização e


sumarização são descritivas. As descritivas se concentram em encontrar padrões que
descrevam os dados de forma interpretável pelos seres humanos. As preditivas
realizam inferências nos dados, para construir modelos que serão usados nas predições
do comportamento de novos dados. Nesta dissertação serão abordadas apenas as
técnicas preditivas.

No Quadro 1, para cada técnica relatada nas obras de Fayyad e Piatetsky-Shapiro


e Smyth (1996) e Turban e Rainer e Potter (2004, p.159), foi especificado o tipo de
modelo relatado por Delmater e Hancock (2001).

4XDGUR4XDGURGHWpFQLFDVGH0'GHVHQYROYLGRDSDUWLUGRVDXWRUHV)D\\DGH3LDWHWVN\6KDSLURH
6P\WK  7XUEDQH5DLQHUH3RWWHU S H'HOPDWHUH+DQFRFN  
Técnica Descrição dos modelos Tipo
Pressupõe características definidoras de um
Preditiva
Classificação grupo específico (como clientes que foram
perdidos para concorrentes)
Regressão Prediz um valor numérico com base no Preditiva
comportamento histórico dos dados
Clusterização Possibilita gerar agrupamentos a partir de Descritiva
semelhanças encontradas nos dados.
Procura descobrir se existe algum padrão de
Associação
relacionamento entre itens existentes nos dados Descritiva
(como o conteúdo de um carrinho de compras)
23

2.5.1 7pFQLFDVSUHGLWLYDVGD0'

A classificação e a regressão são formas de análise de dados, que podem ser


usadas para extrair dois tipos de modelos: D os que descrevem classes de dados
importantes; E os que atuam na predição de tendência de dados futuros (HAN;
KAMBER, 2001, p.279; PRADO, 1998, p.39; OLIVEIRA; ALVARENGA, 2003,
p.03).

A predição visa estabelecer o valor de um ou mais atributos, em um banco de dados,


a partir de outros atributos presentes [...] A abordagem preditiva não implica,
necessariamente, na previsão de um valor futuro - ‘a característica importante é que
ela faz uma adivinhação educada sobre o valor de um ou mais atributos
desconhecidos, dados os valores de outros atributos conhecidos’ [JOH97] (PRADO,
1998, p.39).

Faz-se, então, necessária, a distinção entre as técnicas preditivas de classificação


e regressão. Na classificação, cada registro (tupla) pertence a uma classe, entre um
conjunto pré-definido de classes. A classe de uma tupla é indicada por um valor
especificado pelo usuário, em um atributo objetivo. As tuplas consistem de atributos
preditivos e um atributo objetivo, este último indicando a que classe esta tupla
pertence (HAN; KAMBER, 2001, p.280). O atributo objetivo é do tipo categórico ou
discreto (i.e. pode tomar apenas um valor dentro de um conjunto de valores discretos)
(HJ {SIM, NÃO}; {01...10}; {POSITIVO, NEGATIVO, ZONACINZA}),
determinando classes ou categorias.

O princípio da tarefa de classificação é descobrir algum tipo de relacionamento


entre os atributos preditivos e o atributo objetivo, de modo a desvendar um
conhecimento que possa ser utilizado, para prever a classe de uma tupla desconhecida
(OLIVEIRA; ALVARENGA, 2003, p.03).

A regressão, por sua vez, é muito similar à classificação. A regressão é uma


função de aprendizado que mapeia dados ou conjunto de dados de entrada, em uma
saída real numérica. Nessa função, o atributo objetivo é contínuo, isto é, pode tomar
qualquer valor real. O objetivo do algoritmo de regressão é encontrar algum
relacionamento entre os atributos preditivos e o atributo objetivo, de modo a predizer
valores para o atributo objetivo. São exemplos típicos, as predições financeiras e
comerciais.
24

Suponha que, em uma cidade, tenham ocorrido várias endemias ou epidemias de


uma doença ou conjunto de doenças. Essas ocorrências, provavelmente foram
registradas pela Secretaria Municipal de Saúde dessa cidade. Seria interessante utilizar
esses dados, para prever a ocorrência de surtos de uma doença e, assim, possibilitar as
autoridades competentes a planejar melhor seus limitados recursos
(humanos/financeiros), desencadeando ações de vacinação ou combate ao vetor dessa
doença, de forma a melhorar o atendimento aos pacientes e, até mesmo, amenizar o
número de casos confirmados.

No caso de doenças com influência sazonal, a partir dos dados climáticos e


epidemiológicos registrados, um algoritmo de regressão pode descobrir regras que
possam prever o número de casos confirmados, em uma cidade. No caso da regressão,
a informação do surto ocorrido (i.e. número de confirmados) é totalizada em um
atributo (neste caso, o atributo objetivo). Uma vez que se tenha o atributo objetivo
determinado, prepara-se o subconjunto de atributos preditivos, dentre aqueles
existentes na base de dados. Claramente alguns atributos, tais como nome do paciente,
raça, cor dos olhos, estatura, peso, dentre outros, são, de modo geral, irrelevantes para
previsão do surto e, portanto, devem ser desconsiderados.

No caso da predição, para se medir o quão bom é o padrão encontrado (a


chamada acurácia do modelo), basta verificar o número de acertos, em um total de
casos testados (PRADO, 1998, p.39).

São esperadas duas reações distintas às predições: D Preparar-se para as


conseqüências das mudanças ocorridas. Por exemplo, no caso de predição de um
número alto de pacientes infectados por uma doença (HJ dengue), o gestor pode
designar seus limitados recursos humanos/financeiros para o tratamento desses
pacientes, em hospitais; E tomar medidas para reverter ou modificar as predições,
reduzindo as incertezas com a produção de informações, evitando, assim, surpresas
com a precipitação dos eventos. Se o cenário previsto é o de um surto, o gestor pode
decidir tentar amenizá-lo, determinando que sejam incrementadas, ou iniciadas,
campanhas de combate ao vetor. (CUMMINGS HW DO, 2004, p.345; HANKE;
REITSCH 1995 DSXG PASSARI, 2003, p.08).

MD pode ser considerada uma abordagem eficaz, se comparada às técnicas


25

tradicionais, já que lida com grande quantidade de volume de dados e consegue gerar
padrões para fenômenos complexos, que necessitam de muitos parâmetros. Por
exemplo, a estatística, de modo geral, é orientada para a verificação e validação das
hipóteses cognitivas e a maioria de suas técnicas requer o desenvolvimento de uma
hipótese prévia. Já a MD busca padrões, nas bases de dados, que possam ser utilizados
para algum fim. A grande vantagem da MD, em relação às técnicas estatísticas, é a
possibilidade de explicitar informações, apenas do domínio de especialistas,
escondidas nas bases, através da documentação gerada durante sua realização. Essas
informações podem levantar hipóteses que não haviam sido descobertas, até aquele
momento (PASSARI, 2003, pp 58-60).

 3UREOHPDVGHVDILRVYDQWDJHQViUHDVGHDSOLFDomRHWpFQLFDVGD0'

Em relação aos problemas referentes à MD, os mais comuns são: D


representação do conhecimento extraído; E complexidade da pesquisa; F seleção do
método e técnica mais apropriada da mineração para a pesquisa (FAYYAD;
SHAPIRO-PIATETSKY; SMYTH, 1996).

Além desses problemas, existem alguns desafios a serem vencidos, dentre eles:
D o volume da base de dados: as bases, normalmente, possuem centenas de tabelas,
com centenas de campos e talvez milhares de registros, o que pode resultar em uma
variedade enorme de padrões, combinações e hipóteses; E dados inconsistentes: além
de atributos com valores nulos, outros, importantes, podem estar ausentes das bases de
dados, pois, na sua concepção, não foram projetadas para DCBD; F ruídos nas bases
de dados: é um problema muito comum e grave, indicando que atributos importantes
podem estar perdidos, com valores errados ou colocados em locais incorretos, na base
de dados; G interação com o usuário: o profissional ou técnico de MD, deve procurar
conhecimentos, a partir de hipóteses levantadas por seus clientes, que possam ser
utilizados para explicar algum processo, na corporação, ou predizer ocorrências
futuras; H representação da informação: se o conhecimento descoberto não for de
fácil acesso e claramente compreendido pelo cliente, pode causar interpretações
errôneas ou ambíguas (FAYYAD; SHAPIRO-PIATETSKY; SMYTH 1996b).

Aproximadamente oitenta por cento dos problemas em MD referem-se às etapas


de preparação dos dados (pré-processamento), enquanto os outros vinte por cento são
26

referentes à etapa de mineração de dados, em si (ADRIAANS; ZANTINGE, 1996).

A extração física de dados oriundos de diversas fontes é uma tarefa


extremamente árida e tediosa, pois pode trazer surpresas desagradáveis, tais como: D 
ocorrência de exceções (HJ linhas de total no meio do arquivo); E apresentação de
arquivos em formatos diferentes, o que exige sua reconstrução em formato desejado
(HJ $FUREDW 5HDGHU 0LFURVRIW ([FHO 0LFURVRIW :RUG); F falta de padrão na
codificação: instituições diferentes mantêm as mesmas informações, em cadastros
diferentes e independentes (HJ a carteira de identidade, cartão de crédito, carteira de
motorista) (PRADO, 1998, p.25).

É importante levar em consideração que: D é altamente improvável a existência


de uma grande base de dados, sem a presença de algum tipo de ruído, erros ou
inconsistência de dados; E mesmo que se tenha a sensação de que todas as
dificuldades de extração foram superadas, a inclusão de versão atual de um arquivo,
pode trazer erros tão grandes, que não há outra opção, a não ser recomeçar o
processamento dos dados.

As técnicas e características de processamento mais comuns são (HAN;


KAMBER, 2001, pp.105-142; PRADO, 1998, pp.28-29): D limpeza: preencher,
corrigir ou eliminar dados sem informação; E integração: combinar vários dados,
oriundos de várias bases, em um repositório final; F transformação de dados: alterar
dados (consolidar) para o formato desejado; G redução dos dados: representar, de
forma reduzida, o volume dos dados, sem perder a consistência ou a integridade.

Em relação às aplicações, a MD pode ser utilizada para: D segmentação de


mercados: agrupando clientes pela suas características comuns; E detecção de fraude:
identifica transações suspeitas que tenham probabilidade de serem fraudadas; F 
PDUNHWLQJ direto: identifica pessoas, com determinado perfil de consumo, para envio
de um tipo específico de catálogo de produtos (HJ armas, pescaria, roupas, viagens);
G análise de tendências: revela diferenças entre o comportamento de um determinado
cliente, em um período de tempo; H óleo e gás: analisa dados sísmicos, em busca de
depósitos subterrâneos, que possam ser perfurados com mais facilidade; I varejo:
distingue padrões de compras.
27

A MD pode ser utilizada também para predição, nas seguintes áreas: D


PDUNHWLQJ: busca os melhores clientes, para maximizar as vendas; E detecção de
fraude em cartões de crédito; F desistência (perda) de clientes: prevê quais os
prováveis clientes a saírem de empresa; G seguro e sistemas de saúde: antecipa quais
clientes potenciais para novas apólices; H medicina: prevê e indica as terapias
adequadas a cada doença, e a eficácia das drogas (TURBAN; RAINER; POTTER,
2004, p.161).

Além das vantagens e desvantagens já mencionadas, acrescentam-se:

a) A MD não necessita do processamento de todo o banco de dados, para a


geração de regras. Basta que sejam analisadas faixas de dados distintas e desejadas,
dessa base. Através dessa análise, as regras e suas faixas de confiança são geradas
e adicionadas ou, ainda, alteradas, em uma base de regras (também conhecida
como base de conhecimento). Através do acréscimo de novos registros na base de
dados, a base de regras é atualizada com as regras geradas.

A busca de padrões de um local ou região específica pode ser feita e analisada,


através da mudança dos valores existentes, em uma faixa de dados, extraídos de uma
base de dados, conforme pode ser visto na Figura 1.

)LJXUD3URFHVVRGHFRQVWUXomRGHXPDEDVHGHUHJUDVGHXPDUHJLmRDGDSWDGDGH$JUDZDOH3VDLOD
SSFRPDOWHUDo}HV 

b) A Mineração de Dados possibilita, além de velocidade na solução de


problemas, o preenchimento de informações, que podem ser a chave para decisões,
em negócios importantes (ELDER, 2004, p.04).

c) Falha no registro dos dados eletrônicos: por algum motivo, os dados


28

não estão representados no universo necessário e, portanto, a informação obtida


pode não ser confiável. Deve haver a preocupação com a completa representação e
disponibilidade das informações, para quem precise delas (DRUCKER, 2001 in
+DUYDUG%XVLQHVV5HYLHZ(HBR) p.18);

d) Os executivos e profissionais especialistas, a partir dos dados que


possuem, precisam expressar corretamente a informação desejam alcançar. Assim,
os responsáveis por gerá-la, não sobrecarregam o processo de transformação de
dados em informação e conseguem fornecer o suporte a decisão (DRUCKER, 2001
LQ HBR, p.19);

e) Reunir, examinar e confirmar as informações extraídas, a partir de


dados válidos, fornece uma análise sofisticada e possibilita conclusões que
resistem a questionamentos críticos (ARGYRIS, 2001 LQ HBR, p.99,100);

f) Os custos associados com a coleção, processamento e armazenamento


de tais tipos de recursos (informações), podem ser altos o que desencoraja o
investimento na geração desta informação (DELMATER; HANCOCK, 2001,
p.05);

g) Os pesquisadores, ou gerentes supõem que, o melhor modelo e as


melhores respostas para um problema, foram encontrados, podendo decidir pelo
encerramento da pesquisa o que pode impedir que um modelo mais preciso seja
encontrado (ELDER, 2004, p.22).

Pode ser realizada, através de vários modelos e ferramentas específicas, como:


D &URVV,QGXVWULDO 6WDQGDUG 3URFHVV IRU 'DWD 0LQLQJ CRISP-DM  D HVFROKLGD
SDUD HVWD SHVTXLVD E  6DPSOH ([SORUH 0RGLI\ 0RGHO $VVHVV 6(00$  F 
&RPPRQ$SURDFKHV '(/0$7(5+$1&2&.S .

Existem diversas ferramentas profissionais de mineração de dados, dentre elas,


&OHPHQWLQH da SPSS4; (QWHUSULVH0LQHU da SAS5; (DV\QQ3OXV; ,QWHOOLJHQW0LQHU da
IBM7; 63OXV e ,QVLJKWIXO 0LQHU 2 da ,QVLJKWIXO &RUSRUDWLRQ8; 6HH& &XELVW e

4
www.spss.com
5
www.sasinstitute.com
6
www.easynn.com/easynnplus.html
7
www.ibm.com
29

0DJQXP 2SXV da RuleQuest59 e o R10. Academicamente, existem, também, alguns


casos de soluções para 0', dentre eles, o :(.$11 H R$5$5$.

 &5,63'0SDUDPLQHUDomRGRVGDGRV

A metodologia CRISP-DM (DELMATER; HANCOCK, 2001, p.61;


CHAPMAN HW DO, 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA;
ALVARENGA, 2003, p.02) foi concebida em 1996, como um guia passo a passo, para
a MD, e propõe um modelo gratuito de processo padrão, para mineração de dados
(SPSS, 2000).

Sua origem deve-se ao consórcio formado por quatro empresas de consultoria: 1&5
6\VWHPV (QJLQHHULQJ &RSHQKDJHQ 'DLPOHU&KU\VOHU $* 6366 ,QF. e 2+5$
Verzekeringen en Bank Groep (SPSS, 2000 p.2). A CRISP-DM tem como vantagem, não
depender da área de negócio e da tecnologia a ser utilizada na MD, além da fácil
aplicação rapidez, custos mais baixos, viabilidade e facilidade da gestão dos projetos de
alta ou baixa envergadura de MD.

Na descrição dos quatro níveis da CRISP-DM, visto na Figura 2, é utilizado um


modelo de processo hierárquico, composto por um conjunto de tarefas, descritas em
níveis de abstração (SPSS, 2000, p.09):

a) Fases: neste nível, dividido em seis fases principais, estão as tarefas genéricas e os
relacionamentos entre essas tarefas;

b) Tarefas genéricas: neste nível, são apresentadas de forma geral, para cobrir todas
as situações possíveis da MD, mesmo aquelas não previstas (HJ novas técnicas de
modelagem);

c) Tarefas especializadas: neste nível, estão as descrições de como as ações do nível


genérico, devem ser executadas, em certas situações específicas (HJ limpeza dos
dados);

8
www.insightful.com
9
www.rulequest.com
10
www.r-project.org
11
www.cs.waikato.ac.nz/~ml/weka/
12
www.ucb.br/prg/professores/rogerio/arara/arara.html
30

d) Instância de Processos: neste nível, registram-se as ações, decisões e resultados de


um projeto de MD.

)LJXUD5HSUHVHQWDomRGRVTXDWURQtYHLVGDPHWRGRORJLD&5,63'0 6366SWUDGXomRQRVVD 

O primeiro nível (fases), representado na Figura 3, tem as seguintes divisões e


objetivos:  Compreensão do Negócio (%XVLQHVV8QGHUVWDQGLQJ): entender os objetivos
do projeto e seus requisitos, sob o ponto de vista do negócio, para serem convertidos na
definição de um problema de MD; quando se adquire a compreensão dos objetivos e
requisitos do projeto, deve-se definir um plano preliminar, para atingir estes objetivos; 
Compreensão dos Dados ('DWD8QGHUVWDQGLQJ): recolher os dados e familiarizar-se com
eles, para: a identificação de possíveis problemas, provocados pela qualidade desses
dados; o descobrimento de perspectivas iniciais, dentro dos dados; a detecção de
subconjuntos interessantes, que permitam formular hipóteses sobre informações
(escondidas), que não estão disponíveis aos gestores;  Preparação dos Dados ('DWD
3UHSDUDWLRQ : construção dos conjuntos de dados (GDWD VHWV), para a construção de
modelos, a partir dos dados originais;  Modelagem (0RGHOLQJ): seleção, aplicação de
várias técnicas de modelagem de dados e otimização de parâmetros; existem diversas
técnicas que podem ser aplicadas, no mesmo problema de MD, algumas delas com
requisitos específicos, em relação à forma dos dados - é freqüente ter que se voltar à fase
anterior;  Avaliação ((YDOXDWLRQ): do ponto de vista da análise dos dados, os modelos,
construídos nesta fase, podem aparentar elevada qualidade; antes de prosseguir para a
fase seguinte, a de operacionalização, é importante rever os passos dados, na construção
do modelo, para garantir que se atinja os objetivos chave (um deles é determinar se existe
alguma questão importante, não considerada);  Operacionalização ('HSOR\PHQW)
utilização dos modelos criados em ambiente operacional.
31

)LJXUD5HSUHVHQWDomRGRQtYHO)DVHVGD&5,63'0 6366SWUDGXomRQRVVD

 5HGHVQHXUDLVDUWLILFLDLV

“A gestão eficiente de qualquer corporação, seja ela do setor público ou privado,


industrial ou varejista, requer planejamento. Para um planejamento efetivo é necessário
que se tenha uma expectativa precisa das condições futuras em que a corporação irá
operar, e de como se relacionam os elementos condicionantes desta expectativa”
(PASSARI, 2003, p.08).

2.7.1 ,QWURGXomR

O cérebro humano possui, como células fundamentais, aproximadamente 1011


neurônios. Cada neurônio é dividido em três seções distintas, conforme representado na
Figura 4: D corpo da célula; E dendritos; F  axônio. Cada seção possui funções
específicas, porém complementares (BRAGA; LUDERMIR; CARVALHO, 2000, pp.4-5;
HAYKIN, 2001, pp.32-34).

)LJXUD&RPSRQHQWHVGRQHXU{QLRELROyJLFR %5$*$/8'(50,5&$59$/+2S 
32

Os dendritos têm por função, receber as informações (impulsos nervosos) de outros


neurônios e conduzi-las até o corpo celular (soma). A informação é processada neste local
e novos impulsos são gerados. Esses impulsos são transmitidos a outros neurônios,
passando através do axônio, até os dendritos dos neurônios seguintes. O ponto de contato
entre a terminação de um neurônio e o dendrito de outro, é chamado de sinapse. Entre a
sinapse e o dendrito de vários outros neurônios, existe o espaço sináptico (AZEVEDO;
BRASIL; OLIVEIRA, 2000, p.03; BRAGA; LUDERMIR; CARVALHO, 2000, p.06;
HAYKIN, 2001, pp.32-34).

As $UWLILFLDO 1HXUDO 1HWZRUNV ou Redes Neurais Artificiais (RNAs) surgiram a


partir do modelo de neurônios artificiais (SHUFHSWURQ), proposto por 0F&XOORFK e 3LWWV
(1943 DSXG BRAGA; LUDERMIR; CARVALHO, 2000, p.06; AZEVEDO; BRASIL;
OLIVEIRA, 2000, p.06; TURBAN; RAINER; POTTER, 2004, p.417). É uma
simplificação do que se sabia, até então, sobre neurônio biológico. A composição
(descrição) matemática de um neurônio artificial resultou em um modelo com Q terminais
de entrada [ [ [Q (que simulam o papel dos dendritos) e, apenas, um terminal de
saída \ (simulando o papel do axônio). Para simular o comportamento das sinapses, os
terminais de entrada possuir pesos acoplados Z Z ZQ, que podem possuir valores
negativos ou positivos, dependendo das sinapses correspondentes, inibitórias ou
excitatórias (HAYKIN, 2001, pp.36-38). “O efeito de uma sinapse particular L no
neurônio pós-sináptico é dado por xiwi” (BRAGA; LUDERMIR; CARVALHO, 2000,
p.08).

)LJXUD&RPSRQHQWHVGRQHXU{QLRGH0F&XOORFKH3LWWV %5$*$/8'(50,5&$59$/+2
S 
Em suma, nos neurônios artificiais, as conexões emulam os dendritos, pesos imitam
as sinapses, uma função de mapeamento emula o corpo celular e uma saída imita o
33

axônio (BRAGA; LUDERMIR; CARVALHO, 2000, pp.7-8; HAYKIN, 2001, pp.36-37),


conforme pode ser visto na Figura 5. Os neurônios de uma RNA recebem informações de
fontes externas ou de outros neurônios e as transformam, através de pesos, em uma saída.
Esta saída é transmitida para outros neurônios ou para saídas externas (TURBAN;
RAINER; POTTER, 2004, p.418).

De forma genérica, é correto afirmar que as funções básicas de cada neurônio,


presentes em uma rede, seguem a seguinte cronologia:  avaliam os valores de entrada;
 calculam o total dos valores de entrada combinados;  comparam o total com um
valor limiar e determinam o valor que será a saída.

 &DUDFWHUtVWLFDVHDUTXLWHWXUDVGDV51$V

Soluções computacionais clássicas são implementadas, de forma explícita, em um


sistema, através de regras ou equações. Estas soluções fornecem a garantia de saída
computacional, em problemas para os quais foram desenvolvidas, e possuem limitações
(HJ não podem generalizar soluções; não são tolerantes a erros e ruídos) (SWINGLER,
1996, p.08).

As RNAs, por outro lado, são sistemas de processamento de informações


distribuídos, compostas por elementos computacionais simples (i.e. neurônios artificiais)
e, por serem inspiradas no cérebro humano, apresentam: D a capacidade de aprender ou
descobrir padrões complexos de informações e soluções em problemas, para os quais as
regras ou equações não são facilmente visíveis ou de difícil implementação. Em outras
palavras, as RNAS fornecem boas soluções para problemas, cujo domínio e precisão
formal não são possíveis (por falta de profissionais ou de conhecimento adequado) ou não
são viáveis (seja pelo custo financeiro ou pela necessidade de resposta em baixo tempo),
em soluções computacionais tradicionais; E a capacidade de generalizar um problema,
através de um conjunto de dados de treinamento, que não forneça regras explícitas
(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BAETS; VENGOPAL, 1994 DSXG
PASSARI, 2003, p.72; BRAGA; LUDERMIR; CARVALHO 2000, pp.15-27; HAYKIN,
2001, p.28; OLIVEIRA; ALVARENGA, 2003, p.03; SWINGLER, 1996, p.03,08).

Em uma RNA, cada elemento computacional não linear, é chamado de nó ou nodo


e é densamente interconectado, através de conexões diretas. Cada nó recebe um ou mais
34

valores de entrada, que são combinados em um único valor. Com o uso de diferentes
pesos para cada entrada, através de uma função de ativação, gera-se uma saída. Deve-se
ressaltar que o número de elementos que compõem a entrada de uma RNA, não é,
necessariamente, o número de elementos que compõem a saída da mesma RNA
(AZEVEDO; BRASIL; OLIVEIRA, 2000, pp.03-30; BRAGA; LUDERMIR;
CARVALHO 2000, pp.10-13; SWINGLER, 1996, p.03).

Definir a arquitetura de uma RNA é uma decisão importante, uma vez que ela
restringe o tipo de problema a ser tratado pela rede. As principais arquiteturas de redes
são: D As que possuem uma camada única, representada pela Figura 6(a): um nó entre
qualquer entrada e qualquer saída; tendem a resolver problemas linearmente separáveis
(i.e. que podem ser separados por uma reta, em um espaço geométrico, no qual os pontos
obedecem a uma equação linear de coordenadas cartesianas); E As que possuem
múltiplas camadas, representada pela Figura 6(b): com mais de um neurônio entre alguma
entrada e alguma saída da rede e tendem a resolver problemas não linearmente separáveis
(i.e. possuem o potencial de resolverem problemas complexos) (AZEVEDO; BRASIL;
OLIVEIRA, 2000, pp. 71-72,81-90; BRAGA; LUDERMIR; CARVALHO 2000, p. 11-
12,49, HAYKIN, 2001, pp. 46-47,47-48); F As recorrentes, representadas pela Figura
6(c), com a seguinte característica de possuir laços de realimentação (i.e. possuem uma
camada de neurônios que, com seu sinal de saída, alimenta as entradas de todos os outros
neurônios). (HAYKIN, 2001, pp.48-49).

A tecnologia das RNAs, talvez seja a que mais apresenta o profundo poder da MD,
pois elas tentam construir representações internas de modelos ou padrões encontrados
nos dados. A visão do processo das RNAs do tipo MLP a descoberta pode ser feita em
duas fases: na primeira, a seleção dos parâmetros de treinamento do algoritmo, na
segunda, os resultados finais obtidos pela RNA são vistos como uma “caixa preta” (ou
seja, são inexplicáveis) (PASSARI, 2003, p.32; SWINGLER, 1996, p.08); aqui se faz
necessário um apêndice sobre o funcionamento de uma “caixa preta” em uma RNA:

“O funcionamento da RNA se torna uma metáfora de um ato reflexo que, depois de


aprendido, se repete inconscientemente. E este aspecto, que é uma das forças do
paradigma, pois pode ser largamente empregado, constitui, também, em um dos seus
pontos fracos, pois, tal como um ato reflexo, é difícil de explicar o porquê do ato”
(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.18)
35

As RNAs são úteis em diversas aplicações do mundo real, pois lidam com dados
complexos e geralmente incompletos; as primeiras aplicações desenvolvidas nas RNAS
foram: D reconhecimento de voz e E reconhecimento de padrões visuais.

Atualmente são comuns aplicações como: D análise de escrita à mão (utilizados


em SDOPWRSV); E controle e automatização de equipamentos em grandes empresas (HJ
montadoras de carros); F avaliação de crédito (TURBAN; RAINER; POTTER, 2004,
p.39).

)LJXUD$UTXLWHWXUDVGH5HGHV1HXUDLV$UWLILFLDLV±UHWLUDGDGH+D\NLQ SS 
36

Diversas áreas empresariais, já utilizam aplicações baseadas em RNAs, dentre as


quais cita-se (TURBAN; RAINER; POTTER, 2004, pp.418-419): D a MD procurando
padrões em bancos de dados grandes e complexos; E fraudes fiscais, identificando e
procurando irregularidades; F serviços financeiros, identificando padrões de mercado;
G avaliação de empréstimo, analisando o cliente, de acordo com seu histórico naquela
instituição; H análise de novos produtos, fazendo a previsão de vendas daquele produto
em determinada região; I previsão do comportamento do consumidor na Internet, para
ajudar a planejar páginas que possam influenciar em escolha de compra; J detecção de
fraudes de cartões de crédito, também analisando padrões de compras.

2.7.3 5HGHV0XOWL/D\HU3HUFHSWURQ

As redes SHUFHSWURQPXOWLFDPDGDV ou PXOWLOD\HUSHUFHSWURQ (MLP) são redes que


possuem mais de uma camada, em sua construção, e apresentam a característica de
resolver problemas complexos São formadas por neurônios artificiais, ligados por
conexões sinápticas e divididas em: D camada de entrada, que recebe estímulos do meio
externo; E camada interna ou oculta (KLGGHQ), onde ocorre o processamento das
informações e F camada de saída, que se comunica com o exterior e apresenta os
resultados (BRAGA; LUDERMIR; CARVALHO 2000; OLIVEIRA JÚNIOR, 2003;
PASSARI, 2003).

A topologia da MLP refere-se ao número de camadas utilizadas. Uma rede MLP


deve ser composta por, pelo menos, três camadas: D camada de entrada, que consiste nas
variáveis de entrada do modelo e devem ser conhecidas; E camadas intermediárias ou
camadas ocultas, que tornam o modelo mais refinado e não linear, com a capacidade de
aprender padrões mais complexos; F camada de saída, que contém um ou mais nós,
representando os resultados finais do processamento (KUO; XUE, 1998 DSXG PASSARI,
2003, p.79).

“Ficou provado que tudo que uma rede pode aprender com Q camadas
intermediárias pode ser aprendido por uma rede com uma única camada intermediária”
(AZEVEDO; BRASIL; OLIVEIRA, 2000, p.23).

Existem diversos algoritmos de treinamento para RNAs (HJ EDFNSURSDJDWLRQ,


FRXQWHUSURSDJDWLRQ), o algoritmo de aprendizado mais conhecido e utilizado para
37

treinamento dessas redes é o EDFNSURSDJDWLRQ (AZEVEDO; BRASIL; OLIVEIRA,


2000, pp.107-109; RULHEMART; MCCLELLAND, 1986 DSXG BRAGA; LUDERMIR;
CARVALHO 2000, p.59; SWINGLER, 1996, p.10). É um algoritmo supervisionado, que
utiliza pares de entrada e saída desejada para ajustar os pesos da rede, por meio de um
mecanismo de correção de erros. Seu treinamento ocorre nas fases IRUZDUG e EDFNZDUG.
Cada fase percorre a rede em um sentido. A primeira fase (IRUZDUG) é utilizada para
definir a saída da rede, para um dado padrão de entrada. A segunda fase (EDFNZDUG)
“utiliza a saída desejada e a saída fornecida pela rede, para atualizar os pesos de suas
conexões”.(BRAGA; LUDERMIR; CARVALHO 2000, p.59). A Figura 7 foi baseada em
Braga e Ludermir e Carvalho (2000, p.59) e ilustra estas duas fases D em uma rede com
uma saída; E em uma rede com mais de uma saída.

)LJXUD)OX[RGHSURFHVVDPHQWRGRDOJRULWPREDFNSURSDJDWLRQ

“Um dos problemas enfrentados no treinamento de redes MLP, diz respeito à


definição de seus parâmetros. A seleção dos parâmetros de treinamento do algoritmo
EDFNSURSDJDWLRQ é um sucesso tão pouco compreendido, que é muitas vezes chamado de
‘magia negra’” (BRAGA; LUDERMIR; CARVALHO 2000, p.66). Outro dos problemas
enfrentados é a ocorrência de RYHUILWWLQJ (excesso de treinamento), pois a rede, em vez de
melhorar, piora a sua taxa de acertos (BRAGA; LUDERMIR; CARVALHO 2000, p.68).

A 7LPH'HOD\1HXUDO1HWZRUN também é conhecida como atraso de tempo, janela


de tempo ou janelamento. Esta técnica permite que, através de observações passadas,
possa-se realizar o treinamento de uma RNA e predizer ocorrências futuras (LANG;
HINTON, 1988 DSXG BRAGA; LUDERMIR; CARVALHO 2000, p.220, 227;
SWINGLER, 1996, p.43).
38

Existem diversos exemplos bem sucedidos de aplicações de RNAs, na previsão de


séries temporais, com a técnica de janela de tempo. Eis alguns autores (e obras relatadas)
com esta técnica:

a) Braga e Ludermir e Carvalho (2000, p.227): volume de vendas (LANG; HILTON,


1988);

b) Alvarenga e Oliveira Junior e Carvalho (2003, p.14):  previsão de ações


(ROSIN, 1997);  previsão do IBOVESPA (MORAIS; PORTUGAL, 1999); 
previsão da demanda de importações brasileiras (SILVA; PORTUGUAL;
CECHIN; 2001);  previsão da demanda de energia elétrica de concessionárias
brasileiras (SOTO, 1999);  previsão do preço de ovos (TÁPIA; ROISENBERG;
BARRETO, 2000);  previsão de venda de cerveja na Austrália (CALÔBA;
SALIBY, 2001);

c) Oliveira; Alvarenga (2003): predição do valor da ação BRTP4 da Brasil Telecom


Participações.

Os autores Braga e Ludermir e Carvalho (2000, p.228) exemplificam a predição do


volume de vendas de um determinado produto, em uma RNA com cinco neurônios de
entrada, sete neurônios na camada intermediária e um neurônio na camada de saída. A
RNA consegue prever, com certa margem de confiança, o volume de vendas, com uma
semana de antecedência. O exemplo dado por esses autores pode ser visto na Figura 8.

)LJXUD3UHGLomRGHYROXPHGHYHQGDVGXUDQWHFLQFRVHPDQDVXWLOL]DQGR51$FRPDWpFQLFDGH
MDQHODPHQWR %5$*$/8'(50,5&$59$/+2S 

Alvarenga e Oliveira Junior e Carvalho (2003, pp.15-19) utilizaram o simulador


(VRIWZDUH) de redes neurais (DV\113OXV, para construção de um modelo para previsão
39

em séries temporais, baseada em RNAs, para o Sistema de Pagamentos Brasileiro. O


modelo foi criado, através da construção de uma RNA, com a seguinte característica: D
trinta neurônios na camada de entrada, E oito na camada intermediária e um na camada
de saída.

Nesse VRIWZDUH foram aplicados a taxa de aprendizado com o valor 1,00,


momentum 0,60 e com os valores otimizados pelo aplicativo. Os valores previstos são
representados na Figura 9.

)LJXUD3UHGLomRUHDOL]DGDSRU$OYDUHQJDH2OLYHLUD-XQLRUH&DUYDOKR S 

Os resultados obtidos por esses autores, demonstram a sazonalidade da série e


podem auxiliar a tomada de decisões, indicando, ao banco, o potencial de depósitos e
aplicações financeiras, oriundas do Sistema Brasileiro de Pagamentos.

Os autores Oliveira e Alvarenga (2003) relatam a construção de um modelo,


utilizado para predição do valor da ação BRTP4, no mercado de capitais. O modelo foi
criado, através da construção de uma RNA, com a seguinte característica: D trinta e oito
(38) neurônios na camada de entrada; E trinta e oito (38) neurônios na camada
intermediária; (c) dois (02) neurônios na camada de saída.

Foi utilizado o (DV\113OXV com os parâmetros de taxa de aprendizado 0,6,


momentum 0,8 e erro alvo (desejado) 0,05. Os autores relatam que o treinamento foi
realizado com 1.102 amostras, das quais 15 foram escolhidas como amostras de teste. Os
resultados do aprendizado podem ser vistos na Figura 10.
40

)LJXUD*UiILFRGDFXUYDGHDSUHQGL]DGRUHDOL]DGDSRU2OLYHLUDH$OYDUHQJD S 

O erro alcançado nesta predição foi de 0,049916, após 578 ciclos de aprendizado e
os resultados da predição podem ser vistos na Figura 11.

)LJXUD*UiILFRGDSUHGLomRUHDOL]DGDSRU2OLYHLUDH$OYDUHQJD S 

Em relação aos três artigos acima, todos os autores utilizaram RNAs com o
algoritmo EDFNSURSDJDWLRQ e possuíam, no período a ser analisado, todo o universo de
variáveis, que seriam trabalhadas. O grande desafio à predição de Dengue, em Goiânia-
Go, com essa técnica e no período de doação, é o percentual estimado pela Divisão de
Epidemiologia da Secretaria Municipal de Saúde de Goiânia, de trinta e cinco a quarenta
por cento de notificações não realizadas. Esse desafio também é enfrentado pelos gestores
da atualidade, na análise dessas informações.

 *HVWmRGR&RQKHFLPHQWRVREUHRVHIHLWRVGRFOLPDQDVD~GHKXPDQD

Existem diversas obras (GALE MOORE, 2000, OMS, 2003d, 2004b, 2000b, dentre
outras) que relatam as conseqüências da influência sazonal, em relação às doenças
41

transmitidas por vetores. Nas publicações da OMS (2003d, 2004b), foram abordados os
efeitos das variações climáticas e as técnicas mais conhecidas e utilizadas para medir ou
predizer os seus efeitos sobre a saúde humana. Dentre os provocados pelo clima, estão os
surtos causados por vetores. As mudanças climáticas e seus efeitos (relações),
reconhecidos em diversas áreas, estão representados na Figura 12.

As relações reconhecidas entre o clima e a saúde, incluindo os impactos diretos e


indiretos sobre a humanidade, são diversos. Atingem, de maneira e forma diferentes, as
regiões, os continentes e os países, causando diversos efeitos na saúde da população, de
cada localidade. Entre efeitos na saúde, estão as doenças causadas por vetores e roedores,
que sofrem influência sazonal (OMS, 2003d).

)LJXUD0XGDQoDVFOLPiWLFDVHVHXVHIHLWRVQDVD~GHKXPDQD 206GSWUDGXomRQRVVDFRP
DOWHUDo}HV 

As técnicas relatadas nas publicações da OMS (2004b, 2003d), para a predição e


42

detecção de epidemias, que sofrem influência sazonal, são os modelos preditivos e os


Sistemas de Aviso Prévio.

A Organização Mundial de Saúde, em publicações recentes (2000b, 2003d e


2004b), abordou o potencial dos modelos de predição e (DUO\:DUQLQJ6\VWHPV (EWS) ou
Sistemas de Aviso Prévio (SAP). São reconhecidos dois tipos de SAP: D os
desenvolvidos para epidemiologia; E os desenvolvidos para escassez de alimentos
(OMS, 2000b, 2003d). Através da revisão bibliográfica realizada, não foi possível
encontrar trabalhos científicos sobre SAP, aplicados à área de surtos causados por vetores
PRVTXLWR$HGHV em regiões urbanas no Brasil.

Os SAP surgiram, através da proposta de Gill (1923 DSXG OMS, 2004b, p.12), para
predizer o surto de doenças infecciosas (malária), baseado nas condições climáticas
(chuva). O modelo foi colocado em prática, na cidade de Punjab, na Índia, entre os anos
1921 e 1942.

Rogers (1923, 1925, 1926 DSXG OMS, 2004b, p.12) descreveu a associação entre
variáveis climáticas (temperatura, chuva, umidade e ventos) e a incidência de doenças
(pneumonia, varíola, lepra e tuberculose), na Índia e em outras localidades. O modelo
nunca foi implementado em larga escala.

Segundo a OMS (2004b, p.12), os estudos já realizados demonstram a utilidade dos


SAP para predizer padrões existentes e futuros de doenças, mesmo sem estabelecer a
relação da associação de fatores climáticos à incidência de doenças. O uso de SAP pode
ajudar a gestores na área de saúde, a desenvolverem planos e concentrarem recursos, onde
forem necessários (PATZ, 1996 DSXG OMS, 2000b, p.10).

Em seu texto, a OMS (2004b, p.12) aponta três fatores para o setor de saúde
explorar os SAP: D padronização do diagnóstico, o que possibilita a rápida notificação e
monitoramento de doenças; E rede de monitoramento de dados ambientais, a um custo
praticamente inexistente; F avanços nos modelos estatísticos e epidemiológicos.

Na sua obra, a OMS (2004b, p.37) relata a não existência e o desconhecimento na


existência de publicações relatando o uso de SAP, ou de modelos implementados, para
auxiliar o suporte a decisões epidemiológicas.
43

A exceção a essa afirmação é o 6RXWKHUQ$IULFD0DODULD&RQWURO (SAMC), que não


publicou suas obras (OMS, 2004b, p.37), pois “não havia coletado os dados apropriados
(HJ saúde, clima, uso da terra), nos períodos necessários, das regiões afetadas, de forma
adequada” (OMS, 2003d, p.09, tradução nossa).

Na publicação da OMS (2004b, p.16) é dito que: D os SAP incorporam, em seu


funcionamento os modelos preditivos; E utilizam técnicas estatísticas que podem servir
para predizer a possibilidade de ocorrência de uma epidemia ou predizer o tamanho de
uma epidemia; F incluem consideração de condições operacionais de uso e respostas
(nível de acurácia).

Sua predição pode ser feita em semanas, meses ou até mesmo anos (OMS, 2004b,
pp.18-19). Seus principais objetivos são: D identificar se uma epidemia irá ocorrer em
uma população, de acordo com um número relatado de casos; E predizer o número de
casos, em um período de tempo (OMS, 2004b, p.19).

 2 PRGHORGHQRWLILFDomREUDVLOHLUR

No Brasil, em 1969, foi criado o Sistema de Notificação Semanal de Doenças,


através do qual, as Secretarias Estaduais de Saúde relatavam ao Ministério da Saúde, as
informações dos casos ocorridos naquela região. Em 1975, foi instituído pela lei 6.259,
do mesmo ano, e pelo decreto 78.231, de 1976, o Sistema Nacional de Vigilância
Epidemiológica, que incorporou o conjunto de doenças de maior relevância no país
(FUNASA, 2002, pp.10-11).

O Sistema Único de Saúde foi promulgado em 1990, através da lei 8.080, e através
dele, a descentralização das responsabilidades e funções do sistema de saúde, implicou no
redirecionamento das atividades de vigilância epidemiológica ao município (FUNASA,
2002, pp.10-11). A Portaria n.º 1.943, de 18 de outubro de 2001 do Ministério da Saúde,
aumentou para trinta e cinto, o número de doenças que são compulsórias e, por isto,
devem ser notificadas (FUNASA, 2002, pp.26-27).

Para cada doença, a coleta, notificação13 de casos e geração dos dados são

13 "Notificação é a comunicação da ocorrência de determinada doença ou agravo à saúde, feita à autoridade


sanitária, por profissionais de saúde ou qualquer cidadão, para fins de adoção de medidas de intervenção
pertinentes" (FUNASA, 2002, p. 15)
44

especificadas no Sistema Nacional de Agravos de Notificação (SINAN). Os dados que


alimentam esse sistema são: D dados demográficos, socioeconômicos e ambientais; E
dados de mortalidade; F notificação de surtos e epidemias (FUNASA, 2002).

Encontram-se disponíveis, formulários padronizados do SINAN, para a maioria das


doenças do Sistema de Vigilância Epidemiológica brasileiro, nas unidades de saúde de
atendimento do SUS. Em caso suspeito de alguma dessas doenças, a respectiva ficha é
preenchida e enviada à Secretaria Municipal de Saúde. A notificação é compulsória e
pode ser feita: D no local de atendimento; E de forma anônima; F pela imprensa. O
que facilita, após investigação epidemiológica14, e se necessário, o combate à doença
(FUNASA, 2002, pp.34-37).

 'LDJUDPDVGHFRQWUROH

O método indicado pela FUNASA (2002, p.48) e adotado em todo Brasil, para
verificação de uma epidemia, é transcrito a seguir:

Um dos métodos utilizados para verificação de ocorrência de uma epidemia é o


DIAGRAMA DE CONTROLE, que consiste na representação gráfica da distribuição da
média mensal e desvio padrão dos valores da freqüência (incidência ou casos) observada,
em um período de tempo (habitualmente 10 anos). A construção desse gráfico pode ser
gerada, procedendo-se da seguinte maneira:

* Verificar se a distribuição do número de casos/incidência da doença, registrado


mensalmente, durante os últimos anos (geralmente dez anos ou mais), apresenta grandes
variações;

* excluem-se os dados referentes a anos epidêmicos;

* calcula-se a média aritmética e os desvios-padrão (pode ser calculado no


programa Excel) de cada distribuição mensal das incidências registradas no período
selecionado;

14
"Investigação epidemiológica é um trabalho de campo, realizado a partir de casos notificados (clinicamente
declarados ou suspeitos) e seus contatos, que tem como principais objetivos: identificar fonte e modo de
transmissão: grupos expostos a maior risco; fatores determinantes; confirmar diagnóstico; e determinar as
principais características epidemiológicas. O seu propósito final é orientar medidas de controle para impedir a
ocorrência de novos casos" (FUNASA, 2002, 31).
45

* os valores compreendidos entre aqueles correspondentes à média de cada mês,


acrescidos de 1,96 desvios-padrão e os de cada média mensal, subtraídos 1,96 desvios-
padrão (distribuição normal), correspondem ao nível endêmico da doença, ou seja, o
limite de variação esperada para cada mês;

* representa-se graficamente (diagrama curvilinear) a distribuição das médias e


desvios-padrão da incidência (diagrama de controle);

* quando os valores observados ultrapassam aqueles do limite máximo da variação


esperada, diz-se que está ocorrendo uma epidemia. Dessa maneira, quando uma doença
deixou de ocorrer em uma determinada área, o registro de um único caso pode estar
configurando uma epidemia ou surto.

Ao fim da transcrição, exibe-se um diagrama de controle de Dengue da cidade de


Goiânia-Go no ano 2001 (Figura 13).

)LJXUD±'LDJUDPDGHFRQWUROHHFDVRVQRWLILFDGRVGHGHQJXHSRUVHPDQDHSLGHPLROyJLFD*RLkQLD±*R
 6,48(,5$-81,25S 

 'HQJXHHVHX9HWRU

O $HGHVDHJ\SWL 6WHJRP\D (Figura 14)e o$HGHVDOERSLFWXV 6NXVH (Figura 15)


são os vetores conhecidos de Dengue em todo mundo (OMS, 2004, 2003). No Brasil,
nenhuma publicação relata o $HGHVDOERSLFWXV portando-as.
46

)LJXUD$VSHFWRGHXP$HGHVDHJ\SWL 08167(50$11 

)LJXUD$VSHFWRGHXP$HGHVDOERSLFWXV &58= 
Desconhece-se, através da revisão bibliográfica realizada, publicações nas
Américas, que relatem o $HGHV DOERSLFWXV portando quaisquer arbovírus, embora Alves
Borges (2001, p.04) relate que “estudos laboratoriais demonstram a competência vetora
do $H$OERSLFWXV para transmitir dezoito arbovírus, incluídos em três famílias”.

O relato nesta dissertação será referente ao vetor urbano brasileiro de Dengue, o


$HGHV DHJ\SWL. Segundo alguns autores (CUMMINGS HW DO, 2004, p.345; GALE
MOORE, 2000, p.08; PATZ HW DO, 1998, p.01; REBELO HW DO, 1999, p.478; OMS,
2004b, pp.24-26, OMS, 2000b, p.07), Dengue possui um vetor que segue séries sazonais
(depende de temperatura e umidade, normalmente com presença de chuva, para se
propagar). A imunidade contra o vírus de Dengue (Den-1, Den-2, Den-3, Den-4) que
contaminou o paciente, é permanente e, para os demais tipos, é de três meses a cinco
anos, na média (FUNASA, 2002, p.186).

Dengue constitui num dos mais importantes problemas de saúde pública, em vários
outros países, exigindo avanços na busca de soluções e obtenção de resultados
satisfatórios nos programas de controle de vetores (BRASSOLATTI; ANDRADE, 2002,
p.244).
47

A prevenção a essas epidemias pode ser feita por meio do combate ao vetor na
forma de:  campanhas preventivas, aplicação de veneno nas ruas da cidade;  com a
utilização do Ultra Baixo Volume (UBV) (GUBLER, 1989 p.244 DSXG BRASSOLATTI;
ANDRADE, 2000; OMS, 1997, p.57);  predadores naturais (PINHEIRO; TADEI,
2002, p.1529; MARTENS HW DO., 1995, p.04; OMS, 1997, p.59);  agentes biológicos
(POLANCZYK; GARCIA; ALVES, 2003, p.01; OMS, 1997, p.58);  a soltura
(liberação em locais de risco) de vetores transgênicos (não férteis) (O´BROCHTA, 2002,
pp.247-253).

O vetor pode transmitir o vírus de forma indireta (transmissão horizontal), nas


zonas urbanas e rurais. Na zona rural, a transmissão pode ocorrer do mosquito para
animais, e do mosquito para humanos. Na zona urbana, o vetor transmite as doenças de
um animal (ser humano) a outro (transmissão horizontal), através de um mosquito
infectado. O vetor pode também passar o vírus a sua prole, em sua primeira fase de vida
(transmissão vertical) (OMS, 2004, p.02; OMS, 1996, p.21). A transmissão indireta está
representada na Figura 16.

)LJXUD7LSRVGHWUDQVPLVVmRLQGLUHWDUHFRQKHFLGDSDUDGHQJXH 206GSWUDGXomRQRVVD
FRPDOWHUDo}HV 

 'HQJXH

“A Dengue tem sido relatada nas Américas, há mais de 200 anos” [...] “há
referências de epidemias desde o século XIX” (FUNASA, 2002, p.207). Dengue é um
vírus (arbovirose) (UNICAMP, 2004, p.127) da família )ODYLYLULGDH gênero )ODYLYLUXV
(FUNASA 2002, p.203; HEINZ HWDO 2000 DSXGCORTES, 2003, p.01). De acordo com
as publicações da FUNASA (2002, p.203) e da OMS (2003d, p.14, tradução nossa) “é a
mais importante arbovirose que afeta o ser humano”.

De forma geral, as epidemias desse vírus são identificadas, quando a incidência de


casos acumulados, já atingiu um contingente populacional expressivo, em determinada
área geográfica e, portanto, detectadas de forma tardia (OMS, 2000c, pp.75-88).

É uma doença endêmica em cem países, encontrada em regiões tropicais e


48

subtropicais (Figura 17), predominantemente em regiões urbanas e semi-urbanas. A OMS


estima que ocorram cinqüenta milhões de casos suspeitos ao ano. A vacina contra dengue
vem sendo desenvolvida e ainda não foi testada para uso em larga escala (KHAN HWDO,
2004, p.85; SRINIVASAN HWDO. 2004, p.49; OMS, 2003, p.02).

São reconhecidos, no mundo, quatro tipos diferentes do vírus Dengue: Den-1, Den-
2, Den-3 e Den-4. Os tipos Den-1, Den-2 e Den-3 são circulantes em boa parte do Brasil
(SVS, 2005, p.02) (Figura 18). Alguns autores (ALVES BORGES, 2001, pp.18-22;
LOIOLA, 2000, pp.49-55; MSB, 2004, 2005) relatam que o Den-4 não está presente no
Brasil.

)LJXUD±3DtVHVFRPSUHVHQoDGH'HQJXHHP 206FS 
No entanto, a FUNASA (2002, p.207) registrou nos anos de 1981 e 1982,
epidemias comprovadas clínica e laboratorialmente, do Den-4 e Den-1, na cidade de Boa
Vista, em Roraima. Foram registrados, no mesmo período (1981-1982), casos do Den-4
na Venezuela, Equador e Peru (LOIOLA, 2000, pp.49-55). Na obra de )RXTXH e *DULQFL
e *DERULW (2004, p.44), há relato da presença dos quatro sorotipos de Dengue na Guiana
Francesa, o que indica, pela proximidade geográfica, a possibilidade de um novo surto no
Brasil.

Os principais hospedeiros do vírus são os humanos. Alguns estudos sugerem que,


em algumas partes do mundo, os macacos podem ser infectados (OMS, 2003, p.02).
49

)LJXUD6RURWLSRVFLUFXODQWHVGRYtUXVGDGHQJXHSRUHVWDGRV%UDVLO 696S 
Dengue, no organismo do vetor, demora de oito a dez dias para se desenvolver e
permanece ativo, até o fim da vida, sem prejudicá-lo (OMS, 2003, p.01). No organismo
humano, os sintomas aparecem, após três dias da picada do vetor contaminado e o vírus
permanece ativo, em média, de cinco a seis dias, período em que os sintomas aparecem
(OMS, 2003, p.02).

Já se registrou a incidência dos casos de Dengue, entre cinqüenta e setenta por cento
da população do Estado do Rio de Janeiro (CREMERJ, 2002 DSXG DENIS, 2003, p.645).
A OMS estima que a incidência possa atingir, entre oitenta e noventa por cento da
população (GUBLER; TRENT 1993 DSXG OMS, 2003, p.51).

Registra-se que um mesmo paciente pode ser infectado por mais de um vírus, ao
mesmo tempo (ROCCO; BARBOSA; KANOMATA, 1998, p.151). A imunidade
humana, quanto a qualquer dos tipos adquiridos de Dengue, é permanente e a infecção
seqüencial por outro tipo do vírus, pode causar a Febre Hemorrágica do Dengue (FHD)
(FUNASA, 2002, p.203, PONTES; RUFFINO NETTO, 1994, p.01; OMS, 2003, p.01).

Epidemias de FHD foram reconhecidas, na década de 1950, nas Filipinas e


Tailândia, afetando a maioria dos países asiáticos, onde se transformou em uma das
principais causas de hospitalização e óbito de crianças. Sem tratamento adequado, pode
causar a morte de um paciente infectado, entre doze e vinte quatro horas. Segundo
estatísticas da OMS, cerca de dois e meio por cento das pessoas com FDH vão a óbito
(OMS, 2003, p.01).

O mais importante vetor de Dengue, nas Américas e na Ásia, são as fêmeas do


$HGHV DHJ\SWL Nesses continentes, sua reprodução tem características urbanas. Já, na
50

África, além das áreas urbanas, ocorre, também, em áreas silvestres. Em anos recentes, o
$HGHVDOERSLFWXVfoi reconhecido (OMS, 1997, p.51) como vetor secundário, na Ásia, e
tornou-se presente em diversos países americanos, dentre eles o Brasil (OMS, 2003,
p.02).

Em diversas publicações (HJ LIMA HWDO1999; SILVEIRA RODRIGUES HWDO


2002; SOUSA HW DO 2004; VASCONCELOS HW DO., 1998), a estimativa dos casos
ocorridos supera a notificação dos órgãos responsáveis, o que dificulta muito o combate
da doença, pois a falta destas informações prejudica a ação e planejamento eficazes dos
gestores da área de saúde para o tratamento dos pacientes e combate ao vetor de Dengue.

Na publicação de NASCIMENTO SOUSA HWDO (2004), é relatado que, além dos


elementos (parâmetros) meteorológicos, outros fatores contribuem para a incidência de
Dengue, em uma cidade. Estes fatores podem ser exemplificados, através do modelo
epidemiológico 6XVFHSWLEOH,QIHFWHG,PXQH (SIR), utilizado para estabelecer a dinâmica
da transmissão e com a introdução na população de novos subtipos virais circulantes.

No Brasil, a tipificação laboratorial do Den-1 foi feita em 1996. O Den-2 foi


tipificado em 1990 e finalmente o Den-3, em 2000 (SIQUEIRA JÚNIOR, 2005, p.49).
Todos os surtos do Den-4 detectados, foram controlados e não houve epidemia registrada
depois de 1982.

Publicações recentes (SIQUEIRA JUNIOR HW DO, 2004, 2005) relatam que a
ocorrência de Dengue nos anos 2001 e 2002, em toda a América Latina, está concentrada
na população adulta (30 a 49 anos de idade) e, no Brasil, concentrada na faixa etária de 20
a 40 anos de idade.

 ,QTXpULWRVVRUROyJLFRV

Inquéritos sorológicos são exames laboratoriais (LOIOLA, 2000, pp.37-43), cujas


amostras são recolhidas de pessoas residentes em locais escolhidos de forma aleatória,
dentro de um mesmo município, e proporcionam estimativa da dimensão de uma
epidemia (FUNASA, 2002, p.272).

Os inquéritos epidemiológicos realizados em populações brasileiras encontram,


mesmo atualmente, sérias dificuldades quanto ao processo de obtenção das amostras
de domicílios. O sorteio por conglomerados em vários estágios, em que o setor
51

censitário é a unidade primária de amostragem, é o método probabilístico


usualmente adotado (Kish, 1965). Informações demográficas sobre os setores
censitários, sorteados no primeiro estágio, podem ser adquiridas na Fundação
Instituto Brasileiro de Geografia e Estatística (IBGE), que também produz cópias
dos mapas construídos para os censos demográficos, realizados a cada 10 anos
(NUNES SILVA; CUNHA; QUINTANILHA, 2003, p.494)

Os inquéritos são importantes para a precisão da avaliação do caso suspeito, por sua
alta eficácia de diagnóstico (CORTES HW DO., 2003, p.331). Citam-se, em ordem
cronológica de publicação, alguns autores que realizaram inquéritos sorológicos relativos
ao dengue, e os resultados alcançados:

Venâncio da Cunha HW DO (1997, p.379) relatam que, em amostragem de crianças
em fase escolar, no ano de 1994, no Município de Paracambi, Estado do Rio de Janeiro, a
positividade do teste de Inibição da Hemaglutinação foi detectada em 39,2% (145/370)
dos casos escolares pesquisados. A freqüência de positividade foi de 53,8% (78/145) para
o sexo feminino, e de 46,2% (67/145) para o sexo masculino. A distribuição por faixa
etária mostrou positividade crescente com o aumento da idade.

Lima HWDO (1999, p.566) relatam que, mesmo com a notificação compulsória dos
casos de agravo (448 sendo 57 confirmados), os dados estatísticos, obtidos através de
pesquisa (com 1.113 amostras) realizada três (03) meses após o término da epidemia,
feita com a técnica MAC-ELISA para detecção dos anticorpos IgM Den-1 e Den-2,
apresentaram valores duas vezes superiores aos notificados, e quinze vezes superiores aos
casos laboratoriais relatados, o que indicaria que a epidemia foi muito superior à
inicialmente divulgada.

Vasconcelos HW DO. (1998, p.447) relatam inquérito baseado em mil trezentas e
quarenta e uma amostras de soro, de nove distritos sanitários, testadas por inibição da
hemaglutinação, sendo classificadas como negativas e positivas, com quarenta e quatro
por cento ou quinhentas e oitenta e oito amostras positivas. Os autores relatam que não
houve diferença da prevalência quanto ao sexo, faixa etária e escolaridade, ao contrário
da condição sócio-econômica que apresentou diferenças estatisticamente significantes.

Silveira Rodrigues HW DO (2002, p.160), relatam estudo realizado em instituto de
correção de menores (com 196 amostras), que indicou o possível nível de disseminação
52

de Dengue, em uma cidade com grande densidade populacional, demonstrando um índice


de infecção muito superior ao oficial.

Cabe salientar, que o preço médio para um kit com 96 (noventa e seis) amostras
(testes individuais) de averiguação de Dengue, com a capacidade de diagnosticar se a
pessoa está com o vírus no momento, ou se já teve contato com o vírus (são kits
diferentes), foi avaliado em um mil e duzentos reais, em fevereiro de 2005.(preço por kit).
Para realizar um inquérito sorológico, com no mínimo mil amostras, seriam necessários
aproximadamente onze kits, o que totalizaria, aproximadamente, treze mil e duzentos
reais, apenas em material para testes laboratoriais.

 (VWXGRVUHODWDGRV

 (VWXGRDSUHVHQWDGRQD66%'0¶

Esse estudo foi apresentado na ,QWHUQDWLRQDO &RQIHUHQFH RQ 6FLHQWLILF DQG


6WDWLVWLFDO 'DWDEDVH 0DQDJHPHQW 66'%0¶  Nele é relatada a arquitetura do
(SLGHPLRORJLFDODQG6WDWLVWLFDO'DWD([SORUDWLRQ6\VWHP (CARESS), baseada no projeto
&DQFHU5HJLVWU\ /RZHU6D[RQ\ (CARLOS), iniciado em 1993, na Alemanha. O projeto
CARLOS visou melhorar o acesso às informações, através da unificação de ferramentas
de pesquisa (WIETEK; KAMP, 1997, pp.01-02).

Sua arquitetura é formada pelas seguintes camadas: integração de dados,


questionamento, análise, apresentação visual (feita através de ferramentas) e exploração
interativa (KAMP; SITZMANN; WIETEK, 1997, p.01). O centro de toda a arquitetura
consiste na combinação de dados estatísticos e espaciais (mapas) (WIETEK; KAMP,
1997, p.06).

No CARESS, uma pessoa, através de complexas consultas ao banco de dados e de


operações estatísticas, gera as informações que deseja. Essas consultas podem ser
cíclicas, o que gera complexidade de interpretação e alto tempo de realização da pesquisa
(KAMP; SITZMANN; WIETEK 1997, p.02; WIETEK; KAMP, 1997, p.04).

Essas informações podem ser divididas em: D Categorias: região, intervalo de


tempo, propriedades de classificação (HJ idade, sexo) e não classificativas (HJ
doenças); E Resumos: número (HJ população, casos), medida comparativa (HJ
53

classificação), medida geral (HJ nível de significância, testes estatísticos) ou


visualização (HJ mapas, gráficos ou tabelas) (KAMP; SITZMANN; WIETEK, 1997,
p.01; WIETEK; KAMP, 1997, p.04).

No CARESS, os dados são mantidos em um 'DWDZKDUHKRXVH, agrupados em forma


de metadados e disponíveis para consulta. As consultas em forma de mapas, utilizando
Sistemas de Informações Geográficas, são feitas em duas dimensões (KAMP;
SITZMANN; WIETEK, 1997, p.04).

As estatísticas, obtidas através de agrupamentos dos casos, podem servir como


suporte à decisão, para o tratamento de pacientes (através da pesquisa de tratamentos
similares que foram bem sucedidos), ou na prevenção de novos casos (a partir das
condições ambientais em que as pessoas vivem) (WIETEK; KAMP, 1997).

 0RGHOR3DQ(XURSHXGH6D~GH

O Modelo Pan-Europeu de Saúde propõe integrar vários sistemas legados


(programas antigos existentes) de saúde, a fim de utilizar informações de inúmeros
bancos de dados simultâneos. De acordo com a publicação, todos os bancos convergiriam
para a estrutura de um 'DWDZDUHKRXVH, no qual os gestores manejariam informações de
acordo com o perfil dos dados (públicos ou confidenciais) ou o tipo de seu
armazenamento. No modelo Pan-Europeu, foram identificadas três possibilidades de
perfil diferentes (KOVACS HWDO., 2000, pp.01-07): D o perfil de acesso Completo, no
qual os dados privados do paciente são armazenados localmente; E o perfil de acesso de
dados Filtrados (parcialmente confidenciais), no qual os dados dos pacientes guardados
por região; F o perfil de acesso aos dados Filtrados (confidenciais), no qual os dados dos
pacientes armazenados em âmbito nacional ou internacional.

As desvantagens desse modelo para a criação da informação são: D alto tempo


necessário para pesquisa; E a alta especialização necessária para operação do
'DWDZDUHKRXVH; F subjetividade dos dados (KOVACS HWDO, 2000, p.04).

Os conjuntos (grupos) de dados (subjetivos) de sistemas de saúde locais podem ser


assim classificados: D Epidemiologia: dados classificados de acordo com a doença,
facilitando a análise geográfica e temporal de alguns pacientes, selecionados de acordo
com as relações entre eles; E Orçamento: custo da análise para melhor solução; F
54

Recursos humanos: análise da SHUIRUPDQFH de condução, de médicos e outras pessoas;


G Recursos materiais: estudos comparativos de instrumentos e infra-estrutura
(utilização, eficiência e custo); H Sociologia: estudos podem indicar os benefícios do
bem-estar e os custos de saúde (KOVACS HWDO., 2000, p.08).

Os autores relatam que o modelo estava sendo implementado no CRYSTAL ':, o


que possibilitaria uma visão geral e transparente do estado clínico dos pacientes, em uma
região.

 0RGHOR$OHPmRGH6D~GH

No modelo Alemão de Saúde, todas as doenças de notificação compulsória são


analisadas, diariamente, semanalmente, mensalmente ou anualmente, pelo Departamento
de Saúde Pública daquele país (SCHUMANN; LÓPEZ; GRAW 1998). Essas notificações
de doenças são enviadas, em formatos distintos de dados, especificados nas Figuras 19 e
20. Na Figura 19, está representado o formato de envio, dos hospitais ao Departamento de
Saúde Pública Alemão. Na Figura 20, está representado o formato de envio obrigatório de
dados, das companhias seguradoras, ao mesmo departamento de saúde.

)LJXUD)RUPDWRGHHQYLRGHGDGRVGRVKRVSLWDLVDR'HSDUWDPHQWRGH6D~GH3~EOLFD$OHPmR
6&+80$11/Ï3(=*5$: 

Na Figura 19, Kij representa a freqüência da doença Ki, em uma área geográfica oj
(i.e. distrito ou cidade). Os parâmetros [ta, te] representam o intervalo de tempo.

)LJXUD)RUPDWRGHHQYLRGHGDGRVGRVKRVSLWDLVDR'HSDUWDPHQWRGH6D~GH3~EOLFD$OHPmR
6&+80$11/Ï3(=*5$: 

O formato de envio dos dados, das companhias seguradoras ao Departamento de


Saúde Alemão, é compulsório e definido por leis daquele país. Essas leis obrigam que a
notificação do caso contenha: tratamento seguido, idade, sexo (dentre outros parâmetros a
serem informados). Na Figura 20, o parâmetro 2 denota o conjunto de áreas geográficas,
. o tipo da doença e, m1,..., mk, os parâmetros descrevendo o paciente e a doença.
55

Segundo os autores, embora o conjunto de dados 0' possa ser facilmente extraído do
&' o fluxo de dados é lento e dificulta a predição de epidemias.

 2XWURVPRGHORVGHSUHGLomRHWUDEDOKRVHQFRQWUDGRV

Rigau-Perez HWDO (1999) avaliam a utilidade do Gráfico de Barras, na detecção


de epidemias de Dengue, em Porto Rico, para a vigilância de doenças, em múltiplas
localidades. Durante um período de quatro semanas, observou-se significante aumento
na incidência de Dengue, caracterizado por excesso de casos suspeitos, em mais de duas
semanas, além da média prevista. A apresentação de um índice anual de casos
registrados de Dengue, maior que três por mil foi considerado como epidemia.

Hales HWDO (2002) investigam os efeitos potenciais da mudança do clima na saúde


humana, em relação aos arbovetores. Nessa obra, os autores, através de um parâmetro
climático (evaporação de água), avaliaram as mudanças nos limites geográficos da
transmissão de Dengue e o número de possíveis infectados, através de projeções da
população humana e mudanças climáticas.

Os autores relatam que, através de regressões logísticas, com margem de confiança


de oitenta a nove por cento até o ano 2085, o valor aproximado é entre cinco e seis
bilhões de pessoas. De cinqüenta a sessenta por cento da população global projetada,
estariam susceptíveis, em seus limites geográficos atuais, à transmissão de Dengue. Na
construção do modelo, foram utilizados a média mensal das variáveis climáticas (chuva,
temperatura máxima, mínima e média diárias, dentre outras) e o número de casos
notificados da doença.

Penna (2004) realizou um estudo entre as redes neurais e a técnica estatística de


regressão binomial negativa, para predição de cólera, no Ceará. Este estudo teve como
base, os dados de uma epidemia de cólera, ocorrida entre os anos de 1993 e 1994. Foi
utilizada uma rede recorrente, com dois neurônios na camada de entrada (correspondentes
ao ano e ao mês), doze, na camada oculta, um, na camada de saída e um, na de memória.
O treinamento foi feito através do EDFNSURSDJDWLRQ, com taxa de aprendizado de 0,01 e
momentum de 0,9. Os dados utilizados para treinamento, foram coletados entre janeiro de
1979 e junho de 1991, correspondendo a cento e cinqüenta observações. A predição foi
realizada para o período de agosto de 1991 a dezembro de 1995. Houve o mesmo ajuste
de dados para a técnica de regressão binomial negativa, através da qual foram feitas as
56

predições para o mesmo período. Os resultados são os apresentados na Figura 21.

)LJXUDÏELWRVREVHUYDGRVHHVWLPDGRVSRUUHJUHVVmRELQRPLDOQHJDWLYDHUHGHQHXUDO&HDUi-XOKR
GHDGH]HPEURGH 3(11$S 

Nessa obra, a autora nos relata que os dois modelos alcançaram valores bons de
predição, embora o modelo de regressão binomial negativa estudado, apresentasse menor
variância que o da rede neural (PENNA, 2004, p.355).

 7UDEDOKRVHQFRQWUDGRVUHODWLYRVDR%UDVLO

Siqueira Júnior (2005) faz uma avaliação dos casos de Dengue no Brasil nos anos
situados entre 1981 e 2002. Nessa obra, o autor relata que o Brasil notificou,
aproximadamente, setenta por cento de todos os casos notificados nas Américas.

O autor relata que os casos notificados de Dengue reapareceram nas Américas, na


década de 1960, mas precisamente nas Ilhas Caribenhas e Venezuela; na década de 1970
e na Colômbia e no Brasil, na década de 1980.

O histórico da totalização de casos notificados de dengue, no Brasil, pode ser


demonstrado através da Figura 22. Esta figura apresenta um gráfico que está totalizado
mensalmente, sendo que a barra negra representa o mês de janeiro de cada ano
(SIQUEIRA JÚNIOR, 2005).
57

)LJXUD&DVRVUHODWDGRVGHGHQJXHQR%UDVLOQRVDQRVGHD 6,48(,5$-Ò1,25
S 

A Figura 22 fornece informações importantes sobre a ocorrência dos casos de


Dengue no Brasil. A primeira informação é a representação de duas séries temporais
distintas. A segunda informação é a que de forma genérica, no início de cada ano, há um
aumento de número de casos notificados relatados.

A Figura 23 demonstra o número de casos, óbitos, hospitalizações de DH e


tipificação dos casos de Dengue, em todo Brasil, nos anos entre 1996 e 2002, assim como
também FHD, óbitos, hospitalizações e ano de tipificação desse vírus, no Brasil. Nesta
figura pode-se ver o aumento considerável do número de hospitalizações, decorrentes de
complicações relativas ao Dengue ou por FHD.

As últimas pesquisas publicadas no ano de 2004, revelam que houve redução


nacional de 81,8% dos casos notificados, sendo que o estado de Goiás teve decréscimo de
80,7% dos casos de agravo relatados (SVS, 2004, p.05).
58

)LJXUD1~PHURGHFDVRVUHODWDGRVGHDJUDYRyELWRVKRVSLWDOL]Do}HVHDQRGDWLSLILFDomRGRVFDVRVGH
GHQJXHQR%UDVLO 6,48(,5$-Ò1,25S 
 2XWUDVSXEOLFDo}HVUHIHUHQWHVD'HQJXH

Na publicação de Sousa HW DO (2004), é relatada uma relação direta entre a
precipitação pluviométrica e o número de casos notificados de Dengue, em Belém-PA, no
período entre 1998 e 2003. Os autores construíram gráficos anuais, divididos em faixas
mensais que, depois de analisados, os levaram a constatar que existe uma maior
incidência de casos de Dengue nos meses considerados mais chuvosos (janeiro, fevereiro,
março e abril). Os autores relacionaram outros parâmetros meteorológicos (temperatura e
umidade relativa) com o surto dessa doença.

Nascimento Sousa HW DO (2004), relatam ter utilizado tomada mensal de dados
climáticos (temperatura média, temperatura máxima, temperatura mínima, umidade
relativa do ar e precipitação) entre 1996 e 2000, para determinar, através do método de
coeficientes de incidências mensais, a influência do clima sobre a variação anual média
de casos relatados de Dengue, na cidade de Campina Grande-PB. Os autores relatam que
uma das condições atmosféricas (temperatura mínima) restringe a ação do vetor e o
impede de transmitir o vírus de Dengue. Dizem, ainda, que os elementos (parâmetros)
meteorológicos (chuva, temperatura média e umidade relativa do ar) contribuíram para
incidência da doença, naquela cidade, na faixa de doze a trinta e quatro por cento da
população. Ainda justificam que, “além das condições meteorológicas, existem outras,
causadas por condições nutricionais, sociais, e de defesa imunológica do organismo
59

humano” (NASCIMENTO SOUSA HWDO, 2004, p.02) HJ (relatado pelos autores) e pelo
racionamento de água ocorrido na região.

Andrade e Dantas (2004), em sua obra, avaliam a influência de elementos


meteorológicos, nos casos de várias doenças, dentre elas, Dengue, na cidade de Campina
Grande–PB Os elementos climáticos (temperatura mínima, temperatura máxima,
precipitação, umidade relativa do ar) foram analisados através das médias semanais dos
anos entre 1999 e 2001, totalizando 156 semanas. Foram utilizadas técnicas estatísticas
de regressão linear simples e regressão linear múltipla para determinar a correlação do
número de casos registrados de Dengue e as variações climáticas registradas. O resultado
obtido foi a correlação, considerada, pelos autores, fraca, entre clima (variáveis
climáticas) e o surto de Dengue. Na mesma publicação, é relatado que os elementos
meteorológicos que mais influenciaram na disseminação de Dengue, naquela região,
foram a umidade relativa do ar e a precipitação pluviométrica.

Campus Braga HWDO (2004), em artigo, apresentam a regressão linear simples, como
método para predição de Dengue, sobre a região da Paraíba, a partir de uma variável
atmosférica (índice pluviométrico). Os dados adotados para a pesquisa, foram os totais
diários de notificação de Dengue e a precipitação da região. O método tem capacidade de
predição para alguns meses, em relação à distribuição do número de casos relatados de
Dengue. Os resultados encontrados foram de boa acurácia, para alguns municípios da
região estudada.

 (VWXGRVHSLGHPLROyJLFRVHP*RLkQLD

Em sua dissertação de mestrado, Maciel (1999) - através de métodos estatísticos de


análise epidemiológica descritiva, com construção da série histórica do período, taxas de
ataque (ocorrência) global e específica por idade, sexo e local de residência, com
intervalos de confiança de noventa e cinco por cento - faz uma avaliação epidemiológica,
nos dados notificados de Dengue, no Município de Goiânia, no período entre 1994 e
1997. Na pesquisa, é relatado que o maior número de casos notificados, no período,
ocorreu entre janeiro e maio, também a fase de maior precipitação pluviométrica.

Os resultados encontrados foram: D diferença estatística significante entre os


sexos, sendo o feminino o de maior taxa de ataque (ocorrência); E faixas etárias mais
60

atingidas, entre vinte e quarenta e nove anos; F a região com maior número de
notificações foi a central, com 19,8% dos casos.

É importante ressaltar que, antes da década de 80, não houve notificação do vírus
de Dengue, em Goiânia-Go, portanto, o ano de 1994 foi considerado epidêmico.

Siqueira Júnior (2001), em sua dissertação de mestrado, faz uma avaliação


epidemiológica nos dados notificados de Dengue, no Município de Goiânia. Essa
avaliação, nos dados de notificação, visou oferecer bases para determinar a existência de
epidemia, nos primeiros meses de 2001. Foram utilizadas as técnicas de diagramas de
controle de método analítico-gráfico e método de 6KHZKDUW, para determinar o limite de
alarme para a ocorrência do surto.

Os resultados apresentados foram: D a detecção da epidemia (número de casos


notificados comparado ao limite de alarme) por ambas as técnicas. O método analítico-
gráfico, que possibilitou a detecção com duas semanas de antecedência; E “identificação
da região Nordeste, como a área inicial, com excesso significativo de casos” (SIQUEIRA
JÚNIOR, 2001, p.06).

Um inquérito populacional foi realizado em mil seiscentos e dez indivíduos, para


avaliar a presença de anticorpos anti-Dengue, através dos testes sorológicos (IgG e IgM),
e os fatores de risco individuais e de área para a ocorrência da infecção no município de
Goiânia em 2001. Foi realizada, através do método .HUQHO, a distribuição espacial da
prevalência na área urbana. Entre os fatores de risco para infecção o resultado
apresentado foi risco em pessoas mais velhas, com baixo nível de educação, menores
salários e em áreas urbanas mais afastadas, das regiões mais valorizadas (SIQUEIRA
JÚNIOR, 2004).

A Figura 25 mostra as estimativas de prevalência de infecção pelo vírus da Dengue


de acordo com a técnica espacial de .HUQHOpara o município de Goiânia. A prevalência
global para região foi de 29,5%.
61

)LJXUDSUHYDOrQFLDGHGHQJXHHP*RLkQLD 6,48(,5$-Ò1,25HWDO  


62

 0(72'2/2*,$

 &DUDFWHUL]DomRGDSHVTXLVD

 &ODVVLILFDomRGD3HVTXLVD

Este é um trabalho de pesquisa aplicada, que objetiva a criação de modelo


epidemiológico para doenças transmitidas pelo vetor urbano, PRVTXLWR $HGHV (i.e.
Dengue), que possibilite, com certa margem de confiança, a tomada de decisão aos
gestores de saúde. A classificação da pesquisa quanto ao fim, é explicativa (pretende-
se criar relações, de forma a transformar um conjunto de dados em base de
conhecimento, que prevejam a ocorrência de surtos), quanto ao meio de investigação, e
experimental (pretende-se trabalhar com variáveis independentes e observar como
essas variáveis se comportam). Como a fonte dos dados é interdisciplinar, optou-se, no
caso dos dados, pela pesquisa exploratória descritiva (revisão bibliográfica), com
instrumento de pesquisa documental, visando buscar pesquisas recentes sobre o vetor e
as doenças.

 8QLYHUVRGD3HVTXLVD

A pesquisa realizada teve como escopo de trabalho, os dados fornecidos, através


de solicitação, pelas seguintes fontes da cidade de Goiânia-GO: D 10º Distrito de
Meteorologia (10º DISME); E Cia. de Processamento de Dados do Município de
Goiânia (COMDATA); F Secretaria Municipal de Saúde de Goiânia (SMS-GO); G
Divisão de Estudos Sócio Econômicos, pertencente à Secretaria Municipal de
Planejamento (SEPLAN).

O alvo desta pesquisa está direcionado para a criação de modelo epidemiológico,


capaz de prever, com certa margem de confiança, o número de casos confirmados de
Dengue, possibilitando a tomada de decisão/ação (i.e. campanhas de prevenção,
combate ou vacinação de emergência) por parte das autoridades de saúde da cidade
(CUMMINGS HWDO, 2004).

O modelo é alimentado conforme as referências bibliográficas (pesquisa


exploratória) e referentes ao vetor das doenças e a parâmetros climáticos,
representados através dos seguintes bancos de dados:
63

a) Dados epidemiológicos – representados pelos exames laboratoriais e


avaliações médicas, registradas no SINAN, e fornecidas pelo
Departamento de Epidemiologia da Secretaria Municipal de Saúde de
Goiânia - Go;

b) Dados (parâmetros) climáticos fornecidos pelo 10º DISME.

 0DWHULDOH0pWRGRV

 $ERUGDJHP$GRWDGD

Por sua característica interdisciplinar, o curso de mestrado da Universidade


Católica de Brasília (UCB), em Gestão do Conhecimento e da Tecnologia da
Informação (MGCTI), possibilita uma abordagem que parte da tecnologia para a gestão
do conhecimento, de forma indutiva e provocativa, a fim de que os processos mentais
atuem para a implantação de modelos formais de Gestão do Conhecimento em várias
áreas. Dentre essas áreas, está a da Saúde, que no momento, tem grande repercussão, no
que tange a ocorrência de epidemias. O processo de análise e descoberta de
conhecimento, utilizado nesta dissertação, baseia-se na metodologia CRISP-DM
(DELMATER; HANCOCK, 2001, p.61; CHAPMAN HW DO., 1999 DSXG COSTA
SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02), através da aplicação em
estudo de caso, para a área fim da Secretaria Municipal de Saúde de Goiânia.

 'HVFULomRGRPpWRGR&5,63'0

O método CRISP-DM (DELMATER; HANCOCK, 2001, p.61; CHAPMAN et


al., 1999 DSXG COSTA SOUSA, 2003, p.47; OLIVEIRA; ALVARENGA, 2003, p.02) é
apresentado por meio de dois modelos básicos: o de referência e o guia do usuário. O
modelo de referência dá uma visão geral do ciclo de um projeto de mineração de dados.
O modelo guia do usuário oferece um detalhamento maior desse processo e será
empregado no estudo de caso.

 &ROHWDGH'DGRV

Concentrada na atividade fim da SMS, a coleta de dados epidemiológicos,


relativos aos casos confirmados de Dengue, para a mineração de dados, foi realizada,
junto ao setor responsável (Departamento de Epidemiologia). Os aspectos sobre o vetor
64

e doenças foram tratados com os profissionais que realizam, diariamente, o serviço de


notificação de doenças e medida da incidência do vetor na cidade (Departamento de
Zoonoses).

Como os órgãos responsáveis pela captação e gerência das informações, relativas


a epidemias e controle do vetor, detêm a competência para lidar com as questões
inerentes ao prontuário de pacientes, os especialistas dessas áreas foram envolvidos e a
SMS proporcionou o acesso ao banco de dados do SINAN, relativo ao Dengue e à
descrição de sua estrutura.

 5HSUHVHQWDomRGDDQiOLVHGRVGDGRV

Representar a análise dos dados para gestores é tarefa aparentemente simples,


mas, na verdade, trata-se, na maioria das vezes, de tarefa complexa, já que emissor e
receptor possuem experiências, formações e bagagens de conhecimento distintas. Para
sanar esta dificuldade, comunicar as investigações realizadas e representar a análise dos
dados para gestores, nesta dissertação, será utilizada a técnica visual de gráficos.

Os gráficos são importantes, pois tornam a comunicação mais rápida, clara e de


fácil assimilação pelo receptor da mensagem. Existem cinco (05) tipos de gráficos
básicos que devem ser utilizados em qualquer pesquisa: D o de torta; E o de barras;
F o de colunas; G o de linhas; H o de pontos (ZELASNY, 1997, pp.19-36).

Para cada tipo existem especificações: D O gráfico de torta deve ser utilizado
para mostrar o tamanho de cada parte como um percentual do total, em, no máximo, seis
divisões (ZELASNY, 1997, pp.38-42); E O gráfico de barras, ou de colunas, deve ser
utilizado para demonstrar a variação de um item mensurável (HJ volume de vendas,
magnitude de rendimento), em um determinado período ou para a comparação entre
diferentes produtos (ZELASNY, 1997, pp.43-45); F O gráfico de linhas deve ser
utilizado para mostrar, de forma compacta, se existe tendência de aumento ou
decréscimo em determinado período de tempo (ZELASNY, 1997, pp.48-50); G O
gráfico de pontos deve ser utilizado para mostrar a relação entre duas variáveis que
seguem ou não, o padrão que normalmente se esperaria (e.g. pessoas com maior grau de
instrução recebem maiores salários, profissionais com mais tempo de serviço e maior
experiência, realizam tarefas de forma mais rápida e sem necessidade de supervisão).
65

(ZELASNY, 1997, p.56).

No caso de pesquisas que apresentem fortes relações com séries temporais, dois
tipos de gráficos, o de colunas e o de linhas, são os indicados para representar os dados.
No primeiro tipo, o de colunas, deve-se observar o limite máximo de seis ou sete
divisões; já o segundo tipo, o de linhas, deve ser usado para representar mais de sete
divisões (ZELASNY, 1997, p. 36,46-47).

 $QiOLVHGRVJUiILFRVHUHVXOWDGRVHQFRQWUDGRVQDSUHGLomR

Escolher gráficos como uma alternativa para melhor representação visual é uma
opção amplamente utilizada em diversas instituições (ZELASNY, 1997). Quando
existem vários gráficos sobre o mesmo assunto, a análise visual pode comprometer a
avaliação sobre qual deles apresenta o melhor resultado. Para sanar essa dúvida, não
resta alternativa, a não ser trabalhar com métricas de análise.

Nesta obra, em termos da análise dos resultados da predição, serão trabalhadas as


seguintes métricas:

a) percentual de erro, representado pelo percentual entre o resultado previsto e o


real (notificado ou confirmado);

b) acurácia da tendência (real versus predita), representada pelo percentual de


número de acertos;

c) erro médio e erro padrão de previsão (observações versus previsões): existe


necessidade de se avaliar as diferenças existentes entre as observações e previsões,
atribuindo um valor numérico que estabeleça a qualidade do estimador utilizado, para
que a avaliação seja abrangente a toda a amostra.

No modelo matemático utilizado nesta dissertação, adotou-se a seguinte diferença


entre os modelos:   No caso do erro médio, o modelo utiliza o operador “Valor
Absoluto”;  No caso do erro padrão, o modelo utiliza o operador “Elevar ao
quadrado”; O operador Valor Absoluto, aqui utilizado de forma extensiva, não possui
propriedades matemáticas pelas quais se possa fazer uma extensão amostra-população,
já o erro médio é utilizado, apenas, para descrição e não extensão.
66

 0RGHOR3URSRVWR

No Brasil, Dengue é uma doença reemergente e, por isso, as epidemias são um dos
mais importantes problemas de saúde pública, apresentando padrão de contaminação alto,
especialmente em áreas urbanas com elevada densidade populacional (FUNASA, 2002,
p.20). A detecção precoce e a predição de surtos, pelo sistema de vigilância brasileiro, são
essenciais para possibilitar a interrupção da epidemia e o planejamento de combate à
doença.

O número de casos de Dengue relatados em uma (macro/micro) região ou distrito


(de um país, de um estado ou de uma cidade) deve-se às suas próprias características (HJ
densidade demográfica, hidrografia, etc.). Esse número é influenciado por mudanças
climáticas extremas (HJ chuva, ondas de calor, amplitude térmica, etc.) e forma um
cenário no qual cada variável (HJ exposição a um novo tipo de vírus, susceptibilidade da
população a este vírus, etc.) possui seu próprio domínio (i.e. número de casos ocorridos,
presença do vetor naquela região, etc.).

O cenário de Dengue no Brasil, em determinado momento histórico, pode ser


representado na forma clássica de séries temporais, através dos relatos das semanas
epidemiológicas. A notificação dos casos de Dengue, em várias regiões brasileiras e no
mesmo período histórico, forma um conjunto de mosaicos, cenários somente explicados
pelas características únicas (HJ densidade demográfica, influência climática, entrada de
um novo tipo de vírus na região, etc.) que essas regiões apresentam, naquele momento. A
Figura 25 mostra um exemplo desses cenários.

)LJXUD'DGRVSUHOLPLQDUHVGRVFDVRVQRWLILFDGRVGHGHQJXHSRUVHPDQDHSLGHPLROyJLFDVHJXQGR
UHJLmR%UDVLO 696 S

É possível visualizar os cenários específicos de Dengue, na Figura 26, em uma


67

região escolhida, também na forma de coleção de semanas epidemiológicas.

)LJXUD'DGRVSUHOLPLQDUHVGRVFDVRVQRWLILFDGRVGHGHQJXHSRUVHPDQDHSLGHPLROyJLFDGDUHJLmR
&HQWUR2HVWH%UDVLO 696 S

O Brasil possui sua própria técnica de predição e combate epidemiológico: o


diagrama de controle (FUNASA, 2002). A técnica, exemplificada na Figura 27, em
cenários específicos na cidade de Goiânia, na forma de coleção de semanas
epidemiológicas.

)LJXUD±'LDJUDPDGHFRQWUROHGHGHQJXHSRUVHPDQDHSLGHPLROyJLFD*RLkQLDD
)5$1d$$/9(66,/9$$025,06,/9$S 

As ocorrências de um ano com as de outro, podem ser comparadas – Figura 29 -


através de diagrama que contemple essa possibilidade (FRANÇA; ALVES SILVA;
AMORIM SILVA, 2004, p.52), Na análise do diagrama de controle anterior, Figuras 27,
tem-se o número previsto de casos (média), o limite de alarme (a partir do qual o número
de casos notificados é considerado surto) e o número de casos notificados de uma doença.
68

Os autores Maciel (1999) e Siqueira Júnior (2001) utilizaram pesquisas em bases de


dados. Através de técnicas estatísticas ou diagramas de controle, estimaram a quantidade,
a localização (região) e o perfil de pacientes infectados na cidade em tela.

Existe grande quantidade de obras publicadas que utilizam técnicas estatísticas de


predição já consagradas e que relatam a influência sazonal de Dengue (HJ ANDRADE;
DANTAS, 2004; CAMPUS BRAGA HWDO 2004; FOCKS HWDO 1995, RIGATU-PEREZ
HW DO 1999; NASCIMENTO SOUSA HW DO 2004; SOUSA HW DO 2004; SCHREIBER
2001, dentre outras).

Através das publicações da OMS (2003d, 2004b), SVS (2003, 2004, 2005) e dos
autores acima citados (dentre outros), foi possível compilar lista de variáveis que podem
auxiliar o diagnóstico, a localização e a predição de surtos de Dengue. As principais
variáveis são: D Mudanças climáticas extremas (HJ chuva, ondas de calor, amplitude
térmica, etc.); E Regionais (HJ número de casos ocorridos, tipificação do vírus
corrente, susceptibilidade da população ao tipo do vírus, medida do vetor naquela região,
etc.); F Físicas da região (HJ tipo e uso do solo, altitude, vegetação predominante,
características de ocupação territorial, etc.).

A maioria dessas variáveis foi doada por instituições municipais, estaduais e


federais presentes na cidade de Goiânia, que possuem padrões temporais de coleta
distintos, regidos por leis. Algumas das variáveis doadas possuem restrições à publicação
e são de domínio privado.

Assim como relatado pela OMS (2003d, 2004b) em relação às variáveis similares,
não houve possibilidade de análise da amálgama de todas. O problema da impossibilidade
da transformação dos dados para o formato desejado, em tempo hábil, era inesperado e
consumiu aproximadamente três meses da pesquisa. Apenas as variáveis climáticas e
relativas à notificação dessas doenças puderam ser adequadas para o de semanas
epidemiológicas adotado nesta pesquisa.

 (QWHQGLPHQWRGRQHJyFLR

Na fase do CRISP-DM, busca-se a compreensão dos objetivos necessários para o


alcance dos objetivos do projeto. É realizado o levantamento dos requisitos de fontes de
dados e conhecimento de especialistas. Além desses recursos, também são relatados os
69

levantamentos bibliográficos relativos às doenças e, os aspectos legais da disponibilidade


e uso das informações.

 2EMHWLYRV

No Brasil, as Secretarias Estaduais e Municipais de Saúde (SMS) são os órgãos


responsáveis pelo controle e combate de surtos de trinta e cinco doenças cuja notificação
é compulsória (FUNASA, 2002). Dentre essas doenças está o Dengue. O seu controle,
combate e prevenção são feitos através de combate ao vetor.

O Departamento de Epidemiologia da Secretaria Municipal de Saúde de Goiânia


estima que cerca de sessenta a sessenta e cinco por cento dos casos de Dengue ocorridos
na cidade de Goiânia, são notificados, o que dificulta o combate ao vetor dessas doenças.

A Secretaria Municipal de Saúde de Goiânia (SMS-GO), assim como as demais


SMS do Brasil, são órgãos que dependem de planejamento prévio (FUNASA; 2002) para
que: D suas ações de combate a doenças sejam eficientes e eficazes (FRANÇA; ALVES
SILVA; AMORIM SILVA, 2004); E a melhoria contínua de seus sistemas
informatizados proporcione melhor atendimento aos pacientes de uma região (CASTRO,
ARAUJO, 2004; OMS, 2004d).

Na SMS-GO, a Divisão de Vigilância Epidemiológica é responsável pelo cadastro


no SINAN, dos prontuários médicos e seus resultados e pela construção dos diagramas de
controle das doenças de notificação compulsória.

Pode-se então destacar como objetivos principais da Divisão de Vigilância


Epidemiológica (em relação aos dados de Dengue): D alimentação de banco de dados do
SINAN; E construção de diagramas de controle e, F em caso de ocorrência de
epidemias, o diagnóstico e bloqueio perifocal, na área de provável transmissão.

Nas bases de dados do SINAN, que contêm todos os registros classificados como
confirmados, descartados ou suspeitos (i.e. não houve possibilidade de chegar a um
resultado durante a investigação), são mantidos os casos notificados de uma cidade. Cada
região (cidade, estado ou país) tem suas características regionais e físicas próprias e
sofrem diferentes epidemias, em épocas distintas. (OMS, 2003d; 2004b).

A identificação das variáveis climáticas que influenciam o surto de Dengue, em


70

Goiânia, é a etapa secundária do trabalho - a primária é a predição de casos confirmados.


A fase de exploração do espaço do problema é o ponto crítico para um projeto de
mineração de dados e a identificação do problema e sua solução representam duas das
mais importantes fases do projeto de mineração de dados (PYLE 1996 DSXG COSTA
SOUSA, 2003, p.73). Das publicações referentes à predição de Dengue, relatadas por
especialistas e da experiência adquirida durante a fase CRISP-DM, foram selecionados
alguns questionamentos e suas respectivas hipóteses de solução, que serão exploradas
pela mineração de dados, destacando-se as seguintes:

a) Quais as variáveis climáticas que mais contribuem para o menor erro na


variável preditiva (número de casos confirmados) para cidade de Goiânia?

Hipótese: O conjunto de variáveis climáticas influencia o número de casos


confirmados de Dengue.

b) É possível classificar, através dos períodos endêmicos e epidêmicos de Dengue,


as variáveis climáticas de Goiânia?

Hipótese: Períodos endêmicos e epidêmicos de Dengue seguem padrões


meteorológicos.

Com a resolução dessas questões, espera-se fornecer base para suporte ao combate
epidemiológico da doença. Pela análise dos dados e seu entendimento, pode-se identificar
a influência sazonal em relação aos casos confirmados.

 $YDOLDomRGRVUHFXUVRVDWXDLV

Destina-se à identificação dos recursos necessários para o alcance dos objetivos


deste projeto. É realizado o levantamento dos requisitos de VRIWZDUH, fontes de dados e
conhecimento necessário de especialistas, além de levantamentos sobre a qualidade e
segurança dos resultados.

Iniciando a avaliação, segue abaixo a lista dos recursos disponíveis, em termos de


recursos tecnológicos, dados e informações:

a) Foi utilizada a base de dados referente ao SINAN de Goiânia-GO. Nela estão os


dados cadastrais referentes aos prontuários médicos, em relação ao Dengue. As
71

ocorrências descrevem os resultados das avaliações laboratoriais e médicas


(prova do laço) de cada paciente;

b) Foi utilizada a base de dados referente ao 10º DISME de Goiânia. Nela estão os
dados (parâmetros) climáticos;

c) O equipamento utilizado para execução dos modelos de mineração de dados,


tem as seguintes características: K-7 2600Md, 1 Gbyte de memória, 80 Gbytes
de disco rígido;

d) Simulador de Redes Neurais Artificiais (DV\11SOXV, disponível na forma livre;

e) Recursos externos disponíveis (acesso a outras bases de dados): dados que não
puderam ser trabalhados na forma temporal (semanas epidemiológicas) adotada
nesta pesquisa.

f) Por seu caráter individual e restrito, o cadastro dos dados do SINAN não pode
ser divulgado, sem a devida autorização, conforme o compromisso de doação
firmado com a Secretaria Municipal de Saúde. A autorização de uso das
informações do cadastro de pacientes, no SINAN, teve sua aprovação baseada
nas restrições impostas pela FUNASA (2002, p.17) e no pedido de doação que
consta do Anexo A.

g) A autorização de uso das informações cadastrais referentes à cidade de Goiânia


foi concedida pela COMDATA, baseada no pedido que consta do Anexo B:

h) As variáveis climáticas foram doadas pelo 10º DISME–Goiânia, para uso


exclusivo desta dissertação de mestrado, conforme pedido do orientador, que
consta do Anexo C.

i) As variáveis referentes à população de Goiânia foram doadas pela Secretaria de


Planejamento daquela cidade e são de domínio público, assim como as doadas
pelo Departamento de Controle de Zoonoses, referentes à medida do vetor
também em Goiânia.

Tendo-se em mãos a autorização para uso das informações e seguindo o modelo


CRISP-DM, pôde-se dar início aos estudos sobre os casos notificados. As bases de dados
72

foram implementadas na plataforma de banco de dados 0LFURVRIW$FFHVV.

 2EMHWLYRVDVHUHPDOFDQoDGRVSHODPLQHUDomRGHGDGRV

Tomando-se por base os objetivos desta dissertação, o objetivo principal da


mineração de dados foi o de executar mecanismos de análise e predição sobre a
amálgama do SINAN e 10º DISME, que poderão ser utilizados para planejamento ao
combate a endemias e epidemias de Dengue.

 (QWHQGLPHQWRGRV'DGRV

Durante a fase da coleta, foi realizada investigação preliminar que visou maior
familiarização com os dados, além de avaliação e limpeza.

 'DGRV,QLFLDLV

A cidade de Goiânia, capital do Estado de Goiás, fica localizada entre as


coordenadas geográficas 49º 00’ – 49º 45’ W e 16º 30’ - 17º 00’ S e a sua extensão
territorial é de 741 quilômetros quadrados (SIQUEIRA JÚNIOR 2001, p.09). Nela,
existem, atualmente, duas estações climáticas de coleta, sob a responsabilidade do 10º
DISME. Os dados climáticos doados, para este estudo, são referentes à estação 83423,
localizada em latitude de 16º 40’ S e longitude de 49º 15’ W, com altitude de 741,48
metros.

Os dados utilizados para estudo epidemiológico e sua influência climática foram


coletados a partir dos bancos de dados da Secretaria Municipal de Saúde e do 10º
DISME, no período correspondente a 01 de janeiro de 2001 até 30 de abril de 2004.

Inicialmente, a coleta de dados foi realizada de acordo com o formato de doação


dos arquivos, que, por sua vez, foram importados para o Microsoft Access. A importação
dos dados para aquele banco facilitou sua transformação em informações a serem
analisadas no equipamento onde foi executada a técnica de mineração de dados.

Sobre o gerenciador de Banco de Dados 0LFURVRIW$FFHVV, as tabelas utilizadas para


extração dos dados necessários à mineração de dados, foram restritas às seguintes:

a) Tabela de prontuários do SINAN de Goiânia – Goiás (0'(1*8(). Número de


registros, 30.495.
73

b) Tabela de semanas epidemiológicas (6(0$1$(3,), referente ao calendário


definido pelo SINAN para todo Brasil. Número de registros, 175.

c) Tabela de parâmetros climáticos (',60(), referente às variáveis


meteorológicas da cidade de Goiânia, relativa ao período entre 2001 e 2004.
Número de registros gerados, 1.582.

d) Tabela &/$66,),&$'25),1$/ foi gerada pela união das informações das


tabelas eletrônicas: 0'(1*8( 6(0$1$(3, e ',60(. Nela estão
registrados o número de casos confirmados de Dengue e a sua influência
sazonal representada pela média, definida, D SULRUL, em duas semanas anteriores
à semana epidemiológica pesquisada. Número de registros gerados, 175.

Cabe destacar que as demais variáveis doadas (características físicas e


populacionais da cidade e a medida do vetor) foram convertidas, mas tiveram de ser
descartadas, pois não puderam ser adequadas para o formato do calendário de semanas
epidemiológicas escolhido para esta pesquisa.

 'HVFULomRGRVGDGRV

Os dados coletados para este estudo estão descritos nos Quadros 2, 3, 4, 5, 6 e 7.


Em cada quadro está contida a estrutura e descrição da tabela de dados, assim como o seu
local de origem, período de abrangência, número de instâncias, formato de doação,
domínio, nome, número de atributos e utilização nesta pesquisa.

Os Quadros estão agrupados conforme os locais de doação. A ordem de descrição


adotada foi a de bancos de dados municipais e, em seguida, o federal. Após cada quadro,
foi feita a descrição dos dados presentes na base. Os bancos de dados municipais
abordados e seus locais de obtenção estão representados nos Quadros 2, 3, 4, 5 e 6.

4XDGUR'LFLRQiULRGHGDGRVGDWDEHODGR6,1$1UHIHUHQWHDSHVTXLVDVVREUHR'HQJXH

Domínio Casos notificados de dengue


Origem dos Dados Departamento de Epidemiologia da Secretaria
Municipal de Saúde de Goiânia – Goiás
Período de abrangência 01/Janeiro/2001 a 30/Abril/2004
Número de Instâncias Ano de 2001 – 06.709
Ano de 2002 – 17.639
74

Ano de 2003 – 08.236


Ano de 200415 – 03.497
Total – 36.081
Formato de doação do arquivo 'DWD%DVH)LOH(DBF)
Formato de trabalho do arquivo 0LFURVRIW$FFHVV
Domínio dos dados Restrito
Nome 0'(1*8(
Número de Atributos 87 existentes nos arquivos originais, 13 utilizadas na
CRISP-DM.
Utilização Utilizada para geração da tabela CLASSIFICADOR
FINAL
Descrição dos AtributosDicionário de dados da tabela do SINAN
Os domínios aqui apresentados são definidos na )LFKDGH,QYHVWLJDomRGHGHQJXH
ID_MUNICIP Código do município onde foi feita Domínio: 5208707 (Município de
a notificação Goiânia)
DT_NOTIFIC Data da notificação
NU_IDADE Idade do paciente
CS_SEXO Sexo do Paciente Domínio: M; F
ID_BAIRRO Código do bairro onde o paciente reside
ID_MN_RESI Código do município onde o Domínio: 5208707 (Município de
paciente reside Goiânia)
DENGUE Havia sido infectado com Dengue Domínio: 1 - Sim; 2 - Não; 9 -
antes Ignorado
VACINADO Vacinado contra Febre Amarela Domínio: 1 - Sim; 2 - Não; 9 –
Ignorado
FEBRE Teve febre Domínio: 1 - Sim; 2 - Não; 9 –
Ignorado
DURACAO Duração da febre em dias
LACO Prova do Laço Domínio: Positiva; Negativa; Não Realizada
HOSPITALIZ Ocorreu Hospitalização Domínio: Sim; Não; Ignorado
CON_CLASSI Resultado final Domínio: 1 – Dengue Clássico; 2 – Dengue com
Complicações; 3 – Febre Hemorrágica de dengue –
FHD; 4 – Síndrome do Choque de dengue; 5 –
Descartado
No Quadro 2, estão representados os dados do SINAN referentes ao período de
doação. Cada registro desse banco corresponde a uma avaliação médica e/ou exame
laboratorial registrado. Ao total são 36.081 registros de agravo para análise.

No Quadro 3, estão representados os dados referentes às medidas do PRVTXLWR


$HGHV realizados entre os anos de 2001 e 2004. Cada registro desse banco corresponde ao
índice de %UHWHDX medido, em um determinado período histórico, em um conjunto de
bairros da cidade. É importante ressaltar que foram encontrados os seguintes problemas
na conversão dessa base: D a base doada não está em formato que possa facilmente ser
75

transformada em um banco de dados, foi necessária a criação de um campo para


representar o código do bairro e a sua associação manual com os bairros reconhecidos
pela SEPLAN; E existem bairros que não estão presentes na amostragem oficial da
SEPLAN; F a grafia dos nomes dos bairros dessa doação, não segue nenhuma regra.

4XDGUR'LFLRQiULRGHGDGRVVREUHRVGDGRVGR9HWRU

Domínio Dados Entomológicos sobre o Vetor


Origem dos Dados Departamento de Controle de Zoonoses
Período de abrangência 22/Março/2002 a 30/Abril/2004.
Número total de Instâncias Total – 2.191
Formato de doação do arquivo 12 planilhas do Microsoft Excel
Formato de trabalho do arquivo 0LFURVRIW$FFHVV
Domínio dos dados Público
Nome 9,*,B6$1,
Número de Atributos 12
Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL
Descrição dos Atributos
DATAI Data de início
DATAF Data de fim
CD_BAIRRO Código do Bairro
IM_INSP Número de imóveis inspecionados
IM_PAAE Número de imóveis com $HGHVDHJ\SWL
IM_PAAL Número de imóveis com $HGHVDOERSLFWXV
DP_PAAE Número de depósitos positivos com $HGHVDHJ\SWL
DP_PAAL Número de depósitos positivos com $HGHVDOERSLFWXV
IIP_MAAE Índice de infestação predial do $HGHVDHJ\SWL
IIP_MAAL Índice de infestação predial do $HGHVDOERSLFWXV
IB_MAAE Índice de %UHWHDX do $HGHVDHJ\SWL
IB_MAAL Índice de %UHWHDX do $HGHVDOERSLFWXV
No Quadro 4, estão representados os dados referentes ao estudo realizado e
publicado, em 2002, pela SEPLAN, referente ao último censo realizado pelo IBGE, em
2000. Na publicação da SEPLAN, está a lista de todos os bairros reconhecidos por lei,
assim como também, o total de habitantes por sexo e faixa etária, por bairro. É importante
ressaltar que a base doada não possui todos os bairros presentes no cadastro do SINAN.

4XDGUR'LFLRQiULRGHGDGRVGD6(3/$1

Domínio Censo do IBGE publicado pela SEPLAN


Origem dos Dados Secretaria de Planejamento (SEPLAN)
Período de abrangência 2002
Número total de Instâncias Total – 327
Formato de doação do arquivo $FUREDW5HDGHU
15
Os dados existentes referem-se ao ano de 2004, de 01/Janeiro a 30/Abril.
76

Formato de trabalho do arquivo 0LFURVRIW$FFHVV


Domínio dos dados Público
Nome &$5$&7(5,67,&$6%$,55266(3/$1
Número de Atributos 13
Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL
Descrição dos Atributos
CD_BAIRRO Código do bairro
NM_BAIRRO Nome do bairro
TOTAL População total do bairro
POP_H Número de homens do bairro
POP_M Número de mulheres do bairro
TI00_04 Total de Habitantes com idade entre zero e quatro anos
TI05_09 Total de Habitantes com idade entre cinco e nove anos
TI10_19 Total de Habitantes com idade entre dez e dezenove anos
TI20_29 Total de Habitantes com idade entre vinte e vinte e nove anos
TI30_39 Total de Habitantes com idade entre trinta e trinta e nove anos
TI40_49 Total de Habitantes com idade entre quarenta e quarenta e nove anos
TI50_59 Total de Habitantes com idade entre cinqüenta e cinqüenta e nove
anos
TI60 Total de Habitantes com idade superior a sessenta anos
4XDGUR'LFLRQiULRGHGDGRVGD&20'$7$

Domínio Registros da cidade de Goiânia


Origem dos Dados COMDATA
Período de abrangênciaAté agosto de 2004
Número total de Instâncias
Total – 550
Formato de doação dos dados
Texto puro
Formato do arquivo 0LFURVRIW$FFHVV
Domínio dos dados Privado
Nome &$5$&7(5Ë67,&$6%$,5526&20'$7$
Número de Atributos 32
Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL
Descrição dos Atributos
CD_BAIRRO Código do Bairro no qual é realizada a feira
NM_BAIRRO Nome do Bairro no qual é realizada a feira
NR_LT_VAGOS Numero de total de lotes vagos no bairro
NR_LT_RES Numero de lotes residenciais
NR_LT_COM Numero de lotes comerciais
AREA_VERDE Área verde em metros quadrados
ASFALTO Domínio: Completamente asfaltado; Parcialmente
asfaltado; Sem asfalto.
SEM_INST_SANI Total de lotes sem instalação sanitária
COM_INST_SANI Total de lotes sem instalação sanitária
HIDROMETRO Total de lotes com hidrômetro
CISTERNA Total de lotes com cisterna
CISTERNA_HIDROMETRO Total de lotes com cisterna e hidrômetro
77

POCO_ART Total de lotes com poço artesiano


SEM_H2O Total de lotes sem água
REDE_PUB Total de lotes com rede de esgoto pública
FOSSA_SEP Total de lotes com fossa séptica
FOSSA_NEGRA Total de lotes com fossa negra
SEM_ESGOTO Total de lotes sem esgoto
QTDE_FEIRAS Total de feiras livres existentes naquele bairro
QTDE_HOSPITAIS Quantidade de hospitais no bairro
QTDE_ESCOLAS Quantidade de escolas no bairro
NR_PREDIOS Número de prédios (condomínios verticais) existentes no
bairro
NR_CEMITERIOS Número de cemitérios por bairro
No Quadro 5, estão representados os dados referentes à doação da COMDATA, em
2004. No conjunto de dados, estão as características físicas referentes a cada bairro. A
base refere-se apenas ao ano 2004 - não foram doados os anos anteriores - e possui
bairros que não estão presentes na publicação da SEPLAN.

4XDGUR'LFLRQiULRGHGDGRVGDWDEHODUHIHUHQWHDVVHPDQDVHSLGHPLROyJLFDV

Domínio Calendário de semanas epidemiológicas


Origem dos Dados Departamento de Vigilância Sanitária
Período de abrangência 01/Janeiro/2001 a 30/Abril/2004
Número total de Instâncias Total – 175
Formato de doação dos dados Relatório
Formato do arquivo 0LFURVRIW$FFHVV
Domínio dos dados Público
Nome 6(0$1$(3,
Número de Atributos 3
Utilização Descartada na geração da tabela CLASSIFICADOR
FINAL
Descrição dos Atributos
INICIO Data do início da semana
FIM Data do fim da semana
SEM_EPI Semana epidemiológica
No Quadro 6, estão representadas as semanas epidemiológicas do SINAN,
referentes aos anos de 2001 a 2004 (Anexo D).

4XDGUR'LFLRQiULRGHGDGRVGDWDEHODUHIHUHQWHDRVGDGRVGRž',60(

Domínio Clima
Origem dos Dados Distrito de Meteorologia em Goiás - 10º DISME
pertencente ao Instituto Nacional de Meteorologia
(INEMET)
Período de abrangência 01/Janeiro/2001 a 30/Abril/2004
Número total de Instâncias Total – 1.582
Formato de doação dos dados Foram doados 360 arquivos referentes ao clima na
78

cidade de Goiânia.
Formato do arquivo Microsoft Access
Domínio dos dados Restrito a esta pesquisa
Nome ',60(
Número de Atributos 10
Utilização Utilizada para a geração da tabela CLASSIFICADOR
FINAL
Descrição dos Atributos
DATA Data da avaliação climática
N0900 Nebulosidade às 09:00 horas
N1800 Nebulosidade às 18:00 horas
N2100 Nebulosidade às 21:00 horas
PD Índice pluviométrico ou precipitação (medida diária)
URA Umidade relativa do ar (média diária, valor em percentual)
URAMIN Umidade relativa do ar mínima (medida diária, valor em percentual)
URAMAX Umidade relativa do ar máxima (medida diária, valor em percentual)
TEMP Temperatura (média diária, valor em Graus Celsius)
TEMPMAX Temperatura máxima (medida diária, valor em Graus Celsius)
TEMPMIN Temperatura mínima (medida diária, valor em Graus Celsius)
AMPLITUDE Amplitude térmica (medida diária, valor em Graus Celsius)
No Quadro 7, estão representados os dados referentes à doação realizada pelo 10º
DISME. No conjunto de dados estão os padrões climáticos. Não houve problemas de
conversão com essa base.

 ([SORUDomRGRVGDGRV

A exploração dos dados foi realizada por meio da linguagem de programação


9LVXDO%DVLF na qual, através da lógica de programação estruturada e de comandos SQL,
foram feitas, inicialmente, as seguintes análises:

Em relação à tabela eletrônica0'(1*8(

a) Foram feitas as seguintes restrições em seus atributos:  o campo


CON_CLASSI foi definido como não nulo;  os campos ID_MUNICIP e
ID_MN_RESI foram restritos ao código 520870716.

Dessa maneira, eliminaram-se os dados de outras cidades e os resultados das


avaliações médicas não preenchidas e as não condizentes com a pesquisa. Esse
requisito foi utilizado nos anos de 2001, 2002, 2003 e 2004 (Tabela 1 e Figura 28).

16
O código 5208707 é o da cidade de Goiânia, no cadastro de cidades do IBGE.
79

Foi feito um estudo comparativo dos dados que não serão utilizados durante a
análise dos dados.

Ano Existente Após seleção % Perda


2001 6.709 6.178 7,91%
2002 17.639 16.617 5,79%
2003 8.236 7.577 8,00%
2004 3.410 3.301 5,60%
Total 35.994 33.673 -
7DEHOD7RWDOGHUHJLVWURVDQWHVGHSRLVGDVHOHomRHDSHUGD

)LJXUD7RWDODQXDOGHUHJLVWURVGH'HQJXH6,1$1*RLkQLD

O porcentual de perda, na Tabela 1, refere-se aos casos registrados de


pacientes de outras cidades, que realizaram exames na cidade de Goiânia, além de
casos no qual o campo CON_CLASSI eventualmente não está preenchido.

O percentual representativo de cada ano, na base, foi calculado e


representado na Figura 29. Constatou-se que o ano 2002, considerado epidêmico
em todo Brasil, (SIQUEIRA JÚNIOR, 2005), apresentou maior percentual, em
relação aos outros anos analisados17.

17
Os dados referentes a 2004 são até o fim do mês de abril.
80

)LJXUD±3HUFHQWXDODQXDOGHUHJLVWURVGH'HQJXHDSyVVHOHomR6,1$1*RLkQLD-DQD$EU

b) O total de cada tipo de Dengue, em cada prontuário, foi somado de acordo


com o preenchimento do atributo CON_CLASSI; os valores nulos, que
descartaram infecção e os não preenchidos, foram eliminados dessa análise,
representada na Figura 30.

)LJXUD7LSRVHSHUFHQWXDOGHGHQJXH*RLkQLDD

Através da Figura 30, pode-se relatar que o percentual de casos notificados


de FHD é baixo, em comparação aos notificados do tipo clássico de dos
confirmados que apresentaram alguma complicação.

c) O atributo DENGUE foi totalizado de acordo com suas respostas e,


através delas, o seu percentual calculado; os valores nulos, que descartaram
81

infecção e os não preenchidos, foram eliminados da análise.

)LJXUD±3HUFHQWXDOGRWRWDOGDVUHVSRVWDVQRFDPSR'(1*8(GR6,1$1*RLkQLD

A partir da Figura 31, pode-se relatar que o porcentual de casos, nos quais o
paciente não teve contato anterior com o Dengue, é superior aos que o próprio
entrevistado admite não saber se já havia apresentado a doença ou ainda aos que
afirmou ter sido infectado. Esse relato reforça a idéia de que o vírus se dissemina
(através do vetor), em sua maioria, dentre as pessoas que não apresentaram
infecção prévia.

d) O atributo VACINADO foi totalizado de acordo com suas respostas e,


através delas, o seu percentual calculado. Os valores nulos, que descartaram
infecção e não preenchidos, foram eliminados da análise.

De acordo com a Figura 32, pode-se relatar que o porcentual de casos


confirmados, no qual o paciente já foi vacinado contra Febre Amarela, é superior
aos casos em que ele não foi vacinado ou não sabe responder à pergunta. Através
da análise desses dados, é possível concluir que boa parcela dessa população já
está imunizada contra a Febre Amarela, o que justifica a não apresentação de casos
confirmados da doença, pelo SINAN.
82

)LJXUD3HUFHQWXDOGRWRWDOGDVUHVSRVWDVQRFDPSR9$&,1$'26,1$1*RLkQLD

No atributo CON_CLASSI, os valores de 1 a 4, referentes à tipificação


positiva de Dengue, foram convertidos para SIM; o valor 5, referente ao descarte
para NÃO e os valores nulos ou não preenchidos, foram eliminados das análises
que se sucederam.

Na análise da amálgama das tabelas 0'(1*8( e


&$5$&7(5,67,&$6%$,55266(3/$1 surgem as seguintes informações

O gênero dos pacientes com presença do SIM, no atributo (campo) CON_CLASSI,


foi totalizado e comparado ao gênero da somatória da população, com amostragem feita
pelo IBGE, em 2000, como pode ser visto na Figura 33(a).

Na pesquisa do IBGE (2000), a diferença percentual é de quatro vírgula oito


pontos percentuais, em relação aos gêneros, como pode ser demonstrado através da
Figura 33(a), enquanto na totalização do SINAN, a diferença totalizou treze
vírgula cinqüenta e dois pontos percentuais, como visto na Figura 33(b). Foram
encontrados dezessete casos, nos quais o sexo não está preenchido Esses registros
não apresentam percentual representativo (0,06%) da base e não foram eliminados
das pesquisas que se seguiram.
83

)LJXUD3HUFHQWXDOSRUJrQHURHP*RLkQLD,%*( D 3HUFHQWXDOSRUJrQHURQDDQiOLVHGR
6,1$1*RLkQLDD

Algumas das hipóteses que poderiam ser formuladas para explicar essa
possível diferença de taxas de ataque de Dengue com relação ao sexo são: D
grupos que permanecem mais tempo dentro do ambiente domiciliar e/ou ambiente
de trabalho e/ou escolar, possuem uma probabilidade maior de infecção/doença;
E demanda espontânea dos serviços de saúde que dispõe de atendimento
preferencial à saúde da mulher18.

a) O total de pacientes com presença do SIM, no campo CON_CLASSI, foi


totalizado por bairro e comparado à última amostragem feita pelo IBGE, em 2000.

Na Figura 34, o número de casos confirmados notificados, apresentou


relação, considerada forte, com o número de habitantes relatado pelo IBGE (2000

18
Hipóteses também levantadas por Maciel (1999, p. 66) em sua dissertação de mestrado.
84

DSXG SEPLAN 2002). Os bairros que apresentaram, em 2000, os maiores números


na população, apresentam, no período pesquisado, o maior número de casos
confirmados. Esse relato levanta a necessidade de trabalhos futuros detalhados e
específicos sobre a ocorrência de Dengue em altas densidades populacionais,
naquela cidade.

)LJXUD±&DVRVFRQILUPDGRVGHGHQJXHYHUVXVQ~PHURGHKDELWDQWHVSRUEDLUUR*RLkQLDD

b) O percentual de pacientes, por faixa etária, com presença do SIM no


campo CON_CLASSI, foi totalizado por ano, de acordo com as faixas existentes
na publicação do IBGE, na última amostragem realizada em Goiânia, no ano de
2000.

Na Figura 35, o número de casos confirmados notificados, apresentou relação


de ocorrência (ataque), considerada forte, nos anos pesquisados. As faixas com
maior percentual de ataque foram respectivamente: 20 a 29, 10 a 19 e 30 a 39 anos,
o que caracteriza um padrão de alto risco de infecção, para população jovem, em
Goiânia, nesse período.

Em Goiânia, a predominância relatada por Maciel (1999, p.65), foi relativa às


faixas etárias de 20 a 29 e 30 a 39 anos, enquanto e Siqueira Junior (2001, p.12)
relatou maior ocorrência nas faixas de 30 a 39 e 40 a 49 anos. Esses relatos de
ataque desiguais, no mesmo local de estudo e sobre a mesma doença, indicam que
ela atacou faixas etárias diferentes, em períodos históricos diferentes.
85

)LJXUD±3HUFHQWXDOGHIDL[DHWiULDSRUDQR6,1$1*RLkQLD

c) O percentual por gênero e faixa etária, com presença do SIM no campo


CON_CLASSI, foi totalizado, nos anos de doação, de acordo com as faixas
existentes na publicação do IBGE, na última amostragem feita em Goiânia, no ano
de 2000, conforme pode ser visto na Figura 36(a). Esse resultado foi comparado
com o percentual obtido, através de pesquisas da SINAN, naquela cidade, por
gênero - Figura 36(b).

Na Figura 36, embora os gêneros apresentem percentuais muito próximos, na


avaliação do IBGE em 2000, o número de casos confirmados notificados, por
gênero e faixa etária, apresentou diferenças significativas nas idades em que
ocorrem os maiores ataques (20 a 29, 30 a 39 anos e 40 a 49 anos).
86

)LJXUD±3HUFHQWXDOSRUIDL[DHWiULD±*RLkQLD,%*( D H3HUFHQWXDOGHFDVRVFRQILUPDGRVGH
GHQJXH±*RLkQLD6,1$1D

Na análise dos dados das tabelas 0'(1*8( e


&$5$&7(5,67,&$6%$,5526&20'$7$ surgem as seguintes informações:

a) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi totalizado o número de cemitérios existentes e comparado ao número de casos
confirmados, no período de doação, conforme representado na Figura 37.

O número de casos confirmados apresentou relação considerada fraca, com o


número de cemitérios por bairro. Nos dois bairros, onde existem cemitérios, os
relatos são considerados de baixas proporções (aproximadamente 220 casos em
quatro anos).
87

)LJXUD±&DVRVFRQILUPDGRVGH'HQJXHSRUEDLUURVYHUVXVFHPLWpULRVH[LVWHQWHV*RLkQLD
b) O número de casos confirmados, com presença do SIM no campo
CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi calculado o percentual de lotes sem construção (i.e. lotes baldios ou vagos) e
comparado ao número de casos confirmados, no período de doação. O
comparativo pode ser visto na Figura 38.

)LJXUD±&DVRVFRQILUPDGRVGH'HQJXHYHUVXVSHUFHQWXDOGHORWHVYDJRVSRUEDLUURV*RLkQLD


O número de casos confirmados notificados apresentou relação considerada


forte, com os menores percentuais de lotes vagos. De forma genérica, pode-se
afirmar que os bairros que apresentaram os menores percentuais de lotes vagos,
são os que apresentam maiores relatos de casos confirmados. O relato reforça a
necessidade de trabalhos futuros detalhados e específicos, dada a ocorrência de
Dengue, nos locais de alta densidade populacional, naquela cidade.
88

c) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi calculado o percentual representativo de área verde existente e comparado ao
número de casos confirmados, no período de doação. O comparativo pode ser
visto na Figura 39.

)LJXUD&DVRVFRQILUPDGRVGH'HQJXHYHUVXVSHUFHQWXDOGHiUHDYHUGHSRUEDLUUR*RLkQLD
O número de casos confirmados apresentou relação considerada forte com os
menores percentuais de área verde por bairro, ou seja, de forma genérica, a partir
da Figura 39 pode-se relatar que os bairros com os menores percentuais de área
verde são os que apresentam mais relatos de casos confirmados. Este relato
demonstra a necessidade de trabalhos futuros, detalhados e específicos, dada a
ocorrência de Dengue nas altas densidades populacionais, em Goiânia. Surge,
também, outro trabalho futuro interessante: quais as diferenças entre os bairros que
apresentam baixo e alto número de casos, mas possuem densidades similares,
aproximadas, de área verde?

d) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado, por bairro, no período de doação. Para cada bairro,
foi computado o número de feiras livres semanais e comparado ao número de
casos confirmados, no período de doação. Este comparativo pode ser visto na
Figura 40.
89

)LJXUD&DVRVFRQILUPDGRVGHGHQJXHYHUVXVQ~PHURGHIHLUDVOLYUHVVHPDQDLVSRUEDLUUR*RLkQLD


O número de casos confirmados apresentou relação considerada fraca com o


número de feiras livres, por bairro.

e) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de hospitais e comparada ao número de casos
confirmados. Este comparativo pode ser visto na Figura 41.

)LJXUD&DVRVFRQILUPDGRVGHGHQJXHYHUVXVTXDQWLGDGHGHKRVSLWDLVSRUEDLUUR*RLkQLD

O número de casos confirmados apresentou relação considerada fraca, com o


número de hospitais, por bairro. Os cinco bairros com mais de cinco hospitais,
apresentam relatos semelhantes ou inferiores aos que relataram números similares
ou superiores de casos.
90

f) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de escolas existentes e comparada ao número de casos
confirmados, no período de doação. Este comparativo pode ser visto na Figura 42.

)LJXUD&DVRVFRQILUPDGRVGH'HQJXHYHUVXVTXDQWLGDGHGHHVFRODV*RLkQLD

Pode-se relatar, pela análise da Figura 42, que os quatro bairros com mais de
dez hospitais apresentaram números de casos confirmados, semelhantes aos bairros
que não possuem o mesmo número de hospitais.

g) O número de casos confirmados, com presença do SIM no campo


CON_CLASSI, foi totalizado por bairro, no período de doação. Para cada bairro,
foi computada a quantidade de escolas existentes e comparada ao número de casos
confirmados, no período de doação. Este comparativo pode ser visto na Figura 43.

Pode-se relatar, pela análise da Figura 43, que os sete bairros com mais de
cinqüenta prédios, apresentam relatos semelhantes aos dos bairros que não
possuem o mesmo número de prédios e, portanto, é considerada uma relação fraca.
91

)LJXUD&DVRVFRQILUPDGRVGH'HQJXHYHUVXVTXDQWLGDGHGHSUpGLRVSRUEDLUUR*RLkQLD

Na análise da amálgama das tabelas 0'(1*8(6(0$1$(3,e ',60( surgem


as seguintes informações:

a) O percentual de casos confirmados (i.e. com presença de SIM no campo


CON_CLASSI), nos anos de doação 2001, 2002 e 2003, após a seleção e de
acordo com o calendário do SINAN, foi calculado pela respectiva semana
epidemiológica e está representado na Figura 44.

)LJXUD±3HUFHQWXDOGHFDVRVFRQILUPDGRVSRUVHPDQDHSLGHPLROyJLFD*RLkQLDD

A Figura 44 demonstra que o maior número de registros de casos, ocorreu


nas semanas epidemiológicas 01 a 20 de 2002. A tendência de concentração de
casos nessas semanas, embora não tão acentuada, pode ser observada também nos
anos subseqüentes, indicando sazonalidade de ocorrência dos casos de dengue, no
92

mesmo período histórico. A mesma tendência de concentração de casos em 2002,


embora em menor escala, pode ser observada nas semanas 43 a 52.

O ano 2002, naquela cidade, apresentou maior índice pluviométrico (em


relação a 2001, 2003 e 2004) e a entrada de um tipo diferente do vírus (Den-3),
para o qual a população não possuía resistência. Esses dois fatores podem ser
vistos como hipóteses para justificar a ocorrência do surto ocorrido naquele ano.

b) O número de casos confirmados, após a seleção por semana


epidemiológica, foi totalizado. Para cada semana epidemiológica, foi feita, em
relação a cada parâmetro climático, a média climática de duas semanas (definida D
SULRUL) relativas ao período mínimo que o vetor necessitaria para se desenvolver e
ter capacidade de disseminar o vírus. Foi feito o estudo visual (através de gráficos)
dos anos e das variáveis climáticas que pudessem ter relação com o surto, em cada
ano.

A série temporal completa, dos casos confirmados de Dengue no período de


doação, pode ser vista na Figura 45. Para possibilitar a visualização da influência sazonal
dos parâmetros climáticos em relação aos casos confirmados de Dengue, a série temporal
foi dividida em quatro anos distintos.
93

6pULHWHPSRUDOGRVFDVRVFRQILUPDGRVGH'HQJXHGHDFRUGRFRPRFDOHQGiULRLQWHUQDFLRQDOGR6,1$1*RLkQLD*R

1800

1600

1400

1200

H
X 1000
J
Q
H
'

H
G

V
R
V
D 800
&

600

400

200

0
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
S19
S21
S23
S25
S27
S29
S31
S33
S35
S37
S39
S41
S43
S45
S47
S49
S51
S01
S03
S05
S07
S09
S11
S13
S15
S17
6HPDQDVHSLGHPLROyJLFDV

)LJXUD±6pULHWHPSRUDOGRVFDVRVFRQILUPDGRVGH'HQJXH*RLkQLDD
94

Em relação a 2001, os gráficos desenvolvidos foram representados em um quadro,


no qual cada gráfico recebeu uma letra como identificação:

4XDGURGHJUiILFRV&DVRVFRQILUPDGRVGH'HQJXHYHUVXVPpGLDVGHYDULiYHLVFOLPiWLFDVGH

No Quadro de gráficos 1, relativo a 2001, o gráfico A representa a influência dos


casos em relação à chuva (índice pluviométrico); o B, em relação à média da umidade
relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação à média
da URA máxima; o E, em relação à média da temperatura média diária; o F, em relação à
média da temperatura máxima diária; o G, em relação à média da temperatura mínima
95

diária e, finalmente, o H, em relação à média da amplitude térmica diária.

Em relação a 2002, os gráficos desenvolvidos foram representados em um quadro,


no qual cada gráfico recebeu uma letra como identificação:

4XDGURGHJUiILFRV&DVRVFRQILUPDGRVGH'HQJXHYHUVXVPpGLDVGHYDULiYHLVFOLPiWLFDVGH

No Quadro de gráficos 2, relativo ao ano 2002, o gráfico A representa a influência


dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);
o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,
em relação à média da temperatura média diária; o F, em relação à média da temperatura
máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,
96

em relação à média da amplitude térmica diária.

Em relação a 2003, os gráficos desenvolvidos foram representados em um quadro,


no qual cada gráfico recebeu uma letra como identificação:

4XDGURGHJUiILFRV&DVRVFRQILUPDGRVGH'HQJXHYHUVXVPpGLDVGHYDULiYHLVFOLPiWLFDVGH

No Quadro de gráficos 3, relativo ao ano 2004 (até o período de doação), o gráfico


A representa a influência dos casos em relação à chuva; o B, em relação à média da
umidade relativa do ar (URA); o C, em relação à média da URA mínima; o D, em relação
à média da URA máxima; o E, em relação à média da temperatura média diária; o F, em
relação à média da temperatura máxima diária; o G, em relação à média da temperatura
mínima diária e, finalmente, o H, em relação à média da amplitude térmica diária.
97

Em relação a 2004, os gráficos desenvolvidos foram representados em um quadro,


no qual cada gráfico recebeu uma letra como identificação:

4XDGURGHJUiILFRV&DVRVFRQILUPDGRVGH'HQJXHYHUVXVPpGLDVGHYDULiYHLVFOLPiWLFDVGH

No Quadro de gráficos 4, relativo ao ano 2004, o gráfico A representa a influência


dos casos em relação à chuva; o B, em relação à média da umidade relativa do ar (URA);
o C, em relação à média da URA mínima; o D, em relação à média da URA máxima; o E,
em relação à média da temperatura média diária; o F, em relação à média da temperatura
máxima diária; o G, em relação à média da temperatura mínima diária e, finalmente, o H,
em relação à média da amplitude térmica diária.

Cabe novamente ressaltar que, no ano de 2002, considerado epidêmico em todo


98

Brasil (SIQUEIRA JÚNIOR et al., 2005), houve a tipificação (detecção) laboratorial do


Den-3, na cidade de Goiânia (tipo de vírus a que a população não tinha resistência). A
variável climática que apresentou maior similaridade com a curva dos casos confirmados
de Dengue notificados, foi o índice pluviométrico, que naquele ano, teve médias
superiores aos anos de 2001, 2003 e 2004.

A Figura 46 demonstra o percentual de casos confirmados por semana


epidemiológica.

Para classificar os períodos endêmicos (baixa concentração de casos) e epidêmicos


(alta concentração de casos) correspondentes aos casos pesquisados de Dengue, foi
necessário o auxílio dos meteorologistas do 10º DISME. Esses meteorologistas
auxiliaram a adaptar a escala anemométrica de %HDXIRUW (Anexo E), a partir da publicação
de Vianello e Alves (1991).

De forma genérica, essa escala foi adaptada para os países de clima temperado e/ou
tropical (Anexo E). A partir de então, os parâmetros climáticos foram classificados,
conforme a característica apresentada nas 178 semanas epidemiológicas, relativas à tabela
6(0$1$(3,. Essa classificação está representada no Quadro 8 e demonstra a influência
sazonal sobre doença. O índice pluviométrico (PD) foi principal parâmetro climático de
influência, durante aquele período, em Goiânia, com a média de duas semanas.

Nos anos analisados, de forma genérica, as semanas epidemiológicas 01 a 20 e 37 a


52 apresentaram maior número de casos, enquanto as semanas 21 a 36, o menor número
de casos. A variável climática que sofre maior alteração é o PD; outras variáveis, como
URA e TEMP, também apresentam influência sazonal. Nas semanas 21 a 36, ela está
com valor igual ou muito próximo de zero (ausência de chuva), enquanto nas outras
semanas, com valores que indicam presença de chuva (> 1,1mm/h).

4XDGUR&ODVVLILFDomRGRVSHUtRGRVHQGrPLFRVHHSLGrPLFRVGH*RLkQLDDQRVD
Variável climática Períodos endêmicos Períodos epidêmicos

PD Chuvisco fraco Chuva fraca/chuva moderada


URA Desconfortável ou confortável Confortável ou muito úmido
URAMIN Desconfortável ou estado de Confortável
atenção
URAMAX Confortável Muito úmido
TEMP Clima tropical e subtropical Clima equatorial
99

TEMPMIN Clima tropical e subtropical Clima tropical e subtropical


TEMPMAX Clima tropical e subtropical Clima tropical e subtropical
AMPLITUDE Clima tropical e subtropical Clima tropical e subtropical
 4XDOLGDGHGRVGDGRV

Nessa fase, são listados os resultados da verificação da qualidade dos dados do


SINAN, 10º DISME, COMDATA, SEPLAN, Departamento de Vigilância Sanitária e
Departamento de Epidemiologia.

Para preparação dos dados para mineração, os problemas encontrados são tratados
de forma ética e não devem comprometer o resultado esperado. Assim, os registros
atributos com valor faltante, foram descartados da análise e as falhas encontradas no
cadastro foram selecionadas de acordo com os bancos e cronologia abaixo:

a) Historicamente, o cadastro do SINAN (tabela 0'(1*8(), após sua


informatização, vem sofrendo, a cada dia, aperfeiçoamentos, de forma a manter
maior qualidade de informação. As falhas referentes ao cadastro foram:  No
campo CS_SEXO, aproximadamente 0,06% registros estavam sem
preenchimento;  No campo CON_CLASSI, aproximadamente 6,7% registros
estavam com o valor nulo.

b) O cadastro dos dados meteorológicos realizado pelo 10º DISME (tabela


10DISME), na cidade de Goiânia, não apresentou falhas significativas que
comprometessem sua análise.

c) Historicamente, a SEPLAN mantém o cadastro dos dados relativos aos


bairros oficiais de Goiânia. As atualizações são realizadas no momento em que a
homologação de uma lei torna um bairro oficial e reconhecido. Algumas vezes o
bairro existe na forma de um aglomerado de casas e já possui até mesmo asfalto,
energia elétrica, água e esgoto encanados, mas, ainda assim, o bairro não é
reconhecido. Outras vezes o bairro é homologado, as ruas abertas e asfaltadas,
instalações sanitárias e elétricas implantadas e, mesmo assim, não possui nenhum
morador.

d) A COMDATA, empresa do Município de Goiânia, desenvolve diversos


sistemas e mantém o cadastro dos dados relativos às atividades desse Município.
100

Esses cadastros vêm sendo, diariamente, aperfeiçoados e atualizados, mantendo,


assim, maior qualidade de informação. As falhas encontradas referentes à doação
foram:

I. Não existe padronização entre o nome dos bairros contidos nessa base e
os bairros contidos na publicação da SEPLAN (2002). Para a
associação das bases, foi necessária a criação de uma tupla e a
associação manual, bairro a bairro, entre as tabelas;

II. Existem 223 regiões (bairros) nessa listagem, mas ausentes na


publicação da SEPLAN (2002). Essas regiões condizem, em sua
maioria, a:  espaços geográficos a serem povoados (i.e. glebas); 
Fazendas ou zonas rurais que estão no perímetro urbano;  áreas ainda
não reconhecidas como bairros.

e) O Departamento de Controle de Zoonoses realizou, no período estudado,


a tomada do vetor Goiânia e mantém o cadastro dos dados levantados, em
planilhas do aplicativo 0LFURVRIW ([FHO. As falhas encontradas, referentes ao
cadastro, foram:

I. Não existe padronização entre o nome dos bairros dessa base e os


contidos na publicação da SEPLAN ou nas bases da COMDATA; para
a associação das três bases foi necessária a criação de uma tupla e a
associação manual, bairro a bairro, entre as tabelas;

II. Foram encontrados cerca de trinta bairros (regiões) que não constam em
nenhum dos dois cadastros (SEPLAN ou COMDATA), além dos
nomes dos bairros existentes não seguirem nenhum tipo de padrão, na
sua utilização. Essa base, mesmo depois de totalmente digitada,
associada e conferida, não pôde ser utilizada neste trabalho.

f) O Departamento de Vigilância Sanitária doou, no período estudado, o


calendário epidemiológico do SINAN, em forma de relatório (Anexo D) que,
depois de digitado (tabela 6(0$1$(3,), foi utilizado em toda a pesquisa.
101

 $VSHFWRVGD*&QRHQWHQGLPHQWRGRVGDGRV

A fase de entendimento dos dados do modelo CRISP-DM está relacionada à


aquisição, seleção e validação do conhecimento. No aspecto organizacional, os
especialistas e publicações recentes (HJ ALVARENGA, OLIVEIRA JUNIOR,
CARVALHO, 2003; OMS, 2003, 2004, dentre outras) desempenham papel importante, à
medida que determinam os caminhos para identificação e validação dos dados
necessários para a mineração. Já no entendimento dos dados, os especialistas são
provocados, através de processos mentais complexos, para a elaboração de novas idéias
que se tornarão conhecimento útil, para resolução de problemas.

Sem as publicações recentes, não seria possível capturar os requisitos, desde os


dados até o conhecimento para sua avaliação, necessários para solução do problema.

 3UHSDUDomRGRVGDGRV

Nessa fase e a partir do entendimento dos dados, são gerados os conjuntos que
serão submetidos à ferramenta de análise. Antes de submetê-los, é feita a limpeza dos
dados inconsistentes e faltantes, além da totalização dos casos confirmados e respectivas
médias das variáveis climáticas, de acordo com o calendário do SINAN, adotado para
esta pesquisa.

De acordo com o calendário do SINAN, as semanas epidemiológicas dos anos


2001, 2002 e 2004 têm 52 divisões, já o ano 2003 tem 53 divisões. Para que não haja a
exclusão da semana 53, do ano 2003, foi considerada como a semana um de 2004.

São gerados, na tabela &/$66,),&$'25),1$/, basicamente, os seguintes


conjuntos de dados: D total de casos confirmados - originário da tabela de 0'(1*8(,
com dados que não permitem a identificação do paciente; E cinqüenta e dois campos
binários indicando qual das semanas epidemiológicas está sendo analisada; F média (de
duas semanas) em relação a cada variável climática observada – originária da tabela
10DISME. Esse layout pode ser visto no Quadro 9.

4XDGUR'LFLRQiULRGHGDGRVGDWDEHOD&/$66,),&$'25),1$/

Nome do campo Tipo Tamanho Descrição


NCASOSPOSITIVOS Inteiro 5 Número de casos Notificados
NCASOSPREVISTOS Inteiro 5 Número de casos Previstos
102

S01 ... S52 Lógico 1 Sem. Epidemiológica 01 a 52


PD Inteiro 3 Índice pluviométrico
URA Real 6 Umidade relativa do ar
URAMIN Real 6 Umidade relativa do ar mínima
URAMAX Real 6 Umidade relativa do ar máxima
TEMP Real 6 Temperatura média
TEMPMAX Real 6 Temperatura máxima
TEMPMIN Real 6 Temperatura mínima
AMPLITUDE Inteiro 3 Amplitude térmica
A média dos atributos climáticos seguiu os valores comuns à escala anemométrica
de %HDXIRUW (VIANELLO; ALVES 1991). Assim sendo, PD foi arredondado sem casas
decimais e as médias de URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN e
AMPLITUDE, foram arredondados com duas casas decimais. O valor contido no campo
NCASOSPREVISTOS é o seguinte ao NCASOSPOSITIVOS atual.

 0RGHODJHP

No CRISP-DM, a modelagem é a fase em que se escolhe a técnica de mineração de


dados e que apresenta forte interação com a fase de preparação. Acrescenta-se a isso, a
técnica escolhida, que pode ter implicações na formatação dos dados. A técnica de
modelagem a ser utilizada neste trabalho é a de predição, que se destinará à estimativa do
número de casos confirmados, na semana subseqüente à atual.

A predição foi escolhida como técnica, em virtude da necessidade de encontrar


modelos que fossem capazes de estimar, com certa margem de confiança, o número de
casos confirmados de Dengue, em uma cidade. Essa predição possibilita aos gestores, a
destinação de recursos humanos e financeiros para análise das áreas de ocorrência e do
perfil dos pacientes infectados.

Essa simples análise pode fornecer as bases para melhorar o atendimento aos
pacientes além, é claro, do combate ao vetor, nos pontos mais críticos de ocorrência, em
uma cidade. Ações de planejamento podem ser implementadas, por exemplo, através da
localização manual dos casos do SINAN e da análise das últimas N semanas (à escolha
do gestor), em uma ferramenta de Sistema de Informação Geográfica.
103

Foi escolhida a técnica de janelamento de RNAs, por sua capacidade de predição e


pelas existência de diversas obras publicadas. A aplicação dessa técnica consiste em usar,
como entradas de rede, “uma seqüência de valores passados (janela de tempo), da
grandeza que se deseja prever” (ALVARENGA, OLIVEIRA JUNIOR, CARVALHO
2003, p.14).

Para se utilizar a técnica de janelamento precisamos definir as seguintes variáveis


(BRAGA, LUDERMIR, CARVALHO, 2000, p.227):

a) A janela de entrada utiliza um conjunto de valores passados que serão as


entradas da rede neural; por exemplo, 15 valores;

b) A janela de saída utiliza o valor da série com W passos à frente; por exemplo, três
passos à frente;

c) Uma ou um conjunto de variáveis explicativas que podem ajudar no


treinamento da rede; por exemplo, dia, mês ou ano da entrada W

A Figura 46 é o diagrama de controle, até a semana epidemiológica 16 do ano 2004,


feito pela Divisão de Epidemiologia da Secretaria Municipal de Saúde de Goiânia.

Os dados, contidos na Figura 46, doados em forma de planilha 0LFURVRIW ([FHO


foram transpostos para a Tabela 2 e analisados. O número de casos previstos foi
comparado ao número de casos notificados, e a tendência de alta ou queda, foi avaliada,
através do acerto apresentado na série.

)LJXUD±'LDJUDPDGHFRQWUROHGH'HQJXHSRUVHPDQDHSLGHPLROyJLFD606*2*RLkQLD

104

7DEHOD$QiOLVHGRVUHVXOWDGRVGDSUHYLVmRIHLWDDWUDYpVGR'LDJUDPDGH&RQWUROHGD6HFUHWDULD
0XQLFLSDOGH6D~GHGH*RLkQLD*RLiV

Resultados Tendência
semana/2004 previstos notificados % erro real predita acerto
S02 25,3 91 259,68 Alta Alta Ok
S03 35,8 109 204,47 Alta Alta Ok
S04 43 144 234,88 Queda Alta -
S05 37,5 217 478,67 Queda Queda Ok
S06 36,8 205 457,07 Queda Queda Ok
S07 35,8 188 425,14 Alta Queda -
S08 37,8 160 323,28 Queda Alta -
S09 37,7 165 337,67 Alta Alta Ok
S10 42,8 179 318,22 Queda Queda Ok
S11 38,2 139 263,87 Alta Alta Ok
S12 44,5 203 356,18 Queda Queda Ok
S13 42,7 179 319,20 Queda Queda Ok
S14 33,8 142 320,12 Alta Queda -
S15 44 128 190,91 Queda Alta -
S16 43,5 148 240,23 Queda Queda Ok
S17 33,3 136 308,41 - - -

Depois da análise dos resultados da predição versus os casos notificados, através do


percentual de erro, analisou-se a tendência, na Tabela 2. Com isso, a taxa de erro
encontrada na tendência foi de 40% e o erro padrão na previsão de 127,2.

Da tabela eletrônica &/$66,),&$'25),1$/, oriunda do aplicativo 0LFURVRIW


$FFHVV foram selecionados 60 atributos preditivos: NCASOSPOSITIVOS, S01, S02,
...S52, PD, URA, URAMIN, URAMAX, TEMP, TEMPMAX, TEMPMIN,
AMPLITUDE. A classe alvo desta tabela é o campo NCASOSPREVISTOS.

Esta tabela foi importada para o 0LFURVRIW ([FHO e convertida para o formato
&RPPD 6HSDUDWHG 9DOXH (CSV). Após a conversão, o arquivo resultante foi editado,
através do aplicativo 7H[WSDG19 e todas as vírgulas substituídas por pontos.

Os testes foram realizados na forma de estudos, aqui chamados de rodada de testes,


através dos quais, os parâmetros climáticos foram testados em relação ao número de
casos confirmados, naquela semana epidemiológica. Cabe relembrar que, no caso desses
estudos, o que se prediz é o número de casos confirmados e não de casos notificados, o
que indica granularidade superior à da técnica de Diagrama de Controle.

19
Download gratuito através do link ftp://download.textpad.com/pub/textpad4.7/txpptb473.exe
105

Na primeira rodada de testes, foram testadas as seguintes arquiteturas, em relação


aos casos confirmados: D sem nenhuma variável climática; E PD, URA, TEMP; F
PD, URAMIN, TEMPMIN; G PD, URAMAX, TEMPMAX; H PD, URA,
AMPLITUDE; I PD, AMPLITUDE; J  PD, URA, URAMIN, URAMAX, TEMP,
TEMPMIN, TEMPMAX, AMPLITUDE.

Utilizou-se o (DV\11SOXV com a seguinte configuração, para todos os testes:


aprendizado de 0,7, momentum 0,9, erro desejado (alvo) 0,02 e valores otimizados pelo
aplicativo.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa


série, apresenta os dados, assim organizados e divididos:

a) As 33.673 instâncias referentes à tabela 0'(1*8( foram agrupadas e


contabilizadas, de acordo com o calendário de semanas epidemiológicas do
SINAN. Esse agrupamento resultou em 173 instâncias.

b) Do total dos 36.081 casos de agravo, 33.673 (93,3% aproximadamente) eram


casos confirmados e 1.582, referentes a medidas climáticas diárias. Os dados
foram separados em treinamento (2001 e 2002), avaliação (2003) e teste (2004).

c) Para treinamento, foram utilizadas 106 instâncias, referentes aos anos de 2001,
2002. Para avaliação, foram utilizadas 53 instâncias, referentes a 2003. Na
predição, foram utilizadas 16 instâncias, referentes aos quatro primeiros meses
de 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta


cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na
camada de saída. O modelo está representado na Figura 47 e apresenta os seguintes
neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o


objetivo de auxiliar à rede a identificar os componentes sazonais da série;
• Um neurônio contendo o valor da observação PD;
• Um neurônio contendo o valor da observação URA;
106

• Um neurônio contendo o valor da observação TEMP;


• Um neurônio contendo o valor da observação atual e,
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).

)LJXUD$UTXLWHWXUDGHUHGHXWLOL]DGDQR(DV\QQ3OXVSDUDSUHGLomRHSLGHPLROyJLFDGH'HQJXH

O gráfico da curva de aprendizado, no aplicativo utilizado, e com essa arquitetura,


está na Figura 48.

)LJXUD±*UiILFRGDFXUYDGHDSUHQGL]DGR±5RGDGD

Os resultados obtidos nessa predição são mostrados na Tabela 3 e na Figura 49.

7DEHOD±$QiOLVHGRVUHVXOWDGRVGDSUHYLVmR±7pFQLFD

Resultados Tendência
semana/2004 confirmados previstos % erro real predita acerto
S02 96 39 59,38 Queda Alta -
S03 73 32 56,16 Alta Alta Ok
S04 102 34 66,67 Alta Alta Ok
S05 123 39 68,29 Alta Queda -
S06 198 46 76,77 Queda Alta -
S07 179 56 68,72 Queda Alta -
S08 163 43 73,62 Queda Queda Ok
S09 147 44 70,07 Queda Queda Ok
S10 130 33 74,62 Alta Queda -
S11 154 37 75,97 Queda Queda Ok
S12 112 29 74,11 Alta Queda -
107

S13 156 39 75,00 Queda Alta -


S14 148 31 79,05 Queda Queda Ok
S15 113 31 72,57 Queda Alta -
S16 89 37 58,43 Alta Queda -
S17 126 33 73,81 - - -

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGHGHQJXH*RLkQLD±5RGDGD

Com essa análise, a taxa de erro encontrada na tendência foi de 26,7% e o erro
padrão 101,8.

Na segunda rodada de testes, foi gerada uma massa de dados, na tentativa de


auxiliar o treinamento da rede. A lógica utilizada é a que se segue: nas dezesseis
primeiras semanas de 2004, o número de casos confirmados notificados totaliza
aproximadamente 56,4% do número encontrado em 2003. Se essas semanas de 2004
forem comparadas às de 2002, o decréscimo chega a aproximadamente 83,6%. Os
cálculos dão a noção de decréscimo do número de casos notificados de Dengue, em 2004,
ao menos em Goiânia, no período estudado. Parte de sua população, em 2002, adquiriu
resistência ao Den-3, após ocorrência de surto.

Em relação ao Brasil, de forma genérica, pode-se afirmar, a partir das Figuras 23 e


24, que: D antes de cada ano considerado epidêmico (1987, 1991, 1998, 2002), existe
um ano com tendência crescente do número de casos notificados; E sempre depois dos
anos considerados epidêmicos, há redução drástica no número de casos notificados; (b)
108

em média, após quatro anos da ocorrência de um surto, outro ocorre.

A tática adotada visou gerar três anos com a função de ensinar a RNA que, após um
ano epidêmico, acontece queda brusca no número de casos. Para representar essas
informações para rede neural, foram consideradas as trinta e três mil, seiscentas e setenta
e três instâncias (i.e. casos confirmados) agrupadas e contabilizadas, segundo o
calendário do SINAN relativo ao período de estudo, o que resultou em 173 instâncias.

Para o primeiro ano, a fórmula de geração para os campos não binários é a que
se segue.

Sn é a somatória de i, variando de 1 a 3, dividida por 3. Os anos de origem foram


2001, 2002 e 2003.

Em relação ao segundo ano, a fórmula de geração para os campos não binários


é:

Sn é a somatória de i, variando de 1 a 2, dividida por 2. Os anos de origem


foram 2001 e 2003.

Para o terceiro ano, a fórmula de geração para os campos não binários segue a
seguinte seqüência: O número de casos confirmados recebeu o valor do ano 2003, menos
trinta por cento do mesmo campo, nessa tabela e as variáveis climáticas receberam os
valores da média dos anos gerados.

O treinamento dado à rede, pode ser visto no Quadro de gráficos 5, através do qual
vê-se exemplos da ocorrência de decréscimo brusco no número de casos, após um surto.
109

4XDGURGHJUiILFRV±7UHLQDPHQWRSURSRVWR±5RGDGD

Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: D sem


nenhuma variável climática; E PD, URA, TEMP; F PD, URAMIN, TEMPMIN; G
PD, URAMAX, TEMPMAX; H PD, URA, AMPLITUDE; I PD, AMPLITUDE; J 
PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa


série, apresenta os dados, assim organizados e divididos:

a) Para treinamento, foram utilizadas 260 instâncias, referentes aos anos de 2001 e
2002, ano de treinamento 1 e ano de treinamento 2;

b) Para avaliação, foram utilizadas 53 instâncias, referentes ano de 2003;

c) Na predição, foram utilizadas 17 instâncias, referentes aos quatro primeiros meses


do ano 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta


cinqüenta e seis neurônios na camada de entrada, treze, na camada intermediária e um, na
camada de saída. A arquitetura está representada na Figura 47. A camada de entrada
apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana) ,utilizados com o objetivo de


auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo o valor da observação PD;
• Um neurônio contendo o valor da observação URA;
110

• Um neurônio contendo o valor da observação TEMP;


• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,


está na Figura 50.

)LJXUD±*UiILFRGDFXUYDGHDSUHQGL]DGR±5RGDGD

O erro alcançado, como pode ser visto na Figura 50, foi inferior ao desejado. Os
resultados obtidos, após o treinamento, são mostrados na Tabela 4 e na Figura 51.

7DEHOD±$QiOLVHGRVUHVXOWDGRVGDSUHYLVmR5RGDGD

Resultados Tendência
Semana/2004 confirmados previstos % erro real predita acerto
S02 96 34 64,58 Queda Alta -
S03 73 64 12,33 Alta Alta Ok
S04 102 145 42,16 Alta Alta Ok
S05 123 161 30,89 Alta Queda -
S06 198 145 26,77 Queda Alta -
S07 179 174 2,79 Queda Queda Ok
S08 163 173 6,13 Queda Queda Ok
S09 147 126 14,29 Queda Alta -
S10 130 143 10,00 Alta Alta Ok
S11 154 152 1,30 Queda Queda Ok
S12 112 150 33,93 Alta Queda -
S13 156 139 10,90 Queda Queda Ok
S14 148 118 20,27 Queda Queda Ok
S15 113 60 46,90 Queda Alta -
S16 89 109 22,47 Alta Queda -
S17 126 76 39,68 - - -
111

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGH'HQJXH*RLkQLD±5RGDGD

Com essa análise, a taxa de erro na tendência foi de 46,7% e o erro padrão 35,7.

Na terceira rodada de testes, foi utilizada a mesma massa de dados existente na


primeira rodada. Dessa vez, cada valor dos parâmetros meteorológicos foi substituído
pela respectiva faixa da escala adaptada de %HDXIRUW.

Foram testadas as seguintes arquiteturas, em relação aos casos confirmados: D sem


nenhuma variável climática; E PD, URA, TEMP; F PD, URAMIN, TEMPMIN; G
PD, URAMAX, TEMPMAX; H PD, URA, AMPLITUDE; I PD, AMPLITUDE; J 
PD, URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE.

Utilizou-se o (DV\11SOXV  com a seguinte configuração, para todos os testes:


aprendizado de 0,7, momento 0,8, erro desejado (alvo) 0,02% e valores otimizados pelo
aplicativo.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa


série, apresenta os dado e foram assim organizados e divididos:

a) As 33.673 instâncias, referentes à tabela MDENGUE, foram agrupadas e


contabilizadas de acordo com o calendário de semanas epidemiológicas do SINAN. O
agrupamento resultou em 173 instâncias.
112

b) Do total dos 36.081 casos de agravo, 33.673 eram casos confirmados e 1.582,
dados referentes a medidas climáticas diárias. Os dados foram separados em treinamento
(2001 e 2002), avaliação (2003) e teste (2004).

c) Para treinamento, foram utilizadas as 128 primeiras instâncias e para avaliação


foram utilizadas as próximas 28 instâncias. Na predição, foram utilizadas 16 instâncias,
referentes aos quatro primeiros meses de 2004.

O modelo da rede que obteve os melhores resultados dessa série apresenta


cinqüenta e seis neurônios, na camada de entrada, treze na camada intermediária e um, na
camada de saída. O modelo apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o


objetivo de auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo a faixa da observação PD;
• Um neurônio contendo a faixa da observação URAMAX;
• Um neurônio contendo a faixa da observação TEMPMAX;
• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,


está na Figura 52.

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGHGHQJXH*RLkQLD±5RGDGD

O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após


o treinamento, são mostrados na Tabela 5 e na Figura 53.
113

7DEHOD±$QiOLVHGRVUHVXOWDGRVGDSUHYLVmR5RGDGD

Resultados Tendência
Semana/2004 confirmados previstos % erro real predita acerto
S02 96 62 35,42 Queda Queda Ok
S03 73 53 27,40 Alta Alta Ok
S04 102 60 41,18 Alta Alta Ok
S05 123 178 44,72 Alta Alta Ok
S06 198 258 30,30 Queda Queda Ok
S07 179 177 1,12 Queda Queda Ok
S08 163 164 0,61 Queda Alta -
S09 147 181 23,13 Queda Queda Ok
S10 130 150 15,38 Alta Alta Ok
S11 154 152 1,30 Queda Alta -
S12 112 176 57,14 Alta Queda -
S13 156 83 46,79 Queda Queda Ok
S14 148 68 54,05 Queda Alta -
S15 113 116 2,65 Queda Queda Ok
S16 89 72 19,10 Alta Alta Ok
S17 126 135 7,14 - - -

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGHGHQJXH*RLkQLD±5RGDGD
Com essa análise, a taxa de erro na tendência foi de 26,7% o erro padrão 43
aproximadamente.

Foi solicitada a Secretaria Municipal de Saúde de Goiânia a doação dos dados de


Dengue em todo o ano 2004. Todas as rodadas de testes foram novamente feitas, desta
vez, foram preditos os casos notificados de Dengue em Goiânia em todo ano de 2004.

Foram testadas as seguintes arquiteturas, com o (DV\11SOXV  na seguinte


configuração, para todos os testes: aprendizado de 0,7, momento 0,8, erro desejado (alvo)
114

0,02% e valores otimizados pelo aplicativo.

Em relação aos casos notificados:

Com as médias climáticas: D sem nenhuma variável climática; E PD, URA,


TEMP; F PD, URAMIN, TEMPMIN; G PD, URAMAX, TEMPMAX; H PD, URA,
AMPLITUDE; I PD, AMPLITUDE; J  PD, URA, URAMIN, URAMAX, TEMP,
TEMPMIN, TEMPMAX, AMPLITUDE.

Com a adaptação da estala de %HDXIRUW feita nesta dissertação: D sem nenhuma


variável climática; E PD, URA, TEMP; F PD, URAMIN, TEMPMIN; G PD,
URAMAX, TEMPMAX; H PD, URA, AMPLITUDE; I PD, AMPLITUDE; J  PD,
URA, URAMIN, URAMAX, TEMP, TEMPMIN, TEMPMAX, AMPLITUDE; K PD,
PD_Beaufort, URA, URA_Beaufort, TEMP, TEMP_Beaufort,; L PD, PD_Beaufort,
URAMIN, URAMIN_Beaufort, TEMPMIN, TEMPMIN_Beaufort; M PD, PD_Beaufort,
URAMAX, URAMAX_Beaufort, TEMPMAX, TEMPMAX_Beaufort; N PD,
PD_Beaufort, URA, URA_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; O PD,
PD_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort; P  PD, PD_Beaufort, URA,
URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,
TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,
TEMPMAX_Beaufort, AMPLITUDE, AMPLITUDE_Beaufort, 1  PD, PD_Beaufort,
URA, URA_Beaufort, URAMIN, URAMIN_Beaufort, URAMAX, URAMAX_Beaufort,
TEMP, TEMP_Beaufort, TEMPMIN, TEMPMIN_Beaufort, TEMPMAX,
TEMPMAX_Beaufort.

A arquitetura de rede que obteve os melhores resultados dos prognósticos dessa


série, apresenta os dado e foram assim organizados e divididos:

a) As instâncias, referentes à tabela MDENGUE, foram agrupadas e contabilizadas


de acordo com o calendário de semanas epidemiológicas do SINAN. O agrupamento
resultou em 208 instâncias.

b) Para treinamento, foram utilizadas as 118 primeiras instâncias e para avaliação


foram utilizadas as próximas 38 instâncias. Na predição, foram utilizadas 526 instâncias,
referentes ao ano 2004.
115

O modelo da rede que obteve os melhores resultados dessa série apresenta sessenta
e sete neurônios, na camada de entrada, doze na camada intermediária e um, na camada
de saída. O modelo apresenta os seguintes neurônios:

• 52 neurônios binários (um para cada semana do ano), utilizados com o


objetivo de auxiliar a rede a identificar os componentes sazonais da série;
• Um neurônio contendo a faixa da observação PD;
• Um neurônio contendo a faixa da observação PD_Beaufort;
• Um neurônio contendo a faixa da observação URAMIN;
• Um neurônio contendo a faixa da observação URAMIN_Beaufort;
• Um neurônio contendo a faixa da observação URAMAX;
• Um neurônio contendo a faixa da observação URAMAX_Beaufort;
• Um neurônio contendo a faixa da observação TEMPMAX;
• Um neurônio contendo a faixa da observação TEMPMAX_Beaufort;
• Um neurônio contendo a faixa da observação TEMPMIN;
• Um neurônio contendo a faixa da observação TEMPMIN_Beaufort;
• Um neurônio contendo a faixa da observação TEMP_Beaufort;
• Um neurônio contendo a faixa da observação TEMP;
• Um neurônio contendo o valor da observação atual;
• Um neurônio contendo o valor da observação, imediatamente posterior à
que se quer prever (predição semanal).

O gráfico da curva de aprendizado, no aplicativo utilizado e com essa arquitetura,


está na Figura 52.

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGHGHQJXH*RLkQLD±5RGDGD
116

O erro alcançado na Figura 52 foi inferior ao desejado e os resultados obtidos, após


o treinamento, são mostrados na Figura 53.

)LJXUD±&DVRVFRQILUPDGRVSUHYLVWRVGHGHQJXH*RLkQLD±5RGDGD
Com essa análise, a taxa de erro na tendência foi de 47,1% e o erro padrão 56,9.
Neste mesmo período o diagrama de controle obteve a taxa de erro na tendência de 45,1%
e o erro padrão 88,3.

 $SUHVHQWDomRGRVUHVXOWDGRV

A partir da metodologia CRISP-DM, foi possível gerar a amálgama (união) dos


bancos de dados e analisar o comportamento dos casos confirmados de dengue em
relação a diversas variáveis, aqui representada, de forma reduzida, nos Quadros 10 e 11.
O estudo dessas relações forneceu bases (LQVLJKWV) para diversos trabalhos futuros,
relatados no Capítulo 5 desta dissertação.

4XDGUR±$QiOLVHGRVFDVRVFRQILUPDGRVGH'HQJXH*RLkQLDD
Variável Informações
Clássico – 87,87%;
Tipos de dengue em Goiânia, 2001 Dengue com complicações – 11,80%
a 2004 FHD – 0,33%
Não havia apresentado infecção anterior –
Percentual das respostas no campo
88,23%;
DENGUE, SINAN, Goiânia, 2001
Havia apresentado infecção anterior – 7,69%;
a 2004
Ignorado – 3,81%
117

Havia sido vacinado contra febre amarela–


Percentual das respostas no campo
77,44%;
VACINADO, SINAN, Goiânia,
Ignorado 14,96%;
2001 a 2004
Não havia sido vacinado – 7,61%
IBGE, Goiânia, 2000 SINAN, 2001 - 2004
Percentual por gênero Homens 47,60% 43,21%
Mulheres 52,40% 56,73%
Ignorados - 0,06%

4XDGUR±$QiOLVHGRVFDVRVGHGHQJXHYHUVXVYDULiYHO*RLkQLDD

Autores que também


Variável Relação apresentada apresentam estas
relações nesta cidade
Percentual por faixa etária Forte Maciel (1999),
Siqueira Junior (2001)
Número de habitantes por bairro Forte -
Cemitérios por bairro Fraca -
Menores percentuais de lotes vagos Forte -
Menores percentuais de área verde Forte -
Número de feiras livres semanais Fraca -
Quantidade de hospitais por bairro Fraca -
Quantidade de escolas por bairro Fraca -
Quantidade de prédios por bairro Fraca -
Influência sazonal Forte -

Com o auxílio de especialistas do 10º DISME, foi feita extensão (adaptação) da


escala anemométrica de %HDXIRUW (VIANELLO; ALVES, 1991). Investigou-se, a partir
dessa adaptação e através de gráficos, a influência sazonal sofrida pelo dengue, através da
média de duas semanas anteriores (definida D SULRUL) a cada semana epidemiológica, em
relação a cada variável climática. Seguindo essa descrição, foi possível analisar os
períodos com alta e baixa concentração de casos. Deve-se levar em consideração que para
cada cidade analisada, através dos passos descritos, os resultados apresentados podem ser
únicos.

Foi analisado o diagrama de controle da Divisão de Epidemiologia da Secretaria


Municipal de Saúde de Goiânia-Goiás, com formato no calendário de semanas
epidemiológicas, referente ao período entre 01/01/2004 e 30/04/2004. Os resultados
obtidos foram analisados e comparados, na Figura 54, com os de duas rodadas que
apresentaram melhores resultados e fornecem, com certa margem de confiança, suporte
118

para predição de Dengue naquela cidade.

Reforça-se a necessidade de investimentos em recursos humanos e financeiros, para


realizar através de outros softwares e outras técnicas, os trabalhos relatados no Capítulo 5
desta dissertação.

)LJXUD±FRPSDUDomRGDVSUHGLo}HVGDVWpFQLFDVGLDJUDPDGHFRQWUROHHPLQHUDomRGHGDGRVSDUDR
SHUtRGRGHGRDomR
119

 $QiOLVHGRVUHVXOWDGRV
Ao final da apresentação dos resultados, torna-se importante tecer as seguintes
considerações em relação a: D bancos estudados; E metodologia adotada; F Modelo
Brasileiro de Notificação utilizado para o combate de várias doenças; G modelo de
regressão através de redes neurais apresentado; H técnica apresentada para predição; I
objetivos propostos.

a) Em relação aos bancos de dados analisados: nenhum dos bancos avaliados foi
desenvolvido com o fim de DCBD. Mesmo assim, foi possível, através de alto esforço de
conversão, gerar várias informações importantes. A análise dessas informações foi feita
de forma ética, através de gráficos de fácil entendimento, que não identificam os
pacientes infectados ou os bairros da cidade de Goiânia.

b) A CRISP-DM é de fácil utilização, aplicação e possibilita gerar informações


importantes, através da transformação dos dados contidos nas bases (tabelas eletrônicas),
em informações sobre o comportamento dos casos confirmados de Dengue, nos anos de
doação avaliados.

c) O Modelo Brasileiro de Notificação já é consagrado e adotado por lei em todo o


Brasil, há muitos anos, e prediz, com certa margem de confiança, a ocorrência de surtos
de trinta e cinco doenças diferentes. Com essa técnica, na granularidade de semanas
epidemiológicas, é possível fazer a predição em um ou mais anos em relação aos casos
notificados. Além disto, pode-se gerar o limite de alarme, a partir do qual é possível
determinar se existe ou não a ocorrência de uma epidemia.

d) A técnica e arquitetura utilizadas na rede neural implementada no aplicativo


(DV\QQ3OXV apresentou, nas dezesseis primeiras semanas epidemiológicas do ano 2004,
na cidade de Goiânia, melhor faixa de confiança na predição do número de casos
confirmados de Dengue. Essa técnica carrega a desvantagem de gerar erros expressivos,
conforme o número de passos que, no futuro, serão incrementados (i.e. em vez de gerar a
predição com uma semana de antecedência tenta-se gerar a predição com dez semanas e
obtêm-se erros maiores).

e) Em relação ao objetivo geral e aos específicos (sub-item 1.7.1 e 1.7.2):


120

O objetivo principal foi alcançado, já que construído modelo que forneceu suporte à
tomada de decisão para o combate a epidemias de Dengue, o que possibilitou, neste
estudo de caso, a predição de casos confirmados de Dengue, em menor tempo e maior
precisão do que a prática atual.

Quanto aos objetivos específicos: D em Goiânia, de janeiro de 2001 a abril de


2004, o número de casos confirmados de Dengue, no formato de semanas
epidemiológicas, apresentou nítida influência sazonal, principalmente em relação a um
dos parâmetros climáticos (índice pluviométrico); E através da difícil transformação de
dados em informações, foram encontradas diversas relações de Dengue com as
características urbanas representadas no Quadro 11.

Além de todos esses resultados, foram encontradas as seguintes informações


importantes: D o tipo Clássico de Dengue apresentou o maior percentual de notificações
confirmadas, no período estudado, naquela cidade; deve-se levar em consideração que,
embora a ocorrência de Dengue com complicações e FHD apresentem menores
percentuais de confirmação, são elas que, normalmente, sem tratamento médico
adequado, levam a óbito os pacientes infectados; E em relação ao percentual de
respostas no campo DENGUE, da tabela eletrônica 0'(1*8(: em sua maioria, são
notificados pacientes que não haviam apresentado infecção prévia da doença; F em
relação ao percentual de respostas no campo VACINADO da tabela 0'(1*8(, a
maioria dos pacientes afirmam terem sido vacinados contra Febre Amarela, o que apóia a
não notificação dos casos confirmados da doença, no período avaliado; G em relação ao
percentual por gênero, houve forte relação com o sexo feminino; H em relação a
população por bairro, esta apresenta aspecto forte, diretamente proporcional ao número de
habitantes de cada bairro.
121

 &RQFOXV}HVHVXJHVW}HVSDUDWUDEDOKRVIXWXURV
“A arte do raciocínio epidemiológico é tirar sábias conclusões de dados
imperfeitos” George W. Comstock.

 &RQVLGHUDo}HVILQDLV

A Mineração de Dados é utilizada pelas organizações de forma crescente, dada a


possibilidade de procurar padrões e de fornecer suporte à decisão, a partir das bases de
dados existentes.

Quanto à CRISP-DM, talvez seu maior benefício seja a possibilidade de aplicação


em grandes ou pequenos projetos de mineração de dados, além de fornecer aos
pesquisadores juniores, um roteiro que possibilite a conclusão de projetos complexos, em
curto espaço de tempo e com poucos recursos financeiros. Convém ainda ressaltar que a
metodologia CRISP-DM, para MD, é de fácil aplicação e fundamental para manter,
relatar ou descobrir o conhecimento especializado existente nas bases de dados de uma
organização. É um roteiro que conduz o profissional a pesquisas que possibilitam
aquisição e representação do conhecimento. No âmbito desta pesquisa, possibilitou a
aquisição e representação ética do conhecimento epidemiológico sobre os casos
notificados de Dengue.

Para ter sucesso em suas pesquisas, segundo Elder (2004, p.27), o profissional
(pesquisador) de MD deve ter persistência (não desistir se os primeiros experimentos não
apresentarem sucesso) e atitude (ser otimista e acreditar que o trabalho poder ser feito);
ser aberto ao trabalho de equipe (aprender com os usuários o que eles sabem, onde
desejam chegar e como comunicar, de modo eficaz, as descobertas obtidas pela MD). Ser,
principalmente, humildade (saber que a tecnologia, sem o apoio e o conhecimento da
equipe, não fornece soluções).

 'HVWDTXHVHFRQWULEXLomRGDSHVTXLVD

Para se obter maior confiabilidade nos resultados, buscou-se a doação de dados em


instituições públicas (municipais e federais), que realizam, de forma compulsória, a coleta
e armazenamento dos dados necessários para esta pesquisa.

Com essa visão, a pesquisa teve como objetivo principal, predizer, com uma
122

semana de antecedência, o número de casos confirmados de Dengue, naquela cidade. Em


relação aos objetivos secundários, foram encontradas relações que devem ser estudadas
com mais profundidade, em trabalhos futuros.

Existem, ainda, duas outras contribuições: D o valor de doação de todas as


variáveis para esta pesquisa foi gratuito; E a anemométrica de %HDXIRUW foi adaptada
para todos os parâmetros climáticos utilizados para esta pesquisa e, provavelmente, a
mesma adaptação poderá servir para a predição de outras doenças. O simulador de Redes
Neurais (DV\QQ3OXV atende, com facilidade, a especificação e modelagem, o que
permite, aos pesquisadores, seu uso para novas análises e trabalhos futuros.

Em relação aos resultados da análise e da predição, foram apresentados de duas


formas: D para a comunidade científica, com a codificação do nome do bairro, conforme
as questões éticas indicadas por autores consagrados (HJ TURBAN; RAINER; POTTER
2004, p.503, 507); E para os especialistas da SMSGO, através de palestras, planilhas de
dados, do aplicativo 0LFURVRIW ([FHO, com a identificação dos bairros e locais não
identificados no estudo de caso realizado.

Para a comunidade científica e, em relação aos especialistas da SMSGO, os


resultados apresentados, possibilitam a análise de informações importantes, dentre elas:

a) O percentual relativo a cada ano, em relação ao banco de dados, o que


possibilitou identificar o ano de surto;

b) O pequeno percentual de perda, relativo à escolha desta pesquisa, na predição


dos casos confirmados;

c) A escolha de construção de gráficos estatísticos facilitou a análise de Dengue


versus população, lotes baldios, influência sazonal, etc.;

d) Foram identificadas as taxas de ataque, por sexo e idade;

e) Foram estabelecidos e classificados os períodos que apresentam maior ou


menor concentração de casos confirmados;

f) Foi realizada a predição do número de casos confirmados, através de duas


técnicas distintas e ambas apresentaram valores melhores que a técnica
123

brasileira de predição atual.

 6XJHVW}HVSDUDQRYRVWUDEDOKRVGHSHVTXLVD

A complexidade e as potencialidades da análise dos bancos de dados eletrônicos


oferecem muitas oportunidades de pesquisa.

Como sugestão para trabalhos futuros que abordem predição epidemiológica: D


avaliação da predição de casos confirmados de todo o ano 2004; E avaliação de outras
RNAs para predição; F aplicação do modelo proposto em outras séries e/ou períodos
futuros referentes a outras doenças de notificação compulsória; G utilização da técnica
de classificação para identificar os bairros que apresentarão ocorrência de casos
notificados em semana futura, a partir da ocorrência de casos notificados em semana
anterior, em um bairro ou conjunto de bairros; H Utilizar a técnica de classificação para
gerar regras de ocorrências em bairros em relação à tomada do vetor na cidade.

Outros trabalhos futuros que não abordam predição epidemiológica são relatados
abaixo:

a) O governo brasileiro criou o cartão SUS, que será utilizado, após a distribuição
em todo território brasileiro, para identificação de seus pacientes, no
atendimento em suas unidades de saúde. Cerca de cinqüenta por cento destes
cartões já foram distribuídos em Goiânia. Sugere-se utilizar a técnica de
classificação, no aplicativo (software) WEKA, para, de uma base de
conhecimento, identificar as faixas etárias menos contempladas e locais nos
quais houve pouca entrega, auxiliando, assim, o planejamento de campanhas de
distribuição em Goiânia-Go.

b) Considerando que, em geral, dados de saúde estão relacionados com várias


formas de dados ambientais (KAMP, 1997; OMS, 2004, pp.14-15), e que,
segundo a prática de gestão, há forte relação entre a existência de acúmulo de
água em objetos abandonados (BRITO; FORATTINI, 2004, p.204); é
necessário que sejam considerados dados relativos a construções inacabadas,
principais praças na cidade, visitas domiciliares realizadas pelos funcionários
que combatem o vetor das doenças (que apresentaram presença do mosquito),
índice de infestação predial (medido semanalmente), índice pluviométrico por
124

bairro (sugeridos pela OMS, 2004, p.15), campanhas preventivas por setor e
locais/forma de combate ao vetor. Com estes dados, provavelmente seria
conseguido um modelo que fornecesse melhores resultados que os obtidos.
Entretanto, estes dados não estão disponíveis, o que desde já aponta para a
necessidade de uma coleta mais refinada de dados relevantes para a gestão das
doenças em tela. Outros dados, embora interessantes, foram descartados pelo
ciclo de vida/reprodução e combate ao vetor, tais dados e motivos de descarte
são: rios (o vetor não coloca seus ovos em água corrente) e lagoas (existem os
predadores naturais como forma de combate). Neste sentido, um trabalho
interessante seria do de verificar, com as bases existentes quais de suas
variáveis apresentam os menores níveis de ruído e que poderiam ser utilizadas
em estudos futuros.

c) Em relação ao Dengue, na cidade estudada, a estimativa é que, entre trinta e


cinco e quarenta por cento dos casos não são relatados por algum motivo. Para
auxiliar a notificação, propõe-se criar um protocolo de notificação virtual que
forneça subsídios para diminuir a perda de notificação de Dengue. Este
protocolo poderia ser criado através de uma interface e seria dividido em duas
partes. A primeira: criar um layout, para notificação por laboratórios e hospitais
estaduais e/ou particulares, para envio de notificações. A segunda: cadastrar
automaticamente os dados recebidos que não estiverem presentes na base do
SINAN.

d) A mesma proposta do protocolo pode ser estendida, de forma genérica, para


outras doenças brasileiras de notificação compulsória que tenham influência
sazonal. Analisados os dados, poderão fornecer informações que auxiliem, ao
gestor de saúde, na tomada de decisão, de forma a melhorar o atendimento aos
pacientes ou a combater a disseminação de uma doença.

e) Fazer um estudo do percentual de notificações, que não os realizados por


inquérito sorológico: sorteio dos pacientes e verificação de exposição ao vírus,
antes da retirada do sangue; em seguida, logo após o mês de março, coletar as
amostras sangüíneas dos mesmos pacientes e, através de técnicas estatísticas,
determinar o percentual de notificações não realizadas.
125

5HIHUrQFLDV%LEOLRJUiILFDV

ADRIAANS, Pieter; ZANTINGE, Dolf: 'DWD0LQLQJ (QJODQG(G6\VOORJLFS

AGRAWAL, Rakesh; PSAILA, Guiseppe: $FWLYH 'DWD 0LQLQJ In Proceedings of the First
International Conference on Knowledge Discovery and Data Mining (KDD-95): American
Association for Artificial Intelligence. 1995.
ALVARENGA, Rogério; JUNIOR, Odilon N.; CARVALHO, Marcelo R. C.: 8PPRGHORGH
H[WHUQDOL]DomR GR FRQKHFLPHQWR YLVDQGR VXSRUWH j GHFLVmR H YDQWDJHQV FRPSHWLWLYDV
XWLOL]DQGRDVPHWRGRORJLDV&RPPRQNDGVH&5,63'0 KMBRASIL, 2004.

'DWDPLQLQJ HP ILQDQoDV 8P PRGHOR SDUD SUHYLVmR HP VpULHV WHPSRUDLV EDVHDGD HP
ALVARENGA, Rogério; OLIVEIRA JUNIOR, Waldomiro de; CARVALHO, Marcelo.

UHGHV QHXUDLV ± HVWXGR GH SUHYLVmR VREUH R VLVWHPD GH SDJDPHQWRV %UDVLOHLUR
KMBRASIL, Julho 2003.

ALVES BORGES, Sonia Marta dos Anjos ,PSRUWkQFLD HSLGHPLROyJLFD GR $HGHV
$OERSLFWXV QDV $PpULFDV Brasil, Universidade de São Paulo – USP, Dissertação de
Mestrado, Outubro 2001, 99p.
ANDRADE, Ionilda Sabrino; DANTAS, Renilson Targino: (VWXGR GD LQIOXrQFLD GH
HOHPHQWRVPHWHRUROyJLFRVQRVFDVRVGHFyOHUDGHQJXHHPHQLQJLWHQDFLGDGHGH&DPSLQD
*UDQGH XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais.
10p.

ARAUJO, Vânia M. R. Hermes de; FREIRE, Isa Maria; MENDES, Teresa Cristina M.:
'HPDQGDGD,QIRUPDomRSHORVHWRULQGXVWULDO: dois estudos no intervalo de 25 anos. Brasil,
Brasília-Df: Ci. Inf.,v.26 n.3, p. 283-289, set/dez – 1997.

ARGYRIS, Chris: (QVLQDQGR3HVVRDV ,QWHOLJHQWHV D $SUHQGHULQ HARVARD BUSINESS


REVIEW: Gestão do Conhecimento RQ NQRZOHGJH PDQDJHPHQW: 1991. Tradução de Afonso
Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.82-107.

AZEVEDO, Fernando Mendes de; BRASIL, Lourdes Mattos; OLIVEIRA, Roberto Célio
Limão de: 5HGHV 1HXUDLV FRP $SOLFDo}HV HP &RQWUROH H HP 6LVWHPDV (VSHFLDOLVWDV
Florianópolis, Brasil, Visual Books, 2000.

BRAGA, Antônio de Pádua; LUDERMIR, Teresa Bernarda; CARVALHO, André Carlos


Ponce de Leon Ferreira: 5HGHV QHXUDLVDUWLILFLDLV  Teorias e aplicações. Livros Técnicos e
Científicos S. A. – LTC, Rio de Janeiro, 262 p, 2000.

BRASSOLATTI, Rejane Cristina; ANDRADE, Carlos Fernando S. $YDOLDomR GH XPD


LQWHUYHQomRHGXFDWLYDQDSUHYHQomRGDGHQJXHBrasil. Ciênc. Saúde coletiva. 2002, vol.7,
no.2, p.243-251.
BRITO, Marylene de; FORATTINI, Oswaldo Paulo: 3URGXWLYLGDGHGHFULDGRXURVGH$HGHV
DOERSLFWXVQR9DOHGR3DUDtED63%UDVLO. Brasil, São Paulo,: Isso. Saúde pública;38(2):209-
215, abr. 2004.

CAMPOS BRAGA, Giordana HWDO:3UHYLVmRGRQ~PHURGHFDVRVGRGHQJXHQD3DUDtEDD


SDUWLU GD SUHFLSLWDomR GH PRGHORV DWPRVIpULFRV UHJLRQDLV XIII Congresso Brasileiro de
126

Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 14p.


CARDOSO JUNIOR, Rubens PintoHWDO. 'HWHFomRGH$HGHVDHJ\SWLH$HGHVDOERSLFWXVQD
]RQD XUEDQD GR PXQLFtSLR GH &DWDQGXYD63 DSyV FRQWUROH GH HSLGHPLD GH GHQJXH
Brasil. Rev. Soc. Bras. Med. Trop. v.30 n.1 Uberaba jan./fev. 1997, vol.30, no.1, p.37-40.
ISSN 0037-8682.
CARVALHO, Mirléia Aparecida de 6LVWHPD GH VXSRUWH D GHFLVmR SDUD DORFDomR GH iJXD
HPSURMHWRVGHLUULJDomRUniversidade de São Paulo – USP, Tese de Doutorado, Setembro
2003, p.1-193.

CASTRO, Giovanni Gondim; ALVARENGA, Rogério; PRADO, Hércules Antônio: 0RGHOR


SDUDJHVWmRHSLGHPLROyJLFDGR'HQJXHH)HEUH$PDUHODEDVHDGRHP6LVWHPDVGH6XSRUWH
D 'HFLVmR 0LQHUDomR GH 'DGRV H ,QIRUPDo}HV (VSDFLDLV V Workshop de Tecnologia da
Informação da UCB. p. 83-84, Setembro 2004.

______: 8VRGHPLQHUDomRGHGDGRVSDUDDFRQVWUXomRGHPRGHORSUHGLWLYRGHVXUWRGH
GHQJXH XWLOL]DQGR FDVRV FRQILUPDGRV GR 6LVWHPD GH ,QIRUPDo}HV GH $JUDYRV GH
1RWLILFDomRVI Workshop de Tecnologia da Informação da UCB. p. 41-42, Maio 2005.

CASTRO, Giovanni Gondim; ARAUJO, Valdivino Alves. $PSOLDomRGRVLVWHPDGHFRQWUROH


ODERUDWRULDO GD VD~GH GH *RLkQLD Revista da Secretaria Municipal de Saúde, Relatório de
Gestão, Artigos, p. 65,66. Dezembro/2004.

COFFIN, Carla HW DO.: 8VLQJ ,QWHOOLJHQW $JHQWV WR 5HSXUSRVH $GPLQLVWUDWLYH 'DWD LQ
)RUHFDVWLQJ 'LVHDVH 3UHYHQWLRQ LQ DQ 2XWSDWLHQW &RQWH[W 7KH &DVH RI 3QHXPRFRFFDO
9DFFLQDWLRQUSA, Hawaii: Proceedings on 37th Hawaii International Conference on Systems
Sciences – 2004, IEEE, 7p. 2004.
CORTES, Luzia M de C HW DO &RPSDUDWLYH LPPXQRORJLFDO UHFRJQLWLRQ RI SURWHLQV IURP
1HZ *XLQHD ³&´ GHQJXH YLUXV W\SH  SURWRW\SH DQG IURP D GHQJXH YLUXV W\SH  VWUDLQ
LVRODWHG LQ WKH 6WDWH RI 5LR GH -DQHLUR %UD]LO. Brasil.Memorando Instituto Oswaldo Cruz.
Abr. 2003, vol.98, no.3, p.331-334. ISSN 0074-0276.

COSTA SOUSA, Paulo de Tarso: 0LQHUDomR GH 'DGRV SDUD LQGXomR GH XP PRGHOR GH
*HVWmRGR&RQKHFLPHQWRBrasil, Universidade Católica de Brasília – UCB, Dissertação de
Mestrado, Março 2003, 167p.
CRUZ, Bruna: (VWXGR YDL PRQLWRUDU UHSURGXomR
GHYHWRUHVGRGHQJXH Brasil. FIOCRUZ, Março/2004.

CUMMINGS, Derek A. T. HW DO: 7UDYHOOLQJ ZDYHV LQ WKH RFFXUUHQFH RI GHQJXH
KDHPRUUKDJLFIHYHULQ7KDLODQG USA. Nature, Vol. 427, p.344-347, Jan/2004.

CYRINEU TERRA, José Cláudio: *HVWmR GR &RQKHFLPHQWR O grande desafio


empresarial:uma abordagem baseada no aprendizado e na criatividade. Brasil. São Paulo, Ed.
Negócio, 313p. 2001.

DELMATER, Rhonda; HANCOCK, Monte: 'DWD0LQLQJ([SODLQHG± $ 0DQDJHUV*XLGHWR


&XVWRPHU&HQWULF%XVLQHVV,QWHOOLJHQFH. USA. 392p. Ed. Digital Press. 2001. ISBN:1-55558-
231-1.
DENIS, Cristiane K.HWDO0DQLIHVWDo}HVRWRUULQRODULQJROyJLFDVHPSDFLHQWHVFRPGHQJXH
127

Brasil. Set./out. 2003, vol.69, no.5, p.644-647.

DRUCKER, Peter H.:2 DGYHQWR GD 1RYD 2UJDQL]DomR LQ HARVARD BUSINESS


REVIEW: Gestão do Conhecimento RQ NQRZOHGJH PDQDJHPHQW: 1998. Tradução de Afonso
Celso da Cunha Serra. Brasil. Rio de Janeiro, 6ª Edição. Ed. Campus, 2001. p.9-26

DQGUHODWLRQVKLSV. P.1-26. Volume 14, Março 1995. ISSN:0167-9236.


EIRMAN, Michael A; NIEDERMAN, Fred; ADAMS, Carl:'667HRU\DPRGHORIFRQVWUXFWV

ELDER, John:7RS  GDWD PLQLQJ PLVWDNHV :RRG *ULOOH %XIIHW &KDUORWWHVYLOOH 9LUJLQLD
,(((0DUS

WR.QRZOHGJH'LVFRYHU\LQ'DWDEDVHV86$ $PHULFDQ$VVRFLDWLRQIRU$UWLILFLDO,QWHOOLJHQFH
FAYYAD, Usama; SHAPIRO-PIATETSKY, Gregory; SMYTH, Padhraic:)URP'DWD0LQLQJ

1996, p. 37-54.

______: $GYDQFHV LQ .QRZOHGJH 'LVFRYHU\ DQG 'DWD 0LQLQJ. American Association for
Artificial Intelligence, 1996b. 625p. ISBN 0-262-56097-6

FOCKS, Dana A. HW DO$ VLPXODWLRQ PRGHO RI WKH HSLGHPLRORJ\ RI XUEDQ GHQJXH IHYHU
OLWHUDWXUH DQDO\VLV PRGHO GHYHORSPHQW SUHOLPLQDU\ YDOLGDWLRQ DQG VDPSOHV RI VLPXODWLRQ
UHVXOWV. American Journal of Tropical Medicine and Hygiene. 1995. Nr. 53, p. 489-506.

FOUQUE, Florence; BICOUT, Dominique; SABATIER, Philippe:0RGHOLQJ 7UDQVPLVVLRQ


3RWHQWLDORI0RVTXLWRHV9HFWRUVRI7URSLFDO'LVHDVHV
FOUQUE, Florence; GARINCI, Romuald; GABORIT, Pascal(SLGHPLRORJLFDO DQG
HQWRPRORJLFDO VXUYHLOODQFH RI WKH FRFLUFXODWLRQ RI '(1 '(1 DQG '(1 YLUXVHV LQ
)UHQFK *XLDQD 7URSLFDO 0HGLFLQH  ,QWHUQDWLRQDO +HDOWK
Volume 9, p. 41-46. Janeiro 2004.

FRANÇA, Consuelo Vidica; ALVES SILVA, Marta Maria; AMORIM SILVA, Flúvia Pereira:
$o}HV YLWRULRVDV QR FRQWUROH GD GHQJXH HP *RLkQLD Revista da Secretaria Municipal de
Saúde, Relatório de Gestão, Artigos, p. 51-53. Dezembro/2004.

FUNASA:*XLD GH 9LJLOkQFLD (SLGHPLROyJLFD 9ROXPH , Brasil, Brasília-Df. Ed. Fundação


Nacional de Saúde - FUNASA. 477p. 2002.
GACHET, Alexandre:$ )UDPHZRUN IRU 'HYHORSLQJ 'LVWULEXWHG &RRSHUDWLYH 'HFLVLRQ
6XSSRUW 6\VWHPV – Inception Phase. Challenges to Informing Clients: A Transdisciplinary
Approach. University of Fribourg, Switzerland, 2001.
GALE MOORE, Thomas:,Q 6LFNQHVV DQG LQ +HDOWK The Kyoto Protocol versus Global
Warming 6WDQIRUG8QLYHUVLW\ – 2000.
GOEBEL, Michael; GRUENWALD, Le:$ 6XUYH\RI'DWD0LQLQJDQG.QRZOHGJH'LVFRYHU\
6RIWZDUH7RROV 6LJ.GG([SORUDWLRQV, -XQH, Volume 1, Issue 1: p.20-33, 1999.

HALES HW DO.:3RWHQWLDO HIIHFW RI SRSXODWLRQDQG FOLPDWH FKDQJHV RQ JOREDO GLVWULEXWLRQ RI
GHQJXHIHYHUDQHPSLULFDOPRGHO. THE LANCET, Vol 360, p. 830-834, September 2002.

HAMMERS Maryann:0LQH FRPSDQ\ GDWD ZLWKGHFLVLRQVXSSRUWWRROV KXPDQUHVRXUFH


PDQDJHPHQW V\VWHPV – related article Choosing a Decision-Support System. Workforce,
June 2002, p.1-2.
128

HAN Jiawei; KAMBER Micheline:'DWD 0LQLQJ &RQFHSWV DQG 7HFKLQLTXHV 6LPRQ )UDVHU
8QLYHUVLW\2001. 550 p.

HAYKIN, Simon:5HGHV QHXUDLV – Princípios e prática: 1999. Tradução de Paulo Martins


Engel. Brasil, Porto Alegre. 2ª Edição. Ed. Bookman, 2001. 900p.

HENDRIKS, Paul; VRIENS, Dirk:&ROODERUDWLYHH[SORUDWLRQRIVSDWLDOSUREOHPV In Initiative


on Collaborative Spatial Decision Making 17, Londres, NCGIA, 1995.
KAMP, Vera; GRUPE, Roland:6HPDQWLF &OLHQW &DFKLQJ LQ D &OLHQW6HUYHUEDVHG .''
$UFKLWHFWXUH Alemanha, 1997.
KAMP, Vera; SITZMANN, Lars; WIETEK, Frank:$ VSDWLDO GDWD FXEH FRQFHSW WR 6XSSRUW
'DWD $QDO\VLV LQ (QYLURQPHQWDO (SLGHPLRORJ\. EUA, Washington: 3URFHHGLQJV RI WKH WK
,QWHUQDWLRQDO &RQIHUHQFH RQ 6FLHQWLILF DQG 6WDWLVWLFDO 'DWDEDVH 0DQDJHPHQW 66'%0¶ –
,(((&RPSXWHU6RFLHW\3UHVV. 4p. 1997.
KAMP, Vera; WIETEK, Frank:,QWHOOLJHQW 6XSSRUW IRU 0XOWLGLPHQVLRQDO 'DWD $QDO\VLV LQ
(QYLURQPHQWDO(SLGHPLRORJ\ ,QWHUQDWLRQDO6\PSRVLXP IDA’97, 12p, 1997.

KHAN A.M. HW DO.:$QDO\VLV RI DQWLJHQLF KRWVSRWV LQ GHQJXH YLUXV $ ELRLQIRUPDWLFV
DSSURDFK LQ First Asian Regional dengue research network meeting. October 2004. Bankok.
Thailand.

KOVACS, Zsolt HWDO.:'DWDEDVH'HVFULSWLRQIRUD3DQ(XURSHDQ+HDOWKFDUH6\VWHP USA,


Hawaii: 3URFHHGLQJVRIWKHUG+DZDLL,QWHUQDWLRQDO&RQIHUHQFHRQ6\VWHP6FLHQFHV – 2000.
IEEE, 10p, 2000.

LEMOS, Wilda Soares:*HVWmR GH &RPSHWrQFLDV: A Utilização do Método Delphi em um


Estudo de Caso. 2003. Dissertação de Mestrado (Mestrado em Gestão de Conhecimento e
Tecnologia da Informação) - Programa de Pós-Graduação 6WULFWR 6HQVX em Gestão de
Conhecimento e Tecnologia da Informação, Universidade Católica de Brasília – UCB,
Brasília-DF.
LIMA, Virgília L CHWDO'HQJXHLQTXpULWRVRUROyJLFRSyVHSLGrPLFRHP]RQDXUEDQDGR
(VWDGRGH6mR3DXOR %UDVLO Brasil. 5HY6D~GH3~EOLFD. Dez. 1999, vol.33, no.6 p.566-574.
ISSN 0034-8910.

LOIOLA, Carlos Catão Prates:'HQJXH QDV $PpULFDV in CASTRO GOMES, Almerio de:
Informes em Saúde Pública Universidade de São Paulo – Faculdade de Saúde Pública, 2000.

MACIEL, Ivan José:$YDOLDomR (SLGHPLROyJLFD GR 'HQJXH QR 0XQLFtSLR GH *RLkQLD QR
3HUtRGR GH  D  Brasil, Universidade Federal de Goiás, Dissertação de Mestrado,
1999, 119p.

MARTENS, Willem J.M. HWDO:3RWHQWLDO,PSDFWRI*OREDO&OLPDWH&KDQJHRQ0DODULD5LVN


Environmental Health Perspectives Volume 103, Number 5, 11p, May 1995.

MEDEIROS OLIVEIRA, Stanley Robson de:'DWD WUDQVIRUPDWLRQ IRU SULYDF\SUHVHUYLQJ


GDWDPLQLQJ Universidade de Alberta, Canadá, Tese de Doutorado, 2005, 167p.

MELHORAMENTOS:'LFLRQiULR 3UiWLFR da Língua Portuguesa. Brasil, 10. Ed., São Paulo:


129

Cia. Melhoramentos de São Paulo 1998. ISBN 85-06-01707-6

MICHAELIS:3HTXHQR 'LFLRQiULR GD /tQJXD 3RUWXJXHVD Brasil, 5. Ed., São Paulo:


Companhia Melhoramentos 1998. ISBN 85-06-02718-7
MOORE, Fred:1HZ $SSOLFDWLRQV %UHDN 7KURXJK 6WRUDJH %RXQGDULHV ± 1HZV %ULHIV.
&RPSXWHU7HFKQRORJ\5HYLHZ, 2FW 1999, 2p.

MORESI, 2000:'HOLQHDQGRRYDORUGRVLVWHPDGHLQIRUPDomRGHXPDRUJDQL]DomR Brasil,


Brasília-DF: Ci. Inf., V.29, n.º 1, p. 14-24, jan./abr. 2000.
MSB - Ministério da Saúde do Brasil: Núcleo de comunicação da Secretaria de Vigilância em
Saúde – 2 TXHp'HQJXH, Maio 2004.

MUNSTERMANN, Leonard:$HGHVDHJ\SWL WKH\HOORZIHYHUPRVTXLWR. National Institutes of


Health - National Institute for Allergy and Infectious Diseases. 1995.

NASCIMENTO SOUSA HW DO.:(IHLWR GR FOLPD VREUH D 'HQJXH QD FLGDGH GH &DPSLQD
*UDQGH  3%. XIII Congresso Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004.
Anais. 7p.

NONAKA, Ikujiro; TAKEUCHI, Hirotaka:&ULDomRGH&RQKHFLPHQWRQD(PSUHVD. Como as


Empresas Japonesas Geram a Dinâmica da Inovação. Brasil. Editora Campus 2ª Edição. 1997.
NOON, Charles E.; HANKINS, Charles T.:6SDWLDO 'DWD 9LVXDOL]DWLRQ LQ +HDOWKFDUH
6XSSRUWLQJ D )DFLOLW\ /RFDWLRQ 'HFLVLRQ YLD *,6EDVHG 0DUNHW $QDO\VLV  WK +DZDLL
,QWHUQDWLRQDO&RQIHUHQFHRQ6\VWHP6FLHQFHV. IEEE, 10p – 2001.

NUNES SILVA, Nilza; CUNHA, Tarcisio Neves; QUINTANILHA, José Alberto:$PRVWUD


PHVWUD H JHRSURFHVVDPHQWR tecnologias para inquéritos domiciliares. Brasil, São Paulo:
Revista Saúde Pública. P.494-502, Fevereiro 2003.

O´BROCHTA David A.:7UDQVJHQLF ,QVHFWV 3URJUDPV 7HFKQRORJ\ %HQHILWV DQG 5LVNV


in: /02V DQG WKH (QYLURQPHQW 3URFHHGLQJV RI DQ ,QWHUQDWLRQDO &RQIHUHQFH  (C. R.
Roseland ed.) Organization of Economic Cooperation and Development, França, Paris. P.247-
254, 2002.

O’DELL, Carla, GRAYSON, JR. C. Jackson:,I 2QO\ :H .QHZ :KDW :H .QRZ:
The Transfer of Internal Knowledge and Best Practice. The Free Press, USA, 1998

OLIVEIRA JÚNIOR, Waldomiro: 3UHYLVmR GH VpULHV WHPSRUDLV XWLOL]DQGR UHGHV QHXUDLV
Estudo de caso: Previsão no sistema de pagamentos Brasileiro. Universidade Católica de
Brasília – UCB, Descoberta de conhecimentos em bases de dados, 2003, 40 p.

OLIVEIRA, Emerson Madureira; ALVARENGA, Rogério:'DWD PLQLQJ HP ILQDQoDV: Um


exemplo prático utilizando a metodologia CRISP-DM, Brasil, Brasília, Universidade Católica
de Brasília, novembro/2003

OMS:.QRZOHGJHPDQDJHPHQWDQGVKDULQJ .06 Suíça, Genebra, 2p. 2005.

______:)DFWVKHHWQžDecember 2001.Suíça, Genebra. 4p 2004.

______:8VLQJ FOLPDWH WR SUHGLFW ,QIHFWLRXV GLVHDVH RXWEUHDNV D UHYLHZ Suíça, Genebra.
130

&RPPXQLFDEOH 'LVHDVHV 6XUYHLOODQFH DQG 5HVSRQVH 3URWHFWLRQ RI WKH +XPDQ (QYLURQPHQW
5ROO%DFN0DODULD 55p. 2004b.
______:,QWHUQDWLRQDO7UDYHODQG+HDOWKSuíça, Genebra. 2004c
______:'HQJXH1HW:+2*OREDO'HQJXH6XUYHLOODQFH Suíça, Genebra. 2004d

______::RUOG 5HSRUW RQ  .QRZOHGJH IRU %HWWHU +HDOWK  6WUHQJWKHQLQJ +HDOWK 6\VWHPV
Suíça, Genebra. 2004e

______:)DFWVKHHWQž April 2002.Suíça, Genebra. 3p 2003.

______:$WLYLGDGHV GD 206 QD 5HJLmR $IULFDQD – Relatório Anual de 2002. África,
Jonesburgo. 82p. Setembro 2003b.

______:,QWHUQDWLRQDO7UDYHODQG+HDOWKSuíça, Genebra. 207p. 2003c.

______:&OLPDWHFKDQJHDQGKXPDQKHDOWK - risks and responses. Summary Suíça, Genebra.


37p. 2003d. ISBN-92.4.159081.5.
______::K\DLUFUDIWGLVLQVHFWLRQ" Suíça *HQHEUD32000.

______:&OLPDWH9DULDELOLW\DQG&KDQJHDQGWKHLU+HDOWK(IIHFWVLQ3DFLILF,VODQG&RXQWULHV
 :RUNVKRS5HSRUW $SLD6DPRD6XtoD*HQHEUDS-XOKRE

______:'HQJXH DQG 'HQJXH +HPRUUKDJLF )HYHU – Report on global surveillance of
epidemic-prone infectious diseases. Chapter 6: p.75-88, 2000c.

DQGFRPPXQLWLHVGenebra. P.48-59. 1997


______:9HFWRU6XUYHLOODQFHDQG&RQWUROLQ9HFWRUFRQWUROPHWKRGVIRUXVHE\LQGLYLGXDOV

______:$JULFXOWXUDOGHYHORSPHQWDQGYHFWRUERUQHGLVHDVHV Suíça. Genebra. 22p. 1996.

PAIM, Jairnilson Silva:(SLGHPLRORJLD H SODQHMDPHQWR D UHFRPSRVLomR GDV SUiWLFDV


HSLGHPLROyJLFDVQDJHVWmRGR686Brasil: Revista Ciência e Saúde, Associação Brasileira de
Pós-graduação em Saúde Coletiva – ABRASCO, Volume 8, n.º2, p. 557-567, 2003, ISSN
1413-8123.

PASSARI, Antônio Fabrizio Lima:([SORUDomR GH GDGRV DXWRPDWL]DGRV SDUD SUHYLVmR GH
YHQGDVQRYDUHMRXWLOL]DQGRUHGHVQHXUDLV, São Paulo, Brasil, Universidade de São Paulo -
USP, Dissertação de Mestrado, 2003, 150p.
PATZ, Jonathan A. HW DO:'HQJXH )HYHU (SLGHPLF 3RWHQWLDO DV 3URMHFWHG E\ *HQHUDO
&LUFXODWLRQ 0RGHOV RI *OREDO &OLPDWH&KDQJH Environmental Health Perspectives Volume
106, Number 3, March 1998.

PENNA, Maria Lúcia F.:5HGH QHXUDO DUWLILFLDO SDUD GHWHFomR GH VREUHPRUWDOLGDGH


DWULEXtYHO j &yOHUD QR &HDUi. 5HY 6D~GH 3~EOLFD, Junho 2004, vol.38, no.3, p.351-357.
ISSN 0034-8910.
PINHEIRO, Valéria Cristina Soares; TADEI, Wanderli Pedro:$YDOLDomRGRHIHLWRUHVLGXDOGR
WHPHIyV HP ODUYDV GH $HGHV DHJ\SWL 'LSWHUD &XOLFLGDH  HP UHFLSLHQWHV DUWLILFLDLV HP
131

0DQDXV $PD]RQDV %UDVLO Idem. Caderno Saúde Pública. Nov./dez. 2002, vol.18, no.6,
p.1529-1535.

3RWHQFLDO GH %DFLOOXV WKXULQJLHQVLV LVUDHOHQVLV %HUOLQHU QR FRQWUROH GH $HGHV DHJ\SWL.
POLANCZYK, Ricardo Antonio, GARCIA, Marcelo de Oliveira e ALVES, Sérgio Batista:.

5HYLVWD6D~GH3~EOLFD. Dez. 2003, vol.37, no.6, p.813-816. ISSN 0034-8910.

PONTES, Ricardo J. S.; RUFFINO NETTO, Antonio:'HQJXH HP ORFDOLGDGH XUEDQD GD
UHJLmR VXGHVWH GR %UDVLO DVSHFWRV HSLGHPLROyJLFRV Brasil. Revista Saúde Pública. Jun.
1994, vol.28, no.3, p.218-227.
PRADO, Hercules Antônio:$ERUGDJHQV +tEULGDV SDUD 0LQHUDomR GH 'DGRV Exame de
qualificação de doutorado. Universidade Federal do Rio Grande do Sul. 1998.

RAFAELI NETO, Silvio Luiz:7RPDGD GH 'HFLVmR (VSDFLDO Uma abordagem sistêmica e
implicações tecnológicas. III Workshop Brasileiro de Geoinformática – GeoInfo2001. Brasil.
Rio de Janeiro. Instituto Militar de Engenharia, 4 e 5 de outubro de 2001.
REBELO, José Manuel MacárioHWDO.:'LVWULEXLomRGH$HGHVDHJ\SWL H GRGHQJXHQR(VWDGR
GR 0DUDQKmR %UDVLO. &DG 6D~GH 3~EOLFD. Jul./set. 1999, vol.15, no.3, p.477-486. ISSN
0102-311X.

REIFER, Donald J.:$ /LWWOHELWRINQRZOHGJHLVDGDQJHURXVWKLQJ. IEEE, p14/15, May/June


2002.

RIGAU-PEREZ, José G. HWDO:$ 'HULYDWLRQ%DU&KDUWIRU'HWHFWLQJ'HQJXH2XWEUHDNVLQ


3XHUWR5LFR American Journal of Public Health. March 1999, vol. 89, Nr 3, p.374-378.

6LPXOWDQHRXVLQIHFWLRQZLWK'HQJXHDQGLQD%UD]LOLDQSDWLHQW. Brasil. Ver. Inst. ` éd.


ROCCO, Iray Maria; BARBOSA, Maria Luisa; KANOMATA, Emilia Hiromi Nakaya.

Trop. S. Paulo. Maio/Jun. 1998, vol.40, no.3, p.151-154.

D ZDWHUEXGJHWLQJWHFKQLTXHInt. J. Biometorol, March 2001, Nr. 45, p.81-89.


SCHREIBER, Kathleen.:$QLQYHVWLJDWLRQRIUHODWLRQVKLSVEHWZHHQFOLPDWHDQGGHQJXHXVLQJ

WRRO IRU WKH H[SORUDWLRQ RI KXPDQ KHDOWK GDWD Alemanha: Proceedings of the International
SCHUMANN; H, CHÁVEZ, Norma de López; GRAW, H,-U:9LVXDODQDO\VLVDVDQHIILFLHQW

Workshop on Geomedical Systems (GEOMED’97).

SEPLAN:$VSHFWRVGHPRJUiILFRVGDSRSXODomRGH*RLkQLDSRUEDLUURVHJXQGRRDQRGH
 Brasil, Goiânia. Secretaria de Planejamento - SEPLAN. 199p, dezembro 2002.

SILVEIRA RODRIGUES, Eugênia Maria HWDO(SLGHPLRORJLDGDLQIHFomRSHODGHQJXHHP


5LEHLUmR3UHWR63%UDVLOIdem. Revista Saúde Pública. Abr. 2002, vol.36, no.2, p.160-165.

SIQUEIRA JUNIOR, João Bosco HW DO:+RXVHKROG VXUYH\ RI GHQJXH LQIHFWLRQ LQ FHQWUDO
EUD]LO VSDWLDO SRLQW SDWWHUQ DQDO\VLV DQG ULVN IDFWRUV DVVHVVPHQW American Journal of
Tropical Medicine and Hygiene, nº 71, p 646-651, 11/2004.
______:'HQJXH DQG 'HQJXH +HPRUUKDJLF )HYHU %UD]LO ± CDC – Emerging
Infectious Diseases, Vol .11, nº 1, p 48-53, 01/2005.

SIQUEIRA JÚNIOR, João Bosco:9LJLOkQFLD GR 'HQJXH $SOLFDomR GH 'LDJUDPDV GH
&RQWUROHH$QiOLVH(VSDFLDOQR0XQLFtSLRGH*RLkQLD*RLiVBrasil, Universidade Federal
132

de Goiás – UFG,Dissertação de Mestrado, 2001. 53p.

SOUSA HWDO:(VWXGRFRPSDUDWLYRHQWUHDSUHFLSLWDomRSOXYLRPpWULFDPHQVDOHRQ~PHUR
PHQVDO GH FDVRV GH FDVRV GHQJXH QRWLILFDGRV HP %HOpP3D  . XIII Congresso
Brasileiro de Meteorologia. Fortaleza-Ceará. Setembro 2004. Anais. 9p.

SPSS: &5,63'06WHSE\VWHSGDWDPLQLQJJXLGH78p. 2000.

SRINIVASAN K.N. HW DO:$QDO\VLV RI 7FHOO HSLWRSH KRWVSRWV LQ GHQJXH YLUXV HQYHORSH
SURWHLQ LQ First Asian Regional dengue research network meeting. October 2004. Bankok.
Thailand.

STEWART, Thomas A.:&DSLWDO ,QWHOHFWXDO – A Nova Abordagem Competitiva das


Empresas: 1987. Tradução de Ana Beatriz Rodrigues e Priscilla Martins Celeste. Brasil. Rio de
Janeiro. 9ª Edição. Ed. Campus, 1998. 237p.
SVS: Secretaria de Vigilância em Saúde – BRASIL LQ Ministério da Saúde do Brasil - MSB :
Núcleo de Comunicação da Secretaria de Vigilância em Saúde. 'HQJXHEROHWLPGDVHPDQD
Qž, Ministério da Saúde do Brasil.
______:'HQJXHEROHWLPGDVHPDQDQž, Ministério da Saúde do Brasil.
______:'HQJXHEROHWLPGDVHPDQDQž, Ministério da Saúde do Brasil.

SWINGLER, Kevin:$SSO\LQJ QHXUDO QHWZRUNV – D SUDFWLFDO JXLGH. Academic Press, USA,


San Diego, 1996. 303p.

TEIXEIRA FILHO, Jayme:*HUHQFLDQGR FRQKHFLPHQWR. Brasil, Rio de Janeiro, Serviço


Nacional de Aprendizagem Comercial. 2ª Edição. 189p. 2001.

TURBAN, Efraim; ARONSON, Jay E.:'HFLVLRQ 6XSSRUW 6\VWHPV DQG ,QWHOOLJHQW 6\VWHPV
1HZ-HUVH\3UHQWLFH+DOO(GLWLRQ

TURBAN, Efraim; RAINER, Kelly R. Jr.; POTTER, Richard E.:$GPLQLVWUDomR GH


WHFQRORJLD GD LQIRUPDomR – Teoria e prática: 2003. Tradução de Teresa Félix de Souza.
Brasil. Rio de Janeiro. 4ª Edição. Ed. Campus, 2004. 598p.

UNICAMP:;,, &RQJUHVVR ,QWHUQR GH ,QLFLDomR &LHQWtILFD. Brasil. São Paulo: Ed.
Universidade de Campinas (UNICAMP). 398p. Setembro 2004.
VASCONCELOS, Pedro F. C.HWDO(SLGHPLDGHGHQJXHHP)RUWDOH]D&HDUiLQTXpULWR
VRURHSLGHPLROyJLFR DOHDWyULR Brasil. 5HY 6D~GH 3~EOLFD. Out. 1998, vol.32, no.5, p.447-
454. ISSN 0034-8910.
VENÂNCIO DA CUNHA, Rivaldo HW DO'HQJXH LQIHFWLRQ LQ 3DUDFDPEL 6WDWH RI 5LR GH
-DQHLUR. Rev. Soc. Bras. Med. Trop. Set./out. 1997, vol.30, no.5, p.379-383. ISSN
0037-8682.

VIANELLO, Rubens Leite; ALVES, Adil Ramier:0HWHRURORJLD EiVLFD H DSOLFDo}HV


Universidade Federal de Viçosa, Imprensa Universitária, p.384-397, Viçosa – Minas Gerais,
1991.
WANG, Hui; WEIGEND, Andreas S.:'DWD PLQLQJ IRU ILQDQFLDO GHFLVLRQ PDNLQJ. Ed.
Elsevier, 2004, p. 457-460.
133

WESTPHAL, Márcia Faria:2 PRYLPHQWRFLGDGHVPXQLFtSLRVVDXGiYHLVXPFRPSURPLVVR


FRP D TXDOLGDGH GH YLGD. Associação Brasileira de Pós-graduação em Saúde Coletiva –
ABRASCO. 2000, Volume 5 número 1. ISSN 1413-8123

WIETEK, Frank; KAMP, Vera: 6SDWLDO'DWD$QDO\VLV6XSSRUWIRU&DQFHU(SLGHPLRORJ\LQ


&$5(66 *HRPHGLFDO6\VWHPV (GEO-MED 97), 11p 1997.

ZELASNY Gene&RPXQLFDomRYLVXDOSDUDH[HFXWLYRVUtilizando gráficos como poderosa


ferramenta de trabalho. Tradução de Aníbal Mari. Brasil. São Paulo, Ed. Futura, 1997. 203p.
134

*ORVViULR GLFLRQiULRGHWHUPRV 

Termo Significado Autor/página


Arbovírus Um vírus difundido por artrópodes i.e. um vírus que é WHO, 1996, p. 01
transmitido por insetos ou pequenos aracnídeos
apud Citado por, conforme, segundo SERRA NEGRA,
Exemplo: (EVANS, 1987, apud SAGE, 1992, p. 2-3) 2003, p. 165
Segundo Silva (apud ABREU, 1999, p. 3) diz ser [...]
e.g. (latim H[HPSOLJUDWLD), Por exemplo MELHORAMENT
OS, 1998, 1034
Endemia Doença que ocorre constantemente em determinada região. MICHAELIS,
1998, p.468
Epidemia Doença que ataca ao “A ocorrência em uma comunidade ou em uma região, de
mesmo tempo um número de casos específicos no comportamento de
muitas pessoas da uma doença, ou outros eventos claramente relacionados
mesma região. que indiquem a presença de uma epidemia que varia de
(Michaelis, 1998, acordo com o agente da população exposta e experiência
p.483) (falta de precedente da exposição à doença e época e lugar
da ocorrência)” (LAST, 2001 DSXG WHO, 2004, p. 14,
tradução nossa).

i.e. Isto é MELHORAMENT


OS, 1998, 1036
Interação Ação recíproca de dois ou mais corpos uns nos outros; MICHAELIS,
Atualização da influência recíproca de corpos inter- 1998, p.691
relacionados;
Ação Recíproca entre o usuário e um equipamento;
Ações e relações entre os membros de um grupo ou entre
grupos de uma sociedade.
Investigaçã “Investigação epidemiológica é um trabalho de campo, (FUNASA, 2002,
o realizado a partir de casos notificados (clinicamente 31).
epidemioló declarados ou suspeitos) e seus contatos, que tem como
gica principais objetivos: identificar fonte e modo de
transmissão: grupos expostos a maior risco; fatores
determinantes; confirmar diagnóstico; e determinar as
principais características epidemiológicas. O seu propósito
final é orientar medidas de controle para impedir a
ocorrência de novos casos” (FUNASA, 2002, 31).
Iteração Ato e iterar repetir MICHAELIS,
1998, p.710
Modelo É a descrição formal de um sistema. Estas descrições DELMATER e
modem possuir muitas formas, dependendo do propósito HANCOCK, 2001,
do modelo. O propósito do modelo é descrever a relação p. 06
entre a entrada e saída dos dados do sistema.
Mosquito Tipo de mosquito que pode transmitir doenças como a WHO, 1996, p. 01
Aedes Febre Amarela e o Dengue
Notificação “Notificação é a comunicação da ocorrência de determinada FUNASA, 2002, p.
doença ou agravo à saúde, feita à autoridade sanitária por 15
135

profissionais de saúde ou qualquer cidadão, para fins de


adoção de medidas de intervenção pertinentes” (FUNASA,
2002, p. 15)
Surto “Uma epidemia (praga) limitada a um local que aumenta na LAST (2001 DSXG
incidência de uma doença (enfermidade). e.g. em uma vila, WHO, 2004, p.14,
cidade ou instituição fechada” tradução nossa)
Sazonal “Relativo à estação do ano, à sazão” MICHAELIS,
1998, p.1114
136

$QH[R $  62/,&,7$d­2 '( '2$d­2 '( '$'26 $2 6(&5(7È5,2


081,&,3$/'(6$Ò'('(*2,Æ1,$ *2
³6U6HFUHWiULR

3DUD GDU SURVVHJXLPHQWR H FRQVROLGDU D SHVTXLVD HIHWXDGD HP PLQKD
GLVVHUWDomR GH 0HVWUDGR QD 8QLYHUVLGDGH &DWyOLFD GH %UDVtOLD QHFHVVLWR TXH
VHMDP IRUQHFLGDV D WtWXOR GH GRDomR SDUD SHVTXLVD FLHQWtILFD DV LQIRUPDo}HV
%DQFR GH GDGRV PDSDV GDGRV H 3. SHUWHQFHQWHV j 6HFUHWDULD 0XQLFLSDO GH
6D~GH UHIHUHQWHV DR 6LVWHPD 1DFLRQDO GH $JUDYRV H 1RWLILFDomR 6,1$1  QR
SHUtRGR GH  MDQHLUR GH  D  DEULO GH  VREUH DV GRHQoDV 'HQJXH H
)HEUH$PDUHOD

(VFODUHoRTXHHVWRXFLHQWHGDUHVSRQVDELOLGDGHSHODQmRGLYXOJDomRGRV
GDGRVSDUDRXWURVILQVTXHQmRDFDGrPLFRV

2V GDGRV FRQVWDQWHV QR 6,1$1 TXH QmR VHUmR XWLOL]DGRV QD QRVVD
SHVTXLVD VmR QRPH GR SDFLHQWH ORJUDGRXUR UDoD HVFRODULGDGH QXPHUR GR
FDUWmR686QRPHGDPmHWHOHIRQHRFXSDomRGHVORFDPHQWRGDWDGD~OWLPDGRVH
GH IHEUH DPDUHOD VH RFRUUHX D KRVSLWDOL]DomR GDWD GH KRVSLWDOL]DomR
PXQLFtSLRQRPHHQGHUHoRWHOHIRQH GR KRVSLWDO ORFDO SURYiYHO GH LQIHFomR
REVHUYDo}HV³
137

$QH[R %  62/,&,7$d­2 '( '2$d­2 '( '$'26 $2 ',5(725


35(6,'(17('$&20'$7$
³6U3UHVLGHQWH
3DUD GDU SURVVHJXLPHQWR H FRQVROLGDU D SHVTXLVD HIHWXDGD HP PLQKD
GLVVHUWDomRGH0HVWUDGRQD8QLYHUVLGDGH&DWyOLFDGH%UDVtOLDQHFHVVLWRTXHVHMDP
IRUQHFLGDV D WtWXOR GH GRDomR SDUD SHVTXLVD FLHQWtILFD RV VHJXLQWHV GDGRV
UHIHUHQWHVD&LGDGHGH*RLkQLD
• &yGLJRGREDLUUR
• 1RPHGREDLUUR
• 1~PHURGHHVFRODVSRUEDLUUR
• 1~PHURGHKRVSLWDLVSRUEDLUUR
• 1~PHURGHSUpGLRVSRUEDLUUR
• 4XDQWLGDGHWRWDOGHORWHVSRUEDLUUR
• 4XDQWLGDGHWRWDOGHORWHVUHVLGHQFLDLVSRUEDLUUR
• 4XDQWLGDGHWRWDOGHORWHVFRPHUFLDLVSRUEDLUUR
• 7RWDOGHiUHDYHUGHSRUEDLUUR
• $VIDOWR FRPSOHWDPHQWHDVIDOWDGRSDUFLDOPHQWHDVIDOWDGRVHPDVIDOWR 
• ,QVWDODomR6DQLWiULD &RPSOHWD6HP 
• ÈJXD +LGU{PHWUR &LVWHUQD &LVWHUQD +LGU{PHWUR 3RoR $UWHVLDQR
6HP 
• (QHUJLD(OpWULFD
• (VJRWR 5HGH3~EOLFD)RVVD6pSWLFD)RVVD1HJUD6HP 

(VFODUHoR TXH HVWRX FLHQWH GD UHVSRQVDELOLGDGH SHOD QmR
GLYXOJDomRGRVGDGRVSDUDRXWURVILQVTXHQmRDFDGrPLFRV´
138

$QH[R &  6ROLFLWDomR GH GRDomR GH GDGRV &OLPiWLFRV DR


0LQLVWpULRGD$JULFXOWXUDHGR$EDVWHFLPHQWR


³6U$ODRU0RDF\U'¶DOODQW{QLD-~QLRU
'LUHWRUGR'LVWULWRGH0HWHRURORJLDHP*RLiV ',60( 
&DUR6U$ODRU
*RVWDULDVHSRVVtYHOFRQWDUQRYDPHQWHFRPVXDJUDWLGmRFRPSUHHQVmRHERD
YRQWDGH QR VHQWLGR GH YLDELOL]DU D GRDomR GRV GDGRV QHFHVViULDV DR SOHQR
GHVHQYROYLPHQWR H ILQDOL]DomR GD GLVVHUWDomR GH 0HVWUDGR GH PHX RULHQWDQGR
*LRYDQQL*RQGLP
*LRYDQQL WrP GHGLFDGR IRUWHPHQWH HP VXD SHVTXLVD TXH WUDWD GR
GHVHQYROYLPHQWRGHXPPRGHORTXHDFUHGLWDPRVVHMDFDSD]GHSUHYHUHQGHPLDVH
HSLGHPLDVGH)HEUH$PDUHODH'HQJXHWHQGRFRPRFHQiULRSDUDHVWXGRGHFDVRD
FLGDGH GH *RLkQLD H TXH VHMD HTXLYDOHQWH RX DWp PHVPR VXSHULRU DRV PRGHORV Mi
H[LVWHQWHVLQFOXVLYHRVXWLOL]DGRVSHOD2UJDQL]DomR0XQGLDOGH6D~GH
Os dados serão utilizados exclusivamente para este projeto de pesquisa e
teremos imenso prazer de citá-los em nossas publicações.“
139

$QH[R'&DOHQGiULRHSLGHPLROyJLFRGHD
Semana Epidemiológica Inicio Fim
S01 20001231 20010106
S02 20010107 20010113
S03 20010114 20010120
S04 20010121 20010127
S05 20010128 20010203
S06 20010204 20010210
S07 20010211 20010217
S08 20010218 20010224
S09 20010225 20010303
S10 20010304 20010310
S11 20010311 20010317
S12 20010318 20010324
S13 20010325 20010331
S14 20010401 20010407
S15 20010408 20010414
S16 20010415 20010421
S17 20010422 20010428
S18 20010429 20010505
S19 20010506 20010512
S20 20010513 20010519
S21 20010520 20010526
S22 20010527 20010602
S23 20010603 20010609
S24 20010610 20010616
S25 20010617 20010623
S26 20010624 20010630
S27 20010701 20010707
S28 20010708 20010714
S29 20010715 20010721
S30 20010722 20010728
S31 20010729 20010804
S32 20010805 20010811
S33 20010812 20010818
S34 20010819 20010825
S35 20010826 20010901
S36 20010902 20010908
S37 20010909 20010915
S38 20010916 20010922
S39 20010923 20010929
S40 20010930 20011006
S41 20011007 20011013
S42 20011014 20011020
S43 20011021 20011027
S44 20011028 20011103
S45 20011104 20011110
S46 20011111 20011117
S47 20011118 20011124
S48 20011125 20011201
S49 20011202 20011208
S50 20011209 20011215
S51 20011216 20011222
140

S52 20011223 20011229


S01 20011230 20020105
S02 20020106 20020112
S03 20020113 20020119
S04 20020120 20020126
S05 20020127 20020202
S06 20020203 20020209
S07 20020210 20020216
S08 20020217 20020223
S09 20020224 20020302
S10 20020303 20020309
S11 20020310 20020316
S12 20020317 20020323
S13 20020324 20020330
S14 20020331 20020406
S15 20020407 20020413
S16 20020414 20020420
S17 20020421 20020427
S18 20020428 20020504
S19 20020505 20020511
S20 20020512 20020518
S21 20020519 20020525
S22 20020526 20020601
S23 20020602 20020608
S24 20020609 20020615
S25 20020616 20020622
S26 20020623 20020629
S27 20020630 20020706
S28 20020707 20020713
S29 20020714 20020720
S30 20020721 20020727
S31 20020728 20020803
S32 20020804 20020810
S33 20020811 20020817
S34 20020818 20020824
S35 20020825 20020831
S36 20020901 20020907
S37 20020908 20020914
S38 20020915 20020921
S39 20020922 20020928
S40 20020929 20021005
S41 20021006 20021012
S42 20021013 20021019
S43 20021020 20021026
S44 20021027 20021102
S45 20021103 20021109
S46 20021110 20021116
S47 20021117 20021123
S48 20021124 20021130
S49 20021201 20021207
S50 20021208 20021214
S51 20021215 20021221
S52 20021222 20021228
S01 20021229 20030104
S02 20030105 20030111
141

S03 20030112 20030118


S04 20030119 20030125
S05 20030126 20030201
S06 20030202 20030208
S07 20030209 20030215
S08 20030216 20020222
S09 20030223 20030301
S10 20030302 20030308
S11 20030309 20030315
S12 20030316 20030322
S13 20030323 20030329
S14 20030330 20030405
S15 20030406 20030412
S16 20030413 20030419
S17 20030420 20030426
S18 20030427 20030503
S19 20030504 20030510
S20 20030511 20030517
S21 20030518 20030524
S22 20030525 20030531
S23 20030601 20030607
S24 20030608 20030614
S25 20030615 20030621
S26 20030622 20030628
S27 20030629 20030705
S28 20030706 20030712
S29 20030713 20030719
S30 20030720 20030726
S31 20030727 20030802
S32 20030803 20030809
S33 20030810 20030816
S34 20030817 20030823
S35 20030824 20030830
S36 20030831 20030906
S37 20030907 20030913
S38 20030914 20030920
S39 20030921 20030927
S40 20030928 20031004
S41 20031005 20031011
S42 20031012 20031018
S43 20031019 20031025
S44 20031026 20031101
S45 20031102 20031108
S46 20031109 20031115
S47 20031116 20031122
S48 20031123 20031129
S49 20031130 20031206
S50 20031207 20031213
S51 20031214 20031220
S52 20031221 20031227
S53 20031228 20040103
S01 20040104 20040110
S02 20040111 20040117
S03 20040118 20040124
S04 20040125 20040131
142

S05 20040201 20040207


S06 20040208 20040214
S07 20040215 20040221
S08 20040222 20040228
S09 20040229 20040306
S10 20040307 20040313
S11 20040314 20040320
S12 20040321 20040327
S13 20040328 20040403
S14 20040404 20040410
S15 20040411 20040417
S16 20040418 20040424
S17 20040425 20040501
143

$QH[R((VFDOD$QHPRPpWULFD%HDXIRUW$GDSWDGD

VENTO
Velocidade equivalente na altura padrão de 10m acima de um
terreno plano e descoberto
No Beaufort Termo Vel. m/seg. Km/h Especificações em terra
Descritivo Med.

0 Clma <1 0 - 0.2 <1 Não se nota o menor deslocamento
nos mais leves objetos. A fumaça
eleva-se verticalmente
1 Aragem 1 -3 0.3 -1.5 1 -5 A direção do vento é indicada pelo
desvio da fumaça mas não pelos
cata-ventos.
2 Brisa leve 4 -6 1.6 - 3.3 6 -11 Sente-se o vento na face; as folhas
das árvores são levemente
agitadas; os cata-ventos comuns
são acionados.
3 Brisa 7 - 10 3.4 -5.4 12 -19 As folhas e os pequenos arbustos
fraca ficam em agitação contínua; as
bandeiras leves começam a se
estender.
4 Brisa 11 - 16 5.5 - 7.9 20 -28 Move-se os pequenos galhos das
moderada árvores, poeira e pedaços de papel
são levantados.
5 Brisa 17 - 21 8.0 - 29 -38 As árvores pequenas com
forte 10.7 folhagem começam a oscular,
aparecem ondas com crista nas
superfície dos rios e lagos.
6 Vento 22 - 27 13.9 - 39-49 Galhos maiores das árvores
fresco 17.1 agitadas; ouve-se os assobios
produzidos pelo vento ao passar
pelos fios telegráficos; torna-se
difícil de usar o guarda-chuva.
7 Vento 28 - 33 17.2 - 50 -61 Os troncos das árvores oscilam;
forte 20.7 torna-se difícil andar contra o
vento.
8 Ventania 34 - 40 20.8 - 62 -74 Geralmente torna-se impossível
24.4 andar contra o vento. Quebram-se
os galhos das árvores.
9 Ventania 41 - 47 24.5 - 75 -88 Ocorrem pequenos danos nas
forte 28.4 edificações (telhas, chaminés são
arrancadas).
10 Tempesta 48 - 55 24.5 - 89 -102 Raro no interior da terra; as árvores
de 28.4 são derrubadas; as edificações
sofrem danos materiais
consideráveis.
144

11 Tempesta 56 - 63 38.5 - 103 - É observado muito raramente;


de 32.6 117 produz grandes destruições.
violenta
12 Furação 64 - 71 32.7- 118 - Poucos danos - as árvores, os
36.9 133 arbustos e os trailers serão
arrastados se não forem amarrados
a algum lugar seguro. Outros tipos
de construção serão atingidas de
forma mais amena. Destruição
parcial ou total de letreiros e
anúncios mal instalados. Seqüência
de ondas com altura de 1 a 1,5 m
acima do normal. Inundação de
ruas e estradas próximas à costa.
Poucos danos em ancoradouros. As
embarcações pequenas têm suas
amarras rompidas.

13 Furação 72 -80 37.0 - 134 - Poucos danos - as árvores, os


41.4 149 arbustos e os trailers serão
arrastados se não forem amarrados
a algum lugar seguro. Outros tipos
de construção serão atingidas de
forma mais amena. Destruição
parcial ou total de letreiros e
anúncios mal instalados. Seqüência
de ondas com altura de 1 a 1,5 m
acima do normal. Inundação de
ruas e estradas próximas à costa.
Poucos danos em ancoradouros. As
embarcações pequenas têm suas
amarras rompidas.

14 Furação 81 - 89 41.5 - 150 - Danos moderados - danos


46.1 166 consideráveis em árvores e
arbustos. Perda total de trailers,
letreiros e anúncios. Destruição
parcial de telhados, portas e
janelas. Poucos danos em
construções. Seqüência de ondas
com altura de 1,8 a 2,4 m acima do
normal. Inundação de ruas e
estradas próximas à costa. As
avenidas que estão em terrenos
baixos são interrompidas de 2 a 4
horas antes da chegada do centro
do furacão. As marinas ficam
inundadas. É obrigatória a retirada
145

dos moradores das áreas costeiras.


15 Furação 90 - 99 46.2 - 167 - Danos moderados - danos
50.9 183 consideráveis em árvores e
arbustos. Perda total de trailers,
letreiros e anúncios. Destruição
parcial de telhados, portas e
janelas. Poucos danos em
construções. Seqüência de ondas
com altura de 1,8 a 2,4 m acima do
normal. Inundação de ruas e
estradas próximas à costa. As
avenidas que estão em terrenos
baixos são interrompidas de 2 a 4
horas antes da chegada do centro
do furacão. As marinas ficam
inundadas. É obrigatória a retirada
dos moradores das áreas costeiras.
16 Furação 100 - 51.0 - 184 - Muitos danos - ramos de árvores
108 56.0 201 são arrancados. Árvores grandes
são derrubadas. Anúncios e
letreiros são arrastados pelo vento.
Danos em telhados, portas e
janelas de casas. Danos na
estrutura de edifícios pequenos.
Trailers são destruídos. Seqüência
de ondas com altura de 2,8 a 3,7m
acima do normal, inundando a área
costeira e destruindo casas
próximas ao litoral. Prédios de
porte são danificados por causa das
ondas. As avenidas de emergência,
que estão em terrenos baixos, são
interrompidas de 3 a 5 horas antes
da chegada do centro do furacão.
Os terrenos que estão a 1,5 m ou
menos acima do nível do mar são
inundados. A água avança cerca de
12 km continente adentro. É
exigida a retirada dos moradores
das áreas costeiras.
17 Furação 109 - 56.1 - 202 - Danos extremos - as árvores são
118 61.2 220 arrastadas pelo vento. Os anúncios
e letreiros são arrancados ou
destruídos. Grandes danos nos
telhados, janelas e portas das casas.
Algumas paredes e tetos de
residências são completamente
destruídos. Trailers são destruídos.
Seqüência de ondas com altura de
146

4 a 5,5 m acima do normal. Os


terrenos que estão a pelo menos 3
m acima do nível do mar são
inundados e a água avança cerca de
9,6 km continente adentro. As
avenidas e estradas de emergência,
escolhidas para a retirada de
moradores, são interrompidas de 3
a 5 horas antes da chegada do
centro do furacão. É obrigatória a
retirada total de todas as pessoas
que morem próximo à costa e que
vivam em terrenos baixos, a uma
distância deNPGRPDU
Fonte: Manual de Observações Meteorológicas - INMET

Fração da abóbada celeste coberta por nuvens

Divisão da Abóbada Celeste Quantidade de Nuvens


0 - Ausência de nuvens 0 Céu claro
1 - oitavo ou menos de céu 1/10 ou menos, mas não zero Parcialmente nublado
coberto mas não zero
2 - oitavos de céu coberto 2/10 - 3/10 Parcialmente nublado
3 - oitavos de céu coberto 4/10 Parcialmente nublado
4 - oitavos de céu coberto 5/10 Nublado
5 - oitavos de céu coberto 6/10 Nublado
6 - oitavos de céu coberto 7/10 - 8/10 Nublado
7 - oitavos de céu coberto 9/10 ou mais, menos 10/10 Nublado
8 - Céu completamente encoberto 10/10 Encoberto
Fonte: Manual de Observações Meteorológicas - INMET

UMIDADE RELATIVA DO AR (URA)


> - 12% Estado de emergência
12 - 20% Estado de alerta
20 - 30% Estado de atenção
30 - 40% Desconfortável
40 - 50% Desconfortável
50 - 60% Confortável
60 - 70% Confortável
70 - 80% Confortável
80 - 90% Muito úmido
90 - 100% Muito úmido
Fonte: Unicamp

UMIDADE RELATIVA DO AR (URA)


> - 12% Árido
12 - 20% Árido
20 - 30% Semi-árido
30 - 40% Subúmido
147

40 - 50% Subúmido
50 - 60% Úmido
60 - 70% Úmido
70 - 80% Úmido
80 - 90% Muito úmido
90 - 100% Muito úmido
Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado

TEMPERATURA MÉDIA DO AR (oC)


-3 – 10 Clima polar
-3 - 18 Clima temperado
18 - 24 Clima tropical/Subtropical
20 - 27 Clima Equatorial
28 - 30 Clima desértico e clima de monções

TEMPERATURA DO AR (oC)
-3 – 0 Climar polar
0–5 Clima temperado/clima polar
5 – 10 Clima temperado
10 – 15 Clima subtropical
15 – 20 Clima tropical
20 – 25 Clima tropical/Equatorial
25 – 30 Clima tropical/Equatorial
30 - 35 Clima tropical/Equatorial
35 – 40 Clima semi-árido
40 – 45 Clima semi-árido/clima desértico
45 - 50 Clima semi-árido/clima desértico
Classificação Climática segundo Köppen (Vianello, R.L & Alves, A. R., 1991) Modificado

AMPLITUDE TÉRMICA DIURNA (oC)


1-3 Clima Equatorial
3–5 Clima Equatorial/
5–7 Clima tropical
7–9 Clima tropical
9 – 11 Clima subtropical/ Clima tropical
11 – 13 Clima subtropical/ Clima tropical
13 – 15 Clima subtropical/ Clima tropical
15 – 17 Clima tropical
17 - 19 Clima tropical/ Clima subtropical
19 – 21 Clima tropical/ Clima subtropical
21 – 23 Clima tropical/Clima temperado
continental
23 – 25 Clima tropical
25 - 27 Clima desértico
27 – 29 Clima desértico
29 – 31 Clima desértico
31 – 33 Clima desértico
148

33 - 35 Clima desértico

Evaporação diária (mm)


0-1 Clima polar
1-5 Clima equatorial/ clima subtropical
5-7 Clima tropical
7-9 Clima tropical
9 - 11 Clima semi-árido/ clima desértico
11 - 13 Clima semi-árido/ clima desértico
13 - 15 Clima semi-árido/ clima desértico
15 - 17 Clima semi-árido/ clima desértico

Grau de intensidade de precipitação


Chuvisco fraco Máx. 0,3mm/h Visibilidade superior a 1.000 metros.
Chuvisco 0,3 - 0,5mm/h Visibilidade entre 500 e 1.000 metros.
moderado
Chuvisco forte 0,5 mm/h Visibilidade inferior a 500 metros.
1,1 - 5mm/h 0,8 mm/10min As gotas de chuvas são bem
destacadas; os pingos nos telhados
Chuva fraca
fracos, poças d’água corrente nas
sarjetas das ruas.
5,1 – 15mm/h 6,0 mm/10min As gotas de chuva identificam-se bem
15 – 25mm/h 6,0 mm/10min e ao encontrarem superfícies duras
25 – 35mm/h 6,0 mm/10min provocam borrifos; o escoamento das
35 – 45mm/h 6,0 mm/10min águas nas calhas dos telhados vai de
Chuva 45 – 60mm/h 6,0 mm/10min um terço a mais da metade de sua
moderada capacidade; a queda das chuvas nos
telhados provoca ruídos assemelhados
a desde um simples chiado até o bater
de tambores.

Chuva forte > 60mm/h 10,0mm/10min A chuva cai torrencialmente e todas as


demais características são mais
acentuadas que as indicadas para
chuva moderada.

Você também pode gostar