Você está na página 1de 10

Árvore de Decisão para Classificação de Ocorrências de

Dengue nos Municípios de Ilhéus e Itabuna


Marcelo Silva Santos1, José Craveiro da Costa Neto1
1Departamento de Ciências Exatas e Tecnológicas – Universidade Estadual de Santa
Cruz (UESC)
Caixa Postal 45 662 900 – Ilhéus – BA – Brasil
marcelossjj@gmail.com, jccneto@uesc.br

Abstract. Data mining is a procedure of knowledge discovery from


great amount of data stored in repositories. This work describes the
development of a classification model utilizing data mining techniques based
on dengue data from Ilhéus and Itabuna cities to help the diagnosis by
healthcare workers. Afterwards, it is described how the problem model was
created and also the classification algorithm used to generate a decision tree.

Resumo. Mineração de dados é um procedimento de descoberta de


conhecimento a partir de grandes quantidades de dados armazenados em
repositórios. Este trabalho descreve o desenvolvimento de um modelo de
classificação utilizando técnicas de mineração de dados baseado nos dados
da dengue dos municípios de Ilhéus e Itabuna para auxílio do diagnóstico
dos gestores de saúde. Posteriormente é descrito como foi criado a
modelagem do problema, descrição do algoritmo de classificação usado para
gerar a árvore de decisão.

1. Introdução
Nestes últimos anos verifica-se a presença de surtos de dengue com impacto marcante
sobre a população da região compreendida pelos municípios de Ilhéus e Itabuna, o clima
tropical é um dos fatores para tais surtos.
O grande número de casos de dengue vêm assustando a população e autoridades
dos municípios. Itabuna tem o segundo maior número de casos de dengue notificados ao
Sistema de Informação de Agravos de Notificação (SINAN) no estado da Bahia cerca
de 12.000 e em Ilhéus cerca de 5.230 pessoas já foram infectados com o vírus da dengue
em 2009 segundo dados da vigilância epidemiológica da Bahia.
Os municípios em questão trabalham com medidas de para o combate à dengue,
mas estas medidas não tem sido satisfatória para a eliminação do mosquito, isso tem
acontecido pela falta de conscientização da população um dos principais agentes que
contribui com a proliferação do mosquito.
Diante dos problemas descritos e a proximidade dos municípios para as
pesquisas, surgiu a motivação por projetar e construir um mecanismo de classificação e
aplicá-lo aos dados recolhidos diante de entrevistas com pacientes e enfermeiros que
trabalham nesta área. Com a descoberta de padrões de comportamento na ocorrência de

1 Trabalho de Iniciação Científica apoiado pela UESC


surtos de dengue, serão oferecidas ao gestor de saúde informações valiosas para a
administração sanitária da população. Com isso conseguiremos proporcionar uma
contribuição social satisfatória aos municípios.
O objetivo do trabalho é construir um sistema de classificação para a descoberta
de padrões de comportamento na ocorrência de dengue nos municípios de Ilhéus e
Itabuna baseado na ficha de Investigação do SINAN. Foi feita a aplicação do algoritmo
de classificação nas instâncias de uma visão do banco de dados. É válido salientar que o
trabalho está na primeira etapa, ainda falta a segunda onde iremos utilizar os dados da
dengue do SINAN dos anos anteriores para gerarmos um sistema de classificação mais
fiel ao problema descrito.
A utilização da mineração de dados tem como objetivo extrair informações
valiosas entre a base de dados criada relativa a dengue através da tarefa de classificação
e da técnica de árvores de decisão.
O sistema de classificação foi criado a partir da classificação da base de dados da
dengue e a utilização da árvore de decisão que consegue gerar regras importantes para
darem auxilio aos gestores de saúde.
O artigo está dividido em seções. A seção 1 argumenta sobre os trabalhos
relacionados, as seções 3 e 4 descrevem os temas estudados que deram subsidio à
realização do trabalho, seção 5 refere-se ao desenvolvimento do projeto até o momento
e o capítulo 6 descreve uma conclusão e os trabalhos futuros.

2. Trabalhos Relacionados
Marinho, Belmar e Batalha [Marinho, Belmar, Batalha 2008] desenvolveram um
trabalho que tinha como objetivo diminuir os custos de exames a partir da criação de um
modelo de classificação apoiada pela mineração de dados, utilizando os dados da
dengue do SINAN.
O desenvolvimento do projeto descrito acima iniciou-se a partir da amostra de
treinamento dos dados coletados do SINAN. Apenas os atributos relativos aos exames e
diagnóstico do paciente utilizou-se para a classificação onde conseguiram gerar uma
árvore de decisão. Os resultados foram julgados não satisfatórios, pois, apesar de
diagnosticar bem os casos de dengue clássica, o trabalho não trouxe um bom retorno de
investimento como o esperado [Marinho, Belmar, Batalha 2008].
O trabalho descrito neste artigo tem um objetivo específico diferente em
comparação com o trabalho apresentado no parágrafo acima. Este trabalho tem como
intuito utilizar o dados da dengue colhidos com objetivo de predizer o diagnóstico da
dengue com a utilização de um sistema de classificação criado onde utilizamos o
algoritmo ID3 para ser gerada uma árvore de decisão com informações importantes
relativas a dengue. No trabalho relacionado eles utilizaram os atributos dos exames e o
atributo do diagnóstico; neste trabalho utilizamos os atributos relativos aos pacientes,
suas características e o atributo do diagnóstico onde conseguimos extrair regras que
serão úteis ao gestores de saúde na realização do diagnóstico.
O foco do trabalho relacionado teve como objetivo principal utilizar um sistema
de classificação para contribuir com despesas que são feitas com exames, este trabalho
tem como objetivo utilizar um sistema de classificação para o diagnóstico da dengue no
intuito de auxiliar os gestores de saúde.
3. Sistema Para Notificação de Casos de Dengue
Segundo [Bensenõr 2007], a dengue é uma doença conhecido no Brasil desde os tempos
de colônia. O mosquito Aedes Aegypti tem origem africana. Esta doença infecciosa
febril aguda é causada por um vírus, sua transmissão é feita pela picada do mosquito
também infectado pelo vírus por ter picado uma pessoa que já estava infectada, a dengue
pode ser apresentada clinicamente de 3 maneiras: dengue clássica, dengue hemorrágica
e síndrome do choque da dengue [Saúde 2001].
O diagnóstico da dengue é feito a partir do registro de sintomas dos pacientes e
exames. Com o número elevado de casos de dengue alguns diagnósticos estão sendo
feitos baseados apenas nos sintomas onde pode causar danos com erros no diagnóstico.
No Brasil a dengue vem se proliferando cada vez mais rápido por fatores
favoráveis ao mosquito, tais como clima, falta de saneamento básico, esgotos a céu
aberto e falta de conscientização da população.
O controle da dengue é feito através dos agentes de combate que visitam as casas
procurando focos de dengue que se encontram na maioria das vezes em caixas d'água,
pneus, garrafas, vasos de plantas, etc. Esses locais são ideais para a proliferação do
mosquito. Para um maior controle criou-se um sistema chamado SINAN para armazenar
informações sobre doenças e disponibilizá-las às autoridades responsáveis pelo seu
combate e prevenção.
O Sistema de Informação de Agravos de Notificação (SINAN) é alimentado
principalmente pela notificação e investigação de casos de doenças e agravos que
constam da lista nacional de doenças de notificação compulsória, mas é facultado a
estados e municípios incluir outros problemas de saúde importantes em sua região
[Sinan 2003]. Sua utilização efetiva permite a realização do diagnóstico dinâmico da
ocorrência de um evento na população, podendo fornecer subsídios para explicações
causais dos agravos de notificação compulsória.
A ficha individual de investigação (FII) é preenchida pelas unidades assistenciais
para cada paciente quando a suspeita da ocorrência de problema de saúde de notificação
compulsória ou de interesse nacional, estadual ou municipal. Este instrumento deve ser
encaminhado aos serviços responsáveis pela informação e/ou vigilância epidemiológica
das secretarias municipais [Sinan 2003].

4. O Processo de Classificação Utilizando Árvores de Decisão


Segundo [Han e Kamber 2006] mineração de dados é o processo de descoberta de
conhecimento interessante em grande quantidades de dados armazenados em bases de
dados, armazéns de dados ou repositórios de outras informações. É a etapa mais
importante do processo de aquisição de conhecimento. A mineração de dados procura
padrões, associações, mudanças, anomalias e estruturas significativas entre os dados e
assim conseguindo informações valiosas em uma base de dados volumosa.
Amo [Amo 2004] informa que uma tarefa de mineração de dados consiste na
especificação do que estamos querendo buscar nos dados, que tipo de regularidades ou
categoria de padrões temos interesse em encontrar, ou que tipo de padrões poderiam nos
surpreender. Nessa forma de trabalho, em geral, busca-se descobrir regras de associação,
agrupamentos e estruturas de classificação.
Classificação ou aprendizado supervisionado é o processo de encontrar um
conjunto de modelos (funções) que descreva classes diferentes de dados com o
propósito de predizer classes e objetos que ainda não foram classificados utilizando o
modelo pré-definido [Silveira 2003].
Amo [Amo 2004] afirma que a técnica de mineração consiste na especificação
de métodos que nos garantam como descobrir os padrões que nos interessam. Dentre as
principais técnicas utilizadas em mineração de dados, temos técnicas estatísticas e
técnicas de aprendizado de máquina. Cada técnica de mineração da suporte a uma
determinada tarefa, as técnicas existentes são: regras de associação, árvores de decisão,
redes neurais, clustering.
Árvores de decisão são estruturas que podem ser utilizadas para darem a
capacidade de aprender com as informações geradas, bem como para tomar decisões. O
aprendizado ocorre na medida que observa suas interações com o mundo e seu processo
interno de tomada de decisões [Pozzer 2006].
Segundo [Han e Kamber 2006], indução de é um aprendizado da árvore de
decisão a partir de tuplas de treinamento rotuladas em classe. Uma árvore de decisão é
uma estrutura de árvore similar a um fluxograma, onde cada nó interno denota um teste
em um atributo, cada galho representa um resultado do teste, e cada nó folha guarda um
rótulo de classe. O nó superior em uma árvore é a raiz.
O algoritmo de classificação para indução de uma árvore de decisão
implementado pela biblioteca Weka o ID3 (Interactive Dichotomiser) um dos mais
utilizados para a construção de árvores de decisão. Este algoritmo segue os passos
ilustrados no Quadro 1.
Quadro 1. Passos do algoritmo ID3

1.Começar com todos os exemplos de treino;


2.Escolher o teste (atributo) que melhor divide os exemplos, ou
seja agrupar exemplos da mesma classe ou exemplos semelhantes;
3.Para o atributo escolhido, criar um nó filho para cada valor
possível do atributo;
4.Para o atributo escolhido, criar um nó filho para cada valor
possível do atributo;
5.Repetir o procedimento para cada filho não "puro". Um filho é
puro quando cada atributo X tem o mesmo valor em todos os
exemplos.

Weka constitui-se de uma biblioteca de programas para mineração de dados


escrito em Java, que tem como objetivo colecionar algoritmos de aprendizagem de
máquina de diferentes abordagens na área da inteligência artificial, para realizarem
tarefas de mineração de dados. Os algoritmos podem ser aplicados diretamente a uma
série de dados ou ser chamados a partir de código Java segundo [Waikato 2008].
A grande questão desta tecnologia é como a árvore pode ser gerada, ou seja,
como escolher as regras mais importantes e quais regras podem ser descartadas da
árvore. Como regra, o ideal é que a árvore tenha as regras mais importantes, ou seja, as
que melhor classificam a entrada. Com isso, espera-se resolver o problema aplicando-se
o menor número de regras.
5. Um Sistema de Classificação para o Controle de Casos de Dengue
Até a presente data, conseguiu-se levantar informações relativas à dengue para a
modelagem do problema. Com as informações levantadas, criou-se um modelo de
classificação para ser utilizado em um algoritmo ID3 com o intuito de construir uma
árvore de decisão.
A partir da árvore de decisão, extraem-se informações valiosas relativas à
dengue que será de grande utilidade aos agentes de saúde para auxiliar no diagnóstico e
na prevenção da dengue.

5.1. Extração de Informações a Respeito da Dengue


O trabalho foi iniciado com a condução de entrevistas junto a pacientes que haviam sido
infectados com o virus da dengue e enfermeiros, permitindo uma melhor compreensão
sobre os problemas da doença e a obtenção de informações relevantes para esta
pesquisa. O uso de formulários para registrar a ocorrência de dengue nos municípios de
Ilhéus e Itabuna foi importante para um melhor entendimento do problema descrito.
Diante de entrevistas com uma enfermeira especializada em casos de dengue,
foram levantadas informações das consultas dos pacientes. Alguns pacientes chegam aos
hospitais cientes que estão infectados com o vírus da dengue por causa do grande
número de casos que vem ocorrendo nesses municípios, os procedimentos que são
tomados em uma consulta se caracteriza na utilização de exames para o diagnóstico e
com isso receitar medicamentos voltado ao sintoma que o paciente esta sentindo, se
necessário, é feita a utilização de soro fisiológico. Pacientes apenas são internados
quando estão com suspeita de dengue hemorrágica ou tem uma idade elevada. Após
todos os procedimentos tomados ocorre o diagnóstico, se necessário levantar os dados
do paciente para a ficha de investigação do SINAN.
No intuito de um entendimento mais aprofundado, foram criados dois
questionários que auxiliaram na coleta de informações dos pacientes e dos enfermeiros.
Para os pacientes criaram-se perguntas como: Quais sintomas você obteve? Quais
remédios foram indicados? Qual o sorotipo da dengue? Qual tipo da dengue? Para os
enfermeiros criaram-se perguntas como: Quais procedimentos são tomados quando uma
pessoa chega com suspeita de dengue? Quais remédios são indicados? Quais exames
são feitos? Como se detecta o sorotipo do paciente e qual tipo de dengue? Com isto,
conseguimos as informações devidas para a modelagem do problema.
Na continuidade do trabalho, buscaram-se informações adicionais junto à
Diretoria da Vigilância Epidemiológica de Ilhéus, onde se percebeu que a ficha de
investigação não traz todas as informações relativas à doença especificada, com isso o
trabalho não conseguiu modelar todas as informações existentes, entretanto boa parte
foi modelada.
A ficha de investigação do SINAN relativa à dengue foi feita para um melhor
controle dos casos de dengue. A ficha baseia-se em campos com informações relativos a
doença que devem ser preenchidos pelos agentes de saúde que foram responsáveis pelos
pacientes, sua divisão é feita em campos relativos aos dados pessoais, dados
laboratoriais e conclusão do caso, casos de dengue com complicações se for o caso,
dados clínicos e informações complementares.
O procedimento de notificação ao SINAN é feito logo após o diagnóstico do
paciente; infelizmente, não são todos os casos de dengue que preenchem a ficha de
investigação, todos os casos são notificados, mas apenas alguns são investigados.
As informações armazenadas no SINAN são de grande importância para uma
melhor compreensão das manifestações da doença. Esta massa de dados colhida vai
permitir que se mantenha uma estrutura de dados que permita fazer um
acompanhamento mais eficaz da doença nos municípios.

5.2. Um modelo de Banco de Dados Baseado na Ficha de investigação do


SINAN
A modelagem do problema iniciou-se a partir das informações colhidas das entrevistas
com pacientes e enfermeiros. A modelagem baseou-se na ficha de investigação do
SINAN onde conseguimos características dos pacientes e da doença.
A criação do modelo-entidade-relacionamento (MER) como ilustra a Figura 1
partiu das informações do mundo real para serem modeladas em um modelo de banco
de dados. A entidade Paciente e Consulta carregam características importantes na
classificação dos dados da dengue, características essas que foram utilizadas na tarefa de
classificação. O modelo lógico foi implementado a partir do modelo conceitual
modificando o nome da entidade Consulta para uma tabela chamada
diagnosticoDengue, no qual gerou o banco de dados com o SGBD PostgreSQL.

Figura 1. Esta figura descreve o modelo conceitual criado baseado no


formulário de investigação do SINAN.

Após a criação do banco de dados, observou-se a necessidade de criar uma visão


para a utilização das instâncias do banco na tarefa de mineração de dados utilizando a
classificação. Criou-se uma visão chamada vDiagnosticoDengue que faz a junção das 2
tabelas mais importantes para a classificação: Paciente e diagnosticoDengue e a seleção
dos atributos: sexo, escolaridade, idade, racacor que informar qual a raça ou cor do
paciente, tipodengue. Durante a criação da visão utilizou-se uma filtragem dos atributos
mais relevantes para o problema descrito. A visão foi criada no intuito de criar um
sistema de classificação baseado nos casos de dengue nos municípios de Ilhéus e
Itabuna
As tabelas Paciente e diagnosticoDengue foram povoadas a partir dos dados
colhidos diante das entrevistas com pacientes que haviam sido infectados com o vírus da
dengue e enfermeiros que trabalham com estes pacientes.

5.3. Sistema de Classificação do Controle da Dengue


No final da seção anterior, foi apresentada a visão que possibilitou a construção de uma
árvore de decisão para que se possa entender melhor o comportamento da dengue. A
visão teve o papel fundamental no processo de classificação com sua listagem dos dados
que seriam utilizados no algoritmo de classificação.
A partir da visão gerou-se um conjunto de dados, onde se definiu uma amostra
de treinamento selecionando 18 tuplas aleatoriamente das 68 listadas pela visão. O
Quadro 2 ilustra a instância obtida pelo processo de amostra de treinamento.
Quadro 2. Instância da visão vDiagnosticoDengue no formato Weka.

@relation dengue

@attribute sexo {m,f}


@attribute escolaridade {analfabeto, ensino fundamental, ensino médio,
ensino superior}
@attribute idade {criança, jovem, adulto}
@attribute racacor {branco, negro, indigena}
@attribute tipodengue {dengue classica, dengue hemorragica}

@data
f,ensino medio,adulto,branco,dengue classica
m,ensino medio,jovem,branco,dengue classica
f,ensino fundamental,jovem,branco,dengue classica
f,ensino fundamental,criança,negro,dengue classica
m,analfabeto,adulto,branco,dengue classica
m,ensino medio,criança,negro,dengue classica
f,ensino superior,jovem,branco,dengue classica
m,analfabeto,jovem,branco,dengue classica
m,ensino fundamental,jovem,branco,dengue classica
f,ensino fundamental,adulto,branco,dengue hemorragica
m,ensino medio,jovem,negro,dengue hemorragica
m,ensino superior,adulto,negro,dengue classica
f,ensino superior,adulto,branco,dengue classica
f,ensino medio,adulto,negro,dengue classica
m,ensino medio,jovem,negro,dengue classica
m,analfabeto,criança,negro,dengue classica
f,ensino medio,jovem,branco,dengue classica
f,ensino fundamental,criança,negro,dengue hemorragica

Os atributos selecionados na visão vDiagnosticoDengue foram classificados


como: sexo (m,f), escolaridade (analfabeto, ensino fundamental, ensino médio, ensino
superior), idade (criança <=15, jovem <=30, idoso >30), racacor (branca, negra,
indígena) e o atributo tipodengue que informa se o paciente tem dengue clássica ou
hemorrágica é o atributo classe para as instâncias. Os atributos selecionados não têm a
finalidade de informar a partir das características dos atributos se o paciente tem dengue
ou não. A utilização das características dos atributos na classificação gerou uma árvore
de decisão contendo informações onde tentaremos predizer se o paciente tem dengue ou
não a partir dessas informações geradas. É válido salientar que os atributos selecionados
não tem o intuito de informar se os pacientes tem dengue ou não.
Após selecionado os dados que seriam utilizados no algoritmo de classificação,
escolhemos uma ferramenta que implementou o algoritmo de indução de árvore de
decisão, que funciona com a entrada de dados de um txt e a utilização do algoritmo já
implementado resulta em uma árvore de decisão em modo texto, desenvolvida por Ciro
Santos [Santos 2009] em seu trabalho de iniciação científica. Para a utilização desta
ferramenta estudou-se o algoritmo implementado e o código fonte do programa,
algoritmo este já ilustrado no Quadro 1.
Ao decorrer do projeto, escolheu-se trabalhar com as funções da biblioteca
Weka, por sua diversidade de algoritmos de mineração implementados. A árvore de
decisão foi gerada a partir do modelo de classificação do Quadro 2; dados foram
inseridos em um arquivo .arff, conforme o formato aceito por Weka, onde se utilizou o
algoritmo ID3, com isso conseguiu-se gerar uma árvore de decisão em modo texto, a
seguir é apresentada a árvore de decisão num modo gráfico, como pode ser visto na
Figura 2.

Figura 2. Está figura ilustra a árvore de decisão gerada com o algoritmo ID3
utilizando as instâncias ilustradas no Quadro 2.

A partir da árvore gerada conseguimos obter resultados importantes sobre os


pacientes que tiveram dengue nos municípios de Ilhéus e Itabuna, como os pacientes
que tem o ensino médio e cor branca está mais apto a ter dengue clássica. Esse tipo de
informação será de grande auxílio aos gestores de saúde quando forem diagnosticar
algum paciente com suspeita de dengue.
5.4. Resultado da Classificação dos Dados
Com os resultados obtidos a partir da árvore de decisão buscou-se identificar as regras
mais importantes; essas regras contém informações que serão úteis à prevenção da
dengue e ao auxilio do diagnostico aos agentes de saúde. Foram caracterizadas regras
importantes aquelas regras que mais se aproximam das informações do problema real.
Utilizamos as instâncias da amostra de treinamento que não foram utilizadas no
algoritmo ID3 para conseguirmos fazer testes básicos para identificarmos as regras que
eram mais relevantes diante do problema apresentado.
Foram concluídas como as mais relevantes: pacientes jovens que tem um ensino
médio e são de cor negra está apto a dengue clássica, pacientes adultos que tem o ensino
fundamental está apto a dengue hemorrágica e pacientes negros do sexo masculino e
ainda são crianças está apto a dengue clássica.
Algumas regras não foram válidas sendo essas: pacientes que são analfabetos
está apto à dengue clássica e pacientes que tem o ensino superior está apto à dengue
clássica. Estas regras não se expandiram na árvore deixando assim pouca informação
para um diagnóstico.
Estão sendo desenvolvido testes para confirmação das informações geradas pela
árvore de decisão, onde ao decorrer do projeto iremos ilustrar dados numéricos das
informações geradas pela árvore de decisão que reflitam as informações do problema
real.

6. Conclusão e Trabalhos Futuros


Foi criada uma árvore de decisão utilizando a biblioteca Weka, por meio do algoritmo
ID3, com o objetivo de efetuar a classificação de características de pacientes infectados
com o vírus da dengue para predizer se um novo paciente tem qual tipo de dengue,
baseando-se na árvore de decisão gerada com os dados de pacientes anteriores.
O modelo gerado tem como função predizer a partir de características de um
paciente se ele está sujeito a qual dengue, entretanto as informações não são 100% no
qual os agentes de saúdes apenas irão buscar um apoio adicional e com isso poder fazer
um diagnóstico mais preciso. É importante salientar que a ferramenta de mineração de
dados não possui o papel do gestor de saúde.
Foi verificado que o modelo consegue diagnosticar boa parte dos casos de
dengue no qual será de extrema importância para os postos de saúde no diagnóstico da
dengue sem precisar que seja feito alguns dos exames.
O objetivo do trabalho trabalho tem sido desenvolvido conforme planejado,
utilizar a classificação nos dados da dengue para extrair informações valiosas que serão
úteis aos postos de saúde para a prevenção da dengue. O trabalho ainda tem como
objetivo até o final do projeto criar um software baseado nas técnicas de mineração de
dados executadas nos dados da dengue para auxílio aos agentes de saúdes dos
municípios.
O trabalho ainda está em desenvolvimento, na segunda etapa do trabalho serão
utilizados os dados do SINAN para conseguirmos um sistema de classificação com
regras mais valiosas e a criação de um software para o auxílio aos gestores de saúde.
Ao decorrer do projeto foram identificadas inúmeros problemas para uma
melhoria na qualidade do projeto. Informações valiosas que não foram inseridas ao
problema seriam de grande importância para um melhor resultado, informações como
por exemplo: as pessoas que estiveram infectados com o vírus da dengue e não foram
aos postos de saúde e assim ingerindo remédios que administravam a si mesmo,
paciente que se diagnostica, sintomas que estes pacientes tiveram, reações de algum dos
remédios ingeridos. Estas informações não são notificadas ao SINAN então esses dados
não poderão ser utilizados no projeto. Um trabalho que englobe todas essas informações
se carateriza em um dos trabalhos futuros que podem trazer um grande benefício à
prevenção desta doença.

Referências
Amo, Sandra de (2004). “Técnicas de Mineração de Dados”, In: Universidade
Federal de Uberlândia, Minas Gerais.
Benseñor, Sabela (2007). “Histórico da dengue no Brasil”,
http://saude.hsw.uol.com.br/dengue1.htm , Acessado em 10/01/2010.
Elmasri, Ramez e Navathe. Shamkant B. (2005). “Sistemas de Banco de Dados”, 4ª ed.,
Pearson Addison Wesley, São Paulo-SP.
Han, Jiawei e Kamber, Micheline (2006). “Data Mining: Concepts and Techniques”, In:
Academic Press, USA.
Marinho, Marcelo e Belmar, Mariana e Batalha, Diego (2008). “Trabalho de Mineração
de Dados”, In: Universidade Federal do Rio de Janeiro, Rio de Janeiro.
Pozzer, Cesar Tadeu (2006). “Aprendizado por Árvores de Decisão”, In: Universidade
Federal de Santa Maria, Rio Grande do Sul.
Santos, Ciro André Freitas dos (2009). “Adaptação de algoritmos para regras de
classificação para trabalharem buscando informações em um banco de dados”, In:
Relatório final de Iniciação Científica, Universidade Estadual de Santa Cruz., Ilhéus
- BA.
Saúde, Ministério (2001). “Dengue - Saiba como se prevenir”,
http://www.cetesb.sp.gov.br/Institucional/dengue/dengue.asp, Acessado em:
10/01/2010.
Silveira, Rosemari de Freitas (2003). “Mineração de Dados Aplicada à Definição de
Índices em Sistemas de Raciocínio Baseado em Casos”, In: Universidade Federal do
Rio Grande do Sul, Porto Alegre.
Sinan (2003). “Sistema de Informação de Agravos de Notificação (SINAN)”,
http://portal.saude.gov.br/portal/saude/visualizar_texto.cfm?idtxt=21383, Acessado
em: 05/02/2010.
Waikato (2008). “Weka 3: Data Mining Software in Java”,
http://www.cs.waikato.ac.nz/ml/Weka/, Acessado em: 18/01/2010.

Você também pode gostar