Você está na página 1de 4

Uso de Redes Neurais Artificiais Para Diagnstico Etiolgico de AVC Isqumico

Tatiane Wagenfhr Olivette1, Ademir Nied2, Claudio Csar de S3, Alexandre Luiz Longo4
1,2,3 4

Centro de Cincias Tecnolgicas (CCT), Universidade do Estado de Santa Catarina (UDESC), Departamento de Medicina, Universidade da Regio de Joinville (Univille)

Resumo: O AVC , atualmente, um dos maiores causadores de bito no mundo. Um sistema de apoio a deciso que vise facilitar seu diagnstico etiolgico tende a ser um avano em termos de sade pblica. Este trabalho apresenta a implementao de uma Rede Neural Artificial de mltiplas camadas (Multilayer Perceptron) para diagnstico da causa do AVC isqumico, utilizando como base a escala de classificao etiolgica de TOAST. A metodologia adotada ligada ao processo de KDD (Knowledge Discovery from Data) possuindo 5 etapas: seleo de dados, pr-processamento, transformao, minerao de dados e interpretao. A partir de um banco de dados de pacientes da cidade de Joinville-SC, uma Rede Neural Artificial foi treinada utilizando o algoritmo de treinamento backpropagation, atingindo-se a porcentagem de 70% de acerto nos casos avaliados. Neste contexto, este trabalho um passo inicial rumo construo de uma soluo inteligente capaz de auxiliar mdicos no diagnstico da causa de isquemia, sendo necessrios ainda outros estudos para a melhoria da capacidade de generalizao da Rede Neural Artificial visando um aumento no ndice de acertos. Palavras-Chave: Redes Neurais, Minerao de Dados, AVC, Tcnicas de Apoio Deciso. Abstract: Stroke is one of the main causes of death in the world. A decision support system able to help the ethiological diagnosis is prone to be a big advance in terms of public health. This article shows a neural network capable to decide over the cause of an ischemical stroke, using as a base, the TOAST ethiological classification scale. The methodology adopted is bounded to the KDD (Knowledge Discovery from Data) process, composed of 5 steps: data selection, pre-processing, transformations, data mining and interpretation. Using a database of patients from Joinville-SC, an artificial neural network was trained using the backpropagation algorithm, achieving 70% of accuracy over the available cases. In this context, this work is an initial step through the construction of an intelligent solution able to help the doctor on diagnose of stroke cause. Other studies are still necessary to improve the generalization capacity of the artificial neural network aiming a higher accuracy. Key Words: Neural Networks, Data Mining, Stroke, Decision Support Techniques.

Introduo O Acidente Vascular Cerebral (AVC) a segunda causa de bito no mundo e a primeira no Brasil (1). Em termos de patologia, um AVC pode ser Isqumico (85%) ou Hemorrgico (15%) (2). No processo de avaliao dos pacientes vitimados por AVC isqumico, aps a determinao deste subtipo patolgico, fundamental definir-se qual o mecanismo etiolgico da isquemia cerebral, com o objetivo de utilizar a melhor estratgia de tratamento e preveno. Para isto, utilizou-se a Classificao de TOAST (3). O processo de classificao envolve a combinao de dados de anamnese, exames neurolgicos e laboratoriais, dados de Neuroimagem,

Ecocardiograma e Ecografia de Cartidas, tornando este processo complexo e oneroso. O uso de Rede Neural Artificial (RNA) para o diagnstico mdico cada vez mais freqente e podem ser encontrados exemplos em quase todas as reas da medicina. Em (4), os autores utilizam RNA para a classificao de diferentes tipos de cefalia e concluram que esta uma ferramenta de grande valia para o diagnstico mdico. Em (5), duas RNAs foram comparadas para simular o processo de deciso mdica no diagnstico diferencial da doena meningoccica, e comprovaram a viabilidade de uso dessa tcnica para diagnstico. Em (6), os autores compararam RNAs com rvore de classificao para diagnstico de Tuberculose Pulmonar,

obtendo-se o melhor resultado com o uso das RNAs. Neste trabalho, uma RNA treinada com dados de pacientes para, posteriormente, usla num sistema de suporte deciso, capaz de auxiliar a descoberta da causa da isquemia cerebral, e desta forma, otimizar do tratamento. Na prxima seo, a metodologia usada neste trabalho ser explicada. Metodologia Utilizada O banco de dados (BD) utilizado neste trabalho foi fornecido pela Clnica Neurolgica de Joinville, e contm dados de todos os pacientes tratados na cidade de Joinville, entre 2005 e 2007. A maneira como esta pesquisa foi desenvolvida est ligada ao processo de KDD (Knowledge Discovery In Data) (7). Como o nome sugere, o processo de descoberta de conhecimento na forma de padres num BD. Este processo iterativo, e foi repetido diversas vezes at encontrar um resultado satisfatrio. Um intenso trabalho de minerao de dados foi realizado afim de se alcanar um BD capaz de ser utilizado na rede neural. Casos em que no havia certeza do diagnstico, foram removidos. No BD inicial, os casos de AVC isqumico possuam mais de 100 atributos e 1155 registros classificados como segue: Aterotrombtico Possvel, Aterotrombtico Provvel, Lacunar Possvel, Lacunar Provvel, Cardioemblico Possvel, Cardioemblico Provvel, Outra Etiologia Possvel, Outra Etiologia Provvel, Investigao Incompleta, Investigao Negativa. Assim, para o uso deste BD no treinamento de uma RNA, existem muitas classes com alta discrepncia no nmero de registros entre uma classe e outra. Aps a minerao de dados, os valores acima foram reduzidos para apenas 401 registros distribudos de maneira homognea entre 3 classes: Aterotrombtico, Cardioemblico e Lacunar. Essas trs classes englobam tanto os casos classificados como Possveis quanto aqueles classificados como Provveis. Com o auxlio de um especialista na rea de neurologia, muitos dos atributos iniciais do BD tambm foram filtrados de acordo com a necessidade do problema abordado, chegando-se ento a utilizao plena de 30 atributos. Os atributos laboratoriais so 3: Glicemia, Colesterol Total e Creatinina, sendo todos eles dados numricos. A Tabela 1 mostra 11 atributos de Anamnese, seguido de seu contedo.

Atributo IMC Isquemia Prvia Nvel HAS Diabetes Tabagismo Dislipidemia Medicao AntiTrombtica Prob. Cardaco Eletrocardiograma NIH Escala de Bamford

Contedo Numrico Sim, No Numrico Sim, No Sim, No, Ex Sim, No Sim, No Sim, No Sin., F.A., Ausen. Numrico LACS, TACS, PACS e POCS

Tabela 1 Atributos de Anamnese Os outros 16 atributos so de Neuroimagem e so mostrados na Tabela 2. Atributo ACM Dir. ACM Esq. ACA Dir. ACA Esq. ACP Dir. ACP Esq. Watershed Dir. Watershed Esq. ACPI Dir. ACPI Esq. ACS Dir. ACS Esq. TroncoPonte Dir. TroncoPonte Esq. Lacunar Dir. Lacunar Esq . Contedo Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico Numrico

Tabela 2 Atributos de Neuroimagem Cada atributo de Neuroimagem possui duas opes de preenchimento: com leso 1 ou sem leso 0. Para este trabalho, foi escolhida uma RNA do tipo MLP (Multi-Layer Perceptron) e utilizado para treinamento o algoritmo backpropagation (8). Uma caracterstica importante desse algoritmo a retropro-pagao do sinal de sada para a entrada, possibilitando a diminuio do erro de sada a cada poca de treinamento. A ferramenta utilizada foi o minerador de dados WEKA (Waikato Enviroment Knowledge Analysis) (9), que possui, dentre uma srie de algoritmos para todas as tarefas de minerao de dados, uma RNA do tipo MLP implementada. Sua interface de configurao permite modificar: camadas escondidas, taxa

de aprendizagem, decaimento da taxa de aprendizagem, momentum, nmero de pocas (critrio de parada da rede) e valor de inicializao dos pesos. O WEKA no oferece opo para modificar a funo de ativao (sigmide) e a normalizao dos dados (numrica e nominal). A topologia da RNA adotada foi a seguinte: a camada de entrada possui 30 neurnios, correspondentes a quantidade de atributos; uma camada escondida com 2 neurnios, e a camada de sada com 3 neurnios, correspondentes s classes (Aterotrombtico, Cardioemblico e Lacunar). O nmero de pocas foi fixado em 1500 e a taxa de aprendizado foi adquirida iterativamente, considerando os resultados obtidos durante o treinamento da RNA. Por fim, 66% dos casos disponveis foram utilizados para treinamento da rede e o restante para testes. Na seo seguinte so apresentados os resultados obtidos na aplicao da metodologia descrita. Resultados Obtidos Para se chegar na configurao aqui mostrada, vrios testes e anlises foram executados em diversas verses do BD. A Tabela 3 mostra os resultados para a configurao de rede que obteve a taxa de acerto mais alta. A primeira coluna da Tabela 3 representa a Taxa de Aprendizado, a segunda, o nmero de pocas, seguido da taxa de momentum. A penltima coluna representa o nmero de neurnios por camada escondida e a ltima coluna a taxa de acerto. Apr. 0,1 0,1 0,5 pc. 1500 1500 1500 Mom. 0,1 0,07 0,1 C.Esc. 2 2 2 Acerto 70,07 70,07 66,42

Tabela 3 Resultados do treinamento da RNA com trs abordagens principais Aps as modificaes na busca por melhores resultados, a taxa de 70% de acerto, considerada satisfatria, foi atingida. Na prxima seo so apresentadas consideraes sobre a metodologia utilizada e os resultados obtidos. Discusso O fato do BD utilizado neste trabalho ser real, tornou a pesquisa mais interessante do ponto de vista social, porm mais complexa do

ponto de vista tcnico, pois na rotina de um hospital, nem sempre possvel juntar todos os dados pedidos pelo protocolo que deu origem a esse BD. Em virtude disso, a minerao de dados teve as caractersiticas prprias de um trabalho de maior complexidade. Relativo quantidade de neurnios por camada oculta, no existe regra que defina um valor ideal. Como procedimento geral, este valor no deve ultrapassar a quantidade de atributos do problema. Cada problema em que se aplica uma rede neural, a quantidade ideal de neurnios na camada oculta deve ser novamente descoberta. Segundo (8), quanto menor a taxa de aprendizagem escolhida, menor sero as mudanas dos pesos sinpticos de uma iterao para a outra, e mais suave ser a trajetria da funo. A melhora, no entanto, est associada a um aprendizado mais lento. Por outro lado, aumentando-se a taxa de aprendizado, em busca de um aprendizado mais rpido, geram-se bruscas mudanas nos pesos sinpticos que tornam a rede instvel (demasiado oscilatria). Uma soluo para acelerar o aprendizado sem tornar a rede instvel foi adicionar funo de ativao uma constante denominada momentum, definida pelo usurio. Esta constante um nmero positivo entre 0 e 1, sugerindo-se que este nmero seja entre 0 e 0,1, pois valores altos podem tambm desestabilizar a rede. Outro fator a ser analisado a quantidade de pocas a ser utilizada, uma vez que este o critrio de parada do algoritmo, determinado pelo WEKA. Novamente, depara-se com uma questo emprica, pois no h nada que defina a quantidade de pocas ideal. Uma sugesto de abordagem seria arbitrar valores altos, na faixa de 1000, principalmente acompanhado de uma baixa taxa de aprendizagem, ou ento, manter um nmero de pocas em torno de 500, com uma taxa de aprendizagem mais alta. A tendncia o erro por poca variar cada vez menos medida que as pocas passam, sendo ento possvel uma busca mais precisa pelo menor erro. A ferramenta utilizada para este trabalho trouxe uma gama de vantagens e desvantagens. Como foi necessrio um intenso trabalho de minerao, o WEKA mostrou-se verstil e abrangente na parte de pr-processamento, pois foi possvel visualizar as caractersticas de cada atributo e o impacto de cada uma delas nas classes. Ainda como vantagem, a ferramenta mostra uma grande quantidade de algoritmos para minerao e maneiras de visualizar os resultados, assim

como diferentes maneiras de validao. Como principal desvantagem da ferramenta, pode-se apontar a falta de opes de modificao da rede neural. Muitos fatores de modificao importantes, como a normalizao e a funo de ativao, no puderam ser explorados, o que prejudicou o resultado final da pesquisa. Concluses Uma possvel soluo para se conseguir uma taxa de acerto maior, seria utilizar uma outra ferramenta para o treinamento da RNA, capaz de modificar a funo de ativao e ter um controle maior sobre a normalizao, e gerar grficos para visualizao do erro, til para uma busca mais precisa do menor erro e consequentemente, uma taxa de acerto mais alta. Quanto aos resultados obtidos pelo uso da RNA, existem diversos fatores que influenciam na capacidade de generalizao da rede, tais como: topologia da rede, funo de ativao da(s) camada(s) escondida(s) e da camada de sada, inicializao dos pesos, algoritmo de treinamento, taxa de aprendizado, entre outros. Sendo assim, os resultados conseguidos at agora so satisfatrios, mas futuramente pretende-se realizar uma anlise mais elaborada a respeito desses fatores. Ainda como trabalho futuro, uma RNA deve ser capaz de auxiliar no diagnstico de uma gama maior de classes de TOAST. Referncias Bibliogrficas 1. Lessa I. Epidemiologia das doenas cerebrovasculares no Brasil. Revista da Sociedade de Cardiologia do Estado de So Paulo. 1999; 9(4):509-18 2. Cabral NL, Longo AL, Moro CH, Amaral CH, Kiss HC. Epidemiology of cerebrovascular disease in Joinville, Brazil. An institutional study. Arq Neuropsiquiatria. 1997; 55: 357-63. 3. Adams Jr. HP, Bendixen BH, Kappelle LJ, Biller J, Love BB, Gordon DL, Marsh EE 3rd. Classification of subtype of acute ischemic stroke. Definitions for use in a multi-center clinical trial. TOAST. Trial of Org 10172 in Acute Stroke Treatment. Stroke. 1993; 24: 3541. 4. Mendes KB, Steiner MTA. Diagnstico de Dor de Cabea Usando Redes Neurais Artificiais. Revista do Instituto Superior Tupy. 2008; 9: 41-7. 5. Martins LW, Assis JT, Monat AS. Aplicao de Redes Neurais para o Diagnstico Diferencial da Doena Meningoccica. IX

Congresso Brasileiro de Informtica em Sade. 2004. 6. Santos AM, Pereira B de B, Seixas JM de, Mello FC de Q, Kritski A. rvore de Classificao e Redes Neurais Artificiais: Uma Aplicao Predio de Tuberculose Pulmonar. VI Congresso Brasileiro de Redes Neurais. 2003. 7. Fayyad U, Piatetsky-Shapiro G, Smyth P. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM. 1996; 39: 27-34. 8. Haykin S. Redes Neurais: Princpios e Prtica. Bookman Inc. 2004. 9. Witten IH, Frank E. Data Mining: Practical Machine Learning Tools And Techniques. Elsevier Inc. 2005.

Você também pode gostar