Escolar Documentos
Profissional Documentos
Cultura Documentos
Identificação de Paciente Com Tecido Mamário Cancerígino Utilizando Redes Neurais Artificias PDF
Identificação de Paciente Com Tecido Mamário Cancerígino Utilizando Redes Neurais Artificias PDF
FACULDADE DE TECNOLOGIA
MANAUS
2013
2
FACULDADE DE TECNOLOGIA
MANAUS
2013
3
RESUMO
LISTA DE FIGURAS
Figura 3-Relao da variao do erro mdio quadrtico com o nmero de pocas arquitetura
10-10-1. .................................................................................................................................... 18
Figura 6- Relao da variao do erro mdio quadrtico com o nmero de pocas Arquitetura
10-8-1. ...................................................................................................................................... 21
Figura 8- Exemplos de Curvas ROC com valores de reana faixa entre 0,5 e 0,95. (COSTA
FILHO, 1996) ........................................................................................................................... 23
LISTA DE TABELAS
SUMRIO
1 INTRODUO ................................................................................................................. 7
2 MATERIAIS .................................................................................................................... 10
3 METODOLOGIA ........................................................................................................... 13
4 RESULTADOS ................................................................................................................ 24
1 INTRODUO
Simara V. da Rocha et al (2000) O cncer de mama tem se tornado cada dia mais
frequente entre a populao feminina acima dos 40 anos. Somente para o ano de 2011 foram
estimados, no Brasil, 49 mil novos casos. Uma das maneiras para detectar os tumores no
palpveis que causam cncer de mama realizar uma radiografia (mamografia) das mamas. A
mamografia atualmente a melhor tcnica de deteco precoce de leses no apalpveis na
mama com altas chances de ser um cncer curvel. Sabe-se que as chances de cura do cncer
de mama so relativamente altas, se detectado nos estgios inicias.
Cada rede foi treinada com o banco de dados de Wisconsin contendo 9 caractersticas
e somando 683 padres de entrada , 239 malignos e 444 benignos. A rede MLPNN possuiu a
seguinte arquitetura:
Nmero de entradas 9;
Nmero de neurnios na primeira camada oculta 15;
Nmero de neurnios na segunda camada oculta 15;
Nmero de Neurnios de camada de sada - 2.
8
Nas camadas ocultas e de sada, a funo de ativao utilizada foi a sigmide cujo
range est entre 0 e 1, introduzindo importantes propriedades . A primeira, a sigmide no
linear permitindo que a rede faa mapeamentos complexos de entrada para espaos de sada
vetoriais, segundo contnua e diferencivel, o que permite que o gradiente do erro seja
utilizado na atualizao dos pesos. O algoritmo de Levenberg-Marquardt foi utilizado para o
treinamento da rede MLPNN.
Nmero de entradas 9;
Nmero de neurnios na camada oculta 8;
Nmero de Neurnios de camada de sada - 1.
Nas camadas ocultas e de sada, a funo de ativao utilizada foi a sigmide e como
critrios de convergncia utilizaram-se erro mdio quadrtico 0.01 e 2000 pocas.
Na etapa final sero apresentados os resultados atravs da matriz de confuso, que nos
mostrar a acurcia de classificao alm de outras anlises como a sensibilidade e a
especificidade, a anlise dos resultados, concluso e trabalhos futuros.
10
2 MATERIAIS
conjunto de 569 amostras relativo a 10 caractersticas dos ncleos de clulas mamrias sendo
calculado: o valor mdio, erro padro, mdia de trs maiores valores. O mtodo de extrao
de caractersticas pode ser melhor entendido no artigo publicado pelos criadores Wolberg,
Street e Mangasarian,1993.
Do conjunto de dados, 212 so pacientes com tecido mamrio com cncer e 357
pacientes sem cncer. As seguintes caractersticas do ncleo celular, totalizando 10, constam
nesse banco de dados: raio, permetro, rea, compacidade, suavidade, concavidade, pontos
cncavos, simetria, dimenso fractal, textura. A seguir define-se cada uma dessas
caractersticas.
Raio
linhas radiais definida pelo centro de gravidade do contorno e o pontos indivduas do mesmo.
Permetro
rea
Compacidade
Suavidade
Concavidade
quanto o contorno do ncleo cai dentro de cada corda. Este caracterstica afetada pelo
comprimento destas cordas, com cordas menores captura-se melhor as pequenas concavidades
(Wolberg, 1994).
Pontos cncavos
do contorno.
12
Simetria
de comprimento entre as linhas perpendicular ao eixo maior para o limite nuclear em ambas
as direes.
Dimenso fractal
Textura
3 METODOLOGIA
Alm do mais o teorema da Aproximao Universal afirma que uma nica camada
intermediria suficiente para um perceptron de mltiplas camadas (MLP) realizarem uma
aproximao efetiva de um conjunto de treinamento representada pelo conjunto de entradas e
o alvo. (Haykin, 2001).
Em relao s funes de ativao cada neurnio pode ter a sua prpria funo de
ativao, diferente de todos os outros neurnios. Contudo, para simplificar o projeto da rede
comum adotar a mesma para todos os neurnios.
A funo newff inicializa as sinapses da rede. Ela utiliza como padro para camadas
de neurnios tansig a funo initnw para realizar a inicializao. Esta funo baseada na
tcnica de Nguyen e Widrow e gera valores iniciais para as sinapses de uma determinada
camada de tal modelo que as regies ativas dos neurnios da camada sejam distribudas
uniformemente pelo espao de entrada. Esse mtodo tem vrias vantagens sobre a
inicializao puramente aleatria dos pesos: (1) poucos neurnios so desperdiados
(subutilizados), j que as regies ativas de todos os neurnios esto no espao de entrada, (2)
o treinamento ocorre mais rpido (pois cada rea do espao de entrada possui regies ativas
de neurnios).
Haykin (2001) descreve que no existem critrios de parada bem formalizados para o
algoritmo backpropagation, mas sim, critrios de parada razoveis do ponto de vista prtico e
que so normalmente empregados.
Arquitetura 10-10-1
17
Figura 3-Relao da variao do erro mdio quadrtico com o nmero de pocas arquitetura 10-10-1.
19
Arquitetura 10-8-1
Figura 6- Relao da variao do erro mdio quadrtico com o nmero de pocas Arquitetura 10-8-1.
VP
S
VP FN
VN
E
FP VN
VN VP
Ac
VP FP VN FN
das abscissas (vide Figura 1). A partir de pares (Sensibilidade, 1 - Especificidade) obtidos
com valores de corte diferentes, tm-se a curva ROC.
Figura 8- Exemplos de Curvas ROC com valores de rea na faixa entre 0,5 e 0,95. (COSTA FILHO, 1996)
24
4 RESULTADOS
Arquitetura 10-10-1
Confusion Matrix
98 13 88.3%
0
34.5% 4.6% 11.7%
Output Class
8 165 95.4%
1
2.8% 58.1% 4.6%
0 1
Target Class
ROC
1
0.9
0.8
0.7
0.6
True Positive Rate
0.5
0.4
0.3
0.2
0.1
0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
False Positive Rate
Arquitetura 10-8-1
Confusion Matrix
99 13 88.4%
0
34.9% 4.6% 11.6%
Output Class
7 165 95.9%
1
2.5% 58.1% 4.1%
0 1
Target Class
ROC
1
0.9
0.8
0.7
True Positive Rate
0.6
0.5
0.4
0.3
0.2
0.1
0
0 0.2 0.4 0.6 0.8 1
False Positive Rate
Uma forma de analisar os resultados obtidos seria comparar nosso estudo com outros
estudos da literatura, referente ao mesmo objetivo.
Portanto como mostrado na Tabela 3, a acurcia deste trabalho est melhor que o
estudo de Ubeli, 2007 e prximo ao estudo de Cedeo, 2011.
29
Neste estudo, uma Rede Neural Artificial foi apresentada para classificao de cncer
de mama baseado em MultilayerPerceptron (MLP) com retropropagao do erro
(Backpropagation). O estudo mostrou-se ter um bom desempenho, obtendo como melhor
resultado uma acurcia de 93%.
Portanto o sistema atendeu seu objetivo inicial, podendo ser utilizado no auxlio do
diagnstico de cncer de mama.
Para futuros trabalhos podemos propor melhoria da preciso da classificao por uso
de diferentes arquiteturas e algoritmos de treinamento, como por exemplo, utilizando 70% dos
dados para treinamento, uma vez que usamos 50%.
30
REFERNCIAS BIBLIOGRFICAS