Você está na página 1de 10

Aplicao de Redes Neurais Artificiais para Reconhecimento de Formas Geomtricas

Ramiro M. Pereira1, Fagner C. Malheiros1, Joo O. de A. Beck, Oleg Khatchatourian2


1

Acadmico do curso de Cincia da Computao


2

Professor do curso de Cincia da Computao

Universidade de Cruz Alta (UNICRUZ) Cruz Alta/RS - Brasil


axdron@hotmail.com, havok300@hotmail.com, joaobeck87@hotmail.com, olegkha@unijui.edu.br

Abstract. Several techniques are applied to digital image processing, one of them is the Prewitt method, a boundary identification method, used in this paper for identification of geometric shapes. To evaluate the efficiency of the method, an Artificial Neural Network (ANN) using the method of Conjugate Gradient of Powell-Beale Restarts was applied for training of six different pattern shapes obtained from the Prewitt method, with the objective to recognize these shapes in an image containing many polygons with sizes ranging from 400 to 10000 pixels, resulting in an analysis of the percentage of correct answers and the most common errors, concluding if the method of boundaries identification is efficient for this application. Keywords: Prewitt, ANN, shape recognition Resumo. Diversas so as tcnicas aplicadas para o processamento de imagens digitais, dentro delas h o mtodo de Prewitt, utilizado nesse artigo para a identificao de formas geomtricas. Para avaliar a eficincia do mtodo, uma Rede Neural Artificial (RNA) fazendo uso do mtodo de Gradiente Conjugado (Beale-Powell Restarts) foi aplicada para treinamento de seis diferentes formas padro, obtidas a partir do mtodo de identificao de contornos, visando um posterior reconhecimento dessas formas em uma imagem contendo diversos polgonos com dimenses entre 400 e 10000 pixels, resultando em uma anlise do percentual de acertos e dos erros mais comuns, concluindo se o mtodo de Prewitt eficiente para essa aplicao. Palavras-chave: Prewitt, RNA, reconhecimento de formas

1. Introduo
Processamento de Imagens Digitais e em particular os mtodos de identificao de contornos tm grande aplicaes em diversas reas como, por exemplo, na engenharia agrcola [Khatchatourian e Padilha 2008], na rea mdica para deteco de bordas em imagens de ressonncia magntica [Sorano, Pereira, et al. 2009], na observao de imagens estereoscpicas florestais [Tejada 2008] e at mesmo pela NASA para

processamento digital de imagens captadas por satlites [Moik 1980]. O objetivo do trabalho apresentado verificar a possibilidade e eficincia de reconhecimento de figuras geomtricas em forma de polgonos regulares aplicando Processamento de imagens digitais, utilizando o mtodo de Prewitt para deteco de bordas de formas geomtricas, e Redes Neurais Artificais (RNA). As RNA so inspiradas no funcionamento dos neurnios biolgicos, onde utiliza seus neurnios artificiais, unidades de processamento que realizam operaes simples e que possuem conexes por onde so transmitidos os seus resultados, para efetuar o processo de treinamento. Esse processo torna a RNA capaz de reconhecer padres, a partir dos estmulos de entrada fornecidos a ela, separando as entradas em classes distintas conforme suas sadas correspondentes [Braga 2005]. A partir da entrada dos padres identificados atravs do mtodo de Prewitt, o treinamento realizado e as sadas so classificadas, processo esse que ser observado no decorrer do artigo.

2. Identificao das formas


Como possvel observar na figura 1, a figura original que contm os padres a serem identificados possui seis formas geomtricas distintas (quadrado, crculo, tringulo, estrela, pentgono e hexgono), como 5 dimenses cada uma. As dimenses das formas varia entre 100x100 pixels e 20x20 pixels, dessa forma, as imagens a serem reconhecidas posteriormente tambm se encontraro entre esse tamanho. Foram utilizadas cores diferentes nas figuras para observar se encontrada alguma dificuldade no reconhecimento das mesmas pelo MATLAB r2009b, sendo essa a ferramenta utilizada para realizar o trabalho.

Figura 1. Figura original com os padres

Como o mtodo de Prewitt reconhece as bordas atravs da observao da variao das tonalidades na imagem [Mathworks 2011], todas as formas so convertidas para tons de cinza, como observado na figura 2, dessa maneira j observando se a ferramenta foi capaz de identificar todas as 30 formas.

Figura 2. Figura em tons de cinza

Realizada a segunda etapa, iniciada a deteco dos contornos pelo mtodo de Prewitt, apresentada na figura 3. Como perceptvel, h alguns fatores a serem considerados pela observao da figura. O primeiro que nas figuras como os quadrados, os cantos ficaram abertos, assim como nos tringulos o que pode resultar em problemas mais adiante. O segundo que, nas figuras pequenas, as de dimenses 20x20 houve uma distoro muito grande em praticamente todas as formas, com exceo ao tringulo.

Figura 3. Aplicao do mtodo Prewitt

Para tentar solucionar os problemas identificados, os contornos foram dilatados, conforme observado na figura 4, eliminando o primeiro problema, pois todas as formas passam a possuir contorno contnuo e amenizando o segundo problema, melhorando as formas menores.

Figura 4. Dilatao dos contornos

Para ser efetuado o treinamento, as imagens precisam ser processadas e convertidas em matrizes numricas. Visando um melhor mapeamento das formas para essa converso, os contornos contnuos so preenchidos, como observados na figura 5. importante ressaltar que as formas sero extradas da imagem a partir da maior dimenso, ento, no caso das formas inferiores a 100x100 pixels, haver espaos sem serem preenchidos, assim como no caso do crculo, so contados os 100 pixels do dimetro, fazendo com que os cantos venham a ser campos nulos na matriz enquanto o centro possuir valor que representa seu preenchimento. O mesmo ir ocorrer com todas as outras figuras.

Figura 5. Preenchimento dos contornos

Uma vez que as formas de contorno contnuo foram preenchidas, as que no so inteiras e possuem contorno descontnuo devem ser eliminadas para no se tornarem rudo nos dados, o que prejudicaria o treinamento. No caso das formas trabalhadas, nenhuma ser eliminada pelo fato de ter sido efetuada a dilatao dos contornos, observado anteriormente na figura 4, que tornou todas as formas inteiras.

Para finalizar o processamento das imagens, as formas foram identificadas com um nmero, para dar uma melhor orientao durante o uso da RNA, como observado na figura 6, onde tambm foi definido um contorno em cor verde apenas para visualizao, no sendo atribudo a forma original, pois tambm poderia se tornar rudo. Tambm importante observar que nessa etapa, figuras inferiores a 400 pixels (ou, no caso, com dimenses abaixo de 20x20) seriam descartadas.

Figura 6. Imagem processada e com formas identificadas.

3. Treinamento da RNA
Processada a imagem, dado inicio a etapa de treinamento, utilizando RNA, sendo observada na figura 7, que apresenta a ferramenta de treinamentos disponibilizada pelo MATLAB. Nela possvel observar o tempo necessrio para a execuo (7 minutos e 51 segundos), o nmero de iteraes (924), que o objetivo do desempenho foi alcanado, o que significa que a RNA foi treinada com sucesso, foi capaz de identificar padres e est apta a classificar novas entradas. Outros fatores relevantes tambm so apresentados na ferramenta, como o mtodo utilizado para treinamento e a estrutura da RNA. Quanto estrutura, foi utilizada uma RNA com duas camadas, a primeira com 25 neurnios e a segunda com seis neurnios (o mesmo nmero de formas a serem identificadas, j que seria a camada de sada). Quanto ao mtodo de treinamento, foi utilizado o mtodo de Gradiente Conjugado (Beale-Powell Restarts). Para todos os algoritmos de gradiente conjugado, a direo da busca dos padres tem seu gradiente reiniciado com valor negativo, o que ocorre para evitar que a RNA insista na mesma soluo sem obter um resultado satisfatrio, e ocorre quando o nmero de iteraes se equivale a pesos determinados nos parmetros da rede. Powell props um mtodo baseado em uma idia de Beale onde o valor do gradiente reiniciado toda vez que encontrada uma pequena ortogonalidade entre o gradiente atual e o anterior, o que resultou no algoritmo de Beale-Powell Restarts [Mathworks 2011].

Como observado na figura 7 que o treinamento foi um sucesso utilizando o mtodo de Beale-Powell, o que significa que a RNA est pronta e j pode ser aplicada para identificar novas formas.

Figura 7. Treinamento da RNA.

4. Identificao de formas
Para a identificao de formas, foi construda uma nova imagem, utilizando formas similares s contidas nos padres, com dimenses diferentes, mas compreendidas entre 400 e 10000 pixels, tendo o cuidado para no construir elipsides, retngulos ou formas diferentes das que foram treinadas. Na nova imagem, observada na figura 8, foram desenhadas 61 novas formas, com colorao diversa, distribuio e tamanhos aleatrios, buscando obter uma grande variao de tamanho entre formas de um mesmo polgono assim como tamanhos muito parecidos entre formas similares (como por exemplo, hexgonos e crculos pequenos). Essa imagem foi processada da mesma maneira que a imagem utilizada para reconhecer as formas usadas como padres.

Figura 8. Formas a serem identificadas

A figura 9 j trs as figuras numeradas e processadas. interessante observar que foram numeradas somente 58 figuras, o que indica que trs figuras foram descartadas por serem inferiores aos 400 pixels exigidos. Entretanto, durante a criao das imagens, foi tomado o cuidado para que as formas no ficassem abaixo desse valor, com exceo de uma forma criada propositalmente para ser eliminada. A eliminao das outras duas formas ocorreu pelo fato de se encontrarem no limite aceito (dimenses 20x20), ento, qualquer deformao que ocorresse durante a identificao dos contornos podia resultar na excluso da forma da imagem original. Como j era considerada essa possibilidade, o estudo prossegue com a prxima etapa, a identificao das formas a partir dos padres treinados pela RNA.

Figura 9. Formas enumeradas

O processo de identificao da RNA apresentou como sada 58 figuras, sendo dessas: 13 quadrados, 8 crculos, 11 tringulos, 6 estrelas, 9 pentgonos e 11 hexgonos. Para entender melhor o resultado, possvel analisar a tabela 1, onde na primeira coluna apresentada a numerao do processamento da forma, na segunda apresentado o que era a figura de fato, representada pela letra inicial da mesma, e na terceira coluna demonstrado o resultado da identificao, seguindo a mesma lgica da letra inicial, e assim sucessivamente.
Tabela 1. Formas identificadas.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

P H T E C C Q H E C P T Q P T

C H T C C C Q H E C P T Q P T

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

Q Q H P P P C E H P H C Q C P

Q Q Q P C P H E H P H C Q H P

31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

T T H Q E Q E T P T H T C E H

T C Q Q T Q T T P T H T H E Q

46 47 48 49 50 51 52 53 54 55 56 57 58

Q P Q C Q H E E H P T T E

Q P Q H Q H E E H P T T E

A partir da anlise da tabela 1, foi obtida a tabela 2, onde na primeira coluna esto as formas e o total, na segunda coluna o nmero de formas real e na terceira coluna, o que foi identificado corretamente pela RNA.

Tabela 2. Formas identificadas.

Quadrados Crculos Tringulos Estrelas Pentgonos Hexgonos Total

10 8 10 9 11 10 58

10 4 9 6 9 7 45

De 58 formas, 45 foram identificadas corretamente, sendo os erros: quatro crculos identificados com hexgonos, um tringulo identificado como crculo, uma estrela reconhecida como crculo e outras duas estrelas como tringulos, 2 pentgonos

reconhecidos como crculos e por fim, 3 hexgonos reconhecidos como quadrados, resultando num percentual de acertos de 77,58%.

7. Concluses
Como mencionado na seo 2, durante a identificao dos padres, mais precisamente durante o uso do mtodo de Prewitt, ocorreu uma distoro muito grande nas formas menores, ento j era esperado um alto ndice de erro em figuras com dimenses reduzidas, o que acabou pesando na taxa de erros global. Uma taxa de erros de 22,42% pode ser considerada elevada para uma tarefa simples, entretanto metade desses erros ocorreu em imagens com menos de 50x50 pixels, logo, espera-se, que se repetido o estudo utilizando imagens com maiores dimenses, a taxa de erros diminua consideravelmente. Ainda deve ser considerado que foram escolhidas formas similares justamente com a inteno de elevar a taxa de erros, sendo essa uma maneira de colocar tanto o mtodo de deteco de contornos quanto de RNA para serem testados em condies ruins, e o fato de que a grande maioria dos erros foi caracterizada por uma confuso com imagens semelhantes, indica que, provavelmente, as falhas ocorreram devido a identificao dos contornos com defeito, gerando rudo nos dados para o treinamento. Por fim, os resultados obtidos foram abaixo dos desejados, porm dentro do esperado e da margem aceitvel, mas seria interessante o mesmo estudo ser feito com outro mtodo de identificao de contornos diferente e/ou com formas maiores para confirmar a concluso obtida nesse estudo.

Referncias
Braga, Luis Paulo Vieira (2005). Introduo a Minerao de Dados. Rio de Janeiro: EPapers. Khatchatourian, Oleg; Padilha, Fbio R. R.(2008). Reconhecimento de variedades de soja por meio do processamento de imagens digitais usando redes neurais artificiais. Eng. Agrc., Jaboticabal, v. 28, n. 4, Dez. Moik, Johannes G. (1980). Digital Processing of Remotely Sense Images. U.S. Government Printing Office, Washington DC, Estados Unidos da Amrica. Mathworks (2011). MATLAB http://www.mathworks.com/help/techdoc/. Abril. Documentation,

Sorano, Lucas; Pereira, Aledir S.; Marranghello, Norian; Arajo, Alex F.; Catelam, Tiago Tafari; Tavares, Joo Manuel R.S.; Nascimento, Acsio J. do. (2009) Deteco de bordas em imagens de Ressonncia Magntica por meio de Processamento de Imagens com Algoritmos Genticos. 30 CILAMCE IberianLatin-American Congresso on Computational Methods in Engineering. Armao de Bzios, RJ, Brasil. 8 a 9 de Novembro.

Tejada, Carlos Zafra Fernndez de (2008). Anlisis de Mtodos de Procesamiento de Imgenes Estereoscpicas Forestales. Mestrado em investigao em informtica. Departamento de Ingeniera Del Software e Inteligencia Artifical Facultad de Informtica- Universidad Complutense Madrid, Espanha.

Você também pode gostar