Você está na página 1de 8

Reconhecimento de Caracteres Numricos para Converso em Braille Utilizando Redes Neurais Artificiais

Thiago Ribas da Silva Departamento de Cincia da Computao (DECOMP) Universidade Estadual do Centro Oeste do Paran (UNICENTRO) Guarapuava, PR Brasil
xthiagoribasx@gmail.com

Abstract. A recognition characters tool for conversion into Braille based on the use of neural networks, has the ability to receive as input a digital image, and in possession of it, maps the corresponding output. The paper proposes a numerical digital image converter for a system Braille using neural networks for classification numbers. Keywords: Braille, Artificial Neural Network, Character recognition.

Resumo. Uma ferramenta de reconhecimento de caracteres para converso em Braille baseado na utilizao de redes neurais, tem a capacidade de receber como entrada uma imagem digital e, de posse disso, mapeia a sada correspondente. O trabalho prope um conversor de imagens numricas digitais para o sistema Braille utilizando redes neurais para classificao dos nmeros. Palavras-chave: Braille, Rede Neural Artificial, Reconhecimento de caracteres.

1. Introduo
Cerca de 14,4% da populao brasileira apresenta alguma deficincia, onde desta taxa, 48,1% so deficientes visuais (IBGE, 2000) que ao decorrer de sua vida vai se sentindo excludo da sociedade. Apesar de o governo garantir o direito de incluso destes indivduos pela Lei Federal n7.853, principalmente no mbito educacional, percebe-se

que pouco se faz para que essa lei funcione como foi proposta(Melo, 2011). A cegueira uma alterao grave ou total de uma ou mais das funes elementares da viso que afeta de modo irremedivel a capacidade de perceber cor, tamanho, distncia, forma, posio ou movimento em um campo mais ou menos abrangente (Dias et. al., 2007 ). O deficiente visual pode utilizar de auxlios pticos ou no pticos, como o sistema Braille. O sistema Braille um modelo lgico de leitura com o tato criado por Louis Braille que tem se adaptado a todas as lnguas, tornando a palavra escrita disponvel a milhes de deficientes visuais. Devido combinao metdica de seis pontos que se agrupam em duas fileiras verticais, justaposta de trs pontos cada, no mximo (Melo, 2011) Redes Neurais Artificiais (RNA) so tcnicas computacionais de inteligncia artificial que apresentam um modelo matemtico baseado em neurnios biolgicos que adquirem conhecimento atravs da experincia, tendo como aplicao a classificao de dados complexos ou o reconhecimento de determinados padres. Atravs da aprendizagem da rede neural supervisionada, onde a informao de qual a sada desejada para cada padro apresentado na entrada, consegue-se fazer o reconhecimento do padro (Isabel, 2000). Os algoritmos de Aprendizado Supervisionado mais conhecidos so a regra delta ou a correo de erros e a sua generalizao para redes de mltiplas camadas, o algoritmo back-propagation (Rumelhart et. al., 1986). Optical Character Recognition(OCR) uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem. Atravs do OCR possvel digitalizar uma folha de texto impresso e obter um arquivo de texto editvel. O objetivo do trabalho foi desenvolver uma ferramenta que reconhece caracteres adquiridos atravs de uma imagem e converte-os em Braille, onde foi utilizado uma RNA supervisionada e algoritmo de pr-processamento de imagem.

2. Desenvolvimento
Este trabalho prope a criao de uma ferramenta de reconhecimento de caracteres para converso em Braille utilizando o aprendizado oferecido pela RNA. Para isso o sistema foi dividido em componentes, so eles: pr-processamento, dividido em duas fases, e

classificao. 2.1. Tcnicas Utilizadas O processamento de imagens trabalha com a imagem digital, capturada atravs de um scanner ou desenvolvida em um simples editor grfico, onde esta imagem definida como uma matriz de M x N elementos, denominados pixels.

Figura 1: Pr-processamento da imagem

2.1.1.

Pr-processamento

O pr-processamento da imagem realiza algumas alteraes: Ajuste de escala, ajuste da posio, converso para escala de cinza, binarizao e converso para matriz de bits. Para realizar essas tarefas foram utilizadas as biblioteca de cdigo aberto OpenCV e SimpleCV.

Na primeira fase do pr-processamento so realizados os ajustes de escala e posio a partir de imagens armazenadas em um banco e posteriormente por imagens inseridas por um usurio. Assim como nova altura e largura a imagem redimensionada como resultado do pr-processamento. Processo demonstrado na figura 1.

A segunda fase definida pelo processo de converso para escalas de cinza, binarizao e converso para matriz de bits. O algoritmo de binarizao calcula um valor de limiar da imagem (com escalas de cinza) e compara esse valor com os valores dos pixels da imagem, transformando em branco os valores maiores que o limiar e, em preto, os valores menores. Processo demonstrado na figura 2.

Figura 2: Processamento de binarizao da imagem

2.1.2.

Classificao

Na implementao da RNA, foi utilizado a biblioteca de cdigo aberto para redes neurais

Fast Artificial Neural Network (FANN), a qual implementa uma RNA multicamada na
linguagem C, oferecendo um bom desempenho e flexibilidade para o treinamento e execuo. A rede neural utilizada no sistema possui as seguintes caractersticas:

Multicamada: o fato de este modelo ter mltiplas camadas permite que uma maior

variedade de padres seja aprendida, dada a maior capacidade de separao de classes de padres. As camadas so divididas em: entrada, oculta e sada.
Retropropagao: O algoritmo de aprendizado utilizado foi o da retropropagao de

erros (backpropagation), onde o sinal propagado em uma direo e os pesos so reajustados em ordem reversa.
Funo de ativao simtrica: em todas as camadas a funo de ativao utilizada

a tangente hiperblica, sendo esta simtrica e limitada com valores de sada entre -1 e 1.
Totalmente conectada: todos os neurnios de uma camada anterior possuem uma

conexo com cada neurnio da prxima camada.

Os padres de entrada da RNA so constitudos por 16834 valores, que a quantidade de pixels da image treinada/testada na RNA. A sada composta por 10 valores, a seleo da sada ativa de entre os valores da RNA realizada determinando qual a sada que toma o valor mximo, ativando um dos 10 comandos, por exemplo, o primeiro comando seria a sequncia: 1, -1, -1, -1, -1; o segundo -1, 1, -1, -1, -1; e assim por diante.

3. Resultados
Na figura 3 apresentam-se algumas das imagens dos conjuntos de treinamento e teste utilizados pela RNA implementada. A base utilizada composta por 1000 imagens manuscritas, sendo 100 imagens de cada nmero, todas com a mesma dimenso de 128x128 bits.

Figura 3: Imagens da base

Aps o tratamento das imagens com as bibliotecas OpenCV e SimpleCV, so colocadas juntamente com as sadas, tornando-as padres de treinamento. O sistema classificador poder reconhecer corretamente bem como incorretamente os caracteres, podendo falhar no reconhecimento do padro. Os padres, totalizando 1000 foram primeiramente embaralhados e em seguida divididos em 5 arquivos, contendo 200 padres cada. Para o treinamento utilizou-se 4 arquivos e 1 para testes. Na tabela 1 mostrado os parmetros utilizados para o treinamento da RNA.

Tabela 1: Parmetros utilizados no treinamento

Todas as combinaes foram testadas para os parmetros utilizados e foram

realizados 5 treinamentos com cada configurao possvel. Foi considerada uma poca o treinamento com 4 dos 5 arquivos da base, o ltimo arquivo foi utilizado para testar e, a cada poca, o teste era realizado e armazenado seu erro. Na tabela 2 mostrado as melhores configuraes e os menores erros no treinamento.

Tabela 2: Melhores configuraes

Observou-se que na realizao dos treinamentos, algumas configuraes mostraram menor mdia dos testes, mas muita oscilao entre as pocas dos treinamentos, o que mostrou dificuldade pra classificao do padro pela RNA. A configurao escolhida foi a que teve menos oscilaes entre pocas do treinamento e uma mdia de teste baixa.

4. Concluso
Atravs da utilizao de Redes Neurais Artificiais (RNA) com um algoritmo multicamada backpropagation e bibliotecas para tratamento da imagem, podemos adquirir o reconhecimento eficaz de caracteres, com rapidez e segurana comparvel a sensibilidade humana. O objetivo do trabalho foi desenvolver uma ferramenta para identificao de caracteres a partir de uma imagem e converte-los em Braille. importante ressaltar que com base na proposta apresentada neste trabalho os resultados obtidos foram satisfatrios, onde mostrou viabilidade da utilizao das redes neurais artificiais na tarefa de classificao de numerais em imagens, tambm apresentaram timos resultados tanto na etapa de pr-processamento, quanto na etapa de classificao alcanando taxas de acerto muito alta (90%). Para trabalho futuros, seria possvel incrementar o sistema, aumentado o nmero de padres utilizados e tambm inserindo outros padres, como letras do alfabeto. Assim o sistema seria capaz de classificar uma diversidade maior de caracteres contidos em uma imagem digital.

5. Referncias
IBGE. Braslia: Instituto Brasileiro de Geografia e Estatstica. Apresenta notcias referentes populao brasileira e informaes sobre o Censo 2000. Disponvel em: <http://www.ibge.gov.br > Acesso em 19 de Novembro, 2011. MELO, Jssica C. Timofiecsvk, Reconhecimento tico de Caracteres Brailles, 2011. DIAS, Elizabet de S, MARIA, Izilda de Campos, BEATRIZ, Myriam Campolina Silva, Formao Continuada a Distncia de Professores para o Atendimento Educacional Especializado., 2007 ISABEL, Maria de Almeida Milho, Redes Neurais e Reconhecimento de Caracteres, 2000. D. E. Rumelhart, G. E. Hinton, and R. J. Williams. Learning Representations by Backpropagation Error. Nature, 323:533-536, 1986.