Você está na página 1de 12

Profundo IX Encontro de Engenharia de Produo da UFRJ .

Redes neurais artificiais: conceitos e aplicaes




Daniel Karrer (UFRJ) dkarrer@gpi.ufrj.br
Renato Florido Cameira (UFRJ) cameira@gpi.ufrj.br
Andr Strauss Vasques (UFRJ) astrauss@click21.com.br
Marcos de Almeida Benzecry (UFRJ) marcos_benzecry@yahoo.com.br


Resumo: O artigo se prope a realizar uma introduo terico-conceitual s redes
neurais artificiais. Para isso, foi realizada uma breve reviso da bibliografia
disponvel, abrangendo em especial o neurnio booleano de McCulloch, alm de uma
breve descrio do funcionamento do neurnio biolgico. Por fim, h uma seo onde
so descritos exemplos e casos de aplicao das RNAs.
Palavras-chave: Redes neurais artificiais, Neurnio de McCulloch, Aplicaes
gerenciais e biolgicas

1- Introduo

Segundo Braga, Carvalho e Ludemir (2000), em Sistemas Inteligentes, as
Redes Neurais Artificiais (RNAs) so modelos matemticos que se assemelham s
estruturas neurais biolgicas e que tem capacidade computacional adquirida por meio de
aprendizado e generalizao. O aprendizado em RNAs consiste na fase onde a rede
neural absorve dados e, a partir destes, modifica seus parmetros de entrada. Esta etapa
pode ser considerada como uma adaptao da RNA s caractersticas intrnsecas de um
problema, onde se procura cobrir um grande espectro de valores associados as variveis
pertinentes. Isto feito para que a RNA adquira, atravs de uma melhora gradativa, uma
boa capacidade de resposta para o maior nmero de situaes possveis. Por sua vez a
generalizao de uma RNA est associada sua capacidade de dar respostas coerentes
para dados no apresentados a ela durante o treinamento. Espera-se que uma RNA
treinada tenha uma boa capacidade de generalizao independentemente de ter sido
controlada durante o treinamento. No entanto, atualmente, segundo Braga, Carvalho e
Ludemir (2000), boa parte das pesquisas atual na rea visa o desenvolvimento de
modelos e tcnicas de aprendizado que tenham algum controle de generalizao. O
Profundo IX Encontro de Engenharia de Produo da UFRJ .
conceito atual que aprendizado e generalizao andam juntos em vez de a
generalizao surgir naturalmente como conseqncia do aprendizado.
Segundo Braga, Carvalho e Ludemir (2000), bem como Kovcs (1996), o
processamento da informao em RNAs feito por meio de estruturas neurais artificiais
em que o armazenamento e o processamento da informao so realizados de maneira
paralela e distribuda, por elementos processadores relativamente simples. Cada
elemento processador corresponde a um neurnio artificial, tambm conhecido como
modelo de Mc Culloch e Pitts, ou simplesmente modelo MCP.
Ainda de acordo com Braga, Carvalho e Ludemir, uma das caractersticas mais
importantes das RNAs que as mesmas so aproximadoras universais de funes
multivariveis contnuas. Em outras palavras, qualquer problema de aproximao de
funes contnuas pode ser resolvido por meio de RNAs, independente do nmero de
variveis envolvidas.

2 O neurnio Biolgico

De acordo com a descrio de Kovcs (1996), como qualquer clula biolgica, o
neurnio delimitado por uma fina membrana celular que alm de sua funo biolgica
normal, possui determinadas propriedades que so essenciais para o funcionamento
eltrico da clula nervosa. A partir do corpo celular, ou soma o centro dos processos
metablicos da clula nervosa projetam-s extenses filamentares, conhecidas como
dendritos e axnio. A partir de estudos realizados na dcada de 50 e 60, passou-se a
entender o neurnio biolgico como sendo basicamente o dispositivo computacional
elementar do sistema nervoso, que possua mltiplas entradas e apenas uma sada. As
entradas ocorrem atravs das conexes sinpticas, que conectam a rvore dendrital aos
axnios de outras clulas nervosas. Os sinais que chegam por esses axnios so pulsos
eltricos conhecidos como impulsos nervosos ou potenciais de ao, e constituem a
informao que o neurnio processar, de alguma forma, para produzir como sada um
impulso nervoso no seu axnio.
O axnio ou fibra nervosa de um neurnio um tubo filamentar delimitado pela
membrana celular. Em repouso, isto , sem a presena de um impulso nervoso, o
interior da membrana est a um potencial eletronegativo de algumas dezenas de
milivolts em relao ao exterior. Este o potencial de repouso da membrana. A
formao de um potencial de ao na membrana axonal ocorre quando esta sofre uma
Profundo IX Encontro de Engenharia de Produo da UFRJ .
despolarizao suficientemente acentuada para cruzar um determinado valor conhecido
como limiar de disparo. Neste momento, a membrana se despolariza rapidamente, em
questo de alguns microsegundos, muito alm do valor do limiar, e em seguida retorna
mais lentamente, ao valor de repouso. Este fenmeno o potencial de ao, que passa a
se propagar ao longo da fibra nervosa na forma de uma onda no atenuada.
Como destacou, Kovcs (1996), no neurnio biolgico, h uma integrao
espao-temporal dos estmulos: A polarizao ocorre imediatamente aps a chegada
do impulso nervoso na rvore dendrital e se propaga por difuso passiva por toda a
membrana at o local em que poder interferir no surgimento de potencial de ao
(axnio) e, com o tempo, decai de maneira exponencial. Isto , a membrana mantm,
por algum tempo, a memria da atividade sinptica. Este fenmeno conhecido como
integrao temporal dos estmulos pelo neurnio. Por outro lado, o potencial de ao
provocado no axnio de um neurnio pelo efeito combinado de todos os estmulos
excitatrios e inibitrios que chegam a sua rvore dendrital. Esta caracterstica reflete a
integrao espacial dos estmulos.

3 O neurnio Booleano de McCulloch

Em 1943, Warren McCulloch, juntamente com o estatstico Walter Pitts,
publicaram no Bulletin of Mathematical Biophysics o artigo A logical Calculus of the
Ideas Immanent in Nervous Activity. O neurnio de McCulloch um dispositivo
binrio, que segue a lgica da figura 1. Sua sada poderia ser pulso ou no pulso, e as
suas vrias entradas tinham ganho arbitrrio e poderiam ser excitatrias ou inibitrias.

X
1
X
2
X
n
w
1
w
2
w
n
u f(u) y = f(u)








Figura 1: Esquema de um Neurnio de McCulloch

Profundo IX Encontro de Engenharia de Produo da UFRJ .
As entradas do neurnio correspondem ao vetor de entrada X = [x
1
,x
2
,..x
n
]
T
de
dimenso n. Para cada uma das entradas x
i,
h um peso correspondente w
i
na entrada dos
neurnios. A soma das entradas x
i
ponderadas pelo peso correspondente w
i
chamada
de sada linear u, onde u = w
i
x
i
. A sada y do neurnio, chamada de sada de ativao,
obtida pela aplicao de uma funo f sada linear u, indicada por y = f(u). A funo
f chamada de funo de ativao e pode assumir vrias formas, geralmente no-
lineares. As quatro funes de ativao mais utilizadas so linear, rampa,degrau e sigmide.
Um exemplo tpico de funo de ativao a funo degrau unipolar:


f(u) = 0 se u <
f(u) = 1 se u >


onde o limiar acima do qual a sada do neurnio ativada. De acordo com os valores
dos pesos e do limiar , o neurnio artificial pode computar funes diferentes.
Segundo Braga, Carvalho e Ludemir (2000), analisando o comportamento do
neurnio representado pela equao acima e considerando uma entrada de dados com
duas variveis, podemos observar que a equao de deciso por meio da qual o neurnio
ativa ou no a sua sada equivalente a w
1
x
1
+ w
2
x
2
= , que corresponde equao de
uma reta no espao das variveis de entrada x
1
e x
2
(figura

2). Como pode ser observado,
para cada conjunto de valores diferentes de w
1
, w
2
e teremos uma reta diferente no
espao de entrada definido pelas variveis x
1
e x
2
. Com esta visualizao geomtrica do
problema, pode-se entender melhor em que consiste o aprendizado em RNAs, que nada
mais do que o ajuste dos pesos w e de , de maneira que a superfcie de deciso, neste
caso uma reta, atenda aos requisitos de parada de um algoritmo.
Profundo IX Encontro de Engenharia de Produo da UFRJ .
Funo degrau
f(u)
Regio
onde h
ativao
Regio onde
no h ativao
w
1
x
1
+ w
2
x
2
=
X
2
X
1
/w
2

u


Figura 2: Representao grfica


Como apontado por Braga, Carvalho e Ludemir (2000), uma Rede Neural ,
portanto, formada por elementos processadores simples. Cada elemento processador
executa uma funo simples, mas a RNA como um todo tem capacidade computacional
para resoluo de problemas complexos. A estrutura apresentada na figura 3 possui
quatro entradas (x
1
, x
2
, x
3
, x
4
), duas sadas (y
1
,y
2
) e quatro neurnios na camada
intermediria, e capaz de resolver problemas de regresso, classificao ou predio
no espao R
4
. tambm um exemplo de rede neural do tipo feed-foward.


X
1
X
2
X
3
X
4
y
1
y
2








Figura 3: esquema de uma rede neural de 2 camadas

Profundo IX Encontro de Engenharia de Produo da UFRJ .

4 Aprendizado

Conforme descrito anteriormente na introduo, as RNAs caracterizam-se pelo
aprendizado por meio de exemplos. Para um determinado conjunto de dados, o
algoritmo de aprendizado deve ser responsvel pela adaptao dos parmetros da rede,
de maneira que, em um nmero finito de iteraes do algoritmo, haja convergncia para
uma soluo. O critrio de convergncia varia de acordo com o algoritmo e com o
paradigma de aprendizado, mas pode envolver, por exemplo, a minimizao de uma
funo-objetivo, a variao do erro de sada ou mesmo a variao das magnitudes dos
vetores de peso da rede.
Basicamente, considera-se que o processo de aprendizado tem como
caracterstica a ocorrncia de estmulo da rede pelo meio externo atravs da
apresentao do conjunto de dados. Como conseqncia deste estmulo, o algoritmo de
aprendizado provoca mudana nos parmetros da rede e, finalmente, a mudana nos
parmetros acarreta em mudana no comportamento da RNA. Espera-se que a mudana
gradual no comportamento da rede resulte em melhoria gradativa do seu desempenho.
Segundo Kovcs (1996), a modificao do processamento ou da estrutura de
conhecimento de uma rede neural envolve a alterao do seu padro de interconexo.
Em princpio, isto pode ser feito de trs maneiras:desenvolvimento de novas conexes;
perda de conexes existentes na rede ou modificao dos pesos das conexes j
existentes

5 - Aprendizado e Generalizao

Segundo Braga, carvalho e Ludemir (2000), o objetivo principal do
aprendizado em Redes Neurais a obteno de modelos com boa capacidade de
generalizao tendo como base o conjunto de dados. Em problemas de aproximao,
classificao e predio, o conjunto de treinamento composto por pares de entra e
sada (x, y
d
), sendo caracterizada previamente a sada desejada y
d
para um determinado
valor de entrada x. O ajuste de pesos deve modificar a sada y de forma que a diferena
entre y e yd, ou seja, o erro, diminua a cada iterao. No entanto a minimizao pura e
simples do erro pode no levar a resultados satisfatrios. Portanto preciso fazer mais
do que simplesmente minimizar o erro do conjunto de treinamento para se obter boa
Profundo IX Encontro de Engenharia de Produo da UFRJ .
resposta de generalizao. O objetivo dos algoritmos de treinamento deve ser o de
aproximar funes geradoras f
g
dos dados e no simplesmente o de minimizar o erro do
conjunto de treinamento.


6 Classificao das Redes Neurais

Existem diversos tipos de RNA e diferentes maneiras de classific-las. Talvez a
mais importante seja quanto forma de aprendizado que pode ser: supervisionada e no
supervisionada.
Como apontam Portugal e Fernandes (1995), no aprendizado supervisionado so
sucessivamente apresentadas rede conjuntos de padres de entrada e seus
correspondentes padres de sada. Durante este processo, a rede realiza um ajustamento
dos pesos das conexes entre os elementos de processamento, segundo uma
determinada lei de aprendizagem, at que o erro entre os padres de sada gerados pela
rede alcance um valor mnimo desejado. Por exemplo, perceptron, adaline e madaline,
backpropagation, so algumas dentre as dezenas de leis de aprendizagem
supervisionada.
No aprendizado no-supervisionado a rede analisa os conjuntos de dados
apresentados a ela, determina algumas propriedades dos conjuntos de dados e aprende
a refletir estas propriedades na sua sada. A rede utiliza padres, regularidades e
correlaes para agrupar os conjuntos de dados em classes. As propriedades que a rede
vai aprender sobre os dados podem variar em funo do tipo de arquitetura utilizada e
da lei de aprendizagem. Por exemplo, Mapa Auto-Organizavl de Kohonen, Redes de
Hopfield e Memria Associativa Bidirecional, so alguns mtodos de aprendizado no-
supervisionado.
As redes tambm podem ser classificadas quanto suas caractersticas: contnua,
discreta, determinstica e estocstica, ou quanto sua estrutura: redes de mltiplas
camadas - multilayer feedforward network, cujo fluxo de dados segue uma nica
direo e redes recursivas - recurrent network.




Profundo IX Encontro de Engenharia de Produo da UFRJ .
7 Modelagem em Redes Neurais artificiais

Para o desenvolvimento de um modelo ou projeto baseado em redes neurais
artificiais so necessrias diversas etapas: definio do problema; coleta dos dados de
treinamento e de teste; pr e ps-processamento dos dados; projeto da estrutura da rede;
treinamento; teste e validao.
Na elaborao do projeto da RNA ideal para solucionar um determinado
problema, uma das tarefas mais difcieis determinar o nmero de elementos de
processamento da camada oculta, bem como o nmero de camadas ocultas (camadas
intermedirias ou ocultas so as camadas onde feita a maior parte do processamento,
atravs de conexes ponderadas. Podem ser consideradas extratoras de caractersticas).
No existem regras para isto, entretanto, estudos como o Teorema de Kolmogorov
demonstraram que uma nica camada oculta suficiente para representar qualquer
funo ou para resolver a maioria dos problemas de generalizao. Todavia, estes no
indicam o nmero de elementos de processamento que esta camada deve conter.
Os tipos de redes neurais mais adequadas so as redes multicamadas do tipo
feedfoward com mtodo de aprendizagem supervisionado (utilizando o algoritmo de
backpropagation). A parte principal do algoritmo de backpropagation a maneira
interativa pela qual os erros utilizados para adaptar os pesos so propagados para trs,
isto , a partir da camada de sada para as camadas anteriores.

8 Aplicaes

De acordo com Turbam, McLean e Wetherbe (2004), alm de seu papel de mecanismo
computacional alternativo, a computao neural tambm pode ser combinada com
outros sistemas de informao baseados em computador para produzir sistemas hbridos
poderosos.
Em geral, as RNAs no apresentam um bom desempenho em tarefas que no so
bem executadas por pessoas. Por exemplo, clculos matemticos e processamento de
transaes que exijam rapidez no so adequados para as RNAs e so mais bem
executadas pelos computadores convencionais. Entre as reas de aplicao das RNAs
podemos citar:
- Data Mining: Localizar dados em bancos de dados complexos e em sites da
Web;
Profundo IX Encontro de Engenharia de Produo da UFRJ .
- Fraudes tributrias: identificar, localizar e assinalar irregularidades;
- Servios financeiros: identificar padres de dados sobre o mercado de aes e
auxiliar em estratgias de negociao de aes e ttulos; escolha e
comercializao de commodities, subscrio de hipoteca, precificao de ofertas
iniciais ao publico e previso de taxas de cmbio;
- Avaliao de pedidos de financiamento: avaliar a seriedade dos pedidos de
financiamento, com base em padres de informaes anteriores (nvel de critrio
do cliente);
- Previso de solvncia: avaliando os pontos fortes e fracos de empresas e
prevendo possveis fracassos;
- Anlise de novos produtos: previso de vendas e marketing dirigido;
- Gesto de tarifas areas: procura de assentos e escalas de tripulao;
- Avaliao de funcionrios e candidatos a vagas: dados dos candidatos
comparados s exigncias da funo de critrios de desempenho;
- Alocao de recursos baseada em dados histricos e experimentais: descobrir
alocaes que maximizem os resultados;
- Identificao de alvos de aquisio: prever quais empresas esto mais sujeitas a
serem compradas por outras;
- Validao de assinatura: comparao e confirmao de assinaturas com
amostras no cadastro;
- Previses: antecipar as exigncias de comportamento e de pessoal;
- Deteco de fraudes contra seguradoras: descobrir padres de fraude;
- Deteco de fraudes contra administradoras de cartes de crdito: anlise de
padres de compra para deteco de fraude;
- Entre outros.

9 Estudo de caso: Aplicaes de Redes Neurais Artificiais em Bioinformtica

As Redes Neurais Artificiais podem ser aplicadas a diversos problemas da
Bioinformtica, que costumam envolver reconhecimento de padres. Adequam-se aos
casos onde h necessidade de manipulao de conhecimento impreciso; alm de
possibilitarem a construo de modelos a partir de exemplos depositados em bancos de
dados.
Profundo IX Encontro de Engenharia de Produo da UFRJ .
Anlise de Sequncias de Genomas: Uma importante rea de aplicao da Bioinformtica
a Anlise de Sequncias (nucleotdeos ou aminocidos), obtidas a partir do
seqenciamento de genomas dos mais diversos organismos.Vrias abordagens podem
ser utilizadas:
a) Reconhecimento de Sinais - Segundo o "Dogma Central da Biologia Molecular",
toda informao gentica de um organismo est codificada em seu genoma. Portanto, a
anlise de seqncias envolveria a identificao de padres associados a
funcionalidades biolgicas. Como o Reconhecimento de Padres uma das principais
aplicaes das Redes Neurais Artificiais, interessante que estas sejam aplicadas em
Bioinformtica, quando o problema envolver identificao de sinais biolgicos. So
exemplos de sinais a serem reconhecidos em seqncias de nucleotdeos: Promotores
(incio da transcrio); Sinais de trmino de transcrio; Start codon (incio de
traduo); Stop codons (trmino de traduo); RBS (ribossome binding site).
b) Identificao de Assinaturas - Um outro tipo importante de anlise a
caracterizao da protena, com base nos motivos encontrados em sua seqncia de
aminocidos. Uma maneira de realizar esta classificao seria atravs da construo de
Mapas Auto-Organizveis contendo os motivos de interesse.
c) Identificao de Repeties e de Regies de Baixa Complexidade - De maneira
similar aos motivos em seqncias de aminocidos, tanto as repeties como as regies
de baixa complexidade poderiam ser detectadas atravs dos Mapas Auto-Organizveis.

10- Estudo de caso: Administradoras de carto de crdito

Somente 0,25% do faturamento da Visa International, em 1995, foi perdido para
as fraudes, mas o 655 milhes de dlares que esse percentual representa so uma perda
significativa que merece ser prevenida. A Visa est concentrando seus esforos agora
sobre a reverso do nmero de transaes fraudulentas, utilizando para isso a ajuda da
tecnologia de redes neurais.
A maioria das pessoas costuma manter um padro bem-definido de uso de carto
de crdito e raramente faz compras suprfulas. As redes neurais foram desenhadas para
perceber quando um carto, normalmente usado uma vez por semana para abastecer o
automvel, por exemplo, de repente usado para comprar vrios ingressos para a mais
famosa estria de teatro na Broadway.
Profundo IX Encontro de Engenharia de Produo da UFRJ .
Os bancos associados rede Visa acreditam que a tecnologia de redes neurais
um sucesso. O Bank of America usa um sistema de identificao de risco de portador de
carto de crdito (CRIS) e cortou o uso fraudulento de cartes de crdito em dois teros.
O Toronto Dominion Bank descobriu que as perdas haviam diminudo, e seu
atendimento ao cliente melhorado muito desde a introduo da computao neural.
Outro banco registrou uma economia de 5,5 milhes de dlares em seis meses. Em
1994, os bancos associados Visa perderam mais de 148 milhes de dlares com
falsificao de cartes o que representa uma queda maior que 16%. Com esses
nmeros, os 2 milhes de dlares que a visa investiu na instalao do CRIS parecem ter
valido a pena. De fato, a Visa dz que obteve retorno sobre o investimento no CRIS em
apenas 1 ano.
Em 1995, o CRIS realizou mais de 16 bilhes de transaes. Em 2000, o VisaNet
(o data warehouse e operaes de e-mail da Visa) e o CRIS efetuavam mais de 5250
transaes por segundo. No outono de 2000, o CRIS conseguia avisar em poucos
minutos seus bancos associados sobre qualquer fraude que estivesse ocorrendo com
alguma transao.
A administradora japonesa de cartes de crdito Sumitomo Credit Service Co.
utiliza o Falcon, um sistema baseado em redes neurais da HNC Corp. O produto
consegue ler bem os caracteres japoneses, protegendo 18 milhes de portadores de
cartes de crdito no Japo.

11 Concluso

A partir de nosso estudo dos conceitos bsicos, conclui-se que as RNAs
representam uma parte importante do conhecimento que est se formando no campo de
sistemas inteligentes e inteligncia artificial. Atravs dos estudos de caso, percebe-se o
poder desta ferramenta, que pode, dentre outras coisas, ser de grande valia no mbito da
engenharia de produo como suporte a gesto de informao e suporte tomada de
deciso.

12 Bibliografia

Rezende, Solange O. (2003). Sistemas Inteligentes Fundamentos e aplicaes.
Barueri, SP. Editora Manole.
Profundo IX Encontro de Engenharia de Produo da UFRJ .
Turbam, E., McLean, E., Wetherbe, J. (2004) . Tecnologia da Informao para Gesto.
Porto Alegre, RS. Editora Bookman.
Kovcs, Zsolt L. (1996). Redes Neurais Artificiais : Fundamentos e aplicaes. So
Paulo , SP Livraria da Fsisca Editora.
Artigo "Redes Neurais Artificiais e Previso de Sries Econmicas: uma introduo".
Marcelo S. Portugal e Luiz Gustavo L. Fernandes, 1995

Você também pode gostar