Você está na página 1de 6

Redes neurais e sua aplicao em sistemas de

recuperao de informao
Edberto Ferneda INTRODUO
Professor doutor do curso de cincias da informao e
Documentao da Faculdade de Filosofia Cincias e Letras de
Ribeiro Preto USP
Sabe-se que o crebro composto de bilhes de
E-mail: ferneda@ffclrp.usp.br neurnios. Um neurnio uma clula formada por trs
sees com funes especficas e complementares: corpo,
dendritos e axnio. Os dendritos captam os estmulos
Resumo recebidos em um determinado perodo de tempo e os
transmitem ao corpo do neurnio, onde so processados.
Redes neurais constituem um campo da cincia da
computao ligado inteligncia artificial, buscando Quando tais estmulos atingirem determinado limite, o
implementar modelos matemticos que se assemelhem s corpo da clula envia novo impulso que se propaga pelo
estruturas neurais biolgicas. Nesse sentido, apresentam axnio e transmitido s clulas vizinhas por meio de
capacidade de adaptar os seus parmetros como resultado
da interao com o meio externo, melhorando gradativamente
sinapses. Este processo pode se repetir em vrias camadas
o seu desempenho na soluo de um determinado problema. de neurnios. Como resultado, a informao de entrada
A utilizao de redes neurais em sistemas computacionais processada, podendo levar o crebro a comandar reaes
de recuperao de informao permite atribuir um carter
dinmico a tais sistemas, dado que as representaes dos
fsicas. A figura 1 ilustra de forma simplificada as partes
documentos podem ser reavaliadas e alteradas de acordo de um neurnio.
com a especificao de relevncia atribuda pelos usurios
aos documentos recuperados. O presente trabalho apresenta A habilidade de um ser humano em realizar funes
as principais iniciativas de se aplicarem os conceitos de
redes neurais aos sistemas de recuperao de informao e
complexas e principalmente a sua capacidade de aprender
avalia sua aplicabilidade em grandes bases documentais, advm do processamento paralelo e distribudo da rede
como o caso da Web. de neurnios do crebro. Os neurnios do crtex, a
Palavras-chave
camada externa do crebro, so responsveis pelo
processamento cognitivo. Um novo conhecimento ou
Redes neurais. Recuperao de informao. Sistemas uma nova experincia pode levar a alteraes estruturais
adaptativos.
no crebro. Tais alteraes so efetivadas por meio de um
Neural networks and its application in rearranjo das redes de neurnios, reforando ou inibindo
information retrieval systems algumas sinapses (HAYKIN, 2001, p.32-36).

Abstract A busca por um modelo computacional que simule o


funcionamento das clulas do crebro data dos anos 40,
Neural networks are a field of Computer Science related to
Artificial Intelligence. The field aims at implementing
mathematical models that are similar to biological neural FIGURA 1
structures. It is also capable of adapting its parameters as a
result of interactions with the external environment, gradually
Representao simplificada de um neurnio
improving their performance in the solution of a particular
task. By using neural networks in computer information
retrieval systems one can assign a dynamic character to
those systems by allowing the representation of documents to
be reevaluated and modified according to specifications of Axnio
relevance attributed by users to retrieved documents. This
work presents the main initiatives in applying neural networks
concepts to information retrieval systems and evaluates its Dendritos Corpo Terminais
applicability to large document databases as is the case of sinpticos
the Web.

Keywords

Neural networks. Information retrieval. Adaptive systems.

Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006 25


Edberto Ferneda

c o m o t r a b a l h o d e M c C u l l o c h e P i t t s ( 1 9 4 3). conexes, e o valor resultante enviado para a funo de


O entusiasmo pela pesquisa neste campo cresceu durante ativao, que define a sada (y) do neurnio.
os anos 50 e 60. Nesse perodo, Rosenblatt (1958) props
um mtodo inovador de aprendizagem para as redes Combinando diversos neurnios, forma-se uma rede
neurais artificiais denominado percepton. At 1969, neural artificial. As redes neurais artificiais so modelos
muitos trabalhos foram realizados utilizando o percepton que buscam simular o processamento de informao do
como modelo. No final dos anos 60, Minsky e Pappert crebro humano. So compostas por unidades de
(1969) publicam um livro no qual apresentam importantes processamentos simples, os neurnios, que se unem por
limitaes do perceptron. As dificuldades metodolgicas e meio de conexes sinpticas.
tecnolgicas, juntamente com os ataques extremamente De uma forma simplificada, uma rede neural artificial
pessimistas de Papert e Minsky, fizeram com que as pode ser vista como um grafo onde os ns so os neurnios
pesquisas arrefecessem nos anos seguintes. Durante os anos e as ligaes fazem a funo das sinapses, como
70, a pesquisa contava apenas com um nmero nfimo de exemplificado na figura 3.
cientistas. Porm, durante os anos 80, o entusiasmo
ressurge graas a avanos metodolgicos importantes e ao
aumento dos recursos computacionais disponveis. FIGURA 3
Representao simplificada de uma rede neural artificial
O modelo de neurnio artificial da figura 2 uma
simplificao do modelo apresentado por Haykin (2001,
p. 36).

FIGURA 2
Modelo matemtico de um neurnio

As redes neurais artificiais se diferenciam pela sua


arquitetura e pela forma como os pesos associados s
conexes so ajustados durante o processo de aprendizado.
A arquitetura de uma rede neural restringe o tipo de
problema no qual a rede poder ser utilizada, e definida
Este modelo composto por trs elementos bsicos: pelo nmero de camadas (camada nica ou mltiplas
camadas), pelo nmero de ns em cada camada, pelo tipo
um conjunto de n conexes de entrada (x1, x2, ..., xn), de conexo entre os ns (feedforward ou feedback) e por
caracterizadas por pesos (p1, p2, ..., pn); sua topologia (HAYKIN, 2001, p. 46-49).

um somador (6) para acumular os sinais de entrada; Uma das propriedades mais importantes de uma rede
neural artificial a capacidade de aprender por intermdio
uma funo de ativao (M) que limita o intervalo de exemplos e fazer inferncias sobre o que aprendeu,
permissvel de amplitude do sinal de sada (y) a um valor melhorando gradativamente o seu desempenho. As redes
fixo. neurais utilizam um algoritmo de aprendizagem cuja tarefa
ajustar os pesos de suas conexes (BRAGA;
O comportamento das conexes entre os neurnios CARVALHO; LUDEMIR, 2000, cap. 2).
simulado por meio de seus pesos. Os valores de tais pesos
podem ser negativos ou positivos, dependendo de as Existem duas formas bsicas de aprendizado de redes
conexes serem inibitrias ou excitatrias. O efeito de neurais: aprendizado supervisionado e aprendizado no-
um sinal proveniente de um outro neurnio supervisionado. No aprendizado supervisionado, um
determinado pela multiplicao do valor (intensidade) agente externo (professor) apresenta rede neural alguns
do sinal recebido pelo peso da conexo correspondente conjuntos de padres de entrada e seus correspondentes
(xi pi). efetuada a soma dos valores xi pi de todas as padres de sada. Portanto, necessrio ter um

26 Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006


Redes neurais e sua aplicao em sistemas de recuperao de informao

conhecimento prvio do comportamento que se deseja Os termos de busca (t1, t7, t3, t9) iniciam o processo de
ou se espera da rede. Para cada entrada, o professor indica inferncia mediante a ativao dos respectivos termos
explicitamente se a resposta calculada boa ou ruim. de indexao. Alguns termos da expresso de busca
A resposta fornecida pela rede neural comparada podem no fazer parte do conjunto de termos de
resposta esperada. O erro verificado informado rede indexao, como o caso do termo t7 e t9. Nesse caso,
para que sejam feitos ajustes a fim de melhorar suas futuras esses termos no ativaro nenhum termo de indexao
respostas. e, portanto, no sero considerados durante o processo
ativao da rede. Os termos de indexao ativados pelos
Na aprendizagem no supervisionada, ou aprendizado de termos de busca enviam sinais para os documentos.
auto-supervisionado, no existe um agente externo para Estes sinais sero multiplicados pelos pesos de cada
acompanhar o processo de aprendizado. Neste tipo de ligao (p1,1, p1,2, ..., pn,m ). Os documentos ativados enviam
aprendizagem, somente os padres de entrada esto sinais que so conduzidos de volta aos termos de
disponveis para a rede neural. A rede processa as entradas indexao. Ao receberem estes estmulos, os termos de
e, detectando suas regularidades, tenta progressivamente indexao enviam novos sinais aos documentos,
estabelecer representaes internas para codificar repetindo o processo. Os sinais tornam-se mais fracos a
caractersticas e classific-las automaticamente. Este tipo cada iterao, e o processo de propagao eventualmente
de aprendizado s possvel quando existe redundncia pra. O resultado final de uma busca ser um conjunto
nos dados de entrada, para que se consiga encontrar dos documentos que foram ativados, cada qual com um
padres em tais dados. nvel ativao que pode ser interpretado como o grau de
relevncia do documento em relao busca do usurio.
REDES NEURAIS NA RECUPERAO DE Entre os documentos resultantes, podem aparecer alguns
INFORMAO que no esto diretamente relacionados aos termos
utilizados na expresso de busca, mas que foram inferidos
De uma forma simplificada, a recuperao de informao durante a pesquisa e possuem certo grau de relacionamento
lida com documentos, termos de indexao e as com a necessidade de informao do usurio. A ativao
expresses de buscas dos usurios. Pode-se dizer que, do termo de indexao t1, por exemplo, ativou a conexo
em um sistema de recuperao de informao, de um com o documento d1. O documento d1, por sua vez, ativou
lado esto as expresses de busca, do outro lado esto os o termo t2, que no fazia parte do conjunto de termos de
documentos e no centro esto os termos de indexao. busca. O termo t2 poder ativar o documento dm, que,
Essa estrutura pode ser vista como uma rede neural de dependendo do seu grau de ativao, pode vir a fazer parte
trs camadas: a camada de termos de busca seria a camada do conjunto de documentos recuperados.
de entrada da rede neural, a camada de documentos seria
Mozer (1984) foi o pioneiro na utilizao de tcnicas de
a sada, e a camada de termos de indexao seria uma
redes neurais na recuperao de informao. Ele utilizou
camada central. A figura 4 mostra um exemplo genrico
uma arquitetura bastante simples que no empregava uma
da aplicao das redes neurais na recuperao de
das principais caractersticas das redes neurais, que a
informao.
capacidade de aprender. A figura 5 mostra um exemplo
apresentado por Ford (1991, p.108), que utiliza a
FIGURA 4 arquitetura de rede neural idealizada por Mozer.
Representao de rede neural aplicada recuperao
de informao FIGURA 5
Exemplo de rede neural utilizando arquitetura de Mozer

Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006 27


Edberto Ferneda

As linhas contnuas representam ligaes excitatrias


entre os termos de indexao e os documentos. As linhas
pontilhadas, que ligam pares de documentos,
representam ligaes inibitrias, isto , ligaes que
reduzem a fora de associao entre os ns. Os termos de
indexao ativam os documentos que so indexados por
eles e vice-versa. Um documento, ao ser ativado, reduz o
nvel de ativao dos demais documentos.

Utilizando uma expresso de busca que contm os termos


programao e lingstica, por exemplo, a rede neural
da figura 5 apresentar a seguinte seqncia de ativao:
3. O termo computadores ativar os documentos
indexados por ele. Assim, o documento d2 reforado, e
o documento d1 ativado. O termo linguagem reforar
a ativao dos documentos d4 e d5 e tambm o documento
d1. O termo cognio ativar o documento d3.

Este processo se propagar at a estabilizao da rede


neural, quando cessam as ativaes entre seus ns.
O nvel de ativao de cada documento representar a
sua relevncia em relao expresso de busca. No
exemplo, os documentos d2, d4 e d5, que foram ativados
diretamente pelos termos de busca, tero um nvel de
ativao maior do que o documento d3, que indexado
por apenas um termo (cognio) e que foi indiretamente
ativado durante a busca.
1. Inicialmente sero ativados os ns correspondentes
aos termos de busca (programao e lingstica). Para que sejam apresentados resultados satisfatrios, os
O termo programao ir ativar o documento d2, e o parmetros da rede neural (pesos das conexes, funes
termo lingstica ativar os documentos d4 e d5: de ativao etc.) devem ser configurados de forma precisa.
Porm, o sistema pode compensar algumas
inconsistncias na indexao e at possveis imprecises
nas expresses de busca dos usurios. Mozer (1984)
enfatiza que a grande vantagem deste modelo a
habilidade em produzir resultados no esperados,
recuperando documentos que no possuem nenhum
termo em comum com a expresso de busca, mas, mesmo
assim, podem vir a ser relevantes para o usurio. No
exemplo apresentado, em resposta expresso de busca
contendo os termos programao e lingstica.
O documento d 1, que indexado pelos termos
computadores e linguagem, obteve tambm certo nvel
de ativao (FORD, 1991, p.109).

2. O documento d2 ativar todos os termos de indexao Na arquitetura proposta por Mozer, as ligaes entre os
usados para index-lo: programao e computadores. documentos so inibitrias, isto , um documento,
Assim, o termo programao reforado, e o termo quando ativado, reduz o nvel de ativao dos demais
computadores ativado pela primeira vez. Os documentos. Isso causa uma competio entre os
documentos d4 e d5 ativaro o termo linguagem e documentos, fazendo com que apenas os documentos
reforaro a ativao do termo lingstica. O documento mais ativados durante o processo de busca sejam
d5 ativar tambm o termo cognio: efetivamente recuperados, reduzindo assim o nmero de
documentos resultantes.

28 Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006


Redes neurais e sua aplicao em sistemas de recuperao de informao

Ao final do processo de pesquisa, o grau de ativao de para que o usurio possa atribuir um grau de relevncia
cada documento pode ser utilizado como critrio de para cada um dos itens recuperados. Este feedback
ordenamento dos itens resultantes. Os documentos com utilizado na aprendizagem da rede neural, que modifica
maior nvel de ativao so geralmente aqueles que os pesos associados s conexes entre seus ns, buscando
possuem todos os termos utilizados na expresso de busca, adaptar a rede s necessidades de informao dos usurios.
seguidos dos documentos que possuem somente alguns
dos termos de busca e dos que foram apenas inferidos Portanto, o sistema AIR (BELEW, 1989) permite uma
durante o processo de pesquisa. participao ativa de seus usurios por meio da atribuio
de relevncia aos resultados obtidos em suas buscas. Essa
Bein e Smolensky (1988) implementaram e testaram esse interao responsvel por mudanas estruturais na rede
modelo de rede neural proposta por Mozer utilizando neural artificial utilizada pelo sistema e pode ser vista
12.990 documentos e 6.832 termos de indexao. Eles como um processo contnuo de aprendizagem e adaptao
avaliaram os resultados apresentados como satisfatrios do sistema aos interesses de seus usurios, resultando
e sugeriram novos testes utilizando bases de dados maiores presumivelmente em melhoria progressiva de seu
e com caractersticas diversas. desempenho.

Como foi observado anteriormente, o modelo proposto Essa adaptabilidade, porm, permite inferir que este tipo
por Mozer no utiliza uma das caractersticas mais fortes de aplicao das redes neurais s possvel em ambientes
das redes neurais: a habilidade de aprender por meio da nos quais os usurios possuam interesses comuns, para
alterao dos pesos associados s ligaes entre os ns. que seja possvel ao sistema convergir para um
Um sistema mais recente que explora tal habilidade das desempenho timo. Assim, em um ambiente tipicamente
redes neurais o sistema AIR. heterogneo como a Web, esta forma de aplicao das
redes neurais s seria vivel em sistemas com domnio
Desenvolvido por Belew (1989), o sistema Adaptative bem especfico e restrito, como, por exemplo, uma
Information Retrieval (AIR) utiliza uma arquitetura de biblioteca digital especializada ou em sistemas de
rede neural composta de trs camadas que representam recuperao de informao ligados a grupos de pesquisa
os termos de indexao, os documentos e os seus autores. em determinadas reas do conhecimento.
As ligaes so feitas entre os documentos e seus autores
e entre documentos e seus termos de indexao, como Portanto, as idias apresentadas por Mozer (1984) e por
apresentado na figura 6. Belew (1989) sofrem algumas restries quando inseridas
no ambiente web. No entanto, existem outras formas de
FIGURA 6 aplicao desenvolvidas especificamente para o ambiente
Arquitetura de rede neural do sistema AIR web no qual tais restries inexistem, como ser
exemplificado na prxima seo.

REDES NEURAIS NO AMBIENTE WEB

A recuperao de informao no complexo ambiente da


Internet relativamente facilitada pelos mecanismos de
busca (search engines), que coletam e indexam uma parte
da imensa quantidade de pginas disponveis na Web.
Para facilitar a seleo dos itens recuperados, a maioria
dos mecanismos de busca realiza um ordenamento dos
resultados, utilizando algum algoritmo que tenta predizer
a relevncia de cada item para a necessidade de informao
do usurio. As primeiras referncias so presumivelmente
Uma busca pode ser expressa no apenas pela ativao mais relevantes do que as ltimas.
dos termos de indexao, mas por qualquer tipo de n
(autor documento ou termo de indexao), ou por alguma Cada mecanismo de busca utiliza seu prprio algoritmo
combinao deles. Durante a pesquisa, feita a ativao para a coleta e indexao de pginas. Como decorrncia
dos ns da rede e, quando o sistema se estabiliza, os ns e desta diversidade, para uma mesma expresso de busca,
as ligaes que foram inferidos so apresentados ao os resultados apresentados pelos diferentes mecanismos
usurio. O sistema AIR fornece uma interface apropriada podem variar consideravelmente. Pode-se supor, ento,

Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006 29


Edberto Ferneda

que a combinao de vrios mecanismos de busca pode Assim como as redes neurais, diversas outras idias e
aumentar a rea de cobertura da Web e, conceitos desenvolvidos pela cincia da computao
conseqentemente, permitir obter resultados mais podem ser utilizados no tratamento e recuperao da
completos do que um mecanismo de busca tomado informao. Porm, desejvel que essas idias sejam
isoladamente. Esta combinao de vrios mecanismos implementadas e avaliadas levando-se em conta os
de busca denominada metabuscador (metasearch engine). avanos tericos e metodolgicos j realizados pelos
Um metabuscador obtm os resultados de diferentes processos documentrios no mbito da cincia da
mecanismos de busca e, aps retirar as referncias informao.
repetidas, apresenta as pginas ordenadas e em uma
interface adequada. Os mtodos e tcnicas desenvolvidos pela cincia da
computao devem ser continuamente estudados e at
Os metabuscadores ampliam consideravelmente a absorvidos pela cincia da informao. Porm, o
abrangncia das buscas na Web. Porm, como se apiam profissional da informao deve ter sempre em mente
nos recursos oferecidos por um conjunto de mecanismos que a cincia da informao no poder ser desenvolvida
de busca, os metabuscadores herdam deles todas as suas no vazio cultural de um sistema de raciocnio algortmico.
limitaes.

Com o objetivo de melhorar, na Web, a preciso das Artigo submetido em 14/06/2006 e aceito em 10/07/2006.
buscas, Shu e Kak (1999) implementaram um
metabuscador que se apia em quatro mecanismos de
busca: Yahoo, Excite, Infoseek e WebCrawler. Aps a
REFERNCIAS
execuo de uma busca, os resultados de cada um desses
mecanismos so ordenados utilizando um algoritmo de BEIN, J.; SMOLENSKY, P. Application of the interactive activation model
to document retrieval. Colorado: University of Colorado at Boulder,
classificao baseado em uma rede neural. Este algoritmo Department of Computer Science, 1988. (Technical Report CU-CS-
o principal componente do metabuscador denominado 405-88).
Anvish. Para o treinamento da rede neural, o Anvish BELEW, R. K. Adaptive information retrieval. In: ANNUAL
utiliza as duas primeiras pginas do resultado de cada INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH
mecanismo de busca como exemplo de respostas AND DEVELOPMENT IN INFORMATION RETRIEVAL, 12. , 1989,
Cambridge. Proceedings... Cambridge: ACM, 1989. p.11-20.
relevantes. As duas ltimas pginas so apresentadas
rede neural como exemplo de respostas no relevantes. BRAGA, A. P.; CARVALHO, A. C. P. L. F.; LUDEMIR, T. B. Redes
neurais artificiais: teoria e aplicaes. Rio de Janeiro: LTC, 2000.
Uma vez terminado este processo de aprendizagem, o
Anvish apresenta as referncias em ordem decrescente FORD, N. Expert systems and artificial intelligence: an information
managers guide. London: Library Association Publishing, 1991.
de relevncia, baseando-se no que foi aprendido.
HAYKIN, S. Redes neurais: princpios e prtica. Porto Alegre: Bookman,
Resultados experimentais mostraram que o Anvish 2001.

apresenta um desempenho significativamente superior MCCULLOCH, W. S.; PITTS, W. H. A logical calculus of the ideas
immanent in nervous activity. Bulletin of Mathematical Biophysics, n. 5,
maioria dos metabuscadores que utilizam processos
p.115-133, 1943.
estatsticos (SHU; KAK, 1999).
MINSKY, M. L.; PAPPERT, S. Perceptron: an introduction to
computational geometry. Cambridge: MIT Press, 1969.
CONCLUSO
MOZER, M.C. Inductive information retrieval using parallel distributed
computation. San Diego: University of California, 1984. (ICS Technical
A utilizao das redes neurais artificiais em sistemas de Report 8406).
recuperao de informao permite atribuir a tais
ROSENBLATT, F. The perceptron: a probabilistic model for
sistemas um carter dinmico. Esta dinamicidade pode information storage and retrieval in the brain. Psychological Review,
ser implementada mediante a participao ativa dos v. 65, p. 386-408, 1958.
usurios em um processo contnuo de representao dos SHU, B.; KAK, S. A neural network-based intelligent metasearch
documentos do corpus ou mediante a aprendizagem de engine. Information Sciences, v. 120, n. 1-4, p. 1-11, 1999.
certas condies especficas no contexto de uma nica
busca, como o caso do metabuscador Anvish.

30 Ci. Inf., Braslia, v. 35, n. 1, p. 25-30, jan./abr. 2006

Você também pode gostar