Você está na página 1de 5

Universidade Federal do Esprito Santo

Centro Universitrio Norte do Esprito Santo


Departamento de Engenharias e Computao
Curso de Engenharia de Computao




Inteligncia Artificial
prof. Lus Rigo








Redes Bayesianas
Eliezer de Souza da Silva







1. Introduo
Ao raciocinarmos sobre qualquer domnio real, devemos fazer algumas simplificaes. Se
quisermos adicionar qualquer dose de realismo ao nosso raciocnio devemos levar em conta a
incerteza do conhecimento do domnio real que estamos tratando. Ou seja, um modelo
determinstico do mundo real praticamente invivel temos sempre que lidar com a
incerteza.
Incerteza origina-se de alguma deficincia da informao. A informao pode estar
incompleta, ser vaga, imprecisa ou contraditria [1].
Para lidarmos com o problema da incerteza e incompletude nos modelos do mundo real,
precisamos de uma linguagem apropriada e uma representao adequada (formalmente e
computacionalmente) do modelo. A linguagem mais apropriada para lidar com a incerteza a
linguagem da probabilidade dizemos que estamos fazendo uso do Raciocnio Probabilstico.
Atravs do raciocnio probabilstico podemos atribuir um grau de crena s relaes do
domnio real. As relaes de independncia e independncia condicional so extremamente
importantes na simplificao da representao probabilstica do mundo real [2]. Outra relao
muito importante a relao de causalidade entre eventos, e as respectivas probabilidades
condicionais a priori e a posteriori da ocorrncia de ocorrncia de um certo evento.
Neste contexto, as redes bayesianas aparecem como uma metodologia com a possibilidade de
representar o conhecimento incerto, bem como executar raciocnios sobre este conhecimento
incerto.

2. Conceitos da Teoria da Probabilidade e Teoria de Grafos.
Antes de prosseguirmos com os conceitos prprios das redes bayesianas iremos resgatar
alguns conceitos da teoria de probabilidade [3] e teoria dos grafos.
- Espao Amostral: o conjunto de todas configuraes possveis do domnio considerado.
- Evento: um subconjunto do espao amostral.
- Probabilidade Condicional (a posteriori): probabilidade de um evento A acontecer dado que
um evento B aconteceu.

- Eventos Independentes: E e F so independentes se o conhecimento da ocorrncia de F no
afeta a probabilidade de que E ocorra. Isto , a ocorrncia de E no depende da ocorrncia de
F.

- Varivel Aleatria: aquela que assume valores num espao amostral e para a qual est
determinada a probabilidade de ocorrncia de cada um dos elementos do espao amostral.
- Teorema de Bayes: permite calcular a probabilidade a posteriori de um evento, dado a
ocorrncia de um outro evento.

- Distribuio de Probabilidade Conjunto: probabilidade de vrios eventos acontecerem
simultaneamente.
- Grafo Direcionado: um grafo direcionada G=(V,E), um conjunto V de vrtices e um conjunto
de arcos , |, .
- Caminho em um Grafo Direcionado: uma sequncia de ns, com que respeita as seguintes
propriedade

, onde

, , , .
- Circuito: caminho com ns repetidos.
- Grafo Direcionado Acclico (DAG): um grafo direcionada G=(V,E), sem nenhum circuito. Seria
o equivalente de rvores para dgrafos.

3. Redes Bayesianas
Redes Bayesianas so um modelo de representao do conhecimento que trabalham com o
conhecimento incerto e incompleto atravs da Teoria da Probabilidade Bayesiana, publicada
pelo matemtico Thomas Bayes em 1763.
Segue uma lista de marcos histricos importantes na rea de redes bayesianas:
1763 - Rev. Thomas Bayes;
Anos 80 - Judea Pearl (Probabilistic Reasoning in Intelligent Systems);
1980: desenvolvimento de mtodos eficientes para abordar a ambiguidade ou falta de
informao
1993 Microsoft contrata Eric Horvitz, David Heckerman e Jack Breese para explorar
esta abordagem nos seus produtos Microsoft Office e usa esta tecnologia para
fornecer ajuda ao utilizador baseado na historia passada, na forma como o mouse se
movimenta e na atividade em curso.
Se as aces mostram que o utilizador est distrado, provvel que necessite
de ajuda. Se est a trabalhar num grfico, a hiptese plausvel de que
necessite de ajuda na formatao.

O conhecimento incerto aquele que apresenta deficincias. Em algum momento, os dados
podem ser uma representao no exata, parcial ou aproximada da realidade.
Essa representao tem como uma das suas principais caractersticas a adaptabilidade,
podendo, a partir de novas informaes, e com base em informaes de fundo verdadeiras,
gerar alteraes nas dependncias e nos seus conceitos. Permite, dessa forma, que as
probabilidades no sejam meros acasos, podendo confirmar e criar novos conceitos.
importante observar que o modelo baseia-se em probabilidades prvias mais algumas
informaes com um certo nvel de incerteza, para representar o conhecimento. Um modelo
totalmente incerto no seria de grande utilidade e no teria ponto de partida para a
manipulao de suas situaes e a gerao de novas representaes.
A representao da Rede Bayesiana feita atravs de um grafo direcionado acclico no qual os
ns representam variveis de um domnio e os arcos representam a dependncia condicional
ou informativa entre as variveis. Para representar a fora da dependncia, so utilizadas
probabilidades, associadas a cada grupo de ns pais-filhos na rede [2].

Fig. 1 Exemplo de Rede Bayesiana mostrando as folhas da rvore independentes entre si.
Atualmente a utilizao das Redes Bayesianas tem crescido bastante para a resoluo de
problemas relacionados a WEB. A filtragem de SPAM, usualmente feita atravs da utilizao de
filtros que no contm inteligncia, est, com projetos como o Bogofilter, se utilizando de
mecanismos de Inteligncia Artificial para aumentar a sua eficincia.

4. Aprendizado Com Redes Bayesianas
Como vimos anteriormente, a rede bayesiana, representa a estrutura do modelo, ou seja, a
rede bayesiana tem em si o conhecimento do domnio em questo. Portanto o aprendizado
em redes bayesianas se trata de como construir uma rede bayesiana que modela um conjunto
de dados amostrados do domnio. Basicamente temos dois tipos de aprendizado em redes
Bayesianas: aprendizado de estrutura e aprendizado de parmetros.
Levando em conta os dois tipos de aprendizado anteriores, podemos dividir esta tarefa em
quatro problemas de aprendizagem:
Estrutura conhecida e variveis completamente observveis: as tabelas de
probabilidade condicionada podem ser estimadas usando o conjunto de exemplos com
classificador ingnuo de Bayes.
Estrutura desconhecida e variveis completamente observveis: neste caso o problema
construir a topologia da rede. A soluo uma Busca no espao de estruturas. Para
esta tarefa cabe o uso de heursticas na busca da estrutura de rede tima.
Estrutura conhecida e variveis escondidas: caso parecido com aprendizado em redes
neurais.
Estrutura desconhecida, variveis escondidas: no se conhece algoritmos para este
tipo de problema.

5. Inferncia
Uma vez que uma rede bayesiana totalmente especificada constitui um modelo probabilstico
completo das variveis em um domnio (ou seja, ela especifica a distribuio de probabilidade
conjunta), a rede contem a informao necessria para responder todo tipo de consultas
probabilsticas sobre estas variveis (ou seja fazer inferncias sobre estas variveis). Estas
consultas podem pedir uma interpretao de um entrada de dados especfica (em termos
probabilsticos), ou mesmo fazer uma tomada de deciso, caso tenha dados suficientes para
isso. A interpretao requer a instanciao de um conjunto de variveis correspondentes com
a entrada de dados, calcular o impato destes valores instanciados sobre a probabilidades de
um conjunto de variveis (hipteses) e finalmente selecionar a combinao mais adequada
destas hipteses.
A princpio, uma vez que temos a distribuio de probabilidade conjunto, podemos obter esta
interpretao mecanicamente. Esta uma das principais utilidades das Redes Bayesianas, usar
o conhecimento incerto aprendido para inferir sobre probabilidade de eventos futuros. Este
clculo feito aplicando o teorema de Bayes recursivamente (propagation). Vale ressaltar que
este problema no caso mais geral NP-Completo e exponencial no nmero de variveis.



A boa notcia que existem alguns casos particulares que podem ser resolvidos em tempo
linear. Uma poly-tree um grafo direcionado acclico com a propriedade de para todo par de
ns ter no mximo um caminho entre os ns. Abaixo temos exemplo de um DAG que um
poly-tree e outro que no .


Para uma poly-tree o algoritmo de inferncia linear.
Na prtica so utilizados mtodos aproximados para fazer esta inferncias, mtodos como o
de Monte Carlo ou de Simulao Estocsticas.




=
=
n
i
i i n
Y s edecessore y P y y P
1
1
)) ( Pr / ( ) , , ( L
Rede Semntica


Bibliografia
[1] Klir,G.J. and Folger,T.A. Fuzzy Sets, Uncertainty and Information, Prentice Hall, 1998.
[2] Pearl, J., Probabilistic Reasoning in Intelligent Systems, Morgan Kaufmann, San Mateo,
California, 1988.
[3] Ross, S. M., Introduction to Probability Models, Elsevier, San Diego, California, 2007.

Você também pode gostar