Você está na página 1de 54

CIC 116653 Introdução à Inteligência Artificial

Turma A, 01/2022

PPGInf - CIC/UnB
Prof. Li Weigang
weigang@unb.br
Lógica de predicados de 1ª ordem

• Material:
• Agentes inteligentes
• Capítulo 6 – Russell & Norvig
• Seções 6.1, 6.2 e 6.3
• Contato:
weigang@unb.br
weigangbr@gmail.com
• Página web:
https://cic.unb.br/~weigang/

Introdução à Inteligência Artificial  – IIA, 2020


Lógica de predicados de 1ª ordem

Introdução à Inteligência Artificial  – IIA, 2020


Sumário
• Lógica de predicados de 1ª ordem
• Agente baseado em lógica de predicados para o Mundo do
Wumpus
Características
• Formalismo de referência para representação de conhecimento, o
mais estudado e o melhor formalizado
• Satisfaz em grande parte os critérios de ...
• Adequação representacional
• Permite representar o mundo (expressividade)
• Adequação inferencial
• Permite inferência
• Eficiência aquisicional
• Facilidade de adicionar conhecimento
• Modularidade
• Embora tenha problemas com legibilidade e eficiência inferencial
Engajamento ontológico (Natureza da
realidade, descrição do mundo)
• Na Lógica Proposicional, o mundo consiste em fatos
• Na Lógica de 1ª Ordem, o mundo consiste em ...
• ... objetos: “coisas” com identidade própria
Exemplo: pessoas, casas, Wumpus, caverna, etc.
• ... relações entre esses objetos
Exemplo: irmão-de, tem-cor, parte-de, adjacente, etc.
• ... propriedades, que distinguem esses objetos
Exemplo: vermelho, redondo, fundo, fedorento, etc.
• ... funções: um ou mais objetos se relacionam com um único objeto
Exemplo: dobro, distância, pai_de, etc.
Engajamento ontológico
• Além disso, LPO exprime ...
• ... fatos sobre todos objetos do universo ()
• ... fatos sobre objetos particulares ()
Exemplo: 1 + 1 = 2
objetos: 1, 2
relação: =
função: +
Exemplo: Todas as Cavernas adjacentes ao Wumpus são fedorentas
objetos: cavernas, Wumpus
propriedade: fedorentas
relação: adjacente
• No entanto, LPO não faz engajamentos ontológicos para coisas como
tempo, categorias, e eventos
Engajamento epistemológico (estados do
conhecimento - crença)
• LPO tem o mesmo engajamento epistemológico que a lógica
proposicional
• Tudo é verdadeiro ou falso
• Para tratar incerteza ...
• Outras lógicas (de n-valores, fuzzy, para-consistente, etc.)
• Probabilidade
Sintaxe
• Símbolos
• Constantes lógicas (Verdade e Falso)
• Constantes tais como A e João
• Variáveis tais como x e y
• Símbolos proposicionais tais como P e Q (sentenciais)
• Símbolos funcionais tais como f e g
• Conectivos lógicos (Ø Ù Ú Þ Û) - operadores
• Quantificadores (" e $)
• Parênteses ( ) – Sinais de pontuação
Sintaxe
• Sentenças
• <Sentença> ® <SentençaAtômica>
| <Sentença> <Conectivo> <Sentença>
| <Quantificador> <Variável>,... <Sentença>
| Ø <Sentença> | (<Sentença>)
• <SentençaAtômica> ® <Predicado>(<Termo>,...)
| <Termo> = <Termo> | Verdade | Falso
• <Termo> ® <Função>(<Termo>,...)
| <Constante> | <Variável>
• <Conectivo> ® Ù | Ú | Þ | Û
• <Quantificador> ® " | $
Semântica
• Constantes e variáveis denotam objetos
Exemplo: Caetano, aluno
• Uma interpretação especifica a que objeto no mundo cada constante e
cada variável livre se refere
• O mesmo objeto pode ser referenciado por mais de um símbolo
Exemplo: “Sheila Melo” e “A Loura do Tchan” referem-se ao mesmo objeto
(pessoa) no mundo
Semântica

• Predicados denotam propriedades e relações


• Uma interpretação especifica a que propriedade (predicados unários)
ou relação no mundo o predicado se refere
Exemplo: Irmão é um predicado binário que se refere à relação de irmandade
Irmão(Caetano, Bethânia)
Exemplo: Feio(Maguila) faz referência à propriedade feiura
Predicados e relações
• “O dia eh bonito” := B (Logica proporcional)
Sujeito Predicado
• “O carro eh bonito” := C (Logica proporcional)
Sujeito Predicado

https://www.youtube.com/watch?v=gMpi4HO2cnY&t=66s
Predicados e relações
d
• “O dia eh bonito” := Bd
Sujeito Predicado
c
• “O carro eh bonito” := Bc
Sujeito Predicado
a R
• “O avião eh rápido e bonito” := Ra ∧ Ba
Sujeito Predicado
Predicados e relações
j R m
• “João eh casado com Maria” := Cjm = Cmj
Sujeito Predicado
Relação simétrica “Aridade”: O-ario, unario, binario, ternario, n-ario
p P j
• “Pedro eh pai de Joao” := Ppj P()()
Sujeito Predicado

Relação não simétrica

B E s u
• “Brasil esta entre Suriname e Uruguai” := Ebsu E()()()
Sujeito Predicado
Predicados e relações
s B c C
• “Se o Sol Brilha, então a chuva não cai”
Bs  ØCc
Semântica
• Funções denotam relações funcionais
• uma interpretação especifica que relação funcional no mundo é
referida pelo símbolo da função, e que objetos são referidos pelos
termos que são seus argumentos
• ligam um objeto (ou mais) a um único objeto no mundo
Exemplo: Mãe(Roberto Carlos)  LadyLaura (devolve o nome da mãe do seu
argumento)
Exemplo: Nota (Zezinho)  9 (Devolve a nota do argumento Zezinho)
• Termos denotam objetos
• São constantes, variáveis ou funções
Semântica
• Sentenças atômicas (predicados + termos)
• O valor-verdade de uma sentença depende da interpretação e do
mundo
Exemplo: Irmão(Caetano, Betânia)
Exemplo: casados(PaiDe(Caetano),MãeDe(Betânia))
• Sentenças complexas
• Usa conectivos e quantificadores
• A semântica dessas sentenças é atribuída da mesma maneira que na
lógica proposicional: semântica dos conectivos + valor-verdade das
sentenças individuais
Exemplo: Irmão(Caetano, Betânia) Ù Filho(Zeca,Caetano)  Tia(Betânia,Zeca)
Semântica
• Igualdade
• Declara que dois termos se referem ao mesmo objeto
Exemplo: Mãe(Roberto Carlos) = Lady Laura
• Pode ser visto como a relação identidade
Exemplo: Para dizer que Huguinho tem pelo menos dois irmãos (Luizinho e
Zezinho), escreve-se:
$x,y Irmão(Huguinho,x) Ù Irmão(Huguinho,y) Ù Ø(x = y)
Semântica
• Quantificador universal (")
• Conjunção sobre o universo de objetos
• "(x) P(x) é verdade sse P é verdade para todos os objetos no mundo
Exemplo: "(x) Gato(x) Þ Mamífero(x)
• O valor-verdade é dado pela semântica do quantificador universal e do
conectivo Þ.
• Quantificador Existencial ($)
• Disjunção sobre o universo de objetos
• $(x) P(x) é verdade sse P é verdade para algum objeto no mundo
Exemplo: "(x) $(y) Pessoa(x) Ù Mãe(y,x)
• Conexão entre os dois quantificadores
Exemplo: "(x) Gosta(x, Banana)  $(x) Gosta(x, Banana)
Quantificação
“x eh mortal”
Px propocional
Univ. "xPx
Exist. $yPy
“Tudo eh fisico” = "xFx ≈ Fa ∧ Fb ∧ Fc ∧ Fd (a,b,c,d)
Fx := “x eh fisico”
“Tudo nao eh fisico” = "x ØFx
“Nao eh o caso que tudo eh fisico” = Ø"x Fx
equivalente: $x ØFx

“Nao eh o caso que tudo nao eh fisico” = Ø"x ØFx


equivalente: $xFx
“Existe um individuo que eh gordo e alto”
G A
$x (Gx ∧ Ax)

https://www.youtube.com/watch?v=LICgEY7cVtM&t=1s
Leis de De Morgan
• Equivalência entre sentenças quantificadas e entre sentenças
não quantificadas
"(x) ØP º Ø$(x) P ØP Ù ØQ º Ø(P Ú Q)
Ø"(x) P º $(x) ØP Ø(P Ù Q) º ØP Ú ØQ
"(x) P º Ø$(x) ØP P Ù Q º Ø(ØP Ú ØQ)
$(x) P º Ø"(x) ØPP Ú Q º Ø(ØP Ù ØQ)
• Moral da história:
• Não precisamos de ambos os quantificadores " e $ nem de ambos os
conectivos Ù e Ú ao mesmo tempo, o que é útil para melhorar a
eficiência da inferência
Leis de De Morgan
"(x) ØP º Ø$(x) P : Para todos alunos não gostam das provas, não existe pelo
menos um aluno gosta de prova;
Ø"(x) P º $(x) ØP : Não são todos brasileiros gostam de futebol, existe pelo menos
um brasileiro não gosta de futebol;
"(x) P º Ø$(x) ØP : Todas crianças gostam de sorvete, não existe uma criança
não gosta de sorvete;
$(x) P º Ø"(x) ØP: Pelo menos um brasileiro gosta de samba, não são todos
brasileiros não gostam de samba;
ØP Ù ØQ º Ø(P Ú Q) : Não gosta de corrupto e não gosta de burocracia equivalente,
não gosta de corrupto ou burocracia;
Ø(P Ù Q) º ØP Ú ØQ : Não gosta de corrupto e burocracia equivalente, não gosta de
corrupto ou não gosta de burocracia;
PÙQ º Ø(ØP Ú ØQ) : Criança e adulto gostam de sorvete, equivalente, não
existem criança não gosta de sorvete ou adulto não gosta de sorvete;
PÚQ º Ø(ØP Ù ØQ) : Criança ou adulto gostam de sorvete, equivalente, não
existem criança não gosta de sorvete e adulto não gosta de sorvete;
LPO em agentes baseados em conhecimento
função Agente-BC-PO(percepção) retorna uma ação
Tell(BC, Percepções-Sentença(percepção,t))
ação  Ask(BC, Pergunta-Ação(t))
Tell(BC, Ação-Sentença(ação,t))
tt+1
retorna ação

· Onde...
à Pergunta-Ação cria uma query tal como: $a Ação(a,6)
à ASK devolve uma lista de instanciações
{a/Pegar} – Pegar é atribuída à variável ação.
à TELL grava a ação escolhida na BC
LPO em agentes baseados em conhecimento

Representação Representação Representação


do mundo lógica inicial lógica atualizada

Conhecimento de lógica Mecanismo


de inferência
· Mundo
à João possui um cachorro
à Quem possui um cachorro é amigo dos animais
à Quem ama os animais não é um matador de animais
· Lógica
à $x Cachorro(x) Ù Possui(João,x)
à "x ($y Cachorro(y) Ù Possui(x,y)) Þ AmigoAnimais(x)
à "x AmigoAnimais(x) Þ "y Animal(y) Þ ØMata(x,y)
LPO em agentes baseados em conhecimento
• Axiomas = fatos estáticos
Exemplo: Pai(Caetano,Zeca), Mãe(Canô,Caetano)
• Definições = regras
Exemplo: "x,z Avó(x,z) Û $(y) Mãe(x,y) Ù Pai(y,z)
• Teoremas = fatos dinâmicos
Exemplo: Avó(Canô,Zeca)
• Assertivas = TELL, Pesquisa = ASK
• : a resposta é booleana
Exemplo: ASK(KB, Esposa(Lavígne,Caetano))  true
Exemplo: ASK(KB, x Esposa(x,Caetano) Ù Baiana(x))  false
• : a resposta é uma lista de instanciações/substituições de variáveis
Exemplo: ASK(KB, $x Esposa(x,Caetano))  {x/Lavigne,x/Dedé}
Exemplo: ASK(KB, $x Esposa(x,Caetano) Ù Baiana(x))  {x/Dedé}
Agente baseado em LPO para o mundo do Wumpus
• Interface entre o agente e o ambiente
• sentença de percepções, que inclui as percepções e o tempo
(passo) em que elas ocorreram
Exemplo: Percepção([Fedor, Brisa, Luz, nada, nada], 6)

• Ações do agente
• Girar(Direita)
• Girar(Esquerda)
• Avançar
• Atirar
• Pegar
• Soltar
• Sair
Agente baseado em LPO para o mundo do Wumpus

• Três arquiteturas de agentes baseados em LPO:


• Agente reativo
• Agente com modelo do mundo
• Agente baseado em objetivo
Agente reativo

• Possui regras ligando as seqüências de percepções às ações


• As regras assemelham-se a reações
Exemplo: " f,b,c,g,t Percepção([f,b,Luz,c,g], t) Þ Ação(Pegar, t)
• Essas regras dividem-se entre
• Regras de (interpretação) da percepção
Exemplo: "b,l,c,g,t Percepção([Fedor,b,l,c,g], t) Þ Fedor(t)
Exemplo: "f,l,c,g,t Percepção([f,Brisa,l,c,g], t) Þ Brisa(t)
Exemplo: "f,b,c,g,t Percepção([f,b,Luz,c,g], t) Þ Junto-do-Ouro(t)
• Regras de ação
Exemplo: "t Junto-do-Ouro (t) Þ Ação(Pegar, t)
Agente reativo

• Limitações
• Um agente ótimo deveria ...
• ... recuperar o ouro ou
• ... determinar que é muito perigoso pegar o ouro e
• ... em qualquer dos casos acima, voltar para (1,1) e sair da caverna
• Um agente reativo nunca sabe quando sair
Exemplo: Estar com o ouro e estar na caverna(1,1) não fazem parte da sua
percepção (se pegou, esqueceu)
• Esses agentes podem entrar em laços infinitos
• Para ter essas informações, o agente precisa...
• guardar uma representação do mundo
Agente com modelo do mundo
• Agentes podem ter um comportamento ótimo se ...
• ... todas as percepções são gravadas na BC
• ... existem regras para lidar com percepções passadas e presentes
• Porém, escrever essas regras dá trabalho... e é ineficiente
• Solução:
• Modelo interno do mundo = sentenças sobre o mundo atual em vez de
percepções passadas
Exemplo: “as 4h30 pegou o ouro”  “está com o ouro”
• As sentenças serão atualizadas quando receber novas percepções e
realizar ações
Exemplo: chaves no bolso, pegou o ouro,..
• Regras diacrônicas: como o mundo muda com o tempo
Agente com modelo do mundo

• Representação das mudanças do mundo


Exemplo: O agente foi de [1,1] para [1,2]
• Apagar da BC sentenças que já não são verdade
• Ruim: perdemos o conhecimento sobre o passado, o que impossibilita
previsões de diferentes futuros.
• Cada estado é representado por uma BC diferente:
• Ruim: pode explorar situações hipotéticas, porém não pode raciocinar sobre
mais de uma situação ao mesmo tempo.
Exemplo: Existiam buracos em (1,2) e (3,2)?
Exemplo: Ana foi à Disneylândia antes de completar 15 anos?
• Solução: Cálculo Situacional
• Uma maneira de escrever mudanças no tempo em LPO
• Representação de diferentes situações na mesma BC
Agente com modelo do mundo
• Representação das mudanças do mundo
• Cálculo Situacional
• O mundo consiste em uma seqüência de situações
• SituaçãoN –<Ação> SituaçãoN+1
• Predicados que mudam com o tempo têm um argumento de situação
adicional
Exemplo: Ao invés de Em(Agente,local) teremos
(Em(Agente,[1,1],S0) Ù Em(Agente,[1,2],S1))
• Predicados que denotam que não mudam com o tempo não necessitam de
argumentos de situação
Exemplo: Parede(0,1) e Parede(1,0)
• Para representar as mudanças no mundo: função Resultado
Exemplo: Resultado (Ação,SituaçãoN) = SituaçãoN+1
Agente com modelo do mundo
• Representação das mudanças do mundo
• Cálculo Situacional
Exemplo: Resultado(PraFrente,S0) = S1
Resultado(Vira(Direita),S1) = S2
Resultado(PraFrente,S2) = S3

PraFrente

Vira(Direita)

PraFrente
Agente com modelo do mundo

• Representação das mudanças do mundo


• As ações são descritas pelos seus efeitos
• Especificando-se as propriedades da situação resultante da realização da
ação
• Por meio dos axiomas de efeito e dos axiomas frames.
Agente com modelo do mundo
• Representação das mudanças do mundo
• Axiomas de efeito descrevem como o mundo muda
Exemplo: O agente estará segurando algo se ele acabou de pegá-lo
"x,s Presente(x,s) Ù Portável(x) Þ Segurando(x,Resultado(Pegar,s))
Exemplo: o agente não estará segurando nada depois de realizar uma ação de
Soltar
"x,s ØSegurando(x,Resultado(Soltar,s))
• Axiomas de frames descrevem como o mundo continua igual
Exemplo: Se o agente está segurando algo e ele não o soltou, então ele
continua segurando-o
"a,x,s Segurando(x,s) Ù (a ¹ Soltar) Þ Segurando(x,Resultado(a,s))
Exemplo: Se o agente não está segurando algo e ele não pegou nada, então ele
continua com as mãos vazias
"a,x,s ØSegurando(x,s) Ù (a ¹ Pegar Ú Ø(Presente(x,s) Ù Portável(x)) Þ
ØSegurando(x,Resultado(a,s))
Agente com modelo do mundo

• Representação das mudanças do mundo


• Axioma de efeito + axioma de frames = axioma estado-sucessor
• Descrição completa de como o mundo evolui
uma coisa é verdade depois Û
[uma ação acabou de torná-la verdade
Ú ela já era verdade e nenhuma ação a tornou falsa ]
Exemplo: "a,x,s Segurando(x,Resultado(a,s)) Û
[(a = Pegar Ù (Presente(x,s) Ù Portável(x))
Ú (Segurando(x,s) Ù (a ¹ Soltar)]
• É necessário escrever uma axioma estado-sucessor para cada predicado
que pode mudar seu valor no tempo
Agente com modelo do mundo
• Representação das mudanças do mundo
• Problemas
• Problema representacional dos frames
• Proliferação de axiomas de frames
• Foi tema de calorosos debates durante anos...
• Solução: uso do axioma do estado sucessor
• Problema inferencial dos frames
• Excesso de inferências (para atualizar todo o mundo)
• Solução: usar planejamento (só atualiza o estrito necessário)
• Problema de qualificação
• Dificuldade em enumerar todas as pré-condições de sucessor de uma
ação
• Problema da ramificação
• Dificuldade em enumerar todos os efeitos de uma ação
Agente com modelo do mundo

• Representação das mudanças do mundo


• Guardando localizações
• O agente precisa lembrar de por onde andou e o que viu ...
• ... para poder deduzir onde estão os buracos e o Wumpus
• ... para garantir uma exploração completa das cavernas
Agente com modelo do mundo

• Representação das mudanças do mundo


• Guardando localizações
• A partir desses axiomas, pode-se deduzir que quadrado está em frente ao agente “ag”
que está na localização “l”
"ag,l,s Em(ag,l,s) Þ
LocalizaçãoEmFrente(ag,s) =
PróximaLocalização(l,Orientação(ag,s))
• Pode-se também definir adjacência ...
"l1,l2 Adjacente(l1,l2) Û $d l1 = PróximaLocalização(l2,d)
• ... e detalhes geográficos do mapa
"x,y Parede([x,y]) Û (x = 0 Ú x = 5 Ú y = 0 Ú y = 5)
Agente com modelo do mundo

• Representação das mudanças do mundo


• Guardando localizações
• Resultado das ações sobre a localização do agente
• Axioma Estado-Sucessor: só indo em frente o agente
muda de localização, a não ser que haja uma parede
"a,l,ag,s Em(ag,l,Resultado(a,s)) Û
[(a = Avançar Ù l = LocalizaçãoEmFrente(ag,s) Ù
ØParede(l)) Ú (Em(ag,l,s) Ù a ¹ Avançar)]
Agente com modelo do mundo

• Representação das mudanças do mundo


• Guardando localizações
• Efeito das ações sobre a orientação do agente
• Axioma Estado-Sucessor: girar é a única ação que
muda a direção
"a,d,ag,s Orientação(ag,Resultado(a,s)) = d Û
[(a = Girar(Direita) Ù d = Mod(Orientação(ag,s) - 90,360)
Ú (a = Girar(Esquerda) Ù d = Mod(Orientação(ag,s) + 90, 360)
Ú (Orientação(ag,s) = d Ù Ø(a = Girar(Direita) Ù a = Girar(Esquerda))]
Agente com modelo do mundo
· Deduzindo Propriedades do Mundo
à Agora que o agente sabe onde está, ele pode associar
propriedades aos locais
"l,s Em(Agente,l,s) Ù Brisa(s) Þ Ventilado(l)
"l,s Em(Agente,l,s) Ù Fedor(s) Þ Fedorento(l)
à Sabendo isto, o agente pode deduzir ...
¾ ... onde estão os buracos e o Wumpus
¾ ... quais são as cavernas seguras (predicado OK)
à Os predicados Ventilado e Fedorento não necessitam do
argumento de situação
Agente baseado em LPO para o mundo do Wumpus
¨Agente com modelo do mundo
· Tipos de regras
à Regras diacrônicas (“através do tempo”)
¾ Descrevem como o mundo evolui (muda ou não) com o tempo
"x,s Presente(x,s) Ù Portável(x) Þ Segurando(x,Resultado(Pegar,s))
à Regras síncronas
¾ Relacionam propriedades na mesma situação (tempo)
"l,s Em(Agente,l,s) Ù Brisa(s) Þ Ventilado(l)
¾ Axiomas que possibilitam deduzir propriedades escondidas no
mundo
¾ Principais tipos de regras síncronas: causais e de diagnóstico
Agente com modelo do mundo
· Tipos de regras
à Regras causais
¾ Assumem causalidade: algumas propriedades escondidas no
mundo causam a geração de certas percepções
Exemplos:
As cavernas adjacentes ao Wumpus são fedorentas
"l1,l2,s Em(Wumpus,l1,s) Ù Adjacente(l1,l2) Þ Fedorento(l2)
Se há fogo, há fumaça
"l,s Fogo(l,s) Þ Fumaça(l,s)
Se choveu, a grama está molhada
"x ChoveuEm(x) Þ Molhado(x)
· Sistemas que raciocinam com regras causais são
conhecidos como Sistemas Baseados em Modelos
Agente com modelo do mundo
· Tipos de regras
à Regras de diagnóstico
¾ Raciocínio abdutivo: supõe a presença de propriedades escondidas
a partir das percepções do agente
¾ Preserva a falsidade mas não a verdade
Exemplos:
A ausência de fedor ou brisa implica que esse local e os adjacentes estão
OK
"x,y,g,u,c,s Percepção([nada,nada,g,u,c],t) Ù Em(Agente,x,s) Ù
Adjacente(x,y) Þ OK(y)
Se há fumaça, há fogo
"l,s Fumaça(l,s) Þ Fogo(l,s)
Se a grama está molhada, então é porque o aguador ficou ligado
"x Molhado(x) Þ AguadorLigado(x,true)
Agente com modelo do mundo
· Tipos de regras
à A distinção entre raciocínio baseado em modelos e raciocínio
baseado em diagnóstico é importante
à É perigoso misturar esses dois tipos de regras numa mesma KB!!
Exemplo: ...  “Se choveu é porque o aguador estava ligado”
à O raciocínio baseado em modelos tem crescido na preferência
Exemplo: diagnóstico médico e de equipamentos
Agente com modelo do mundo
· Modularidade das regras
à As regras definidas até agora não são modulares
¾ Mudanças nas crenças do agente sobre algum aspecto do mundo
requerem mudanças nas regras que lidam com outros aspectos
que não mudaram
¾ Para tornar essas regras mais modulares, deve-se separar fatos
sobre ações de fatos sobre objetivo
Þ Assim, o agente pode ser “reprogramado” mudando-se o seu
objetivo
Þ Ações descrevem como alcançar resultados.
Þ Objetivos descrevem a adequação (“desirability”) de estados
resultado, não importando como foram alcançados
¾ Descreve-se a adequação das regras e se deixa que a máquina de
inferência escolha a ação mais adequada
Agente com modelo do mundo
· Modularidade das regras
à Adequação das Regras
¾ Escala, em ordem decrescente de adequação:
Þ Ações podem ser: ótimas, boas, médias, arriscadas e mortais
Þ O agente escolhe a mais adequada
"a,s Ótima(a,s) Þ Ação(a,s)
"a,s Boa(a,s) Ù (Ø$b Ótima(b,s)) Þ Ação(a,s)
"a,s Média(a,s) Ù (Ø$b (Ótima(b,s) Ú Boa(b,s) )) Þ Ação(a,s)
"a,s Arriscada(a,s) Ù (Ø$b (Ótima(b,s) Ú Boa(b,s) Ú Média(a,s)))
Þ Ação(a,s)
¾ Essas regras são gerais, podendo ser usadas em situações diferentes
Þ Uma ação arriscada na situação S0 (onde o Wumpus está vivo)
pode ser ótima na situação S2, quando o Wumpus já está morto
Agente com modelo do mundo
· Sistema de Ação-Valor
à Sistema baseado em regras de adequação
¾ Não se refere ao que a ação faz, mas a quão desejável ela é

Exemplo: prioridades do agente até encontrar o ouro


Ações ótimas: pegar o ouro quando ele é encontrado e sair das cavernas
Ações boas: mover-se para uma caverna que está OK e ainda não visitada
Ações médias: mover-se para uma caverna que está OK já visitada
Ações arriscadas: mover-se para uma caverna que não se sabe com certeza
que não é mortal, mas também não é OK
Ações mortais: mover-se para cavernas que sabidamente contêm buracos
ou o Wumpus vivo
Agentes Baseados em Objetivos
· O conjunto de ações-valores é suficiente para
prescrever uma boa estratégia de exploração
inteligente das cavernas
à Quando há uma seqüência segura de ações, acha-se o ouro
à Porém, isso é tudo o que um agente LPO pode fazer
· Depois de encontrar o ouro, a estratégia deve mudar
à Novo objetivo: estar na caverna (1,1) e sair
"s Segurando(Ouro,s) Þ LocalObjetivo([1,1],s)
· A presença de um objetivo explícito permite que se
encontre uma seqüência de ações que alcançam o
objetivo
Agente baseado em objetivos
· Como encontrar seqüências de ações
à Inferência
¾ Idéia: escrever axiomas que perguntam à BC uma seqüência de
ações que com certeza alcança o objetivo
¾ Porém, para um mundo mais complexo isto se torna muito caro
¾ Como distinguir entre boas soluções e soluções mais dispendiosas
(onde o agente anda “à toa” pelas cavernas)?
à Busca
¾ Usar Busca pela Melhor Escolha para encontrar um caminho até o
objetivo
¾ Nem sempre é fácil traduzir conhecimento em um conjunto de
operadores, e representar o problema (ambiente) em estados para
poder aplicar o algoritmo
Agente baseado em objetivos
· Como encontrar seqüências de ações
à Planejamento
¾ Envolve o uso de um sistema de raciocínio dedicado, projetado para
raciocinar sobre ações e conseqüências para objetivos diferentes

ficar rico e feliz

pegar o ouro sair das cavernas

ações e conseqüências ações e conseqüências


Capacitação Inovadora
para o Futuro das Pessoas
e Organizações

Você também pode gostar