Aula 07 IA Logica Primeira 02 2022

CIC 116653 Introdução à Inteligência Artificial
Turma A, 01/2022
PPGInf - CIC/UnB
Prof. Li Weigang
weigang@unb.br
Lógica de predicados de 1ª ordem
• Material:
• Agentes inteligentes
• Capítulo 6 – Russell & Norvig
• Seções 6.1, 6.2 e 6.3
• Contato:
weigang@unb.br
weigangbr@gmail.com
• Página web:
https://cic.unb.br/~weigang/
Introdução à Inteligência Artificial – IIA, 2020

Lógica de predicados de 1ª ordem
Introdução à Inteligência Artificial – IIA, 2020

Sumário
• Lógica de predicados de 1ª ordem
• Agente baseado em lógica de predicados para o Mundo do
Wumpus
Características
• Formalismo de referência para representação de conhecimento, o
mais estudado e o melhor formalizado
• Satisfaz em grande parte os critérios de ...
• Adequação representacional
• Permite representar o mundo (expressividade)
• Adequação inferencial
• Permite inferência
• Eficiência aquisicional
• Facilidade de adicionar conhecimento
• Modularidade
• Embora tenha problemas com legibilidade e eficiência inferencial
Engajamento ontológico (Natureza da
realidade, descrição do mundo)
• Na Lógica Proposicional, o mundo consiste em fatos
• Na Lógica de 1ª Ordem, o mundo consiste em ...
• ... objetos: “coisas” com identidade própria
Exemplo: pessoas, casas, Wumpus, caverna, etc.
• ... relações entre esses objetos
Exemplo: irmão-de, tem-cor, parte-de, adjacente, etc.
• ... propriedades, que distinguem esses objetos
Exemplo: vermelho, redondo, fundo, fedorento, etc.
• ... funções: um ou mais objetos se relacionam com um único objeto
Exemplo: dobro, distância, pai_de, etc.
Engajamento ontológico
• Além disso, LPO exprime ...
• ... fatos sobre todos objetos do universo ()
• ... fatos sobre objetos particulares ()
Exemplo: 1 + 1 = 2
objetos: 1, 2
relação: =
função: +
Exemplo: Todas as Cavernas adjacentes ao Wumpus são fedorentas
objetos: cavernas, Wumpus
propriedade: fedorentas
relação: adjacente
• No entanto, LPO não faz engajamentos ontológicos para coisas como
tempo, categorias, e eventos
Engajamento epistemológico (estados do
conhecimento - crença)
• LPO tem o mesmo engajamento epistemológico que a lógica
proposicional
• Tudo é verdadeiro ou falso
• Para tratar incerteza ...
• Outras lógicas (de n-valores, fuzzy, para-consistente, etc.)
• Probabilidade
Sintaxe
• Símbolos
• Constantes lógicas (Verdade e Falso)
• Constantes tais como A e João
• Variáveis tais como x e y
• Símbolos proposicionais tais como P e Q (sentenciais)
• Símbolos funcionais tais como f e g
• Conectivos lógicos (Ø Ù Ú Þ Û) - operadores
• Quantificadores (" e $)
• Parênteses ( ) – Sinais de pontuação
Sintaxe
• Sentenças
• <Sentença> ® <SentençaAtômica>
| <Sentença> <Conectivo> <Sentença>
| <Quantificador> <Variável>,... <Sentença>
| Ø <Sentença> | (<Sentença>)
• <SentençaAtômica> ® <Predicado>(<Termo>,...)
| <Termo> = <Termo> | Verdade | Falso
• <Termo> ® <Função>(<Termo>,...)
| <Constante> | <Variável>
• <Conectivo> ® Ù | Ú | Þ | Û
• <Quantificador> ® " | $
Semântica
• Constantes e variáveis denotam objetos
Exemplo: Caetano, aluno
• Uma interpretação especifica a que objeto no mundo cada constante e
cada variável livre se refere
• O mesmo objeto pode ser referenciado por mais de um símbolo
Exemplo: “Sheila Melo” e “A Loura do Tchan” referem-se ao mesmo objeto
(pessoa) no mundo
Semântica
• Predicados denotam propriedades e relações

• Uma interpretação especifica a que propriedade (predicados unários)
ou relação no mundo o predicado se refere
Exemplo: Irmão é um predicado binário que se refere à relação de irmandade
Irmão(Caetano, Bethânia)
Exemplo: Feio(Maguila) faz referência à propriedade feiura
Predicados e relações
• “O dia eh bonito” := B (Logica proporcional)
Sujeito Predicado
• “O carro eh bonito” := C (Logica proporcional)
Sujeito Predicado
https://www.youtube.com/watch?v=gMpi4HO2cnY&t=66s
d
• “O dia eh bonito” := Bd
Sujeito Predicado
c
• “O carro eh bonito” := Bc
Sujeito Predicado
a R
• “O avião eh rápido e bonito” := Ra ∧ Ba
Sujeito Predicado
j R m
• “João eh casado com Maria” := Cjm = Cmj
Sujeito Predicado
Relação simétrica “Aridade”: O-ario, unario, binario, ternario, n-ario
p P j
• “Pedro eh pai de Joao” := Ppj P()()
Sujeito Predicado
Relação não simétrica
B E s u
• “Brasil esta entre Suriname e Uruguai” := Ebsu E()()()
Sujeito Predicado
s B c C
• “Se o Sol Brilha, então a chuva não cai”
Bs  ØCc
Semântica
• Funções denotam relações funcionais
• uma interpretação especifica que relação funcional no mundo é
referida pelo símbolo da função, e que objetos são referidos pelos
termos que são seus argumentos
• ligam um objeto (ou mais) a um único objeto no mundo
Exemplo: Mãe(Roberto Carlos)  LadyLaura (devolve o nome da mãe do seu
argumento)
Exemplo: Nota (Zezinho)  9 (Devolve a nota do argumento Zezinho)
• Termos denotam objetos
• São constantes, variáveis ou funções
Semântica
• Sentenças atômicas (predicados + termos)
• O valor-verdade de uma sentença depende da interpretação e do
mundo
Exemplo: Irmão(Caetano, Betânia)
Exemplo: casados(PaiDe(Caetano),MãeDe(Betânia))
• Sentenças complexas
• Usa conectivos e quantificadores
• A semântica dessas sentenças é atribuída da mesma maneira que na
lógica proposicional: semântica dos conectivos + valor-verdade das
sentenças individuais
Exemplo: Irmão(Caetano, Betânia) Ù Filho(Zeca,Caetano)  Tia(Betânia,Zeca)
Semântica
• Igualdade
• Declara que dois termos se referem ao mesmo objeto
Exemplo: Mãe(Roberto Carlos) = Lady Laura
• Pode ser visto como a relação identidade
Exemplo: Para dizer que Huguinho tem pelo menos dois irmãos (Luizinho e
Zezinho), escreve-se:
$x,y Irmão(Huguinho,x) Ù Irmão(Huguinho,y) Ù Ø(x = y)
Semântica
• Quantificador universal (")
• Conjunção sobre o universo de objetos
• "(x) P(x) é verdade sse P é verdade para todos os objetos no mundo
Exemplo: "(x) Gato(x) Þ Mamífero(x)
• O valor-verdade é dado pela semântica do quantificador universal e do
conectivo Þ.
• Quantificador Existencial ($)
• Disjunção sobre o universo de objetos
• $(x) P(x) é verdade sse P é verdade para algum objeto no mundo
Exemplo: "(x) $(y) Pessoa(x) Ù Mãe(y,x)
• Conexão entre os dois quantificadores
Exemplo: "(x) Gosta(x, Banana)  $(x) Gosta(x, Banana)
Quantificação
“x eh mortal”
Px propocional
Univ. "xPx
Exist. $yPy
“Tudo eh fisico” = "xFx ≈ Fa ∧ Fb ∧ Fc ∧ Fd (a,b,c,d)
Fx := “x eh fisico”
“Tudo nao eh fisico” = "x ØFx
“Nao eh o caso que tudo eh fisico” = Ø"x Fx
equivalente: $x ØFx
“Nao eh o caso que tudo nao eh fisico” = Ø"x ØFx

equivalente: $xFx
“Existe um individuo que eh gordo e alto”
G A
$x (Gx ∧ Ax)
https://www.youtube.com/watch?v=LICgEY7cVtM&t=1s
Leis de De Morgan
• Equivalência entre sentenças quantificadas e entre sentenças
não quantificadas
"(x) ØP º Ø$(x) P ØP Ù ØQ º Ø(P Ú Q)
Ø"(x) P º $(x) ØP Ø(P Ù Q) º ØP Ú ØQ
"(x) P º Ø$(x) ØP P Ù Q º Ø(ØP Ú ØQ)
$(x) P º Ø"(x) ØPP Ú Q º Ø(ØP Ù ØQ)
• Moral da história:
• Não precisamos de ambos os quantificadores " e $ nem de ambos os
conectivos Ù e Ú ao mesmo tempo, o que é útil para melhorar a
eficiência da inferência
Leis de De Morgan
"(x) ØP º Ø$(x) P : Para todos alunos não gostam das provas, não existe pelo
menos um aluno gosta de prova;
Ø"(x) P º $(x) ØP : Não são todos brasileiros gostam de futebol, existe pelo menos
um brasileiro não gosta de futebol;
"(x) P º Ø$(x) ØP : Todas crianças gostam de sorvete, não existe uma criança
não gosta de sorvete;
$(x) P º Ø"(x) ØP: Pelo menos um brasileiro gosta de samba, não são todos
brasileiros não gostam de samba;
ØP Ù ØQ º Ø(P Ú Q) : Não gosta de corrupto e não gosta de burocracia equivalente,
não gosta de corrupto ou burocracia;
Ø(P Ù Q) º ØP Ú ØQ : Não gosta de corrupto e burocracia equivalente, não gosta de
corrupto ou não gosta de burocracia;
PÙQ º Ø(ØP Ú ØQ) : Criança e adulto gostam de sorvete, equivalente, não
existem criança não gosta de sorvete ou adulto não gosta de sorvete;
PÚQ º Ø(ØP Ù ØQ) : Criança ou adulto gostam de sorvete, equivalente, não
existem criança não gosta de sorvete e adulto não gosta de sorvete;
LPO em agentes baseados em conhecimento
função Agente-BC-PO(percepção) retorna uma ação
Tell(BC, Percepções-Sentença(percepção,t))
ação  Ask(BC, Pergunta-Ação(t))
Tell(BC, Ação-Sentença(ação,t))
tt+1
retorna ação
· Onde...
à Pergunta-Ação cria uma query tal como: $a Ação(a,6)
à ASK devolve uma lista de instanciações
{a/Pegar} – Pegar é atribuída à variável ação.
à TELL grava a ação escolhida na BC
Representação Representação Representação

do mundo lógica inicial lógica atualizada
Conhecimento de lógica Mecanismo

de inferência
· Mundo
à João possui um cachorro
à Quem possui um cachorro é amigo dos animais
à Quem ama os animais não é um matador de animais
· Lógica
à $x Cachorro(x) Ù Possui(João,x)
à "x ($y Cachorro(y) Ù Possui(x,y)) Þ AmigoAnimais(x)
à "x AmigoAnimais(x) Þ "y Animal(y) Þ ØMata(x,y)
• Axiomas = fatos estáticos
Exemplo: Pai(Caetano,Zeca), Mãe(Canô,Caetano)
• Definições = regras
Exemplo: "x,z Avó(x,z) Û $(y) Mãe(x,y) Ù Pai(y,z)
• Teoremas = fatos dinâmicos
Exemplo: Avó(Canô,Zeca)
• Assertivas = TELL, Pesquisa = ASK
• : a resposta é booleana
Exemplo: ASK(KB, Esposa(Lavígne,Caetano))  true
Exemplo: ASK(KB, x Esposa(x,Caetano) Ù Baiana(x))  false
• : a resposta é uma lista de instanciações/substituições de variáveis
Exemplo: ASK(KB, $x Esposa(x,Caetano))  {x/Lavigne,x/Dedé}
Exemplo: ASK(KB, $x Esposa(x,Caetano) Ù Baiana(x))  {x/Dedé}
Agente baseado em LPO para o mundo do Wumpus
• Interface entre o agente e o ambiente
• sentença de percepções, que inclui as percepções e o tempo
(passo) em que elas ocorreram
Exemplo: Percepção([Fedor, Brisa, Luz, nada, nada], 6)
• Ações do agente
• Girar(Direita)
• Girar(Esquerda)
• Avançar
• Atirar
• Pegar
• Soltar
• Sair
• Três arquiteturas de agentes baseados em LPO:

• Agente reativo
• Agente com modelo do mundo
• Agente baseado em objetivo
Agente reativo
• Possui regras ligando as seqüências de percepções às ações

• As regras assemelham-se a reações
Exemplo: " f,b,c,g,t Percepção([f,b,Luz,c,g], t) Þ Ação(Pegar, t)
• Essas regras dividem-se entre
• Regras de (interpretação) da percepção
Exemplo: "b,l,c,g,t Percepção([Fedor,b,l,c,g], t) Þ Fedor(t)
Exemplo: "f,l,c,g,t Percepção([f,Brisa,l,c,g], t) Þ Brisa(t)
Exemplo: "f,b,c,g,t Percepção([f,b,Luz,c,g], t) Þ Junto-do-Ouro(t)
• Regras de ação
Exemplo: "t Junto-do-Ouro (t) Þ Ação(Pegar, t)
Agente reativo
• Limitações
• Um agente ótimo deveria ...
• ... recuperar o ouro ou
• ... determinar que é muito perigoso pegar o ouro e
• ... em qualquer dos casos acima, voltar para (1,1) e sair da caverna
• Um agente reativo nunca sabe quando sair
Exemplo: Estar com o ouro e estar na caverna(1,1) não fazem parte da sua
percepção (se pegou, esqueceu)
• Esses agentes podem entrar em laços infinitos
• Para ter essas informações, o agente precisa...
• guardar uma representação do mundo
Agente com modelo do mundo
• Agentes podem ter um comportamento ótimo se ...
• ... todas as percepções são gravadas na BC
• ... existem regras para lidar com percepções passadas e presentes
• Porém, escrever essas regras dá trabalho... e é ineficiente
• Solução:
• Modelo interno do mundo = sentenças sobre o mundo atual em vez de
percepções passadas
Exemplo: “as 4h30 pegou o ouro”  “está com o ouro”
• As sentenças serão atualizadas quando receber novas percepções e
realizar ações
Exemplo: chaves no bolso, pegou o ouro,..
• Regras diacrônicas: como o mundo muda com o tempo
• Representação das mudanças do mundo

Exemplo: O agente foi de [1,1] para [1,2]
• Apagar da BC sentenças que já não são verdade
• Ruim: perdemos o conhecimento sobre o passado, o que impossibilita
previsões de diferentes futuros.
• Cada estado é representado por uma BC diferente:
• Ruim: pode explorar situações hipotéticas, porém não pode raciocinar sobre
mais de uma situação ao mesmo tempo.
Exemplo: Existiam buracos em (1,2) e (3,2)?
Exemplo: Ana foi à Disneylândia antes de completar 15 anos?
• Solução: Cálculo Situacional
• Uma maneira de escrever mudanças no tempo em LPO
• Representação de diferentes situações na mesma BC
• Cálculo Situacional
• O mundo consiste em uma seqüência de situações
• SituaçãoN –<Ação> SituaçãoN+1
• Predicados que mudam com o tempo têm um argumento de situação
adicional
Exemplo: Ao invés de Em(Agente,local) teremos
(Em(Agente,[1,1],S0) Ù Em(Agente,[1,2],S1))
• Predicados que denotam que não mudam com o tempo não necessitam de
argumentos de situação
Exemplo: Parede(0,1) e Parede(1,0)
• Para representar as mudanças no mundo: função Resultado
Exemplo: Resultado (Ação,SituaçãoN) = SituaçãoN+1
• Cálculo Situacional
Exemplo: Resultado(PraFrente,S0) = S1
Resultado(Vira(Direita),S1) = S2
Resultado(PraFrente,S2) = S3
PraFrente
Vira(Direita)
PraFrente

• As ações são descritas pelos seus efeitos
• Especificando-se as propriedades da situação resultante da realização da
ação
• Por meio dos axiomas de efeito e dos axiomas frames.
• Axiomas de efeito descrevem como o mundo muda
Exemplo: O agente estará segurando algo se ele acabou de pegá-lo
"x,s Presente(x,s) Ù Portável(x) Þ Segurando(x,Resultado(Pegar,s))
Exemplo: o agente não estará segurando nada depois de realizar uma ação de
Soltar
"x,s ØSegurando(x,Resultado(Soltar,s))
• Axiomas de frames descrevem como o mundo continua igual
Exemplo: Se o agente está segurando algo e ele não o soltou, então ele
continua segurando-o
"a,x,s Segurando(x,s) Ù (a ¹ Soltar) Þ Segurando(x,Resultado(a,s))
Exemplo: Se o agente não está segurando algo e ele não pegou nada, então ele
continua com as mãos vazias
"a,x,s ØSegurando(x,s) Ù (a ¹ Pegar Ú Ø(Presente(x,s) Ù Portável(x)) Þ
ØSegurando(x,Resultado(a,s))

• Axioma de efeito + axioma de frames = axioma estado-sucessor
• Descrição completa de como o mundo evolui
uma coisa é verdade depois Û
[uma ação acabou de torná-la verdade
Ú ela já era verdade e nenhuma ação a tornou falsa ]
Exemplo: "a,x,s Segurando(x,Resultado(a,s)) Û
[(a = Pegar Ù (Presente(x,s) Ù Portável(x))
Ú (Segurando(x,s) Ù (a ¹ Soltar)]
• É necessário escrever uma axioma estado-sucessor para cada predicado
que pode mudar seu valor no tempo
• Problemas
• Problema representacional dos frames
• Proliferação de axiomas de frames
• Foi tema de calorosos debates durante anos...
• Solução: uso do axioma do estado sucessor
• Problema inferencial dos frames
• Excesso de inferências (para atualizar todo o mundo)
• Solução: usar planejamento (só atualiza o estrito necessário)
• Problema de qualificação
• Dificuldade em enumerar todas as pré-condições de sucessor de uma
ação
• Problema da ramificação
• Dificuldade em enumerar todos os efeitos de uma ação

• Guardando localizações
• O agente precisa lembrar de por onde andou e o que viu ...
• ... para poder deduzir onde estão os buracos e o Wumpus
• ... para garantir uma exploração completa das cavernas

• A partir desses axiomas, pode-se deduzir que quadrado está em frente ao agente “ag”
que está na localização “l”
"ag,l,s Em(ag,l,s) Þ
LocalizaçãoEmFrente(ag,s) =
PróximaLocalização(l,Orientação(ag,s))
• Pode-se também definir adjacência ...
"l1,l2 Adjacente(l1,l2) Û $d l1 = PróximaLocalização(l2,d)
• ... e detalhes geográficos do mapa
"x,y Parede([x,y]) Û (x = 0 Ú x = 5 Ú y = 0 Ú y = 5)

• Resultado das ações sobre a localização do agente
• Axioma Estado-Sucessor: só indo em frente o agente
muda de localização, a não ser que haja uma parede
"a,l,ag,s Em(ag,l,Resultado(a,s)) Û
[(a = Avançar Ù l = LocalizaçãoEmFrente(ag,s) Ù
ØParede(l)) Ú (Em(ag,l,s) Ù a ¹ Avançar)]

• Efeito das ações sobre a orientação do agente
• Axioma Estado-Sucessor: girar é a única ação que
muda a direção
"a,d,ag,s Orientação(ag,Resultado(a,s)) = d Û
[(a = Girar(Direita) Ù d = Mod(Orientação(ag,s) - 90,360)
Ú (a = Girar(Esquerda) Ù d = Mod(Orientação(ag,s) + 90, 360)
Ú (Orientação(ag,s) = d Ù Ø(a = Girar(Direita) Ù a = Girar(Esquerda))]
· Deduzindo Propriedades do Mundo
à Agora que o agente sabe onde está, ele pode associar
propriedades aos locais
"l,s Em(Agente,l,s) Ù Brisa(s) Þ Ventilado(l)
"l,s Em(Agente,l,s) Ù Fedor(s) Þ Fedorento(l)
à Sabendo isto, o agente pode deduzir ...
¾ ... onde estão os buracos e o Wumpus
¾ ... quais são as cavernas seguras (predicado OK)
à Os predicados Ventilado e Fedorento não necessitam do
argumento de situação
¨Agente com modelo do mundo
· Tipos de regras
à Regras diacrônicas (“através do tempo”)
¾ Descrevem como o mundo evolui (muda ou não) com o tempo
"x,s Presente(x,s) Ù Portável(x) Þ Segurando(x,Resultado(Pegar,s))
à Regras síncronas
¾ Relacionam propriedades na mesma situação (tempo)
"l,s Em(Agente,l,s) Ù Brisa(s) Þ Ventilado(l)
¾ Axiomas que possibilitam deduzir propriedades escondidas no
mundo
¾ Principais tipos de regras síncronas: causais e de diagnóstico
· Tipos de regras
à Regras causais
¾ Assumem causalidade: algumas propriedades escondidas no
mundo causam a geração de certas percepções
Exemplos:
As cavernas adjacentes ao Wumpus são fedorentas
"l1,l2,s Em(Wumpus,l1,s) Ù Adjacente(l1,l2) Þ Fedorento(l2)
Se há fogo, há fumaça
"l,s Fogo(l,s) Þ Fumaça(l,s)
Se choveu, a grama está molhada
"x ChoveuEm(x) Þ Molhado(x)
· Sistemas que raciocinam com regras causais são
conhecidos como Sistemas Baseados em Modelos
· Tipos de regras
à Regras de diagnóstico
¾ Raciocínio abdutivo: supõe a presença de propriedades escondidas
a partir das percepções do agente
¾ Preserva a falsidade mas não a verdade
Exemplos:
A ausência de fedor ou brisa implica que esse local e os adjacentes estão
OK
"x,y,g,u,c,s Percepção([nada,nada,g,u,c],t) Ù Em(Agente,x,s) Ù
Adjacente(x,y) Þ OK(y)
Se há fumaça, há fogo
"l,s Fumaça(l,s) Þ Fogo(l,s)
Se a grama está molhada, então é porque o aguador ficou ligado
"x Molhado(x) Þ AguadorLigado(x,true)
· Tipos de regras
à A distinção entre raciocínio baseado em modelos e raciocínio
baseado em diagnóstico é importante
à É perigoso misturar esses dois tipos de regras numa mesma KB!!
Exemplo: ...  “Se choveu é porque o aguador estava ligado”
à O raciocínio baseado em modelos tem crescido na preferência
Exemplo: diagnóstico médico e de equipamentos
· Modularidade das regras
à As regras definidas até agora não são modulares
¾ Mudanças nas crenças do agente sobre algum aspecto do mundo
requerem mudanças nas regras que lidam com outros aspectos
que não mudaram
¾ Para tornar essas regras mais modulares, deve-se separar fatos
sobre ações de fatos sobre objetivo
Þ Assim, o agente pode ser “reprogramado” mudando-se o seu
objetivo
Þ Ações descrevem como alcançar resultados.
Þ Objetivos descrevem a adequação (“desirability”) de estados
resultado, não importando como foram alcançados
¾ Descreve-se a adequação das regras e se deixa que a máquina de
inferência escolha a ação mais adequada
· Modularidade das regras
à Adequação das Regras
¾ Escala, em ordem decrescente de adequação:
Þ Ações podem ser: ótimas, boas, médias, arriscadas e mortais
Þ O agente escolhe a mais adequada
"a,s Ótima(a,s) Þ Ação(a,s)
"a,s Boa(a,s) Ù (Ø$b Ótima(b,s)) Þ Ação(a,s)
"a,s Média(a,s) Ù (Ø$b (Ótima(b,s) Ú Boa(b,s) )) Þ Ação(a,s)
"a,s Arriscada(a,s) Ù (Ø$b (Ótima(b,s) Ú Boa(b,s) Ú Média(a,s)))
Þ Ação(a,s)
¾ Essas regras são gerais, podendo ser usadas em situações diferentes
Þ Uma ação arriscada na situação S0 (onde o Wumpus está vivo)
pode ser ótima na situação S2, quando o Wumpus já está morto
· Sistema de Ação-Valor
à Sistema baseado em regras de adequação
¾ Não se refere ao que a ação faz, mas a quão desejável ela é
Exemplo: prioridades do agente até encontrar o ouro

Ações ótimas: pegar o ouro quando ele é encontrado e sair das cavernas
Ações boas: mover-se para uma caverna que está OK e ainda não visitada
Ações médias: mover-se para uma caverna que está OK já visitada
Ações arriscadas: mover-se para uma caverna que não se sabe com certeza
que não é mortal, mas também não é OK
Ações mortais: mover-se para cavernas que sabidamente contêm buracos
ou o Wumpus vivo
Agentes Baseados em Objetivos
· O conjunto de ações-valores é suficiente para
prescrever uma boa estratégia de exploração
inteligente das cavernas
à Quando há uma seqüência segura de ações, acha-se o ouro
à Porém, isso é tudo o que um agente LPO pode fazer
· Depois de encontrar o ouro, a estratégia deve mudar
à Novo objetivo: estar na caverna (1,1) e sair
"s Segurando(Ouro,s) Þ LocalObjetivo([1,1],s)
· A presença de um objetivo explícito permite que se
encontre uma seqüência de ações que alcançam o
objetivo
Agente baseado em objetivos
· Como encontrar seqüências de ações
à Inferência
¾ Idéia: escrever axiomas que perguntam à BC uma seqüência de
ações que com certeza alcança o objetivo
¾ Porém, para um mundo mais complexo isto se torna muito caro
¾ Como distinguir entre boas soluções e soluções mais dispendiosas
(onde o agente anda “à toa” pelas cavernas)?
à Busca
¾ Usar Busca pela Melhor Escolha para encontrar um caminho até o
objetivo
¾ Nem sempre é fácil traduzir conhecimento em um conjunto de
operadores, e representar o problema (ambiente) em estados para
poder aplicar o algoritmo
Agente baseado em objetivos
· Como encontrar seqüências de ações
à Planejamento
¾ Envolve o uso de um sistema de raciocínio dedicado, projetado para
raciocinar sobre ações e conseqüências para objetivos diferentes
ficar rico e feliz
pegar o ouro sair das cavernas
ações e conseqüências ações e conseqüências

Capacitação Inovadora
para o Futuro das Pessoas
e Organizações

Aula 07 IA Logica Primeira 02 2022

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula 07 IA Logica Primeira 02 2022

Enviado por

Direitos autorais:

Formatos disponíveis

CIC 116653 Introdução à Inteligência Artificial

Introdução à Inteligência Artificial – IIA, 2020

Introdução à Inteligência Artificial – IIA, 2020

• Predicados denotam propriedades e relações

Relação não simétrica

“Nao eh o caso que tudo nao eh fisico” = Ø"x ØFx

Representação Representação Representação

Conhecimento de lógica Mecanismo

• Três arquiteturas de agentes baseados em LPO:

• Possui regras ligando as seqüências de percepções às ações

• Representação das mudanças do mundo

• Representação das mudanças do mundo

• Representação das mudanças do mundo

• Representação das mudanças do mundo

• Representação das mudanças do mundo

• Representação das mudanças do mundo

• Representação das mudanças do mundo

Exemplo: prioridades do agente até encontrar o ouro

ficar rico e feliz

pegar o ouro sair das cavernas

ações e conseqüências ações e conseqüências

Você também pode gostar