Aula - 3 Agentes PEAS Ambiente - Tarefas

Agentes Inteligentes, PEAS,
Ambientes e Tarefas
Prof. Alexandre Monteiro
Recife
Contatos
Prof. Guilherme Alexandre Monteiro Reinaldo
Apelido: Alexandre Cordel
E-mail/gtalk: alexandrecordel@gmail.com
greinaldo@fbv.edu.br
Site: http://www.alexandrecordel.com.br/fbv
Celular: (81) 9801-1878
Roteiro
O que um Agente Racional (Inteligente)?
Qual sua utilidade em IA?
Ambientes e arquiteturas
Aplicaes
Estado atual do conceito de agente
Agente Racional
Um programa de IA pode ser visto

como um Agente Racional.
Agente Racional aquele que faz
tudo certo, ou seja, tudo certo
visando o objetivo.
4
O que um agente
Agente qualquer entidade que:?
percebe seu ambiente atravs de sensores (ex.

cmeras, microfone, teclado, finger...)
age sobre ele atravs de atuadores (ex. vdeo, autofalante, impressora, braos, ftp, ...)
Mapeamento: seqncia de percepes => ao
ambiente
Agente
sensores
Raciocinador
atuadores
modelo do
ambiente
Medida de Desempenho
(MD)
Critrio que define o grau de SUCESSO de um agente na
realizao de uma dada tarefa
Esta medida deve ser imposta do exterior

M escolha da MD pode acarretar comportamento
indesejado
Compromissos entre objetivos mltiplos conflitantes
Resta o problema de saber quando avaliar o
desempenho
Ex. aspirador de p, provador de teoremas,
filtragem de e-mails, policial de trnsito, avaliador
de clima...
Agente Racional
(McCarthy & Hayes 69, Newell 81)

Agente Racional: fazer a melhor coisa possvel
segue o princpio da racionalidade: dada uma

seqncia de percepes, o agente escolhe, segundo
seus conhecimentos, as aes que satisfazem melhor
seu objetivo.
Problema
estado inicial + aes => estado final (objetivo)
Racionalidade Oniscincia, limitaes de:
sensores
atuadores
raciocinador (conhecimento, tempo, etc.)
Agir para obter mais dados perceptivos racional
Racionalidade vs. Oniscincia
Racionalidade: maximiza o desempenho esperado.
Medida do desempenho que define o critrio de sucesso

Conhecimento anterior que o agente tem do ambiente.
As aes que o agente pode executar
A sequncia de percepes do agente at o momento
Oniscincia: maximiza o desempenho real.

O agente sabe o resultado real de suas aes e pode agir de
acordo com ele.
Ex: Avio de Eduardo Campos, improvvel noticiar que ele foi
idiota por pegar aquele avio.
Explorao e Aprendizagem
Explorao
Tem a finalidade de modificar percepes

futuras, chamada de coleta de informaes
Conhecer mais sobre o ambiente
Apredizagem
A partir da coleta de informaes se pode

aprender
Conhecimento a priori, no exige percepo
nem aprendizagem
10
Autonomia e Utilidade
Autonomia
Capacidade de adaptao a situaes novas, para as

quais no foi fornecido todo o conhecimento
necessrio com antecedncia
Duas implementaes: aprendizagem e/ou
programao declarativa
Independncia de conhecimento anterior
Para construir um sistema inteligente, utilizamos
linguagem
inferncia
conhecimento
11
A metfora de agente
decompe
1) Problema
em:
percepes, aes, objetivos e ambiente (e outros agentes)
2) Tipo de conhecimento em:
Quais so as propriedades relevantes do mundo

Como o mundo evolui
Como identificar os estados desejveis do mundo
Como interpretar suas percepes
Quais as conseqncias de suas aes no mundo
Como medir o sucesso de suas aes
Como avaliar seus prprios conhecimentos
3) Arquitetura e mtodo de resoluo de problema
Agente
raciocnio
Agente de
Policia
Conhecimento:
- leis
- comportamento
dos indivduos,...
percepo
Ambiente
Objetivo:
- fazer com que as leis
sejam respeitadas
execuo
Aes:
- multar
- apitar
- parar, ...
Exemplos de
Agentes
Ambiente de Tarefa
PEAS (Performance, Environment, Actuators, Sensors)

desempenho, ambiente, atuadores e sensores.
Ex: Txi automatizado
Tipo de
Agente
Medida
Desempenho
Ambiente
Atuadores
Sensores
Motorista de
Txi
Viagem Segura,
rpida, dentro
da lei,
confortvel,
maximizar
lucros
Estradas,
outros tipos de
trfego,
pedestres,
clientes
Direo,
acelerador,
freio, sinal,
buzina, visor
Cmeras,
sonar,
velocmetro,
GPS,
hodmetro,
sensores do
motor, teclado
15
Proprie
dades
Classes
de ambientes
de
Fsico: robs
Software: softbots
Ambien
Realidade virtual (simulao do ambiente fsico): softbots e avatares
tes dede um ambiente
Propriedades
Tarefas
Acessvel (completamente observvel) x inacessvel (parcialmente observvel
Esttico (no muda) x dinmico (muda) semidinmico (aes)

Determinista (conhece prximo estado) x estocstico (-determinista)
Discreto x contnuo
Episdico (s depende das aes anteriores) x no-episdico (seqncial)
tamanho: nmero de percepes, aes, objetivos,...
Discreto (xadrez) x contnuo (dirigir txi)
Agente nico x multiagente
16
Ambientes: propriedades (1/2)
Acessvel: quando os sensores do agente conseguem

perceber o estado completo do ambiente.
Determinstico: o prximo estado do ambiente pode ser
completamente determinado pelo estado atual e as
aes selecionadas pelo agente.
Episdico: a experincia do agente dividida em
episdios. Cada episdio consiste em o agente perceber
e ento agir. Cada episdio no depende das aes que
ocorreram em episdios prvios.
17
Ambientes: propriedades (2/2)
Esttico: o ambiente no muda enquanto o agente est

escolhendo a ao a realizar.
Semi-dinmico: o ambiente no muda enquanto o

agente delibera, mas o "score" do agente muda.
Discreto: quando existe um nmero distinto e claramente

definido de percepes e aes em cada turno.
Contnuo: percepes e aes mudam em um espectro
contnuo de valores.
Exemplos de
Agente Ambientes
acessvel determinista
episdico
esttico
discreto
xadrez sem relgio
Sim
Sim
No
Sim
Sim
xadrez com relgio
Sim
Sim
No
Semi
sim
gamo
sim
no
no
sim
sim
motorista de taxi
No
No
No
No
No
mdico
No
No
No
No
No
tutor
No
No
No
No
Sim
Analisador de imagem
Sim
Sim
Sim
Semi
No
Busca na web
No
No
Sim
No
Sim
Filtrador de mail
Sim
No
Sim
No
Sim
Msico
Sim
No
No
No
No
+ O Tamanho do ambiente dado por:

nmero de percepes, aes e objetivos possveis
19
Algoritmo Bsico
Funo agenteSimples (percept) retorna ao

memria := atualizaMemria (memria, percept)
ao := escolheMelhorAo(memria)
memria := atualizaMemria (memria, ao)
retorna ao
Arquiteturas
Agente
Agente
Agente
Agente
Agente
Agente
tabela
reativo simples
reativo baseado em modelos
baseado em objetivos
baseado em utilidade
com aprendizagem
autonomia
complexidade
Agente Tabela (chave-valor)

sensores
ambiente
Agente
Tabela
percepes
aes
.
.
.
.
atuadores
Limitaes
Mesmo Problemas simples -> tabelas muito grandes
- ex. xadrez 30^100
Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela

No h autonomia nem flexibilidade
Este agente s tem fins didticos!!! No vale nem a pena pensar nele
Ambientes
acessvel, determinstico, episdico, esttico, discreto e minsculo!
ambiente
Agente Reativo Simples
(percepo atual)
sensores
Agente
Qual a aparncia atual do mundo?

Que ao devo executar agora?
Regras
condio-ao
atuadores
Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e eficiente
- ex. Se velocidade > 60 ento multar
No pode armazenar uma seqncia de percepes, pouca autonomia
Ambientes:
Reflexo imprescindvel em ambientes dinmicos
Acessvel, episdico, pequeno
Agente Reativo Baseado em

Modelos
sensores
Agente
ambiente
estado: como o mundo era antes
Qual a aparncia atual

mundo?
como o mundo evolui

impacto de minhas aes
Que ao devo executar

agora?
Regras
condio-ao
atuadores
Desvantagem: pouca autonomia

no tem objetivo, no encadeia regras
Ambientes: determinstico e pequeno

Ex. Tamagotchi
Controla o estado atual e depois

Agente Reativo Simples
Agente Baseado em Objetivo
ambiente
sensores
Qual a aparncia atual do
mundo?
Qual ser a aparncia se for
executada a ao A?
Que ao devo executar
agora?
Agente
como o mundo evolui
impacto de minhas aes
Objetivos
atuadores
Vantagens e desvantagens:
Mais complicado e ineficiente, porm mais flexvel, autnomo
No trata objetivos conflitantes
Ambientes: determinstico
ex.: xeque-mate no xadrez
Agente Baseado em
Utilidade
sensores
Qual a aparncia atual do
mundo?
ambiente
Agente
como o mundo evolui
Qual ser a aparncia se for

executada a ao A?
qual o impacto de
minhas aes
Este novo mundo melhor?

Que ao devo executar agora?
Funo de Utilidade
atuadores
Ambiente: sem restrio

Desvantagem: no tem adaptabilidade
Ex. motorista recifence
Agente com Aprendizado

sensores
t+1
crtico
avaliao
ambiente
t
trocas
elemento de
desempenho (agente)
conhecimento
elemento de
aprendizagem
objetivos de
aprendizagem
atuadores
Agente
Gerador de
problemas
Ambiente: sem restrio

Vantagem: tem adaptabilidade (aprende)
Ex. motorista sem o mapa da cidade
26
Simulao do Ambiente
s vezes mais conveniente simular o ambiente
mais simples
permite testes prvios
evita riscos, etc...
O ambiente (programa)
recebe os agentes como entrada
fornece repetidamente a cada um deles as percepes
corretas e recebe as aes
atualiza os dados do ambiente em funo dessas aes e de
outros processos (ex. dia-noite)
definido por um estado inicial e uma funo de atualizao
deve refletir a realidade
27
Simulao de ambiente
funo simulaAmbiente (estado,

funoAtualizao,agentes,final)
repita
para cada agente em agentes faa
Percept[agente] := pegaPercepo(agente,estado)
para cada agente em agentes faa
Action[agente] := Programa[agente] (Percept[agente])
estado := funoAtualizao(aes, agentes, estado)
scores := avaliaDesempenho(scores,agente,estado) //opcional
at final
Observao:
no cair em tentao roubando do ambiente a descrio do que
aconteceu. Usar a memria do agente!
28
Inteligncia Coletiva
Porque pensar a inteligncia/racionalidade como

propriedade de um nico indivduo?
No existe inteligncia ...
Em um time de futebol?
Em um formigueiro?
Em uma empresa (ex. correios)?
Na sociedade?
Soluo: IA Distribuda
Agentes simples que juntos resolvem problemas complexos
tendo ou no conscincia do objetivo global
Proposta por Marvin Minsky e em franca expanso...
o prprio ambiente pode ser modelado como um agente
29
IA Distribuda: dois tipos de sistemas
Resoluo distribuda de problemas

conscincia do objetivo global e diviso clara de tarefas
Exemplos: Robtica clssica, Busca na Web, Gerncia de sistemas
distribudos, ...
Sistemas Multi-agentes
no conscincia do objetivo global e nem diviso clara de tarefas
Exemplos: n-puzzle, futebol de robs, balanceamento de carga,
robtica, ...
3
7
4
5
8
2
30
Questes
Questes centrais
comunicao
negociao (ex. compra-venda na Web)
estados mentais
crena, ...
Tenso (trade-off)
Quanto mais agentes, mais simples (sub-dividido)
fica o problema
No entanto, mais complexa fica a comunicao e
coordenao entre os agentes
Mundo WUMPUS
Mundo WUMPUS
O mundo de Wumpus um problema didtico onde o objetivo encontrar um

monte de ouroem uma de 16 salas possveis.
Para isso o agente deve evitar as salas que contm poos sem fundo e a sala
onde est o Wumpus. O ambiente do mundo de Wumpus contm:
Wumpus, que monstro que devora qualquer guerreiro que entrar em sua sala.
Malha 44 de salas conectadas por passagens.
Ouro em alguma sala.
Poos sem fundo nos quais cair qualquer um que vagar por esta sala, exceto
oWumpus.
O agente pode matar o Wumpus, porm possui apenas uma flecha para fazer isso.
O agente sempre comea no quadrado identificado como [1,1] voltado para a
direita.
As posies do Wumpus, ouro e poos so escolhidas ao acaso
Mundo WUMPUS
O agente que vasculhar o mundo de Wumpus em busca do ouros possui as
seguintescaractersticas:
Medida de desempenho: +1.000 por pegar ouro, -1.000 se cair em um
poo ou fordevorado pelo Wumpus, -1 para cada ao executada, -10
pelo uso da flecha
Atuadores: O agente pode mover-se para frente, virar esquerda,
virar direita,agarrar um objeto e atirar a flecha
Sensores: fedor (quadrados adjacentes ao Wumpus, exceto diagonal),
brisa(quadrados adjacentes a um poo, exceto diagonal), resplendor
(quadrados ondeexiste ouro), impacto (ao caminhar para uma parede)
e audio (percebe o grito do Wumpus ao morrer).
Agente no conhece a configurao do ambiente.
Mundo WUMPUS
Desenvolvaum sistema que implemente um agente que explore
autonomamente oMundo de Wumpus instanciado de acordo com a
figura vista no incio desta especificao detrabalho. O sistema dever
ter as seguintes caractersticas:
Interface grfica que permita visualizar o mundo de Wumpus e a
movimentao doagente pelo conjunto de 16 salas;
Quando for encontrado o ouro, o agente dever ir para a sala que
contm o ouro eassim finalizar a execuo do programa;
Dever se levar em considerao as medidas de desempenho
apresentadas nestadescrio de trabalho, de modo que o agente
dever encontrar o ouro escolhendo ocaminho com o menor custo
possvel;
Dever ser apresentado ao usurio do sistema as atualizaes que sero
feitas nossensores do agente de acordo com as respostas fornecidas a
partir de inferncias.
35
Evoluo da noo de Agente

alm das fronteiras da IA....
36
Agente: ainda no h uma definio

nica
IBM: Intelligent agents are software entities that carry out

some set of operations on behalf of an user, and in doing so
employ some knowledge representation of the users goals
or desires
KidSim: Agent is a persistent software entity (agents have
their own ideas about how to accomplish tasks) dedicated
to a specific purpose (smaller than multifunctions
applications)
SodaBot: Software agents are programs that engage in
dialogs to negotiate and coordinate transfer of information
Antes....
Tcnicas &
Problemas
37
Agora
programas
programas
IA
agentes
inteligentes
agentes mveis,
agentes de software,
robs, ...
38
Propriedades
Autonomia (IA)
raciocnio, comportamento guiado por objetivos
reatividade
Adaptabilidade & aprendizagem (IA)
Comunicao & Cooperao (IA)
Personalidade (IA)
Continuidade temporal
Mobilidade
39
Agentes na Internet
Categorias por Tipos de Servios:
Agentes de Busca e Recuperao (ex. Altavista)

Agentes que Filtram Informaes (ex. KOM)
Agentes de Entrega Off-line (ex. PointCast)
Agentes Notificadores (ex. URL-Minder)
Agentes de Suporte ao Comrcio (ex. BargainBot)
Agente corretor (interoperabilidade - ACL)
Outros...
40
Concluses
Agentes em IA
Metodologia (metfora) para projeto de sistemas
Sistemas multi-agentes e robtica
Agentes em computao
Adoo de uma nova metfora (antropomrfica e
sociolgica). Extrapolao de OOP
- IA: autmato -> mente
- Agentes: objetos -> pessoas
Integrao de tcnicas de IA
Novas tecnologias prprias Web (ex. mobilidade)
Marketing (moda)
Agentes: tcnica ou metodologia ?
41
Desenvolvimento de software
Projeto:
inteligente
Modelar tarefa em termos de ambiente, percepes,

aes, objetivos e utilidade
Identificar o tipo de ambiente
Identificar a arquitetura de agente adequada ao
ambiente e tarefa
Implementao
o gerador e o simulador de ambientes
componentes do agente (vrios tipos de
conhecimento)
Testar o desempenho com diferentes instncias do
ambiente
Referncias
T. Mitchell. Machine Learning. McGraw Hill, New York,

1997.
Stuart Russell and Peter Norvig, Artificial Intelligence A Modern Approach. Prentice Hall, 1995.
42

Aula - 3 Agentes PEAS Ambiente - Tarefas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula - 3 Agentes PEAS Ambiente - Tarefas

Enviado por

Direitos autorais:

Formatos disponíveis

Agentes Inteligentes, PEAS,

Prof. Guilherme Alexandre Monteiro Reinaldo

Apelido: Alexandre Cordel

Celular: (81) 9801-1878

O que um Agente Racional (Inteligente)?

Qual sua utilidade em IA?

Estado atual do conceito de agente

Um programa de IA pode ser visto

Agente qualquer entidade que:?

percebe seu ambiente atravs de sensores (ex.

realizao de uma dada tarefa

Esta medida deve ser imposta do exterior

(McCarthy & Hayes 69, Newell 81)

segue o princpio da racionalidade: dada uma

estado inicial + aes => estado final (objetivo)

Racionalidade Oniscincia, limitaes de:

Racionalidade vs. Oniscincia

Racionalidade: maximiza o desempenho esperado.

Medida do desempenho que define o critrio de sucesso

Oniscincia: maximiza o desempenho real.

Tem a finalidade de modificar percepes

A partir da coleta de informaes se pode

Capacidade de adaptao a situaes novas, para as

Para construir um sistema inteligente, utilizamos

Quais so as propriedades relevantes do mundo

PEAS (Performance, Environment, Actuators, Sensors)

Esttico (no muda) x dinmico (muda) semidinmico (aes)

Ambientes: propriedades (1/2)

Acessvel: quando os sensores do agente conseguem

Ambientes: propriedades (2/2)

Esttico: o ambiente no muda enquanto o agente est

Semi-dinmico: o ambiente no muda enquanto o

Discreto: quando existe um nmero distinto e claramente

xadrez sem relgio

xadrez com relgio

+ O Tamanho do ambiente dado por:

Funo agenteSimples (percept) retorna ao

Agente Tabela (chave-valor)

Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela

Agente Reativo Simples

Qual a aparncia atual do mundo?

No pode armazenar uma seqncia de percepes, pouca autonomia

Agente Reativo Baseado em

estado: como o mundo era antes

Qual a aparncia atual

como o mundo evolui

Que ao devo executar

Desvantagem: pouca autonomia

Ambientes: determinstico e pequeno

Controla o estado atual e depois

Agente Baseado em Objetivo

impacto de minhas aes

Qual ser a aparncia se for

Este novo mundo melhor?

Ambiente: sem restrio

Agente com Aprendizado

Ambiente: sem restrio

s vezes mais conveniente simular o ambiente

funo simulaAmbiente (estado,

Porque pensar a inteligncia/racionalidade como

IA Distribuda: dois tipos de sistemas

Resoluo distribuda de problemas

O mundo de Wumpus um problema didtico onde o objetivo encontrar um