Você está na página 1de 42

Agentes Inteligentes, PEAS,

Ambientes e Tarefas
Prof. Alexandre Monteiro
Recife

Contatos

Prof. Guilherme Alexandre Monteiro Reinaldo

Apelido: Alexandre Cordel

E-mail/gtalk: alexandrecordel@gmail.com
greinaldo@fbv.edu.br

Site: http://www.alexandrecordel.com.br/fbv

Celular: (81) 9801-1878

Roteiro

O que um Agente Racional (Inteligente)?

Qual sua utilidade em IA?

Ambientes e arquiteturas

Aplicaes

Estado atual do conceito de agente

Agente Racional

Um programa de IA pode ser visto


como um Agente Racional.
Agente Racional aquele que faz
tudo certo, ou seja, tudo certo
visando o objetivo.
4

O que um agente

Agente qualquer entidade que:?

percebe seu ambiente atravs de sensores (ex.


cmeras, microfone, teclado, finger...)
age sobre ele atravs de atuadores (ex. vdeo, autofalante, impressora, braos, ftp, ...)
Mapeamento: seqncia de percepes => ao
ambiente

Agente

sensores

Raciocinador

atuadores

modelo do
ambiente

Medida de Desempenho
(MD)
Critrio que define o grau de SUCESSO de um agente na

realizao de uma dada tarefa

Esta medida deve ser imposta do exterior


M escolha da MD pode acarretar comportamento
indesejado
Compromissos entre objetivos mltiplos conflitantes
Resta o problema de saber quando avaliar o
desempenho
Ex. aspirador de p, provador de teoremas,
filtragem de e-mails, policial de trnsito, avaliador
de clima...

Agente Racional

(McCarthy & Hayes 69, Newell 81)


Agente Racional: fazer a melhor coisa possvel

segue o princpio da racionalidade: dada uma


seqncia de percepes, o agente escolhe, segundo
seus conhecimentos, as aes que satisfazem melhor
seu objetivo.

Problema

estado inicial + aes => estado final (objetivo)

Racionalidade Oniscincia, limitaes de:

sensores
atuadores
raciocinador (conhecimento, tempo, etc.)
Agir para obter mais dados perceptivos racional

Racionalidade vs. Oniscincia

Racionalidade: maximiza o desempenho esperado.

Medida do desempenho que define o critrio de sucesso


Conhecimento anterior que o agente tem do ambiente.
As aes que o agente pode executar
A sequncia de percepes do agente at o momento

Oniscincia: maximiza o desempenho real.


O agente sabe o resultado real de suas aes e pode agir de
acordo com ele.
Ex: Avio de Eduardo Campos, improvvel noticiar que ele foi
idiota por pegar aquele avio.

Explorao e Aprendizagem

Explorao

Tem a finalidade de modificar percepes


futuras, chamada de coleta de informaes
Conhecer mais sobre o ambiente

Apredizagem

A partir da coleta de informaes se pode


aprender
Conhecimento a priori, no exige percepo
nem aprendizagem

10

Autonomia e Utilidade

Autonomia

Capacidade de adaptao a situaes novas, para as


quais no foi fornecido todo o conhecimento
necessrio com antecedncia
Duas implementaes: aprendizagem e/ou
programao declarativa
Independncia de conhecimento anterior

Para construir um sistema inteligente, utilizamos

linguagem
inferncia
conhecimento

11

A metfora de agente
decompe
1) Problema
em:
percepes, aes, objetivos e ambiente (e outros agentes)
2) Tipo de conhecimento em:

Quais so as propriedades relevantes do mundo


Como o mundo evolui
Como identificar os estados desejveis do mundo
Como interpretar suas percepes
Quais as conseqncias de suas aes no mundo
Como medir o sucesso de suas aes
Como avaliar seus prprios conhecimentos
3) Arquitetura e mtodo de resoluo de problema

Agente

raciocnio

Agente de
Policia

Conhecimento:
- leis
- comportamento
dos indivduos,...

percepo

Ambiente

Objetivo:
- fazer com que as leis
sejam respeitadas

execuo

Aes:
- multar
- apitar
- parar, ...

Exemplos de
Agentes

Ambiente de Tarefa

PEAS (Performance, Environment, Actuators, Sensors)


desempenho, ambiente, atuadores e sensores.
Ex: Txi automatizado

Tipo de
Agente

Medida
Desempenho

Ambiente

Atuadores

Sensores

Motorista de
Txi

Viagem Segura,
rpida, dentro
da lei,
confortvel,
maximizar
lucros

Estradas,
outros tipos de
trfego,
pedestres,
clientes

Direo,
acelerador,
freio, sinal,
buzina, visor

Cmeras,
sonar,
velocmetro,
GPS,
hodmetro,
sensores do
motor, teclado

15

Proprie
dades
Classes
de ambientes
de
Fsico: robs
Software: softbots
Ambien
Realidade virtual (simulao do ambiente fsico): softbots e avatares
tes dede um ambiente
Propriedades
Tarefas
Acessvel (completamente observvel) x inacessvel (parcialmente observvel

Esttico (no muda) x dinmico (muda) semidinmico (aes)


Determinista (conhece prximo estado) x estocstico (-determinista)
Discreto x contnuo
Episdico (s depende das aes anteriores) x no-episdico (seqncial)
tamanho: nmero de percepes, aes, objetivos,...
Discreto (xadrez) x contnuo (dirigir txi)
Agente nico x multiagente

16

Ambientes: propriedades (1/2)

Acessvel: quando os sensores do agente conseguem


perceber o estado completo do ambiente.
Determinstico: o prximo estado do ambiente pode ser
completamente determinado pelo estado atual e as
aes selecionadas pelo agente.
Episdico: a experincia do agente dividida em
episdios. Cada episdio consiste em o agente perceber
e ento agir. Cada episdio no depende das aes que
ocorreram em episdios prvios.

17

Ambientes: propriedades (2/2)

Esttico: o ambiente no muda enquanto o agente est


escolhendo a ao a realizar.

Semi-dinmico: o ambiente no muda enquanto o


agente delibera, mas o "score" do agente muda.

Discreto: quando existe um nmero distinto e claramente


definido de percepes e aes em cada turno.
Contnuo: percepes e aes mudam em um espectro
contnuo de valores.

Exemplos de
Agente Ambientes
acessvel determinista

episdico

esttico

discreto

xadrez sem relgio

Sim

Sim

No

Sim

Sim

xadrez com relgio

Sim

Sim

No

Semi

sim

gamo

sim

no

no

sim

sim

motorista de taxi

No

No

No

No

No

mdico

No

No

No

No

No

tutor

No

No

No

No

Sim

Analisador de imagem

Sim

Sim

Sim

Semi

No

Busca na web

No

No

Sim

No

Sim

Filtrador de mail

Sim

No

Sim

No

Sim

Msico

Sim

No

No

No

No

+ O Tamanho do ambiente dado por:


nmero de percepes, aes e objetivos possveis

19

Algoritmo Bsico

Funo agenteSimples (percept) retorna ao


memria := atualizaMemria (memria, percept)
ao := escolheMelhorAo(memria)
memria := atualizaMemria (memria, ao)
retorna ao

Arquiteturas

Agente
Agente
Agente
Agente
Agente
Agente

tabela
reativo simples
reativo baseado em modelos
baseado em objetivos
baseado em utilidade
com aprendizagem
autonomia
complexidade

Agente Tabela (chave-valor)


sensores
ambiente

Agente

Tabela
percepes
aes
.
.
.
.

atuadores

Limitaes
Mesmo Problemas simples -> tabelas muito grandes
- ex. xadrez 30^100

Nem sempre possvel, por ignorncia ou questo de tempo, construir a tabela


No h autonomia nem flexibilidade
Este agente s tem fins didticos!!! No vale nem a pena pensar nele

Ambientes
acessvel, determinstico, episdico, esttico, discreto e minsculo!

ambiente

Agente Reativo Simples

(percepo atual)

sensores

Agente

Qual a aparncia atual do mundo?


Que ao devo executar agora?

Regras
condio-ao

atuadores

Vantagens e desvantagens
Regras condio-ao: representao inteligvel, modular e eficiente
- ex. Se velocidade > 60 ento multar

No pode armazenar uma seqncia de percepes, pouca autonomia

Ambientes:
Reflexo imprescindvel em ambientes dinmicos
Acessvel, episdico, pequeno

Agente Reativo Baseado em


Modelos
sensores

Agente

ambiente

estado: como o mundo era antes

Qual a aparncia atual


mundo?

como o mundo evolui


impacto de minhas aes

Que ao devo executar


agora?

Regras
condio-ao

atuadores

Desvantagem: pouca autonomia


no tem objetivo, no encadeia regras

Ambientes: determinstico e pequeno


Ex. Tamagotchi

Controla o estado atual e depois


Agente Reativo Simples

Agente Baseado em Objetivo

ambiente

sensores
Qual a aparncia atual do
mundo?
Qual ser a aparncia se for
executada a ao A?
Que ao devo executar
agora?

Agente
estado: como o mundo era antes
como o mundo evolui

impacto de minhas aes

Objetivos

atuadores

Vantagens e desvantagens:
Mais complicado e ineficiente, porm mais flexvel, autnomo
No trata objetivos conflitantes

Ambientes: determinstico
ex.: xeque-mate no xadrez

Agente Baseado em
Utilidade
sensores
Qual a aparncia atual do
mundo?

ambiente

Agente
estado: como o mundo era antes
como o mundo evolui

Qual ser a aparncia se for


executada a ao A?

qual o impacto de
minhas aes

Este novo mundo melhor?


Que ao devo executar agora?
Funo de Utilidade

atuadores

Ambiente: sem restrio


Desvantagem: no tem adaptabilidade
Ex. motorista recifence

Agente com Aprendizado


sensores

t+1

crtico
avaliao

ambiente

t
trocas
elemento de
desempenho (agente)

conhecimento

elemento de
aprendizagem
objetivos de
aprendizagem

atuadores

Agente

Gerador de
problemas

Ambiente: sem restrio


Vantagem: tem adaptabilidade (aprende)
Ex. motorista sem o mapa da cidade

26

Simulao do Ambiente

s vezes mais conveniente simular o ambiente

mais simples
permite testes prvios
evita riscos, etc...

O ambiente (programa)
recebe os agentes como entrada
fornece repetidamente a cada um deles as percepes
corretas e recebe as aes
atualiza os dados do ambiente em funo dessas aes e de
outros processos (ex. dia-noite)
definido por um estado inicial e uma funo de atualizao
deve refletir a realidade

27

Simulao de ambiente

funo simulaAmbiente (estado,


funoAtualizao,agentes,final)
repita
para cada agente em agentes faa
Percept[agente] := pegaPercepo(agente,estado)
para cada agente em agentes faa
Action[agente] := Programa[agente] (Percept[agente])
estado := funoAtualizao(aes, agentes, estado)
scores := avaliaDesempenho(scores,agente,estado) //opcional
at final

Observao:
no cair em tentao roubando do ambiente a descrio do que
aconteceu. Usar a memria do agente!

28

Inteligncia Coletiva

Porque pensar a inteligncia/racionalidade como


propriedade de um nico indivduo?
No existe inteligncia ...

Em um time de futebol?
Em um formigueiro?
Em uma empresa (ex. correios)?
Na sociedade?

Soluo: IA Distribuda
Agentes simples que juntos resolvem problemas complexos
tendo ou no conscincia do objetivo global
Proposta por Marvin Minsky e em franca expanso...
o prprio ambiente pode ser modelado como um agente

29

IA Distribuda: dois tipos de sistemas

Resoluo distribuda de problemas


conscincia do objetivo global e diviso clara de tarefas
Exemplos: Robtica clssica, Busca na Web, Gerncia de sistemas
distribudos, ...
Sistemas Multi-agentes
no conscincia do objetivo global e nem diviso clara de tarefas
Exemplos: n-puzzle, futebol de robs, balanceamento de carga,
robtica, ...

3
7
4

5
8
2

30

Questes

Questes centrais
comunicao
negociao (ex. compra-venda na Web)
estados mentais
crena, ...
Tenso (trade-off)
Quanto mais agentes, mais simples (sub-dividido)
fica o problema
No entanto, mais complexa fica a comunicao e
coordenao entre os agentes

Mundo WUMPUS

Mundo WUMPUS

O mundo de Wumpus um problema didtico onde o objetivo encontrar um


monte de ouroem uma de 16 salas possveis.
Para isso o agente deve evitar as salas que contm poos sem fundo e a sala
onde est o Wumpus. O ambiente do mundo de Wumpus contm:
Wumpus, que monstro que devora qualquer guerreiro que entrar em sua sala.
Malha 44 de salas conectadas por passagens.
Ouro em alguma sala.
Poos sem fundo nos quais cair qualquer um que vagar por esta sala, exceto
oWumpus.
O agente pode matar o Wumpus, porm possui apenas uma flecha para fazer isso.
O agente sempre comea no quadrado identificado como [1,1] voltado para a
direita.
As posies do Wumpus, ouro e poos so escolhidas ao acaso

Mundo WUMPUS
O agente que vasculhar o mundo de Wumpus em busca do ouros possui as
seguintescaractersticas:
Medida de desempenho: +1.000 por pegar ouro, -1.000 se cair em um
poo ou fordevorado pelo Wumpus, -1 para cada ao executada, -10
pelo uso da flecha
Atuadores: O agente pode mover-se para frente, virar esquerda,
virar direita,agarrar um objeto e atirar a flecha
Sensores: fedor (quadrados adjacentes ao Wumpus, exceto diagonal),
brisa(quadrados adjacentes a um poo, exceto diagonal), resplendor
(quadrados ondeexiste ouro), impacto (ao caminhar para uma parede)
e audio (percebe o grito do Wumpus ao morrer).
Agente no conhece a configurao do ambiente.

Mundo WUMPUS
Desenvolvaum sistema que implemente um agente que explore
autonomamente oMundo de Wumpus instanciado de acordo com a
figura vista no incio desta especificao detrabalho. O sistema dever
ter as seguintes caractersticas:
Interface grfica que permita visualizar o mundo de Wumpus e a
movimentao doagente pelo conjunto de 16 salas;
Quando for encontrado o ouro, o agente dever ir para a sala que
contm o ouro eassim finalizar a execuo do programa;
Dever se levar em considerao as medidas de desempenho
apresentadas nestadescrio de trabalho, de modo que o agente
dever encontrar o ouro escolhendo ocaminho com o menor custo
possvel;
Dever ser apresentado ao usurio do sistema as atualizaes que sero
feitas nossensores do agente de acordo com as respostas fornecidas a
partir de inferncias.

35

Evoluo da noo de Agente


alm das fronteiras da IA....

36

Agente: ainda no h uma definio


nica

IBM: Intelligent agents are software entities that carry out


some set of operations on behalf of an user, and in doing so
employ some knowledge representation of the users goals
or desires
KidSim: Agent is a persistent software entity (agents have
their own ideas about how to accomplish tasks) dedicated
to a specific purpose (smaller than multifunctions
applications)
SodaBot: Software agents are programs that engage in
dialogs to negotiate and coordinate transfer of information

Antes....

Tcnicas &
Problemas

37

Agora

programas

programas

IA

agentes
inteligentes

agentes mveis,
agentes de software,
robs, ...

38

Propriedades

Autonomia (IA)
raciocnio, comportamento guiado por objetivos
reatividade

Adaptabilidade & aprendizagem (IA)

Comunicao & Cooperao (IA)

Personalidade (IA)

Continuidade temporal

Mobilidade

39

Agentes na Internet

Categorias por Tipos de Servios:

Agentes de Busca e Recuperao (ex. Altavista)


Agentes que Filtram Informaes (ex. KOM)
Agentes de Entrega Off-line (ex. PointCast)
Agentes Notificadores (ex. URL-Minder)
Agentes de Suporte ao Comrcio (ex. BargainBot)
Agente corretor (interoperabilidade - ACL)
Outros...

40

Concluses

Agentes em IA
Metodologia (metfora) para projeto de sistemas
Sistemas multi-agentes e robtica
Agentes em computao
Adoo de uma nova metfora (antropomrfica e
sociolgica). Extrapolao de OOP
- IA: autmato -> mente
- Agentes: objetos -> pessoas
Integrao de tcnicas de IA
Novas tecnologias prprias Web (ex. mobilidade)
Marketing (moda)
Agentes: tcnica ou metodologia ?

41

Desenvolvimento de software
Projeto:
inteligente

Modelar tarefa em termos de ambiente, percepes,


aes, objetivos e utilidade
Identificar o tipo de ambiente
Identificar a arquitetura de agente adequada ao
ambiente e tarefa

Implementao
o gerador e o simulador de ambientes
componentes do agente (vrios tipos de
conhecimento)
Testar o desempenho com diferentes instncias do
ambiente

Referncias

T. Mitchell. Machine Learning. McGraw Hill, New York,


1997.
Stuart Russell and Peter Norvig, Artificial Intelligence A Modern Approach. Prentice Hall, 1995.

42

Você também pode gostar