Você está na página 1de 41

Agenda

Agentes que Respondem por Estmulo Agentes Inteligentes

PUCC

Rob
R

PUCC

Rob
s1 s2 s3 s8 R s4 s7 s6 s5

PUCC

Rob
Vetor de features (x1,...xi,...xn)

Sensores
Processamento de Percepo Funo de Ao

Ao

PUCC

Rob
Dois problemas precisam ser resolvidos
Converter o dado de entrada no vetor de features. Especificar as funes de ao.

PUCC

Percepo
A entrada de dados dos sensores consistem dos valores s1,.....s8. Portanto existem 256 combinaes possveis. Para o nosso problema, existem 4 features que so teis para o nosso problema.

PUCC

Percepo
x1=1 se e somente se s2=1 ou s3=1 x2=1 se e somente se s4=1 ou s5=1 x3=1 se e somente se s6=1 ou s7=1 x4=1 se e somente se s8=1 ou s1=1

PUCC

Ao
Conhecidas as 4 features devemos especificar uma funo delas que selecione uma ao apropriada:
Se x1=1 e x2=0 mova para LESTE Se x2=1 e x3=0 mova para SUL Se x3=1 e x4=0 mova para OESTE Se x4=1 e x1=0 mova para NORTE

PUCC

Funes de Ao
Vrias maneiras de representar e implementar funes de ao foram estudadas. Se existem R possveis aes a serem tomadas, ento devemos encontrar uma funo adequada do vetor de features para computar a ao.

PUCC

Sistemas de Produo
Lista ordenada de regras, chamadas regras de produo. Cada regra: ci ai, onde: ci a condio e ai a ao.
c1 c2 ci cm
PUCC

a1 a2 ai am
10

Nosso Exemplo
x 4x 1 x 3x 4 x 2x 3 x 1x 2 1 NORTE OESTE SUL LESTE NORTE

PUCC

11

Agentes
Um AGENTE qualquer coisa que pode ser vista como Percebendo seu ambiente atravs de Sensores e Agindo sobre ele atravs de atuadores (effectors). Um agente humano possui olhos, orelhas e outros rgos como sensores e mos, pernas, boca e outras partes do corpo como effectors.

PUCC

12

Agentes x Ambiente
AGENTE

Sensores

?
Effectors
PUCC

A M B I E N T E

13

Agentes x Ambiente
AGENTE

Sensores

Funo do Agente
Effectors

A M B I E N T E

PUCC

14

Agente Racional
aquele que faz a coisa certa. O que significa coisa certa Ao certa aquela que far o agente obter maior sucesso. Precisamos de algum mtodo para Medir o sucesso. Isso nos traz um outro problema: decidir Como e Quando avaliar o sucesso do agente.
PUCC 15

Medida de Performance
Serve para responder a pergunta COMO? Imposta por alguma autoridade Vrios nveis de sofisticao Na questo do QUANDO, muitas vezes importante medir a performance em perodos de longo prazo

PUCC

16

Racionalidade
Depende de 4 pontos:
Medida de Performance que define graus de sucesso. Tudo que o agente percebeu (seqncia de percepo). O que o agente sabe sobre o ambiente. As aes que o agente pode fazer.

O que uma gente racional perfeito?


PUCC 17

Motorista de TAXI
Open Ended - no existe limite para as combinaes de circunstncias que podem ocorrer. Temos que pensar em Sensores, Aes, Objetivos e Ambiente para esse agente. Tipo de Agente: Motorista de Taxi Medidas de Desempenho: Atuadores: Sensores:

PUCC

18

Motorista de TAXI
Tipo de Agente: Motorista de Taxi Medidas de Desempenho:
Viagem mais curta, viagem mais segura, viagem mais agradvel, maximizar lucros...

Atuadores:
Direo, acelerador, freio, sinal, buzina, retrovisores...

Sensores:
Cmeras, velocmetro, GPS, sonar...

PUCC

19

Mapeamento
Se o comportamento do agente depende da sua seqncia de percepo, podemos descrever qualquer agente fazendo uma tabela de aes que ele toma em resposta a cada seqncia de percepo. Numerao exaustiva?? Melhor fazer uma especificao do mapeamento.

PUCC

20

Autonomia
Conhecimento built-in Se as aes dos agentes so baseadas exclusivamente em seu conhecimento interno, de forma que ele no precisa prestar ateno sua percepo diz-se que falta autonomia a esse agente. O comportamento de uma agente pode ser baseado na sua experincia e no seu conhecimento interno. Um sistema autnomo se em grande parte seu comportamento determinado pela sua prpria experincia.

PUCC

21

Estrutura
Um dos trabalhos da IA desenvolver programas agentes: funes que implementem o mapeamento das percepes para as aes. Esse programa rodar em algum artefato computacional: arquitetura

Agente= Arquitetura + Programa

PUCC

22

Projetar Agentes
Antes que se projete agentes de programas devemos:
ter idia muito clara das percepes e aes possveis quais objetivos ou medidores de performance so esperados dos agentes em qual ambiente ele vai operar

PUCC

23

Programas Agentes
function agente(percepo) static: memria (memria do agente do mundo) memria ao memria Atualiza_memria(memria, percepo) Escolha_melhor_ao(memria) Atualiza_memria(memria,ao)

return(ao);

PUCC

24

Tipos de Programas Agentes


Agora ns temos que decidir como construir um programa real para implementar o mapeamento das percepes em aes. Vamos considerar quatro tipos de agentes:
Agentes de simples reflexo Agentes baseado em modelos Agentes para atingir objetivos Agentes baseado em utilidades

PUCC

25

Agentes de simples reflexo


Construir uma tabela lookup explcita est fora de questo. Porqu? Ns podemos reduzir esta tabela notando certas associaes comuns entrada/sada. Regra de condio-ao
SE o carro da frente est brecando ENTO comece a brecar

PUCC

26

Agentes de simples reflexo


AGENTE

Sensores Como o Mundo est agora

Regras condio-ao

Que ao devo fazer agora

Effectors

A M B I E N T E

PUCC

27

Agentes de simples reflexo


function Agente_SR (percepo) static: regras, conjunto condio-ao estado Interpreta-Entrada(percepo) regra Encontra_Regra(estado,regra) ao Regra_Ao[regra] return ao

PUCC

28

Agentes de simples reflexo


Quando este tipo de agente funcionar?
Somente se a deciso correta puder ser tomada baseada na percepo corrente

PUCC

29

Agentes baseado em modelos


Sensores no provem acesso ao estado completo do mundo. Nessa condio, os agentes devem manter alguma informao interna do estado a fim de distinguir entre estados do mundo que gerem a mesma percepo mas sejam significativamente diferentes. Significativamente diferentes indica que aes diferentes so as mais adequadas.
PUCC 30

Agentes baseado em modelos


Atualizar essas informaes internas do estado com o passar do tempo requer que dois tipos de conhecimento estejam codificados no programa agente:
Como o mundo evolui independente do agente. Como as aes do agente afetam o mundo.

PUCC

31

Agentes baseado em modelos


AGENTE
Estado Evoluo Mundo Minhas Aes Regras condio-ao

Sensores Como o Mundo est agora Que ao devo fazer agora Effectors

A M B I E N T E

PUCC

32

Agentes baseado em modelos


function Agente_R_com _estado(percepo) static: regras, conjunto de condio-ao estado, descrio do estado atual do mundo ao, a mais recente, inicialmente nenhuma estado Atualiza_Estado(estado,ao, percepo) regra Encontra_Regra(estado,regras) ao Regra_Ao[regra] return ao
33

PUCC

Agentes por Objetivos


Conhecer o estado atual do ambiente nem sempre suficiente para se decidir o que fazer. Da mesma forma que a descrio do estado atual, o agente necessita de alguma informao de objetivos. O programa agente pode combinar essa informao com as de resultados das aes para buscar o objetivo.
PUCC 34

Agentes por Objetivos


Tcnicas de Busca Planejamento Tomada de Deciso desse tipo diferente das regras de condio - ao descritas anteriormente. Embora sejam menor eficientes, so mais flexveis
35

PUCC

Agentes por Objetivos


Sensores Como o Mundo est agora

Estado Evoluo Mundo Minhas Aes

Como ficar Mundo se eu fizer ao A


Que ao devo fazer agora Effectors

Objetivos

A M B I E N T E

AGENTE

PUCC

36

Agentes por Utilidade


Objetivos no so suficientes para gerar comportamento de alta qualidade. Eles somente provem uma distino entre estados felizes e infelizes. Medidas de performance mais gerais devem permitir comparao entre estados informando o quo feliz ele faria o agente se puder ser encontrado. Se um estado prefervel em relao a outro, ele tem uma utilidade maior para o agente.
PUCC 37

Agentes por Utilidade


Utilidade portanto uma funo que mapeia um estado num nmero real, o qual descreve o grau de felicidade Aparecem
quando existem objetivos conflitantes muitos objetivos para o agente procurar

Um agente pode tomar decises racionais se ele possui um funo de utilidade explcita.
PUCC 38

Agentes com Aprendizagem


Como os agentes passam a existir?
Programar mquinas inteligentes mo Algum mtodo mais eficiente desejvel Criar mquinas com capacidade de aprendizagem e depois ensin-las.

Existem quatro componentes conceituais



PUCC

Elemento de Aprendizado Elemento de Desempenho Crtico (padres de desempenho) Gerador de Problemas (novas experincias)
39

Agentes com Aprendizagem


Padres de Desempenho Crtico Sensores

Elemento de Aprendizado

Elemento de Desempenho

Gerador de Problemas

A M B I E N T E

AGENTE
PUCC

Effectors

40

Ambiente
Observvel x Parcialmente Observvel Determinstico x Estocstico Esttico x Dinmico Discreto x Contnuo Episdico x Seqencial Agente nico x Multiagentes
PUCC

Classifique:
Jogo de Xadrez Backgammon Motorista de Taxi Rob de Seleo de Peas
41

Você também pode gostar