IA - Aula02

Agenda
Agentes que Respondem por Estmulo Agentes Inteligentes
PUCC
Rob
R
PUCC
Rob
s1 s2 s3 s8 R s4 s7 s6 s5
PUCC
Rob
Vetor de features (x1,...xi,...xn)
Sensores
Processamento de Percepo Funo de Ao
Ao
PUCC
Rob
Dois problemas precisam ser resolvidos
Converter o dado de entrada no vetor de features. Especificar as funes de ao.
PUCC
Percepo
A entrada de dados dos sensores consistem dos valores s1,.....s8. Portanto existem 256 combinaes possveis. Para o nosso problema, existem 4 features que so teis para o nosso problema.
PUCC
Percepo
x1=1 se e somente se s2=1 ou s3=1 x2=1 se e somente se s4=1 ou s5=1 x3=1 se e somente se s6=1 ou s7=1 x4=1 se e somente se s8=1 ou s1=1
PUCC
Ao
Conhecidas as 4 features devemos especificar uma funo delas que selecione uma ao apropriada:
Se x1=1 e x2=0 mova para LESTE Se x2=1 e x3=0 mova para SUL Se x3=1 e x4=0 mova para OESTE Se x4=1 e x1=0 mova para NORTE
PUCC
Funes de Ao
Vrias maneiras de representar e implementar funes de ao foram estudadas. Se existem R possveis aes a serem tomadas, ento devemos encontrar uma funo adequada do vetor de features para computar a ao.
PUCC
Sistemas de Produo
Lista ordenada de regras, chamadas regras de produo. Cada regra: ci ai, onde: ci a condio e ai a ao.
c1 c2 ci cm
PUCC
a1 a2 ai am
10
Nosso Exemplo
x 4x 1 x 3x 4 x 2x 3 x 1x 2 1 NORTE OESTE SUL LESTE NORTE
PUCC
11
Agentes
Um AGENTE qualquer coisa que pode ser vista como Percebendo seu ambiente atravs de Sensores e Agindo sobre ele atravs de atuadores (effectors). Um agente humano possui olhos, orelhas e outros rgos como sensores e mos, pernas, boca e outras partes do corpo como effectors.
PUCC
12
Agentes x Ambiente
AGENTE
Sensores
?
Effectors
PUCC
A M B I E N T E
13
Agentes x Ambiente
AGENTE
Sensores
Funo do Agente
Effectors
A M B I E N T E
PUCC
14
Agente Racional
aquele que faz a coisa certa. O que significa coisa certa Ao certa aquela que far o agente obter maior sucesso. Precisamos de algum mtodo para Medir o sucesso. Isso nos traz um outro problema: decidir Como e Quando avaliar o sucesso do agente.
PUCC 15
Medida de Performance
Serve para responder a pergunta COMO? Imposta por alguma autoridade Vrios nveis de sofisticao Na questo do QUANDO, muitas vezes importante medir a performance em perodos de longo prazo
PUCC
16
Racionalidade
Depende de 4 pontos:
Medida de Performance que define graus de sucesso. Tudo que o agente percebeu (seqncia de percepo). O que o agente sabe sobre o ambiente. As aes que o agente pode fazer.
O que uma gente racional perfeito?

PUCC 17
Motorista de TAXI
Open Ended - no existe limite para as combinaes de circunstncias que podem ocorrer. Temos que pensar em Sensores, Aes, Objetivos e Ambiente para esse agente. Tipo de Agente: Motorista de Taxi Medidas de Desempenho: Atuadores: Sensores:
PUCC
18
Motorista de TAXI
Tipo de Agente: Motorista de Taxi Medidas de Desempenho:
Viagem mais curta, viagem mais segura, viagem mais agradvel, maximizar lucros...
Atuadores:
Direo, acelerador, freio, sinal, buzina, retrovisores...
Sensores:
Cmeras, velocmetro, GPS, sonar...
PUCC
19
Mapeamento
Se o comportamento do agente depende da sua seqncia de percepo, podemos descrever qualquer agente fazendo uma tabela de aes que ele toma em resposta a cada seqncia de percepo. Numerao exaustiva?? Melhor fazer uma especificao do mapeamento.
PUCC
20
Autonomia
Conhecimento built-in Se as aes dos agentes so baseadas exclusivamente em seu conhecimento interno, de forma que ele no precisa prestar ateno sua percepo diz-se que falta autonomia a esse agente. O comportamento de uma agente pode ser baseado na sua experincia e no seu conhecimento interno. Um sistema autnomo se em grande parte seu comportamento determinado pela sua prpria experincia.
PUCC
21
Estrutura
Um dos trabalhos da IA desenvolver programas agentes: funes que implementem o mapeamento das percepes para as aes. Esse programa rodar em algum artefato computacional: arquitetura
Agente= Arquitetura + Programa
PUCC
22
Projetar Agentes
Antes que se projete agentes de programas devemos:
ter idia muito clara das percepes e aes possveis quais objetivos ou medidores de performance so esperados dos agentes em qual ambiente ele vai operar
PUCC
23
Programas Agentes
function agente(percepo) static: memria (memria do agente do mundo) memria ao memria Atualiza_memria(memria, percepo) Escolha_melhor_ao(memria) Atualiza_memria(memria,ao)
return(ao);
PUCC
24
Tipos de Programas Agentes

Agora ns temos que decidir como construir um programa real para implementar o mapeamento das percepes em aes. Vamos considerar quatro tipos de agentes:
Agentes de simples reflexo Agentes baseado em modelos Agentes para atingir objetivos Agentes baseado em utilidades
PUCC
25
Agentes de simples reflexo

Construir uma tabela lookup explcita est fora de questo. Porqu? Ns podemos reduzir esta tabela notando certas associaes comuns entrada/sada. Regra de condio-ao
SE o carro da frente est brecando ENTO comece a brecar
PUCC
26

AGENTE
Sensores Como o Mundo est agora
Regras condio-ao
Que ao devo fazer agora
Effectors
A M B I E N T E
PUCC
27

function Agente_SR (percepo) static: regras, conjunto condio-ao estado Interpreta-Entrada(percepo) regra Encontra_Regra(estado,regra) ao Regra_Ao[regra] return ao
PUCC
28

Quando este tipo de agente funcionar?
Somente se a deciso correta puder ser tomada baseada na percepo corrente
PUCC
29
Agentes baseado em modelos

Sensores no provem acesso ao estado completo do mundo. Nessa condio, os agentes devem manter alguma informao interna do estado a fim de distinguir entre estados do mundo que gerem a mesma percepo mas sejam significativamente diferentes. Significativamente diferentes indica que aes diferentes so as mais adequadas.
PUCC 30

Atualizar essas informaes internas do estado com o passar do tempo requer que dois tipos de conhecimento estejam codificados no programa agente:
Como o mundo evolui independente do agente. Como as aes do agente afetam o mundo.
PUCC
31

AGENTE
Estado Evoluo Mundo Minhas Aes Regras condio-ao
Sensores Como o Mundo est agora Que ao devo fazer agora Effectors
A M B I E N T E
PUCC
32

function Agente_R_com _estado(percepo) static: regras, conjunto de condio-ao estado, descrio do estado atual do mundo ao, a mais recente, inicialmente nenhuma estado Atualiza_Estado(estado,ao, percepo) regra Encontra_Regra(estado,regras) ao Regra_Ao[regra] return ao
33
PUCC
Agentes por Objetivos

Conhecer o estado atual do ambiente nem sempre suficiente para se decidir o que fazer. Da mesma forma que a descrio do estado atual, o agente necessita de alguma informao de objetivos. O programa agente pode combinar essa informao com as de resultados das aes para buscar o objetivo.
PUCC 34

Tcnicas de Busca Planejamento Tomada de Deciso desse tipo diferente das regras de condio - ao descritas anteriormente. Embora sejam menor eficientes, so mais flexveis
35
PUCC

Sensores Como o Mundo est agora
Estado Evoluo Mundo Minhas Aes
Como ficar Mundo se eu fizer ao A

Que ao devo fazer agora Effectors
Objetivos
A M B I E N T E
AGENTE
PUCC
36
Agentes por Utilidade

Objetivos no so suficientes para gerar comportamento de alta qualidade. Eles somente provem uma distino entre estados felizes e infelizes. Medidas de performance mais gerais devem permitir comparao entre estados informando o quo feliz ele faria o agente se puder ser encontrado. Se um estado prefervel em relao a outro, ele tem uma utilidade maior para o agente.
PUCC 37
Agentes por Utilidade

Utilidade portanto uma funo que mapeia um estado num nmero real, o qual descreve o grau de felicidade Aparecem
quando existem objetivos conflitantes muitos objetivos para o agente procurar
Um agente pode tomar decises racionais se ele possui um funo de utilidade explcita.
PUCC 38
Agentes com Aprendizagem

Como os agentes passam a existir?
Programar mquinas inteligentes mo Algum mtodo mais eficiente desejvel Criar mquinas com capacidade de aprendizagem e depois ensin-las.
Existem quatro componentes conceituais

PUCC
Elemento de Aprendizado Elemento de Desempenho Crtico (padres de desempenho) Gerador de Problemas (novas experincias)
39
Agentes com Aprendizagem

Padres de Desempenho Crtico Sensores
Elemento de Aprendizado
Elemento de Desempenho
Gerador de Problemas
A M B I E N T E
AGENTE
PUCC
Effectors
40
Ambiente
Observvel x Parcialmente Observvel Determinstico x Estocstico Esttico x Dinmico Discreto x Contnuo Episdico x Seqencial Agente nico x Multiagentes
PUCC
Classifique:
Jogo de Xadrez Backgammon Motorista de Taxi Rob de Seleo de Peas
41

IA - Aula02

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

IA - Aula02

Enviado por

Direitos autorais:

Formatos disponíveis

Agenda

Agentes que Respondem por Estmulo Agentes Inteligentes

O que uma gente racional perfeito?

Agente= Arquitetura + Programa

Tipos de Programas Agentes

Agentes de simples reflexo

Agentes de simples reflexo

Sensores Como o Mundo est agora

Que ao devo fazer agora

Agentes de simples reflexo

Agentes de simples reflexo

Agentes baseado em modelos

Agentes baseado em modelos

Agentes baseado em modelos

Agentes baseado em modelos

Agentes por Objetivos

Agentes por Objetivos

Agentes por Objetivos

Estado Evoluo Mundo Minhas Aes

Como ficar Mundo se eu fizer ao A

Agentes por Utilidade

Agentes por Utilidade

Agentes com Aprendizagem

Existem quatro componentes conceituais

Agentes com Aprendizagem

Você também pode gostar