Aula Agente

Agente
• Percebe seu ambiente através de

sensores e atua neste ambiente através
de atuadores.
Racional
• Agente racional: Faz o que é certo!!

Agente
• Percebe seu ambiente através de sensores e atua neste ambiente

através de atuadores.
Racional
• Agente racional: Faz o que é certo!!

• Considerando as consequências do seu comportamento.
• Sequência de AÇÕES do agente ⇒ Sequência de ESTADOS do
ambiente
• Precisamos de medidas de performance baseadas no que
queremos no ambiente, ao invés de como o agente deveria ter
procedido.
Racionalidade depende
• Medidas de desempenho que que definirem um critério

de sucesso
• O conhecimento a priori que o agente tem do ambiente
• As acções que o agente pode executar
• A sequencia de percepções do agente até ao momento
Obs:
• A escolha de uma medida de desempenho errada pode

acarretar um comportamento indesejado
Agente Racional
• Para cada possível sequência de percepções, o agente

seleçciona uma acção que busca maximizar a sua medida
de desempenho, dadas as evidências fornecidas pelas
sequências de percepções e o conhecimento inerente ao
agente
Obs.
• A escolha racional depende das percepções até aquele

momento
Características
• Omnisciência: conhece o resultado real das suas acções e

pode agir de acordo (impossível na realidade)
• Executar a melhor acção apos o facto mas é impossível
projectar um agente que atende esse especificação
• Aprendizado: colecta informações, aprende tanto quanto do
que percebe (i.e. modifica o comportamento em função do
que percebe)
• Autonomia: capacidade de interagir com o ambiente, e
extrair informações sobre o mundo. Possui um
conhecimento inicial e habilidades de inferir ou aprender
novos conhecimentos (conhecimento interno e experiência)
Tipo de Medida de Ambiente Actuadores Sensores
agente desempenho
Taxista Maximizar a Estradas, outros Direcção, Camaras, sonores,
Segurança e trafego , acelerador, acelerômetro,
conforto, maximizar passadelas, freio, sinal, termómetro, GPS,
as violações de clientes painel hodometros, sensor
transito, Chegar ao do motor, painel
local certo,
minimizar o custo
da viajem,
maximizar lucro
Aspirador Miximizar a
de Pó quantidade de
aspirada em 8 hrs
Ambiente
• Completamente e parcialmente observável: Se os
sensores de um agente dão acesso ao estado
completo do ambiente em cada ponto no tempo,
então dizemos que o ambiente é completamente
observável.
• Um ambiente pode ser parcialmente observável por
conta de imprecisões ou ruídos nos sensores , ou
porque partes dos estados estão ausentes nos dados
do sensor.
• Um ou vários agentes
Ambiente
• Determinístico vs. estocástico.
• Se o próximo estado do ambiente é completamente
determinado pelo estado actual e a acção executada pelo
agente, então dizemos que o ambiente é determinístico;
caso contrário, é estocástico
• Dizemos que um ambiente é incerto se não for totalmente
observável ou não determinístico
• A incerteza é quantificada em termos de probabilidades;
• Um ambiente não determinístico apresenta ações
caracterizadas por seus resultados possíveis, mas nenhuma
probabilidade está associada a elas.
Ambiente
• Episódico vs. sequencial.
• Episódico: experiência do agente é dividida em
episódios atômicos. Em cada episódio, o agente
recebe uma percepção e então realiza uma única ação.
• Sequencial: a decisão atual pode afetar todas as
decisões futuras.
• Estático vs. dinâmico: se o ambiente pode mudar
enquanto um agente está deliberando, então dizemos
que o ambiente é dinâmico para aquele agente; caso
contrário, é estático.
Regra Condição-Acção
•Exemplo
• Carro_em_frente_freia então freiar
Programa Agente
• Função que implementa o mapeamento
percepção -> acção
• O programa agente roda numa arquitectura:
dispositivo de hw que inclui sensores e
actuadores
• Agente= Arquitectura+ programa
• Arquitectura: a forma de perceber o mundo,
a forma que actua
Exemplo
• função agente_aspirador_reflexivo([]local,
estado) retorna acção
• Se estado=sujo então retorna aspirar
• Senão se local= A então retorna direita
• Senão se local = B então retorna esquerda
Tabela parcial do agente
aspirador de pó
Sequência de percepções acção
[A, limpo] direita
[A, sujo] aspirar
[B, limpo] esquerda
[B, sujo] aspirar
[A, limpo] [A, limpo] direita
[A, limpo] [A, sujo] aspirar
……
[A, limpo] [A, limpo][A, limpo] Direita
Comparação Agentes reactivos
• Simples: reage através da percepção actual, Não possui
histórico
• Modelo: através do histórico tem a noção do mundo,
utiliza aleatoriedade e pode parar um tempo
• Objectivo: adapta-se ao ambiente, pode utilizar modelos.
• poderia decidir estar meia hora em cada sala, golpear o
adversário superando os obstáculos (utiliza algoritmos
de busca),
• O modelo pode mudar mais o objectivo não
• Utilidade: coloca em evidência uma serie de heurísticas.
P.e. custo distancia etc.

Aula Agente

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula Agente

Enviado por

Direitos autorais:

Formatos disponíveis

Agente

• Percebe seu ambiente através de

• Agente racional: Faz o que é certo!!

• Percebe seu ambiente através de sensores e atua neste ambiente

• Agente racional: Faz o que é certo!!

• Medidas de desempenho que que definirem um critério

• A escolha de uma medida de desempenho errada pode

• Para cada possível sequência de percepções, o agente

• A escolha racional depende das percepções até aquele

• Omnisciência: conhece o resultado real das suas acções e

Você também pode gostar