Você está na página 1de 14

Agente

• Percebe seu ambiente através de


sensores e atua neste ambiente através
de atuadores.

Racional

• Agente racional: Faz o que é certo!!


Agente

• Percebe seu ambiente através de sensores e atua neste ambiente


através de atuadores.

Racional

• Agente racional: Faz o que é certo!!


• Considerando as consequências do seu comportamento.
• Sequência de AÇÕES do agente ⇒ Sequência de ESTADOS do
ambiente
• Precisamos de medidas de performance baseadas no que
queremos no ambiente, ao invés de como o agente deveria ter
procedido.
Racionalidade depende

• Medidas de desempenho que que definirem um critério


de sucesso
• O conhecimento a priori que o agente tem do ambiente
• As acções que o agente pode executar
• A sequencia de percepções do agente até ao momento

Obs:

• A escolha de uma medida de desempenho errada pode


acarretar um comportamento indesejado
Agente Racional

• Para cada possível sequência de percepções, o agente


seleçciona uma acção que busca maximizar a sua medida
de desempenho, dadas as evidências fornecidas pelas
sequências de percepções e o conhecimento inerente ao
agente

Obs.

• A escolha racional depende das percepções até aquele


momento
Características

• Omnisciência: conhece o resultado real das suas acções e


pode agir de acordo (impossível na realidade)
• Executar a melhor acção apos o facto mas é impossível
projectar um agente que atende esse especificação
• Aprendizado: colecta informações, aprende tanto quanto do
que percebe (i.e. modifica o comportamento em função do
que percebe)
• Autonomia: capacidade de interagir com o ambiente, e
extrair informações sobre o mundo. Possui um
conhecimento inicial e habilidades de inferir ou aprender
novos conhecimentos (conhecimento interno e experiência)
Tipo de Medida de Ambiente Actuadores Sensores
agente desempenho
Taxista Maximizar a Estradas, outros Direcção, Camaras, sonores,
Segurança e trafego , acelerador, acelerômetro,
conforto, maximizar passadelas, freio, sinal, termómetro, GPS,
as violações de clientes painel hodometros, sensor
transito, Chegar ao do motor, painel
local certo,
minimizar o custo
da viajem,
maximizar lucro
Aspirador Miximizar a
de Pó quantidade de
aspirada em 8 hrs
Ambiente
• Completamente e parcialmente observável: Se os
sensores de um agente dão acesso ao estado
completo do ambiente em cada ponto no tempo,
então dizemos que o ambiente é completamente
observável.
• Um ambiente pode ser parcialmente observável por
conta de imprecisões ou ruídos nos sensores , ou
porque partes dos estados estão ausentes nos dados
do sensor.
• Um ou vários agentes
Ambiente
• Determinístico vs. estocástico.
• Se o próximo estado do ambiente é completamente
determinado pelo estado actual e a acção executada pelo
agente, então dizemos que o ambiente é determinístico;
caso contrário, é estocástico
• Dizemos que um ambiente é incerto se não for totalmente
observável ou não determinístico
• A incerteza é quantificada em termos de probabilidades;
• Um ambiente não determinístico apresenta ações
caracterizadas por seus resultados possíveis, mas nenhuma
probabilidade está associada a elas.
Ambiente
• Episódico vs. sequencial.
• Episódico: experiência do agente é dividida em
episódios atômicos. Em cada episódio, o agente
recebe uma percepção e então realiza uma única ação.
• Sequencial: a decisão atual pode afetar todas as
decisões futuras.
• Estático vs. dinâmico: se o ambiente pode mudar
enquanto um agente está deliberando, então dizemos
que o ambiente é dinâmico para aquele agente; caso
contrário, é estático.
Regra Condição-Acção

•Exemplo
• Carro_em_frente_freia então freiar
Programa Agente
• Função que implementa o mapeamento
percepção -> acção
• O programa agente roda numa arquitectura:
dispositivo de hw que inclui sensores e
actuadores
• Agente= Arquitectura+ programa
• Arquitectura: a forma de perceber o mundo,
a forma que actua
Exemplo

• função agente_aspirador_reflexivo([]local,
estado) retorna acção
• Se estado=sujo então retorna aspirar
• Senão se local= A então retorna direita
• Senão se local = B então retorna esquerda
Tabela parcial do agente
aspirador de pó
Sequência de percepções acção
[A, limpo] direita
[A, sujo] aspirar
[B, limpo] esquerda
[B, sujo] aspirar
[A, limpo] [A, limpo] direita
[A, limpo] [A, sujo] aspirar
……
[A, limpo] [A, limpo][A, limpo] Direita
Comparação Agentes reactivos
• Simples: reage através da percepção actual, Não possui
histórico
• Modelo: através do histórico tem a noção do mundo,
utiliza aleatoriedade e pode parar um tempo
• Objectivo: adapta-se ao ambiente, pode utilizar modelos.
• poderia decidir estar meia hora em cada sala, golpear o
adversário superando os obstáculos (utiliza algoritmos
de busca),
• O modelo pode mudar mais o objectivo não
• Utilidade: coloca em evidência uma serie de heurísticas.
P.e. custo distancia etc.

Você também pode gostar