Agentes

Agentes Inteligentes
Prof. Srgio R. P. da Silva Profa. Josiane Melchiori Pinheiro

Baseado no Cap. 2 do livro de Stuart Russel e Peter Norving - Inteligncia Artificial, 2a ed.
Principais pontos abordados
Modelos de:
Agentes Ambientes E o relacionamento entre eles
Um agente se comporta melhor do que outros
Um agente racional se comporta to bem quanto possvel A qualidade do comportamento do agente depende da natureza do ambiente
2
Agentes
Agentes
Definio:
Um agente qualquer coisa que pode perceber seu ambiente atravs de sensores e agir sobre este ambiente atravs de atuadores.
Exemplos:

Humano: 5 sentidos, braos, boca, ... Rob: cmeras, detectores infravermelho, sonares, motores, ... Software: teclado, arquivos, pacotes da rede, impressora, vdeo, ... (sensaes e aes esto codificados em bits)
Percepo, Seqncia de Percepes e Aes
Percepo: entradas perceptivas do agente em qualquer momento Seqncia de percepes: histria completa de tudo o que o agente j percebeu A escolha de uma ao de um agente em qualquer instante pode depender da seqncia inteira de percepo at o momento Uma funo agente o mapeamento de qualquer seqncia possvel de percepes para uma ao
Tabela muito grande. Na verdade infinita. A menos que se tenha um limite para o comprimento da seqncia de percepes
5
Exemplo: mundo do aspirador de p

Percepo: local e contedo, por exemplo, [A, sujo] Aes: Direita, Esquerda, Sugar, NoOp
Tabela parcial de uma funo de agente simples

Seqncia de Percepes [A, limpo] [A, sujo] [B, limpo] [B, sujo] [A, limpo] [A, limpo] [A, limpo] [A, sujo] ... [A, limpo] [A, limpo] [A, limpo] [A, limpo] [A, limpo] [A, sujo] ... Ao Direita Aspirar Esquerda Aspirar Direita Aspirar Direita Aspirar
Como os agentes devem agir?

Um agente racional aquele que faz tudo certo Mas como saber se a sua ao a correta?

Ao correta aquela que leva o agente ao maior sucesso Mas precisamos de uma forma para medir o sucesso Medidas de desempenho (MD) ->critrios para se medir o sucesso do comportamento do agente Exemplo de MD para um agente que limpa uma sala:

MD1: quantidade de lixo retiradas X horas de trabalho MD2: quantidade de lixo retiradas X horas de trabalho descontadas a energia gasta e o nvel de rudo produzido
Como e quando medir o desempenho? (passo a passo, resultado ??)

8
A racionalidade depende de quatro fatores:
A medida de desempenho que define o grau de sucesso. O conhecimento anterior que o agente tem sobre o ambiente. Que aes o agente pode realizar. O histrico da percepo do agente, i.e., tudo que j foi percebido pelo agente. Estes 4 fatores nos levam a definio de racionalidade ideal:
Agente racional ideal
Definio:
Para cada seqncia de percepo possvel, um agente racional ideal deve saber se sua ao maximizar sua medida de desempenho, baseado na evidncia de sua seqncia de percepo e no conhecimento que ele traz consigo.
10
Agente aspirador de p
Uma agente racional para o mundo do aspirador de p:
MD: 1 pt para cada quadrado limpo em cada unidade de tempo, ao longo de 1.000 perodos Conhece a geografia do ambiente, mas no sabe onde tem sujeira e nem a posio inicial.
Quadrados limpos permanecem limpos e aspirar limpa o quadrado atual As aes Esquerda e Direita movem o agente nesta direes; exceto quando isto leva o agente para fora do ambiente (fica parado)
Aes disponveis: Esquerda, Direita, Aspirar, NoOP (no faz nada) O agente percebe: a sua posio e se nessa posio existe sujeira
11
Como os agentes devem agir?
Racionalidade x Oniscincia so diferentes
Oniscincia poder saber os resultados de suas aes antecipadamente e com preciso
Impossvel de se atingir na realidade
Racionalidade: maximiza o desempenho esperado Perfeio: maximiza o desempenho real
Exemplo: Ao atravessar uma rua... No podemos condenar um agente que falha por no levar em conta algo que ele no pode perceber ou por uma ao que ele no capaz de tomar
12
Coleta de Informaes

Ex. agente que atravessa a rua sem olhar no racional A ao correta seria olhar porque maximiza o desempenho Coleta de informaes:
A realizao de aes com a finalidade de modificar percepes futuras uma parte importante da racionalidade Tambm pode ser a realizao de aes para a explorao de um ambiente desconhecido
13
Aprendizagem

O agente pode ter algum conhecimento anterior Ele tambm pode ganhar experincia e modificar e ampliar este conhecimento Se o ambiente previamente conhecido:

O agente no precisa aprender ou perceber Somente agir de forma correta Mas este tipo de agente se torna muito frgil Ex: do besouro e da vespa
14
Agente bem sucedido
Dividem a tarefa de calcular a funo do agente em trs perodos:
Na fase de projeto clculos feitos pelo projetista Na fase de deliberao sobre a prxima ao a ser executada clculos feitos pelo agente Na fase de aprendizagem a partir de experincias clculos feitos pelo agente para decidir como modificar o seu comportamento
15
Autonomia
Quando um agente se baseia somente no conhecimento anterior de seu projetista ele no tem autonomia O agente consegue aprender por experincia e alterar seu comportamento, ele pode ter autonomia funcional
Fugir do funcionamento que lhe foi imposto pela natureza
Agente autnomo deve aprender o que puder para compensar o conhecimento prvio parcial ou incorreto Na prtica, raramente os agentes tm autonomia completa desde o incio. Assim como os animais... Agentes que aprendem podem se comportar de forma efetivamente independente do seu conhecimento anterior (prvio)
16
Agente autnomo = conhecimento inato + aprendizagem
Agente autnomos so mais flexveis, podem se adaptar a novas condies de ambiente.
Exemplo: agente de reconhecimento de fala, tem um conjunto pr-definido de padres, mas pode aprender o sotaque de um novo usurio.
Um agente inteligente verdadeiramente autnomo deveria ser capaz de operar com sucesso em um grande variedade de ambientes, dado um tempo suficiente para se adaptar.
17
A natureza dos ambientes
1 Passo do projeto de um agente
Especificar o ambiente de tarefa de forma to completa quanto possvel
Ambientes de tarefas:

Os problemas para os quais os agentes so a soluo. Compreendem as seguintes especificaes:
Medida de desempenho Ambiente Atuadores Sensores

18
Exemplo: Agente Motorista de Taxi
Desempenho

Ambiente

chegar no lugar certo minimizar o consumo de combustvel e desgaste minimizar o tempo de percurso, custo da viagem minimizar as infraes de leis de trnsito minimizar os distrbios aos outros motoristas maximizar a segurana e conforto do passageiro Obs.: alguns destes objetivos so conflitantes... estradas locais ou freeways, tipo de trfego, neve, Inglaterra, Brasil, ... o ambiente ir determinar a dificuldade da implementao Frear, acelerar, virar, falar com o passageiro, se comunicar com outros motoristas Sensores de velocidade, acelerao, estado (mecnico) do veculo GPS (Golbal Positioning System) para saber onde esta num mapa Sensores infra-vermelhos para detectar a distncia dos outros carros Microfone ou teclado para o passageiro informar o destino
19
Atuadores
Sensores

Exemplos de agentes
Tipo diagnstico mdico anlise de imagens de satlite controle de refinaria tutor de ingls interativo
Desempenho Ambiente paciente so, minimizao de custos e processos categorizao correta da imagem maximizar pureza, rendimento e segurana maximizar a pontuao do estudante paciente, hospital, corpo mdico imagens obtidas de satlites refinaria, operadores Conjunto de estudantes, agencia de teste
Atuadores questionrios, testes, diagnsticos mostrar categorizaro da cena vlvulas, tubos, aquecedores, displays imprimir exerccios, sugestes, correes
Sensores Dados de entrada dos sintomas, respostas do paciente array de pixels coloridos Temperatura, Presso, Sensores qumicos Teclado de entrada
Ambiente real x virtual. Complexidade.
Softbots simulador de vo, agente para encontrar notcias de interesse do usurio na rede
20
Propriedades dos ambientes
TOTALMENTE OBSERVVEL X PARCIALMENTE OBSERVVEL
Quanto ao acesso completo do estado do ambiente fornecido pelos sensores Totalmente observvel - No necessrio manter o estado interno
DETERMINSTICO X ESTOCSTICO
Prximo estado do ambiente completamente determinado pelo estado corrente e pelas aes selecionadas pelo agente.
EPISDICO X SEQUENCIAL
A experincia do agente dividida em episdios (no depende de aes passadas) Cada episdio = percepo + ao
21
Propriedades dos ambientes
DINMICO X ESTTICO

O ambiente pode se alterar enquanto um agente est decidindo Se o ambiente no se altera, mas o desempenho do agente se altera chamado SEMIDINMICO
DISCRETO X CONTNUO
Percepes e aes so contveis e distintas (xadrez discreto, txi contnuo)
AGENTE NICO X AGENTES MLTIPLOS

Palavras cruzadas agente nico Xadrez agentes mltiplos -> ambiente competitivo Dirigir txi agentes mltiplos -> ambiente cooperativo Ambiente com agentes mltiplos precisam de uma forma de comunicao
22
Tipos de ambientes
Palavras Cruzadas Observvel Determinstico Episdico Esttico Discreto Agente nico SIM SIM NO SIM SIM SIM Xadrez com tempo SIM NO NO SEMI SIM NO Diagntico mdico NO NO NO NO NO SIM Direo de Txi NO NO NO NO NO NO
23
Estrutura de um agente inteligente

Agente = programa + arquitetura Programa uma funo que implementa o mapeamento das percepes (entradas) do agente para suas aes (sadas) Arquitetura suporte dado a execuo dos programas de agente

A aquisio de percepes (sensores) Execuo de aes no ambiente (atuadores)
24
Programas agentes
function ESQUELETO_DE_AGENTE(percepo):ao static: memria (memria do agente sobre o mundo) memria ATUALIZA_MEMRIA(memria,percepo) ao ESCOLHA_A_MELHOR_AO(memria) memria ATUALIZA_MEMRIA(memria,ao) return ao

O programa agente recebe somente a percepo atual A funo agente pode depender da seqncia de percepes inteira
O agente ter que armazenar as percepes (seqncia)
A MD no faz parte da esqueleto (medida externamente)

25
O mapeamento ideal da seqncia de percepes para as aes
Mapeamento (de seqncias de percepes para aes)
Uma tabela muito longa (na verdade infinita, mas limitada para o mundo real) de seqncias das percepes que esto sendo consideradas
Mapeamento ideal
Especifica qual ao um agente deve tomar em resposta a qualquer seqncia de percepo
Exemplo:
a funo raiz quadrada

a seqncia de percepo: a digitao de nmeros a ao: mostrar o resultado correto
26
Por que simplesmente no olhamos as respostas?

function AGENTE_POR_TABELA(percepo):ao static: percepes (uma seqncia, inicialmente vazia) tabela (uma tabela, indexada por percepo, inicialmente completamente especificada) agregar (percepo) ao fim de percepes ao PROCURA(percepes,tabela) return ao
27
Por que simplesmente no olhamos as respostas?
A tabela pode ser muito grande.
Ex: um agente para jogar xadrez teria 10150 entradas
Mesmo que seja possvel constru-la isto poderia levar muito tempo O agente no tem autonomia, pois as aes so derivadas do seu conhecimento interno (e no da sua experincia).
Uma troca inesperada no ambiente poderia resultar em falha
28
Implementao do Agente Motorista de Taxi
Criar a tabela de Percepo x Ao.
50 MB de imagens por segundo (25 frames p/s, 1000x1000 pixels, 8 bits cores e 8 bits de intensidade)

Tabela com 10250.000.000.000 entradas Para cada imagem possvel -> uma ao !
Desafio fundamental da IA:
Escrever programas que, na medida do possvel, produzam um comportamento racional a partir de uma pequena quantidade de cdigo Exemplo:

Tabelas de razes quadradas utilizadas por engenheiros (dec. 70) Substitudas por um programa de 5 linhas que corresponde ao mtodo de Newton
29
A IA pode fazer pelo comportamento inteligente o que Newton fez para as razes quadradas?
Tipos de agentes
Podemos classificar os agentes em tipos bsicos levando em conta sua ordem crescente de generalidade:
AGENTES REATIVO (REFLEXO) SIMPLES AGENTES REATIVO (REFLEXO) BASEADO EM MODELO AGENTES BASEADOS EM OBJETIVOS AGENTES BASEADOS EM UTILIDADE
30
Agente reativo simples
Selecionam aes com base somente na percepo atual
Exemplo: agente aspirador de p
Funo AGENTE-ASPIRADOR-REATIVO ([posio, estado]) retorna uma ao se estado = sujo ento retorna aspirar seno se posio = A ento retorna direita seno se posio = B ento retorna esquerda
31
Agente reativo simples aspirador de p
Programa muito pequeno em relao a tabela que representa a funo agente
Porque descartamos o histrico de percepes
Diminuem as possibilidades
Porque se o quadro est sujo, no precisamos verificar a posio A entrada pode ser processada para estabelecer uma condio
Exemplo: Processar a imagem do agente motorista de txi e verificar que o carro da frente est freando Ao invs de ter uma tabela com cada mudana que ocorre na imagem, interpretamos a condio da imagem
32
Agente reativo simples aspirador de p
Ento podemos fazer conexes entre as condies de entrada e as aes correspondentes Se carro_da_frente_est_freando
ento comear_a_frear
Estas regras so chamadas de regras de condio-ao Conexes nos seres humanos:

Aprendidas: dirigir Reflexos inatos: tirar a mo do fogo, ou piscar qdo algo se aproxima do olho
Projeto do agente:

Construir um interpretador de uso geral para regras de condio-ao Criar um conjuntos de regras para cada ambiente de tarefa
33
Esquema de funcionamento
Agente
sensor
Como o mundo est agora?
Regras condioao
Que ao eu devo realizar agora?
atuador
34
Ambiente
Funcionamento
function AGENTE-REFLEXO-SIMPLES(percepo): ao static: regras (um conjunto regra condio-ao) estado INTERPRETA-ENTRADA(percepo) regra CASAMENTO-REGRA(estado, regras) ao AO-REGRA[regra] return ao
INTERPRETA-ENTRADA Gera uma descrio abstrata do estado a partir do que foi percebido CASAMENTO-REGRA Retorna a primeira regra que "casou" com a descrio do estado
35
Limitaes

So simples, porm limitados Funcionar somente se a deciso correta puder ser tomada com base apenas na percepo atual
Ambiente completamente observvel
Exemplos de alguns problemas:
Talvez somente uma imagem no suficiente para determinar se o carro da frente esta dando sinal de mudana de direo, alerta ou freio
36
Agente reativo baseado em modelo
Como lidar com a possibilidade de observao parcial
O agente deve controlar as partes do mundo que ele no pode ver agora
O agente deve manter um estado interno que dependa do histrico de percepes e reflita os aspectos no observados no estado atual Dois tipos de conhecimento so necessrios para atualizar o estado interno do agente (modelo do mundo):
Como o ambiente evolu independente do agente
Um carro que est ultrapassando em geral estar mais perto do que estava um instante antes Se o agente virar o volante direita, o carro ir virar p/ a direita
37
Como as aes do prprio agente afetam o mundo
Modelo de mundo
O conhecimento de como o mundo funciona
Pode ser implementado em simples circuitos booleanos ou em teoria cientficas completas
Agente baseado em modelo
Um agente que usa o modelo de mundo
38
Agente
Estado Interno Como o ambiente evolu O que minhas aes fazem Regras condioao Que ao eu devo realizar agora?
sensor
Ambiente
Como o mundo est agora?
atuador
39
Funcionamento
function AGENTE_REFLEXO_COM_ESTADO(percepo):ao static: estado (uma descrio do estado atual do mundo) regras (um conjunto regra condio-ao) estado ATUALIZA-ESTADO(estado,percepo) regra CASAMENTO-REGRA(estado,regras) ao AO-REGRA[regra] return ao ATUALIZA_ESTADO > responsvel por criar uma nova descrio do estado interno
40
Limitaes
Conhecer os estados do ambiente no suficiente para tomar uma boa deciso Exemplo:
o agente Motorista de Txi chega a um cruzamento com trs caminhos, qual direo tomar?

Simplesmente reagir: mas existem trs reaes possveis Examinar o modelo de mundo: no ajuda a decidir qual o caminho
A deciso depende de onde o txi est tentando chegar
41
Agente baseado em objetivos
O agente precisa de algum tipo de informao sobre o seu objetivo
Objetivos descrevem situaes desejveis. Ex: estar no destino
Combinando informaes sobre:

O objetivo do agente Os resultados de suas aes
O agente pode escolher aes que alcancem o objetivo A seleo da ao baseada em objetivo pode ser:

Direta: quando o resultado de uma nica ao atinge o objetivo Mais complexa: quando ser necessrio longas seqncias de aes para atingir o objetivo
42
Agente baseado em objetivos
Para encontrar seqncias de aes que alcanam os objetivos
Algoritmos de Busca e Planejamento
A tomada de deciso envolve a considerao do futuro -> distinta das regras de condio-ao

O que acontecer se eu fizer isso ou aquilo? O quanto isso me ajudar a atingir o objetivo?
Agentes reativos: reao -> frear qdo carro da frente frear Agentes baseado em objetivo: raciocnio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: no atingir outros carros -> ao para atingir objetivo: frear
43
Agente
Estado interno
sensor
Como o mundo est agora? Como o mundo ficar se eu fizer a ao x Que ao eu devo realizar agora?
Como o ambiente evolu O que minhas aes fazem
Objetivos
atuador
44
Ambiente
Consideraes e limitaes
O agente que funciona orientado a objetivos mais flexvel

Agente reflexo aes pr-compiladas (condio-ao) Agente p/ objetivo pode alterar somente o objetivo sem necessidade de se reescrever as regras de comportamento
Mais flexvel representao do conhecimento permite modificaes
Ex: Se comear a chover todos as informaes relevantes podem ser alteradas para se operar de forma eficiente
O objetivo no garante o melhor comportamento para o agente, apenas a distino entre estados objetivos e no objetivos
Ex: Algumas alternativas de planejamento de aes futuras podem ser mais rpidas, seguras ou baratas que outras
45
Agente baseado em utilidade
Se um estado do mundo mais desejvel que outro, ento ele ter maior utilidade para o agente Utilidade uma funo que mapeia um estado para um nmero real que representa o grau de satisfao com este estado Especificao completa da funo de utilidade decises racionais em dois tipos de casos:
Quando existem objetivos conflitantes (velocidade x segurana) a funo de utilidade especifica o compromisso apropriado Quando existem vrios objetivos que se deseja alcanar e nenhum deles pode ser atingido com certeza ponderar a importncia dos objetivos
46
Estado interno Como o ambiente evolu O que minhas aes fazem
sensor
Como o mundo esta agora
Utilidade
Quo feliz serei se ir para tal estado Que ao eu devo fazer agora
Agente
atuador
47
Ambiente
Como o mundo ficar se fizer a ao
Agentes com aprendizagem
Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista Turing prope construir mquinas com aprendizagem e depois ensina-las Aprendizagem tambm permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o sue conhecimento inicial poderia permitir Quatro componentes conceituais de uma ag com aprendizagem:

Elemento de aprendizado Crtico Elementos de desempenho Gerador de problemas

48
Agentes com aprendizagem componentes
Elemento de aprendizado:

Responsvel pela execuo dos aperfeioamentos Utiliza realimentao do crtico sobre como o agente est funcionando Determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro
Crtico:
Informa ao elemento de aprendizado como o agente est se comportando em relao a um padro fixo de desempenho necessrio pq as percepes no fornecem nenhuma indicao de sucesso O agente no dever modific-lo
49
Agentes com aprendizagem componentes
Elementos de desempenho:

Responsvel pela seleo de aes externas (agente completo) Recebe percepes e decide sobre aes
Gerador de problemas:
Responsvel por sugerir aes que levaro a experincias novas e informativas Aes no timas a curto prazo para descobrir aes timas a longo prazo
50
Agente motorista de txi com aprendizagem
Elemento de desempenho: conhecimento e procedimentos para dirigir Crtico: observa o mundo e repassa para o elemento de aprendizagem a reao dos outros motoristas a uma ao do agente Elemento de aprendizagem:

capaz de formular uma regra afirmando que a ao foi boa/ruim Modifica o elemento de desempenho pela instalao da nova regra
Gerador de problemas:

Identifica reas que precisam de melhorias Sugere experimentos: testar os freios em diferentes superfcies
51
Agentes que aprendem

sensor
Crtico
Elemento de aprendizado
Elemento de Desempenho
Gerador de Problemas
Agente
atuador
52
Ambiente

Agentes

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Agentes

Enviado por

Direitos autorais:

Formatos disponíveis

Agentes Inteligentes

Prof. Srgio R. P. da Silva Profa. Josiane Melchiori Pinheiro

Principais pontos abordados

Agentes Ambientes E o relacionamento entre eles

Um agente se comporta melhor do que outros

Percepo, Seqncia de Percepes e Aes

Exemplo: mundo do aspirador de p

Tabela parcial de uma funo de agente simples

Como os agentes devem agir?

Como e quando medir o desempenho? (passo a passo, resultado ??)

A racionalidade depende de quatro fatores:

Agente racional ideal

Uma agente racional para o mundo do aspirador de p:

Como os agentes devem agir?

Racionalidade x Oniscincia so diferentes

Oniscincia poder saber os resultados de suas aes antecipadamente e com preciso

Impossvel de se atingir na realidade

Racionalidade: maximiza o desempenho esperado Perfeio: maximiza o desempenho real

Agente bem sucedido

Dividem a tarefa de calcular a funo do agente em trs perodos:

Fugir do funcionamento que lhe foi imposto pela natureza

Agente autnomo = conhecimento inato + aprendizagem

Agente autnomos so mais flexveis, podem se adaptar a novas condies de ambiente.

A natureza dos ambientes

1 Passo do projeto de um agente

Especificar o ambiente de tarefa de forma to completa quanto possvel

Os problemas para os quais os agentes so a soluo. Compreendem as seguintes especificaes:

Medida de desempenho Ambiente Atuadores Sensores

Exemplo: Agente Motorista de Taxi

Ambiente real x virtual. Complexidade.

Propriedades dos ambientes

TOTALMENTE OBSERVVEL X PARCIALMENTE OBSERVVEL

Propriedades dos ambientes

Percepes e aes so contveis e distintas (xadrez discreto, txi contnuo)

AGENTE NICO X AGENTES MLTIPLOS

Estrutura de um agente inteligente

A aquisio de percepes (sensores) Execuo de aes no ambiente (atuadores)

O agente ter que armazenar as percepes (seqncia)

A MD no faz parte da esqueleto (medida externamente)

O mapeamento ideal da seqncia de percepes para as aes

Mapeamento (de seqncias de percepes para aes)

Especifica qual ao um agente deve tomar em resposta a qualquer seqncia de percepo

a funo raiz quadrada

a seqncia de percepo: a digitao de nmeros a ao: mostrar o resultado correto

Por que simplesmente no olhamos as respostas?

Por que simplesmente no olhamos as respostas?

A tabela pode ser muito grande.

Ex: um agente para jogar xadrez teria 10150 entradas

Uma troca inesperada no ambiente poderia resultar em falha

Implementao do Agente Motorista de Taxi

Criar a tabela de Percepo x Ao.

Desafio fundamental da IA:

Agente reativo simples

Selecionam aes com base somente na percepo atual

Exemplo: agente aspirador de p

Agente reativo simples aspirador de p

Programa muito pequeno em relao a tabela que representa a funo agente

Porque descartamos o histrico de percepes

Agente reativo simples aspirador de p

Estas regras so chamadas de regras de condio-ao Conexes nos seres humanos:

Que ao eu devo realizar agora?

Ambiente completamente observvel

Exemplos de alguns problemas:

Agente reativo baseado em modelo