Escolar Documentos
Profissional Documentos
Cultura Documentos
Modelos de:
Um agente racional se comporta to bem quanto possvel A qualidade do comportamento do agente depende da natureza do ambiente
2
Agentes
Agentes
Definio:
Um agente qualquer coisa que pode perceber seu ambiente atravs de sensores e agir sobre este ambiente atravs de atuadores.
Exemplos:
Humano: 5 sentidos, braos, boca, ... Rob: cmeras, detectores infravermelho, sonares, motores, ... Software: teclado, arquivos, pacotes da rede, impressora, vdeo, ... (sensaes e aes esto codificados em bits)
Percepo: entradas perceptivas do agente em qualquer momento Seqncia de percepes: histria completa de tudo o que o agente j percebeu A escolha de uma ao de um agente em qualquer instante pode depender da seqncia inteira de percepo at o momento Uma funo agente o mapeamento de qualquer seqncia possvel de percepes para uma ao
Tabela muito grande. Na verdade infinita. A menos que se tenha um limite para o comprimento da seqncia de percepes
5
Percepo: local e contedo, por exemplo, [A, sujo] Aes: Direita, Esquerda, Sugar, NoOp
Um agente racional aquele que faz tudo certo Mas como saber se a sua ao a correta?
Ao correta aquela que leva o agente ao maior sucesso Mas precisamos de uma forma para medir o sucesso Medidas de desempenho (MD) ->critrios para se medir o sucesso do comportamento do agente Exemplo de MD para um agente que limpa uma sala:
MD1: quantidade de lixo retiradas X horas de trabalho MD2: quantidade de lixo retiradas X horas de trabalho descontadas a energia gasta e o nvel de rudo produzido
A medida de desempenho que define o grau de sucesso. O conhecimento anterior que o agente tem sobre o ambiente. Que aes o agente pode realizar. O histrico da percepo do agente, i.e., tudo que j foi percebido pelo agente. Estes 4 fatores nos levam a definio de racionalidade ideal:
Definio:
Para cada seqncia de percepo possvel, um agente racional ideal deve saber se sua ao maximizar sua medida de desempenho, baseado na evidncia de sua seqncia de percepo e no conhecimento que ele traz consigo.
10
Agente aspirador de p
MD: 1 pt para cada quadrado limpo em cada unidade de tempo, ao longo de 1.000 perodos Conhece a geografia do ambiente, mas no sabe onde tem sujeira e nem a posio inicial.
Quadrados limpos permanecem limpos e aspirar limpa o quadrado atual As aes Esquerda e Direita movem o agente nesta direes; exceto quando isto leva o agente para fora do ambiente (fica parado)
Aes disponveis: Esquerda, Direita, Aspirar, NoOP (no faz nada) O agente percebe: a sua posio e se nessa posio existe sujeira
11
Exemplo: Ao atravessar uma rua... No podemos condenar um agente que falha por no levar em conta algo que ele no pode perceber ou por uma ao que ele no capaz de tomar
12
Coleta de Informaes
Ex. agente que atravessa a rua sem olhar no racional A ao correta seria olhar porque maximiza o desempenho Coleta de informaes:
A realizao de aes com a finalidade de modificar percepes futuras uma parte importante da racionalidade Tambm pode ser a realizao de aes para a explorao de um ambiente desconhecido
13
Aprendizagem
O agente pode ter algum conhecimento anterior Ele tambm pode ganhar experincia e modificar e ampliar este conhecimento Se o ambiente previamente conhecido:
O agente no precisa aprender ou perceber Somente agir de forma correta Mas este tipo de agente se torna muito frgil Ex: do besouro e da vespa
14
Na fase de projeto clculos feitos pelo projetista Na fase de deliberao sobre a prxima ao a ser executada clculos feitos pelo agente Na fase de aprendizagem a partir de experincias clculos feitos pelo agente para decidir como modificar o seu comportamento
15
Autonomia
Quando um agente se baseia somente no conhecimento anterior de seu projetista ele no tem autonomia O agente consegue aprender por experincia e alterar seu comportamento, ele pode ter autonomia funcional
Agente autnomo deve aprender o que puder para compensar o conhecimento prvio parcial ou incorreto Na prtica, raramente os agentes tm autonomia completa desde o incio. Assim como os animais... Agentes que aprendem podem se comportar de forma efetivamente independente do seu conhecimento anterior (prvio)
16
Exemplo: agente de reconhecimento de fala, tem um conjunto pr-definido de padres, mas pode aprender o sotaque de um novo usurio.
Um agente inteligente verdadeiramente autnomo deveria ser capaz de operar com sucesso em um grande variedade de ambientes, dado um tempo suficiente para se adaptar.
17
Ambientes de tarefas:
Desempenho
Ambiente
chegar no lugar certo minimizar o consumo de combustvel e desgaste minimizar o tempo de percurso, custo da viagem minimizar as infraes de leis de trnsito minimizar os distrbios aos outros motoristas maximizar a segurana e conforto do passageiro Obs.: alguns destes objetivos so conflitantes... estradas locais ou freeways, tipo de trfego, neve, Inglaterra, Brasil, ... o ambiente ir determinar a dificuldade da implementao Frear, acelerar, virar, falar com o passageiro, se comunicar com outros motoristas Sensores de velocidade, acelerao, estado (mecnico) do veculo GPS (Golbal Positioning System) para saber onde esta num mapa Sensores infra-vermelhos para detectar a distncia dos outros carros Microfone ou teclado para o passageiro informar o destino
19
Atuadores
Sensores
Exemplos de agentes
Tipo diagnstico mdico anlise de imagens de satlite controle de refinaria tutor de ingls interativo
Desempenho Ambiente paciente so, minimizao de custos e processos categorizao correta da imagem maximizar pureza, rendimento e segurana maximizar a pontuao do estudante paciente, hospital, corpo mdico imagens obtidas de satlites refinaria, operadores Conjunto de estudantes, agencia de teste
Atuadores questionrios, testes, diagnsticos mostrar categorizaro da cena vlvulas, tubos, aquecedores, displays imprimir exerccios, sugestes, correes
Sensores Dados de entrada dos sintomas, respostas do paciente array de pixels coloridos Temperatura, Presso, Sensores qumicos Teclado de entrada
Softbots simulador de vo, agente para encontrar notcias de interesse do usurio na rede
20
Quanto ao acesso completo do estado do ambiente fornecido pelos sensores Totalmente observvel - No necessrio manter o estado interno
DETERMINSTICO X ESTOCSTICO
Prximo estado do ambiente completamente determinado pelo estado corrente e pelas aes selecionadas pelo agente.
EPISDICO X SEQUENCIAL
A experincia do agente dividida em episdios (no depende de aes passadas) Cada episdio = percepo + ao
21
DINMICO X ESTTICO
O ambiente pode se alterar enquanto um agente est decidindo Se o ambiente no se altera, mas o desempenho do agente se altera chamado SEMIDINMICO
DISCRETO X CONTNUO
Palavras cruzadas agente nico Xadrez agentes mltiplos -> ambiente competitivo Dirigir txi agentes mltiplos -> ambiente cooperativo Ambiente com agentes mltiplos precisam de uma forma de comunicao
22
Tipos de ambientes
Palavras Cruzadas Observvel Determinstico Episdico Esttico Discreto Agente nico SIM SIM NO SIM SIM SIM Xadrez com tempo SIM NO NO SEMI SIM NO Diagntico mdico NO NO NO NO NO SIM Direo de Txi NO NO NO NO NO NO
23
Agente = programa + arquitetura Programa uma funo que implementa o mapeamento das percepes (entradas) do agente para suas aes (sadas) Arquitetura suporte dado a execuo dos programas de agente
24
Programas agentes
function ESQUELETO_DE_AGENTE(percepo):ao static: memria (memria do agente sobre o mundo) memria ATUALIZA_MEMRIA(memria,percepo) ao ESCOLHA_A_MELHOR_AO(memria) memria ATUALIZA_MEMRIA(memria,ao) return ao
O programa agente recebe somente a percepo atual A funo agente pode depender da seqncia de percepes inteira
Uma tabela muito longa (na verdade infinita, mas limitada para o mundo real) de seqncias das percepes que esto sendo consideradas
Mapeamento ideal
Exemplo:
26
27
Mesmo que seja possvel constru-la isto poderia levar muito tempo O agente no tem autonomia, pois as aes so derivadas do seu conhecimento interno (e no da sua experincia).
28
50 MB de imagens por segundo (25 frames p/s, 1000x1000 pixels, 8 bits cores e 8 bits de intensidade)
Tabela com 10250.000.000.000 entradas Para cada imagem possvel -> uma ao !
Escrever programas que, na medida do possvel, produzam um comportamento racional a partir de uma pequena quantidade de cdigo Exemplo:
Tabelas de razes quadradas utilizadas por engenheiros (dec. 70) Substitudas por um programa de 5 linhas que corresponde ao mtodo de Newton
29
A IA pode fazer pelo comportamento inteligente o que Newton fez para as razes quadradas?
Tipos de agentes
Podemos classificar os agentes em tipos bsicos levando em conta sua ordem crescente de generalidade:
AGENTES REATIVO (REFLEXO) SIMPLES AGENTES REATIVO (REFLEXO) BASEADO EM MODELO AGENTES BASEADOS EM OBJETIVOS AGENTES BASEADOS EM UTILIDADE
30
Funo AGENTE-ASPIRADOR-REATIVO ([posio, estado]) retorna uma ao se estado = sujo ento retorna aspirar seno se posio = A ento retorna direita seno se posio = B ento retorna esquerda
31
Diminuem as possibilidades
Porque se o quadro est sujo, no precisamos verificar a posio A entrada pode ser processada para estabelecer uma condio
Exemplo: Processar a imagem do agente motorista de txi e verificar que o carro da frente est freando Ao invs de ter uma tabela com cada mudana que ocorre na imagem, interpretamos a condio da imagem
32
Ento podemos fazer conexes entre as condies de entrada e as aes correspondentes Se carro_da_frente_est_freando
ento comear_a_frear
Aprendidas: dirigir Reflexos inatos: tirar a mo do fogo, ou piscar qdo algo se aproxima do olho
Projeto do agente:
Construir um interpretador de uso geral para regras de condio-ao Criar um conjuntos de regras para cada ambiente de tarefa
33
Esquema de funcionamento
Agente
sensor
Como o mundo est agora?
Regras condioao
atuador
34
Ambiente
Funcionamento
function AGENTE-REFLEXO-SIMPLES(percepo): ao static: regras (um conjunto regra condio-ao) estado INTERPRETA-ENTRADA(percepo) regra CASAMENTO-REGRA(estado, regras) ao AO-REGRA[regra] return ao
INTERPRETA-ENTRADA Gera uma descrio abstrata do estado a partir do que foi percebido CASAMENTO-REGRA Retorna a primeira regra que "casou" com a descrio do estado
35
Limitaes
So simples, porm limitados Funcionar somente se a deciso correta puder ser tomada com base apenas na percepo atual
Talvez somente uma imagem no suficiente para determinar se o carro da frente esta dando sinal de mudana de direo, alerta ou freio
36
O agente deve controlar as partes do mundo que ele no pode ver agora
O agente deve manter um estado interno que dependa do histrico de percepes e reflita os aspectos no observados no estado atual Dois tipos de conhecimento so necessrios para atualizar o estado interno do agente (modelo do mundo):
Um carro que est ultrapassando em geral estar mais perto do que estava um instante antes Se o agente virar o volante direita, o carro ir virar p/ a direita
37
Modelo de mundo
38
Esquema de funcionamento
Agente
Estado Interno Como o ambiente evolu O que minhas aes fazem Regras condioao Que ao eu devo realizar agora?
sensor
Ambiente
Como o mundo est agora?
atuador
39
Funcionamento
function AGENTE_REFLEXO_COM_ESTADO(percepo):ao static: estado (uma descrio do estado atual do mundo) regras (um conjunto regra condio-ao) estado ATUALIZA-ESTADO(estado,percepo) regra CASAMENTO-REGRA(estado,regras) ao AO-REGRA[regra] return ao ATUALIZA_ESTADO > responsvel por criar uma nova descrio do estado interno
40
Limitaes
Conhecer os estados do ambiente no suficiente para tomar uma boa deciso Exemplo:
o agente Motorista de Txi chega a um cruzamento com trs caminhos, qual direo tomar?
Simplesmente reagir: mas existem trs reaes possveis Examinar o modelo de mundo: no ajuda a decidir qual o caminho
41
O agente pode escolher aes que alcancem o objetivo A seleo da ao baseada em objetivo pode ser:
Direta: quando o resultado de uma nica ao atinge o objetivo Mais complexa: quando ser necessrio longas seqncias de aes para atingir o objetivo
42
A tomada de deciso envolve a considerao do futuro -> distinta das regras de condio-ao
O que acontecer se eu fizer isso ou aquilo? O quanto isso me ajudar a atingir o objetivo?
Agentes reativos: reao -> frear qdo carro da frente frear Agentes baseado em objetivo: raciocnio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: no atingir outros carros -> ao para atingir objetivo: frear
43
Esquema de funcionamento
Agente
Estado interno
sensor
Como o mundo est agora? Como o mundo ficar se eu fizer a ao x Que ao eu devo realizar agora?
Objetivos
atuador
44
Ambiente
Consideraes e limitaes
Agente reflexo aes pr-compiladas (condio-ao) Agente p/ objetivo pode alterar somente o objetivo sem necessidade de se reescrever as regras de comportamento
Ex: Se comear a chover todos as informaes relevantes podem ser alteradas para se operar de forma eficiente
O objetivo no garante o melhor comportamento para o agente, apenas a distino entre estados objetivos e no objetivos
Ex: Algumas alternativas de planejamento de aes futuras podem ser mais rpidas, seguras ou baratas que outras
45
Se um estado do mundo mais desejvel que outro, ento ele ter maior utilidade para o agente Utilidade uma funo que mapeia um estado para um nmero real que representa o grau de satisfao com este estado Especificao completa da funo de utilidade decises racionais em dois tipos de casos:
Quando existem objetivos conflitantes (velocidade x segurana) a funo de utilidade especifica o compromisso apropriado Quando existem vrios objetivos que se deseja alcanar e nenhum deles pode ser atingido com certeza ponderar a importncia dos objetivos
46
Esquema de funcionamento
Estado interno Como o ambiente evolu O que minhas aes fazem
sensor
Como o mundo esta agora
Utilidade
Quo feliz serei se ir para tal estado Que ao eu devo fazer agora
Agente
atuador
47
Ambiente
Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista Turing prope construir mquinas com aprendizagem e depois ensina-las Aprendizagem tambm permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o sue conhecimento inicial poderia permitir Quatro componentes conceituais de uma ag com aprendizagem:
Elemento de aprendizado:
Responsvel pela execuo dos aperfeioamentos Utiliza realimentao do crtico sobre como o agente est funcionando Determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro
Crtico:
Informa ao elemento de aprendizado como o agente est se comportando em relao a um padro fixo de desempenho necessrio pq as percepes no fornecem nenhuma indicao de sucesso O agente no dever modific-lo
49
Elementos de desempenho:
Responsvel pela seleo de aes externas (agente completo) Recebe percepes e decide sobre aes
Gerador de problemas:
Responsvel por sugerir aes que levaro a experincias novas e informativas Aes no timas a curto prazo para descobrir aes timas a longo prazo
50
Elemento de desempenho: conhecimento e procedimentos para dirigir Crtico: observa o mundo e repassa para o elemento de aprendizagem a reao dos outros motoristas a uma ao do agente Elemento de aprendizagem:
capaz de formular uma regra afirmando que a ao foi boa/ruim Modifica o elemento de desempenho pela instalao da nova regra
Gerador de problemas:
Identifica reas que precisam de melhorias Sugere experimentos: testar os freios em diferentes superfcies
51
Elemento de aprendizado
Elemento de Desempenho
Gerador de Problemas
Agente
atuador
52
Ambiente