Você está na página 1de 52

Agentes Inteligentes

Prof. Srgio R. P. da Silva Profa. Josiane Melchiori Pinheiro


Baseado no Cap. 2 do livro de Stuart Russel e Peter Norving - Inteligncia Artificial, 2a ed.

Principais pontos abordados

Modelos de:

Agentes Ambientes E o relacionamento entre eles

Um agente se comporta melhor do que outros

Um agente racional se comporta to bem quanto possvel A qualidade do comportamento do agente depende da natureza do ambiente
2

Agentes

Agentes

Definio:

Um agente qualquer coisa que pode perceber seu ambiente atravs de sensores e agir sobre este ambiente atravs de atuadores.

Exemplos:

Humano: 5 sentidos, braos, boca, ... Rob: cmeras, detectores infravermelho, sonares, motores, ... Software: teclado, arquivos, pacotes da rede, impressora, vdeo, ... (sensaes e aes esto codificados em bits)

Percepo, Seqncia de Percepes e Aes

Percepo: entradas perceptivas do agente em qualquer momento Seqncia de percepes: histria completa de tudo o que o agente j percebeu A escolha de uma ao de um agente em qualquer instante pode depender da seqncia inteira de percepo at o momento Uma funo agente o mapeamento de qualquer seqncia possvel de percepes para uma ao

Tabela muito grande. Na verdade infinita. A menos que se tenha um limite para o comprimento da seqncia de percepes
5

Exemplo: mundo do aspirador de p


Percepo: local e contedo, por exemplo, [A, sujo] Aes: Direita, Esquerda, Sugar, NoOp

Tabela parcial de uma funo de agente simples


Seqncia de Percepes [A, limpo] [A, sujo] [B, limpo] [B, sujo] [A, limpo] [A, limpo] [A, limpo] [A, sujo] ... [A, limpo] [A, limpo] [A, limpo] [A, limpo] [A, limpo] [A, sujo] ... Ao Direita Aspirar Esquerda Aspirar Direita Aspirar Direita Aspirar

Como os agentes devem agir?


Um agente racional aquele que faz tudo certo Mas como saber se a sua ao a correta?

Ao correta aquela que leva o agente ao maior sucesso Mas precisamos de uma forma para medir o sucesso Medidas de desempenho (MD) ->critrios para se medir o sucesso do comportamento do agente Exemplo de MD para um agente que limpa uma sala:

MD1: quantidade de lixo retiradas X horas de trabalho MD2: quantidade de lixo retiradas X horas de trabalho descontadas a energia gasta e o nvel de rudo produzido

Como e quando medir o desempenho? (passo a passo, resultado ??)


8

A racionalidade depende de quatro fatores:

A medida de desempenho que define o grau de sucesso. O conhecimento anterior que o agente tem sobre o ambiente. Que aes o agente pode realizar. O histrico da percepo do agente, i.e., tudo que j foi percebido pelo agente. Estes 4 fatores nos levam a definio de racionalidade ideal:

Agente racional ideal

Definio:

Para cada seqncia de percepo possvel, um agente racional ideal deve saber se sua ao maximizar sua medida de desempenho, baseado na evidncia de sua seqncia de percepo e no conhecimento que ele traz consigo.

10

Agente aspirador de p

Uma agente racional para o mundo do aspirador de p:

MD: 1 pt para cada quadrado limpo em cada unidade de tempo, ao longo de 1.000 perodos Conhece a geografia do ambiente, mas no sabe onde tem sujeira e nem a posio inicial.

Quadrados limpos permanecem limpos e aspirar limpa o quadrado atual As aes Esquerda e Direita movem o agente nesta direes; exceto quando isto leva o agente para fora do ambiente (fica parado)

Aes disponveis: Esquerda, Direita, Aspirar, NoOP (no faz nada) O agente percebe: a sua posio e se nessa posio existe sujeira
11

Como os agentes devem agir?

Racionalidade x Oniscincia so diferentes

Oniscincia poder saber os resultados de suas aes antecipadamente e com preciso

Impossvel de se atingir na realidade

Racionalidade: maximiza o desempenho esperado Perfeio: maximiza o desempenho real

Exemplo: Ao atravessar uma rua... No podemos condenar um agente que falha por no levar em conta algo que ele no pode perceber ou por uma ao que ele no capaz de tomar
12

Coleta de Informaes

Ex. agente que atravessa a rua sem olhar no racional A ao correta seria olhar porque maximiza o desempenho Coleta de informaes:

A realizao de aes com a finalidade de modificar percepes futuras uma parte importante da racionalidade Tambm pode ser a realizao de aes para a explorao de um ambiente desconhecido

13

Aprendizagem

O agente pode ter algum conhecimento anterior Ele tambm pode ganhar experincia e modificar e ampliar este conhecimento Se o ambiente previamente conhecido:

O agente no precisa aprender ou perceber Somente agir de forma correta Mas este tipo de agente se torna muito frgil Ex: do besouro e da vespa

14

Agente bem sucedido

Dividem a tarefa de calcular a funo do agente em trs perodos:

Na fase de projeto clculos feitos pelo projetista Na fase de deliberao sobre a prxima ao a ser executada clculos feitos pelo agente Na fase de aprendizagem a partir de experincias clculos feitos pelo agente para decidir como modificar o seu comportamento

15

Autonomia

Quando um agente se baseia somente no conhecimento anterior de seu projetista ele no tem autonomia O agente consegue aprender por experincia e alterar seu comportamento, ele pode ter autonomia funcional

Fugir do funcionamento que lhe foi imposto pela natureza

Agente autnomo deve aprender o que puder para compensar o conhecimento prvio parcial ou incorreto Na prtica, raramente os agentes tm autonomia completa desde o incio. Assim como os animais... Agentes que aprendem podem se comportar de forma efetivamente independente do seu conhecimento anterior (prvio)
16

Agente autnomo = conhecimento inato + aprendizagem

Agente autnomos so mais flexveis, podem se adaptar a novas condies de ambiente.

Exemplo: agente de reconhecimento de fala, tem um conjunto pr-definido de padres, mas pode aprender o sotaque de um novo usurio.

Um agente inteligente verdadeiramente autnomo deveria ser capaz de operar com sucesso em um grande variedade de ambientes, dado um tempo suficiente para se adaptar.

17

A natureza dos ambientes

1 Passo do projeto de um agente

Especificar o ambiente de tarefa de forma to completa quanto possvel

Ambientes de tarefas:

Os problemas para os quais os agentes so a soluo. Compreendem as seguintes especificaes:

Medida de desempenho Ambiente Atuadores Sensores


18

Exemplo: Agente Motorista de Taxi

Desempenho

Ambiente

chegar no lugar certo minimizar o consumo de combustvel e desgaste minimizar o tempo de percurso, custo da viagem minimizar as infraes de leis de trnsito minimizar os distrbios aos outros motoristas maximizar a segurana e conforto do passageiro Obs.: alguns destes objetivos so conflitantes... estradas locais ou freeways, tipo de trfego, neve, Inglaterra, Brasil, ... o ambiente ir determinar a dificuldade da implementao Frear, acelerar, virar, falar com o passageiro, se comunicar com outros motoristas Sensores de velocidade, acelerao, estado (mecnico) do veculo GPS (Golbal Positioning System) para saber onde esta num mapa Sensores infra-vermelhos para detectar a distncia dos outros carros Microfone ou teclado para o passageiro informar o destino
19

Atuadores

Sensores

Exemplos de agentes
Tipo diagnstico mdico anlise de imagens de satlite controle de refinaria tutor de ingls interativo

Desempenho Ambiente paciente so, minimizao de custos e processos categorizao correta da imagem maximizar pureza, rendimento e segurana maximizar a pontuao do estudante paciente, hospital, corpo mdico imagens obtidas de satlites refinaria, operadores Conjunto de estudantes, agencia de teste

Atuadores questionrios, testes, diagnsticos mostrar categorizaro da cena vlvulas, tubos, aquecedores, displays imprimir exerccios, sugestes, correes

Sensores Dados de entrada dos sintomas, respostas do paciente array de pixels coloridos Temperatura, Presso, Sensores qumicos Teclado de entrada

Ambiente real x virtual. Complexidade.

Softbots simulador de vo, agente para encontrar notcias de interesse do usurio na rede

20

Propriedades dos ambientes

TOTALMENTE OBSERVVEL X PARCIALMENTE OBSERVVEL

Quanto ao acesso completo do estado do ambiente fornecido pelos sensores Totalmente observvel - No necessrio manter o estado interno

DETERMINSTICO X ESTOCSTICO

Prximo estado do ambiente completamente determinado pelo estado corrente e pelas aes selecionadas pelo agente.

EPISDICO X SEQUENCIAL

A experincia do agente dividida em episdios (no depende de aes passadas) Cada episdio = percepo + ao
21

Propriedades dos ambientes

DINMICO X ESTTICO

O ambiente pode se alterar enquanto um agente est decidindo Se o ambiente no se altera, mas o desempenho do agente se altera chamado SEMIDINMICO

DISCRETO X CONTNUO

Percepes e aes so contveis e distintas (xadrez discreto, txi contnuo)

AGENTE NICO X AGENTES MLTIPLOS


Palavras cruzadas agente nico Xadrez agentes mltiplos -> ambiente competitivo Dirigir txi agentes mltiplos -> ambiente cooperativo Ambiente com agentes mltiplos precisam de uma forma de comunicao
22

Tipos de ambientes
Palavras Cruzadas Observvel Determinstico Episdico Esttico Discreto Agente nico SIM SIM NO SIM SIM SIM Xadrez com tempo SIM NO NO SEMI SIM NO Diagntico mdico NO NO NO NO NO SIM Direo de Txi NO NO NO NO NO NO

23

Estrutura de um agente inteligente


Agente = programa + arquitetura Programa uma funo que implementa o mapeamento das percepes (entradas) do agente para suas aes (sadas) Arquitetura suporte dado a execuo dos programas de agente

A aquisio de percepes (sensores) Execuo de aes no ambiente (atuadores)

24

Programas agentes
function ESQUELETO_DE_AGENTE(percepo):ao static: memria (memria do agente sobre o mundo) memria ATUALIZA_MEMRIA(memria,percepo) ao ESCOLHA_A_MELHOR_AO(memria) memria ATUALIZA_MEMRIA(memria,ao) return ao

O programa agente recebe somente a percepo atual A funo agente pode depender da seqncia de percepes inteira

O agente ter que armazenar as percepes (seqncia)

A MD no faz parte da esqueleto (medida externamente)


25

O mapeamento ideal da seqncia de percepes para as aes

Mapeamento (de seqncias de percepes para aes)

Uma tabela muito longa (na verdade infinita, mas limitada para o mundo real) de seqncias das percepes que esto sendo consideradas

Mapeamento ideal

Especifica qual ao um agente deve tomar em resposta a qualquer seqncia de percepo

Exemplo:

a funo raiz quadrada


a seqncia de percepo: a digitao de nmeros a ao: mostrar o resultado correto

26

Por que simplesmente no olhamos as respostas?


function AGENTE_POR_TABELA(percepo):ao static: percepes (uma seqncia, inicialmente vazia) tabela (uma tabela, indexada por percepo, inicialmente completamente especificada) agregar (percepo) ao fim de percepes ao PROCURA(percepes,tabela) return ao

27

Por que simplesmente no olhamos as respostas?

A tabela pode ser muito grande.

Ex: um agente para jogar xadrez teria 10150 entradas

Mesmo que seja possvel constru-la isto poderia levar muito tempo O agente no tem autonomia, pois as aes so derivadas do seu conhecimento interno (e no da sua experincia).

Uma troca inesperada no ambiente poderia resultar em falha

28

Implementao do Agente Motorista de Taxi

Criar a tabela de Percepo x Ao.

50 MB de imagens por segundo (25 frames p/s, 1000x1000 pixels, 8 bits cores e 8 bits de intensidade)

Tabela com 10250.000.000.000 entradas Para cada imagem possvel -> uma ao !

Desafio fundamental da IA:

Escrever programas que, na medida do possvel, produzam um comportamento racional a partir de uma pequena quantidade de cdigo Exemplo:

Tabelas de razes quadradas utilizadas por engenheiros (dec. 70) Substitudas por um programa de 5 linhas que corresponde ao mtodo de Newton
29

A IA pode fazer pelo comportamento inteligente o que Newton fez para as razes quadradas?

Tipos de agentes

Podemos classificar os agentes em tipos bsicos levando em conta sua ordem crescente de generalidade:

AGENTES REATIVO (REFLEXO) SIMPLES AGENTES REATIVO (REFLEXO) BASEADO EM MODELO AGENTES BASEADOS EM OBJETIVOS AGENTES BASEADOS EM UTILIDADE

30

Agente reativo simples

Selecionam aes com base somente na percepo atual

Exemplo: agente aspirador de p

Funo AGENTE-ASPIRADOR-REATIVO ([posio, estado]) retorna uma ao se estado = sujo ento retorna aspirar seno se posio = A ento retorna direita seno se posio = B ento retorna esquerda
31

Agente reativo simples aspirador de p

Programa muito pequeno em relao a tabela que representa a funo agente

Porque descartamos o histrico de percepes

Diminuem as possibilidades

Porque se o quadro est sujo, no precisamos verificar a posio A entrada pode ser processada para estabelecer uma condio

Exemplo: Processar a imagem do agente motorista de txi e verificar que o carro da frente est freando Ao invs de ter uma tabela com cada mudana que ocorre na imagem, interpretamos a condio da imagem
32

Agente reativo simples aspirador de p

Ento podemos fazer conexes entre as condies de entrada e as aes correspondentes Se carro_da_frente_est_freando
ento comear_a_frear

Estas regras so chamadas de regras de condio-ao Conexes nos seres humanos:


Aprendidas: dirigir Reflexos inatos: tirar a mo do fogo, ou piscar qdo algo se aproxima do olho

Projeto do agente:

Construir um interpretador de uso geral para regras de condio-ao Criar um conjuntos de regras para cada ambiente de tarefa
33

Esquema de funcionamento
Agente
sensor
Como o mundo est agora?

Regras condioao

Que ao eu devo realizar agora?

atuador
34

Ambiente

Funcionamento
function AGENTE-REFLEXO-SIMPLES(percepo): ao static: regras (um conjunto regra condio-ao) estado INTERPRETA-ENTRADA(percepo) regra CASAMENTO-REGRA(estado, regras) ao AO-REGRA[regra] return ao

INTERPRETA-ENTRADA Gera uma descrio abstrata do estado a partir do que foi percebido CASAMENTO-REGRA Retorna a primeira regra que "casou" com a descrio do estado

35

Limitaes

So simples, porm limitados Funcionar somente se a deciso correta puder ser tomada com base apenas na percepo atual

Ambiente completamente observvel

Exemplos de alguns problemas:

Talvez somente uma imagem no suficiente para determinar se o carro da frente esta dando sinal de mudana de direo, alerta ou freio

36

Agente reativo baseado em modelo

Como lidar com a possibilidade de observao parcial

O agente deve controlar as partes do mundo que ele no pode ver agora

O agente deve manter um estado interno que dependa do histrico de percepes e reflita os aspectos no observados no estado atual Dois tipos de conhecimento so necessrios para atualizar o estado interno do agente (modelo do mundo):

Como o ambiente evolu independente do agente

Um carro que est ultrapassando em geral estar mais perto do que estava um instante antes Se o agente virar o volante direita, o carro ir virar p/ a direita
37

Como as aes do prprio agente afetam o mundo

Modelo de mundo

O conhecimento de como o mundo funciona

Pode ser implementado em simples circuitos booleanos ou em teoria cientficas completas

Agente baseado em modelo

Um agente que usa o modelo de mundo

38

Esquema de funcionamento
Agente
Estado Interno Como o ambiente evolu O que minhas aes fazem Regras condioao Que ao eu devo realizar agora?

sensor
Ambiente
Como o mundo est agora?

atuador
39

Funcionamento
function AGENTE_REFLEXO_COM_ESTADO(percepo):ao static: estado (uma descrio do estado atual do mundo) regras (um conjunto regra condio-ao) estado ATUALIZA-ESTADO(estado,percepo) regra CASAMENTO-REGRA(estado,regras) ao AO-REGRA[regra] return ao ATUALIZA_ESTADO > responsvel por criar uma nova descrio do estado interno

40

Limitaes

Conhecer os estados do ambiente no suficiente para tomar uma boa deciso Exemplo:

o agente Motorista de Txi chega a um cruzamento com trs caminhos, qual direo tomar?

Simplesmente reagir: mas existem trs reaes possveis Examinar o modelo de mundo: no ajuda a decidir qual o caminho

A deciso depende de onde o txi est tentando chegar

41

Agente baseado em objetivos

O agente precisa de algum tipo de informao sobre o seu objetivo

Objetivos descrevem situaes desejveis. Ex: estar no destino

Combinando informaes sobre:


O objetivo do agente Os resultados de suas aes

O agente pode escolher aes que alcancem o objetivo A seleo da ao baseada em objetivo pode ser:

Direta: quando o resultado de uma nica ao atinge o objetivo Mais complexa: quando ser necessrio longas seqncias de aes para atingir o objetivo
42

Agente baseado em objetivos

Para encontrar seqncias de aes que alcanam os objetivos

Algoritmos de Busca e Planejamento

A tomada de deciso envolve a considerao do futuro -> distinta das regras de condio-ao

O que acontecer se eu fizer isso ou aquilo? O quanto isso me ajudar a atingir o objetivo?

Agentes reativos: reao -> frear qdo carro da frente frear Agentes baseado em objetivo: raciocnio -> carro da frente freia -> carro da frente diminui velocidade -> objetivo: no atingir outros carros -> ao para atingir objetivo: frear
43

Esquema de funcionamento
Agente
Estado interno

sensor
Como o mundo est agora? Como o mundo ficar se eu fizer a ao x Que ao eu devo realizar agora?

Como o ambiente evolu O que minhas aes fazem

Objetivos

atuador
44

Ambiente

Consideraes e limitaes

O agente que funciona orientado a objetivos mais flexvel


Agente reflexo aes pr-compiladas (condio-ao) Agente p/ objetivo pode alterar somente o objetivo sem necessidade de se reescrever as regras de comportamento

Mais flexvel representao do conhecimento permite modificaes

Ex: Se comear a chover todos as informaes relevantes podem ser alteradas para se operar de forma eficiente

O objetivo no garante o melhor comportamento para o agente, apenas a distino entre estados objetivos e no objetivos

Ex: Algumas alternativas de planejamento de aes futuras podem ser mais rpidas, seguras ou baratas que outras
45

Agente baseado em utilidade

Se um estado do mundo mais desejvel que outro, ento ele ter maior utilidade para o agente Utilidade uma funo que mapeia um estado para um nmero real que representa o grau de satisfao com este estado Especificao completa da funo de utilidade decises racionais em dois tipos de casos:

Quando existem objetivos conflitantes (velocidade x segurana) a funo de utilidade especifica o compromisso apropriado Quando existem vrios objetivos que se deseja alcanar e nenhum deles pode ser atingido com certeza ponderar a importncia dos objetivos
46

Esquema de funcionamento
Estado interno Como o ambiente evolu O que minhas aes fazem

sensor
Como o mundo esta agora

Utilidade

Quo feliz serei se ir para tal estado Que ao eu devo fazer agora

Agente

atuador
47

Ambiente

Como o mundo ficar se fizer a ao

Agentes com aprendizagem

Em agentes sem aprendizagem tudo o que o agente sabe foi colocado nele pelo projetista Turing prope construir mquinas com aprendizagem e depois ensina-las Aprendizagem tambm permite ao agente atuar em ambientes totalmente desconhecidos e se tornar mais competente do que o sue conhecimento inicial poderia permitir Quatro componentes conceituais de uma ag com aprendizagem:

Elemento de aprendizado Crtico Elementos de desempenho Gerador de problemas


48

Agentes com aprendizagem componentes

Elemento de aprendizado:

Responsvel pela execuo dos aperfeioamentos Utiliza realimentao do crtico sobre como o agente est funcionando Determina de que maneira o elemento de desempenho deve ser modificado para funcionar melhor no futuro

Crtico:

Informa ao elemento de aprendizado como o agente est se comportando em relao a um padro fixo de desempenho necessrio pq as percepes no fornecem nenhuma indicao de sucesso O agente no dever modific-lo

49

Agentes com aprendizagem componentes

Elementos de desempenho:

Responsvel pela seleo de aes externas (agente completo) Recebe percepes e decide sobre aes

Gerador de problemas:

Responsvel por sugerir aes que levaro a experincias novas e informativas Aes no timas a curto prazo para descobrir aes timas a longo prazo

50

Agente motorista de txi com aprendizagem

Elemento de desempenho: conhecimento e procedimentos para dirigir Crtico: observa o mundo e repassa para o elemento de aprendizagem a reao dos outros motoristas a uma ao do agente Elemento de aprendizagem:

capaz de formular uma regra afirmando que a ao foi boa/ruim Modifica o elemento de desempenho pela instalao da nova regra

Gerador de problemas:

Identifica reas que precisam de melhorias Sugere experimentos: testar os freios em diferentes superfcies
51

Agentes que aprendem


sensor
Crtico

Elemento de aprendizado

Elemento de Desempenho

Gerador de Problemas

Agente

atuador
52

Ambiente

Você também pode gostar