Escolar Documentos
Profissional Documentos
Cultura Documentos
ndice
1
Introduo ................................................................................................... 4
1.1
1.2
IA Que utilidade?.................................................................................................................. 4
1.3
IA O que ? ........................................................................................................................... 4
1.4
1.4.1
Agentes ........................................................................................................................... 4
1.4.2
Tarefas............................................................................................................................. 5
1.4.3
Ambientes ....................................................................................................................... 5
1.5
Metforas................................................................................................................................ 6
1.5.1
Computacional ................................................................................................................ 6
1.5.2
Conexionista.................................................................................................................... 7
1.5.3
Biolgica .......................................................................................................................... 7
1.6
Problema N-Rainhas................................................................................................................ 8
1.6.1
1.6.2
1.6.3
1.7
IA possvel? ...................................................................................................................... 10
1.7.1
Teste de Turing.............................................................................................................. 11
Generalidades ....................................................................................................................... 14
2.1.1
Taxinomia ...................................................................................................................... 14
2.1.2
Arquitectura .................................................................................................................. 15
2.1.3
2.2
2.2.1
2.3
2.3.1
2.3.2
2.3.3
Agentes de Procura.................................................................................... 26
3.1
3.2
IIA
Espcie de Sebenta/Resumo
3.2.2
Em comprimento primeiro............................................................................................ 30
3.2.3
Variantes ....................................................................................................................... 32
3.3
3.4
6.2
IIA
Espcie de Sebenta/Resumo
1 Introduo
IAFA Cap. 1
Estrutura do agente:
Percepo: mecanismo que lhe permite recolher informao do ambiente;
Aco: mecanismo que lhe permite actuar sobre o ambiente;
Deciso: processos que lhe permitem definir qual a melhor aco a realizar. Estes processos de
deciso sero tanto mais sofisticados quanto mais complexa for a tarefa e/ou o ambiente.
Propriedades do agente:
Corpo;
Localizao: existem no espao e no tempo;
Capacidades: tm um conjunto de instrumentos para perceber e actuar sobre o ambiente;
Mecanismos de deciso: tm mecanismos de suporte aco inteligente.
IIA
Espcie de Sebenta/Resumo
IIA
Espcie de Sebenta/Resumo
1.5 Metforas
[1.2]
1.5.1 Computacional
A metfora computacional parte do princpio de olhar para a inteligncia como computao.
Considera-se que os computadores e a mente humana so instncias de uma famlia de artefactos
denominados Sistemas Fsicos de Smbolos (SFS). Na base dos SFS, esto estruturas simblicas que
no so mais do que representaes de conhecimento. Os SFS tm a capacidade de processar essas
representaes, produzindo ao longo do tempo novas estruturas simblicas.
A inteligncia ento o resultado da actuao dos processos sobre as estruturas simblicas. Assim,
temos:
Inteligncia = Processos + Estruturas Simblicas
Os processos podem ser de criao, modificao, cpia ou destruio de smbolos que so usados
para compor as estruturas simblicas.
Um SFS vive e interage num mundo determinado. Tem mecanismos de percepo e de actuao, par
alm obviamente de mecanismos cognitivos. O SFS recebe do mundo um conjunto de percepes
que so filtradas e organizadas internamente como estruturas simblicas. Em funo dos seus
objectivos, fixados interna ou externamente, o SFS processa essas representaes e determina que
aco deve realizar tendo em vista a satisfao desses objectivos. Esta situao iterado sem fim ao
longo do tempo.
IIA
Espcie de Sebenta/Resumo
1.5.2 Conexionista
A metfora conexionista olha para a inteligncia como sendo uma propriedade emergente das
interaces de um nmero elevado de unidades elementares de processamento. A ideia central do
conexionismo a de que a cognio pode ser modelada como sendo a (o resultado da) interaco
simultnea de muitas unidades, semelhantes a neurnios, densamente interligadas.
Neurnio artificial: existe um conjunto de entradas (xi) que tm associados pesos (wi). calculada a
soma pesada das entradas que, se ultrapassar um valor limiar de referncia (), faz com que o
neurnio dispare produzindo um sinal sua sada (y).
Existem vrios tipos de redes de neurnios artificiais, tendo sido propostas vrias classificaes. Uma
classificao possvel envolve trs aspectos: o modo como os neurnios se ligam entre si (topologia),
como ficam activos ou inactivos (funo de activao), ou a forma como modificam alguns dos seus
elementos (dinmica de rede).
Existem dois grandes tipos de representaes:
Local: cada unidade simples pode representar directamente um aspecto do mundo;
Distribuda: cada unidade elementar pode estar ligada a mais do que um aspecto do mundo e, do
mesmo modo, vrias unidades podem ser usadas para representar um dado aspecto do mundo.
1.5.3 Biolgica
Sustenta-se numa analogia com a forma como as espcies evoluem.
Na abordagem de inspirao biolgica, para se resolver um problema, parte-se de um conjunto de
solues candidatas, designada populao, que se faz evoluir ao longo do tempo de acordo com os
princpios darwinistas. Cada elemento da populao chamado indivduo. Por seu turno um
indivduo formado por cromossomas, eles prprios constitudos por genes que podem assumir
diferentes valores ou alelos. Cada indivduo tem associado uma qualidade ou um mrito, que define
o seu grau de adaptao. Os de melhor qualidade tm uma probabilidade maior de sobreviver e,
consequentemente, de se reproduzir.
IIA
Espcie de Sebenta/Resumo
IIA
Espcie de Sebenta/Resumo
Cada neurnio representa uma posio no tabuleiro e pode estar activo (tem rainha nessa posio)
ou no. Como existem n^2 neurnios, existem 2^(n^2) configuraes diferentes da rede, tambm
chamadas de estados. A cada estado podemos associar uma funo de energia que reflicta os
ataques entre rainhas. Deste modo uma soluo para o nosso problema traduz-se em encontrar um
estado de energia mnima. Para isso teremos que alterar as sadas dos vrios neurnios que, como j
dissemos, dependem do valor dos pesos e do limiar. Como se pode ver, tambm nesta abordagem
crucial a definio de uma representao apropriada e de um mecanismo apropriado de raciocnio.
Igualmente, fundamental ter uma noo de proximidade soluo, o que dado pela funo de
energia.
Fica garantido que a rede, independentemente do seu estado inicial, ir, em princpio, convergir
para um estado estvel que corresponder a uma disposio das n rainhas que no se atacam
mutuamente. A chave da soluo est numa definio cuidadosa da funo de energia. Isso passa
por introduzir nessa funo as restries de problema.
Comentrio sobre a aproximao ao problema:
A representao do tabuleiro est distribuda pela rede, pelo que a soluo uma propriedade
emergente. Graas utilizao da funao de energia, apenas uma parte limitada do espao de
IIA
Espcie de Sebenta/Resumo
generalizvel, pois para cada caso preciso definir a funo de energia apropriada, o que
nem sempre trivial. Tambm no existe a garantis de o algoritmo convergir para uma
soluo que represente um mnimo global, isto , podem existir estados estveis com u
nmero de rainhas diferente de n.
Neste caso, a qualidade de um indivduo pode ser dada pelo somatrio dos ataques entre rainhas.
Determinando o nmero de ataques, permite-nos determinar o mrito relativo de uma
representao. Um par de indivduos ser selecionado para reproduo com base no seu mrito
relativo.
Este mtodo de seleco habitualmente designado por mtodo roleta.
Ex: temos quatro configuraes de mrito absoluto 1, 2, 3, 4. O respectivo mrito relativo ser 0.1,
0.2, 0.3 e 0.4. ou seja, a 1 configurao tem 10% de hipteses de ser escolhida, a 2 tem 20% de
hipteses, etc. Ilustrando em forma de roleta (neste caso pie-chart), a roleta ao parar de rodar vai
indicar qual o individuo selecionado.
Os operadores utilizados para combinar o material gentico sero a recombinao e a mutao.
Estes operadores tm de ser definidos de modo a no gerar indivduos impossveis.
Uma das caractersticas fundamentais desta abordagem prende-se com o facto de tratarmos em
paralelo vrias solues e de, em geral, apenas uma parte limitada do espao de configuraes ser
analisado. Tal permite que se possam abordar problemas de grande complexidade. O recurso
funo de mrito permite guiar a procura.
1.7 IA possvel?
[1.4]
Afirmar a partilha da inteligncia com as mquinas, coloca o Homem perante uma realidade que tem
naturalmente dificuldade em aceitar.
IIA
Espcie de Sebenta/Resumo
10
IIA
Espcie de Sebenta/Resumo
11
Conscincia: Somente quando as mquinas puderem ter conscincia, ou seja, saberem que so e no
apenas serem, que poderemos admitir que as mquinas pensam.
Resposta de Turing: este tipo de objeo cai num solipsismo, ou seja, s podemos saber se uma
mquina pensa se nos podermos tornar a prpria mquina. O que na realidade devemos fazer
julgar se uma mquina inteligente ou no pelos resultados que ela nos fornece, como fazemos
com as pessoas nossa volta.
Incapacidades Vrias: Embora se possam construir mquinas que possam fazer muita coisa, nunca
existiro mquinas que possam ser amveis ou belas ou que se enganem ou que se apaixonem ou
Resposta de Turing: as crticas apresentadas so formas disfaradas de argumento da conscincia e
devem ser respondidas da mesma maneira.
Lady Lovelace: As mquinas s fazem aquilo para que ns, humanos, as programmos.
Resposta de Turing: isso no impede que possamos construir uma mquina que possa aprender
ou pensar por si mesma, desde que saibamos ordenar-lhe isto.
Continuidade do sistema nervoso: O crebro, que trabalha com base em impulsos elctricos que so
amplificados e propagados, no uma mquina de estados discretos. Logo, nenhum computador
poder imitar o crebro humano.
Resposta de Turing: no jogo da imitao o interrogador no pode tirar qualquer vantagem disso,
porque um computador poder resolver qualquer problema matemtico por mtodos numricos
aproximados.
IIA
Espcie de Sebenta/Resumo
12
IIA
Espcie de Sebenta/Resumo
13
2 Agentes Reactivos
IAFA Cap. 2
2.1 Generalidades
[2.1]
2.1.1 Taxinomia
Um agente autnomo um sistema situado num ambiente capaz de percepcionar esse ambiente e
actuar sobre ele, ao longo do tempo, tendo em vista a satisfao dos propsitos da sua agenda, de
modo a afectar o que ser percepcionado no futuro.
Autonomia significa que o agente pode tomar decises sem a interveno directa ou indirecta de
outros agentes (humanos ou no)
Ambiente o agente existe mergulhado no ambiente, estando em permanente interaco com ele ,
podendo modific-lo. Esta referncia perenidade (durabilidade) temporal permite, por exemplo,
distinguir o agente da maioria dos programas de computador.
Agenda o agente tem uma agenda, sendo a sua aco guiada para a concretizao dessa agenda.
Para classificar os agentes, juntar algumas propriedades pode tornar os agentes mais especficos.
Propriedades dos agentes
Reactividade Responde em tempo til a mudanas no ambiente
Orientado por objectivos Tem iniciativa. No se limita a actuar apenas como resposta ao ambiente
Comunicao Comunica com outros agentes (eventualmente de outro tipo)
Aprendizagem Muda o seu comportamento de acordo com a sua experincia prvia
Mobilidade Capaz de se transportar a ele prprio de mquina para mquina
Carcter Tem um estado emocional e a sua prpria personalidade
Um agente pode ter um subconjunto destas propriedades. Com base na ideia de conjunto de
propriedades e do conceito de incluso de conjuntos, possvel definir uma hierarquia de agentes.
IIA
Espcie de Sebenta/Resumo
14
Agentes
Naturais
Artificiais
Robticos
Computacionais
Software
Vida Artificial
2.1.2 Arquitectura
Como projectar um agente autnomo?
Formalizao:
O agente vive mergulhado num ambiente. Admitimos que o ambiente pode ser caracterizado por
um conjunto E={e1, e2, } de estados. Ex: e1 temperatura da sala alta; e2 temperatura da sala
est baixa.
O agente capaz de interagir com o ambiente, captando o seu estado e realizando um conjunto de
aces sobre o ambiente que podem levar mudana do seu estado. Seja A = {a1, a2, } o conjunto
de aces que o agente pode realizar. Ex: a1 ligar o aquecimento; a2 desligar o aquecimento.
Matematicamente um agente pode ser definido por:
Agente: E* A
Ou seja, dada um sequncia de estados do ambiente (E*), o agente reage com uma dada aco (A).
Sequncia de estados implica que o agente tem acesso aos estados passados do ambiente e assim
determinar melhor a aco a realizar. Nos agentes mais simples, esta condio no se verifica.
A mudana de estado no ambiente tambm pode ser definido por:
Ambiente: E x A (E)
onde (E) o conjunto potncia de E, o que significa que, dado um estado do ambiente (E) e uma
aco do agente (A), existe no determinismo quanto ao estado para que transita o ambiente. As
interaces sucessivas entre o ambiente e o agente do origem a uma histria (h).
Tendo em vista a implementao do agente, decompomo-lo ento em duas partes: uma transforma
os estados do ambiente em percepes, a outra transforma uma sequncia de percepes (P*)
numa aco:
IIA
Espcie de Sebenta/Resumo
15
1
4
IIA
3
Espcie de Sebenta/Resumo
16
0 livre; 1 ocupado
Veculo 1 de Braitenberg
Abordagem simblica
Abordagem conexionista
- Arquitectura de subordinao
IIA
Espcie de Sebenta/Resumo
17
2.2.1.1.1 Exemplo 1
Agente num ambiente 2D
Sistema de produes simples:
Deambular1:
1.
2.
3.
4.
5.
O1 N
O2 E
O3 S
O4 O
T NIL
Este sistema de produes leva a que haja uma preferncia pela movimentao para norte, visto
esta ser a regra que se encontra em primeiro na lista. Leva tambm a que o agente entre num ciclo,
pois ao atingir o canto superior direito do ambiente em ficar estancado nesse local, variando entre
as duas clulas superiores mais direita.
Uma hiptese para resolver a situao permitir que o agente marque o terreno por onde vai
passando de modo que identifique posteriormente as marcas como obstculos a evitar. Temos que
mudar o SP. Pi o identificador de passagem pela posio i. Obtemos uma nova verso do SP:
Deambula2:
IIA
Espcie de Sebenta/Resumo
18
O1, P1 N, Pag
O2, P2 E, Pag
O3, P3 S, Pag
O4, P4 O, Pag
T NIL
Significado: se o agente est na posio ag e a posio i est livre, ento vai para a posio i e marca
IIA
Espcie de Sebenta/Resumo
19
x4 x1 N
x3 x4 O
x2 x3 S
x1 x2 E
TN
Com este sistema de produes o agente ao encontrar uma parede segue-a. No entanto existem
casos em que o agente no actua do modo esperado. Ao encontrar uma passa estreita o agente no
segue a parede. (Ver livro para exemplos)
2.2.1.2
IIA
Espcie de Sebenta/Resumo
20
IIA
Espcie de Sebenta/Resumo
21
Controlo do motor
Execuo da tarefa
Planeamento
Modelizao
Sensores
Percepo
Actuadores
IIA
Espcie de Sebenta/Resumo
22
Sensores
Actuadores
IIA
Espcie de Sebenta/Resumo
23
O estado interno funciona ento como memria da histria das interaces entre o agente e o
ambiente. Por seu turno, o agente funciona como uma mquina de estados, que vai alterando o seu
estado em funo do seu estado actual e da informao que recebe do ambiente.
2.3.2 Implementao Formiga FORMART
Um sistema de produes tem a capacidade de implementar um agente com estado interno.
Formart uma formiga artificial, num mundo 2D. Formart segue um trilho contnuo de feromona, a
sua tarefa. Cada pedao do trilho ocupa uma clula. A formiga ocupa tambm uma clula,
podendo estar direcionada para cima, baixo, esquerda e direita.
A formiga pode estar em dois estados, activa (On) ou inactiva (Off). Pode avanar uma posio no
sentido em que se encontra, virar 90 graus para a esquerda ou para a direita, e ficar activa ou
inactiva. A sua percepo limita-se a detectar a presena de feromona na clula sua frente. Pode
ainda determinar se est activa ou inactiva.
Queremos especificar atravs de um sistema de produes o mecanismo de controlo da formiga
para que siga o trilho.
Aces possveis:
A Avanar
E rodar 90 graus esquerda
D rodar 90 graus direita
On passa a activa
Off passa a inactiva
IIA
Espcie de Sebenta/Resumo
24
Off, F A, Off
Off, F E, On
On, F A, Off
On, F D, On
O estado interno (On/Off) permite ter informao sobre o passado, isto , sobre o facto de a
formiga andar (On) ou no (Off) a mudar de direco. Assim o comportamento o seguinte.
Enquanto detecta feromona na sua frente avana (regra 1). Quando deixa de sentir, muda de estado
e roda esquerda (regra 2). Se mudou de direco e foi bem sucedida, volta ao estado anterior e
avana (regra 3). Caso tenha sido mal sucedida, volta atrs (regra 4) e mantm o estado de procura
(regra 4).
Constata-se que, sendo colocada inicialmente sobre o trilho e com feromona sua frente, a Formart
nunca sai do trilho. Tambm se verifica que nunca volta atrs. Fica claro neste exemplo o papel do
estado interno a funcionar como memria e a impedir a formiga de entrar em ciclo.
2.3.3 Limitaes sensoriais e estado interno.
(em falta) (parece no ter sido lecionado)
IIA
Espcie de Sebenta/Resumo
25
3 Agentes de Procura
IAFA Cap. 3
Espcie de Sebenta/Resumo
26
IIA
Espcie de Sebenta/Resumo
27
Numa rvore de procura cada n tem um nvel. A raiz tem nvel 0, os seus sucessores nvel 1, etc. A
estratgia de procura em largura primeiro analisa todos os ns de nvel n antes dos ns de nvel n+1.
IIA
Espcie de Sebenta/Resumo
28
Como se pode verificar, o algoritmo comea por formar uma fila contendo o estado inicial (1). Entra
depois num ciclo (2) e, caso a fila no esteja vazia (2.1), situao que gera uma resposta negativa
(2.1.1), retira o elemento cabea da fila (2.2) e analisa-o, relativamente ao teste objectivo (2.3). se
for soluo, devolve-o (2.3.1), seno determina os seus sucessores de acordo com os operadores
que lhe so aplicveis, os quais so inseridos no fim da fila (2.3.2).
Os ns de um dado nvel no so gerados todos na mesma iterao. Existe a possibilidade de
aparecimento de ns j anteriormente expandidos e analisados, o que leva possibilidade de
existirem ciclos. O crescimento do nmero de ns na lista de ns no linear.
completa, mesmo no caso de espaos de procura infinitos ou contendo ciclos. Com efeito, os ns
vo sendo todos analisados nvel a nvel, pelo que, se existir uma soluo, mais cedo ou mais tarde
ela ser encontrada.
Ser discriminadora? Se todas as ligaes tiverem o mesmo custo (por exemplo, a distncia entre
duas quaisquer cidades for a mesma), ento a soluo encontrada ser a melhor (menos
quilometragem percorrida) pois o factor determinante ser o nvel a que foi encontrada a soluo.
Mesmo que os custos das ligaes sejam diferentes, a soluo encontrada pode ainda ser ptima se
o custo do caminho percorrido for uma funo no decrescente do nvel do n. Uma vez mais,
impossvel existir uma soluo melhor a um nvel mais baixo. Em geral, no entanto, estas condies
no esto garantidas, pelo que esta abordagem no garante que se encontre sempre a melhor
soluo.
econmica? A anlise feita em duas componentes: tempo de execuo e espao de memria
necessrio. Considerando que todos os ns tm o mesmo nmero de sucessores (factor de
ramificao), r.
Em termos de anlise temporal, admitindo que a soluo se encontra no nvel n, tiveram de ser
analisados obrigatoriamente todos os ns dos nveis anteriores. No nvel n, a soluo pode estar
entre as posies 1 e n. No pior caso, a soluo encontra-se no ltimo n do nvel.
O nmero de ns analisados cresce exponencialmente com o factor de ramificao, para um dado
nvel, mas tambm quando a variao feita em funo do nvel a que se encontra a soluo,
fixando o factor de ramificao.
Atravs de uma anlise da complexidade assimpttica, constacta-se que a complexidade temporal
de ordem O(rn).
IIA
Espcie de Sebenta/Resumo
29
Esta estratgia parte da raiz, expande um n, escolhe um dos seus sucessores, expande-o por sua
vez, continuando o processo at que encontre a soluo ou o n no possa ser mais expandido.
IIA
Espcie de Sebenta/Resumo
30
IIA
Espcie de Sebenta/Resumo
31
Esta estratgia apresenta um ganho substancial do ponto de vista de memria usada e uma
melhoria do ponto de vista temporal face procura em largura primeiro, mas a impossibilidade de
lidar com ciclos e a no garantia de encontrar a melhor soluo so aspectos negativos a ter em
conta.
3.2.3
3.2.3.1
[3.2.2]
Variantes
Custo uniforme
Pode existir um custo associado s transies de estado. Ex: no caso do mapa, o custo dado pela
distncia quilomtrica entre cidades. Ao aplicarmos um sequncia de operadores desde o n inicial
at um dado n k, o custo do caminho correspondente ser definido pelo soma dos custos parciais.
g(k) a funo que nos d o custo associado ao caminho que nos leva ao n k.
IIA
Espcie de Sebenta/Resumo
32
3.2.3.2
[3.2.4]
Profundidade limitada
Aprofundamento progressivo
Consiste na chamada repetida do algoritmo de procura limitada, fazendo variar o valor do limite
mximo entre o nvel 0 e infinito.
IIA
Espcie de Sebenta/Resumo
33
3.3.1
IIA
Trepa colinas
Espcie de Sebenta/Resumo
34
[3.3.5]
O algoritmo trepa colinas baseia-se na filosofia de encontrar a melhor soluo e no o caminho at
ela. Este tipo de abordagem tem uma natureza tipicamente local e envolve ir melhorando
progressivamente a soluo candidata. O algoritmo descarta todos os vizinhos menos o melhor.
Algoritmo da procura trepa colinas:
Funo TrepaColinas(problema): soluo
1. n_corrente Estado_Inicial(problema)
2. Repete
2.1. n_seguinte Melhor(h, Expanso(n_corrente, Operadores(problema)))
2.2. Se h(n_seguinte) > h(n_corrente) Ento
2.2.1 Devolve n_corrente
Fim_de_Se
2.3. n_corrente n_seguinte
Fim_de_Repete
Fim_de_Funo
Caractersticas:
No completo: pode haver situaes em que uma transio inicialmente promissora nos conduz
para um estado que no soluo e cujos descendentes no melhoram o resultado dado pela
funo de avaliao.
No discriminadora/ptima: podemos terminar num mximo local, o que torna impossvel
melhorar a soluo, logo impossvel atingir a soluo pretendida.
Quanto natureza econmica: em termos de complexidade espacial, esta contantes, ordem O(k),
pois apenas guarda um estado. Em termos de complexidade temporal, semelhante a uma procura
em profundidade primeiro, ordem O(r*n). a utilizao deste algoritmo depende bastante da
natureza do terreno. Para alm do problema dos mximos locais, tambm a existncia de
planaltos pode dificultar o funcionamento do algoritmo, pois, tendo este apenas uma viso local do
terreno, se a funo de avaliao devolver valores idnticos para todos os vizinhos, a escolha ser
ento aleatria.
Existem solues para estes problemas. Uma das possibilidades de tratar dos mximos locais seria
retomar o algoritmo a partir de uma nova posio. Do ponto de vista da complexidade, o algoritmo
IIA
Espcie de Sebenta/Resumo
35
Procura sfrega
[3.3.1]
IIA
Espcie de Sebenta/Resumo
36
3.3.3
A*
[3.3.2]
O algoritmo A* tenta escolher a cada instante o melhor caminho passando pelo n n usando a
funo f(n) = g(n) + h(n). Dado que h(n) nos d um valor estimado, f(n) tambm quantifica o valor
estimado de um caminho passando por n.
Este algoritmo garante, no caso de a funo h(n) ter boas propriedades, no apenas ser completo,
mas encontrar a melhor soluo. Qual a propriedade que h(n) deve possuir? Deve ser admissvel,
entende-se por isso que nunca sobrestima o custo real do caminho que passa por n, ou seja:
h(n) hreal(n)
IIA
Espcie de Sebenta/Resumo
37
IIA
Espcie de Sebenta/Resumo
38
IIA
Espcie de Sebenta/Resumo
39
IIA
Espcie de Sebenta/Resumo
40
IIA
Espcie de Sebenta/Resumo
41
No caso de procurarmos usar uma procura heurstica, temos de ter em ateno o facto de a
heurstica h(n) dever ser admissvel.
Exemplo Charada de 15 algoritmo heurstico
Podemos pensar em usar como heurstica (relembrando que mede a distncia estimada soluo)
o valor do nmero de nmeros na posio errada. Outra possibilidade seria considerar o nmero de
movimentos mnimos para colocar um nmero na sua posio final, admitindo que o caminho est
livre.
Existindo mais do que uma heurstica admissvel, devemos mesmo assim ter cuidado na escolha. Um
critrio simples ser optar pela heurstica que distinga melhor os estados e aproxime mais do valor
real o valor estimado, isto , que fornea valores mais elevados.
IIA
Espcie de Sebenta/Resumo
42
IIA
Espcie de Sebenta/Resumo
43
IAFA Cap. 4
4.1 Generalidades
4.1.1
Arquitectura
4.1.2
4.1.2.1
O mundo
4.1.2.2
As abordagens computacionais
Generalidades
4.2.2
Clculo proposicional
4.2.2.1
Sintaxe
4.2.2.2
Semntica
4.2.3
IIA
Espcie de Sebenta/Resumo
44
IIA
Espcie de Sebenta/Resumo
45
6 Agentes Aprendizes
IAFA Cap. 5
6.1 Generalidades
[5.1]
6.1.1 O significado de aprender
A noo de experincia envolve quer o agente, quer o ambiente externo, do mesmo modo que o
problema do desempenho ter de ser referido a uma dada tarefa. Uma definio que torna mais
claro o relacionamento entre estas quatro diferentes componentes ser:
Aprendizagem o processo pelo qual um agente altera de modo automtico as suas estruturas
internas, de modo a realizar melhor tarefas do seu interesse, nas condies impostas pelo ambiente.
Ex: Admitamos que pretendemos um agente especialista na atribuio de crdito (tarefa). O
ambiente ser composto pelas centenas de processos de concesso de crdito cujo resultado
conhecido. O desempenho do agente pode ser medido pela percentagem de decises erradas que
tomou. O processo de aprendizagem procurar ento diminuir essa percentagem.
Agente
Ambiente
Aprendizagem
Percepo
Aco
Deciso
IIA
Espcie de Sebenta/Resumo
46
IIA
Espcie de Sebenta/Resumo
47
Decisor
Decisor
Crtico
Modificador
Comparador
Mdulo de aprendizagem
Se a avaliao do comportamento do elemento de deciso, feita pelo mdulo crtico por
comparao com um standard, no satisfatria, ento o elemento modificador determina e
promove as mudanas necessrias no elemento de deciso tendo em vista a melhoria do
comportamento do agente. O processo pode repetir-se at que o mdulo de aprendizagem no
promova mais modificaes, altura em que o mdulo de deciso interage com o mdulo de aco
para este reagir sobre o ambiente.
Operacionalizao do problema de aprendizagem:
Dados:
INSTNCIAS (I)
CONCEITO ALVO (C)
EXEMPLOS DE TREINO DO CONCEITO ALVO (C I)
HIPTESES (H)
TEORIA SOBRE O DOMNIO EXPLICATIVA DOS EXEMPLOS (T)
Determinar:
Hipteses hi H para descrever o conceito alvo (C), consistente com os exemplos de treino
(E) e com a teoria sobre o domnio (T)
Significado:
O conjunto de instncias (I) refere-se ao conjunto de todos os objectos do mundo, ex: todas
as cadeiras;
O conceito alvo (C) o que se pretende que o sistema aprenda, ex: o conceito de cadeira;
O conjunto dos exemplos (de objectos) de treino (E) formado pelos objectos usados na
aprendizagem, sendo alguns deles cadeiras;
O conjunto de hipteses (H) definidoras do conceito refere-se s possibilidades de hipteses
definidoras para o conceito alvo, ex: objectos com 4 pernas que suportam uma superfcie
plano e dispondo de encosto;
A teoria sobre o domnio (T) o conhecimento preexistente e explicativo dos exemplos, ex:
uma cadeira um objecto estvel.
IIA
Espcie de Sebenta/Resumo
48
IIA
Espcie de Sebenta/Resumo
49
Neurnio artificial
Uma TLU uma rede neuronal com um nico neurnio, com uma funo de activao do tipo
degrau e usando uma regra delta como regra de aprendizagem. A partir de um conjunto de
exemplos de treino e de um parmetro que especifica a dimenso dos ajustes dos pesos (o ritmo de
aprendizagem ), vai aprender o conjunto de pesos que permite classificar correctamente os
exemplos de treino (e de teste).
Os pesos e o limiar so inicializados com valores aleatrios. Entra-se depois num ciclo em que, para
cada exemplo de treino, se verifica se a rede responde correctamente. Em caso negativo, procede-se
ao ajuste dos pesos na proporo do erro verificado e do ritmo de aprendizagem, seguindo a Regra
de Hebb: A fora entre A e B aumenta se A contribui de modo consistente para o disparo de B.
6.2.1
Generalidades
Neurnio i
Wi
Funo de
Entrada, Ini
Funo de
Activao, g
Funo de
Sada, fi
xi
[5.4.1]
Modelo abstracto do neurnio artificial
Na figura, X = <x0, x1, x2, , xn> representa o vector de entrada proveniente das sadas de outros
neurnios. Wi = <wi0, wi1, wi2, , win> um vector que traduz a fora da ligao entre entradas e o
neurnio i (pesos). Os sinais pesados da entrada so combinados e produzem o sinal total da
entrada. A forma mais usual de combinar os sinais de entrada atravs da sua soma pesada:
IIA
Espcie de Sebenta/Resumo
50
Uma vez conhecido o sinal total de entrada, determina-se o nvel de activao do neurnio usando a
funo de activao g:
(
IIA
Funes de activao
linear
degrau
linear saturada
degrau bipolar
Espcie de Sebenta/Resumo
sigmide
sigmide bipolar
51
A opo por uma destas funes de activao no irrelevante, como se ver mais frente.
6.2.1.2 Topologia
A topologia diz respeito ao modo como os diferentes neurnios se ligam uns aos outros.
Um conjunto de neurnios sem ligaes entre si, recebendo sinais de entrada de outro conjunto de
neurnios e transmitindo os seus sinais de sada a outro conjunto de neurnios chamado de
camada.
Camada
A camada de entrada recebe os sinais de entrada de fora da rede, a camada de sada envia os
seus sinais para fora da rede. A uma camada que no nem de entrada nem de sada designa-se
por camada escondida. Uma rede com uma topologia 3-2-5-4 tem trs neurnios na camada de
entrada, dois na primeira camada escondida e cinco na segunda, e quatro na camada de sada.
Podemos ter redes monocamadas (como as TLU) ou redes multicamadas. Se todos os neurnios de
uma camada estiverem ligados a todos os neurnios de outra camada, as duas camadas esto
completamente ligadas.
IIA
Espcie de Sebenta/Resumo
52
Esta equao significa que, se uma dada entrada xj estiver simultaneamente activada com xi, ento
o valor de peso da sua ligao vai ser modificador de
. O ritmo de aprendizagem, , controla a
velocidade de convergncia dos valores dos pesos para a situao desejada. Se for baixo, a
convergncia lenta, se for elevado pode provocar oscilaes.
Quando estamos a treinar uma rede com exemplos de treino, a variao do peso pode depender da
proporo do erro entre o valor terico e o valor observado:
(
o valor correcto e o valor observado. Falamos neste caso de aprendizagem pela regra delta ou
regra de Widrow-Hoff.
aprendidos:
IIA
Espcie de Sebenta/Resumo
53
O que o algoritmo de aprendizagem faz , ao alterar o valor dos pesos e o valor do limiar, alterar a
inclinao e os pontos de interseco com os eixos.
XOR Limitao
Pode ser implementado com recurso a um AND e um OR, mas os valores dos pesos no so
aprendidos..
IIA
Espcie de Sebenta/Resumo
54
O erro E depende dos pesos wi. Ao alterar os valores destes alteramos o valor de E.
A variao dos pesos dada por:
onde
( )
( )
IIA
Espcie de Sebenta/Resumo
55
( ) (
( ))
Funo sigmide e suas derivadas
necessrio ter em ateno a existncia de camadas escondidas numa rede neuronal. Consideremos
apenas uma camada escondida.
A regra delta generalizada semelhante anteriormente apresentada. No entanto, como existem
mais camadas, uma vez calculado o erro final total, preciso atribu-lo aos vrios pesos da rede.
Consideraremos a seguinte arquitetura para as frmulas seguintes:
l
vji
xi
zj
wkj
yk
sada do neurnio yk
)
Do mesmo modo:
Agora a relao entre a camada de entrada e a escondida. necessrio encontrar uma expresso
para o erro. Enquanto para a camada de sada sabemos os valores que devamos obter, isso no se
passa para os neurnios da camada escondida. A ideia de retropropagao que o n escondido zj
contribui com uma dada fraco de erro para cada um dos ns da camada de sada a que est ligado,
IIA
Espcie de Sebenta/Resumo
56
Juntando tudo:
Ou seja:
6.2.4 Questes
Inicializao dos pesos (inclui o limiar)
Valores elevados fazem com que a derivada da funo sigmide tenha valores pequenos, pelo
que a variao dos pesos tambm baixa. Com valores baixos, o valor da activao ser baixo.
IIA
Espcie de Sebenta/Resumo
57
falsos positivos
verdadeiros
positivos
IIA
Espcie defalsos
Sebenta/Resumo
negativos
58
f
Exemplo
Determinar, a partir de exemplos concretos de condies meteorolgicas, se devemos praticar
desporto ou no.
Domnio: As condies meteorolgicas num dado dia so caracterizadas a partir de um conjunto de
IIA
Espcie de Sebenta/Resumo
59
exemplo positivo
exemplo negativo
Para que a descrio geral se traduza por aprendizagem, essa descrio deve poder caracterizar
correctamente mais exemplos do que aqueles que foram usados para a obter. As hipteses geradas
pelos algoritmos apresentaro atributos cujo valor pode ser qualquer, ou atributos cujo valor no
pode ser nenhum dos existentes.
? qualquer valor
- nenhum valor
Exemplos de hipteses h:
h1 = < ?, frio, alta, ?, ?, ?>
h2 = <?, ?, ?, ?, ?, ?>
h3 = <-, -, -, -, -, ->
h1 caracteriza a situao temperatura do ar frio e humidade alta.
h2 e h3 so os dois casos extremos: h2, o valor de todos os atributos irrelevante; h3, nenhum valor
possvel. h2 diz que todos os dias so bons para desporto; h3 diz que nenhum dia aconselhvel
para fazer desporto.
agora possvel estabelecer uma mtrica comparativa entre valores e hipteses:
Conceito de satisfao: uma instncia x satisfaz uma hiptese h, se e s se h classifica x como sendo
positiva:
h(x) = 1
Diz-se que uma hiptese hi mais geral ou igual do que a hiptese hj se e s se todas as instncias
que satisfazem hj tambm satisfazem hi. Tambm se diz que hj mais especfica ou igual do que hi.
Podem existir hipteses que no se podem comparar luz desta definio.
Exemplos:
h1 = <?, ?, normal, ?, quente, ?>
h2 = <?, ?, normal, ?, ?, ?>
h3 = <?, ?, normal, forte, ?, ?>
h4 = <?, ?, normal, forte, quente, ?>
De acordo com a definio, h2 mais geral do que h1, h3 e h4, mas h1 e h3 no podem ser
comparadas do ponto de vista da generalidade. h3 mais geral do que h4. Obtemos a sequncia:
h1 h2 hi hn
Se hn no tiver nenhuma outra hiptese em relao qual ela seja mais geral, dizemos que hn a
hiptese de sequncia maximamente especfica ou minimamente geral. Do mesmo modo, se no
existir nenhuma hiptese mais geral que h1, dizemos que h1 minimamente especfica ou
maximamente geral.
IIA
Espcie de Sebenta/Resumo
60
forte
fraco
geral
?
As setas do a indicao do mais geral para o mais especfico.
E:
G:
{<limpo, ?, ?, ?, ?, ?>
apresentados.
Exemplo de espao de verses
E simboliza o conjunto das hipteses mais especficas consistentes com os exemplos. G contm o
conjunto das hipteses mais gerais consistentes com os exemplos. As setas indicam o sentido da
relao mais geral ou igual do que.
Todo o espao de verses pode ser representado apenas pelos conjuntos E e G. com base nesse
teorema que o algoritmo de eliminao de candidatos funciona. A partir da fronteira G mais geral
(quando G = <?, ?, ?, ?, ?, ?>), o algoritmo usa os exemplos negativos para tornar mais especfica as
hiptese contidas em G. Simetricamente, para a fronteira mais especfica E (quando E = <-, -, -, -, -, >), o algoritmo usa os exemplos positivos para tornar mais geral E.
Algoritmo de Eliminao de Candidatos:
Funo Eliminao de Candidatos
IIA
Espcie de Sebenta/Resumo
61
mais especfico.
Espcie de Sebenta/Resumo
62
IIA
Espcie de Sebenta/Resumo
63
Problemas:
Rudo: se a classificao for mal efectuada, o algoritmo colapsa fornecendo resultados
inconsistentes;
Valores em falta/desconhecidos: em situaes reais pode acontecer que alguns exemplos de teste
tenha atributos sem valores associados. Coloca-se o problema de saber que valor atribuir nesses
casos. Uma soluo escolher o valor mais frequente para a classe;
Polarizao: o algoritmo prefere as hipteses simples s complexas, princpio genericamente usado
em aprendizagem emprica;
Sobreajustamento: problema que ocorre quando o sistema, dispondo de muitas hipteses onde
podem ocorrer erros, descobre regularidades sem sentido, classificando correctamente os exemplos
de treino, mas incorrectamente os de teste. Uma soluo possvel poder ser limitar o crescimento
da rvore de deciso;
Valores contnuos: necessitam ser discretizados, podendo tambm ainda serem definidos intervalos.
IIA
64
Espcie de Sebenta/Resumo
onde o peso para o ramo i traduz a proporo dos objectos de S que pertencem a Si. O ganho de
informao por optarmos por A como elemento de diviso dado por:
G(A) = I(p, n) E(A)
Chegamos ento seguinte regra:
Regra de escolha Quinlan. Deve-se escolher como atributo de diviso aquele que produz o maior
ganho informativo, o mesmo dizer, para um dado n de etiqueta A, o atributo que minimiza E(A).
Exemplo ver livro, pg. 220 + slides pg. 13
6.4.1 Generalidades
Um sistema classificador (SC) um sistema semelhante a um sistemade produo mas capaz de
aprender regras, denominadas classificadores. Essas regras permitem ao sistema interagir de forma
adaptada com o ambiente, e permitem classificar as mensagens que o ambiente envia ao sistema.
semelhana de um sistema de controlo clssico um SC usa a reaco do ambiente para adaptar os
classificadores ao ambiente.
A reao traduz-se num sinal dito de reforo.
Um sistema classificador pode ainda ser visto como a juno de sistemas periciais baseados em
regras com os algoritmos genticos. O AG utilizado para aprender as regras que melhor se
adaptam tarefa e ao ambiente.
Duas abordagens mis conhecidas:
IIA
Espcie de Sebenta/Resumo
65
Algoritmo Gentico
Arquitectura de um sistema classificador
IIA
Espcie de Sebenta/Resumo
66
IIA
Atribuio de crdito
Espcie de Sebenta/Resumo
67
7 Agentes Adaptativos
IAFA Cap. 6
IIA
Espcie de Sebenta/Resumo
68
8 Sociedades de Agentes
IAFA Cap. 9
IIA
Espcie de Sebenta/Resumo
69