Você está na página 1de 22

1 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E

TECNOLOGIA DO TOCANTINS
CAMPUS ARAGUATINS
PERCEPTRON MULTICAMADAS

Cleberson Rian Rosal


Carlos Eduardo
José Carlos
2

INTRODUÇÃO
O que é inteligência? O que é um ser inteligente?

REPRODUZIR A INTELIGÊNCIA HUMANA


INTRODUÇÃO

Definição de Inteligente: Dotado de inteligência, capaz de compreender,


esperto, habilidoso [Larousse 99];
Faculdade de conhecer, de aprender, de conceber, de compreender: a
inteligência distingue o homem do animal [Larousse 99];
Definição de Inteligência Artificial: Conjunto de teorias e de técnicas
empregadas com a finalidade de desenvolver máquinas capazes de simular
a inteligência humana [Larousse99];

3
INTRODUÇÃO

Definição de Inteligência Artificial: A Inteligência Artificial é uma área de


estudos da computação que se interessa pelo estudo e criação de
sistemas que possam exibir um comportamento inteligente e realizar
tarefas complexas com um nível de competência que é equivalente ou
superior ao de um especialista humano [Nikolopoulos 97].

4
5

O que é Aprendizado?
Adaptação e mudança de comportamento de forma a evoluir (melhorar
segundo algum critério). Um sistema, biológico ou artificial, que não seja
capaz de evoluir ou de mudar seu comportamento diante de novas
situações que lhe são propostas é um sistema sem inteligência;

Correção dos erros cometidos no passado, de modo a não repeti-los no


futuro. Este item está diretamente relacionado ao anterior, o sistema
deve modificar seu comportamento caso o comportamento atual não
satisfaça a algum tipo de exigência (onde a sobrevivência deve ser um
dos quesitos mais importantes a serem considerados nos seres vivos);
6

Otimização: melhoria da performance do sistema como um todo. O


aprendizado pode implicar em uma mudança do comportamento que
busque: a economia de energia gasta para realizar uma tarefa, a
redução do tempo gasto numa tarefa, etc. Quando falamos em
otimização, devemos lembrar que podemos ter quesitos contraditórios
e opostos, onde teremos que maximizar ou minimizar custos de
acordo com algum tipo de critério;
Interação com o meio, pois é através deste contato com o mundo que
nos cerca que podemos trocar experiências e/ou realizar experiência,
de forma a adquirir novos conhecimentos;
7

Representação do conhecimento adquirido: O sistema deve ser


capaz de armazenar uma massa muito grande de conhecimentos, e isto
requer uma forma de representar estes conhecimentos que permita ao
sistema explorá-los de maneira conveniente. Como nossos recursos
são limitados, devemos ter uma maneira de guardar conhecimentos e
regras gerais, pois guardar tudo seria muito difícil (exige muita memória,
dificulta o uso pela lentidão da consulta aos conhecimentos).
8

PERCEPTRON DE MULTICAMADAS
Arquitetura

As redes neurais artificiais são usadas nos diversos setores da sociedade


para resolução de problemas.

 Sistema de controle;
 Reconhecimento de padrões;
 Aproximação universal de funções;
 Identificação e controle de processos;
 Previsão de séries temporais;
 Otimização de sistemas;
9

Características
 Processamento – Neurônio;
 Links de conexão - (Sinais)
 Pesos associados - (Memória)
 Função de ativação;

 Demais características
 Feedforward: Sem realimentação;
 Feedback: Com alimentação;
10

Perceptron de Múltiplas Camadas (PMC)

• Redes neurais multicamadas são arquiteturas em que neurônios são organizados


em duas ou mais camadas.

• As camadas intermediárias são aquelas situadas entre a camada de entrada e a


respectiva camada neural de saída.

• Consequentemente, as redes PMC possuem no mínimo duas camadas de


neurônios, os quais estarão distribuídos entre as camadas intermediárias e a
camada de saída.
11

Princípio de Funcionamento

Fluxo de Percorre nas Camada


Camada de
informações camadas neural de
entrada intermediárias saída
Camada única
Cada neurônio tem a seguinte configuração
X1 W1


W2
X2 F

W3 Função de ativação
Xn

Entrada
O Perceptron de camada única

Exemplo!

 F
Função de ativação

Entrada
14

Multicamadas!

1. As entradas da rede serão propagadas, camada-a-camada, em direção à camada neural de


saída.

2. As saídas dos neurônios da primeira camada neural de saída serão as próprias entradas
daqueles neurônios pertencentes à segunda camada neural escondida.

3. As saídas dos neurônios da segunda camada neural escondida serão as respectivas entradas
dos neurônios pertencentes à sua camada neural de saída.

Pesos Pesos
F
Pesos
  /F
Entrada Saída Final
1º camada 2º camada
escondida escondida
15

Multicamadas!
+Neurônios
Pesos
+Camadas
+Conexões sinápticas
 F Pesos

 F
 F
Saída

Entrada  F
16

1. O modelo de cada neurônio ou elemento processador da rede


possui uma função de ativação.
2. A rede possui pelo menos uma camada oculta de processamento
com neurônios.
3. A rede possui alto grau de conectividade entre seus elementos
processadores. Esta conectividade é definida pelos pesos
sinápticos.
Três classes de função de ativação

Função Sinal Função Sigmoidal

F(x) 0 se x ≤ 0
F(x) 1 se x > 0
x + a se -a < x < a F(x) = 1/1+e-ax
0 se x ≤ 0
1 se x ≥ a

Função linear por partes

17
18

Treinamento MLP
Para que uma rede dessas funcione, é preciso treiná-la. É como ensinar
a uma criança o beabá. O treinamento de uma rede MLP insere-se no
contexto de aprendizado de máquina supervisionado, em que cada amostra
de dados utilizada apresenta um rótulo informando a que classificação ela se
encaixa. Por exemplo, uma imagem de um cachorro contém um rótulo
informando que aquilo é um cachorro.
Assim, a ideia geral é fazer com que a rede aprenda os padrões
referentes a cada tipo de coisa (cada classe), assim, quando uma amostra
desconhecida for fornecida à rede, ela seja capaz de estabelecer a qual
classe tal amostra pertence. Como isso pode ser feito?
19

Passos do Backpropagation
1. Inicialização: Inicialize os pesos da rede aleatoriamente ou segundo
algum método.
2. Processamento direto: Apresente um padrão à rede. Compute as
ativações de todos os neurônios da rede e então calcule o erro.
3. Passo reverso: Calcule os novos pesos para cada neurônio da rede, no
sentido retroativo (isto é, da saída para a entrada), camada a camada.
4. Teste de parada: Teste o critério de parada adotado. Se satisfeito,
termine o algoritmo;
5. senão volte ao passo 2.
O treinamento das redes MLP com backpropagation pode demandar um tempo
de treinamento longo.
20

Isso é um gato ou cachorro?


21

Tempo de Treinamento?

Quanto ao tempo de treinamento, vários fatores podem influenciar a sua


duração, porém sempre será necessário utilizar algum critério de parada. O critério
de parada do algoritmo backpropagation não é bem definido, e geralmente é
utilizado um número máximo de ciclos. Mas, devem ser considerados a taxa de erro
médio por ciclo, e a capacidade de generalização da rede. Pode ocorrer que em um
determinado instante do treinamento a generalização comece a degenerar,
causando o problema de over-training, ou seja a rede se especializa no conjunto de
dados do treinamento e perde a capacidade de generalização.
22

THANKS!
Questionamentos?