Você está na página 1de 29

APRENDIZAGEM E RECOMPENSA

Dr. Flvio Freitas Barbosa

Aprendizagem

mudana relativamente duradoura de comportamento resultante da experincia.

Behaviorismo
J.B. Watson Estudo da mente:
No-cientfico Apenas ambiente E-R

Skinner

Condicionamento Clssico

Condicionamento Clssico

EI

RI

EN + EI
EC

RC

Condicionamento clssico: aversivo ao som

Condicionamento Clssico
Contigidade

Extino
Recuperao espontnea Generalizao do estmulo

Condicionamento de segunda ordem

EC1

EC2

RC

Mais do que contigidade


Significado evolutivo
Prontido biolgica (fobias)

Perspectiva cognitiva
Predio e expectativa Modelo de Rescorla-Wagner

Condicionamento operante

o processo de aprendizagem em que as conseqncias de uma ao determinam a probabilidade de ela ser realizada no futuro

Condicionamento operante

Lei do efeito

E. Thorndike

CONDICIONAMENTO OPERANTE
Associao entre um comportamento e sua conseqncia REFORO
Ao + reforo positivo Aumenta a freqncia da ao que gera o reforo Ao + reforo negativo

Aumenta a freqncia da ao que evita o reforo

PUNIO a ao deixa de ser realizada

Condicionamento operante

Condicionamento operante
Modelagem
Reforar sucessivas aproximaes

Reforos primrios
Comida, gua

Reforos secundrios
Dinheiro, nota 10 (condic. Clssico)

Condicionamento operante
Limitaes biolgicas
Predisposies inatas

Distino aquisio-desempenho
Aprendizagem sem reforo Mapas cognitivos (E. Tolman) insight

Mapas cognitivos

Figure 6: Error curves for HR, HNR, HNR-R.

Aprendizagem por observao


Aprendizagem por imitao
Modelao Reforo vicrio

Neurnios-espelho

Aprendizagem por observao

Aprendizagem por observao

Qual a base biolgica da recompensa?

Condicionamento Operante
Comportamento Espontneo

Recompensa

Aumento

Estimulao eltrica cerebral

Auto-administrao de drogas de abuso

Vias Dopaminrgicas

Teoria de D. Hebb (1949)

When an axon of cell A is near enough to excite cell B and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A's efficiency, as one of the cells firing B, is increased.

Ativao

Reverberao

Plasticidade

trao

dica

evocao

Teoria de D. Hebb (1949)

Reverberao no circuito Plasticidade sinptica Redes neurais distribudas