Você está na página 1de 5

[https://doi.org/10.

1007/s00426-009-0230-6]

> OS CRITÉRIOS
→ É necessário que seja um comportamento instrumental, estando, portanto, sobre
o controle das consequências desencadeadas.
→ Atender para os critérios de crença e desejo
→ CRITÉRIO DE CRENÇA
→ É necessário que a relação ação e consequência tenha sido aprendida
→ É necessário que seja mais que sensível, é necessário uma representação
causal entre ação e consequência. Desse modo, o desempenho da resposta é
mediado por esse processo
→ Respostas instrumentais habituais não atendem a esse critério. Dado o
estímulo associado a resposta, a resposta é efetuada
→ CRITÉRIO DE DESEJO
→ Este critério estabelece que ações direcionadas a objetivos são
controlados pelo valor afetivo ou motivacional do resultado no momento em que a
ação é realizada
→ Os estudos manipulam o valor afetivo de um meta através do paradigma
de Reavaliação do Resultado
→ A suposição inicial é que este paradigma deve apenas manipular o
estado afetivo de uma meta. Para esse fim, é necessário, primeiramente, que o
agente possua conhecimento da contingência da ação-resultado, previamente.
Segundo, a o agente é capaz de avaliar a meta à luz de suas necessidades e desejos
atuais e usar essa avaliação para decidir se realiza ou não a ação

“Em um procedimento típico de reavaliação de resultados, os ratos são


primeiro treinados para realizar uma ação para obter um determinado
resultado alimentar. Após esse treinamento instrumental, o valor desse
desfecho é reduzido na ausência da oportunidade de realizar a ação
instrumental, seja pelo estabelecimento de uma aversão alimentar específica
ao parear o consumo de alimentos com a indução de náuseas (Garcia,
Kimeldorf, & Koelling, 1955 ) ou pela alimentação ilimitada do animal para
induzir saciedade específica para este alimento (Balleine & Dickinson, 1998a ,
1998b).”

→ Posteriormente, os animais têm a oportunidade de realizar a ação


instrumental. É esperado que após a modulação afetiva, a frequência da resposta
caia em decorrência da desvalorização. Sublinha-se que o comportamento é medido
em um contexto de extinção(a resposta não desencadeia nas consequências
desejadas)
→ Não há dúvidas que nossas respostas são direcionadas a objetivos. Embora, seja
pouco sabido como ocorre, e menos como se desenvolve durante a vida.
→ Os bebês tinham a oportunidade de assistir o desenho A ou B a depender da
ação realizada. Foi ensinado a ação para consequência A e B. Posteriormente, um
dos desenhos foi desvalorizado através da apresentação repetitiva. Em seguida, foi
permitido que eles escolhessem, e consistentemente os bebês fizeram a ação que
dava acesso ao desenho não repetido ou com a meta valorizada. Os bebês tinham 2
anos. Feito por Klossek, Russell e Dickinson
(2008)[https://doi.org/10.1037/0096-3445.137.1.39]. Replicado em outro cenário
por Kenward, Folke, Holmberg, Johansson e Gredeback
(2009)[https://doi.org/10.1037/a0014076].
> TEORIAS (CONSEQUÊNCIA → RESPOSTA)CR
→ CRITÉRIO DA CRENÇA
→ A invocação da representação do resultado leva a resposta motora
→ Caso a aprendizagem instrumental estabeleça associações C → R, é
esperado que a apresentação da consequência produza a resposta aprendida
previamente.
→ Drogas parecem ser especialmente fortes para indução da resposta
→ A apresentação da droga aumenta o desejo e a propensão para
procurá-la [https://doi.org/10.1037/1064-1297.2.4.31]. Revisão em animais
[https://doi.org/10.1007/978-1-4612-4812-5_12]
→ Dicas sensoriais pós-reforçamento
→ [https://doi.org/10.1037/0097-7403.11.1.52]
→ Pré-treinamento de alavanca, após o acesso ao reforçador,
havia o emparelhamento com algum estímulo dica(luz, som).
→ A hipótese foi que caso houvesse ocorrido uma associação C
→ R, é esperado que o grupo que passar por um treino discriminativo
e o estímulo preditor seja coerente com apresentação na fase
pré-treinamento, esse terá uma aprendizagem mais rápida(grupo
congruente). O grupo incongruente é oposto
→ Experimento com humanos
[https://doi.org/10.1037//0096-1523.27.1.229]
→ Processos de priming(suscetibilidade a determinada coisa) P
→ C.
P→C→R
→ Estar coerente com uma dada expectativa(?), a recordação foi
mais fortemente estabelecida
→ Transferência Pavloviano para Instrumental (PIT)
→ “Ouço o som do carro da pamonha(S), recordo-me do gosto
agradável da pamonha(C), vou até o carro da pamonha e como-a(R)

“Com esta tarefa, foi demonstrado que um estímulo puramente pavloviano


pode estimular o desempenho de uma resposta instrumental que foi
emparelhada separadamente com o mesmo resultado que o estímulo
pavloviano (Baxter & Zamble, 1982 ).; Blundell, Hall e Killcross, 2001 ; Colwill
& Motzkin, 1994 ; Colwill & Rescorla, 1988 ; Corbit, Janak, & Balleine, 2007 ;
Holanda, 2004 ; Kruse, Overmier, Konz, & Rokke, 1983 ; Rescorla, 1994 )”

→ O treinamento não é feito em conjunto, sendo feito o treinamento


pavloviano com o estímulo preditor e o reforçador, sendo após seguido treinamento
da resposta instrumental
→ Ratos receberam treinamento pavloviano em que luz se associou
com comida e ruído sonoro com água açucarada. Em seguida receberam
treinamento instrumental para puxar a alavanca para comida e puxar corrente para
água açucarada. A apresentação do ruído levou a puxar mais frequentemente a
corrente, enquanto a luz para puxar a alavanca.
→ Desse modo há evidências que tanto animais como humanos apresentam
sensibilidade às consequências, como também aos estímulos indiretamente
associados a ela, assim a resposta iniciada se apresenta coerente às consequências
diretas ou eventos preditores dessas. Cumprindo deste modo o critério da crença
> TEORIAS (RESPOSTA → CONSEQUÊNCIA)RC
→ CRITÉRIO DO DESEJO
→ Delineamentos do tipo PIT não mostram mudanças mesmo após a
desvalorização do resultado ter sido empreendida. Pelo menos em ratos
→ Lesões no núcleo accumbens tornam os ratos insensíveis a desvalorização
dos resultados, sem que isso afete processos do tipo PIT
→ Grandes quantidades de treinamento eliminam os efeitos do PIT
→ Modelo R → C, nesta perspectiva, é primeiro pensado sobre as
possibilidades possíveis, sendo os desfechos da decisão avaliados afetivamente,
aumentando assim a probabilidade de ocorrer a resposta associado com desfecho
mais agradável
→ O problema inicial do modelo diz respeito a amostragem de
respostas. Solução S[R – C].
→ A solução envolve o desenvolvimento inicial de hábitos que seguidos de
reforço criam as representações da resposta e da consequência
→ Barulho do sorvete → Pensamento da ação → Pensamento da
consequência → Resposta motora
→ Modelo Associacionista-Cibernético como implementação
→ MODELO ASSOCIACIONISTA-CIBERNÉTICO

→ Inicialmente, a relação do estímulo sonoro e resposta de aproximação são


reforçados com o desfecho favorável, sendo o programa motor também reforçado.
Contiguamente, um sistema de memória associativa, cria a partir dos feedbacks da
memória de hábito uma representação perceptiva do processo, seja da resposta em
si, como também do evento reforçador(o valor de um resultado é aprendido
experimentando diretamente as reações hedônicas a ele. )
→ Exemplo do sorvete para ilustrar a operação integrada do modelo AC.
Após alguma experiência limitada com o vendedor de gelo, a audição do jingle
ativará uma tendência de aproximação através da associação S→R na memória do
hábito, que por sua vez tenderá a excitar a unidade M para esta resposta no sistema
motor. Concomitantemente, pensamentos da resposta de aproximação e do sorvete
serão ativados na memória associativa por meio das associações R→F e F→O,
respectivamente, que por sua vez ativarão a unidade de recompensa no sistema de
incentivos, provocando um efeito geral e indiscriminado. influência em todas as
unidades do sistema motor. A característica importante do feedback positivo é que
ele só é eficaz quando coincide com uma entrada excitatória do sistema de hábito
para as unidades motoras de aproximação
→ Autonomia comportamental
→ “O reforço contínuo deve fortalecer a associação S→R na memória
de hábito a tal ponto que a apresentação do estímulo possa acionar de forma
confiável a unidade motora para a resposta antes que a via de feedback mais longa
através da memória associativa possa avaliar se o resultado é atualmente um
objetivo para o animal. Se o treinamento extensivo estabelece ou não autonomia
comportamental comparável em humanos aguarda investigação e, até o momento,
a única demonstração experimental de autonomia comportamental em humanos
adultos é aquela engendrada por conflito de resposta devido à interferência
associativa estímulo-resultado (de Wit et al., 2007 ).”
→ Memória de Hábitos vs Memória de Associações
→ Esquema de razão favorece as memórias de associação. Oposto de
esquema de intervalo
[https://doi.org/10.3758/s13415-014-0300-0]

Você também pode gostar