Você está na página 1de 15

The Journal of Neuroscience, 4 de março de 2020 • 40 (10): 2139–2153 • 2139

Comportamental / Cognitivo

Controle Complementar sobre Hábitos e Vigor Comportamental por


Atividade Fásica no Estriado Dorsolateral

AdamC. G. Crego, Fabián Štoček, Alec G. Marchuk, X James E. Carmichael, X Matthijs AA van der Meer e Kyle S. Smith

Departamento de Ciências Psicológicas e do Cérebro, Dartmouth College, Hanover, New Hampshire 03755

Apesar de evidências claras ligando os gânglios da base ao controle da insensibilidade ao resultado (ou seja, hábito) e vigor comportamental (ou seja, sua velocidade / fluidez

comportamental), ainda não está claro se ou como essas funções se relacionam entre si. Aqui, usando ratos Long-Evans machos em tarefas de corrida em labirinto baseadas
em respostas e em pistas, demonstramos que a atividade fásica estriado dorsolateral (DLS) que ocorre no início de um comportamento aprendido regula o quão vigoroso e

habitual ele é. Em uma tarefa baseada em resposta, uma breve excitação optogenética no início das corridas diminuiu a duração da corrida e a ocorrência de comportamentos

deliberativos, enquanto a estimulação intermediária teve pouco efeito. A desvalorização do resultado mostrou que essas corridas eram habituais. A inibição de DLS no início

da execução não produziu efeitos robustos no comportamento até após a desvalorização do resultado. Naquela hora, quando o DLS era plausivelmente mais criticamente

necessário para o desempenho (isto é, habitual), a inibição reduziu as medidas de vigor do desempenho e causou uma perda dramática da resposta habitual (ou seja, os

animais desistiram da tarefa). Em uma segunda tarefa "beacon" baseada em sugestão que requer iniciação de comportamento no início da corrida e novamente no meio da

corrida, a excitação DLS em ambos os pontos de tempo poderia melhorar o vigor das corridas. O teste de pós-avaliação mostrou que o comportamento na tarefa do farol

também era habitual. Este padrão de resultados sugere que um papel para a atividade DLS fásica na iniciação do comportamento é promover a execução do comportamento de

forma vigorosa e habitual por meio de um conjunto diversificado de medidas. animais desistem da tarefa). Em uma segunda tarefa "beacon" baseada em sugestão que requer

iniciação de comportamento no início da corrida e novamente no meio da corrida, a excitação DLS em ambos os pontos de tempo poderia melhorar o vigor das corridas. O teste de pós-avaliação

Palavras-chave: hábito; vigor; Gânglios basais; optogenética; estriado dorsolateral; labirinto em cruz; ação direcionada a um objetivo; insensibilidade ao resultado;
deliberação (VTE)

Declaração de Significância

Nossa pesquisa expande a literatura duas vezes. Em primeiro lugar, descobrimos que as características de um comportamento habitual que são tipicamente

estudadas separadamente (isto é, desempenho de resposta do labirinto, movimentos de deliberação, vigor da corrida e insensibilidade ao resultado) estão

intimamente ligadas. Em segundo lugar, esforços foram feitos para entender “o que” o corpo estriado dorsolateral (DLS) faz pelo comportamento habitual, e nossa
pesquisa fornece um conjunto chave de resultados mostrando “quando” ele é importante (isto é, na iniciação do comportamento). Ao mostrar um controle tão

dramático sobre os hábitos pela atividade DLS em uma janela de tempo fásica, aplicações plausíveis do mundo real poderiam envolver perturbações DLS mais
informadas para conter hábitos intratáveis problemáticos.

Introdução (DLS, homólogo de putâmen de primata; Yin et al., 2004 , 2006 ; Seger e Spiering,
Hábitos são rotinas comportamentais caracterizadas por sua automaticidade, 2011 ; Smith e Graybiel, 2016 ; Amaya e Smith, 2018 ) Uma linha de pesquisa
consistência e resistência à mudança. Um nó-chave dentro da rede promotora de mostrou que o DLS promove hábitos operantes que são insensíveis a mudanças
hábitos no cérebro é o estriado dorsolateral na relação entre um comportamento aprendido e seu resultado ( Dickinson, 1985 ;

Balleine e Dickinson, 1998 ; Yin e Knowlton, 2006 ; Balleine et al., 2009 ) Uma segunda linha
Recebido em 6 de junho de 2019; revisado em 18 de dezembro de 2019; aceito em 19 de dezembro de 2019.
de pesquisa amplamente separada mostrou que o DLS é importante para o uso de
Contribuições dos autores: ACGC e KSS elaboraram pesquisas; ACC, FS, AGM e JEC realizaram pesquisas;

KSS contribuiu com reagentes / ferramentas analíticas não publicadas; ACGC e KSS analisaram dados; ACGC, FS, AGM, estratégias de execução baseadas em respostas (egocêntricas) em tarefas de labirinto ( Packard,
JEC, MAAvdM e KSS escreveram o artigo. 2009 ), que também pode ser insensível ao resultado em algumas, mas não em todas as
Este trabalho foi apoiado por uma bolsa de pesquisa da National ScienceFoundation (IOS1557987) e uma bolsa dos Institutos
condições ( De Leonibus et al., 2011 ; Kosaki et al., 2018 ) Uma terceira linha paralela de
Nacionais de Saúde (1R01DA044199) para KSS. Agradecemos a Kenneth Amaya, Jacqueline Perron-Smith, Elizabeth McNally,

Alyssa DiLeo, Alex Brown, Elizabeth Smedley e Dr. Stephen pela ajuda.
pesquisa implicou os gânglios da base na promoção da estrutura e do vigor da sequência
Os autores declaram não haver interesses financeiros concorrentes. de movimento ( Aldridge et al., 2004 ; Haithet al., 2012 ; Dudman e Krakauer, 2016 ; da Silva et
A correspondência deve ser endereçada a Kyle Smith em kyle.s.smith@dartmouth.edu ou Adam Crego em
al., 2018 ), com a conclusão de que o DLS controla planos de movimento rápido e fluido ( Novak
Adam.C.Crego.GR@dartmouth.edu.

https://doi.org/10.1523/JNEUROSCI.1313-19.2019
et al.,
Copyright © 2020 os autores
2140 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

2002 ; Dudman e Krakauer, 2016 ) No roedor, as medidas de vigor podem incluir velocidade de proteína rescent (EYFP)], o construto inibitório eNpHR3.0-halorhodopsina (eNpHR3.0)
movimento rápida; baixa duração de desempenho; e, na corrida de labirinto, falta de (tarefa de resposta, n 8; AAV5-hSYN-eNpHR3.0-
EYFP), ou um vetor de controle sem qualquer transgene de opsina (tarefa de resposta,
movimentos de cabeça semelhantes a deliberação [tentativa e erro vicário (VTE)] em pontos de
n 8; tarefa de farol, n 8; AAV5-hSYN-EYFP). Injeção bilateral de DLS
escolha.
e as coordenadas do implante de fibra foram as seguintes (em mm): ântero-posterior
Dada a natureza amplamente não sobreposta dessas linhas de pesquisa, tornou-se
0,5, mediolateral 4,0, injeção dorsoventral (DV) 4,3 do crânio, com implantes de fibra (200 m;
incerto como as medidas de vigor de desempenho, hábito conforme definido pela ThorLabs ou interno) terminando em DV 3,8 mm. ChR2 expressa uma opsina de ganho de função (por
insensibilidade ao resultado e navegação egocêntrica se relacionam. Um ponto de entrada exemplo, canal de sódio artificial, agindo para ativar e despolarizar o neurônio) na superfície da célula
para estudar essa questão, usado aqui, é um sinal de atividade proeminente no DLS que neuronal ( Allen et al., 2015 ) Em contraste, eNpHR3.0 atua como uma opsina de perda de função (por
ocorre durante a transição da ação para o hábito. Especificamente, muitas vezes há uma exemplo, canal de cloreto artificial, agindo para hiperpolarizar o neurônio) na superfície da célula

explosão de atividade DLS (200-500 ms) no início de uma sequência de movimento bem neuronal ( Allen et al., 2015 ) Nós direcionamos os neurônios DLS de forma não específica usando o

aprendida ( Jog et al., 1999 ; Kubota et al., 2009 ; promotor hSyn, uma vez que a maioria dos neurônios de projeção e interneurônios estão ativos no início
do comportamento ( Kubota et al., 2009 ; Smith andGraybiel, 2013a ; O'Hare et al., 2016 ; Vicente et al.,
2016 ) e desempenham um papel crítico nos hábitos ( Lovinger, 2010 ; Nelson e Killcross, 2013 ; Corbit et
Jin e Costa, 2010 ; Thorn et al., 2010 ; Smith e Graybiel, 2013a ) Este evento de
al., 2014 ; O'Hare et al., 2018 ) Os implantes de fibra foram fixados permanentemente ao crânio usando
sinalização foi encontrado em uma variedade de espécies e subtipos neuronais DLS
cimento dentário e parafusos cranianos. Os ratos receberam implantes de fibra e infusões de vetor viral
( Jog et al., 1999 ; Kubota et al., 2009 ;
em uma única cirurgia. Ratos separados foram submetidos a implantes de eletrodos para confirmar a
Vicente et al., 2016 ) e também pode ocorrer em redes cerebrais mais amplas ( Fujii e eficácia da canalrodopsina (ver abaixo). Todos os ratos tiveram um tempo de recuperação pós-cirurgia
Graybiel, 2003 ; Jin e Costa, 2010 , 2015 ; Fujimoto et al., 2011 ; Smith e Graybiel, 2013a ; Desrochers
de pelo menos 1 semana antes da exposição à tarefa.
et al., 2015 ) Notavelmente, os aumentos na magnitude da atividade relacionada ao início
do movimento no DLS e sua entrada de substantia nigra pars compacta estão
intimamente relacionados às mudanças comportamentais que refletem o aumento do
vigor ( Jin e Costa, 2010 ; Smith e Graybiel, 2013a ; da Silva et al., 2018 ) Dentro do DLS
em particular, a explosão de atividade DLS no início de um comportamento é preditiva no Projeto experimental geral
nível de teste único de duração de desempenho reduzida e deliberações reduzidas em Treinamento de labirinto. O labirinto usado em todos os experimentos foi um Plexiglas plusmaze
customizado contendo quatro braços de totalmaze que eram idênticos em comprimento (35,56 cm),
pontos de decisão ( Smith e Graybiel, 2013a ) Em outras palavras, quanto mais forte é a
largura (17,78 cm) e altura (33,02 cm) e que eram separados por uma região central quadrada (diâmetro
atividade DLS no início do comportamento, mais vigorosa é a corrida no labirinto. Esse
25,4 cm; veja Figs. 1 UMA, 4 UMA).
padrão DLS também se correlaciona, embora menos em um nível de teste, com mais
Após a recuperação da cirurgia, os animais receberam uma sessão de habituação em que pelotas de
execuções a um resultado desvalorizado (ou seja, à insensibilidade do resultado no
alimento livre (pelotas de precisão de 45 mg sem poeira: proteína
comportamento; 21,3%, gordura 3,8%, carboidrato 54,0%; produto # F0165, Bio-Serv) estavam disponíveis nos braços
finais do labirinto. Seguiram-se sessões de treino diário de 20 tentativas. Em uma sessão, os ratos
começaram em uma das duas localizações iniciais do braço (por exemplo, braço norte ou sul em um
Smith e Graybiel, 2013a ) design de bloco: cinco tentativas no braço norte, cinco tentativas no braço sul, etc., contrabalançado) que

Em suma, os estudos de perda de função relatam um papel necessário para foram bloqueados por uma inserção removível separando o braço de partida da pista. Uma vez que o

o DLS em hábitos, navegação egocêntrica e vigor, mas quais aspectos destes inserto foi removido (contrabalançado por direção), ele sinalizou para o rato que um teste havia
começado. O rato então cruzou o braço do labirinto inicial até o ponto de decisão central, tendo então a
são regulados pela atividade DLS no início do comportamento é desconhecido;
opção de virar à esquerda ou à direita. No entanto, apenas um braço final foi iscado com um pellet de
não foram feitas manipulações causais para avaliar como esses aspectos do
comida, e esta atribuição permaneceu consistente por rato (isto é, tarefa de resposta: pellet de comida na
comportamento se relacionam uns com os outros. Para responder a essas
direção da curva; tarefa de farol: pellet de comida de pista; veja abaixo). Após cada tentativa, o rato seria
questões, incorporamos uma abordagem optogenética para estimular ou inibir o
colocado de volta no braço inicial. Houve um intervalo de 1 minuto entre as tentativas, com o rato
DLS no início de comportamentos de corrida em labirinto egocêntricos esperando no local do braço inicial. Portanto, uma corrida perfeita seria 20 curvas corretas à direita de um
aprendidos e efeitos estudados no vigor de desempenho e insensibilidade ao local de partida no braço sul de Northarmor. A direção de curva atribuída produzindo um pellet de
resultado. Para identificar a iniciação do comportamento como um ponto de alimento foi atribuída pseudo-aleatoriamente entre os animais e grupos. As durações das corridas por
tempo chave para a função DLS, dois experimentos testaram o papel da segmento do labirinto, as durações gerais das corridas e os eventos da tarefa (por exemplo, hora de

atividade DLS fásica em uma tarefa que permitiu aos animais selecionar uma início, fim do teste, etc.) foram registrados pelo software de rastreamento EthoVision XT (Noldus) por meio

corrida completa desde o início (uma tarefa de resposta) e, separadamente, de uma câmera digital suspensa conectada a um computador. A precisão das medidas comportamentais
automatizadas foi verificada por meio de filmagem e pontuação manual de um subconjunto de sessões
para verificar a precisão dos dados do EthoVision. Os erros devido ao rastreamento deficiente que foram
encontrados no pós-processamento de dados do EthoVision foram corrigidos por análises pontuadas
manualmente diretamente de vídeos de teste individuais. Em raras ocasiões, ocorria um problema
mecânico e esses testes foram omitidos da análise. As deliberações foram contadas como ocorrendo ou
Materiais e métodos não (máximo 1 / tentativa) usando um x – y quadro de referência para o ponto do nariz na região central do

Sujeitos e cirurgia labirinto. As deliberações eram pontuadas manualmente e os pontuadores não enxergavam o grupo. As
Ratos machos Long – Evans ( n 42 para treinamento comportamental, n 3 para electro- deliberações incluíam uma virada clara da cabeça para baixo em um braço do labirinto e, em seguida, um
fisiologia) foram alojados individualmente em um biotério dedicado sob procedimentos de cuidado retorno da cabeça para frente ou para o braço alternativo. O treinamento progrediu ao longo de sessões
direto aprovados pelo Comitê de Uso e Cuidado Institucional de Animais do Dartmouth College. diárias até que a aquisição da precisão do desempenho fosse alcançada (75% por 3 dias).
Todos os ratos foram obtidos com 250-400 ge então mantidos com um peso pós-cirúrgico de 85%
para a duração do treinamento e teste. Os ratos foram alojados em um ciclo reverso de luz /
escuridão, com experimentos de tarefa de resposta conduzidos em um ambiente escuro e
experimentos de tarefa de farol conduzidos em um ambiente claro. Os procedimentos cirúrgicos
foram realizados utilizando técnicas assépticas sob anestesia com isoflurano para permitir a injeção
intracraniana de vetores virais e implantação de guias de fibra óptica. Os ratos receberam injeções
bilaterais (volume de 0,3 l) em DLS usando uma bomba de microinfusão e uma seringa de calibre DLSmanipulations durante as execuções do labirinto. Três dias de teste de manipulação de DLS
33 de uma única construção viral: a construção do canal excitatório rodopsina-2 (ChR2) [tarefa de ocorreram após o cumprimento do critério de precisão. Em dias de manipulação DLS, 473 ou 593,5
resposta, n 8; tarefa de farol, n 10; vírus adeno-associado nm de luz de lasers de estado sólido bombeados por diodo (Shanghai Laser & Optics CenturyCo.,
Ltd.) foram entregues por meio de um patch cord de fibra (Thorlabs) conectado a um divisor de feixe
de junta rotativa integrado (Doric Lentes) que permitiu que dois patch cords de fibra fossem
tipo 5 (AAV5) -sinapsina humana (hSYN) -ChR2-reforço amarelo fluo-
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2141

Figura 1. Tarefa de resposta. UMA, Acima, esquemático da tarefa do labirinto ilustrando o exemplo de virada à esquerda (verde, portões). Protocolo do meio, exemplo de cinco blocos de teste com locais de início para uma sessão.

Embaixo, à esquerda, Sessionorder para aquisição de tarefas (por meio de 3d de 75% de precisão) e teste de linha de base (cabos de fibra conectados, mas sem fornecimento de luz). Abaixo, à direita, protocolo de manipulação de DLS

de exemplo (0,5 s contínuo de entrega de luz) nos dias de teste. B, Execute a precisão em 12 sessões até o último dia de desempenho do critério, separados pelos grupos ChR2 (azul), controle (cinza) e eNpHR3.0 (amarelo). As linhas e

os erros mostram o SEM médio. Os grupos não eram diferentes. C, Mapas histológicos mostrando áreas de expressão de animais ChR2-EYFP, controle EYFP e eNpHR3.0-EYFP. O sombreamento semitransparente denota expressão

por animal; o sombreamento é sobreposto aos animais. Os números indicam o plano ântero-posterior em milímetros em relação ao bregma. X, colocações de implante de fibra. D, Exemplo de imagens confocais de DLS: EYFP,

NeuroTrace, sobreposição de baixa magnitude, sobreposição de alta magnitude. As setas mostram os mesmos exemplos de neurônios na marcação.

conectado diretamente a uma cânula de fibra óptica implantada cirurgicamente (implantes de ocasionalmente, um rato se recusava a executar várias oportunidades de teste consecutivas (uma tendência

fibra internos, 200 m; Thorlabs) por meio de luvas de cerâmica que terminam bilateralmente do grupo eNpHR3.0 na tarefa do labirinto de resposta), caso em que a sessão foi concluída. Para contabilizar

no SDL. A entrega do laser foi controlada pelo software EthoVision XT ou por meio de um isso, os dados foram avaliados para os testes que levaram à primeira oportunidade de teste que falhou. Para a

gerador de pulsos Master-9 (AMPI). A potência de saída foi medida entre 3 e 5 mW no nível análise da porcentagem de tentativas concluídas dentro de uma sessão antes de desistir (um efeito da

de cada conector de ponteira do patch cable por hemisfério antes e depois de cada dia de desvalorização do resultado), a primeira tentativa que um rato falhou em completar dentro de 30 s foi usada

teste. Os implantes foram testados após a perfusão para confirmar a eficácia. Em dias de (por exemplo, se fosse a tentativa 10 de 20, então o cálculo foi de 50% )

manipulação separados, a luz laser foi fornecida como um pulso de 0,5 s bloqueado no início
de um ensaio, um pulso de 0,5 s na chegada ao meio do labirinto, ou como um pulso ciclado Detalhes da tarefa de resposta. Uma das duas tarefas de labirinto usadas foi uma tarefa de
de 0,5 s ligado / desligado para a conclusão completa. 0 contínuo. Smith andGraybiel, 2013a ) execução de labirinto baseada em resposta em que o desempenho é considerado dependente de DLS ( Packard
O parâmetro ligado / desligado de 0,5 s ciclado foi escolhido para incluir a iluminação no início e McGaugh, 1996 ; Chang e Gold, 2004 ; Palencia andRagozzino, 2005 ) Para animais submetidos à
da execução e, em seguida, mais tempo de iluminação (ou seja, para ver se as mudanças tarefa de resposta ( n
comportamentais com a iluminação no início da execução foram aumentadas ainda mais se 24), o treinamento e o teste foram realizados e registrados em um ambiente escuro sob uma luz
mais iluminação foi fornecida durante as execuções), ao mesmo tempo, minimizar o vermelha para minimizar o uso de dicas visuais. Os ratos correndo aprenderam a virar na mesma
aquecimento em o cérebro que pode ocorrer com o fornecimento de luz de longa duração. Os direção (ou seja, sempre virar à direita em um ponto de escolha) em direção a um braço final com isca
dias com entrega de luz no início ou no meio da execução foram contrabalançados entre os para uma única pelota, independentemente da localização inicial do labirinto (ou seja, braço norte ou
grupos em ambas as tarefas, com a entrega de luz ciclada sempre ocorrendo por último. sul). No total, 20 voltas (por exemplo, tudo bem) produziriam uma bolinha de comida em uma sessão
diária. Os ratos nesta tarefa de resposta tiveram a oportunidade de se corrigir se não inserirem o armon
correto na primeira tentativa (ou seja, semelhante a Packard e McGaugh (1996) ) e receberam um total de
30 segundos para completar um teste. Uma corrida tortuosa (ou seja, múltiplas entradas de braço), mas,
em última análise, precisa foi registrada como uma tentativa incorreta ao calcular a precisão geral devido
Desvalorização do resultado. Para definir operacionalmente se os comportamentos de curva do labirinto à falta de uma estratégia de resposta clara na corrida. Os ensaios com mais de 30 s foram contados
foram impulsionados por hábito, realizamos um procedimento de desvalorização do resultado após os três como “erros” e excluídos da análise. Em caso de falha, a sessão continuaria até que 20 tentativas
dias de manipulação DLS. Ratos foram dados AD Libitum acesso aos pellets de comida de tarefa (2,5 g fossem concluídas. As sessões diárias de treinamento foram realizadas até que um critério de precisão
50 pellets) por 30 min fosse atingido (75% por 3 dias), momento em que as manipulações do DLS e a desvalorização do
em sua gaiola em uma sala separada do labirinto. Depois, uma injeção de cloreto de lítio (0,3 M, 10ml resultado procederam como acima.
/ kg, ip) foi administrado para introduzir náuseas. Três desses pares foram dados em intervalos de
48 horas. O consumo de pelotas foi registrado antes e depois de cada procedimento. O consumo
de pelotas durante o desempenho das tarefas também foi registrado antes e após o procedimento
de desvalorização. Detalhes da tarefa de beacon. A segunda tarefa do labirinto foi uma tarefa "beacon" que derivamos
das tarefas win-stay dependentes de DLS e de abordagem de marco intraambiental ( Packard et al.,
Manipulações DLS de peridavaliação. As execuções habituais foram testadas operacionalmente 1989 ; McDonald e White, 1993 ; Sage e Knowlton, 2000 ; Berke et al., 2009 ; Kosaki et al., 2015 ) Para
usando um dia de teste de extinção de pré-avaliação, seguido pelo procedimento de desvalorização de esta tarefa, uma das duas dicas removíveis (dois XXs ou OOs verticais) foi afixada a um dos dois
resultado (por exemplo, três pares separados de injeções de cloreto de lítio (LiCl) após um período de braços da extremidade do labirinto que poderiam ser trocados manualmente. Uma sugestão foi
ingestão livre de 20-30 minutos na gaiola doméstica em um contexto separado), a dia de teste de emparelhada com uma bolinha de comida em um braço final, e a outra sugestão foi emparelhada com
extinção de pós-avaliação (sem pellets) e um dia de teste de pós-avaliação (reaquisição) em que os um prato vazio no braço oposto que também permaneceu consistente durante as tentativas. Nenhuma
pellets puderam ser ganhos novamente. As manipulações DLS ocorreram no início da execução no dia das pistas pode ser detectada até que a região central seja alcançada devido às paredes opacas do
de extinção de pré-avaliação, dia de extinção de pós-avaliação e dia de reaquisição de pós-avaliação. labirinto altas que foram cobertas com uma lona verde removível que pode ser afixada diretamente no
Após a desvalorização do resultado,
2142 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

o labirinto e facilmente removido. Desse modo, os ratos aprenderam a localizar a sugestão que prevê pellets As seções foram então analisadas usando um microscópio confocal (LSM880 com microscópio
de comida, em vez de apenas adivinhar e explorar os dois braços finais e não fazer a associação de que confocal de varredura a laser Airyscan, Zeiss; Dartmouth College Biology Department Light
uma das duas pistas estava emparelhada com uma pelota de comida e a outra resultou em nada. Em Microscopy Core Facility). A aquisição e análise das imagens foram quantificadas usando Imaris
contraste com a tarefa de resposta, em que a direção da corrida pode ser selecionada no início de cada (Bitplane) e Zen Blue (ZEISS). EYFP, NeuroTrace e neurônios marcados duas vezes foram
tentativa, dois segmentos principais de corrida foram necessários para esta tarefa: no início (corrida para o contados separadamente em seções pseudo-aleatórias de DLS usando uma abordagem de grade
meio) e novamente no centro (corrida para pista emparelhada de pelotas ) Todos os testes de de três cérebros.
comportamento da tarefa de farol foram realizados e registrados em um ambiente bem iluminado.

Análises estatísticas de comportamento


ANOVAs de medidas repetidas foram usadas para comparar diferenças em variáveis
Em sessões diárias, os ratos ( n 18) começou no mesmo braço norte ou sul
comportamentais dependentes [por exemplo, duração cumulativa do labirinto, deliberações (VTEs) no
Localizações. A remoção do portão alertou o rato de que o teste havia começado. As sessões consistiram
ponto de escolha, precisão, etc.] para análises dentro e entre sujeitos para os efeitos principais dos
em 20 tentativas por dia com no máximo 20 pellets, com intervalo de 1min entre as tentativas. Os ratos que
seguintes fatores: dia de iluminação (por exemplo, linha de base, início da execução, meio-dia, ciclo
executaram a tarefa de farol atravessaram a pista para o centro, onde a decisão (virar à esquerda ou direita)
ligado / desligado), teste dentro das sessões, grupo de vírus (por exemplo, controle vs ChR2 vs
foi tomada com base na localização da sugestão emparelhada de pelotas, independentemente da
eNpHR3.0) e suas interações. Essas comparações foram conduzidas separadamente para quatro
localização inicial do labirinto (por exemplo, braço norte ou sul). Um desenho de blocos também foi usado
estágios com base em eventos de interesse a priori: (1) aquisição de tarefa; (2) testes de iluminação
(cinco norte, cinco sul, cinco norte, cinco sul). A sugestão XX ou OO significaria a disponibilidade de pílula
após a aquisição; (3) durante os dias de teste de extinção de pré-avaliação e pós-avaliação; e (4)
alimentar e permaneceria no mesmo braço oeste ou leste durante as primeiras 10 tentativas e, em seguida,
durante o dia de reaquisição (a medida de pellets consumidos também foi comparada com um dia de
mudaria para o braço alternativo nas 10 tentativas restantes. Todos os parâmetros foram atribuídos
iluminação de pré-avaliação equivalente para confirmar a avaliação na tarefa). Devido ao interesse a
pseudo-aleatoriamente em ratos. Curvas incorretas para a sugestão desemparelhada resultaram em nenhum
priori em um efeito potencial de nível de teste dentro das sessões de iluminação, os graus de
grânulo de comida. Ao contrário da tarefa de resposta, os ratos que escolheram o incorreto, braço de taco
liberdade para estatísticas de interação envolvendo teste em nosso modelo estatístico eram grandes.
não pareado não tinha permissão para se corrigir. Por exemplo, uma inserção de Plexiglas foi usada para
Se houvesse um efeito principal significativo para uma variável comportamental ou interação entre as
impedir que o rato entrasse no braço correto se ele escolhesse primeiro o braço não pareado, resultando na
variáveis para qualquer uma das tarefas do labirinto (além do dia de teste de reaquisição
colocação manual do rato de volta no local do braço inicial. O treinamento nesta tarefa de farol continuou até
pós-avaliação em ambas), usamos um teste corrigido de Tukey post hoc análise para comparações
o critério de precisão, seguido por dias de teste de iluminação DLS, desvalorização de resultado e dias de
individuais e comparações de dias individuais usando ANOVAs univariados.
teste por desvalorização como acima.

Resultados
Aquisição e processamento de dados de spiking neuronal
Tarefa de resposta
Ratos machos Long-Evans separados ( n 3) foram usados para registro eletrofisiológico da
estimulação neuronal mediada por ChR2, porque nossos parâmetros de estimulação eram um Treinamento e teste
tanto diferentes dos relatos da literatura sobre animais de comportamento livre. Esses ratos Os ratos foram primeiro treinados em uma resposta de labirinto em cruz dependente de DLS

receberam injeções de construção viral contendo ChR2 no DLS como acima e implantados com tarefa ( Chang e Gold, 2004 ; Palencia e Ragozzino, 2005 ), em que uma curva específica (por
uma fibra óptica (núcleo de 200 m, 0,39 NA) rodeado por oito tetrodos móveis exemplo, curva à esquerda) em um ponto de escolha sempre foi emparelhada com uma pelota de
independentemente (VersaDrive-8 Optical, Neuralynx) em qualquer fase crônica ( n comida apetitosa, independentemente do local de partida ( Figura 1 UMA). O treinamento continuou
até que três dias consecutivos de precisão de 75% fossem alcançados. A precisão da execução
2; gravações durante o comportamento livre) ou uma preparação aguda ( n 1;
nas sessões que antecederam o último dia do critério de desempenho não mostrou
gravações sob anestesia com uretano a 1,5 g / kg). As estampas de tempo Transistor-Transistor Logic
(TTL) do sistema de controle de laser e atividade de spiking (filtrada em 600-6000 Hz) foram coletados
efeito do grupo ( F ( 2.243) 1.558, p 0,213) ou dia / grupo inter-
usando um sistema de aquisição Digital Lynx SX e um par de pré-amplificadores HS-18-MM (Neuralynx)
açao ( F ( 22.243) 1.349, p 0,144), mas um efeito principal do dia
com todos os sinais referenciado a um parafuso do crânio acima do cerebelo. Durante as gravações, os
ciclos de fornecimento de luz azul (2–5 mW) foram dados com duração de pulso de 0,5 s a cada minuto ou
( F ( 11.243) 44.861, p 0,001; Figura 1 B). Isso indicou que o rato

como pulsos liga / desliga de 0,5 s para aproximar as condições da tarefa. As sessões únicas incluíram os grupos aprenderam a tarefa de maneira semelhante antes das intervenções
ambos os protocolos de distribuição de luz quando a estabilidade de gravação permitida. Entre as sessões, optogenéticas. Uma série de dias de teste ( Figura 1 A) seguido, durante o qual o DLS foi
os tetrodos foram baixados e a aquisição de novas unidades foi confirmada visualmente. As unidades optogeneticamente estimulado (ChR2) ou inibido (eNpHR3.0) por 0,5 s contínuos no
foram isoladas offline (classificador offline, Plexon), plotadas ( Figura 1 ), e analisado quanto à início das corridas de labirinto, por 0,5 s contínuos durante o meio (centro do labirinto)
responsividade à entrega de luz (NeuroExplorer, NexTechnologies; SPSS, IBM). Uma unidade foi das corridas, ou em 0,5 s contínuos s on / 0,5 s off ciclo para a duração das execuções.
considerada responsiva se a frequência de aumento durante o período de fornecimento de luz ultrapassou
Essas manipulações foram comparadas com uma condição de controle em que os
um intervalo de confiança de 95% do aumento de linha de base por três ou mais intervalos de tempo
animais foram tratados de forma idêntica, mas não apresentavam expressão de opsina
consecutivos de 0,02 s. A atividade da unidade era claramente distinguível dos artefatos fotoelétricos.
DDL A histologia confirmou a colocação precisa de construções virais e fibras no DLS ( Figura
1 C). A imagem confocal (imunocoloração GFP / NeuroTrace) revelou que cerca de 83%
dos neurônios DLS expressaram as moléculas virais ( Figura 1 D). Registros
eletrofisiológicos separados confirmaram que a estimulação contínua mediada por ChR2

Histologia de 0,5 s aumentou a atividade de spiking no DLS ( Figura 2 ); inibição semelhante


Ao término de cada experimento, foi administrada uma dose letal de anestesia mediada por eNpHR3.0 foi relatada ( Gradinaru et al., 2009 ; Smith et al., 2012 ; Chang et
(pentobarbital sódico), seguida de perfusão transcardial de solução salina 0,9% e al., 2017 ) A duração cumulativa média das execuções (tempo total para completar um
paraformaldeído 4%. Os cérebros foram colocados em solução de sacarose a 20% ensaio) foi marcadamente afetada pelas manipulações DLS ( FIG.
durante a noite e congelados a 80 ° C. Os cérebros foram seccionados sob um micrótomo
a 30–60 m, montados em lâminas e cobertos com uma lamela com meio contendo DAPI. A
colocação da fibra e as zonas dos neurônios que expressam EYFP foram avaliadas
usando análise de microscópio fluorescente (microscópio fluorescente BX53 com câmera
3 UMA). Isso foi mostrado por um efeito do dia dentro do sujeito ( F ( 2.9,1014)
DP73, Olympus). Para estimativas da eficácia da infecção viral, seções cerebrais foram
4.828, p 0,003) e uma interação dia / grupo ( F ( 5,8,1014) 3.897,
imunocoradas para marcar EYFP (anticorpos primários e secundários: anti-GFP de coelho
/ anti-rabino de cabra Alexa Fluor 488; anti-eYFP de rato / anti-rato de cabra Alexa Fluor p 0,001), mas sem interações de dia / teste ( F ( 55,1014) 0,934, p

594) e montadas em lâminas com NeuroTrace (Thermo Fisher Scientific), 0,613) ou dia / grupo / ensaio ( F ( 110,1014) 1.081, p 0,276). Simi-
larmente, houve um efeito principal entre os grupos ( F ( 2.338) 17,992,
p 0,001) em todos os três dias de iluminação: início da execução ( F ( 2.451)
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2143

Figura 2. Estimulação evocada por ChR2 de neurônios DLS com luz azul contínua de 0,5 s. Histogramas (caixas de 0,02 s) de todas as unidades únicas gravadas que responderam à luz azul. Taxa de disparo (Hz) é mostrado

0,5 s antes, durante e após o fornecimento de luz. UMA, Unidades registradas sob anestesia ( n 9). B, Unidades registradas durante o comportamento livre ( n 3). A, B, As colunas mostram a mesma unidade registrada quando a luz foi

fornecida por 0,5 s a cada 1min (colunas da esquerda) e quando a luz foi fornecida em um ciclo liga / desliga de 0,5 s (colunas da direita). As lacunas denotam unidades que não foram estáveis ou não foram detectadas durante esse

protocolo de entrega de luz. Embora nem todas as unidades tenham respondido à luz imediatamente, elas exibiram excitação de resposta como confirmação da estimulação do DLS mediada por ChR2. Unidades com atividade inibida

pela luz não foram observadas.

20.733, p 0,001), meio ( F ( 2.447) 7,663, p 0,001), e O número de movimentos deliberativos da cabeça (VTEs) no ponto de escolha no
ciclado ( F ( 2.449) 34.748, p 0,001). Post hoc comparações para centro do labirinto seguiu um padrão semelhante ( Fig. 3 B) à duração cumulativa.
iluminação run-start mostrou que o grupo ChR2 foi mais rápido Encontramos um efeito dentro do assunto
do que controles ( p 0,001) e ratos eNpHR3.0 ( p 0,001), mas o efeito do dia ( F ( 3,1014) 3.423, p 0,017) e interação dia / grupo
O grupo eNpHR3.0 não foi significativamente mais rápido do que os controles ( p ção ( F ( 6,1014) 5,858, p 0,001), mas sem interação de dia / teste
0,751). A estimulação do meio não foi diferente dos controles ( p ( F ( 57,1014) 0,963, p 0,555) ou dia / grupo / teste ( F ( 114,1014)
0,326), mas a inibição resultou em ensaios mais lentos contra os controles ( p 0,033) e 1.030, p 0,402). Semelhante às mudanças na duração da execução, havia um

ratos ChR2 ( p 0,001). Iluminação cíclica post hoc as comparações mostraram efeitos efeito principal entre grupos ( F ( 2.338) 11.023, p 0,001). Dias
bidirecionais de estimulação e inibição, com a estimulação acelerando o desempenho mostrando efeitos significativos foram a iluminação de início de execução ( F ( 2.451)

e a inibição retardando-o: ChR2 / controle ( p 22.148, p 0,001) e iluminação ciclada ( F ( 2.449) 25.975, p
0,001), eNpHR3.0 / controle 0,001), com post hoc comparações revelando que o grupo ChR2 deliberou menos do
( p 0,001), e ChR2 / eNpHR3.0 ( p 0,001). que o controle ( p 0,001) e eNpHR3.0 ( p
2144 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

Figura 3. Mudanças no comportamento do responsemaze com manipulações DLS. UMA, Duração das corridas de labirinto (segundos). A estimulação DLS reduziu a dilatação se fornecida no início da corrida ou ciclada. A inibição de

DLS pode aumentar a duração da corrida marginalmente quando administrada no meio e quando ciclada. B, Porcentagem de julgamentos com deliberações. Aumentos e diminuições na deliberação geralmente seguem aumentos e

diminuições na dilatação. C, Porcentagem de execução correta nos dias de teste de linha de base e iluminação. As manipulações de DLS não afetaram a precisão de execução. Barras e erros mostram o SEM médio; asteriscos denotam

significantes post hoc comparações (* p 0,05, *** p 0,001); falta de asteriscos denota falta de significado.

0,001) grupos, mas não mostrando nenhuma diferença entre eNpHR3.0 e controles ( p Nós primeiro estabelecemos uma linha de base dando aos animais um teste de sonda sob
0,422). Comportamento de deliberação em iluminação ciclada condições de extinção (sem pellets fornecidos) com entrega de luz DLS no início da execução,
dias de ação foi semelhante, mas com a inibição ciclada carregando um efeito significativo de seguido por uma sessão de lembrete de retreinamento normal sem qualquer entrega de luz ( Fig.
aumento da deliberação (ChR2 / controle: p 0,001; 4 UMA). Em seguida, a ingestão livre de pellets de comida em gaiolas caseiras foi combinada
eNpHR3.0 / controle: p 0,001; ChR2 / eNpHR3.0: p 0,001). com LiCl nauseogênico até que uma aversão aos pellets se desenvolvesse. Cada rato recebeu
Assim, as deliberações foram reduzidas com estimulação run-start ou DLS ciclada, assim três pares, e todos os ratos rejeitaram todos os pellets pelo último par em suas gaiolas sem
como a duração da corrida. A estimulação e inibição do meio não afetou as deliberações. quaisquer diferenças de grupo ( Fig. 4 B). Os ratos foram então devolvidos à tarefa e expostos a
As deliberações foram aumentadas apenas com a inibição de DLS ciclada. um teste de sonda de extinção pós-avaliação seguido por um teste de reaquisição
pós-avaliação (ou seja, pellets devolvidos), ambos com luz DLS sendo entregue no início da
A precisão das corridas não foi afetada pela estimulação DLS run-start ( Fig. 3 C), sugerindo execução.
que o uso de regras de tarefas para informar o comportamento não foi afetado. Não houve
efeito principal dentro do assunto
efeitos do dia ( F ( 3,1017) 2.087, p 0,100), nem houve interação Todos os animais correram para o local do objetivo desvalorizado no teste de
ções de dia / grupo ( F ( 6,1017) 1.641, p 0,133), dia / teste sonda de extinção de pós-avaliação em um nível de precisão que foi comparável ao
( F ( 57,1017) 0,881, p 0,722), dia / grupo / ensaio ( F ( 114,1017) teste de extinção de pré-avaliação ( Fig. 4 C).
1.084, p 0,268), ou um efeito principal entre os grupos ( F ( 2.339) Não houve diferenças significativas na precisão de execução entre
1.073, p 0,343). Este resultado mostra que o vigor das corridas em um sessões de extinção por dia ( F ( 1.123) 3.187, p 0,077), grupo
A tarefa de resposta dependente de DLS é poderosamente modulada pela atividade de DLS, ( F ( 2.123) 0,819, p 0,443), ou interação dia / grupo ( F ( 2.123)
especialmente no início do comportamento. Ficamos surpresos que a precisão não foi 0,562, p 0,572). Também não houve diferença na precisão (quando
afetada, dados os relatórios descritos acima de que a navegação de labirinto baseada em ratos correram) durante o dia de reaquisição pós-avaliação ( F ( 2,75)
resposta requer o DLS. 1.309, p 0,276). Embora os animais fossem precisos quando
Análise de ondulações nos segmentos do labirinto (latência para entrar no centro do labirinto correu, descobrimos que uma medida mais sensível de sensibilidade ao resultado é a tarefa
a partir do início da corrida, centro do labirinto, braço final; de "desistir", em que os animais negligenciam até mesmo iniciar uma corrida ( Fig. 4 D). Estatisticamente,
tabela 1 ) indicaram que as mudanças no vigor não estavam relacionadas estritamente a entre os dias de extinção de pré-avaliação e pós-avaliação (ou seja, sessões de extinção
mudanças no início da corrida quando a perturbação DLS ocorreu, nem estavam ocorrendo antes e depois da desvalorização do resultado), houve uma principal
relacionadas apenas a mudanças na runduração no segmento médio (quando as
deliberações ocorreriam, como abaixo). Assim, a duração total da corrida foi reduzida pela efeito do assunto do dia ( F ( 1,24) 64,444, p 0,001), um dia / grupo
estimulação DLS aplicada no início da corrida (e por estimulação ciclada, que incluía um interação ( F ( 2,24) 35,008, p 0,001), e um principal entre-
ponto de tempo de início da corrida), mas não por estimulação no meio. A inibição de DLS efeito de grupos ( F ( 2,24) 35,008, p 0,001). Post hoc comparações
no início da corrida não fez nada, mas aumentou a duração da corrida quando aplicada no mostrou que isso se deve ao fato de os ratos eNpHR3.0 não conseguirem iniciar as execuções com

meio e particularmente quando ciclada. mais frequência (ChR2 / eNpHR3.0, p 0,001; controle / eNpHR3.0,
p 0,001; ChR2 / controle, p 0,735). A mesma tendência, embora
não significativo, ocorreu durante a reaquisição ( F ( 1,9) 0,117, p
Desvalorização 0,077). Interpretamos isso como evidência de que o início da corrida foi o momento em que os
Em seguida, examinamos como a mudança no vigor da corrida produzida por animais não processaram ou não processaram a mudança no valor do resultado esperado.
manipulações run-start relacionadas ao hábito por definição formal por meio de um Neste caso, animais controle e ChR2 eram habituais, correndo em quase todas as
procedimento de desvalorização de resultados. Este procedimento testa a forma como as oportunidades para fazê-lo na sessão de extinção pós-avaliação. Durante a reaquisição, ambos
mudanças no valor do resultado esperado e o resultado recebido foram usados no os grupos reduziram de forma semelhante sua escolha de correr em 50%, confirmando que eles
comportamento ( Fig. 4 ) Uma corrida habitual maior (ou menos) exibiria independência de poderiam integrar o resultado desvalorizado somente depois que ele fosse experimentado na
(ou sensibilidade a) mudanças no valor do resultado (isto é, insensibilidade ao resultado). tarefa. Em total contraste, os ratos com início de corrida
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2145

Tabela 1. Estatísticas para segmentos de tarefa de resposta

Segmento de labirinto Principais comparações Linha de base Iluminação no início da execução Iluminação no meio Iluminação cíclica

Latência para entrar nos efeitos do sujeito: Controle principal versus ChR2 (SE 0,334, Controle versus ChR2 (SE 0,265, Controle versus ChR2 (SE 0,311, Controle versus ChR2 (SE 0,262,

centro do labirinto dia de efeito, F ( 2.9,1011) p 0,622), controle versus p 0,289), controle versus p 0,992), controle versus p 0,087), controle versus

2.316, p 0,077; inter- eNpHR3.0 (SE 0,335, p < eNpHR3.0 (SE 0,265, p < eNpHR3.0 (SE 0.316, p < eNpHR3.0 (SE 0,267, p
ações: dia / grupo, 0,001), e ChR2 versus 0,001), e ChR2 versus 0,001), e ChR2 versus < 0,001), e ChR2 versus
F ( 5,7,1011) 1.678, p eNpHR3.0 (SE 0,336, p < eNpHR3.0 (SE 0,269, p < eNpHR3.0 (SE 0.320, p < eNpHR3.0 (SE 0,266, p
0,127; dia / teste, 0,001) 0,001) 0,001) < 0,001)
F ( 54.6,1011) 1.019, p

0,439, ou dia / grupo / ensaio,

F ( 109,1011) 1,137, p

0,171; entre assuntos


efeitos: efeito principal

grupo F ( 2.337) 53.425,

p 0,001
Centro do labirinto Efeitos dentro do sujeito: principal Controle versus ChR2 (SE Controle versus ChR2 (SE Controle versus ChR2 (SE Controle versus ChR2 (SE

efeito dia, F ( 2.7,1011) 0,460, p 0,002), controle 0,375, p < 0,001), controle 0,347, p < 0,001), controle 0,408, p 0,002), ao controle

4,996, p 0,003; inter- versus eNpHR3.0 (SE versus eNpHR3.0 (SE versus eNpHR3.0 (SE versus eNpHR3.0 (SE

ações: dia / grupo 0,462, p 0,002), e ChR2 0,373, p 0,017), e ChR2 0,353, p 0,016), e ChR2 0,41601, p 0,701), e

F ( 5.4,1011) 0,748, p versus eNpHR3.0 (SE 0,463, versus eNpHR3.0 (SE 0,380, versus eNpHR3.0 (SE 0,357, ChR2 versus eNpHR3.0 (SE

0,597; dia / teste, F ( 51,1011) p 0,998) p 0,074) p 0,748) 0,415, p < 0,001)
0,862, p 0,743; ou

dia / grupo / ensaio,

F ( 102,1011) 1.011, p

0,456; entre assuntos


efeitos: efeito principal

grupo, F ( 2.337)

14,269, p 0,001

Braço final Efeitos dentro do sujeito: Controle principal versus ChR2 (SE 0,394, Controle versus ChR2 (SE Controle versus ChR2 (SE 0,383, Controle versus ChR2 (SE

efeito dia, F ( 3.996) p 0,667), controle versus 0,327, p 0,006), ao controle p 0,691), controle versus 0,406, p 0,018), ao controle

4,411, p 0,004; inter- eNpHR3.0 (SE 0,397, p versus eNpHR3.0 (SE 0,326, eNpHR3.0 (SE 0,392, p versus eNpHR3.0 (SE 0,413,

ações: dia / grupo, 0,756), e ChR2 versus eN- p 0,926), e ChR2 versus 0,730), e ChR2 versus eN- p 0,055), e ChR2 versus

F ( 6.966) 3,619, p pHR3,0 (SE 0,398, p eNpHR3.0 (SE 0,332, p pHR3,0 (SE 0,397, p eNpHR3.0 (SE 0.412, p <

0,001; dia / teste, F ( 57.966) 0,264) 0,020) 0,999) 0,001)


1.069, p 0,341; ou dia /

grupo / ensaio, F ( 114.966)

1.149, p 0,147; estar-

efeitos entre os sujeitos:

grupo de efeito principal, F ( 2.332)

2.402, p 0,092

ANOVA de medidas repetidas foi conduzida para cada segmento do labirinto por dia, com ensaio e grupo (isto é, vírus) como fatores. Tukey post hoc as correções foram realizadas para os efeitos principais nas colunas subsequentes (ou seja, dia da linha de base, etc.).
As comparações significativas aparecem em negrito.

A inibição de DLS optou por não funcionar na grande maioria dos ensaios no teste de 41.428, p 0,001; eNpHR3.0 / controle, p 0,001; eNpHR3.0 /
extinção pós-avaliação, mostrando que eram direcionados ao objetivo no comportamento. ChR2, p 0,001; controle / ChR2, p 0,237), pós-avaliação
É altamente improvável que as mudanças comportamentais causadas por eNpHR3.0 extinção ( F ( 2,82) 18.935, p 0,001; eNpHR3.0 / controle, p
durante os dias de teste de pós-avaliação foram devido a deficiência motora, porque 0,001; eNpHR3.0 / ChR2, p 0,001; controle / ChR2, p 0,010),
manipulações idênticas (nos mesmos ratos e mesmas condições de teste) não produziram e reaquisição pós-avaliação ( F ( 2,48) 14.366, p 0,001;
este mesmo efeito antes da desvalorização. eNpHR3.0 / controle, p 0,001; eNpHR3.0 / ChR2, p 0,001; vigarista-
trol / ChR2, p 0,122). Figura 4 F ilustra como animais diferentes receberam inibição ou estimulação
Em cada dia de teste (sonda de pré-avaliação e pós-avaliação; reaquisição de DLS no início da execução em comparação com os controles em sua duração de execução
pós-avaliação), a estimulação DLS no início da corrida novamente produziu um padrão de (alteração percentual), mostrando manipulações de início de execução durante o teste normal,
melhora do vigor medido primeiro pela duração da corrida reduzida ( Fig. 4 E). Ao contrário como acima, e durante as fases de teste de desvalorização.
das sessões de pré-avaliação, a inibição DLS no início da execução produziu um aumento
considerável na duração da execução ( Fig. 4 E). O aumento mediado pelo eNpHR3.0 na Os movimentos deliberativos da cabeça foram afetados de forma semelhante à duração da

duração ocorreu antes da desvalorização do resultado durante a sessão de extinção, bem corrida. Para movimentos de cabeça de deliberação ( Fig. 4 G), não houve efeitos principais dentro do

como nas sessões de pós-avaliação. Para correr sujeito durante a extinção de pré-avaliação

versus dias de extinção pós-avaliação ( F ( 1,83) 3.084, p


duração, houve um efeito principal dentro do sujeito do dia ( F ( 1,82) 0,083), nem houve interações: dia / grupo ( F ( 2,83) 0,592,
25.139, p 0,001) e interação dia / grupo ( F ( 2,82) 7,471, p 0,555), dia / teste ( F ( 19,83) 0,541, p 0,935), e dia / grupo /
p 0,001), mas sem interação de dia / teste ( F ( 19,82) 0,826, p tentativas ( F ( 21,83) 0,676, p 0,845). Ainda assim, havia uma diferença entre
0,671) nem dia / grupo / ensaio ( F ( 22,82) 1.001, p 0,473). Lá efeito de grupos ( F ( 2,83) 15.612, p 0,001) em todos os três
foram os principais efeitos entre os grupos ( F ( 2,82) 22.703, p 0,001) dias de iluminação: extinção de pré-avaliação ( F ( 2.203) 32.478,
em todos os três dias de iluminação: extinção de pré-avaliação ( F ( 2.202) p 0,001; controle / ChR2, p 0,050, controle / eNpHR3.0, p
2146 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

Figura 4. Comportamento do labirinto de resposta relacionado à desvalorização do resultado. UMA, Cronograma de teste de desvalorização. A luz foi dada no início da execução em uma sessão de extinção de pré-avaliação (seguida

por uma sessão de retreinamento sem luz) e sessões de extinção e reaquisição pós-avaliação (pellets entregues). Cinza, controles; azul, ChR2; amarelo, eNpHR3.0. B, Consumo de pellet durante cada um dos três pares de pellet / LiCl

para causar desvalorização. Todos os animais rejeitaram os pellets pelo terceiro par. C, Precisão do labirinto em execução nas tentativas em que ocorreram. Sem diferenças de grupo. D, Porcentagem de tentativas em cada sessão

concluída antes de encerrar a tarefa. Os animais realizaram todos os ensaios antes da desvalorização do resultado. Após a desvalorização, os animais correram por hábito nos grupos ChR2 e controle, mas os animais com inibição de

DLS realizaram muito poucas tentativas, mostrando sensibilidade à desvalorização. E, Duração cumulativa média das execuções de teste (segundos). A DLS tornou os animais mais rápidos a cada dia, enquanto a inibição da DLS tornou

os animais mais lentos. F, Alteração percentual na duração cumulativa em relação aos controles. Azul, grupo ChR2 versus controle; amarelo, eNpHR3.0 versus controle. G, Porcentagem de tentativas com deliberação. Novamente, essas

mudanças refletiram na duração da execução. H, Porcentagem de pellets consumidos na tarefa (antes de encerrar a tarefa), que foi reduzida entre os grupos e tentativas desde a pré-avaliação até a pós-avaliação com iluminação no

início da execução. Os grupos não diferiram na redução do consumo de pelotas após a desvalorização. Barras e erros mostram média

SEM; asteriscos denotam significantes post hoc comparações (* p 0,05, ** p 0,01, *** p 0,001); falta de asteriscos denota falta de significado. ns, não significativamente

diferente.

0,001; ChR2 / eNpHR3.0, p 0,001), extinção pós-avaliação: 0,119). Os grupos não diferiram em sua rejeição ao pellet, confirmando que a memória de
( F ( 2,83) 10,765, p 0,001; controle / eNpHR3.0, p 0,006; desvalorização foi generalizada de forma equivalente à tarefa e indicando que a tendência dos
ChR2 / eNpHR3.0, p 0,001), e reaquisição pós-avaliação ratos com inibição de DLS para desistir da tarefa não estava relacionada a eles terem uma
( F ( 2,50) 11,928, p 0,001; controle / eNpHR3.0, p 0,003; aversão mais forte ao pellet. Mais uma vez, as mudanças na duração da corrida não se
ChR2 / eNpHR3.0, p 0,001). limitaram ao comportamento no segmento inicial do labirinto quando a iluminação foi dada ( mesa
Quando os animais executaram a tarefa durante a reaquisição após a desvalorização do 2)
resultado, eles rejeitaram quase todas as pelotas, como visto em uma comparação deste dia
com o dia de iluminação de início de execução de pré-avaliação normal ( Fig. 4 H). A análise Em suma, a estimulação DLS no início da corrida aumentou o vigor da corrida de forma
dentro do assunto mostrou semelhante antes e depois da desvalorização do sedimento. Ao mesmo tempo, a frequência de
um efeito do dia ( F ( 1.356) 2776,301, p 0,001) e interações negligência para executar a tarefa, a precisão da execução quando ela foi executada e o nível de
[dia / teste ( F ( 14.356) 7,981, p 0,001), dia / grupo ( F ( 2.356) rejeição de chumbo no grupo ChR2 foram todos semelhantes aos controles após a
7,981, p 0,001), dia / grupo / ensaio ( F ( 25.356) 4,434, p 0,001)] desvalorização. Pode ter havido um teto para aumentar o quão habituais (insensíveis ao
mas nenhum efeito principal entre os sujeitos do grupo na pré-avaliação resultado) as corridas eram, embora ainda houvesse "espaço" para a melhoria do vigor de
dia de ação ( F ( 2.262) 0) ou reaquisição ( F ( 2,94) 2.177, p
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2147

Tabela 2. Estatísticas para tarefa de resposta com desvalorização

Segmento de labirinto Principais comparações Extinção de pré-avaliação Extinção pós-avaliação Reaquisição de pré-avaliação

Latência para entrar Efeitos dentro do sujeito: efeito principal dia, Controle versus ChR2 (SE 0,436, p Controle versus ChR2 (SE 0,401, p Efeitos entre assuntos: grupo de efeito principal,

centro do labirinto F ( 1,82) 4.438, p < 0,038; inter- 0,286), controle versus 0,196), controle versus eN- F ( 2,49) 1,167, p 0,320; efeito principal

ações: dia / grupo, F ( 2,82) 1.056, eNpHR3.0 (SE 0,367, p pHR3,0 (SE 0,750, p 0,109), tentativas, F ( 13,52) 1.847, p 0,060; grupo/

p 0,353; dia / teste, F ( 19,82) 0,004), e ChR2 versus e ChR2 versus eNpHR3.0 (SE interação experimental, F ( 21,52) 0,850, p

0,302, p 0,998; orday / group / trial, eNpHR3.0 (SE 0,402, p < 0,773, p 0,014) 0,649

F ( 22,82) 0,554, p 0,941; entre- 0,001)


efeitos do sujeito: efeito principal grupo

F ( 2,82) 4.446, p 0,015

Centro do labirinto Efeitos dentro do sujeito: efeito principal dia Controle versus ChR2 (SE 0 0,453, Controle versus ChR2 (SE 0 0,359, Efeitos entre assuntos: efeito principal

F ( 1,82) 35.097, p < 0,001; inter- p 0,793), controle versus p 0,129), controle versus grupo, F ( 2,49) 37.673, p < 0,001;
ações: dia / grupo, F ( 2,82) eNpHR3.0 (SE 0.381, p < eNpHR3.0 (SE 0,670, p < efeito principal tentativas, F ( 12,49) 3.794, p <

11.352, p < 0,001; dia / teste, 0,001), e ChR2 versus 0,001), e ChR2 versus 0,001; interação grupo / ensaio, F ( 14,49)

F ( 19,82) 0,764, p 0,741; ou dia / eNpHR3.0 (SE 0,418, p < eNpHR3.0 (SE 0,690, p < 4.483, p < 0,001
grupo / ensaio, F ( 22,82) 0,873, p 0,001) 0,001) Controle versus ChR2 (SE 0,238, p

0,628; efeitos entre sujeitos: 0,488), controle versus eNpHR3.0 (SE

efeito principal grupo, F ( 2,82) 0,391, p < 0,001), e ChR2 ver-


25.837, p < 0,001 sus eNpHR3.0 (SE 0,391, p <
0,001)
Braço final Efeitos dentro do sujeito: dia do efeito principal, Controle versus ChR2 (SE 0.700, p Controle versus ChR2 (SE 0,646, p Efeitos entre assuntos: efeito principal

F ( 1,83) 3,799, p 0,055; interac- 0,630), controle versus 0,068), controle versus grupo, F ( 2,47) 7,389, p 0,002;

ções: dia / grupo, F ( 2,83) 1.226, eNpHR3.0 (SE 0,590, p < eNpHR3.0 (SE 1.208, p ensaio de efeito principal, F ( 12,47) 0,654, p

p 0,299; dia / teste, F ( 19,83) 0,001), e ChR2 versus 0,044), e ChR2 versus 0,785; interação grupo / ensaio, F ( 14,47)

0,518, p 0,947; orday / group / trial, eNpHR3.0 (SE 0,646, p < eNpHR3.0 (SE 1.244, p 1.054, p 0,421

F ( 21,83) 0,934, p 0,551; entre- 0,001) 0,002) Controle versus ChR2 (SE 0,594, p

efeitos do sujeito: efeito principal grupo, 0,154), controle versus eNpHR3.0 (SE

F ( 2,83) 9,130, p < 0,001 0,964, p < 0,001), e ChR2 ver-


sus eNpHR3.0 (SE 0,959 p

0,002)

ANOVA de medidas repetidas foi conduzida para cada segmento do labirinto por dia, com teste e grupo (ou seja, vírus) como fatores na comparação de dias de extinção de pré-avaliação versus pós-avaliação. Tukey post hoc foram feitas correções para os efeitos
principais nas colunas subsequentes (isto é, extinção de pré-avaliação e pós-avaliação). O dia de reaquisição de pré-avaliação foi analisado separadamente na última coluna. As comparações significativas estão em negrito.

essas execuções [isto é, a menor duração cumulativa possível em qualquer rato para (1) animais para atravessar o braço inicial do labirinto para o centro para localizar a dica
extinção pós-avaliação (ChR2, 2,3 s; controle, 4,2 s) e (2) reaquisição (ChR2, 2,3 s; controle, visual, e um segundo que exigia que eles atravessassem o braço que continha essa dica
4,0 s)]. Em contraste, a inibição de DLS no início da corrida produziu um aumento profundo para receber pelotas de alimento. Nós nos concentramos em comparar a estimulação
na sensibilidade do resultado e redução do vigor quando os animais correram. O vigor DLS mediada por ChR2 com os controles. O mesmo treinamento e protocolo de
reduzido ocorreu principalmente quando os pellets foram omitidos (sonda de extinção) ou manipulação optogenética usado para a tarefa de resposta acima foi usado para a tarefa
desvalorizados, sugerindo uma grande diferença nos efeitos da inibição de DLS no de farol ( Fig. 5 UMA). A histologia confirmou o vetor viral preciso e as colocações de fibra
comportamento quando os valores de resultado são estáveis versus reduzidos. no DLS ( Fig. 5 B). O treinamento nesta tarefa levou a uma melhoria na precisão da
Plausivelmente, a corrida contínua durante as sessões, quando elas são reduzidas, é corrida ao longo das sessões que levaram ao último dia de desempenho de critério, e os
principalmente dependente de DLS, razão pela qual a inibição produziu efeitos tão robustos. grupos não diferiram neste aprendizado de tarefa inicial ( Fig. 5 C). Não havia principal
Especificamente, em cada dia de teste, incluindo a sonda de pré-avaliação, as execuções de
animais eNpHR3.0 com inibição de início de corrida (quando correram) foram muito mais
lentas, e as deliberações ocorreram em quase todos os julgamentos. Além disso, esses
efeito do grupo ( F ( 1.258) 1.018, p 0,314) ou dia / grupo
animais eNpHR3.0 abandonaram a tarefa principalmente após a desvalorização do resultado
interação ( F ( 28.158) 0,914, p 0,574), mas havia um principal
quando a iluminação DLS foi dada no início da corrida, mostrando uma redução acentuada
efeito do dia ( F ( 21.253) 5.514, p 0,001).
em quão habituais eram suas corridas, e essa redução estava em estreita sintonia com a
O aumento do vigor de corrida foi replicado nesta condição de tarefa de farol com
redução no vigor da execução.
estimulação de DLS no início da corrida. Notavelmente, em contraste com a tarefa de
resposta, a estimulação DLS no meio de repente também foi eficaz em melhorar o vigor
geral da corrida nesta tarefa. O aumento da atividade de DLS neste ponto da corrida, que foi
quando a sugestão foi localizada e abordada, também aumentou o vigor em níveis
comparáveis com o aumento causado pela estimulação de início de corrida. A estimulação
Tarefa Beacon
em ciclo também foi essencialmente idêntica.
Treinamento e teste
Os resultados do experimento do labirinto de resposta levantaram a questão
Verifique se a melhora no vigor de corrida observada com a estimulação DLS Primeiro, os estímulos DLS reduziram a duração da corrida ( Fig. 6 UMA).

corrida-start ocorreu porque esse foi o ponto no tempo em que uma rotina de corrida Não houve efeito principal dentro do sujeito do dia ( F ( 1.7.954) 1.190,
completa foi selecionada e posta em movimento. Para explorar essa possibilidade, p 0,299), nem houve interações de dia / ensaio ( F ( 31,7,954)
usamos uma coorte separada de ratos e a tarefa de labirinto em cruz de farol 1.102, p 0,323) ou dia / grupo / ensaio ( F ( 31,7,954) 0,565, p

descrita em Materiais e Métodos. Nesta tarefa, os ratos aprenderam a navegar em 0,974), mas houve uma interação dia / grupo ( F ( 1.7.954) 7,727,
direção a uma dica visual para um pellet de comida ( Fig. 5 UMA). A lógica era dividir p 0,001). A comparação entre os grupos não mostrou diferença
o labirinto em dois segmentos, um que exigia no dia da linha de base que faltou iluminação ( F ( 1.320) 0,739, p
0,390), mas diferenças significativas no início da execução ( F ( 1.320) 13.729,
2148 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

Figura 5. Tarefa de Beacon. UMA, Configuração de labirinto e esquemas para blocos de teste, treinamento e teste de manipulação DLS como em figura 1 UMA. B, Mapas histológicos mostrando controle e expressão de ChR2, como em

figura 1 C. C, Execute a precisão em 12 sessões até o último dia de desempenho do critério, separados pelos grupos ChR2 (azul) e controle (cinza) (sem diferenças de grupo). Linhas e erros mostram SEM médio.

Figura 6. Mudanças no comportamento do beaconmaze-running withDLSmanipulation. UMA, Duração cumulativa média das execuções de amaze (segundos) A estimulação DLS reduziu a duração da corrida, seja administrada no início

da corrida, no meio ou no ciclo. Azul, ChR2; cinza, controles. B, Porcentagem de tentativas com deliberação, que a estimulação DLS também reduziu. C, Porcentagem de testes executados corretamente, o que não diferiu entre os

grupos. Asteriscos denotam significantes post hoc comparações (** p 0,001).

p 0,001), meio ( F ( 1.319) 30,453, p 0,001), e ciclado diminuir a duração da corrida, a variação da duração entre as tentativas e as deliberações no ponto
dias de iluminação ( F ( 1.319) 23.895, p 0,001). de escolha, mas não afetou o uso das regras de tarefas pelos animais para ditar as escolhas de
Em segundo lugar, os estímulos DLS também reduziram as deliberações no corrida.
ponto de escolha central do labirinto ( Fig. 6 B). Não houve efeito principal dentro do Em contraste com a tarefa de resposta, observamos que o efeito do vigor

sujeito do dia ( F ( 3.954) 0,229, p 0,876) nem aprimorado que ocorreu ao longo das sessões de iluminação se relacionou às
interações de dia / julgamento ( F ( 57.954) 1.282, p 0,082) ou dia / mudanças em execução em partes específicas da tarefa, especificamente a latência
grupo / ensaio ( F ( 57.954) 0,823, p 0,822), mas houve um dia / dos animais para entrar no centro do labirinto desde o início do teste. Para esta
interação de grupo ( F ( 3.954) 2.622, p 0,050). Semelhante a correr medida, houve um principal
duração, não houve diferença entre os grupos na linha de base efeito de interação do dia / grupo ( F ( 2,4954) 5,117, p 0,004)
dia ( F ( 1.320) 1.111, p 0,293), mas havia um grupo significativo e um efeito entre sujeitos do grupo ( F ( 1.318) 21.728, p
diferenças durante a iluminação no início da execução ( F ( 1.320) 11.381, 0,001; Tabela 3 )
p 0,001), meio ( F ( 1.319) 18.376, p 0,001), e ciclado
( F ( 1.319) 17.367, p 0,001) dias. Assim, cada tipo de estímulo DLS- Desvalorização
ulação reduziu as deliberações. Nosso protocolo de desvalorização de resultado então seguido ( Fig. 7 UMA), no

Tal como acontece com a tarefa de resposta, nenhuma manipulação DLS afetou a precisão de que LiCl foi emparelhado com os grânulos de comida para estabelecer uma aversão ( Fig. 7 B).
execução nesta tarefa de farol ( Fig. 6 C). Não havia principal Após a desvalorização do resultado, todos os animais executaram esta tarefa habitualmente,
efeito dentro do assunto por dia ( F ( 3.954) 1.531, p 0,205), nem executando com a mesma precisão de antes e optando por executar quase todas as
interações: dia / grupo ( F ( 3.954) 0,703, p 0,550), dia / teste tentativas ( Fig. 7 CD). As análises incluíram a comparação dos dias de extinção
( F ( 57.954) 0,791, p 0,868), dia / grupo / ensaio ( F ( 57.954) 1,107, (pré-avaliação e pós-avaliação) e uma comparação de grupos dentro do dia de reaquisição.
p 0,277). Assim, a estimulação DLS no início da execução e no meio da corrida poderia
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2149

Tabela 3. Estatísticas para segmentos de taskmaze de beacon

Segmento de labirinto Principais comparações Linha de base Iluminação no início da execução Iluminação no meio Iluminação cíclica

Latência para entrar Efeitos dentro do sujeito: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal

centro do labirinto dia de efeito, F ( 2,4954) grupo de efeito, F ( 1.320) efeito grupo, F ( 1.320) efeito grupo, F ( 1.319) efeito grupo, F ( 1.319)

0,246, p 0,819; inter- 0,550, p 0,459; a Principal 14.668, p < 0,001; a Principal 24.632, p < 0,001; a Principal 22.864, p < 0,001; a Principal

ações: dia / grupo, teste de efeito, F ( 19.320) 1.329, teste de efeito, F ( 19.320) 0,737, teste de efeito, F ( 19.319) 0,620, teste de efeito, F ( 19.319)

F ( 2,4954) 5,117, p p 0,162; grupo / ensaio inter- p 0,779; grupo / ensaio inter- p 0,891; grupo / ensaio inter- 0,524, p 0,951; grupo/

0,004; dia / teste, açao, F ( 19.320) 0,415, p açao, F ( 19.320) 0,683, p açao, F ( 19.319) 0,319, p interação experimental, F ( 19.319)

F ( 45,2954) 1.207, p 0,987 0,836 0,997 0,498, p 0,963

0,169; ou dia / grupo / ensaio,

F ( 45,2954) 0,859, p

0,733; entre assuntos


efeitos: efeito principal

grupo, F ( 1.318)

21.728, p < 0,001


Centro do labirinto Efeitos dentro do sujeito: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal

dia de efeito, F ( 1,4,954) grupo de efeito, F ( 1.320) grupo de efeito, F ( 1.320) grupo de efeito, F ( 1.319) grupo de efeito, F ( 1.320)

2.631, p 0,090; inter- 2.974, p 0,086; a Principal 1.314, p 0,253; a Principal 3.719, p 0,055; a Principal 1.744, p 0,188; a Principal

ações: dia / grupo, teste de efeito, F ( 19.320) 0,620, teste de efeito, F ( 19.320) 1,117, teste de efeito, F ( 19.319) 1,119, teste de efeito, F ( 19.320)

F ( 1,4,954) 3,610, p p 0,891; grupo / ensaio inter- p 0,332; grupo / ensaio inter- p 0,330; grupo / ensaio inter- 0,809, p 0,696; grupo/

0,042; dia / teste, açao, F ( 19.320) 0,780, p açao, F ( 19.320) 0,739, p açao, F ( 19.319) 0,999, p interação experimental, F ( 19.320)

F ( 27,5,954) 0,668, p 0,731 0,778 0,462 1.025, p 0,431

0,901; ou dia / grupo / ensaio,

F ( 27,5,954) 0,899, p

0,615; entre assuntos


efeitos: efeito principal

grupo, F ( 2.337)

14,269, p < 0,001


Braço final Efeitos dentro dos sujeitos: Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal Efeitos entre assuntos: principal

dia do efeito principal, F ( 1.1.954) grupo de efeito, F ( 1.320) grupo de efeito, F ( 1.320) efeito grupo, F ( 1.319) grupo de efeito, F ( 1.319)

1.194, p 0,279; 1.474, p 0,226; a Principal 3.815, p 0,052; a Principal 6.223, p 0,013; a Principal 0,249, p 0,618; a Principal

interações: dia / grupo, teste de efeito, F ( 19.320) 0,768, teste de efeito, F ( 19.320) 1.163, teste de efeito F ( 19.319) 1.242, teste de efeito, F ( 19.319)

F ( 1.1.954) 1.970, p p 0,745; grupo / ensaio inter- p 0,288; grupo / ensaio inter- p 0,221; grupo / ensaio inter- 1.232, p 0,229; grupo/

0,160; dia / teste, F ( 20,5,954) açao, F ( 19.320) 0,765, p açao, F ( 19.320) 0,477, p açao, F ( 19.319) 0,855, p interação experimental, F ( 19.319)

0,705, p 0,843; ou 0,749 0,970 0,640 0,394, p 0,990

dia / grupo / ensaio, F ( 20,5,954)

0,737, p 0,790;

efeitos entre sujeitos:


grupo de efeito principal, F ( 1.318)

0,326, p 0,569

ANOVA de medidas repetidas conduzida para cada segmento do labirinto por dia, com teste e grupo (isto é, vírus) como fatores. Tukey post hoc as correções foram feitas nos efeitos da formaína nas colunas subsequentes (ou seja, dia da linha de base, etc.). As
comparações significativas estão em negrito.

Para a precisão do desempenho, entre os dias de extinção de pré-avaliação e 0,514, p 0,474) ou interações do dia / ensaio ( F ( 19.214) 1.571,
pós-avaliação, não houve efeito principal dentro do sujeito p 0,065) e dia / grupo / ensaio ( F ( 19.214) 0,990, p 0,475).
efeito do dia ( F ( 1.214) 2.135, p 0,145), interação dia / grupo Houve uma interação dia / grupo ( F ( 1.214) 5,644, p
( F ( 1.214) 0,169, p 0,682), ou efeito entre grupos ( F ( 1.214) 0,018), e houve um efeito principal entre os grupos para o
0,464, p 0,497). No dia da reaquisição, também não houve extinção de pré-avaliação ( F ( 1.297) 15,331, p 0,001) e
efeito do grupo ( F ( 1.270) 0,035, p 0,852). Curiosamente, os ratos também extinção pós-avaliação ( F ( 1.215) 7,671, p 0,006) dias.
continuou a funcionar com precisão no teste de reaquisição que se seguiu. Para o Nos testes de teste de extinção de pré-avaliação e pós-avaliação, encontramos
abandono da corrida, entre os dias de extinção de pré-avaliação e pós-avaliação, não
estimulação de início de execução do DLS com duração de execução reduzida em
houve efeito principal dentro do sujeito
comparação com os controles ( Fig. 7 E, F). Além disso, analisamos o único dia de
dia ( F ( 1,30) 0,108, p 0,746), interação dia / grupo ( F ( 1,30)
reaquisição pós-avaliação sozinho
0,034, p 0,854), ou efeito entre grupos ( F ( 1,30) 0,460,
e encontrou uma diferença semelhante entre os grupos ( F ( 1.270)
p 0,504); ou efeito entre grupos para reaquisição ( F ( 1,16)
4.455, p 0,036).
0,450, p 0,513). Este nível de persistência na execução poderia
Uma análise idêntica foi realizada para deliberações produzindo uma tendência
refletem uma atração de incentivo para a sugestão do labirinto em si, em vez do resultado
emparelhado ( Morrison et al., 2015 ; Smedley e Smith, 2018 ) semelhante ( Fig. 7 G), em que não havia principal dentro
efeito do assunto do dia ( F ( 1.214) 0,314, p 0,576) ou interações de

No entanto, ainda havia efeitos de melhoria no vigor das corridas geradas pela dia / grupo ( F ( 1.214) 0,183, p 0,669), dia / teste ( F ( 19.214)
estimulação DLS em nosso procedimento de desvalorização ( Fig. 7 E, F). Analisamos 0,672, p 0,844), ou dia / grupo / teste ( F ( 19.214) 0,931, p

a duração da execução para nossos dias de teste de extinção de pré-avaliação e 0,545). No entanto, houve um forte efeito principal entre os grupos para a extinção
pós-avaliação e de pré-avaliação ( F ( 1.297) 11.142, p 0,001)
não descobriram efeitos principais dentro do sujeito durante o dia ( F ( 1.214) e extinção pós-avaliação ( F ( 1.215) 16.901, p 0,001)
2150 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

Figura 7. Tarefa Beacon relacionada à desvalorização do resultado. UMA, Cronograma de teste de desvalorização, como em Figura 4 . B, Consumo de pelotas durante cada dia de emparelhamento de pelotas / LiCl para desvalorizar os

grupos de ratos. O consumo caiu a zero em ambos os grupos. C, A acurácia do desempenho quando os ratos correram, que foi alta e estável, sugerindo desempenho habitual de ambos os grupos. Azul, ChR2; cinza, controles. D,

Porcentagem de tentativas concluídas antes de parar. Ambos os grupos realizaram quase todas as oportunidades de teste. E, Duração cumulativa média das execuções de teste (segundos). A estimulação DLS reduziu a cada dia. F,

Alteração percentual na duração cumulativa em animais com estimulação mediada por ChR2 em relação aos controles (azul). G, Porcentagem de tentativas com deliberação, que a estimulação DLS reduziu. H,

Porcentagem de pellets consumidos na tarefa (antes de encerrar uma execução), que foi reduzida de forma equivalente entre os grupos da pré-avaliação à pós-avaliação. Asteriscos denotam significantes post hoc

comparações (* p 0,05, ** p 0,01, ** p 0,001). ns, não significativamente diferente.

Tabela 4. Estatísticas para tarefa de beacon com desvalorização

Segmento de labirinto Principais comparações Extinção de pré-avaliação Extinção pós-avaliação Reaquisição de pré-avaliação

Latência para entrar Efeitos dentro do sujeito: dia do efeito principal, Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal

centro do labirinto F ( 1.214) 3.466, p 0,064; grupo, F ( 1.297) 24,951, p < grupo, F ( 1.215) 12.873, p < grupo, F ( 1.270) 11,417, p <
interações: dia / grupo, 0,001; ensaio de efeito principal, F ( 19.297) 0,001; ensaio de efeito principal, F ( 19.215) 0,001; ensaio de efeito principal, F ( 19.270)

F ( 1.214) 9.102, p 0,003; 0,393, p 0,990; grupo / ensaio 0,601, p 0,903; grupo / ensaio 0,448, p 0,979; grupo / ensaio

dia / teste, F ( 19.214) 1.315, p interação, F ( 19.297) 0,296, p interação, F ( 19.215) 0,714, p interação, F ( 19.270) 0,299, p

0,176; ou dia / grupo / ensaio, 0,999 0,802 0,998

F 1.239, p 0,228;
14 e) efeitos en-sujeitos: principal

estar 19 t, 2 W
efeito grupo, F ( 1.214)
27,996, p < 0,001
Centro do labirinto Efeitos dentro do sujeito: efeito principal dia, Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal

F ( 1.214) 8.022, p 0,005; grupo, F ( 1.297) 0,156, p grupo, F ( 1.215) 0,053, p grupo, F ( 1.270) 0,392, p

interações: dia / grupo, F ( 1.214) 0,693; ensaio de efeito principal, F ( 19.297) 0,819; ensaio de efeito principal, F ( 19.215) 0,532; ensaio de efeito principal, F ( 19.270)

0,010, p 0,921; dia / teste, F ( 19.214) 0,761, p 0,752; grupo / ensaio 1,165, p 0,290; grupo / ensaio 0,969, p 0,498; grupo / ensaio

1.088, p 0,365; ou dia / grupo / interação, F ( 19.297) 0,632, p interação, F ( 19.215) 0,557, p interação, F ( 19.270) 0,744, p

tentativas, F ( 19.214) 0,686, p 0,831; 0,881 0,933 0,772

efeitos entre sujeitos: principal

grupo de efeito, F ( 1.214) 0,072, p

0,789

Braço final Efeitos dentro dos indivíduos: efeito principal Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal Efeitos entre assuntos: efeito principal

dia, F ( 1.214) 0,789, p 0,375; grupo, F ( 1.297) 0,288, p grupo, F ( 1.215) 0,716, p grupo, F ( 1.269) 0,515, p

interações: dia / grupo, F ( 1.214) 0,592; ensaio de efeito principal, F ( 19.297) 0,398; ensaio de efeito principal, F ( 19.215) 0,473; ensaio de efeito principal, F ( 19.269)

0,174, p 0,677; dia / teste, F ( 19.214) 0,911, p 0,569; grupo / ensaio 1.011, p 0,450; grupo / ensaio 0,928, p 0,549; grupo / ensaio

1.440, p 0,110; ou dia / grupo / interação, F ( 19.297) 1,005, p interação, F ( 19.215) 0,740, p interação, F ( 19.269) 0,629, p

tentativas, F ( 19.214) 1.578, p 0,064; 0,454 0,775 0,883

efeitos entre sujeitos: efeito principal

grupo, F ( 1.214) 0,936, p 0,334

ANOVA de medidas repetidas foi conduzido para cada segmento de mazé por dia, com ensaio e grupo (ou seja, vírus) como fatores que comparam a avaliação pré-avaliação com os dias de extinção pós-avaliação. Tukey post hoc as correções foram feitas nos efeitos da
avaliação nas colunas subsequentes (isto é, extinção de pré-avaliação e pós-avaliação). O dia de reaquisição de pré-avaliação foi analisado separadamente na última coluna. As comparações significativas estão em negrito.

dias de iluminação. Não houve efeito entre os grupos durante O consumo / rejeição dos próprios pellets desvalorizados não foi afetado
reaquisição pós-avaliação ( F ( 1.270) 0,785, p 0,376). Estes pelos estímulos DLS ao comparar o consumo durante a reaquisição
mudanças de comportamento não se limitaram a segmentos específicos de labirinto ( Tabela pós-avaliação com o dia de teste de pré-avaliação normal anterior ( Fig. 7 H). Houve
4) efeitos do dia
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2151

( F ( 1.627) 1726,655, p 0,001) e interações do dia / teste comportamento oroso ( Niv et al., 2007 ; Floresco, 2015 ; Bailey et al., 2016 ; Salamone
( F ( 19.627) 2.875, p 0,001) e dia / grupo / ensaio ( F ( 19.627) et al., 2016 ; Berke, 2018 )
1.829, p 0,017); no entanto, não houve interação dia / grupo Independentemente disso, as mudanças no vigor da corrida que resultaram das
( F ( 1.356) 2.667, p 0,103) e nenhum efeito principal do grupo no perturbações DLS mostraram uma correspondência intrigante com o quão insensível ao
dia de pré-avaliação (F ( 1.337) 0) ou dia de reaquisição (F ( 1.290) resultado (isto é, habitual) essas corridas eram. Os resultados da tarefa de resposta e da
1.944, p 0,164). tarefa de farol mostraram que, para nossa surpresa, os animais eram normalmente bastante
habituais, apesar de não terem recebido uma grande quantidade de treinamento. Assim, a
Discussão estimulação DLS adicional atingiu um “teto” para aumentar os hábitos acima do normal.
Se um comportamento aprendido ocorre como um hábito ou como uma ação direcionada Ainda assim, a estimulação DLS pode produzir melhorias no vigor da corrida em ambas as
a um objetivo intencional, acredita-se que seja ditado pelo nível de participação entre tarefas acima e além da independência do resultado do comportamento, destacando a
sistemas neurais de gânglios corticobasais concorrentes que funcionam para promover importância potencial de olhar para ambas as medidas ao estudar a base cerebral dos
uma ou outra estratégia ( Killcross e Coutureau, 2003 ; Yin e Knowlton, 2006 ; Balleine et al., hábitos.
2009 ;
Packard, 2009 ) O sistema de hábitos, envolvendo o DLS, está vinculado em uma linha de O amortecimento da atividade de DLS na tarefa de resposta no mesmo ponto de tempo de
pesquisa à promoção de comportamentos que são realizados reflexivamente e início de execução não reduziu de forma robusta o vigor da corrida até que os pellets de comida
independentemente do valor de seu resultado, e em outra linha de pesquisa à promoção de fossem removidos durante o teste de sonda de extinção de pré-avaliação ou após a
comportamentos vigorosos e fluidos. Nossos resultados ajudam a mostrar que há uma ligação desvalorização do resultado (embora a inibição de DLS ciclada fosse mais eficaz durante as
clara entre o vigor de um comportamento e como ele é sensível ao resultado, e que a atividade sessões reforçadas antes da desvalorização ) Este resultado sugere que o vigor da corrida era
DLS fásica controla ambos de uma maneira poderosa ( Graybiel, 2008 ; Smith e Graybiel, 2013b , bastante imune à interrupção do DLS no início do comportamento, mas era altamente sensível a
2014 ) Mostramos especificamente que a sinalização DLS fásica no momento em que os ser reduzido quando havia uma “razão” para reduzir o comportamento com base na redução dos
comportamentos são selecionados ou iniciados promove o vigor comportamental (ou seja, valores de resultado. Em outras palavras, os períodos de tarefa em que o comportamento de
menor tempo de duração do desempenho e movimentos de cabeça deliberativos reduzidos). corrida contínuo era provavelmente mais controlado pelo DLS (isto é, habitual apesar da falta de
Isso é verdadeiro para o comportamento de corrida de labirinto baseado em resposta, no qual a pellets disponíveis ou pellets desvalorizados) foram aqueles em que a inibição do DLS produziu o
resposta pode ser totalmente selecionada desde o início, bem como para uma tarefa de corrida efeito mais claro sobre o comportamento. Isso pode sugerir que os circuitos paralelos para o
de labirinto baseada em sugestões em que uma resposta deve ser selecionada em dois pontos comportamento direcionado ao objetivo poderiam compensar a inibição de DLS naqueles
durante a corrida de labirinto. Também mostramos que a mesma sinalização fásica é crítica momentos (ou seja, quando os pellets de comida ainda eram valiosos e presentes), mas não
para controlar quão habituais (isto é, insensíveis ao resultado) são os comportamentos nessas poderiam quando os pellets estavam desvalorizados ou ausentes e os hábitos eram necessários
tarefas. Estes resultados mostram que a atividade DLS fásica previamente conhecida durante o para manter o desempenho. Este conjunto de resultados de inibição de DLS é claramente uma
início de um comportamento, visto em muitas espécies e tarefas ( Smith e Graybiel, 2016 ), pode reminiscência da perda de hábito (ou seja, ganho de sensibilidade de resultado) mostrado em
controlar diretamente o quão vigoroso e habitual esses comportamentos se tornam. O fato de estudos anteriores de perda de função de DLS ( Yin et al., 2004 ,
que os hábitos podem ser prontamente controlados pelo cérebro durante uma janela de tempo
tão curta e precisa pode ser usado como uma vantagem para definir estratégias de intervenção
para humanos com comportamentos compulsivos resistentes ao tratamento. Além disso, ao
mostrar como medidas tipicamente diferentes para hábitos - vigor de corrida de labirinto e 2006 ) e potencialmente aponta esses resultados para sinalização DLS comprometida
insensibilidade a resultados - se relacionam umas com as outras no cérebro, esses resultados especificamente no início do comportamento.
podem ajudar a informar futuros esforços científicos para estudar hábitos em um nível mais Notamos também que a precisão da corrida não foi afetada por nenhuma
holístico do que o normal. Poucos estudos compararam a relação de comportamento de perturbação DLS. Esta falta de mudança na precisão é curiosa, dado que as versões de
resultados com medidas de corrida de labirinto, mas os resultados aqui apóiam uma visão geral ambas as tarefas do labirinto mostraram ser dependentes de DLS ( Packard et al., 1989 ;
de que a corrida de labirinto [seja puramente egocêntrica (tarefa de resposta) ou orientada por McDonald e White, 1993 ;
dicas (tarefa de farol)] pode ser bastante habitual na desvalorização- senso de insensibilidade ( Sage Sage e Knowlton, 2000 ; Chang e Gold, 2004 ; Palencia e Ragozzino, 2005 ; Berke et al.,
e Knowlton, 2000 ; De Leonibus et al., 2011 ; Smith e Graybiel, 2016 ; Kosaki et al., 2018 ) 2009 ; Kosaki et al., 2015 ) É possível que essa sinalização de DLS fásico não esteja
relacionada ao uso de regras de tarefas para executar com precisão ou outros sistemas
neurais foram capazes de compensar as perturbações da atividade de DLS para
realizar corridas precisas.

Apesar da correspondência razoavelmente próxima à atividade DLS na iniciação do


comportamento, níveis de vigor de corrida e níveis de insensibilidade ao resultado (isto é,
hábito), levantamos uma possibilidade de que eles podem nem sempre estar alinhados e,
No que diz respeito às formas de vigor comportamental, há dissociações entre o vigor portanto, são importantes para comparar daqui em diante. Um estudo anterior ( Smith e Graybiel,
de resposta, que está relacionado à latência de início do movimento, e o vigor de 2013a ) descobriram que o vigor da corrida no labirinto aumenta durante a formação do hábito,
desempenho, que está relacionado, em vez disso, a movimentos contínuos ( Wang et al., assim como a insensibilidade ao resultado se desenvolve e a atividade do SLD torna-se alinhada
2013 ) O vigor do desempenho foi vinculado à função DLS ( Novak et al., 2002 ; Dudman e ao início da corrida no labirinto. No entanto, a magnitude da atividade DLS pode ser comparada
Krakauer, 2016 ) Consistente com isso, nossos resultados mostram que a duração da no nível de corrida única com diferentes aspectos do comportamento de corrida. Verificou-se
execução e as deliberações foram afetadas pelas manipulações de início de execução do que a correlação mais próxima da atividade DLS era com o vigor da corrida, enquanto as
DLS na tarefa de resposta, e esses efeitos não foram vinculados especificamente à latência medidas de insensibilidade ao resultado (ou seja, se os animais se aproximavam ou evitavam
de início da execução, sugerindo um papel fundamental em ditar o vigor do desempenho em um objetivo desvalorizado) não estavam intimamente relacionadas com a atividade DLS em
vez da resposta vigor. No entanto, nossos resultados de labirinto de farol ligaram a latência nível de ensaio. Embora não tenhamos variado as manipulações de DLS para aplicá-las em
de início de execução a alguns efeitos de estimulação DLS no tempo de execução geral, alguns ensaios, mas não em outros para comparar verdadeiramente o vigor e as medidas de
sugerindo algum papel potencial para o DLS no vigor de resposta também. Valerá a pena hábito, isso poderia revelar se o vigor / insensibilidade ao resultado estão sempre relacionados
conduzir um estudo comparativo sobre o sistema mesolímbico, que também foi pensado (sempre co-ocorrendo, refletindo um único processo de hábito subjacente) ou pode
para controlar o esforço e a vigilância.
2152 • J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 Crego et al. • Hábitos e vigor comportamental

ser dissociado (nem sempre co-ocorrendo, refletindo processos dissociáveis). Da mesma forma, Fujimoto H, Hasegawa T, Watanabe D (2011) Neural coding of syntactic

dado que essas tarefas deixaram pouco espaço para aumentos na insensibilidade ao resultado, estrutura em vocalizações aprendidas no pássaro canoro. J Neurosci 31: 10023–10033.

como animais de controle correram habitualmente para pelotas de comida desvalorizadas, mais
Gradinaru V, Mogri M, Thompson KR, Henderson JM, Deisseroth K (2009)
trabalho será necessário para determinar se as ações direcionadas ao objetivo podem ser
Desconstrução ótica do circuito neural parkinsoniano. Science 324: 354–359.
transformadas em hábitos pela atividade DLS fásica, e se isso corresponde a um aumento
conjunto no vigor da corrida e na insensibilidade do resultado. Graybiel AM (2008) Hábitos, rituais e o cérebro avaliativo. Annu Rev
Neurosci 31: 359–387.
Finalmente, dado o direcionamento inespecífico dos neurônios DLS, será importante Haith AM, Reppert TR, Shadmehr R (2012) Evidence for hyperbolic tem-
resolver a seguir como os diferentes tipos de células estriatais e vias de gânglios basais desconto poral da recompensa no controle dos movimentos. J Neurosci 32: 11727–11736.

servem a hábitos e vigor de forma semelhante ou diferente. Por exemplo, embora estudos
Jin X, Costa RM (2010) Sinais de partida / parada surgem em circuitos nigroestriatais
tenham descoberto que os neurônios de via direta e indireta, e interneurônios de disparo
durante o aprendizado de sequência. Nature 466: 457–462.
rápido, do corpo estriado estão envolvidos no início de uma sequência comportamental ( Kubota
Jin X, Costa RM (2015) Modelando sequências de ação em circuitos de gânglios da base.
et al., 2009 ; Smith andGraybiel, 2013a ; O'Hare et al., 2016 ; Vicente et al., 2016 ) e estão
Curr Opin Neurobiol 33: 188–196.
envolvidos em hábitos ( Lovinger, 2010 ; Nelson e Killcross, 2013 ; Corbit et al., 2014 ; O'Hare JogMS, Kubota Y, Connolly CI, Hillegaart V, Graybiel AM (1999) Building
et al., 2018 ), esses estudos e outros também documentam dissociações entre as representações neurais de hábitos. Science 286: 1745–1749.
populações de células do estriado na forma como representam o comportamento Killcross S, Coutureau E (2003) Coordenação de ações e hábitos na
contínuo, o que levanta a necessidade de estudar as células do estriado individualmente córtex pré-frontal medial de ratos. Cereb Cortex 13: 400–408.

também neste contexto experimental. Kosaki Y, Poulter SL, Austen JM, McGregor A (2015) Dorsolateral striatal
lesões prejudicam a navegação com base em vetores de meta, mas facilitam o aprendizado
espacial com base em um "mapa cognitivo". Aprenda Mem 22: 179–191. Kosaki Y, Pearce JM,
McGregor A (2018) A estratégia de resposta e o
a estratégia de lugar em um labirinto em cruz tem diferentes sensibilidades à desvalorização do resultado
Referências
esperado. Hippocampus 28: 484–496.
Aldridge JW, Berridge KC, Rosen AR (2004) Basal ganglia neural mecha-
nismos de sequências de movimento natural. Can J Physiol Pharmacol 82: 732– Kubota Y, Liu J, Hu D, DeCoteau WE, Eden UT, Smith AC, Graybiel AM
739. (2009) A codificação estável da estrutura da tarefa coexiste com a codificação flexível dos eventos da

Allen BD, Singer AC, Boyden ES (2015) Principles of design interpreta- tarefa no corpo estriado sensório-motor. J Neurophysiol 102: 2142–

experimentos de comportamento optogenético. Aprenda Mem 22: 232–238. 2160.


Amaya KA, Smith KS (2018) Neurobiologia da formação de hábitos. Curr Opin Lovinger DM (2010) Funções do neurotransmissor na modulação sináptica, plasticidade

Behav Sci 20: 145–152. e aprendizagem no estriado dorsal. Neuropharmacology 58: 951–961. McDonald RJ,
Bailey MR, Simpson EH, Balsam PD (2016) Neural substrates subjacentes White NM (1993) A triple dissociation of memory sys-
esforço, tempo e tomada de decisão baseada em risco em comportamento motivador. Neurobiol Learn tems: hipocampo, amígdala e estriado dorsal. Behav Neurosci 107: 3-22.
Mem 133: 233–256.
Balleine BW, Dickinson A (1998) Ação instrumental direcionada a objetivos: contra Morrison SE, Bamkole MA, Nicola SM (2015) Rastreamento de sinal, mas não objetivo
aprendizagem por estímulo e tingência e seus substratos corticais. Neuropharmacology 37: rastreamento, é resistente à desvalorização do resultado. Front Neurosci 9: 468. Nelson AJ,
407–419. Killcross S (2013) Formação acelerada de hábito após am-
Balleine BW, Liljeholm M, Ostlund SB (2009) A função integrativa de a exposição à fetamina é revertida por D1, mas aumentada por antagonistas do receptor D2.
os gânglios da base no condicionamento instrumental. Behav Brain Res 199: 43- Front Neurosci 7:76.
52 Niv Y, DawND, Joel D, Dayan P (2007) Dopamina tônica: custos de oportunidade
Berke JD (2018) O que significa dopamina? Nat Neurosci 21: 787–793. Berke JD, Breck JT, e o controle do vigor da resposta. Psychopharmacology (Berl) 191: 507–
EichenbaumH (2009) Striatal versus hipocampal rep- 520.
ressentimentos durante a performance do labirinto win-stay. Journal of Neurophysiology 101: Novak KE, Miller LE, Houk JC (2002) The use of overlapping submove-
1575–1587. mentos no controle de movimentos rápidos das mãos. Exp Brain Res 144: 351–364.
Chang Q, Gold PE (2004) A inativação do estriado dorsolateral prejudica ac-
Questão de aprendizagem de resposta em condições deficientes de sugestão, mas não disponíveis. Behav
O'Hare JK, Ade KK, Sukharnikova T, Van Hooser SD, Palmeri ML, Yin HH,
Neurosci 118: 383–388.
Calakos N (2016) Pathway-specific striatal substrates for habitual behavior. Neuron 89:
Chang SE, Smedley EB, Stansfield KJ, Stott JJ, Smith KS (2017) Optogenética
472–479.
a inibição dos neurônios palidos ventrais prejudica a busca de sal orientada pelo contexto. J Neurosci
O'Hare J, Calakos N, Yin HH (2018) Insights recentes sobre o corticostriatal
37: 5670–5680.
mecanismos de circuito subjacentes aos hábitos: revisão convidada para opiniões atuais em ciências do
Corbit LH, Nie H, Janak PH (2014) Habitual responding for alcohol de-
comportamento. Curr Opin Behav Sci 20: 40–46.
depende da sinalização do receptor AMPA e D2 no corpo estriado dorsolateral. Front
Packard MG (2009) Exumado do pensamento: gânglios da base e resposta
Behav Neurosci 8: 301.
aprendendo no labirinto positivo. Behav Brain Res 199: 24–31.
da Silva JA, Tecuapetla F, Paixão V, Costa RM (2018) Neurônio dopamina
Packard MG, McGaugh JL (1996) Inativação do hipocampo ou caudado
a atividade antes do início da ação abre e revigora movimentos futuros. Nature 554:
O núcleo com lidocaína afeta diferencialmente a expressão do local e o aprendizado da resposta.
244–248.
Neurobiol Learn Mem 65: 65–72.
De Leonibus E, Costantini VJ, Massaro A, Mandolesi G, Vanni V, Luvisetto S,
Packard MG, Hirsh R, White NM (1989) Differential effects of fórnix e
Pavone F, Oliverio A, Mele A (2011) Determinantes cognitivos e neurais da estratégia de resposta na
lesões do núcleo caudado em duas tarefas do labirinto radial: evidências para múltiplos sistemas de
tarefa de labirinto em cruz de solução dupla. Aprenda Mem 18: 241–244.
memória. J Neurosci 9: 1465–1472.

Desrochers TM, Amemori K, Graybiel AM (2015) Habit learning by ingênuo Palencia CA, Ragozzino ME (2005) A contribuição do NMDA recep-
os macacos são marcados pela nitidez da resposta dos neurônios do estriado, representando o custo
torções no estriado dorsolateral para aprendizagem de resposta egocêntrica. Behav Neurosci

e o resultado das sequências de ação adquiridas. Neuron 87: 853–868. 119: 953–960.
Sage JR, Knowlton BJ (2000) Efeitos da desvalorização dos EUA na estadia de ganho e

Dickinson A (1985) Ações e hábitos: o desenvolvimento de comportamentos comportamentais desempenho em labirinto radial win-shift em ratos. Behav Neurosci 114: 295–306. Salamone

autonomia. Philos Trans R Soc Lond B Biol Sei 308: 67 ± 78. JD, Pardo M, Yohn SE, López-Cruz L, SanMiguel N, Correa M

Dudman JT, Krakauer JW (2016) Os gânglios basais: comandos frommotor (2016) Dopamina mesolímbica e a regulação do comportamento motivado. Curr Top Behav
ao controle do vigor. Curr Opin Neurobiol 37: 158–166. Neurosci 27: 231–257.
Floresco SB (2015) O núcleo accumbens: uma interface entre cognição, Seger CA, Spiering BJ (2011) Uma revisão crítica da aprendizagem de hábitos e os princípios básicos

emoção e ação. Annu Rev Psychol 66: 25–52. gânglios. Front Syst Neurosci 5:66.
Fujii N, Graybiel AM (2003) Representação dos limites da sequência de ação Smedley EB, Smith KS (2018) Evidência para uma representação compartilhada de se-
por neurônios corticais pré-frontais de macacos. Science 301: 1246–1249. pistas importantes que envolvem o rastreamento de sinais. Behav Processes 157: 489–494.
Crego et al. • Hábitos e vigor comportamental J. Neurosci., 4 de março de 2020 • 40 (10): 2139–2153 • 2153

Smith KS, Graybiel AM (2013a) Uma visão do operador duplo do comportamento habitual Vicente AM, Galvão-Ferreira P, Tecuapetla F, Costa RM (2016) Direto e
refletindo a dinâmica cortical e estriatal. Neuron 79: 361–374. as vias indiretas do estriado dorsolateral reforçam diferentes estratégias de ação. Curr Biol 26:
Smith KS, Graybiel AM (2013b) Usando optogenética para estudar hábitos. Cérebro R267 – R269.
Res 1511: 102-114. Wang AY, Miura K, Uchida N (2013) O estriado dorsomedial codifica
Smith KS, Graybiel AM (2014) Hábitos de investigação: estratégias, tecnologias retorno líquido esperado, crítico para energizar o vigor do desempenho. Nat Neurosci 16: 639–647.
e modelos. Front Behav Neurosci 8:39.
Smith KS, Graybiel AM (2016) Formação de hábito. Diálogos Clin Neurosci Yin HH, Knowlton BJ (2006) O papel dos gânglios da base na forma de hábito
18: 33–43. ção. Nat Rev Neurosci 7: 464–476.
Smith KS, Virkud A, Deisseroth K, Graybiel AM (2012) Reversível online Yin HH, Knowlton BJ, Balleine BW (2004) Lesions of dorsolateral striatum
controle do comportamento habitual por perturbação optogenética do córtex pré-frontal medial. preservar a expectativa de resultado, mas interromper a formação de hábito na aprendizagem instrumental.
Proc Natl Acad Sci USA 109: 18932–18937. Eur J Neurosci 19: 181–189.
Thorn CA, Atallah H, Howe M, Graybiel AM (2010) Differential dynamics Yin HH, Knowlton BJ, Balleine BW (2006) Inativação dorsolateral
de mudanças de atividade nas alças estriatal dorsolateral e dorsomedial durante a aprendizagem. Neuron striatum aumenta a sensibilidade a mudanças na contingência ação-resultado no
66: 781–795. condicionamento instrumental. Behav Brain Res 166: 189–196.

Você também pode gostar