Escolar Documentos
Profissional Documentos
Cultura Documentos
Perspectiva
https://doi.org/10.1038/s41593-018-0152-y
A dopamina é um modulador crítico da aprendizagem e da motivação. Isso apresenta um problema: como as células-alvo podem saber se
o aumento da dopamina é um sinal para aprender ou se mover? Muitas vezes, presume-se que a motivação envolve mudanças lentas
('tônicas') da dopamina, enquanto flutuações rápidas ('fásicas') da dopamina transmitem erros de previsão de recompensa para o
aprendizado. No entanto, estudos recentes mostraram que a dopamina transmite valor motivacional e promove o movimento mesmo em
escalas de tempo de subsegundos. Aqui eu descrevo um relato alternativo de como a dopamina regula o comportamento contínuo. A
liberação de dopamina relacionada à motivação é rápida e localmente esculpida por receptores nos terminais de dopamina,
independentemente do disparo das células de dopamina. Os neurônios-alvo alternam abruptamente entre os modos de aprendizado e desempenho, co
O impacto comportamental da dopamina varia de acordo com a sub-região, mas em cada caso a dopamina fornece uma estimativa
dinâmica sobre se vale a pena gastar um recurso interno limitado, como energia, atenção ou tempo.
A dopamina é um sinal de aprendizado, motivação ou ambos?. Nossa que maximizam a recompensa. Como o disparo de células de dopamina se
compreensão da dopamina mudou no passado e está mudando mais uma vez. assemelhava aos RPEs e os RPEs são usados para o aprendizado, tornou-se
Uma distinção crítica é entre os efeitos da dopamina no comportamento atual natural enfatizar o papel da dopamina no aprendizado. Manipulações optogenéticas
(desempenho) e os efeitos da dopamina no comportamento futuro (aprendizado). posteriores confirmaram a identidade dopaminérgica das células que codificam o
Ambos são reais e importantes, mas em vários momentos um foi a favor e o outro EPR12,13 e mostraram que elas realmente modulam o aprendizado14,15.
não. A ideia de que a dopamina fornece um sinal de aprendizado se encaixa
Quando (na década de 1970) se tornou possível realizar lesões seletivas e perfeitamente com a literatura de que a dopamina modula a plasticidade sináptica
completas das vias de dopamina, a consequência comportamental óbvia foi uma no corpo estriado, o principal alvo da dopamina no prosencéfalo. Por exemplo, a
redução severa no movimento1 . Isso se encaixa com os efeitos acinéticos da perda tripla coincidência de estimulação de glutamato de uma espinha dendrítica estriatal,
de dopamina em humanos produzidos pela doença de Parkinson avançada, drogas despolarização pós-sináptica e liberação de dopamina faz com que a espinha
tóxicas ou encefalite2 . No entanto, nem os ratos nem os humanos exibem uma cresça16. A modulação dopaminérgica dos mecanismos de aprendizado de longo
incapacidade fundamental de se mover. Ratos com lesão de dopamina nadam em prazo ajuda a explicar os efeitos comportamentais persistentes de drogas viciantes,
água fria3 , e pacientes acinéticos podem se levantar que compartilham a propriedade de aumentar a liberação de dopamina estriatal17.
e correr se um alarme de incêndio soar (chamado 'cinesia paradoxal'). Tampouco Mesmo a acinesia profunda com perda de dopamina pode ser parcialmente
há um déficit básico na apreciação de recompensas: ratos com lesão de dopamina explicada por tais mecanismos de aprendizado18. A falta de dopamina pode ser
consomem alimentos colocados em suas bocas e mostram sinais de que estão tratada como um RPE constantemente negativo que atualiza progressivamente os
gostando4 . Em vez disso, eles não escolherão se esforçar para obter recompensas valores das ações em direção a zero. Efeitos semelhantes progressivos e
ativamente. Esses e muitos outros resultados estabeleceram uma ligação semelhantes ao da extinção no comportamento podem ser produzidos por
fundamental entre dopamina e motivação5 . Mesmo a lentidão do movimento antagonistas da dopamina19,20.
observada em casos menos graves da doença de Parkinson pode ser considerada No entanto, a ideia de que a dopamina está criticamente envolvida na motivação
um déficit motivacional, refletindo decisões implícitas de que não vale a pena contínua nunca desapareceu - pelo contrário, é amplamente aceita pelos
gastar a energia necessária para movimentos mais rápidos . macacos comportados neurocientistas comportamentais. Isso é apropriado, dada a forte evidência de que
(em áreas do . as funções da dopamina na motivação, movimento e revigoramento são dissociáveis
mesencéfalo que se projetam para o prosencéfalo: área tegmental ventral, VTA do aprendizado15,20–23. Menos apreciado é o desafio envolvido em reconciliar
e substância negra pars compacta, SNc). Entre os padrões de disparo observados, esse papel motivacional com a teoria de que a dopamina fornece um sinal de
havia breves rajadas de atividade a estímulos que disparavam movimentos aprendizado de RPE.
imediatos. Esse disparo fásico de dopamina foi inicialmente interpretado como Motivação 'olha para frente': ela usa previsões de recompensa futura (valores)
suporte à ativação comportamental7 e à excitação motivacional8 — em outras para energizar adequadamente o comportamento atual. Em contraste, a
palavras, como revigorante do comportamento atual do animal. aprendizagem “olha para trás” em estados e ações no passado recente e atualiza
seus valores. São fases complementares de um ciclo: os valores atualizados podem
ser usados na tomada de decisões subsequentes se esses estados forem
Uma mudança radical ocorreu na década de 1990, com a reinterpretação dos reencontrados, atualizados novamente e assim por diante.
surtos fásicos de dopamina como codificação de erros de predição de recompensa Mas em qual fase do ciclo a dopamina está envolvida, usando valores para tomar
(RPEs)9 . Isso foi baseado em uma observação importante: as células de dopamina decisões (desempenho) ou atualizando valores (aprendizado)?
respondem a estímulos inesperados associados a recompensas futuras, mas Em algumas circunstâncias, é fácil imaginar a dopa mine desempenhando
frequentemente param de responder se esses estímulos se tornam esperados10. A ambos os papéis simultaneamente24. Sugestões inesperadas e preditivas de
ideia do RPE originou-se em teorias de aprendizado anteriores e especialmente no recompensa são os eventos arquetípicos para evocar o disparo e a liberação de
campo da ciência da computação em desenvolvimento de aprendizado por células de dopamina, e tais sugestões tipicamente revigoram o comportamento e
reforço11 . O objetivo de um sinal RPE é atualizar valores (estimativas de evocam o aprendizado (Fig. 1 ). Nesta situação particular, tanto a previsão de
recompensas futuras). Esses valores são usados posteriormente, para ajudar a fazer escolhas
recompensa quanto os RPEs aumentam simultaneamente, mas isso nem sempre é
Departamentos de Neurologia e Psiquiatria, e Kavli Institute for Fundamental Neuroscience, University of California, San Francisco, San Francisco, CA,
EUA. e-mail: joshua.berke@ucsf.edu
Passado presente futuro especialmente se sincronizados artificialmente através das células de dopamina, levam
a aumentos rápidos correspondentes na dopamina26 do prosencéfalo que são altamente
transitórios (duração de subsegundos27). A contribuição separada do disparo de
células tônicas de dopamina para as concentrações de dopamina no prosencéfalo é
menos clara. Algumas evidências sugerem que essa contribuição é muito pequena28.
Pode ser suficiente produzir estimulação quase contínua dos receptores D2 de maior
afinidade, permitindo que o sistema perceba breves pausas no disparo das células de
dopamina29 e use essas pausas como erros de previsão negativa.
© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google
10 Recompensa
Dopamina
(nM)
4
–2 10 segundos
–1 0 1 2 3 4 5 6 78 –4 ÿ2 0 2 4s
Tempo(s)
e 0
d Número de recompensas
1.2
1 nas últimas 10 tentativas
trabalho
valor
do Recompensa
deixa
0,75 0,8
8–10
6–7
3–5
0–2
ÿ0,4
ÿ0,8
normalizada
ÿDopamina
Decisão 0,4
0,5
de começar
normalizada
ÿDopamina
ÿ 0,4
0,25 0
ÿ
normalizada
ÿDopamina
0
0 ÿ0,4
Hora de recompensar Obter
ÿ4 ÿ2 0 2 4
começar
a trabalhar recompensa
ÿ4 ÿ2 0 2 4
Tempo desde side-in (s)
Tempo desde side-in (s)
Fig. 2 | Flutuações rápidas de dopamina sinalizam expectativas de recompensa em evolução dinâmica. a-c, a liberação de dopamina mesolímbica aumenta rapidamente à
medida que os ratos se aproximam das recompensas antecipadas. d, o valor, definido como estimativas descontadas temporariamente da recompensa futura, aumenta à medida que a
recompensa se aproxima. Indicações que indicam que uma recompensa é maior, mais próxima ou mais certa do que o esperado anteriormente causam saltos de valor. Esses saltos de
um momento para o outro são RPEs de diferença temporal. e, Subtrair as linhas de base pode confundir o valor e os sinais de RPE. Esquerda: a dopamina alinhada à sugestão preditiva
de recompensa (no tempo zero), com subtração convencional da linha de base, parece mostrar que a dopamina salta para níveis mais altos quando a recompensa é menos
esperada (marrom), lembrando um sinal RPE. Certo: uma apresentação alternativa dos mesmos dados, igualando os níveis de dopamina após a sugestão, mostraria, em vez disso,
que os níveis de dopamina pré-sugestão dependem da expectativa de recompensa (valor). Análises adicionais determinaram que a apresentação do lado direito está mais próxima
da verdade (ver detalhes na ref. 15). Painel a reproduzido, com permissão, da ref. 38, Macmillan Publishers Limited.; painel b reproduzido, com permissão, da ref. 37, Elsevier;
painéis c–e reproduzidos, com permissão, da ref. 15, Macmillan Publishers Limited.
a liberação de dopamina e o valor flutuante são visíveis tão rápido quanto a Ou esse significado precisa ser construído, por exemplo, comparando os níveis
técnica de registro permite, ou seja, em uma escala de tempo de aproximadamente de dopamina ao longo do tempo ou usando outros sinais coincidentes para
100 ms com eletrodos de voltametria aguda15. determinar qual maquinário celular acionar? Esta possibilidade é discutida mais
Flutuações rápidas de dopamina não apenas espelham a motivação, mas abaixo.
também impulsionam imediatamente o comportamento motivado. Respostas
fásicas maiores das células dopaminérgicas aos sinais de gatilho preveem A liberação de dopamina transmite a mesma informação que o disparo de
tempos de reação mais curtos naquele mesmo ensaio39. A estimulação células de mina de dopa?. A relação entre flutuações rápidas de dopamina e
optogenética das células de dopamina VTA torna os ratos mais propensos a valor motivacional parece estranha, dado que o disparo de células de dopamina
começar a trabalhar em nossa tarefa de recompensa probabilística15, como se se assemelha ao RPE. Além disso, alguns estudos relataram sinais de RPE na
tivessem uma expectativa maior de recompensa. A estimulação optogenética de liberação de dopamina mesolímbica43. É importante notar um desafio na
neurônios dopaminérgicos SNc, ou seus axônios no estriado dorsal, aumenta a probabilidade de movimento40,41.
interpretação de algumas formas de dados neurais.
Criticamente, esses efeitos comportamentais são aparentes dentro de algumas Sinais de valor e RPEs estão correlacionados entre si, o que não é surpreendente,
centenas de milissegundos do início da estimulação optogenética. A capacidade pois o RPE é geralmente definido como a mudança no valor de um momento para
de pistas preditivas de recompensa para aumentar a motivação parece ser o outro (RPE de 'diferença temporal'). Devido a essa correlação, é fundamental
mediada pela modulação dopaminérgica muito rápida da capacidade de excitação usar projetos experimentais e análises que diferenciem o valor das contas RPE.
dos neurônios espinhosos NAc42. Uma vez que a dopamina está mudando O problema é agravado quando se usa uma medida neural que depende de
rapidamente e essas mudanças de dopamina afetam a motivação rapidamente, mudanças de sinal relativas, em vez de absolutas. As análises de voltametria
as funções motivacionais da dopamina são melhor descritas como rápidas geralmente comparam a dopamina em algum ponto de interesse a uma época
(fásicas), não lentas (tônicas). 'base' anterior em cada tentativa (para remover componentes de sinal que não
Além disso, invocar escalas rápidas e lentas separadas não resolve por si só são dependentes de dopamina, incluindo carregamento de eletrodo em cada
o problema de decodificação enfrentado pelos neurônios com receptores de varredura de voltagem e desvio em uma escala de tempo de minutos). Mas
dopamina. Se a dopamina sinaliza o aprendizado, a modulação da plasticidade subtrair uma linha de base pode fazer com que um sinal de valor se assemelhe a
sináptica pareceria uma resposta celular apropriada. Mas os efeitos imediatos no um sinal RPE. Isso é o que observamos em nossos próprios dados de voltametria
comportamento motivado implicam efeitos imediatos no pico, por exemplo, por (Fig. 2e). Mudanças na expectativa de recompensa foram refletidas em mudanças
meio de mudanças rápidas na excitabilidade. na concentração de dopamina no início de cada tentativa, e essas mudanças
A dopamina pode ter esses dois efeitos pós-sinápticos (e mais), então uma são perdidas se alguém simplesmente assumir uma linha de base constante entre
determinada concentração de dopamina tem um significado específico? as tentativas15. Conclusões sobre
liberação de dopamina e codificação RPE, portanto, precisam ser vistos com cautela. As células colinérgicas estriatais estão, portanto, bem posicionadas para mudar
Esse perigo de interpretação de dados se aplica não apenas à tentativa de dinamicamente o significado de uma mensagem dopaminérgica multiplexada.
voltametria, mas a qualquer análise que dependa de mudanças relativas – incluindo Durante as pausas da NIC, o alívio de um bloqueio muscarínico sobre a plasticidade
potencialmente alguma ressonância magnética funcional e fotometria44. sináptica permitiria que a dopamina fosse usada para o aprendizado. Em outras
No entanto, ainda precisamos reconciliar a liberação de dopamina relacionada ao ocasiões, a liberação dos terminais de dopamina seria esculpida localmente para
valor no núcleo do NAc com a ausência consistente de aumento relacionado ao valor afetar o desempenho comportamental contínuo. Atualmente, esta sugestão é
pelos neurônios dopaminérgicos13, mesmo dentro da área VTA lateral que fornece especulativa e incompleta. Foi proposto que os CINs integram informações de
dopamina ao núcleo do NAc45. Um fator potencial é que as células de dopamina são muitos neurônios espinhosos circundantes para extrair sinais úteis em nível de rede,
geralmente registradas em animais com restrição de cabeça realizando tarefas de como entropia59,60. Mas não está claro que a dinâmica da atividade CIN possa ser
condicionamento clássico, enquanto a liberação de dopamina é tipicamente medida usada para gerar sinais de valor de dopamina61 ou para controlar sinais de
em animais sem restrição que se movem ativamente em seu ambiente. Propusemos aprendizagem de dopamina.
que a dopamina mesolímbica pode indicar especificamente o valor do 'trabalho'15,
ou seja, que reflete uma exigência de dedicar tempo e esforço para obter a A dopamina significa a mesma coisa em todo o prosencéfalo?.
recompensa. Consistente com isso, a dopamina aumenta com sinais que instruem o À medida que a ideia do RPE se consolidava, imaginava-se que a dopamina era um
movimento, mas não com sinais que instruem a imobilidade, mesmo quando indicam sinal global, transmitindo uma mensagem de erro ao longo dos alvos corticais
recompensa futura semelhante46. Se, como em muitas tarefas de condicionamento estriatais e frontais. Schultz enfatizou que células de minas de dopa de macaco em
clássico, não houver benefício no trabalho ativo, então as alterações dopaminérgicas VTA e SNc têm respostas muito semelhantes62.
que indicam o valor do trabalho podem ser menos aparentes. Estudos de células de dopamina identificadas também encontraram respostas
bastante homogêneas do tipo RPE em roedores, pelo menos para neurônios VTA
Ainda mais importante pode ser o fato de que a liberação de dopamina pode ser laterais em contextos clássicos de condicionamento13. No entanto, as células
controlada localmente nos próprios terminais e, assim, mostrar padrões espaço- dopaminérgicas são molecular e fisiologicamente diversas63-65, e agora há muitos
temporais independentes do pico do corpo celular. Por exemplo, a amígdala relatos de que elas mostram diversos padrões de disparo no comportamento de
basolateral pode influenciar a liberação de NAc dopamina mesmo quando o VTA está animais. Isso inclui aumentos fásicos no disparo de eventos aversivos66 e pistas de
inativado47. Por outro lado, a inativação da amígdala basolateral reduz a liberação gatilho67, que se ajustam mal à conta padrão de RPE.
de dopamina NAc e o comportamento motivado correspondente, aparentemente sem Muitas células de dopamina mostram uma resposta inicial de latência curta a
afetar o disparo de VTA48. Os terminais de dopamina têm receptores para uma eventos sensoriais que refletem surpresa ou 'alerta' mais do que codificação
variedade de neurotransmissores, incluindo glutamato, opioides e acetilcolina. específica de RPE68,69. Esse aspecto de alerta é mais proeminente no SNc69, onde
as células dopaminérgicas se projetam mais para o estriado dorsolateral (EDL)
Os receptores nicotínicos de acetilcolina permitem que os interneurônios colinérgicos sensório-motor45,63. Também foi relatado que subpopulações de células de
estriatais (CINs) controlem rapidamente a liberação de dopamina49,50. Embora dopamina SNc aumentam41 ou diminuem70 o disparo em conjunto com movimentos
tenha sido observado há muito tempo que o controle local da liberação de dopamina espontâneos, mesmo sem estímulos externos.
é potencialmente importante7,51, isso não foi incluído nas contas computacionais Vários grupos usaram fotometria de fibra e o indicador de cálcio GCaMP para
da função da dopamina. Eu proponho que a dinâmica de liberação de dopamina examinar a atividade em massa de subpopulações de neurônios dopaminérgicos71,72.
relacionada à codificação de valor surge em grande parte por meio do controle local, Células de dopamina que se projetam para o estriado dorsomedial (DMS) mostraram
mesmo quando o disparo de células de dopamina fornece importantes sinais atividade deprimida transitoriamente para choques breves inesperados, enquanto
semelhantes ao RPE para o aprendizado. aquelas que se projetam para DLS mostraram atividade aumentada71 mais
consistente com uma resposta de alerta. Respostas dopaminérgicas distintas em
Como a dopamina pode significar aprendizado e motivação sem confusão? Em diferentes sub-regiões do prosencéfalo também foram observadas usando GCaMP
princípio, um sinal de valor é suficiente para transmitir RPE também, uma vez que para examinar a atividade de axônios e terminais de dopamina40,72,73. Usando
RPEs de diferença temporal são simplesmente mudanças rápidas de valor (Fig. 2d). imagens de dois fótons em camundongos com restrição de cabeça, Howe e
Por exemplo, vias intracelulares distintas em neurônios-alvo podem ser diferentesmente Dombeck40 relataram atividade fásica da dopamina relacionada a movimentos
sensíveis à concentração absoluta de dopamina (representando valor) versus espontâneos. Isso foi observado predominantemente em axônios de dopamina
mudanças relativas rápidas na concentração (representando RPE). Este esquema individuais de SNc que terminavam no estriado dorsal, enquanto axônios de dopamina
parece plausível, dada a complexa modulação da dopamina da fisiologia do neurônio VTA em NAc responderam mais à entrega de recompensa. Outros também
espinhoso52 e sua sensibilidade a padrões temporais de concentração de cálcio53. encontraram atividade dopaminérgica relacionada à recompensa em NAc, com DMS,
No entanto, isso também parece um tanto redundante. Se um sinal semelhante ao em vez disso, mais ligada a ações contralaterais72 e a cauda posterior do estriado
RPE já existe no pico de células de dopamina, deve ser possível usá-lo em vez de responsiva a estímulos aversivos e novos74.
derivar novamente o RPE de um sinal de valor.
Medidas diretas da liberação de dopamina também revelam heterogeneidade
Para usar apropriadamente RPE distinto e sinais de valor, os circuitos receptores entre as sub-regiões30,75. Com a microdiálise, descobrimos que a dopa mina está
de dopamina podem mudar ativamente como eles interpretam a dopamina. correlacionada com o valor especificamente no núcleo NAc e no córtex frontal
Há evidências intrigantes de que a acetilcolina também pode desempenhar esse ventromedial e não em outras partes mediais do corpo estriado (revestimento NAc,
papel de comutação. Ao mesmo tempo em que as células de dopamina disparam DMS) ou córtex frontal. Isso é intrigante, pois parece mapear bem dois 'hotspots' de
rajadas de picos para sinais inesperados, os CINs mostram pausas breves (~ 150 codificação de valor consistentemente vistos em estudos de ressonância magnética
ms) no disparo, que não escalam com RPEs54. Essas pausas da NIC podem ser funcional humana76,77. Em particular, o sinal dependente do nível de oxigênio no
conduzidas por neurônios VTA GABAérgicos55 ou por células relacionadas à sangue (BOLD) de NAc, que tem uma relação próxima com a sinalização de
'surpresa' no tálamo intralaminar, e foi proposto que atuem como um sinal de dopamina78, aumenta com a antecipação de recompensa (valor) mais do que com
associabilidade promovendo o aprendizado56. Morris e Bergman sugeriram54 que RPE76.
as pausas colinérgicas definem janelas temporais para a plasticidade estriatal, Quer esses padrões espaciais de liberação de dopamina surjam do disparo de
durante as quais a dopamina pode ser usada como um sinal de aprendizado. A subpopulações distintas de células de dopamina, do controle local da liberação de
plasticidade dependente de dopamina é continuamente suprimida por mecanismos, dopamina ou de ambos, eles desafiam a ideia de uma mensagem global de dopamina.
incluindo receptores muscarínicos M4 em neurônios estriatais de via direta57. Pode-se concluir que existem muitas funções diferentes da dopamina, com (por
Modelos de sinalização intracelular sugerem que durante pausas de NIC, a ausência exemplo) dopamina no movimento de sinalização do estriado dorsal e dopamina na
de ligação de M4 pode atuar sinergicamente com surtos fásicos de dopamina para recompensa de sinalização do estriado ventral40. No entanto, sou a favor de outra
aumentar a ativação de PKA58, promovendo assim alteração sináptica. abordagem conceitual.
Diferentes sub-regiões estriatais recebem informações de diferentes células corticais.
© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google
2. Sacks, O. Despertar. (Duckworth, Londres, 1973). 33. Cohen, JY, Amoroso, MW & Uchida, N. Os neurônios serotoninérgicos sinalizam recompensa
3. Marshall, JF, Levitan, D. & Stricker, EM Restauração induzida por ativação de funções sensório- e punição em várias escalas de tempo. eLife 4, e06346 (2015).
motoras em ratos com lesões cerebrais de depleção de dopamina. 34. Floresco, SB, West, AR, Ash, B., Moore, H. & Grace, AA A modulação aferente da fring de
J. Comp. Physiol. Psicol. 90, 536-546 (1976). neurônios dopaminérgicos regula diferencialmente a transmissão tônica e fásica da
4. Berridge, KC, Venier, IL & Robinson, TE Análise da reatividade do sabor da afagia induzida por 6- dopamina. Nat. Neurosci. 6, 968–973 (2003).
hidroxidopamina: implicações para as hipóteses de excitação e anedonia da função 35. Grace, AA Desregulação do sistema de dopamina na fisiopatologia da esquizofrenia e depressão.
da dopamina. Behav. Neurosci. 103, 36–45 (1989). Nat. Rev. Neurosci. 17, 524-532 (2016).
36. Phillips, PE, Stuber, GD, Heien, ML, Wightman, RM & Carelli, R.
5. Salamone, JD & Correa, M. As misteriosas funções motivacionais da dopamina mesolímbica. M. A liberação de dopamina em subsegundos promove a busca por cocaína. Natureza 422,
Neuron 76, 470-485 (2012). 614-618 (2003).
6. Mazzoni, P., Hristova, A. & Krakauer, JW Por que não nos movemos mais rápido? 37. Wassum, KM, Ostlund, SB & Maidment, NT Fasico mesolímbico
doença de Parkinson, vigor do movimento e motivação implícita. J. Neurosci. 27, 7105–7116 a sinalização de dopamina precede e prediz o desempenho de uma tarefa de sequência de
(2007). ação auto-iniciada. Biol. Psychiatry 71, 846–854 (2012).
7. Schultz, W. Respostas dos neurônios dopaminérgicos do mesencéfalo a estímulos de gatilho 38. Howe, MW, Tierney, PL, Sandberg, SG, Phillips, PE & Graybiel, A.
comportamental no macaco. J. Neurophysiol. 56, 1439-1461 (1986). M. Sinalização prolongada de dopamina no corpo estriado sinaliza proximidade e valor de
8. Schultz, W. & Romo, R. Neurônios dopaminérgicos do mesencéfalo do macaco: recompensas distantes. Nature 500, 575–579 (2013).
contingências de respostas a estímulos que provocam reações comportamentais 39. Satoh, T., Nakai, S., Sato, T. & Kimura, M. Codificação correlacionada de
imediatas. J. Neurophysiol. 63, 607–624 (1990). motivação e resultado da decisão pelos neurônios dopaminérgicos. J. Neurosci. 23, 9913–9923
9. Montague, PR, Dayan, P. & Sejnowski, TJ Uma estrutura para (2003).
sistemas de dopamina mesencefálicos baseados na aprendizagem hebbiana preditiva. 40. Howe, MW & Dombeck, DA Sinalização rápida em axônios dopaminérgicos distintos durante a
J. Neurosci. 16, 1936–1947 (1996). locomoção e recompensa. Nature 535, 505–510 (2016). 41. da Silva, JA, Tecuapetla,
10. Schultz, W., Apicella, P. & Ljungberg, T. Respostas de neurônios de dopamina de macaco para F., Paixão, V. & Costa, RM A atividade do neurônio dopaminérgico antes do início da ação bloqueia e
recompensar e condicionar estímulos durante etapas sucessivas de aprendizagem de revigora os movimentos futuros.
uma tarefa de resposta atrasada. J. Neurosci. 13, 900-913 (1993). Nature 554, 244–248 (2018). 42. du
11. Sutton, RS & Barto, AG Aprendizagem por Reforço: uma Introdução. (MIT Hofmann, J. & Nicola, SM A dopamina revigora a busca de recompensas ao promover a excitação
Imprensa: Cambridge, Massachusetts, 1998). evocada por pistas no núcleo accumbens. J. Neurosci. 34, 14349–14364 (2014).
12. Cohen, JY, Haesler, S., Vong, L., Lowell, BB & Uchida, N. Sinais específicos do tipo de neurônio
para recompensa e punição na área tegmental ventral. 43. Hart, AS, Rutledge, RB, Glimcher, PW & Phillips, PE A liberação de dopamina fásica no
Nature 482, 85–88 (2012). núcleo accumbens do rato codifica simetricamente um termo de erro de predição
13. Eshel, N., Tian, J., Bukwich, M. & Uchida, N. Os neurônios dopaminérgicos compartilham de recompensa. J. Neurosci. 34, 698-704 (2014).
função de resposta comum para erro de previsão de recompensa. Nat. Neurosci. 19, 479-486
(2016). 44. Soares, S., Atallah, BV & Paton, JJ Controle dos neurônios dopaminérgicos do mesencéfalo
14. Steinberg, EE et al. Uma ligação causal entre erros de previsão, neurônios de dopamina e julgamento do tempo. Ciência 354, 1273–1277 (2016).
aprendizado. Nat. Neurosci. 16, 966-973 (2013). 45. Ikemoto, S. Circuitos de recompensa de dopamina: dois sistemas de projeção do mesencéfalo
15. Hamid, AA et al. A dopamina mesolímbica sinaliza o valor do trabalho. Nat. ventral ao complexo do núcleo accumbens-tubérculo olfatório.
Neurosci. 19, 117–126 (2016). Cérebro Res. Rev. 56, 27–78 (2007).
16. Yagishita, S. et al. Uma janela de tempo crítica para as ações da dopamina na plasticidade 46. Syed, EC et al. A iniciação da ação molda a codificação mesolímbica da dopamina de recompensas
estrutural das espinhas dendríticas. Ciência 345, 1616–1620 (2014). futuras. Nat. Neurosci. 19, 34–36 (2016).
17. Berke, JD & Hyman, SE Addiction, dopamina e os mecanismos moleculares da memória. 47. Floresco, SB, Yang, CR, Phillips, AG & Blaha, CD Basolateral
Neuron 25, 515-532 (2000). A estimulação da amígdala evoca o efluxo de dopamina dependente do receptor de glutamato no
18. Beeler, JA Um papel para a aprendizagem mediada por dopamina na fisiopatologia e tratamento da núcleo accumbens do rato anestesiado. EUR. J. Neurosci. 10, 1241–1251 (1998).
doença de Parkinson. Cell Rep. 2, 1747–1761 (2012).
19. Sábio, RA Dopamina, aprendizado e motivação. Nat. Rev. Neurosci. 5, 483-494 (2004). 48. Jones, JL et al. A amígdala basolateral modula a liberação terminal de dopamina no núcleo
accumbens e a resposta condicionada. Biol. Psiquiatria 67, 737–744 (2010).
20. Leventhal, DK et al. Efeitos dissociáveis da dopamina na aprendizagem e
desempenho dentro do corpo estriado sensório-motor. Basal Ganglia 4, 43–54 (2014). 49. Cachope, R. A ativação seletiva de interneurônios colinérgicos aumenta
21. Wyvell, CL & Berridge, KC A anfetamina intra-accumbens aumenta a saliência do incentivo liberação de dopamina fásica accumbal: definindo o tom para o processamento de recompensa.
condicionado da recompensa da sacarose: aumento da Cell Rep. 2(1), 33–41 (2012).
recompense “querer” sem aumentar “gostar” ou reforço de resposta. 50. Trelfell, S. et al. A liberação de dopamina estriatal é desencadeada por
J. Neurosci. 20, 8122-8130 (2000). atividade em interneurônios colinérgicos. Neuron 75, 58-64 (2012).
22. Cagniard, B. et al. A dopamina aumenta o desempenho na ausência de novos 51. Grace, AA Liberação de dopamina fásica versus tônica e a modulação da responsividade do
aprendizado. Neuron 51, 541-547 (2006). sistema de dopamina: uma hipótese para a etiologia da esquizofrenia.
23. Shiner, T. et al. Dopamina e desempenho em uma tarefa de aprendizado por reforço: evidências Neuroscience 41, 1–24 (1991).
da doença de Parkinson. Cérebro 135, 1871-1883 (2012). 52. Moyer, JT, Wolf, JA & Finkel, LH Efeitos da modulação dopaminérgica nas propriedades integrativas
24. McClure, SM, Daw, ND & Montague, PR Um substrato computacional para saliência de incentivo. do neurônio espinhoso médio estriado ventral. j.
Trends Neurosci. 26, 423–428 (2003). Neurofisiológico. 98, 3731–3748 (2007).
25. Schultz, W. Múltiplas funções da dopamina em diferentes cursos de tempo. Annu. 53. Jÿdrzejewska-Szmek, J., Damodaran, S., Dorman, DB & Blackwell, KT
Rev. Neurosci. 30, 259-288 (2007). A dinâmica do cálcio prevê a direção da plasticidade sináptica nos neurônios de projeção
26. Gonon, F. et al. Geometria e cinética da transmissão dopaminérgica no corpo estriado de ratos e em espinhosa do estriatal. EUR. J. Neurosci. 45, 1044–1056 (2017).
camundongos sem o transportador de dopamina. Prog. Cérebro Res. 125, 291–302 (2000). 54. Morris, G., Arkadir, D., Nevet, A., Vaadia, E. & Bergman, H. Mensagens coincidentes, mas
distintas, da dopamina do mesencéfalo e dos neurônios tonicamente ativos do estriado.
27. Aragona, BJ et al. O aumento preferencial da transmissão de dopamina dentro do núcleo Neuron 43, 133-143 (2004).
accumbens pela cocaína é atribuível a um aumento direto nos eventos de liberação fásica de 55. Brown, MT et al. Projeções GABA da área tegmental ventral pausam
dopamina. J. Neurosci. 28, 8821–8831 (2008). interneurônios colinérgicos acumulativos para melhorar a aprendizagem associativa. Nature
492, 452–456 (2012).
28. Owesson-White, CA et al. Fontes que contribuem para a média 56. Yamanaka, K. et al. Funções dos núcleos parafasciculares centromedianos de
concentração extracelular de dopamina no núcleo accumbens. j. tálamo e interneurônios colinérgicos no estriado dorsal na aprendizagem associativa de eventos
Neurochem. 121, 252–262 (2012). ambientais. J. Transm. Neural. (Viena) 125, 501–513 (2018).
29. Yapo, C. et al. Detecção de dopamina fásica por neurônios espinhosos médios estriatais D1 e D2. J.
Physiol. (Londres.) 595, 7451–7475 (2017). 57. Shen, W. et al. A sinalização do receptor muscarínico M4 melhora o estriatal
30. Freed, CR & Yamamoto, BK Metabolismo cerebral regional da dopamina: um marcador para a déficits de plasticidade em modelos de discinesia induzida por L-DOPA. Neuron 88, 762-773
velocidade, direção e postura de animais em movimento. Science 229, 62-65 (1985). (2015).
58. Nair, AG, Gutierrez-Arenas, O., Eriksson, O., Vincent, P. & Hellgren Kotaleski, J. Sensing
31. Niv, Y., Daw, ND, Joel, D. & Dayan, P. Dopamina tônica: custos de oportunidade e controle do vigor sinais de recompensa positivos versus negativos através de GPCRs acoplados a
da resposta. Psychopharmacology (Berl.) 191, 507–520 (2007). adenilil ciclase em neurônios espinhosos médios estriatais de via direta e indireta. J.
Neurosci. 35, 14017–14030 (2015).
32. Strecker, RE, Steinfels, GF & Jacobs, BL Atividade da unidade dopaminérgica em gatos que se 59. Stocco, A. Entropia baseada em acetilcolina na seleção de resposta: um modelo de como os
movem livremente: falta de relação com alimentação, saciedade e injeções de glicose. interneurônios estriatais modulam a exploração, exploração e variabilidade de resposta na
Cérebro Res. 260, 317–321 (1983). tomada de decisões. Frente. Neurosci. 6, 18 (2012).
© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google