Você está na página 1de 7

Machine Translated by Google

Perspectiva
https://doi.org/10.1038/s41593-018-0152-y

O que significa dopamina?


Joshua D. Berke

A dopamina é um modulador crítico da aprendizagem e da motivação. Isso apresenta um problema: como as células-alvo podem saber se
o aumento da dopamina é um sinal para aprender ou se mover? Muitas vezes, presume-se que a motivação envolve mudanças lentas
('tônicas') da dopamina, enquanto flutuações rápidas ('fásicas') da dopamina transmitem erros de previsão de recompensa para o
aprendizado. No entanto, estudos recentes mostraram que a dopamina transmite valor motivacional e promove o movimento mesmo em
escalas de tempo de subsegundos. Aqui eu descrevo um relato alternativo de como a dopamina regula o comportamento contínuo. A
liberação de dopamina relacionada à motivação é rápida e localmente esculpida por receptores nos terminais de dopamina,
independentemente do disparo das células de dopamina. Os neurônios-alvo alternam abruptamente entre os modos de aprendizado e desempenho, co
O impacto comportamental da dopamina varia de acordo com a sub-região, mas em cada caso a dopamina fornece uma estimativa
dinâmica sobre se vale a pena gastar um recurso interno limitado, como energia, atenção ou tempo.

A dopamina é um sinal de aprendizado, motivação ou ambos?. Nossa que maximizam a recompensa. Como o disparo de células de dopamina se
compreensão da dopamina mudou no passado e está mudando mais uma vez. assemelhava aos RPEs e os RPEs são usados para o aprendizado, tornou-se
Uma distinção crítica é entre os efeitos da dopamina no comportamento atual natural enfatizar o papel da dopamina no aprendizado. Manipulações optogenéticas
(desempenho) e os efeitos da dopamina no comportamento futuro (aprendizado). posteriores confirmaram a identidade dopaminérgica das células que codificam o
Ambos são reais e importantes, mas em vários momentos um foi a favor e o outro EPR12,13 e mostraram que elas realmente modulam o aprendizado14,15.
não. A ideia de que a dopamina fornece um sinal de aprendizado se encaixa
Quando (na década de 1970) se tornou possível realizar lesões seletivas e perfeitamente com a literatura de que a dopamina modula a plasticidade sináptica
completas das vias de dopamina, a consequência comportamental óbvia foi uma no corpo estriado, o principal alvo da dopamina no prosencéfalo. Por exemplo, a
redução severa no movimento1 . Isso se encaixa com os efeitos acinéticos da perda tripla coincidência de estimulação de glutamato de uma espinha dendrítica estriatal,
de dopamina em humanos produzidos pela doença de Parkinson avançada, drogas despolarização pós-sináptica e liberação de dopamina faz com que a espinha
tóxicas ou encefalite2 . No entanto, nem os ratos nem os humanos exibem uma cresça16. A modulação dopaminérgica dos mecanismos de aprendizado de longo
incapacidade fundamental de se mover. Ratos com lesão de dopamina nadam em prazo ajuda a explicar os efeitos comportamentais persistentes de drogas viciantes,
água fria3 , e pacientes acinéticos podem se levantar que compartilham a propriedade de aumentar a liberação de dopamina estriatal17.
e correr se um alarme de incêndio soar (chamado 'cinesia paradoxal'). Tampouco Mesmo a acinesia profunda com perda de dopamina pode ser parcialmente
há um déficit básico na apreciação de recompensas: ratos com lesão de dopamina explicada por tais mecanismos de aprendizado18. A falta de dopamina pode ser
consomem alimentos colocados em suas bocas e mostram sinais de que estão tratada como um RPE constantemente negativo que atualiza progressivamente os
gostando4 . Em vez disso, eles não escolherão se esforçar para obter recompensas valores das ações em direção a zero. Efeitos semelhantes progressivos e
ativamente. Esses e muitos outros resultados estabeleceram uma ligação semelhantes ao da extinção no comportamento podem ser produzidos por
fundamental entre dopamina e motivação5 . Mesmo a lentidão do movimento antagonistas da dopamina19,20.
observada em casos menos graves da doença de Parkinson pode ser considerada No entanto, a ideia de que a dopamina está criticamente envolvida na motivação
um déficit motivacional, refletindo decisões implícitas de que não vale a pena contínua nunca desapareceu - pelo contrário, é amplamente aceita pelos
gastar a energia necessária para movimentos mais rápidos . macacos comportados neurocientistas comportamentais. Isso é apropriado, dada a forte evidência de que
(em áreas do . as funções da dopamina na motivação, movimento e revigoramento são dissociáveis
mesencéfalo que se projetam para o prosencéfalo: área tegmental ventral, VTA do aprendizado15,20–23. Menos apreciado é o desafio envolvido em reconciliar
e substância negra pars compacta, SNc). Entre os padrões de disparo observados, esse papel motivacional com a teoria de que a dopamina fornece um sinal de
havia breves rajadas de atividade a estímulos que disparavam movimentos aprendizado de RPE.
imediatos. Esse disparo fásico de dopamina foi inicialmente interpretado como Motivação 'olha para frente': ela usa previsões de recompensa futura (valores)
suporte à ativação comportamental7 e à excitação motivacional8 — em outras para energizar adequadamente o comportamento atual. Em contraste, a
palavras, como revigorante do comportamento atual do animal. aprendizagem “olha para trás” em estados e ações no passado recente e atualiza
seus valores. São fases complementares de um ciclo: os valores atualizados podem
ser usados na tomada de decisões subsequentes se esses estados forem
Uma mudança radical ocorreu na década de 1990, com a reinterpretação dos reencontrados, atualizados novamente e assim por diante.
surtos fásicos de dopamina como codificação de erros de predição de recompensa Mas em qual fase do ciclo a dopamina está envolvida, usando valores para tomar
(RPEs)9 . Isso foi baseado em uma observação importante: as células de dopamina decisões (desempenho) ou atualizando valores (aprendizado)?
respondem a estímulos inesperados associados a recompensas futuras, mas Em algumas circunstâncias, é fácil imaginar a dopa mine desempenhando
frequentemente param de responder se esses estímulos se tornam esperados10. A ambos os papéis simultaneamente24. Sugestões inesperadas e preditivas de
ideia do RPE originou-se em teorias de aprendizado anteriores e especialmente no recompensa são os eventos arquetípicos para evocar o disparo e a liberação de
campo da ciência da computação em desenvolvimento de aprendizado por células de dopamina, e tais sugestões tipicamente revigoram o comportamento e
reforço11 . O objetivo de um sinal RPE é atualizar valores (estimativas de evocam o aprendizado (Fig. 1 ). Nesta situação particular, tanto a previsão de
recompensas futuras). Esses valores são usados posteriormente, para ajudar a fazer escolhas
recompensa quanto os RPEs aumentam simultaneamente, mas isso nem sempre é

Departamentos de Neurologia e Psiquiatria, e Kavli Institute for Fundamental Neuroscience, University of California, San Francisco, San Francisco, CA,
EUA. e-mail: joshua.berke@ucsf.edu

Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience 787


© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

Perspectiva NaTure Neuroscience

Passado presente futuro especialmente se sincronizados artificialmente através das células de dopamina, levam
a aumentos rápidos correspondentes na dopamina26 do prosencéfalo que são altamente
transitórios (duração de subsegundos27). A contribuição separada do disparo de
células tônicas de dopamina para as concentrações de dopamina no prosencéfalo é
menos clara. Algumas evidências sugerem que essa contribuição é muito pequena28.
Pode ser suficiente produzir estimulação quase contínua dos receptores D2 de maior
afinidade, permitindo que o sistema perceba breves pausas no disparo das células de
dopamina29 e use essas pausas como erros de previsão negativa.

A microdiálise tem sido amplamente utilizada para medir diretamente os níveis de


dopamina no prosencéfalo, embora com baixa resolução temporal (normalmente com
média de muitos minutos). Essas medições lentas da mina de dopa podem ser difíceis
de relacionar com precisão ao comportamento. No entanto, a microdiálise de dopamina
no núcleo accumbens (NAc; estriado ven tromedial) mostra correlações positivas com
a atividade locomotora30 e outros índices de motivação5 . Isso tem sido amplamente
considerado como significando que há mudanças lentas (tônicas) na concentração de
dopamina e que essas mudanças lentas transmitem um sinal motivacional.

Mais especificamente, modelos computacionais propuseram que os níveis de dopamina


tônica acompanham a taxa média de recompensa de longo prazo31, uma variável
motivacional útil para alocação de tempo e decisões de forrageamento. Vale a pena
enfatizar que pouquíssimos artigos definem claramente 'tônica dopa mina'; eles
geralmente assumem apenas que a concentração de dopamina muda lentamente ao
longo da escala de tempo de vários minutos da microdiálise.
No entanto, esta 'dopamina fásica = aprendizagem; A visão tônica dopamina =
motivação enfrenta muitos problemas. Em primeiro lugar, não há evidência direta de
que o disparo de células tônicas de dopamina normalmente varie em escalas de tempo lentas.
As taxas de disparo tônico não mudam com a mudança de motivação32,33. Tem sido
Fig. 1 | Dopamina: atualizando o passado, revigorando o presente. Acima: argumentado que os níveis tônicos de dopamina mudam devido a uma mudança na
Os círculos com setas representam os estados e as ações potenciais desses proporção de células de dopamina ativas34,35. Mas em muitos estudos em animais
estados. As larguras das setas indicam os valores aprendidos da execução de sem drogas e sem lesões, nunca foi relatado que as células de dopamina alternam
cada ação. À medida que estados e ações desaparecem no passado, eles são entre os estados silencioso e ativo.
progressivamente menos elegíveis para reforço. Meio: ocorre uma explosão de Além disso, o fato de a microdiálise medir os níveis de dopamina lentamente não
dopamina. O resultado é o fortalecimento das ações disponíveis do estado atual significa que os níveis de dopamina realmente mudem lentamente. Recentemente,
(vermelho) e a plasticidade das representações de valor para ações realizadas examinamos a dopamina NAc de rato em uma tarefa de recompensa probabilística,
recentemente (roxo). Abaixo: como resultado da plasticidade, na próxima vez que usando microdiálise e voltametria cíclica de varredura rápida. Confirmamos que a
esses estados forem encontrados, seus valores associados aumentarão (largura das setas). dopamina mesolímbica, medida por microdiálise, se correlaciona com a taxa de
Por meio da experiência repetida, o aprendizado por reforço pode criar um sulco no recompensa (recompensas por minuto).
espaço de estado, tornando certas trajetórias cada vez mais prováveis. No entanto, mesmo com uma resolução temporal de microdiálise aprimorada (1 min), a
Além desse papel de aprendizado, o papel revigorante e de desempenho da dopamina flutuou tão rápido quanto a amostramos: não vimos nenhuma evidência de
dopamina parece acelerar o fluxo ao longo de trajetórias previamente aprendidas. um sinal de dopamina inerentemente lento.
Usando a resolução temporal ainda mais fina da voltametria, observamos uma
estreita relação entre as flutuações de dopamina em subsegundos e a motivação. À
O caso. Como apenas um exemplo, as pessoas e outros animais muitas vezes são medida que os ratos realizavam a sequência de ações necessárias para obter
motivados a trabalhar por recompensas, mesmo quando pouco ou nada de recompensas, a dopamina subia cada vez mais, atingindo um pico assim que obtinham
surpreendente ocorre. Eles podem trabalhar cada vez mais à medida que se aproximam a recompensa (e caindo rapidamente conforme a consumiam). Mostramos que a
cada vez mais da recompensa (o valor aumenta à medida que as recompensas se dopamina se correlacionou fortemente com o valor instantâneo do estado, definido
aproximam). A questão é que aprendizado e motivação são conceitualmente, como a recompensa futura esperada, descontada pelo tempo esperado necessário para
recebê-la.
computacionalmente e comportamentalmente distintos, mas a dopamina parece fazer as duas coisas. Essa dinâmica rápida da dopamina também pode explicar os resultados da
A seguir, avalio criticamente as ideias atuais sobre como a dopamina é capaz de microdiálise, sem invocar sinais de dopamina separados em diferentes escalas de
atingir funções motivacionais e de aprendizado. Proponho um modelo atualizado, tempo. À medida que os animais experimentam mais recompensas, eles aumentam
baseado em três fatos principais: (i) a liberação de dopamina dos terminais não surge suas expectativas de recompensas futuras em cada etapa da sequência de tentativas.
simplesmente do disparo de células de dopamina, mas também pode ser controlada Em vez de um sinal de taxa de recompensa média de evolução lenta, a correlação entre
localmente; (ii) a dopamina afeta tanto a plasticidade sináptica quanto a excitabilidade dopamina e taxa de recompensa é melhor explicada como uma média, ao longo do
das células-alvo, com consequências distintas para o aprendizado e o desempenho, tempo prolongado de coleta de amostras de microdiálise, desses valores de estado de
respectivamente; e (iii) os efeitos da dopamina na plasticidade podem ser ativados ou rápida evolução.
desativados por elementos de circuito próximos. Juntos, esses recursos podem permitir
que os circuitos cerebrais alternem entre duas mensagens distintas de dopamina, para Essa interpretação do valor da liberação de dopamina mesolímbica é consistente
aprendizado e motivação, respectivamente. com os resultados da voltametria de outros grupos de pesquisa, que descobriram
repetidamente que a liberação de dopamina aumenta com o aumento da proximidade
da recompensa36-38 (Fig. 2). Este sinal motivacional não é inerentemente 'lento', mas
Existem sinais de dopamina fásicos e tônicos separados, com significados pode ser observado em uma escala contínua de escalas de tempo. Embora as rampas
diferentes?. Muitas vezes, argumenta-se que os papéis motivacionais e de de dopamina possam durar vários segundos quando um comportamento de abordagem
aprendizagem da dopamina ocorrem em diferentes escalas de tempo25. também dura vários segundos38, isso reflete o curso do tempo do comportamento, em
As células de dopamina disparam continuamente (tonicamente) em alguns picos por vez da dinâmica intrínseca da dopamina. A relação entre mesolímbico
segundo, com ocasionais breves rajadas (fásicas) ou pausas. Explosões,

788 Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience

© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

NaTure Neuroscience Perspectiva


a b c
Objetivo Objetivo
Clique Distal Imprensa Porto Alimentar – em
de teste curto de teste longo
12 proximal

10 Recompensa

Dopamina
(nM)
4

–2 10 segundos

–1 0 1 2 3 4 5 6 78 –4 ÿ2 0 2 4s

Tempo(s)

e 0
d Número de recompensas
1.2
1 nas últimas 10 tentativas

trabalho
valor
do Recompensa

deixa
0,75 0,8
8–10
6–7
3–5
0–2
ÿ0,4

ÿ0,8
normalizada
ÿDopamina

Decisão 0,4
0,5
de começar

normalizada
ÿDopamina

ÿ 0,4
0,25 0
ÿ
normalizada
ÿDopamina

0
0 ÿ0,4
Hora de recompensar Obter
ÿ4 ÿ2 0 2 4
começar
a trabalhar recompensa
ÿ4 ÿ2 0 2 4
Tempo desde side-in (s)
Tempo desde side-in (s)

Fig. 2 | Flutuações rápidas de dopamina sinalizam expectativas de recompensa em evolução dinâmica. a-c, a liberação de dopamina mesolímbica aumenta rapidamente à
medida que os ratos se aproximam das recompensas antecipadas. d, o valor, definido como estimativas descontadas temporariamente da recompensa futura, aumenta à medida que a
recompensa se aproxima. Indicações que indicam que uma recompensa é maior, mais próxima ou mais certa do que o esperado anteriormente causam saltos de valor. Esses saltos de
um momento para o outro são RPEs de diferença temporal. e, Subtrair as linhas de base pode confundir o valor e os sinais de RPE. Esquerda: a dopamina alinhada à sugestão preditiva
de recompensa (no tempo zero), com subtração convencional da linha de base, parece mostrar que a dopamina salta para níveis mais altos quando a recompensa é menos
esperada (marrom), lembrando um sinal RPE. Certo: uma apresentação alternativa dos mesmos dados, igualando os níveis de dopamina após a sugestão, mostraria, em vez disso,
que os níveis de dopamina pré-sugestão dependem da expectativa de recompensa (valor). Análises adicionais determinaram que a apresentação do lado direito está mais próxima
da verdade (ver detalhes na ref. 15). Painel a reproduzido, com permissão, da ref. 38, Macmillan Publishers Limited.; painel b reproduzido, com permissão, da ref. 37, Elsevier;
painéis c–e reproduzidos, com permissão, da ref. 15, Macmillan Publishers Limited.

a liberação de dopamina e o valor flutuante são visíveis tão rápido quanto a Ou esse significado precisa ser construído, por exemplo, comparando os níveis
técnica de registro permite, ou seja, em uma escala de tempo de aproximadamente de dopamina ao longo do tempo ou usando outros sinais coincidentes para
100 ms com eletrodos de voltametria aguda15. determinar qual maquinário celular acionar? Esta possibilidade é discutida mais
Flutuações rápidas de dopamina não apenas espelham a motivação, mas abaixo.
também impulsionam imediatamente o comportamento motivado. Respostas
fásicas maiores das células dopaminérgicas aos sinais de gatilho preveem A liberação de dopamina transmite a mesma informação que o disparo de
tempos de reação mais curtos naquele mesmo ensaio39. A estimulação células de mina de dopa?. A relação entre flutuações rápidas de dopamina e
optogenética das células de dopamina VTA torna os ratos mais propensos a valor motivacional parece estranha, dado que o disparo de células de dopamina
começar a trabalhar em nossa tarefa de recompensa probabilística15, como se se assemelha ao RPE. Além disso, alguns estudos relataram sinais de RPE na
tivessem uma expectativa maior de recompensa. A estimulação optogenética de liberação de dopamina mesolímbica43. É importante notar um desafio na
neurônios dopaminérgicos SNc, ou seus axônios no estriado dorsal, aumenta a probabilidade de movimento40,41.
interpretação de algumas formas de dados neurais.
Criticamente, esses efeitos comportamentais são aparentes dentro de algumas Sinais de valor e RPEs estão correlacionados entre si, o que não é surpreendente,
centenas de milissegundos do início da estimulação optogenética. A capacidade pois o RPE é geralmente definido como a mudança no valor de um momento para
de pistas preditivas de recompensa para aumentar a motivação parece ser o outro (RPE de 'diferença temporal'). Devido a essa correlação, é fundamental
mediada pela modulação dopaminérgica muito rápida da capacidade de excitação usar projetos experimentais e análises que diferenciem o valor das contas RPE.
dos neurônios espinhosos NAc42. Uma vez que a dopamina está mudando O problema é agravado quando se usa uma medida neural que depende de
rapidamente e essas mudanças de dopamina afetam a motivação rapidamente, mudanças de sinal relativas, em vez de absolutas. As análises de voltametria
as funções motivacionais da dopamina são melhor descritas como rápidas geralmente comparam a dopamina em algum ponto de interesse a uma época
(fásicas), não lentas (tônicas). 'base' anterior em cada tentativa (para remover componentes de sinal que não
Além disso, invocar escalas rápidas e lentas separadas não resolve por si só são dependentes de dopamina, incluindo carregamento de eletrodo em cada
o problema de decodificação enfrentado pelos neurônios com receptores de varredura de voltagem e desvio em uma escala de tempo de minutos). Mas
dopamina. Se a dopamina sinaliza o aprendizado, a modulação da plasticidade subtrair uma linha de base pode fazer com que um sinal de valor se assemelhe a
sináptica pareceria uma resposta celular apropriada. Mas os efeitos imediatos no um sinal RPE. Isso é o que observamos em nossos próprios dados de voltametria
comportamento motivado implicam efeitos imediatos no pico, por exemplo, por (Fig. 2e). Mudanças na expectativa de recompensa foram refletidas em mudanças
meio de mudanças rápidas na excitabilidade. na concentração de dopamina no início de cada tentativa, e essas mudanças
A dopamina pode ter esses dois efeitos pós-sinápticos (e mais), então uma são perdidas se alguém simplesmente assumir uma linha de base constante entre
determinada concentração de dopamina tem um significado específico? as tentativas15. Conclusões sobre

Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience 789


© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

Perspectiva NaTure Neuroscience

liberação de dopamina e codificação RPE, portanto, precisam ser vistos com cautela. As células colinérgicas estriatais estão, portanto, bem posicionadas para mudar
Esse perigo de interpretação de dados se aplica não apenas à tentativa de dinamicamente o significado de uma mensagem dopaminérgica multiplexada.
voltametria, mas a qualquer análise que dependa de mudanças relativas – incluindo Durante as pausas da NIC, o alívio de um bloqueio muscarínico sobre a plasticidade
potencialmente alguma ressonância magnética funcional e fotometria44. sináptica permitiria que a dopamina fosse usada para o aprendizado. Em outras
No entanto, ainda precisamos reconciliar a liberação de dopamina relacionada ao ocasiões, a liberação dos terminais de dopamina seria esculpida localmente para
valor no núcleo do NAc com a ausência consistente de aumento relacionado ao valor afetar o desempenho comportamental contínuo. Atualmente, esta sugestão é
pelos neurônios dopaminérgicos13, mesmo dentro da área VTA lateral que fornece especulativa e incompleta. Foi proposto que os CINs integram informações de
dopamina ao núcleo do NAc45. Um fator potencial é que as células de dopamina são muitos neurônios espinhosos circundantes para extrair sinais úteis em nível de rede,
geralmente registradas em animais com restrição de cabeça realizando tarefas de como entropia59,60. Mas não está claro que a dinâmica da atividade CIN possa ser
condicionamento clássico, enquanto a liberação de dopamina é tipicamente medida usada para gerar sinais de valor de dopamina61 ou para controlar sinais de
em animais sem restrição que se movem ativamente em seu ambiente. Propusemos aprendizagem de dopamina.
que a dopamina mesolímbica pode indicar especificamente o valor do 'trabalho'15,
ou seja, que reflete uma exigência de dedicar tempo e esforço para obter a A dopamina significa a mesma coisa em todo o prosencéfalo?.
recompensa. Consistente com isso, a dopamina aumenta com sinais que instruem o À medida que a ideia do RPE se consolidava, imaginava-se que a dopamina era um
movimento, mas não com sinais que instruem a imobilidade, mesmo quando indicam sinal global, transmitindo uma mensagem de erro ao longo dos alvos corticais
recompensa futura semelhante46. Se, como em muitas tarefas de condicionamento estriatais e frontais. Schultz enfatizou que células de minas de dopa de macaco em
clássico, não houver benefício no trabalho ativo, então as alterações dopaminérgicas VTA e SNc têm respostas muito semelhantes62.
que indicam o valor do trabalho podem ser menos aparentes. Estudos de células de dopamina identificadas também encontraram respostas
bastante homogêneas do tipo RPE em roedores, pelo menos para neurônios VTA
Ainda mais importante pode ser o fato de que a liberação de dopamina pode ser laterais em contextos clássicos de condicionamento13. No entanto, as células
controlada localmente nos próprios terminais e, assim, mostrar padrões espaço- dopaminérgicas são molecular e fisiologicamente diversas63-65, e agora há muitos
temporais independentes do pico do corpo celular. Por exemplo, a amígdala relatos de que elas mostram diversos padrões de disparo no comportamento de
basolateral pode influenciar a liberação de NAc dopamina mesmo quando o VTA está animais. Isso inclui aumentos fásicos no disparo de eventos aversivos66 e pistas de
inativado47. Por outro lado, a inativação da amígdala basolateral reduz a liberação gatilho67, que se ajustam mal à conta padrão de RPE.
de dopamina NAc e o comportamento motivado correspondente, aparentemente sem Muitas células de dopamina mostram uma resposta inicial de latência curta a
afetar o disparo de VTA48. Os terminais de dopamina têm receptores para uma eventos sensoriais que refletem surpresa ou 'alerta' mais do que codificação
variedade de neurotransmissores, incluindo glutamato, opioides e acetilcolina. específica de RPE68,69. Esse aspecto de alerta é mais proeminente no SNc69, onde
as células dopaminérgicas se projetam mais para o estriado dorsolateral (EDL)
Os receptores nicotínicos de acetilcolina permitem que os interneurônios colinérgicos sensório-motor45,63. Também foi relatado que subpopulações de células de
estriatais (CINs) controlem rapidamente a liberação de dopamina49,50. Embora dopamina SNc aumentam41 ou diminuem70 o disparo em conjunto com movimentos
tenha sido observado há muito tempo que o controle local da liberação de dopamina espontâneos, mesmo sem estímulos externos.
é potencialmente importante7,51, isso não foi incluído nas contas computacionais Vários grupos usaram fotometria de fibra e o indicador de cálcio GCaMP para
da função da dopamina. Eu proponho que a dinâmica de liberação de dopamina examinar a atividade em massa de subpopulações de neurônios dopaminérgicos71,72.
relacionada à codificação de valor surge em grande parte por meio do controle local, Células de dopamina que se projetam para o estriado dorsomedial (DMS) mostraram
mesmo quando o disparo de células de dopamina fornece importantes sinais atividade deprimida transitoriamente para choques breves inesperados, enquanto
semelhantes ao RPE para o aprendizado. aquelas que se projetam para DLS mostraram atividade aumentada71 mais
consistente com uma resposta de alerta. Respostas dopaminérgicas distintas em
Como a dopamina pode significar aprendizado e motivação sem confusão? Em diferentes sub-regiões do prosencéfalo também foram observadas usando GCaMP
princípio, um sinal de valor é suficiente para transmitir RPE também, uma vez que para examinar a atividade de axônios e terminais de dopamina40,72,73. Usando
RPEs de diferença temporal são simplesmente mudanças rápidas de valor (Fig. 2d). imagens de dois fótons em camundongos com restrição de cabeça, Howe e
Por exemplo, vias intracelulares distintas em neurônios-alvo podem ser diferentesmente Dombeck40 relataram atividade fásica da dopamina relacionada a movimentos
sensíveis à concentração absoluta de dopamina (representando valor) versus espontâneos. Isso foi observado predominantemente em axônios de dopamina
mudanças relativas rápidas na concentração (representando RPE). Este esquema individuais de SNc que terminavam no estriado dorsal, enquanto axônios de dopamina
parece plausível, dada a complexa modulação da dopamina da fisiologia do neurônio VTA em NAc responderam mais à entrega de recompensa. Outros também
espinhoso52 e sua sensibilidade a padrões temporais de concentração de cálcio53. encontraram atividade dopaminérgica relacionada à recompensa em NAc, com DMS,
No entanto, isso também parece um tanto redundante. Se um sinal semelhante ao em vez disso, mais ligada a ações contralaterais72 e a cauda posterior do estriado
RPE já existe no pico de células de dopamina, deve ser possível usá-lo em vez de responsiva a estímulos aversivos e novos74.
derivar novamente o RPE de um sinal de valor.
Medidas diretas da liberação de dopamina também revelam heterogeneidade
Para usar apropriadamente RPE distinto e sinais de valor, os circuitos receptores entre as sub-regiões30,75. Com a microdiálise, descobrimos que a dopa mina está
de dopamina podem mudar ativamente como eles interpretam a dopamina. correlacionada com o valor especificamente no núcleo NAc e no córtex frontal
Há evidências intrigantes de que a acetilcolina também pode desempenhar esse ventromedial e não em outras partes mediais do corpo estriado (revestimento NAc,
papel de comutação. Ao mesmo tempo em que as células de dopamina disparam DMS) ou córtex frontal. Isso é intrigante, pois parece mapear bem dois 'hotspots' de
rajadas de picos para sinais inesperados, os CINs mostram pausas breves (~ 150 codificação de valor consistentemente vistos em estudos de ressonância magnética
ms) no disparo, que não escalam com RPEs54. Essas pausas da NIC podem ser funcional humana76,77. Em particular, o sinal dependente do nível de oxigênio no
conduzidas por neurônios VTA GABAérgicos55 ou por células relacionadas à sangue (BOLD) de NAc, que tem uma relação próxima com a sinalização de
'surpresa' no tálamo intralaminar, e foi proposto que atuem como um sinal de dopamina78, aumenta com a antecipação de recompensa (valor) mais do que com
associabilidade promovendo o aprendizado56. Morris e Bergman sugeriram54 que RPE76.
as pausas colinérgicas definem janelas temporais para a plasticidade estriatal, Quer esses padrões espaciais de liberação de dopamina surjam do disparo de
durante as quais a dopamina pode ser usada como um sinal de aprendizado. A subpopulações distintas de células de dopamina, do controle local da liberação de
plasticidade dependente de dopamina é continuamente suprimida por mecanismos, dopamina ou de ambos, eles desafiam a ideia de uma mensagem global de dopamina.
incluindo receptores muscarínicos M4 em neurônios estriatais de via direta57. Pode-se concluir que existem muitas funções diferentes da dopamina, com (por
Modelos de sinalização intracelular sugerem que durante pausas de NIC, a ausência exemplo) dopamina no movimento de sinalização do estriado dorsal e dopamina na
de ligação de M4 pode atuar sinergicamente com surtos fásicos de dopamina para recompensa de sinalização do estriado ventral40. No entanto, sou a favor de outra
aumentar a ativação de PKA58, promovendo assim alteração sináptica. abordagem conceitual.
Diferentes sub-regiões estriatais recebem informações de diferentes células corticais.

790 Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience

© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

NaTure Neuroscience Perspectiva


regiões e assim estarão processando diferentes tipos de informação. No entanto, da distribuição do tempo de reação, que é exatamente o que se observa quando
cada sub-região estriatal compartilha uma arquitetura de microcircuito comum, a anfetamina é infundida no corpo estriado sensório-motor20.
incluindo neurônios espinhosos portadores de receptores D1 versus D2 Em vez de limites fixos, os dados comportamentais e neurais podem ser mais
separados79, CINs e assim por diante. Embora seja comum referir-se a várias adequados se os limites diminuírem com o tempo, como se as decisões se
sub-regiões estriatais (por exemplo, DLS, DMS, NAc core) como se fossem tornassem cada vez mais urgentes. A saída dos gânglios da base foi proposta
áreas distintas, não há limites anatômicos nítidos entre elas (a camada NAc é para fornecer um sinal de urgência em evolução dinâmica que revigora os
um pouco mais distinta neuroquimicamente). Em vez disso, há gradientes suaves mecanismos de seleção no córtex93. A urgência também é maior quando as
na densidade do receptor, proporções de interneurônios, etc., que parecem mais recompensas futuras estão mais próximas no tempo, tornando esse conceito
ajustes nos parâmetros de um algoritmo computacional compartilhado. Dada semelhante à codificação de valor, papel ativador da dopamina.
essa arquitetura comum, podemos descrever uma função de dopamina comum, Esse papel de ativação é suficiente para descrever os efeitos moduladores
abstraída da informação específica sendo tratada por cada sub-região? do desempenho da dopamina estriatal? Isso está relacionado à questão de longa
data sobre se os circuitos dos gânglios da base selecionam diretamente entre as
ações aprendidas80 ou apenas revigoram as escolhas feitas em outro lugar93,94.
Dopamina estriatal e a alocação de recursos limitados. Proponho que uma Existem pelo menos duas maneiras pelas quais a dopamina pode parecer ter um
variedade de efeitos díspares da dopamina no comportamento contínuo pode efeito mais "direcional". A primeira é quando a dopamina age dentro de uma
ser entendida como modulação das decisões de alocação de recursos. sub-região do cérebro que processa informações inerentemente direcionais. Os
Especificamente, a dopamina fornece estimativas de quanto vale a pena gastar circuitos dos gânglios da base têm um papel importante e parcialmente
um recurso interno limitado, com o recurso particular diferindo entre as sub- lateralizado, orientando e abordando recompensas potenciais. O caudado primata
regiões estriatais. Para o estriado motor (aproximadamente DLS), o recurso é o (aproximadamente DMS) está envolvido na condução dos movimentos oculares
movimento, que é limitado porque movimentar custa energia e porque muitas em direção aos campos espaciais contralaterais95. Um sinal dopaminérgico
ações são incompatíveis entre si80. Aumentar a dopamina torna mais provável indicando que algo no espaço contralateral vale a pena orientar pode explicar a
que um animal decida que vale a pena gastar energia para se mover ou se mover correlação observada entre a atividade dopaminérgica no DMS e os movimentos
mais rápido6,40,81. Observe que um sinal de dopamina que codifica 'movimento contralaterais72, bem como o comportamento rotacional produzido pelas
vale a pena' produzirá correlações entre dopamina e movimento, mesmo sem a manipulações da dopamina96. Uma segunda influência direcional da dopamina
codificação de dopamina 'movimento' per se. é aparente quando as lesões (bilaterais) de dopamina direcionam os ratos para
escolhas de baixo esforço e baixa recompensa, em vez de alternativas de alto
Para estriado cognitivo (aproximadamente DMS), os recursos são processos esforço e alta recompensa97.
cognitivos, incluindo atenção (que é de capacidade limitada por definição82) e Isso pode refletir o fato de que algumas decisões são mais seriais do que
memória de trabalho83. Sem dopamina, sinais externos salientes que paralelas, com ratos (e humanos) avaliando opções uma de cada vez98.
normalmente provocam movimentos de orientação são negligenciados, como se Nesses contextos de decisão, a dopamina ainda pode desempenhar um papel
fossem considerados menos dignos de atenção3 . Além disso, organizar fundamentalmente ativador ao transmitir o valor da opção atualmente considerada,
deliberadamente os processos de controle cognitivo é trabalhoso (caro84). A que pode ser aceita ou não24.
dopamina, principalmente no DMS85, tem papel fundamental na decisão se vale Animais ativos tomam decisões em vários níveis, muitas vezes em altas
a pena fazer esse esforço86,87. Isso pode incluir a possibilidade de empregar taxas. Além de pensar em decisões individuais, pode ser útil considerar uma
trajetória geral através de uma sequência de estados (Fig. 1).
estratégias de decisão mais cognitivamente exigentes e deliberativas (baseadas em modelos)88.
Para estriado motivacional (aproximadamente NAc), um recurso limitado Ao facilitar as transições de um estado para o outro, a dopamina pode acelerar o
chave pode ser o tempo do animal. A dopamina mesolímbica não é necessária fluxo ao longo das trajetórias aprendidas99. Isso pode estar relacionado à
quando os animais realizam uma ação simples e fixa para obter recompensas importante influência da dopamina sobre o tempo do comportamento44,100 .
rapidamente89. Mas muitas formas de recompensa só podem ser obtidas por Um dos principais desafios para trabalhos futuros é obter uma compreensão
meio de trabalho prolongado: sequências extensas de ações não recompensadas, mais profunda de como esses efeitos da dopamina sobre o comportamento
como no forrageamento. Escolher se engajar no trabalho significa que outras contínuo surgem mecanicamente, alterando o processamento de informações
formas benéficas de passar o tempo devem ser abandonadas. A alta dopamina dentro de células individuais, microcircuitos e loops de gânglios corticais-basais em grande esc
mesolímbica indica que vale a pena engajar-se em um trabalho prolongado e Além disso, enfatizei os papéis computacionais comuns da dopamina em uma
com esforço, mas, à medida que a dopamina diminui, os animais não se variedade de alvos estriatais, mas negligenciei os alcatrões corticais, e resta
incomodam e podem, em vez disso, apenas se preparar para dormir90. saber se as funções da dopamina em ambas as estruturas podem ser descritas
Dentro de cada circuito de alça corticoestriatal, a contribuição da dopamina dentro da mesma estrutura.
para o comportamento contínuo é, portanto, tanto econômica (relacionada à
alocação de recursos) quanto motivacional (se vale a pena gastar recursos)81. Conclusão
Esses circuitos não são totalmente independentes, mas têm uma organização Uma descrição adequada da dopamina explicaria como a dopamina pode
hierárquica e espiralada: as porções mais ventrais do corpo estriado influenciam sinalizar tanto o aprendizado quanto a motivação nas mesmas escalas de tempo
as células dopaminérgicas que se projetam para as porções mais dorsais5,91. rápidas sem confusão. Isso explicaria por que a liberação de dopamina em alvos-
Dessa forma, as decisões de se engajar no trabalho também podem ajudar a chave co-varia com a expectativa de recompensa, embora o disparo de células
revigorar os movimentos específicos e mais breves necessários. Mas, no geral, de dopamina não o faça. E forneceria uma conta computacional unificada das
a dopamina fornece sinais de ativação – aumentando a probabilidade de que ações da dopamina em todo o estriado e em outros lugares que explica os efeitos
alguma decisão seja tomada – em vez de sinais direcionais especificando como comportamentais díspares no movimento, cognição e tempo. Algumas ideias
os recursos devem ser gastos5 . específicas apresentadas aqui são especulativas, mas destinam-se a revigorar
discussões renovadas, modelagem e novos experimentos incisivos.
Qual é o papel computacional da dopamina quando as decisões são
tomadas?. Uma maneira de pensar sobre esse papel de ativação é em termos
de limites de tomada de decisão. Em certos modelos matemáticos, os processos Recebido: 5 de outubro de 2017; Aceito: 30 de março de 2018;
de decisão aumentam até atingir um nível limite, quando o sistema se compromete Publicado online: 14 de maio de 2018
com uma ação92. Dopamina mais alta seria equivalente a uma distância até o
limiar mais baixa, de modo que as decisões são tomadas mais rapidamente.
Referências
Essa ideia é simplista, mas faz previsões quantitativas que foram confirmadas.
1. Ungerstedt, U. Adipsia e afagia após 6-hidroxidopamina induzida
A redução dos limiares de movimento causaria uma mudança específica na forma degeneração do sistema dopaminérgico nigro-estriatal. Acta Physiol. Escanear.
Supl. 367, 95-122 (1971).

Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience 791


© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

Perspectiva NaTure Neuroscience

2. Sacks, O. Despertar. (Duckworth, Londres, 1973). 33. Cohen, JY, Amoroso, MW & Uchida, N. Os neurônios serotoninérgicos sinalizam recompensa
3. Marshall, JF, Levitan, D. & Stricker, EM Restauração induzida por ativação de funções sensório- e punição em várias escalas de tempo. eLife 4, e06346 (2015).
motoras em ratos com lesões cerebrais de depleção de dopamina. 34. Floresco, SB, West, AR, Ash, B., Moore, H. & Grace, AA A modulação aferente da fring de
J. Comp. Physiol. Psicol. 90, 536-546 (1976). neurônios dopaminérgicos regula diferencialmente a transmissão tônica e fásica da
4. Berridge, KC, Venier, IL & Robinson, TE Análise da reatividade do sabor da afagia induzida por 6- dopamina. Nat. Neurosci. 6, 968–973 (2003).
hidroxidopamina: implicações para as hipóteses de excitação e anedonia da função 35. Grace, AA Desregulação do sistema de dopamina na fisiopatologia da esquizofrenia e depressão.
da dopamina. Behav. Neurosci. 103, 36–45 (1989). Nat. Rev. Neurosci. 17, 524-532 (2016).
36. Phillips, PE, Stuber, GD, Heien, ML, Wightman, RM & Carelli, R.
5. Salamone, JD & Correa, M. As misteriosas funções motivacionais da dopamina mesolímbica. M. A liberação de dopamina em subsegundos promove a busca por cocaína. Natureza 422,
Neuron 76, 470-485 (2012). 614-618 (2003).
6. Mazzoni, P., Hristova, A. & Krakauer, JW Por que não nos movemos mais rápido? 37. Wassum, KM, Ostlund, SB & Maidment, NT Fasico mesolímbico
doença de Parkinson, vigor do movimento e motivação implícita. J. Neurosci. 27, 7105–7116 a sinalização de dopamina precede e prediz o desempenho de uma tarefa de sequência de
(2007). ação auto-iniciada. Biol. Psychiatry 71, 846–854 (2012).
7. Schultz, W. Respostas dos neurônios dopaminérgicos do mesencéfalo a estímulos de gatilho 38. Howe, MW, Tierney, PL, Sandberg, SG, Phillips, PE & Graybiel, A.
comportamental no macaco. J. Neurophysiol. 56, 1439-1461 (1986). M. Sinalização prolongada de dopamina no corpo estriado sinaliza proximidade e valor de
8. Schultz, W. & Romo, R. Neurônios dopaminérgicos do mesencéfalo do macaco: recompensas distantes. Nature 500, 575–579 (2013).
contingências de respostas a estímulos que provocam reações comportamentais 39. Satoh, T., Nakai, S., Sato, T. & Kimura, M. Codificação correlacionada de
imediatas. J. Neurophysiol. 63, 607–624 (1990). motivação e resultado da decisão pelos neurônios dopaminérgicos. J. Neurosci. 23, 9913–9923
9. Montague, PR, Dayan, P. & Sejnowski, TJ Uma estrutura para (2003).
sistemas de dopamina mesencefálicos baseados na aprendizagem hebbiana preditiva. 40. Howe, MW & Dombeck, DA Sinalização rápida em axônios dopaminérgicos distintos durante a
J. Neurosci. 16, 1936–1947 (1996). locomoção e recompensa. Nature 535, 505–510 (2016). 41. da Silva, JA, Tecuapetla,
10. Schultz, W., Apicella, P. & Ljungberg, T. Respostas de neurônios de dopamina de macaco para F., Paixão, V. & Costa, RM A atividade do neurônio dopaminérgico antes do início da ação bloqueia e
recompensar e condicionar estímulos durante etapas sucessivas de aprendizagem de revigora os movimentos futuros.
uma tarefa de resposta atrasada. J. Neurosci. 13, 900-913 (1993). Nature 554, 244–248 (2018). 42. du
11. Sutton, RS & Barto, AG Aprendizagem por Reforço: uma Introdução. (MIT Hofmann, J. & Nicola, SM A dopamina revigora a busca de recompensas ao promover a excitação
Imprensa: Cambridge, Massachusetts, 1998). evocada por pistas no núcleo accumbens. J. Neurosci. 34, 14349–14364 (2014).
12. Cohen, JY, Haesler, S., Vong, L., Lowell, BB & Uchida, N. Sinais específicos do tipo de neurônio
para recompensa e punição na área tegmental ventral. 43. Hart, AS, Rutledge, RB, Glimcher, PW & Phillips, PE A liberação de dopamina fásica no
Nature 482, 85–88 (2012). núcleo accumbens do rato codifica simetricamente um termo de erro de predição
13. Eshel, N., Tian, J., Bukwich, M. & Uchida, N. Os neurônios dopaminérgicos compartilham de recompensa. J. Neurosci. 34, 698-704 (2014).
função de resposta comum para erro de previsão de recompensa. Nat. Neurosci. 19, 479-486
(2016). 44. Soares, S., Atallah, BV & Paton, JJ Controle dos neurônios dopaminérgicos do mesencéfalo
14. Steinberg, EE et al. Uma ligação causal entre erros de previsão, neurônios de dopamina e julgamento do tempo. Ciência 354, 1273–1277 (2016).
aprendizado. Nat. Neurosci. 16, 966-973 (2013). 45. Ikemoto, S. Circuitos de recompensa de dopamina: dois sistemas de projeção do mesencéfalo
15. Hamid, AA et al. A dopamina mesolímbica sinaliza o valor do trabalho. Nat. ventral ao complexo do núcleo accumbens-tubérculo olfatório.
Neurosci. 19, 117–126 (2016). Cérebro Res. Rev. 56, 27–78 (2007).
16. Yagishita, S. et al. Uma janela de tempo crítica para as ações da dopamina na plasticidade 46. Syed, EC et al. A iniciação da ação molda a codificação mesolímbica da dopamina de recompensas
estrutural das espinhas dendríticas. Ciência 345, 1616–1620 (2014). futuras. Nat. Neurosci. 19, 34–36 (2016).
17. Berke, JD & Hyman, SE Addiction, dopamina e os mecanismos moleculares da memória. 47. Floresco, SB, Yang, CR, Phillips, AG & Blaha, CD Basolateral
Neuron 25, 515-532 (2000). A estimulação da amígdala evoca o efluxo de dopamina dependente do receptor de glutamato no
18. Beeler, JA Um papel para a aprendizagem mediada por dopamina na fisiopatologia e tratamento da núcleo accumbens do rato anestesiado. EUR. J. Neurosci. 10, 1241–1251 (1998).
doença de Parkinson. Cell Rep. 2, 1747–1761 (2012).
19. Sábio, RA Dopamina, aprendizado e motivação. Nat. Rev. Neurosci. 5, 483-494 (2004). 48. Jones, JL et al. A amígdala basolateral modula a liberação terminal de dopamina no núcleo
accumbens e a resposta condicionada. Biol. Psiquiatria 67, 737–744 (2010).
20. Leventhal, DK et al. Efeitos dissociáveis da dopamina na aprendizagem e
desempenho dentro do corpo estriado sensório-motor. Basal Ganglia 4, 43–54 (2014). 49. Cachope, R. A ativação seletiva de interneurônios colinérgicos aumenta
21. Wyvell, CL & Berridge, KC A anfetamina intra-accumbens aumenta a saliência do incentivo liberação de dopamina fásica accumbal: definindo o tom para o processamento de recompensa.
condicionado da recompensa da sacarose: aumento da Cell Rep. 2(1), 33–41 (2012).
recompense “querer” sem aumentar “gostar” ou reforço de resposta. 50. Trelfell, S. et al. A liberação de dopamina estriatal é desencadeada por
J. Neurosci. 20, 8122-8130 (2000). atividade em interneurônios colinérgicos. Neuron 75, 58-64 (2012).
22. Cagniard, B. et al. A dopamina aumenta o desempenho na ausência de novos 51. Grace, AA Liberação de dopamina fásica versus tônica e a modulação da responsividade do
aprendizado. Neuron 51, 541-547 (2006). sistema de dopamina: uma hipótese para a etiologia da esquizofrenia.
23. Shiner, T. et al. Dopamina e desempenho em uma tarefa de aprendizado por reforço: evidências Neuroscience 41, 1–24 (1991).
da doença de Parkinson. Cérebro 135, 1871-1883 (2012). 52. Moyer, JT, Wolf, JA & Finkel, LH Efeitos da modulação dopaminérgica nas propriedades integrativas
24. McClure, SM, Daw, ND & Montague, PR Um substrato computacional para saliência de incentivo. do neurônio espinhoso médio estriado ventral. j.
Trends Neurosci. 26, 423–428 (2003). Neurofisiológico. 98, 3731–3748 (2007).
25. Schultz, W. Múltiplas funções da dopamina em diferentes cursos de tempo. Annu. 53. Jÿdrzejewska-Szmek, J., Damodaran, S., Dorman, DB & Blackwell, KT
Rev. Neurosci. 30, 259-288 (2007). A dinâmica do cálcio prevê a direção da plasticidade sináptica nos neurônios de projeção
26. Gonon, F. et al. Geometria e cinética da transmissão dopaminérgica no corpo estriado de ratos e em espinhosa do estriatal. EUR. J. Neurosci. 45, 1044–1056 (2017).
camundongos sem o transportador de dopamina. Prog. Cérebro Res. 125, 291–302 (2000). 54. Morris, G., Arkadir, D., Nevet, A., Vaadia, E. & Bergman, H. Mensagens coincidentes, mas
distintas, da dopamina do mesencéfalo e dos neurônios tonicamente ativos do estriado.
27. Aragona, BJ et al. O aumento preferencial da transmissão de dopamina dentro do núcleo Neuron 43, 133-143 (2004).
accumbens pela cocaína é atribuível a um aumento direto nos eventos de liberação fásica de 55. Brown, MT et al. Projeções GABA da área tegmental ventral pausam
dopamina. J. Neurosci. 28, 8821–8831 (2008). interneurônios colinérgicos acumulativos para melhorar a aprendizagem associativa. Nature
492, 452–456 (2012).
28. Owesson-White, CA et al. Fontes que contribuem para a média 56. Yamanaka, K. et al. Funções dos núcleos parafasciculares centromedianos de
concentração extracelular de dopamina no núcleo accumbens. j. tálamo e interneurônios colinérgicos no estriado dorsal na aprendizagem associativa de eventos
Neurochem. 121, 252–262 (2012). ambientais. J. Transm. Neural. (Viena) 125, 501–513 (2018).
29. Yapo, C. et al. Detecção de dopamina fásica por neurônios espinhosos médios estriatais D1 e D2. J.
Physiol. (Londres.) 595, 7451–7475 (2017). 57. Shen, W. et al. A sinalização do receptor muscarínico M4 melhora o estriatal
30. Freed, CR & Yamamoto, BK Metabolismo cerebral regional da dopamina: um marcador para a déficits de plasticidade em modelos de discinesia induzida por L-DOPA. Neuron 88, 762-773
velocidade, direção e postura de animais em movimento. Science 229, 62-65 (1985). (2015).
58. Nair, AG, Gutierrez-Arenas, O., Eriksson, O., Vincent, P. & Hellgren Kotaleski, J. Sensing
31. Niv, Y., Daw, ND, Joel, D. & Dayan, P. Dopamina tônica: custos de oportunidade e controle do vigor sinais de recompensa positivos versus negativos através de GPCRs acoplados a
da resposta. Psychopharmacology (Berl.) 191, 507–520 (2007). adenilil ciclase em neurônios espinhosos médios estriatais de via direta e indireta. J.
Neurosci. 35, 14017–14030 (2015).
32. Strecker, RE, Steinfels, GF & Jacobs, BL Atividade da unidade dopaminérgica em gatos que se 59. Stocco, A. Entropia baseada em acetilcolina na seleção de resposta: um modelo de como os
movem livremente: falta de relação com alimentação, saciedade e injeções de glicose. interneurônios estriatais modulam a exploração, exploração e variabilidade de resposta na
Cérebro Res. 260, 317–321 (1983). tomada de decisões. Frente. Neurosci. 6, 18 (2012).

792 Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience

© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.
Machine Translated by Google

NaTure Neuroscience Perspectiva


60. Franklin, NT & Frank, MJ Um circuito de feedback colinérgico para regular 83. Chatham, CH, Frank, MJ & Badre, D. Gating de saída corticostriatal durante a seleção da
incerteza da população estriatal e otimizar o aprendizado por reforço. eLife 4, e12029 (2015). memória de trabalho. Neuron 81, 930-942 (2014).
84. Shenhav, A., Botvinick, MM & Cohen, JD Te valor esperado de controle: uma teoria integrativa da
61. Nougaret, S. & Ravel, S. Modulação de neurônios tonicamente ativos do função do córtex cingulado anterior. Neuron 79, 217-240 (2013).
macaco estriado por eventos que carregam diferentes informações de força e recompensa.
J. Neurosci. 35, 15214–15226 (2015). 85. Aarts, E. et al. A dopamina estriatal medeia a interface entre
62. Schultz, W. Sinal de recompensa preditivo de neurônios dopaminérgicos. J. Neurophysiol. controle motivacional e cognitivo em humanos: evidências de imagens genéticas.
80, 1–27 (1998). Neuropsicofarmacologia 35, 1943-1951 (2010).
63. Lammel, S. et al. Propriedades únicas dos neurônios mesoprefrontais dentro de um sistema 86. Westbrook, A. & Braver, TS A dopamina tem dupla função em motivar o esforço cognitivo. Neuron
duplo de dopamina mesocorticolímbica. Neuron 57, 760-773 (2008). 89, 695-710 (2016).
64. Poulin, JF et al. Definindo a diversidade de neurônios dopaminérgicos do mesencéfalo por 87. Manohar, SG et al. A recompensa paga o custo da redução de ruído no motor e
perfil de expressão gênica de célula única. Cell Rep. 9, 930–943 (2014). controle cognitivo. atual Biol. 25, 1707–1716 (2015).
65. Morales, M. & Margolis, EB Área tegmental ventral: heterogeneidade celular, conectividade e 88. Wunderlich, K., Smittenaar, P. & Dolan, RJ A dopamina aumenta
comportamento. Nat. Rev. Neurosci. 18, 73–85 (2017). Comportamento baseado em modelo sobre escolha livre de modelo. Neuron 75, 418-424 (2012).
66. Matsumoto, M. & Hikosaka, O. Dois tipos de neurônios dopaminérgicos transmitem distintamente 89. Nicola, SM Hipótese da abordagem flexível: unificação de esforços e
sinais motivacionais positivos e negativos. Nature 459, 837–841 (2009). hipóteses de resposta a estímulos para o papel da dopamina do núcleo accumbens na ativação
do comportamento de busca de recompensa. J. Neurosci. 30, 16585–16600 (2010).
67. Pasquereau, B. & Turner, RS Os neurônios da dopamina codificam erros na previsão da 90. Eban-Rothschild, A., Rothschild, G., Giardino, WJ, Jones, JR & de Lecea, L. VTA neurônios
ocorrência do gatilho do movimento. J. Neurophysiol. 113, 1110–1123 (2015). dopaminérgicos regulam comportamentos sono-vigília etologicamente relevantes. Nat.
Neurosci. 19, 1356–1366 (2016).
68. Redgrave, P., Prescott, TJ & Gurney, K. A resposta de dopamina de latência curta é muito curta 91. Haber, SN, Fudge, JL & McFarland, NR As vias estriatonigroestriatais em primatas formam uma
para sinalizar erro de recompensa? Trends Neurosci. 22, 146-151 (1999). espiral ascendente desde a concha até o corpo estriado dorsolateral. J. Neurosci. 20, 2369–
2382 (2000).
69. Bromberg-Martin, ES, Matsumoto, M. & Hikosaka, O. Dopamina no controle motivacional: 92. Reddi, BAJ & Carpenter, RHS A influência da urgência na decisão
gratificante, aversivo e alerta. Neuron 68, 815-834 (2010). tempo. Nat. Neurosci. 3, 827–830 (2000).
93. Tura, D. & Cisek, P. Os gânglios da base não selecionam alvos de alcance, mas controlam a
70. Dodson, PD et al. Representação do movimento espontâneo por urgência do compromisso. Neuron 95, 1160–1170.e5 (2017).
Os neurônios dopaminérgicos são seletivos para o tipo de célula e interrompidos no parkinsonismo. 94. Turner, RS & Desmurget, M. Contribuições dos gânglios da base para o controle motor: um
Proc. Nacional Acad. ciência EUA 113, E2180–E2188 (2016). tutor vigoroso. atual Opin. Neurobiol. 20, 704-716 (2010).
71. Lerner, TN et al. As análises do cérebro intacto revelam informações distintas transportadas pelos 95. Hikosaka, O., Nakamura, K. & Nakahara, H. Os gânglios da base orientam os olhos para a
subcircuitos de dopamina SNc. Cela 162, 635–647 (2015). recompensa. J. Neurophysiol. 95, 567-584 (2006).
72. Parker, NF et al. Codificação de recompensa e escolha em terminais de 96. Kelly, PH & Moore, KE Mesolímbico neurônios dopaminérgicos no modelo rotacional da
Os neurônios dopaminérgicos do mesencéfalo dependem do alvo estriatal. Nat. Neurosci. 19, função nigroestriatal. Nature 263, 695-696 (1976).
845-854 (2016). 97. Cousins, MS, Atherton, A., Turner, L. & Salamone, JD Nucleus
73. Kim, CK et al. Medição rápida simultânea da dinâmica do circuito em vários locais do a depleção de dopamina accumbens altera a alocação de resposta relativa em uma tarefa
cérebro de mamíferos. Nat. Métodos 13, 325–328 (2016). de custo/benefício de labirinto em T. Behav. Cérebro Res. 74, 189–197 (1996).
98. Redish, AD Vicarious tentativa e erro. Nat. Rev. Neurosci. 17, 147–159
74. Menegas, W., Babayan, BM, Uchida, N. & Watabe-Uchida, M. Inicialização oposta a novas pistas (2016).
na sinalização de dopamina no estriado ventral e posterior em camundongos. eLife 6, e21886 99. Rabinovich, MI, Huerta, R., Varona, P. & Afraimovich, VS Transient
(2017). dinâmica cognitiva, metaestabilidade e tomada de decisão. Computação PLOS. Biol. 4, e1000072
75. Brown, HD, McCutcheon, JE, Cone, JJ, Ragozzino, ME & Roitman, MF Recompensa alimentar (2008).
primária e estímulos preditivos de recompensa evocam diferentes padrões de sinalização 100. Merchant, H., Harrington, DL & Meck, WH Base neural do
fásica da dopamina em todo o corpo estriado. EUR. j. percepção e estimativa do tempo. Annu. Rev. Neurosci. 36, 313–336 (2013).
Neurosci. 34, 1997–2006 (2011).
76. Knutson, B., & Greer, SM Afect antecipatório: correlatos neurais e consequências para
Agradecimentos Agradeço
a escolha. Fil. Trans. R. Soc. Lond. B 363, 3771–3786 (2008).
aos muitos colegas que forneceram comentários perspicazes sobre rascunhos de textos
anteriores, incluindo K. Berridge, P. Dayan, B. Knutson, J. Beeler, P. Redgrave, J.
77. Bartra, O., McGuire, JT & Kable, JW Te sistema de avaliação: uma meta-análise baseada em
Lisman e J. Goldberg. Lamento que as limitações de espaço tenham impedido a
coordenadas de experimentos BOLD fMRI examinando correlatos neurais de valor
discussão de muitos estudos anteriores importantes. Apoio essencial foi fornecido pelo
subjetivo. Neuroimage 76, 412–427 (2013). Instituto Nacional de Distúrbios Neurológicos e Derrame, Instituto Nacional de Saúde Mental
78. Ferenczi, EA et al. Regulação cortical pré-frontal da dinâmica do circuito cerebral e
e Instituto Nacional de Abuso de Drogas.
comportamento relacionado à recompensa. Ciência 351, aac9698 (2016).
79. Bertran-Gonzalez, J. et al. Padrões opostos de ativação de sinalização em
neurônios estriatais que expressam os receptores de dopamina D1 e D2 em resposta à Interesses conflitantes O autor
cocaína e ao haloperidol. J. Neurosci. 28, 5671-5685 (2008). declara não haver interesses conflitantes.
80. Redgrave, P., Prescott, TJ & Gurney, K. Os gânglios da base: uma solução vertebrada para o
problema de seleção? Neuroscience 89, 1009-1023 (1999). Informações adicionais Informações
81. Beeler, JA, Frazier, CR, & Zhuang, X. Colocando o desejo em um orçamento: sobre reimpressões e permissões estão disponíveis em www.nature.com/reprints.
dopamina e gasto energético, conciliando recompensa e recursos. Frente.
A correspondência deve ser endereçada a JDB
integr. Neurosci. 6, 49 (2012).
82. Anderson, BA et al. O papel da dopamina na atenção baseada em valor Nota do editor: A Springer Nature permanece neutra em relação a reivindicações jurisdicionais em
orientando. atual Biol. 26, 550–555 (2016). mapas publicados e afiliações institucionais.

Natureza Neurociência | VOL 21 | JUNHO 2018 | 787–793 | www.nature.com/natureneuroscience 793


© 2018 Nature America Inc., parte da Springer Nature. Todos os direitos reservados.

Você também pode gostar