Você está na página 1de 12

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Processos Comportamentais 127 (2016) 97–108

Listas de conteúdos disponíveis emScience Direct

Processos Comportamentais

Página inicial do jornal :www. Els ev ier . com/ l oc ate / behavp r oc

Escolha social para um: sobre a racionalidade das decisões intertemporais


Fábio Paglieri
Laboratório de Agentes Orientados a Objetivos (GOAL), ISTC-CNR, Via San Martino della Battaglia 44, 00185 Roma, Itália

artigoinfo abstrato

Historia do artigo: Diante de uma escolha intertemporal entre uma recompensa menor de curto prazo e um prêmio maior de longo prazo, optar
Recebido em 2 de dezembro de 2015 Recebido em pelo último é sempre indicativo de tolerância a atrasos? E a tolerância ao atraso deve sempre ser considerada uma
forma revisada em 14 de abril de 2016 Aceito em 18 de
manifestação de autocontrole e, portanto, uma solução racional para dilemas intertemporais? Argumento a favor de uma
abril de 2016
resposta negativa para ambas as questões, com base em evidências coletadas na literatura de desconto de atraso. Isso
Disponível online em 23 de abril de 2016
destaca a necessidade de uma compreensão diferenciada da racionalidade na escolha intertemporal, para capturar também
situações em que a espera énãoa estratégia ótima. Este artigo sugere que tal entendimento é fomentado pela adoção de
Palavras-chave:
teoria da escolha socialcomo uma estrutura promissora para modelar a tomada de decisão intertemporal. Alguns resultados
escolha intertemporal
preliminares desta abordagem são discutidos, e seu potencial é comparado com um modelo formal muito mais estudado
Auto-controle
Atraso para a escolha intertemporal, ou seja, a teoria dos jogos.
Racionalidade © 2016 Elsevier BV Todos os direitos reservados.
Teoria da escolha social
Teoria do jogo

Conteúdo

1. Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
2. Quando se recusar a esperar nada tem a ver com aversão ao atraso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3. Quando a tolerância de atraso não é a melhor opção. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4. Um é uma multidão: ferramentas sociais para escolha individual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.1. Jogos intrapessoais: potencialidades e limites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.2. Teoria da escolha social individual: a importância do caráter temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5. Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

1. Introdução ções sobre a racionalidade diacrônica (Hájek, 2005; Ross e outros, 2007;
Holton, 2009; Paglieri, 2012). Dado que o tomador de decisão
Imagine que você está pensando em comprar um vestido novo caro, um experimenta um conflito entre as preferências presentes e os objetivos
carro caro ou um apartamento em algum lugar chique. Ao refletir sobre isso, futuros (esperados), qual é a coisa certa a fazer? Você deve se entregar
você provavelmente também levará em consideração se é melhor investir ao consumismo que deseja atualmente ou deve dar prioridade às
seu dinheiro para comprar aquele bem agora ou guardá-lo para algum preocupações futuras? O dilema também não se limita às escolhas de
propósito futuro, por exemplo, pagar mensalidades para os filhos que você compra e investimento: sacrificar o fim de semana para preparar um
ainda não tem, aproveitar sua aposentadoria quando mais velho, ou talvez exame difícil em um mês ou apenas aproveitar dois dias na casa de
apenas economize o suficiente para pagar as férias de verão que você praia com os amigos? Você deveria ceder aos seus desejos por uma
sempre quis e nunca poderia ter. Decisões semelhantes são referidas na refeição luxuosa em seu restaurante favorito hoje à noite, ou deveria
literatura econômica e neuropsicológica comoescolhas intertemporais ( permanecer firme e seguir sua dieta para obter algum ganho a longo
Rachlin, 2000; Ainslie, 2001; Frederick et al., 2002; Ler, 2004; Soman et al., prazo?
2005; Berns e outros, 2007; Ariely, 2008; Kalenscher e Pennartz, 2008; Na vida cotidiana, a sabedoria recebida é que ficar de olho no futuro é
Madden e Bickel, 2010), e têm atraído interesse filosófico por suas melhor do que apenas focar no presente. Transferida em configurações de
implicações laboratório, essa visão implicaria que uma escolha pela recompensa maior e
posterior (LL) é indicativa de autocontrole, enquanto a opção pelo prêmio
menor e mais cedo (SS) é uma manifestação de impulsividade. Felizmente,
Endereço de email:fabio.paglieri@istc.cnr.it os estudiosos estão plenamente conscientes de que

http://dx.doi.org/10.1016/j.beproc.2016.04.011 0376-6357/©
2016 Elsevier BV Todos os direitos reservados.
98 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

autocontrole (Rachlin, 2000) e impulsividade (Evenden, 1999; Madden e Bickel, ser também o maior, e buscar o prêmio maior é uma resposta prepotente na
2010) são fenômenos complexos e multifacetados, que não podem ser maioria das espécies (como demonstrado por estudos sobre a tarefa de
simplesmente reduzidos a, respectivamente, tolerância ao atraso e aversão ao contingência de recompensa, por exemplo; verBoysen, 2006), as respostas
atraso. No entanto, é tentador começar a usar os primeiros rótulos carregados LL podem, na verdade, indicar falha na inibição dessa tendência
como atalhos para os últimos, conceitos menos imponentes: é por isso que comportamental prepotente, em vez de atrasar a tolerância (o “vá para mais”
encontramos excelentes trabalhos acadêmicos sobre a escolha intertemporal problema).Por outro lado, a extensão pela qual o atraso reduz a propensão
apresentados como tendo uma relação direta com a paciência (Stevens e outros, para maximizar um certo tipo de recompensa depende da força dessa
2005a) e impaciência (Van den Bergh e outros, 2008). Sempre que isso acontece, propensão na ausência de qualquer atraso (se alguém não se importa mais
parte-se do pressuposto de que (i) as respostas LL são indicativas de um certo tipo com a opção de longo prazo do que com a de curto prazo). termo um,
de autocontrole, enquanto as escolhas SS manifestam uma forma de decidir não esperar não tem nada a ver com aversão ao atraso), mas alguns
impulsividade, ainda que não a única possível. Isso, por sua vez, pode levar a um protocolos experimentais2não mede essa resistência, deixando de fornecer
julgamento de valor adicional: ou seja, a ideia de que (ii) manifestar autocontrole um ponto de referência para tolerância de atraso (o “problema do ponto
em escolhas intertemporais é sempre melhor, ou seja, mais racional do que a zero).Ambos os problemas foram discutidos longamente em trabalhos
alternativa.1 recentes (Paglieri et al., 2015a), então aqui vou apenas resumir os principais
Neste artigo, questiono essas duas afirmações. Contra (i), começo resultados que confirmam sua importância para interpretar corretamente as
revisando alguns problemas metodológicos de interpretação das respostas escolhas intertemporais.
LL como uma manifestação de autocontrole, ou mesmo tolerância tardia, e O problema “ir para mais” aplica-se principalmente a tarefas em que as
aponto algumas evidências de tais problemas (Seção2). Contra (ii), quantidades de recompensa são diretamente visíveis (por exemplo,
argumento que, mesmo quando as respostas LL de fato medem a tolerância conjuntos de pelotas de comida ou pilhas de moedas), em vez de serem
ao atraso, isso não é suficiente para qualificá-las automaticamente como representados simbolicamente (por exemplo, chaves operantes ou
racionalmente superiores às escolhas SS (Seção3). O resultado dessa análise descrições linguísticas de somas monetárias). . No primeiro caso, todas as
é que a equação simplista LL resposta = autocontrole = escolha racional é espécies testadas até agora, incluindohomo sapiens,demonstraram uma
falha e, em muitos casos, refutada por evidências. Isso, por sua vez, levanta resposta prepotente para a quantidade maior, não surpreendentemente;
a questão de como os estudiosos interessados no comportamento além disso, tal resposta prepotente tem se mostrado muito difícil de
intertemporal devem reagir a tal conclusão. Devemos simplesmente superar, mesmo quando apontar para a quantidade maior leva os sujeitos a
“abandonar o barco” e abster-nos de qualquer comentário adicional sobre a receberem a menor, e vice-versa, como acontece na tarefa de contingência
racionalidade, ou falta dela, dos comportamentos intertemporais de recompensa reversa (Russel e outros, 1991). Nesta tarefa, um
observados, contentando-nos assim com um mero nível descritivo de desempenho correto é alcançado somente após as contingências da tarefa
análise? Acho que não, e na Seção4Sugiro a adaptação de ferramentas serem modificadas para facilitar o treinamento (por exemplo, usando um
normalmente usadas para analisar a racionalidade na interação social para método grande ou nenhum com macacos-japoneses e macacos-de-cheiro;
obter uma melhor compreensão da racionalidade de nossa sociedade Silberberg e Fujita, 1996; Anderson e outros, 2000, 2004), ou substituindo os
interna de eus, ou seja, diferentes perfis de preferência que são realizados valores reais por sua representação simbólica (por exemplo, em chimpanzés
em diferentes pontos no tempo. Esta sugestão não é nova (os primeiros por algarismos arábicos e em macacos-prego por fichas de alto valor
proponentes incluem Schelling, 1984; Elster, 1986; Ainslie, 1992), mas a simbólico;Boysen e Berntson, 1995; Boysen et al., 1999; Addessi e Rossi,
ferramenta escolhida para colocá-la em prática muitas vezes tem sido a 2011); resultados semelhantes são observados também usando
teoria dos jogos. Por exemplo, Ainslie propôs analisar o tipo de conflito representações simbólicas de recompensas com crianças de 3 anos (Carlson
intrapsíquico gerado pelo desconto hiperbólico como um Dilema do e outros, 2005). Curiosamente, as representações simbólicas são eficazes
Prisioneiro iterado (Ainslie, 1992; uma sugestão posteriormente criticada por para facilitar o desempenho na tarefa de contingência de recompensa
Bratman, 1999), e o termo “dilemas intrapessoais” foi mais tarde cunhado reversa apenas quando não têm uma correspondência um-para-um com as
para descrever toda uma família de interações problemáticas entre recompensas reais: substituir matrizes de pellets de comida por matrizes de
diferentes eus no tempo (Read e Roelofsma, 1999; Leia, 2001). Embora pontos não leva a um desempenho correto, embora sim. às vezes reduzem
certamente valha a pena explorar os modelos teóricos dos jogos de dilemas ligeiramente a frequência de respostas incorretas (possivelmente devido à
intrapessoais, aqui sugiro que os cientistas comportamentais também remoção das características “quentes” do reforçador, no sentido deMetcalfe
considerem outra ferramenta complementar:teoria da escolha social.Em e Mischel, 1999). Apenas representações altamente simbólicas, ou seja,
particular, resumi o que tem sido, até onde sei, a única tentativa até agora representações que não tornam a quantidade maior perceptivamente
de aplicar a teoria da escolha social a problemas intertemporais (Steedman e saliente, são verdadeiramente eficazes para ajudar os sujeitos a executar
Krause, 1986; Veja tambémKrause, 2010), a fim de enfatizar suas implicações corretamente a tarefa (Boysen et al., 1996; Carlson e outros, 2005; Boysen,
para avaliar a racionalidade da escolha intertemporal e sua relevância para 2006; Addessi e Rossi, 2011), mostrando que o prepotente “buscar mais
projetar novos protocolos experimentais para estudar mudanças de resposta” está atrelado à percepção de quantidade, e não tanto à natureza
preferência e seus efeitos no comportamento. (apetitiva ou não) da recompensa. Crianças pequenas e primatas não
humanos testados até agora têm uma resposta prepotente para a pilha
2. Quando se recusar a esperar não tem nada a ver com aversão ao maior de coisas, seja comida, pedras, pontos ou qualquer outro tipo de
atraso objeto, desde que associado a uma recompensa.
Esses resultados colocam em questão a interpretação das respostas
Interpretar as respostas LL como indicativas de tolerância ao atraso esbarra LL em escolhas intertemporais onde quantidades reais de recompensas
em dois problemas metodológicos. Por um lado, uma vez que a recompensa são usadas como estímulos de escolha, como é usual em estudos
atrasada em uma tarefa de escolha intertemporal padrão acontece primatológicos. Quantas dessas opções são realmente indicativas

1Meu objetivo não é estabelecer se muitos cientistas comportamentais estão comprometidos


com essas suposições (isso exigiria uma revisão de literatura muito mais extensa e, 2O problema é evitado principalmente por procedimentos de ajuste, nos quais a quantidade de
pessoalmente, suspeito que não seja esse o caso), mas sim destacar quais problemas tais recompensa ou a quantidade de atraso são ajustadas com base em escolhas anteriores: esses
suposições levantam, quando endossadas – juntos ou desarticulados. O facto de serem por vezes protocolos geralmente começam com uma escolha entre quantidades iguais ou atrasos iguais,
endossados é, no entanto, demonstrado por alguns dos factos discutidos mais adiante, por cuidando assim da questão do ponto zero . Isso, infelizmente, não costuma acontecer com
exemplo, a frequente falta de condições de controlo em tarefas de escolha intertemporal (ver estudos que utilizam um protocolo não ajustador, como o chamado questionário de Kirby (Kirby e
Secção2). Isso é suficiente para justificar a busca por um modelo normativo mais matizado de Marakovic, 1996; Kirby e outros, 1999; para discussão recente, Myerson e outros, 2014).
tomada de decisão intertemporal, conforme discutido na Seção3.
F. Paglieri / Processos Comportamentais 127 (2016) 97–108 99

de tolerância de atraso, como é normalmente assumido, e quantos são, em anteriormente pensado para ter um excelente desempenho em tarefas de
vez disso, uma manifestação de inibição falha de uma resposta “vá para escolha intertemporal, por exemplo, macacos-prego (Addessi et al., 2011):
mais”? Seja qual for a resposta, esse potencial fator de confusão deve ser mais de 60% dos erros foram observados nesta espécie, o que significa que
muito cauteloso ao interpretar automaticamente uma resposta LL como um mais de uma resposta LL em dois não indica, na verdade, tolerância ao
sinal de autocontrole temporal, uma vez que, nessas condições, pode indicar atraso (Paglieri e outros, 2013). Por outro lado, outras espécies podem sofrer
exatamente o oposto, ou seja, incapacidade de inibir uma resposta menos com esse problema: dados com chimpanzés indicam que eles podem
prepotente. De fato, as evidências desse problema vêm se acumulando nos navegar na tarefa de atraso híbrido praticamente sem erros (Beran et al.,
últimos anos, tanto direta quanto indiretamente. A evidência indireta inclui o 2014), muito provavelmente devido ao seu excelente desempenho em
fato de que esconder os valores da recompensa ou usar tokens altamente tarefas de manutenção de atraso em geral (Beran, 2002; Beran e Evans,
simbólicos realmente reduz a frequência de escolhas LL em uma tarefa 2006; Evans e Beran, 2007).
intertemporal (sugerindo assim que pelo menos algumas dessas escolhas O problema do “marco zero” representa um desafio diferente para
foram devidas à falha na inibição de um “ir para mais resposta” ;Genty et al., interpretar as respostas LL como indicativas de tolerância de atraso, uma vez
2012;Addessi et al., 2014), a tendência dos sujeitos ingênuos de optarem que é principalmente um problema de medição. Mesmo assumindo que o
pela recompensa atrasada maior com mais frequência do que os sujeitos já atraso é de fato um fator crucial na tomada de decisão intertemporal, medir
familiarizados com as contingências da escolha intertemporal (sugerindo seu impacto requer estabelecer um ponto de referência, que só pode ser a
assim que os sujeitos ingênuos estão realmente respondendo à quantidade, tendência de maximizar o valor da recompensa em primeiro lugar, ou seja,
em vez de considerar o atraso;Addessi et al., 2013; com base em dados de noausênciade atraso. Infelizmente, estudos de escolha intertemporal com
Rosati e outros, 2007), e a falta de correlação ou processos neurocognitivos atrasos fixos, especialmente aqueles com participantes humanos, tendem a
compartilhados, tanto dentro quanto entre espécies, entre tarefas de não incluir uma condição de controle com os mesmos valores, mas sem
escolha intertemporal padrão e uma medida bem estabelecida de tolerância atraso associado ao maior, com pouquíssimas exceções (notáveis são os
a atrasos, ou seja, tarefas de manutenção de atrasos, como o teste de estudos recentes sobre desconto sexual em uso de preservativo;Johnson e
Marshmallow (Mischel e outros, 1989) e a tarefa de acumulação (Beran e Bruner, 2012, 2013; Herrmann et al., 2014). O que é pior, mesmo na ausência
outros, 1999).3Isso mostra que a tolerância ao atraso não é o único fator por de um controle crucial, as variações na porcentagem de respostas LL, seja
trás das respostas LL (Reynolds e outros, 2002; Toner e Smith, 1977; entre condições, sujeitos ou populações, são frequentemente interpretadas
Duckworth e Kern, 2011; Addessi et al., 2013; Paglieri et al., 2013; Schwarz et como variações na tolerância de atraso subjacente, enquanto os mesmos
al., 1983; Richards et al., 1998; Evenden, 1999; Reynolds e Schiffbauer, 2005). dados poderiam facilmente ser interpretado comovariações na motivação
básica para maximizar o reforçador em questão.
Quanto à evidência direta do problema “vá para mais”, a chamada tarefa
híbrida de atraso (Paglieri e outros, 2013) foi projetado para testar se uma Alguns podem considerar isso um ponto um tanto pedante: afinal, quais evidências precisamos para

resposta inicial de LL seria seguida por manutenção de atraso real, uma vez que os saber que a motivação para maximizar a ingestão de alimentos é robusta em todas as espécies ou que

sujeitos tivessem a oportunidade de revisar sua escolha – o que eles não podem maximizar ganhos monetários sempre funciona bem com participantes humanos? De acordo com essa

fazer em tarefas de escolha intertemporal padrão. Na tarefa de atraso híbrido, o atitude, o controle da motivação básica seria necessário apenas quando algum reforçador “exótico” estiver

sujeito primeiro enfrenta uma escolha intertemporal típica, por exemplo, entre 4 sendo usado, por exemplo, na tarefa de desconto sexual mencionada acima, enquanto na grande maioria

bolinhas de comida imediatamente (SS) ou 12 bolinhas de comida após 36 s (LL): dos estudos, onde o bom e velho dinheiro e comida são usados como reforçador, não há motivo para ser

se SS for escolhido, a recompensa é entregue imediatamente e inteiramente, tão meticuloso. Infelizmente, esta posição está errada, porque a questão aqui não é se um determinado

como habitual; mas se for escolhido LL, então o alimento começa a ser transferido reforçador é eficaz em geral (comida e dinheiro certamente são, neste contexto), mas sim se a motivação

ao alcance do sujeito a uma taxa fixa, por exemplo, um pellet a cada 3 s, e o para maximizar esse reforçador pode variar entre condições, sujeitos e populações. . E é claro que existem

procedimento é interrompido assim que o sujeito pega a quantidade já muitas razões pelas quais mesmo um reforçador forte pode variar bastante em seu poder motivacional em

acumulada, ou quando toda a recompensa é transferidos, por exemplo, após 36 s, diferentes assuntos: saciedade e gostos são exemplos óbvios com relação à comida, enquanto status

de acordo com o protocolo típico de manutenção de retardo. Uma característica socioeconômico, cronogramas de pagamento e planos de investimento são igualmente bons exemplos de

interessante desta tarefa é que ela permite capturar erros de forma inequívoca, ou fatores que levam a oscilações na motivação para maximizar o dinheiro. Sem controlar tais variações,

seja, tentativas em que o sujeito primeiro opta por LL, mas depois não consegue mesmo usando reforçadores bem estabelecidos não imuniza uma tarefa de escolha intertemporal do

acumular uma quantidade igual a SS – terminando assim com menos comida após problema do “marco zero”. cronogramas de pagamento e planos de investimento são exemplos

algum atraso, em vez de mais comida imediatamente. A porcentagem de tais igualmente bons de fatores que levam a oscilações na motivação para maximizar o dinheiro. Sem controlar

erros na tarefa de atraso híbrido pode ser tomada como uma estimativa tais variações, mesmo usando reforçadores bem estabelecidos não imuniza uma tarefa de escolha

aproximada de quanto o problema “vá para mais” influencia a fase de escolha intertemporal do problema do “marco zero”. cronogramas de pagamento e planos de investimento são

inicial naquela população específica de sujeitos.4Dados mostram que o problema exemplos igualmente bons de fatores que levam a oscilações na motivação para maximizar o dinheiro.

pode ser extremamente grave, mesmo em espécies Sem controlar tais variações, mesmo usando reforçadores bem estabelecidos não imuniza uma tarefa de

escolha intertemporal do problema do “marco zero”.5

Um excelente exemplo desse problema em ação é dado por estudos


3Na tarefa do marshmallow, um experimentador interage com uma criança por alguns sobre o efeito do tipo de recompensa nas escolhas intertemporais. Diversos
minutos, então sai da sala com uma desculpa: uma recompensa muito apreciada (p.
receberá o dobro se deixar de consumir a recompensa enquanto o experimentador
estiver ausente. As variáveis dependentes são se a criança se abstém de comer ou tocar
na recompensa, quanto tempo ela consegue resistir e os vários comportamentos a tarefa híbrida de atraso mostra que é improvável que as respostas LL em tarefas ITC padrão
adotados durante o tempo de espera. Na tarefa de acumulação, uma certa quantidade de meçam com segurança a tolerância ao atraso, sob certas condições.
recompensa se acumula a uma taxa fixa ao alcance do sujeito (normalmente um animal 5É importante enfatizar que o problema diz respeito à variação entre os sujeitos, e não às
não humano): assim que o sujeito alcança ou toca as recompensas já acumuladas, o oscilações de utilidade dentro de um único indivíduo. O que precisa de medição empírica é a
processo de entrega termina, assim, apenas esperando até que a última recompensa seja motivação básica para maximizar uma certa recompensa entre pessoas diferentes, antes de
entregue, o sujeito pode coletar todo o prêmio. As variáveis dependentes são o número usarmos essa recompensa para dizer qualquer coisa sobre sua tolerância a atrasos. Se acontecer
de itens de recompensa acumulados, a duração do tempo de espera e os de você amar chocolate enquanto eu odeio, seria injustificado interpretar minha falta de vontade
comportamentos adotados durante o mesmo. de esperar por mais chocolate como uma indicação de que sou menos paciente do que você -
simplesmente não ligo para chocolate para começar. O mesmo se aplica ao dinheiro: se John se
4Uma interpretação alternativa seria considerar o comportamento como determinado por respostas preocupa mais com ele do que Karl, isso precisa ser medido e levado em consideração na
prepotentes (infelizmente para o animal, conflitantes) em ambos os estágios da tarefa: primeiro a opção LL interpretação de suas escolhas intertemporais com dinheiro. Interessantemente,Killeen (2015)
é escolhida com base em uma resposta “vai mais”, depois a quantidade acumulada após apenas alguns recentemente propuseram um modelo matemático de variações intersubjetivas na impulsividade
segundos são obtidos com base em um imperativo semelhante, por exemplo, “obtenha o que está que, como a teoria da escolha social, tem potencial para ser usado também intrapessoalmente,
disponível à sua frente o mais rápido possível”. De qualquer forma, erros de quando as dimensões relevantes são ruidosas ou instáveis.
100 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

experimentos mostraram que as recompensas monetárias provocam uma Uma lição de moral importante a ser aplicada a descobertas experimentais
porcentagem maior de respostas LL do que as recompensas primárias sobre escolha intertemporal: sempre que uma alta porcentagem de escolhas
(normalmente alimentos ou bebidas), mesmo após o controle do valor de LL é observada, pode ser considerada uma forte orientação para o futuro,
mercado (Kirby e Guastello, 2001; McClure et al., 2004; Estle et al., 2007; que por sua vez seria considerada um traço comportamental desejável.
McClure e outros, 2007; Jimura et al., 2009; Jimura et al., 2011; Paglieri et al., Claramente, há um (grande) grão de sal nessa interpretação, como
2015a). Isso tem sido tipicamente interpretado como um efeito na tolerância mostrado pela forte correlação negativa entre a orientação para o futuro e
a atrasos, alegando assim que o dinheiro nos torna mais tolerantes a atrasos comportamentos problemáticos, como abuso de substâncias e direção
(“pacientes”, se preferir) do que reforçadores primários, e várias explicações arriscada, e a correlação positiva ainda mais forte entre esses
foram sugeridas para explicar esse fenômeno (para discussão, vejaPaglieri comportamentos e a orientação para o presente. , medido pelo Zimbardo
et al., 2015a, pp. 200–204). No entanto, aqui temos um campo de aplicação Time Perspective Inventory (Zimbardo et al., 1997; Keough e outros, 1999).
perfeito para o problema do “ponto zero”: e se o dinheiro nos tornasse mais No entanto, essa visão não pode ser suficiente como uma imagem científica
gananciosos, ou seja, mais dispostos a maximizar a quantidade, do que a do que é racional fazer na escolha intertemporal. De fato, a fábula clássica
comida, em vez de nos tornar mais pacientes? Um estudo recente (Paglieri et marginaliza outros fatores potencialmente relevantes, como os custos de
al., 2015a) confirma essa hipótese: quando uma condição de controle sem negligenciar as recompensas de curto prazo (quanto esforço, tédio e
atrasos foi introduzida tanto para comida quanto para dinheiro, observou-se oportunidades perdidas a formiga abandona durante sua labuta de verão?),
a mesma redução de escolhas para a maior recompensa entre dinheiro e os arrependimentos futuros associados a tal escolha (quanto quanto a
comida, independentemente do atraso. Na ausência de atraso, o percentual formiga lamenta perder os prazeres passados da vida, enquanto confinada
de escolhas para a maior recompensa foi maior para dinheiro do que para em sua caverna de inverno mês após mês?), e até que ponto as
comida (Money Control = 90,5%, Food Control = 73,8%), e essa diferença considerações ecológicas afetam a racionalidade, ou a falta dela, de
permaneceu a mesma quando o atraso foi introduzido, reduzindo a qualquer estratégia dada (e se o inverno A estação do ano acabou não sendo
proporção de Escolhas de LL para ambos os tipos de recompensa (Money tão dura, tornando assim os esforços de verão da formiga em grande parte
Delay = 60,9%, Food Delay = 44,3%). Para colocar em termos mais técnicos: inúteis e, em vez disso, as escolhas da cigarra bastante adaptáveis?).7
tanto o tipo de recompensa quanto o atraso tiveram um efeito significativo Nenhuma dessas preocupações é apenas uma questão de especulação: pelo
nas escolhas, mas sem nenhuma interação. Isso mostra que o tipo de contrário, há evidências empíricas crescentes de seu papel fundamental na
recompensa tem impacto na motivação para maximizar o valor, não na determinação do que constitui uma solução racional para um dilema
tolerância ao atraso.Charlton e Fantino, 2008), ainda é uma questão em intertemporal. Considere primeiro o papel dos fatores ecológicos: estudos
aberto. No entanto, esses resultados demonstram claramente o quão etológicos sobre comportamento de forrageamento mostraram que a estrutura
profundamente a motivação básica para maximizar o reforçador afeta os de certos problemas de escolha (por exemplo, exploração de manchas em gaios-
resultados da escolha intertemporal, fornecendo assim mais uma razão pela azuis) garante que estratégias de maximização de curto prazo levem ao sucesso
qual as respostas LL devemnãoser automaticamente considerado como uma de longo prazo (Stephens e Anderson, 2001). Nesses casos, optar pela gratificação
indicação de tolerância de atraso, muito menos autocontrole.6 imediata é fundamental para garantir o forrageamento ideal a longo prazo e,
portanto, dificilmente poderia ser descrito como um comportamento impulsivo ou
irracional. Este resultado também não está limitado a uma espécie em particular:
Fawcett et ai. 2012recentemente propôs uma estrutura matemática geral para
3. Quando a tolerância de atraso não é a melhor opção explicar a evolução de diferentes níveis da chamada “impulsividade” em diferentes
espécies, dependendo de uma variedade de parâmetros ecológicos. Sua análise
Os problemas metodológicos discutidos na seção anterior são mostra como os comportamentos de escolha intertemporal considerados
preocupantes, mas certamente não letais para o estudo experimental irracionais pela economia convencional (por exemplo, desconto hiperbólico e a
do comportamento de escolha intertemporal. Pedir cautela na resultante reversão de preferência) podem, na verdade, ser perfeitamente
interpretação dos dados não é o mesmo que declarar derrota: na adaptativos, sob as condições apropriadas. De forma mais geral, as explicações de
verdade, soluções concretas para esses problemas metodológicos racionalidade ecológica têm sido muitas vezes invocadas para interpretar as
foram sugeridas ao longo do caminho. Pode não estar claro se essas diferenças na escolha intertemporal entre as espécies (Stevens e outros, 2005a;
soluções já estão suficientemente difundidas na literatura experimental Stevens e outros, 2005b; Rosati et al., 2007; Amici et al., 2008; Addessi et al., 2011;
sobre escolha intertemporal, mas não há dúvida de que são viáveis e, para discussão, vejaLogue, 1988; Kacelnik, 2003; Stevens e Stephens, 2010) e
de fato, muitos estudos fazem sua devida diligência, produzindo dados estudos recentes usando modelos de robótica evolutiva (Paglieri et al., 2015b)
que podem ser interpretados inequivocamente como indicativos de começou a testar condições ambientais sob as quais as pressões evolutivas de fato
atraso tolerância. Agora é hora de voltar para uma questão normativa: levam a uma aversão ao atraso mais forte, por exemplo, na presença de uma
mesmo quando as respostas LL revelam tolerância ao atraso, isso deve abundância relativa do reforçador relevante. Mesmo tendo em mente que
ser considerado “uma coisa boa”? Mais precisamente, “adaptativo evolutivo” não significa necessariamente “correto normativamente” (
Boudry e outros, 2015), esses resultados mostram que uma preferência acentuada
Uma resposta positiva a essa pergunta é incorporada pela fábula de pela gratificação de curto prazo não é necessariamente uma “falha” a ser corrigida
Esopo sobre a formiga e a cigarra (em versões posteriores, gafanhoto). Na – na verdade, pode muito bem ser o contrário. Isso certamente não diminui o
fábula, a cigarra se diverte durante o verão, zombando da laboriosa formiga valor das evidências existentes sobre como uma forte orientação para o futuro
que continua trabalhando para estocar comida para a estação ruim; é claro pode ser algo bom de se cultivar, mas deixa claro que há muitas exceções
que, quando chega o inverno, a formiga voltada para o futuro está segura importantes à simples equação “autocontrole = escolha racional”.
em seu refúgio bem abastecido, enquanto a cigarra míope é deixada para
morrer de frio e fome. Aspereza à parte, isso pode parecer uma tentação
Outra dessas exceções é revelada por estudos sobrehipermetropia
temporal,ou seja, a incapacidade sistemática de optar por uma gratificação
6Esses resultados também colocam em foco as dificuldades de definir o autocontrole em
imediata, devido a uma forte necessidade de dar sempre prioridade
primeiro lugar. Como não pretendo resolver aqui esta espinhosa questão filosófica, neste artigo
me valerei de uma definição simples de trabalho, segundo a qual, para que uma escolha seja
considerada uma manifestação genuína de autocontrole, dois critérios precisam ser atendidos:
deve ser alcançado contra alguma forma de inclinação para fazer diferente e deve levar a um 7Sobre este último ponto, a teoria da história de vida fornece uma abordagem evolutiva
resultado que seja normativamente melhor do que sua alternativa. O fato de que o que conta adequada para capturar as nuances envolvidas na avaliação da racionalidade das escolhas
como “normativamente melhor” seja uma questão controversa é precisamente o ponto da intertemporais a partir de uma perspectiva temporalmente estendida (para uma revisão e
presente contribuição. discussão recentes, verDel Giudice et al., 2016).
F. Paglieri / Processos Comportamentais 127 (2016) 97–108 101

às preocupações futuras. O termo foi cunhado por Ran Kivetz e vulneráveis ao viés, eles também são consistentes com a intuição e o bom
colaboradores (Kivetz e Simonson, 2002; Keinan e Kivetz, 2008), para senso. Afinal, do que você espera se arrepender mais em seu leito de morte
enfatizar sua oposição à doença típica investigada pelos estudos de – a nota ruim que tirou naquele dia em que não estudou o suficiente, ou
escolha intertemporal, a miopia temporal. As pessoas que sofrem de toda a diversão que poderia ter tido com seus entes queridos e não o fez,
hipermetropia temporal podem ser descritas como hipócritas (na ocupado como estava? construindo seu futuro? No mínimo, considerar a
verdade, muitas vezes se descrevem nesses termos): elas sentem um dinâmica do arrependimento representa um desafio fundamental para
desejo de fazer “a coisa certa”, mesmo quando os custos percebidos estabelecer a racionalidade da escolha intertemporal: uma vez que a
são maiores do que os benefícios esperados, e assim, parte deles suposição de que as respostas LL são “boas” é, em última análise, baseada
preferiria não ceder a esse impulso e aproveitar um pouco a vida, para na percepção de que elas são melhores no longo prazo, avaliando o quanto
variar. Crucialmente, as pessoas hipócritas se veem como tendo um chegamos arrepender-se de tê-los feito é crucial para testar essa suposição.
problema de autocontrole, não menos do que as pessoas que lutam Todas essas considerações mostram que precisamos ir além das
contra a impulsividade, e tentam remediar isso usando táticas formigas e das cigarras, em nossa análise da racionalidade na escolha
semelhantes, embora com uma intenção oposta. Por exemplo, dada intertemporal. Às vezes, optar pela recompensa de longo prazo é a coisa
uma escolha entre uma certa quantia em dinheiro e férias com certa a fazer, e às vezes não é. A questão então é: como podemos saber?
exatamente o mesmo valor de mercado, ambos disponíveis no futuro, Que teoria de princípios pode ser usada para estabelecer a opção racional
Kivetz e Simonson, 2002). Ou eles podem tentar se concentrar nos em um problema intertemporal? Esta questão não é algo que os cientistas
arrependimentos de longo prazo de sua conduta hipócrita, como uma comportamentais possam confortavelmente deixar nas mãos de outra
forma de facilitar a escolha atual para gratificação imediata (Keinan e pessoa, por exemplo, filósofos, uma vez que é crucial fornecer orientação
Kivetz, 2008). Qualquer que seja sua estratégia, a luta dos hipócritas prática para pessoas que enfrentam dilemas intertemporais em sua vida
demonstra uma situação em que a associação entre escolha cotidiana.
intertemporal e autocontrole é inversa: para essas pessoas, ceder aos
prazeres de curto prazo requer um ato deliberado de vontade,
4. Um é uma multidão: ferramentas sociais para escolha individual
enquanto agir em vista de interesses futuros mostra falta de controle
sobre seus próprios vieses motivacionais.
Fornecer uma teoria para a escolha racional intertemporal requer
encontrar um padrão normativo que determine a solução ótima na
interação entre todos os diferentes interesses que o indivíduo venha a
vivenciar ao longo do tempo, e que passe a ser relevante para o problema
de decisão em questão. Essa concatenação de eus temporais com
A contemplação de arrependimentos futuros – a antecipação de decepções
preferências diferentes é bastante semelhante a um grupo de pessoas com
posteriores por escolhas também governadas pelo foco no futuro em vez do
preferências diferentes. Embora a consideração de interesses conflitantes
envolvimento no presente – ajuda as pessoas a serem um pouco menos austeras,
mediando uma decisão possa ser um anátema para alguns behavioristas,
menos “controladoras”. Eles também têm um impacto direto na racionalidade da
parecendo muito com povoar o crânio não com um, mas com uma família de
escolha intertemporal e na maneira como pensamos sobre ela. Ironicamente, esse
homúnculos, outros behavioristas propuseram noções semelhantes.8
próprio pensamento tende a ser hipermetrópico: concentrando-se em tentativas
Portanto, não é surpreendente que ferramentas analíticas originalmente
fracassadas de adiar a gratificação, em vez de nos custos de oportunidade pagos
projetadas para estudar a racionalidade da interação social tenham sido
por uma vida vivida com muita prudência. Arrependimentos futuros sempre foram
frequentemente adotadas para estudar a tomada de decisão intertemporal
um tópico de interesse na literatura sobre escolha intertemporal, mas são
individual (Schelling, 1984; Elster, 1986; Ainslie, 1992). A seguir, discutirei
tipicamente considerados em associação com tentativas fracassadas de alcançar
brevemente duas dessas aplicações, a teoria dos jogos e a teoria da escolha
resultados de longo prazo: optar por SS (muitas vezes descrito como ceder à
social, para mostrar por que a última, embora menos estudada do que a
tentação, se não ao vício total) é suposto gerar arrependimentos mais tarde,
primeira em conjunto com a escolha intertemporal, na verdade é uma
quando os benefícios potenciais da opção LL não se materializam – exatamente
promessa significativa para insights relevantes, tanto teóricos quanto
como acontece com a cigarra da fábula, arrependendo-se inutilmente de seus
empíricos.
erros passados enquanto morre por eles. Da mesma forma, a literatura sobre a
escolha intertemporal está repleta de estudantes tomados pelo remorso por sua
falta de preparação, enquanto fazem um exame para o qual não estudaram, ou de 4.1. Jogos intrapessoais: potencialidades e limites
investidores imprudentes, enfrentando a perspectiva de pobreza na velhice devido
à falta de tempo. escolhas inteligentes de sua juventude. Por mais atraente que Uma vez que os dilemas intertemporais descrevem, por definição, um conflito entre
seja essa imagem da realidade (muitos estudantes e investidores realmente se diferentes ordens de preferência, a teoria dos jogos tem sido freqüentemente aplicada
arrependem, é claro), ela também é muito parcial. E os alunos que passam no para modelar tais problemas, especialmente na economia, como uma estrutura
exame graças aos seus estudos anteriores, mas se arrependem profundamente naturalmente adequada para lidar com a interação estratégica de conjuntos conflitantes
de todos os prazeres que tiveram que abrir mão para chegar lá? E o avarento, que de preferências. O objetivo desta seção não é fornecer uma pesquisa abrangente da
não tem problema nenhum em fazer fortuna para a velhice, ainda por causa disso vasta literatura sobre o assunto,
perde completamente tudo de valor real que a vida tem a oferecer (Scrooge de
Dickens sendo o exemplo óbvio, aqui)? Em outras palavras, abrir mão da
gratificação de curto prazo gera arrependimentos tão reais quanto aqueles
8Mais notavelmente, BF Skinner emCiência e Comportamento Humano: “Se o ambiente do qual
produzidos por não atingir objetivos de longo prazo, e ambos devem ser o comportamento é uma função não for consistente momento a momento, não há razão para
considerados ao estabelecer qual é o curso racional de ação em um determinado esperar consistência no comportamento. O piedoso frequentador da igreja no domingo pode se
problema de escolha intertemporal. tornar um homem de negócios agressivo e sem escrúpulos na segunda-feira. Ele possui dois
sistemas de resposta adequados a diferentes conjuntos de circunstâncias, e sua inconsistência
não é maior do que a do ambiente que o leva à igreja no domingo e ao trabalho na segunda-
Além disso, estudos sobre a dinâmica temporal desses sentimentos feira. Mas as variáveis controladoras podem vir juntas; durante um sermão, o freqüentador da
sugerem que o arrependimento por perder a gratificação imediata aumenta igreja pode ser solicitado a examinar suas práticas comerciais, ou o empresário pode se envolver
com o tempo, enquanto o remorso por ostentar objetivos de longo prazo em transações comerciais com seu clérigo ou sua igreja. Problemas podem então surgir. Da
mesma forma, se um indivíduo desenvolveu repertórios diferentes com a família e amigos, as
desaparece (Kivetz e Keinan, 2006). Ironicamente, isso significa que as
duas personalidades entram em conflito quando ele está com os dois ao mesmo tempo. Muitas
respostas SS são mais lamentadas do que as respostas LL apenas no curto
das lutas dramáticas que inundam a literatura sobre personalidades múltiplas podem ser
prazo, enquanto o oposto é verdadeiro no longo prazo. Mesmo que esses explicadas da mesma forma” (2012, p. 286). Agradeço a Peter Killeen por me fornecer esta
dados sejam baseados em auto-relato e, portanto, especialmente citação.
102 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

mas apenas para oferecer um esboço dela, suficiente para apreciar seu potencial, indicativo de decisões futuras? É aqui que a analogia IPD é necessária.
bem como algumas de suas limitações. De acordo com Ainslie, “as curvas de desconto hiperbólicas criam uma
Análises teóricas de jogos de problemas de escolha intertemporal situação de cooperação parcial, ou guerra limitada, entre seus
geralmente se enquadram em uma das três grandes categorias:modelos de sucessivos estados motivacionais. Seus interesses individuais em
dual-self,onde o autocontrole é analisado como um jogo entre um eu recompensas de curto prazo, combinados com seus interesses comuns
paciente de longo prazo versus uma sequência de eus impulsivos de curto em estabilidade de escolha, criam incentivos muito parecidos com
prazo (Fudenberg e Levine, 2006), ou um planejador contra vários aqueles do muito estudado jogo de barganha, o repetido dilema do
executores míopes (Thaler e Shefrin, 1981), ou um sistema afetivo vs. um prisioneiro” (2001, p. 104). Se for esse o caso, uma lógica semelhante à
sistema deliberativo (Loewenstein e O'Donoghue, 2004; inspirada em Olho por Olho justificaria a crença de que qualquer coisa que eu
Metcalfe e Mishel, 1999);jogos de auto-sinalização,explorando as implicações escolher agora me levará a escolher novamente na próxima vez que me
para o autocontrole da atribuição de valor diagnóstico às escolhas atuais, ou deparar com a tentação - exatamente o tipo de crença racional
seja, quando as ações de alguém são tomadas como indicação do nível necessária para agregar a trabalhar. Em breve discutirei algumas
subjacente de força de vontade (Benabou e Tirole, 2004) ou traços e críticas levantadas contra a analogia de Ainslie: no entanto,
inclinações pessoais (Bodner e Prelec, 2003);modelos formais de pré-
compromisso e autocontrole na teoria da decisão,
por exemplo, como ordens de preferência em diferentes loterias ou menus ( Da mesma forma, os jogos dinâmicos podem ser usados para avaliar a
Gul e Pesendorfer, 2001; Nehring, 2006; Dekel et al., 2009; Noor e Takeoka, utilidade potencial, ou a falta dela, de diferentes soluções propostas para
2010; Stovall, 2010), o trabalho de Daniel Read sobre dilemas intrapessoais ( enigmas intertemporais específicos. O seguinte é um exemplo recente:
Leia, 2001; Veja tambémRead e Roelofsma, 1999) e a noção de determinação interpretar dados de um grande estudo de campo sobre freqüência à
do jogo de Don Ross na interação social (Ross, 2008). Além dessas três linhas academia (Della Vigna e Malmendier, 2006),Paglieri (2012)usa jogos
principais de trabalho, a teoria dos jogos é frequentemente utilizada como dinâmicos com agentes sofisticados para avaliar os impactos
quadro de referência para discutir aspectos específicos ou instâncias de comportamentais de duas estratégias diferentes de pré-compromisso, ou
tomada de decisão intertemporal, seja para fornecer uma explicação de um seja, pagamento antecipado versus pagamento antecipado com reembolso
determinado fenômeno (diagnósticouso), para sugerir uma solução para um condicional. No primeiro caso, é pago antecipadamente um determinado
problema específico (prognósticouso), ou para avaliar os resultados valor (por exemplo, uma mensalidade) para garantir o acesso posterior ao
potenciais de diferentes estratégias de autocontrole (avaliativo usar). ginásio; no segundo caso, um valor ainda maior é adiantado pelo usuário,
mas parte dele é reembolsado com base no comparecimento efetivo. Um
Um bom exemplo do uso diagnóstico da teoria dos jogos é a análise de modelo teórico de jogo simples (para detalhes e discussão, vejaPaglieri, 2012
ativos ilíquidos de Laibson como um dispositivo de pré-compromisso ( ) fornece uma explicação clara de por que o último, e não o primeiro,
Laibson, 1997). A ideia básica é que introduzir um atraso no desinvestimento trabalha para vincular as pessoas a um curso de ação desejável de longo
do patrimônio poderia funcionar como uma salvaguarda contra escolhas prazo, mas de curto prazo, por exemplo, ir à academia. A razão intuitiva é
impulsivas de consumo e, assim, garantir um melhor nível de investimento. simples de entender: enquanto apenas pagar antecipadamente apenas
Essa intuição é capturada usando um jogo dinâmico entre eus sucessivos, introduz um custo genérico, independentemente de escolhas futuras,
assumindo agentes sofisticados (ou seja, preditores perfeitos de suas adicionar reembolso condicional torna o custodependentesobre o
preferências futuras) e descontando o atraso quase-hiperbolicamente, e comportamento futuro, criando assim um incentivo para vencer a tentação
usando o equilíbrio perfeito do subjogo como o conceito de solução. Ativos de relaxar. De fato, a parcela significativa de escolhas irracionais observadas
ilíquidos são modelados como realizando sua liquidez, devido à venda ou por Della Vigna e Malmendier com pagamento antecipado simples (ou seja,
empréstimo no momentot,só na horat + 1.O modelo mostra que, em pessoas que pagam uma mensalidade, mas depois frequentam a academia
equilíbrio, a cada período de tempoto agente consome toda a sua liquidez, menos do que o mínimo necessário para justificar a despesa, ao contrário de
mas realoca seus ativos ilíquidos para restringir as oportunidades de outros esquemas de pagamento) é um ilustração do poder dos custos
consumo no próximo período de tempot + 1,com base em suas expectativas irrecuperáveis em influenciar nossas escolhas (Arkes e Blumer, 1985). Aliás,
sobre as preferências de consumo emt + 1em relação às preferências emt. também sugere que tal viés não é necessariamente uma coisa ruim. De fato,
Assim, o modelo explica dois fatos estilizados bem conhecidos: (i) o consumo pode-se especular que algumas dessas pessoas estão cientes do mau
se correlaciona com a renda, mas não com o patrimônio líquido, uma vez negócio que estão fazendo, mas consideram melhor do que a alternativa:
que uma parte de nossos ativos ilíquidos é mantida como forma de controlar não pagar adiantado e, portanto,nuncair à academia − em vez de pagar
o consumo futuro, e (ii) a inovação financeira tem um impacto negativo na caro, mas pelo menos conseguir ir algumas vezes, motivado por sua
poupança, uma vez que qualquer instrumento que remova os atrasos na suscetibilidade “irracional” a custos irrecuperáveis.
liquidação dos ativos mina sua eficácia como dispositivos de pré- Embora seja certamente produtivo analisar os dilemas intrapessoais
compromisso (como exemplo, Laibson menciona a crise de poupança dos como análogos à barganha interpessoal, também é importante enfatizar
anos 80 nos EUA, que coincidiu com a introdução de novos sistemas de algumas diferenças cruciais entre essas duas situações. Uma assimetria
crédito instrumentos). fundamental diz respeitonatureza transitória dos eus temporais: para
Quanto ao uso prognóstico da teoria dos jogos no estudo da capturar as mudanças de preferências que ocorrem ao longo do tempo, a
escolha intertemporal, o exemplo mais notável é a sugestão de Ainslie maioria dos modelos descreve a interação interna como um jogo dinâmico –
de tratar o conflito de preferência gerado pelo desconto hiperbólico uma sequência de movimentos que se desenrolam ao longo do tempo, em
como um Dilema do Prisioneiro iterado (IPD) e, em seguida, usar essa que cada agente (ou seja, cada self temporal) está ciente dos movimentos já
analogia para apoiar uma saída do problema. dilema, ou seja, a noção feitos pelos jogadores anteriores ( isto é, os eus temporais anteriores). No
de agregação (Ainslie, 1992, 2001). Bundling propõe que superar uma entanto, no caso social, cada jogador geralmente fica por perto depois de
opção tentadora de curto prazo (ex. indicativos de escolhas fazer sua jogada, o que não é o caso dos eus temporais: um eu temporal,
semelhantes no futuro: se eu consigo acreditar racionalmente que entendido como um perfil de preferência em um determinado momento,
fumando agora estou me condenando a fumar para sempre, enquanto desaparece necessariamente assim que as preferências mudam, e um novo
resistir agora garantirá (ou pelo menos facilitará) parar de vez, então eu temporal “nasce”. Tal natureza transitória tem importantes implicações
torna-se perfeitamente racional optar contra a tentação, mesmo para o práticas para modelos teóricos de jogos, independentemente de suas
eu presente. Mas o que nos justificaria em acreditar que as escolhas consequências metafísicas ou fenomenológicas sobre noções de identidade
presentes são pessoal (para uma discussão sobre isso, vejaParfit, 1984; Paglieri, 2012).
Uma primeira implicação é que os conceitos de solução baseados em recompensar
ou punir o comportamento de jogadores anteriores não podem ser aplicados
F. Paglieri / Processos Comportamentais 127 (2016) 97–108 103

aos dilemas intrapessoais. Esta é exatamente a crítica levantada por podem ser circunstâncias particulares que tornam a continência menos
Bratman contra a analogia IPD de Ainslie, segundo a qual uma escolha difícil de contemplar. Esses fatores podem ter um impacto substancial na
virtuosa no dia 1 (por exemplo, abster-se) é motivada pela crença minha escolha racional, precisamente porque eles inclinam a escala
racional de que o agente no dia 2 será motivado por essa escolha a ser motivacional para um lado ou outro; ainda assim, eles são normalmente
virtuoso novamente, como uma forma de retribuir o primeiro agente e, desconsiderados pelos modelos teóricos do jogo, uma vez que eles tendem
assim, atrair mais cooperação, como na estratégia Tit-for-Tat usual para a se concentrar em um conjunto bastante limitado de configurações de
a versão social do IPD. Infelizmente, a analogia falha, devido à natureza recompensa. Esta é uma tendência, não uma restrição embutida: nada
transitória dos eus temporais: “Suponha que, no dia 2, eu me lembre de impede que modelos teóricos de jogos contemplem uma maior variedade de
ter escolhido me abster no dia 1. Por que eu suporia que a pessoa que perfis motivacionais (ou seja, mais jogadores com diferentes payoffs), e de
fez a escolha no dia 1 está esperando para ver se vou 'retribuir' no dia 2 fato algumas tentativas preliminares nessa direção podem ser encontradas
e, só assim, continuar a “cooperar” no dia 3? Ao contrário do caso de em a literatura sobre escolha intertemporal (por exemplo, modelos com
duas pessoas, não há outra pessoa. Existe apenas eu. (. . .) Você pode, custos marginais crescentes para o exercício do autocontrole, rotulados
se você quiser, fale sobre o “estágio de pessoa” anterior que decidiu como “autocontrole ascendente”; Fudenberg e Levine, 2006; Noor e Takeoka,
abster-se no dia 1 e diferencie esse estágio do atual, estágio do dia 2. 2010). No entanto, a maioria das aplicações da teoria dos jogos para a
Mas aquele estágio pessoal anterior não existe mais, muito menos tomada de decisão intertemporal é baseada em jogos de duas pessoas,
esperando para ver o que eu faço no dia 2 ”(Bratman, 1999). Eus possivelmente por uma questão de simplicidade. Ampliar para casos mais
passados não podem ser recompensados ou punidos pelo que eu complexos usando a teoria dos jogos certamente não é impossível, mas
faço agora, simplesmente porque eles não existem mais. Na verdade, envolve alguns desafios técnicos, incluindo um rápido aumento na
não há iteração verdadeira aqui: cada vez que o jogo é jogado entre complexidade algorítmica do modelo resultante (para discussão, vejaNisan e
“novos” indivíduos (isto é, eus temporais). outros, 2007). Assim, pode valer a pena considerar uma ferramenta analítica
Uma segunda implicação da transitoriedade dos eus temporais é que eles não alternativa, originalmente projetada para agregar as preferências de
podem esperar para descontar suas recompensas: qualquer que seja a utilidade grandes populações de agentes: a teoria da escolha social.
que obtenham de sua escolha atual, ela deve ser percebida antes que um novo eu
temporal entre em cena, removendo assim da existência o jogador anterior. . 4.2. Teoria da escolha social individual: a importância do caráter
Conforme observou Read, isso implica que nem todas as interações sociais têm temporal
uma contraparte intrapessoal: “Dilemas interpessoais clássicos, como DP (. . .),
são caracterizados por uma interdependência entre todos os jogadores, de modo De acordo com a Enciclopédia de Filosofia de Stanford, “a teoria da
que decisões passadas e futuras influenciam a utilidade de qualquer escolha. (. . .) escolha social é o estudo dos processos e procedimentos de decisão
Nos dilemas intrapessoais, entretanto, a recompensa para o eu atual é coletiva”, e entre suas questões centrais estão incluídas as seguintes: “Como
determinada por sua própria decisão e pelas decisões dos eus passados, mas não um grupo de indivíduos pode escolher um resultado vencedor (por exemplo,
pelas decisões dos eus futuros. Isso não significa que o eu atual não se importa política, eleições candidato) de um determinado conjunto de opções? (. . .)
com o que o eu futuro fará, mas apenas que uma vez que as expectativas sobre o Como pode um coletivo (por exemplo, eleitorado, legislativo, tribunal
comportamento futuro são incorporadas à utilidade de decisão do eu atual, o que colegiado, painel de especialistas ou comitê) chegar a preferências ou
os eus futuros realmente fazem é irrelevante. Consequentemente, apenas um julgamentos coletivos coerentes sobre algumas questões, com base nas
subconjunto limitado de jogos interpessoais tem um equivalente intrapessoal” ( preferências ou julgamentos individuais de seus membros?” (Lista, 2013).
Leia 2001; pp. 1100–1101). PD é um excelente exemplo de interdependência de Uma vez que olhamos para a tomada de decisão intertemporal em termos
recompensa: no cenário clássico com dois suspeitos, a recompensa para cada de uma comunidade de eus temporais com diferentes ordens de
jogador é determinada somente após o outro jogador ter feito sua escolha, preferência, a teoria da escolha social (SCT, de agora em diante) parece ter
mesmo que seus movimentos ocorram sequencialmente (por exemplo, um todos os prós da teoria dos jogos: SCT é uma teoria bem definida e bem
suspeito é interrogado após o outro ). Isso simplesmente não pode ser o caso no definida. estrutura formal estudada, tanto quanto a teoria dos jogos, sem
cenário intrapessoal, porque o segundo eu temporal sempre substituirá o tendência a focar em interações de duas pessoas, e a natureza transitória
primeiro: o que é mais uma razão pela qual a analogia IPD de Ainslie não pode dos eus temporais não apresenta um problema para SCT, porque as
funcionar. De forma mais geral, a transitoriedade dos eus temporais constitui uma preferências devem ser comparadas simultaneamente em cada passo de
condição limitante na aplicação da teoria dos jogos a problemas intertemporais. tempo.9Além disso, o SCT tem um foco explícito em agregar diferentes
ordens de preferência, em vez de como cada indivíduo pode interagir
estrategicamente com os outros: seu interesse natural é o que é melhor
Finalmente, um possível risco de aplicar a teoria dos jogos a escolhas para a comunidade dos eus, e não para uma única “fatia temporal” , e esta
intertemporais é uma tendência a representar essas escolhas como uma luta parece uma direção promissora para abordar a questão central deste artigo
entrenão mais do que dois jogadores -tipicamente, um eu perspicaz (quando – como podemos fornecer uma teoria baseada em princípios sobre o que
a tentação ainda está longe no futuro) e seu gêmeo míope (quando a torna uma escolha intertemporal racional? Além disso, a SCT tem sido muito
tentação está bem na nossa frente). Mesmo modelos teóricos de jogos que menos estudada do que a teoria dos jogos em relação aos problemas
contemplam toda uma sequência de eus temporais, como a maioria faz, intertemporais, então definitivamente merece atenção no futuro.
geralmente definem sua função de utilidade de forma a garantir uma No entanto, os leitores familiarizados com o SCT podem se perguntar se
dinâmica oscilatória: cada passo de escolha sempre captura o mesmo dilema estamos em um falso começo. Afinal, o resultado mais notório do SCT no
básico – ceder a alguma tentação míope, ou manter a fé em algum curso de último século é um resultado de impossibilidade,Teorema de Arrow (1950):
ação com maiores benefícios a longo prazo. Embora essa luta de duas em termos leigos, o teorema afirma que, dados desideratos razoáveis
pessoas certamente caracterize um bom número de dilemas intertemporais, sobre como as preferências individuais são agregadas (domínio irrestrito,
ela ainda constitui uma simplificação exagerada da maioria dos casos da não-ditadura, eficiência de Pareto, independência
vida real. Mesmo quando o problema de autocontrole é um tanto cíclico por
natureza, sua nova iteração não apresenta necessariamente ao agente
exatamente as mesmas opções. Considere o fumante tentando parar, ou o 9O que isso significa é que, a qualquer momento, consideramos as preferências atuais do eu
glutão lutando para manter uma dieta: seu dilema básico entre indulgência presente e as preferências esperadas deNeus futuros, e uma escolha é feita agregando essas
diferentes preferências usando algum procedimento de agregação. O fato de algumas dessas
e firmeza nunca é exatamente o mesmo. Hoje posso ter motivos especiais
preferências pertencerem a eus futuros é irrelevante para o procedimento, uma vez que todos
(motivos verdadeiros, não apenas desculpas) para achar aquele cigarro ou
são tratados “como se” fossem eleitores coexistentes simultaneamente. De fato, pode-se até
aquele pedaço de bolo especialmente sedutores, ou pelo contrário pensar em procedimentos de agregação que “dão voto” também a alguns eus do passado,
possivelmente com o objetivo de garantir maior estabilidade no planejamento.
104 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

de alternativas irrelevantes), qualquer sistema de agregação baseado sugere a opção de abandonar a não-ditadura como requisito, oferecendo
em ordenações hierárquicas não pode garantir um resultado racional – assim, imediatamente, uma saída para o resultado de impossibilidade de
ou seja, uma ordenação de preferência em toda a comunidade que seja Arrow. Nessa visão, a ditadura do presente é o preço que temos que pagar
transitiva e completa. Transposto para o caso intrapessoal, isso para garantir a possibilidade de preferências racionais na tomada de
pareceria sugerir que nenhum procedimento de agregação pode ao decisões intertemporais. Essa “solução” é, no entanto, bastante drástica:
mesmo tempo satisfazer restrições razoáveis sobre como diferentes aqui a racionalidade é assegurada pelo simples fato de o eu presente ser
eus temporais interagem uns com os outros e garantir uma solução deixado livre para fazer o que quiser – o que provavelmente não é um
racional para todos os problemas intertemporais – ou seja, um sistema critério satisfatório para avaliar a racionalidade das escolhas intertemporais
global transitivo e completo. ordem de preferência. Então, como a SCT da vida real. De fato, como toda a dificuldade é que o eu em momentos
pode ajudar a descobrir o que é racional para a comunidade interna de diferentes quer coisas diferentes, a ditadura do presente é parte do
eus temporais? Como Steedman e Krause observaram,Steedman e problema, e não sua solução, porque não pode garantir (e de fato ameaça
Krause, 1986; pág. 207). ativamente) a consistência da conduta ao longo do tempo.
Uma alternativa mais promissora é considerar outra restrição do
teorema de Arrow, a não comensurabilidade das preferências individuais, e
Existem várias respostas para essa preocupação. A primeira e mais testar se ela faz sentido também para o caso intrapessoal. A versão original
simples é observar que a racionalidade envolvida no teorema de Arrow do teorema aplica-se apenas quando as preferências ordinais são
é de um tipo muito especial e impõe fortes restrições à ordenação de consideradas (ou seja, se uma opção é melhor do que outra para um
preferência resultante (transitividade e completude). O fato de que assunto), ao passo que é contornada pela introdução de considerações de
nenhuma política de agregação pode garantir esse tipo de cardinalidade, a saber,quantoessa opção é melhor do que outra para um
racionalidade não implica que alguma política de agregação possa determinado assunto – como o próprio Arrow observou. Mais precisamente,
realmente garantir a obtenção de outras formas de racionalidade mais Sen (1970)mostrou que não é suficiente usar a utilidade cardinal ao invés da
relaxadas, com restrições mais fracas na ordem geral de preferência. É utilidade ordinal para modelar as preferências: o resultado da
claro que esta é uma sugestão sensata, mas que não será explorada impossibilidade é evitado apenas permitindocomparação interpessoal de
aqui. Em vez disso, quero apontar que os mesmos desideratos podem utilitários,isto é, estabelecer se o ganho de utilidade de alguém pode
não se aplicar igualmente bem ao caso social e individual, oferecendo compensar a perda de utilidade de outra pessoa e até que ponto. No caso
assim uma saída para o resultado de impossibilidade de Arrow. Em social, a comparação interpessoal de utilidades é desaprovada, e por um
particular,não-ditadura enão comparabilidade de pReferências bom motivo: ela imediatamente torna o sistema vulnerável à manipulação
estratégica, por exemplo, um agente pode reivindicar ganhos ou perdas de
utilidade maiores do que o que realmente é o caso, sem nenhum significa
A não-ditadura capta a ideia de que nenhum indivíduo tem o poder de sempre determinar o que todo o grupo fará com base em suas próprias preferências.10Por que manter essas manipulações sob controle, porque a própria utilidade não é
essa é uma característica desejável de qualquer sistema social é autoevidente: provavelmente também é desejável para a comunidade interna de eus temporais e, no entanto, observável por outros, muito menos mensurável. Mas essa preocupação não
nesse caso, é bastante claro que o potencial para a ditadura está sempre presente, e necessariamente assim. Afinal, o eu presente está, literalmente, no comando por enquanto e, precisa se aplicar ao caso individual, pois aqui a comparação éintrapessoal
portanto, pode impor suas próprias preferências escolhendo apenas de acordo com elas. Claro, o fato de que ele pode impor uma escolha não garante que tal escolha será por definição. Em outras palavras, não há nada ultrajante em presumir que
preferida pela comunidade de eus temporais (por exemplo, meu eu de janeiro pode vir a desprezar a escolha do meu eu de dezembro de comer demais durante as férias de posso pesar quanto meu eu presente pode ganhar contra quanto meu eu
Natal). mas isso não altera o fato de que o eu presente sempre tem o potencial de agir como um ditador – na verdade, é exatamente isso que gera a maioria dos problemas futuro perderá por causa do que faço agora, e vice-versa, e então escolher
intertemporais. Informalmente, O teorema de Arrow prova que, para qualquer procedimento de agregação que satisfaça todos os outros requisitos (domínio irrestrito, eficiência um curso de ação baseado em o resultado de tal comparação. Afinal, ainda é
de Pareto, independência de alternativas irrelevantes), a única maneira de garantir uma ordem de preferência geral racional (ou seja, completa e transitiva) é deixando um ditador de mim que estamos falando, não de outra pessoa cujas dores e ganhos eu
emergir, o chamado eleitor central, isto é, o eleitor cujas preferências influenciam a preferência social de uma forma ou de outra. No caso social, isso é preocupante, porque não não sei como imaginar. Nessa visão, o resultado da impossibilidade de
existem “ditadores natos” e temos boas razões para desejar que eles nunca apareçam. Mas no caso individual, o eu presente é, necessariamente, um “ditador nato”, ou seja, Arrow é neutralizado não pela ditadura do presente, mas ao assumir a
alguém que, pela própria natureza do problema de escolha, tem o potencial de impor suas preferências sobre toda a sociedade de eus temporais. Esta su- para qualquer possibilidade de comparar quantitativamente as utilidades de diferentes eus
procedimento de agregação que satisfaça todos os outros requisitos (domínio irrestrito, eficiência de Pareto, independência de alternativas irrelevantes), a única maneira de temporais. Fundamentalmente, essa suposição não exige que a comparação
garantir uma ordem de preferência geral racional (ou seja, completa e transitiva) é deixando um ditador emergir, o chamado eleitor pivô , isto é, o eleitor cujas preferências seja automaticamente justa na prática: de fato, muitos fenômenos
influenciam a preferência social de uma forma ou de outra. No caso social, isso é preocupante, porque não existem “ditadores natos” e temos boas razões para desejar que eles estudados na literatura sobre escolha intertemporal (por exemplo, o papel
nunca apareçam. Mas no caso individual, o eu presente é, necessariamente, um “ditador nato”, ou seja, alguém que, pela própria natureza do problema de escolha, tem o dos arrependimentos antecipados em favorecer escolhas de longo prazo, ou
potencial de impor suas preferências sobre toda a sociedade de eus temporais. Esta su- para qualquer procedimento de agregação que satisfaça todos os outros requisitos o impacto da saliência da recompensa no fortalecimento das preferências de
(domínio irrestrito, eficiência de Pareto, independência de alternativas irrelevantes), a única maneira de garantir uma ordem de preferência geral racional (ou seja, completa e curto prazo; para discussão, vejaBerns e outros, 2007) mostram como a
transitiva) é deixando um ditador emergir, o chamado eleitor pivô , isto é, o eleitor cujas preferências influenciam a preferência social de uma forma ou de outra. No caso social, avaliação de diferentes utilidades temporais pode ser manipulada. Mas isso
isso é preocupante, porque não existem “ditadores natos” e temos boas razões para desejar que eles nunca apareçam. Mas no caso individual, o eu presente é, necessariamente, nada tem a ver com o fato de tal comparação ser possível em princípio, ao
um “ditador nato”, ou seja, alguém que, pela própria natureza do problema de escolha, tem o potencial de impor suas preferências sobre toda a sociedade de eus temporais. Esta contrário do que comumente se supõe no caso social.
su- a única forma de garantir uma ordenação de preferência geral racional (ou seja, completa e transitiva) é deixando emergir um ditador, o chamado eleitor pivô, isto é, o eleitor

cujas preferências passam a influenciar a preferência social de uma forma ou de outra. No caso social, isso é preocupante, porque não existem “ditadores natos” e temos boas

razões para desejar que eles nunca apareçam. Mas no caso individual, o eu presente é, necessariamente, um “ditador nato”, ou seja, alguém que, pela própria natureza do Uma vez que as assimetrias entre o caso interpessoal e intrapessoal
problema de escolha, tem o potencial de impor suas preferências sobre toda a sociedade de eus temporais. Esta su- a única forma de garantir uma ordenação de preferência geral permitem contornar alguns dos resultados limitantes de Arrow para o
racional (ou seja, completa e transitiva) é deixando emergir um ditador, o chamado eleitor pivô, isto é, o eleitor cujas preferências passam a influenciar a preferência social de uma SCT, seria de esperar encontrar um número significativo de estudos
forma ou de outra. No caso social, isso é preocupante, porque não existem “ditadores natos” e temos boas razões para desejar que eles nunca apareçam. Mas no caso individual, sobre como aplicar o SCT como um quadro normativo para a escolha
intertemporal. No entanto, este não é o caso: tanto quanto sei, a única
o eu presente é, necessariamente, um “ditador nato”, ou seja, alguém que, pela própria natureza do problema de escolha, tem o potencial de impor suas preferências sobre toda a sociedade de eus temporais. Esta su- o eleitor cujas preferências influenciam a preferência social de uma forma ou de outra. No caso social, isso é preocupante, porque não existem “ditadores natos” e temos boas razões para de

tentativa substancial nesse sentido foi feita por Steedman e Krause


(1986)em um capítulo de livro que, apesar de suas promessas, gerou
muito pouco interesse na literatura subsequente, e que posteriormente
10Na verdade, o senso técnico de ditadura de Arrow é mais amplo (verHylland, 1986), já

que um ditador é definido como alguém cujas preferências estritas sempre coincidem foi desenvolvido apenas por um dos autores originais (em particular,
com as da sociedade, de modo que o que acaba sendo preferido é sempre o que ele teria verKrause, 2010). Um dos objetivos desta seção é chamar a atenção
preferido por conta própria. Essa definição não exige que o ditador imponha suas para essa linha de trabalho, bem como enfatizar sua potencial
preferências à sociedade: mesmo um conformista absoluto, ou seja, alguém que sempre relevância para estudos comportamentais de escolha intertemporal.
adota as preferências dominantes da sociedade, contaria como um ditador no sentido de
Arrow. No entanto, o caso problemático que Arrow pretendia evitar, como o nome do
constrangimento indica, é o de um “verdadeiro ditador”, ou seja, alguém que obriga o Steedman e Krause propõem ver a função de agregação de diferentes
resto da sociedade a querer o que ele quer. ordenações locais, ou seja, diferentes preferências de vários tempos.
F. Paglieri / Processos Comportamentais 127 (2016) 97–108 105

eus gerais, como definindo ocaráter temporaldo agente. Eles primeiro tabela 1
Um problema de escolha com quatro fluxos alternativos de receitas (A, B, C ou D)
distinguem duas categorias gerais, caracteres cardinais versus caracteres
distribuídos em cinco intervalos de tempo (6, 12, 18, 24 e 30 meses), projetado para
ordinais, dependendo se as preferências cardinais ou ordinais são discriminar entre diferentes caracteres temporais.
consideradas e, em seguida, especificam uma variedade de caracteres
6 meses 12 meses 18 meses 24 meses 30 meses
temporais pertencentes a cada categoria. A seguir, uma lista não exaustiva,
apenas para dar uma indicação do poder expressivo de sua abordagem: A 15 22 15 16 12
caracteres cardinais B 16 2 15 26 25
C 6 7 4 52 11
D 4 23 18 9 26
• Tipo utilitário:tomar o curso de ação que maximiza a soma das
utilidades de todos os agentes envolvidos.
• tipo rawlsiano:tomar o curso de ação que maximiza a utilidade do Esses resultados sãometa-teóricas: exploram as condições de
agente menos satisfeito. possibilidade de uma política de agregação capaz de assegurar
• Tipos comprometedores (Krause 2010): tome o curso de ação que maximiza (um resultados racionais. No entanto, a mesma estrutura pode ser usada
certo tipo de) valor médio para todos os agentes (por exemplo, tipos para analisar a racionalidade, ou a falta dela, de comportamentos
aritméticos, geométricos, harmônicos, médios de potência). concretos de escolha intertemporal. Dado o mesmo problema de
escolha, ou seja, o mesmo conjunto de utilidades para diferentes eus
caracteres ordinais temporais, qual opção conta como racional depende do caráter
temporal do agente. Além disso, problemas de escolha específicos
• tipo pareto:tomar o curso de ação que é preferido a todos os outros por todos podem ser projetados para permitir a distinção entre diferentes
caracteres temporais. Isso é particularmente importante, se a noção de
os agentes.
• Tipo de contagem:tomar o curso de ação que é preferido a todos os caráter temporal tiver impacto nos estudos comportamentais de
escolha intertemporal. Embora, em princípio, faça todo o sentido supor
outros pela maioria dos agentes.
• Tipo hierárquico:tomar o curso de ação que é preferido a todos os que diferentes agentes podem ter diferentes políticas de agregação
para suas várias preferências temporais,
outros pelos agentes mais importantes.
• Tipo de Sen:tomar o curso de ação preferido por pelo menos um
agente.
O seguinte é um exemplo de um problema de escolha adequado para
discriminar entre quatro caracteres temporais diferentes. Os participantes devem
Em geral, os caracteres ordinais são muito mais problemáticos do escolher um dos quatro fluxos diferentes de receita, A a C, cujos pagamentos são
que os cardinais: não apenas são suscetíveis ao resultado de distribuídos ao longo do tempo conforme resumido emtabela 1.
impossibilidade de Arrow (as preferências ordinais impedem por Assumindo que os retornos em cada período de tempo indicam as
definição a comparação de utilitários), mas também sofrem de utilidades daquele eu temporal particular, o fluxo de consumo escolhido é
fraquezas adicionais, dependendo de sua política de agregação. Por indicativo de um caráter temporal diferente, ou seja, uma forma diferente de
exemplo, um tipo de Pareto frequentemente será indeciso, pois requer agregar essas utilidades: um agente com umrawlsianoo personagem
unanimidade, o que raramente é realizado. Um tipo Hierárquico é escolheria A, uma vez que garante a maior utilidade (12) para o self temporal
muito melhor na tomada de decisões, mas tem o problema de que termina com o pior retorno (aos 30 meses); um agente com umutilitário
estabelecer quem são os agentes mais importantes – ou seja, os eus o personagem, ao contrário, favoreceria B, já que a soma de todas as
temporais que têm prioridade na determinação do que fazer. E, claro, utilidades (84) é maior do que para todas as outras opções (80); alguém com
um tipo Sen é altamente arbitrário, porque o curso de ação preferido umBingingpersonagem11iria para C, uma vez que garante a maior
depende de qual agente específico está sendo considerado no recompensa individual (52 aos 24 meses); Considerando que alguém com
momento. Portanto, não surpreendentemente, os tipos de umcontandopersonagem optaria por D, uma vez que garante o maior
personagens mais interessantes são os cardeais, retorno em três intervalos de tempo de cinco (em 12, 18 e 30 meses). A
Steedman e Krause provaram que cada um desses caracteres criação de um número suficientemente grande de problemas de escolha
produz preferências globais que são completas, transitivas e reflexivas, semelhantes permitiria verificar se as escolhas dos participantes de fato
se e somente se esses caracteres forem considerados harmônicos e revelam um caráter temporal predominante, mantendo sob controle
sensíveis (1986, pp. 211-213).Harmoniaé uma propriedade das relações possíveis confusões. Algumas dessas confusões devem ser totalmente
entre diferentes ordenações locais, de modo que não difiram “muito” – evitadas, por exemplo, nunca incluir itens que representam sequências
ou seja, não existem duas opções A e B tais que A > B em uma crescentes ou decrescentes de recompensas (para evitar o tipo de efeito
ordenação local e B > A em outra.Sensibilidadeem vez disso, é uma observado emLoewenstein e Prelec, 1993; Haisley e Loewenstein, 2011) e
propriedade da relação entre as ordenações locais e a ordenação certificando-se de que o evento “binge” nunca esteja no início ou no final da
global, de modo que, se A > B em todas as ordenações locais, então A > série (para evitar dar muito destaque). Outras confusões, no entanto, não
B na ordenação global. Enquanto a sensibilidade é uma restrição podem ser evitadas e, portanto, precisam ser contrabalançadas entre os
manifestamente racional e tipicamente satisfeita, muitas vezes falta itens (juntamente com variáveis mais óbvias, como a ordem de
harmonia em cenários da vida real − inclusive em escolhas apresentação das opções): por exemplo, sempre haverá uma opção que
intertemporais, onde a forma da curva de desconto torna possível que supera as outras na primeira vez intervalo, e sempre haverá uma opção com
dois ordenamentos locais diferentes estejam em conflito em relação a maior valor total descontado, assumindo determinada função e taxa de
preferências estritas (por exemplo , LL > SS agora, mas SS > LL depois). desconto.mesa 2mostra como os itens podem ser projetados para manter
Como observam Steedman e Krause, “essa representação da sob controle essas duas variáveis:
racionalidade pode ser vista tanto como mostrando as suposições
necessárias para apoiar o postulado da racionalidade quanto como
indicando o campo limitado de aplicação desse postulado” (1986, p.
228). Em outras palavras,
11Este é um personagem cardeal que nunca foi discutido anteriormente nesta literatura, mas
tem plausibilidade psicológica óbvia. É fundamental, é claro, porque a própria definição de um
evento compulsivo, ou seja, um momento em que um prêmio significativamente maior é
alcançado em relação a todos os outros pontos no fluxo de consumo, requer uma comparação
quantitativa de utilidades.
106 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

mesa 2 distribuição máxima de constantes de velocidade (k)é trivial (verKilleen,


Outro problema de escolha com quatro fluxos alternativos de receitas (A, B, C ou D)
2001). Obtemos então o seguinte:
distribuídos em cinco intervalos de tempo (6, 12, 18, 24 e 30 meses), contrabalançando
algumas possíveis confusões. ∫∞ ∫∞
e−ke−kd dk = 1 e−k(1+d)|∞ 1
6 meses 12 meses 18 meses 24 meses 30 meses e−k(1+d)dk = 0=
1 +d 1 +d
A 14 30 16 2 18 0 0
B 5 6 5 60 4
C 15 12 15 21 17 Isso mostra que um modelo SCT de tomada de decisão intertemporal,
D 5 21 13 28 17
sob suposições maximamente simples/gerais, retorna a função de desconto
mais simples e padrão. É importante ressaltar que o fato de essas
suposições serem simples e gerais não as torna universais: por exemplo,
esse resultado supõe que as taxas de desconto sejam positivas, excluindo
Neste problema de escolha, A é a opção Counting, B a escolha assim instâncias conhecidas de taxas de desconto negativas, por exemplo,
Binging, C a alternativa Rawlsiana e D o ótimo Utilitário. A primeira no desconto de perdas (Yates e Watts, 1975; Van der Pol e Cairns, 2000) e em
coisa a notar é que emtabela 1a melhor opção aos 6 meses é a Utilitária efeitos de sequência (Loewenstein e Prelec, 1993; Haisley e Loewenstein,
(B), enquanto emmesa 2o vencedor aos 6 meses é Rawlsian (C). Além 2011). No entanto, este resultado preliminar mostra uma maneira
disso, assumindo o desconto hiperbólico de recompensas futuras12e interessante de harmonizar uma perspectiva SCT com uma abordagem de
usandoFórmula de Mazur (1987),V = A/(1 + kD),com uma taxa de modelagem de desconto de atraso: isso é importante, uma vez que o
desconto dentro da faixa geralmente observada em estudos humanos primeiro tem o potencial de oferecer uma visão diferenciada da
(ou seja,k =0,015), a opção que garante a maior soma de todas as racionalidade da escolha intertemporal, enquanto o último tem um
utilidades descontadas é a Rawlsiana emtabela 1(A) e o Contador em excelente histórico na captura da dinâmica de uma ampla variedade de
mesa 2(A novamente). Ao ajustar cuidadosamente as utilidades em fenômenos da vida real.
cada período de tempo, é possível contrabalançar entre os itens que
tipo de personagem garante o pagamento inicial ideal e a utilidade
5. Conclusões
descontada máxima, de modo a verificar se esses fatores afetam o
comportamento de escolha além do caráter temporal.
A tendência de assumir que as respostas LL em tarefas de escolha
Esta metodologia hipotética está atualmente sendo desenvolvida para
intertemporal são indicativas de autocontrole pode ser tentadora, mas
testes, e esta breve ilustração serve apenas para exemplificar como a noção
tanto as considerações metodológicas quanto as evidências empíricas
de caráter temporal pode ser verificada empiricamente. Independentemente
sugerem que essa suposição é equivocada em uma variedade de
do resultado dessa verificação, a mesma noção pode ser abordada do ponto
situações. Quando quantidades visíveis de recompensa são usadas, as
de vista da modelagem: ao fazê-lo, o desconto não é mais um fator de
escolhas de LL provavelmente serão infladas pela falha na inibição de
confusão a ser controlado, mas sim uma variável-chave a ser incluída no
uma resposta prepotente em relação à quantidade maior – o oposto do
modelo. O que se segue é apenas um esboço preliminar de um modelo
autocontrole. De forma mais geral, na ausência de uma linha de base
baseado em SCT de tomada de decisão intertemporal.13Considere um
para medir a motivação para maximizar a quantidade de reforçador, as
conjunto potencialmente infinito de eus temporais, todos compartilhando
respostas LL poderiam ser moduladas tanto pela aversão ao atraso
uma forma semelhante de desconto, mas com taxas de desconto
quanto pela força motivacional, tornando questionável a interpretação
radicalmente diferentes. Uma taxa de descontokperto de 0 denotaria
dos dados em termos de autocontrole. E mesmo quando as respostas
hipermetropia extrema, enquanto um perto de 1 indicaria impulsividade
LL podem ser interpretadas com segurança como revelando tolerância
extrema. Suponha uma distribuição uniforme de valores parakno intervalo
ao atraso, seja ou não esta a resposta normativamente correta,
[0,1]. Se agora perguntarmos qual seria, em média, sua função de desconto,
assumindo assim um compromisso krausiano, o cálculo é direto:

Por todas essas razões, avaliar a racionalidade das escolhas intertemporais


∫1 requer um arcabouço normativo bastante sofisticado. Uma vez que o problema
a a 1 a
dk = ln (1 +kd) | = ln (1 +d) −0 básico é como integrar racionalmente conjuntos de preferências conflitantes, é
1 +kd d 0 d
natural recorrer a modelos normativos originalmente desenvolvidos para avaliar a
0
racionalidade em contextos sociais. Tanto a teoria dos jogos quanto a teoria da
escolha social oferecem excelentes ferramentas para esse propósito: a última, no
Definindo a quantidadeum =1, obtemos uma curva de desconto com
entanto, tem sido muito menos estudada em conexão com a escolha
uma forma aproximadamente hiperbólica, conforme mostrado pelo ajuste
intertemporal. Portanto, é necessária uma investigação mais aprofundada sobre
da hipérbole (k =0,34). Isso é, no entanto, ainda bastante deselegante, uma
como aplicar a teoria da escolha social à tomada de decisão intertemporal, e este
vez que tanto o intervalo [0,1] quanto a hipérbole escolhida são arbitrários.
artigo pretende, de fato, promover maior atenção a essa abordagem em estudos
Consideremos então uma distribuição de entropia máxima de taxas de
comportamentais de autocontrole.
desconto para uma função de desconto de entropia máxima. Na linha semi-
A mensagem para levar para casa, no entanto, não deve ser mal
infinita (positiva), ambos são exponenciais e a média sobre isso
interpretada como algum tipo de ceticismo geral sobre os dados de escolha
intertemporal. Mesmo que haja razões para ser cauteloso na interpretação
desses dados em certas situações, ainda é o caso que as respostas LL, na
maioria das condições, revelam tolerância ao atraso. Da mesma forma, a
12Claramente, um tratamento semelhante pode ser usado assumindo, em vez disso, um
necessidade de uma compreensão normativa mais sofisticada da
desconto exponencial de recompensas futuras ou qualquer outra forma de desconto que se
deseje considerar. O importante é que em cada item a opção superior em termos de desconto
racionalidade das escolhas intertemporais é compatível com as respostas LL
deve associar-se a um caráter temporal diferente, para que possamos destrinçar desconto e que se tornam, possivelmente com bastante frequência, a estratégia
caráter temporal como explicações independentes das escolhas do sujeito. racional para lidar com dilemas intertemporais. A fábula da formiga e da
13Esta análise matemática da tomada de decisão intertemporal baseada em SCT é inteiramente
cigarra simplifica demais o que está em jogo na tomada de decisão
devida a Peter Killeen, que generosamente me ofereceu para publicação neste artigo enquanto
intertemporal, mas também capta o que é, na maioria das situações, um
atuava como revisor do manuscrito original. Sou muito grato a ele por esse presente perspicaz e
desejo que ele receba todo o crédito que lhe é devido; por outro lado, assumo total insight valioso: é melhor planejar com antecedência as contingências
responsabilidade por qualquer erro ou imprecisão remanescente. futuras, em vez de apenas focar no aqui e agora.
F. Paglieri / Processos Comportamentais 127 (2016) 97–108 107

A escolha ainda precisará fazer justiça a esse insight, enquanto ao mesmo Del Giudice, M., Gangestad, S., Kaplan, H., 2016.Teoria da história de vida e
tempo detalha em que condições ele não se aplica. Este é precisamente o Psicologia evolucionária. In: Buss, D. (Ed.), The Handbook of Evolutionary Psychology,
vol. 1: Fundações. , 2ª edição. Wiley, Hoboken, NJ, pp. 88–114. Della Vigna, S.,
tipo de flexibilidade permitido pela aplicação da teoria da escolha social à Malmendier, U., 2006.Pagar para não ir à academia. Sou. Econ. Rev.
escolha intertemporal, por exemplo, através da definição de vários 96, 694–719.
caracteres temporais, e a principal razão pela qual os cientistas Duckworth, A., Kern, M., 2011.Uma meta-análise da validade convergente de
medidas de autocontrole. J. Res. Pessoal. 45, 259–268.
comportamentais devem considerá-la com grande interesse, tanto como um Elster, J. (Ed.), 1986.O Eu Múltiplo. Estudos sobre Racionalidade e Mudança Social.
quadro teórico de referência , e como inspiração para novos designs University Press, Cambridge: Cambridge.
experimentais. Estle, SJ, Green, L., Myerson, J., Holt, DD, 2007.Desconto monetário e
recompensas diretamente consumíveis. Psicol. ciência 18, 58–63.
Evans, T., Beran, M., 2007.Os chimpanzés usam a auto-distração para lidar com
Referências impulsividade. Biol. Deixe 3, 599-602.
Evenden, J., 1999.Variedades de impulsividade. Psicofarmacologia (Berl) 146,
Addessi, E., Rossi, S., 2011.Tokens melhoram o desempenho do capuchinho no 348–361.
tarefa de contingência de recompensa reversa. Proc. R. Soc. Londres Ser. B 278, 849–854. Fawcett, T., McNamara, J., Houston, A., 2012.Quando é adaptativo ser paciente?: Uma
Addessi, E., Paglieri, F., Focaroli, V., 2011.A racionalidade ecológica do atraso estrutura geral para avaliar recompensas atrasadas. Behav. Processo. 89,
tolerância: insights de macacos-prego. Cognição 119, 142–147. Addessi, E., Paglieri, 128–136.
F., Beran, M., Evans, T., Macchitella, L., De Petrillo, F., Focaroli, Frederick, S., Loewenstein, G., O'Donoghue, T., 2002.Desconto de tempo e tempo
V., 2013.Adiar a escolha versus adiar a manutenção: diferentes medidas de preferência: uma revisão crítica. J. Econ. Aceso. 40, 351–401.
adiamento da gratificação em macacos-prego (Cebus apella).J. Comp. Psicol. 127 Fudenberg, D., Levine, D., 2006.Um modelo dual-self de controle de impulso. Sou. Econ.
(4), 392–398. Rev. 96 (5), 1449–1476.
Addessi, E., Bellagamba, F., Delfino, A., De Petrillo, F., Focaroli, V., Macchitella, L., Genty, E., Karpel, H., Silberberg, A., 2012.Preferências de tempo em macacos de cauda longa
Maggiorelli, V., Pace, B., Pecora, G., Rossi, S., Sbaffi, A., Tasselli, MI, Paglieri, F., 2014. (Macaca fascicularis)e humanos (homo sapiens).Anim. cogn. 15 (6), 1161–
Esperar por engano: a representação simbólica de recompensas modula a escolha 1172.
intertemporal em macacos-prego, pré-escolares e humanos adultos. Cognição 130, Gul, F., Pesendorfer, W., 2001.Tentação e autocontrole. Econométrica 69 (6),
428–441. 1403–1435.
Ainslie, G., 1992.Picoeconomia. Cambridge University Press, Cambridge. Ainslie, G., Hájek, A., 2005.O paradoxo do cara do cabo. Análise 65, 112–119.
2001.Destruição da Vontade. Cambrid Ugeniversity Press, Nova York. Amici, F., Aureli, Haisley, E., Loewenstein, G., 2011.Não é o que você consegue, mas quando você consegue: o
F., Call, J., 2008.Dinâmica de fissão-fusão, flexibilidade comportamental: efeito da sequência de presentes nos saldos de depósitos e no sentimento do cliente em um

e controle inibitório em primatas. atual Biol. 18, 1415–1419. banco comercial. J. Mercado. Res. 48 (1), 103–115.

Anderson, JR, Awazu, S., Fujita, K., 2000.Pode macacos-esquilo (Saimiri sciureus) Herrmann, E., Hand, D., Johnson, M., Badger, G., Heil, S., 2014.Atraso no exame
aprender autocontrole?: Um estudo usando testes de seleção de matriz de alimentos e desconto de sexo protegido por preservativo entre mulheres dependentes de opioides e mulheres

contingência de recompensa reversa. J. Exp. Psicol. Anim. Behav. Processo. 26, 87–97. de controle não usuárias de drogas. Droga Álcool Depende. 144, 53–60.

Anderson, JR, Awazu, S., Fujita, K., 2004.macacos esquilos (Saimiri sciureus) Holton, R., 2009.Querer, Querer, Esperar. Oxford University Press, Oxford. Hylland,
escolher matrizes de alimentos menores: retenção de longo prazo, escolha com A., 1986.O propósito e o significado da teoria da escolha social: alguns
alimentos não preferidos e transposição. J. Comp. Psicol. 118 (1), 58–64. observações gerais e uma aplicação ao 'problema de Lady Chatterley'. Em: Elster, J.,
Ariely, D., 2008.Previsivelmente irracional: as forças ocultas que moldam nossa Hylland, A. (Eds.), Fundamentos da Teoria da Escolha Social. Cambridge University
Decisões. Harper-Collins, Nova York. Press, Cambridge, pp. 45–73.
Arkes, H., Blumer, C., 1985.A psicologia do custo irrecuperável. Org. Behav. Zumbir. Decis. Jimura, K., Myerson, J., Hilgard, J., Braver, T., Green, L., 2009.As pessoas são realmente mais
Processo 35, 124–140. paciente do que outros animais?: Evidência do desconto humano de recompensas líquidas
Arrow, K., 1950.Uma dificuldade no conceito de bem-estar social. J. Polit. Econ. 58 (4), reais. Psiconom. Touro. Rev. 16, 1071–1075.
328–346. Jimura, K., Myerson, J., Hilgard, J., Keighley, J., Braver, T., Green, L., 2011.Domínio
Bénabou, R., Tirole, J., 2004.Força de vontade e regras pessoais. J. Polit. Econ. 112, independência e estabilidade no desconto de recompensas atrasadas em adultos jovens e
848-886. idosos. Behav. Processo. 87, 253–259.
Beran, MJ, Evans, TA, 2006.Manutenção do atraso da gratificação por quatro Johnson, M., Bruner, N., 2012.A tarefa de desconto sexual: comportamento de risco de HIV e
chimpanzés (Pan trogloditas):Os efeitos da visibilidade atrasada da recompensa, o desconto de recompensas sexuais atrasadas na dependência de cocaína. Droga
presença do experimentador e intervalos de atraso estendidos. Behav. Processo. 73, Álcool Depende. 123 (1–3), 15–21.
315–324. Johnson, M., Bruner, N., 2013. Confiabilidade teste-reteste e diferenças de gênero no
Beran, M., Pate, J., Rumbaugh, D., 1999.Atraso de gratificação em chimpanzés (Frigideira Tarefa de desconto sexual entre dependentes de cocaína. Exp. Clin.
trogloditas).Dev. Psicobiol. 34, 119–127. Psicofármaco. 21 (4),http://dx.doi.org/10.1037/a0033071. Kacelnik, A., 2003.A
Beran, M., Evans, T., Paglieri, F., McIntyre, J., Addessi, E., Hopkins, W., 2014. evolução da paciência. In: Loewenstein, G., Read, D.,
Chimpanzés (Pan trogloditas)podem esperar: quando quiserem: um estudo com a tarefa Baumeister, R. (Eds.), Time and Decision: Economic and Psychological Perspectives
híbrida de atraso. Anim. cogn. 17, 197–205. on Intertemporal Choice. Fundação Russell Sage, Nova York, pp. 115–138.
Beran, M., 2002.Manutenção do atraso auto-imposto de gratificação por quatro
chimpanzés (Pan trogloditas)e um orangotango (Pongo pygmaeus).J. Gen. Kalenscher, T., Pennartz, C., 2008.Um pássaro na mão vale dois no futuro?:
Psychol. 129, 49–66. A neuroeconomia da tomada de decisão intertemporal. Prog. Neurobiol. 84,
Berns, G., Laibson, D., Loewenstein, G., 2007.Escolha intertemporal − em direção a uma 284-315.
quadro integrativo. Tendências Cognit. ciência 11, 482-488. Keinan, A., Kivetz, R., 2008.Remediando a hipermetropia: os efeitos do arrependimento do autocontrole
sobre o comportamento do consumidor. J. Mercado. Res. 45, 676-689.
Bodner, R., Prelec, D., 2003.Utilidade de auto-sinalização e diagnóstico no dia a dia
tomando uma decisão. In: Brocas, I., Carrillo, J. (Orgs.), A Psicologia das Decisões Keough, K., Zimbardo, P., Boyd, J., 1999.Quem está fumando, bebendo e usando drogas?
Económicas, Volume 1: Racionalidade e Bem-estar. Oxford University Press, Perspectiva do tempo como preditor do uso de substâncias. Apl. Básico Sociedade Psicol.
Oxford, pp. 105–123. 21 (2), 149–164.
Boudry, M., Vlerick, M., McKay, R., 2015.A evolução pode nos tirar do gancho?: Killeen, P., 2001.Escrever e sobrescrever a memória de curto prazo. Psicon. Touro. Rev.
Avaliando a defesa ecológica da racionalidade humana. Consciente. cogn. 33, 8 (1), 18–43.
524-535. Killeen, P., 2015.Modelos de TDAH: cinco maneiras menores, quanto antes, melhor. J. Neurosci.
Boysen, S., Berntson, G., 1995.Respostas à quantidade: perceptual versus cognitiva Métodos 252, 2–13.
mecanismos em chimpanzés (Pan trogloditas).J. Exp. Psicol. 21, 82–86. Boysen, Kirby, K., Guastello, B., 2001.Fazer escolhas em antecipação a um futuro semelhante
S., Berntson, G., Hannan, M., Cacioppo, J., 1996.baseado em quantidade escolhas podem aumentar o autocontrole. J. Exp. Psicol. 7, 154–164.
interferência e representações simbólicas em chimpanzés (Pan trogloditas).J. Exp. Kirby, K., Marakovic, N., 1996.Recompensas probabilísticas de desconto de atraso: taxas
diminuem à medida que as quantidades aumentam. Psicon. Touro. Rev. 3, 100–104.
Psicol. Anim. Behav. Processo. 22, 76–86.
Boysen, S., Mukobi, K., Berntson, G., 1999.Superando o viés de resposta usando Kirby, KN, Petry, NM, Bickel, WK, 1999.Viciados em heroína descontam recompensas atrasadas
representações simbólicas de número por chimpanzés (Pan trogloditas).Anim. em taxas mais altas do que os controles não usuários de drogas. J. Exp. Psicol. Gn 128, 78–
Aprender. Behav. 27, 229–235. 87. Kivetz, R., Keinan, A., 2006.Hipermetropia arrependida: uma análise do autocontrole
Boysen, S., 2006.O impacto das representações simbólicas na cognição dos chimpanzés. arrependimentos. J. Consum. Res. 33, 273–282.

In: Hurley, S., Nudds, M. (Eds.), Rational Animals? Oxford University Press, Nova Kivetz, R., Simonson, I., 2002.Autocontrole para os justos: em direção a uma teoria da
York, pp. 489–511. pré-compromisso para entrar. J. Consum. Res. 29, 199–217.
Bratman, M., 1999.Faces da intenção: ensaios selecionados sobre intenção e agência. Krause, EUA, 2010.Dinâmica coletiva de agentes faustianos. In: Vint, J., Metcalfe, JS,
Cambridge University Press, Cambridge. Kurz, HD, Salvadori, N., Samuelson, P. (Eds.), Teoria Econômica e Pensamento
Carlson, S., Davis, A., Leach, J., 2005.Menos é mais: função executiva e simbólica Econômico: Ensaios em Honra de Ian Steedman. Routledge, Londres, pp. 374–385.
representação em pré-escolares. Psicol. ciência 16, 609–616. Charlton, S., Fantino, Laibson, D., 1997.Ovos de ouro e desconto hiperbólico. QJ Econ. 112, 443–477. List, C.,
E., 2008.Taxas específicas de commodities de desconto temporal: 2013. Teoria da escolha social. In: Zalta, E. (Ed.), The Stanford Encyclopedia of
a função metabólica está por trás das diferenças na taxa de desconto? Behav. Filosofia (Edição Inverno 2013).http://plato.stanford.edu/archives/win2013/
Processo. 77 (3), 334–342. entries/social-choice/.
Dekel, E., Lipman, B., Rustichini, A., 2009.Preferências motivadas pela tentação. Rev.
Econ. Viga. 76, 937–971.
108 F. Paglieri / Processos Comportamentais 127 (2016) 97–108

Loewenstein, G., O'Donoghue, T., 2004.Espíritos animais: afetivo e deliberativo Reynolds, B., de Wit, H., Richards, J., 2002.Atraso de gratificação e atraso
Processos no Comportamento Econômico. CAE Working Paper 2004-14, Cornell desconto em ratos. Behav. Processo. 59, 157–168.
University. Richards, J., Chock, M., de Wit, H., 1998.A depleção de serotonina causa prejuízos
Loewenstein, G., Prelec, D., 1993.Preferências por sequências de resultados. Psicol. na inibição sustentada em ratos. Sociedade Neurosci. Resumo 24, 1183.
Rev. 100 (1), 91–108. Rosati, A., Stevens, J., Hare, B., Hauser, M., 2007.A origem evolutiva do ser humano
Logue, A., 1988.Pesquisa sobre autocontrole: uma estrutura integradora. Behav. Cérebro paciência: preferências temporais em chimpanzés, bonobos e humanos adultos.
ciência 11, 665-709. atual Biol. 17, 1663-1668.
Madden, G., Bickel, W. (Eds.), 2010.Impulsividade: O Comportamental e Neurológico Ross, D., Spurrett, D., Kincaid, H., Stephens, L. (Eds.), 2007.Cognição Distribuída
Ciência do Desconto. APA, Washington. e a Vontade: Vontade Individual e Contexto Social. Cambridge, MIT Press. Ross,
Mazur, J., 1987.Um procedimento de ajuste para estudar reforçamento retardado. Em: D., 2008.Teoria clássica dos jogos: a socialização e a racionalização da
Commons, M., Mazur, J., Nevin, J., Rachlin, H. (Eds.), Quantitative Analysis of convenções. Topoi 27, 57–72.
Behavior: The Effects of Delay and of Intervening Events on Reinforcement Value, Russell, J., Mauthner, N., Sharpe, S., Tidswell, T., 1991.A tarefa do Windows como um
5. Erlbaum, Mahwah, pp. –73. medida de decepção estratégica em pré-escolares e sujeitos autistas. Br. J. Dev.
McClure, S., Laibson, D., Loewenstein, G., Cohen, J., 2004.Sistemas neurais separados Psicol. 9, 101–119.
valoriza recompensas monetárias imediatas e atrasadas. Ciência 306, 503– Schelling, T., 1984.Escolha e Consequência. Perspectivas de um Economista Errante.
507. McClure, S., Ericson, K., Laibson, D., Loewenstein, G., Cohen, J., 2007.Tempo Harvard University Press, Cambridge.
desconto para recompensas primárias. J. Neurosci. 27, 5796–5804. Schwarz, J., Schrager, J., Lyons, A., 1983.Atraso da gratificação por pré-escolares:
Metcalfe, J., Mischel, W., 1999.Uma análise do sistema quente/frio do atraso da gratificação: evidência para a validade do paradigma de escolha. Desenvolvimento infantil 54, 620–625.
dinâmica da força de vontade. Psicol. Rev. 106, 3–19. Sen, A., 1970.Escolha coletiva e bem-estar social. Holden-Day, São Francisco. Silberberg, A.,
Mischel, W., Shoda, Y., Rodriguez, M., 1989.Atraso de gratificação em crianças. Fujita, K., 1996.Apontando para quantidades menores de comida em um análogo de
Ciência 244, 933–938. Procedimento de Boysen e Berntson (1995). J. Exp. Anal. Behav. 66, 143–147. Soman,
Myerson, J., Baumann, A., Green, L., 2014.Desconto de recompensas atrasadas: D., Ainslie, G., Frederick, S., Li, X., Lynch, J., Moreau, P., Mitchell, A., Read, D.,
(A) interpretação teórica do questionário de Kirby. Behav. Processo. 107, 99–105. Sawyer, A., Trope, Y., Wertenbroch, K., 2005.A psicologia do desconto intertemporal:
por que os eventos distantes são avaliados de forma diferente dos proximais?
Nehring, K., 2006. Autocontrole por meio de preferências de segunda ordem. Documento de trabalho Mercado. Deixe 16, 347-360.
(última consulta em 30 de novembro de 2015, àshttp://emlab.berkeley.edu/ Steedman, I., Krause, U., 1986.de GoetheFausto,o teorema da possibilidade de seta e o
users/webfac/szeidl/e208 f06/nehring.pdf). tomador de decisão individual. In: Elster, J. (Ed.), The Multiple Self. Estudos sobre
Nisan, N., Roughgarden, T., Tardos, E., Vazirani, V. (Eds.), 2007.Jogo algorítmico Racionalidade e Mudança Social. Cambridge University Press, Cambridge, pp. 197–231.
Teoria. University Press, Cambridge: Cambridge.
Noor, J., Takeoka, N., 2010.Autocontrole ascendente. Teor. Econ. 5, 127–158. Paglieri, Stephens, D., Anderson, D., 2001.O valor adaptativo da preferência pelo imediatismo:
F., Focaroli, V., Bramlett, J., Tierno, V., McIntyre, J., Addessi, E., Evans, T., quando regras míopes têm consequências previdentes. Behav. Eco. 12, 330–
Beran, M., 2013.A tarefa de atraso híbrido: pode macacos-prego (Cebus apella) 339.
sustentar um atraso após uma escolha inicial para fazê-lo? Behav. Processo. 94, Stevens, J., Stephens, D., 2010.A natureza adaptativa da impulsividade. In: Madden, G.,
45–54. Paglieri, F., Addessi, E., Sbaffi, A., Tasselli, MI, Delfino, A., 2015a.É paciência ou Bickel, W. (Eds.), Impulsividade: A Ciência Comportamental e Neurológica do
motivação? Sobre confusão motivacional em tarefas de escolha intertemporal. J. Exp. Anal. Desconto. APA, Washington, pp. 361–387.
Behav. 103 (1), 196–217. Stevens, J., Hallinan, E., Hauser, M., 2005a.A ecologia e a evolução da paciência em
Paglieri, F., Parisi, D., Patacchiola, M., Petrosino, G., 2015b.Investigando dois primatas do Novo Mundo. Biol. Deixe 1, 223–226.
escolha intertemporal através da robótica evolutiva experimental. Behav. Stevens, J., Rosati, A., Ross, K., Hauser, M., 2005b.Vai viajar por comida: espacial
Processo. 115, 1–18. desconto em dois macacos do Novo Mundo. atual Biol. 15, 1855–1860.
Paglieri, F., 2012.Vontade de Ulisses: autocontrole, constrangimentos externos e jogos. Em: Stovall, J., 2010.Várias tentações. Econometrica 78, 349–376.
Paglieri, F. (Ed.), Consciência na Interação: O Papel do Contexto Natural e Social Thaler, R., Shefrin, H., 1981.Uma teoria econômica do autocontrole. J. Polit. Econ. 89
na Formação da Consciência. John Benjamins, Amsterdã, pp. 179–206. (2), 392–406.
Toner, I., Smith, R., 1977.Idade e verbalização aberta na manutenção do atraso
Parfit, D., 1984.Razões e Pessoas. Press, Oxford: Clarendon. comportamento em crianças. J. Exp. Psicol. Infantil. 24, 123–128.
Rachlin, H., 2000.A Ciência do Autocontrole. Harvard University Press, Cambridge. Read, Van den Bergh, B., Dewitte, S., Warlop, L., 2008.Biquínis instigam generalizada
D., Roelofsma, P., 1999.Escolhas difíceis e vontades fracas: a teoria da impaciência na escolha intertemporal. J. Consum. Res. 35, 85-97.
dilemas intrapessoais. Philos. Psicol. 12 (3), 341–356. Leia, D., 2001. Van der Pol, M., Cairns, J., 2000.Preferência de tempo negativa e zero para a saúde.
Dilemas intrapessoais. Zumbir. Relat. 54, 1093–1117. Economia da Saúde. 9 (2), 171–175.
Leia, D., 2004.Escolha intertemporal. In: Koehler, D., Harvey, N. (Eds.), Blackwell Yates, F., Watts, R., 1975.Preferências por perdas diferidas. Órgão. Behav. Zumbir.
Manual de Julgamento e Tomada de Decisão. Blackwell, Oxford, pp. 424–443. Executar. 13, 294-306.
Reynolds, B., Schiffbauer, R., 2005.Atraso na gratificação e atraso no desconto: um Zimbardo, P., Keough, K., Boyd, J., 1997.Perspectiva do tempo presente como um preditor de
modelo de feedback unificador do comportamento impulsivo relacionado ao atraso. Psicol. Gravando. 55, condução arriscada. Pers. Indiv. Dif. 23 (6), 1007–1023.
439-460.

Você também pode gostar