Você está na página 1de 26

1

REVISTA BRASILEIRA DE ANÁLISE DO COMPORTAMENTO / BRAZILIAN JOURNAL OF BEHAVIOR ANALYSIS, 2017, Vol. 13, No.1, 53-68.

CONVERGÊNCIAS ENTRE ANÁLISE DO COMPORTAMENTO E ECONOMIA NA EXPLICAÇÃO


DO COMPORTAMENTO DE ESCOLHA
CONVERGENCE BETWEEN BEHAVIOR ANALYSIS AND ECONOMICS ON THE EXPLANATION
OF CHOICE BEHAVIOR

FLÁVIO CAMPESTRIN BETTARELLO


ELENICE S. HANNA

UNIVERSITY OF BRASÍLIA
NATIONAL INSTITUTE OF SCIENCE AND TECHNOLOGY ON BEHAVIOR, COGNITION AND TEACHING (INCT-
ECCE), BRAZIL

Resumo

Por intermédio de uma revisão da literatura da Análise do Comportamento e da economia


sobre comportamento de escolha, particularmente o de escolhas intertemporais, este
artigo busca indicar a complementariedade das duas áreas de conhecimento na explicação
de um objeto de estudo comum. Tanto a Análise do Comportamento quanto a economia
têm empregado modelos matemáticos, notadamente em formulações exponenciais e
hiperbólicas, para buscar mensurar o comportamento de escolha intertemporal. Partindo
de aspectos teóricos e de modelos característicos de cada área, o presente artigo conclui
que, a despeito de diferenças na abordagem, o compartilhamento recíproco dos achados
da Análise do Comportamento e da economia pode contribuir para o avanço integrado do
conhecimento científico.
Palavras-chave: economia comportamental, comportamento de escolha, escolhas
intertemporais, quantificação de escolha
Abstract

Through an Analysis of Behavior and economics literature review on choice behavior


and, more specifically, on intertemporal choice, this article seeks to identify the
complementarities of both areas on the explanation of a common object of study. Both
Analysis of Behavior and economics researchers have been using mathematical models,
usually in exponential or hyperbolic formulations, to quantify intertemporal choice
behavior. Considering theoretical aspects and models of both areas, the present article
concludes that, despite differences in the approach, the sharing of Analysis of Behavior
and economics findings may contribute to the integrated advancement of scientific
knowledge.
Keywords: behavioral economics, choice behavior, intertemporal choice, quantification
of choice

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
1

Em 2002, o Prêmio Nobel de Iyengar (2010) assinala, nesse contexto,


Economia foi conferido ao psicólogo que o conceito de “escolha” pode ganhar
Daniel Kahneman, da Universidade de diversos significados e seu estudo pode ser
Princeton, em reconhecimento a seus conduzido segundo inúmeras abordagens
trabalhos sobre tomada de decisão em distintas. Parcela importante dos estudos
situações com probabilidade de ganho ou sobre tomada de decisão dedica-se à
perda. Todorov, Coelho e Hanna (2003) melhor compreensão das chamadas
registraram que pesquisadores de escolhas intertemporais, que envolvem a
diferentes áreas da psicologia ficaram avaliação de custos e benefícios cuja
“eufóricos” com a láurea. Destacaram, incidência dá-se em momentos distintos.
também, a importância da interação entre Esse tipo de escolha está presente em
economia e psicologia demonstrada a inúmeras situações de nosso quotidiano.
partir da análise econômica da tomada de Loewenstein e Elster (1992) mencionam,
decisão e do papel central de eventos por exemplo, a escolha entre dormir tarde
psicológicos em situações de escolha com ou acordar cedo; “beliscar” ou comer uma
alternativas conflitantes. De fato, a entrega refeição saudável; comprar um carro
do Nobel a Kahneman bem ilustra duas esportivo ou um sedã seguro; arrumar um
tendências atuais do movimento científico: emprego ou cursar uma faculdade; arriscar
o reconhecimento da psicologia e da a gravidez ou utilizar anticoncepcionais.
economia como campos de estudo Os processos psicológicos
complementares; e o destaque conferido a subjacentes a escolhas intertemporais
pesquisas sobre tomada de decisão e foram e são alvos de muitos estudos tanto
escolhas. na área de economia (e.g., Loewenstein &
A crescente aproximação entre Elster, 1992) quanto na de Análise do
psicologia e economia pode ser Comportamento (e.g., Logue, 1988;
exemplificada pela publicação, em 1997, Rachlin, 1989). As aplicações decorrentes
de edição especial do Quarterly Journal of de estudos sobre escolhas intertemporais
Economics da Universidade de Oxford, o são inúmeras e variadas. Meier e Sprenger
mais antigo periódico econômico em (2007), por exemplo, empregaram esse
língua inglesa, dedicada inteiramente à instrumental na explicação do
área de interface da Economia comportamento individual de crédito
Comportamental. Além disso, estima-se (poupança e consumo), expandindo
que hoje 20% das teses de pós-graduação pesquisas anteriores sobre padrões de
em economia elaboradas em universidades comportamento verificados no mercado de
norte-americanas de ponta (como, por cartões de crédito (Laibson, Repetto &
exemplo, Harvard, MIT, Princeton, Yale e Tobacman, 2007; Shui & Ausubel, 2005).
Stanford) associam-se a tal campo Schoenfelder e Hantula (2003) aplicaram
interdisciplinar (Troyjo, 2007). os conceitos de descontos intertemporais
No que diz respeito aos estudos para analisar as escolhas de carreira de
sobre tomada de decisão e escolhas, seu graduandos. Aplicação distinta foi a
universo de pesquisa atualmente é bastante empregada nos estudos de Fehr e Zych
amplo, enveredando por distintas áreas da (2000) e de O'Donoghue e Rabin (2002),
economia, psicologia, filosofia, sociologia, sobre a formação de hábitos e o
antropologia, matemática e estatística.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
2

desenvolvimento de comportamentos comportamento entre alternativas e a


aditivos (cf. Rachlin, 2000). distribuição de estímulos reforçadores.
Partindo de aspectos teóricos e de Com base nessas investigações, formulou
modelos sobre escolhas intertemporais, o a Lei da Igualação (matching law) (1970;
presente artigo buscará indicar que, a Todorov, 1991), pela qual propôs que
despeito das diferentes abordagens da tanto as medidas de frequência relativa de
Análise do Comportamento e da Economia respostas quanto de tempo relativo alocado
(quanto aos sujeitos experimentais, ao a uma alternativa igualam a frequência
delineamento de pesquisa, ao método relativa de reforços obtidos naquela
científico adotado e às técnicas de análise alternativa:
dos resultados empregadas, por exemplo), R1 / (R1 + R2) = SR1 / (SR1 + SR2)
as duas áreas são complementares.
Consequentemente, o compartilhamento (1)
dos achados das pesquisas em cada campo T1 / (T1 + T2) = SR1 / (SR1 + SR2)
poderia contribuir para o avanço integrado
do conhecimento científico. (2)
Abordagem da Análise do em que R, T e SR se referem a medidas de
Comportamento frequência de resposta, de tempo alocado e
Escolher é responder a um entre de frequência de reforços obtidos,
dois ou mais estímulos acessíveis e respectivamente, e os números indicam as
preferir é passar mais tempo respondendo alternativas de escolha.
(Skinner, 1950) ou responder mais a um As Equações 1 e 2 propostas por
deles (Hanna, 1991). A tomada de Herrnstein (1961) atraíram grande
decisões, a escolha entre alternativas e a interesse devido a sua aplicação a
demonstração de preferências são condições de reforço intermitente, quando
comportamentos verificados a todo o estímulo reforçador é apresentado apenas
instante (Todorov & Hanna, 2005). eventualmente e de acordo com regras
Mesmo em esquemas de reforçamento especificadas no esquema de reforçamento
simples, em que é programada pelo (Ferster & Skinner, 1957).
experimentador apenas uma contingência Verificou-se, porém, que em alguns
de reforço, inúmeras respostas casos a distribuição de respostas não
concorrentes, com seus correspondentes igualava a distribuição de reforços obtidos
reforços, são possíveis além da planejada (Todorov & Hanna, 2005). Observava-se,
(Herrnstein, 1961). na realidade, uma diminuição da
Para a Análise do Comportamento, sensibilidade do comportamento: as
o comportamento de escolha por si só não mudanças na distribuição dos reforços
diz muito: o interesse reside nas relações obtidos eram acompanhadas por mudanças
organismo-ambiente que caracterizam tal menores na distribuição de respostas.
comportamento. O fundamental é entender Apurou-se que tal distorção geralmente
onde, quando e em função de que variáveis ocorre por problemas específicos do
as escolhas e preferências são alteradas procedimento experimental, o que
(Todorov, 1982). significa que os procedimentos podem
Herrnstein (1961) foi pioneiro ao incorporar características de situações
investigar a relação entre a distribuição do naturais e que, portanto, apontam para

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
3

importante questão a respeito das COD de pelo menos 3 s é utilizado, ou


condições sob as quais a escolha ocorre. alguma outra consequência de respostas de
Tomemos como exemplo mudança que impeça a formação de
experimentos de comportamento operante cadeias simples é empregada (cf. Baum,
com pombos. Os sujeitos, antes de 1982; Boelens & Kop, 1983; Pliskoff &
expostos às condições experimentais, são Fetterman, 1981; Todorov, 1971; Todorov,
treinados a comer no comedouro e a bicar Acuña-Santaella, & Falcón-Sanguinetti,
os discos da caixa de comportamento 1982; Todorov & Souza, 1978; Todorov,
operante. Para esse treino, utiliza-se Souza & Bori, 1993), a Equação 1 tende a
alguma técnica de modelagem da resposta descrever bem a relação entre
e usualmente emprega-se alimento como comportamento e consequências em
reforço (Keller & Schoenfeld, 1950; esquemas concorrentes de intervalo
Skinner, 1953). No treino, normalmente variável. Mesmo assim, a Equação 1 se
toda bicada é reforçada (esquema de mostrou inadequada para explicar uma
reforçamento contínuo). Na primeira quantidade razoável de resultados
sessão experimental com esquemas experimentais. Para trabalhar com esses
concorrentes de intervalo variável, em que dados, Baum (1974, 1979; Baum &
as respostas são reforçadas após diferentes Rachlin, 1969) propôs uma equação com
intervalos de tempo decorridos a partir da maior número de parâmetros conhecidos
apresentação do último reforço, os pombos como Equação da Lei Generalizada de
tendem a alternar frequentemente de um Igualação (Generalized Matching Law):
disco para o outro quando as respostas não R1 / R2 = k (SR1 / SR2)a
são reforçadas, pois a extinção gera
variabilidade no comportamento (Keller & (3)
Schoenfeld, 1950). Ao invés de em que o parâmetro k é uma medida de
desempenhos independentes e viés, isto é, uma preferência por uma
concorrentes, é gerada uma cadeia simples, alternativa causada por variáveis outras
e a sequência reforçada tende a ser que não a frequência de reforços (Cunha,
repetida. Com o estabelecimento de uma 1988; Todorov & Bigonha, 1982), e o
cadeia de alternações, os animais parâmetro a é uma medida da
simplesmente não discriminam as fontes sensibilidade do comportamento à
alternativas de reforço. distribuição de reforços entre as
Herrnstein (1961), para superar alternativas (e.g., Hanna, Blackman, &
esse problema, programou um atraso de Todorov, 1992; Todorov, Oliveira-Castro,
reforço para respostas de alternação Hanna, Bittencourt de Sá, & Barreto,
(changeover delay – COD): nenhuma 1983).
resposta seria reforçada antes que se De Villiers e Herrnstein (1976)
passassem 1,5 s desde a última resposta de adaptaram as Equações das Leis de
alternação. O COD foi pensado por Igualação para uma situação de alternativa
Herrnstein como uma penalidade para única (ver, também, de Villiers, 1977).
mudanças de esquema e uma maneira de Essa adaptação parte do princípio já
separar temporalmente as respostas reconhecido por Herrnstein (1970) de que,
emitidas em um esquema dos reforços mesmo em situações em que apenas uma
obtidos em outro esquema. Quando um alternativa é programada, a taxa de

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
4

respostas reflete uma situação de escolha deles só pode ser determinado em relação
(e.g., entre pressionar a barra e se coçar, a outro bem que por ele pode ser trocado.
fareja as grades, ou qualquer outra forma Quanto maior a disponibilidade de um
de distração; Gonçalves, 2005; McDowell, bem em relação a outro, menor o valor
1989, 1988). A equação que reflete a subjetivo da aquisição de uma unidade
frequência de comportamento em que não adicional desse bem (menor o valor
há mais de uma alternativa programada é marginal do bem). Conforme exposto por
R1 = k.SR1 / (SR1 + SRe) Rachlin (1989), considerando que
podemos somar o valor de dois bens, uma
(4) função utilidade que poderia expressar o
em que k corresponde à taxa de resposta valor total de uma cesta de dois bens para
assintótica na ausência de alternativas e um indivíduo é:
SRe corresponde à somatória de todos os VA = k1 (Q1)s + k2 (Q2)s
outros reforçadores com exceção daquele
programado (De Villiers, 1977; De Villiers (5)
& Herrnstein, 1976; Gonçalves, 2005). em que VA é o valor total de uma cesta
Na interface entre Análise do composta pela quantidade Q1 de um bem 1
Comportamento e Economia, a igualação mais uma quantidade Q2 de um bem 2,
foi teoricamente colocada no contexto da sendo k1 e k2 constantes que representam a
teoria da evolução (Logue, 1988) contribuição de cada bem para o valor e o
associada ao comportamento racional, ou expoente s uma medida da
seja, ao comportamento maximizador, substituibilidade entre os bens 1 e 2.
seguindo a ideia de que os organismos têm Percebe-se que, caso s seja igual a 1,0, os
melhores chances de sobrevivência quando bens são perfeitamente substituíveis e o
se comportam de maneira a maximizar, ao valor total depende apenas da soma
longo de certo período de tempo, a ponderada do valor de cada bem. Caso se
obtenção de reforços possíveis em uma tivesse que escolher apenas um desses dois
dada situação (Rachlin, 1989; Rachlin, itens, a solução maximizadora seria
Battalio, Kagel, & Green, 1981). simplesmente a escolha pelo bem presente
Para melhor explicar a em maior quantidade. No entanto, caso os
maximização, é necessário introduzir o itens não sejam perfeitamente substituíveis
conceito de substitutabilidade, que indica o (s < 1), a escolha depende não só da
quanto determinado indivíduo está quantidade mas também da
disposto a trocar um bem por outro (para substitutabilidade.
comparações terminológicas entre Análise A teoria econômica prevê também
do Comportamento e Economia, ver a existência de uma outra equação que
Tabela 1). Caso os bens sejam representa a restrição orçamentária à
perfeitamente substituíveis, é indiferente escolha, partindo do pressuposto que não
para um sujeito ter apenas um bem, ter há disponibilidade infinita de bens. A
apenas o outro, ou ter qualquer teoria da maximização prediz que, dado
combinação dos dois. A única dimensão de um conjunto possível de alternativas
interesse é a quantidade total dos bens. representadas pela linha de restrição, a
Caso os bens não sejam perfeitamente escolha será feita para o ponto em que a
substituíveis, o valor econômico de um

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
5

utilidade subjetiva for máxima (ver Figura 1).

Figura 1. Maximização: alternativas de bens A1 (eixo x) e A2 (eixo y), curva de utilidade

subjetiva, curva de restrição orçamentária e ponto de maximização.

A relação entre igualação e maximização é Nesse caso, percebe-se que o expoente s


matéria de grande debate (e.g., Commons, da Equação 6 corresponde ao expoente a
Mazur, Nevin & Rachlin, 1987): alguns da Lei Generalizada de Igualação
acreditam que a maximização só ocorre (Equação 3), sendo que a sensibilidade à
quando de acordo com a igualação; outros, distribuição dos reforços corresponde à
o contrário. O fato é que, na maioria dos medida de substitutabilidade entre eles.
casos, tanto a maximização quanto a Em determinadas condições
igualação fazem a mesma predição correta experimentais, no entanto, verificou-se que
do comportamento. Rachlin (1989) os organismos podem não conseguir
aproxima a Função Utilidade (Equação 5) maximizar reforços e ainda assim igualar
das equações utilizadas em Análise do distribuição de respostas e distribuição de
Comportamento ao trocar as variáveis A1 e reforços obtidos (Herrnstein & Vaughan,
A2, indicativas da quantidade disponível 1980). Dados experimentais têm mostrado
de cada bem, por variáveis SR1 e SR2 (e.g., Rodriguez & Logue, 1986;
indicativas da frequência de reforçamento Schneider, 1973; Todorov, 1973) que
em um período T determinado: organismos, em situação de escolha, são
VA = k1 (SR1)s + k2 (SR2)s mais sensíveis a variações na frequência
relativa de reforços do que a variações em
(6) magnitude relativa ou atraso relativo – um
princípio não previsto por teorias que

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
6

afirmam que os indivíduos tendem a Rachlin (Rachlin, 1989; Rachlin,


distribuir suas respostas para maximizar os Green e Tormey, 1988) considera que a
reforços disponíveis (e.g., Logue, 1988; discussão sobre a preponderância da
Rachlin et al., 1981; Rachlin, Logue, igualação ou da maximização é
Gibbon, & Frankel, 1986). estritamente conceitual, dependendo
Dessa forma, igualação não apenas de como esses termos são
corresponde exatamente à maximização. definidos. Caso maximização corresponda
Caso identifiquemos maximização com a um grande intervalo temporal,
racionalidade, como é caro à Economia, dificilmente os comportamentos de
isso teoricamente significa dizer que, em escolha seguem suas predições. No
determinadas situações, indivíduos cujas entanto, caso maximização simplesmente
escolhas seguem a igualação estão se signifique que o comportamento de
comportando apenas quase-racionalmente. escolha corresponde à opção ótima para
Simon (1978) elaborou o termo satisficing alguma função de utilidade referente a um
para situações em que, considerando intervalo temporal determinado, então os
limitações de tempo e de informação, as comportamentos podem ser corretamente
escolhas são sub-ótimas. Um exemplo de descritos como “racionais”. A igualação
satisficing seria quando um indivíduo não pode ser vista como uma forma de
conta seu troco em moedas de maneira maximização para uma visão limitada do
minuciosa. É de se esperar que, algumas futuro e, conforme eventos futuros sejam
vezes, esse indivíduo perca dinheiro. No mais e mais descontados, igualação e
entanto, considerando um horizonte maximização tendem a convergir (para
temporal amplo, pode-se argumentar que o uma comparação entre visão molar e visão
tempo e o esforço mental economizados ao molecular da teoria de escolha, ver Baum,
não se contar o troco mais do que 2004). Com base nesse entendimento,
compensam as perdas financeiras. No Rachlin (1989) elaborou interessante
longo prazo, portanto, satisficing também tabela com a equivalência entre termos
poderia ser considerado um exemplo de econômicos e da análise do
comportamento racional. comportamento:

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
7

Tabela 1.
Comparação da Terminologia Empregada em Experimentos de Escolha-Operante e em
Economia (Rachlin, 1989; tradução livre dos autores)
Escolha Operante Escolha Econômica
Contingência objetiva Esquema de reforçamento Restrições
Resultados positivos Reforço Bens (commodities)
Resultados negativos Punição Prejuízos (commodities)
Escolha simétrica Esquemas concorrentes de Alocação de renda entre
reforçamento bem 1 ao preço 1 e do bem
2 ao preço 2
Escolha assimétrica Esquema simples de Alocação de tempo entre
reforçamento trabalho e lazer

Processo subjetivo de Igualação Maximização


escolha

Retornando ao desenvolvimento R1 / R2 = (SR1 . A1 / SR2 . A2)


histórico dos estudos sobre igualação, a
transformação logarítmica da equação de (8)
igualação facilitou a pesquisa sobre outros em que A é a duração do estímulo
parâmetros do estímulo reforçador. A reforçador. Utilizando a forma logarítmica
equação da Lei Generalizada de Igualação da Lei da Igualação, Schneider (1973) e
(Equação 4), em sua forma logarítmica, Todorov (1973), independentemente,
pode ser escrita como: demonstraram que, em situações de
log (R1 / R2) = log k + a log (SR1 / escolha nas quais tanto a frequência
SR2) (7) quanto a magnitude dos estímulos
Neuringer (1967) propôs uma extensão da reforçadores variam, a frequência é mais
equação original de Herrnstein (1961) para importante que a magnitude:
situações nas quais tanto a frequência log (R1 / R2) = log k + a log (SR1 /
R
quanto a magnitude, computada S 2) + b log (A1 / A2) (9)
originalmente como a duração do acesso em que sA é o expoente que mede a
ao alimento, dos estímulos reforçadores sensibilidade do comportamento a
alternativos variam, empregando uma alterações na magnitude de reforço, seja
simples regra multiplicativa para em termos de duração de acesso ao
relacionar a distribuição de respostas à alimento para pombos (Oscós & Todorov,
distribuição dos efeitos combinados de 1978; Todorov, 1973; Todorov, Hanna, &
frequência e duração do reforço: Bittencourt de Sá, 1984), seja em termos

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
8

de número de pelotas de alimento para em uma mesma equação com múltiplas


ratos (Schneider, 1973). Nos experimentos variáveis já foi empregada com resultados
citados, o expoente da Equação 5 para satisfatórios. Logue, Peña-Correal,
frequência de reforço (a) foi próximo de Rodriguez e Kabela (1986) sugeriram a
1,0 e o expoente para magnitude (b) ao seguinte equação, combinando grande
redor de 0,5. número de variáveis:
Além da magnitude e da frequência log (R1 / R2) = log k + a log (SR1 /
do estímulo reforçador, outro parâmetro SR2) + b log (A1 / A2)
explorado pelos pesquisadores foi o + c log (D2 / D1)
chamado atraso de reforço (cf. Azzi, Fix,
Keller & Rocha e Silva, 1964). Observa- (12)
se, no ambiente natural, que nem sempre a A Equação 12 é a forma mais ampla da
consequência de um comportamento equação da Lei Generalizada de Igualação
ocorre imediatamente após a emissão da (Baum, 1979). Quando os esquemas
resposta. É comum que certo tempo alternativos programam reforços de
decorra entre a resposta reforçada e a mesma duração e atraso, a Equação 12 se
apresentação do estímulo reforçador reduz à Equação 7. Quando apenas os
(atraso de reforço). Chung e Herrnstein atrasos são iguais, ela se reduz à Equação
(1967) estudaram os efeitos de variações 9. Quando as magnitudes e frequências são
na duração do atraso de reforço em iguais e os atrasos são diferentes, a
esquemas concorrentes de intervalo Equação 12 se reduz à Equação 11.
variável e concluíram que o princípio da Rodriguez e Logue (1986) usaram
igualação se aplicava também aos dados outra variante ao manipular os valores de
de seu experimento: duração e atraso de reforço mantendo
R1 / R2 = [1 / (1 + D1)] / [1 / (1 + iguais e constantes as frequências de
D2)] (10) reforços:
em que D é a duração do atraso. Williams log (R1 / R2) = log k + b log (A1 /
e Fantino (1978) analisaram os dados de A2) + c log (D2 / D1) (13)
Chung e Herrnstein (1967) utilizando outra Com essa equação, Rodriguez e Logue
equação em forma logarítmica: (1986) encontraram um valor de 0,5 para b
log (R1 / R2) = log k + c log (D2 / e um valor também de cerca de 0,5 para c,
D1) (11) resultados confirmados em experimento
em que c é a sensibilidade do posterior (Chavarro & Logue, 1988).
comportamento a variações no atraso de As inúmeras equações apresentadas
reforço. A re-análise de Williams e demonstram os esforços teóricos
Fantino (1978) mostrou que no empreendidos para capturar todas as
experimento de Chung e Herrnstein (1967) variáveis relevantes do comportamento de
o valor de c na Equação 11 foi diferente escolha em uma expressão empiricamente
para atrasos curtos e para atrasos mais testável. Como exposto, uma dimensão
longos. Logo, c não seria uma constante que se mostrou bastante relevante para a
independente do valor absoluto do atraso compreensão da relação entre frequência
de reforço, mas sim uma variável. de reforço e frequência de resposta é a do
A combinação de frequência, atraso existente entre a emissão do
magnitude e atraso do estímulo reforçador comportamento e a liberação do reforço.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
9

Situações envolvendo atraso, em conjunto 1974, 1978) salientou a importância do


com aquelas em que a liberação do reforço tema, afirmando que os indivíduos muitas
está associada a uma probabilidade, foram vezes controlam parte de seu próprio
denominadas situações de risco (Green & comportamento nos casos em que uma
Myerson, 1996; Kacelnick & Bateson, resposta leva tanto a reforçamento positivo
1996). O aumento do atraso ou a quanto a negativo, ou seja, em casos de
diminuição da probabilidade de um conflito. Assim, segundo a noção de
determinado evento diminui a preferência autocontrole de Skinner, o fenômeno é
por ele, ou seja, diminui o valor que aquele uma contingência com duas consequências
evento tem para um determinado (reforço e punição) para uma mesma
organismo – aos eventos atrasados ou resposta controlada (Rc). Há uma história
prováveis são dados descontos (Grace, individual em que ocorre o
1999). Esses descontos encontram-se estabelecimento de propriedades aversivas
intimamente associados à noção para o comportamento controlado, sendo
econômica de taxas de descontos que respostas que reduzem a probabilidade
individuais (individual discount rates – desse comportamento podem ser
IDRs), ou seja, uma taxa que mede o fortalecidas. Faz parte da contingência um
quanto um bem perde de seu valor segundo comportamento, controlador
subjetivo em função do atraso para sua (Rac), que altera a probabilidade da
disponibilização. resposta controlada. As mudanças na
O atraso no reforço, o período que contingência do comportamento
decorre desde a emissão da resposta até a controlado pelo comportamento
liberação da consequência, é uma das controlador podem (a) reduzir/aumentar a
variáveis de influência da distribuição de intensidade de estímulos eliciadores ou
escolhas mais pesquisadas, tanto em aversivos; (b) produzir/retirar estímulos
estudos com animais não-humanos quanto discriminativos; (c) modificar a motivação
em estudos com participantes humanos. através da criação de operações
Segundo Gonçalves (2005, p. 16), “o estabelecedoras; (d) tornar
efeito do atraso sobre o processo de reforçadores/punidores altamente
escolha deu origem a uma série de prováveis; ou (e) desenvolver alternativas
pesquisas que formaram o corpo de boa comportamentais que não impliquem em
parte do que se chama, em Análise punição. Skinner considera, assim,
Experimental do Comportamento, de diversas formas de autocontrole. Vale
Autocontrole”. assinalar que o autocontrole não é uma
Cabe, aqui, um pequeno aparte para característica inata dos indivíduos.
relativizar essa afirmação de Gonçalves Segundo Hanna e Ribeiro (2005, p. 175),
(2005). Hanna e Todorov (2002) advertem “autocontrole é um termo muitas vezes
que inúmeros pesquisadores têm relacionado com traços de personalidade,
restringido a generalidade do fenômeno do características inatas dos indivíduos ou
autocontrole ao enfatizar demasiadamente força interior que possibilita o controle de
a relação entre autocontrole e reforçadores suas próprias ações. Este uso do conceito
atrasados (Logue, 1988). O fenômeno, contrasta com o fato de que uma mesma
como estes autores bem expõem, é muito pessoa pode apresentar graus diferentes de
mais abrangente. Skinner (1953, 1963, autocontrole em situações diferentes, e

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
10

mostrar graus de autocontrole diferenciado um período de tempo T, a duas chaves


em situações semelhantes, mas em etapas iluminadas: R1, que levava a 2 s de
diversas da sua vida”. apresentação imediata de alimento seguida
A acepção de autocontrole por 6 s de blackout, e R2, que levava ao
empregada por Gonçalves (2005) ao se mesmo resultado de R2 em B. Respostas
referir a estudos sobre atraso de reforço é a em B significam, assim, uma resposta de
que foi inicialmente desenvolvida por compromisso, pois apenas a situação de
Rachlin (1970, 1974, 1976, 1989) e por reforço atrasado se torna disponível. Os
Rachlin e Green (1972). Consideram-se autores identificaram que a preferência
dois concorrentes operantes e pela chave B aumentava em função do
incompatíveis, R1 e R2, que ocorrendo na período T. Interpretou-se esse resultado
presença de condições ambientais pelo que ficou conhecido como Modelo
diferentes (SD1 e SD2) produzem Ainslie-Rachlin: o valor subjetivo do
consequências diferenciais (SR1 e SR2), reforçador, ou seja, sua eficácia (Ainslie,
sendo SR2 atrasada: 1975), diminui na medida em que o
SD1 : R1 − SR1 momento de apresentação do reforçador
SD2 : R2 − SR2 atrasado distancia-se do momento de escolha. Há,
Como o atraso de SR2 reduz seu valor assim, um fenômeno de desvalorização,
reforçador, a probabilidade de R1 é maior com uma preferência menor pelo
do que a de R2. Entretanto, uma Rac pode reforçador atrasado do que pelo reforçador
modificar as condições ambientais e imediato – o que, como já vimos, na
inverter as probabilidades de R1 e R2. Economia se chama de desconto de
Rachlin e seus seguidores definem utilidade para bens diferidos.
autocontrole, com base nesse modelo, O Modelo Ainslie-Rachlin
como a escolha ou preferência pela representa o valor subjetivo dos
alternativa de reforçamento maior reforçadores (eixo x da Figura 2) por
atrasado, sendo a escolha do estímulo curvas em formato de hipérbole, em
reforçador menor imediato chamada de função do tempo decorrido entre a emissão
impulsividade (Hanna & Todorov, 2002). do comportamento e a obtenção dos
Rachlin e Green (1972) realizaram reforçadores (eixo y). As curvas de valor
uma pesquisa sobre respostas de do reforçador menor imediato e do
compromisso, utilizando um procedimento reforçador maior atrasado se cruzam em
de esquemas concorrentes encadeados com determinado ponto (valor de atraso).
pombos. Nesse procedimento, o elo inicial Depois desse ponto, o valor subjetivo do
(FR 25, chaves A e B) conduzia a uma de reforço menor imediato passa a ser maior
duas possíveis respostas dependendo da do que o valor do reforço maior atrasado,
25ª resposta emitida. Uma resposta em B ocorrendo uma inversão, ou seja, uma
levava, após um período de tempo T, à mudança na preferência. Exatamente nesse
iluminação de uma chave em que a ponto, torna-se indiferente a escolha entre
resposta R2 levava a um blackout de 4 s os dois reforçadores. Tem-se, portanto, um
seguido de 4 s de disponibilidade de ponto de indiferença (ver Figura 2).
alimento. Uma resposta em A levava, após

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
1

Figura 2. Modelo Ainslie-Rachlin: curvas de valor subjetivo do reforço menor imediato e


do reforço maior atrasado em função do tempo e ponto de indiferença.

Caso sejam encontrados diferentes situação apetitiva, com um aumento da


pontos de indiferença para distintas magnitudes preferência pela alternativa atrasada em função
de reforçadores, é possível traçar uma curva de do aumento do atraso. Os resultados do estudo
indiferença representativa do comportamento corroboraram essa hipótese.
de valoração / desconto intertemporal de cada Buscando desenvolver um modelo
indivíduo. matemático que pudesse relacionar a influência
O Modelo Ainslie-Rachlin foi estendido do atraso sobre o valor subjetivo de
para situações envolvendo mudanças na reforçadores, Mazur (1987) desenvolveu um
magnitude e no atraso de estímulos aversivos procedimento distinto do de Rachlin e Green
por Deluty, Whitehouse, Mellitz e Hineline (1972). Enquanto na pesquisa de Rachlin e
(1983). Em seu experimento, o reforço foi Green as escolhas eram feitas entre uma
substituído por choques. Em um período inicial alternativa de compromisso e outra que
de 5 s , denominado período de compromisso, conduzia a uma nova escolha entre duas
uma resposta levaria à apresentação de um alternativas, no estudo de Mazur as escolhas se
período T (variável) acrescido de 5 s de atraso davam entre alternativas com diferentes valores
e 0,5 s de choque. No caso de ausência de de atraso. Esse último tipo de procedimento foi
respostas no período de compromisso, após o denominado procedimento de ajuste ou
período T haveria o denominado período de esquema de titulação (titration).
escolha, em que uma resposta levaria à Nesse primeiro procedimento de
apresentação de um choque de 0,5 s titulação, pombos foram expostos a uma
imediatamente e a ausência de respostas levaria contingência que requeria uma resposta inicial
a um atraso de 5 s seguido da apresentação de que ativava duas chaves, A e B (Mazur,1987).
um choque de 5 s. Esperava-se um Respostas em A eram seguidas por um atraso
comportamento simetricamente oposto ao da fixo e depois por 2 s de acesso ao alimento.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
2

Respostas em B levavam a um atraso ajustável aumentos no atraso e e é a base do logaritmo


seguido por 6 s de acesso ao alimento. Cada natural.
sessão experimental foi dividida em 16 blocos O segundo modelo apresentado por
de 4 tentativas. Em cada bloco, as 2 primeiras Mazur (1987) foi o modelo hiperbólico, em
tentativas eram de escolha forçada, uma com a que o valor do reforço também é inversamente
iluminação e disponibilização apenas da chave proporcional ao atraso, porém segundo uma
A, e outra com iluminação e disponibilização função de aceleração negativa decrescente (a
apenas da chave B. Nas outras 2 tentativas, redução do valor subjetivo é mais acentuada
ambas as chaves eram iluminadas e a escolha inicialmente e, para atrasos maiores, mais
era livre. As respostas nas tentativas livres gradual):
determinavam o ajuste no atraso do reforçador V = A / (1 + KD)
maior: duas respostas em A diminuíam o atraso (15)
em 1 s no bloco seguinte; duas respostas em B Por fim, Mazur (1987) introduziu o modelo
levavam a um acréscimo de 1 s; e uma resposta hiperbólico-exponencial, em que é apresentado
em cada chave mantinha o tempo do atraso. um parâmetro S que busca representar
Percebe-se que, com esse variações individuais na avaliação do tempo de
procedimento, Mazur (1987) buscou atraso:
determinar os pontos de indiferença, pontos em V = A / (1 + KDS)
que o valor do reforçador atrasado fosse (16)
equivalente ao valor do reforçador imediato, Os resultados obtidos por Mazur (1987)
levando a uma distribuição similar das favorecerem o modelo hiperbólico, que
respostas dos sujeitos entre as duas chaves. Ao apresentou um bom ajuste aos dados empíricos.
longo do experimento, foram apresentados O modelo hiperbólico-exponencial não foi
distintos atrasos, de 0 a 20 s. Para cada um descartado, mas a adição de um parâmetro livre
desses atrasos, determinou-se um ponto de adicional, dificultando sua interpretação e
indiferença distinto, a partir dos quais Mazur tornando o modelo menos parcimonioso, fez
buscou avaliar a adequação de diversos tipos com o que o autor reputasse o modelo
de modelos matemáticos explicativos da hiperbólico como mais adequado.
relação entre o valor de determinado reforço e Mazur (2006) analisa algumas
seu atraso. peculiaridades da opção por um modelo
O primeiro modelo apresentado por exponencial ou hiperbólico. Esse autor afirma
Mazur (1987) foi o exponencial, em que o que os economistas – especificamente os
valor do reforço é inversamente proporcional economistas clássicos, como será abordado
ao atraso, segundo uma função de aceleração mais à frente neste estudo – favoreceram a
negativa constante: equação exponencial como função adequada
V = Ae-KD para representar o desconto intertemporal por
(14) ela aparentar ser mais “racional”: todos os
em que V é o valor ou força de um reforço reforçadores são descontados por um mesmo
disponibilizado após um intervalo D, A percentual conforme o tempo passa,
representa o valor do reforço caso ele fosse independente de sua magnitude ou do
disponibilizado imediatamente, K é um momento de sua liberação (ou seja, a IDR é
parâmetro representativo das diferenças constante). Porém, como discutido por Ainslie
individuais que determinam o quão (1975), se o parâmetro de desconto K (ver
rapidamente o valor de V declina com Equações 14 e 15) for o mesmo para os dois

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
3

reforços, imediato e atrasado, a equação instrumentos financeiros disponíveis a cada


exponencial não permite a inversão de participante, a taxa anual de juros de cada um
preferência em uma situação de escolha desses instrumentos, seu saldo corrente e a
intertemporal: uma pessoa que preferir um percepção individual de possibilidade de
reforço maior atrasado hoje deve manter essa obtenção de empréstimos, linha de crédito e
preferência com a passagem do tempo. Em cartão de crédito. Foram encontradas
alguns casos específicos, porém, quando K é correlações entre algumas características sócio
maior para o reforço menor do que para o demográficas e as IDRs determinadas para
reforço maior, a equação exponencial pode cada participante (escolaridade, condição
prever inversões de preferência (Green e profissional – estudante, aposentado,
Myerson, 1993). A equação hiperbólica, por empregado ou desempregado –, anos após a
sua vez, prediz a inversão de preferências meia-idade, percepção de acesso a
independente dos valores do parâmetro K instrumentos financeiros).
(como nos casos, segundo Mazur, em que uma A pesquisa de Harrison, Lau e Williams
pessoa que está fazendo uma dieta promete não (2002) demonstrou que há diferença
repetir de prato no almoço, mas muda de ideia significativa entre a IDR determinada para um
durante a refeição e come mais do que tinha atraso de 6 meses e as IDRs determinadas para
planejado). os demais atrasos, contradizendo a hipótese do
Harrison, Lau e Williams (2002) modelo exponencial e corroborando o
testaram a suposição do modelo exponencial de comportamento das taxas de desconto do
que a IDR é constante para diferentes atrasos. modelo hiperbólico.
Para isso, empregaram procedimento Após o desenvolvimento e emprego por
experimental já utilizado por Coller e Williams Mazur (1987) de modelos matemáticos
(1999), denominado de lista de preços explicativos da relação entre o valor de
múltiplos (Multiple Price List – MPL). A MPL determinado reforço e seu atraso em estudos
apresenta 15 binômios de escolha entre um com animais, delineou-se em estudos com
reforço menor a ser disponibilizado em data humanos o procedimento que ficou conhecido
futura próxima e um reforço maior a ser como desvalorização pelo atraso ou delay
disponibilizado em data posterior. Cada um dos discounting (DD). Nesse procedimento, fixa-se
binômios de escolha encontra-se associado a ou o reforço menor ou o reforço maior atrasado
uma IDR distinta. Harrison et al. aplicaram a e varia-se o outro reforço. O objetivo é
MPL para quatro atrasos diferentes: 6, 12, 24 e encontrar o par de valores em que é indiferente
36 meses. para o sujeito escolher entre um ou outro
Para controlar a possibilidade de a reforço. Tal par é identificado quando se
apresentação de múltiplos atrasos afetar a observa a inversão da preferência do sujeito de
resposta dos participantes, foram realizadas um para outro reforço, o switching point. O
duas séries experimentais: em uma delas, os ponto de indiferença tem de estar localizado
participantes foram aleatoriamente distribuídos entre os dois pares de alternativas em que se
para uma sessão em que deveriam considerar verifica a mudança. Considerando as
apenas um atraso; na outra, cada participante diferenças de magnitude entre o reforço menor
realizou sessões considerando os quatro imediato e o reforço maior atrasado no ponto
atrasos. Os autores utilizaram questionários de indiferença, é possível auferir a taxa
para coletar informações sobre características individual de desconto para determinado
sócio demográficas dos participantes, atraso.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
4

Repetindo-se a operação de esquema concorrente encadeado é determinado


identificação de pontos de indiferença para pela quantidade da redução do atraso que
distintos atrasos, é possível traçar a curva de ocorre quando cada elo terminal é iniciado,
indiferença representativa do comportamento comparado ao tempo médio para o alimento do
de escolha intertemporal do indivíduo. Na início dos elos iniciais. Squires e Fantino
mesma linha da proposta de Mazur (1987), tal (1971) elaboraram a seguinte equação para a
curva permite ajustar equações matemáticas e DRT:
avaliar qual delas melhor descreve a relação R1 / R2 = (SR1 / SR2) ( Ttotal – Tt1 / Ttotal –
entre atraso, magnitude e valor subjetivo das Tt2) (17)
R R
alternativas para participantes humanos (Green, em que S 1 e S 2 são as frequências totais de
Myerson, Lichtman, Rosen, & Fry, 1996; reforçamento, incluindo tanto o tempo no elo
McKerchar, Green, Myerson, Pickford, Hill & inicial quanto no terminal, Ttotal é o tempo total
Stout, 2009; Myerson & Green, 1995). Têm médio para o reforço primário do inicio dos
sido testados empiricamente, com frequência, o elos iniciais e Tt1 e Tt2 são os tempos médio
modelo exponencial e o hiperbólico para reforço primário do início dos dois elos
(Gonçalves, 2005). terminais, ou seja, as durações médias dos dois
Myerson, Green & Warusawitharana elos terminais. A DRT tem como suposição
(2001) sugeriram método alternativo para básica o princípio da igualação, reduzindo-se à
mensurar o desconto de um reforço atrasado, Lei da Igualação de Herrnstein (1961) na
denominado área sob a curva (Area Under the ausência de elos terminais.
Curve – AUC). Segundo esses autores, tal Grace (1994), por sua vez, desenvolveu
método independe da forma matemática da um modelo denominado contextual choice
função de desconto e supera eventuais model (CCM), baseado na seguinte equação:
problemas relacionados às propriedades R1 / R2 = (SRi1 / SRi2) (SRt1 / SRt2) (Ti / Tt)
estatísticas dos parâmetros dessa função. A (18)
AUC é simplesmente a área que se encontra em que R1 e R2 são as frequências de resposta
sob a função empírica de desconto normalizada nos elos iniciais de um esquema concorrente
em um plano cartesiano. encadeado, SRi1 e SRi2 são as frequências de
Deve-se assinalar, também, que a reforçamento nos elos iniciais, ou seja, as
Análise do Comportamento buscou formalizar frequências pelas quais cada um dos dois elos
os efeitos do atraso para além dos esquemas de terminais são iniciados, e SRt1 e SRt2 são as
reforçamento “simples”, com experimentos frequências de reforçamento nos dois elos
utilizando esquemas concorrentes encadeados. terminais (as frequências pelas quais os elos
Um procedimento de concorrentes encadeados terminais liberam o reforço primário). Segundo
normalmente envolve dois esquemas que o CCM, a escolha em esquemas concorrentes
operam durante os elos iniciais, cada qual encadeados depende tanto dos esquemas nos
ocasionalmente conduzindo a seu próprio elo elos iniciais quanto dos esquemas nos elos
terminal. Cada elo terminal consiste em outro terminais. O CCM caracteriza-se pela razão
esquema de reforçamento que leva, por fim, ao Tt/Ti, em que Tt é a duração média dos elos
reforço primário. terminais e Ti é a duração média dos elos
Fantino (1981; Fantino, Preston & iniciais. Como a razão Tt/Ti é o expoente das
Dunn, 1993) elaborou a delay-reduction theory taxas de reforçamento nos elos terminais, o
(DRT), segundo a qual o valor reforçador CCM sugere que diferenças nos elos terminais
condicionado de um elo terminal de um terão efeitos maiores na preferência quando

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
5

eles são longos relativamente aos tamanhos dos Além da suposição sobre o papel
elos iniciais, e que os elos terminais terão crucial da redução do atraso, a DRT difere do
menos efeito na preferência quando são CCM em sua suposição de que o
relativamente curtos. comportamento de escolha é também uma
Grace (1994) partiu da suposição básica função das frequências totais de reforçamento
da Lei de Igualação de Herrnstein (1961) para (SR1 e SR2), comparado à suposição do CCM de
a elaboração do CCM: a frequência relativa de que ele é uma função das frequências de
comportamento é proporcional à frequência reforçamento nos elos iniciais (SRi1 e SRi2)
relativa de reforçamento. Grace supôs que (Mazur, 2006).
esquemas do elo terminal são reforços Mazur (2001) construiu, para esquemas
condicionados cujos valores são uma função de concorrentes encadeados, o modelo hyperbolic
suas frequências de reforçamento (SRt1 e SRt2). value-added (HVA), baseado em três
Além da Lei de Igualação, Grace partiu da suposições fundamentais: em primeiro lugar,
proposta de Baum e Rachlin (1969) de que nos como no CCM e no DRT, o HVA adota o
casos em que os reforços diferem em duas ou principio da igualação como suposição básica,
mais dimensões (e.g., frequência, atraso, reduzindo-se à Lei de Igualação caso não
magnitude), esses diversos fatores podem ser existam elos terminais; em segundo lugar,
combinados multiplicativamente para obter considera-se que o valor do reforço declina
uma medida do valor total dos reforços. De com aumentos no atraso segundo uma função
maneira semelhante, Grace argumentou que as hiperbólica; e em terceiro lugar, o modelo
frequências de reforçamento nos elos iniciais prevê que a escolha depende do incremento
(SRi1 e SRi2) podem ser multiplicadas pela experimentado pelo valor do reforço
frequência de reforçamento nos elos terminais condicionado quando o elo inicial termina e o
(SRt1 e SRt2) para obter os valores dos dois elo final tem início. Cabe assinalar que
esquemas alternativos em procedimentos Davison (1988) já havia adaptado o modelo
concorrentes encadeados. hiperbólico para esquemas concorrentes
Grace (1994) interpretou que a encadeados com relativo sucesso, mas com
expressão comportamental dos valores dos elos especificidades de procedimento que
terminais depende do contexto no qual eles são comprometiam sua generalização. A equação
apresentados (ou seja, das durações dos elos do HVA é:
terminais comparadas àquelas dos elos R1 / R2 = (SRi1 / SRi2) (Vt1 – Vi / Vt2 –
iniciais). Seguindo o trabalho de Baum (1974) Vi) (19)
sobre a Lei Generalizada da Igualação, que As duas expressões mais à esquerda são
conta com um expoente que reflete a idênticas ao CCM. A expressão nos parênteses
sensibilidade do comportamento a diferenças à direita inclui Vt1 e Vt2, os valores dos dois
nas taxas de reforçamento (o parâmetro a na elos terminais, e Vi, o valor dos elos iniciais.
Equação 3), Grace usou o expoente Tt/Ti para Todos esses valores são calculados por meio de
expressar o fato de que a sensibilidade às taxas uma variação da função hiperbólica (Mazur,
de reforçamento nos elos terminais depende 1984).
das durações relativas dos elos iniciais e Empiricamente, os três modelos
terminais. O resultado final deste conjunto de mostraram-se bastante adequados como
suposições foi o CCM. Note que a Equação 18 preditores do comportamento de escolha. Em
se reduz à simples Lei de Igualação nos casos uma comparação realizada por Mazur (2001,
em que não há elo terminal (Tt = 0). 2006), o CCM explicou em média 90,8% da

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
6

variação comportamental de diversos sujeitos imediatamente sentidas pelos tomadores de


animais não humanos envolvidos em esquemas decisão.
concorrentes encadeados, o HVA 89,6% e o No segundo estágio, marcado pelas
DRT 83,0%. No entanto, devem ser salientadas contribuições de Böhm-Bawerk (1889, 1914) e
as diferenças teóricas de cada modelo. Para o Fisher (1930) na virada do século XIX para o
CCM, o fator chave é o contexto no qual a XX, escolhas intertemporais eram vistas em
escolha é feita, mais especificamente a duração termos cognitivos, como uma troca de
do período de escolha. Se o período de escolha satisfação presente por satisfação futura. A
é longo relativamente à duração dos elos razão da existência de um desconto seria a
terminais, as diferenças entre os esquemas dos incapacidade do tomador de decisão de
elos terminais exercerão relativamente pouca imaginar com exatidão no presente como seria
influência sobre a preferência. Para a DRT o o futuro.
fator chave é a redução do atraso: a preferência O terceiro estágio basicamente tem
depende da diminuição no tempo para o início com a formulação por Samuelson (1937)
reforço que é sinalizado pelo início de um elo do modelo de utilidade descontada (discounted
terminal. Por fim, o HVA considera o valor do utility model – DU). Samuelson propõe uma
reforçador condicionado associado a cada equação em que indivíduos descontam custos e
esquema como a variável chave, e a benefícios futuros exponencialmente. Uma
preferência depende do aumento no valor que é possível função utilidade que contemplaria o
sinalizado pelo início de um elo terminal. paradigma exponencial de escolhas seria:
Abordagem Econômica T-t
Cabe analisar, após a exposição dos U = ut + Σδiut+i
modelos empregados pela Análise do (20)
i=1
Comportamento para descrever o
comportamento de escolhas intertemporais, as Essa função relaciona a utilidade total U de
formalizações utilizadas pela Economia com a acordo com a utilidade descontada u de
mesma finalidade, que são principalmente atividades presentes no período t e de
modelos de utilidade descontada. A Economia, atividades futuras nos períodos de t+1 a T-1.
assim como a Análise do Comportamento, dá Cada indivíduo apresentaria um fator de
grande destaque ao estudo de escolhas desconto δ constante para quaisquer dois
intertemporais. Segundo Loewenstein (1992), períodos, ou seja, os descontos seriam os
quatro estágios históricos distintos podem ser mesmos para escolhas imediatas e para
identificados na evolução da interpretação escolhas futuras. O fator individual de desconto
econômica das escolhas intertemporais. (IDF), como indicador da preferência temporal
No primeiro estágio, economistas do dos indivíduos, é inversamente proporcional à
século XIX como Senior (1836) e Jevons taxa individual de desconto (IDR), de forma
(1871) explicaram o desconto intertemporal que:
recorrendo ao que hoje seria chamado de IDF = 1 / (1 + IDR)
“efeitos motivacionais”, influências (21)
emocionais ou hedonistas no comportamento. O modelo de Samuelson (1937) considera que
Ambos os autores mencionados acreditavam os indivíduos decidem entre poupar e gastar de
que a predisposição a deferir temporalmente forma perfeitamente racional, dadas suas
uma gratificação dependeria das emoções restrições de renda. De acordo com essa visão,
há uma forte preferência dos agentes pela

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
7

manutenção de um padrão de consumo consumir de forma perfeitamente racional, ou


constante ao longo de seus ciclos de vida seja, não otimizam sua suavização de consumo,
(Deaton, 1992). Escolhas entre poupar e gastar consumindo muito e poupando pouco em
são realizadas de forma a assegurar um determinados períodos, e poupando muito e
consumo intertemporal suave, dadas as consumindo pouco em outros períodos.
diferenças de renda verificadas em períodos Inúmeras pesquisas buscaram
distintos. Essas escolhas, considerando as demonstrar que a distorção na otimização das
diversas preferências individuais, são ótimas. escolhas entre poupar e gastar deve-se a
O quarto estágio histórico apontado por problemas de autocontrole (Benton, Meier &
Loewenstein (1992) é o de superação do Sprenger, 2007; Laibson, 1997; Laibson,
modelo clássico de utilidade descontada, com a Repetto & Tobacman, 2003; O’Donoghue &
proposição de modelos alternativos que Rabin, 1999). Ao planejar escolhas futuras, os
consideram a possibilidade de desvios do indivíduos otimizam suas decisões de forma a
comportamento perfeitamente racional. Essa suavizar seu consumo mas, quando os mesmos
reação ao modelo clássico teve suas bases em indivíduos se vêem frente a uma escolha
observações empíricas. Apurou-se que presente e imediata entre poupar e gastar, o
dificilmente as escolhas individuais adaptam-se valor relativo de consumir aumenta enquanto o
à função exponencial proposta por Samuelson. valor relativo de poupar diminui. Como
Em primeiro lugar, o consumo não é suave ao consequência, inúmeros indivíduos escolhem o
longo da vida de determinado indivíduo, mas reforço imediato de consumir, mesmo quando a
tende a acompanhar as variações de renda em decisão ótima a longo prazo seria a de poupar
diferentes estágios de seu ciclo de vida (Carroll (reforço maior atrasado).
& Summers, 1991). Quanto maior a renda atual Como decorrência dessas evidências,
de dado indivíduo, maiores são seus gastos estudos concluem que, contrariamente à visão
imediatos, o contrário também sendo válido. da economia tradicional sobre preferências
Mesmo em horizontes de tempo curtos, os temporais, muitos indivíduos não descontam
indivíduos falham em suavizar seu consumo. custos e benefícios exponencialmente, mas
Beneficiários de programas da seguridade apresentam um viés em direção ao presente
social consomem mais no início de cada mês e (ver, por exemplo, Frederick, Loewenstein &
significativamente menos ao final do período O’Donoghue, 2002; Takahashi, 2005).
do benefício (Shapiro, 2005; Stephens, 2003). Adicionalmente, evidências sugerem que
Assalariados regulares, da mesma forma, indivíduos diferem substantivamente quanto ao
apresentam evidências de consumirem muito grau de seu viés ao presente (Coller, Harrison
após receberem seu pagamento mensal, & Rutström, 2005). As preferências temporais
diminuindo seu nível de consumo no final do enviesadas ao presente representam uma
mês (Huffman & Barenstein, 2004). Por fim, a inconsistência dinâmica das escolhas, pois
expectativa de recebimentos previsíveis (como, implicam que um indivíduo impõe um fator de
por exemplo, restituições de imposto ou bônus desconto menor entre hoje e uma data a partir
por trabalho desempenhado) também afeta de hoje do que entre um período igual no
diretamente o padrão de consumo (Ishikawa & futuro, aproximando-se da crítica de Mazur
Ueda, 1984; Souleles, 1999). A conclusão (2006) ao modelo exponencial.
lógica derivada de todas essas investigações Os descontos diferenciais levam a um
empíricas é a de que os indivíduos não problema de autocontrole (Meier & Sprenger,
realizam suas escolhas entre poupar e gastar / 2007). Indivíduos podem fazer planos para

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
8

escolhas em períodos futuros, mas eles inconsistências dinâmicas cria a necessidade


sistematicamente violarão estes planos no metodológica de se empregar em estudos sobre
momento em que essas escolhas futuras se atraso, sempre que possível, não um reforço
tornarem presentes (Fisher, 1930; Strotz, imediato e outro diferido, mas sim dois
1956). A função de utilidade exponencial, reforços atrasados, um disponibilizado em um
elaborada sob a premissa de otimização da futuro mais próximo e outro em um futuro
suavização do consumo, não é representativa, mais distante. Esse procedimento, conhecido
por conseguinte, de inúmeras situações em que como front-end delay, objetiva neutralizar a
indivíduos agem de forma inconsistente. variação de IDR em função do viés ao
Laibson (1997) e O’Donoghue e Rabin (1999) presente.
apresentam uma função quase-hiperbólica Considerações Finais
alternativa que contabiliza os descontos Percebe-se que há algumas diferenças
diferenciais: entre o tipo de abordagem que a Análise do
T-t Comportamento e a economia dão a seus
U = ut + βΣδiut+i estudos. Por exemplo, enquanto a Análise do
(22) Comportamento recorre a grande quantidade de
i=1
pesquisas com animais não humanos, as
No modelo quase-hiperbólico, β representa o pesquisas econômicas são realizadas quase que
viés ao presente, enquanto δ representa o fator exclusivamente com participantes humanos. A
de desconto a longo prazo. Um indivíduo utilização de sujeitos não humanos pela
desconta entre hoje e amanhã a βδ, mas Análise do Comportamento justifica-se pela
desconta entre dois dias sequenciais no futuro preocupação da disciplina em manter rigoroso
somente a δ. O modelo quase-hiperbólico, por controle experimental, tarefa mais difícil nos
conseguinte, abrange os casos de casos em que os participantes são humanos. O
inconsistência dinâmica nas escolhas entre controle experimental é fundamental para
poupar e gastar. Se β < 1, as escolhas assegurar que os dados de comportamento
individuais apresentam inconsistências individual (coletados, muitas vezes, em estudos
dinâmicas (o valor presente do consumo é com n pequeno) conduzam a análises e
superestimado). Se β = 1, os indivíduos resultados consistentes. A economia, grosso
descontam exponencialmente e o modelo modo, trabalha com maior flexibilidade de
quase-hiperbólico reduz-se ao modelo controle experimental, compensada pela
exponencial de descontos padrão. Nesse caso, análise conjunta dos dados de grande número
as escolhas são perfeitamente racionais e de participantes (n grande).
ótimas a longo prazo. A forma de coletar os dados também
Assim, β também é um indicador do costuma ser diversa em cada disciplina: a
grau de racionalidade da tomada de decisão e Análise do Comportamento recorre a
do autocontrole dos indivíduos. O Homo procedimentos de ajuste como, por exemplo, a
economicus perfeitamente racional (β = 1) seria titulação; a economia, na maioria das vezes,
capaz de otimizar e de manter seu emprega questionários. O delineamento
planejamento financeiro, mesmo quando as experimental é usualmente distinto: a Análise
escolhas se tornam presentes. No caso dos do Comportamento utiliza o sujeito como seu
demais agentes econômicos, haveria um viés próprio controle (delineamento intra-sujeito); a
ao presente (β < 1) e a escolha apresentaria economia costuma empregar delineamentos de
inconsistência dinâmica. A ocorrência de grupo. Outra diferença diz respeito ao método

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
9

científico empregado: a Análise do particular, são exemplos de como as


Comportamento prioriza o método indutivo; a abordagens comportamentais e econômicas são
economia favorece o método dedutivo. sinérgicas. Guardadas suas peculiaridades,
As opções pelo tipo de delineamento e tanto a Análise do Comportamento quanto a
pelo método empregado influenciam a forma economia têm empregado modelos
como cada área analisa os dados obtidos. A matemáticos, notadamente em formulações
Análise do Comportamento prioriza análises exponenciais e hiperbólicas, para buscar
que destacam cada sujeito, na tentativa de mensurar o comportamento de escolha
compreender diferenças individuais. Nesse intertemporal.
contexto, recorre a instrumentos como, por A possibilidade de integração de
exemplo, a inspeção visual e análises resultados, aberta pelo emprego do método
estatísticas (sobretudo descritivas) e regressões experimental tanto pela Análise do
que enfocam o indivíduo. A economia, por sua Comportamento quanto pela economia, não
vez, prioriza a compreensão das relações torna, no entanto, a tarefa trivial. Cada uma
representativas do grupo, empregando dessas disciplinas adota, em geral, postura
intensamente técnicas econométricas e de distinta na explicação e discussão de seus
estatística inferencial. resultados. A Análise do Comportamento
Essas distinções ajudam a explicar o considera uma relação direta entre
por quê de a Análise do Comportamento e a comportamento de escolha e ambiente. A
economia terem seguido cursos diferentes por aversão ao risco, por exemplo, é vista como
tanto tempo, com poucas oportunidades de uma faceta de escolhas em situação de conflito
diálogo. O emprego de vocabulários distintos (autocontrole) que ocorre em determinados
pelos cientistas de uma e de outra área, mesmo contextos. A economia, por sua vez, assume
ao tratarem de questões análogas, dificulta em geral uma postura mediacionista (o que
ainda mais a interação. A integração dos dois mais a aproxima, inclusive, das correntes
campos do conhecimento também se ressente cognitivistas da psicologia). A discussão
de, na grande maioria dos casos, a divulgação econômica dos resultados, por conseguinte,
dos resultados das pesquisas de cada área ficar parte de tal posição: no exemplo da aversão ao
limitada apenas a sua própria comunidade risco, a economia entende que esse seria um
verbal. problema de autocontrole, o que torna o
No entanto, apesar das dificuldades, é autocontrole, consequentemente, a causa do
fundamental promover a interface entre comportamento de escolha.
Análise do Comportamento e economia, pois, A superação desses obstáculos
como visto ao longo deste artigo, as (inclusive dos eminentemente epistemológicos)
informações geradas por uma das áreas de é de suma importância para permitir que os
conhecimento podem ser complementares às achados de uma área sejam incorporados às
obtidas na outra. Conforme exposto, os estudos pesquisas da outra para avanço integrado do
sobre tomada de decisão e escolhas, de forma conhecimento científico.
geral, e sobre escolhas intertemporais, em

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
10

Referências
Ainslie, G. (1975). Special reward: A saving and economic performance (pp. 305-
behavioral theory of impulsiveness and 43). Chicago: Chicago University Press.
impulse control. Psychological Bulletin, 82 Chavarro, A. & Logue, A. W. (1988).
(4), 463-496. Sensitivity to amount and delay of
Azzi, R., Fix, D. S. R., Keller, F. S., & Rocha e reinforcement: Effects of different types of
Silva, M. I. (1964). Exteroceptive control of concurrent variable-interval schedules. The
response under delayed reinforcement. Psychological Record, 38, 421-35.
Journal of the Experimental Analysis of Chung, S. H. & Herrnstein, R. J. (1967).
Behavior, 7, 159-62. Choice and delay of reinforcement. Journal
Baum, W. (1974). Choice in free-ranging wild of the Experimental Analysis of Behavior,
pigeons. Science, 185, 78-79. 10, 67-74.
Baum, W. (1979). Matching, undermatching, Coller, M., Harrison, G., & Ruström, E.
and overmatching in studies on choice. (2005). Does Everyone Have Quasi-
Journal of the Experimental Analysis of Hyperbolic Preferences? University of
Behavior, 32, 269-281. Central Florida, Mimeo.
Baum, W. (1982). Choice, changeover and Coller, M. & Williams, M. B. (1999). Eliciting
travel. Journal of the Experimental Analysis individual discount rates. Experimental
of Behavior, 38, 35-49. Economics, , 2, 107–127.
Baum, W. (2004). Molar and molecular views Commons, M., Mazur, J., Nevin, J., & Rachlin,
of choice. Behavioural Processes, 66(3), H. (1987). Quantitative analysis of
349-59. behavior. Vol. 5, The effects of delay.
Baum, W. & Rachlin, H. (1969). Choice as Cambridge: Ballinger.
time allocation. Journal of the Experimental Cunha, R. N. (1988). Análise das equações de
Analysis of Behavior, 12, 861-874. Baum e Davison: esquemas de tempo e
Benton, M., Meier, S., & Sprenger, C. (2007). razão. Dissertação (Mestrado),
Overborrowing and undersaving: Lessons Universidade de Brasília, Instituto de
and policy implications from research in Psicologia.
behavioral economics. Federal Reserve Davison, M. (1988). Delay of reinforcers in a
Bank of Boston Discussion Paper Series. concurrent-chain schedule: An extension of
Boelens, H. & Kop, P. (1983). Concurrent the hyperbolic-decay model. Journal of the
schedules: Spatial separation of response Experimental Analysis of Behavior, 1988,
alternatives. Journal of the Experimental 50(2), 219-36.
Analysis of Behavior, 40, 35-45. Deaton, A. (1992). Understanding
Böhm-Bawerk, E. (1889/1970). Capital and consumption. Oxford: Oxford University
interest. South Holland: Libertarian Press. Press.
Böhm-Bawerk, E. (1914/1970). History and Deluty, M. Z., Whitehouse, W. G., Mellitz, M.,
critique of interest theories. South Holland: & Hineline, P. N. (1983). Self-control and
Libertarian Press. commitment involving aversive events.
Carroll, C. D. & Summers, L. H. (1991). Behaviour Analysis Letters, 3 (4), 213-219.
Consumption growth parallels income De Villiers, P. (1977). Choice in concurrent
growth: Some new evidence. In B. D. schedules and a quantitative formulation of
Bernheim & J. B. Shoven (Orgs.), National the law of effect. In W. K. Honig & J. E. R.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the
Graduate Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was
supported by resources granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and
National Council of Scientific and Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail:
flavio.bettarello@itamaraty.gov.br, elenicehanna@gmail.com
11

Staddon (Eds.), Handbook of operant Green, L. & Myerson, J. (1993). Alternative


behavior (pp. 233-287). Englewood Cliffs: frameworks for the analysis of self-control.
Prentice-Hall. Behavior and Philosophy, 21, 37-47.
De Villiers, P. & Herrnstein, R. J. (1976). Green, L. & Myerson, J. (1996). Exponential
Toward a law of response strength. versus hyperbolic discounting of delayed
Psychological Bulletin, 83 (6), 1121-1153. outcomes: Risk and waiting time. American
Fantino, E. (1981). Contiguity, response Zoologist, 36, 496-505.
strenght, and the delay-reduction Green, L., Myerson, J., Lichtman, D., Rosen,
hypothesis. In P. Harzem & M. Zeiler S., & Fry, A. (1996). Temporal discounting
(Eds.), Advances in analysis of behavior: in choice between delayed rewards: the role
Vol. 2. Predictability, correlation, and of age and income. Psychology and Aging,
contiguity (pp. 169-201). Cheichester: 11(1), 79–84.
Wiley. Hanna, E. (1991). Behavior analysis of
Fantino, E., Preston, R., & Dunn, R. (1993). complex learning: Some determinants of
Delay reduction: Current status. Journal of choice. Tese (Doutorado), University of
the Experimental Analysis of Behavior, Wales, College of Cardiff.
60(1), 159-69. Hanna, E., Blackman, D., & Todorov, J.
Fehr, E. & Zych, P. (2000). Intertemporal (1992). Stimulus effects on concurrent
choice under habit formation. University of performance in transition. Journal of the
Zurich, Institute for Empirical Research in Experimental Analysis of Behavior, 58, 335-
Economics, Working Paper Series, 43. 347.
Ferster, C. B. & Skinner, B. F. (1957). Hanna, E. & Ribeiro, M. (2005). Autocontrole:
Schedules of reinforcement. Nova York: um caso especial de comportamento de
Appleton-Century-Crofts. escolha. In J. Abreu-Rodrigues & M.
Fisher, I. (1930). The theory of interest. Ribeiro (Orgs.), Análise do
Londres: MacMillan. Comportamento: Pesquisa, Teoria e
Frederick, S., Loewenstein, G., & Aplicação (pp. 175-87). São Paulo: Artmed.
O’Donoghue, T. (2002). Time discounting Hanna, E. & Todorov, J. (2002). Modelos de
and time preference: A critical review. autocontrole na Análise Experimental do
Journal of Economic Literature, 40(2), 351- Comportamento: Utilidade e crítica.
401. Psicologia: Teoria e Pesquisa, 18 (3), 337-
Gonçalves, F. L. (2005). Desvalorização pelo 43.
atraso em situações apetitivas e aversivas. Harrison, G. W., Lau, M. I., & Williams, M. B.
Tese (Doutorado), Universidade de São (2002). Estimating individual discount rates
Paulo, Instituto de Psicologia. in Denmark: A field experiment. The
Grace, R. (1994). A contextual model of American Economic Review, 92 (5), 1606-
concurrent-chains choice. Journal of the 1617.
Experimental Analysis of Behavior, 61(1), Herrnstein, R. (1961). Relative and absolute
113-29. strength of response as a function of
Grace, R. (1999). The matching law and frequency of reinforcement. Journal of the
amount-dependent functions as account for Experimental Analysis of Behavior, 4, 267-
choice in human and pigeon. Journal of the 272.
Experimental Analysis of Behavior, 70, 1-
19, 1999.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
12

Herrnstein, R. (1970). On the law of effect. Loewenstein, G. (1992). The fall and rise of
Journal of the Experimental Analysis of psychological explanations in the economics
Behavior, 13, 243-266. of intertemporal choice. In G. Loewenstein
Herrnstein, R. & Vaughan, W. (1980). & J. Elster (Orgs.), Choice over time (pp. 3-
Melioration and behavioral allocation. In J. 34). New York: Russel Sage Foundation.
Staddon (Org.), Limits to action: The Loewenstein, G. & Elster, J. (1992). Choice
allocation of individual behavior (pp. 143- over time. New York: Russell Sage
176). New York: Academic Press. Foundation.
Huffman, D. & Barenstein, M. (2004). Riches Logue, A. (1988). Research on self-control: An
to rags every month? The fall in integrating framework. Behavioral and
consumption expenditures between paydays. Brain Sciences, 11, 665-679.
Institute for the Study of Labor Discussion Logue, A., Peña-Correal, T., Rodriguez, M., &
Paper Series. Kabela, E. (1986). Self-control in adult
Ishikawa, T. & Ueda, K. (1984). The bonus humans: Variation in positive reinforcer
payment system and japanese personal amount and delay. Journal of the
savings. In M. Aoki (Org.), The Economic Experimental Analysis of Behavior, 46, 159-
Analysis of the Japanese Firm (pp. 133- 173.
192). Amsterdam: North-Holland. Mazur, J. E. (1984). Tests of an equivalence
Iyengar, S. (2010). The art of choosing. Nova rule for fixed and variable reinforcer delays.
York: Twelve. Journal of Experimental Psychology:
Jevons, W. S. (1871). Theory of political Animal Behavior Processes, 10, 426-436.
economy. Londres: MacMillan. Mazur, J. E. (1987). An adjusting procedure for
Kacelnick, A. & Bateson, M. (1996). Risky studying delayed reinforcement. In M. L.
theories - the effects of variance on foraging Commons, J. E. Mazur, J. A. Nevin & H.
decisions. American Zoologist, 36, 402-434. Rachlin (Eds.), Quantitative Analysis of
Keller, F. S. & Schoenfeld, W. N. (1950). Behavior. Vol. 5, The effects of delay (pp.
Principles of psychology. Nova York: 55-73). Cambridge: Ballinger.
Appleton-Century-Crofts. Mazur, J. E. (2001). Hyperbolic value addition
Laibson, D. (1997). Goleen eggs and and general models of animal choice.
hyperbolic discounting. Quarterly Journal Psychological Review, 108, 96-112.
of Economics, 112(2), 443-477. Mazur, J. E. (2006). Mathematical models and
Laibson, D., Repetto, A., & Tobacman, J. the experimental analysis of behavior.
(2003). A debt puzzle. In P. Aghion, R. Journal of the Experimental Analysis of
Friedman, J. Stiglitz, & M. Woodford Behavior, 85(2), 275-91.
(Orgs.), Knowledge, information and McDowell, J. J. (1988). Matching theory in
expectation in modern economics: In honor natural human environments. The Behavior
of Edmund S. Phelps (pp. 228-266). Analyst, 11, 95-109.
Princeton, Princeton University Press. McDowell, J. J. (1989). Two modern
Laibson, D., Repetto, A., & Tobacman, J. developments in matching theory. The
(2007). Estimating discount functions with Behavior Analyst, 12, 153-166.
consumption choices over the lifecycle. McKerchar, T., Green, L., Myerson, J.,
University of Oxford, Department of Pickford, T. S., Hill, J., & Stout, S. (2009).
Economics, Economics Series Working A comparison of four models of delay
Papers, 341.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
13

discounting in humans. Behavioural Rachlin, H., Battalio, R., Kagel, J., & Green, L.
Processes, 81(2), 256-259. (1981). Maximization theory in behavioral
Meier, S. & Sprenger, C. S. (2007). Impatience psychology. Behavioral and Brain Sciences,
and credit behavior: Evidence from a field 4, 371-417.
experiment. Research Center for Behavioral Rachlin, H. & Green, L. (1972). Commitment,
Economics and Decision-Making Working choice and self-control. Journal of the
Papers Series, 07-3. Experimental Analysis of Behavior, 17, 15-
Myerson, J. & Green, L. (1995). Discounting 22.
of delayed rewards: Models of individual Rachlin, H., Green, L., & Tormey, B. (1988).
choice. Journal of Experimental Analysis of Is there a decisive test between matching
Behavior, 64(3), 263-276. and maximizing? Journal of the
Myerson, J., Green, L., & Warusawitharana, Experimental Analysis of Behavior, 50(2),
M. (2001). Area under the curve as a 113-23.
measure of discounting. Journal of the Rachlin, H., Logue, A. W., Gibbon, J., &
Experimental Analysis of Behavior, 76(2), Frankel, M. (1986). Cognition and behavior
235-243. in studies of choice. Psychological Review,
O’Donoghue, T. & Rabin, M. (1999). Doing it 93, 33-45.
now or later. American Economic Review, Rodriguez, M. L., & Logue, A. W. (1986).
89(1), 103-104. Independence of the amount and delay
O’Donoghue, T. & Rabin, M. (2002) Addiction ratios in the generalized matching law.
and present-biased preferences. University Animal Learning and Behavior, 14, 29-37.
of California, Berkeley, Economics Samuelson, P. (1937). A note on measurement
Department, Working Paper, E02-312. of utility. Review of Economic Studies, 4,
Oscós, A., & Todorov, J. C. (1978). On 155-161.
frequency and magnitude of reinforcement Schneider, J. W. (1973). Reinforcer
in concurrent schedules. Revista Mexicana effectiveness as a function of reinforcer rate
de Análisis de La Conducta, 4, 217-21. and magnitude: A comparison of concurrent
Pliskoff, S. S. & Fetterman, J. G. (1981). performances. Journal of the Experimental
Undermatching and overmatching: The Analysis of Behavior, 20, 461-71.
fixed-ratio changeover requirement. Journal Schoenfelder, T. & Hantula, D. (2003). A job
of the Experimental Analysis of Behavior, with a future? Delay discounting, magnitude
36, 21-7. effects, and domain independence of utility
Rachlin, H. (1970). Modern behaviorism. San for career decisions. Journal of Vocational
Francisco: Freeman. Behavior, 62, 1, 43-55.
Rachlin, H. (1974). Self-Control. Behaviorism, Senior, N. W. (1836). An outline of the science
2, 94-107. of political economy. Londres: Clowes and
Rachlin, H. (1976). Behavior and learning. San Sons.
Francisco: Freeman. Shapiro, J. (2005). Is there a daily discount
Rachlin, H. (1989). Judgment, decision and rate? Evidence from the food stamp
choice: A cognitive/behavioral synthesis. nutrition cycle. Journal of Public
New York: Freeman. Economics, 89(2-3), 303-25.
Rachlin, H. (2000). The science of self-control. Shui, H. & Ausubel, L. (2005). Time
Cambridge/London: Harvard University inconsistency in the credit card market.
Press. University of Maryland, Mimeo.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
14

Simon, H. (1978). Information-processing Todorov, J. (1973). Interaction of frequency


theory of human problem solving. In W. and magnitude of reinforcement on
Estes (Ed.), Handbook of learning and concurrent performances. Journal of the
cognitive process. Vol. 5. Hillsdale: Experimental Analysis of Behavior, 19, 451-
Erlbaum. 58.
Skinner, B. F (1950). Are theories of learning Todorov, J. (1982). Matching and bias in
necessary? Psychological Review, 57, 193- concurrent performances: Effects of
216. asymmetrical changeover delays. Revista
Skinner, B. F. (1953/2003). Ciência e Mexicana de Análisis de La Conducta, 8,
Comportamento Humano. 11ª Edição. São 39-45.
Paulo: Martins Fontes. Todorov, J. (1991). Trinta anos de matching
Skinner, B. F. (1963/1969). Contingencies of law: evolução na quantificação da lei do
Reinforcement: a Theoretical Analysis. New efeito. Anais da XXI Reunião Anual de
York: Appleton-Century-Crofts. Psicologia (pp. 300-314). Ribeirão Preto:
Skinner, B. F. (1974). About behaviorism. New Sociedade Brasileira de Psicologia.
York: Alfred A. Knopf. Todorov, J., Acuña-Santaella, L. E., & Falcón-
Skinner, B.F. (1978). Reflections on Sanguinetti, O. (1982). Concurrent
behaviorism and society. Englewood Cliffs: procedures, changeover delay and the
Prentice-Hall. choice behavior of rats. Revista Mexicana
Squires N. & Fantino, E. (1971). A model for de Análisis de la Conducta, 8, 133-44.
choice in simple concurrent and concurrent- Todorov, J. & Bigonha, V. A. (1982).
chains schedules. Journal of the Esquemas concorrentes: viés provocado
Experimental Analysis of Behavior, 15(1), pela qualidade do esquema. Trabalho
27–38. apresentado na Reunião da Sociedade de
Souleles, N. S. (1999). The response of Psicologia de Ribeirão Preto.
household consumption to income tax Todorov, J., Coelho, C., & Hanna, E. (2003). O
refunds. American Economic Review, 89 que, como e porque escolher.
(4), 947-58. UniverCiência, 2, 33-38.
Stephens, M. (2003). “3rd of tha month”: Do Todorov, J. & Hanna, E. (2005). Quantificação
social security recipients smooth de escolhas e preferências. In J. Abreu-
consumption between checks? The Rodrigues & M. Ribeiro (Orgs.), Análise do
American Economic Review, 93(1), 406-22. Comportamento: Pesquisa, Teoria e
Strotz, R. (1956). Myopia and inconsistency in Aplicação (pp. 159-74). São Paulo: Artmed.
dynamic utility maximization. Review of Todorov, J., Hanna, E., & Bitencourt de Sá, M.
Economic Studies, 23, 165-180. (1984). Frequency versus magnitude of
Takahashi, T. (2005). Loss of self-control in reinforcement: New data with a different
intertemporal choice may be attributable to procedure. Journal of the Experimental
logarithmic time-perception. Medical Analysis of Behavior, 41, 157-167.
Hypotheses, 65(4) 691-693. Todorov, J., Oliveira-Castro, J., Hanna, E.,
Todorov, J. C. (1971). Concurrent Bittencourt de Sá, M., & Barreto, M.
performances: Effect of punishment (1983). Choice, experience, and the
contingent on the switching response. generalized matching law. Journal of the
Journal of the Experimental Analysis of Experimental Analysis of Behavior, 40, 99-
Behavior, 16, 51-62. 111.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com
15

Todorov, J. & Souza, D. G. (1978). Minimum


interchangeover intervals in concurrent
schedules. Revista Mexicana de Análisis de
la Conducta, 4, 17-28.
Todorov, J., Souza, D. G., & Bori, C. M.
(1993). Momentary maximizing in
concurrent schedules with a minimum
interchangeover interval. Journal of the
Experimental Analysis of Behavior, 60(2),
415–435.
Troyjo, M. P. (2007). Nação-comerciante:
Poder e prosperidade no século XXI. São
Paulo: Aduaneiras / Lex Editora.
Williams, B. A. & Fantino, E. (1978). Effects
on choice of reinforcement delay and
conditioned reinforcement. Journal of the
Experimental Analysis of Behavior, 29, 77-
86.

This paper is partially based on the first author’s Doctoral Dissertation, under supervision of the second author, for the Graduate
Program in Behavioral Sciences from the University of Brasilia, Brazil. Manuscript preparation was supported by resources
granted to INCT-ECCE (São Paulo State Foundation [FAPESP: grant# 2014/50909-8] and National Council of Scientific and
Technological Development [CNPq: grant # 465686/2014-1]. Contact by E-mail: flavio.bettarello@itamaraty.gov.br,
elenicehanna@gmail.com

Você também pode gostar