Você está na página 1de 17

The American Economic Review, vol LIX, nº5, dez 1969, pp.817-831.

UMA INTERPRETAÇÃO ECONÔMICA


DA TEORIA DO CONTROLE ÓTIMO
Tradução : Alexandre Stamford
Robert Dorfman*

49
The American Economic Review, vol LIX, nº5, dez 1969, pp.817-831.
2
A teoria do Capital é a economia do Exemplos notáveis são Hotelling [6] e Ramsey [8].
tempo. Sua tarefa é explicar se, e porque, um
Tudo isso foi mudado abruptamente na
instrumento de produção durável terá uma
década passada como resultado da
maior contribuição ao valor do produto,
reapresentação, ou reorientação, do cálculo
durante seu tempo de vida útil, do que os
das variações, que surgiu em grande parte
custos para produzi-lo ou adquiri-lo. Ou seja,
pelas exigências impostas pela tecnologia
ela deduz conclusões normativas e descritivas
espacial.3 Na sua versão moderna, o cálculo
sobre o curso temporal da acumulação de
das variações é chamado de teoria do controle
capital por unidades econômicas e da
ótimo. Ela tornou-se, merecidamente, a
economia como um todo.
ferramenta central da teoria do capital e tem
Tradicionalmente, a teoria do capital,
dado a última uma nova vida. Como resultado,
como todos os ramos da economia, era
a teoria do capital transformou-se tão
estudada no contexto de equilíbrios
profundamente, que rebatizaram-na de teoria
estacionários. Por exemplo, tanto a condição
do crescimento, ela trouxe numerosos e
de equilíbrio estacionário dos economistas
importantes resultados práticos e teóricos que
clássicos como o equilíbrio do período de
antes não poderiam ser formulados.
produção da teoria de Böhm-Bawerk,
A tese principal desse paper é que a teoria
descrevem situações nas quais promover a
do controle ótimo é formalmente idêntica a
acumulação de capital não vale a pena. Um
teoria do capital, e que seus principais
modelo de análise que é tão limitado não é
procedimentos podem ser atingidos por
apropriado para se entender acumulação de
argumentação estritamente econômica. Essa
capital e crescimento,1 mas nenhuma outra
tese será sustentada pela obtenção do principal
técnica parecia disponível na história da
teorema da teoria do controle ótimo, chamado
teoria do capital.
o princípio do máximo, por meios de análises
Nos cinco últimos anos tem-se percebido,
econômicas.
sem muita definição, que a teoria do capital é
I. A Equação Básica
formalmente um problema em cálculo das
Para termos um vocabulário concreto,
variações.2 Mas o cálculo das variações é
considere o problema de decisão de uma firma
considerado um assunto muito áspero por
que deseja maximizar seus lucros totais em
muitos economistas e, além disso, suas
algum período de tempo. Em uma data t, essa
formulações convencionais parecem muito
firma terá herdado um certo estoque de capital
rígidas para serem aplicadas em muitos
e outras condições de seu comportamento
problemas econômicos. A aplicação dessa
passado. Denote isso por k ( t ) .Com esse
ferramenta conceitual à teoria do capital
estoque de capital, e outras facilidades k, e
permaneceu superficial e esporádica até
para aquela data particular t, a firma está
muito recentemente, e a teoria do capital
permanece presa pelas limitações dos 3
A duas fontes do novo cálculo das variações são R.
equilíbrios estáticos. Bellman [4] e L.S. Pontryagin, et al. [7]. Bellman enfatizou
* primeiramente as implicações de seus trabalhos para
O autor é Professor da Universidade de Harvard
1 economia.
Um apontamento mais rigoroso é feito por Joan
Robinson em [9] e em outros lugares.

50
The American Economic Review, vol LIX, nº5, dez 1969, pp.817-831.

51
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5
5
em posição para tomar algumas decisões que O argumento t permite a introdução de alguma
fórmula de desconto que deve ser apropriada.
podem dizer respeito a taxa de produção,
de decisão. Essa restrição é expressa dizendo-
preço de produção, design de produtos, ou
se que a taxa de variação do estoque de
outras coisas mais. Denote as decisões feitas
capital num instante qualquer é uma função
em alguma data por x(t). Do estoque de capital
de sua posição atual, da data, e das decisões
herdado na data especificada junto com as
tomadas. Simbolicamente:6
decisões atuais, a firma obtém uma certa taxa
dk
de benefícios ou um conjunto de lucros por (1) k   f ( k , x, t ) .
unidade de tempo. Denote isso por u( k(t),x(t), dt
t).4 Essa função u determina a taxa a qual os Assim as decisões feitas num tempo qualquer
lucros estão sendo ganhos no tempo t como tem dois efeitos. Elas influenciam a taxa a
resultado de se ter k e de se fazer as decisões qual os lucros são ganhos naquele tempo e
x. também a taxa a qual o estoque de capital
Olhe agora para a situação futura como se está mudando e assim o estoque de capital
ela estivesse na data inicial t = 0. O total de que estará disponível no instante de tempo
lucros que serão ganhos nessa época para subsequente.
alguma data final T é dado por: Essas duas fórmulas expressam a essência
T do problema de se tomar decisões num

W (k 0 , x )   u ( k , x, t ) dt contexto dinâmico. O problema é selecionar

o
0 curso temporal simbolizado por x , assim
como também, fazer o valor total do
que é simplesmente a soma da taxa a qual o resultado, W, tão grande quanto possível
lucro está sendo ganho a todo instante levando em conta o efeito da escolha de x nas
descontada para a data inicial (se desejado) e taxas instantâneas de lucro e estoque de
somada para 
todos os instantes. 5 Nessa capital que serão transportadas para o futuro.
notação, x não simboliza um número Esse é verdadeiramente um problema difícil, e
ordinário mas um curso temporal inteiro de não apenas para principiantes. A dificuldade
variáveis de decisão x da data inicial até T. essencial é que todo um curso temporal, de
Essa notação afirma que se a firma começa algumas variáveis, tem que ser escolhido. O
com um montante inicial de capital k0 e então cálculo elementar ensina como selecionar o

segue a política de decisões denotada por x , número mais adequado possível e atribuí-lo a
ela obterá um resultado total, W, que é a uma única variável, ou os números mais
integral (a soma contínua) dos resultados oportunos para mais de uma variável,
obtidos a cada instante; esses resultados diferenciando alguma função e estabelecendo
dependem da data no instante pertinente, do as derivadas parciais iguais a zero. Mas
estoque de capital da época e da decisão selecionar um curso temporal mais adequado
aplicada naquele momento. A firma tem é uma matéria inteiramente diferente e
liberdade, dentro de certos limites, de escolher conduz a algumas técnicas matemáticas muito

o curso temporal da variável de decisão x avançadas. A estratégia da solução é reduzir
mas ela não pode, independentemente, o problema que, como colocado, nos exige
escolher o montante de capital a cada instante; achar todo um curso temporal, para um
que é uma conseqüência do capital na data problema que nos requeira apenas
inicial e do curso temporal escolhido para as determinar um único número (ou alguns
variáveis de números), e isso nós sabemos como fazer
4
No resultado nós podemos muitas vezes omitir o pelo cálculo normal.
argumento – tempo em pró da simplificação, e assim 6
escrever simplesmente u( k, x, t ). O ponto será usado freqüentemente para denotar uma
taxa de variação com respeito ao tempo.
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

Essa transformação do problema pode ser feita fato de que a forma da integral é a mesma
de várias maneiras. Uma maneira, que data do rescrevendo a fórmula como:
século dezoito, conduz ao cálculo das  
variações clássico. Outra maneira, que será W (k , x , t )  u (k , x t , t )  W (k t   , x , t   )
seguida aqui, conduz ao princípio do máximo
onde as mudanças nos subscritos são feitas
da teoria do controle ótimo. Esse método
cuidadosamente.
depende muito da introdução de uma notação
Agora, mais algumas notações.Se a firma
apropriada. Primeiro, introduz-se uma fórmula
conhecesse a melhor escolha de x da data t
para o valor que pode ser obtido pela firma
em diante, ela poderia segui-la e assim obter
começando de uma data t arbitrária com algum
um valor seguro. Nós denotamos  esse valor,
montante decapital k e seguindo uma política
que resulta da escolha ótima de x , por V*,
de decisão x arbitrária até uma data final. A
da seguinte forma:
fórmula é:

T
V * (kt ,t)  max W ( k t , x , t ) .

W ( k t , x , t )   u [ k , x ,  ] d 
t
Note que V* não

tem x como argumento.
Isso porque x já foi maximizado. O valor
que, de certo, é uma generalização da fórmula máximo que pode ser obtido começando na

de W introduzida previamente. data t com o capital k não depende de x mas
Agora divide-se W em duas partes. Pense é o valor que pode ser obtido com as
em um intervalo de tempo curto de tamanho  condições da melhor escolha possível de x .
começando no tempo t. É para se pensar em  Agora suponha que a política designada por
como sendo tão pequeno que a firma não xt é seguida no intervalo curto de tempo, de t
mudaria x no decorrer dele, mesmo se ela até t+, e que depois disso a melhor política
pudesse. Então nós podemos escrever: possível é seguida. Pela fórmula (2) a
conseqüência dessa política peculiar pode ser
T
 escrita como
(2) W (k , x , t )  u (k , x t , t )   u [k (t ), x,  ]d
t 
V(k t ,x t ,t)  u(k t ,x t , t )  V * (k t   ,t  ) .
Essa fórmula diz que se o montante de capital
Em palavras, isso significa que, os resultados
disponível no tempo t é k e se a política
de seguir tal política são os benefícios que
denotada por x é seguida nesse tempo, então
advêm do período inicial usando a decisão xt ,
o valor de contribuição a soma total, na data t,
mais o máximo lucro possível que pode ser
consiste de duas partes. A primeira parte é a
contribuição do pequeno intervalo que começa realizado começando-se da data t+, com o
na data t. Ela é a taxa a qual os lucros são capital k(t+) que resulta da decisão feita no
ganhos durante o intervalo vezes o tamanho do período inicial.
intervalo. Ela depende do estoque de capital Agora nós chegamos a um problema de
atual, da data, e do valor presente da variável cálculo comum de achar o melhor valor
de decisão, denotada aqui por xt. A segunda possível para xt. Se a firma adota esse valor,
parte é uma integral da mesma forma que a então o V da última fórmula será igual a V*. O
anterior mas começando na data t + . Deve- cálculo nos ensina que, freqüentemente, uma
se notar que o capital inicial nessa data para maneira efetiva de se descobrir um valor de
uma variável que maximiza uma dada função
essa última integral não é k(t) mas k(t+). Esse
é diferenciar a função com respeito a variável
fato, de que o estoque de capital mudará
e igualar a derivada parcial a zero. Esse é o
durante o intervalo da maneira como é
método que nós deveríamos usar. Mas
influenciado por xt , terá um papel muito
primeiro nós deveremos tomar alguns
significante. Nós podemos tirar vantagem do
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

cuidados pois esse método não é infalível. É disponível em t+. Ela é, então, o valor
completamente possível que as derivadas marginal do capital no tempo t+; ou o
parciais anulem-se quando a função não está montante pelo qual, ocorrendo um
maximizada (por exemplo, elas podem se incremento de uma unidade de capital nesse
anular quando a função é minimizada, ou ainda tempo, o máximo valor possível de W
num turn-point), e não é raro que as derivadas crescerá. Nós denotamos o valor marginal do
parciais difiram de zero no máximo. Nós capital no tempo t por (t), definido por
retornaremos a esses inconvenientes mais
tarde. Por enquanto, nós assumiremos que as V * ( k , t )
derivadas parciais anulam-se no máximo, ( t )  .
k
diferenciando V(kt , xt ,t) com respeito a xt ,
obtém-se Inserindo esse resultados na fórmula (3),
(3)
 
nós obtemos
 u(k,xt , t )  V * (k ( t   ),t  )  0 .
x t x t
u f
(4)    ( t   ) 0.
O incômodo com essa fórmula, sem falar do x t x t
fato que a função V* é ainda desconhecida, é
que nós dissemos para diferenciar V* com e além disso, a constante  pode ser
respeito a xt , que não envolve xt cancelada. Nós temos mais uma simplificação
explicitamente. Para fugir disso, note que a fazer antes de chegarmos a nossa primeira
conclusão importante. O valor marginal do
V * V * k ( t   ) capital muda gradualmente com o tempo e
 .
x t k ( t   ) x t assim, para uma aproximação suficientemente
boa,
Ambas as expressões merecem uma análise e
nós devemos começar com a segunda. Desde ( t   )  ( t )   ( t ) .
que nós estamos tratando com um curto
período de tempo nós podemos usar a Isso é, o valor marginal do capital em t+ é o
aproximação valor marginal em t mais a taxa a qual ele está
mudando durante o intervalo vezes o
k ( t   )  k ( t )  k . tamanho do intervalo. Inserindo essa
expressão na equação (4), após cancelar o
Isso é, o montante de capital no tempo t+ é
igual ao montante de capital no tempo t mais a valor comum , obtém-se
taxa de mudança do capital durante o intervalo
u f f
de tempo vezes o tamanho do intervalo.  ( t )   ( t )  0.
Relembrando a fórmula (1), k depende de xt : x t x t x t

k  f ( k , x t , t ) . Agora faz-se  aproximar-se de zero. O


Terceiro termo torna-se muito pequeno em
Assim nós podemos escrever comparação com os outros dois.
Desprezando-o, resulta
k ( t   ) f
 .
x t x t u f
(5)  ( t ) 0.
x t x t
Retornando, agora, para o primeiro fator,
V * k . Essa derivada é a taxa a qual o Esse é o nosso primeiro grande resultado e
constitui-se em metade do princípio do
máximo fluxo de lucro possível no tempo t+
máximo. Ele tem um sentido perfeitamente
muda com respeito ao montante de capital
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

válido para um economista. Ele diz que, ao Essa é a segunda maior fórmula do princípio
longo do curso ótimo da variável de decisão, do máximo e possui uma interpretação
num tempo qualquer, o efeito marginal de econômica esclarecedora.
curto prazo de uma mudança na decisão é Para um matemático,  é a taxa a qual o
contra balanceado exatamente pelo efeito valor de uma unidade do capital está
daquela decisão no valor total do estoque de mudando. Para um economista, ela é a taxa a
capital um instante depois. Nós entendemos qual o capital está se valorizando. -  é
que o segundo termo na equação é o efeito portanto a taxa a qual uma unidade de capital
marginal da decisão atual na taxa de está se depreciando no tempo t.
crescimento de capital com o capital valorado Consequentemente a fórmula afirma que
pelo seu valor marginal, . O valor de x, que a quando o curso temporal ótimo de
firma deve escolher a todo instante, deve ser acumulação de capital é seguido, a queda em
de tal maneira que o ganho marginal imediato valor de uma unidade de capital num pequeno
seja exatamente igual ao custo de longo prazo, intervalo de tempo é a soma de sua
que é medido pelo valor do capital contribuição para os lucros realizados
multiplicado pelo efeito da decisão na durante o intervalo com sua contribuição para
acumulação de capital. aumentar o valor do estoque de capital até o
Agora suponha que xt é determinado de tal fim do intervalo. Em outras palavras, uma
maneira que satisfaça a equação (5). Na unidade de capital perde valor ou deprecia-se
hipótese de que esse procedimento revela o com o passar do tempo por uma taxa a qual
valor ótimo de xt , V(kt , xt,,t) deverá então ser sua contribuição potencial para os lucros
igual a seu valor máximo possível ou V*(k, t). torna-se sua contribuição passada.
Assim, Esse achado é remanescente da figura de
linguagem empregada pelos teóricos do
V * (k,,t)  u(k,xt , t )  V * (k ( t   ),t  ) . capital no século dezenove. Eles diziam que
um bem de capital incorporava um certo
Agora diferencia-se essa expressão em relação
montante de valor que ele emprestava
a k. A derivada do lado esquerdo é, por
gradualmente aos bens que eram feitos com a
definição, (t). A derivação do lado direito é sua ajuda. Que é exatamente o que está
muito similar ao que nós já fizemos funcionando aqui. Cada unidade de bem de
anteriormente e segue-se que: capital está gradualmente decrescendo em
u  * valor a precisamente a mesma taxa a qual ela
( t )    V (k( t   ),t  ) está dando acréscimo aos produtos que têm
k k
u k ( t   ) valor, a cada bem vendido ou armazenado
   ( t  ) para o futuro em capital acumulado. Nós
k k
podemos também interpretar -  como a
perda que deve ser incorrida se a aquisição de
u  f  uma unidade de capital foi adiada por um
  1   (    )
k  k  curto período.
u f f 2
          II. O Princípio do Máximo
k k k
Fomos conduzidos a construir então uma
Nós podemos ignorar o termo em 2 e fazer os
função auxiliar ou Hamiltoniana
cancelamentos óbvios para obter
H  u(k,x , t )   ( t ) f(k , x , ,t) ,
u f
(6)     .
k k e obter sua derivada parcial com respeito a x,
e fazê-la igual a zero, isso é, maximizá-la.
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

Essa construção tem uma significância vemos que as equações (5) e (6) aconselham
econômica substancial. Se nós imaginarmos H a firma a escolher o curso temporal de x e 
multiplicado por , nós podemos ver que ele é de tal forma que os valores resultantes de k
a soma dos lucros totais obtidos no intervalo  são os únicos que ela escolheria, se ela puder
mais o acumulado de capital durante esse fazer isso, para ter a soma dos lucros e o
intervalo, valorado por seu valor marginal. H incremento no valor do capital tão grande
é assim a contribuição total das atividades quanto possível em cada pequeno intervalo
executadas no intervalo , incluindo tanto sua de tempo.
contribuição direta a integral de W, quanto o Como nota técnica, a respeito da
valor do capital acumulado durante o diferenciação de H, o valor marginal  não é
intervalo. Naturalmente, então, a variável de considerado como uma função de x e k, mas
decisão x durante o intervalo corrente deve ser como um curso temporal separado que deve
escolhida de maneira a fazer H tão grande ser determinado otimamente.
quanto possível. É por essa razão que o Agora temos diante de nós a idéia do
procedimento que nós estamos descrevendo é princípio do máximo. Existe naturalmente
chamado de princípio do máximo. Uma muito mais no método que essas duas
maneira simples, e freqüentemente efetiva de fórmulas. Uma boa quantidade de elaboração
se fazer isso, é escolher um valor da variável matemática é requerida antes que as duas
de controle para o qual a derivada parcial se fórmulas possam ser interpretadas, e nós
anule, como nós fizemos antes. indicaremos depois algumas das
Em adição, nós também teremos que fazer a complicações que podem surgir. Mas existe
derivada parcial de H com relação a k e igualar uma característica adicional que tem que ser
essa a -  . O sentido dessa operação pode ser mencionada antes de nós finalizarmos o
melhor visualizado de um Hamiltoniano tratamento dos fundamentos. Isso diz
modificado, respeito a condições de fronteira; por
exemplo, o montante de capital disponível no
d início do período planejado e o montante
H *  u(k,x , t )  k
dt requerido para se ter na data final.
 u(k,x , t )  k   k Para ver como essa limitação nos dados
afeta a solução do problema, considere agora
H* é a soma dos lucros realizados durante um 7
H* difere de H porque inclui ganhos de capital
intervalo de comprimento  e o acréscimo no
a maneira como as três fórmulas básicas
valor do estoque de capital durante o intervalo,
operam. Elas são:
ou em outro sentido, o valor da contribuição
total das atividades durante o intervalo para os (I) k  f ( k , x , t )
lucros presentes e futuros.7Se nós
maximizarmos formalmente H* com respeito a u f
(II)  0
x e k nós obteremos: x x

u f u f
 0 (III)   
x x k k
u f
    0 , A primeira delas é parte dos dados do
k k
problema. Ela especifica como o capital
que são as equações (5) e (6). cresce a ca-da instante como o resultado de
Na verdade, a firma não pode maximizar H* sua posição atual e das escolhas feitas. As
com respeito a k desde que k não é uma outras duas fórmulas são os resultados
variável sujeita a escolha. Mas agora nós principais do princípio do máximo. A fórmula
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

(II) diz que a variável de escolha a cada capital. Repetindo esse ciclo novamente
instante deverá ser selecionada de tal maneira repetidas vezes, nós podemos traçar a
que os ganhos marginais imediatos fiquem em evolução de todas as variáveis do tempo zero
equilíbrio com o valor da contribuição para a até o tempo T.
acumulação do capital. A fórmula (III) diz que Em resumo, essas três fórmulas,
o capital se deprecia a mesma taxa que ele trabalhando juntas, determinam os cursos
contribui para os produtos úteis. ótimos de todas as variáveis começando de
As três fórmulas são convenientemente alguma posição inicial dada. Em outro
escritas e relembradas em termos do sentido, então, o problema da escolha de um
Hamiltoniano. Nessa forma elas são: curso ótimo foi reduzido a um problema
muito simples, o problema de escolher um
H valor inicial ótimo para o valor de uma
(I’)  k
 unidade de capital. Isso não é de modo algum
H um problema fácil, mas obviamente é mais
(II’’) 0 fácil que achar todo um curso ótimo sem a
x
ajuda dessas fórmulas.
H
(III’’’)   . III. As Condições de Contorno
k
Nós podemos agora mencionar o papel das
Note o papel recíproco que k e  têm nessas condições de contorno. Elas são de dois
equações. A derivada parcial de H com tipos. A condição inicial descreve o estado da
respeito a cada um é simplesmente relacionada firma ou da economia para a data inicial, t =0.
a derivada em relação ao tempo do outro.
Essas três fórmulas em conjunto 8
Algumas complicações matemáticas surgem aqui. Nós
determinam completamente os cursos assumimos que com k,  e t dados, a fórmula (II) é
satisfeita por um único valor de x.
temporais da variável de escolha (decisão), do Em particular ela estabelece o estoque inicial
estoque de capital e do valor do capital. Nós de capital. As condições finais prescrevem os
começaríamos no tempo zero com um certo valores de algumas, ou de todas, as variáveis
estoque de capital. Agora olhe para a fórmula na data final, t = T. Por exemplo, o problema
(II) escrita mais explicitamente: pode requerer que a firma tenha em mãos
  pelo menos algum estoque de capital
(II) u( k , x , t )   ( t ) f ( k , x,t )  0 .
x x especificado, digamos K , para a data final,
que pode ser imposto incluindo k ( T )  K
Com k e  conhecidos, essa fórmula determina nas condições do problema. Ou, novamente,
o valor de x, a variável de decisão.8Colocando se o problema é estritamente de maximização
esse valor na fórmula (I) nós obtemos k , a de lucros durante um intervalo finito, 0 a T, é
taxa a qual o estoque de capital está mudando. claro que o capital em mãos no tempo T não
Colocando ele na fórmula (III) nós obtemos pode contribuir para esse objetivo; sua
similarmente  a taxa a qual o valor de uma existência é muito tardia para ter alguma
unidade de capital está mudando. Assim nós serventia em T. Tal problema faz surgir a
conhecemos o estoque de capital e o valor de condição final ( T )  0 .
uma unidade de capital um curto período de Agora nós vimos que as três equações (I),
tempo depois. Usando esses novos valores, (II), (III) juntas determinam toda evolução de
nós podemos repetir nossas substituições nas x, k e  , uma vez que os valores iniciais
três fórmulas e assim achar, sucessivamente, foram preestabelecidos. Em particular, elas
um novo valor para a variável de escolha, uma determinam os valores finais. Nós temos
nova taxa para mudança no estoque de capital apenas 9 que determinar um conjunto de
e uma nova taxa para a mudança no valor do
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

valores iniciais que conduzem a valores finais Seja  a taxa social de preferência temporal
aceitáveis para encontrar um curso temporal (isso é, a taxa de desconto).
completo que satisfaça as condições Então a importância no tempo 0 do
necessárias de otimalidade. No nosso exemplo, consumo realizado no tempo t é
como o estoque de capital é dado, o valor
inicial crítico a se determinar é  ( 0 ) , o valor (7) e  t e nt u( c )  e ( n   )t u( c ) .
marginal do capital no tempo inicial. As três
O objetivo social defendido para uma
fórmulas básicas, aparentemente abstratas, de
sociedade com horizonte de tempo T
fato constituem uma solução construtiva para
(concebidamente infinito) é maximizar
o problema da escolha de um curso temporal
ótimo. Elas são uma solução, a princípio, do T

problema da acumulação de capital ótima. (8) W   e ( n   )t u( c )dt ,


Nós agora encontramos que a velha técnica 0

adaptada de equações marginais, usada com ou a soma das utilidades desfrutadas entre 0 e
pouca ingenuidade, conduz ao princípio do T.11
máximo, que é o teorema fundamental da O consumo é limitado pelo produto e o
teoria do controle ótimo. produto pelo estoque de capital. Denote K(t)
IV. Um Exemplo como o estoque de capital na data t e
10
Uma discussão extensiva de um modelo muito similar
Um conhecido e simples exemplo da
pode ser achado em Arrow [1].
aplicação desse princípio a um problema 11
É melhor assumir  > n ou a integral será infinita
econômico para T = .
9
Apenas! Reputações foram construídas para resolver k(t)=K(t)/N(t) como capital per capta. Em
esse problema em importantes instâncias. virtude dos retornos constantes de escala, nós
é a obtenção do curso temporal socialmente podemos escrever a função de produção da
ótimo da acumulação de capital para uma economia como
economia de um setor com um crescimento
populacional exponencial e uma produção com Y ( t )  N ( t ) f ( k ( t )) ,
retornos constantes de escala.10
ou, omitindo o tempo,
Vamos estabelecer a seguir alguma notação
e dados. N(t) é a população na data t. Como a Y  Nf ( k )  e nt f ( k ) .
população cresce exponencialmente, à taxa n,
digamos, O investimento bruto iguala-se ao produto
menos o consumo, ou Y – Nc. A rede de
N ( t )  N ( 0 )e nt . investimentos iguala-se ao investimento bruto
menos a depreciação física. Suponha que o
Ela adquirirá menos desordem se nós
assumirmos N(0) = 1 (medido em centenas de capital físico deteriora-se a uma taxa  por
milhões de pessoas). Denote o consumo per unidade por ano de maneira que a taxa total
capta por c e a utilidade desfrutada por uma de degeneração do estoque de capital,
pessoa consumindo à taxa c por u(c). A quando ele é K, é K. Então a rede de
utilidade total desfrutada por todas as pessoas acumulação de capital é
vivas no tempo t com consumo per capta à K  Y  Nc  K  N ( f ( k )  c )  K
taxa c é  N ( f ( k )  c )  Nk
e nt u( c ) .  N ( f ( k )  c  k )

Finalmente, elimina-se K
 notando-se que:
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

d K K  K N  Essa é nossa equação final para o curso ótimo


k     
dt N N K N de acumulação do capital. Ela afirma que ao
 K 
longo de tal curso a taxa de consumo a cada
(9)  k   n  momento deve ser escolhida de tal maneira
 Nk  que a produtividade marginal do capital seja a
 f ( k )  c  k  nk soma de três componentes:
 f ( k )  c  ( n   )k . (1) , a taxa social de preferência pelo
tempo (a taxa de desconto)
As equações (8) e (9) constituem nosso
exemplo simples. A equação (9) é um exemplo (2) , a taxa de depreciação física do
da equação (I). Para obter a equação (II), capital, e
diferencie as equação (7) e (9) com respeito a (3) o termo mais estranho considerado
variável de decisão, c: que, contudo, é simplesmente a taxa
percentual a qual o custo psicológico
 ( n   )t de poupar diminui através do tempo.
e u( c )  e ( n   )t u' ( c ) .
c Isso pode ser visto notando que o

custo psicológico de poupar num
[ f ( k )  c  ( n   )k ]  1. tempo qualquer é u’(c), sua taxa
c
temporal de mudança é u’’(c)dc/dt, e
Consequentemente a equação (II) é: sua taxa temporal percentual de
mudança é o negativo do terceiro
(10) e ( n   )t u' ( c )    0 , termo na soma.
Em outras palavras, ao longo do curso
ou o valor de uma unidade no tempo t é a ótimo de acumulação, a contribuição marginal
utilidade marginal do consumo nesse tempo, de uma unidade de capital ao produto durante
ajustada pelo crescimento da população e pela um curto intervalo de tempo, deve ser
taxa de preferência pelo tempo (taxa de exatamente suficiente para cobrir os três
desconto). componentes de custo social de processar
A equação (III) é obtida similarmente aquela unidade de capital, que são a taxa
diferenciando as equações (7) e (9) com social de preferência pelo tempo (taxa de
respeito a k. Isso resulta em: desconto), a taxa de deterioração física do
   0   [ f ' ( k )  ( n   )] , capital e o custo psicológico adicional de
poupar uma unidade no começo do intervalo
ou preferivelmente que no fim. Todos eles são
expressos em percentuais por unidade de
 tempo, que também é a dimensão da
(11) f' ( k )  n   .
 produtividade marginal do capital.
A evolução dessa economia ao longo de
A equação (10) pode ser usada para eliminar a
seu curso ótimo de desenvolvimento pode ser
variável desconhecida . Diferenciando-a em
vista com alguma clareza desenhado-se um
relação ao tempo: diagrama de fase como mostrado na Figura 1.
 u' ' ( c ) dc Nós encontramos que as taxas de mudança de
 n   . k e c podem ser escritas como:
 u' ( c ) dt
k  f ( k )  ( n   )k  c ,
Substituindo em (11):
(9) u' ( c )
u' ' ( c ) dc c  [     f ' ( k )].
f' ( k )     u' ' ( c )
.
u' ( c ) dt
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

Assim k  0 sempre que c e k satisfaçam a A linha vertical na Figura 1, rotulada de


equação c  0 , é desenhada para esse nível de k. Se
c  f ( k )  ( n   )k . nós aceitamos as hipóteses usuais de utilidade
marginal positiva mas decrescente u’(c)>0,
Na Figura 1, k está no eixo horizontal e c no u’’(c)<0. Então c  0 , isso é, o consumo per
eixo vertical. A curva rotulada k  0 mostra capta cresce, do lado esquerdo dessa linha. A
combinações de c e k que satisfazem essa razão é que com níveis mais baixos de capital
equação. Ela tem uma forma puxada para per capta o montante depreciado é menor e o
frente por causa das hipóteses convencionais montante de capital necessário para equipar o
de que a produtividade marginal do capital é incremento da população com o nível de
positiva mas decrescente (isso é, f’(k)>0, capital per capta atual também é menor.
f’’(k)<0), e a hipótese mais plausível de que Essas considerações permiti-nos descrever
para níveis mais baixos de capital por qualitativamente as leis de movimento do
trabalhador, f’(k)>n+. Nós também sistema. Imagine um nível de capital per capta
assumimos que não é possível produzir nada inicial baixo, representado pela linha vertical
com nenhum capital, isso é, f(0) = 0. Se o tracejada no diagrama. Toda a evolução do
consumo per capta é menor que a taxa no local sistema é determinada pela escolha do nível
descrito, o capital per capta cresce ( k  0 ). inicial de consumo per capta. Se um nível
Acima do local k  0 . inicial baixo é escolhido, tal como no ponto A
na figura, tanto o consumo quanto o capital
per capta cresceram com o tempo, seguindo a
reta que parte do ponto A. Mas quando o
nível de capital per capta alcança o nível
crítico, o consumo per capta começará a
baixar embora o nível de capital per capta
continue a crescer. Essa é uma política de
c c  0 generosidade inicial no consumo seguida por
abstinência crescente planejada,
presumivelmente para atingir algum desejado
nível final de capital per capta.
Similarmente, o curso que parte do ponto
B representa uma política de consumo per
k  0
capta continuamente crescente, com o capital
sendo acumulado inicialmente e
eventualmente sendo consumido. Os outros
B cursos desenhados têm interpretações
C similares.
A O curso originado do ponto C é de
k interesse particular. Ele conduz à interseção
das duas curvas críticas, o estado fixo do
Figura 1 sistema no qual nem o consumo nem a renda
per capta mudam. Embora nesse ponto todos
os valores absolutos cresçam
Similarmente , o consumo per capta não exponencialmente à taxa comum n.
muda ( c  0 ) se Agora vimos que se o capital per capta
inicial é dado, todo o curso da economia está
f’(k)=   . determinado pela escolha do nível inicial de
consumo per capta. Essa escolha determina,
DORFMAN : TEORIA DO CONTROLE ÓTIMO 5

entre outras coisas, o montante de capital per Aqueles que desconfiam da habilidade, e
capta numa data especificada.12 Se as de argumentos intuitivos, como eu, devem
condições do problema prescrevem um achar mais confortante ver os mesmos
montante particular de capital em alguma data, resultados deduzidos por um método mais
o c inicial deve ser o único curso que conduz familiar de maximização sujeita a um número
ao ponto especificado. Se não existem tal finito de restrições. Suponha que o período
prescrição para acumulação do capital, o c total de T meses seja dividido em n
inicial será o único que esgota o estoque de subperíodos de m meses cada. u( xt , kt , t)
capital na data final sobre consideração. E se denota então a taxa a qual os lucros estão
não existe data final (isso é, T= ) o problema sendo ganhos, ou outros benefícios estão
torna-se muito difícil matematicamente e, na sendo obtidos, durante o t-éssimo
verdade, a teoria da otimização com um subperíodo, com xt sendo o valor da variável
horizonte de tempo infinito não está mas de decisão durante aquele subperíodo, e kt o
completamente fundamentada. Mas, nesse valor da variável de estado no começo desse
simples caso, nós podemos ver que a única subperíodo. Como o subperíodo tem duração
solução possível é um curso que se origina no de m meses, o lucro total ganho é u( xt , kt
ponto C e termina no ponto onde c  k  0 . ,t)m.
Pois, a figura mostra que todos os outros A taxa de mudança da variável de estado
cursos que satisfazem as condições de durante o t-éssimo período é f( xt , kt ,t).
otimização conduzem eventualmente a Então os valores da variável de estado no
situações em que começo dos subperíodos sucessivos são
12
relacionados pela equação
A posição da economia numa data particular não pode
ser lida fora do plano de fase . (12) k t 1  k t  f ( x t , k t , t )m .
ou c ou k é negativo. Como tais cursos não
podem ser realizados, o único caminho de Finalmente, a versão finita do nosso problema
otimização viável é aquele que se dirigi a é escolher 2n valores, xt , kt de tal maneira
c  k  0 . que maximize o lucro total sobre o período
Esse é um resultado bem característico de total,
n
um problema de horizonte infinito: os cursos
de crescimento ótimo, sobre muitas condições,  u( x
t 1
t , k t , t )m .
dirigem-se à situação em que o consumo e o
estoque de capital crescem exponencialmente à Sujeito às n restrições (12), e para algumas
taxa determinada pela taxa de crescimento da condições de contorno que devem ser
população e a taxa do progresso tecnológico aplicadas. Para ser específico, suponha que os
(aqui assumida igual a zero), exatamente como valores iniciais e finais para a variável de
nesse caso. estado são previamente estabelecidos. Isso
Para problemas de horizonte finito, pode-se faz aparecer as condições
mostrar que na data final mais remota
considerada, no final o curso se dirigirá para a k1  K 0
posição do estado imutável ( c  k  0 ) indo k n 1  K T
antes ou para um alto consumo ou para uma
alta acumulação de capital dependendo do Esse problema é resolvido estabelecendo-
caso. Essa é uma versão do teorema do se a função Lagrangeana
“turnpike”.
IV. Obtenção via Maximização Finita
DORFMAN : TEORIA DO CONTROLE ÓTIMO 6
n variável discreta. Os multiplicadores de
L   u( x t , k t , t )m Lagrange têm suas interpretações usuais. Em
t 1
n particular, t é o montante pelo qual o valor
.
   t [ k t  f ( x t , k t , t )m  k t 1 ] n

t 1 máximo atingível de  u( x
t 1
t , k t , t )m será
  0 [ K 0  k1 ]   [ k n 1  K T ]
acrescido se uma unidade adicional de capital
E fazendo cada uma de suas derivadas parciais tornou-se disponível por mágica no final do t-
iguais a zero. Os símbolos gregos na fórmula éssimo período. Em outras palavras, t é o
são os multiplicadores de Lagrange, um para valor marginal do capital em mãos na data mt.
cada restrição. Nós deveremos interpretá-los As condições de maximização achadas
depois de terminarmos nossos cálculos. previamente devem ser o limite dessas
A mesma expressão do Hamiltoniano que equações quando m tende para zero e n para
nós encontramos no começo está começando a infinito, e elas são. Para mostrar isso, nós
emergir, assim é conveniente escrever precisamos revisar ligeiramente nossa
notação. As variáveis subscritas agora
H ( x t , k t , t )  u( x t , k t , t )   t f ( x t , k t , t ) denotam os valores que as variáveis têm no t-
e éssimo período. Quando m muda, as datas
n n incluídas no t-éssimo período também
L  m H ( x t , k t , t )    t ( k t  k t 1 ) mudam. Assim nós precisamos de símbolos
1 1
para os valores das variáveis para uma data
  0 ( K 0  k1 )   ( k n 1  K T ). fixa. Para esse fim,  denotará uma data e
Agora diferenciando e igualando as derivadas a x(), por exemplo, o valor de x nessa data. A
zero: conexão entre xt e x() é fácil. Uma data 
L  está em um subperíodo numerado t onde t é
m H ( xt , k t ,t ) dado por
x t x t
(13)
 [ u1 ( x t , k t , t )   t f 1 ( x t , k t , t )] m  0 t  1 [ / m ] .
para t  1, 2  , n ,
Nessa fórmula, [ ] é uma antiga notação usual
que é análoga a equação (5). E que significa “parte inteira de”. Por exemplo:
[3,14159]= 3. Então x() é denotado por
L 
m H ( x t , k t , t )   t   t 1  0 x(  )  x1 [  / m ] ,
k t k t
ou e similarmente para as outras variáveis. As
equações (13) e (14) podem agora serem
 t   t 1
  u 2 ( xt , k t , t ) escritas em termos de  :
(14) m
  t f 2 ( x t , k t , t ), para t  1,  , n, (15)

que é a análoga discreta da equação (6). (  )  (   m )


  u 2 [ x(  ), k (  ), ]
Finalmente (16) m
 (  ) f 2 [ x(  ), k (  ), ].
L
   n    0.
k n 1 Note na equação (16) que  t 1 foi trocado
Assim,    n e pode ser esquecido. por  (   m ) , refletindo que o começo dos
Essas equações são aplicáveis a problemas intervalos são m meses separadamente.
nos quais o tempo é considerado como uma
DORFMAN : TEORIA DO CONTROLE ÓTIMO 6

A equação (15) é idêntica à (II). Quando m onde


aproxima-se de zero, o lado esquerdo da
dk
equação (16) aproxima-se de   (  ) , fazendo  f [ k ( t ), x( t ), t ] ,
por garantia que ela se aproxima como um dt
limite e aplicando a definição de derivada. A onde k(0) é preestabelecido, e onde
equação total, portanto, aproxima-se da requer-se que k ( T )  K . Assume-se que as
equação (III). A equação (I) é similarmente e funções u(k, x, t) e f(k, x, t) são duas vezes
obviamente a forma limite da equação (12). continuamente diferenciáveis (são de classe
Assim, as equações básicas do princípio do C2) com respeito a k, diferenciável com
máximo são vistas como formas limites das respeito a x, e contínua com respeito a t.
condições necessárias de primeira ordem para Então se x*(t) é uma solução a esse problema,
um máximo aplicado ao mesmo problema, e as existe uma variável auxiliar  ( t ) tal que:
variáveis auxiliares do princípio do máximo
são os valores limites dos multiplicadores de
Lagrange. 13
Por exemplo, em Arrow and Kurz [3] e Halkin [5] .
14
O teorema dado é uma adaptação do de Arrow[2],
VI. Qualificação e Extensão Proposições 1 e 2. Teoremas mais elaborados podem ser
achados nessa fonte.
Todo esse desenvolvimento foi
excessivamente informal, posto
generosamente. O cálculo das variações é uma
matéria difícil e delicada, de forma que sempre (a) Para cada t, x*(t) maximiza
foi feita uma escolha entre especificar H [ k ( t ), x( t ),  ( t ), t ] onde
corretamente uma proporção, com todas as H ( k , x ,  , t )  u( k , x , t )  f ( k , x , t ) ;
qualificações que ela merece, e especificá-la d H
forçosa e claramente de tal maneira que a idéia (b) ( t ) satisfaça  avaliado
dt x
essencial possa ser compreendida facilmente. A para k=k(t), x=x*(t),   ( t ) ; e
alternativa mais inteligível foi escolhida nesse (c) k ( T )  K , ( T )  0 ,
paper pois todos os teoremas foram  ( t )[ k ( T )  K ]  0 .
rigorosamente provados e estabelecidos na Esse teorema aplica-se ao tipo de
literatura.13 Essa escolha, quando ela ocorre, problema que nós estávamos considerando,
tem um obstáculo especial no presente com a elaboração útil de que um limite
contexto porque muitas das virtudes do inferior foi imposto no valor final da variável
princípio do máximo reside precisamente nas de estado, k. A parte (c) da conclusão,
qualificações que foram suprimidas: ele é chamada de condição de transversalidade,
válido sob condições mais gerais do que os resulta desse requerimento adicional. Ela
métodos clássicos que produzem quase os afirma que o valor final da variável auxiliar
mesmos teoremas. não pode ser negativo e que será zero se, no
Como um exemplo do modo alternativo de final do curso ótimo, k(T) exceder o valor
exposição, nossas principais conclusões podem requerido.
ser estabelecidas mais formalmente e A principal diferença entre esse enunciado
corretamente como segue:14 formal e nossas prévias conclusões residi na
TEOREMA 1. Pede-se para achar um curso conclusão (a) do Teorema. A afirmação de
temporal de uma variável de controle x(t) de que a função Hamiltoniano, H, é maximizada
tal maneira que maximize a integral a cada instante de tempo não é o mesmo que
T afirmar que suas derivadas parciais
 u [ k ( t ), x( t ),t ] dt , desaparecerão, como feito em nossas
0 equações (II) e (II’). Igualar as derivadas
DORFMAN : TEORIA DO CONTROLE ÓTIMO 6

parciais a zero não é nem necessário nem disponíveis como esse da programação
suficiente para maximização, embora seja matemática. E é exatamente nessas
especialmente esclarecedora para os circunstâncias que o princípio do máximo
economistas, quando é apropriada, porque produz teoremas mais elegantes e manejáveis
condições nas derivadas parciais traduzem-se que o velho cálculo das variações, que é o
prontamente em igualdades marginais. Existem parente mais próximo do cálculo diferencial.
três complicações que podem fazer o Por todas essas razões, a condição
desaparecimento das derivadas parciais uma fundamental para um curso de crescimento
indicação inadequada da localização de um ótimo é a maximização de H(k, x,, t) a todo
máximo. momento de tempo, e o desaparecimento de
Primeira, existem as chamadas condições de H
x é apenas dispositivo seguro mas
ordem maior. As derivadas parciais de primeira imperfeito para se localizar esse máximo. Ele
ordem podem zerar para um mínimo ou para é, no entanto, um dispositivo muito
um ponto de cela bem como para um máximo. esclarecedor
Para se prevenir contra essas possibilidades, as 15
Tecnicamente isso é chamado de “solução de canto”.
derivadas parciais de segunda ordem, e outras
de ordem maior, devem ser levadas em conta. e contém o conceito essencial da matéria,
Segundo, o desaparecimento das derivadas motivo pelo qual nos concentramos nele.
parciais, mesmo quando as condições de Em toda a discussão nós tentamos ser
ordem mais altas são satisfeitas, estabelece ambíguos sobre a natureza exata dos cursos
apenas um máximo local. Isso não impede que temporais, x(t) e k(t). Nós tratamos x e k
possa existir algum outro valor das variáveis, a como se elas fossem variáveis
uma distância finita, para a qual a função será unidimensionais, tal como a quantidade de
maximizada tendo um valor mais alto ainda. capital ou a taxa de consumo. Em muitos
Para realçar esse ponto, uma inspeção global é problemas econômicos, porém, existem várias
melhor que inspeções apenas em diferenciais variáveis de estado e várias variáveis de
ou propriedades locais das funções envolvidas. escolha (decisão). Em tais problemas, é
Finalmente, onde a faixa de variação das proveitoso pensar em x(t), k(t), suas
funções envolvidas é limitada de alguma derivadas, e assim por diante, como vetores.
maneira, o máximo deve ser atingido num Então  ( t ) também deve ser visto como um
ponto onde as derivadas parciais não vetor, com um componente para cada
desapareceram. Isso ocorre freqüentemente em componente de k(t). Quando toma-se esse
aplicações econômicas, como estamos ponto de vista, todas as nossas conclusões e
familiarizados, em programação linear. Por também o teorema são aplicáveis quase sem
exemplo, deve ser ótimo para uma firma com mudança na notação. Isso porque nós fomos
grandes possibilidades de crescimento reduzir ambíguos: é mais fácil pensar com números
seus dividendos a zero, embora dividendos ordinários, mas nossas conclusões e também
negativos não sejam permitidos. Em termos muitos dos nossos argumentos são aplicáveis
das nossas fórmulas isso será indicado achando quando as variáveis são vetores.
H A última observação cultiva algumas novas
 0 para todo x t  0 , possibilidades importantes. Muitos problemas
x t
econômicos dizem respeito a cursos
onde xt denota pagamento de dividendos por temporais de variáveis interconectadas. Por
ano no tempo t. H deve ser maximizado exemplo, um problema pode tratar com
escolhendo-se xt =0, seu menor valor cursos de crescimento do consumo (c),
permissível, apesar das derivadas parciais não investimento (i), gastos governamentais (g), e
serem zero.15 Esse máximo não pode ser renda (y) em uma economia. Essas quatro
encontrado pelos métodos comuns do cálculo. variáveis podem ser consideradas como
Outros métodos, com certeza, estão
DORFMAN : TEORIA DO CONTROLE ÓTIMO 6

quatro componentes de um vetor de decisão, x, [6] H. HOTELLING, “A General Mathematical


conectados pela identidade da renda c(t) + i(t) Theory of Depreciation,” J. Amer. Statist.
+ g(t) = y(t). Então o problema de otimizar o Ass., Sept. 1925, 20, 340-53.
curso de crescimento requer que sejam [7] L. S. PONTRYAGIN, V. G. BOLTVANSKII, R.
achados os cursos ótimos de crescimento para V. MISHCHENKO, The Mathematical Theory
essas quatro variáveis (e talvez outras) que of Optimal Processes,(tr. By K. N. Trirogoff).
satisfaçam a identidade da renda. New York 1962.
A nova característica que nós encontramos [8] F. P. RAMSEY, “A Mathematical Theory of
é a introdução de restrições ou condições Saving,” Econ. J. Dec. 1942, 38, 543-59.
laterais nos valores das variáveis de decisão. A [9] J. ROBINSON, The Accumulation of
mesma linha de raciocínio que nós usamos Capital. Homewood, 1956.
pode ser usada, com apenas uma modificação,
a de que, quando a função V(k, xt , t) é
maximizada, o vetor xt tem que ser escolhido
de maneira a satisfazer todas as condições
laterais. A álgebra torna-se um pouco mais
complicada mas conduz a conclusões como as
discutidas acima e com a mesma importância
econômica. Em 1968, Kenneth Arrow deduziu
uma versão lúcida do enunciado formal do
teorema aplicável a problemas nos quais as
variáveis de decisão são restritas. Veja [2,
Proposição 3, p.90]. De fato, esse argumento,
também, presume aquelas circunstâncias em
que as próprias derivadas parciais zeram para
um máximo.

REFERÊNCIAS:
[1] K. J. ARROW, “Discounting and Public
Investment Criteria,” in A. V. Kneese and S. C.
Smith, eds. Water Research, Washington 1966,
pp. 13-32.
[2]______, “Applications of Control Theory to
Economic Growth ,” American Mathematical
Society, Mathematics of the Decision
Sciences, Part 2. Providence 1968, pp. 85-119.
[3]______, AND M. KURZ, Public Investment,
the Rate of Return, and Optimal Fiscal Policy.
Stanford University Institute for Mathematical
Studies in the Social Sciences, 1968.
[4] R. BELLMAN, Dynamic Programming.
Princeton 1957.
[5] H.HALKIN, “On the Necessary Condition
for Optimal Control of Nonlinear Systems,”
Journal D’Analyse Mathêmatique, 1964, 12,
1-82.