Teoria Do Controle Otimo Capitulo 7 Stamford

1
Captulo 7
Controle timo:
O princpio do mximo
O clculo das variaes, o mtodo clssico para atacar problemas de otimizao dinmica,
assim como o clculo comum, requer para sua aplicabilidade a diferenciabilidade das
funes que entram no problema. Mais importante que isso que apenas solues interiores
podem ser manipuladas. Um desenvolvimento mais moderno que pode trabalhar com
caractersticas no clssicas tais como soluo de canto, encontrado na teoria do controle
timo. Como seu nome indica, a formulao de controle timo do problema de otimizao
dinmica foca uma ou mais variveis que servem como instrumentos de otimizao.
Diferente, entretanto, do clculo das variaes, onde nosso objetivo encontrar o caminho
temporal timo para uma varivel estado y, a teoria do controle timo tem como sua
principal meta a determinao do caminho timo para a varivel de controle u. Certamente,
logo que o caminho do controle timo, u*(t), seja encontrado, ns podemos tambm
encontrar o caminho do estado timo, y*(t), que corresponde a ele. De fato, os caminhos
u*(t) e y*(t) so usualmente encontrados no mesmo processo. Mas a presena de uma
varivel de controle como estgio central muda a orientao bsica do problema de
otimizao dinmica.
Duas questes so propostas imediatamente. O que que uma varivel de controle
faz? E como seu ajuste dentro do problema da otimizao dinmica? Para responder essas
questes, vamos considerar uma economia ilustrativa simples. Suponha que exista numa
economia um estoque finito de recursos exaurveis S (tal como carvo ou leo), como no
modelo de Hotelling, com S(0) = S0. Como esse recurso est sendo extrado (e usado), o
estoque de recurso ser reduzido de acordo com a relao
dS (t )
E (t )
dt
onde E(t) denota a taxa de extrao do recurso no tempo t. A varivel E(t) qualificada
como varivel de controle porque possui as duas propriedades seguintes. Primeiro, ela
algo que esta sujeito a nossa escolha arbitrria. Segundo, nossa escolha de E(t) age sobre a
varivel S(t) que indica o estado do recurso a todo instante do tempo. Conseqentemente, a
varivel E(t) como um mecanismo de pilotagem em que ns podemos manobrar de forma
a dirigir a varivel de estado S(t) para vrias posies em qualquer tempo t por meio da
equao diferencial dS(t)/dt = - E(t). Por uma pilotagem correta de tal varivel de controle,
ns poderamos, consequentemente, visar a otimizao de algum critrio de performance
expresso pelo funcional objetivo. Para o presente exemplo, ns podemos postular que a
sociedade quer maximizar a utilidade total derivada do uso do recurso exaurvel sobre um
dado perodo de tempo [0,T]. Se no h restrio no estoque final, o problema de
otimizao dinmica toma a seguinte forma:
2
T
Maximize 0
U ( E )e t dt
dS
sujeito a E (t )
dt
e S (0) S 0 S (T ) livres (S 0 , T dados )
Nessa formulao, apenas a varivel de controle E entra no funcional objetivo. Mas,

de uma maneira geral, espera-se que o funcional objetivo dependa tanto da(s) varivel(eis)
de estado quanto da(s) varivel(eis) de controle. Similarmente, apenas um caso especial
que nesse exemplo o movimento da varivel de estado S dependa apenas da varivel de
controle E. Em geral, o curso do movimento da varivel de estado sobre o tempo pode ser
afetado tanto por varivel (variveis) de estado quanto por varivel (variveis) de controle,
e ainda pela prpria varivel t.
Com esse conhecimento, ns agora continuamos a discusso do mtodo de controle
timo.
7.1 O PROBLEMA BSICO DE CONTROLE TIMO
Para manter uma estrutura introdutria simples, primeiro vamos considerar um problema
com uma nica varivel de estado y e uma nica varivel de controle u. Como sugerido
anteriormente, a varivel de controle o instrumento de poltica que nos habilita a
influenciar a varivel de estado. Assim, qualquer escolha do caminho de controle u(t) ir
implicar num caminho de estado associado y(t). Nossa tarefa escolher um caminho timo
admissvel u*(t) no qual, ao longo do caminho de estado timo admissvel y*(t), iremos
otimizar o funcional objetivo sobre o intervalo de tempo [0,T].
Caractersticas Especiais dos Problemas de Controle timo

3
u y
C
A
c Trajetria
Trajetria estado
de controle B
b d
a
0 t 0 t
t1 t2 T t1 t2 T
(a) (b)
Figura 7.1
Uma caracterstica notvel da teoria do controle timo a de que um caminho de controle

no precisa ser contnuo para se transformar em admissvel; ele apenas precisa ser contnuo
por partes. Isso significa que ele pode conter saltos descontnuos, como ilustrado na figura
7.1a, apesar de no podermos permitir descontinuidades que envolvam um valor infinito de
u. Uma boa ilustrao de controle contnuo por partes na vida diria o liga e desliga da
chave do computador ou da ignio. Quando giramos a chave para ligar (u = 1) e desligar
(u = 0), a trajetria do controle experimenta um salto.
A trajetria de estado y(t), por outro lado, deve ser contnua no perodo de tempo
[0,T]. Mas, como ilustrado na Fig. 7.1b, permite-se que tenha um nmero finito de pontos
agudos, ou quinas. Isto , para ser admissvel, uma trajetria de estado necessita apenas ser
diferencivel por partes1. Note que cada ponto agudo sobre a trajetria do estado aparece
no tempo em que o caminho do controle d um salto. A razo para esse ritmo coincidente
est no processo de obteno da soluo do problema. Uma vez que tenhamos encontrado
que o segmento do controle timo para o intervalo de tempo [0,t 1) , digamos, a curva ab na
Fig 7.1a, ns tentamos ento determinar o segmento correspondente da trajetria tima de
estado. Ela pode ser, digamos, a curva AB, na Fig. 7.1b, cujos pontos iniciais satisfazem
uma dada condio inicial. Para o prximo intervalo, [t 1,t2), determinamos novamente o
segmento da trajetria de estado timo sobre a base do controle timo pr encontrado,
curva cd, mas dessa vez devemos tomar o ponto B como ponto inicial do segmento de
estado timo. Da, o ponto B serve como ponto terminal para o primeiro segmento e como
ponto inicial para o segundo segmento da trajetria de estado timo. Por essa razo, no h
descontinuidade no ponto B, apesar de aparecer como um ponto agudo. Como trajetria de
controle admissvel, a trajetria admissvel deve ter um valor finito y para todo t no
intervalo de tempo [0,T].
1
Pontos agudos numa trajetria de estado podem tambm ser acomodados no clculo de vrias variveis via
as condies de Weierstrass-Edrmann. Ns no discutimos esse assunto nesse livro, por causa da relativa
raridade de suas aplicaes econmicas. O leitor interessado pode consultar qualquer livro sobre clculo das
variaes.
4
Outra caracterstica importante que a teoria de controle timo capaz de manipular

diretamente uma restrio na varivel de controle u, tal como a limitao u (t ) U para
todo t [0, T ] , onde U denota algum conjunto de controle limitado. O conjunto controle
pode ser de fato fechado, conjunto convexo, tal como u (t ) [0,1] . O fato de que U possa
ser um conjunto fechado significa que solues de canto (solues de fronteiras) podem ser
admitidas, o que insere uma importante caracterstica no clssica na estrutura do problema.
Quando essa caracterstica combinada com a possibilidade de saltos descontnuos na
trajetria de controle, um fenmeno interessante chamado de soluo bang-bang pode
ocorrer. Assumindo que o conjunto controle seja U = [0,1], por exemplo, a trajetria do
controle timo ir saltar como segue:
u*(t) = 1 para t [o, t1 )
u*(t) = 0 para t [t1 , t 2 ) t1 t 2
u*(t) = 1 para t [t 2 , T ] t2 T
ento estaremos ricocheteando* (banging) sucessivamente entre um e outro limite do

conjunto de controle U; da, o nome bang-bang.
Finalmente, chamamos a ateno de que o problema bsico da teoria do controle
timo, diferente do clculo das variaes, tem um estado terminal livre (linha terminal
vertical) ao invs de um ponto terminal fixo. A primeira razo para isso que: No
desenvolvimento das condies fundamentais de primeira ordem conhecido como princpio
mximo, invocamos a noo de um u arbitrrio. Qualquer u arbitrrio deve, portanto,
implicar num y associado. Se o problema tem um estado terminal fixo, precisamos prestar
ateno se o y associado ir para o estado terminal designado. Assim, a escolha de u
pode no ser inteiramente e verdadeiramente arbitrria. Se o problema tem um estado
terminal livre (linha terminal vertical), por outro lado, ento podemos arbitrar um u sem
qualquer preocupao com o destino final de y. E isto simplifica o problema.
O problema bsico
Baseado na discusso precedente, podemos colocar o problema bsico do controle timo

como
(7.1)
T
Maximize V
0
F (t , y , u ) dt
sujeito a y f (t , y , u )
y (0) A y (T ) livre ( A, T dad
e u (t ) U para todo t [0, T ]
Aqui, como na discusso subseqente, nos ocuparemos exclusivamente com o problema de

maximizao. Nesse aspecto, as condies necessrias para otimizao podem ser
*
N.T. O termo em ingls foi mantido entre parnteses por no ter traduo direta para o portugus
5
estabelecidas com mais especificidade e menos confuso. Quando for encontrado um

problema de minimizao, podemos sempre reformul-lo como um problema de
maximizao simplesmente colocando o sinal de menos no funcional objetivo. Por
T T
exemplo, minimizar 0
F (t , y , u ) dt equivalente a maximizar
0
F (t , y , u ) dt .
Em (7.1), o funcional objetivo ainda toma a forma de uma integral definida, mas a
funo integrando F no inclui o argumento y como no clculo das variaes. Ao
contrrio, existe um novo argumento u. A presena da varivel de controle u necessita de
uma ligao entre u e y, para nos dizer como u afeta especificamente o curso tomado pela
varivel de estado y. Essa informao fornecida pela equao y f (t , y , u ) , onde o
smbolo com ponto y , denotando a derivada dy/dt, uma notao alternativa para o
smbolo y usado antes2. No tempo inicial, os dois primeiros argumentos na funo f
devem tomar valores dados t = 0 e y(0) = A, ento apenas o terceiro argumento est sob
nossa escolha. Para alguma poltica escolhida em t = 0, digamos, u1 (0) , essa equao
produzir um valor especfico para y , digamos, y 1 (0) , que impe uma direo
especfica para a qual a varivel y move-se. Uma poltica diferente u 2 (0) , geralmente nos
dar um valor diferente, y 2 (0) , via a funo f. E um argumento similar aplicar-se- a
outros pontos do tempo. O que essa equao faz, todavia, fornecer um mecanismo pelo
qual nossa escolha do controle u poder ser transformada num padro especfico de
movimento da varivel de estado y. Por essa razo, essa equao conhecida como a
equao de movimento para a varivel de estado (ou, para simplificar, a equao de
estado). Normalmente, a ligao entre u e y pode ser adequadamente descrita pela equao
diferencial de primeira ordem y f (t , y , u ) . Entretanto, se existir um padro de mudana
da varivel de estado y que no possa ser capturado pela primeira derivada y mas que
requer o uso da segunda derivada y d 2 y / dt 2 , ento a equao de estado tomar a forma
de uma equao diferencial de segunda ordem, que ns deveremos transformar num par de
equaes diferenciais de primeira ordem. A complicao que, no processo de
transformao, uma varivel de estado adicional dever ser introduzida no problema. Um
exemplo de tal situao pode ser encontrado na seo 8.4.
Ns usaremos consistentemente a letra f minscula como smbolo da funo na
equao de movimento, e reservaremos a letra maiscula F para a funo integrando no
funcional objetivo. Assume-se que as funes F e f so contnuas em todos os seus
argumentos, e possuem derivadas parciais de primeira ordem contnuas com respeito a t e y,
mas no necessariamente com respeito a u.
O resto do problema (7.1) consiste de especificaes com relao aos conjuntos de
fronteira e de controle. Da mesma forma que o caso da linha-terminal-vertical bsico e foi
implementado, outras especificaes de ponto-terminal tambm podem ser acomodadas.
Igualmente para o conjunto controle, o caso bsico de U ser um conjunto aberto
U ( ,) . Se entretanto, a escolha de U de fato no restritiva, em tal caso
poderemos, de um modo geral, omitir a imposio u (t ) U do problema.
Um caso especial
2
Ainda que y e y sejam smbolos alternativos, usaremos y exclusivamente no contexto da teoria do
controle timo, para fazer distino do contexto do clculo das variaes.
6
Como um caso especial, considere o problema onde a escolha de u no restringida, e onde

a equao de movimento toma uma forma particularmente simples
y u
Ento o problema de controle timo fica
(7.2)
T
Maximize V 0
F (t , y , u ) dt
sujeito a y u
y ( 0) A y (T ) livres ( A, T dados )
Substituindo a equao de movimento na funo integrando, entretanto, podemos eliminar

e reescrever o problema como
y
(7.2)
T
Maximize V F (t , y , y ) dt
0
sujeito a y ( 0) A y (T ) livres ( A, T dados)
Este precisamente o problema de clculo das variaes com linha terminal vertical. A
ligao fundamental entre o clculo das variaes e a teoria do controle timo , ento,
evidente. Mas, as equaes de movimento encontradas nos problemas de controle timo so
geralmente mais complicadas que em (7.2).
7.2 O PRINCPIO DO MXIMO
O resultado mais importante na teoria do controle timo uma condio necessria de

primeira ordem conhecida como o princpio do mximo. Esse termo foi cunhado pelo
matemtico russo L S Pontryagin e seus associados 3. Como mencionado na seo 1.4,
entretanto, a mesma tcnica foi independentemente descoberta por Maguns Hestenes, um
matemtico da Universidade da Califrnia, Los Angeles, que depois tambm expandiu os
resultados de Pontryagin. O enunciado do princpio do mximo envolve o conceito da
funo Hamiltoniana e da varivel co-estado. Devemos, entretanto, primeiro explicar esses
conceitos.
A varivel de co-estado e a funo Hamiltoniana
Trs tipos de variveis foram apresentadas no problema (7.1): t (tempo), y (estado) e u

(controle). No processo de soluo, outro tipo de varivel emerge. Ela chamada de
3
L. S. Pontryagin, V. G. Boltyanski, R. V. Gamkrelidze, e E. F. Miahchenko, O proceso Matemtico do
Controle timo (The Mathematical Theory of Optimal Processes), traduzido do russo por K.N. Trirogoff,
Interscience, New York, 1962. Esse livro ganhou em 1962 o Prmio Lnin de Cincia e Tecnologia.
7
varivel de co-estado (ou varivel auxiliar) e ser designada por . Como veremos, a
varivel de co-estado similar ao multiplicador de Lagrange e, como tal, tem carter de
uma varivel de valorao, medindo o preo sombra de uma varivel de estado associada.
Como y e u, a varivel pode tomar diferentes valores em diferentes pontos do tempo.
Assim, o smbolo na verdade uma notao simplificada para (t).
O veculo pelo qual a varivel de co-estado entra no problema do controle timo a
funo Hamiltoniana, ou simplesmente, o Hamiltoniano, que figura com muito destaque no
processo de soluo. Denotando por H, o Hamiltoniano definido como
(7.3) H (t , y , u , ) F (t , y , u ) (t ) f (t , y , u )
Desde que H consiste da funo integrando F mais o produto da varivel de co-estado pela
funo f, ele naturalmente uma funo com quatro argumentos: t, y, u bem como . Note
que, em (7.3), ns designamos um coeficiente unitrio para F, o que entra em contraste com
o coeficiente ainda indeterminado (t) de f. Rigorosamente falando, o Hamiltoniano deveria
ser escrito como
(7.4) H (t , y , u , ) 0 F (t , y , u ) (t ) f (t , y , u )
onde 0 uma constante no negativa, tambm ainda indeterminada. Para o problema (7.1)
da linha-terminal-vertical, a constante 0 torna-se sempre no nula (estritamente positiva);
assim, ela pode normalizada para o valor unitrio, reduzindo (7.4) a (7.3). O fato de ser
0 0 no problema bsico devido a duas condies do princpio do mximo. Primeiro,
os multiplicadores 0 e (t) no podem desaparecer simultaneamente em nenhum ponto
do tempo. Segundo, a soluo do problema da linha-terminal-vertical deve satisfazer a
condio de transversalidade (T) = 0, que ser explicada na discusso que se segue. A
condio (T) = 0 requer um valor no nulo para 0 em t = T. Mas, desde que 0 uma
constante no negativa conclumos que 0 uma constante positiva, que pode ser
normalizada para a unidade.
Para formulaes do problema do controle timo diferente de (7.1), por outro lado,
0 pode tornar-se zero, invalidando desta forma o Hamiltoniano em (7.3). O purista,
entretanto, insistir em checar que 0 de fato positivo em todo problema, antes de usar o
Hamiltoniano (7.3). O processo de checagem envolver uma demonstrao onde a hiptese
de que 0 0 conduzir a uma contradio e violar a condio mencionada antes, de que,
0 e (t) no podem desaparecer simultaneamente 4. Na realidade, porm, a eventualidade
de um 0 nulo acontece apenas em certas situaes no usuais (algumas digamos
patolgicas) onde a soluo do problema independente da funo integrando, F, ou
seja, onde a funo F no tem importncia no processo da soluo 5. exatamente esse o
motivo pelo qual se pode pr o coeficiente 0 igual a zero, para fazer a funo F sair do
Hamiltoniano. Como muitos dos problemas encontrados em economia so do tipo onde a
4
Para exemplos especficos do processo de checagem veja, Akira Takayama, Mathematical Economics 2ed.,
Cambridge Universty Press, Cambridge, 1985, pp. 617 618, 674 675, e 679 680.
5
Um exemplo de um problema como esse pode ser encontrado em Morton I. Kamien e Nancy L. Schwartz,
Dynamic Optimazation: The Calculus of Variations and Control Optimal in Economics and Management,
2ed., Elsevier, New York, 1991, p. 149.
8
funo F tem importncia, a prtica prevalecente entre os economistas simplesmente

assumir 0 0 , normalizando-o ento para a unidade e usando o Hamiltoniano (7.3),
sempre que o problema no for daquele com uma linha terminal vertical. Essa a prtica
que seguiremos.
O princpio do mximo
Em contraste com a equao de Euler que uma simples equao diferencial de segunda
ordem na varivel de estado y, o princpio do mximo envolve duas equaes diferenciais
de primeira ordem na varivel de estado y e na varivel de co-estado . Junto com essas
equaes, exigido tambm que o Hamiltoniano seja maximizado com respeito as
variveis de controle u em todo ponto do tempo. Para uma eficincia pedaggica, primeiro
explicamos e discutimos as condies envolvidas, antes de fornecer a racionalidade do
princpio do mximo.
Para o problema em (7.1), e com o Hamiltoniano definido em (7.3), as condies
para o princpio do mximo so
Max H (t , y, u , ) para todo t [0, T ]

u
H
y [equao de movimento para y ]

(7.5)
H
[equao de movimento para ]
y
(T ) 0 [condio de transversalidade]
O smbolo Max u
H significa que o Hamiltoniano deve ser maximizado
exclusivamente com respeito a u como varivel de escolha. Um modo equivalente de
expressar essa condio
(7.6) H (t , y , u * , ) H (t , y , u , ) para todo t [0, T ]
onde u* o controle timo, e u qualquer outro valor de controle. Na discusso a seguir,

para simplificar, vamos usar algumas vezes uma notao mais curta Max H para indicar
essa exigncia sem mencionar explicitamente u. O leitor notar que esse requerimento de
maximizar H com respeito a u que faz surgir o nome o princpio do mximo.
Pode parecer a princpio que o requerimento em (7.6) possa ser resumidamente
colocado na condio de primeira ordem H / u 0 (particularmente suportado por uma
condio de segunda ordem apropriada). A verdade, entretanto, que a exigncia de
Max H uma exigncia muito mais extensa desse requerimento. Na fig. 7.2,
u
desenhamos trs curvas, cada uma indicando um possvel grfico do Hamiltoniano H contra
a varivel de controle u em um ponto especfico do tempo, para valores especficos de y e .
Assume-se que a regio de controle o intervalo fechado [a,c]. Para a curva 1, que
diferencivel com respeito a u, o mximo de H ocorre em u = b, um ponto interior da
regio de controle U; nesse caso, a equao H / u 0 pode de fato servir para identificar
o controle timo em cada ponto do tempo. Mas, se a curva 2 a curva relevante, ento o
9
controle que maximiza H em U, u = c, um ponto limite de U. Assim a condio

H / u 0 no se aplica ainda que a curva seja diferencivel. E no caso da curva 3, com o
Hamiltoniano linear em u, o mximo de H ocorre em u = a, outro ponto limite e a
condio H / u 0 novamente inaplicvel porque a derivada no igual a zero em
nenhum lugar. Em resumo, enquanto a condio H / u 0 pode servir ao propsito
quando o Hamiltoniano diferencivel com respeito a u e produz uma soluo interior, o
fato de que a regio de controle possa ser um conjunto fechado, com possibilidade de
solues de canto, necessita da exigncia mais ampla de Max u
H . De fato, sob o princpio
do mximo no se requer sempre que o Hamiltoniano seja diferencivel com respeito a u.
O caso onde o Hamiltoniano linear em u de especial interesse. Ele tanto uma
situao especialmente simples de manipular quando se traa o grfico de H contra u como
tambm uma linha reta positiva ou negativamente inclinada, pois o controle timo
sempre encontrado num dos limites de u. A tarefa apenas determinar qual dos limites. (Se
o grfico de H contra u uma linha horizontal, ento no existe controle timo nico). Mais
importante ainda, esse caso serve para realar como uma situao incmoda no clculo das
variaes torna-se facilmente manipulvel na teoria do controle timo. No clculo das
variaes, sempre que a funo integrando linear em y , resultando Fyy 0 , a equao
de Euler no produz uma soluo que satisfaa as condies de limite dado. Na teoria do
controle timo, ao contrrio, esse caso no apresenta qualquer problema.
Partindo-se para as outras partes de (7.5), notamos que a condio y H / no
H Curva 1
Curva 2
Figura 1 7.2
Curva 3
u
a c
0 b
U
nada mais que uma reafirmao da equao de movimento da varivel de estado
originalmente especificada em (7.1). O nico motivo de re-expressar y como a derivada
parcial de H com respeito a varivel de co-estado mostrar a simetria entre essa equao
de movimento e a varivel de co-estado. Note, entretanto, que na ltima equao de
movimento, o negativo da derivada parcial de H com respeito a varivel de estado y.
Juntas, as duas equaes de movimento so referidas coletivamente como o sistema
Hamiltoniano, ou sistema cannico (significando o sistema de equaes diferenciais
padro) para o dado problema. Contudo ns temos mais que uma equao diferencial para
tratar na teoria do controle timo uma para cada varivel de estado e uma para cada
10
varivel de co-estado cada equao diferencial apenas de primeira ordem. Desde que a
varivel de controle nunca aparece na forma derivada, no existe equao diferencial para u
no sistema Hamiltoniano. Mas, da soluo bsica de (7.5) pode-se, se desejado, obter uma
equao diferencial para a varivel de controle. E, em alguns modelos, pode ser mais
conveniente tratar com um sistema dinmico nas variveis (y, u) no lugar do sistema
cannico nas variveis (y, ).
A ltima condio em (7.5) a condio de transversalidade para o problema de
estado-terminal-livre aquele com uma linha terminal vertical. Como ns esperaramos, tal
condio diz respeito apenas ao que deveria ocorrer no tempo terminal T.
EXEMPLO 1: Ache a curva de menor distncia de um ponto P dado para uma linha reta L
dada. Ns j tnhamos encontrado esse problema no clculo das variaes. Para reformul-
lo como um problema de controle timo, seja o ponto P(0,A), e assuma, sem perda de
generalidade, que a linha L uma linha vertical. (Se a posio da linha no for vertical,
pode-se sempre fazer que seja atravs de uma rotao apropriada nos eixos). A funo F
previamente usada 1 y 2 pode ser reescrita como 1 u 2 , onde y u ou y u .
1/ 2 1/ 2
Para converter o problema de minimizao-de-distncia para maximizao, devemos

tambm, colocar o sinal de menos no integrando. Ento, nosso problema
Maximize V
T
0

1 u2 1/ 2
dt
(7.7) sujeito a y u
y (0) A y (T ) livre ( A, T dados)
Note que a varivel de controle no restringida, portanto o controle timo ser uma
soluo interior.
Etapa i Comeamos escrevendo a funo Hamiltoniana
(7.8)
H 1 u2 1/ 2
u
observando que H diferencivel e no linear, podemos aplicar a condio de primeira

ordem H / u 0 para obter
H
1 u 2 (2u ) 0
1 1 / 2
u 2
Isso produz a soluo6

6
A equao H / u 0 pode ser escrita como

u 1 u2 1 / 2

Elevando ao quadrado em ambos os lados, multiplicando por 1 u 2 e arrumando os termos, obteremos
2

u 1 2
2
11
(7.9)
u (t ) 1 2 1 / 2
Alm disso a diferenciao de H / u usando a regra do produto produz
2H
u
2
1 u2 3 / 2
0
Assim, o resultado em (7.9) maximiza H. Mesmo que (7.9) expresse u em termos de , ns

vemos agora encontrar uma soluo para .
Etapa ii Para fazer isso, ns recorremos a equao de movimento da varivel de co-estado

H
em (7.5). Mas, como (7.8) mostra que H independente de y, temos
y
H
(7.10) 0 (t ) constante
y
Convenientemente, a condio de transversalidade (T ) 0 em (7.5) suficiente para

definir a constante. Pois, se uma constante, ento seu valor em t = T tambm seu valor
para todo t. Assim,
(7.10) * (t ) 0 para todo t [0, T ]
Observando (7.9), ns tambm poderemos concluir que
(7.11) u * (t ) 0 para todo t [0, T ]
Etapa iii Da equao de movimento y u , estamos agora capacitados a escrever
(7.12) y 0 y (t ) constante
Mais ainda, a condio inicial y(0) = A habilita-nos a definir essa constante e escrever
(7.12) y * (t ) A
Esse resultado implica que 2 1 , de outra forma a equao produziria 0 = 1, o que impossvel. Dividindo

ambos os lados pela quantidade no nula 1 2 e tomando a raiz quadrada ns finalmente chegaremos a
(7.9)
12
y * (t ) A
A B
Figura 7.3
t
0
T
Esse caminho y*, ilustrado na Fig. 7.3, uma linha reta horizontal. Alternativamente, ele
pode ser visto como um caminho ortogonal para a linha terminal vertical.
EXEMPLO 2 Encontre o controle timo que
V 2 y 3u dt
T
Maximize
0
(7.13) sujeito a y y u
y (0) 4 y (2) livre
e u (t ) U [0,2]
Como esse problema caracterizado pela linearidade em u e um por um conjunto de

controle fechado, podemos esperar que ocorram solues de canto.
Etapa i O Hamiltoniano de (7.13), nominalmente,
H 2 y 3u ( y u ) (2 ) y ( 3)u
linear em u, com inclinao H / u 3 . Se em um dado ponto do tempo,

encontramos > 3, ento uma curva de inclinao ascendente como a curva 1 na Fig. 7.4
ir prevalecer; para maximizar H, devemos escolher u* = 2. Se por outro lado < 3, ento
a curva 2 ir prevalecer, e deveremos escolher u* = 0. Em resumo,
2
u * (t ) se (t ) 3
0
As solues u* = 2 e u* = 0 so, certamente, solues de canto. Note que, pelo fato de H
ser linear em u, a condio de primeira ordem usual H / u 0 inaplicvel na nossa
busca por u*.
13
Etapa ii Nossa prxima tarefa determinar (t), dado que ele necessrio em (7.14). Da
equao de movimento de , ns teremos a equao diferencial
H
2 ou 2
y
H Max H
Curva 1
Max H >3
Curva 2
<3 Figura 7.4
u
0
2
Sua soluo geral 7
(t ) ke t 2 (k arbitrria)
Desde que a constante arbitrria k pode ser definida como k 2e 2 pela utilizao da
condio de transversalidade (t) = (2) = 0, poderemos escrever a soluo definitiva como
(7.15) * (t ) 2e 2 e t 2 2e 2 t 2
Note que * (t ) uma funo decrescente, caindo do valor do estado inicial

* (0) 2e 2 2 12,778 para o valor final * (2) 2 2 0 . Assim, * primeiramente
excede 3 e eventualmente cai abaixo de 3. O ponto crtico no tempo, quando * = 3 e
quando o controle timo muda abruptamente de u* = 2 para u* = 0, pode ser encontrado
colocando * (t) = 3 em (7.15) e resolvendo para t. Denotando esse t particular pela letra
grega , teremos
(7.16) 2 ln 2,5 1,084
Conseqentemente, o controle timo em (7.14) pode ser reescrito mais especificamente em

duas fases:
(7.17) Fase I: u *I u * [0, ) 2
7
Equaes lineares de primeira ordem desse tipo so explicadas na Sec. 14.1, de Alpha C. Chiang,
Fundamental Methods of Matematical Economics, 3 ed. McGraw-Hill, New York, 1984.
14
Fase II: u * II u * [ ,2] 0
u*
(a)
Fase I Fase II
2
t
0 2
1 = 1,083
39,339
(b)
15,739 y*II Figura 7.5

4,000
y*I
2 t
1 = 1,083
Como descrito graficamente na Fig. 7.5a, esse controle timo exemplifica uma variante
simples de bang-bang.
Etapa iii Ainda que o problema pergunte somente o caminho do controle timo, ns
podemos encontrar tambm o caminho de estado timo, em duas fases. Na fase I, a equao
de movimento para y y y u y 2 , ou
y y 2 com valor inicial y(0) = 4
Sua soluo
(7.18)
y * I y * [0, ) 2 3e t 1
Na fase II, a equao de movimento para y y y 0 , ou
y y 0
com soluo geral
(7.19) y *II y * [ ,2] cet (c arbitrria)
Note que a constante c no pode ser definida pelas condies iniciais y(0) = 4 dada em
(7.13) porque j estamos na fase II, depois de t = 0. Nem pode ser definida por qualquer
15
condio terminal porque o estado terminal livre. Entretanto, o leitor lembrar do

requerimento de que o caminho timo y deva ser contnuo, como ilustra a Fig. 7.1b.
Conseqentemente, o valor inicial de y*II deve ser igual ao valor de y*I em . Porquanto,

y * I 2 3e 1 [por (7.18)]
e
y *II 2e [por (7.19)]
encontramos, igualando essas duas expresses e resolvendo para c, que c 2(3 e ) ,
portanto o caminho timo y na fase II
(7.19)
y*II 2 3 e 5,324e t
O valor de y* no tempo de troca aproximadamente 2(3e1, 096 1) 15,739 .

Combinando os dois caminhos (7.18) e (7.19), obteremos o caminho completo y*
para o intervalo de tempo [0,2], como exposto na Fig. 7.5b. Nesse particular exemplo, a
juno dos caminhos parece uma curva exponencial simples, mas os dois segmentos so de
fato partes de duas curvas exponenciais separadas.
Exerccios 7.2
1 No exemplo 2, (t) uma funo decrescente, e atinge o valor 3 apenas em um

ponto do tempo, . O que acontece se (t) = 3 para todo t?
2 Encontre os caminhos timos das variveis de controle, estado e co-estado para
4
Maximize 3 ydt
0
sujeito a y y u
y (0) 5 y (4) livre
e u (t ) U [0,2]
Cheque que de fato o Hamiltoniano maximizado ao invs de minimizado.
y u dt
2
2
Maximize
0
sujeito a y u
y (0) 0 y (2) livre u (t ) no restrito
Verifique que o Hamiltoniano maximizado ao invs de minimizado.

16
Maximize
1

0
1

2

y 2 u 2 dt
sujeito a y u y
y (0) 1 y (1) livre u (t ) no restrito
Verifique que o Hamiltoniano maximizado ao invs de minimizado.
[Sugesto: Duas equaes de movimento devem ser resolvidas simultaneamente. Revise o

material sobre equaes diferenciais simultneas em Alpha C. Chiang, Fundamental
Methods of Mathematical Economics, 3ed., McGraw-Hill, New York, 1984, Sc. 18.2]
7.3 A RACIONALIDADE DO PRINCPIO DO MXIMO
Vamos agora explicar a racionalidade subjacente ao princpio do mximo. O que ns

planejamos fazer no dar uma prova detalhada mas, apresentar uma variao do problema
para tornar o princpio do mximo plausvel a prova completa dada por Pontryagin e seus
associados (Cap. 2 do seu livro) tem algo em torno de 40 pginas. Isso ser reforado mais
tarde fazendo-se uma comparao das condies do princpio do mximo com a equao de
Euler e as outras condies do clculo das variaes.
Uma viso variacional do problema do controle
Para tornar as coisas simples, assume-se aqui que a varivel de controle u irrestrita, de
forma que u* uma soluo interior. Alm disso, assumido que a funo Hamiltoniana
diferencivel com respeito a u e que a condio H / y 0 pode ser invocada no lugar da
condio Max H. Como usual, tomamos o ponto inicial como um ponto fixo, mas
permitido ao ponto terminal variar. Isso ir nos habilitar a derivar certas condies de
transversalidade no processo da discusso. O problema ento fica
T
Maximize V 0
F (t , y , u ) dt
sujeito a y f (t , y , u )
y (0) y 0 dado
Etapa i Como primeiro passo no desenvolvimento do princpio do mximo,

incorporaremos a equao de movimento dentro do funcional objetivo e ento re-
expressaremos o funcional em termos do Hamiltoniano.
O leitor observar que, se a varivel y sempre obedece a equao de movimento,
ento a quantidade [ f (t , y, u ) y ] ir seguramente tomar um valor zero para todo t no
intervalo [0,T]. Assim, usando a noo dos multiplicadores de Lagrange, podemos formar
uma expresso (t )[ f (t , y , u ) y ] para cada valor de t, e ainda ter um valor zero. Apesar
de existir um nmero infinito de valores de t no intervalo [0,T], somando
(t )[ f (t , y , u ) y ] sobre o tempo no perodo [0,T] ainda iremos produzir um valor geral
zero:
T
(7.21) 0
(t )[ f (t , y , u ) y ]dt 0
17
Por essa razo, podemos aumentar o antigo funcional objetivo com a integral em (7.21) sem
afetar a soluo. Isso , podemos trabalhar com um novo funcional objetivo
T
V (t )[ f (t , y, u ) y ]dt
0
(7.22) T
{F (t , y, u ) (t )[ f (t , y, u ) y ]}dt
0
confiando que ter os mesmos valores que V, pois a equao de movimento em (7.20)
obedecida em todos os pontos do tempo.
Previamente, tnhamos definido a funo Hamitoniana como
H (t , y , u , ) F (t , y , u ) (t ) f (t , y , u )
A substituio da funo H dentro de (7.22) pode simplificar o novo funcional para a forma
T

0
[ H (t , y , u ) (t ) y ]dt
(7.22) T T

0
H (t , y , u , ) dt (t ) y
0
dt
importante distinguir claramente entre o segundo termo no Hamiltoniano,

(t ) f (t , y , u ) , por um lado, e a expresso do multiplicador de Lagrange,
(t )[ f (t , y , u ) y ] por outro. O ltimo contm explicitamente y
, enquanto o anterior
8
no. Quanto a ltima integral em (7.22), integrada por partes , encontramos que
T T
(t ) y dt (T ) yT (0) y 0 y (t ) dt
0 0
Consequentemente, pela substituio desse resultado, o novo funcional objetivo pode ser
re-escrito como
T
[ H (t , y, u, ) y (t ) ]dt (T ) yT (0) y0
(7.22) 0

1 2 3
8
A frmula da integrao por partes uma integral definida foi dada em (2.15). Aqui, trocamos o smbolo u em
(2.15) por w, porque u agora usado para denotar a varivel de controle. Seja
v (t ) (implicando que dv dt )
w y (t ) (implicando que dw y dt )
Ento, desde que (t ) y dt vdw , ns temos
T T
(t ) y dt [ (t ) y (t )]T0 y (t ) dt
0 0
que coincide com o resultado no texto.
18
A expresso composta da soma de trs termos, 1, 2 e 3. Note que enquanto o

termo 1, uma integral, cobre todo perodo de planejamento [0,T], o termo 2 diz respeito
exclusivamente ao tempo terminal T, e 3 diz respeito apenas ao tempo inicial.
Etapa ii O valor de depende da escolha dos caminhos no tempo para as trs variveis, y,
u e , bem como dos valores escolhidos de T e yT. Na presente etapa, iremos focar .
A varivel , sendo um multiplicador de Lagrange, difere fundamentalmente de u e y,

pois a escolha do caminho de (t) no ir produzir efeito sobre o valor de , pois a equao
de movimento y f (t , y , u ) estritamente satisfeita no perodo, isto , durante o perodo
H
(7.23) y para todo t [0, T ]
y
Portanto, para ajudar-nos nas inquietaes do efeito de (t) sobre , simplesmente impomos
(7.23) como uma condio necessria para a maximizao de . Isso responsvel por uma
das trs condies do princpio do mximo. Essa, claro, uma etapa pouco estremecedora,
pois a equao de movimento na realidade dada como uma parte do prprio problema.
Etapa iii Agora podemos voltar para o caminho de u(t) e seus efeitos sobre o caminho y(t).
Se conhecemos um caminho u*(t) e o perturbamos com uma curva de perturbao p(t),
podemos produzir caminhos de controle vizinhos
(7.24) u (t ) u * (t ) p (t )
para cada valor de . Mas, de acordo com a equao de movimento y f (t , y , u ) ,

existir para cada uma perturbao correspondente no caminho y*(t). Os caminhos na
vizinhana de y podem ser escritos como
(7.25) y (t ) y * (t ) q (t )
Alm disso, se T e yT so variveis, tambm teremos
dT dy
(7.26) T T * T e yT y *T yT (implicando T e T yT )
d d
Observando as expresses de u e y em (7.24) e (7.25), podemos expressar em termos de
, portanto poderemos aplicar a condio de primeira ordem / 0 . A nova verso
de
T ()
(7.27) 0 {H [t , y * q (t ), u * p (t ), ] [ y * q (t )]}dt (T ) yT (0) y 0
Etapa iv Agora aplicamos a condio / 0 . No processo da diferenciao, o termo

integral gera, pela frmula (2.11), a derivada
19
T () H H dT
(7.28)
0

y
q (t )
u
p (t ) q (t )dt [ H y ]t T
d
E a derivada do segundo termo em (7.27) com respeito a , pela regra do produto,
dyT d (T ) dT
(7.29) (T ) yT (T )yT yT (T )T
d dT d
[por (7.26)]
Por outro lado, o termo ( 0 ) y 0 na equao (7.27) desaparece na diferenciao. Assim,
/ a soma de (7.28) e (7.29). Adicionando essas duas expresses, entretanto,

notamos que um componente de (7.28) pode ser re-escrito como segue:
y t T
dT
d
(T ) yT T [por (7.26)]
Assim, quando a soma de (7.28) e (7.29) igualada a zero, a condio de primeira ordem
emerge (aps re-ordenamento) como
d T H H
(7.30) q (t ) p(t )dt [ H ]t T T (T )yT 0
d 0 y u
Os trs componentes dessa derivada relacionam-se com termos arbitrrios diferentes:

O componente da integral contm as curvas de perturbaes arbitrrias p(t) e q(t), enquanto
os outros dois envolvem os termos arbitrrios T e yT , respectivamente.
Conseqentemente, cada uma das trs devem ser individualmente igualadas a zero para
satisfazer (7.30). Colocando o componente integral igual a zero, podemos deduzir duas
condies:
H H
e 0
y u
A primeira nos d a equao de movimento para a varivel de co-estado (ou

simplesmente, a equao de co-estado). E a segunda representa uma verso frgil da
condio Max u
H frgil no sentido de que previamente assumido que H seja
diferencivel com respeito a u e que exista uma soluo interior. Desde que o problema
bsico tem um T fixo e um yT livre, o termo T em (7.30) automaticamente igual a
zero, mas o termo yT no. A fim de que faamos a expresso (T ) yT desaparecer,
devemos impor a restrio
20
(T ) 0
Isso explica a condio de transversalidade em (7.5)
Note que apesar do caminho de (t) ter sido anteriormente, na etapa ii, descartado por
no ter efeito no valor do funcional objetivo, ele agora, impressionantemente, volta
condio anterior. Ns vemos que, para o princpio do mximo trabalhar, o caminho (t)
no deve ser arbitrariamente escolhido, mas imposto que ele siga uma equao de
movimento prescrita e que finalize com um valor terminal de zero se o problema tem um
estado terminal livre.
7.4 CONDIES TERMINAIS ALTERNATIVAS
O que acontecer ao princpio do mximo quando a condio terminal especificar alguma

outra coisa ao invs de linha terminal vertical? A resposta geral que as trs primeiras
condies em (7.5) ainda sero asseguradas, mas a condio de transversalidade assumir
uma forma alternativa.
Ponto Terminal Fixo
A razo pela qual o problema com um ponto terminal fixo (com ambos, o estado terminal e
o tempo terminal fixos) no se qualifica como um problema bsico na teoria do controle
timo que a especificao de um ponto terminal fixo acarreta uma complicao na noo
de uma curva de perturbao arbitrria p(t) para a varivel de controle u. Se a perturbao
do caminho u*(t) suposta para gerar atravs da equao de movimento y f (t , y , u ) uma
perturbao correspondente no caminho y*(t) que tem que acabar em um estado terminal
pr-estabelecido, ento a escolha da curva de perturbao p(t) no verdadeiramente
arbitrria. A questo ento procede como se ainda pudssemos deduzir legitimamente a
condio H / u 0 de (7.30).
Afortunadamente, a validade do princpio do mximo no afetada por esse
compromisso na arbitragem de p(t). Por simplicidade, todavia, no entraremos em detalhes
para demonstrar esse ponto. Para nossos propsitos, suficiente afirmar que, com um ponto
terminal fixo, a transversalidade substituda pela condio
y (T ) yT ( T , yT dados)
Linha Terminal Horizontal (O Problema do Pontofinal-Fixo)
Se o problema tem uma linha terminal horizontal (com um tempo terminal livre mas um
ponto final fixo, significando um estado terminal fixo), ento yT fixo yT 0 , mas
T no ( T arbitrrio). Do segundo e terceiro termos componentes em (7.30), fcil
ver que a condio de transversalidade para esse caso
(7.31) H t T 0
21
A funo Hamiltoniana deve atingir um valor zero no tempo terminal timo. Mas, no
existe restrio sobre o valor de no tempo T.
Curva terminal
Caso uma curva terminal yT (T ) governe a seleo do ponto terminal, ento T e

yT no sero ambos arbitrrios, mas ligados um ao outro pela relao yT (T ) t .
Usando isso para eliminar yT , podemos combinar os dois ltimos termos em (7.30)
numa simples expresso envolvendo apenas T :
H t T T (t ) (T )T H t T T
Segue-se que, para um T arbitrrio, a condio de transversalidade deva ser
(7.32) H t T 0
Linha Terminal Vertical Truncada
Agora considere o problema em que o tempo terminal fixo, mas o estado terminal livre
para variar, apenas sujeito a yT y min onde y min denota um dado nvel mnimo
permissvel para y.
Apenas dois tipos de resultados so possveis na soluo tima: y *T y min ou
y *T y min . No primeiro resultado, a restrio terminal automaticamente satisfeita.
Assim, a condio de transversalidade para o problema com um linha terminal vertical
regular usaria
(7.33) (T) = 0 para y *T y min
No outro resultado, y *T y min , desde que a restrio terminal atingida, os

caminhos admissveis da vizinhana de y consistiram apenas daqueles que tem estado
terminal yT y min . Se avaliamos (7.25) para t = T e permitimos y *T y min , obtemos
yT = ymin + q(T)
Assumindo que q(T) > 0 sobre a curva de perturbao q(t)9, a exigncia yT y min impe
0. Mas, pelas condies de Kuhn-Tucker, a no negatividade de alteraria a condio
de primeira ordem d / d 0 para d / d 0 no nosso problema de maximizao10. Segue-
se que (7.30) iria gerar agora uma condio de transversalidade de desigualdade
(T ) yT 0
9
Essa hiptese no influencia o resultado final do processo aqui deduzido.
10
As condies de Kuhn-Tucker so explicadas em Alpha C. Chiang, Fundamental Methods of Matematical
Economics, 3ed, McGraw-Hill, New York, 1984, Sc. 21.2
22
Ao mesmo tempo, ns podemos ver de (7.26) que, dado 0, a exigncia de yT y min

que a mesma que yT y *T no presente contexto implica yT 0 . Assim, a
precedente condio de transversalidade de desigualdade reduz-se a
(7.34) (T ) 0 para y *T y min
Combinando (7.33) e (7.34) e omitindo o smbolo *, podemos finalmente escrever

um simples enunciado conciso da condio de transversalidade como segue:
(7.35) (T ) 0 yT y min yT y min (T ) 0
Note que a ltima parte desse enunciado representa a familiar condio de folga-complentar
das condies de Kuhn-Tucker. Como no problema similar com uma linha terminal vertical
truncada no clculo das variaes, a aplicao prtica de (7.35) no complicada como a
condio possa parecer. Podemos sempre tentar primeiro a condio (T ) 0 e checar se
o resultante valor de y*T satisfaz a restrio terminal yT y min . Se sim, o problema est
resolvido. Se no, colocamos ento y *T y min para satisfazer a condio de folga-
complementar e tratamos o problema como se fosse um problema com um ponto terminal
dado.
Linha Horizontal Terminal Truncada
Seja o estado terminal fixo, mas permita o tempo terminal T variar sujeito a restrio T*
Tmax, onde Tmax o valor mximo permitido de T um deadline* pr-estabelecido. Ento,
ns temos T* < Tmax ou T* = Tmax, na soluo do tima.
No primeiro resultado, a restrio terminal no atingida, e a condio de
transversalidade para o problema com uma linha terminal horizontal regular ainda vlido:
(7.36) H t T 0 para T* < Tmax
Mas se T* = Tmax, ento por implicao todos os caminhos admissveis vizinhos do

caminho y devem ter tempo terminal T* Tmax. Por razes anlogas s que conduziram ao
resultado (7.34) para a linha terminal vertical truncada, possvel estabelecer a condio de
transversalidade:
(7.37) H t T 0 para T* = Tmax
Combinando (7.36) e (7.374) e omitindo o smbolo *, obtemos o seguinte enunciado

cresumido da condio de transversalidade:
(7.38) H t T 0 T Tmas T Tmax H t T 0
*
NT. O termo deadline usual em controle timo no Brasil, seu significado pode ser grosseiramente
traduzido como o instante onde tudo acaba.
23
EXEMPLO 1
1
Maximize V 0
u 2 dt
sujeito a y yu
y (0) 1 y (1) 0
Com pontos finais fixos, no necessitamos de condio de transversalidade nesse problema.
Etapa i Desde que a funo Hamiltoniana no linear:
H u 2 ( y u )
e desde que u no restrito, podemos aplicar a condio de primeira ordem
H
2u 0
u
Isso gera a soluo u / 2 ou, mais precisamente,
1
(7.39) u (t ) (t )
2
Desde que 2 H / u 2 2 negativa, essa soluo u(t) maximiza ou invs de minimizar

H. Mas desde que a soluo expressa em termos de (t), devemos encontrar o caminho
final de u(t) que ser determinado adiante.
Etapa ii Da equao de movimento de co-estado
H

y
conseguimos a soluo geral
(7.40) (t ) ke t (k arbitrria)
Para definir a constante arbitrria, tentamos resolver as condies de vizinhana, mas,

infelizmente, para o problema de ponto terminal fixado, essas condies so ligadas a
varivel y ao invs de . Assim, agora necessrio procurar primeiro dentro do caminho
soluo de y.
Etapa iii A equao de movimento de y y y u . Usando (7.39) e (7.40),

1 t
entretanto, podemos re-escrever essa equao como y y ke ou,
2
24
1 t
y y ke
2
Essa uma equao diferencial linear de primeira ordem com um coeficiente varivel e um
1 t
termo varivel, do tipo dy / dt u (t ) y w(t ) - aqui com u(t) = - 1 e w(t ) ke . Via
2
uma frmula padro, sua soluo pode ser encontrada como segue11:
1dt 1
y (t ) e c ke t e dt
1dt
2
1
e t c ke t e t dt
2
(7.41)
1
e t c ke 2t
4
1
ce t ke t (c arbitrria)
4
Etapa iv Agora as condies limites y(0)=1 e y(1)=0 so diretamente aplicveis, e

elas nos do a seguinte valores definitivos para c e k:
1 4e 2
c e k
1 e2 1 e2
Conseqentemente, substituindo esses valores em (7.41), (7.40) e (7.37), temos a seguinte

soluo definitiva para os trs caminhos timos:
1 e2
y * (t ) e
t
e t
1 e 2
1 e 2
2
4e 2e 2 t
* (t ) e t
e u * (t ) e
1 e2 1 e2
A procura pelas trajetrias de u*(t), y*(t) e *(t) no presente problema torna-se um

processo entrelaado. Isso porque, diferente do problema bsico do controle timo, onde a
condio de transversalidade (T) = 0 pode habilitar-nos a obter uma soluo definida do
caminho de co-estado *(T) no estgio inicial do jogo, o problema do ponto terminal fixo
no permite a aplicao das condies de fronteira sobre y(0) e y(T) at o estgio final do
processo de soluo.
11
Veja Alpha C. Chiang, Fudamental Methods of Mathematical Economics, 3 ed., Mc-Graw-Hill, New York,
1984, Sec. 14.3. Na execuo da integrao envolvida na aplicao da frmula, omitimos a constante de
integrao sempre que elas podem ser includas sob outras constantes. Alternativamente, ns podemos
encontrar a funo complementar e a integral particular separvel e ento combin-las. Com um termo
varivel na equao diferencial, podemos obter a integral particular pelo mtodo dos coeficientes a
determinar. (ibid., Sec. 15.6)
25
EXEMPLO 2 Vamos considerar o exemplo precedente, com condio terminal y(1) = 0,

substituda pela restrio
T=1 y(1) 3
O problema ento aquele com uma linha terminal vertical truncada e a condio de
transversalidade apropriada (7.35). Primeiro tentamos resolver esse problema como se sua
linha terminal vertical no fosse truncada. Se y*(1) torna-se 3, ento o problema est
resolvido; noutros casos, ns refazemos ento o problema colocando y(1) = 3.
Etapa i O Hamiltoniano permanece o mesmo como no Exemplo 1 e a soluo para varivel

de controle ainda
1
(7.42) u (t ) (t ) [de (7.39)]
2
Etapa ii Embora que a soluo geral para seja ainda
(t ) ke t [de (7.40)]
podemos agora usar a condio de transversalidade (T) = 0 ou (1) = 0 para definir a

constante arbitrria. O resultado k = 0, portanto,
*(t) = 0
Segue-se ento de (7.42) que
(7.44) u*(t) = 0
Etapa iii Da equao de movimento para y, encontramos
y y u y [por (7.44)]
A soluo geral para essa equao diferencial
y (t ) cet
onde a constante c pode ser definida como c = 1 pela condio inicial y(0) = 1. Assim, o
caminho timo de estado
(7.45) y * (t ) e t
Etapa iv Resta checar (7.45) contra a restrio terminal. No ponto terminal fixo T = 1,
(7.45) nos d y * (t ) e . Isso, infelizmente, viola a restrio terminal y(1) 3. Assim, para
satisfazer a condio de transversalidade (7.35), temos que colocar y(1) = 3 e resolver o
26
problema como um problema com um ponto terminal fixo. Note que tendo a restrio
terminal permanecido T = 1, y(1) 2, ento (7.45) teria sido uma soluo aceitvel.
EXEMPLO 3
T
Maximize V 0
1dt
sujeito a
y y u
y ( 0) 5 y (T ) 11 T livre
e u (t ) [ 1,1]
Esse exemplo ilustra o problema com uma linha terminal horizontal. Mais ainda, ele ilustra
o tipo de problema conhecido como problema do tempo timo, cujo objetivo atingir
algum alvo preestabelecido num montante de tempo mnimo. A natureza de tempo-timo
do problema transmitida pelo funcional objetivo:
1dt t 0 T
T

T
0
Claramente, maximizar essa integral minimizar T.
Etapa i Para comear, forme o Hamiltoniano
(7.46) H 1 ( y u )
Pelo fato da funo H ser linear em u, a condio H / u 0 inaplicvel. E, com a

varivel de controle confinada ao intervalo fechado [-1,1], espera-se que o valor timo de u
em qualquer ponto do tempo seja um valor limite, ou -1 ou 1. Especificamente, se > 0 (H
uma funo crescente de u), ento u* = 1 (limite superior); mas, se < 0, ento u* = - 1.
Como terceira possibilidade, se = 0 para algum valor de t, ento o Hamiltoniano ser
traado num grfico contra u como uma linha horizontal, e u* ser indeterminado neste
ponto do tempo. Essa relao entre u* e pode ser sucintamente capturada pela chamada
funo sinal, denotada pelo smbolo sgn e definida como segue:
1

(7.47) y sgn x y indeterminado se x 0
1

Note que se y uma funo sinal de x, ento y (se determinado) pode tomar apenas um dos
dois valores, e o valor de y depende do sinal (no da magnitude) de x.
Aplicado ao presente problema, essa funo resulta em
27
1
(7.48) u* = sgn ou u*
se 0
1
Mais uma vez, encontramos que necessrio um conhecimento de antes de u poder ser
determinado.
Etapa ii A equao de movimento da varivel de co-estado , de (7.46)
H

y
que integrada d
(7.49) (t ) ke t (k arbitrria)
Nesse resultado, (t), sendo exponencial, pode tomar apenas um nico sinal algbrico o
sinal da constante k. Conseqentemente, excetuando a eventualidade de k = 0 isto (t) =
0 para todo t (o que eventualmente, de fato, no ocorre aqui), u* deve ser determinado e
aderir a um nico sinal qualquer, um nico valor constante em concordncia com a
funo sinal. Por essa razo, ainda que a linearidade do Hamiltoniano na varivel de
controle u resulte numa soluo de fronteira no presente exemplo, ela no produz o
fenmeno bang-bang.
Ocorre que o indicativo para o sinal de k reside na condio de transversalidade
H t T 0 . Usando o H em (7.46), o em (7.49) e a condio terminal y(T) = 11, ns
podemos escrever a condio de transversalidade como
1 ke T (11 u*) 0
Desde que u* ou 1 ou -1, a quantidade (11 + u*) deve ser positiva, como e T .
Entretanto, k deve ser positivo para satisfazer essa condio. Ento segue-se que (t) > 0
para todo t, e que
(7.50) u*(t) = 1
Etapa iii Com u* = 1 para todo t, podemos expressar a equao de movimento da varivel
estado, y y u , como
y y 1
28
Isso se enquadra no formato de uma equao diferencial de primeira ordem com coeficiente
constante e como termo constante, dy / dt ay b aqui com a = -1 e b = 1. Sua soluo
definitiva nos d o caminho timo y12
b b
y * (t ) y (0) e at
a a
(7.51)
6e t 1 [ y (0) 5]
Etapa iv Tendo obtido os caminhos do controle timo e do estado u*(t) e y*(t),

procuramos a seguir por *(t). Para esse propsito, primeiro retornamos condio de
transversalidade H t T 0 para fixar o valor da constante k. Considerando (7.50) e (7.51),
a condio de transversalidade agora se reduz a
1 ke T (6e T 1 1) 0 ou 6k 1
1
Portanto k . Substituindo ento esse resultado em (7.49) produz o caminho timo
6
1 t
(7.52) * (t ) e
6
Etapa v Os trs caminhos timos em (7.50), (7.51) e (7.52) retratam a soluo completa
par o presente problema exceto para o valor de T*. Para calcul-lo, lembre que o valor do
estado terminal estipulado em y(T) = 11. Disso, em conjunto com o caminho y*(t) obtido
anteriormente, nos diz que 11 6eT 1 ou eT 2 . Consequentemente,
T ln 2( 0,6931)
Os caminhos timos para as vrias variveis so facilmente desenhados. Deixamos isso
para o leitor.
A Constncia do Hamiltoniano em Problemas Autnomos
Todos os exemplos discutidos previamente partilhavam em comum a caracterstica de que

os problemas eram autnomos, isto , as funes no integrando e f na equao de
movimento no continham t como um argumento explcito. Uma importante conseqncia
dessa caracterstica que o Hamiltoniano timo o Hamiltoniano avaliado ao longo dos
caminhos timos de y, u e ter um valor constante no tempo.
12
A frmula soluo deduzida em Alpha C. Chiang, Fundamental Methods of Mathematical Economics,
3ed. Mc-Graw- Hill, New York, 1984 Sec. 14.1
29
Para ver isso, primeiro vamos examinar a derivada com respeito ao tempo do
Hamiltoniano H (t , y , u , ) no caso geral:
dH H H H H
y u
dt t y u
Quando H maximizado, temos H u 0 (para uma soluo interior) ou u 0 (para

uma soluo de canto). Assim o terceiro termo do lado direito desaparece. Mais ainda, o
H H
princpio do mximo tambm estipula que y e . Portanto, o segundo e o

quarto termos do lado direito se cancelam. O resultado lquido que H*, o Hamiltoniano
avaliado ao longo do caminho timo em todas as variveis, satisfaz a equao
dH * H *
(7.53)
dt t
Esse resultado vlido em geral, para ambos os problemas autnomos e no autnomos.
No caso especial de um problema autnomo, como t est ausente das funes F e f
como um argumento explcito, o Hamiltoniano tambm no deve conter esse argumento.
Conseqentemente, ns temos H / t 0 , portanto
dH *
(7.54) 0 ou H * constante [para problemas autnomos]
dt
Esse resultado de uso prtico num problema autnomo com uma linha terminal
horizontal. Espera-se normalmente que a condio de transversalidade H t T 0 seja
vlida apenas para tempo terminal. Mas se o Hamiltoniano uma constante na soluo
tima, ento ele deve zero para todo t e a condio de transversalidade pode ser aplicada a
qualquer ponto do tempo.
No exemplo 3, por exemplo, ns acharemos que
H * 1 * ( y * u*) 1
1 t
6

e 6e t 1 1 0
Esse valor zero de H* prevalece indiferentemente do valor de t, o que mostra que a

condio de transversalidade de fato satisfeita para todo t.
EXERCCIOS 7.4
1. Ache os caminhos timos das variveis de controle, estado e co-estado para

T
Maximize 0
(t 2 u 2 ) dt
sujeito a y u
y (0) 4 y (T ) 5 T livre
30
2. Ache os caminhos timos das variveis de controle, estado e co-estado para

4
Maximize 0
3 ydt
sujeito a
y y u
y ( 0) 5 y ( 4) 300
e 0 u(t ) 2
3. Ns desejamos nos mover do ponto inicial (0,8) no plano ty para alcanar o valor do
estado terminal y(T) = 0 logo que possvel. Formule e resolva o problema,
assumindo que dy / dt 2u , e que o conjunto de controle o intervalo fechado
[-1,1]
4. Ache o caminho do controle timo e o estado timo correspondente que minimiza a
distncia entre o ponto de origem (0,0) e uma curva terminal
y (T ) 10 T 2 , T 0 . Faa um grfico da curva terminal e do caminho y*(t).
5. Demonstre a validade da condio de transversalidade (7.37) para o problema com
uma linha terminal horizontal truncada.
7.5 COMPARAO DO CLCULO DAS VARIAES E DA TEORIA DO

CONTROLE TIMO
Ns mostramos anteriormente em (7.2) e (7.2) que um problema bsico de controle timo

pode ser transladado para um problema equivalente de clculo das variaes. Ser
maravilhoso se, em tal problema, as condies de otimalidade requeridas para o princpio
do mximo tambm forem equivalentes quelas do clculo das variaes. A resposta que
elas realmente so.
Para o problema (7.55), a funo Hamiltoniana
(7.55) H F (t , y, u ) u
Assumindo que essa funo seja diferencivel com respeito a u, podemos listar as seguintes
condies para o princpio do mximo:
H
Fu 0
u
H
y u
(7.56)
H
F y
y
(T ) 0
A primeira equao em (7.56) pode ser re-escrita como Fu . Mas, devido a segunda
equao aqui, ela pode ser re-escrita como
(7.57) Fy
31
Diferenciando (7.57) com respeito a t produz
d
F y
dt
Entretanto, a terceira equao em (7.56) d uma outra expresso para . Pela igualdade
das duas expresses, terminamos com a simples condio
d
F y Fy 0
dt
que idntica a equao de Euler (2.18).
Quando o Hamiltoniano maximizado com respeito a u, a condio H / u ser

acompanhada pela condio de segunda ordem 2 H / u 2 0 . Alm disso, a diferenciao
de H / u na expresso (7.56) produz
2H
Fuu Fy y 0
u 2
Isso, claro, a condio necessria de Legendre. Assim, o princpio do mximo

perfeitamente consistente com as condies do clculo das variaes.
Agora, lancemos um olhar sobre as condies de transversalidade. Para o problema
do controle com linha terminal vertical, a condio de transversalidade (T) = 0. Por
(5.57), entretanto, isso pode ser re-escrito como [ Fy ]t T 0 , ou, equivalentemente,
[ Fy ]t T 0
Novamente, isso precisamente a condio de transversalidade no clculo das variaes

apresentada em (3.10).
Para o problema com linha terminal horizontal, a condio de transversalidade do
controle timo H t T 0 . Observando (7.55), isso significa F u t T 0 . Usando
(7.56) novamente aps a substituio de y por u, contudo, podemos transformar esse
condio em
F F y
y t T 0
Exceto por essa ligeira diferena na simbologia, esta precisamente a condio de

transversalidade sob o clculo das variaes dada em (3.11).
Pode tambm ser mostrado que a condio de transversalidade para o problema com
uma curva terminal y T (T ) sob a teoria do controle timo pode ser transladada para a
correspondente condio sob o clculo das variaes e vice-versa. Os detalhes da
demonstrao so, todavia, deixados para o leitor.
7.6 A POLTICA DO CICLO DE NEGCIOS

32
Aplicaes do princpio do mximo a problemas econmicos cresceram rapidamente entre

1965 e 1975, e a tcnica tem se tornado bastante comum. Suas aplicaes alcanam
inteiramente das reas mais clssicas na macro e microeconomia at tpicos como indstria
de pesca, planejamento urbano e controle da poluio. Na presente seo, vamos introduzir
um modelo interessante de William Nordhaus13, que mostra que, numa democracia, um
partido poltico da situao que tenta impedir o partido (ou partidos) rival de tir-lo do
poder encoraja a busca por polticas que iro dar uma ateno particular s taxas de
desemprego e de inflao a cada perodo eleitoral. A repetio de tal padro em perodos
eleitorais sucessivos ir ento se manifestar, como uma srie de ciclo de negcios
unicamente enraizada no jogo dos polticos.
A Funo Voto e o Tradeoff de Phillips
O partido da situao, no controle do governo nacional, obrigado, numa democracia, a

perseguir polticas que agradem a uma maioria de eleitores no intuito de obter a vitria nas
eleies. No presente modelo, a ateno focada apenas sobre polticas econmicas, na
verdade em apenas duas variveis econmicas: U (a taxa de desemprego) e p (a taxa de
inflao). Como os efeitos malficos do desemprego e da inflao do a impresso de
serem a primeira preocupao econmica do eleitorado, essa escolha do foco certamente
razovel. Assume-se que a reao dos eleitores a quaisquer valores de U e p percebidos est
incorporada na funo voto (agregada).
p(%)
Menor
Maior
U(%) FIGURA 7.6

0
13
William Nordhauss: The Political Business Cycle. Review of Economics Studies, April 1975, pp. 169
190.
33
(7.58) = (U,p) (U < 0 p > 0)
onde uma medida do poder dos votos ganhos do partido da situao. As derivadas
parciais de com respeito a cada argumento so negativas, porque altos valores de ambos
U e p conduzem a perda de votos. Esse fato refletido na Fig. 7.6, onde, fora das trs
curvas de isovotos ilustradas, a mais alta associada a um baixo . A noo da curva
isovoto ressalta o fato que, no lado poltico, existe um tradeoff entre as duas variveis U e
p. Se o partido da situao desagrada os eleitores pela produo de uma alta inflao, ele
pode esperar recuperar os votos perdidos via uma reduo suficiente na taxa de
desemprego.
A parte do tradeoff poltico, as duas variveis em considerao tambm so ligadas
uma a outra por um tradeoff econmico via relao de Phillips com expectativas-
aumentadas
(7.59) p (U ) ( 0, 0 1)
onde denota a taxa esperada de inflao. Assume que as expectativas so formadas

adaptativamente, de acordo com a equao diferencial
(7.60) b( p ) b0
No final das contas, temos agora trs variveis, U, p e . Mas destas, quais devero
ser consideradas como variveis de estado e como variveis de controle? Para uma varivel
qualificar-se como varivel de estado, ela deve vir com uma dada equao de movimento
no problema. Como (7.60) constitui uma equao de movimento para , podemos tomar
como varivel de estado. A varivel U, por outro lado, no vem com uma equao de
movimento. Mas como U pode afetar p via (7.59) e assim dirigir dinamicamente via
(7.60), ns podemos us-la como varivel de controle. Usar U como uma varivel de
controle, porm, requer a suposio implcita de que o governante no poder tem a
habilidade de implementar qualquer taxa alvo de desemprego que ele escolha em qualquer
ponto no tempo. Como para a varivel remanescente, p, (7.59) mostra que seu valor em
qualquer tempo t ser determinado aps os valores das variveis de estado e controle serem
conhecidos. Portanto, no poderemos v-la nem como varivel de estado nem como
varivel de controle, mas, semelhante a , apenas como uma funo das outras duas
variveis.
O Problema do Controle timo
Suponha que um partido ganhou as eleies no tempo t = 0, e que a prxima eleio est
para acontecer T anos mais tarde em t = T. O partido vencedor tem ento T anos no total
para impressionar os eleitores com suas realizaes (ou com o que possa aparentar ser isto)
e como isso ganhar seus votos. A qualquer tempo do perodo [0,T], o par de valores
realizados de U e p determinaro um valor especifico de . Todos esses valores de , em
diferentes pontos do tempo, devero entrar no funcional objetivo do partido da situao.
Mas, os vrios valores devem ser ponderados diferentemente dependendo do tempo em que
ocorram. Se os eleitores tm uma memria coletiva curta e so mais influenciados por
34
eventos que ocorram prximos ao perodo eleitoral, ento, devero ser atribudos pesos
maiores aos valores de da parte posterior do perodo [0,T] do que queles que vm antes.
Ns podemos ento formular o problema do controle timo do partido da situao como
segue:
T
Maximize
0
(U , p )e rt dt
sujeito a p (U ) a
(7.61)
b( p )
e (0) 0 (T ) livre ( 0, T dados)
Alguns comentrios devem ser feitos sobre (7.61). Primeiro, ao sistema de

ponderao dos valores pertinentes a diferentes pontos no tempo foi dado a forma
especfica de uma funo exponencial e rt , onde r > 0, denota a taxa de queda de memria.
Essa funo mostra que os valores de para pontos posteriores do tempo so mais
fortemente ponderados. Note que, em contraste com a expresso e t , o que temos aqui
no um fator de desconto, mas seu inverso. Segundo, ns conservamos a relao de
Phillips de expectativas aumentadas no enunciado do problema. No momento, ns no
estamos equipados para tratar com tal restrio. Felizmente, a varivel p pode ser
facilmente eliminada pela substituio daquela equao na funo voto e na equao de
movimento. Ento a equao de p desaparecer como restrio separada. Terceiro, como
indicam as condies de fronteira, o partido da situao encontra uma linha terminal
vertical, devido ao T (o tempo da eleio) est predeterminado. Quarto, mesmo que a taxa
de desemprego seja necessariamente no negativa, nenhuma restrio de no negatividade
foi de fato colocada na varivel de controle U. O plano e isso uma estratgia
freqentemente usada no impor nenhuma restrio e deixar a soluo por ela mesma
cair fora. Se U*(t) vier a ter valores economicamente aceitveis para todo t, ento no
haver motivo para preocupao; se no, e somente se no, ns teremos que modificar a
formulao do problema.
Como declarado em (7.61) o problema contm funes gerais e assim no pode
produzir uma soluo quantitativa. Para resolver o problema quantitativamente, Nordhaus
assume as seguintes formas funcionais especficas:
(7.62) (U , p ) U 2 hp ( h 0)
(7.63) p ( j kU ) a ( j , k 0,0 a 1)
De (7.62) pode ser visto que as derivadas parciais de so de fato negativas. Em (7.63),
percebemos que relao de Phillips (U ) foi linearizada. Usando essas funes
especficas, e aps substituir (7.63) em (7.62), agora temos o problema especfico:
T
Maximize 0
( U 2 hj hkU ha )e rt dt
(7.64) sujeito a b[ j kU (1 a ) ]
e (0) 0 (T ) livre ( 0, T dados)
35
Maximizando o Hamiltoniano
O Hamiltoniano
(7.65)
H U 2 kj hkU ha e rt b[ j kU (1 a) ]
Maximizando com respeito a varivel de controle U, temos a equao
H
2U hk e rt bk 0
U
Isso implica no caminho de controle
1
(7.66) U (t ) k (h be rt )
2
2H
Desde que 2e rt 0 , o caminho de controle em (7.66) de fato maximiza H em
U 2
todo ponto do tempo, como requer o princpio do mximo.
A presena de na soluo de U(t) requer agora uma procura pelo caminho (t).
O Caminho do Co-estado timo
A procura pelo caminho do co-estado comea com a equao de movimento
H
hae rt b(1 a )

Quando re-escrita na forma
b(1 a ) hae rt
a equao prontamente reconhecida como uma equao diferencial linear de primeira

ordem com um coeficiente constante mas um termo varivel. Empregando os mtodos
padro de soluo14, ns podemos achar a funo complementar c e a integral particular
como sendo, respectivamente,
c Aeb (1a ) t (A arbitrrio)
14
Veja Alpha C. Chiang, Fundamental Methods of Mathematical Economics, 3ed. Mc-Graw- Hill, New York,
1984 Sec. 14.1 (para funo complementar) e Sec 15.6 (para a integral particular)
36
ha rt
e B r b ab
B
Segue que a soluo geral para
ha rt
(7.67) (t ) c Aeb (1a )t e
B
Note que as duas constantes A e B so fundamentalmente diferentes na sua natureza; B

meramente um smbolo taquigrfico que escolhemos para simplificar a notao, mas A
uma constante arbitrria a ser definida.
Para definir A, podemos fazer uso da condio de transversalidade para o problema
de linha terminal vertical, (T) = 0. Pondo t = T em (7.67), aplicando a condio de
transversalidade e resolvendo para A, encontramos que A ha / B e BT . Segue-se que a
soluo definitiva o caminho do co-estado timo
ha rt
(7.67) * (t ) [e e BT b (1a ) t ]
B
O Caminho do Controle timo
Agora que encontramos *(t), tudo que se tem a fazer substituir (7.67) em (7.66) para
deduzir o caminho do controle timo. O resultado , aps simplificaes,
kh
(7.68) U * (t ) [(r b) bae B (T t ) ]
2B
esse caminho de controle que o partido da situao deve seguir no interesse de sua
reeleio no ano T.
Quais so as implicaes econmicas desse caminho? Primeiro, notemos que U*
uma funo decrescente de t. Especificamente, temos
dU * 1
(7.69) khbae B (T t ) 0
dt 2
porque k, h, b e a so todas positivas, como a expresso exponencial. A poltica
econmica maximizadora de votos , consequentemente, estabelecer um alto nvel de
desemprego imediatamente aps vencer a eleio em t = 0 e ento deixar a taxa de
desemprego cair persistentemente por todo o perodo eleitoral [0,T]. De fato, os nveis
timos de desemprego no tempo 0 e no tempo T podem ser precisamente determinados.
Eles so
kh
U * (0) [(r b) bae BT ]
2B
37
kh kh
U * (T ) [(r b) ba]
2B 2
Note que o nvel terminal de desemprego, kh / 2 uma quantidade positiva. E desde que
U*(T) representa o ponto mais baixo em todo o caminho U*(t), os valores de U* para todos
os valores de t em [0,T] devem ser uniformemente positivos. Isso significa que a estratgia
de no impor restries deliberadamente na varivel U no causa nenhum incmodo
relativo ao sinal de U no presente caso. Entretanto, para ser economicamente significativo,
U*(0) deve ser menor que a unidade ou mais realisticamente, menor que alguma taxa
mxima de desemprego tolervel Umax < 1. A menos que os valores dos parmetros sejam
tais que U*(0) Umax, o modelo necessitar ser reformulado para incluir a restrio
U * (t ) [0, U max ] .
O tpico caminho do desemprego timo, U*(t), ilustrado na Fig 7.7, onde tambm
mostramos que a repetio de padres similares U*(t) sobre sucessivos perodos eleitorais
geram ciclos dos negcios polticos. Entretanto, a curvatura do caminho U*(t) nem sempre
cncava como na Fig. 7.7. Pois, por diferenciao de (7.69) com respeito a t, podemos ver
que
d 2U * 1 B (T t )

(7.70) Bkhbae 0 quando B0
dt 2 2
U*
t FIGURA 7.7
0 T 2T 3T
Se, para ilustrao, r = 0,03, b = 0,30 e a = 0,70, ento B = r b + a b = 0,06 e o caminho

U*(t) ser cncavo. Porm, um valor positivo de B mudar a curvatura para outra forma. E,
com mudanas nos parmetros em perodos eleitorais diferentes, tanto a posio quanto a
curvatura dos caminhos U*(t) em sucessivos perodos eleitorais podem mudar bastante.
Todavia, a poltica do ciclo de negcios tender a persistir.
O Caminho do Estado timo
A tendncia cclica na varivel de controle U inspirada politicamente deve tambm verter-

se sobre a varivel de estado e consequentemente tambm para a taxa real de inflao p.
O padro geral seria de uma taxa de inflao tima relativamente menor no comeo de cada
perodo eleitoral, mas sofrendo uma subida persistente. Noutras palavras, o perfil temporal
38
de p* tende a ser oposto ao de U*. Mas no iremos deduzir o caminho timo da taxa de
inflao aqui.
O leitor est lembrado que as concluses do presente modelo como aquelas de
alguns outros modelos esto intimamente ligadas s suposies adotadas. Em particular,
as formas especficas escolhidas para a funo voto em (7.62) e a relao de expectativas
aumentadas de Phillips (7.63) indubitavelmente exerce uma importante influncia sobre a
soluo final. Suposies alternativas tais como mudana no termo linear - hp em (7.62)
para - hp 2 so provveis de modificar significativamente tanto a soluo U*(t) quanto a
soluo p*(t). Mas tambm provvel que a formulao do problema seja mais
complicada.
EXERCCIOS 7.6
1. (a) O que acontece no modelo de Nordhaus se o caminho do controle timo for

caracterizado por dU * / dt 0 para todo t?
(b) Quais valores dos vrios parmetros faro dU * / dt faro ser zero?
(c) Interprete economicamente os valores encontrados na parte (b).
2. Qual valor do parmetro que causa dU * / dt 0 causar tambm U*(t) = 0 para todo
t? Explique as implicaes econmicas e racionais para tal resultado.
3. Como uma mudana no valor do parmetro r (taxa de decaimento da memria do
voto) afeta a inclinao do caminho de U*(t)? Discuta as implicaes econmicas
desse resultado. [Note: B r b b ]
4. Elimine o termo e rt na funo objeto em (7.64) e escreva o novo problema
(a) Resolva o novo problema efetuando os mesmos passos como aqueles ilustrados no
texto do problema original
(b) Verifique seus resultados colocando r = 0 no resultado do modelo original
especialmente (7.68) e (7.69)
7.7 USO DA ENERGIA E QUALIDADE AMBIENTAL
Quando uma economia revestida com um recurso que exaurvel, digamos, combustvel
fssil, certamente conveniente a coletividade ser concernente sobre a questo de como a
ofertada limitada do recurso melhor do que ser alocado para uso todo tempo. Discutimos
algumas das controvrsias envolvidas na Sec. 6.3 com o mtodo do clculo das variaes.
Mas, os cidados da mundo atual so tambm intensivamente concernentes quanto
qualidade do meio ambiente em que eles vivem. Se o uso de combustvel exaurvel gera
poluio como um derivado, ento qual o caminho timo do tempo para o uso da
energia? Ilustramos agora como tal questo pode ser includa na teoria do controle timo
com um modelo de Bruce A. Forester15.
15
Bruce A. Forester, Optimal Energy Use in a Polluted Enviroment, Journal of Enviromental Economics
and Management, 1980, pp 321 - 333. Enquanto esse trabalho apresenta trs diferentes modelos, aqui
confinaremos nossa ateno exclusivamente no primeiro deles, que assume uma fonte simples de energia
produzindo um poluente no acumulativo. Outro modelo, tratando poluio como um estoque varivel e
envolvendo duas variveis de estado ser discutido na Sec. 8.8.
39
A Funo Utilidade Social
Denote por S(t) o estoque de combustvel e E(t) a taxa de extrao do combustvel (e uso
da energia) em qualquer tempo t. Ento, temos:
(7.71) S E
O uso de energia, E, possibilita a produo de bens e servios para o consumo, C, que gera
utilidade, mas tambm gera um fluxo de poluio., P, que cria desutilidade. Ao invs de
escrever a funo utilidade simplesmente como U(E), como fizemos na seo introdutria
desse captulo, portanto, nossa funcional objetivo ir conter dois argumentos, C(E) e P(E).
Forester, especifica a funo consumo e a funo poluio como segue:
(7.72) C C (E ) C 0, C 0
(7.73) P P( E ) P 0, P 0
Enquanto o uso da energia cresce a uma taxa decrescente, ela gera poluio a uma taxa
crescente. Nesse modelo particular, poluio assumida por simplicidade ser no
acumulativa; isto , ela um fluxo que dissipa e no forma estoque. Isso exemplificado
pelo tipo auto-emisso de poluio.
A funo utilidade social depende do consumo e da poluio, com derivadas como
segue:
(7.74) U U (C , P ) U C 0, U P 0, U CC 0, U PP 0, U CP 0
A especificao de U C 0 e U CC 0 , mostra que a utilidade marginal do consumo

positiva, mas decrescente. Ao contrrio, a especificao de U P 0 e U PP 0 revela que a
utilidade marginal da poluio negativa e diminui (dado um acrscimo particular em P,
U P pode diminuir de, digamos, 2 para 3). Em termos de desutilidade marginal de
P ( U P ) , portanto, U PP 0 significa aumento na desutilidade marginal.
Desde que ambos C e P dependem de E, a utilidade social depende, em ltima anlise,
da energia usada exclusivamente positivamente via consumo e negativamente via
poluio. Isso significa que C e P podem ambos ser substitudos deixando E como o
primeiro candidato a varivel de controle. Outra nica varivel no modelo, S, aparece em
(7.71) na forma derivada. Desde que uma varivel dinamicamente direcionada para
varivel de controle E, claro que S faz aqui o papel de varivel de estado.
O Problema do controle timo
Se um Conselho de Energia indicado para planejar e desenhar o caminho do tempo timo

do uso da varivel energia E sobre um especificado perodo de tempo [0,T], o problema de
otimizao dinmica deve tomar a forma:
40
T
Maximize 0
U [C ( E ), P ( E )]dt
(7.75) sujeito a S E
e S (0) S 0 S (T ) livre ( S 0, T dados)
Essa particular formulao no permite fator de desconto no integrando, uma prtica em

Ramsey tradicional. E o Conselho de Energia compete a prudncia de escolher o estoque
terminal S(T), sujeito apenas a restrio imposta pela natureza de no negatividade. Desde
que o tempo terminal fixado, o problema se caracteriza por linha vertical terminal
truncada. Com uma simples varivel de controle E e uma simples varivel de estado S, o
problema pode ser resolvido facilmente.
Maximizao do Hamiltoniano
A funo Hamiltoniana
(7.76) H U [(C ( E ), P ( E )] E
envolve funes diferenciais no lineares U, C e P. Assim, podemos maximizar H com

respeito a varivel de controle simplesmente colocando sua derivada primeira igual a zero:
H
U C C ( E ) U P P ( E ) 0
E
Quando resolvido, essa equao expressa E em termos de .

Para fazer tal como em (7.77) maximizar ao invs de minimizar o Hamiltoniano,
verificamos o sinal 2 H / 2 E . Desde que UC e UP so, como U, dependente de E, a
segunda derivada
H 2
2
U C (E) UCC UPPP UPP 0
2 CC
2 [por (7.72), (7.73) e (7.74)]
E
O sinal negativo garante que H maximizado.
Os caminhos timos do co-estado e do controle
Para extrair mais informao sobre E de (7.77), portanto, precisamos olhar dentro do
caminho do tempo de . O princpio do mximo nos diz que a equao de movimento para
41
H
0 implicando (t) = c (constante)
S
Para definir c, podemos recorrer a condio de transversalidade. Para o problema em mos,

com linha vertical terminal truncada, a condio toma a forma:
(7.79) (T) 0 S(T) 0 (T) S(T) = 0 [por (7.35)]
Em aplicaes prticas desse tipo de condio, o passo inicial colocar (T) = 0 (como se
linha terminal no fosse truncada) para ver com soluo ir trabalhar. Desde que (T)
constante por (7.78), para colocar (T) = 0 realmente colocar (t) = 0 para todo t.
Com (t) = 0 (7.77) se reduz a uma equao numa simples varivel E,
(7.80) U C C ( E ) U P P ( E ) 0
que, em princpio, pode ser resolvido pelo caminho do controle timo. Desde que essa
equao independente da varivel t, sua soluo constante no tempo:
(7.81) E*(t) = E* (uma constante especfica) [se *(t) = 0]
Se essa soluo aceitvel do ponto de vista de S(T) 0 a restrio , todavia, ainda

causa para ser estabelecida.
Entretanto, isso usado para examinar o significado econmico de (7.80). O primeiro
termo, U C C (E ) , mede o efeito da troca em E sobre U via C. Isto , representa a utilidade
marginal do uso da energia atravs de sua contribuio para o consumo. Similarmente, o
termo U P P(E ) expressa a desutilidade marginal do uso da energia atravs de seu efeito
poluio. O que (7.80) faz , entretanto, direcionar o Conselho de Energia para selecionar o
valor E* que equilibra a utilidade marginal e a desutilidade marginal do uso da energia,
tanto quanto a familiar regra Custo Marginal = Receita Marginal requer para uma firma
equilibrar os efeitos de custo e receita da produo.
O Caminho do estado timo
Lembre-se de verificar se a soluo E* em (7.81) pode satisfazer a restrio S(T) 0. Para

esse propsito, devemos encontrar o caminho do estado S(t).
Com o uso da energia constante, a equao de movimento S E pode ser realmente
integrada para gerar
S (t ) Et k (k arbitrria)
Mais ainda, colocando t = 0 nesse resultado, fcil ver que k representa o estoque inicial de
combustvel S0. Assim, o caminho do estado timo pode ser re-escrito como
(7.82) S * (t ) S 0 Et
42
O valor de S*(t) em qualquer tempo claramente depende da magnitude de E*. Desde

que as funes que temos trabalhado U(C,P), C(E) e P(E) so todas gerais, E* no pode
assumir um valor especfico ou uma expresso paramtrica. Alm disso, podemos examinar
a restrio S(T) 0 qualitativamente.
Considere trs valores ilustrativos de E* na Fig. 7.8, onde E* 1 < E*2 < E*3. Quando a
taxa do uso da energia E* 1 est verdadeiramente baixa, o estoque S*(t) aparece como uma
linha reta de inclinao suave, tal que S*(t) seja positivo. Com uma alta taxa do uso de
energia, por outro lado, o estoque de combustvel est caindo a zero no tempo T. Ainda
assim, o Conselho de Energia usaria de sua autoridade. Mas, o outro caso, E*3,
vinculando a exausto pr matura da dotao do combustvel, evidentemente viola a
estipulao S(T) 0. Assim, se nossa soluo E* em (7.81)
S*(t)
S*(t)=S0 E*t
E*1 < E*2 < E*3
E*= E*1
Figura 7.8
E*= E*3 E*= E*2

t
0
tende ser como E*1 ou E*2, ento a condio de transversalidade (7.79) adequada e o
problema solucionado. Mas se for como E*3, ento devemos colocar S(T) = 0 e resolver o
problema como se fosse um com ponto terminal dado. Nesse evento, o valor E* pode ser
diretamente encontrado de (7.82) colocando t = T e S(T) = 0:
S0
(7.83) E* 0 [se (7.81)viola S*(T) 0]
T
Esse novo E* est ilustrado por E*2 na Fig. 7.8.

uma notvel caracterstica desse modelo que E*, a taxa do uso timo da energia,
constante no tempo. Essa constncia de que E* prevalece mesmo que a restrio sobre o
estoque terminal, S(T) 0, amarrada [como em (7.83)] ou no amarrada [como em
(7.81)]. Que hiptese do modelo responsvel por esse resultado? A resposta cai na
ausncia do fator de desconto. Se um fator de desconto introduzido [veja Prob. 3,
Exerccio 7.7], o caminho E* ento ir ser decrescente no tempo, conquanto que *(t) > 0.
Entretanto, no outro caso em que *(t) = 0, E* ser constante.
Exerccio 7.7
43
1. Suponha que a soluo em (7.80) seja E* 3 que insuficiente para satisfazer a

restrio S(T) 0, e conseqentemente o Conselho de Energia forado a
selecionar uma baixa taxa do uso de energia, E*2, por exemplo.
(a) E*3 satisfaz a regra utilidade marginal = desutilidade marginal?
(b) E*2 satisfaz a regra? Se no, E*2 caracteriza-se por utilidade marginal <
desutilidade marginal ou utilidade marginal > desutilidade marginal?
Explique.
2. Seja a condio terminal no modelo de Forester alterada de S(T) 0 para S(T) S min
>0. Como ser modificada a Fig. 7.8 para mostrar que E* 1 resulta em S(T) > Smin ,
E*2 resulta em S(T) = Smin e E*3 resulta em S(T) < Smin?
3. Suponha que o Conselho de Energia decida incorporar um fator de desconto e t na
funcional objetivo.
(a) Escreva o novo Hamiltoniano e encontre as condies que iro maximizar o
novo Hamiltoniano.
(b) Examine o caminho timo do co-estado. Voc conseguir obter um caminho
constante como em (7.78)?
(c) Se a condio de transversalidade (T) = 0 aplica-se, como ser
transformado a condio de maximizao na parte (a)? Essa condio pode
ser simplificada para (7.80)? O que voc pode concluir sobre E* nesse caso?
(d) Se a condio de transversalidade (T) > 0 e S(T) = 0, por exemplo, como
ser transformado a condio de maximizao do Hamiltoniano na parte (a)?
Encontre a derivada dE / dt e deduza o caminho caracterstico de E*(t) para
esse caso.

Teoria Do Controle Otimo Capitulo 7 Stamford

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Do Controle Otimo Capitulo 7 Stamford

Enviado por

Direitos autorais:

Formatos disponíveis

1

Nessa formulao, apenas a varivel de controle E entra no funcional objetivo. Mas,

7.1 O PROBLEMA BSICO DE CONTROLE TIMO

Caractersticas Especiais dos Problemas de Controle timo

Uma caracterstica notvel da teoria do controle timo a de que um caminho de controle

Outra caracterstica importante que a teoria de controle timo capaz de manipular

u*(t) = 1 para t [o, t1 )

u*(t) = 0 para t [t1 , t 2 ) t1 t 2

ento estaremos ricocheteando* (banging) sucessivamente entre um e outro limite do

Baseado na discusso precedente, podemos colocar o problema bsico do controle timo

Aqui, como na discusso subseqente, nos ocuparemos exclusivamente com o problema de

estabelecidas com mais especificidade e menos confuso. Quando for encontrado um

Como um caso especial, considere o problema onde a escolha de u no restringida, e onde

Ento o problema de controle timo fica

Substituindo a equao de movimento na funo integrando, entretanto, podemos eliminar

sujeito a y ( 0) A y (T ) livres ( A, T dados)

7.2 O PRINCPIO DO MXIMO

O resultado mais importante na teoria do controle timo uma condio necessria de

A varivel de co-estado e a funo Hamiltoniana

Trs tipos de variveis foram apresentadas no problema (7.1): t (tempo), y (estado) e u

funo F tem importncia, a prtica prevalecente entre os economistas simplesmente

Max H (t , y, u , ) para todo t [0, T ]

(7.6) H (t , y , u * , ) H (t , y , u , ) para todo t [0, T ]

onde u* o controle timo, e u qualquer outro valor de controle. Na discusso a seguir,

controle que maximiza H em U, u = c, um ponto limite de U. Assim a condio

Para converter o problema de minimizao-de-distncia para maximizao, devemos

Etapa i Comeamos escrevendo a funo Hamiltoniana

observando que H diferencivel e no linear, podemos aplicar a condio de primeira

Isso produz a soluo6

Alm disso a diferenciao de H / u usando a regra do produto produz

Assim, o resultado em (7.9) maximiza H. Mesmo que (7.9) expresse u em termos de , ns

Etapa ii Para fazer isso, ns recorremos a equao de movimento da varivel de co-estado

Convenientemente, a condio de transversalidade (T ) 0 em (7.5) suficiente para

(7.10) * (t ) 0 para todo t [0, T ]

Observando (7.9), ns tambm poderemos concluir que

(7.11) u * (t ) 0 para todo t [0, T ]

Etapa iii Da equao de movimento y u , estamos agora capacitados a escrever

EXEMPLO 2 Encontre o controle timo que

Como esse problema caracterizado pela linearidade em u e um por um conjunto de

Etapa i O Hamiltoniano de (7.13), nominalmente,

linear em u, com inclinao H / u 3 . Se em um dado ponto do tempo,

Sua soluo geral 7

Note que * (t ) uma funo decrescente, caindo do valor do estado inicial

(7.16) 2 ln 2,5 1,084

Conseqentemente, o controle timo em (7.14) pode ser reescrito mais especificamente em

(7.17) Fase I: u *I u * [0, ) 2

Fase II: u * II u * [ ,2] 0

15,739 y*II Figura 7.5

y y 2 com valor inicial y(0) = 4

com soluo geral

(7.19) y *II y * [ ,2] cet (c arbitrria)

condio terminal porque o estado terminal livre. Entretanto, o leitor lembrar do

O valor de y* no tempo de troca aproximadamente 2(3e1, 096 1) 15,739 .

1 No exemplo 2, (t) uma funo decrescente, e atinge o valor 3 apenas em um

Cheque que de fato o Hamiltoniano maximizado ao invs de minimizado.

3 Encontre os caminhos timos das variveis de controle, estado e co-estado para

Verifique que o Hamiltoniano maximizado ao invs de minimizado.

4 Encontre os caminhos timos das variveis de controle, estado e co-estado para

Verifique que o Hamiltoniano maximizado ao invs de minimizado.

[Sugesto: Duas equaes de movimento devem ser resolvidas simultaneamente. Revise o

7.3 A RACIONALIDADE DO PRINCPIO DO MXIMO

Vamos agora explicar a racionalidade subjacente ao princpio do mximo. O que ns

Uma viso variacional do problema do controle

Etapa i Como primeiro passo no desenvolvimento do princpio do mximo,

(7.17) Fase I: u I u [0, ) 2

(7.19) y II y [ ,2] cet (c arbitrria)

A procura pelas trajetrias de u(t), y(t) e *(t) no presente problema torna-se um

Etapa iv Tendo obtido os caminhos do controle timo e do estado u(t) e y(t),