Escolar Documentos
Profissional Documentos
Cultura Documentos
Captulo 7
Controle timo:
O princpio do mximo
O clculo das variaes, o mtodo clssico para atacar problemas de otimizao dinmica,
assim como o clculo comum, requer para sua aplicabilidade a diferenciabilidade das
funes que entram no problema. Mais importante que isso que apenas solues interiores
podem ser manipuladas. Um desenvolvimento mais moderno que pode trabalhar com
caractersticas no clssicas tais como soluo de canto, encontrado na teoria do controle
timo. Como seu nome indica, a formulao de controle timo do problema de otimizao
dinmica foca uma ou mais variveis que servem como instrumentos de otimizao.
Diferente, entretanto, do clculo das variaes, onde nosso objetivo encontrar o caminho
temporal timo para uma varivel estado y, a teoria do controle timo tem como sua
principal meta a determinao do caminho timo para a varivel de controle u. Certamente,
logo que o caminho do controle timo, u*(t), seja encontrado, ns podemos tambm
encontrar o caminho do estado timo, y*(t), que corresponde a ele. De fato, os caminhos
u*(t) e y*(t) so usualmente encontrados no mesmo processo. Mas a presena de uma
varivel de controle como estgio central muda a orientao bsica do problema de
otimizao dinmica.
Duas questes so propostas imediatamente. O que que uma varivel de controle
faz? E como seu ajuste dentro do problema da otimizao dinmica? Para responder essas
questes, vamos considerar uma economia ilustrativa simples. Suponha que exista numa
economia um estoque finito de recursos exaurveis S (tal como carvo ou leo), como no
modelo de Hotelling, com S(0) = S0. Como esse recurso est sendo extrado (e usado), o
estoque de recurso ser reduzido de acordo com a relao
dS (t )
E (t )
dt
onde E(t) denota a taxa de extrao do recurso no tempo t. A varivel E(t) qualificada
como varivel de controle porque possui as duas propriedades seguintes. Primeiro, ela
algo que esta sujeito a nossa escolha arbitrria. Segundo, nossa escolha de E(t) age sobre a
varivel S(t) que indica o estado do recurso a todo instante do tempo. Conseqentemente, a
varivel E(t) como um mecanismo de pilotagem em que ns podemos manobrar de forma
a dirigir a varivel de estado S(t) para vrias posies em qualquer tempo t por meio da
equao diferencial dS(t)/dt = - E(t). Por uma pilotagem correta de tal varivel de controle,
ns poderamos, consequentemente, visar a otimizao de algum critrio de performance
expresso pelo funcional objetivo. Para o presente exemplo, ns podemos postular que a
sociedade quer maximizar a utilidade total derivada do uso do recurso exaurvel sobre um
dado perodo de tempo [0,T]. Se no h restrio no estoque final, o problema de
otimizao dinmica toma a seguinte forma:
2
T
Maximize 0
U ( E )e t dt
dS
sujeito a E (t )
dt
e S (0) S 0 S (T ) livres (S 0 , T dados )
Para manter uma estrutura introdutria simples, primeiro vamos considerar um problema
com uma nica varivel de estado y e uma nica varivel de controle u. Como sugerido
anteriormente, a varivel de controle o instrumento de poltica que nos habilita a
influenciar a varivel de estado. Assim, qualquer escolha do caminho de controle u(t) ir
implicar num caminho de estado associado y(t). Nossa tarefa escolher um caminho timo
admissvel u*(t) no qual, ao longo do caminho de estado timo admissvel y*(t), iremos
otimizar o funcional objetivo sobre o intervalo de tempo [0,T].
u y
C
A
c Trajetria
Trajetria estado
de controle B
b d
a
0 t 0 t
t1 t2 T t1 t2 T
(a) (b)
Figura 7.1
1
Pontos agudos numa trajetria de estado podem tambm ser acomodados no clculo de vrias variveis via
as condies de Weierstrass-Edrmann. Ns no discutimos esse assunto nesse livro, por causa da relativa
raridade de suas aplicaes econmicas. O leitor interessado pode consultar qualquer livro sobre clculo das
variaes.
4
u*(t) = 1 para t [t 2 , T ] t2 T
O problema bsico
(7.1)
T
Maximize V
0
F (t , y , u ) dt
sujeito a y f (t , y , u )
y (0) A y (T ) livre ( A, T dad
e u (t ) U para todo t [0, T ]
Em (7.1), o funcional objetivo ainda toma a forma de uma integral definida, mas a
funo integrando F no inclui o argumento y como no clculo das variaes. Ao
contrrio, existe um novo argumento u. A presena da varivel de controle u necessita de
uma ligao entre u e y, para nos dizer como u afeta especificamente o curso tomado pela
varivel de estado y. Essa informao fornecida pela equao y f (t , y , u ) , onde o
smbolo com ponto y , denotando a derivada dy/dt, uma notao alternativa para o
smbolo y usado antes2. No tempo inicial, os dois primeiros argumentos na funo f
devem tomar valores dados t = 0 e y(0) = A, ento apenas o terceiro argumento est sob
nossa escolha. Para alguma poltica escolhida em t = 0, digamos, u1 (0) , essa equao
produzir um valor especfico para y , digamos, y 1 (0) , que impe uma direo
especfica para a qual a varivel y move-se. Uma poltica diferente u 2 (0) , geralmente nos
dar um valor diferente, y 2 (0) , via a funo f. E um argumento similar aplicar-se- a
outros pontos do tempo. O que essa equao faz, todavia, fornecer um mecanismo pelo
qual nossa escolha do controle u poder ser transformada num padro especfico de
movimento da varivel de estado y. Por essa razo, essa equao conhecida como a
equao de movimento para a varivel de estado (ou, para simplificar, a equao de
estado). Normalmente, a ligao entre u e y pode ser adequadamente descrita pela equao
diferencial de primeira ordem y f (t , y , u ) . Entretanto, se existir um padro de mudana
da varivel de estado y que no possa ser capturado pela primeira derivada y mas que
requer o uso da segunda derivada y d 2 y / dt 2 , ento a equao de estado tomar a forma
de uma equao diferencial de segunda ordem, que ns deveremos transformar num par de
equaes diferenciais de primeira ordem. A complicao que, no processo de
transformao, uma varivel de estado adicional dever ser introduzida no problema. Um
exemplo de tal situao pode ser encontrado na seo 8.4.
Ns usaremos consistentemente a letra f minscula como smbolo da funo na
equao de movimento, e reservaremos a letra maiscula F para a funo integrando no
funcional objetivo. Assume-se que as funes F e f so contnuas em todos os seus
argumentos, e possuem derivadas parciais de primeira ordem contnuas com respeito a t e y,
mas no necessariamente com respeito a u.
O resto do problema (7.1) consiste de especificaes com relao aos conjuntos de
fronteira e de controle. Da mesma forma que o caso da linha-terminal-vertical bsico e foi
implementado, outras especificaes de ponto-terminal tambm podem ser acomodadas.
Igualmente para o conjunto controle, o caso bsico de U ser um conjunto aberto
U ( ,) . Se entretanto, a escolha de U de fato no restritiva, em tal caso
poderemos, de um modo geral, omitir a imposio u (t ) U do problema.
Um caso especial
2
Ainda que y e y sejam smbolos alternativos, usaremos y exclusivamente no contexto da teoria do
controle timo, para fazer distino do contexto do clculo das variaes.
6
y u
(7.2)
T
Maximize V 0
F (t , y , u ) dt
sujeito a y u
y ( 0) A y (T ) livres ( A, T dados )
(7.2)
T
Maximize V F (t , y , y ) dt
0
Este precisamente o problema de clculo das variaes com linha terminal vertical. A
ligao fundamental entre o clculo das variaes e a teoria do controle timo , ento,
evidente. Mas, as equaes de movimento encontradas nos problemas de controle timo so
geralmente mais complicadas que em (7.2).
varivel de co-estado (ou varivel auxiliar) e ser designada por . Como veremos, a
varivel de co-estado similar ao multiplicador de Lagrange e, como tal, tem carter de
uma varivel de valorao, medindo o preo sombra de uma varivel de estado associada.
Como y e u, a varivel pode tomar diferentes valores em diferentes pontos do tempo.
Assim, o smbolo na verdade uma notao simplificada para (t).
O veculo pelo qual a varivel de co-estado entra no problema do controle timo a
funo Hamiltoniana, ou simplesmente, o Hamiltoniano, que figura com muito destaque no
processo de soluo. Denotando por H, o Hamiltoniano definido como
(7.3) H (t , y , u , ) F (t , y , u ) (t ) f (t , y , u )
Desde que H consiste da funo integrando F mais o produto da varivel de co-estado pela
funo f, ele naturalmente uma funo com quatro argumentos: t, y, u bem como . Note
que, em (7.3), ns designamos um coeficiente unitrio para F, o que entra em contraste com
o coeficiente ainda indeterminado (t) de f. Rigorosamente falando, o Hamiltoniano deveria
ser escrito como
(7.4) H (t , y , u , ) 0 F (t , y , u ) (t ) f (t , y , u )
onde 0 uma constante no negativa, tambm ainda indeterminada. Para o problema (7.1)
da linha-terminal-vertical, a constante 0 torna-se sempre no nula (estritamente positiva);
assim, ela pode normalizada para o valor unitrio, reduzindo (7.4) a (7.3). O fato de ser
0 0 no problema bsico devido a duas condies do princpio do mximo. Primeiro,
os multiplicadores 0 e (t) no podem desaparecer simultaneamente em nenhum ponto
do tempo. Segundo, a soluo do problema da linha-terminal-vertical deve satisfazer a
condio de transversalidade (T) = 0, que ser explicada na discusso que se segue. A
condio (T) = 0 requer um valor no nulo para 0 em t = T. Mas, desde que 0 uma
constante no negativa conclumos que 0 uma constante positiva, que pode ser
normalizada para a unidade.
Para formulaes do problema do controle timo diferente de (7.1), por outro lado,
0 pode tornar-se zero, invalidando desta forma o Hamiltoniano em (7.3). O purista,
entretanto, insistir em checar que 0 de fato positivo em todo problema, antes de usar o
Hamiltoniano (7.3). O processo de checagem envolver uma demonstrao onde a hiptese
de que 0 0 conduzir a uma contradio e violar a condio mencionada antes, de que,
0 e (t) no podem desaparecer simultaneamente 4. Na realidade, porm, a eventualidade
de um 0 nulo acontece apenas em certas situaes no usuais (algumas digamos
patolgicas) onde a soluo do problema independente da funo integrando, F, ou
seja, onde a funo F no tem importncia no processo da soluo 5. exatamente esse o
motivo pelo qual se pode pr o coeficiente 0 igual a zero, para fazer a funo F sair do
Hamiltoniano. Como muitos dos problemas encontrados em economia so do tipo onde a
4
Para exemplos especficos do processo de checagem veja, Akira Takayama, Mathematical Economics 2ed.,
Cambridge Universty Press, Cambridge, 1985, pp. 617 618, 674 675, e 679 680.
5
Um exemplo de um problema como esse pode ser encontrado em Morton I. Kamien e Nancy L. Schwartz,
Dynamic Optimazation: The Calculus of Variations and Control Optimal in Economics and Management,
2ed., Elsevier, New York, 1991, p. 149.
8
O princpio do mximo
Em contraste com a equao de Euler que uma simples equao diferencial de segunda
ordem na varivel de estado y, o princpio do mximo envolve duas equaes diferenciais
de primeira ordem na varivel de estado y e na varivel de co-estado . Junto com essas
equaes, exigido tambm que o Hamiltoniano seja maximizado com respeito as
variveis de controle u em todo ponto do tempo. Para uma eficincia pedaggica, primeiro
explicamos e discutimos as condies envolvidas, antes de fornecer a racionalidade do
princpio do mximo.
Para o problema em (7.1), e com o Hamiltoniano definido em (7.3), as condies
para o princpio do mximo so
H
y [equao de movimento para y ]
(7.5)
H
[equao de movimento para ]
y
(T ) 0 [condio de transversalidade]
O smbolo Max u
H significa que o Hamiltoniano deve ser maximizado
exclusivamente com respeito a u como varivel de escolha. Um modo equivalente de
expressar essa condio
desenhamos trs curvas, cada uma indicando um possvel grfico do Hamiltoniano H contra
a varivel de controle u em um ponto especfico do tempo, para valores especficos de y e .
Assume-se que a regio de controle o intervalo fechado [a,c]. Para a curva 1, que
diferencivel com respeito a u, o mximo de H ocorre em u = b, um ponto interior da
regio de controle U; nesse caso, a equao H / u 0 pode de fato servir para identificar
o controle timo em cada ponto do tempo. Mas, se a curva 2 a curva relevante, ento o
9
H Curva 1
Curva 2
Figura 1 7.2
Curva 3
u
a c
0 b
U
nada mais que uma reafirmao da equao de movimento da varivel de estado
originalmente especificada em (7.1). O nico motivo de re-expressar y como a derivada
parcial de H com respeito a varivel de co-estado mostrar a simetria entre essa equao
de movimento e a varivel de co-estado. Note, entretanto, que na ltima equao de
movimento, o negativo da derivada parcial de H com respeito a varivel de estado y.
Juntas, as duas equaes de movimento so referidas coletivamente como o sistema
Hamiltoniano, ou sistema cannico (significando o sistema de equaes diferenciais
padro) para o dado problema. Contudo ns temos mais que uma equao diferencial para
tratar na teoria do controle timo uma para cada varivel de estado e uma para cada
10
varivel de co-estado cada equao diferencial apenas de primeira ordem. Desde que a
varivel de controle nunca aparece na forma derivada, no existe equao diferencial para u
no sistema Hamiltoniano. Mas, da soluo bsica de (7.5) pode-se, se desejado, obter uma
equao diferencial para a varivel de controle. E, em alguns modelos, pode ser mais
conveniente tratar com um sistema dinmico nas variveis (y, u) no lugar do sistema
cannico nas variveis (y, ).
A ltima condio em (7.5) a condio de transversalidade para o problema de
estado-terminal-livre aquele com uma linha terminal vertical. Como ns esperaramos, tal
condio diz respeito apenas ao que deveria ocorrer no tempo terminal T.
EXEMPLO 1: Ache a curva de menor distncia de um ponto P dado para uma linha reta L
dada. Ns j tnhamos encontrado esse problema no clculo das variaes. Para reformul-
lo como um problema de controle timo, seja o ponto P(0,A), e assuma, sem perda de
generalidade, que a linha L uma linha vertical. (Se a posio da linha no for vertical,
pode-se sempre fazer que seja atravs de uma rotao apropriada nos eixos). A funo F
previamente usada 1 y 2 pode ser reescrita como 1 u 2 , onde y u ou y u .
1/ 2 1/ 2
Maximize V
T
0
1 u2 1/ 2
dt
(7.7) sujeito a y u
y (0) A y (T ) livre ( A, T dados)
Note que a varivel de controle no restringida, portanto o controle timo ser uma
soluo interior.
(7.8)
H 1 u2 1/ 2
u
H
1 u 2 (2u ) 0
1 1 / 2
u 2
(7.9)
u (t ) 1 2 1 / 2
2H
u
2
1 u2 3 / 2
0
H
(7.10) 0 (t ) constante
y
(7.12) y 0 y (t ) constante
Mais ainda, a condio inicial y(0) = A habilita-nos a definir essa constante e escrever
(7.12) y * (t ) A
Esse resultado implica que 2 1 , de outra forma a equao produziria 0 = 1, o que impossvel. Dividindo
ambos os lados pela quantidade no nula 1 2 e tomando a raiz quadrada ns finalmente chegaremos a
(7.9)
12
y * (t ) A
A B
Figura 7.3
t
0
T
Esse caminho y*, ilustrado na Fig. 7.3, uma linha reta horizontal. Alternativamente, ele
pode ser visto como um caminho ortogonal para a linha terminal vertical.
V 2 y 3u dt
T
Maximize
0
(7.13) sujeito a y y u
y (0) 4 y (2) livre
e u (t ) U [0,2]
H 2 y 3u ( y u ) (2 ) y ( 3)u
2
u * (t ) se (t ) 3
0
As solues u* = 2 e u* = 0 so, certamente, solues de canto. Note que, pelo fato de H
ser linear em u, a condio de primeira ordem usual H / u 0 inaplicvel na nossa
busca por u*.
13
Etapa ii Nossa prxima tarefa determinar (t), dado que ele necessrio em (7.14). Da
equao de movimento de , ns teremos a equao diferencial
H
2 ou 2
y
H Max H
Curva 1
Max H >3
Curva 2
<3 Figura 7.4
u
0
2
(t ) ke t 2 (k arbitrria)
Desde que a constante arbitrria k pode ser definida como k 2e 2 pela utilizao da
condio de transversalidade (t) = (2) = 0, poderemos escrever a soluo definitiva como
(7.15) * (t ) 2e 2 e t 2 2e 2 t 2
7
Equaes lineares de primeira ordem desse tipo so explicadas na Sec. 14.1, de Alpha C. Chiang,
Fundamental Methods of Matematical Economics, 3 ed. McGraw-Hill, New York, 1984.
14
u*
(a)
Fase I Fase II
2
t
0 2
1 = 1,083
39,339
(b)
2 t
1 = 1,083
Como descrito graficamente na Fig. 7.5a, esse controle timo exemplifica uma variante
simples de bang-bang.
Etapa iii Ainda que o problema pergunte somente o caminho do controle timo, ns
podemos encontrar tambm o caminho de estado timo, em duas fases. Na fase I, a equao
de movimento para y y y u y 2 , ou
Sua soluo
(7.18)
y * I y * [0, ) 2 3e t 1
Na fase II, a equao de movimento para y y y 0 , ou
y y 0
Note que a constante c no pode ser definida pelas condies iniciais y(0) = 4 dada em
(7.13) porque j estamos na fase II, depois de t = 0. Nem pode ser definida por qualquer
15
y * I 2 3e 1 [por (7.18)]
e
y *II 2e [por (7.19)]
encontramos, igualando essas duas expresses e resolvendo para c, que c 2(3 e ) ,
portanto o caminho timo y na fase II
(7.19)
y*II 2 3 e 5,324e t
Exerccios 7.2
4
Maximize 3 ydt
0
sujeito a y y u
y (0) 5 y (4) livre
e u (t ) U [0,2]
y u dt
2
2
Maximize
0
sujeito a y u
y (0) 0 y (2) livre u (t ) no restrito
Maximize
1
0
1
2
y 2 u 2 dt
sujeito a y u y
y (0) 1 y (1) livre u (t ) no restrito
Para tornar as coisas simples, assume-se aqui que a varivel de controle u irrestrita, de
forma que u* uma soluo interior. Alm disso, assumido que a funo Hamiltoniana
diferencivel com respeito a u e que a condio H / y 0 pode ser invocada no lugar da
condio Max H. Como usual, tomamos o ponto inicial como um ponto fixo, mas
permitido ao ponto terminal variar. Isso ir nos habilitar a derivar certas condies de
transversalidade no processo da discusso. O problema ento fica
T
Maximize V 0
F (t , y , u ) dt
sujeito a y f (t , y , u )
y (0) y 0 dado
Por essa razo, podemos aumentar o antigo funcional objetivo com a integral em (7.21) sem
afetar a soluo. Isso , podemos trabalhar com um novo funcional objetivo
T
V (t )[ f (t , y, u ) y ]dt
0
(7.22) T
{F (t , y, u ) (t )[ f (t , y, u ) y ]}dt
0
confiando que ter os mesmos valores que V, pois a equao de movimento em (7.20)
obedecida em todos os pontos do tempo.
Previamente, tnhamos definido a funo Hamitoniana como
H (t , y , u , ) F (t , y , u ) (t ) f (t , y , u )
A substituio da funo H dentro de (7.22) pode simplificar o novo funcional para a forma
T
0
[ H (t , y , u ) (t ) y ]dt
(7.22) T T
0
H (t , y , u , ) dt (t ) y
0
dt
Consequentemente, pela substituio desse resultado, o novo funcional objetivo pode ser
re-escrito como
T
[ H (t , y, u, ) y (t ) ]dt (T ) yT (0) y0
(7.22) 0
1 2 3
8
A frmula da integrao por partes uma integral definida foi dada em (2.15). Aqui, trocamos o smbolo u em
(2.15) por w, porque u agora usado para denotar a varivel de controle. Seja
v (t ) (implicando que dv dt )
w y (t ) (implicando que dw y dt )
Ento, desde que (t ) y dt vdw , ns temos
T T
(t ) y dt [ (t ) y (t )]T0 y (t ) dt
0 0
que coincide com o resultado no texto.
18
Etapa ii O valor de depende da escolha dos caminhos no tempo para as trs variveis, y,
u e , bem como dos valores escolhidos de T e yT. Na presente etapa, iremos focar .
H
(7.23) y para todo t [0, T ]
y
Portanto, para ajudar-nos nas inquietaes do efeito de (t) sobre , simplesmente impomos
(7.23) como uma condio necessria para a maximizao de . Isso responsvel por uma
das trs condies do princpio do mximo. Essa, claro, uma etapa pouco estremecedora,
pois a equao de movimento na realidade dada como uma parte do prprio problema.
Etapa iii Agora podemos voltar para o caminho de u(t) e seus efeitos sobre o caminho y(t).
Se conhecemos um caminho u*(t) e o perturbamos com uma curva de perturbao p(t),
podemos produzir caminhos de controle vizinhos
(7.24) u (t ) u * (t ) p (t )
(7.25) y (t ) y * (t ) q (t )
dT dy
(7.26) T T * T e yT y *T yT (implicando T e T yT )
d d
Observando as expresses de u e y em (7.24) e (7.25), podemos expressar em termos de
, portanto poderemos aplicar a condio de primeira ordem / 0 . A nova verso
de
T ()
(7.27) 0 {H [t , y * q (t ), u * p (t ), ] [ y * q (t )]}dt (T ) yT (0) y 0
T () H H dT
(7.28)
0
y
q (t )
u
p (t ) q (t )dt [ H y ]t T
d
dyT d (T ) dT
(7.29) (T ) yT (T )yT yT (T )T
d dT d
[por (7.26)]
Por outro lado, o termo ( 0 ) y 0 na equao (7.27) desaparece na diferenciao. Assim,
y t T
dT
d
(T ) yT T [por (7.26)]
Assim, quando a soma de (7.28) e (7.29) igualada a zero, a condio de primeira ordem
emerge (aps re-ordenamento) como
d T H H
(7.30) q (t ) p(t )dt [ H ]t T T (T )yT 0
d 0 y u
H H
e 0
y u
(T ) 0
Note que apesar do caminho de (t) ter sido anteriormente, na etapa ii, descartado por
no ter efeito no valor do funcional objetivo, ele agora, impressionantemente, volta
condio anterior. Ns vemos que, para o princpio do mximo trabalhar, o caminho (t)
no deve ser arbitrariamente escolhido, mas imposto que ele siga uma equao de
movimento prescrita e que finalize com um valor terminal de zero se o problema tem um
estado terminal livre.
A razo pela qual o problema com um ponto terminal fixo (com ambos, o estado terminal e
o tempo terminal fixos) no se qualifica como um problema bsico na teoria do controle
timo que a especificao de um ponto terminal fixo acarreta uma complicao na noo
de uma curva de perturbao arbitrria p(t) para a varivel de controle u. Se a perturbao
do caminho u*(t) suposta para gerar atravs da equao de movimento y f (t , y , u ) uma
perturbao correspondente no caminho y*(t) que tem que acabar em um estado terminal
pr-estabelecido, ento a escolha da curva de perturbao p(t) no verdadeiramente
arbitrria. A questo ento procede como se ainda pudssemos deduzir legitimamente a
condio H / u 0 de (7.30).
Afortunadamente, a validade do princpio do mximo no afetada por esse
compromisso na arbitragem de p(t). Por simplicidade, todavia, no entraremos em detalhes
para demonstrar esse ponto. Para nossos propsitos, suficiente afirmar que, com um ponto
terminal fixo, a transversalidade substituda pela condio
y (T ) yT ( T , yT dados)
Se o problema tem uma linha terminal horizontal (com um tempo terminal livre mas um
ponto final fixo, significando um estado terminal fixo), ento yT fixo yT 0 , mas
T no ( T arbitrrio). Do segundo e terceiro termos componentes em (7.30), fcil
ver que a condio de transversalidade para esse caso
(7.31) H t T 0
21
A funo Hamiltoniana deve atingir um valor zero no tempo terminal timo. Mas, no
existe restrio sobre o valor de no tempo T.
Curva terminal
H t T T (t ) (T )T H t T T
Segue-se que, para um T arbitrrio, a condio de transversalidade deva ser
(7.32) H t T 0
Agora considere o problema em que o tempo terminal fixo, mas o estado terminal livre
para variar, apenas sujeito a yT y min onde y min denota um dado nvel mnimo
permissvel para y.
Apenas dois tipos de resultados so possveis na soluo tima: y *T y min ou
y *T y min . No primeiro resultado, a restrio terminal automaticamente satisfeita.
Assim, a condio de transversalidade para o problema com um linha terminal vertical
regular usaria
yT = ymin + q(T)
Assumindo que q(T) > 0 sobre a curva de perturbao q(t)9, a exigncia yT y min impe
0. Mas, pelas condies de Kuhn-Tucker, a no negatividade de alteraria a condio
de primeira ordem d / d 0 para d / d 0 no nosso problema de maximizao10. Segue-
se que (7.30) iria gerar agora uma condio de transversalidade de desigualdade
(T ) yT 0
9
Essa hiptese no influencia o resultado final do processo aqui deduzido.
10
As condies de Kuhn-Tucker so explicadas em Alpha C. Chiang, Fundamental Methods of Matematical
Economics, 3ed, McGraw-Hill, New York, 1984, Sc. 21.2
22
Note que a ltima parte desse enunciado representa a familiar condio de folga-complentar
das condies de Kuhn-Tucker. Como no problema similar com uma linha terminal vertical
truncada no clculo das variaes, a aplicao prtica de (7.35) no complicada como a
condio possa parecer. Podemos sempre tentar primeiro a condio (T ) 0 e checar se
o resultante valor de y*T satisfaz a restrio terminal yT y min . Se sim, o problema est
resolvido. Se no, colocamos ento y *T y min para satisfazer a condio de folga-
complementar e tratamos o problema como se fosse um problema com um ponto terminal
dado.
Seja o estado terminal fixo, mas permita o tempo terminal T variar sujeito a restrio T*
Tmax, onde Tmax o valor mximo permitido de T um deadline* pr-estabelecido. Ento,
ns temos T* < Tmax ou T* = Tmax, na soluo do tima.
No primeiro resultado, a restrio terminal no atingida, e a condio de
transversalidade para o problema com uma linha terminal horizontal regular ainda vlido:
*
NT. O termo deadline usual em controle timo no Brasil, seu significado pode ser grosseiramente
traduzido como o instante onde tudo acaba.
23
EXEMPLO 1
1
Maximize V 0
u 2 dt
sujeito a y yu
y (0) 1 y (1) 0
H u 2 ( y u )
H
2u 0
u
1
(7.39) u (t ) (t )
2
H
y
(7.40) (t ) ke t (k arbitrria)
1 t
y y ke
2
Essa uma equao diferencial linear de primeira ordem com um coeficiente varivel e um
1 t
termo varivel, do tipo dy / dt u (t ) y w(t ) - aqui com u(t) = - 1 e w(t ) ke . Via
2
uma frmula padro, sua soluo pode ser encontrada como segue11:
1dt 1
y (t ) e c ke t e dt
1dt
2
1
e t c ke t e t dt
2
(7.41)
1
e t c ke 2t
4
1
ce t ke t (c arbitrria)
4
1 4e 2
c e k
1 e2 1 e2
1 e2
y * (t ) e
t
e t
1 e 2
1 e 2
2
4e 2e 2 t
* (t ) e t
e u * (t ) e
1 e2 1 e2
T=1 y(1) 3
O problema ento aquele com uma linha terminal vertical truncada e a condio de
transversalidade apropriada (7.35). Primeiro tentamos resolver esse problema como se sua
linha terminal vertical no fosse truncada. Se y*(1) torna-se 3, ento o problema est
resolvido; noutros casos, ns refazemos ento o problema colocando y(1) = 3.
1
(7.42) u (t ) (t ) [de (7.39)]
2
(t ) ke t [de (7.40)]
*(t) = 0
Segue-se ento de (7.42) que
(7.44) u*(t) = 0
y y u y [por (7.44)]
y (t ) cet
onde a constante c pode ser definida como c = 1 pela condio inicial y(0) = 1. Assim, o
caminho timo de estado
(7.45) y * (t ) e t
Etapa iv Resta checar (7.45) contra a restrio terminal. No ponto terminal fixo T = 1,
(7.45) nos d y * (t ) e . Isso, infelizmente, viola a restrio terminal y(1) 3. Assim, para
satisfazer a condio de transversalidade (7.35), temos que colocar y(1) = 3 e resolver o
26
problema como um problema com um ponto terminal fixo. Note que tendo a restrio
terminal permanecido T = 1, y(1) 2, ento (7.45) teria sido uma soluo aceitvel.
EXEMPLO 3
T
Maximize V 0
1dt
sujeito a
y y u
y ( 0) 5 y (T ) 11 T livre
e u (t ) [ 1,1]
Esse exemplo ilustra o problema com uma linha terminal horizontal. Mais ainda, ele ilustra
o tipo de problema conhecido como problema do tempo timo, cujo objetivo atingir
algum alvo preestabelecido num montante de tempo mnimo. A natureza de tempo-timo
do problema transmitida pelo funcional objetivo:
1dt t 0 T
T
T
0
(7.46) H 1 ( y u )
1
(7.47) y sgn x y indeterminado se x 0
1
Note que se y uma funo sinal de x, ento y (se determinado) pode tomar apenas um dos
dois valores, e o valor de y depende do sinal (no da magnitude) de x.
Aplicado ao presente problema, essa funo resulta em
27
1
(7.48) u* = sgn ou u*
se 0
1
Mais uma vez, encontramos que necessrio um conhecimento de antes de u poder ser
determinado.
H
y
que integrada d
(7.49) (t ) ke t (k arbitrria)
Nesse resultado, (t), sendo exponencial, pode tomar apenas um nico sinal algbrico o
sinal da constante k. Conseqentemente, excetuando a eventualidade de k = 0 isto (t) =
0 para todo t (o que eventualmente, de fato, no ocorre aqui), u* deve ser determinado e
aderir a um nico sinal qualquer, um nico valor constante em concordncia com a
funo sinal. Por essa razo, ainda que a linearidade do Hamiltoniano na varivel de
controle u resulte numa soluo de fronteira no presente exemplo, ela no produz o
fenmeno bang-bang.
Ocorre que o indicativo para o sinal de k reside na condio de transversalidade
H t T 0 . Usando o H em (7.46), o em (7.49) e a condio terminal y(T) = 11, ns
podemos escrever a condio de transversalidade como
1 ke T (11 u*) 0
Desde que u* ou 1 ou -1, a quantidade (11 + u*) deve ser positiva, como e T .
Entretanto, k deve ser positivo para satisfazer essa condio. Ento segue-se que (t) > 0
para todo t, e que
(7.50) u*(t) = 1
Etapa iii Com u* = 1 para todo t, podemos expressar a equao de movimento da varivel
estado, y y u , como
y y 1
28
Isso se enquadra no formato de uma equao diferencial de primeira ordem com coeficiente
constante e como termo constante, dy / dt ay b aqui com a = -1 e b = 1. Sua soluo
definitiva nos d o caminho timo y12
b b
y * (t ) y (0) e at
a a
(7.51)
6e t 1 [ y (0) 5]
1 ke T (6e T 1 1) 0 ou 6k 1
1
Portanto k . Substituindo ento esse resultado em (7.49) produz o caminho timo
6
1 t
(7.52) * (t ) e
6
Etapa v Os trs caminhos timos em (7.50), (7.51) e (7.52) retratam a soluo completa
par o presente problema exceto para o valor de T*. Para calcul-lo, lembre que o valor do
estado terminal estipulado em y(T) = 11. Disso, em conjunto com o caminho y*(t) obtido
anteriormente, nos diz que 11 6eT 1 ou eT 2 . Consequentemente,
T ln 2( 0,6931)
Os caminhos timos para as vrias variveis so facilmente desenhados. Deixamos isso
para o leitor.
12
A frmula soluo deduzida em Alpha C. Chiang, Fundamental Methods of Mathematical Economics,
3ed. Mc-Graw- Hill, New York, 1984 Sec. 14.1
29
Para ver isso, primeiro vamos examinar a derivada com respeito ao tempo do
Hamiltoniano H (t , y , u , ) no caso geral:
dH H H H H
y u
dt t y u
dH * H *
(7.53)
dt t
Esse resultado vlido em geral, para ambos os problemas autnomos e no autnomos.
No caso especial de um problema autnomo, como t est ausente das funes F e f
como um argumento explcito, o Hamiltoniano tambm no deve conter esse argumento.
Conseqentemente, ns temos H / t 0 , portanto
dH *
(7.54) 0 ou H * constante [para problemas autnomos]
dt
Esse resultado de uso prtico num problema autnomo com uma linha terminal
horizontal. Espera-se normalmente que a condio de transversalidade H t T 0 seja
vlida apenas para tempo terminal. Mas se o Hamiltoniano uma constante na soluo
tima, ento ele deve zero para todo t e a condio de transversalidade pode ser aplicada a
qualquer ponto do tempo.
No exemplo 3, por exemplo, ns acharemos que
H * 1 * ( y * u*) 1
1 t
6
e 6e t 1 1 0
EXERCCIOS 7.4
3. Ns desejamos nos mover do ponto inicial (0,8) no plano ty para alcanar o valor do
estado terminal y(T) = 0 logo que possvel. Formule e resolva o problema,
assumindo que dy / dt 2u , e que o conjunto de controle o intervalo fechado
[-1,1]
4. Ache o caminho do controle timo e o estado timo correspondente que minimiza a
distncia entre o ponto de origem (0,0) e uma curva terminal
y (T ) 10 T 2 , T 0 . Faa um grfico da curva terminal e do caminho y*(t).
5. Demonstre a validade da condio de transversalidade (7.37) para o problema com
uma linha terminal horizontal truncada.
(7.55) H F (t , y, u ) u
Assumindo que essa funo seja diferencivel com respeito a u, podemos listar as seguintes
condies para o princpio do mximo:
H
Fu 0
u
H
y u
(7.56)
H
F y
y
(T ) 0
A primeira equao em (7.56) pode ser re-escrita como Fu . Mas, devido a segunda
equao aqui, ela pode ser re-escrita como
(7.57) Fy
31
d
F y
dt
Entretanto, a terceira equao em (7.56) d uma outra expresso para . Pela igualdade
das duas expresses, terminamos com a simples condio
d
F y Fy 0
dt
2H
Fuu Fy y 0
u 2
[ Fy ]t T 0
F F y
y t T 0
p(%)
Menor
Maior
13
William Nordhauss: The Political Business Cycle. Review of Economics Studies, April 1975, pp. 169
190.
33
onde uma medida do poder dos votos ganhos do partido da situao. As derivadas
parciais de com respeito a cada argumento so negativas, porque altos valores de ambos
U e p conduzem a perda de votos. Esse fato refletido na Fig. 7.6, onde, fora das trs
curvas de isovotos ilustradas, a mais alta associada a um baixo . A noo da curva
isovoto ressalta o fato que, no lado poltico, existe um tradeoff entre as duas variveis U e
p. Se o partido da situao desagrada os eleitores pela produo de uma alta inflao, ele
pode esperar recuperar os votos perdidos via uma reduo suficiente na taxa de
desemprego.
A parte do tradeoff poltico, as duas variveis em considerao tambm so ligadas
uma a outra por um tradeoff econmico via relao de Phillips com expectativas-
aumentadas
(7.59) p (U ) ( 0, 0 1)
(7.60) b( p ) b0
No final das contas, temos agora trs variveis, U, p e . Mas destas, quais devero
ser consideradas como variveis de estado e como variveis de controle? Para uma varivel
qualificar-se como varivel de estado, ela deve vir com uma dada equao de movimento
no problema. Como (7.60) constitui uma equao de movimento para , podemos tomar
como varivel de estado. A varivel U, por outro lado, no vem com uma equao de
movimento. Mas como U pode afetar p via (7.59) e assim dirigir dinamicamente via
(7.60), ns podemos us-la como varivel de controle. Usar U como uma varivel de
controle, porm, requer a suposio implcita de que o governante no poder tem a
habilidade de implementar qualquer taxa alvo de desemprego que ele escolha em qualquer
ponto no tempo. Como para a varivel remanescente, p, (7.59) mostra que seu valor em
qualquer tempo t ser determinado aps os valores das variveis de estado e controle serem
conhecidos. Portanto, no poderemos v-la nem como varivel de estado nem como
varivel de controle, mas, semelhante a , apenas como uma funo das outras duas
variveis.
Suponha que um partido ganhou as eleies no tempo t = 0, e que a prxima eleio est
para acontecer T anos mais tarde em t = T. O partido vencedor tem ento T anos no total
para impressionar os eleitores com suas realizaes (ou com o que possa aparentar ser isto)
e como isso ganhar seus votos. A qualquer tempo do perodo [0,T], o par de valores
realizados de U e p determinaro um valor especifico de . Todos esses valores de , em
diferentes pontos do tempo, devero entrar no funcional objetivo do partido da situao.
Mas, os vrios valores devem ser ponderados diferentemente dependendo do tempo em que
ocorram. Se os eleitores tm uma memria coletiva curta e so mais influenciados por
34
eventos que ocorram prximos ao perodo eleitoral, ento, devero ser atribudos pesos
maiores aos valores de da parte posterior do perodo [0,T] do que queles que vm antes.
Ns podemos ento formular o problema do controle timo do partido da situao como
segue:
T
Maximize
0
(U , p )e rt dt
sujeito a p (U ) a
(7.61)
b( p )
e (0) 0 (T ) livre ( 0, T dados)
(7.62) (U , p ) U 2 hp ( h 0)
(7.63) p ( j kU ) a ( j , k 0,0 a 1)
De (7.62) pode ser visto que as derivadas parciais de so de fato negativas. Em (7.63),
percebemos que relao de Phillips (U ) foi linearizada. Usando essas funes
especficas, e aps substituir (7.63) em (7.62), agora temos o problema especfico:
T
Maximize 0
( U 2 hj hkU ha )e rt dt
(7.64) sujeito a b[ j kU (1 a ) ]
e (0) 0 (T ) livre ( 0, T dados)
35
Maximizando o Hamiltoniano
O Hamiltoniano
(7.65)
H U 2 kj hkU ha e rt b[ j kU (1 a) ]
H
2U hk e rt bk 0
U
1
(7.66) U (t ) k (h be rt )
2
2H
Desde que 2e rt 0 , o caminho de controle em (7.66) de fato maximiza H em
U 2
todo ponto do tempo, como requer o princpio do mximo.
A presena de na soluo de U(t) requer agora uma procura pelo caminho (t).
H
hae rt b(1 a )
b(1 a ) hae rt
14
Veja Alpha C. Chiang, Fundamental Methods of Mathematical Economics, 3ed. Mc-Graw- Hill, New York,
1984 Sec. 14.1 (para funo complementar) e Sec 15.6 (para a integral particular)
36
ha rt
e B r b ab
B
ha rt
(7.67) (t ) c Aeb (1a )t e
B
ha rt
(7.67) * (t ) [e e BT b (1a ) t ]
B
Agora que encontramos *(t), tudo que se tem a fazer substituir (7.67) em (7.66) para
deduzir o caminho do controle timo. O resultado , aps simplificaes,
kh
(7.68) U * (t ) [(r b) bae B (T t ) ]
2B
esse caminho de controle que o partido da situao deve seguir no interesse de sua
reeleio no ano T.
Quais so as implicaes econmicas desse caminho? Primeiro, notemos que U*
uma funo decrescente de t. Especificamente, temos
dU * 1
(7.69) khbae B (T t ) 0
dt 2
porque k, h, b e a so todas positivas, como a expresso exponencial. A poltica
econmica maximizadora de votos , consequentemente, estabelecer um alto nvel de
desemprego imediatamente aps vencer a eleio em t = 0 e ento deixar a taxa de
desemprego cair persistentemente por todo o perodo eleitoral [0,T]. De fato, os nveis
timos de desemprego no tempo 0 e no tempo T podem ser precisamente determinados.
Eles so
kh
U * (0) [(r b) bae BT ]
2B
37
kh kh
U * (T ) [(r b) ba]
2B 2
Note que o nvel terminal de desemprego, kh / 2 uma quantidade positiva. E desde que
U*(T) representa o ponto mais baixo em todo o caminho U*(t), os valores de U* para todos
os valores de t em [0,T] devem ser uniformemente positivos. Isso significa que a estratgia
de no impor restries deliberadamente na varivel U no causa nenhum incmodo
relativo ao sinal de U no presente caso. Entretanto, para ser economicamente significativo,
U*(0) deve ser menor que a unidade ou mais realisticamente, menor que alguma taxa
mxima de desemprego tolervel Umax < 1. A menos que os valores dos parmetros sejam
tais que U*(0) Umax, o modelo necessitar ser reformulado para incluir a restrio
U * (t ) [0, U max ] .
O tpico caminho do desemprego timo, U*(t), ilustrado na Fig 7.7, onde tambm
mostramos que a repetio de padres similares U*(t) sobre sucessivos perodos eleitorais
geram ciclos dos negcios polticos. Entretanto, a curvatura do caminho U*(t) nem sempre
cncava como na Fig. 7.7. Pois, por diferenciao de (7.69) com respeito a t, podemos ver
que
d 2U * 1 B (T t )
(7.70) Bkhbae 0 quando B0
dt 2 2
U*
t FIGURA 7.7
0 T 2T 3T
de p* tende a ser oposto ao de U*. Mas no iremos deduzir o caminho timo da taxa de
inflao aqui.
O leitor est lembrado que as concluses do presente modelo como aquelas de
alguns outros modelos esto intimamente ligadas s suposies adotadas. Em particular,
as formas especficas escolhidas para a funo voto em (7.62) e a relao de expectativas
aumentadas de Phillips (7.63) indubitavelmente exerce uma importante influncia sobre a
soluo final. Suposies alternativas tais como mudana no termo linear - hp em (7.62)
para - hp 2 so provveis de modificar significativamente tanto a soluo U*(t) quanto a
soluo p*(t). Mas tambm provvel que a formulao do problema seja mais
complicada.
EXERCCIOS 7.6
2. Qual valor do parmetro que causa dU * / dt 0 causar tambm U*(t) = 0 para todo
t? Explique as implicaes econmicas e racionais para tal resultado.
3. Como uma mudana no valor do parmetro r (taxa de decaimento da memria do
voto) afeta a inclinao do caminho de U*(t)? Discuta as implicaes econmicas
desse resultado. [Note: B r b b ]
4. Elimine o termo e rt na funo objeto em (7.64) e escreva o novo problema
(a) Resolva o novo problema efetuando os mesmos passos como aqueles ilustrados no
texto do problema original
(b) Verifique seus resultados colocando r = 0 no resultado do modelo original
especialmente (7.68) e (7.69)
Quando uma economia revestida com um recurso que exaurvel, digamos, combustvel
fssil, certamente conveniente a coletividade ser concernente sobre a questo de como a
ofertada limitada do recurso melhor do que ser alocado para uso todo tempo. Discutimos
algumas das controvrsias envolvidas na Sec. 6.3 com o mtodo do clculo das variaes.
Mas, os cidados da mundo atual so tambm intensivamente concernentes quanto
qualidade do meio ambiente em que eles vivem. Se o uso de combustvel exaurvel gera
poluio como um derivado, ento qual o caminho timo do tempo para o uso da
energia? Ilustramos agora como tal questo pode ser includa na teoria do controle timo
com um modelo de Bruce A. Forester15.
15
Bruce A. Forester, Optimal Energy Use in a Polluted Enviroment, Journal of Enviromental Economics
and Management, 1980, pp 321 - 333. Enquanto esse trabalho apresenta trs diferentes modelos, aqui
confinaremos nossa ateno exclusivamente no primeiro deles, que assume uma fonte simples de energia
produzindo um poluente no acumulativo. Outro modelo, tratando poluio como um estoque varivel e
envolvendo duas variveis de estado ser discutido na Sec. 8.8.
39
Denote por S(t) o estoque de combustvel e E(t) a taxa de extrao do combustvel (e uso
da energia) em qualquer tempo t. Ento, temos:
(7.71) S E
O uso de energia, E, possibilita a produo de bens e servios para o consumo, C, que gera
utilidade, mas tambm gera um fluxo de poluio., P, que cria desutilidade. Ao invs de
escrever a funo utilidade simplesmente como U(E), como fizemos na seo introdutria
desse captulo, portanto, nossa funcional objetivo ir conter dois argumentos, C(E) e P(E).
Forester, especifica a funo consumo e a funo poluio como segue:
(7.72) C C (E ) C 0, C 0
(7.73) P P( E ) P 0, P 0
Enquanto o uso da energia cresce a uma taxa decrescente, ela gera poluio a uma taxa
crescente. Nesse modelo particular, poluio assumida por simplicidade ser no
acumulativa; isto , ela um fluxo que dissipa e no forma estoque. Isso exemplificado
pelo tipo auto-emisso de poluio.
A funo utilidade social depende do consumo e da poluio, com derivadas como
segue:
(7.74) U U (C , P ) U C 0, U P 0, U CC 0, U PP 0, U CP 0
T
Maximize 0
U [C ( E ), P ( E )]dt
(7.75) sujeito a S E
e S (0) S 0 S (T ) livre ( S 0, T dados)
Maximizao do Hamiltoniano
A funo Hamiltoniana
(7.76) H U [(C ( E ), P ( E )] E
H
U C C ( E ) U P P ( E ) 0
E
H 2
2
U C (E) UCC UPPP UPP 0
2 CC
2 [por (7.72), (7.73) e (7.74)]
E
O sinal negativo garante que H maximizado.
Para extrair mais informao sobre E de (7.77), portanto, precisamos olhar dentro do
caminho do tempo de . O princpio do mximo nos diz que a equao de movimento para
41
H
0 implicando (t) = c (constante)
S
Em aplicaes prticas desse tipo de condio, o passo inicial colocar (T) = 0 (como se
linha terminal no fosse truncada) para ver com soluo ir trabalhar. Desde que (T)
constante por (7.78), para colocar (T) = 0 realmente colocar (t) = 0 para todo t.
Com (t) = 0 (7.77) se reduz a uma equao numa simples varivel E,
(7.80) U C C ( E ) U P P ( E ) 0
que, em princpio, pode ser resolvido pelo caminho do controle timo. Desde que essa
equao independente da varivel t, sua soluo constante no tempo:
Mais ainda, colocando t = 0 nesse resultado, fcil ver que k representa o estoque inicial de
combustvel S0. Assim, o caminho do estado timo pode ser re-escrito como
(7.82) S * (t ) S 0 Et
42
S*(t)
S*(t)=S0 E*t
E*1 < E*2 < E*3
E*= E*1
Figura 7.8
tende ser como E*1 ou E*2, ento a condio de transversalidade (7.79) adequada e o
problema solucionado. Mas se for como E*3, ento devemos colocar S(T) = 0 e resolver o
problema como se fosse um com ponto terminal dado. Nesse evento, o valor E* pode ser
diretamente encontrado de (7.82) colocando t = T e S(T) = 0:
S0
(7.83) E* 0 [se (7.81)viola S*(T) 0]
T
Exerccio 7.7
43