Você está na página 1de 258

Tópicos de

Mecânica Clássica
Publicações Matemáticas

Tópicos de
Mecânica Clássica

Artur Lopes
UFRGS

impa
Copyright  2012 by Artur Lopes

Impresso no Brasil / Printed in Brazil


Capa: Noni Geiger / Sérgio R. Vaz

Publicações Matemáticas
• Introdução à Topologia Diferencial – Elon Lages Lima
• Criptografia, Números Primos e Algoritmos – Manoel Lemos
• Introdução à Economia Dinâmica e Mercados Incompletos – Aloísio Araújo
• Conjuntos de Cantor, Dinâmica e Aritmética – Carlos Gustavo Moreira
• Geometria Hiperbólica – João Lucas Marques Barbosa
• Introdução à Economia Matemática – Aloísio Araújo
• Superfícies Mínimas – Manfredo Perdigão do Carmo
• The Index Formula for Dirac Operators: an Introduction – Levi Lopes de Lima
• Introduction to Symplectic and Hamiltonian Geometry – Ana Cannas da Silva
• Primos de Mersenne (e outros primos muito grandes) – Carlos Gustavo T. A. Moreira e Nicolau
Saldanha
• The Contact Process on Graphs – Márcia Salzano
• Canonical Metrics on Compact almost Complex Manifolds – Santiago R. Simanca
• Introduction to Toric Varieties – Jean-Paul Brasselet
• Birational Geometry of Foliations – Marco Brunella
• Introdução à Teoria das Probabilidades – Pedro J. Fernandez
• Teoria dos Corpos – Otto Endler
• Introdução à Dinâmica de Aplicações do Tipo Twist – Clodoaldo G. Ragazzo, Mário J. Dias
Carneiro e Salvador Addas Zanata
• Elementos de Estatística Computacional usando Plataformas de Software Livre/Gratuito –
Alejandro C. Frery e Francisco Cribari-Neto
• Uma Introdução a Soluções de Viscosidade para Equações de Hamilton-Jacobi – Helena J.
Nussenzveig Lopes, Milton C. Lopes Filho
• Elements of Analytic Hypoellipticity – Nicholas Hanges
• Métodos Clássicos em Teoria do Potencial – Augusto Ponce
• Variedades Diferenciáveis – Elon Lages Lima
• O Método do Referencial Móvel – Manfredo do Carmo
• A Student's Guide to Symplectic Spaces, Grassmannians and Maslov Index – Paolo Piccione e
Daniel Victor Tausk
• Métodos Topológicos en el Análisis no Lineal – Pablo Amster
• Tópicos em Combinatória Contemporânea – Carlos Gustavo Moreira e Yoshiharu Kohayakawa
• Uma Iniciação aos Sistemas Dinâmicos Estocásticos – Paulo Ruffino
• Compressive Sensing – Adriana Schulz, Eduardo A.B.. da Silva e Luiz Velho
• O Teorema de Poncelet – Marcos Sebastiani
• Cálculo Tensorial – Elon Lages Lima
• Aspectos Ergódicos da Teoria dos Números – Alexander Arbieto, Carlos Matheus e C. G.
Moreira
• A Survey on Hiperbolicity of Projective Hypersurfaces – Simone Diverio e Erwan Rousseau
• Algebraic Stacks and Moduli of Vector Bundles – Frank Neumann
• O Teorema de Sard e suas Aplicações – Edson Durão Júdice
• Tópicos de Mecânica Clássica – Artur Lopes

IMPA - ddic@impa.br - http://www.impa.br - ISBN: 978-85-244-0335-4


Prefácio

O presente livro é uma sequência natural do material apresentado


no texto [Lo] do mesmo autor.
Os primeiros três capı́tulos do texto introduzem conceitos de Te-
oria Ergódica e sua relação com a Mecânica Clássica. Nestes capı́tulos
apresentamos exemplos de sistemas em que aparece o fenômeno KAM.
Como veremos a fundamentação matemática da Mecˆanica Es-
tatı́stica “a la Gibbs” necessita de fato de resultados de Teoria Ergó-
dica como o Teorema de Birkhoff. Referimos [Rue] e [PP] ao leitor
para maiores detalhes sobre este assunto.
Os capı́tulos de 5 a 6 abordam o Formalismo Simplético. Para
se analisar sistemas mecˆanicos de maneira intrı́nseca em variedades
diferenciáveis se necessita deste formalismo. Estes resultados podem
ser generalizados (ver [AM]) para dimens˜ ao infinita e permitem a
análise da equção de Korteg-de Vries, etc...

A equação
Huyghens é o de Hamilton-Jacobi
tema dos capı́tulose 7suaa rela¸ cão com
10. Nesta o Princı́pio
parte do livro de

abordado a rela¸cão entre frentes de onda e raios de luz que foi a
motivação principal para a introdução do ponto de vista hamiltoniano
na Mecânica Clássica.
No capı́tulo 11 (em conjunto com M. Sebastiani) apresentamos
algumas propriedades de integrais oscilantes que permitem o me-
lhor entendimento da ´otica oscilatória (que foi abordado no capı́tulo
10) e que est˜ao também relacionadas com o limite semi-clássico da
Mecânica Quântica.
O apêndice capı́tulo 12 apresenta algumas definições e exemplos
de aplicações de primeiro retorno induzidas em capı́tulos, pontos
periódicos hiperbólicos, elı́pticos, etc... conceitos estes que aparecem
anteriormente no texto.
Referimos o texto [DL] ao leitor para resultados gerais sobre
Equações Diferenciais Ordin´arias que serão aqui utilizados.
Ressaltamos que o livro [FMP] apresenta uma grande quantidade
de material de Mecˆanica Clássica de uma maneira muito elegante e
com muitos detalhes nas demonstra¸cões.
Índice

1. A A¸cão Associada a Bilhares Convexos . . . . . . . . . . . . . . . . . . . . . . . 1

2. O Teorema Ergódico e a Hip´otese de Boltzmannn . . . . . . . . . . . 17

3. A Teoria de Aubry par a Quasi-Cristais e Exemp los do


Tipo KAM .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ..5 3

4. Formas Diferenciais em Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5. Formalismo Simplético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

6. Linhas de Vortex em Mecânica Hamiltoniana ...............140

7. E.D.P: Método das Caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 146

8. E.D.P: Método da Solução Completa .. .. .. .. . .. .. .. .. .. .. .. 162

9. O Princı́pio de Huygens em Mecânica Hamiltoniana . . . . . . . . 176

10. A Equação da Onda .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 199

11. O Método da Fase Estacionária - em conjunto com


Marcos Sebastiani . .. .. .. .. .. .. . .. .. .. .. .. .. .. .. .. .. .. .. .. .207
12. Apêndice: Aplicação de Primeiro Retorno . . . . . . . . . . . . . . . . . 227

Bibliografias .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .2 47
Capı́tulo 1

A Ação Associada a
Bilhares Convexos

Vamos considerar a seguir bilhares determinados por uma curva con-


vexa e sua rela¸cão com fluxos Hamiltonianos. Este exemplo p ossibili-
tará introduzir de maneira natural alguns conceitos b´asicos do ponto
de vista estatı́stico (não determinı́stico) de se entender a mecânica.
Na próxima seção apresentaremos ao leitor os rudimentos da Te-
oria Ergódica. Nos reportaremos a alguns exemplos tratados na pre-
sente seção para ilustrar algumas propriedades que l´a serão descritas.
Considere o movimento livre de uma partı́cula de massa 1 no plano
sujeito à ação do Hamiltoniano
1 2
 
p + p22 .
2 1

Como
linha reta sabemos a trajet´da
e pelo Teorema oria da partı́cula
Conserva¸ cão daseEnergia
dará segundo uma
Total (que
neste caso, é também a Energia Cinética) a velocidade ao longo da

trajetória terá módulo p21 + p22 = c = constante.
Vamos descrever alguns resultados básicos na Teoria dos Bilhares
(ver [CM] e [CRZ]).
Suponha a existência de um recipiente circundando a partı́cula de
tal modo que vai impedir que a partı́cula vá embora para o infinito.

1
2 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Mais precisamente, suponha que exista uma curva infinitamente


diferenciável C de Jordan (sem auto-interceção), que é parametrizada
2
por g : [0, c] → ⊂
C R no sentido anti-hor´ario, g diferenciável e
g(0) = g(c). Considere a condição inicial ( q0 , p0 ) R4 da part´ıcula

de tal modo que q0 esteja contida no interior da regi˜ao D delimitada
pela curva C e que a velocidade inicial p0 seja tal que p0 = 1 (logo
 
por conservação de energia este m´odulo se manterá constante igual a
1 para sempre).
Vamos supor que a regi˜ ao D é estritamente convexa (sem seg-
mentos retos), isto é, que dados dois pontos quaisquer q1 , q2 D, o ∈
segmento de reta unindo q1 a q2 está estritamente contido no interior
da região delimitada por D.
A evolução temporal da partı́cula
(q (s), p(s)) = ( q1 (s), q2 (s), p1 (s), p2 (s))
a partir da condi¸cão inicial ( q0 , p0 ) = (q01 , q02 , p10 , p20 ) R4 será tal que

∈ 2 ∈
cada vez que a trajet´ oria q (s) R , s R colide com a curva C ,
ela reflete de tal modo que o ˆangulo de incidência com a tangente à
curva C seja igual ao ˆangulo de reflexão (ver Figura 1.1).
Desta maneira, se a trajetória for tal que q0 está inicialmente
na parte D interior à curva C , ela jamais sair´a de D. Vamos su-
por também que as reflexões são elásticas, ou seja, n˜ao há perda de
energia. Sendo assim, este movimento estará restrito `a superfı́cie
tridimensional em R4 determinada por p21 + p22 = 1.
Este modelo é uma boa aproximação para o que acontece com as
partı́culas de um gás contido em um recipiente fechado. O problema
em que estamos interessados nesta se¸cão é analisar o que acontece
com a evolução temporal ( q (s), p(s)) de “uma”partı́cula que no tempo
inicial s = 0 est´a exatamente em q0 ∈
D (ou em C ) e com vetor
velocidade p0 . Problemas de ac´ustica também podem ser modelados

por Considere
bilhares. g : [0, c] →
C (c é o comprimento da curva) uma para-
metrização da curva C pelo comprimento de arco, isto é g ′ (t) = 1.  
Vamos supor sem perda de generalidade que a curva C tenha com-
primento igual a 1 (caso contr´ario fa¸ca uma mudança de vari´aveis),
ou seja que c = 1.
Como entre cada batida o movimento é trivial (é descrito por
uma linha reta) podemos simplificar o problema tridimensional (na
3

superfı́cie p21 + p22 = 1) para um problema bidimensional em que


q0 C da seguinte maneira: a p osição inicial ( q0 , p0 ) R4 tal que
∈ ∈
(p10 )2 + (p20 )2 = 1 e q0 = (q01 , q02 ) C , pode ser descrita por ( t, ϕ) onde
∈  π π

t [0, 1] é tal que g(t) = q0 , e ϕ ∈ − 2 , 2 é o angulo
ˆ de p0 com
a normal a C em q0 apontando para dentro de C (ver Figura 1.2).
Por convenção assumimos que ϕ = π/2 corresponde a tangente t

da curva (orientada no sentido anti-hor´ario).
O vetor p0 sempre aponta para dentro da curva C , logo seu ângulo
com a normal (apontando para dentro da curva) varia de π/2 a π/2 −
como foi dito acima.
Por uma questão de conveniência em vez de ϕ, vamos usar a
∈−
variável θ = sin ϕ ( 1, 1).
Segundo a convenção g ′ (t) corresponde a θ = 1. −
Para descrever com mais exatid˜ao a analogia que existe entre o
modêlo do bilhar e propriedades de sistemas hamiltonianos vamos
usar a seguinte nota¸cão, vamos associar t = q e θ = p. Sendo assim,
denotaremos indistintamente t = q = g(t) e também θ = p.
Dada a condição inicial ( t0 , θ0 ), considere a trajet´oria ( q (s), p(s))
(solução do fluxo Hamiltoniano come¸ cando em ( q0 , p0 ) = (t0 , θ0 ))
q (s) ∈ D e ap´os a primeira colis˜ao e respectivo rebote obteremos

(q1 , p1 ), q1 C . Denotaremos por ( t1 , θ1 ) os novos valores obtidos
nas coordenadas ( t, θ) de tal jeito que g(t1 ) = q1 é exatamente o
ponto de C onde a trajet´oria q (s) determinada por ( q (s), p(s)) vai
colidir com C pela primeira vez (ver Fig ura 1.2). O ˆangulo θ1 é
obtido como o valor do seno do ˆ angulo (do vetor refletido) com a
normal (ver Figura 1.2).
O fato de assumir que a curva C é estritamente convexa implica
que T (t0 , θo ) = (t1 , θ1 ) esta bem definida e é continua. Devemos
assumir que a curva é parametrizada por uma função de Classe C 2
para que resulte um difeomorfismo a aplica¸cão de primeiro retorno.
Fica assim, determinado um difeomorfismo

T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1),


onde T (t0 , θ0 ) = (t1 , θ1 ).
A diferenciabilidade do difeomorfismo é C 1 .
Vamos denotar por

E = [0, 1) × (−1, 1)
4 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

a regi˜ao bidimensional em que T vai estar definida. E representa


uma seção transversal (ver se¸cão 12 para considera¸cões gerais sobre
o assunto) na superfı́cie tridimensional p21 + p22 = 1.
Reduzimos assim um problema com tempo contı́nuo em dimensão
3 para um problema de dimens˜ao 2 com tempo discreto, ou seja a
dinâmica temporal para o fluxo φt , t R transforma-se na dinˆamica

temporal para T n , n N, onde T : E ∈→
E é um difeomorfismo. Este
segundo problema, em princı́pio, é mais simples e vai apresentar as
principais caracterı́sticas do primeiro.
Para entender o que acontece com com a evolução temporal φs (q, p),

s R, da partı́cula com posição inicial ( q, p) = (t, θ), q C , basta ∈
saber o que acontece com as sucessivas batidas determinadas por T
em C , ou seja pela ´orbita de ( q, p) = (t, θ) dada por

(t, θ) , T (t, θ) , T (T (t, θ)) , ..., T n (t, θ) ,...,

pois entre cada batid a a trajetória é uma linha reta. A linha quebrada
correspondendo aos v´arios rebotes desta evolu¸cão temporal t R ∈
pode ser facilmente reconstruı́da a partir da informação da ´orbita de
(t0 , θ0 ).
Note que se a fronteira do bilhar for constituı́do por uni˜ao de
curvas diferenciáveis como na Figura 1.4 e 2.1, existir˜ ao singulari-
dades devido aos vértices e isto cria uma pequena dificuldade (que
pode ser eliminada conforme veremos na pr´oxima seção) na definição
de T . Alguns destes bilhares (como o da Figura 2.1) chamados dis-
persores ou de Sinai (ver [Mar] para defini¸ cão), apresentam caos e
podem ser rigorosamente analisados adaptando técnicas de sistemas
hiperbólicos da Teoria dos Sistemas Dinâmicos e Teoria Ergódica (ver
Ro[1]). Os bilhares analisados aqui são focalizadores (em oposição aos
dispersores) e também podem exibir como veremos em alguns casos
comportamento caótico mas para sua an´alise rigorosa as técnicas em-
pregadas são de natureza distinta (e na verdade mais difı́cil) do que
as utilizadas no caso dispersor.
Bilhares são os exemplos naturais mais simples em que se observa
caos (ver Figura 2.2).
Para o leitor familiarizado com a teoria geométrica das equações
diferenciais ordin´arias (ver [LL] e [So]) esclarecemos que o procedi-
mento acima (tomar a itera¸cão do difeomorfismo T em vez do fluxo
5

Figura 1.1:

φt ) é similar a tomar uma seção de Poincaré (global) para uma


equação diferencial. Neste sentido, a aplica¸cão T pode ser enten-
dida da seguinte maneira. O movimento do bilhar se d´a na regi˜ao
invariante tridimensional p21 + p22 = 1. A regi˜ao E (seção transversal
de acordo com a se¸cão 12) vai ser constituı́da pelos pontos da forma
(q, p) onde q está na curva C (bordo de D) e p é um vetor de norma
1 em q e apontando para dentro da curva C .
Dada uma condi¸cão inicial em E , a aplica¸cão T vai determinar o
primeiro retorno (seguido de uma simetria do ˆ angulo de incidência
com a normal `a curva) da trajet´oria (que se desloca na regi˜ao tridi-
mensional) à seção transversal E (ver Figura 1.5).

Observação 1.1. Note que em geral se come¸carmos com uma con-


diç˜ao inicial (q0 , p0 ), e denotando por (pn , qn ) = T n (q0 , p0 ), se se-
guirmos os iterados (qn , pn ), tentando prever exatamente onde ele
vai estar no tempo (digamos) 1000, (isto é, qual o valor exato de
(q1000 , p1000 )) enfrentaremos sérias dificuldades. Um pequeno erro

na aproximaç˜
e assim ao do valor
por diante, exato
fazendo com de que 1 ) se propaga para (q2 , p2 )
(q1a, pprevis˜ao do valor exato de
(q1000 , p1000 ) seja bastante difı́cil. O ponto de vista acima descrito
pode ser entendido como o ponto de vista determinı́stico. Para o tipo
de problema que estamos considerando (bilhares em regi˜oes convexas)
ser´a melhor analisar a quest˜ao do ponto de vista da an´alise estatı́stica
das trajet´orias. Para isto se r´a necess´ario mostrar que T preserva
´area, o que vai ser feito a seguir.
6 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Notação: Como estamos identificando t com q = g(t) (para sim-


plificar a nota¸cão), denote

 − q  = S (q, Q)
S (q0 , q1 ) = q0 1

(ou alternativamente


S (t0 , t1 ) = g(t0 ) − g(t ), 1

onde g(t0 ) = q = q0 , g(t1 ) = q1 = Q) o comprimento do segmento


ligando q0 a q1 . Como D é estritamente convexo, este segmento está
inteiramente contido em D.
∂S (q0 ,q1 )
Proposição 1.1. Seja (q1 , p1 ) = T (q0 , p0 ). Para q0 fixado, ∂q 1 =
−p1 .

Demonstração: Como sabemos d<z(t)dt, z(t)> = 2 < z ′ (t) , z(t) >,


então usando a nota¸cão descrita acima onde q0 = g(t0 ) e q1 = g(t1 )

∂S (q0 , q1 ) = d < g(t1 )


∂q 1
 − g(tdt) , g(t ) − g(t ) > =
0
1
1 )

1 ′
g(t ) − g(t ) < g (t ) , g(t ) − g(t ) > .
1 0
1 1 0


Como g (t ) = 1 por hip´otese, usando a express˜ao
1

< u, v > = uv  cos (ângulo formado por u e v),

obtemos que ∂S (∂q q0 ,q1 )


1
é o cosseno do ângulo entre ( g(t1 ) g(t)) e −

g (t1 ), ou seja é igual ao cosseno do ângulo de incidência da partı́cula
em g(t1 ) com a tangente g ′ (t1 ) neste ponto. Como p1 = θ1 = sin φ1
édSo(q0seno
,q1 ) do ângulo com a normal ap´ os o rebote, concluı́mos que
dq1 − = p1 .
A troca de sinal é devido ao ângulo refletido. 

Analogamente pode se mostrar que para q1 fixado ∂S (∂qq0 ,q1 )


0
= p0 .
Sendo assim S define uma transforma¸cão que preserva ´area. Seguirá
do que foi descrito acima que:
7

Figura 1.2:

Proposição 1.2. Fixe dois pontos q1 e q3 em C e considere A(q ) =


A(t) a funç˜ ∈
ao de t = q [0, 1) (estamos usando a nota¸c˜ao, de iden-

tificar g(t) = q C ) tomando valores reais, tal que para todo valor
q C,∈
A(q ) = S (q1 , q ) + S (q, q3 ) = q1  − q  +  q − q . 3

Ent˜ao, é equivalente dizer que A(q ) = S (q1 , q ) + S (q, q3 ) tem um


ponto cr´ıtico em q2 e dizer que a trajet´ oria do bilhar em D, sai de
∈ ∈
q1 , colide a seguir com C em q2 C e finalmente bate em q3 C .
∂S (q1 ,q2 )
Demonstração: Pela última proposi¸cão, ∂q 2 = −p .
2 De
∂S (q2 ,q3 )
maneira análoga se pode mostrar que = p2 .
∂q 2
Sendo assim, a partir do que vimos na ´ultima proposição, a condi-
ção da igualdade do ˆangulo de incidência e o ângulo de reflexão entre
os segmentos q1 , q2 e q2 , q3 no ponto q2 é equivalente a dizer que q2
satisfaz
∂S (q1 , q ) ∂S (q, q3 )
+ = 0.
∂q ∂q
Esta última condição, por sua vez, é equivalente a A(q ) ter q2
como ponto crı́tico. 

A conclusão é que (q1 , p1 ) = T (q0 , p0 ) satisfaz as equa¸cões


∂S (q0 , q1 )
= p0
∂q
e
∂S (q0 , q1 )
∂q 1
= −p .1
8 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.3:

Um cálculo fácil permite obter que

∂ 2 S (q0 , q1 ) p0 p1
= >0
∂q 0 ∂q 1 S (q0 , q1 )
ou seja,
∂ 2 S (t0 , t1 ) Senθ0 Senθ1
= >0
∂t 0 ∂t 1 S (t0 , t1 )
Mais tarde retornaremos a analisar esta express˜ao. Note que po-
demos tomar também S (q, Q) = − − 
q Q sem que alteremos em
nada o que foi descrito acima, apenas fazendo com que

∂ 2 S (q0 , q1 )
< 0.
∂q 0 ∂q 1
Mais tarde analisaremos transforma¸cões T obtidas a partir de S
e que satisfazem a ´ultima expressão acima.
Como vimos no Capı́tulo 3 [L], se T (q0 , p0 ) = (q1 , p1 ) é obtido
através de uma aplicação geradora de mudan¸ca de coordenadas
2
S (q0 , q1 ) tal que ∂ ∂q
S (q0 ,q1 )

0 ∂q 1
= 0 como acima, ent˜ao T preserva área.
Note que foi necess´ario usar as coordenadas θ = sin ϕ e não ϕ para
obter que T : E → E preserva área.
Logo, para tal T vale que para qualquer aberto A, os conjuntos
A e T (A) tem a mesma ´area.
9

Figura 1.4:

Definição 1.1. A aplicaç˜


ao q1  − q = S (q, q ) : [0 , 1] × (−1, 1) → R
1
é denominada Aç˜ao associada ao bilhar definido pela curva C .

Uma conclusão que podemos obter do fato acima demonstrado


é que todos os pontos do bilhar são n˜ao errantes (ver Defini¸cão 5,
Capı́tulo 3 [L]). Isto segue de imediato do fato que T preserva área e
do Teorema de Poincaré (Teorema 5, Capı́tulo 3).
O Exemplo 13, Capı́tulo 1 [L], constitu´ ıdo por duas partı́culas
colidindo num intervalo, pode ser transformado num problema sobre
trajetórias no bilhar triangula r. A demonstração que a aplica¸cão no
bordo do bilhar preserva ´area também pode ser aplicada a tal bi-
lhar. Concluimos portanto que no caso do sistema de duas partı́culas
colidindo num intervalo, todos os pontos s˜ao não errantes.
O fato do difeomorfismo T do bilhar convexo preservar área, per-
mitirá também usar técnicas probabil´ısticas na an´alise das trajet´orias
do sistema mecânico em considera¸cão. Estes resultados serão apre-
sentados na próxima seção.
O resultado acima, sobre conserva¸cão de ´area é verdadeiro para
uma grande classe de inter essantes e diferentes tipos de bilhares. A
evolução das trajetórias do bilhar vai depender no entanto de maneira
essencial da forma da curva C . Vamos mostrar isto através de alguns
exemplos.
10 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.5:

Definição
T se V (q, p)1.2. Dizemos
é cont´
ınua e constante →
que V : E ao longo
R é uma integral
das orbitas
´ Tprimeira
n
(q0 , p0 ) de
=
(qn , pn ).

×−
A existência de tal V : [0, 1) ( 1, 1) → R implica na existência
de uma integral primeira Ṽ para φt em p21 + p22 = 1. Isto ocorre
porque, o sistema a tempo contı́nuo φt na superfı́cie tridimensional
p21 + p22 = 1, é obtido a partir de T apenas acrescentando retas ligando
×−
x a T (x). Cada curva invariante em [0 , 1) ( 1, 1) determina por-
tanto uma superfı́cie bidimensional invariante para φt na superf´ıcie
tridimensional em p21 + p22 = 1.

Exemplo 1.1. O cı́rculo. Considere C um cı́rculo de raio 1. Em vez


da
usarparametrizaç˜ ao do0cı́rculo
as coordenadas ≤ por (cos 2πt, senao2πt
s < 2π para a posiç˜ − ≤ ≤≤
), 0 t 1 vamos
q e π/2 ϕ < π/ 2
para o ˆangulo com a normal. No caso do cı́rculo é f´acil ver que

S (q, Q) = S (s0 , s1 ) = 2 sen ((s1 s0 )/2).

Por propriedades elementares de geometria o ˆ angulo ϕ não va-


ria ao longo de uma ´ orbita e T é dado por T (s0 , ϕ0 ) = (s1 , ϕ1 ) =
(s0 + 2ϕ0 , ϕ0 ) É fácil ver que se a condi¸ cão inicial for ( s0 , ϕ0 ) =
11


(q0 , p0 ) [0, 2π) ( π/2, π/2), então para todo n, T n (q0 , p0 ) =
×−
(qn , pn ) é tal que pn = p. Sendo assim se plotarmos v´arias trajetórias
{(q, p), T (q, p), T 2 ,...,T n (q, p) , onde ( q, p) são diferentes condi¸cões
}
iniciais, obteremos uma decomposição do espa¸co de fase ( q, p) ∈
×−
[0, 2π) ( π/2, π/2), da forma apresentada na Figura 1.7.
Logo, a fun¸cão V (q, p) = p (ou seja V (s, ϕ) = ϕ) é constante ao
longo de cada ´orbita. Portanto, tal V é uma integral primeira do
bilhar.
Como T (s0 , ϕ0 ) = (s0 + 2ϕ0 ), φ0 ) considere apenas a a¸cão de T
na primeira ordenada g(s0 ) = s0 + 2ϕ0 (mod 1 ). Se 2 ϕ0 for da
forma racional vezes 2 π é fácil ver que todo ponto s0 será periódico.
Caso 2ϕ0 for da forma irracional vezes 2 π então, conforme a pr´oxima
seção, ocorre que para qualquer s0 fixado a ´orbita g j (s0 ), j > 0 será
densa em [0, 1). Neste ´ultimo caso, naturalmente, não existem órbitas
periódicas.
Sendo assim, concluı́mos que a dinâmica da evolu¸cão temporal
de T n (s0 , ϕ0 ) fica completamente entendida e de acordo com a Fi-
gura 1.5. Se quisermos podemos mud ar novamente coordenadas e
considerar alternativamente o problema nas coordenadas T n (t0 , θ0 )
obtendo os resultados an´alogos. Optamos p elas coordenadas ( s, ϕ)
apenas porque as f´ormulas de T e S neste caso ficam mais simples.

Exemplo 1.2. A elipse. Tomando v´arias condiç˜ oes iniciais (q, p) ∈


×−
[0, 1) ( 1, 1) diferentes e tomando as correspondentes ´orbitas
n
{(q, p), T (q, p),...,T (q, p),... }
obteremos uma decomposi¸c˜ao do espaço de fase (q, p) ∈ [0, 1)×(−1, 1)
da forma apresentada na Figura 1.7.

A função
V (q, p) = q 2
−−ǫ cos ν
2
ǫ cos ν 2
1 2 2

(onde ǫ é a excentricidade da elipse e ν é o angulo


ˆ de p com o eixo dos
x), por sua vez, é constante ao longo das órbitas do bilhar na elipse.
Um exame das curvas de nı́vel de tal G nos determina a Figura
que 1.7 descreve ´orbitas associadas a diversas condi¸cões iniciais. Da
mesma maneira como no cı́rculo algumas curvas de nı́vel serão tais
12 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.6:

que as órbitas de condi¸cões iniciais sobre elas ser˜ao densas nela e em


algumas outras curvas tal n˜ao ocorre.
É possı́vel mostrar também que em algumas curvas de nı́vel o tj
de (tj , θj ) = T (t0 , θ0 ), j > 0 explora densamente on intervalo [0 , 1] e
em outras não; a Figura 1.7 e 1.8 ilustra tal fato.
×−
A existência de tal V : [0, 1) ( 1, 1) →R por sua vez implica na
existência de uma integral primeira Ṽ para φt em p21 + p22 = 1. Por-
tanto, da mesma maneira como no caso do cı́rculo, obtemos neste caso
uma integral primeira para o sistema a tempo contı́nuo associado.
Exemplo 1.3. O ovo (ver Figur a 1.8). Tomando v´arias condiç˜ oes
iniciais (q, p) diferentes e tomando as correspondentes ´orbitas

{(q, p), T (q, p),...,T n (q, p) }


obteremos uma decomposi¸ c˜ao do espaço de fase da forma apresentada
na Fig ura 1.8. Note que mesmo que a elipse e o ovo tenham for -
mas semelhantes, o espa¸co de fase do bilhar com fronteira dada pelo
ovo apresentado na Figura 1.8 é bastante diferente dos dois exem-
plo anteriores. Este sistema, aparentemente pelo que mostra a Fi-
gura 1.8 n˜ao existe fun¸c˜ao contı́nua V (definida em todo E e n˜ao
13

constante) que seja constante em cada ´orbita T n (x), n { ∈ N} para



cada x = (q, p) E .

O Exemplo 1.3 (ver Figura 1.8) mostra uma combina¸cão de com-


portamentos distintos (dependendo da órbita ou seja da condi¸cão ini-
cial escolhida); existe uma evidência numérica que existem algumas
curvas invariantes por T e também regiões bidimensionais invariantes
por T (que não são união de curvas invariantes conforme Figura 1.8).
Neste caso aparece o que se convenciona chamar de ilhas KAM e
que será analisado mais tarde no texto.
Nas curvas invariantes que aparecem na figura podem haver órbitas
periódicas, trajetórias com ´orbita densa, etc...

Exemplo 1.4. O est´adio circular é o bilhar tal que a curva C tem


a forma apresentada na Figura 1.4. E´ constituı́do por duas retas
paralelas com comprimento l > 0 e por duas metades de um cı́rculo.

Tomando apenas “uma certa”condi¸cão inicial ( q0 , p0 ) e plotando


a órbita de ( q, p) até ordem n=999, isto é, plotando o conjunto
999
{(q, p), T (q, p),...,T (q, p) }
obtemos Figura 1.7 (figura da direita). A ´orbita T j (q0 , p0 ), j ∈
{ }
1, 2,...,n parece se distribuir de maneira uniforme sobre E , isto
é o número de j ∈{
1, 2,...,n − }1 em um aberto qualquer fixado A
dividido por 1000 parece ser proporcional a ´area de A.
Note que podem existir ´orbitas no est´adio circular que n˜ao tem
o comportamento acima descrito: por exemplo ´orbitas periódicas de
perı́odo dois como aparece na Figura 1.6.
Na verdade para a ”maioria”das condi¸cões iniciais ( q0 , p0 ) as ´or-
bitas no est´adio circular T j (q0 , p0 ) terão uma distribui¸cão uniforme
como no caso
da palavra da Figuraa1.7
”maioria”ser´ um (figura da direita).
dos objetivos da pr´ Explicar o sentido
oxima seção. Este
exemplo será um dos assim chamados sistemas erg´odicos.

Observação 1.2. Note que o comportamento da trajet´oria T n (q, p)


neste ´ultimo Exemplo 1.4 é totalmente distinto dos dois primeiros
Exemplos 1.1 e 1.2, onde cada trajet´oria esta confinada a uma curva
(um conjunto unidimensional) por causa da integral primeira V .
14 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.7: Espa¸co de fase respectivamente do cı́rculo, elipse e esta-


dium.

O comportamento descrito pelo Exemplo 1.4 mostra uma situação


que é também diferente do Exemplo 1.3. No presente caso a tra-
jetória T n (x), x [0, 1) ( 1, 1) de um ponto escolhido ao acaso no
∈ ×−
Exemplo 1.4 parece tentar explorar toda a regi˜ ao bidimensional E .
Mais precisamente, a ´orbita T n (x) tenta ocupar densamente todo
{ }
o espaço E = [0, 1) ( 1, 1) e neste caso, n˜ao parece existirem curvas
×−
invariantes para tal T em E .
Este último bilhar Exemplo 1.4 é o protótipo de um sistema
ergódico (os Exemplos 1.1, 1.2 e 1.4 n˜ ao o s˜ao) conceito que ser´a
tornado preciso na pr´oxima seção.
Para finalizar algumas considera¸cões gerais sobre bilhares.
Observação 1.3. Generalizando o que foi afirmado na Proposi¸c˜ ao
1.2 é f´
acil ver que se q0 , q1 , q2 ,...,q n s˜ao sucessivas batidas em C de
uma ´orbita T j (q0 , θ0 ) ent˜ao para q0 , qn fixos a fun¸c˜ao
A(x1 , x2 ,...,x n−1 ) = S (q0 , x1 ) + S (x1 , x2 ) + ... +
+ S (xn−2 , xn−1 ) + S (xn−1 , qn )

A : E n−1 → R tem (q1 , q2 ,...,q n−1 ) como ponto crı́tico. Temos assim
uma vers˜ao a tempo discreto do princı́pio mı́nima a¸ c˜ao. Esta propri-
edade ser´a analisada posteriormente com mais detalhe e também em
outros casos similares.
Note que para bilhares focalizadores (como descritos acima) se
|| − ||
em vez de considerarmos S (q0 , q1 ) = q0 q1 tomarmos S (q0 , q1 ) =
−|| − ||
q0 q1 determinaremos também uma T que descreve a dinˆamica
15

Figura 1.8: O ovo e seu espa¸ co de fase.

do bilhar (troca apenas a orienta¸ cão da curva). A condição obtida


2 2
S (q0 ,q1 ) S (q0 ,q1 )
antes ∂ ∂q 0 ∂q 1
> 0 neste ´ultimo caso troca para ∂ ∂q 0 ∂q 1
< 0. No
|| − ||
caso S (q0 , q1 ) = q0 q1 a condição de mı́nimo para A da observação
acima significa obter trajetórias com mı́nimo comprimento. No outro
caso o princı́pio de mı́nima ação determina trajet´orias com m´aximo
comprimento.
Para bilhares dispersores (ver Figura 2.1) podemos também consi-
|| − ||
derar S (q0 , q1 ) = q0 q1 ou S (q0 , q1 ) = −|| − ||
q0 q1 correspondendo
∂ 2 S (q0 ,q1 ) ∂ 2 S (q0 ,q1 )
respectivamente a ∂q 0 ∂q 1 < 0 e ∂q 0 ∂q 1 > 0 (observe a troca de
sinal em compara¸cão com o caso focalizador).
O bilhar descrito pela Figura 2.1 em que o bordo do bilhar é
constituı́do por uma série de curvas diferenciáveis com a concavidade
para fora (que fazem um ˆangulo não nulo nas interceções) é conhecido
como bilh ar de Sina i. Pode-se mostrar que o espa¸co de fase neste
caso é semelhante ao do caso do estadium, isto é, tomando um ponto
inicial ( q0 , p0 ) fixado no bordo, os iterados ( qn , pn ) = T n (q0 , p0 ) se
distribuem de maneira uniforme no espaço de fase. Referimos o leitor
a [Si], [Ma] e [Ta] para resultados gerais sobre o assunto.
Alguns tipos diferentes de bilhares s˜ao analisados em [S] e [LS.]
16 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

A conclus˜ao a que chegamos ao fim desta se¸ cão é que mesmo


para um campo Hamiltoniano sem energia potencial, a dinˆamica da
evolução temporal do sistema mecˆ anico associado pode ser muito
complexa, se assumirmos a existência de um recipiente contendo a
condição inical e com a qual a trajet´ oria do sistema colide elastica-
mente.

Exercı́cios
1. Mostre que V (q, p) = p do Exemplo 1.1, é constante ao longo
das trajetórias do bilhar no cı́rculo.
2 2 2
2. Mostre que V (q, p) = q1−−ǫǫ2 cos
cos ν
2 ν do Exemplo 1.2, é constante
ao longo das trajet´orias do bilhar na elipse.
Capı́tulo 2

O Teorema Ergódico e a
Hipótese de Boltzmann

Nesta seção vamos apresentar de maneira suscinta o Teorema Ergódico


e algumas de suas conseq¨uências. Primeiramente vamos apresentar o
Teorema Ergódico com tempo discreto e mais para o fim desta se¸cão
o Teorema Ergódico com tempo contı́nuo.
Informamos ao leitor que o objetivo da presente se¸ cão é apenas
apresentar idéias e descrever resultados interessantes. Referimos para
os excelentes textos [M] e [KH] para a fundamenta¸ cão matemática
rigorosa do que segue abaixo. O autor do presente livro esc reveu
também notas [L2] onde estes tópicos s˜ao apresentados com todo
rigor matemático.
Ao fim da presente se¸ cão, o Exemplo 2.15 é um dos mais im-
portantes deste texto . Neste exemplo, mostraremos que sob certas
condições, vale a hip´otese de Boltzmann (ver considera¸cões a seguir)
em torno de um ponto de equilı́brio de um sistema integrável.
Como vimos anteriormente quando analisamos o bilhar na Se¸ cão
1, o entendimento do comportamento das ´orbitas do fluxo Hamilto-
niano
H (q1 , q2 , p1 , p2 ) = p21 + p22
restrito a um recipiente delimitado por uma curva C (na qual exis-

17
18 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

te um rebote quando a ´ orbita colide com a curva) pode ser obtido


pela iteração de uma aplica¸cão T induzida em uma se¸cão transversal
bidimensional E (pelo primeiro retor no). Vamos apresentar um re-
sultado matemático que vai possibilitar entender melhor a evolu¸cão
temporal de tal sistema mecˆanico. Lembre que o difeomorfismo T
induzido pelo bilhar em C preserva área, pois é obtido através de
uma aplicação geradora S (ver Proposi¸cão 1.2 e Lema 11.1, Capı́tulo
3 [L]).

Definição 2.1. Uma probabilidade P definida em um conjunto aberto


X do Rn é uma lei que associa a cada subconjunto A X um valor


P (A) [0, 1].
Uma probabilidade deve satisfazer também as seguintes proprie-
dades:
∅ ∅
1) P ( ) = 0 ( é o conjunto vazio)
2) P (X ) = 1.
∪ 
3) P ∞ Ai =
∞ P (A ) se os conjuntos A forem todos
i=1 i=1 i i

disjuntos. 
Na Seção 10 do Capı́tulo 3 (ver Exemplo 51 em [L]), introduzimos
um caso parti cular de probabilidade. Outras ser˜ao consideradas a
seguir.

Observação 2.1. N˜ ao dissemos nada a respeito da classe de subcon-


juntos A de X onde est´a definido tal probabilidade P .
P precisa ser definida numa sigma-algebra (ou seja, uma cole¸ c˜ ao
F
de conjuntos tal que
a) X ∈F,
b) se A ∈F ent˜ao X A − ∈F
e c) para toda coleç˜ao enumer´avel An vale que n An ).
∈F ∪ ∈F
Para não entrar em detalhes técnicos, vamos apenas esclarecer
que muitas vezes que nem todos os subconjuntos A terão um valor de
probabilidade P (A). Felizmente, os conjuntos A que tem importância
no desenvolvimento que segue ter˜ao sempre um valor bem definido
de probabilidade. O leitor interessado na formalização matemática
de tais conceitos, que envolvem Teoria da Medida, sigma-´ algebras,
19

Figura 2.1:

etc..., podem encontrar uma ´otima exposição do assunto em [Fe] e


[Rud].
A classe de subconjuntos A que vamos necessitar utilizar aqui
(e que ter˜ao um valor bem definido de probabilidade) incluem entre
outros os abertos com bordo diferenci´avel por partes.
Nosso ponto de vista aqui será apenas dar uma idéia dos conceitos
principais sem entrar em detalhes matem´aticos mais sofisticados.
Vamos descrever brevemente agora que tipo de probabilidades P
vamos considerar a seguir.
n
Considere X ⊂
R , subconjunto aberto limitado com o bordo
constituido por uma curva diferenci´ avel por partes, e uma fun¸ cão
continua não negativa ψ definida em X , tal que
 ψ(x)dx =
 ψ(x)dx1 dx2 ...dxn = 1.
X X

Se A for um conjunto aberto A ⊂


X com o bordo definido por
uma curva diferenci´avel por partes, utilizando a defini¸ cão usual de

integral do Cálculo a várias variáveis, A ψ(x)dx existe e vamos definir
20 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

Figura 2.2:

a probabilidade P = Pψ sobre conjuntos A desta forma por P (A) =


A ψ(x)dx.
É fácil ver que P satisfaz as leis 1) 2) 3) da Defini¸ cão 2.1 acima,

para a coleção dos abertos A X com bordo diferenciável por partes
(e suas uniões contáveis).
Desta maneira obtemos a partir de ψ uma probabilidade P = Pψ
definida em X associando valores P (A) a subconjuntos abertos A de
X com bordo diferenci´avel por partes.
  b b
× × ×
Por exemplo, para um paralelepı́pedo B = (a1 , b2 ) (a2 , b2 ) ...
(an , bn ) X Rn , obteremos que P (B) = a11 ... ann ψ(x)dx1 ...dxn .
⊂ ⊂
As probabilidades P que estaremos interessados nesta seção serão
sempre do tipo acima descrito P = Pψ . ψ será denominada densidade
da probabilidade P = Pψ . Se ψ é constante diremos que Pψ é a
“probabilidade uniforme”em X . Neste caso,

área de A
P (A) = .
área de X
Fixada uma probabilidade P , a classe de conjuntos A ⊂ X so-
bre os quais necessitamos definir o que seria a probabilidade P (A),
21

Figura 2.3:

no entanto, deve ser maior do que a classe dos abertos com bordo
diferenciável por part es. Será necessário por exemplo, no Teorema
Ergódico, falar sobre certos conjuntos A que não s˜ao abertos, mas
tem relevância no entendimento da evolu¸ cão temporal do sistema.
Estes conjuntos serão denominados de conjuntos de probabilidade
total.
Muitos dos resultados que apresentaremos a seguir valem para
probabilidades mais gerais P (não s´o do tipo Pψ ), mas para n˜ ao
entrarmos em problemas técnicos desnecessários, vamos considerar
apenas probabilidades deste tipo.
Definição 2.2. Dada uma probabilidade P em X , dizemos que um
conjunto A X Rn tem probabilidade zero para P se para qualquer
⊂ ⊂
ǫ existe uma sequência de paralelep´
n ∞ 

ıpedos Bi , i ∈
N contidos em

X R tal que A ⊂∪ i=1 Bi e i=1 P (Bi ) < ǫ.

Para conjuntos A deste tipo, ser´a verdade que P (A) = 0 (ver [Fe]
e [Rud]).
O critério de mostrar que um certo conjunto tem probabilidade
zero, mostrando que satisfaz a Defini¸cão 2.2 é extremamente útil.
Exemplo 2.1. Considere a probabilidade uniforme em [0, 1], que

atribui probabilidade b a para todo intervalo [a, b] ⊂ [0, 1]. Para

esta probabilidade o conjunto dos racionais em [0, 1], isto é Q [0, 1]
(ou qualquer conjunto enumer´avel) tem probabilidade zero. Isto segue
22 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

do fato que, dado ǫ, os conjuntos da forma Biǫ = Bi , i ∈N


Bi =
∈
| | − q | < 12 2ǫx [0, 1] x i
 
i

cobrem Q, onde q ∈ Q∩[0, 1], i ∈ N é uma enumeraç˜ao dos racionais


i

em [0, 1]. Note que o comprimento total coberto pela uni˜ao dos B , i ∈ i
N, é menor que ǫ qualquer dado.
Dada a probabilidade P = Pψ em X , a integral de uma fun¸cão ϕ : 
X → R com respeito a P , é por definição X ϕ(x)ψ(x)dx, expressão

que é denotada por ϕ(x)dP (x). 
Dado um conjunto A vale sempre que IA (x)dP (x) = P (A) 
 Se P é a probabilidade uniforme em X , então ϕ(x)dP (x) =
ϕ(x)dx
área de X .
X

Exemplo 2.2. Conjuntos de probabilidade zero aparecem natural-


mente na Teoria das Séries de Fourier. Suponha que duas funç˜oes f
e g s˜ao iguais em todos os pontos do intervalo [0,1], menos num con-
junto A de probabilidade uniforme1 0 (no qual
1 podem eventualmente
 
ser distintos), sendo assim, 0 f (x)dx = 0 g(x)dx. Este fato segue
facilmente da definiç˜ao de integral (ver [Li1] e [Fe]). Concluı́mos
ent˜ao que duas fun¸c˜oes que diferem apenas num conjunto de medida
zero tem a mesma integral com respeito a dx.
Como as fun¸cões f (x)ei2πxn e g(x)ei2πnx também são iguais em
todos os pontos do intervalo (0 , 1), menos num conjunto A de proba-
bilidade 0, ent˜ao
 1
f (x)ei2πxn dx =
 1
g(x)ei2πnx dx.
0 0

Logo as duas fun¸cões f e g como acima possuem a mesma série


de Fourier, porque possuem os mesmos coeficientes de Fourier:
1
 1
f (x)e i2πxn
dx =
1
 1
g(x)ei2πxn , n
∀ ∈ Z.
2π 0 2π 0

A recı́proca também é verdadeira: duas funções que tem todos os


coeficientes de Fourier iguais s˜ao iguais a menos de um conjunto de
probabilidade dx nula.
23

Logo, a Série de Fourier, não distingue uma f e g que são iguais


a menos de um conjunto de probabilidade uniforme zero.

×
Exemplo 2.3. Seja X = [0, 1] [0, 1]. Se P (A) = ´ area de A, para
⊂ ×
cada A [0, 1] [0, 1] (esta probabilidade como vimos antes é cha-
mada de uniforme), ent˜ao um conjunto tem probabilidade zero para
P , se puder ser coberto por uni˜oes de retˆangulos tal que a soma das
´areas destes retˆangulos pode ser tomada arbitrariamente pequena.

Exemplo 2.4. Considere em X = [0, 1] o conjunto A obtido da se-


guinte maneira. Primeiro retire o terço central do intervalo [0,1],
a seguir retire dos dois intervalos que sobraram os ter¸ cos do meio.
Obteremos assim 4 intervalos. Retire novamente de cada um dos
4 intervalos os ter¸cos médios e prossiga assim indefinidamente. Na
etapa n teremos ao todo 2n intervalos disjuntos. O conjunto que sobra
deste procedimento de retirar infinitamente terços dos intervalos que
v˜ao sobrando, é mostrado de maneira aproximada na Figura 2.3. Este
conjunto é denominado conjunto de Cantor. Considere a probabili-
dade P tal que
O conjunto P ([a, b])tem
de Cantor − a para qualquer
= bprobabilidade 0 paraintervalo
tal P . [a, ⊂ [0, 1].
b] provar
Para
isto, basta cobrir o conjunto de Cantor por uni˜ ao de intervalos tal
que a soma dos intervalos é arbitrariamente pequena.

Note que os 2 n intervalos que restam do procedimento na etapa


n
n, contem C e tem soma total dos comprimentos igual a 2 n 13 . Como
2n
3 converge a zero, ent˜ao o conjunto de Cantor tem probabilidade
zero em [0,1] para a probabilidade uniforme.
O conjunto de Cantor não é um conjunto aberto. Como o conjunto
de Cantor tem probabilidade zero é portanto um conjunto “ralo”(ou
seja, muito pequeno) no intervalo [0 , 1]. Este conjunto é o exemplo
mais elementar de fractal (ver defini¸cão em [Fa]).
Note que foi fundamental usar o critério da Definição 2.2 para
dizer que o conjunto de Cantor tem probabilidade zero.
Os conjuntos de probabilidade zero s˜ao considerados desprezı́veis
na análise probabilı́stica. Ou seja, se uma propriedade é válida para
todos os p ontos de E , menos para um conjunto de probabilidade zero,
então do ponto de vista probabilı́stico tal propriedade é verdadeira.
Se escolhessemos um ponto ao acaso no intervalo [0,1] de acordo com
24 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

a Probabilidade P do último exemplo, este ponto n˜ao estaria no con-


junto de Cantor, pois este conjunto tem probabilidade 0.
Definição 2.3. Para uma certa probabilidade P definida em X , di-
zemos que um conjunto B tem probabilidade total para P se X B −
tem probabilidade zero para P .
Exemplo 2.5. O conjunto dos irracionais no intervalo [0,1], isto

é o conjunto [0, 1] Q, tem probabilidade total para a probabilidade

uniforme, pois Q [0, 1] tem probabilidade zero.
Diz-se que uma propriedade é válida em P -quase toda parte, se
ela é válida num conjunto de probabilidade total para P . Quando se
diz que um ponto x é escolhido ao acaso segundo um probabilidade
P , x é na verdade ao acaso dentro de um conjunto de probabilidade
total B. Este p onto de vista (ou seja se preocupar apenas com o que
é verdadeiro P -quase toda parte) é a essência da Teoria da Probabi-
lidade.

Definição
dade total é2.4. Um pontodexum
denominado escolhido num conjunto
ponto “genérico de probabili-
no sentido proba-
bil´ıstico”(para a probabilidade P ).
Nosso objetivo a seguir é analisar do ponto de vista estatı́stico (ou
probabilı́stico) a evolução temporal da órbita T n (x) de um difeomor-
fismo T : X → X . Iremos considerar uma probabilida de P sobre X
e tentaremos fazer afirma¸cões que tenham sentido do ponto de vista
probabilı́stico. Isto é, o que se pode dizer para as órbitas T n (x) se
x for escolhido num conjunto de probabilidade total para P ? Em
outras palavras, desejamos obter propriedades das ´orbitas T n (x) de
pontos x escolhidos ao acaso de acordo com a probabilidade P (ou
seja pontos x genéricos).
As probabilidades P que são úteis para o entendimento da evolução
temporal das ´orbitas T : X → X , devem ter algum tipo de rela¸ cão
com T .
Esta relação será descrita pela pr´oxima definição.
Definição 2.5. Dizemos que P probabilidade sobre X é invariante
para um difeomorfismo T se P (T (A)) = P (A) para qualquer conjunto

A X.
25

Exemplo 2.6. Na ultima


´ seç˜ao mostramos que o difeomorfismo T
associado ao bilhar convexo preserva ´area em E = [0, 1) ( 1, 1) ×−
(Proposiç˜ao 1.2, Capı́tulo 1). Logo, se P é definido por
´area de A
P (A) = ,
2
ent˜ao P é invariante para tal T . Neste caso a densidade ψ(t, θ) = 12 ,
define Pψ = P .
Note que no caso da Figura 2.1 (bilhar dispersor) tı́nhamos difi-
culdade em definir T : E → E porque algumas trajet´orias T (t0 , θ0 )
poderiam bater numa quina. Como estamos utilizando um ponto de
vista probabilı́stico ficaremos satisfeitos se T estiver bem definido em

um subconjunto K E de P -probabilidade total. Em muitos casos
tal propriedade é verdadeira e a análise dinâmica que faz sentido será
na verdade de T : K → K (ver [Ma]).
No caso do bilhar dispersor (ou outro qualquer com quinas) con-
{ |
sidere L = (q0 , p0 ) tal que T (q0 , p0 ) bate numa quina ou p1 = 1
ou 1 (ou seja a reta a partir de q com ângulo p intersecta uma
−}
quina ou fica tangente a um lado). É fácil ver que nos casos mais co-
muns o conjunto L é uma curva diferenciável por partes e tem medida
bidimensional em E nula.
n
Considere agora K = E
n
−∪ n∈Z T L. É fácil ver que em K todos
os iterados de T estão bem definidos e perdemos do conjunto E um
conjunto de medida 0 (pois P (E ) = P (K ) = 1). Nada foi perdido do
ponto de vista probabilı́stico com esta restrição.
Exemplo: Seja T (x) = x + λ (mod 1), T : [0, 1] →
[0, 1], onde
λ é uma constante, então a probabilidade uniforme (ou seja dx) é
invariante para T . Isto segue trivialmente do fato que a inclina¸cão
do gráfico de T é 1, logo para cada intervalo A a imagem T (A) tem
o mesmo comprimento total (pode ser a uni˜ ao de dois intervalos)
que A.
Considere agora uma fun¸cão ϕ : E → R, que na maioria das vezes
vai representar algum observável do sistema (por exemplo, o valor da
posição t (neste caso ϕ(t, θ) = t) na curva C do bilhar considerado
na seção anterior).
Ao longo da evolu¸cão temporal do sistema come¸cando em x (ou
seja, a ´orbita x, T (x), T 2 (x),...,T n (x),... começando no ponto x
{ } ∈
26 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

Figura 2.4:

E ) estaremos interessados em calcular o valor médio de ϕ, denotado


por
1
ϕm (x) = (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)))
m
ao longo da ´orbita de x do tempo 0 até o tempo m 1. −
Fazendo o número de itera¸cões m tender a infinito, obteremos a
média assintótica média do observável ϕ ao longo da evolu¸cão tem-
poral iniciada em x:
1 m 1
ϕ̂(x) = mlim
→∞ m (ϕ(x) + ϕ(T (x)) + ... + ϕ(T − (x))).
Estaremos assim obtendo uma informação de natureza assintótica
desta evolução temporal. Um dos t´opicos de maior interesse da
Mecânica Estatı́stica é saber o que acontece em termos probabilı́sticos
(em x) com as médias temporais ϕ̂(x) e sua dependência em x.
O fı́sico L. Boltzmann estava interessado em entender o sistema
de partı́culas (da ordem de 1023 partı́culas) de um gás delimitado por
27

um recipiente fechado. Um sistema com tantas partı́culas é dif´ıcil de


ser analisado do ponto de vista determinı́stico. O sistema com ap e-
nas “uma”partı́cula colidindo elasticamente com a fronteira de uma
região bidimensional que apresentamos na seção anterior já apresenta
dificuldades de análise determin´ıstica como vimos anteriormente (ver
Observação 1.1, Capı́tulo 1 em [L]). Prever a evolução temporal de
uma part´ıcula após decorrido em tempo t muito grande é muito difı́cil
(devido a acumula¸cão de erros nas aproxima¸cões), imagine analisar
um número enorme de partı́culas (1023 ) como acontece em um g´ as
em um compartimento fechado. Sendo assim, faz mais sentido, per-
guntar sobre a probabilidade de encontrar uma partı́cula numa região
D do recipiente. Este é o ponto de vista probabilı́stico da Mecânica
e que é o objeto da Mecânica Estatı́stica. Estaremos interessados em
fazer afirmações para pontos x “genéricos no sentido probabilı́stico”.
Para fixar idéias vamos considerar a evolução temporal
2 n
{T (x), T (x),...,T }
(x)
quando x = (q, p) descreve a posi¸cão de “uma”partı́cula de um gás
que está em q com velocidade p. Considere agora ϕ um observável do
sistema (θ, ou temperatura, etc...), isto é, ϕ é uma função do espa¸co

de fase x = (q, p) E tomando valores em R. O que s e pode di zer
do valor médio ϕ̂(x)?
A Hip´otese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann, que foi enunciada por L. Boltzmann no meio do século
XIX, afirmava que fixado um nı́vel de energia H0 , este valor ϕ̂(x) n˜ao
deveria depender de x neste nı́vel de energia H0 (no caso de um g´as
num recipiente fechado).
Bem, a referida hip´otese em termos t˜ao amplos n˜ao resultou ser
verdadeira. Primeiro, vamos tentar entender em termos Matemáticos

mais precisos
Hipótese o que L.Mais
Ergódica. Boltzmann estava querendo
tarde, tentaremos afirmar
esclarecer comn˜
o que aao
sua
foi
confirmado de tal hip´otese.
Em termos matemáticos mais precisos, o que L. Boltzmann estava
afirmando, na verdade, é que deve existir uma probabilidade natural
{ }
P definida no nı́vel de energia X = (q, p), H (q, p) = H0 , tal que
dado uma função ϕ sobre X , deveria existir uma constante c tal que
para P -quase todo ponto x no conjunto X (o nı́vel de energia H0 ), o
28 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

valor ϕ̂(x) é igual a c. P seria uma probabilidade natural invariante


associada ao sistema de partı́culas de um gás. Ou seja, que existiria
um conjunto B contido no nı́vel de energia H0 tal que P (B) = 0 e
∈ −
para qualquer x X B, deveria ser verdade que ϕ̂(x) = c. Em
outras palavras, que ϕ̂ é constante para pontos genéricos no sentido
probabil´ıstico.
O Teorema de Birkhoff que será apresentado a seguir vai se referir
a questão mencionada acima.
A evolução temporal das condi¸cões iniciais x que são fisicamente
observadas no sistema constituido pelo g´ as s˜ao as trajet´orias que
começam em x, onde x é escolhido num conjunto de probabilidade
total em relação a uma probabilidade natural P . Esta propriedade é o
fundamento do ponto de vista probabil´ıstico da Mecância Estatı́stica.
A probabilidade P é chamada algumas vezes de estado de Gibbs
(terminologia usada em homenagem ao matem´ atico W. Gibbs) do
sistema mecânico (ver [Ru], [E], [BS] e [KH] para referências). Para
simplificar estamos supondo que o g´as vai ser descrito por uma ´unica
partı́cula para evitar analisar problemas relativos às colis˜oes entre
part´ıculas do gás.
Não vamos definir aqui o que é um estado de Gibbs, mas queremos
apenas mencionar que no caso do bilhar numa curva convexa ele é
×−
a probabilidade uniforme em E = [0, 1) ( 1, 1) (conforme Exem-
plo 2.6).

Definição 2.6. Seja P uma probabilidade invariante para um dife-


omorfismo T : X →
X . Dizemos que P é erg´
odica se toda vez que

T (A) = A, A X , ent˜ao P (A) = 0 ou P (A) = 1.

Em outras palavras, uma probabilidade P é ergódica quando não


existem conjuntos invariantes pela a¸cão de T que não sejam triviais


(dizemos que um conjunto A X é trivial se P (A) = 0 ou P (A) = 1).
Observação 2.2. Note que é sempre verdade (ver Definiç˜
ao 1.2) que
∅ ∅
P ( ) = 0 ( é o conjunto vazio) e P (X ) = 1 (onde X é o conjunto
∅ ∅
onde P est´a definido), e ainda que T ( ) = e T (X ) = X , por
isto a necessidade de enunciar a defini¸c˜ao de probabilidade erg´odica
como foi feito acima (e n˜ao apenas dizendo que n˜ao existem conjuntos

invariantes). Os conjuntos X e s˜ao triviais.
29

Figura 2.5:

Exemplo : A transformação T (x) = x + λ (mod 1), onde λ é uma


constante irracional, T definida no intervalo [0 , 1) (ou no cı́rculo S 1 )
é ergodica para dx.
Seja A tal que T −1 (A) = A, então IA (x) = IT −1 (A) (x) = IA (T (x))

para todo x [0, 1).
Expresse IA (x) como Série de Fourier


IA (x) = an e2πinx .
n= −∞
Como IA (x) = IA (T (x)) temos que

∞ ∞
IA (x) = an e2πinx = an e2πin(x+λ) = IA (T (x)).
n= −∞ n=
−∞
Portanto
 ∞  ∞
2πinx
an e = an e2πinλ e2πinx .
n= −∞ n= −∞
30 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

Como os coeficientes de Fourier s˜ ao únicos an e2πinλ = an para



todo n Z . Como λ é irracional então nλ não é inteiro para todo
n (a menos que n = 0). A conclusão é que an = 0 para todo n = 0. 
Portanto IA is constante (a menos de um conjunto de medida zero),
mas como só assume os valores 0 ou 1, ela é, a menos de um conjunto
de medida zero a fun¸cão constante 0 ou a fun¸cão constante 1. Logo
µ(A) = IA (x)dx = 0dx = 0 ou µ(A) = IA (x)dx = 1dx = 1
   
(porque funções que diferem apenas em um conjunto de medida zero
tem a mesma integral).
Se λ é racional T (x) = x + λ (mod 1) n˜ao é ergodica.
Observação 2.3. Um g´as em um recipiente fechado, ao longo da sua
evoluç˜ao temporal, tender´a a ocupar densamente todo o espa¸co dis-
pon´
ıvel, n˜ao deixando espaço para existirem regi˜
oes invariantes. Esta
observaç˜ao traduz em termos fı́sicos aproximados o que o conceito de
ergodicidade expressa em termos matem´aticos.
O fato da transforma¸cão bilhar preservar ´area e do fluxo Hamil-
toniano preservar volume os qualificam para os métodos de Teoria
Ergódica [A3].
Seja um difeomorfismo T : E → E , P = Pϕ probabilidade inva-
riante sobre E para T e ϕ : E →R função tomando valores reais
(observável). O pr´oximo resultado é válido em geral e n˜ao precisare-
mos assumir que T é a transformação induzida pelo primeiro retorno
a uma seção transversal de um fluxo Hamiltoniano no bilhar convexo.
Um dos resultados Matem´aticos mais relevantes para a Mecˆanica
Estatı́stica é o Teorema Erg´odico de G. Birkhoff (1935) que afirma o
seguinte:
Teorema 2.1. (Teorema de Birkhoff) Seja ϕ : E → R cont´
ınua,
P = Pψ probabilidade erg´ odica para T : E →
E e suponha que
ϕ(y)dP (y) < , ent˜ao, existe c R tal que para todo ponto x,
∞ ∈
genérico no sentido probabilı́stico em rela¸
 c˜ao a probabilidade P , vale
que
1
c = ϕ̂(x) = lim (ϕ(x) + ... + ϕ(T m−1 (x))).
m→∞ m
O valor c pode ser obtido como

c=
 ϕ(y)dP (y),
31

ou seja, a integral de ϕ em relaç˜ao a P .


Para a prova e para considera¸cões mais gerais sobre o Teoria
Ergódica, referimos o leitor para [PY], [M1], [CFS] e [KH]. Esta Te-
oria permite um melhor entendimento de quest˜oes fundamentais da
Mecânica Estatistica [PP] e [Ru]. O ponto de vista do formalismo
DLR da Mecˆanica Estatistica é descrito em [G].
Em resumo o teorema de Birkhoff diz que existe um conjunto A

tal que P (A) = 1 tal que para todo x A vale que a média temporal
assintótica
n −1
1 
ϕ̂(x) = lim ϕ(T j (x))
m→∞ m
j =0

é igual à integral espacial


 ϕ(y)dP (y) =
 ϕ(y)ψ(y)dy.
E

Observação: Mostramos em exemplo anterior que T (x) = x + λ


(mod 1) é ergódica para a probabilidade uniforme (a P tal P ([a, b]) =
b a). É fácil ver por indu¸cão que T n (x) = x + nλ (mod 1). Seja

[a, b] intervalo qualquer e considere ϕ(x) = I[a,b] (x).
Podemos aplicar o teorema ergódico também neste caso e concluir

que existe K [0, 1] tal que P (K ) = 1 e para todo x K ∈
n 1
− 
ˆ ] (x) = lim 1 
I[a,b I[a,b] (T j (x)) = I[a,b] (y)dP (y) = b − a > 0.
m→∞ m
j =0

Note que T j (x) [a, b], se e s´o se, I[a,b] (T j (x)) = 1. Portanto,

para x K a órbita T n (x) n Z visita o conjunto [ a, b].
∈ { | ∈ }
Logo as ´orbitas T n (x) n Z , para x quase todo ponto (em
{ | ∈ }
relação a P ), vão determinar conjuntos densos em [0 , 1].

Exemplo 2.7. Considere o est´adio circular ( l > 2) do Exemplo 1.4


e que foi descrito na se¸c˜ao anterior.
Um resultado n˜ao trivial obtido recentemente por [Bu] afirma que
a probabilidade natural P (a ´area) associada ao bilhar no est´adio é
erg´
odica, isto é, a aplicaç˜ao induzida no bordo pelo primeiro retorno
32 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

×−
T : [0, 1) ( 1, 1) → ×−
[0, 1) ( 1, 1) é erg´odica para a probabilidade
uniforme.
Considere a, b valores em [0,1) e ϕ : E →
R a funç˜
ao indicador
×−
de A = (a, b) ( 1, 1).
Para A um subconjunto de X , IA (z), a fun¸c˜ao indicador de A, é
a funç˜ao tal que IA (z) = 1 se z A e IA (z) = 0 se z n˜ao est´a est´a
em A.  ∈ 
E´ f´acil ver que IA (x)ψ(x)dx = A ψ(x) = P (A).
No caso em considera¸ c˜ao neste exemplo de bilhares em E = [0, 1) ×

( 1, 1) ψ(x) é constante igual a 1/2.
A fun¸c˜ao ϕ = IA n˜ao é contı́nua (tem descontinuidades numa
curva diferenci´avel por partes), mas o Teorema Erg´odico também é
v´alido para tal tipo de fun¸c˜ao ϕ (ver [M1] e [CFS]).
E´ f´acil ver que para x fixo e m N e ϕ = IA

1
(ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x))
m
é igual a
{ ∈ {0, 1,...,m − 1} tal que T
# j j (x) ∈ (a, b) × (−1, 1)} .
m
Sendo assim o limite
1
ϕ̂(x) = lim (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)) ),
n→∞ m
neste caso expressa o valor médio de vezes que a trajet´
oria começando
em x bate na regi˜
ao do bordo do bilhar compreendida entreg(a) e g(b),
(onde g é a parametrizaç˜ao do bordo do bilhar). Neste caso ϕ̂(x)
vai descrever o que chamamos de tempo de ocupa¸c˜ao assint´otico da
regi˜
ao A.

O conceito
Definição de tempo3 de
25, Capı́tulo [L],ocupa¸ cão j´repeti-lo
mas vamos a foi apresentado
a seguir. antes na
Definição 37*: Considere T : E →
E difeomorfismo, A E e ⊂

x = (q, p) E . Dizemos que x tem um tempo de ocupaç˜ao assintótico
de A igual a ôA (x) se existe o limite
# vezes que T j (q, p) A, j ∈ ∈ {1, 2,...,n }
lim = ôA (x).
n→∞ n
33

O valor c = ϕ̂(x) = IˆA (x) = ôA (x) é constante para todo x (fora
de um conjunto de probabilidade 0) pelo Teorema de Birkhoff, e é

IA dP
igual a ϕdP = 2 = P (A) = área de A = (b a). Portanto, −
graças ao Teorema Ergódico podemos calcular no Exemplo 2.7 o valor
exato do tempo de ocupa¸cão assintótica ôA (x) do conjunto A para x

quase toda parte; este valor é b a. −
Sendo assim, podemos fazer a seguinte previsão: no bi lhar no
estádio com l = 2 (que é ergódico), se formos observar a partı́cula
depois de 1000 rebotes, dentre estes 1000 rebotes, aproximadamente

um número (b a)1000 deles foram no arco de curva compreendido
entre g(a) e g(b).
Vamos relembrar agora a Definição no Capı́tulo 1 de ponto perió-
dico.
Dizemos que uma ´orbita T n (q, p), n N é periódica se existe
{ ∈ }
m N tal T m (q, p) = (q, p). Neste caso

T n (q, p) , n N = (q, p), T (q, p),...,T m 1 − (q, p) .
{ ∈ } {
O valor m é denominado perı́odo de (q, p). }
Observação 2.4. Note que o resultado sobre o tempo de ocupa¸c˜ ao
ôA (x) = ϕ̂(x) no est´adio l > 0 n˜ ao pode ser verdade para tˆodas
as condiç˜oes iniciais x = (q, p). Na Figura 1.5, mostramos duas tra-
jet´orias a e b na parte interna do est´adio, que correspondem à ´orbitas
peri´odicas para T de per´ {
ıodo dois, respectivamente (qa , pa ), T (qa , pa )}
{ }
e (qb , pb ), T (qb , pb ) . Na Figura 1.6 mostramos também no espaço
∈ ×−
de fase (q, p) [0, 1) ( 1, 1) as duas ´orbitas acima mencionadas.
Estas ´orbitas naturalmente v˜ao determinar tempos de ocupaç˜ao dife-
rentes para o conjunto A que aparece na Figura 3.25. O tempo de
ocupaç˜ao assint´otico de A para a ´orbita a é zero e para a orbita
´ b é

um.Note que o comportamento desta duas trajet´orias é totalmente


distinto do comportamento da trajet´ oria descrita pela Figura 1.7 apre-
sentada na ´ultima seç˜ao. Para “qualquer ponto inicial x escolhido ao
acaso” de acordo com a probabilidade uniforme, a ´orbita T n (x) gera
a Figura 1.7.
N˜ao existe contradi¸c˜ao entre a Figura 1.7 e 1.6, pois no ´ ulimo
caso a posiç˜ao da condiç˜ao inicial (q0 , p0 ) é muito particular, e esta
34 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

fora do conjunto de probabilidade total para o qual vale o Teorema


de Birkhoff. A explicaç˜ao para este fato é que estas duas condiç˜oes
iniciais (qa , pa ) e (qb .pb ) n˜ao ser˜ao condiç˜oes “genéricas”no sentido
estabelecido pela Definiç˜ao 2.4 e pelo Teorema Erg´odico. No entanto,
se escolhermos ao acaso (de acordo com P uniforme) a condiç˜ao
inicial (q0 , p0 ), ent˜ao (q0 , p0 ) ser´a genérica e portanto vai satisfazer
a propriedade que o tempo ocupa¸c˜ao ôA para um certo conjunto A
fixado, existe e independe da condiç˜ao inicial. Isto é o que afirma o
Teorema Erg´ odico para ϕ = IA !
E´ importante destacar que na an´alise matem´atica e probabil´ıstica
dos bilhares, as ´orbitas peri´odicas (principalmente as de perı́odo muito
alto) desempenham um papel importantı́ssimo no entendimento da
dinˆamica das trajet´orias.
Exemplo 2.8. No caso do sistema de duas partı́culas

x = (x1 , x2 , v1 , v2 )

que foi considerado no Exemplo 13 da Se¸c˜ao 4, Capı́tulo 1 [L], existe


um conjunto A denso (ver Defini¸c˜ao 13, Capı́tulo 1 [L]) em R2 tal

que quando as massas m1 e m2 s˜ao tais que (m1 , m2 ) B, ent˜ao é
possı́vel mostrar (ver [KMS]) que a probabilidade natural P associada
ao bilhar triangular é erg´
odica.

Logo, no caso em que (m1 , m2 ) A, as médias ϕ̂(x) para qualquer
funç˜ao cont´ınua ϕ definida sobre o bilhar triangular s˜ao as mesmas,
independentes da condiç˜ao inicial x (contanto que x seja escolhido
ao acaso de acordo com a probabilidade P ).
Podemos portanto, analogamente ao procedimento do exemplo an-
terior, obter o valor exato ôB , onde B corresponde ao evento: a
posiç˜ao x1 e x2 ao colidirem est˜ao no inter valo (0.2, 0.5) . Do Te-
orema Erg´odico segue que ôB = P (B) e ôB independe de x (para
x num conjunto
calculado de probabilidade
facilmente a partir de Ptotal).
. O valor ôB pode ent˜ao ser
√m2

Quando √m1 Q, o sistema acima considerado n˜ao é erg´ odico.
Acreditamos que com estes dois ´ ultimos exemplos tenha ficado
transparente a importˆancia do Teorema Erg´odico de Birkhoff para a
análise de propriedades estatı́sticas das órbitas dos fluxos Hamiltoni-
anos.
35

Note que se P é ergódica e é sempre positiva em abertos então para


x P-quase toda parte a ´orbita x, T (x),..,T n (x),... é um conjunto
{ }
denso; de fato, dado um aberto A como P (A) > 0 então

0 < P (A) = IA (x)dP (x) = oA (x) =

lim
1 
(IA (x) + IA (T (x)) + ... + IA (T m−1 (x)) ).
n→∞ m

Neste caso algum IA (T j (x)) é igual a 1.


Para um sistema erg´odico, o Teorema de Birkhoff descreve a ma-
neira matemática exata como deve ser entendida a hip´otese de Boltz-
mann.
A teoria de Kolmogorov-Arnold Moser (KAM) (ver [KH] e Se¸ cão
13, Capı́tulo 3 [L]) desenvolvido no meio deste século mostrou que
para uma grande quantidade de Hamiltonianos a propriedade da er-
godicidade não é v´alida. Vamos a seguir, através de um exemplo, dar
uma breve idéia porque não é verdade a Hipótese de Boltzmann em
sua formulação mais geral.
Consideraremos agora o bilhar no ovo (Exemplo 1.4, Capı́tulo 1)
e T a aplicação induzida no bordo do bilhar conforme mostra Figu-
ra 1.8.
Observação 2.5. No caso do bilhar no ovo, existe uma evidência
numérica de haver um uni˜ao finita de curvas fechadas invariantes
∈{
γi , i }
1,..,n para T (ver Figura 1.8), mostra claramente que tal T
n˜ao é erg´
odica. Isto porque
( [0, 1) × (−1, 1) ) − ∪ γ
i i

possui um conjunto invariante de probabilidade uniforme positiva (por


exemplo a uni˜ao das partes internas das γi ).

Isto pode
siderando ser observado
´orbitas numericamente
começando em condiç˜oes em um computador,
iniciais con-
que est˜ao respec-
tivamente no interior e no exterior da curva.
Concluı́mos ent˜ ao que existe uma evidência numérica de que tal
sistema n˜ao é erg´odico.
Este fato contraria ent˜ao a Hip´otese Erg´odica de Boltzmann pois
T representa a evoluç˜ao temporal de uma partı́cula de uma g´ as num
recipiente fechado.
36 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

O leitor poderia argumentar que j´a para o bilhar no cı́rculo (Exem-


plo 1.2) o difeomorfismo T n˜ao é erg´ odico para a probabilidade uni-
×−
forme em [0, 1) ( 1, 1) (uma linha horizontal l = (θ0 , t) invariante
×−
por T determina em [0, 1) ( 1, 1) duas componentes invariantes
por T de medida uniforme n˜ao nulas). Para ser mais preciso, cabe
ressaltar que a Hip´otese Erg´odica de Boltzmann é em geral relaxada
e enunciada para um conjunto denso de possı́veis bordos de bilha-
res. O exemplo acima é persistente, isto é, para curvas diferenci´aveis
convexas γ , que est˜ao C 1 pr´oximas da curva do ovo, o espa¸ co de
fase da aplicaç˜ao T induzida pelo bilhar em γ continua a determinar
curvas invariantes. Sendo assim, existem ao menos duas regi˜oes bi-
dimensionais invariantes de probabilidade positiva e portanto pode-se
dizer que existem bilhares que n˜ao podem ser aproximados por bilha-
res tais que o correspondente T seja erg´odico para a probabilidade
×−
uniforme em [0, 1) ( 1, 1). Portanto, o exemplo do bilhar no ovo
nos parece indicar indicar numericamente que a Hip´ otese Erg´odica
de Boltzmann n˜ao é verdadeira em geral. No exemplo do est´adio cir-
cular da se¸c˜ao anterior, por usa vez, a hip´ otese é confirmada pois o
sistema é erg´
odico.
Na verdade não estamos mostrando matematicamente que a Hi-
pótese Ergódica de Boltzmann n˜ao é verdadeira, estamos apenas su-
gerindo através de exemplos e figuras obtidas no computador que
existe uma forte evidência numérica de que esta hipótese não é ver-
dadeira. Na Teoria KAM se obtem resultados matemáticos precisos
que mostram exemplos onde a hip´otese não é verdadeira (ver [KH]).
Na Seção 3 vamos mostrar para aplica¸cão “standard”a existência
de curvas invariantes, e assim dar uma demontra¸cão matemática de
que realmente a hip´otese ergódica em alguns casos particulares n˜ao é
verdadeira.
Em alguns outros casos particulares importantes, no entanto, a
hipótese de Boltzmann resultou ser verdadeira como por exemplo em
variedades de curvatura constante negativa (ver [KH] e [A2]).
Vamos agora analisar o Teorema Erg´odico para tempo continuo.
Definição 2.7. Considere para todo t ( −∞ ∞
< t < ), uma trans-
formaç˜ao St do espaço X em si mesmo, St : X → X , que satisfaça a

seguinte condiç˜ao: para quaisquer t1 , t2 , St1 St2 = St1 +t2 . Chama-
remos tal famı́lia de um sistema dinˆamico a tempo cont´
ınuo.
37

Exemplo 2.9. Dada uma equaç˜ ao diferencial x′ = G(x), x Rn , o ∈


fluxo φt associado a tal equaç˜ao (conforme Defini¸c˜ao 21, Capı́tulo 1
[L]) é um exemplo de um sistema dinˆamico a tempo cont´ınuo St = φt .
Exemplo 2.10. Considere α n´ umero real e defina St : R R por →
St (x) = x + tα, para todo real t. St é um sistema dinˆ
amico a tempo
cont´ınuo.
Exemplo 2.11. Considere α n´ umero real e defina St : [0, 1) [0, 1) →
por St (x) = x + tα (mod 1) para todo real t. Este sistema dinˆamico
ser´a muito importante em nossas futuras consideraç˜oes.
Definição 2.8. A probabilidade µ é dita invariante em relaç˜
ao ao
{ }
sistema dinˆamico St se, para todo conjunto B X e para qualquer ⊂
t real, µ(St B) = µ(B).
Uma maneira equivalente de dizer que uma medida µ é invariante
para St : Para toda fu nção contı́nua φ e para todo t real vale que
 
φ(x)dµ(x) = φ(St (x))dµ(x).
O Teorema de Liouville (Teorema 4, Capı́tulo 3 [L]) mostra que
se φt é o fluxo associado a um Hamiltoniano H , então para todo t, e
para todo aberto A vale que área φt (A) = área de A.
Logo, neste caso, o sistema dinˆ amico St = φt deixa invariante a
probabilidade uniforme.
O Exemplo 33 do Capı́tulo 3 [L] mostra um exemplo de proba-
bilidade invariante sobre uma curva γ obtida através do tempo de
ocupação assintótico.
Exemplo 2.12. E ´ f´acil ver que o sistema dinˆ amico St do Exem-
plo 2.11 deixa invariante a probabilidade µ definida sobre [0,1) por

µ( [a, b] ) = b a. Esta probabilidade, como vimos antes se chama
probabilidade uniforme em [0,1).
Dada uma ´orbita peri´odica γ (s), s ∈ [0, b], tal que γ (0) = γ (b)
defina a medida µ tal que para toda fun¸c˜ao contı́nua φ temos
 φ(x)dµ(x) =
 b
φ(γ (s))ds.
0

A medida µ assim definida é invariante; de fato, para t fixo


 φ(St (x))dµ(x) =
 b
φ(St (γ (s)))ds =
0
38 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

 b
φ(St (Ss (γ (0)))ds =
 b
φ(St+s (γ (0)))ds.
0 0

Fazendo a mudança de vari´avel s → s + t, obtemos


b b
φ(St (x))dµ(x) = φ(Ss (γ (0))ds = φ(γ (s))ds = φ(x)dµ(x).
 0  0 
Definição 2.9. O fluxo St é dito erg´
odico para µ se para todo con-
⊂ ∀∈
junto A X tal que St (A) = A, t R, ent˜ao µ(A) = 0 ou µ(A) = 1.
Vamos agora considerar St = φt o fluxo associado a um campo de
vetores Hamiltoniano H em (q, p) R2n restrito a uma superfı́cie de

Hamiltoniano H constante.
Suponha que a superfı́cie S de energia constante H0 seja com-
pacta. Neste caso, como veremos na Se¸cão 5, existe sempre uma
probabilidade invariante P para o fluxo Hamiltoniano φt restrito à su-
perf´ıcie H (q, p) = H0 de Hamiltoniano constante. Esta probabilidade
P é a probabilidade P = PH0 = P k com densidade ψ = ∇kH 
∇H 

sobre H (q, p) = H0 (ver Seção 5) onde k é apenas uma constante


para normalizar a probabilidade P .
Tal probabilidade P definida sobre S é positiva em abertos de
S , ou seja, dado x
2n

S e ǫ > 0, então P (B(x, ǫ) S ) > 0, onde ∩
B(x, ǫ) = y R { ∈ x y <ǫ . || − | }
Vamos tentar colocar a afirma¸cão de Boltzmann de uma maneira
matematicamente mais precisa do que a que foi feita pelo mesmo no
século XIX.
A Hip´otese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann para Hamiltonianos é análoga `a anteriormente descrita
(no caso em que o tempo é discreto n N). ∈
A Hipótese Ergódica para Hamiltonianos afirma que para todo va-
lor de energia H0 , PH0 é ergódico para o fluxo φt restrito a
H (q, p) = H0 .
É importante n˜ao confundir a a¸cão de fluxo φt sobre o espa¸co
(q, p) R2n com a a¸cão (restrita) do fluxo φt sobre uma superf´ıcie

de Energia constante H0 .
A questão da validade ou n˜ao da Hipótese Ergódica de Boltzmann
influenciou sobremaneira a Fı́sica e a Matemática do século XX.
39

Contra-exemplo 68: Lembre que o fluxo Hamiltoniano φt preserva


volume em R2n ou seja preserva a probabilidade uniforme em cada
2n
subconjunto aberto limitado invariante X
2n

R . A probabilidade
P em X = R neste caso n˜ao é ergódica para φt . Isto porque um
sistema com uma integral primeira não pode ser erg´odico (lembre que
H é integral primeira) como veremos a seguir.

Se tomarmos o aberto limitado A X (com probabilidade posi-
tiva para P portanto) dos pontos x R2n tal que E1 < H (x) < E2 ,

então o fluxo Hamiltoniano φt deixa A invariante pelo Teorema de
Conservação do Hamiltoniano e no entanto 1 > P (A) > 0. Logo, em-
bora o fluxo Hamiltoniano deixe invariante a probabilidade P , não é
verdade que P é ergódico para φt .
Outra questão de natureza distinta é: será que φt é ergódico
quando restrito a uma superfı́cie S de energia constante H0 ?
Teorema 2.2. (Teorema de Birkhoff) Seja um Sistema Dinˆamico St
definido em X , preservando a probabilidade erg´odica P = Pψ . Ent˜ao
para toda funç˜ao cont´ınua f tal que X f (x)dP (x) = X f (x)ψ(x)dx <
, existe uma constante c e existe um conjunto B de probabilidade

total tal que para todo ponto x B ∈  
c = lim
1
 t
f (Sτ x)dτ = lim
1
 t
f (S−τ x)dτ.
t→∞ t 0 t→∞ t 0

O valor c naturalmente depende de f e pode ser obtido como

c=
 f (y)dP (y) =
 f (y)ψ(y)dy.
X X

Vamos recordar mais uma vez a defini¸cão de tempo de ocupa¸cão


assintótico (ver Seção 10, Capı́tulo 3 [L]), desta vez no caso de tempo
cont´ ∈
ınuo t R.

Definição

x X, ⊂
37**: Dado um conjunto A X e uma condi¸c˜ao inicial

lim
1 t

IA (Sτ x)dτ = ôA (x)
t→∞ t 0

ao assintótico de A começando em x.
é chamado de tempo de ocupaç˜
Uma consequência importante do teorema anterior é que, no caso
de P ser ergódico para St , então para todo x em um conjunto B de
40 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

probabilidade total para P , a órbita de x pelo sistema dinâmico St (x)


determina um tempo de ocupa¸cão assintótico de um conjunto aberto

qualquer A X tal que ˆo(A)(x) = P (A).
Isto é verdade, porque pelo Teorema 2.2, dado um subconjunto A
e considerando f = IA acima obtemos

1  t 
lim IA (Sτ x)dτ = IA (z)dP (z) =
t→∞ t 0 X

=
 dP (z) = P (A) = c = constante
A

para x em um conjunto B de probabilidade total para µ.


Logo, se um sistema é ergódico, existe B tal que P (B) = 1 e para

x B o tempo de ocupa¸cão assintótico de um conjunto aberto A não
depende do valor x.
A analogia do Teorema Erg´odico com tempo contı́nuo t R para ∈
o Teorema Ergódico com tempo discreto n N visto anteriormente ∈
é transparente.
Examinaremos, agora, um tipo importante de sistema dinˆ amico
com tempo contı́nuo: o grupo de translações a um parâmetro no toro.
Seja X =Torn = S 1 S 1 ... S 1 (n fatores) o toro de dimens˜ao
× × ×
n. Um ponto desse espa¸co pode ser representado pelo sistema de
| |
números complexos z = (z1 , z2 ,...,z n ), zk = 1, 1 k n. Note que ≤ ≤
ıvel escrever zk = e2πixk (xk R); então, o mesmo ponto z pode
é poss´ ∈
ser identificado com o sistema de n´umeros reais x = (x1 , x2 ,...,x n ) ∈
[0, 1)n , definidos mod 1 (neste caso, podemos assumir que 0 xk < ≤
1). A primeira nota¸cão é conhecida como multiplicativa, e a segunda,
como aditiva.
Sendo assim iremos identificar o toro com o conjunto [0 , 1)n onde

identificamos faces opostas


cões nodo
dinâmico das transla¸ paralelepı́pedo.
toro Definiremos o sistema
Tor n pela expressão

St z = (z1 e2πiλ1 t , z2 e2πiλ2 t ,...,z n e2πiλn t )

ou, equivalentemente, com

St x = (x1 + λ1 t( mod 1) , x2 + λ2 t( mod 1) ,...,x n + λn t( mod 1)) ,


41

onde λ1 , λ2 ,...,λ n são n´umeros reais fixos. Cada St é dita uma


{ }
translação no toro, e p or isso St é chamado um grupo de translações
a um parˆametro em Torn , definido pelo vetor λ = (λ1 , λ2 ,...,λ n ).
 n
Note que a probabilidade uniforme no toro dµ = k=1 dxk é
{ }
invariante em relação a St . Isto porque, como St (A) é apenas um
transladado de A, A, então St (A) e A tem a mesma ´area. Logo St

preserva o volume dx1 ...dxn . Note que µ(Torn ) = 1. Sendo assim se

definirmos µ(A) = A dx1 ...dxn , a probabilidade uniforme µ resulta
ser invariante para o sistema dinˆamico St em [0, 1)n .
O conjunto dos vetores a(t) = (e2πiλ1 t , e2πiλ2 t ,...,e 2πiλn t ),
−∞ <

t < , define a trajet´oria do zero através da evolução temporal do
sistema dinâmico St .
O Sistema Dinˆamico St acima definido é muitas vezes chamado
≤ ≤
condicionalmente periódico, sendo λk (1 k n) suas frequências.

Exemplo 2.13. O exemplo mais simples de tais sistemas St foi


apresentado nos Exemplos 2.11 e 2.12: para α fixo, St (x) = x +

αt(mod1), α = 0. Neste caso a probabilidade invariante P é a proba-
bilidade
erg´odicauniforme
para tal Sem [0, 1). Uma pergunta natural é quando que P é
t.

Vamos mostrar agora que tal P é sempre ergódica para tal St .

Observação 2.6. Pode-se mostrar (ver [M1]) que um fluxo St{ }


é erg´
 odico para µ, se e s´ o se, vale que para toda fun¸ c˜ao f tal que
X fdµ < ∞
e f (St (x)) = f (x) para todo x, ent˜ao é porque f (x) =
const. = X f dµ para um conjunto de pontos x em um conjunto B
de probabilidade total para µ.
Vamos usar o resultado mencionado na observa¸ cão acima para
mostrar que St é ergódico para a probabilidade uniforme.

Considere
St (x) percorrefixado
todosum os ponto x ∈ [0, 1).y do
valores possı́veis Observe que[0variando
intervalo t,
, 1). Logo,
para uma dada fun¸cão f , f (St (x)) = f (x) significa que para todo

y [0, 1), f (y) = f (x). Logo f é constante. Sendo assim pela última
observação St é ergódico.
Vamos apresentar agora uma outra prova da ergodicidade da St
acima definida, e que vai motivar a demonstra¸ cão do pr´oximo teo-
rema. Considere um fun ção f que seja invariante para St , ou seja,
42 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

f (St (x)) = f (x) para qualquer x ∈


[0, 1). Escreva f em série de
Fourier 
f (x) = cs e2πisx .
s ∈Z
Como f é invariante

f (St (x)) =  cs e2πis(x+αt) =  cs e2πisαt e2πisx =


s ∈Z s Z

=
 cs e2πisx = f (x).
s Z

Logo, concluı́mos pela unicidade da Série de Fourier de uma fun¸ cão,
que s Z, t R, cs e2πisαt = cs , ou seja que se cs = 0, para todo
∀ ∈ ∀∈ 
t vale que e2πiαst = 1. Portanto α s = 0, e como α = 0, isto é im- 
possı́vel a menos que s = 0. Portanto, cs = 0 para s = 0. Logo f é 
constante em quase toda parte com rela¸cão a probabilidade uniforme
P pois sua série de Fourier é constante igual a c.
Logo, pela ´ultima observação St (x) = x + αt é sempre ergódico.
Será que St (x1 , x2 ,..,x n ) = (x1 + λ1 t(mod1),...,x n + λn t(mod1))
também é ergódico para a probabilidade uniforme? A resposta é
: nem sempre! Será necess´ario assumir alguma hip´otese sobre os
λ1 ,..,λ n . Estas condi¸cões serão estabelecidas pelo pr´oximo teorema.
Teorema 2.3. Para que um fluxo condicionalmente peri´odico St seja
erg´odico é necess´
ario e suficiente que os n´umeros λ1 , λ2 ,...,λ n sejam
racionalmente independentes, isto é, que igualdades da forma s1 λ1 +

s2 λ2 + ... + sn λn = 0, onde s1 , s2 ,...,s n Z sejam possı́veis apenas
quando s1 = s2 = ... = sn = 0.
Demonstração:
Vamos utilizar o critério estabelecido pela última observação para
demonstrar o resultado desejado.
Primeiro, provaremos a suficiência. Suponhamos que os números

λ1 , λ2 ,...,λ n

sejam racionalmente independentes.


Vamos mostrar que qualquer f tal que f (St (x)) = f (x), é tal que
f é constante fora de um conjunto de probabilidade uniforme nula.
43

A fun¸cão f em Torn tomando valores reais, pode ser expandida


em uma série de Fourier que convirja na média quadrática, ou seja,

f (x) =
 cs e2πi(s1 x1 +s2 x2 +...+sn xn ) ,
s

n
onde 1 2 n ∈
s Zns .= (s , s ,...,s ) Z , e a soma é tomada sobre a famı́lias de

Da invariância de f obtemos

f (St x) =
 cs e2πi[s1 (x1 +λ1 t)+s2 (x2 +λ2 t)+...+sn (xn +λn t)]
s

=
 cs e2πi (s1 λ1 +s2 λ2 +...+sn λn )t . e2πi(s1 x1 +s2 x2 +...+sn xn ) = f (x)
s

=
 cs e2πi (s1 x1 +s2 x2 +...+sn xn ) ,
s

a menos de um conjunto de probabilidade uniforme zero (lembre que

adesérie de Fourieruniforme
probabilidade de uma função
0. f é definida a menos de um conjunto
Em virtude da unicidade do coeficiente de Fourier,

cs = cs e2πi (s1 λ1 +...+sn λn )t ,

isto é, para todo s ou cs = 0 ou e2πi(s1 λ1 +...+sn λn )t = 1. A segunda


igualdade só é v´
alida quando ( s1 λ1 + ... + sn λn )t = p, onde p Z. ∈
Como t é arbitrário, isto acontece apenas se s1 λ1 + ... + sn λn = 0,
ou seja, se s1 = ... = sn = 0, pois estamos supondo que λ1 ,...,λ n
eram racionalmente independentes. Logo, para todo s = (0, 0,..., 0), 
temos que cs = 0. Note que o argumento n˜ao pode ser aplicado a c0 .
Portanto, todos os coeficientes de Fourier cs tais que s = 0 s˜ao nulos. 
Logo, temos que f (x) = c0 = constante a menos de um conjunto de
probabilidade zero. Portanto, p ela Observação 2.6, concluı́mos que
P é ergódica.
Agora, provaremos a necessidade. Suponhamos que haja um vetor
não-nulo s = (s1 ,...,s n ) com coordenadas inteiras tais que s1 λ1 +...+
sn λn = 0. Ent˜ao, a fun¸cão f tal que

f (x) = e2πi(s1 x1 +...+sn xn )


44 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

não é constante (mod 0), mas é invariante em relação a St pois

f (St x) = e2πi [s1 (x1 +λ1 t)+...+sn (xn +λn t)]

= e2πi(s1 λ1 +...+sn λn )t .e2πi (s1 x1 +...+sn xn ) = f (x).

completamos { }
t não é ergódico, o que é uma contradição. Assim,
Portanto, a Sprova do teorema. 

Exemplo 2.14. Segue do teorema acima que o sistema dinˆamico

St (x1 , x2 ) = (x1 + t (mod1), x2 + αt (mod1))

é erg´
odico, se, e somente se, α é irracional.
Considere agora o Hamiltoniano H (q, p) = p21 + p22 + ... + p2n .
Para p0 = (λ1 , λ2 ,...,λ n ) fixado considere o subconjunto D do
2n
R constitu´
ıdo pelos pontos da forma

(q, p0 ) = (q1 , q2 ,...,q n , p1 ,...,p n ) = (q1 , q2 ,...,q n , λ1 ,...,λ n ),

onde (q1 , q2 ,...,q n ) [0, 1]n .



Podemos considerar que este sistema Hamiltoniano oriundo de tal
H (q, p) está definido em q Rn (mod 1), descrevendo assim um fluxo

Hamiltoniano no toro [0 , 1)n .
É fácil ver que D é invariante para o fluxo Hamiltoniano φt gerado
por H . Por exemplo, D pode ser obtido através de superfı́cies de nı́vel
de integrais primeiras do tipo Vi (q, p) = pi = λi . É também fácil ver
a proje¸cão π1 (φt ) (onde π1 (q, p) = q ) do fluxo φt é na verdade igual

ao St (q ) = π1 φt (q, p0 ) acima descrito.
Como a velocidade p(t) das solu¸cões (q (t), p(t)) do Hamiltoniano
H é constante igual a p0 = (λ1 ,...,λ n ) então podemos pensar que
St é apenas uma mudança de coordenadas π1 do fluxo Hamiltoni-
ano (restrito a D) determinado por tal H . Sendo assim entender a
evolução temporal do sistema dinˆamico St das translações no toro é
na verdade entender a evolu¸ cão de um sistema mecˆ anico peri´odico
sem energia potencial.

Observação 2.7. Com relaç˜ao ao Teorema acima h´a um esclareci-


mento importante a fazer: em todos os nossos argumentos, a condiç˜ao
45

de ergodicidade do fluxo no toro, foi equivalente a independência ra-


cional dos n´umeros λ1 ,...,λ n ; ora, nem sempre a condi¸c˜ao de inde-
pendência racional dos n´ umeros λ1 ,...,λ n é verdadeira (por exem-
plo, se todos os λi forem racionais). Felizmente, o conjunto dos
(λ1 ,...,λ n ) que n˜ao s˜ao racionalmente independentes, tem probabi-
lidade zero em rela¸c˜ao a probabilidade de dλ1 ...dλn em [0, 1)n (ver
Exercı́cio 5).
Sendo assim, escolhendo um conjunto de valores (λ1 ,...,λ n ) ao
acaso em Rn de acordo com a probabilidade uniforme em dλ1 ...dλn
obteremos um sistema que tem ´otimas propriedades estat´ısticas. Por-
tanto, do ponto de vista probabilı́stico podemos afirmar que o sistema
observado na natureza (escolhendo os λ1 ,...,λ n com probabilidade to-
tal em Rn ) possui propriedades estatı́sticas otimas
´ para as trajet´orias
começando em x num conjunto de probabilidade total.
Dizemos que um sistema tem propriedades estatı́sticas ´otimas se
para um conjunto de probabilidade total de condiç˜oes iniciais, as tra-
jet´orias visitam uma dada regi˜ao A com a mesma frequência assin-
t´otica.
Note que a afirma¸c˜ao do sistema ter ´otimas propriedades estatı́s-
ticas n˜ao pode ser feita para “todos”os possı́veis sistemas λ1 ,...,λ n
condicionalmente peri´odicos.
Exemplo 2.15. Considere um ponto de equilı́brio de um sistema Ha-
miltoniano natural unidimensional H (q, p) = 12 p2 + V (q ) onde V (q )
2
tem mı́nimo local em 0. Suponha que d dq V (q )
2 |
q =0 > 0. O sistema Ha-
miltoniano em torno do ponto (0, 0) é integr´ avel e as curvas de nı́vel
para o Hamiltoniano s˜ao curvas fechadas envolvendo o ponto (0, 0).
Conforme vimos na Se¸cão 7, Capı́tulo 3 expressão (3.5) [L], o
fluxo Hamiltoniano pode ser localmente escrito em coordenadas a¸ cão
- ângulo (θ, I ) através da equação

θ̇ = w(I ) , I˙ = 0.

As soluções deste sistema, como vimos antes s˜ao da forma


(θ(t), I (t)) = ( θ0 + w(I0 ) t, I0 ), onde ( θ0 , I0 ) é a condição inicial.
Logo, em variáveis ação-ângulo, o fluxo Hamiltoniano φt restrito
a curva de nı́vel I = I0 = constante, é da forma φt (θ0 , I0 ) = (θ0 +
w(I0 )t, I0 ).
46 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

A partir de φt , considerando apenas a variável θ, obtemos no nı́vel


de energia correspondente a I0 o sistema dinâmico

St (θ) = θ + w(I0 ) t (mod 1) .

Este sistema dinâmico foi analisado anteriormente e é sempre


ergódico.
Retornando as vari´aveis ( q, p) o resultado an´alogo será também
verdadeiro.
Desta maneira, pelo que vimos acima, o fluxo Hamiltoniano φt
restrito a uma curva de Energia constante, pr´oxima ao ponto de
equilı́brio é ergódico. Sendo assim, a Hip´otese Ergódica de Boltz-
mann é verdadeira neste caso.
Será que a mesma propriedade é válida para o caso an´ alogo n-
dimensional? 2
Considere agora o sistema n-dimensional H (q, p) = |p2| + V (q )
com q e p em Rn e suponha que V (q ) tenha mı́nimo local em q =
n 1 2 2 1 2 2
0 ∈R . Suponha ainda que V (q ) = 2 a1 q1 + .. + 2 an qn . Esta

hipótese
um sentidonãogenérico,
é muito restritiva,
todo campo naHamiltoniano
verdade, pode-se mostrar
da forma quep)em
H (q, =
||2
p + V (q ) que tem mı́nimo local q0 para V , pode ser represen-
tado localmente através de mudanças de coordenadas deste forma
(ver [A-M] e [Milnor]).
A equação de Hamilton, neste caso, é separável em n equações
′′
qi −a q i i = 0, i ∈ {1, 2,...,n }.
Não é difı́cil ver que cada plano (qi , pi ) é invariante pelo fluxo Ha-
miltoniano φt , que cada trajet´oria (qi (t), pi (t)) é periódica no plano
(qi , pi ) e que s˜ao válidos em cada um destes planos ( qi , pi ) os resul-
tados que obtivemos na Se¸cão 7, Capı́tulo 3 [L], obtendo variáveis
i i i
ação-ângulo ( θ , I ) e frequências wi = w(I ) = ai , i
O fluxo Hamiltoniano φt em coordenadas a¸cão-ângulo é dado por
∈{ }
1, 2,...,n .
(θ i (t), I i (t)) = ( θ0i + ai t (mod1), I0i ).
É fácil ver que o conjunto dos ( θ 1 , I 1 , θ 2 , I 2 ,...,θ n , I n ) tal que

I 1 = I01 , I 2 = I02 ,...,I n


= I0n

define uma superf´ıcie S invariante para o fluxo Hamiltoniano.


47

Logo fixada a condição inicial ( θ01 , I01 , θ02 , I02 ,...,θ 0n , I0n ), de maneira
análoga ao caso unidimensional tratado acima, nas coordenadas
(θ1 ,..,θ n ) o fluxo Hamiltoniano φt restrito a S se escreve como

St (θ01 ,...,θ 0n ) = (θ 1 (t), θ 2 (t),...,θ n (t)) =

= (θ01 + ai t(mod1),...,θ 0n + an t(mod1))


e define em S uma translação St condicionalmente periódica no sen-
tido anteriormente considerado.
Pergunta: O fluxo Hamiltoniano é ergódico quando restrito a tal
superfı́cie S ?
Como veremos, a resposta é afirmativa se os ai são racionalmente
independentes.
Note que o resultado a seguir n˜ ao é para a superfı́cie de Ener-
gia constante E , mas para a superfı́cie S acima definida (e que est´a
estritamente contida num nı́vel de Energia E ).
A partir do Teorema 2.3 e da Observa¸cão 2.7, concluı́mos que no
1 2 2 1 2 2
caso do sistema mecˆanico com potencial V (q ) = 2 a1 q1 + ... + 2 an qn ,
o fluxo φt = St é ergódico em S se os a1 ,...,a n são escolhidos ao
acaso de acordo com a probabilidade uniforme. Em fun¸cão do que
foi dito acima no caso de um sistema mecˆ anico real, assumir que os
ai satisfazem tal propriedade é uma hipótese bastante razoável.
O resultado obtido para ( θ 1 , I 1 ,...,θ n , I n ) pode ser tranferido via
mudanças de coordenadas para o sistema Hamiltoniano inicial nas
variáveis ( q, p). Sendo assim, podemos afirmar neste caso, que lo-
calmente em torno do ponto de equilı́brio (0, 0) no plano ( q, p), a
Hipótese de Boltzmann vale para a superfı́cie com vari´avel Ação
I0i , i
∈{ 1, 2,..,n constante, se o potencial V (q ) = 12 a21 q12 + ... 12 a2n qn2
}
é tal que os ai , i ∈{ }
1,..,n são escolhidos ao acaso de acordo com
a probabilidade uniforme em Rn . Sendo assim, localmente e neste
sentido um pouco mais fraco (restri¸ cão sobre uma escolha ao acaso
dos ai ), a Hip´otese de Boltzmann é verdadeira.
Chamamos a aten¸cão para um fato: a ergodicidade do fluxo St
não implica a ergodicidade do difeomorfismo T = St para um valor t
fixo.
Agora nos concentraremos no estudo de uma das muitas aplicações
dos sistemas dinˆamicos no toro: o problema de Lagrange, que surgiu
48 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

de algumas quest˜oes de Mecˆanica Celeste e que tem estimulado o


desenvolvimento da teoria das fun¸cões quase periódicas.
Considere um sistema constituı́do por n pêndulos com hastes de
tamanhos distintos acoplados um ao outro e com o extremo inicial
fixo (ver Figu ra 2.4) . Sejam n números complexos a1 , a2 ,...,a n (n
vetores no plano). Examinaremos a curva no plano complexo dada
pela equação
z(t) = a1 e2πiλ1 t + a2 e2πiλ2 t + ... + an e2πiλn t .

O significado geométrico da função z é o seguinte: suponhamos


que haja um vetor a1 no plano, que o vetor a2 esteja ligado à extre-
midade de a1 e que cada um dos outros esteja ligado ` a extremidade
do anterior. Se a1 girar em torno de sua srcem fixa (o ponto (0,0))
com velocidade angular constante λ1 , a2 girar ao mesmo tempo em
torno de sua srcem (a extremidade de a1 ) com velocidade angular λ2
e assim por diante, a curva dada por z é a trajetória da extremidade
do vetor an . A Figura 2.5 ilustra o caso em que n = 3.
Suponhamos que z(t) não se anule para nenhum t. Então podemos
representar z(t) na forma
z(t) = r(t)e2πiφ(t) ,

onde φ é uma função contı́nua de t (veja a Figura 2.5).


Lagrange formulou a seguinte pergunta: “Existe
1
ω = lim φ(t),
t→∞ t

e, se existir, como podemos determiná-lo?” Em outras palavras,


com que velocidade angular média a extremidade do vetor an gira
em torno da srcem do vetor a1 ?
A resposta, no caso em que

|a | + |a | + ... + |a | < |a | ,
2 3 n 1 (2.1)

é simples de ser obtida, pois φ(t) = λ1 t + α(t), onde α é uma função


| |≤
limitada, ou seja, α(t) αmáx. Claramente, temos que ω = λ1 .
Isto se deve ao fato que a rota¸ cão limite de z(t) é determinada
apenas por a1 , pois as outras hastes s˜ao muito curtas em rela¸cão a
a1 .
49

Se a desigualdade (2.1) n˜ao for v´alida, o problema torna-se razo-


avelmente difı́cil, sendo que o próprio Lagrange o resolveu somente
com dois vetores.
Consideraremos, agora o caso genérico com n hastes, onde exibi-
remos a relação entre esse problema e a teoria erg´odica.
Tomando os logaritmos de ambos os lados da equa¸ cão de z(t),
obtemos  
1
φ(t) = Re log z(t) ,
2πi
(onde Re(z) representa a parte real de z, isto é, Re(a + bi) = a) e
então n


(t) = Re
 ′
1 z (t)
 
= Re k=1n
λk ak e2πiλk t
=
dt 2πi z(t)  ak e2πiλk t
k=1
n
 || λk ak e2πi (xk +λk t)
= Re k=1n ,
| |
k =1 ak e2πi (xk +λk t)
onde x = (x1 , x2 ,...,x n ) determina a posi¸cão inicial dos vetores a1 ,
a2 , ..., an , ou seja,
ak = ak e2πixk , 1
| | ≤k≤n
(note que, utilizando a igualdade anterior, podemos escrever
z(t) = a1 e2πi (x1 +λ1 t) + a2 e2πi(x2 +λ2 t) + ... + an e2πi (xn +λn t) ).
| | | | | |
Consideremos o toro Tor n = [0, 1)n e o fluxo condicionalmente
periódico determinado pelo vetor λ = (λ1 , λ2 ,...,λ n ). A medida uni-
forme µ no toro (visto como subconjunto do Rn ) é invariante para o
fluxo como já vimos antes. Suponhamos inicialmente que os n´umeros
λ1 ,...,λ n sejam racionalmente independentes, de forma que o fluxo
correspondente seja ergódico.
Usando a nota¸cão aditiva, definamos a seguinte fun¸cão em Tor n :
n
 || λk ak e2πixk
f (x) = f (x1 ,...,x n ) = Re k=1n
| | . (2.2)
ak e2πixk
k=1
50 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

Então, é válida a igualdade



(t) = f (St x),
dt
e, por isso,
t2

φ(t2 ) − φ(t1 ) =  t1
f (Sτ x)dτ.
O limite que desejamos encontrar pode ser, portanto, reescrito
como 
φ(t) 1 t
lim = lim f (Sτ x)dτ.
t→∞ t t→∞ t 0

Se a fun¸cão f fosse limitada e contı́nua, este limite existiria para


todo x Torn e seria, de acordo com o teorema erg´ odico, igual a

 fdµ.
Torn
Contudo, o denominador em (2.2) pode se anular. A condi¸cão
n
| ak e2πixk =0
| (2.3)
k=1

é, na verdade, um sistema de duas equações em rela¸cão a x1 ,...,x n


(tanto a parte real como a imagin´ aria da soma devem ser iguais a
zero). Isso implica que os pontos onde a equação (2.3) vale constituem
uma subvariedade diferenciável de codimens˜ao 2 em Tor n = [0, 1)n .
Portanto, o conjunto de todas as trajet´orias que a interceptam é uma

subvariedade de dimens˜ao n 1, e sua probabilidade uniforme em
[0, 1)n é zero. Então, para uma trajet´oria escolhida aleatoriamente, a
equação (2.3) não vale com probabilidade 1. Usando essas considera-
ções, suponhamos que o teorema erg´odico seja aplic´avel e substitua-
mos a integral ao longo da trajet´ oria pela integral sobre o toro.
Temos que
n
 f dµ = Re
  || k=1
n
λk ak e2πixk
dx1 dx2 ...dxn =
n
 | |
λk ak Wk ,
n
Tor Torn
| | ak e2πixk k=1
k =1
51

onde  e2πixk
Wk = Re n dx1 ...dxn .
Torn | | aj e2πixj
j =1

É importante interpretarmos esse resultado. Para tal fim, deve-


mos reescrever a integral sobre o toro na forma de integrais iteradas,
efetuando a integra¸cão em rela¸cão a xk . Então,

Wk = Re
  1
e2πixk

dxk dx1 ...dxk−1 dxk+1 ...dxn ,
Torn−1 0 B + ak e2πixk
| |
onde B é o somatório de todos os termos tais que j = k. 
Quando xk varia de 0 a 1, o ponto Z = B + ak e2πixk descreve | |
um cı́rculo C no plano complexo na Figura 2.5. Portanto,
 1
e2πixk
dxk =
1
 1
Z ′ (xk )
dxk =
1
 1
dZ.
| |
B + ak e 2πix k 2πi ak | | Z (xk ) 2πi ak | | Z
0 0 C

| |
A última expressão é igual a 1 ak , se o disco delimitado por C
contém a srcem; caso contr´ario, é igual a zero.
O cı́rculo delimita um disco contendo a srcem se B < ak . | | | |
Logo,
1  n 1

Wk =
| |
ak
P (x1 ,...,x k−1 , xk+1,...,x n ) ∈ Tor − ||B| < |a | k ,

onde P é a probabilidade de Lebesgue em Torn−1 .


A independência racional de λ1 ,...,λ n implica a de

λ1 ,...,λ k−1 , λk+1,...,λ n .


n 1
Portanto,
caso, o tempoorelativo
fluxo em Tor
que também
uma−trajet´ oria éescolhida
ergódico.aleatoriamente
Como, nesse
permanece em um dado conjunto mensur´avel é igual à probabilidade
deste, o resultado obtido pode ser interpretado da seguinte maneira:
| |
ak Wk é a parte desse tempo em que a rotação do vetor ak contribui
para a fun¸cão φ.
O problema de Lagrange ilustra um fato que é bastante natural em
Mecânica Clássica: existe um conjunto desprezı́vel de situações ruins,
52 [CAP. 2: O TEOREMA ERG ÓDICO E A HIP ÓTESE DE BOLTZMANN

mas para condições iniciais fora deste conjunto de probabilidade zero,


um resultado bastante forte e preciso do ponto de vista estatı́stico
pode ser enunciado para o sistema mecˆanico em considera¸cão.

Exercı́cios
×
1. Mostre que se A = γ for uma curva diferenciável em [0, 1] [0, 1],
então A tem probabilidade zero para probabilidade uniforme em
×
[0, 1] [0, 1].
2. Considere P a probabilidade uniforme em [0 , 1]. Mostre que se
F é um difeomorfismo de classe C 1 de [0 , 1] em si mesmo e A
tem probabilidade zero, ent˜ao F (A) tem probabilidade zero.
3. Seja T (x) = 2x (mod 1), T [0, 1] →
[0, 1]. Mostre que T é in-
variante e é ergódica para a probabilidade uniforme P . Su-
gestão: considere um conjunto A e escreva IA em série de
Fourier. A seguir, suponh a que T −1 (A) = A, e conclua que

IT −1 (A) (x) = IA T (x) = IA (x). O resultado é obtido igua-
lando os correspondentes coeficientes de Fourier de IA e IA T . ◦
4. Mostre que se λ é irracional, então T (x) = x + λ (mod 1),
T [0, 1] → ⊂
[0, 1], é tal que existe um conjunto K [0, 1] tal que

para todo x K a órbita de x é densa em [0, 1].
5. Mostre que uma superfı́cie de dimensão d < n em Rn tem
probabilidade uniforme 0 em Rn
6. Mostre que o conjunto dos p ontos ( x1 , x2 ,..x n ) racionalmente
independentes tem medida total em Rn .
Capı́tulo 3

A Teoria de Aubry para


Quase-Cristais e
Exemplos do Tipo
KAM

Vamos descrever a seguir uma vers˜ ao discretizada da A¸cão de um


Sistema Hamiltoniano que é semelhante em um certo sentido ao pro-
cedimento que utilizamos na se¸ cão 11 na qual analisamos bilhares
determinados por curvas convexas. Neste modêlo o fênomeno deno-
minado KAM (de Arnold, Kolmogorov e Moser) irá aparecer e iremos
fazer uma análise matemática do problema em primeira aproximação.
Ressaltamos que alguns dos resultados apresentados nesta se¸ cão
não estão de todo formalizados de maneira matematicamente rigo-
rosa. Nosso objetivo é apresentar algumas das idéias e conceitos
principais como motivação para o estudo da Teoria de Aubry-Mather
[CRZ], [Au1], [Au2], [CI], [Fat], [M2], [MH], [MF], [dL], [B] e [LC].
A equação de Hamilton para o Hamiltoniano natural H (q, p) =
1 2
2 p − ∈
V (q ),q,p R é

q̇ = p

53
54 [CAP. 3: A TEORIA DE AUBRY

∂V
p˙ = .
∂q
Trocamos o sinal do potencial V acima apenas para obter ao fi-
nal de nossas considera¸cões um sistema a tempo discreto dentro da
notação de Aubry [Au1] e [Au2].
Uma versão em diferenças finitas de tal equa¸cão é

qi+1 = qi + pi+1 ∆t
∂V
pi+1 = pi + ∆t
∂q i
| qi .

Tomando ∆t = 1, obtemos
∂V
G(qi , pi ) = (qi+1 , pi+1 ) = (qi + pi+1 , pi
∂q i
|
qi ).

O leitor pode facilmente checar que tal transforma¸ cão do plano


no plano preserva área, bastando para isso mostrar que a matriz
Jacobian tem determinante 1.
Aplicações do tipo acima representam uma vers˜ ao discretizada
das equações de Hamilton e preservam ´area como veremos em breve
(ver Lema 3.1).
Na verdade existe um modêlo com real significado fı́sico que pode
ser representado por tal aplicação. Este modelo (ver [B], [MF], [Au1],
[Au2] e [Me] para mais detalhes) ser´a brevemente descrito abaixo.
A teoria que vamos considerar agora aparece na an´alise de alguns
modelos fı́sicos para ions mergulhados em plasma. Consideraremos
também alguns exemplos da Teoria KAM que aparecem no modêlo.
Não iremos fazer uma an´ alise completa da equa¸cão das curvas
que aparecem nos fenˆomenos da Teoria KAM (Kolmogorov-Arnold-
Moser), mas iremos apenas dar uma vis˜ao esquemática de como ana-

lisar a equa¸cão
O problema comassociada `as curvas KAM
esta simplifica¸cão em primeira
permitirá ao leitoraproxima¸cão.
ter uma idéia
porque aparecem pequenos denominadores e propriedades da Teoria
dos Números (ver [Le] e [Kh] para referência) e das Séries de Fourier
(ver [Fi] e [Ju] para referência) na Teoria. Com esta simplificação
estaremos evitando certos detalhes técnicos complicados (mas im-
portantes [A2], [H] e [Ba]), e cuja dificuldade est´a acima do nı́vel que
desejamos manter no presente texto.
55

Considere na reta real o Potencial V (u) peri´odico de perı́odo 1


e assuma também que V (0) = 0 , V ′ (0) = 0 e V ′′ (u) > 0, u ∀ ∈

( 1/2, 1/2] (ou alternativamente em (0 , 1]). Vamos considerar (Fi-
gura 3.1) como um caso particular importante o exemplo em que

1
V (u) = 2 (1 − cos2 πu).
O modelo que vamos analisar é descrito por vários átomos cuja
posição ui∈ { }
R é descrita por arranjos ui i∈Z , onde i ∈
Z. Estes
átomos formam uma cadeia e est˜ ao acoplados de forma que cada
átomo na posição ui sofre influência apenas dos átomos vizinhos nas
posições ui−1 e ui+1.
{ }
Nosso objetivo é analisar os arranjos ui i∈Z que tem significado
fı́sico real. A seguir vamos descrever como são tais arranjos.
O termo de energia cinética na reta real será dado por

1 2
W (u) = u ,
2
que vai ser na verdade uma fun¸cão da distância entre ui+1 e ui . Mais
precisamente, a energia cinética será dada por

W (ui+1 − u ) = 12 (u − u ) .
i i+1 i
2

u u
Fazendo um analogia com a Mecˆanica Cl´assica, o valor i+11− i
faz o papel da velocidade (ou momento) no modelo, e assim por sua
vez 12 (ui+1 ui )2 desempenha o papel da Energia Cinética.

A idéia neste modelo é substituir equações diferenciais da Mecânica
Clássica por equações de diferenças. Deste modo, de maneira análoga,
é natural introduzir um parâmetro externo λ que vai estabelecer a
altura do po¸co do potencial λV .
De maneira an´aloga ao caso cl´ assico (n˜ao discretizado), o La-
grangiano natural S agindo sobre cada part´ıcula, é Energia Cinética
menos Energia Potencial, ou seja a a¸cão individualizada ligando ui a
ui+1 vai ser dada por

S (ui+1 , ui ) = λV (ui ) + W (ui+1 −u )i (3.1)


56 [CAP. 3: A TEORIA DE AUBRY

{ }
Definição 3.1. Considere um arranjo ui i∈Z . Para n < m fixados,
{ }
a Aç˜ao Total do arranjo ui i∈Z de n a m é dada por
m 1
− m 1
−
φ({u }) =
i λV (ui ) + W (ui+1 −u )=
i S (ui+1 , ui ).
i =n i =n

A Ação Total de n a m é a soma das Ações individuais (3.1) e



corresponde na Mecˆanica Clássica à Sdq.

{ }
Definição 3.2. Um arranjo ui i∈Z vai ser minimal para a A¸ c˜
ao
Total, se para todo n e m fixos n < m, e para todo arranjo vi tal { }
que vn = un e vm = um vale que
m 1
 −
{ }
φ( ui ) = λV (ui ) + W (ui+1 − u ) ≤ φ({v }) =
i i
i =n

m 1 −
= λV (vi ) + W (vi+1 vi ).

i=n −
A condi¸cão de um arranjo ser minimal, acima definida, é clara-
mente inspirada pelo Princı́pio de Mı́nima Ação (ver Se¸cão 9, Capı́-
tulo 3 [L]).

Definição 3.3. Um arranjo ui i∈Z é cr´ { }


ıtico para a A¸
c˜ao Total se
para todo n e m, n < m fixados vale que
∂φ
∂u i
= 0, ∀ i ∈ {n + 1, m − 1}.
Isto é, um arranjo é crı́tico se mantendo os extremosun e um fixos

epara
variando as posi¸
cõescões
tais varia¸ ui . intermediárias ui , a express˜
Note a semelhança ao acima
da ´ultima é cr´
expressão ıtica
com
a Proposição 1.2 da Se¸cão 1 sobre bilhares convexos.
Todo arranjo minimal é claramente crı́tico, embora a recı́proca
não seja sempre verdadeira. Na teoria que vamos brevemente des-
crever a seguir, do ponto de vista fı́sico e também do ponto de vista
matemático, os resultados interessantes concernem os arranjos mini-
mais e n˜ao apenas os arranjos crı́ticos.
57

Os arranjos que s˜ao fisicamente observados no problema acima


descrito são na verdade os arranjos minimais.
Primeiramente vamos determinar um método para encontrar ar-
ranjos crı́ticos.
Note que para um arranjo { }
ui i∈Z , cada valor ui , n < i < m
aparece na ação total φ de n a m em apenas dois termos

S (ui+1, ui ) + S (ui , ui−1 ) =

λV (ui ) + W (ui+1 − u ) + λV (u − ) + W (u − u − ).
i i 1 i i 1

Para calcular a express˜ao do arranjo crı́tico, derivamos a última


expressão em rela¸cão a ui e considerando V , W como acima, obtere-
mos
0 = λV ′ (ui ) (ui+1 ui ) + (ui ui−1 ).
− − −
Logo, obtemos a equa¸cão

0 = λV ′ (ui ) + 2ui − (u i+1 + ui−1 ),

a qual todaassim,
Sendo solu¸cão { }
ui i∈Z deve
cr´ıticade maneira
obtemos satisfazer.
equivalente

− λ2 V ′(u ) = u − u
i i
i+1 + u i− 1
2
. (3.2)

Por exemplo, como V (0) = 0 e W (0) = 0, concluı́mos que o


∀∈
arranjo ui = 0, i Z, é cr´ ıtico para a¸
cão total.
Uma interpretação pictórica da expressão (3.1) é que a força (me-
nos a derivada do potencial)

− λ2 V ′(u )i

émédio ui+1 +uipelo


equilibrada deslocamento ui da posição
deligando
2
−1
) da corda elástica ui−1 a de equilı́brio
ui+1 (ponto
(Lei de Hooke)
conforme mostra Figura 3.28.
{ }
Deste ponto de vista, o arranjo ui i∈Z parece descrever um
elástico fixo na posi¸cão un e um , em que pela Lei de Hooke, o afasta-
u ui+1
mento do elástico na posi¸cão ui da posi¸cão intermediária i−1 + 2 ,
é equilibrada pela força criada pelo potencial agindo em cada reta
x = i.
58 [CAP. 3: A TEORIA DE AUBRY

O modelo acima descreve exatamente quase-cristais, que s˜ao ob-


jeto de estudo recente em Fı́sica da Matéria e da Teoria do Plasma
[Au].
Voltemos agora a analisar que propriedades podemos obter sobre
os arranjos crı́ticos definidos acima.
A expressão (3.2) para um arranjo crı́tico ui i Z pode ser ex-
pressa numa rela¸cão de três termos como ∈ { }
ui+1 = λV ′ (ui ) + 2ui −u− .i 1

No modelo em que V (u) = 12 (1 cos2 πu), um arranjo crı́tico (ver



Definição 3.3) pode ser calculado conforme (3.2) por uma rela¸ cão de
três termos
ui+1 = λπ sin2 πu i + 2ui ui−1 .−
{ }
Logo o arranjo ui i∈Z pode ser calculado a partir de u0 e u1
inicial pela rela¸cão de três termos acima descrita.
Passando a uma rela¸cão de pares ( ui+1 , ui ) obtemos

ui+1
    
ui =T ui
ui−1 = 2ui
ui + λπ sin2 πu
i −u−
i 1 
a partir de coordenadas iniciais ( u1 , u0 ) R2 .

{ }
As soluções cr´ıticas ui i∈Z são obtidas portanto através das ór-
bitas de T .
É natural interpretar o momento pi como uma nova variável,

pi = ui −u− ,i 1

em fun¸cão da analogia do problema descrito acima com a vers˜ ao


discretizada da Mecˆanica Clássica no espa¸co de fase ( p, q ) = (p, u).
Vamos a seguir expressar a aplicação T mencionada anteriormente

em Antes
coordenadas ( p, u).
disso, note { } {
também que se ui i∈Z é arranjo cr´ıtico, ui +
}
1 i∈Z também é arranjo crı́tico. Este fato nos sugere considerar os
ui (mod 1) para simplificar o problema.
Algumas vezes vamos considerar os ui tomados (mod 1) e outras
×
vezes não. No primeiro caso ( ui , pi ) está em [0, 1) [0, 1) e no segundo
caso ( ui , pi ) está em R2 .
Para não confundir o leitor vamos reservar a letra q para u (mod 1).
59


Seja qi o valor ui (módulo 1), como pi+1 = ui+1 ui (mod 1) (que

é o mesmo que qi+1 qi (mod 1)), obtemos a transforma¸cão acima
∈ ×
definida T agindo sobre ( pi , qi ) [0, 1) [0, 1) como

pi pi+1 pi + λπ sin2 πqi (mod 1)


T = =
qi qi+1 pi+1 + qi (mod 1)
    
que é conhecida como a aplicação padrão, ou standard.

Logo a itera¸cão de uma ´orbita T n (p0 , q0 ) = (pn , qn ), n Z a ∈
partir de uma condi¸cão inicial ( p0 , q0 ), vai definir na segunda variável
{ }
ui o arranjo ui i∈Z (a menos de um inteiro) a solu¸ cão crı́tica do
problema acima descrito. Uma infinidade de solu¸cões qi i∈Z são { }
possı́veis, basta tomar diferentes condições iniciais ( p0 , q0 ). Faremos
a seguir (Defini¸cão 3.4, Capı́tulo 3) uma restrição que vai determinar
{ }
um arranjo ui i∈Z de maneira ´unica.
Observo que tomar qi (mod 1) é bastante natural (ou seja supor
que o espa¸co de configura¸cão é compacto), mas tomar pi (mod 1),
em princı́pio não. No caso do modêlo de quase-cristais, no entanto,

éjeito
natural esta segunda
permitem hipótese.
considerar Estas
a iteração de Tduas
numhip ótesescompacto
espaço de qualquer
(ou
seja fechado e limitado).
Duas trajetórias minimais n˜ao podem se cruzar duas vezes como
na Figura 3.2. Esta propriedade é conhecida como a condição Twist
(ver [CRZ] para mais detalhes).
Considerando potenciais V mais gerais ( V (u) ou V (q ) sempre
periódico de perı́odo 1) obterı́amos de maneira análoga uma T defi-
×
nida em [0 , 1] [0, 1] → ×
[0, 1] [0, 1] por

T
    
pi
=
pi+1
=

pi + λV (qi )
 .
qi qi+1 pi+1 + qi

Não estamos
ela está implı́citacolocando
no modeloo termo (mod 1) na express˜ao acima, mas
em consideração.
A aplica¸cão padrão preserva ´area. Mostraremos na verdade no
caso mais geral (n˜ao somente para V (q ) = 12 (1 cos2 πq )), que a

aplicação T , obtida acima a partir de um potencial V qualquer, pre-
serva área. As Figuras desta se¸cão que descrevem iterações de T para
o caso de V (u) = 12 (1 cos2 πu) ocorrem também em outras situações

quando se considera um V geral.
60 [CAP. 3: A TEORIA DE AUBRY

Vamos usar, a partir de agora, indistintamente as letras q ou u e


o contexto vai indicar qual da duas estamos considerando.
Note a semelhança da aplicação acima definida com a que apresen-
tamos no começo desta seção e associada `a discretização da equa¸cão
de Hamilton.

Lema 3.1. A aplicaç˜


ao T dada por

T
    
pi
=
pi+1
=

pi + λV (ui )
 (3.3)
ui ui+1 pi+1 + ui
preserva ´area.
Demonstração:
Vamos considerar S (Q, q ) = S (un+1 , un ) abaixo.
Desejamos mostrar que
∂S
∂u n
(un+1 , un ) = −p n

e
∂S (un , un+1 ) = pn+1
∂u n+1
A segunda equa¸cão acima descreve trivialmente o que acontece
com a variável pn pela iteração de T (p, u), pois
1 2
S (un+1, un ) = λV (un ) + (un+1
2
−u ) n

e pn+1 = (un+1 un ).−


A equação das trajet´orias cr´ıticas
∂φ ∂S ∂S
0= = (un+1 , un ) + (un , un−1 ).
∂u n ∂u n ∂u n

Ora, como vimos


∂S
∂u n
(un , un−1 ) = un −u − n 1 = pn .

Portanto, da equação da trajet´oria cr´


ıtica
∂S
∂u n
(un+1 , un ) = − ∂u∂S (u , u − ) = −p
n
n n 1 n (3.4)
61

Logo fica definida através de S uma função geradora de mudanças


de coordenadas
(pn , un ) = (p, q ) → (p n+1 , un+1 ) = −(P, Q)
através de

S (Q, q ) = S (un+1 , un ) = λV (un ) + 12 (un+1 un )2 = −


1
= λV (q ) + (Q q )2 . − (3.5)
2

Note que (P (q, p), Q(q, p)) preservar área é equivalente a
(P (q, p), Q(q, p))
preservar área.
A fun¸cão (pn , qn ) →(pn+1 , qn+1 ) assim definida é a T anteri-
ormente considerada. Fica assim determinado (ver Proposição 17,
Capı́tulo 3 [L]) que a transformação T preserva área e é da forma
pn pn+1
T un
    = un+1 .
onde
∂S
∂u n
(un+1 , un ) = − ∂u∂S (u , u − ) = −p
n
n n 1 n

e
∂S
(un+1 , un ) = pn+1 .
∂u n+1

{ }
Existem infinitos possı́veis arranjos ui i∈Z . Necessitamos impor
condições de fronteira do seguinte tipo:

lim
−u =l
un n′

− →∞ n − n′
n n
para assim determinar uma solu¸cão cr´
ıtica única a partir de l.
Definição 3.4. Dada uma configura¸c˜ ao cr´ıtica {u } ∈ , o valori i Z l
dado por
u −u n n′
lim =l
− →∞ n − n′
n n′

é chamado distˆ
ancia média atˆ
omica (ou n´umero de rotaç˜ao).
62 [CAP. 3: A TEORIA DE AUBRY

Na definição acima devemos considerar u1 e não qi .


Em princı́pio não há garantia de que exista tal limite para uma
configuração qualquer. l também é chamado de número de rota¸cão
{ }
da configuração ui i∈Z .
Estamos considerando na expressão acima que os un , un′ não são
tomados (mod 1). Sendo assim l representa uma inclinação média do
conjunto de pontos ( i, ui ), i ∈ Z, vista com subconjunto de pontos
do R2 .
Observe que quanto mais pr´oximo de zero for l, o deslocamento
para a direita de n produzirá muitos pontos muito pr´oximos ui (mod
1). Neste caso a distˆancia média entre elementos ui deverá ser muito
menor do que para inclina¸cões grandes de l. Fica assim justificado o
nome de distância média atômica. 
n

Outra interpretração de l é a seguinte: como un un′ = i=n′ +1 pi ,
podemos pensar que l é o momento médio da trajet´ oria. Isto porque

un −u n′
=
 n
i=n′ +1 pi
.
n − n′ n − n′
Propriedade Importante: É possı́vel mostrar (ver [Ba]) que fixado
l, sob certas condi¸cões, obtem-se um ´unico arranjo minimal ui i∈Z { }
(no sentido da Definição 3.2) com tal valor de distância média atômica
l (momento médio).
Fazendo analogia com a Mecânica Clássica, fixados posi¸cão e mo-
mento médio, desejamos encontrar de maneira única uma solu¸cão
{ }
ui i∈bf Z (que será mı́nima) com aquela posição inicial e com aquele
momento médio.
No caso λ = 0, então ui = il+α (linear em i) é solu¸
cão, e portanto,
ao menos neste caso trivial, sabemos que existe a inclina¸ cão media
{ }
associada a tal ui .

seráNo casoem
densa λ= 0, se
[0,1] irracional, a solução ui = il + α (módulo 1)
l é[A2]).
(ver
A questão relevante no modelo acima descrito é analisar no caso

geral λ = 0, o arranjo minimal associado a cada valor l. Isto é
para cada condi¸cão de fronteira l, deseja-se encontrar propriedades
da solução minimal com inclina¸cão média l.
Nesta direção, o seguinte Teorema (ver [Ba]), que n˜ ao será de-
monstrado, é de fundamental importância.
63

Teorema 3.1. Dada uma configura¸c˜ { }


ao ui i∈Z mı́nima, existem l
e α tal que para qualquer i, os valores ui e il + α (n˜ao estamos
considerando mod 1) est˜ao no mesmo intervalo [mi , mi + 1] onde mi
é um n´
umero inteiro.
Segue portanto deste teorema que toda solu¸cão minimal tem um
valor de distância média atômica l.
Definição 3.5. O valor α acima apresentado é denominado a fase
da configuraç˜ao cr´ıtica ui .
O próximo teorema vai apresentar um resultado bastante preciso
{ }
sobre as soluções minimais ui i∈Z . Antes necessitamos algumas de-
finições e resultados da Teoria dos N´ umeros (ver [A2], [Kh] e [Le]
para referências gerais sobre os tópicos que serão considerados aqui).

Definição 3.6. Um n´umero l > 0 é do tipo Diofantino se existe


γ > 0, r > 2 tal que ∀
p, q N ∈
p 1
− 
l q > γ qr . (3.6)

Um número deste tipo é mal aproximado p or racionais , ou seja,


ele é “muito irracional”.
Lembre (ver Definição 2.2, Capı́tulo 2) que um subconjunto D da
reta tem medida zero se para qualquer ǫ pequeno existe uma cober-


tura de D por intervalos [ ai , bi ], i N tal que ∞ (b a ) < ǫ.

i=1 1 i
Ou seja D é desprezı́vel em termos de comprimento, embora possa
ser um conjunto até mesmo denso em R (por exemplo o conjunto dos
racionais tem medida zero).
Lembre também (ver Definição 2.3, Capı́tulo 2) que dizemos que
um subconjunto A tem medida total na reta, se o seu complementar
é desprezı́vel, ou seja que o seu complementar tem medida zero.
Observação 3.1. Se r > 2 e γ > 0 est˜ ao fixados, é possı́vel mostrar
(veja [A2]) que o conjunto de n´ umeros que satisfazem (3.6) na defi-
niç˜ao acima, tem medida total em R. Sendo assim, se escolhermos
um n´umero ao acaso de acordo com a probabilidade uniforme em
R, este n´umero ser´a Diofantino. Nem todos os n´umeros reais s˜ao
Diofantinos.
64 [CAP. 3: A TEORIA DE AUBRY

Figura 3.1:

Todo número irracional pode ser aproximado por frações contı́nuas,


isto é, x pode ser expresso da seguinte forma
1
x = n0 + 1 , (3.7)
n1 + n2 + n 1
3 +...

onde os ni são números naturais.


O procedimento é o seguinte: dado x, subtraia sua parte inteira,
obtendo x n0 (0, 1). Portanto, x−1n0 > 1. Seja n1 a parte inteira
− ∈
de x−1n0 , logo x1 = x−1n0 n1 (0, 1].
− ∈
1
Portanto x = n0 + n1 +x1 .

Aplique agora o mesmo procedimento a x1 , isto é, considere n2 a


parte inteira de x11 e x2 = x11 n2 (0, 1] obtendo assim
− ∈
1
x = n0 + 1 .
n1 + n 2 +x 2

Repetindo o mesmo procedimento para x2 e indutivamente assim

por diantex obtemos


números a expans˜
tal que tal ao de x termina
procedimento em frações contı́nuas
em algum (3.7). Os
instante n
(isto é, xn = 0 ou xn = 1) são os n´umeros x racionais.
65

2 1.6

1.4

1.5

1.2

1 1

0.8

0.5

0.6

0 0.4

1 1.5 2 2.5 1.4 1.6 1.8 2 2.2 2.4 2.6

1.3 2

1.2

1.5

1.1

1 1

0.9

0.5

0.8

0.7 0
1.7 1.8 1.9 2 2.1 2.2 2.3 1 1.5 2 2.5 3
66 [CAP. 3: A TEORIA DE AUBRY

1.75

1.5

1.5

1.25

1
1

0.75

0.5
0.5

0.25

0 0
1 1.5 2 2.5 3 1.2 1.3 1.4 1.5 1.6

2
1.4

1.5
1.2

a
t
e 1
h
1 t

0.5
0.8

0.6 0
1 1.5 2 2.5 3
1.6 1.8 2 2.2 2.4 p

Seja x irracional e k ∈ N, vamos denotar por


pk 1
= n0 + 1
qk n1 + n2 + n 1
3 +...+ n
1
k

o aproximante de ordem k de x, onde pk , qk ∈ N.


O seguinte resultado é demonstrado em [A2].

Teorema 3.2. Para qualquer n´umero real irracional x, aproximado


67

for fraç˜ao contı́nua da forma


1
x = n0 + 1
n1 + n2 + n 1
3 +...

ni ∈ N, i ∈ N, é v´alido que
 − 
x pk < 1 .
qk qk2
Ou seja r > 2 na defini¸cão de n´umero Diofantino é uma propri-
edade nem sempre satisfeita para x qualquer, mas tomando γ = 1 e
r = 2 é sempre possı́vel aproximar qualquer número real x por racio-
nais pqkk como acima no último Teorema. No que segue, ser´a essencial
assumir que l é do tipo Diofantino satisfazendo (3.6) com r > 2.
A expans˜ao em fra¸cões contı́nuas surgiu inicialmente em Mate-
mática como um procedimento eficaz para aproximar um n´ umero
irracional x por n´umeros racionais. A aproximção de x de ordem k
é obtida quebrando a expansão em fra¸cões contı́nuas no termo nk ,
pk
obtendo assim um n´umero racional qk .
Em geral a aproxima¸cão por fra¸cões contı́nuas é melhor que as
outras maneiras conhecidas (o erro decai como q12 como se pode ob-
k
servar pela última desigualdade).
Posteriormente, a expansão em fra¸cões contı́nuas se mostrou útil
e fundamental para analisar uma série de questões de Aritmética e
também em questões de Mecânica Clássica e Geometria Diferencial.
Note que quanto maiores forem os ni , maiores serão os correspon-
dentes qk , permitindo assim melhores aproxima¸cões por racionais do
numero irracional considerado.
Exemplo 3.1. O n´
umero π é aproximado em fraç˜oes continuas de
ordem 3 por
p3 = 333
q3 106
A aproximaç˜ao é de 6 casas decimais.
Exemplo 3.2. O n´
umero real β dado pela raz˜ao ´aurea satisfaz
1
√5 + 1
β = 1+ 1 =
1+ 1+ 1+1...
2
68 [CAP. 3: A TEORIA DE AUBRY

e portanto é super mal aproximado por racionais (os qk crescem deva-


gar porque os ni = 1 s˜ao os menores possı́veis). Logo podemos dizer
que a raz˜ao ´aurea é o mais irracional dos n´
umeros reais.
Para mostrar que este n´umero β tem a expans˜ao em fraç˜oes con-
tı́nuas acima basta observar que β satisfaz a equa¸c˜ao

1 + 1 = β.
β
Vamos agora apresentar o resultado mais importante desta se¸ cão
e que é apresentado de maneira resumida em [Au].
Teorema 3.3. Suponha que l, a distˆancia média entre atomos,
´ seja
{ }
irracional para uma certa configuraç˜ao minimal ui i∈Z , ou seja,
{ }
ui i∈Z satisfaz

(ui −u i+1 ) + (ui − u − ) = −λV ′(u ) (mod1).


i 1 i (3.8)

e ainda é mı́nima no sentido da Defini¸


c˜ao 51, Cap´ıtulo 3.
Ent˜ao existe f mon´otona crescente tal que
ui = f (il + α) (mod1).

a) Se f é descont´ınua, o conjunto das descontinuidades é denso.


b) Se o n´ umero l é Diofantino, ent˜ ao existe λcr´ıtico(l) tal que
para λ < λcr´ıtico(l) a funç˜ao f é cont´ınua.
69

1.75

1.5

1.5

1.25

1
1

0.75

0.5
0.5

0.25

0 0
1.6 1.625 1.65 1.675 1.7 1.725 1.7 1.8 1.9 2 2.1 2.2 2.3

2
1.15

1.1

1.5

1.05

1 1

0.95

0.5

0.9

0.85
0
1.94 1.96 1.98 2 2.02 2.04 2.06 2.275 2.3 2.325 2.35 2.375 2.4
70 [CAP. 3: A TEORIA DE AUBRY

2 2

1.5 1.5

1 1

0.5 0.5

0 0
1.06 1.08 1.1 1.12 1.14 0.96 0.98 1 1.02 1.04

2
2

1.5
1.5

a
t
e 1
h
1 t

0.5
0.5

0
0 1 1.25 1.5 1.75 2 2.25
0.86 0.88 0.9 0.92 0.94 p

A diferenciabilidade de f vai depender da diferenciabildade de V


e também do valor λ. Dependendo de λ, em alguns casos f é continua
mas não é diferenciável, em alguns casos f é apenas diferenciável de
classe C k e em alguns casos f é anal´ıtica.
É usual e mais pr´atico, em vez de dizer que existe f como acima,
dizer que existe g tal que

ui = f (il + α) = (il + α) + g(il + α). (3.9)

A existência de f é claramente equivalente a existência de g. Va-


mos a seguir mostrar que existe tal g.
71

Figura 3.2:

Observação 3.2. No caso de haver uma fun¸c˜ ao continua f , associ-


ado a um certo valor l irracional, as iteraç˜oes da aplicaç˜ao padr˜ao T
a partir de um ponto inicial (p0 , u0 ) (ou seja u0 , u1 ) v˜ao determinar
{ }
um arranjo ui denso (mod 1) em [0, 1], com inclinaç˜ao média l e
tal que a correspondente ´orbita associada T n (p0 , u0 ) = (pn , un ) deter-
mina através do conjunto dos seus pontos de acumulaç˜ao em R2 uma
curva de Jordan fechada no espa¸co de fase (p, u). Estas curvas s˜ao
chamadas de curvas KAM. O exemplo de uma curva KAM aparece
nas Figuras 3.3 e 12.12.
Vamos explicar ao leitor como determinar a curva KAM em [0, 1] ×

[0, 1] no caso acima descrito. Ora ( pn , un ) = (un un−1 , un ), logo
− −
(pn , un ) = (f (nl + α) f (nl + α l), f (nl + α)).
Logo, ( pn , un ) (mod 1) est´a sobre a curva

(f (u) − f (u − l) (mod1) , f (u) (mod1)).


Se l é irracional, il + α determina um conjunto denso (mod 1)
de pontos no intervalo (0 , 1) e portanto, como afirmamos, o conjunto
dos pontos de acumula¸cão de ( un , pn ) (mod 1) determina a curva

− −
(f (u) f (u l) (mod1) , f (u) (mod1)) , u (0, 1).∈
Nem sempre a um valor irracional l vai corresponder uma curva
KAM.
Quando f não é continua (caso a) do Teorema 3.3, Capı́tulo 3),
fica então determinado pelo fecho da ´orbita T n (p0 , u0 ) um conjunto
“ralo”tipo Cantor (também chamado de conjunto de Aubry-Mather)
conforme mostra Figura 2.3.
72 [CAP. 3: A TEORIA DE AUBRY

Demonstração do item b) do Teorema 3.3: Não vamos dar


uma demonstração completa do item b) do Teorema 3.3, mas apenas
analisar o problema em primeira aproxima¸cão. Vamos considerar λ
pequeno (λ < λcr´ıtico ) e l Diofantino. Neste caso existir´a f continua
e nosso objetivo a seguir é dar uma idéia aproximada porque tal
propriedade é verdadeira (referimos o leitor a [He], [LC], [Ba] e [MF]
para uma demonstra¸cão completa).
Vamos ver como aparece de maneira natural a condição do número
l ser Diofantino no problema em considera¸ cão. Substituindo ui =
il + α + g(il + α) na equa¸cão (ui ui+1) + (ui ui−1 ) = λV ′ (ui )
− − −
obtemos

−λV ′(u ) = il + α + g(il + α) − ((i + 1)l + α)


i

−g((i + 1)l + α) + il + α + g(il + α) − ((i − 1)l + α) − g((i − 1)l + α) =


2g(il + α) − g(il + α + l) − g(il + α − l).
Desejamos saber se existe uma g analı́tica (ou continua ao menos)
satisfazendo a expressão acima

−λV (u ) = 2g(il + α) − g(il + α + l) − g(il + α − l)
i (3.10)

Nosso procedimento será tentar descobrir que tipo de equa¸ cão


deve satisfazer tal g na variável u.

l é irracional, logo os números da forma il+α Z determinam um
conjunto denso em [0, 1) (mod 1) conforme foi visto na se¸cão anterior.

Observação 3.3. No caso geral (λ > λcr´ ıtico) , nem sempre para
{ }
um arranjo ui i∈Z cr´ıtico é verdade que os ui s˜ao densos no inter-
valo [0,1] (embora o conjunto dos il + α seja denso em [0,1] se l é
irracional).
|
Isto se deve do fato que un+1 un − |≤
l + 2 (ver Teorema 3.1) e
da equaç˜ao (3.2)

λV ′ (ui ) = (ui+1 + ui−1 ) − 2u ≤ 2(l + 2),


i

logo
V ′ (ui ) ≤ 2(l λ+ 2) .
73

Portanto, se λ for grande, V ′ (ui ) vai poder assumir apenas valores


pequenos. Seja z tal que V ′ (z) = 0, ent˜ao somente uma pequena
vizinhança A = u V ′ (u) < 4λl de z poder´
{| } a ser visitada pela ´orbita
{ }
ui i∈Z .
Sendo assim, neste caso, o conjunto dos ui n˜ao ser´a denso em
[0, 1). Em muitos destes casos o fecho do conjunto dos ui (mod 1)
é um conjunto tipo Cantor de medida zero. Neste caso o raciocı́nio
que faremos a seguir, usando séries de Fourier n˜ao se aplica.
No que segue é essencial assumir que os ui (mod 1) sejam densos
em [0,1), e isto ocorre quando λ < λcr´ıtico .
A equação (3.10) para g em primeira aproxima¸cão é dada por

λV (u) = 2g(u) − g(u + l) − g(u − l). (3.11)

A primeira aproximação resulta de supor que g(il + α) é pequeno


e portanto que ui seja aproximadamente igual a il + α (pois ui −
(il + α) = g(il + α)). Como os ui são densos, podemos substituir
na equa¸cão (3.10) os ui e os il + α por u [0, 1) e obter assim a

equação para g dada por (3.11). Esta aproximação é verdadeiramente
muito grosseira, mas o esquema da demonstração matemática começa
resolvendo a equa¸cão em primeira aproxima¸cão e depois resolvendo
uma sequência de melhores aproximações da equação (3.10) (ver [H]).
Não demonstraremos esta parte mais sofisticada do teorema aqui e
nos contentaremos apenas em entender a quest˜ao da primeira apro-
ximação. Desta maneira não entraremos em quest˜oes de dificuldade
técnica bastante grande.
Com as hip´otese acima em mente, vamos proseguir na an´alise da
equação (3.9) para g em primeira aproxima¸cão, ou seja da equa¸ cão
(3.11) para g.
Expandindo V ′ em Série de Fourier, obtemos
 ∞
V ′ (u) = Vm ei2πm u .
m= −∞
Vamos tentar obter g em Série de Fourier
∞
g(u) = gm ei2πm u .
m= −∞
74 [CAP. 3: A TEORIA DE AUBRY

Substituindo esta expressão na equa¸cão (3.11), obtemos



− λ2 Vm
g(u) =
 ei2πmu . (3.12)
m= −∞ (1 − cos2 πml)

ma.Observe a existência
Isto porque o termo node denominad
pequenos denominadores
or do quocientena
deequação aci-
cada termo
da série acima vai ficar próximo de zero, pois cos 2πml vai estar, para
certos valores de m, muito pr´oximo de 1 (isto segue do fato que o
conjunto ml,n ∈ Z é denso (mod 1) em [0,1]). Sendo assim n˜ao há
garantia de que para todos valores de u a série formal (3.12) definida
acima convirja. Note no entanto que Vm também vai a zero e podem
haver compensações do denominador e numerador de cada termo da
série (3.12).
Se uma série converge absolutamente, ela converge. Sendo assim,
uma condição suficiente para convergência da série (3.12) acima é

Vm K
−
1 cos(2πml) < m1+B  (3.13)
K , B > 0, ou seja,
 Vm
 1/ 2
<
K
. (3.14)
1+B
1 − cos2 πml m 2

Ou seja, neste caso, o denominador de cada termo da série p ode


ser pequeno, mas Vm é menor ainda.

Observação 3.4. Note que a condi¸c˜ ao suficiente acima descrita,


exige apenas que na ´ultima express˜ao 2 > 12 . A seguir vamos mos-
1+B

trar que tal propriedade é verdadeira para certos n´umeros l do tipo


Diofantino.
Quando 2πml est´a pr´oximo de 2π(mod 1), ent˜ao pela F´ormula de
Taylor
(1 − cos2 πml) ∼ 12 4π (lm − n) 2 2

onde n é o inteiro mais pr´


oximo de lm (estamos tomando a f´ormula
de Taylor em torno de 2πn ).
75

Logo  
Vm Vm
< .
1 − cos(2πml) 2
K̃ (4π) (lm − n) 2

Se assumirmos que V (x) é anal´ıtica complexa na faixa em que a
parte imagin´aria de x é menor que ρ, ent˜ao existe k, ρ tal que
2π m ρ
|V | < k exp−
m
| | (3.15)
Este resultado (3.15) pode ser facilmente obtido da f´ ormula in-
tegral de Cauchy de Vari´avel Complexa (ver [N]), e considerando
um contorno retangular no plano complexo passando pelos pontos
− π,π,π + ρi, π + ρi. Integrando neste contorno e usando o fato que

as integrais em dois lados do retˆangulo cancelam, segue o resultado.

Se V (z) não é anal´ıtica, mas apenas ν vezes diferenciável, então

|V | < mk
m
1
ν +1
(3.16)

para uma certa constante k1 (ver [Fi] seção 2.8).


Logo se V é ν vezes diferenciável,


 1  ≤
Vm 2
k2

1 cos2 πml m(ν +1)/2 (lm − n) ,
onde k2 é uma constante.
Se l é número Diofantino, de (3.6)
 −
l
n
1
> γ r , r > 2.
m m
O valor de r será especificado em breve.
Logo
1
lm n > γ r 1
ou seja
| − |
m−
1
γ < mr −1 .
lm n | − |
Concluindo
  1
Vm 2
mr −1 1
< K3 = K3 ν +1 ,
1 − cos2 πml m(ν +1)/2 m 2 −r+1
76 [CAP. 3: A TEORIA DE AUBRY

para uma certa constante K3 .


Tomando ν suficientemente grande
ν +1
2
− r +1 (3.17)

1
fica maior quee 2assim
é verdadeira e assim, segundo
a série a Observação
de Fourier 3.4, desejamos
da g que segue que (3.14)
obter
converge.
Desta maneira, mostramos que sob certas condições existe solução
g contı́nua (em primeira aproximação) da equa¸cão (3.9) da curva
KAM (ver Observação 3.2).
Vamos fazer uma an´alise mais delicada da quest˜ao acima consi-
derada.
Estamos interessados em propriedades que s˜ao validas para todo
l em um conjunto de medida total. Sendo assim, podemos assumir
r = 2 + ε com ε pequeno (ver Observa¸cão 3.1 antes do teorema)
e concluir que para um conjunto de medida total de valores l (os
números Diofantinos), para valores λ menores que λ , existe
uma curva KAM. cr´ıtico

Neste caso, se V for apenas três vezes diferenciável já obtemos
de (3.17) (ver Observa¸cão 3.4) que
3+1
2
− r + 1 = 2 − 2 − ε + 1 > 12
pois
1
ε<
2

Sendo assim se V for três vêzes diferenciavel, a condição (3.13) é
válida para tal g e a Série de Fourier (3.12) de g converge, embora g

nãoAseja necessariamente
conclusão final é quediferenciável (apenas
se V for três vezes contı́nua).
diferenciável, então g
(ou seja f ) satisfazendo (3.8) e (3.9) existe é contı́nua e é expressa
através da Série de Fourier (3.9) acima descrita.
Se V ′ for mais de tres vezes diferenci´avel então as curvas obtidas
serão diferenciáveis. Quanto maior a classe de diferenciabilidade de
V ′ , maior ser´a a classe de diferenciabilidade da g que define a curva
KAM. 
77

É realmente um fato muito interessante o fato que propriedades


topológicas (a existência de curvas KAM ou a existência de conjuntos
de Cantor invariantes, conforme aparece no conjunto das 16 figuras)
dependem de propriedades de diferenciabilidade de V ′ e também de
propriedades numéricas de l.
Considere um valor l de distância média atômica fixado.
Se V ′ for analı́tica, então pode-se mostrar que para pequenos va-
lores de λ, a fun¸cão g é anal´ıtica.
Pode-se mostrar que para valores de λ um pouco maiores, a curva
invariante é diferenciável, mas não analı́tica (mesmo que V ′ seja
anal´ıtica).
Para valores de λ moderadamente grandes, a aplicação padrão
definida acima, vai apresentar exemplos em que a g acima considerada
é realmente continua mas não diferenciável e este fato vai assegurar
a existência de curvas KAM não diferenciáveis.
Em todos os casos considerados acima, existe curva KAM.
No conjunto das oito figuras, logo ap´os a Figura 1.14, para v´arios
valores de λ, plotamos v´arias ´orbitas no espa¸co de fase de v´ arias
aplicações padrão T = Tλ associados ao potencial λV (u) = λ 12 (1
cos2 πu).

No conjunto das oito figuras antes da Figura 1.5 mostramos o
espaço de fase de v´arias órbitas para T quando λ = 0. Note a seme-
lhança deste caso com o bilhar no cı́rculo do Exemplo 1.1, Capı́tulo 3.
As figuras do meio das oito correspondem a valores n˜ ao muito
grandes nem muito pequenos de λ.
A última figura do primeiro conjunto mostra o espa¸co de fase de
T para o valor λ que fica localizado um pouco antes da destrui¸cão da
última curva KAM. Esta curva tem n´umero de rotação l = β a razão
áurea.
Um fato relevante a ser destacado é que a medida que aumen-

tamos λ mais e mais


de ser contı́nuas. Esteasfenômeno
g associadas a l Diofantinos
é conhecido vão deixando
como a destruição das
curvas invariantes em teoria KAM. A medida que estas curvas v˜ ao
sendo destruidas, aparecem conjuntos ’ralos”tipo Cantor e também
regiões bidimensionais invariantes (ver Figura 3.32). As regi˜oes bidi-
×
mensionais ocupam uma parte cada vez maior de [0 , 1] [0, 1] até que
finalmente para valores muito grandes de λ elas parecem ocupar todo
×
o [0, 1] [0, 1] (ver última figura do conjunto dos primeiros oito).
78 [CAP. 3: A TEORIA DE AUBRY

Figura 3.3:

As dezesseis figuras foram obtidas da seguinte maneira, tomando


um ponto ( p0 , u0 ) inicial ao acaso, iteramos 10,000 vezes a condi¸cão
inicial e plotamos esta trajet´oria de
10000
{(p , u ), T (p , u ),...,T
0 0 0 0 }
(p0 , u0 ) .
Observação 3.5. Note que muitas das evidências numéricas que
aparecem nas figuras obtidas em computador n˜ao correspondem sem-

pre a conclus˜
figura oes verdadeiras.
do conjunto Por exemplo,
das oito primeiras, paraqueλ aparentemente
mostra grande, a ´ultimao
sistema é erg´odico quando restrito a uma regi˜ao bidimensional (es-
cura) de ´area positiva. Poderia ocorrer que certas ´orbitas ficam encer-
radas em regi˜oes bidimensionais invariantes muito pr´oximas da pr´o-
pria ´orbita. O que se assemelha a uma ´ orbita que parece ocupar den-
samente o espa¸co de fase, na verdade seria apenas um ponto elı́ptico
(ver definiç˜ao na ´ultima seç˜ao do texto, Defini¸c˜ao 12.4) de perı́odo
79

muito grande. Este fato n˜ao poderia ser percebido pela resoluç˜ao do
computador que gerou tais figuras. Tal situaç˜ao que parece ins´olita,
de fato corre com alguns parˆametros da aplica¸ c˜ao “padr˜
ao”(ver [Du]).
As figuras obtidas de simulaç˜oes no computador podem ser de
grande valia no entendimento da riqueza de fenˆomenos que aparecem
num sistema mecˆanico. Note que a Figura 1.8 parece descrever a exis-
tência de pontos elı́pticos. Elas por si s´
o, no entanto, não asseguram
a veracidade matem´atica do fenˆomeno que parecem descrever.

Conclusão: Considere um potencial V analı́tico. Para um valor


pequeno de λ, não existem mais curvas invariantes para T com l ra-
cional. Elas são destruidas e d˜ao lugar a ´orbitas periódicas. Não
existem também curvas com l irracional não Diofantino. Subsistem
varias curvas KAM com l Diofantino, mas a medida que aumenta-
mos λ, mais e mais destas curvas v˜ao sendo destruidas, dando raz˜ao
ao aparecimento de conjuntos fractais (muito pequenos, quase im-
perceptiveis) e a regi˜oes bidimensionais invariantes. Quando uma
curva KAM é destruida, aparece em geral uma sequência alternada
de pontos periódicos elı́pticos e hiperbólicos (ver última figura do se-
gundo conjunto). Aparecem assim p ontos hipebólicos que geram as-
sim um conjunto tipo ferradura (ver [R02] [Ka ][PM]). A se¸cão 6.3 em
[DL] descreve este fenˆomeno. Entremeado neste conjunto, aparecem
“ilhas elı́pticas”. Estas “ilhas elı́pticas” em torno dos pontos elipti-
cos, por sua vez, possuem curvas invariantes e cada um desta curvas
tem número de rotação (ou distˆancia média atômica) l em torno de
cada ponto elı́ptico. Estas curvas, por sua vez, se tem numero de
rotação l (em torno do ponto elı́ptico) racional ou não Diofantino,
logo são destruidas ao aumentar o parˆ ametro λ . Restam as cur-
vas (em torno deste ponto elı́ptico) com l Diofantino, as quais v˜ao
sendo destruidas a medida que o parametro λ aumenta criando novas

sequências
valores de λdemuito
pontos hiperbólicos
grande, e elı́pticossóe existe
aparentemente, assim uma
por diante. Para
regi˜ao bidi-
mensional invariante, ou seja a probabilidade uniforme P é ergodico
para T . Dizemos aparentemente, por causa da Observação 3.5 acima.
Existe uma conjectura que diz que para valores λ grandes, o con-
junto de tais λ que determinam T = Tλ não ergódica, é muito pequeno

em termos da medida uniforme em λ R (ver [Du] para maiores con-
siderações a respeito do assunto). Este resultado implicaria então que
80 [CAP. 3: A TEORIA DE AUBRY

para λ grande, a maioria das transforma¸cões T seria ergódica para a


Probabilidade uniforme.
A evolução do espa¸co de fase com o parˆametro λ descrita acima
é o que se chama de fenômeno KAM.
A destruição das curvas invariantes acima descritas, correspondem
a destruição de toros invariantes em torno de pontos elı́pticos de
aplicações de Poincaré de primeiro retorno, conforme foi descrito no
fim da Se¸cão 7, Capı́tulo 1 [L].
Aplicações do tipo padr˜ao formam uma classe mais geral de apli-
cações denominadas de tipo “twist”ou também chamadas “aplicações
que giram para a direita”.
Esta classe de aplica¸cões é objeto de intenso estudo nos últimos
anos (ver [MF] e [M2]).

×
Definição 3.7. Seja T : [0, 1] [0, 1] → ×
[0, 1] [0, 1], obtida a partir
de uma fun¸c˜ao geradora S (x, X ), dizemos que T (x, y) é do tipo que
gira para a direita, se T = (T1 , T2 ), e existe C > 0 tal que
∂T 1
C < ∂y < C −1 . (3.18)

Tal T preserva ´area (ou seja, preserva dxdy.


Para aplicações do tipo acima podemos considerar o problema
análogo: determinar as qi onde T (q0 , p0 ) = (qi , p1 ) tais que se q0 ,
q1 , q2 ,...,q n são sucessivas iteradas na vari´avel q de uma ´orbita
T j (q0 , p0 ) então para q0 , qn fixos a fun¸cão

A(x1 , x2 ,...,x n−1 ) =

= S (q0 , x1 ) + S (x1 , x2 ) + ... + S (xn−2 , xn−1 ) + S (xn−1 , qn ),


n 1
A:E −
etc....
→ R tem (q1 , q2 ,...,q n−1 ) como ponto crı́tico (ou mı́nimo),
É fácil ver que a aplica¸cão T definida por (3.3) gira para a direita
′′
pois ∂T ∂u = λV (u) > 0 e é obtida através de uma fun¸
1
cão geradora
S (q, Q).

Exemplo 3.3. (Bilhares convexos) Considere como na se¸c˜ ao ante-


| − |
rior a aç˜ao S (ui , ui+1) = ui ui+1 , ou seja a distˆancia entre o ponto
81

ui e ui+1 no bordo do bilhar, e a a¸c˜


 ao total de n a m como a soma
m
i=n S (ui , ui +1 ) . As trajet´
orias do bilhar determinam configuraç˜oes
cr´ıticas para a aç˜ao total. A aplicaç˜ao T que determinamos para o
bilhar convexo é portanto an´ aloga a T que estamos considerando na
presente seç˜ao.
O difeomorfismo T do bilhar convexo é a aplicaç˜ao induzida pelo
primeiro retorno ao bordo do bilhar convexo. A aplicaç˜ao T preserva
´area como vimos na Proposi¸ c˜ao 17, Cap´ıtulo 3 [L]. E´ f´acil mostrar que
tal T satisfaz (3.18) (ver [LC] e [CRZ] para prova). Logo, utilizando a
S acima, a transformaç˜ ao T induzida pelas batidas do bilhar no bordo
de um bilhar convexo define uma aplica¸c˜ao que gira para a direita.
×
Seja T : [0, 1] [0, 1] → ×
[0, 1] [0, 1], obtida a partir de uma
função geradora S (x, X ), dizemos que T (x, y) é do tipo que gira para
a esquerda, se T = (T1 , T2 ), e existe C > 0 tal que

1 ∂T 1
−C − <
∂y
< −C.
No caso do bilhar do Sinai (ver defini¸ cão na se¸cão 1) se conside-
| − |
rarmos a a¸cão S (q, Q) = q Q obteremos uma fun¸cão T que gira
para esquerda.
Esclarecemos ao leitor que a teoria em que ”minimizamos

S (q0 , x1 ) + S (x1 , x2 ) + ... + S (xn−2 , xn−1 ) + S (xn−1 , qn )

para aplicações que giram para a direita”é a mesma teoria em que


”maximizamos

S (q0 , x1 ) + S (x1 , x2 ) + ... + S (xn−2 , xn−1 ) + S (xn−1 , qn )

para aplicações que giram para a esquerda”(ver [LC]).


Note no entanto que a teoria em que ”minimizamos
S (q0 , x1 ) + S (x1 , x2 ) + ... + S (xn−2 , xn−1 ) + S (xn−1 , qn )

para aplicações que giram para a esquerda”é diferente a teoria em


que ”minimizamos

S (q0 , x1 ) + S (x1 , x2 ) + ... + S (xn−2 , xn−1 ) + S (xn−1 , qn )


82 [CAP. 3: A TEORIA DE AUBRY

para aplicações que giram para a direita”. No primeiro caso esta re-
mos localizando conjuntos ”próximos”de pontos de sela e no segundo
conjuntos ”próximos”de pontos elı́pticos. Na última figura do pri-
meiro conjunto de oito vemos uma alternˆancia de pontos elı́pticos e
pontos hiperbólicos em cada anel. Fixado uma aplica¸ cão T que gira
para a direita ”minimizar”ou ”maximizar” S vai determinar que tipo
de conjunto estamos tentando encontrar. As curvas KAM aparecem
apenas no problema em que minimizamos S .
Sendo assim no caso do bilhar do Sinai (ver defini¸ cão na se¸cão
−| − |
1) é mais interessante considerar a ação S (q, Q) = q Q obtendo
assim uma fun¸cão T que gira para direita.
Dada uma ´orbita peri´odica de um sistema Hamiltoniano, se a
aplicação de primeiro retorno T tem um ponto fixo elı́ptico, em geral
esta T é localmente uma aplicação que gira para a direita. Referimos
o leitor para [M2] para uma prova deste fato.
A teoria acima possui uma extens˜ao para lagrangianos peri´odicos
e mais recentemente foi extendida para lagrangianos Autˆonomos. O
leitor pode encontrar um texto cobrindo tais assuntos em [CI] e [Fat].
Existe também uma teoria análoga para transforma¸cões expan-
sivas e sistemas tipo Anosov (ver [CLT]) em que se considera entre
outras coisas o expoente de Lyapunov.
Sendo assim, esperamos ter convencido ao leitor da importˆancia
do entendimento dinâmico das aplicações que giram para a direi-
ta. Este entendimento possibilitaria a melhor compreens˜ao de vários
problemas importantes da Mecˆanica Clássica. Muito trabalho ainda
será requerido para chegar ao entendimento matemático completo da
dinâmica de tais aplica¸cões.

Exercı́cios
1. Mostre que a transformação T associada ao bilhar, considerada
na Seção 11, é do tipo que gira para a esquerda.
2. Mostre que os números Diofantinos tem probabilidade total na
reta.
Capı́tulo 4

Formas Diferenciais em
Variedades

Nesta seção vamos apresentar de maneira resumida as principais pro-


priedades das formas diferenciais em variedades diferenci´aveis, que
serão necessárias para o entendimento da próxima seção que analisará
o formalismo simplético. Referimos a [MC1] para o leitor que desejar
uma exposição mais completa do assunto abordado nesta se¸cão.
O objetivo de considerar formas diferenciais como faremos a se-
guir, será apresentar no futuro (ver pr´ oxima seção) uma vers˜ao da
Mecânica Clśsica que seja intrı́nseca, isto é, que seja definida sem
apelo a coordenadas locais . Lembre que, p or exemplo, para definir
o campo Hamiltoniano usamos a estrutura do R2n (necessitamos de
variáveis q e p separadas) de maneira essencial. Muitas vezes em
problemas fı́sicos concretos, não é natural supor que o sistema em
consideração seja um subconjunto do R2n . Isto vai nos cond uzir ao
conceito de variedade diferenciável. Para definir o campo Hamiltoni-
ano necessitaremos também do conceito de formas diferenciais.
∈ n n
Dado p R , chamaremos de espaço tangente a R em p, e
n n
denotaremos Rp = (T R )p , o conjunto de todos os vetores tangentes
v do Rn , cuja srcem est´a localizada no ponto p.

83
84 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Mais precisamente, v Rnp determina a classe de todas as curvas



γ (t) Rn tal que γ (0) = p e γ ′ (0) = v.

n n
Rp é um espaço vetorial, e seu dual ser´a (Rp )∗ , isto é, o conjunto
n →
de todos as transforma¸cões lineares f : Rp R.

n
Definição 4.1. Uma k-forma w em Rp é por definiç˜ao uma fun¸c˜ao
do tipo
w : Rnp n
× R ×···× n

vezes k
p
 Rp
→ R

tal que w é linear em cada coordenada.



A forma w é dita alternada se i < j ,
w(v , v ,...,v ,...,v ,...,v ) = − w(v , v ,...,v
1 2 i j k 1 2 j ,...,v i ,...,v k ).

n k n
Denotaremos para cada p ∈ R por Ω (R o conjunto das p ),
n
funç˜oes k-lineares alternadas em Rp tomando valores reais.
Note que se houver repeti¸cão de um elemento v na k-upla, então

w(v1 , v2 ,...,v,...,v,..,v k) = − w(v , v ,...,v,...,v,...,v


1 2 k)

e portanto w(v1 , v2 ,...,v,...,v,...,v k) = 0.


3
Exemplo 4.1. Em a 3-forma w tal que w(v1 , v2 , v3 ) é o de-
R
terminante da matriz que tem como colunas (v1 , v2 , v3 ) é alternada.
Por exemplo, esta 3-forma satisfaz w(v1 , v2 , v3 ) = w(v2 , v1 , v3 ) = −
w(v2 , v3 , v1 ).

Exercı́cio: Mostre que se v1 é combinação linear de v2 , v3 ,...,v n ,



k
isto é, v1 = i=2 αi vi , então w(v1 , v2 ,...,v n ) = 0. Em particular
para uma 2-forma w(v, v) = 0.
Este último conjunto Ωk (Rn ) com a opera¸cão de soma de fun¸cões,
p
e multiplicação por escalar definidas de maneira usual, (( f + g)(x) =
f (x) + g(x) e (cf )(x) = cf (x), x Rnp ), é um espaço vetorial.
∀ ∈
Exemplo 4.2. Seja dx2 : R3 → R a projeç˜ao na segunda coordenada,
dx2 (y1 , y2 , y3 ) = y2 .
3
∈ R ∗, para qualquer p ∈ R . 3
Ent˜ao, dx2 p
85

As transformaç˜oes lineares dxi : Rn → R, tal que


dxi (y1 , y2 ,...,y n ) = yi

s˜ao transformaç˜oes (ou funcionais) lineares, que formam uma base


para Ω1 (Rnp ).
Observação 4.1. Ω1 (Rnp ) = (Rnp )∗ .

Note que dxi satisfaz dxi (ej ) = δi,j , i, j = 1, 2,...,n , onde δi,j = 0

se i = j e δi,j = 1 se i = j.

Definição 4.2. Uma 1-forma ou forma exterior de grau 1 em um


aberto A do Rn , é uma aplicaç˜ao ω definida em A n
R tomando ⊂
1 n n
∈ ⊂
valores em Ω (Rp ), que associa a cada ponto p A R , uma
n
func˜ao linear ω(p) : Rp R.→
Como dx1 , dx2 ,...,dx n é base do espa¸
co das transformaç˜oes linea-
res, ω(p) poder´ a ser escrito como:

ω(p) = a1 (p)dx1 + a2 (p)dx2 + ... + an (p)dxn .


Se cada ai : A Rn ⊂ →
R for diferenciável p A Rn , diremos
∀ ∈ ⊂
que ω é uma 1-forma diferenciável ou forma exterior diferenci´avel de
grau 1.
Por abuso de nota¸cão, falaremos de uma forma diferencial em Rn
quando nos referirmos a uma 1-forma diferencial sobre um aberto
A Rn .

Definição 4.3. Se ϕ1 , ϕ2 , ..., ϕk , s˜
ao 1-formas lineares, podemos
obter um elemento
ϕ1 ∧ ϕ ∧···∧
2 ϕk
k n
de Ω (Rp ), definindo:
(ϕ1 ∧ ϕ ∧···∧
2 ϕk )(v1 , v2 ,...,v k) = det([ϕi (vj )]).

Segue das propriedades do determinante, que ( ϕ1 ϕ2 ∧ ∧···∧


ϕk )
é k-linear, alternada. É fácil ver que ( ϕ1 ϕk ) Ωk (Rnp ).
∧···∧ ∈
Em particular ( dx1 ) (dxk ) Ω(Rnp ). Denotaremos ( dx1 )
∧···∧ ∈ ∧
···∧ (dxk ) por ( dx1 ∧···∧
dxk ).
86 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Proposição 4.1. O conjunto {(dx ∧ dx ∧···∧ dx )}, i < i i1 i2 ik 1 2 <


k n
··· < i , onde i ∈ {1, 2,...,n }, forma uma base para Ω (R ).
k j p

Demonstração: Primeiramente veremos que os elementos deste


conjunto são linearmente independentes. Suponha que

i1 <
···<ik ai ···ik dxi
1
∧···∧ dx = 0.
1 ik

Considere fixado j1 < ... < j k i , j ∈ {1, 2,...,n }, tal que o corres-
pondente aj1 ···jk não seja nulo. Ent˜ao para qualquer k-upla de ı́ndices
i1 < ... < i k , dxi1 ∧···∧
dxik aplicado a ( ej1 ,...,e jk ) resulta ser
(dxi1 ∧···∧ dxik )(ej1 ,...,e jk ) =
 dxi1 (ej1 ) dxi1 (ej2 ) ··· dxi1 (ejk )

= det .. .. .. .. .
 . . . . 
dxik (ej1 ) dxik (ej2 ) ··· dxik (ejk )
Lembramos que

dxi (ej ) =
 0, se i = j 
1, se i = j
Logo (dxj1 ∧···∧
dxjk )(ej1 ,...,e jk ) = 1 e portanto aj1 ,...jk (dxj1 ∧
···∧ dxjk )(ej1 ,...,e jk ) = aj1 ,...,jk .
Mantendo-se fixo (ej1 ,...,e jk ) e fazendo-se todas as escolhas pos-
sı́veis (diferentes desta) para i1 < i2 < < ik , il ···
1, 2,...,n , ∈{ }
obteremos:
 ∗
−a j1 j2 ···jk = ai1 ···ik (dxi1 ∧···∧ dxik )(ej1 ,...,e jk ),
i1 < ···<ik
onde o ∗ significa que evitamos (i ,...,i ) = (j ,...j ) no somatório
1 k 1 k

acima. 
Note agora que se ( i1 , i2 , ··· , i ) é diferente de (j ,...,j
k 1 k) então
(dxi1 ∧···∧ dxik )(ej1 ,...,e jk ) = 0.
Logo,
 ai1 ···ik (dxi1 ∧···∧ dxik )(ej1 ,...,e jk ) =0 ⇒a j1 ···jk = 0.
i1 < ···<ik
87

Obtivemos portanto uma contradição.


{
Logo o conjunto (dxi1 dxi2 ∧ ∧···∧
dxik )p , i1 < i2 < < ik ,} ···
onde ij ∈{1, 2,...,n , é linearmente independente em Ωk (Rnp ).
}
Mostraremos agora que se f Ωk (Rnp ), então f é uma combinação

linear da forma:

f=  ai1 ···ik dxi1 ∧···∧ dxik .


i1 < ···<ik
Para vermos isto, basta definirmos ai1 ···ik = f (ei1 ,...,e ik ) (lem-
bramos que f é k-linear alternada). 

Definição 4.4. Uma k -forma (ou forma exterior de grau k) em um


aberto A, A Rn (k 1) é uma aplicaç˜ao ω que a cada p A Rn
⊂ ≥ ∈ ⊂
associa ω(p) Ωk (Rnp ).

Como vimos na ´ultima proposiç˜ao, ω pode ser escrito como:

ω(p) = ai1 ···ik (p)(dxi1 ∧···∧ dxik ),


i1 < <ik

ij ∈ {1, 2,...,n } onde a



···
i1 ···ik : A ⊂ Rn → R.
Se estas fun¸c˜oes ai1 ···ik forem diferenci´aveis, ω é chamada uma
k-forma diferenci´ avel.
Por abuso de linguagem, as k-formas sobre abertos A do Rn serão
chamadas de k-formas diferenciais em Rn .

Observação 4.2. A k -upla (i1 ,...,i k ), i1 < < ik ser´ ···


a indicada
por I , e a nota¸c˜ao a ser usada a partir de agora ser´ a:

ω= aI dxI ,
I

dxI = dxi1 ∧···∧ dxik .



Convenciona-se que uma 0-forma diferenci´avel em Rn é uma funç˜ao
avel f : A Rn
diferenci´ ⊂ R. →
Se ω e ϕ s˜ao duas k-formas,

ω=
 aI dxI , ϕ =
 bI dxI ,
I I
88 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

podemos definir a soma:

ω+ϕ=
 (aI + bI )dxI
I

e a multiplica¸c˜ao de ω por escalar c R

cω =
∈ c aI dxI .
I

Estas propriedades determinam que o conjunto das k-formas di-


ferenciais em A aberto do Rn é um espaço vetorial.

Definição 4.5. Se ω é uma k -forma e ϕ uma s-forma, podemos


definir uma operaç˜ao chamada produto exterior ω ϕ, obtendo uma ∧
k + s-forma.
Se
ω= aI dxI , I = (i1 ,...,i k ) k -forma
I

ϕ=
 bJ dxJ , J = (j1 ,...,j s) s-forma.
J

Por definiç˜ao,

ω ∧ϕ=
 aI bJ dxI ∧ dx J,
I,J

onde dxI ∧ dx J = dxi1 ∧ ... ∧ dx ∧ dx ∧ ... ∧ dx


ik j1 js .

Note que esta defini¸cão é compatı́vel com a Defini¸


cão 4.3.
Por exemplo, (2dx +5dx ) (5dx +4dx ) = 10 dx dx +8dx
dx3 25dx2 dx3 . 1
− ∧ 3 2 ∧ 3 1 2 1 ∧ ∧
Proposição 4.2. Se ω é uma k -forma, ϕ uma s-forma e θ uma
r-forma, teremos:
∧ ∧ ∧ ∧
(a) (ω ϕ) θ = ω (ϕ θ)
(b) (ω ϕ) = ( 1)ks ϕ ω
∧ − ∧
∧ ∧ ∧
(c) ω (ϕ + θ) = ω ϕ + ω θ quando r = s.
89

Demonstração: (a) e (c) s˜ao conseq¨uências das definições acima.


 
Para o item (b), sejam ω = I aI dxI e ϕ = J bJ dxJ , onde I =
(i1 ,...,i k ) e J = (j1 ,...,j s )

ω ∧ϕ= aI bJ dxi1 ∧···∧ dxik ∧ dx ∧···∧


j1 dxjs =
I,J

=
 −  ∧···∧
aI bJ ( 1)dxi1 dxik−1 ∧ dx ∧ dx ∧ dx ∧···∧
j1 ik j2 dxjs =
I,J

=
− ( 1)k aI bJ dxj1
∧ dxi1 ∧ dx ∧···∧
i2 dxik ∧ dx ∧···∧
j2 dxjs ,
I,J

fazendo a mesma invers˜ao para dxj2 , dxjn ,...,dx js , ao final teremos


realizado este raciocı́nio s-vezes, teremos s-vezes ( 1)k à frente de −
aI bJ , ou seja, ( 1)ks , portanto ϕ ω = ( 1)ks ω ϕ.
− ∧ −  ∧
Note que uma n-forma diferenciável w em um aberto A do Rn é

sempre da forma w(x) = c(x) dx1 dx2 ... dxn , onde c : A ∧ ∧
R é →
uma função diferenciável.
Fixado n 1 , e2 ,...,e n ) =
c(x), onde x,
ei ,para
i determinar
1, 2,..,n é c(x),
∈{ }
a basebasta tomardow(x)(e
canônica R .

Definição 4.6. Seja f : A Rn Rm uma funç˜


⊂ → ao diferenci´avel,
n m
ent˜ao a derivada dfp : Rp →
Rf (p) induz para cada ponto p A uma ∈
∗ k m k n
transformaç˜ao linear fp : Ω (Rf (p) ) →
Ω (Rp ) do seguinte modo:
k m ∗ k n

dado w Ω (Rf (p) ), f (w) = w1 Ω (Rp ) é tal que ∈
w1 (v1 ,...,v k) = fp∗ (ω)(v1 ,...,v k) = ω(dfp (v1 ), dfp (v2 ), .. ., dfp (vk )),
onde v1 , v2 ,...,v k Rnp . ∈
Fazendo p variar em Rn , obtemos uma aplica¸c˜ao f ∗ que leva k -
formas diferenciais do Rm em k -formas diferenciais do Rn .


Convenciona-se que f ∗ (g) = g f se g é uma 0-forma
Enunciaremos a seguir algumas propriedades de f ∗ .
do Rm .

n m
Proposição 4.3. Se f : A ⊂ R → R é diferenci´ avel ent˜ao:
(a) f ∗ (ω + ω ) = f ∗ (ω ) + f ∗ (ω ), onde ω e ω s˜ao k -formas.
1 2 1 2 1 2
(b) f ∗ (ω ∧ ω ) = f ∗ (ω ) ∧ f ∗ (ω ) onde ω e ω s˜ao 1-formas.
1 2 1 2 1 2
(c) f (gω) = f (g)f (ω) onde g é uma 0-forma do Rm e ω uma
∗ ∗ ∗
k-forma do Rm .
90 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Demonstração:
(a) f ∗ (ω1 + ω2 )(p) (v1 , v2 ,...,v k ) =
= (ω1 + ω2 )(f(p) )(dfp (v1 ), .. . , dfp (vk )) =
= ω1 (f(p) )(dfp (v1 ,. .. , dfp (vk )) + ω2 (f(p) )(dfp (v1 ),. .. ,dfp (vk )) =
= f ∗ (ω1 )(p) (v1 ,...,v k ) + f ∗ (ω2 )(p) (v1 ,...,v k ).

(b) f ∗ (ω1 ∧ω )2 (p) (v1 , v2 ) = (ω1 ∧ω ) 2 f (p) (dfp (v1 ), dfp (v2 )) =

= det
 ω1 f (p) (dfp (v1 )) ω1 f (p) (dfp (v2 ))
 =
ω2 f (p) (dfp (v2 )) ω2 f (p) (dfp (v2 ))

= det
 f ∗ (ω1 )(p) (v1 ) f ∗ (ω1 )(p) (v2 )
 =
f ∗ (ω2 )(p) (v1 ) f ∗ (ω2 )(p) (v2 )

= (f ∗ (ω1 )(p) ∧ f ∗(ω ) 2 (p) )(v1 , v2 ).

(c) f ∗ (gω)(p) (v1 ,...,v k ) = (gω)(f(p) )(dfp (v1 ),. .. ,dfp (vk )) =
= (g f )(p) f ∗ (ω)(p) (v1 ,...,v k ) = f ∗ (g)(p) f ∗ (ω)(p) (v1 , v2 ,...,v k ).

◦ 

Estamos prontos agora para mostrar que a opera¸cão f ∗ é equiva-


lente à substituição de variáveis.
n m
Seja f : A R⊂ R →
uma fun¸cão diferenciável que associa
(x1 ,...,x n ) a (y1 , y2 ,...,y m ) da seguinte maneira:
 y1 = f1 (x1 ,...,x n)
 y2 = f2 (x1 ,...,x n)
..
 .
ym = fm (x1 ,...,x n ).

m
Seja ω I aI dyI uma k-forma do R , usando a ´ultima pro-
= que:   
posição, temos f ∗ (ω) = f ∗ ( I aI dyI ) = I f ∗ (aI )f ∗ (dyi1 ) ∧

f (dyi2 ) ∧···∧f (dyik ). Ora f ∗ (dyi )(v) = dyi (df (v)) = d(yi f )(v) =
∗ ◦
∗ ◦
dfi (v) e f (aI ) = aI f = aI (f ), pois aI é uma o-forma (usamos
definição de f ∗ para 0-formas). Assim,

f ∗ (ω) =
 aI (f1 (x1 ,...,x n ),...,f m (x1 ,...,x n ))dfi1 ∧df ∧···∧ df
i2 ik
I
91

onde fi e dfi são funções de xj ,


n
 ∂f i
dfi = dxj ,
j =1
∂x j

portanto aplicar pelas


f ∗ a fun¸cões
ω equivale i
suas diferenciais xk ae substituir
df (xk ). em ω as variáveis y e
Vimos na proposi¸cão anterior que a adi¸cão comuta com a substi-
tuição de vari´aveis (f ∗ (ω1 + ω2 ) = f ∗ (ω1 ) + f ∗ (ω2 )) veremos agora
que o produto exterior de duas formas diferenciais quaisquer também
comutam com a substitui¸cão de variáveis.
Na Se¸cão 6, Capı́tulo 3 [L], quando consideramos mudanças de
variável
F (x, y) = (X (x, y), Y (x, y)),
a expressão de uma forma W na variável ( X, Y ) era calculada na
variável ( x, y). O Teorema 16 e a Proposi¸cão 17, Capı́tulo 3 [L],
são casos particulares da propriedade geral apresentada pela ´ultima
expressão. Por exemplo, expressar a forma diferencial W = dX dY
na variável (X, Y ) através de outra forma diferenciável w na variável

(x, y) corresponde a tomar w = F ∗ (W ), isto é, w = F ∗ (dX dY ) = ∧
( ∂X ∂X
∂x dx + ∂y dy) ( ∂Y∧ ∂Y
∂x dx + ∂y dy).

Exercı́cio: No caso geral, dados abertos A, B do Rn ,o difeomorfismo


f : A → ∧ ∧
B, e W (y) = c(y) dy1 ... dyn uma n-forma diferencial
em B, então a n-forma diferencial w = f ∗ (W ) em A é dada por
∧ ∧
w(x) = c(f (x)) (det Df (x)) dy1 ... dyn = z(x) dy1 ... dyn . Isto ∧ ∧
segue do fato que w(e1 , e2 ,..,e n ) = z(x).
n m
Proposição 4.4. Seja f : A ⊂ R → R uma aplicaç˜ao diferenci´a-
n
vel que a cada (x1 ,...,x n ) A ∈ ⊂ R , associa
(y1 ,...,y m) = (f1 (x1 ,...,x n ),...,f m (x1 ,...,x n ))

m
∈R ent˜ao:
(a) f ∗ (ω ϕ) = f ∗ (ω) f ∗ (ϕ), onde ω e ϕ s˜ao formas diferenciais
∧ ∧
em Rm .
(b) (f g)∗ (ω) = g ∗ (f ∗ (ω)), onde g : Rp
◦ n

R é uma aplicaç˜
ao
diferenci´avel.
92 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES


Demonstração: Sejam ω = I aI dyI , ϕ = I bJ dyJ .
 

Sabemos que: ω ϕ = I,J aI bJ dyI dyJ .
 ∧
(a) f ∗ (ω ϕ) =
∧ I,J aI (f1 ,...,f m )bJ (f1 ,...,f m )dfI ∧ df J =
f ∗ (ω) f ∗ (ϕ)

(b) (f g)∗ (ω) = I aI ((f g)1 ,..., (f g)m )d(f g)I =
◦
= I aI (f1 (g1 ,...,g
 ◦ ◦ ◦
n ),...,f m (g1 ,...,g n ))dfI (dg1 , dg2 ,...,dg n)
= g ∗ (f ∗ (ω)) 

Dada uma 0-forma diferenciável, ou seja, uma função diferenciável,


podemos obter uma 1-forma, efetuando a opera¸ cão de derivação so-
bre f . Vamos definir agora uma opera¸cão sobre uma k-forma, a qual
chamaremos de diferencial exterior, que associa esta k-forma a uma
(k + 1)-forma.

Definição 4.7. Se ω = I aI dxI é uma k -forma diferencial, a di-
ferencial exterior de ω ser´a a (k + 1)-forma diferencial definida da
seguinte maneira:
dω =
 daI ∧ dx . I
I

Proposição 4.5. (a) d(ω1 + ω2 ) = dω1 + dω2 , ω1 e ω2 s˜


ao k-formas.
(b) d(ω1 ω2 ) = dω1 ω2 + ( 1)k ω1 dω2 , ω1 uma k -forma e ω2
∧ ∧ − ∧
é uma s-forma.
(c) d(dω) = d2 ω = 0.
(d) d(f ∗ (ω)) = f ∗ (dω), onde ω é uma k-forma em Rm e f : A ⊂
n m
R →R é uma aplicaç˜ao diferenci´avel.

Observação 4.3. O item (d) nos diz que esta opera¸ c˜


ao de tomar
derivada independe das coordenadas que usamos para representar ω .

Demonstração:
 
(a) Sejam ω1 = I aI dxI e ω2 =
ω1 + ω2 = I (aI + bI )dxI .

 I bI dxI duas k-formas e

d(ω1 +ω2 ) = I d(aI +bI ) dxI = ∧ I ∧
daI dxI + I ∧
dbI dxI =
dω1 + dω2
93

∧  
(b) ω1 = I aI dxI uma k-forma e ω2 = J bJ dxJ uma s-forma,
ω1 ω2 = I,J aI bJ dxI dxJ ∧


 ∧ ∧ ∧
d(ω1 ω2 ) = I,J d(aI bJ ) dxI dxJ = I,J daI bJ dxI dxJ + ∧ ∧
I,J aJ dbJ ∧
dxI dxJ = ∧
= dω1 ω2 + ( 1)k I,J aI dbJ ( 1)k dxI dxJ = dω1 ω2 +
∧ − − ∧ ∧ ∧
k

( 1) ω1 ∧ dω . 2 
(c) Demonstraremos este item usando indu¸cão em k.
Primeiramente provaremos a validade da asserção, para 0-formas.
Seja f : A Rn R.⊂ →
     n
∂f
n
∂f
d(df ) = d ∧ ∂x i
dxi = d
∂x i
dxi =
i=1 i=1

  ∧

=
n n
∂2f
∂xi ∂x j
dxj dxi =
i=1 j =1

  ∂ 2f ∂2f
= ∧ ∧
∂x i ∂xj
dxj dxi +
∂x i ∂x j
dxj dxi = 0,
i<j i>j

pois os coeficientes s˜ao iguais e dxj dxi = dxi dxj , portanto∧ − ∧


d(df ) = 0.
Suponhamos agora, por hip´otese de indução, que tenhamos
d(dω) = 0, para uma k-forma ω, mostraremos que o mesmo vale para
uma (k + 1)-forma.
Toda a (k +1)-forma pode ser escrita como soma de ( k +1)-formas

do tipo ω dxi . Pelo que provado no item (a), a soma comuta com a
diferenciação externa, portanto, temos que provar o item (c) apenas
para as ( k + 1)-formas do tipo ω dxi .
∧ ∧ ∧−
d(d(ω dxi )) = d(dω dxi + ( 1)k ω d(dxi )), ora xi : Rm
é uma 0-forma, logo d(dxi )) = 0, sendo assim
R ∧ →
d(d(ω dxi )) = d(dω dxi ) = d(dω) dxi + ( 1)k dω d(dxi ) = 0,
∧ ∧ ∧ − ∧
pois d d(ω) = 0 por hip´otese de indu¸cão, e d(dxi )) = 0 também.
(d) Da mesma forma que fizemos no item (c), a demonstra¸ cão
será feita por indu¸cão em k.
Provaremos o resultado inicialmente para uma 0-forma g : Rm R. →
94 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

   
m
∂g
m
∂g
n
∂f i  ◦
∂ (g f )
f ∗ (dg) = f ∗ dyi = dxj = dxj =
i=1
∂y i i=1
∂y i j =1
∂x j j
∂x j

= d(g f ) = d(f ∗ g).



Suponhamos agora que d(f ∗ ω) = f ∗ (dω), para ω uma k-forma
provaremos que este resultado é válido para uma k + 1-forma.
Toda a k + 1-forma é escrita como uma soma finita de formas do
tipo ω dxi , mas tanto f ∗ , como “ d”, comutam com a soma (pro-

posições anteriores), assim, temos apenas que provar este resultado
para k + 1-formas do tipo ω dxi . ∧
f ∗ (d(ω dxi )) = f ∗ (dω dxi + ( 1)k ω d(dxi )) = f ∗ (dω dxi ) =
∧ ∧ − ∧ ∧
f (dω) f ∗ (dxi ), mas por hip´otese de indu¸cão f ∗ (dω) = d(f ∗ (ω)).
∗ ∧
Portanto,

f ∗ (d(ω ∧ dx )) = d(f ∗(ω)) ∧ f ∗(dx ) =


i i

= d[f ∗ (ω) ∧ f ∗(dx )] = d(f ∗(ω ∧ dx )).


i i

Definição 4.8. A integral de uma k -forma diferenci´ avel w em Rn ,


n
sobre uma superf´ ⊂
ıcie k-dimensional S R , parametrizada por uma
k
unica
´ g(x1 ,...,x k ), g : U R ⊂ Rn , U simplesmente conexo, (tal

superfı́cie é dita simples conforme Definiç˜ao 12, Cap´ıtulo 1) é por
definiç˜ao
  w= wg(x)
∂g ∂g
, ,...,
∂g

dx1 dx2 ...dxk
S U ∂x 1 ∂x 2 ∂x k

Esta definição engloba todas as defini¸cões de integral de forma


diferencial (integral de linha, de superfı́cies, sobre abertos etc.) apre-
sentadas na Se¸cão 6, Cap´ıtulo 3.
Observação 4.4. Note que conforme o exercı́cio proposto anterior-
mente para uma n-forma diferencial

a(x) dx1 ∧ dx ∧ ... ∧ dx


2 n
95

n n n
em R , ef :A⊂ R → R vale que
f ∗ (a(x) dx ∧ ... ∧ dx ) = a(f (x)) (det Jac f )(x)dx ∧ ... ∧ dx .
x 1 n 1 n

Deste modo se g : U → S e g : U → S forem duas cartas


1 1 2 2
1
coordenadas para S , aplicando este resultado para f = g ◦ (g )− , 1 2

segue da f´ormula de mudan¸ca de vari´aveis que


  
∂g 1 ∂g 1 ∂g 1
wg1 (x) , ,..., dx1 dx2 ...dxk =
U1 ∂x 1 ∂x 2 ∂x k
 wg2 (x)
 ∂g 2 ∂g 2
, ,...,
∂g 2

dx1 dx2 ...dxk .
U2 ∂x 1 ∂x 2 ∂x k

Logo, S w independe da escolha da carta coordenada e é assim
um conceito intr´ınseco.
Esta propriedade é similar a que foi considerada na Seç˜ao 10,
Capı́tulo 3 [L], sobre integrais de superf´
ıcies.

Exercı́cio: Mostre que dado f : A Rn A R


n
e w k-forma

diferencial, então f ∗ (w) = w, se e somente se, para toda superfı́cie

S A de dimensão k
→ ⊂
  w= f ∗ (w).
S S

Para a integral de uma forma diferencial sobre a superfı́cie simples


S estar bem definida, devemos fixar uma orientação sobre S (ver
Capı́tulo 3 [L]).
Para integrar superf´ıcies k dimensionais não simples, que s˜ao ob-
tidas através de várias cartas g, utilizaremos parti¸cões da unidade
que serão apresentadas em breve (ver Defini¸cão 4.25).
Este procedimento ser´a uma alternativa ao procedimento de co-
lar superf´ıcies k dimensionais simples que foi desenvolvido na se¸cão
Capı́tulo 3 [L]. Este procedimento poderá também ser utilizado para
integrar formas diferenciais em variedades.
Note que uma n-forma em Rn é sempre da forma a(x)dx1 dx2 ∧ ∧

... dxn .
n
Definição 4.9. Uma n-forma diferencial em
n
R com a(x) ≥ 0 é
chamada uma forma volume sobre R .
96 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Figura 4.1:

Note que segue da defini¸cão acima que para uma forma volume
w = a(x)dx1 dx2 ... dxn em Rn , e para um aberto A Rn
∧ ∧ ∧ ⊂
  w= a(x)dx1 dx2 ...dxn .
A A

Vamos agora introduzir o conceito de variedade diferenci´avel.


Seja M um conjunto. Um sistema de coordenadas locais ou carta
local em M é uma aplicação bijetiva fα : Uα →
fα (Uα ) de um sub-
conjunto Uα M sobre um aberto fα (Uα ) Rn .
⊂ ⊂
Dizemos que n é a dimensão de fα : Uα fα (Uα ).
∈ →
Para cada p Uα tem-se fα (p) = (x1 (p),...,x n (p)). Os números
xi = xi (p), i = 1,...,n são chamados as coordenadas do ponto p M ∈
no sistema fα .
Definição 4.10. Um atlas de dimens˜ao n sobre um conjunto M é
U n

uma coleç˜ao de sistemas de coordenadas locais fα : Uα R em
M , cujos dom´ınios Uα cobrem M . Os dom´ınios Uα dos sistemas de
coordenadas fα ∈U s˜ao chamados as vizinhan¸cas coordenadas de . U
97

Definição 4.11. Um conjunto M no qual existe um atlas de di-


mens˜ao n chama-se uma variedade de dimens˜ao n. Em outras pala-
vras, M é uma variedade de dimens˜
ao n se, e somente se, cada ponto
→n ∈
x de M existe fα : Uα R carta local com x Uα .
Usaremos a seguinte nota¸cão: gα : Vα
n
→ U ⊂ M é a inversa de
α
n
fα :Sendo→ ⊂
Uα assim, R .
Vα um variedade
Logo Vα éMum
deaberto em nRpode
dimensão . ser alternativa-
U
mente definida por um atlas cartas gα : Vα →
M , tal que α gα (Vα ) ∪
cobre todo M e onde para todo α, Vα é aberto de Rn .
m
Exemplo 4.3. Toda superfı́cie M ⊂R de dimens˜ao n é uma va-
riedade de dimens˜ao n.
m
Dados os sistemas de coordenadas locais fα : Uα
n
R e fβ : →
Uβ → R no conjunto M , tais que Uα ∩
Uβ = , cada ponto p∅ ∈
Uα Uβ tem coordenadas xi = xi (p) no sistema fα e coordenadas

yi = y i (p) relativamente ao sistema fβ .
A correspondência
1 n 1 n
(x (p),...,x (p)) ↔
(y (p),...,y (p))
estabelece uma bije¸cão ϕαβ = fβ fα−1 : fα (Uα Uβ )
◦ ∩
fβ (Uβ Uα ) → ∩
que é chamada mudança de coordenadas.
As mudanças de coordenadas s˜ao ditas C ∞ se elas s˜ao de Classe
k

C para todo k N. Todas as variedades, mudanças de coordenadas,
funções etc., que consideraremos no texto serão assumidas ser de
classe C ∞ .
Definição 4.12. Um atlas U de∞dimens˜ao n sobre um conjunto M
diz-se diferenci´avel, de classe C (k ≥ 1), se todas as mudan¸cas de
1
coordenadas ϕ = f ◦ f − , f , f ∈ U s˜ao aplicaç˜oes de classe
αβ β α α β

C .
1

são,Como ϕαβ
de fato, = (ϕβα )− , ede
difeomorfismos ϕβα é diferenciável
classe segue-se
C ∞ (ver Figura que
4.1). Em ϕαβ
ospar-
ticular, se escrevemos ϕαβ : (x1 ,...,x n ) (y 1 ,...,y n ), então o deter-
→
minante jacobiano  
∂y i
det
∂x j
é não nulo em todo ponto de fα (Uα ∩ U ). β
98 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Definição 4.13. Uma variedade diferenci´


avel, de dimens˜ao n e classe
C ∞ é um par ordenado (M, ) onde M é um conjunto e é um atlas
U U
de dimens˜ao n e classe C ∞ sobre M .
Na maioria das vezes vamos omitir o U quando nos referimos a
uma variedade M .
n
O espaço R é naturalmente uma variedade diferenciável com um
atlas com uma única carta fα : Uα = Rn
U n

R , onde fα (x) = x.

Definição 4.14. Uma variedade orient´avel M é uma variedade di-


ferenci´
avel que admite um atlas cobrindo toda a variedade e de tal
jeito que as mudanças de carta coordenadas ϕαβ sempre satisfazem
a propriedade que que
 
∂y i
det > 0.
∂x j

Figura 4.2:

O conjunto de cartas que satisfazem tal propriedade é chamado


de uma orienta¸cão para a variedade. Quando falamos de uma varie-
dade M orientável, estamos implicitamente dizendo que fixamos uma
orientação em M , ou seja que fixamos um atlas como acima.
99

Exercı́cio: O espa¸co Rn com o atlas U


, constituı́do pelas cartas
f1 (x) = x e f2 (x) = 2x é uma variedade orientável.
Exemplo 4.4. O Plano Projetivo P 2 é uma variedade diferenci´avel
de dimens˜ao dois como veremos a seguir. O plano projetivo P 2 é o
conjunto das retas r de R3 que passam pela srcem (0,0,0) de R3 .


os pontos (λx,λy,λz ), λ = 0, determinam a mesma reta. Portanto,

Uma tal reta é determinada por um ponto (x,y,z ) = (0, 0, 0) de R3 e
P 2 é o espaço quociente de R3 (0, 0, 0) pela relaç˜
−{ } ao de equivalência
que identifica (x,y,z ) com (λx,λy,λz ), λ = 0; os pontos de P 2 , que

s˜ao retas r passando pela srcem, ser˜ao indicados por r = [x,y,z ] =
{ |  }
(x1 , y1 , z1 ) tal que existe λ = 0, tal que (x,y,z ) = λ(x1 , y1 , z1 ) .
Qualquer elemento (x1 , y1 , z1 ) ∈
[x,y,z ] pode ser tomado como
representante da classe, isto é, [x,y,z ] = [x1 , y1 , z1 ].
Definimos em P 2 subconjuntos U1 , U2 , U3 por:

{
U1 = [x,y,z ]; x = 0 ,  }
{{
U2 = [x,y,z ]; y = 0 ,
U3 = [x,y,z ]; z = 0
 }}
e aplicações gi : R2 → U , i = 1, 2, 3, por:
i

g1 (u, v) = [1,u,v ],

g2 (u, v) = [u, 1, v],


g3 (u, v) = [u,v, 1]
2
onde ( u, v) ∈ R .
3
Em termos geométricos, U2 é o conjunto das retas de R que
passam pela srcem e n˜ ao pertencem ao plano xOz.
Afirmamos que as fun¸cões

fα1 = g1−1 , fα2 = g2−1 , fα3 = g3−1 ,

determinam um atlas C ∞ sobre P 2 . Com efeito, cada apli cação gi ,


i = 1, 2, 3, é evidentemente biunı́voca e
 gi (R2 ) = P 2 .
i
100 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

A última igualdade segue do fato que dado qualquer reta r, toman-


do um ponto ( x,y,z ) sobre ela e supondo (sem perda de generalidade)

que x = 0, então g1 (y/x, z/x) = r
Resta mostrar que fαi (Ui Uj ) é aberto em R2 e que fα−j1 fαi
∩ ◦
é aı́ diferenciável. Demonstraremos este fato para i = 1, j = 2; os
outros casos são inteiramente análogos.

Os pontos de fα1 (U1 U2 ) são da forma ( u, v), com u = 0, v = 0.  
Portanto fα1 (U1 U2 ) é aberto em R2 e

f α2 1
◦ f − (u, v) = f
α1
−1
α2 [1,u,v ] = g2
   
1
, 1,
v
=
1 v
,
u u u u

é evidentemente diferenciável, como quer´ ıamos.


2 ∞
Logo, P admite um atlas C .
Pode-se mostrar que o plano projetivo n˜ao é uma variedade orien-
tável (ver por exemplo [Li3]).
Passaremos agora a estender às variedades diferenciáveis as noções
de Cálculo diferencial que s˜ao válidas em abertos do Rn .
Superf´ıcies diferenciáveis de dimensão 2 podem ser obtidas via um
processo de colagem a partir de abertos do R2 (ver Figuras 4.2 e 4.3).
Definição 4.15. Seja S uma variedade diferenci´avel de dimens˜ao n.
Uma funç˜ao ϕ : S →
R é diferenci´ ∈
avel em p S se para alguma
parametrizaç˜ao gα : Vα S , Vα IRn com p gα (Vα ), tem-se que
→ ⊂ ∈

ϕ gα : V α → avel no ponto gα−1 (p).
R é diferenci´
Diremos que ϕ é diferenci´ avel em S se é diferenci´
avel para todo

p S . A fun¸c˜ ◦
ao ϕ gα é chamada a express˜ ao de ϕ na parametriza-
ç˜ao gα .
É claro que esta defini¸cão independe da parametriza¸cão, pois se
gβ : V β→ ∈ ∩
S é outra parametrização, com p gα (Vα ) gβ (Vβ ), então

ϕ ◦ g = (ϕ ◦ g ) ◦ (g − ◦ g ),
β α α1 β

e assim ϕ ◦ g é diferenciável, se e somente se, ϕ ◦ g é diferenciável


β α
(pois é composta de aplicações diferenciáveis).
Um caso particular importante da definição acima é dado a seguir.
Definição 4.16. Seja S uma variedade de dimens˜ao n. Uma curva

λ : I = ( ǫ, ǫ) R ⊂ →
S é diferenci´ ∈
avel em t I se, para alguma
101

Figura 4.3:

parametrizaç˜ao gα : Vα → ∈ ◦
S , com λ(t) gα (Vα ), tem que gα−1 λ :
I→ Rn é diferenci´ avel em t.
A curva gα−1 λ = fα λ é chamada a express˜
◦ ◦ ao local de λ na
parametrizaç˜ao gα .
A verificação de que esta defini¸cão independe da parametriza¸cão
escolhida é análoga à anterior.
Gostarı́amos agora de definir a noção de vetor tangente a uma
variedade diferenciável S , e aı́ encontramos a nossa primeira dificul-
dade. Se a variedade S de dimensão n está contida no meio ambiente
k
R , então dada uma curva x(t) cuja imagem est´a contida em S faz
sentido x(t + δt) x(t) Rk . A seguir tomando
− ∈
lim x(t + δt) − x(t) ∈ R k
=v ∈R ,k
δt →0 δt
obtemos o vetor tangente.
Quando S é definida intrinsecamente, S não é e nem está contida
num espaço vetorial, logo x(t + δt) x(t) Rk não faz sentido.
− ∈
Nosso problema se reduz ent˜ao a definir de maneira alternativa o
vetor tangente a uma curva diferenci´avel λ : I →
S . Por exemplo,
102 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

⊂ 3
quando S R é superfı́cie de dimensão 2, o vetor tangente de λ
é simplesmente o vetor velocidade λ′ (t) de λ, como vetor de R3 .
Como não temos a estrutura ambiente de R3 , precisamos destacar
uma propriedade caracterı́stica do vetor tangente que não dependa
do espaço ambiente.
Para isto, seja v um vetor de R2 , com srcem em p R2 e compo-
nentes (α, β ). Escolha-se uma curva diferenciável λ : I = ( ǫ, ǫ)
2
∈ − →
R com λ(0) = p e λ′ (0) = v = (α, β ).
Se λ(t) = (u1 (t), u2 (t)), podemos escrever que

α = u′1 (0),

β = u′2 (0).
Observe-se agora que dada uma fun¸cão ϕ, diferenciável em uma
vizinhança de p, podemos restringir ϕ a λ(t) e tomar a “derivada
direcional”de ϕ em relação a v, isto é

d(ϕ λ) ∂ϕ du1 ∂ϕ du2


◦  
dt t=0
= ∂u 1 dt + ∂u 2 dt t=0 =

=
    
α



ϕ.
∂u 1 t=0 ∂u 2 t=0

Desta maneira, a “derivada direcional segundo v”é um operador


L sobre funções diferenciáveis que só depende de v. Esta ser´a a pro-
priedade que tomaremos no caso geral para definir o vetor tangente
a uma curva.
O vetor v está associado de maneira ´unica ao α e β que definem
o operador L = Lλ sobre funções ϕ tomando valores reais

∂ ∂
L (ϕ) = L(ϕ) = α +β ϕ.
λ ∂u 1 t=0
     ∂u 2 t=0
Em outra palavras, optamos por determinar o vetor v por sua
ação sobre funções diferenciáveis em vez de tomar o objeto geométrico
v Rk .

Note que o operador acima depende de α e β e não da expressão
escolhida para λ (lembre que várias possı́veis curvas λ tem a mesma
tangente v = (α, β )).
103

Um vetor tangente ser´a considerado a seguir como um destes o-


peradores L : pD → R obtidos a partir de um λ, agindo sobre p, o D
conjunto das fun¸cões ϕ diferenciáveis em p.

Definição 4.17. Seja λ : I →


S uma curva diferenci´avel em uma
variedade diferenci´avel S de dimens˜ao n com λ(0) = p, e seja p

o conjunto das fun¸c˜oes ϕ : S →


R, diferenci´aveis em p. O vetor
tangente a curva λ no ponto p é a funç˜ao real L = Lλ : p R tal D → D
que para cada ϕ ∈D p ,

d
L(ϕ) = (ϕ λ) ◦
 .
dt t=0


Um vetor tangente em p S é o vetor tangente de uma curva dife-
renci´
avel λ : I →
S , com λ(0) = p.

Muitas curvas distintas λ poderão determinar o mesmo operador


L = Lλ .
Denotaremos por Tp S o conjunto de tais vetores tangentes, ou
seja de tais operadores L. Algumas vezes, por abuso de linguagem,
vamos denotar o vetor tangente L = Lλ por λ′ (0), onde λ é um dos
λ tais que Lλ = L. Pode-se mostrar (ver considera¸cões a seguir) que
o espaço Tp S de tais L = Lλ para diferentes λ, é um espaço vetorial
de dimensão n.
Note que vários λ podem determinar um mesmo L = Lλ . No caso
de superfı́cies de dimensão 2 em R3 , os λ que geram o mesmo L são
aqueles que determinam o mesmo vetor λ′ (0) = v R3 . Isto segue ∈
do fato que os α e β acima ficam neste caso determinados de maneira
única a partir de v.
Algumas vezes, tais L da Definição 4.17 serão também denotados

por v Tp S .
Fixada uma parametriza¸cão gα (u1 , u2 ,...,u n ), e um ponto p S
  ∈D ∈
usaremos a notação ∂u∂ i p para denotar o op erador L definido
0
pela curva

x(t) = gα (u1 , u2 ,...,u i1 , u i + t, ui+1 ,...,u n ),

onde gα (u1 , u2 ,...,u n ) = p. Note que x(0) = p.


104 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Para mostrar que a no¸cão acima L = Lλ possui as proprie-


dades usuais dos vetores tangentes, considere uma parametrização
gα : Vα → S , com
gα (0, 0,..., 0) = p.
Seja ϕ uma fun¸cão diferenciável em uma vizinhan¸ca de p e supo-
nhamos que ϕ
que
◦g α se escreva como ϕ(u1 , u2 ,...,u n ). Então é claro

dϕ(u1 (t), u2 (t),...,u n (t))
λ′ (0)(ϕ) = =
dt t=0

=
 
α1

+ ... + αn
  ∂
(ϕ)
∂u 1 0 ∂u n 0
onde αi = u′i (0). Decorre daı́ que

λ′ (0) = α1
  ∂
+ ... + αn
  ∂
∂u 1 0 ∂u n 0

onde
 ∂
∂u i
,i ∈ {1,...,n }
0
são os vetores tangentes em p respectivamente às curvas

ui → λ(0,...,u i ,..., 0).

Seja T o espaço vetorial gerado por


  ∂
, i ∈ {1, 2,...,n }
∂u i 0

onde as opera¸cões são definidas como opera¸cões sobre fun¸cões.


Em resumo, como n˜ao podemos falar do vetor tangente da ma-
neira usual para superfı́cies, estamos substituindo o vetor tangente
pela sua a¸cão sobre funções ϕ diferenciáveis.
Lema 4.1. O conjunto Tp (S ) dos vetores tangentes v = Lλ a S em
n
p ∈ S coincide com T . O vetor (α1 ,...,α n ) R definido como ∈
acima, é chamado de express˜ ao local do vetor v segundo a carta gα .
A aplicaç˜ao que leva (α1 ,...,α n ) em v é um isomorfismo de espaços
vetoriais.
105

Demonstração: Pelo que acabamos de ver Tp (S ) T . Reciproca- ⊂



mente, se v T , então existem α1 ,...,α n R tal que ∈
v = α1
 ∂
+ ... + αn
 ∂
.
∂u 1 0 ∂u n 0

Seja λ : I → S uma curva, cuja express˜ao nas coordenadas


(u1 , u2 ,...,u n ) da parametrização gα é u1 (t) = αi t,... un = αn t.
Então    
∂ ∂
Lλ = λ′ (0) = α1 + ... + αn ,
∂u 1 0 ∂u n 0

isto é, v Tp (S ).
Decorre daı́ que a soma de elementos L de Tp (S ), definida como
soma de funções, é ainda um elemento de Tp (S ) e o mesmo se passa
com o produto por um n´ umero real. É imediato verificar que, com
estas operações, Tp (S ) é um espaço vetorial. Além disso,

∂ ∂
,...,
∂u 1
    0 ∂u n 0

são vetores linearmente independentes que geram Tp (S ). Portanto


Tp (S ) tem dimensão n e é chamado o plano tangente de S em p. 
A base     
∂ ∂
,...,
∂u 1 0 ∂u n 0

de Tp (S ) é chamada a base associada à parametrização f no ponto p.


Voltemos à extensão das no¸cões de C´alculo às variedades diferen-
ciáveis.

Definição 4.18. Dada uma variedade S , o fibrado tangente a S é o


conjunto ∪∈ p S Tp (S ) = T S.
Note que o fibrado tangente tem uma estrutura de variedade
diferenciável de dimens˜ao 2n. De fato, dado uma par ametriza¸cão
gα,β (u1 ,...,u n ), a função Gα,β (u1 ,...,u n , u̇1 ,..., u̇n ) que associa a cada
(u1 ,...,u n ) e a cada vetor

(u̇1 ,..., u̇n )


106 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

o operador L definido por por

L = u̇1
 

+ ... + u̇n
 

,
∂u 1 0 ∂u n 0

determina cartas coordenadas de R2n em T S . Estas cartas, é fácil


ver, determinam em T S uma estrutura de variedade diferenci´avel.
Um campo de vetores G numa variedade M de dimensão n é uma

escolha de um vetor v(p) = G(p) Tp M para todo p M . O campo ∈
de vetores é diferenciável se para alguma (todas) carta coordenada
fα = gα1 tal que p Uα , a expressão local de G(p) em Rn (ver Lema

4.1), através da carta coordenada fα , em coordenadas locais em Rn
define um campo de vetores diferenci´avel em Rn .
Uma curva λ(t) em M é uma solução da equação diferencial asso-
ciada ao campo de vetores G, com condição inicial p0 no tempo t0 , se
λ′ (t) = G(λ(t)) e λ(t0 ) = p0 . Passando para cartas locais fα , a exis-
tência e unicidade de soluções de campos de vetores diferenci´aveis G
em variedades segue de imediato do Teorema 10.8 [DL] de existência
e unicidade. A solu¸cão λ(t) em M é obtida através da carta coorde-
nada fα e da solu¸cão da equa¸cão diferencial de primeira ordem em
n
fα (Uα )⊂ R . Para valores grandes de t (muito maiores que t0 ) a
solução pode sair fora de uma carta coorde nada. A solução λ(t), neste
caso, é obtida pela expressão em cada carta local e “colada”peda¸ co
a pedaço em M .

Definição 4.19. Seja uma aplica¸c˜ ao h : S1 →


S2 e p S1 . Diz- ∈
se que h é diferenci´
avel em p, se existem sistemas de coordenadas
g1 : V 1 → S1 e g2 : V 2 → S2 com p ∈
g1 (V1 ) e h(p) ∈
g2 (V2 ),
tais que g2−1 h g1 é diferenci´
◦ ◦ avel em g1−1 (p). A aplica¸c˜ao h diz-se
diferenci´
avel em S1 se for diferenci´avel em p para todo p S1 . ∈
De uma maneira an´aloga ao que consideramos nas defini¸cões an-
teriores, verifica-se que a defini¸cão acima n˜ao depende dos sistemas
de coordenadas escolhidas.

Definição 4.20. Um difeomorfismo h : S1 →


S2 é uma aplicaç˜
ao
bijetiva de S1 sobre S2 , tal que h e sua inversa h−1 : S2 S1 s˜ ao →
diferenci´aveis.
107

Definição 4.21. A derivada de uma aplicaç˜ ao diferenci´avel h : S1 →



S2 em p S1 é a aplica¸ c˜ao dhp : Tp S1 →
Th(p) S2 que a cada operador
∈ D
v = L Tp S1 (agindo em p ) associa o operador ṽ = L̃ = dhp (v) ∈
Th(p) S2 (agindo em h(p) ), da seguinte maneira: se L = Lλ = λ′ (0)
D
, para alguma curva λ : I →
S1 com λ(0) = p, ent˜ao dhp (v) =
˜ ˜ ´
(h ◦
λ)′ (0)
λ e que é = = Lh◦ao
umaL aplicaç˜λ . E f´acil ver
linear. que denotar
Vamos dhp independe da curva
a derivada de h
por dh : T S1 →
T S2 , repetindo o processo acima em cada ponto

p S1 , onde T S1 (respectivamente T S2 ) denota o fibrado tangente a
S1 (respectivamente S2 ).
Observação 4.5. Com a no¸c˜ ao de diferencial, podemos obter a se-
guinte interpretaç˜ao da base de Tp (S ), associada a uma parametri-
zaç˜ao gα : Vα →
S . Suponhamos que gα (q ) = p, q = (0, 0,..., 0),
e sejam e1 ,...,e n os vetores da base canonica de Rn (e que est˜ao
{ }
associados aos operadores

,
∂u i

i ∈ {1, 2,...,n }). Ent˜ao 


d ∂
dgαq (ei ) = gα (0,...,u i ,..., 0) =( )p ,
dui ui =0 ∂u i

formam um base de Tp S , se variamos i 1, 2,...,n . ∈{ }


Mais precisamente, para i ∈{ }
1, 2,...,n fixo e para cada ϕ ∈D p


(ϕ) =
d
ϕ◦g α (0,...,u i ,..., 0)

∂u i p dui ui =0

é um elemento da base de Tp S .
Convém estendermos a definiç˜ao de variedade, dada anterior-
mente, de modo a incluir as variedades com “bordo”. A defini¸c˜ao
acima apresentada de variedade diferenci´avel n˜ao inclui, por exem-
plo, o conjunto M (o cilindro com bordo) dado por
3 2
{
M = (x,y,z ) ∈ R ;1 = x + y2, 1 ≥ z ≥ 0} ,0

pois a interseç˜ao V M de qualquer vizinhança V em R3 de um ponto



p = (x,y,z 0 ) do “bordo”de M com M n˜ ao é sequer homeomorfa a
um aberto de R2 .
108 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES


Observamos, entretanto, que V M é homeomorfa a um aberto
do semi-plano (u, v) R2 ; v
{ ∈ ≤ }
0 , enquanto que os pontos de M
que n˜ao est˜ao no bordo se comportam como pontos de uma variedade
de dimens˜ao 2. Isso nos sugere uma nova defini¸c˜ao de variedade que
inclui a situa¸c˜ao mencionada.

Um aberto do Rn é sempre uma variedade de dimensão N .


Chamaremos de semi-espaço superior H n Rn ao conjunto dada

por
H n = (x1 ,...,x n )
{ n
∈ R ;x 1 ≥ 0} .
Um aberto V de H n é a interseção de um aberto U de Rn com
H , isto é, V = U H n .
n

Diremos que uma fun¸cão f : V →
R, definida de um aberto V de
H n é diferenciável se existir uma fun¸cão f¯ : U →
R de um aberto U
de Rn contendo V , tal que a restri¸cão de f¯ a V seja igual a f . Se f
é diferenciável em V a diferencial dfp é definida por dfp = df¯p .
Se o aberto V não contém pontos da forma (0, x2 ,...,x n ) então,
V é um aberto de Rn e a defini¸cão coincide com a usual. Se p é
da forma (0 , x2 ,...,x n ), dfp está definida para todos os vetores de Rn
com srcem p, e não apenas para os que “apontam”para o semi-espaço
superior H n . Tomando curvas diferenciáveis em V passando por p, é
fácil mostrar que a defini¸cão de dfp não depende da extens˜ao f¯ de f .
n
n
A definição de aplica¸cão diferenciável f : V →
R , V aberto em
H é estabelecida de maneira análoga.
Daremos agora uma defini¸cão de variedade com bordo, de modo
a incluir a defini¸cão (Definição 4.13) anterior de variedade como caso
particular.

Definição 4.22. Uma variedade diferenci´


avel (de dimens˜ao n) com
bordo regular é um conjunto M e um atlas de aplica¸c˜oes gα : Vα
n n

H → M de V ⊂ H
1)
α tomando valores em M tais que:
 gα (Vα ) = M
α

∩ ∅
2) para todo par α, β , com gα (Vα ) gβ (Vβ ) = W = , os conjuntos
g −1 (W ), g −1 (W ) s˜
α β ao abertos em H n e as aplicaç˜oes g −1 ◦ gα , g −1 ◦ gβ ,
β α
ao diferenci´aveis em H n (no sentido acima descrito).
aı́ definidas, s˜
109

Figura 4.4:

Denotaremos por fα : Uα M ⊂ → H n as inversas dos respectivos


gα : Vα→ M.

Um ponto p M é chamado um ponto do bordo de M se para um
sistema de coordenadas gα−1 = fα : Uα H n em torno de p se tem

− 1
gα (p) = fα (p) = (0, x2 ,...,x n ).
Note que para algumas cartas gα podem ter domı́nio Vα em aber-
{ | }
tos em (x1 ,...,x n ) x1 > 0 e outras domı́nios Vα que possuem pon-
tos da forma (0 , x2 ,..,x n ).
Estas últimas cartas v˜ao cobrir pontos do bordo de M .
2
Exercı́cio: O cilindro {(x,y,z ) | x + y2 = 1 , 0 ≤ z ≤ 1} é uma
variedade com bordo.
As defini¸cões de diferenciabilidade de funções, plano tangente,
orientabilidade, etc., para variedades com bordo s˜ao introduzidas de
maneira inteiramente análoga às correspondentes definições para va-
riedades.

Proposição 4.6. A definiç˜


ao de ponto de bordo independe do sistema
de coordenadas.
Demonstração: Seja g1 : V1 →
M um sistema de coordenadas em
torno do ponto p do bordo de M tal que g1 (q1 ) = p, onde q1 é da
forma (0, x2 ,...,x n ).
Suponhamos, por absurdo, que em outro sistema de coordenadas
g2 : V2 → M se tenha g2 (q2 ) = p, onde q2 é da forma (x1 ,...,x n ),
110 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES


x1 = 0.
Seja W = g1 (V1 ) ∩ g (V ); aplicação
2 2

1 1 1
g − ◦ g : g − (W ) → g − (W )
1 2 2 1

é um difeomorfismo. Como q2 é da forma (x1 ,...,x n ) com x1 = 0,


existe uma vizinhan¸ca U de q2 , V
eixo x1 .

g2−1 (W ) que n˜ao intercepta o 
Restringindo g1−1 g2 a U , teremos uma aplica¸cão diferenciável

g1−1 g2 : U
◦ →H n


com jacobiano n˜ao nulo em q2 U . Pelo teorema da fun¸cão inversa
(ver [Li1]), g1−1 g2 leva uma vizinhan¸ca V
◦ U de q2 em Rn difeo-

1
morficamente sobre uma vizinhança g1 − g2 (V ) g1−1 g2 (U ) de q1
◦ ⊂ ◦
em Rn ; mas então, g1−1 g2 (V ) conteria pontos de forma ( x1 ,...,x n )

com x1 > 0, o que contradiz o fato de g1−1 g2 (V ) g1−1 (S ). Portanto
◦ ⊂
a hipótese de que q2 é da forma (x1 ,...,x n ) com x1 = 0 leva a uma 
contradição.
O conjunto dos pontos de bordo de M que é, portanto, bem deter-
minado, é chamado o bordo de M e indicado por ∂M . Se ∂M = , a ∅
Definição 4.19 coincide com a Defini¸cão 4.13 de variedade diferencial.

Proposição 4.7. O bordo ∂M de uma variedade diferenci´avel de


dimens˜ao n com bordo é uma variedade diferenci´
avel de dimens˜ao
n 1.−

Demonstração: Seja p M um ponto do bordo de M e gα :
Vα → M um sistema de coordenadas em torno de p, i.e., Vα H n é ⊂
aberto, gα é biun´ıvoca e gα (q ) = p, onde q = (0, x2 ,...,x n ) U . ∈
Seja Z̄α = Vα (x1 , x2 ,...,x n−1 , xn ) Rn ; x1 = 0 . Identificando
∩{{(x , x ,...,x ) ∈ R ∈; x
1 2 n
n
1 =0 } }
com Rn−1 , Z̄α é um conjunto aberto de Rn−1 .
Se denotarmos por ¯gα a restri¸cão de gα a Z̄α , então pela Pro-

posição 4.6, ¯gα (Z̄α ) ∂M . É fácil ver que a famı́lia (Z̄α , ḡα ) é { }
uma estrutura diferenciável em ∂M . A defini¸cão de orienta¸cão é
apresentada na Defini¸cão 4.14.
111

Proposição 4.8. Seja M uma variedade com bordo ∂M . Se M é


orient´avel, uma orienta¸c˜ao de M induz uma orienta¸c˜ao em ∂M .
Demonstração: Fixemos uma orienta¸cão em M , isto é, escolha-
mos uma famı́lia gα : Vα →
M de sistemas de coordenadas tal que
{ } ∩
gα (Vα ) cobre M , e se gα (Vα ) gβ (Uβ ) = então a mudan¸ca de ∅
coordenadas tem jacobiano positivo. Consideremos a famı́lia dos Vα
∩ ∅
tal que gα (Vα ) ∂M = . Como vimos na pro posição anterior, a
fam´ { }
ılia (Z̄α , ḡα ) é uma estrutura diferenciável em ∂M .
Basta então mostrar que se ¯gα e ḡβ são dois sistemas de coorde-
∩ ∅
nadas tais que ¯gα (Z̄α ) ḡβ (Z̄β ) = , a mudan¸ca de coordenadas
α β
uα β
2 = u2 (u2 ,...,u n )

..
.
α β
uα β
n = un (u2 ,...,u n )

satisfaz a condi¸cão
∂ (uα α
2 ,...,u n )
∂ (uβ2 ,...,u βn ) > 0.
Para isso, observamos que a mudança de coordenadas de gα : Vα →M
a gβ : V β →M satisfaz as condi¸cões
β
0 = uα β
2 (0, u2 ,...,u n )

α β
uα β
2 = u2 (u2 ,...,u n )
..
.
β
uα α β
n = un (0, u2 ,...,u n ),

e portanto
∂ (uα ...uα )
1 n β β
∂ (uβ1 ...uβn ) (0, u ,...,u ) =
2 n

∂u α ∂ (uα α
2 ,...,u n )
1
(0, uβ2 ,...,u β2 ) (0, uβ2 ,...,u βn ) > 0.
∂u β1 ∂ (uβ2 ,...,u βn )
Além disso,
∂u α
1
(0, uβ2 ,...,u βn ) > 0,
∂u β1
112 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

β β
pois uα β
1 = 0 em (0 , u2 ,...,u n ) e torna-se negativo com u1 . Portanto

∂ (uα α
2 ,...,u n )
> 0.
∂ (uβ2 ,...,u βn )

Toda variedade diferenciável é uma variedade diferenciável com


bordo.

Definição 4.23. Dada uma variedade diferenci´avel com V de di-


mens˜ao n, uma k -forma w em V é uma aplicaç˜ao k -linear alternada

em cada fibra Tz M, z V . Em outras palavras, wz (v1 , v2 ,...,v k ) para
cada z ∈ V fixo, é linear em cada vi , i ∈{ }
1, 2,...,n e é também
alternada.
Por exemplo as 1-formas s˜ao aplicações 1-lineares, e assim, para
cada z são transformações lineares em cada Tz M tomando valores
reais.

Definição 4.24. Uma k-forma diferenci´avel w em uma variedade


diferenci´ avel V é uma k-forma em V tal que para cada carta de
n
coordenadas locais gα : Vα ⊂ V →
R , nas coordenadas locais
(x1 , x2 ,...,x n ), a forma w é expressa como
 aI (x1 , x2 ,...,x n )dxI
I

e os aI (x1 , x2 ,...,x n ) s˜ao diferenci´aveis em (x1 , x2 ,...,x n ).


Denotamos Ωk (V ) o conjunto das k -formas diferenci´aveis em V .
As definições introduzidas anteriormente para formas diferenciais
n
R
em se estendem
variedades V. de maneira an´aloga para formas diferenciais em

Por exemplo, a derivada dw de w Ωk (V ) é uma (k + 1)-forma

diferenciável dw Ωk+1(V ) tal que em coordenadas locais é igual a
derivada de w (em coordenadas locais). Em geral qualquer conce ito
que seja local, como derivada, etc. definido em Rn vai se extender
para uma variedade diferenciável V de maneira semelhante à maneira
acima utilizada.
113

Seja M variedade de dimens˜ao n e N variedade de dimens˜ao r,


dada uma aplica¸cão f : M →N , e uma k-forma diferencial w ∈
Ωk (N ), f ∗ (w) Ωk (M ) é obtida através da expressão local de f e

usando a defini¸cão anterior para fp∗ : Ωn (Rr ) Ωk (Rn ). Portanto,

f ∗ (Ωk (N )) Ωk (M ).

Figura 4.5:

Ainda, se w1 ∈Ωk (V ) é uma k-forma e w2 ∈


Ωj (V ) é uma j-
∧ ∈
forma, a (k + j)-forma w1 w2 Ωk+j (V ) é por definição dada local-
mente pelo produto exterior destas duas formas em cartas locais. To-
dos estes conceitos estão bem definidos. A forma w1 w2 Ωk+j (V )
∧ ∈
é chamada de produto exterior de w1 e w2 .
Vamos considerar a partir de agora que o leitor est´a familiarizado
com as an´alogas definições de formas diferenciais sobre Rn para as
variedades diferenciáveis M .

Lembre
função φ) é que o suportedos
o conjunto de pontos
uma k-forma
q tal quew w(respectivamente, uma
q (respectivamente φ)
não é nula.
Uma subvariedade A contida na variedade V , é uma variedade tal

que seu conjunto de pontos x A está contido em V e a aplicação de
inclusão i : A → V é diferenciv́el (como aplica¸cão entre variedades).
Exigimos ainda que a aplica c˜ao i tenha derivada injetiva me todos
os pontos.
114 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Seja V variedade de dimensão n. Para definir integral de uma k-


forma w Ωk (V ) sobre uma sub-variedade A de dimensão r contida

na variedade V (ver Definição 4.33), necessitaremos de algum cuidado
especial (integrar não é um conceito local como derivar). Em primeiro
lugar, se a forma w que desejamos integrar tem suporte no domı́nio Uα
n
de uma carta coordenada fα : Uα V R , então a sub-variedade
A, em cordenadas locais x ∈ ⊂ →
n
R , vai resultar numa superfı́cie de
dimensão k em Rn .
A integral de w em A é neste caso a integral da forma w em A
(superfı́cie n-dimensional) nas coordenadas locais ( x1 , x2 ,...,x n ) em
n
R (ver Definição 4.8). Não é difı́cil ver que tal conceito está bem
definido.
O problema é como definir integral no caso em que o suporte
da forma w não cabe inteiramente dentro do domı́nio de uma carta
coordenada.
Definição 4.25. Seja M variedade diferenci´ avel, um conjunto coor-
n
denadas locais fαi : Uαi M ⊂ → ∈ R ,i N. Considere um conjunto
de funç˜oes diferenci´aveis 0 φi , i N definidas em M tomando va-
lores em R tal que ∞  ≤ ∈
i=1 φi (x) = 1 e tal que o suporte de cada φi (q )
esta contido em Uαi . Vamos supor ainda que em cada carta Uαi ape-
nas um n´umero finito das φj s˜ao n˜ao nulas. Tal conjunto de fun¸c˜oes

φi , i N é chamada de uma parti¸ c˜ao da unidade para M .
Pode-se mostrar (ver por exemplo [MC1]) que dada uma variedade
diferenciável M sempre existe uma parti¸cão da unidade para M .
A partir de uma parti¸cão da unidade podemos definir a integral
de uma k-forma w como veremos em breve.
Referimos o leitor a [Li4] para referências sobre produto interno
e formas quadráticas.
Definição 4.26. Uma estrutura Riemanniana em uma variedade di-

ferenci´
W (v), avel
v M
∈ TM deq ,dimens˜

q M ao definida
n é uma positiva
escolha de
emuma
cadaforma
planoquadr´atica
tangente
T Mq . Vamos também exigir que tal forma quadr´ atica W quando ex-
m
pressa em coordenadas locais gα : Vα M⊂ R →
seja tal que os
coeficientes aij (x1 ,...,x n ) de
n
 ai,j (x1 ,...,x n )vi vj
i,j =1
115


sejam diferenci´aveis em (x1 ,...,x n ) gα (Vα ).
Acima, vi , i ∈{ }
1, 2,...,n denota as componentes do vetor tan-
gente v nas coordenadas x = (x1 ,...,x n ).
M munida de tal estrutura é denominada variedade Riemanniana.

Uma forma quadrática W está sempre associada de maneira ´unica


a um produto interno < , >=< u , v > , u, v em T Mq tal que vale
W (v) =< v , v > , v ∀ ∈
T Mq . Reciprocamente, podemos definir <
u,v > , u, v T Mq a partir de W por < u , v > = 12 (W (u + v)
∈ −

W (u) W (v)).
Denotaremos a variedade diferenciável M com tal estrutura Rie-
manniana por ( M, <, > ).
Note que cada carta local gα determina uma métrica Riemanniana

 n
ai,j (x1 ,...,x n )vi vj
i,j =1

n
em um aberto no R no sentido anteriormente considerado (ver De-
finição 1, Se¸cão 2 e Defini¸cão 20, Se¸cão 7 do Capı́tulo 2.)
Proposição 4.9. Toda variedade diferenci´
avel admite uma métrica
Riemanniana.
Demonstração: Sejam fi : Ui Rn coordenadas locais e φi : M R
→ →
funções diferenciáveis que determinam uma parti¸cão da unidade.

Se v é vetor tangente a M no ponto p e se p Ui , denotaremos
vi1 ,...,v in as coordenadas de v segundo fi .
Seja Wi (v) = vi21 + ... + vi2n se v Ui e Wi (v) = 0 se v não está

em Ui .
Então W = φWi é uma métrica Riemanniana em M . Para
provar isto, basta lembrar que a soma anterior é localmente finita. 

O comprimento de uma curva γ (t), t ∈ [a, b] contida em M é
n
obtida considerando v´arias cartas fi : Ui → R , i ∈{ }
1,...,s de tal
modo que o tra¸co da curva γ esteja contido em si Ui , pois γ [a, b] é

compacto (ver Definição 4.32, Capı́tulo 3). A seguir, dividimos [a, b]
em intervalos [ a, a1 ], [a1 , a2 ], [a2 , a3 ], ..., [ as−1 , b] que definem uma

partição de [ a, b] de tal modo que γ [ai , ai+1 ] Ui . Podemos calcular
n
o comprimento de γ [ai , ai+1 ] passando a uma carta lo cal fi : Ui → R
116 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

(use a Definição 18, Se¸cão 7, Capı́tulo 2 para o comprimento de uma


|
curva γ [ai ,ai+1 ] segundo uma métrica Riemanniana num aberto do
Rn ). O comprimento de γ , denotado por γ , é por definição a

soma dos comprimentos das curvas γ [ai , ai+1 ]. Pode-se mostrar que
este procedimento est´a bem definido, isto é, não depende das cartas
escolhidas.
Vamos apresentar as seguir algumas defini¸cões e propriedades de
espaços métricos. Referimos o leitor a [Li2] para uma exposição com-
pleta sobre o t´opico.
Definição 4.27. Um espaço métrico M é um conjunto munido com

uma funç˜ao d(x, y), x, y M , d : M M × →
R, chamada distˆ
ancia
(ou métrica) tal que

a) d(x, y) 0 e ainda vale que d(x, y) = 0, se e s´o se, x = y ;

b) d(x, y) d(x, z) + d(z, y), x,y,z ∀ M; ∈
c) d(x, y) = d(y, x).
Vamos denotar tal espaço por (M, d).
Exemplo 4.5. Quando considerarmos M o espaço Rn , ent˜ao d(x, y)
 −
= x y (onde 
é a norma Euclidiana) define uma métrica, isto
é, as propriedades a), b), c) acima s˜ao satisfeitas para tal d. Para
n
abertos do R , se nada for dito, estaremos considerando a métrica
d(x, y) = x  − y .
Definição 4.28. Um aberto A no espaço métrico (M, d) é um con-
junto A ⊂ ∀ ∈
M tal que x A, existe ǫ > 0 tal que

{y ∈ M | d(x, y) < ǫ} ⊂ A.
Definição 4.29. Um conjunto F contido em (M, d) é dito fechado
se o conjunto M −
F é aberto.

Definição 4.30. Uma aplicaç˜ ao contı́nua F : M1


espaços métricos (M1 , d1 ) e (M2 , d2 ), é uma aplica¸
→ M2 , entre dois
c˜ao F tal que, para

todo ponto x M1 , vale que para todo ǫ > 0, existe δ > 0 tal que se
d(x, y) < δ ent˜ao d(f (x), f (y)) < ǫ.
Definição 4.31. Um homeomorfismo h entre os espaços métricos
ao bijetiva tal que h e h−1 s˜ao
(M1 , d1 ) e (M2 , d2 ) é uma aplicaç˜
cont´ınuas.
117

Uma cobertura de um espaço métrico M é uma coleção de abertos


Ai contidos em M (onde i varia num conjunto qualquer de ı́ndices)
tal que M ⊂∪i Ai .

Definição 4.32. Um espaço métrico M é dito compacto se toda co-


bertura por abertos admite uma subcobertura finita.

Exemplo 4.6. Para uma superf´ ıcies S de dimens˜ao k em Rn , sempre


podemos considerar a métrica induzida pelo Rn , ou seja d(x, y) = x−
y , x, y S define uma métrica em Rn . E
 ∈ ´ possı́vel mostrar que toda
n
superf´ıcie S que é fechada no espa¸co R e que seja também limitada
(isto é, existe K ∈ R tal que ∀
x, y∈ S, d(x, y)≤ K ) é compacta
com relaç˜ao a tal métrica. Logo, neste caso, é possı́vel selecionar
a partir de um atlas qualquer de S , um novo atlas com apenas um
n´umero finito de cartas coordenadas. Isto porque, o domı́nio Uα de
cada carta coordenada de um atlas é um aberto de S e S é compacta.
Dada uma variedade diferenci´avel M com uma estrutura Rieman-
niana, vamos mostrar que sempre é possı́vel obter uma métrica (no
sentido da Defini¸c˜ao 4.24) a partir da métrica Riemanniana.

Exemplo 4.7. Considere (M, <, > ) variedade Riemanniana. E-


xiste uma distˆancia natural d = d< , > em M associada à estrutura

Riemanniana < , >, definida para (x, y) M por

{γ  | γ [a, b] → M,
d(x, y) = inf

γ é curva em M ligando γ (a) = x a γ (b) = y}.

É possı́vel mostrar que tal d define realmente uma métrica em M


(ver [MC1] [Li3]).
Vamos supor a partir deste momento pelo resto do texto que a
variedade M que vamos considerar esteja equipada com uma métrica
Riemanniana < , > e com a distância d = d< , > associada à estrutura
Riemanniana < , > do Exemplo 4.7.
Sempre se pode equipar uma variedade M com uma estrutura
Riemanniana como vimos na Proposi¸cão 4.9 acima.
Quando falarmos de um aberto em M variedade Riemanniana,
estaremos nos referindo à Definição 4.28 e usando a distˆancia d acima
descrita.
118 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

É fácil mostrar que toda variedade diferenciável compacta M (com


uma métrica Riemanniana) admite um atlas com um número finito
de cartas coordenadas. Isto segue do fato que os domı́nios das cartas
coordenadas locais Uαi são abertos de M .
Dada uma estrutura Riemanniana numa variedade V , sempre que
considerarmos A subvariedade de V (ver Definição 4.33, Capı́tulo 3),
estaremos considerando em A a estrutura Riemanniana obtida pela
restrição da estrutura Riemanniana de V a A.

Definição 4.33. Quando dizemos que A é uma subvariedade da va-


riedade V (que possui uma métrica Riemanniana < , >), estamos
querendo dizer que o subconjunto de pontos de A est´a contido em
V , que a fun¸c˜ao inclus˜ao i : (A, d1 ) →
(V, d2 ) tal que i(x) = x é

um homeomorfismo de A sobre i(A) V (com respeito à métrica d1
associada à estrutura Riemanniana induzida em A e d2 a métrica as-
sociada à estrutura Riemanniana em V ) e ainda que para todo p A ∈

a derivada dip : Tp A Tp V é injetiva.

mosSuponha
que A é que A seja isto
compacta, subvariedade da estamos
significa que variedade V . Quando em
considerando dize-A
a distância d< , > = d< , >A obtida pela métrica Riemanniana < , >A ,
restrição da métrica Riemanniana de V a A. Sendo assim é poss´ ıvel
mostrar que A está contida numa união finita de domı́nios Uαi de car-
tas de V . Na pr´oxima definição estaremos utilizando as considerações
feitas acima.

Exemplo 4.8. Um exemplo de espa¸co métrico é o conjunto das


n
F
funç˜oes contı́nuasF { |
= f f : (a, b) →
R , f cont´
ınua , com a }
{ − }
distˆancia d tal que d(f, g) = supremo f (x) g(x) x∈(a,b) , onde
f, g ∈F .

Exemplo 14.9. ∗Um exemplo de espa¸co métrico


funç˜oes C , F { |
= f f : (a, b) n
→ é o conjunto1 ∗ das
R , f é de classe C , com }F
a distˆancia d tal que d(f, g) = supremo f (x) g(x) , f ′ (x)
{ −   −
g ′ (x) x∈(a,b) , onde f , g
} ∈F∗.

A distˆancia do Exemplo 4.9 foi anteriormente considerada na


Seção 2, Cap´ıtulo 2.
119

Figura 4.6:

Definição 4.34. Dizemos que um conjunto B contido em um espaço



métrico M é denso em (M, d), se para todo x M e ǫ > 0, existe

y B tal que d(x, y) ǫ.≤
A defini¸cão acima generaliza a Defini¸ cão 13, Capı́tulo 1 e e a
Definição 6, Cap´ıtulo 3.
Muitas das propriedades interessantes de um sistema mecˆanico,
embora não acontecam para todos os possı́veis sistemas, são no en-
tanto verdadeiras para sistemas que est˜ ao num subconjunto denso
B de tais sistemas (ver por exemplo no fim da Se¸ cão 7, Cap´ıtulo 1,
Exemplo 13, Capı́tulo 1, considerações após Definição 13, Capı́tulo 1
e considerações antes do Teorema 5, Capı́tulo 3).
Após as considerações anteriores, estamos agora prontos para defi-
nir a integral de uma forma diferencial numa variedade diferenci´ avel.

Definição 4.35. Dada uma k -forma diferenci´avel w Ωk (V ) na



variedade Riemanniana diferenci´avel V de dimens˜ao r e uma partiç˜ao

da unidade φi , i N para V , a integral da k -forma w em uma sub-

variedade diferenci´avel compacta A, A V de dimens˜ao k (k r) é ≤
120 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

dada por
  ∞
w= φi (q )wq .
A i=1 A

Cada uma das integrais da soma da express˜ ao da direita est´a bem


definida pois a k -forma φi w tem suporte em finitas Ui , dom´ınio da
carta coordenada xi .
Pode-se mostrar que tal conceito est´a bem definido e a integral

não depende da parti¸cão da unidade φi , i N escolhida (ver [MC1]).
Exercı́cio: Mostre que dado f : V →
V , V variedade diferenciável, e
w k-forma diferencial sobre V , então f ∗ (w) = w, se e somente se, para  
toda subvariedade S V de dimensão k, vale que S w = S f ∗ (w).

O resultado principal desta se¸cão é o Teorema de Stokes, que vale
em grande generalidade e que ser´a apresentado a seguir.
Teorema 4.1. (Teorema de Stokes) Considere V variedade Rieman-
niana diferenci´avel de dimens˜ao r. Dada uma n-forma diferenci´avel
w Ωn (V ), n r 1 e uma variedade compacta C de dimens˜ao
∈ ≤ −
n + 1 com bordo ∂ (C ) de dimens˜ao n, C subvariedade de V , ent˜ao
 dw =
 w.
C ∂C

Para sermos mais precisos deverı́amos escrever a expressão acima


como:  
dw = i∗ w,
C ∂C
onde i é a inclusão de ∂ (C ) em V (ver Definição 4.33).
No caso em que o bordo de C tenha várias componentes cone-
xas, no Teorema acima, devemos considerar em cada uma delas uma
orientação. Este procedimento de expressar ∂ (C ) como soma de com-
ponentes orientadas,
orientações por exemplo,
das variedades ∂ (C ) = G1n+dependem
Gi de dimensão G2 + G3 , duma
em queori-
as
entação da superf´ıcie C , foi descrito acima na Proposi¸ cão 4.8 (ver
também Seção 5, Cap´ıtulo 3).
O teorema de Stokes vai dizer no caso do exemplo mencionado
acima que    
dw = w+ w+ w.
C G1 G2 G3
121

Referimos o leitor a [MC1] para uma demonstra¸ cão do teorema


acima.
Vamos considerar agora um exemplo de variedade diferenci´avel
(que vai ser importante para o que segue) obtida a partir de outra
variedade diferenciável M . Vamos definir agora o fibrado cotangente
à variedade M .

Definição 4.36. Para cada q M fixado, T Mq é o espaço vetorial
tangente a M em q . Considere T ∗ Mq o conjunto das transformaç˜oes
lineares de T Mq em R. O conjunto T ∗ M é por definiç˜ao o conjunto
∪ ∗
q T Mq . Este conjunto ser´a denominado fibrado cotangente à varie-
dade M .
Vamos assumir que M possua uma estrutura Riemanniana < , >.
Vamos agora equipar T ∗ M com um atlas diferenciável a partir de um
atlas diferenciável de M .

Dado q M considere < , >q =< , >. É fácil ver que para cada
q fixo e l T ∗ Mq , existe um ´unico η = ηl T Mq tal que para todo
∈ ∈
z T Mq , l(z) =< η, z >.

Fica assim definida uma aplicação que leva l em ηl e que estabelece
um isomorfismo de T ∗ Mq em T Mq .
Como estamos supondo que M possui uma estrutura Riemanni-
n
ana < , >, se fα : Uα
2n

M → R é carta coordenada local, então
Xα : x∈Vα T ∗ Mx
∪ → R dado por Xα (q, l) = (fα (q ), dfαq (ηl )) define
carta coordenada local.
É possı́vel mostrar (ver [Li3]) que variando as possı́veis cartas
locais fα , as correspondentes cartas Xα assim obtidas definem uma
atlas diferenciável para T ∗ M .
Chama-se de fibra tangente sobre q o conjunto dos v T Mq . ∈
Considere M variedade de dimens˜ao n. Fixada uma carta fα :
→n ∈ ⊂ ∈
Uα R de M , tal que fα (x) = q, x Uα M, q = (q1 , q2 ,...,q n )
n
R
∈{ }
, ep)i= qi . 1, 2,...,n considere a aplicação projeção πi , tal que
πi (q,
Fica assim definida a transforma¸cão linear dqi : T Mq → R dife-
rencial de tal πi . Estas transfromações dqi formam uma base do
conjunto das transforma¸cões lineares de T Mq em R. Sendo assim,
dada uma transforma¸cão linear p : T Mq → R é usual denotar tal p
em coordenadas locais q = fα (x) como p = p1 dq1 + ... + pn dqn .
Chama-se de fibra cotangente sobre q o conjunto dos p T ∗ Mq . ∈
122 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Um vetor v tangente a T ∗ M em (q, p) é portanto um elemento em


T ( T ∗ M ) que pode ser identificado com todas as curvas ( q (t), p(t))
tal que ( q (0), p(0)) = ( q, p) e ainda que ( q ′ (0), p′ (0)) determinam o
mesmo v T ( T ∗ M ) (ver Definição 4.17).

Exercı́cios
1. Mostre que a esfera x2 + y 2 + y 2 = 1 em R3 admite um atlas
C ∞ que a torna uma variedade orient´avel.
3
2. Mostre que o conjunto dos planos passando pela srcem em R
possui uma estrutura de variedade diferenci´avel.
3. Calcule dF para a transforma¸cão F : S →
S , onde S é a esfera
de centro (0,0,0) e raio 1 em R3 e F (x,y,z ) = ( x, y, z).
− −
4. Calcule a integral da 2-forma difere ncial w = x1 dx1 dx2 + ∧
x2 dx2 dx3 + x3 dx3 dx4 em Ω( R4 ) sobre a superfı́cie de di-
∧ ∧
mensão 2 dada por x21 + x22 + x23 + x24 = 1 e x1 = 0.1.
∧ ∧
5. Calcule a integral de dp1 dq1 + dp2 dq2 sobre a superf´ıcie de
dimensão dois q12 +q22 + p21 + p22 = 1 e q1 = 0.1 em (q1 , q2 , p1 , p2 )

4
R .
Capı́tulo 5

Formalismo Simplético

Nosso objetivo nesta se¸cão é apresentar a equação de Hamilton de


maneira intrı́nseca, ou seja de uma maneira que seja independente
de coordenadas locais. Usaremos para isto o formalismo das formas
diferenciais. Vamos considerar nesta se¸cão sistemas autˆonomos. Os
sistemas não autônomos serão analisados na pr´oxima seção.
Na Mecânica Hamiltoniana as vari´aveis posição e momento s˜ao
independentes (na Mecˆanica Lagrangeana a posi¸cão e a velocidade
não são independentes). Este ponto de vista é desejável na Mecânica
Quântica [ABC].
Em primeiro lugar vamos considerar o espaço dual de Rn . Lembre
que este espa¸co, denotado por Rn∗ , é por definição o espa¸co das
transformações lineares l : Rn
→ R (ver Definição 4.36).
Para cada ponto q do Rn considere Rnq o espaço tangente a Rn
em q e Rnq ∗ o espaço cotangente em q .
Uma base de Rn é dada por dq , dq ,...,dq .
O conjunto dos qelementos
∗ 1
( q, l) onde∈2
q Rnne l Rnq ∗ é chamado

de fibrado cotangente e é denotado por T ∗ Rn = q Rnq ∗ .

Note que Rn∗ = T ∗ Rn é uma variedade de dimensão 2n.
Nesta seção vamos introduzir o estudo de sistemas Hamiltonia-
nos em variedades no caso em que o Hamiltoniano n˜ ao dependa do
tempo t.
Na próxima seção vamos considerar o caso n˜ao autônomo.

123
124 [CAP. 5: FORMALISMO SIMPL ÉTICO

Em primeiro lugar cumpre destacar que a express˜ao


∂H
q̇ =
∂p
p˙ = − ∂H
∂q
, (5.1)

2n 2n
(q, p) ∈R , usa explicitamente a estrutura do R , em que dividi-

mos algumas
intenção coordenadas
de definir como p e outras
um Hamiltoniano como q . Caso
e as equa¸cões tenhamos
de Hamilton (ema
sistemas mecânicos em que o esp¸co de configura¸cão é uma variedade
diferenciável M ) de uma maneira an´aloga a (5.1), é necessário ex-
pressar tais equa¸cões de uma maneira independente da estrutura do
2n
R .
Para este fim ser´a natural introduzir formas diferenciais para ex-
pressar as equa¸cões de (5.1).
Considere  
0 E
J=
E 0 −
onde E é a matriz identidade em Rn . Sendo assim J é uma matriz
2n 2n.
× −
Note que J 2 = I (a matriz identidade). J vai ser a express˜ao
matricial local do que vamos chamar abaixo de forma simplética.
No caso em que n = 1 obtemos

J=
 0 1

−1 0
Considere agora a 2-forma diferencial
 =
w(z, v) = Jz,v
= zn+1v1 + zn+2 v2 + ... + z2n vn − z v − z v − ... − z v
1 n+1 2 n+2 n 2n ,

∈R 2n   é o produto interno Euclidiano .


z, v onde , Note que w
é alternada. Tal forma diferencial será denominada mais tarde de
simplética.
Para cada valor de i ∈{ }
1, 2,...,n , considere a 2-forma dpi
2n

dqi nas variáveis ( q, p) = (q1 , q2 ,...,q n , p1 , p2 ,...,p n ) ∈
R . Note
que para η = (η1 ,...,η n , ηn+1 ,...,η 2n ), θ = (θ1 ,...,θ n , θn+1 ,...,θ 2n ) a

expressão de dpi dqi quando aplicado a estes vetores é dada por
dpi ∧ dq (η, θ) = θ η − η θ
i i n +i i n+i .
125

Logo w pode ser escrita como w(η, θ) =


 n
i=1 dpi ∧ dq (η, θ) =
i

dp dq (η, θ).
Observe agora que dado H (v, w) : R2n R →
∂H ∂H
∂q 1 ∂p 1
.. ..
 ∂H.   ∂H. 
∂q n ∂p n
J ∂H = ∂H .
 ∂p 1
..
  −∂q 1
..

 .  − . 
∂H ∂H
∂p n ∂q n

2n
Sendo assim as Equa¸cões de Hamilton em R podem ser escritas
de maneira compacta como
∂H ∂H
(q̇, p) ∇
˙ = J( H) = (
∂p 1
,...,
∂p n
, − ∂H
∂q
,...,
∂H
∂q
1
).
n

J ( H ) define assim o campo de vetores Hamiltoniano.



Como sabemos,
∂H ∂H ∂H ∂H
dH = dq1 + ... + dqn + dp1 + ... + dpn
∂q 1 ∂q n ∂p 1 ∂p n
∈R 2n ∈R 2n
é uma 1-forma diferencial em . Seja um vetor η ,

η = (η1 ,...,η 2n ).

Note que
n n
∂H ∂H
dH (η) = ηi + ηn+i =
i=1
∂q i i=1
∂p i
   ∂H ∂H ∂H ∂H

− −η ),
(ηn+1,...,η 2n , η1 ,..., n − −∂p 1
,...,=
∂p n
,
∂q 1
,...,
∂q n
Jη,J (∇H ) = w(η, J (∇H )).
∂H ∂H
Em outras palavras ε = J (∇H ) = ( , − ) é o unico
´ vetor em
∂p ∂q
R2n tal que para todo η, vale que w(η, ε) = dH (η).
126 [CAP. 5: FORMALISMO SIMPL ÉTICO

Observação 5.1. Podemos portanto afirmar que ε =


 ∂H
− ∂H
 é
∂p , ∂q
2n
o unico
´ vetor tal que para todo η ∈R
w(η, ε) = (dp1 ∧ dq1 + ... + dpn ∧ dq ) (η, ε) = dH (η).
n

A expressão acima é a que realmente pode ser tratada de maneira


intrı́nseca para fins de definição do campo de vetores Hamiltoniano
como veremos a seguir.
Vamos definir o Campo Hamiltoniano de maneira intrı́nseca em
uma variedade n-dimensional.
Dada uma superfı́cie de configuração M , o campo Hamiltoniano
para ser definido de maneira intrı́nseca, deverá ser definido sobre V ,
onde V é o fibrado cotangente T ∗ M = V .

Definição 5.1. Sobre uma variedade V de dimens˜ao 2n, diz-se que


uma 2-forma w em V é n˜ao degenerada se para todo x V , vale que ∈
∀ ∈  ∈
ε Tx V = 0 existe um η Tx V tal que wx (η, ε) = 0. 
Definição 5.2. Uma forma w é chamada de forma simplética sobre
uma variedade V se w satisfaz dw = 0 e é também n˜
ao degenerada.
Uma variedade V com uma 2-forma simplética w é chamada de uma
variedade simplética e ser´
a denotada por (V, w).

Exemplo 5.1. A 2-forma


 n
i=1 dpi ∧ dq i define uma estrutura sim-
plética sobre R2n .

Lembre que um campo de vetores G em uma superfı́cie V de


dimensão r é uma escolha de um vetor tangente G(x) T Vx para ∈

cada x V .
Como vimos anteriormente, nesta se¸cão,

(q̇, p) ∇
˙ = J( H) =
 ∂H
, − ∂H
 = G(q, p),
∂p ∂q

define o campo de vetores Hamiltoniano.


Vamos a seguir definir campos de vetores Hamiltonianos sobre
variedades simpléticas.
127

Definição 5.3. Considere uma variedade simplética (V, w). Para



cada vetor ε T Vx tangente à variedade simplética (V, w) no ponto
x, associamos a 1-forma wε tal que
∀ η ∈ T V , w (η) = w(η, ε).
x ε

Denote por A : T V T ∗ V a aplicaç˜


ao tal que A(ε) = wε , onde
∈ ∈ →
ε T Vx e wε T ∗ Vx foi definida acima.
Observe que A é isomorfismo linear entre dois espaços vetoriais
de mesma dimens˜ao. Isto porque, A é injetiva de T Vx no espaço das
1-formas em T Vx∗ , isto é, A(ε) = 0 implica que ε = 0 (isto segue
facilmente de ε = 0 existe um η tal que wx (η, ε) = 0, ε, η T Vx ).
∀   ∈
Considere agora In a inversa de A
In : T V ∗ → T V.
Definição 5.4. Dado H : V → R qualquer, onde (V, w) é uma vari-
edade simplética, o campo Hamiltoniano em M determinado por H
é por definiç˜ao In(dH ). Isto é, para x ∈ V fixo In(dH ) = ε ∈ T V , x
onde w (η) = w(η, ε) = dH (η), ∀η ∈ T V . Fica definido assim um
ε x

campo
campo dede vetores
vetores ε(x) = G(x) para
Hamiltoniano todo x ∈
associado a VH,. que ser´a denominado
A definição acima é absolutamente natural após as considera¸cões
que fizemos anteriormente nesta seção (ver Observação 5.1). Conside-
rando H (q, p) definido sobre (q, p) T ∗ Rn e w = dp dq recuperamos
∈ ∧
a expressão do campo Hamiltoniano quando estamos nas coordenadas
locais de R2n .
Observe que para diferentes estruturas simpléticas w sobre a mes-
ma variedade V , podemos ter diferentes campos Hamiltonianos.
Note que dH (é uma transformação linear agindo em T Mx ) e w
(é uma transformação bilinear agindo em T Mx ) são definidos intrin-
secamente, logo o vetor ε foi definido de maneira intrı́nseca.

(verVamos agora
Definição usarpcoordenadas
4.36), = p1 dq1 + ...locais
+ pn dqxn transformação
= (q, p) em V linear
= T ∗de
M
T Mq em R (M variedade de configuração) e denotar x = (x1 ,...,x 2n )
por
x = (q1 ,...,q n , p1 ,...,p n )
e vetores tangentes por
(q1′ ,...,q n′ , p′1 ,...,p ′n ) ∈ T ( T ∗M ) .
x
128 [CAP. 5: FORMALISMO SIMPL ÉTICO

Proposição 5.1. Seja M variedade de dimens˜ao n. O fibrado cotan-


gente T ∗ M , tem uma estrutura simplética natural w. Essa estrutura
simplética w, em coordenadas locais é dada por dp1 dq1 + dp2 dq2 + ∧ ∧

... + dpn dqn .
Demonstração: Considere p : T Mq R uma transformação linear
e (q, p) ∈ T ∗ M . →
Vamos primeiramente definir uma 1-forma v em T ∗ M . A 2-forma
w = dv, derivada de tal forma v será a forma simplética que busca-
mos.
Seja ε ∈ T (T ∗ M )(q,p) um vetor tangente do fibrado cotangente
no ponto ( q, p) onde p T ∗ Mq .

Um vetor tangente ε em T (T ∗ M )(q,p) é representado por uma
curva (q (t), p(t)) T ∗ M, t ( ǫ, ǫ), tal que ( q1′ ,...,q n′ , p′1 ,...,p ′n ) =
∈ ∈ −
(q ′ (0), p′ (0)) = ε e (q (0), p(0)) = (q, p).
Considere agora a proje¸cão π : T ∗ M →
M tal que π(q, p) = q .
Para ε um vetor em T (T ∗ M ), temos que dπ(ε) ∈
T M (pois dπ :

T (T M ) → T M é a derivada da projeção π).

Definimos a 1-forma v em T ∗ M por


v(ε) = p(dπ(ε)) , ε T (T ∗ M )(q,p) .
∀ ∈
Afirmamos que esta 1-forma v em coordenadas locais se escreve

n
como pdq = i=1 pi dqi .
Vamos mostrar agora a afirma¸cão mencionada acima. Considere
coordenadas locais ( q, p) para T ∗ M .
Por definição
π : T ∗M M →
(q, p)→ q = (q , q ,...,q )
1 2 n

Logo dπ : T (T ∗ M ) → T M é apenas (dq , dq ,...,dq 1 2 n ). Logo


dπ(ε) = (q1′ ,...,q n′ ).
A transformação linear p definida em T Mq tem coordenadas locais

p1 , p2 ,...,p n ,

isto é p é a transformação p1 dq1 + p2 dq2 + ... + pn dqn . 


n
Finalmente, v(ε) = p(dπ(ε)) = pi q1′ + ... + p2 q2′ = i=1 pi dqi (ε).
Fica portanto demonstrada a afirma¸cão que v = pdq.
129

Considere agora w = dv.


É claro que dw = ddv = 0 (ver Proposi¸cão 4.5, Capı́tulo 2).

n
Note que em coordenadas locais w = i=1 dpi dqi = dp dq . ∧ ∧
É fácil ver também que w é não degenerada, p ois se ε = (ε1 ,...,ε 2n ) = 

0, então existe εi = 0 (suponhamos que i esteja entre os primeiros n do
vetor ε para simplificar a nota¸cão que segue). Portanto w(η, ε) = 0,
onde η = (η1 ,...,η 2n ) é escolhido de tal modo que ηj = 0, para 

j = n + i e ηn+i = 1 (este fato segue da forma local de w(z, v) =<
 n
Jz,v > = i=1 dpi dqi ). ∧
Se o termo n˜ao nulo εi está entre os ´ultimos n elementos do vetor
ε, um raciocı́nio análogo pode ser aplicado.
Concluı́mos assim que w como definida acima é uma forma sim-
plética. 

Um resultado mais geral que o anterior, mas que não será demons-
trado no texto é o teorema de Darboux (ver [A1] para prova).
Teorema 5.1. (Teorema de Darboux) Dada uma variedade simplética
V de dimens˜ao 2n e uma forma simplética w, para todo ponto x V ,
é possı́vel encontrar um sistema de coordenadas fα em torno de x ∈
tal que fα : Uα → R2n , fα (x) = (q1 , q2 ,...,q n , p1 , p2 ,...,p n ), tal que

nestas coordenadas w é da forma ni=1 dpi dqi = dp dq .∧ ∧
Vamos mostrar agora um resultado muito importante.
Seja ( M, w) uma estrutura simplética e H : T M ∗ R Hamilto- →
niano. Assuma que In(dH ) define o campo de vetores Hamiltoniano
G(x) e seja φt : T ∗ M T ∗ M o correspondente fluxo de difeomorfis-

mos associado ao campo, isto é,

d
 φt x = In(dH )(x) = G(x).
dt t=0

Esse fluxo se chama o fluxo Hamiltoniano associado ao Hamilto-



niano H .
Uma variedade diferenciável A de dimens˜ao dois com bordo é
simplesmente conexa se ela é difeomorfa a um aberto simplesmente
conexo do R2 .
Teorema 5.2. O fluxo Hamiltoniano φt sobre T M ∗ preserva a es-
trutura simplética natural w = dp dq , isto é, (φt )∗ w = w.

130 [CAP. 5: FORMALISMO SIMPL ÉTICO

Demonstração: Temos que mostrar (ver exercı́cio após Defini¸cão


4.35) que qualquer subvariedade (que sem perda de generalidade po-
demos assumir ser simplesmente conexa) A de dimensão 2, A T ∗ M ⊂
com bordo diferenci´avel por partes é tal que

 
A w= φt (A) w.

Considere a superfı́cie de dimensão 3 , A × (0, τ ) ⊂ T ∗M × R e


sua imagem pelo fluxo φt ,

Jτ = ∪∈t (0,τ ) ∪∈ x A (φt (x), t) ⊂ T ∗M × R,


então, ver Figura 4.4,

−( ∪ ∈ ∪ ∈ (φ (x), t) + φ A − A.
∂J τ = t (0,τ ) x ∂A t τ

Denotaremos ∪ ∈ ∪ ∈ (φ (x), t) = B , que é a superfı́cie de


t (0,τ ) x ∂A t τ
dimensão 2 (que depende de τ ).
Note que w é uma forma diferencial em T M ∗ e assim podemos
pensar que é uma forma diferencial sobre T M ∗ R que não depende ×
da segunda variável. Quando formos usar a seguir o teorema de Sto-

kes, lembre que a contribuição da integral em t∈(0,τ ) x∈δA (φt (x), t), ∪
não vai depender do t na parte (., t) acima. Sendo assim, para simpli-
ficar a nota¸cão, algumas vezes vamos omitir a parte correspondente
a t nas integrais abaixo.
Primeiro, vamos mostrar que

d
 w=
 dH =
 dH,
dτ Bτ φτ (∂A ) (φτ (δA ),τ )

isto é, vamos mostrar equivalentemente que


 w=
  τ
dH dt.

Bτ 0 φt (∂A )


Seja f (s), 0 < s 1 parametrização de ∂A.
Então ϕ(s, t) = (φt (f (s)), t) = φt (f (s)), 0 < s 1, 0 < t < τ , ≤
define uma parametriza¸cão da superf´ıcie Bτ de dimensão 2.
131

Por definição de integral de uma 2-forma diferencial


 w=
 τ 1
w(η, ε)dsdt
Bτ 0 0

onde
ε = ∂ϕ
∂t
e
∂ϕ
, η=
δs
pois ϕ(s, t) = φt (f (s)) parametriza Bτ .
Note que ε é o vetor que define o campo Hamiltoniano.
Por definição de campo Hamiltoniano
∂ϕ
dH (η) = dH ( ) = w(η, ε)
∂s
(ver Definição 5.4).
Logo
 τ
   
dH dt =
τ 1
dH
∂ϕ(s, t)
 
ds dt = w.
0 φt (∂A ) 0 0 ∂s Bτ

Assim concluı́mos que

d
 w=
 dH.
dτ Bτ φτ (∂A )

Ora pelo Teorema de Stokes,

 φt (∂A ) dH =  ∂ (φt (∂A )) H=0

pois ∂ (φt (∂ (A))) = . ∅


Logo  w

é constante.
132 [CAP. 5: FORMALISMO SIMPL ÉTICO

Quando τ → 
0, Bτ w converge a ∂A w = 0 (afinal estamos in-

tegrando uma 2-forma em uma superfı́cie com região bidimensional
convergindo a uma curva quando τ vai a zero).
Logo
w=
0 (5.2)

para todo τ .

Como w é simplética satisfaz dw = 0 então:

0=
 dw. (5.3)

Pelo teorema de Stokes


 dw =
 w=
 w −
 − w w. (5.4)
Jτ ∂J τ φτ (A) A Bτ

Juntando as expressões (5.3) e (5.4) obtemos

0=  Jτ dw = ∂J τ w=  φτ (A) w −  −
A w Bτ w.

Como o termo
 Bτ w é zero por (5.2) concluı́mos que
 w=
 w,
φτ (A) A

ou seja, φt preserva a forma simplética w. 

Definição 5.5. Dizemos que uma k-forma diferencial w é um inva-


riante integral absoluto para g : T ∗ M T ∗ M se →
w= w
g (C ) C

para toda variedade C de dimens˜ao k contida em T ∗ M .

Equivalentemente, w é invariante integral absoluto para g : T ∗ M →
T M se g ∗ (w) = w.

A proposi¸cão anterior mostrou que g ∗ (w) = w quando g = φt é
o fluxo Hamiltoniano para t fixo obtido a partir de H e w a forma
simplética natural (Proposição 5.1).
133

2 ∧ dp é um
Exemplo 5.2. Se g preserva ´area em R ent˜ao w = dq
invariante integral absoluto de g .
Proposição 5.2. Se w1 e w2 s˜
ao invariantes integrais de g , ent˜ao

w1 w2 também é invariante integral de g .

Demonstração: Segue imediatamente do fato que


g ∗ (w1 w2 ) = (g ∗ w1 ) (g ∗ w2 ) = w1 w2
∧ ∧ ∧
(ver Proposição 4.3 c)). 

A 2n-forma diferencial ( w)n define um elemento de volume em


T ∗ M (ver Definição 4.9). Note que em coordenadas locais

wn = (dp ∧ dq) n
= dp1 ∧ dp ∧ ... ∧ dp ∧ dq ∧ dq ∧ ... ∧ dq .
2 n 1 2 n

Proposição 5.3. O fluxo Hamiltoniano φt preserva o elemento de


volume (w)n .
n n
Demonstração: Segue imediatamente do fato que g ∗ (w ) = (g ∗ w)
= (w)n , quando g = φt , t fixo, e do Teorema 5.2. 

Definição 5.6. Uma transformaç˜ ao g , g : T ∗ M → T ∗M que pre-



serva w, isto é, g w = w, é dita canˆ
onica.
Note que se g é canônica, g também preserva o elemento de volume
(w)n , pois g ∗ (wn ) = (g ∗ w)n = (w)n .
Definição 5.7. Uma k-forma w é dita invariante relativo para g :
T ∗M →T ∗ M se  
w= w
∂C g (∂C )

para toda subvariedade C de dimens˜ao k com bordo contida em T ∗ M .


Proposição 5.4. Se w é invariante relativo para g : T ∗ M → T ∗M
ent˜ao dw é invariante absoluto para g .
Demonstração: Seja w invariante relativo e C subvariedade de di-
mensão k + 1 com bordo ∂ (C ) contida em T ∗ M . Note que o bordo
de ∂ (C ) é vazio.
134 [CAP. 5: FORMALISMO SIMPL ÉTICO

Logo pelo Teorema de Stokes


 dw =
 w=
 w=
 w=
 dw.
C ∂C g (∂C ) ∂ (g (C )) g (C )

Logo, concluı́mos que dw é invariante absoluto. 

Vamos agora demonstrar a vers˜ao simplética do teorema de con-


servação do Hamiltoniano. Observe como a demonstração fica abre-
viada através do uso do formalismo simplético.
Teorema 5.3. (Lei de Conservação de Energia) A funç˜
ao H é cons-
tante ao longo das trajet´orias do fluxo Hamiltoniano.
Demonstração: A derivada direcional de H na direção θ é dH (θ).
Por definição In(dH ) é o Campo Hamiltoniano. Seja então η =
In(dH ).
Então dH (η) = w(η,In (dH )) = w(η, η) = 0 (pois como w é
alternada w(η, η) = w(η, η)).−
Logo, H é constante ao longo do fluxo Hamiltoniano. 


Dado um Hamiltoniano H (q, p), q M , variedade m-dimensional,
vamos mostrar agora que existe uma densidade natural ∇H1(x) que
define uma medida invariante para o fluxo Hamiltoniano restrito a

uma superfı́cie (2m 1) dimensional de Energia total constante.
Considere uma superfı́cie S de dimensão m 1 em Rm . Dado −
m-vetores v1 , v2 ,...,v m em Rm , o volume determinado por estes ve-
∧ ∧
tores é expresso por dx1 ... dxm (v1 , v2 ,...,v m ) (ver Definição 4.3).
O procedimento natural de induzir em S uma maneira de medir vo-

lume m 1 dimensional em cada plano T Sx é o seguinte: dados

u1 , u2 ,...,u m−1 T Sx , definimos o volume w̃(u1 ,...,u m−1 ) determi-
nado por u1 ,..,u m−1 como

∧ ∧
w̃(u1 ,...,u m−1 ) = dx1 ... dxm (η, u1 , u2 ,...,u m−1 ),
onde η é o vetor normal unitário (aqui estamos usando a métrica
Riemanniana) em S .
Geometricamente falando, estamos considerando um paralelepı́-
pedo m dimensional com altura η e dizendo que o volume m 1 −
dimensional da base é o volume m-dimensional do paralelepı́pedo
η, u1 ,..,u m−1 (isto porque η tem altura 1).
135

As considerações geométricas feitas acima devem esclarecer o lei-


tor para o procedimento que ser´a utilizado na pr´oxima proposição.
Vamos denotar por wn a forma volume usual em R2n = dq1 ... ∧ ∧

dqn dp1 ... dpn . ∧ ∧
Proposição 5.5. Seja M = Rn variedade Riemanniana de dimens˜ao
n com a métrica Riemanniana definida por <, >. Considere um
Hamiltoniano H (q, p) e w forma simplética natural (ver Proposiç˜ao
56, Capı́tulo 3) sobre R2n = V = T ∗ M = T ∗ (Rn ). Ent˜ao a forma

w̃ ((2n 1)-forma diferencial) sobre uma superfı́cie compacta E =
{ | } −
(q, p) H (q, p) = c (2n 1 dimensional) de Hamiltoniano constante
(assuma que ∇
H (x) n˜ 
ao se anule em E ) dada por
1
w̃x (v2 , v3 ,...,v 2n ) = wn (ηx , v2 ,...,v 2n )
∇ H (x) x

é invariante para φt restrito a esta superf´
ıcie E .

Demonstração: Para c R fixo considere a variedade de dimens˜ao
2n 1
− Ec = E = x T ∗ M H (x) = c . { ∈ | }
Como sabemos pelo Teorema de Conserva¸cão do Hamiltoniano,
E é invariante por φt .
A forma wn é forma volume sobre T ∗ M . Se M for o R2n então
n
∧ ∧ ∧ ∧ ∧
w = dp1 ... dpn dq1 ... dqn . A forma volume natural sobre

a superfı́cie E de dimensão 2n 1 é a forma ŵ tal que x E ∀ ∈
ŵx (v2 ,...,v 2n ) = wxn (ηx , v2 ,...,v 2n )

onde ηx é o vetor normal a E (estamos assumindo uma orienta¸cão


em E ) com norma 1 (estamos assumindo que existe uma métrica
Riemanniana, ou seja, que ηx , ηx = ηx 2 = 1).
   
Considere sobre E a 2n − 1 forma diferencial
1
w̃ =
∇H (x) ŵ , x x

isto é,
1 n
w̃x (v2 , v3 ,...,v 2n ) =
∇H (x) w x (ηx , v2 ,...,v 2n ).
136 [CAP. 5: FORMALISMO SIMPL ÉTICO

Vamos mostrar que w̃ = φ∗t (w̃) para qualquer t R. Logo φt vai ∈


deixar invariante uma forma volume sobre E .
Antes, mostramos na Seção 2, Cap´ıtulo 3 que H φt = H , t R. ◦ ∀∈
Logo
dH dφt (x) = dH. ◦
∀ ∈
Portanto, η T ∗ Mx ,
∇ 
Hφt (x) , dφt (x)(η) = (dH◦ dφ (x))(η) = dH (η) = ∇H , η.
t x

Aplicando a última expressão a η = ∇H , obtemos ∇H , ∇H  = x x x


2
∇H  = ∇H , dφ (x)(∇H ) .
x φt (x) t x
Como ∇H é normal à variedade E , temos que

η =
∇H x
x
∇H  x

e
η =
∇H . φt (x)
φt (x)
∇H  φt (x)

Logo a ´ultima igualdade pode ser reescrita como


∇H (x) = ∇H
 φt (x)

∇H  ∇H
φt (x) φt (x)  , dφ (x)(η )
t x  
= ηφt (x) , dφt (x)(ηx ) .

Logo a proje¸cão de dφt (x)(ηx ) sobre ηφt (x) é

∇H (x) .
∇H  φt (x)

Sendo assim

dφt (x)(ηx ) =
∇H  η x
φt (x) + z1
∇H  φt (x)


onde z1 T Eφt (x) .
Note que se ˜v2 , ṽ3 ,..., ṽ2n é uma base de T Eφt (x) , então existem
αi , i∈{ }
2,..., 2n tal que
2n

z1 = αi ṽi .
i=2
137

Logo
 2n

wφnt (x) (z1 , ṽ2 , ṽ3 ,..., ṽ2n ) = wφnt (x) αi ṽi , ṽ2 ,..., ṽ2n =
i=2

2n
 αi wφnt (x) (ṽi , ṽ2 , ṽ3 ,..., ṽi ,..., ṽ2n ) = 0.
i=2

É fácil ver a partir da ´ultima expressão que para qualquer


v2 , v3 ,...,v n T Eφt (x) , wφnt (x) (z1 , v2 ,...,v 2n ) = 0.

Portanto, para qualquer v2 , v3 ,...,v n T Eφt (x) ∈
 ∇H  η x

wφnt (x) (dφt (x)(ηx ), v2 ,...,v 2n ) = wφnt (x) φt (x) , v2 ,...,v 2n .
∇H  φt (x)
(5.5)
Vamos agora mostrar que φ∗t w̃ = w̃.
Ora, φ∗t (x)(w̃)(v2 ,...,v 2n ) = w̃φt (x) (dφt (x)(v2 ),...,dφ t (x)(v2n ))

= 1 n
∇H φt (x) w φt (x) (ηφt (x) , dφt (x)(v2 ),...,dφ t (x)(v2n ))

1
 ∇ Hx 

= wn ηφt (x) , dφt (x)(v2 ),...,dφ t (x)(v2n )
Hx φt (x)
∇  ∇ Hφt (x) 
1
= wn (dφt (x)(ηx ), dφt (x)(v2 ),...,dφ t (x)(v2n ))
Hx φt (x)
∇ 
1
= wn (ηx , v2 ,...,v 2n ).
∇ Hx x
A última igualdade segue de φ∗t (x)(wn ) = wn (Proposição 5.3,
Capı́tulo 3) e a penúltima de (5.5).
Concluı́mos portanto que w̃ define uma densidade invariante para
φt restrito à superfı́cie de Hamiltoniano constante Ec . Este fato segue
de que
1
w̃x (v2 , v3 ,...,v 2n ) = wn (ηx , v2 ,...,v 2n )
∇ H (x) x 
é invariante para φt , t ∈ R. 
138 [CAP. 5: FORMALISMO SIMPL ÉTICO

Para obter uma probabilidade a partir de w̃ devemos multiplicar


w̃ pela constante k = 1 w̃ . 
E
Deixamos a cargo do leitor estender o resultado acima para varie-
dades simpléticas.
Para concluir esta se¸cão, vamos agora descrever o procedimento

natural
L(q, q̇ ), para se obter
definido sobreum Hamiltoniano
uma variedade de a partir
configura¸ de umacãoLagrangiano
M, q ∈ M,

q̇ T Mq .
Para um Lagrangiano L, e para ( q, q̇ ) fixo, vamos considerar que
o momento p Rnq ∗ é dado por p = dL
∈ dq̇ (q, q̇ ), isto p é a transformação
linear derivada de L em relação a ˙q no ponto ( q, q̇ ).
Sendo assim, fixada a base dq1 , dq2 ,...,dq n , a 1-forma diferencial
(famı́lia de transformações lineares dependendo de q ) p = ∂L ∂ q̇ nesta
base é dada por
∂L ∂L
p= dq1 + ... + dqn .
∂ q˙1 ∂ q˙n
dL
Desta maneira dq̇ quando expressa na base dq1 , dq2 ,...,dq n , de-

termina
Sendoo que anteriormente
assim, para cada qcham´avamos
fixo fica associadode momento
a q̇ Rnp.de maneira

n∗
bem definida um elemento p ∈ Rq (contanto que a condi¸cão da
Observação 4, Capı́tulo 3), que vai ser o momento.
Uma questão importante é a seguinte: como obter H (q, p), (q, p) ∈
T ∗ M , a partir de L(q, q̇ ), (q, q̇ ) T M .

Para (q, q̇ ) fixo considere p = ∂L ∂ q̇
∈ T ∗ Mq .
Para q fixo obtemos assim uma associação d e q̇ com p, defi-
nindo uma aplica¸cão Bq : T Vq → T ∗ Vq tal que Bq (q̇ ) = p. Esta
∂2L
aplicação é bijetiva se por exemplo ∂ q̇ > 0, conforme a Observa¸cão
4, Capı́tulo 3.
Vamos supor no que segue que tal Bq seja bijetivo para todo
q V.
∈ Considere um Lagrangiano L(q, q̇ ). Para ( q, p) fixados, definimos
H (q, p) como
H (q, p) = p(Bq−1 (p)) 1
− L(q, B− (p)) = p(q̇) − L(q, q̇),
q

onde Bq (q̇ ) = p.
Acima, p(Bq−1 (p)) significa aplicar a transforma¸ cão linear p no
vetor tangente q̇ = Bq−1 (p).
139

Note que o Lagrangiano é naturalmente definido no fibrado tan-


gente T M de uma variedade M de configuração, enquanto que o
Hamiltoniano é naturalmente definido no fibrado cotangente T ∗ M
da variedade de configura¸cão.
Conclusão: Dada uma função H (q, p) definida no fibrado cotangente
a uma variedade M é possı́vel definir um campo de vetores sobre o
fibrado cotangente denominado campo Hamiltoniano. Isto porque, o
fibrado cotangente tem uma estrutura simplética natural.
Quando desejamos fazer alguma conta, podemos considerar um
certo sistema de coordenadas locais e assim obter resultados sobre o
sistema.
É mais natural proceder de maneira intrı́nseca como foi feito
acima, pois n˜ao existe raz˜ao para um certo sistema de coordenadas
ser privilegiado em rela¸cão aos outros.
As trajetórias deste campo de vetores podem ser definidas também

como os extremais da a¸cão γ pdq onde os extremos do caminho γ
estão fixos em γ (t1 ) = a, γ (t2 ) = b.
Este campo n˜ao é determinado por um único possı́vel Hamilto-
niano H , pois podemos somar a esta fun¸ cão uma forma w tal que
dw = 0, e claramente a Defini¸cão 96 n˜ao vai alterar o campo Hamil-
toniano que vamos obter.
Dada uma fun¸cão sobre o fibrado tangente a uma variedade M ,
podemos obter um sistema Lagrangiano sobre o fibrado tangente. A
maneira de relacionar os dois sistemas foi descrita acima.

Exercı́cios
1. Para o Hamiltoniano do pêndulo sem atrito, calcule para cada
nı́vel de energia constante a densidade ψ do Teorema 63.
Assuma que o nı́vel de energia não passe pelo ponto (0,0) ou
(π, 0).
2. Mostre que o toro S1 ×S 1 admite um estrutura simplética.
Capı́tulo 6

Linhas de Vortex em
Mecânica Hamiltoniana

Nesta seção vamos considerar apenas campos Hamiltonianos n˜ao au-


tônomos H (q,p,t ). Vamos desenvolver o formalismo que permit e
definir neste caso as equa¸cões de Hamilton de maneira intrı́nseca.
O ponto de vista ser´a intrı́nseco e o leitor pode perceber que as
as demostrações utilizando tal ponto de vista ser˜ ao simples e n˜ao
envolvem demasiado cálculo.
2n+1
Proposição 6.1. Dado uma 2-forma w em R , 
existe ξ = 0 tal
que w(ξ, η) = 0, η R2n+1 .
∀ ∈
Demonstração: Uma forma diferencial é por definição alternada,
 
portanto é dado por w(ξ, η) = Aξ,η onde A é matriz alternada.

Ora
A∗ =o determinante
− de tal
A e det A = det A∗matriz − −×
= det((2A)n=+( 1)1)2n(2n
+1 + 1) é zero pois
det A = det A. −

Logo existe um auto-vetor ξ = 0 com auto-valor 0 e, portanto,
   
w(ξ, η) = Aξ,η = 0, η = 0. 

Definição 6.1. Uma 2-forma é dita n˜


ao singular se
2n+1 2n+1
{ ∈R
dim ξ |w(ξ, η) = 0, ∀ η ∈ R } = 1.
140
141

Definição 6.2. Dada uma 2-forma w n˜ ao singular, em cada ponto do


R2n+1 , o subespaço de dimens˜
ao 1 definido por algum ξ da Proposiç˜ao
6.1 é chamada direç˜ao de vortex.
Definição 6.3. Seja w 2-forma diferencial n˜
ao singular. Uma curva
2n+1
diferenci´
avel em R cuja tangente em cada ponto est´a na direç˜ao
de vortex naquele ponto da 2-forma w é chamada uma linha de vortex
da 2-forma w.
Os teoremas de existência e unicidade de equações diferenciais
ordinárias asseguram localmente a existência das linhas de vortex,
bastando para isso assumir condi¸cões de suavidade ( C ∞ ) da 2-forma
w não singular. Observe que enquanto a solução de uma equação dife-
rencial depende do tempo de maneira bem definida, a linha de vortex
é uma curva, para a qual poderı́amos ter v´arias parametrizações pelo
parâmetro t.
As linhas de vortex determinam o que se chama um campo de
linhas e n˜ao um campo de vetores (ver [MC3]).
Proposição 6.2. Considere em R2n+1 o Hamiltoniano H (p, q, t), a

1-forma w1 = pdq Hdt e a 2-forma w2 = dw1 . Ent˜ao as solu¸c˜oes
do sistema Hamiltoniano
dH
q̇ =
dp
p˙ = − dH
dq
s˜ao linhas de vortex de w2 .
Demonstração: Suponha que w2 seja não singular. Sendo assim

basta mostrar que ξ = (Hp , Hq , 1) em (q,p,t ) é direção de vortex da
2-forma w2 no ponto (q,p,t ). Primeiro mostraremos este ´ultimo fato,
e deixaremos ao leitor o trabalho de mostrar que w2 é não singular.
Ora, denote η por ( q1 , p1 , t1 )

w2 (ξ, η) = dw1 (ξ, η) = ∧ − dH


 (dp ∧ dt) − dH (dq ∧ dt) (ξ, η) =
dp dq
dp dq

= [(−H q − H p ) − H (H t − p ) − H (−H t − q ) = 0.
q 1 p 1 p q 1 1 q p 1 1

Logo ξ = (H , −H , 1) é a direção de vortex e as solu¸ cões de


p q
p˙ = Hp e q̇ = −Hq são curvas de vortex. 

Exercı́cio: Mostre que a forma w2 definida acima é não singular.


142 [CAP. 6: LINHAS DE VORTEX EM MEC ÂNICA HAMILTONIANA

Exemplo 6.1. Vamos calcular em um exemplo a forma w2 = dw1



quando w1 = pdq Hdt. Seja
p2 ω02 2
H (p, q ) = + q
2 2

o Hamiltoniano do oscilador harmˆonico. Logo  


p2 ω02 2
w1 = pdq − Hdt = pdq − 2
+
2
q dt

∧ dq − pdp ∧ dt − qw dq ∧ dt. 2
e w2 = dw1 = dp 0
Ora,
dH
q̇ = =p
dp

p˙ = − dH
dq
= −ω q. 2
0

Neste caso, temos realmente para η = (q1 , p1 , t1 ) e


ξ = (Hp , Hq , 1) = ( p, w02 q, 1) que

w2 (ξ, n) = [dp 2
∧ dq − pdq ∧ dt − qω dq ∧ dt] (ξ, n) =
0

( ω02 qq 1
− 2
− pp ) − p(−ω qt − p ) − qω (pt − q ) = 0.
1 0 1 1 0 1 1

Este exemplo serve apenas como ilustraç˜ao do resultado mais geral


anteriormente demonstrado.
A conclus˜ao importante do resultado que obtivemos acima é que
é possı́vel expressar as curvas soluç˜oes do Hamiltoniano através de
formas diferenciais, sem usar a estrutura global do R2n+1 . Isto per-
mitir´a introduzir as equaç˜oes de Hamilton (caso n˜ao autˆonomo) em
uma variedade diferenci´avel M . Deixamos a cargo do leitor fazer tal
extens˜ao.
Considere em R2n+1 duas curvas fechadas γ˜1 e γ˜2 tal que γ̃2 é
obtida aplicando o fluxo Hamiltoniano `a curva γ˜1 (ver Figura 4.5).
Definição 6.4. Duas curvas fechadas na situa¸c˜ao acima ser˜ao de-
nominadas de “relacionadas pelo fluxo Hamiltoniano”.
Definição 6.5. A forma w1 = pdq Hdt ser´ −
a chamada de invariante
de Poincaré-Cartan.
143

Teorema 6.1. Sejam γ̃1 e γ̃2 duas curvas fechadas relacionadas pelo
 

fluxo Hamiltoniano, ent˜ao γ̃1 pdq Hdt = γ̃2 pdq Hdt. −
Demonstração: Seja w1 = pdq − Hdt a forma de Poincaré-Cartan,
então pelo Teorema de Stokes,

 σ
dw1 =  γ̃1
w1 −  γ̃2
w1

onde σ é o tubo bidimensional que tem como bordo as duas curvas


γ̃1 e γ̃2 orientadas na dire¸cão positiva.
As curvas γ1 e γ2 da Figura 4.5 correspondem respectivamente a

γ̃1 e γ̃2 .
A integral de  dw1 = 0,
σ

pois o vetor ( Hp , Hq , 1), tangente à superf´ıcie com bordo σ, se anula
para a forma dw1 . Isto se dev e a uma Proposi¸cão que foi anterior-
mente demonstrada. 

Considere agora uma curva ˜γ1 contida em um plano t1 = cons-


tante.
Sendo assim, considerando o campo ( Hp , Hq , 1) e a sua evolu¸cão −
com t, é fácil ver que a curva ˜ γ2 que se obtém aplicando o fluxo
φt à curva ˜γ1 , é tal que γ̃2 também está contida em um plano t =
constante, digamos t = t1 . Neste caso, a proposi¸cão acima diz apenas
que  
pdq = pdq.
γ̃1 γ̃2

Isto porque
Hdt = Hdt = 0,
 γ̃ 1  γ̃ 2

uma vez que n˜ao existe compone nte na direção t para os vetores
tangentes a γ̃1 ou γ̃2 .
Observe que todas as considerações que fizemos acima s˜ao válidas
em variedades diferenci´aveis. Em outras palavras, não usamos em
nenhum momento propriedades do espa¸co R2n+1 .
− 2n+1
Proposição 6.3. O fluxo ( Hq , Hq , 1) preserva volume em R .
144 [CAP. 6: LINHAS DE VORTEX EM MEC ÂNICA HAMILTONIANA

Demonstração: Seja γ˜1 curva fechada simples contida em t1 =


constante e γ˜2 outra curva obtida pela evolu¸cão do fluxo no tempo
t2 .
Então pelo teorema de Stokes em R2n R2n t1 , temos ≡ ×
pdq = dp dq
 γ˜1  ∆1 ∧
onde ∆ 1 é a região de R2n R2n t1 tal que δ ∆1 = γ˜1 (ver Fi-
≡ ×
gura 4.5 ). Da mes ma for ma se φt (∆1 ) = ∆2 então δ ∆2 = γ˜2 em
R2n = R2n t2 , e ainda pelo teorema de Stokes
×
 pdq =
 dp ∧ dq.
γ˜1 ∆2

Como vimos antes


 pdq =
 pdq,
γ˜1 γ˜2

logo segue-se que


 dp ∧ dq =
 dp ∧ dq.
∆1 ∆2

Como o resultado vale para qualquer ∆ 1 (note que φt (∆1 ) = ∆2


e φt (γ˜1 ) = γ˜2 ) concluı́mos que φt preserva dp dq . Como ∧
n
(dp ∧ dq) = dp1 ∧ ... ∧ dp ∧ dq
n 1 ∧ ... ∧ dq ,
n

2n
concluı́mos que o fluxo Hamiltoniano φt em R preserva volume. 

Observe que o resultado acima foi provado para Hamiltonianos


H (q,p,t ) que dependem do tempo. J´a havı́amos mostrado antes este
resultado, o teorema de Liouville, mas a demonstra¸ cão acima pode
ser aplicada também a ao fibrado cotangente T ∗ M de uma variedade
diferenciável M .
Deixamos a cargo do leitor extender os resultados acima obtidos
no Rn para variedades diferenciáveis M de dimensão n.
Conclusão: A partir de um Hamiltoniano H (q,p,t ), definido sobre
o produto cartesiano do fibrado tangente a uma variedade M por R,
145

foi possı́vel definir um campo de vetores Hamiltoniano sobre o fibrado


cotangente a M .
Este campo de vetores pode também ser caracterizado como os
 −
extremais de γ pdq Hdt, em que os extremos (e os tempos) γ (t1 ) = a
e γ (t2 ) = b estão fixos.
Este campo não é determinado por um único possı́vel Hamiltoni-
ano H , pois podemos somar a esta fun¸ cão uma forma w = dG, e os

valores da ação irão se alterar por uma valor fixo G(b) G(a). Logo,
irão determinar os mesmos extremais.

Exercı́cio
1. Considere o Hamiltoniano H (q,p,t ) = p2 + q 2 + t. Calcule as
linhas de vortex em R3 para tal Hamiltoniano.
Capı́tulo 7

Equações Diferenciais
Parciais: Método das
Caracterı́sticas

Para analisar com mais profundidade a equação diferencial de Hamil-


ton-Jacobi necessitaremos primeiro analisar alguns aspectos da teoria
geral das equa¸cões diferenciais de primeira ordem. Referimos o leitor
para [Jo], [I] e [Ju] para uma exposi¸cão mais completa sobre o assunto.
Nosso objetivo nas pr´oximas seções, ser´a explicar a rela¸cão das
frentes de ondas com raio s de luz. Esta rela¸cão é um dos pontos
centrais na formulação da Mecˆanica Hamiltoniana.
Primeiramente, necessitaremos analisar alguns t´opicos da teoria
das equações diferenciais parciais.
Vamos começar analisando um exemplo bem simples que vai an-
tecipar as principais propriedades dos exemplos mais complexos de
equações diferenciais que ser˜ao analisados a seguir.
Considere a equa¸cão diferencial parcial de 1 a ordem
∂u ∂u
x +y = 0. (7.1)
∂x ∂y
Desejamos encontrar quem é a função u(x, y) que satisfaz tal

146
147

equação. Em geral exis tem infinitas solu¸cões, pois se u é solução


então βu + α também é solu¸ ∈
cão (β, α R são constantes quaisquer).
Observe que se u é solução de (7.1), ent˜ao u(x, y) = B determina
uma curva cuja tangente ( x′ , y′ ) em ( x, y) é colinear com (x, y). Isto
porque
∂u ∂u
∇u = ∂x , ∂y
 
é normal à curva de nı́vel e por hipótese de u ser solução de (7.1),

(x, y), ∇u = 0.


Vamos tentar determinar a expressão analı́tica de tais curvas

u(x, y) = constante = B.

Suponha que possamos obter a mencionada curva através da ex-


pressão u(x, y(x)) = B onde y(x) é obtido a partir de x pelo Teorema
da Função Implı́cita. Temos, portanto, que (1, y ′ (x)) é tangente a esta
curva, logo a partir do que afirmamos acima devemos ter que
y ′ (x) y(x)
= .
1 x
Logo
y ′ (x) 1
= ,
y(x) x
e portanto,
d d
(log y(x)) = log x.
dx dx

Sendo assim, log(y(x)) = log x+c, c R, e finalmente y(x) = ax para
R
algum ∈
a as. Logo
e portanto curvasu édeconstante
nı́veis deem semitais
u são retas passando Observe
semi-retas. pela origem,
que
em (x, y) = (0 , 0) não podemos fazer as considera¸cões acima.
Note que se estabelecermos como condi¸cão de fronteira os valores
de u em uma curva diferenci´avel Γ que é cortada por cada uma das
semi-retas y = ax em apenas um ponto da curva Γ, pelo que de-
duzimos anteriormente, os valores da “possı́vel”(ainda não sabemos
se existe) solu¸cão u ficam necessariamente determinados. O valor
148 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

u(x, y) tem que ter o valor de u, oriundo da condi¸cão de fronteira,


na interceção da reta y = ax com a curva Γ. Isto é, se este ponto de
interceção for ( x0 , y0 ), então escolheremos o valor u(x, y) para todo
ponto (x, y) desta semi-reta y = ax, como u(x, y) = u(x0 , y0 ). Com a
união deste feixe de retas cobre um aberto do plano, ent˜ ao podemos
definir u em um subconjunto aberto do plano.
Vamos mostrar que a u assim definida na verdade é realmente
solução de (7.1).
Fixado (x, y), pela maneira como estamos definindo u, a reta y =

ax é curva de nı́vel de u, logo u é perpendicular a esta reta. Como

(x, y) está nesta reta, segue que < u, (x, y) >= 0. Logo a u definida
acima realmente satisfaz a equa¸cão diferencial (7.1).
Em geral o problema que pode ocorrer é que a curva Γ (onde
é fixada a condição de fronteira) intercepte uma destas semi-retas
y = ax em mais de um ponto. Neste caso poderı́amos ter o problema
de não poder obter u de maneira bem definida. Se n˜ao ocorrer esta
situação, no entanto, ent˜ao o problema est´a bem posto e a solu¸ cão
existe e est´a bem definida (e ´unica) da maneira como foi escolhido
acima.
Em outras palavras, a condi¸cões natural inicial (ou de fronteira)
do problema de Cauchy deve ser fixar o valor de u em uma curva Γ
que intercepta cada semi-reta passando pela srcem em apenas um
ponto.
Agora vamos analisar a equa¸cão linear geral de primeira ordem.
Considere a equa¸cão diferencial parcial de 1 a ordem em R2

∂u ∂u
a(x, y) + b(x, y) = 0. (7.2)
∂x ∂y

Gostarı́amos de encontrar a solução desta equa¸cão de uma ma-


neira semelhante `a utilizada no exemplo anterior.
Da maneira análoga como no exemplo anterior, primeiro resolve-
remos o sistema de equa¸cões diferenciais ordin´arias de 1 a ordem

dx
= a(x, y)
dt
dy
= b(x, y). (7.3)
dt
149

Observe agora o que acontece com a restri¸ cão de u (solução de


(7.2)) às soluções de (7.3):

d ∂u ′ ∂u ′ ∂u ∂u
u(x(t), y(t)) = x + y = a(x, y) + b(x, y) = 0.
dt ∂x ∂y ∂x ∂y

Logo u é constante ao longo das soluções de (7.3).


Sendo assim, se ( x(t), y(t)) é uma solução de (7.3), ent˜ao

∇u(x(t), y(t)), (ẋ(t), ẏ(t)) = 0.


Logo, cada curva ( x(t), y(t)) deve satisfazer a propriedade que
(ẋ(t), ẏ(t)) está na reta tangente `a curva u(x, y) = c.
Se tomarmos agora uma curva Γ cortando em um e s´o um ponto
cada curva solução de (7.3), e fixando os valores de u em Γ de-
terminaremos a solu¸cão u(x, y) (pois u é constante em soluções de
(7.3)). Do mesmo modo como no exemplo anterior, basta dar o va-
lor u(x, y) = u(x0 , y0 ) para cada ( x, y) sobre uma curva γ solução

de (7.3)a tal
define Γ natural

quecão
condi¸ de0 fronteira
γ = (x , y0 ). Uma
docurva com tais propri edades
problema.
Definição 7.1. As curvas solu¸c˜
oes de (7.3) s˜ao chamadas curvas
caracterı́sticas de (7.2).
Exemplo 7.1. Considere a equaç˜
ao
∂u
y
∂x
− x ∂u
∂x
= 0, (7.4)

com a condiç˜ao de fronteira (ou inicial) u(s, 0) = s2 , 0 s.



Uma outra maneira de especificar a condi¸c˜ao de fronteira acima
a fixa uma curva em R3 dada por
é estabelecer que est´

(x(s), y(s), u(s)) = ( s, 0, s2 ),

no espaço das vari´aveis (x,y,u ). Esta maneira, na verdade, é a que


usaremos na seq¨uência desta seç˜ao.
Neste caso a equa¸c˜ao diferencial ordin´aria que define as carac-
ter´ısticas é
ẋ = y
150 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

Figura 7.1:

ẏ = −x.
As soluç˜oes desta equa¸c˜ao s˜ao do tipo

(x(t), y(t)) = ( r cos(t), r sin(t)).

Para cada
ferencial valor
ordin´ s considere
aria com
s (t), ys (t)) a soluç˜
condiç˜ao(xinicial ao da
(s, 0). Pelo que equaç˜
vimos ao di-
acima,
2
devemos escolher u(xs (t), ys (t)) = u(s, 0) = s . Em outras palavras,
u é constante em cı́rculos.
Se usarmos coordenadas (s, t) ent˜ao u(s, t) = s2 , ou alternativa-
mente em coordenadas polares u(r, θ) = r2 .
Se desejarmos encontrar a solu¸c˜ao u na vari´avel (x, y), ou seja

obter u(x, y), devemos substituir r = x2 + y 2 , θ = arctan y/x em
u(r, θ) e obter u(x, y) = x2 + y 2 . Fica assim determinada a soluç˜ ao
do problema (7.4) por um método que se baseou fundamentalmente
nas curvas caracter´ ısticas.
Vamos considerar novamente o caso geral (7.2).
Definição 7.2. Dada a equaç˜
ao diferencial parcial
∂u ∂u
a(x, y) + b(x, y) = 0,
∂x ∂y
chamamos de superfı́cie integral da equa¸
c˜ao diferencial uma superf´
ıcie
na vari´avel (x,y,u ) R3 obtida como gr´afico de u(x, y), onde u é

soluç˜ao da equaç˜ao diferencial.
151

Observação 7.1. Uma condiç˜ ao necess´aria e suficiente para que


3
uma superfı́cie S ⊂ R seja uma superfı́cie integral de (7.2) é que
para cada (x,y,u ) R3 , o vetor (a(x, y), b(x, y), 0) esteja no plano

tangente à superfı́cie S em (x,y,u ). Isto porque como o vetor nor-
mal η = ( ∂u ∂u

∂x , ∂y , 1) é ortogonal a superfı́cie em (x,y,u ) (isto é, η é
perpendicular ao plano tangente), ent˜ao

η, (a,b, 0) = ∂u


∂x
a+
∂u
∂y
b + 0 = 0.

Portanto, segue que (a,b, 0) estar no plano tangente a S em (x,y,u )


é uma condiç˜ao necess´ aria e suficiente para S ser superf´ ıcie integral.
Esta relaç˜ao é v´
alida para a equa¸c˜ao linear (7.2). Vamos definir
em breve superfı́cie integral para uma EDP qualquer e neste caso a
an´alogoa relaç˜ao ser´a mais complexa.
Dada a equaç˜ao diferencial (7.2), uma maneira geométrica de ob-
ter o conjunto de pontos S que define uma superf´ ıcie integral para esta
equaç˜ao e satisfazendo uma condiç˜ao de fronteira inicialmente fixada
é a seguinte: para cada condiç˜ao inicial (x(s), y(s), u(s)), considere
(xs (t), ys (t)) curvas caracterı́sticas (soluç˜
ao de (7.3)) com condi¸c˜ao
inicial no tempo t = 0 igual a (x(s), y(s)). Considere em R3 a su-
perf´ıcie S obtida pela uni˜ao das curvas

(xs (t), ys (t), u(s)),

onde s, t variam sem restri¸c˜ao (ver Figura 4.6).


Pictoricamente, para obter S , estamos varrendo a condição inicial

(x(s), y(s), u(s))

com curvas caracterı́sticas, ou seja soluções de (7.3).


Vamos mostrar agora que realmente tal superfı́cie S assim obtida
é uma superfı́cie integral de (7.2) com a condição de fronteira dada.
É obvio que S satisfaz a condi¸cão de fronteira.
Suponha agora que ( x, y) possa ser obtido como ( xs (t), ys (t)) para
algums valor de s, t. Para cada s fixo, o vetor
 dxs (t) dys (t) du(s)
, ,
 = (x′s (t), ys′ (t), 0) = ( a(x, y), b(x, y), 0)
dt dt dt
152 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

está no plano tangente a S em (x,y,u ). Sendo assim pela Observa¸cão


45, S determina superfı́cie integral satisfazendo a condição de fron-
teira.
Note que foi necess´ario supor que ( xs (t), ys (t)) cobre um aberto
do R2 para poder concluir a afirma¸cão acima. Na verdade ( s, t) de-
veria ser considerado como novas coordenadas adaptadas `a solução
do problema. Voltando as antigas coordenadas ( x, y) por mudan¸ca
de variável podemos obter

u(s(x, y), t(x, y)) = u(x, y)

como função de ( x, y).


O procedimento acima é a essência do método das caracterı́sticas.
Encontramos a solução u de uma EDP resolvendo uma EDO. É mais
3

conveniente pensar no conjunto geométrico S R de pontos do
gráfico da solução u em vez de diretamente com u(x, y) pois assim po-
demos ter a liberdade de considerar coordenadas ( s, t) mais apropri-
adas (em função das caracterı́sticas) e finalmente encontrar a solução
final u em de
mudanças coordenadas ( x, y) apenas através de um procedimento de
coordenadas.
Vamos agora considerar o caso geral de uma equa¸cão diferencial
parcial de primeira ordem.
Considere uma fun¸cão diferenciável de Classe C 2 , F : R5 R, →
F (x,y,z,p,q ).

No contexto que vamos considerar a seguir z vai expressar a função


z(x, y) (será portanto uma vari´avel dependente) solução da EDP que
será definida a partir de F e

∂z ∂z
p= ,q =
∂x ∂y
(serão também dependentes).
A equação diferencial parcial geral de primeira ordem pode ser
expressa através da condição

0=F
 x,y,z (x, y),
∂z ∂z
,
 = F (x,y,z,p,q ), (3.55)
∂x ∂y
153

Figura 7.2:

para uma certa F fixada.


Dada uma curva ( x(s), y(s), z(s), p(s), q (s)), a < s < b (que faz o
papel de condi¸cão de fronteira) desejamos encontrar a solu¸cão z(x, y)
da EDP geral de primeira ordem de tal jeito que a solu¸ cão z(x, y)
satisfaça a condi¸cão de fronteira z(x(s), y(s)) = z(s). Os valores
(q (s), p(s)) devem satisfazer certas condi¸cões como veremos a seguir.
Definição 7.3. Uma superf´ıcie integral da equaç˜ao diferencial parcial
F = 0 é uma superf´ıcie S em R3 tal que é gr´ afico de uma fun¸c˜ao
z(x, y) que satisfaz

F (x,y,z (x, y), zx (x, y), zy (x, y)) = 0 .


Encontrar superfı́cies integrais equivale a resolver (3.55).
Nesta seção, vamos desenvolver métodos geométricos que se apli-
cam a situações bem gerais e que s˜ao semelhantes aos anteriormente
usados. Através da condição de fronteira, vamos escolher condi¸cões
iniciais e a seguir vamos varrê-las com feixes de caracterı́sticas (que
serão adequadamente definidas) e assim finalmente iremos identificar
154 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

Figura 7.3:

uma superf´ıcie integral S . Encontrar a solução final em uma certa


variável (por exemplo ( x, y)) é apenas uma questão de mudan¸ca de
coordenadas.
Procedendo de maneira semelhante a que fizemos antes, as carac-
ter´
ısticas serão obtidas como curvas soluções de equações diferenciais
ordinárias de tal jeito que F (x,y,z,p,q ) é constante igual a zero ao
longo destas curvas solu¸cões ( x(t), y(t), z(t), p(t), q (t)). Nosso obje-
tivo inicial é encontrar a equação diferencial ordinária em R5 que vai
definir soluções com estas propriedades.
Afirmamos que se desejarmos que ( x(t), y(t), z(t), p(t), q (t)) satis-
faça a propriedade acima descrita F (x(t), y(t), z(t), p(t), q (t)) = 0,
então esta curva deve satisfazer:
dx
= Fp (7.5)
dt
155

dy
= Fq (7.6)
dt
dz
= pFp + qFq. (7.7)
dt
Mais duas equa¸cões serão adicionadas mais tarde para dp e dq .
Primeiro queremos justificar a necessidade de assumir que dt asdt
três
equações acima sejam satisfeitas.
Para (x0 , y0 , z0 ) fixados, resolvemos em p a equação

F (x0 , y0 , z0 ,p,q (p)) = 0 .

A equação do plano tangente a superfı́cie integral S passando p or

(x0 , y0 , z0 )

determina que

∂z ∂z
(z− z ) = p(x − x ) + q(y − y ) = ∂x (x , y ) + ∂y (x , y ).
0 0 0 0 0 0 0

Sendo assim, teremos ( z − z ) = p(x − x ) + q (p)(y − y ).


0 0 0
Derivando a última expressão em p obtemos

dq
0 = (x − x ) + (y − y ) dp
0 . 0 (7.8)

Derivando em p a equação F (x0 , y0 , z0 ,p,q (p)) = 0 obtemos

dq
Fp + Fq = 0. (7.9)
dp

Eliminando
dq
dp
das duas ´ultimas equações ((7.8) e (7.9)), obtemos

x −x 0
=
y −y 0
.
Fp Fq
156 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

Assumindo agora que a curva ( x(t), y(t), z(t)) está na superf´ıcie


integral e que ( x(0), y(0), z(0)) = (x0 , y0 , z0 ) então
x(t) x0

Fp
=
x(t) −x 0
= t
Fq y(t) −y 0
− .
y (t) y0
t

Fazendo o limite em t tender a zero, obtemos

x′ (t) y ′ (t)
= .
Fp Fq

Isto justifica tomar x′ (t) = Fp e y ′ (t) = Fq .


Vamos agora justificar z ′ = pFp + qF q .
Ora
dz ∂z dx ∂z dy
= + = px′ + qy ′ .
dt ∂x dt ∂y dt
Como assumimos que x′ = Fp e y′ = Fq , concluı́mos que z ′ =
Fp p + Fq q .
Concluı́mos portanto que (7.5), (7.6) e (7.7) são condições naturais
para as caracterı́sticas.
Seja a equação diferencial ordin´aria em R5 dada por

dx
= Fp (7.10)
dt
dy
= Fq (7.11)
dt
dz
= pFp + qF q (7.12)
dt
dp
− −
dt = Fx pFz (7.13)
dq
dt
− −
= Fy qF z (7.14)

Estas equações são denominadas equa¸cões das caracterı́sticas.

Definição 7.4. As soluç˜


oes do sistema de equa¸c˜oes diferenciais or-
din´arias acima s˜ao denominadas de caracterı́sticas.
157

Nosso objetivo é mostrar que F é constante ao longo das carac-


terı́sticas.
Antes porém, devemos justificar a escolha das equações das ca-
racter´ısticas.
Ora (7.10), (7.11) e (7.12) s˜ ao nada mais que (7.5), (7.6) e (7.7).
Devemos portanto justificar apenas (7.13) e (7.14).
Suponha que ( x(t), y(t), z(t), p(t), q (t)) pertence ao conjunto de
pontos de uma superfı́cie integral. Ora p(x(t), y(t)) e q (x(t), y(t))
satisfazem
dp dx dy
= px + py = px Fp + py Fq (7.15)
dt dt dt
e
dq dx dy
= qx + qy = qx Fp + qy Fq . (7.16)
dt dt dt
Derivando F (x,y,z,p,q ) = 0 em rela¸cão a x obtemos
   ∂z ∂p ∂q
0 = Fx + Fz +Fp + Fq
∂x ∂x ∂x
= Fx + Fz p +Fp px + Fq qx . (7.17)
  
Derivando F (x,y,z,p,q ) = 0 em rela¸cão a y obtemos
   ∂z ∂p ∂q
0 = Fy + Fz +Fp + Fq
∂y ∂y ∂y

= Fy + Fz q +Fp py + Fq qy (7.18)
  
Como
∂2z ∂2z
= py = qx =
∂y∂x ∂x∂y
então juntando (7.15) e (7.17) e juntando (7.16) e (7.18) derivamos
(7.13) e (7.14), ou seja,

dp
dt
= −F − F p
x z

dq
dt
= −F − F q.
y z
158 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

Fica assim justificado (7.13) e (7.14) e portanto as equa¸ cões das


caracterı́sticas. Vamos então considerar a equação diferencial or-
dinária n˜ao linear em R5 dada por (7.10), (7.11), (7.12), (7.13) e
5
(7.14). Denotaremos tal equação por r′ = G(r) onde r ∈ R e
G : R5 → 5
R .
Vamos voltar agora a considerar o problema de Cauchy que est´ a-
vamos interessados em resolver, ou seja F (x,y,z,p,q ) = 0 com uma
certa condição de fronteira dada por ( x(s), y(s), z(s), p(s), q (s)). De-
sejamos encontrar pelo método das carcter´ ısticas z(x, y) satisfazendo
as condições iniciais

(x(s), y(s), z(s), p(s), q (s)).

Observação 7.2. Note que estas 5 quantidades n˜ao podem ser esco-
lhidas independentemente pois devem obedecer as relaç˜oes
dz ∂z dx ∂z dy dx dy
= + =p +q
ds ∂x ds ∂y ds ds ds

e
F (x(s), y(s), z(s), p(s), q (s)) = 0 .
Sendo assim a condi¸c˜ao inicial ser´a dada apenas por
(x(s), y(s), z(s)). Os valores (p(s), q (s)) devem ser escolhidos satis-
fazendo as equaç˜oes acima.
Por exemplo, se escolhemos z(s) constante sobre (x(s), y(s)), ent˜ao
as duas equaç˜oes acima s˜ao F (x(s), y(s), z(s), p(s), q (s)) = 0 e
p(s)x′ (s) + q (s)y ′ (s) = 0.
Como dissemos antes, a maneira correta de entender a condi¸ c˜ao
inicial na verdade é a seguinte, dada uma curva γ no plano, parame-
trizada por (x(s), y(s)) escolhemos os valores de z (ou u) em γ . Isto
equivale a escolher de fato a condi¸c˜ao (x(s), y(s), z(s)).
Vamos agora encontrar a soluç˜ao pelo método das5 caracterı́sticas.
Para cada valor s fixado considere a curva em R

(xs (t), ys (t), zs (t), ps (t), qs (t)) =

soluç˜ao de r′ = G(r) com condiç˜ao inicial

r(0) = ( x(s), y(s), z(s), p(s), q (s)).


159

Figura 7.4:

Denotaremos por
x = x(s, t) = xs (t)

y = y(s, t) = ys (t)
z = z(s, t) = zs (t)
p = p(s, t) = ps (t)
q = q (s, t) = qs (t)
os valores obtidos com o procedimento acima.
Vamos considerar agora a superfı́cie S 3 obtida varrendo a
R


condiç˜ao de fronteira (x(s), y(s), z(s)) por curvas (xs (t), ys (t), zs (t))
obtidas a partir das curvas caracterı́sticas. Vamos mostrar que a S
assim definida é uma superf´ ıcie integral.
Para mostrar que S define uma superfı́cie integral, vamos agora
derivar
F (xs (t), ys (t), zs (t), ps (t), qs (t))
em relaç˜ao a t.
160 [CAP. 7: M ÉTODO DAS CARACTERÍSTICAS

Usando as equaç˜oes das caracter´ısticas


dF dx dy dz dp dq
= Fx + Fy + Fz + Fp + Fq =
dt dt dt dt dt dt
= Fx Fp + Fy Fq + Fz (pFp + qF q ) − F (F
p x + pFz ) − F (F
q y + qF z ) = 0.

Logo F é constante e n˜
ao depende de t. Como assumimos que
(x(s), y(s), z(s))

est´a na superf´
ıcie integral e (p(s), q (s)) foram escolhidos de tal jeito
que F (x(s), y(s), z(s), p(s), q (s)) = 0 , conclu´ımos que

F (xs (t), ys (t), zs (t), ps (t), qs (t)) = 0

para qualquer s, t. Logo S é superf´ ıcie integral satisfazendo a condi¸


c˜ao
de fronteira. S pode ser definida como a superfı́cie bidimensional
definida por (xs (t), ys (t), zs (t)) (ver [Jo]).
Suponha que (x(s, t), y(s, t)) cobre um aberto do plano (x, y), in-
jetivamente em (s, t). Uma condiç˜ao suficiente para tal propriedade
ocorrer localmente é (x′ (s), y ′ (s)) n˜ao ser colinear com (Fp , Fq ) =
(x′ (t), y ′ (t)) sobre a curva de condi¸c˜oes iniciais. Se conseguirmos in-
verter a relaç˜ao entre as vari´aveis (x(s, t), y(s, t)), obtendo
(s(x, y), t(x, y)), poderemos expressar a soluç˜ ao z(x, y) como

z(x, y) = z(s(x, y), t(x, y)),

onde z(s, t) = zs (t) foi obtida acima (ver [Jo]).


O conceito de superfı́cie integral permite pensar de maneira geo-
métrica, sem se preocupar com as variáveis (x, y), e assim descrever
a solução em coordenadas mais naturais que s˜ ao (s, t). Finalmente,
podem obter z(x, y) através do desenvolvimento acima.
A equação de Hamilton-Jacobi é uma equação diferencial parcial
de primeira ordem, e o método das caracter´ ısticas é um procedimento
natural para calcular solu¸cões desta equa¸cão.
161

Exercı́cios
1. Calcule a equação das caracterı́sticas para a equação diferencial
parcial de Hamilton-Jacobi

∂z ∂z
0=1 H x,y, , = F (x,y,z,z x , zt ).
−  ∂x ∂y 
2. Encontre as caracterı́sticas da equação diferencial parcial x2 zx +
y 2 zy = 0, z(x, y) ∈ R, (x, y) ∈ 2
R . A seguir determine uma
curva de condições iniciais tal que esteja bem definida a solu¸cão
do problema de Cauchy.
Capı́tulo 8

Equações Diferenciais
Parciais: Método da
Solução Completa

Na seção anterior usamos o método das caracter´ ısticas para resolver a


equação diferencial parcial geral de primeira ordem F (x,y,z,p,q )=0.
Nesta seção vamos nos concentrar no método da solução completa
para resolver (3.55). Este método também será importante para a
correta análise da equação de Hamilton-Jacobi.
Antes disso devemos analisar envolt´orias de curvas e sua rela¸cão
com a propaga¸cão de ondas. Primeiramente no entanto, vamos ana-
lisar o caso mais simples de envolt´ orias de fun¸cões de uma vari´avel
tomando valores reais.
Considere f (x, c) = fc (x) uma famı́lia a um parâmetro c R, de
funções, como por exemplo fc (x) = sin(x + c). ∈
Definição 8.1. Dada uma famı́lia de curvas fc , a envolt´oria das
ao de dimens˜ao 2 obtida em R2
curvas (x, fc (x)) é o bordo da regi˜

pela uni˜ao de todas as curvas (x, fc (x)), c R.
Vamos mostrar que no caso do exemplo acima mencionado a en-

voltória é a união das retas y = 1 e y = 1.

162
163


Para cada x0 R fixado, os dois pontos da envolt´oria que est˜ao
situados na reta vertical passando p or x0 podem ser determinados da
seguinte maneira: considere para cada possı́vel valor de c os possı́veis
valores f (x0 , c). Estes valores f (x0 , c) vão determinar um intervalo de
possı́veis valores. Os valores extremos deste intervalo devem corres-
ponder ao supremo e ao ı́nfimo de g(c) = f (x0 , c), onde g é encarado
como uma fun¸cão da vari´avel c. Logo tomando os dois va lores c =
cx0 tal que g ′ (c) = 0 (ou seja ∂f ∂c = 0) temos que f (x, cx0 ) está na
envoltória da famı́lia fc .
Exemplo 8.1. Para fc (x) = sin(x + c), obtemos do desenvolvimento
acima a equaç˜ao
∂f
0= (x, c) = cos(x + c),
∂c
logo
π
(x + c) =
2
ou − π2 ,
portanto,
Logo ateremos fc (x)
envolt´oria da = sin(x f+ c)
famı́lia = 1 ou
c é a uni˜
fc (x)
ao das = sin(x
retas − −
y = +1c)e=y =11.
(ver Figura 7.1).
Exemplo 8.2. (Transformada de Legendre) Seja f :
2
R →Rea
famı́lia de retas em R

g(x, p) = gp (x) = xp − f (p).


p faz o papel do parˆametro da fam´
ılia de funç˜oes gp .
∈ −
Para cada p R fixado xp f (p) é a equaç˜ao de uma reta na
vari´avel x. A envolt´oria u desta famı́lia de retas é encontrada da
seguinte maneira: encontre p0 tal que
∂g
(x, p0 ) = 0,
∂p
a seguir tome
u(x) = xp0 − f (p ).
0

Dado x, estas equaç˜oes equivalem a escolher p tal que x = f ′ (p)



e u(x) = xp f (p), ou seja, u é a Transformada de Legendre de f .
164 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

Figura 8.1:

Alternativamente, podemos expressar as condições acima na ma-


neira mais familiar ao leitor, conforme Se¸cão 3 deste capı́tulo: u(x) é
a transformada de Legendre de f se

u(x) = sup xp
p ∈R
{ − f (p)}.
Vamos analisar agora famı́lias de superfı́cies em R3 parametriza-
das por c R. Por exemplo f (c,x,y ) = fc (x, y) = sin( x + c) + y,

c R. ∈
Definição 8.2. A envolt´oria da fam´ ılia de superf´ıcies cujo gr´
afico é
(x,y,f c (x, y)) é por definiç˜ao o bordo da regi˜ao de dimens˜ao 3 obtida
como uni˜ao dos pontos do R3 da forma (x,y,f c (x, y)).
Para cada (x, y) o ponto da envolt´oria da forma ( x,y,z ) é aquele
tal que z = fc0 (x, y), onde se g(c) = fc (x, y) então c0 é obtido como o
165

máximo ou m´ınimo para g na variável c. Em outras palavras devemos


encontrar c0 = c0 (x, y) tal que g ′ (c0 ) = 0, ou seja c0 tal que

∂f
(c,x,y ) = 0,
∂c

e a seguir considerar ( x,y,z ) onde z = fc0 (x, y).


A função u(x, y) = fc0 (x,y) (x, y) define então através do seu gráfico
(x,y,u (x, y)) a envoltória da fam´ılia. fc

Exemplo 8.3. Seja fc (x, y) = sin( x + c) + y , ent˜ao c = c(x,y) deve


satisfazer
∂f
(c,x,y ) = cos(x + c) = 0.
∂c
Ou seja,
π
x+c=
2
ou x + c = − π2 ,
logo

z = sin

π
+ y = 1 + y ou z = sin
− 
π
+y = −1 + y.
2 2

A envolt´oria da fam´ılia é, portanto, a uni˜


ao de dois planos (x,y, 1+
y) e (x,y, −
1 + y).

Agora vamos voltar a considerar o problema de resolver equa¸ cões


diferenciais parciais.
A equação diferencial parcial geral de 1 a ordem para a fun¸cão
de duas variáveis z(x, y) e suas derivadas zx = p e zy = q pode ser
escrita como
F (x,y,z,p,q ) = 0, (8.1)
onde F : R5 →
R tem derivadas parciais de segunda ordem contı́nuas.
Considere a condição de fronteira dada por uma curva (x(t), y(t), z(t)).
Um exemplo de tal tipo de equações diferenciais é F (x,y,z,p,q ) =
(z px qy)2 + (1 + p2 + q 2 ) = 0. Este exemplo ser´a analisado em
− −
breve.
Nosso objetivo inicial ser´a obter novas solu¸cões de F = 0 a partir
de famı́lias de soluções de F = 0.
166 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

O fato de z(x, y) ser solução de (8.1) nos d´a uma relação no ponto
(x0 , y0 , z0 ) entre

∂z ∂z
p= (x0 , y0 , z0 ) e q = (x0 , y0 , z0 ).
∂x ∂y

Vamos considerar agora uma famı́lia fc (x, y) = z = f (x,y,c ) de


soluções de (8.1), ou seja, para cada c fixado, z(x, y) = fc (x, y) é
solução de F = 0.
Vamos mostrar que a envoltória desta famı́lia de soluções nos de-
termina uma outra solu¸cão de F = 0.
A fun¸cão g(x, y) cujo gr´afico é a envoltória da famı́lia pode ser
obtida da seguinte maneira: para ( x, y) fixados, encontre c0 tal que

∂f
(x,y,c 0 ) = 0, (8.2)
∂c
e então obteremos z = g(x, y) = f (x,y,c 0 ).
Note que c0 = c0 (x, y) na verdade depende de ( x, y).
A envoltória g será f (x,y,c (x, y)) e satisfará então a equa¸cão
∂g ∂f ∂f ∂c ∂f
= + =
∂x ∂x ∂c ∂x ∂x
e
∂g ∂f ∂f ∂c ∂f
= + = .
∂y ∂y ∂c ∂y ∂y
Como fc (x, y) é solução de (8.1) então para fc (x, y) = fc(x,y) (x, y)
= g(x, y) a rela¸cão F (x,y,f c (x, y),p,q ) = 0 é v´
alida e portanto

F (x,y,g (x, y),p,q ) = 0

pois
p = ∂f = ∂g e q = ∂f = ∂g .
∂x ∂x ∂y ∂y
Portanto g também satisfaz a equação diferencial parcial (8.1).
Note que nas considera¸cões acima, nada foi dito sobre condi¸ cões de
fronteira.
Obter mais uma solu¸cão g a partir de uma famı́lia fc não pa-
rece contribuir muito para a solu¸ cão ger al do problema (8. 1). No
167

entanto, se considerarmos famı́lias a dois parâmetros de soluções


z(x, y) = fa,b (x, y) = f (x,y,a,b ), estaremos obtendo através de en-
voltórias uma informação não trivial como veremos a seguir. O ponto
fundamental é que desejamos encontrar soluções da EDP, F = 0, mas
sujeita a uma certa curva de valores de fronteira ( x(s), y(s), z(s))
dada. Uma famı́lia a um parâmetro de solu¸cões não permite isto, e
será necessário considerar famı́lias a dois parâmetros.
Escolha uma famı́lia a um parâmetro ( a(s), b(s)) no espa¸co de
parâmetros (a, b). Esta famı́lia será determinada em breve no texto.

Considere a famı́lia a um parâmetro s R, z = f (x,y,a (s), b(s))
e sua envoltória (ver expressão (8.2)) z = f (x,y,a (s), b(s)) (onde s
satisfaz 0 = ∂f ∂f ′ ∂f ′
∂s = ∂a a + ∂b b ) que é também uma solu¸ cão de F = 0
como vimos antes .
Vamos mostrar agora que dada uma curva de condi¸ cões iniciais
em R3
(x(s), y(s), z(s)),
podemos tentar obter uma superfı́cie integral que contenha tal curva
a partir de uma escolha conveniente de ( a(s), b(s)).
Seja então (x(s), y(s), z(s)) uma curva, a qual desejamos encon-
trar uma superfı́cie integral que a contenha.
Considere as duas equa¸cões
z(s) − f (x(s), y(s),a,b )=0 (8.3)
∂f ′ ∂f ′
z′ − x (s) − y (s)=0 (8.4)
∂x ∂y
obtendo assim uma rela¸cão de a e b em função de s (para s fixado
temos duas equa¸cões a duas inc´ognitas). Obtemos assim a(s) e b(s)
de tal jeito que satisfazem (8.3) e (8.4).
Com essa escolha de a(s) e b(s) vamos determinar uma famı́lia
a um parˆametro que vai determinar através da sua envoltória uma
supef´ıcie integral passando por (x(s), y(s), z(s)).
Considere a famı́lia a um parâmetro
z = fs (x, y) = f (x,y,a (s), b(s)) (8.5)

e como vimos acima a sua correspondente equa¸cão da envoltória


z = f (x,y,a (s0 ), b(s0 )) (8.6)
168 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

Figura 8.2:

onde s0 = s0 (x, y) satisfaz


∂f ∂f ′ ∂f ′
0= = a (s) + b (s). (8.7)
∂s ∂a ∂b

Seja g(x, y) a envoltória da fam´ılia (8.5), isto é:

g(x, y) = f (x,y,a (s0 (x, y)), b(s0 (x, y))),

onde s = s0 (x, y) é obtido para (x, y) fixo satisfazendo (8.7).


Note que conforme j´a vimos antes, é sempre verdade que tal en-
voltória g(x, y) determina uma superfı́cie integral que é solução da
Equação Dife rencial Parcial. A questão que nos interessa é se a
curva
vemos.inicialmente
Afirmamosdada que (pertence ` az(s))
x(s), y(s), superfı́cie
está naintegral S que
superfı́cie obti-
integral
da envoltória g(x, y), ou seja satisfaz (8.6) e (8.7). Isto é verdade
pois (8.6)
z(s) = f (x(s), y(s), a(s), b(s))
vem de (8.3) e da maneira como s foi escolhido.
Devemos mostrar agora que (8.7) e (8.4) s˜ao equivalentes.
169

Ora de (8.3) z(s) = f (x(s), y(s), a(s), b(s)), logo derivando em


relação a s
∂f ′ ∂f ′ ∂f ′ ∂f ′
z ′ (s) = x (s) + y (s) + a (s) + b (s)
∂x ∂y ∂a ∂b

A expressão (8.4) nos diz que


∂f ′ ∂f ′
z′ = x (s) + y (s)
∂x ∂y
portanto
∂f ′ ∂f ′
a (s) + b (s) = 0.
∂a ∂b
Isto mostra que (8.7) é equivalente a (8.4).
Logo se a(s) b(s) satisfazem (8.3) e (8.4), então obtemos através de
g(x, y) acima, envoltória da familia fs , a solução da EDP satisfazendo
a condição de fronteira dada.
Portanto dado uma curva ( x(s), y(s), z(s)) em R3 , através do
método exposto acima, podemos obter uma superfı́cie integral que
a contenha.
Definição 8.3. Uma famı́lia fa,b (x, y) a dois parˆametros (a, b) de
soluç˜oes de (8.1) é chamada uma soluç˜ao completa de (8.1).
O método descrito acima, que permite através de uma famı́lia a
dois parâmetros (uma solu¸cão completa conforme a defini¸cão acima)
encontrar uma superfı́cie integral a partir de condições de fronteira é
chamado de método da solução completa.
Exemplo 8.4. Vamos resolver agora, através do método da soluç˜
ao
completa a EDP
2 2 2
− u ∂u x
∂x
− ∂u
∂y
y  −   −  
1+ ∂u
∂x
∂u
∂y
= 0.

Isto é F (x,y,z,p,q ) = (z px qy)2 (1 + p2 + q 2 ) = 0. Seja a


− − −
famı́lia a dois parˆametros a e b (com a2 + b2 < 1)

z=  −−
1
a
(a2 + b2 )
x+  −−
1
b
(a2 + b2 )
y+ − 1
1
(a2 + b2 )
= fa,b (x, y)
170 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

de soluç˜oes (uma soluç˜ao completa).


Dada a curva z = 1, x = 1/2cos θ, y = 1/2sin θ, 0 ≤ θ ≤ 2π
ent˜ao (8.3) significa:

z=
−ax − by + 1 ,
2
1 (a + b ) 2
 −
ou seja,
− a b
1 (a2 + b2 ) + cos θ + sin θ − 1 = 0. (8.8)
2 2
J´a (8.4) significa

0 − − (a) −
( sin θ)
+
b − − cos θ
= 0,
1 2 2
(a + b ) 2 2 1 (a2 + b2 )

ou seja,
a sin θ − b cos θ = 0. (8.9)

De
Logo(8.8) e (8.9)
a soluç˜ se buscamos
ao que obtém a(θ)z(x,
= 4/5cos θ , b(θ)
y) (envolt´oria=da4/5sin θ . a um
famı́lia
parˆ
ametro θ)
z= − 43 x cos θ − 43 y sin θ + 53
que fornece como soluç˜ao o cone

− 43 5
z=
 x2 + y 2 + .
3
A equação de Hamilton-Jacobi é de primeira ordem, e o método da
solução completa será utilizado em breve para analisar tal equa¸cão.
Anteriormente estávamos considerando envoltórias de funções. A-
gora iremos considerar envoltórias de curvas, obtendo resultados que
também serão muito importantes em Mecˆanica Hamiltoniana.
Vamos agora considerar famı́lias de curvas. Estas curvas serão
dadas implicitamente.

Definição 8.4. A envolt´oria de uma famı́lia de curvas dadas impli-


citamente ser´a a curva que define o bordo da uni˜ao de todas as curvas
da fam´ılia.
171

Considere a famı́lia a um parâmetro de curvas implicitamente da-



das por f (x,y,α ) = 0, α R. Para cada α, 0 = fα (x, y) = f (x,y,α )
define implicitamente na variável (x, y) uma curva da famı́lia. Como
encontrar a curva C (ou curvas) que determinam a envolt´ oria da
fam´ılia fα ?

Teorema 8.1. Se a famı́lia a parˆ


ametro α de curvas determinada
por
fα (x, y) = f (x,y,α ) = 0
tem uma curva envolt´oria, ent˜ao esta curva pode ser encontrada im-
plicitamente através da equaç˜ao que se obtém substituindo α = αx,y ,
soluç˜ao de
∂f (x,y,α )
= 0. (8.10)
∂α
em f (x,y,α ) = 0.
Fica assim determinado implicitamente a envolt´oria por

0 = g(x, y) = F (x,y,α x,y ).

Demostração: Supondo por exemplo

∂f
∂y

(x̄, ȳ, ᾱ) = 0

então para ( x,y,α ) perto de (¯x, ȳ, ᾱ) tem-se

f (x,y,α ) = 0 ⇔ y = g(x, α)
com g diferenciável. Pelo resultado anterior (8.2), a envoltória da
famı́lia de curvas gα (x) é dada por

∂g
(x̄, ᾱ) = 0.
∂α
Como f (x, g(x, α), α) = 0 para todo ( x, α) próximo de (¯x, ᾱ), obtém-
se, diferenciando com rela¸cão a α,

∂f ∂g ∂f
0= (x, g(x, α), α) (x, α) + (x, g(x, α), α)
∂y ∂α ∂α
172 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

e em particular, em (¯x, ᾱ):

∂f ∂g ∂f ∂f
0= (x̄, g(x̄, ᾱ), ᾱ) (x̄, ᾱ) + (x̄, g(x̄, ᾱ), ᾱ) = (x̄, ȳ, ᾱ),
∂y ∂α ∂α    ∂α
=ȳ
=0

i.e., a envoltória das curvas é dado equivalentemente por


  
∂f
(x̄, ȳ, ᾱ) = 0.
∂α
O caso
∂f
∂x

(x̄, ȳ, ᾱ) = 0

é análogo. 

Exemplo 8.5. Vamos encontrar a envolt´


oria da fam´ılia de cı́rculos

f (x,y,α ) = x2 + y2 2αx 2αy + α2 = 0


− −
usando o ´ultimo Teorema.

Esta famı́lia representa cı́rculos de raio α centrados nos pontos
da reta diagonal (α, α), ou seja, a famı́lia (x α)2 + (y α)2 = α2 .
− −
Ora
∂f
∂α
= −(2x + 2y − 2α) = 0,
logo α = (x+y). Substituindo α = αx,y por (x +y) em f (x,y,α ) = 0,
obtemos 0 = f (x,y,α ) = (x α)2 +(y α)2 α2 = y 2 +x2 (x+y)2 =
− − − −
− 2xy.
Obtemos portanto a equa¸c˜ao da envolt´oria como xy = 0, ou seja
a equaç˜ao retas que definem os eixos de x e dos y . Geometricamente
é bem f´
acil se observar que realmente os eixos do x e y s˜ao a soluç˜ao
do problema (ver Figura 7.2).

Vamos agora aplicar o resultado acima em uma situa¸ cão que será
extremamente importante na teoria de propaga¸cão de ondas.

Exemplo 8.6. Seja uma fun¸c˜ ao φ : R2 →


R tal que para cada T ,
φ(x, y) = T determina uma curva de nı́vel diferenci´
avel ΣT .
173

Suponhamos que φ tem a seguinte propriedade: para T , ∆ > 0 a


curva ΣT +∆ é obtida como a envolt´oria por cı́rculos de raio ∆ sobre
a curva ΣT (ver Figuras 7.3 e 7.4).
Vamos mostrar que a fun¸c˜ao φ deve satisfazer a equa¸c˜ao
2 2
∂φ ∂φ
1=    
∂x + ∂y . (8.11)

Esta equaç˜ao é conhecida como equaç˜ao eikonal da ´otica geomé-


trica.
Seja (x1 (α), x2 (α)) uma parametrizaç˜ao de ΣT . Ent˜ao a famı́lia
2 2 2
f (x,y,α ) = (x1 (α) − x) + (x2 (α) − y) − ∆ =0
vai definir implicitamente a equa¸c˜ao de cı́rculos (na vari´ avel (x, y))
de raio ∆, centrados nos pontos da curva ΣT .
As Figuras 8.1 e 8.2 d˜ao uma ideia dos distintos envolt´orios ob-
tidos a partir de um objeto unidimensional genérico.
Como vimos antes a envolt´oria da fam´ılia é obtido como a curva
na vari´avel (x, y) que satisfaz as equa¸c˜oes ∂α
∂f = 0 e f (x,y,α ) = 0.
Sendo assim obtemos as equa¸c˜oes:
∂f
0=
∂α
= 2(x1 (α) − x)x′ (α) + 2(x (α) − y)x′ (α),
1 2 2

e (x1 (α) x)2 + (x2 (α) y)2 = ∆2 .


− −
Resolvendo o sistema acima vamos encontrar (x(α), y(α)) para-
metrizaç˜ao de ΣT +∆ dependendo do ponto (x1 (α), x2 (α)) sobre a
curva ΣT . O ponto (x(α), y(α)) est´a na envolt´oria e dista ∆ de
(x1 (α), x2 (α)).
Da equaç˜ao [(x1 (α) x(α))x′1 (α) + (x2 (α) y(α))x′2 (α)] = 0 con-
− −
− −
clu´ımos que para todo ∆(x1 (α) x(α), x2 (α) y(α)) é perpendicu-
lar ao vetor tangenteé normal

x(α), x2 (α) y(α))
(x′1 (α), x′2 (α)). Em outras palavras, (x1 (α)
a ΣT para todo ∆. −
− −
Como sabemos v∆ = ((x1 (α) x(α)), x2 (α) y(α)) para todo −

∆ (pequeno) é colinear com φ (que é perpendicular à superf´ ıcie de
n´ıvel) e v∆ tem sempre norma ∆.
Portanto,
∇φ v ∆
∇φ = v  . ∆
174 [CAP. 8: M ÉTODO DA SOLUÇÃO COMPLETA

Como  
∇φ, ∇∇φφ = ∇φ,
ent˜ao
v∆
∇  φ, ∆ = ∇φ.
Ora

∇φ, u = ∇φ, (u , u ) = lim→


1 2
φ(x + u1 ∆, y + u2 ∆) − φ(x, y) ,
∆ 0 ∆
logo  
v∆
∇φ = ∇ φ,

=

lim
1
φ x1 (α) + ∆
x(α) x1 (α)
,

∆ 0∆ ∆

x2 (α) + ∆
  −  −
(y(α) x2 (α))
 
φ(x1 (α), x2 (α))

lim
1
[φ(x(α), y(α)) − φ(x (α), x (α))] = lim→
1 2
∆+T − T = 1.
∆→0 ∆ ∆ 0 ∆
Sendo assim, ∇φ = 1, ou seja,
   
∂φ
2
∂φ
2

+ = 1.
∂x ∂y

dadeConcluı́mos, portanto,
das envolt´orias que uma
por cı́rculos defunção
mesmoφ raio
satisfazendo a proprie-
para as superfı́cies
de nı́vel ΣT , deve satisfazer a equa¸cão diferencial parcial acima.
Esta equação foi denominada anteriormente de Equa¸cão de Ha-
milton-Jacobi autônoma para o Hamiltoniano H (q, p) = p21 + p22 . Esta
equação não é linear. Para resolvê-la vamos aplicar os métodos para
calcular as soluções de equações diferenciais parciais de 1 a ordem não
lineares a partir de condi¸cões de fronteira que consideramos antes.
175

Figura 8.3:

Exercı́cio
1. Calcule pelo método da solução completa a solu¸cão da equação
diferencial parcial

∂S 2 2
+1 ∂S
   
∂x 4 ∂y
= 1,

com a condição inicial ( x(s), y(s), S (s)) = ( s, 0, 1).


Capı́tulo 9

O Princı́pio de Huygens
em Mecânica
Hamiltoniana

Vamos analisar a seguir a evolu¸ cão de uma frente de onda em um


plano (o caso mais geral em Rn é semelhante). Para fixar idéias,
vamos supor que desejamos analisar a seguinte quest˜ ao: largamos
uma pequena pedra ou um galho de ´ arvore na superfı́cie de um lago
em repouso. A superfı́cie do lago ser´a então percorrida por uma
frente de onda que se propaga a partir da excita¸ cão inicial causada
pela pedra ou galho (ver respectivamente Figuras 8.1 e 8.2).
Vamos denotar por Σ t a posição espacial em R2 da frente de onda
no tempo t.

Observe
externa nas Figuras
da) envolt´ 8.1 cı́rculos
oria por e 8.2 quede
a frente onda Σ t+∆
raio ∆decentrados na éfrente
(a parte
de
onda Σ t . Essa propriedade é observada na natureza e em essência
expressa o seguinte fato. A frente de onda Σ t+∆ poderia ser obtida
lançando ao mesmo tempo t várias pedrinhas sobre a posi¸ cão da
frente de onda Σ t . Esperando decorrer o tempo ∆ cada pedri nha
individualmente cria um cı́rculo (de raio ∆) de frente de onda. A
envoltória destes cı́rculos determina a frente de onda Σ t+∆ .

176
177

Essa propriedade é o que se denomina (em termos simplificados)


o princı́pio de Huygens.
O mesmo princ´ ıpio é também v´alido para a propaga¸cão da luz a
partir de um ponto p0 onde acendemos a luz no tempo inicial t0 . A
luz tem velocidade finita e a separa¸cão entre a regi˜ao iluminada num
tempo T e a regi˜ao ainda n˜ao iluminada é a frente de onda.
Em certos cristais a luz n˜ao se propaga em linha reta e as frentes
de onda n˜ao são necessariamente cı́rculos. Podem haver direções em
que a luz tem mais facilidade de se propagar. Este fato se deve muitas
vezes à estrutura molecular do cristal e é conhecido como anisotropia,
ou não-homogeneidade do meio.
Para descrever matematicamente a evolu¸cão da frente de onda,
vamos supor que existe uma fun¸cão S (x, t), S : Rn R R que vai× →
descrever de maneira implı́cita a posição da frente de onda, isto é,
dado t1 R, t1 > 0, S (x, t1 ) = 0, vai definir a hipersuperfı́cie Σt1 em

n
R , que define a frente de onda no tempo t1 . Vamos supor semp re
que
2 2
2
     
∂S
∂x 1
+ ∂S
∂x 2
+ ... + ∂S
∂x n
= 0.

Referimos o leitor para [BF] e [Jo] para uma explana¸ cão mais
completa dos tópicos a serem apresentados a seguir.

Exemplo 9.1. Considere S (x, t) = x21 + ... + x2n t, ent˜ao para −
t > 0 a frente de onda Σt ser´
 a a esfera com raio t, ou seja, o conjunto
2
dos (x1 ,...,x n ) tal que x1 + ... + x2n t = 0. −
No caso n = 2, a fun¸c˜ao S descreve a evoluç˜ao da frente de
onda de uma pequena pedra lan¸cada no tempo t = 0 na superfı́cie
de um lago (na posi¸ c˜ao (0, 0)). E´ f´acil ver geometricamente que a
propriedade da envolt´oria das curvas de nı́vel por cı́rculos é verdade
para tal S . Estamos neste caso supondo que a propaga¸c˜ao da onda é
isotr´opica e homogênea (vamos definir estes conceitos mais precisa-
mente em breve).
Note que tal S satisfaz a equa¸c˜ao diferencial
   
∂S
2
+
∂S
2
= − ∂S = 1,
∂x 1 ∂x 2 ∂t
178 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

ou equivalentemente
   
∂S
2
∂S
2

∂x 1
+
∂x 2
= − ∂S
∂t
= 1.

Note que esta equa¸c˜ao corresponde a equaç˜ao de Hamilton-Jacobi



para o Hamiltoniano H (q, p) = p21 + p22 . Este fa to ser´a analisado
com mais detalhe em breve.
∈
Exemplo 9.2. Considere para x 2
R ,

S (x, t) = x21 + 4x22 t,

ent˜ao as frentes de onda s˜ao elipses x21 + 4x22 t = 0. Nesse caso

estaremos descrevendo a evoluç˜ao da frente de onda de um dist´ urbio
inicial no tempo 0 feito no ponto (0,0). A propaga¸c˜ao n˜ao é ho-
mogênea pois a onda se propaga mais rapidamente na direç˜ao x1 .
S satisfaz neste caso a equa¸c˜
ao diferencial
   
∂S
2
+
1 ∂S
2
= − ∂S ,
∂x 1 4 ∂x 2 ∂t

ou equivalentemente
   
∂S
2
1 ∂S
2

∂x 1
+
4 ∂x 2
= − ∂S
∂t
.

Note que esta equa¸c˜ao corresponde à equaç˜ao de Hamilton-Jacobi as-



sociada ao Hamiltoniano H (q, p) = p21 + 14 p22 .
Este exemplo ser´a analisado mais uma vez em breve.
Neste texto estaremos analisando, prioritariamente, propaga¸ cão
homogênea e isotrópica. Sendo assim, a frente de onda Σ t+∆ é ob-

tida como
Σt . No a envolt´oria
outro de cı́rculos
caso terı́amos que fazerdeenvoltórios
mesmo raio comcom centro
elipses em
e a ex-
centricidade de tais elipses depende da posi¸cão no caso de um meio
não-homogêneo e anisotrópico.
Considere uma S (x, t) : Rn+1 →
R, que define implicitamente a
posição das frentes de onda conforme definimos anteriormente. Para
simplificar nossas considera¸cões vamos supor ainda mais que exista
S (x) : Rn → R tal que S (x, t) = S (x) −
t (esta expressão é análoga
179


à expressão S (q, t) = S (q ) wt que usamos anteriormente quando
estávamos analisando soluções da equa¸cão de Hamilton-Jacobi na
Seção 8, Capı́tulo 3 [L]).
Que tipo de restri¸cões tal função S deve satisfazer?

Suponha, 0 = S (x, t) = S (x) t, para t fixo, vai descrever a curva
que estabelece a frente de onda no tempo t. Pelo princı́pio de Huygens
a curva de nı́vel no tempo t+∆ é obtida como a envoltória de cı́rculos
(o meio é homogeneo e isotrópico) de raio ∆ e centrados sobre a curva
de nı́vel no tempo t. Esta situação, no caso do plano, é exatamente
aquela que analisamos na seção anterior e sabemos portanto que neste
caso S deve satisfazer a equa¸cão da eikonal
   
∂S
2
∂S
2

+ = 1.
∂x 1 ∂x 2

É possı́vel também mostrar no caso geral do Rn , que a fun¸cão S


deve satisfazer
2 2 2
∂S ∂S ∂S
∂x 1
    + ∂x 2 + ... +   ∂x n = 1.
Esta equação é também denominada equação da eikonal e é um
caso particular de equa¸cão de Hamilton-Jacobi autˆonoma (ver (3.13)
Seção 8, Capı́tulo 3 [L]). A relação desta equa¸cão com a equa¸cão de
Hamilton será o objetivo das nossas pr´oximas considerações.
A relação entre raios de luz e frentes de onda vai nos possibili-
tar entender a raz˜ao da introdução do ponto de vista de “frentes de
onda” de Hamilton de entender a Mecˆanica Clássica. Vamos a seguir
explicar melhor esta rela¸cão.
Na verdade este ponto de vista é, nada mais nada menos, que o
princı́pio de Huygens para a Mecânica Hamiltoniana.
Voltando ao caso geral, considere S (x, t) que vai descrever para
cada tempo t, a frente de onda no tempo t através da curva obtida
implicitamente pela equação S (x, t) = 0.
Suponha que x(t) vai descrever uma curva em Rn tal que t R, ∀ ∈

x(t) Σt . Em outras palavras, x(t) vai estar sempre na frente de
∀ ∈
onda. Sendo assim, S (x(t), t) = 0, t R, t > 0 e, portanto,
∂S ′ ∂S ′ ∂S ′ ∂S
x1 + x2 + ... + xn + =0
∂x 1 ∂x 2 ∂x n ∂t
180 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

ou seja
∇S, x′ = − ∂S
∂t
.

Observação 9.1. Considere S (x, t) que descreve através de S (x, t) =


0 a evoluç˜
ao temporal de uma frente de onda causada por uma fonte
pontual luminosa localizada em um ponto x0 . Para t fixo, a en-

volt´oria dos caminhos z(s), s [0, t] (todos com velocidade constante
z ′ (s) = 1, s (0, t)) com ponto inicial x0 = z(0) e ponto final z(t)
 ∈
determina a frente de onda. Um caminho x(s) entre tantos poss´ ıveis
z(s), que est´a localizado de tal jeito que x(t) est´
a na frente de onda
S (x, t) = 0 vai representar o raio de luz fisicamente observ´avel. Este
caminho x(s) é o que realmente se chama de raio de luz.

Ora, S é perpendicular a Σ t , logo a componente do vetor x′ (t)


∇ ∇S (normal à frente de onda) é
na direção ∇ S

∂S
∂t
.
− ∇ S

Em geral, nem sempre S , o gradiente da fun¸cão frente de onda
S , e x′ (t), o vetor tangente ao raio de luz x(t), são colineares, mas se
o meio é homogêneo e isotrópico, isto acontecer´a como veremos em
breve.

Definição 9.1. A velocidade de propagaç˜ ao da frente de onda é por


definiç˜ao o vetor velocidade de propaga¸c˜ao normal `a superfı́cie Σt ,
ou seja
∂S
∂t
− ∇S ∇S. 2

por 9.2. O m´odulo do vetor velocidade de frente de onda é


Definição
dado
∂S
∂t
− ∇S  > 0.
O módulo do vetor frente de onda é a grandeza mais importante
que vai descrever a evolu¸cão temporal da frente de onda. A lei que
determina tal evolu¸cão será descrita a seguir.
181


Assuma agora que S (x, t) = φ(x) t, isto significa que a velocidade
de propagação da onda é
∂S
− ∇S = ∇1S  = ∇1φ .
∂t

Como já vimos


é verdadeiro para φantes
entãono caso
∇ 
φ = do1.plano, se o princı́pio de Huygens

Sendo assim, assumir que S (x, t) é da forma φ(x) t é assumir
que a velocidade de propaga¸cão da frente de onda é igual a 1. Se
desejássemos analisar uma situa¸cão em que a velocidade da frente
de onda é w então deverı́amos tentar encontrar S do tipo S (x, t) =

φ(x) wt.
Neste caso, é fácil ver que a equa¸cão que descreve tal S é
∇  S = w.

Fica portanto justificado porque é bastante comum quando bus-


camos encontrar solu¸cões da equa¸cão de Hamilton-Jacobi tentar en-

contrar
Vamossoluções
analisardaagora
formaa S (q, t) = S (qde
propagação −
) ondas
wt. de um ponto de vista
bastante geral. Vamos descrever a lei fı́sica que S (x, t) deve satisfazer.
O módulo do vetor velocidade da propaga¸ cão da onda deve sa-
tisfazer uma lei que é chamada de propriedade constitutiva do meio
contı́nuo. Essa lei, que como veremos a seguir é bastante natural,
n
envolve uma fun¸cão H0 (x, p), onde x
n

R , (mas definida apenas
∈ 
para valores unit´arios, ou seja p R , p = 1) que vai descrever
propriedades microscópicas do meio. A lei determina que o m´odulo
do vetor velocidade de propaga¸cão da onda
∂S
∂t
− S
satisfaça ∇   
∂S
∂t
− ∇S  = H 0 x,
∇S . (9.1)
∇S 
A equação diferencial parcial acima estabelece uma dependência
de ∂S ∇S
∂t em x e no vetor unit´ario ∇S  . Esta dependência é estabele-
cida por H0 e expressa uma lei agindo a nı́vel local (microscópico)
182 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

no sistema em considera¸cão. H0 vai descrever a falta de homogenei-


dade e anisotropia (ou n˜ao) que exis te no meio. Esta lei local (9.1)
vai determinar propriedades globais (macroscópicas) do sistema (por
exemplo a forma das frentes de onda a partir de uma perturba¸ cão
inicial em um certo ponto do meio) como veremos a seguir.
Através de considerações de natureza fı́sica e geométrica é natural
agora estabelecer que H seja homogênea na segunda variável, ou seja,
que
H (x,λp ) = λH0 (x, p). (9.2)

Por exemplo, se estivermos analisando uma métrica Riemamnni-


ana < , > como Hamiltoniano, é mais natural neste caso, considerar

H = < , > em vez de H =< , >. Desta maneira a integral γ Hdt

de uma curva γ depende apenas do tra¸co da curva (dos pontos da
curva) e não da parametriza¸cão utilizada.
∀ ∈
λ R, ou seja que para um vetor n˜ ao unitário, H tem uma
dependência linear no comprimento do vetor p. Sendo assim a partir
de (9.1), a equa¸cão constitutiva do meio para S (x, t) que descreve a
evolução de uma frente de onda torna-se

∂S
∂t
+ ∇S H (x, ∇∇SS  ) = ∂S
0
∂t
+ H (x, ∇S ) = 0. (9.3)

Esta equação foi denominada anteriormente (Defini¸cão 26, Se¸cão


8, Capı́tulo 3 [L]) de equação de Hamilton-Jacobi.
O Hamiltoniano H desempenha portanto na Mecˆanica Hamilto-
niana o papel da lei constitutiva do meio na propaga¸ cão de frentes
de onda.

Se S (x, t) for da forma S (x, t) = φ(x) t, então a equa¸cão acima
torna-se

0 = ∂S + H (x, S ) =
∂t
−1 + H (x, ∇φ),

ou seja H (x, φ) = 1.
Esta equação foi denominada em (3.13) na Se¸ cão 8, Capı́tulo 3
[L], de equação de Hamilton-Jacobi autˆonoma.
Como dissemos antes, no caso isotr´opico e homogêneo, devemos

considerar a métrica Euclidiana H (x, p) = p21 + p22 e então teremos
183

a equação

∂S
   ∂S
2
∂S
2
− ∂t

= H (x, S ) =
∂x 1
+
∂x 2
.

Se S (x, t) = φ(x) t, então a equa¸cão acima significa


−     2 2
∂φ ∂φ
1= + .
∂x 1 ∂x 2

A conclusão portanto é que a equação constitutiva


∂S
0=
∂t
+ H (x, S ) ∇
é apenas uma descrição geral do princı́pio de Huygens e determina
uma equação do tipo Hamilton-Jacobi.
Se H no caso bidimensional é dado por H (x, p) = p21 + p22 , então
esta última equação é a equação da eikonal.
Sendo assim a equa¸cão de Hamilton-Jacobi, neste caso particu- 
lar, expressa a lei constitutiva do meio e esta equa¸ cão determina a
propagação de frentes de onda num meio homogêneo e anisotrópico.
Podemos extrapolar o raciocı́nio acima e pensar que o Hamilto-
niano H (x, p) determina uma lei constitutiva no espa¸co da vari´avel
x (de configuração), e que a equa¸ cão de Hamilton-Jacobi descreve
frentes de onda de solu¸cões do sistema mecˆanico.
A dependência de H0 (x, p) em p caracteriza a anisotropia do meio.
Definição 9.3. No caso em que H0 (x, p) n˜
ao depende de p, o meio
é dito isotr´
opico.
Definição 9.4. Se H0 (x, p), por sua vez n˜ao depende de x, dizemos
que o meio é homogêneo.
Exemplo 9.3. Seja o Hamiltoniano H (q, p) = a(q )p21 + 2c(q )p1 p2 +

b(q )p22 (ou H (q, p) = a(q )p21 + 2c(q )p1 p2 + b(q )p22 ), q = (x1 , x2 ), p =
(p1 , p2 ), e suponha que exista solu¸c˜ao da forma S (q, t) = S (q ) t para −
a EDP de Hamilton-Jacobi associada, ent˜ao

0= −1 + H (q, p) = ∂S
∂t
+ H (q, p) =
∂S
∂t
+
 H (q, p)
184 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

vai descrever em geral a evolu¸c˜ao de frentes de onda no plano em um


meio anisotr´opico e n˜ao homogêneo.
Note que no caso de propagaç˜ao de ondas num meio cont´ ınuo, por
causa de (9.2), o H (q, p) deve ser

2 2
H (q, p) =  a(x)p1 + 2c(x)p1 p2 + b(x)p2 ,
mas como vimos na equa¸c˜ao acima, tanto faz tomar a raiz quadrada
ou n˜ao, para fins de calcular a equa¸c˜ao de Hamilton-Jacobi.
Voltaremos a analisar este exemplo em breve.
Acreditamos que neste momento tenha ficado transparente a rela-
ção do princı́pio de Huygens com a Mecânica Hamiltoniana, em par-
ticular com a equa¸cão de Hamilton-Jacobi. A propaga¸cão de frentes
de onda é a inspiração principal para este ponto de vista da Mecânica
Clássica.
Uma boa justificativa porque os raios de luz podem ser inter-
pretados como geodésicas aparece na Observação 9.1 e subsequente
conclusão no fim da pr´oxima seção.
A questão relevante do ponto de vista Fı́sico é a seguinte: consi-
dere um sistema Hamiltoniano definido por H (q, p) e

(q (t), p(t)) = ( x1 (t), x2 (t), p1 (t), p2 (t))

solução do problema mecˆanico. Desejamos analisar a partir de uma


frente de onda de condi¸cões iniciais de posi¸cão e velocidade ( q, p) =

(q (s), p(s)) = ( x1 (s), x2 (s), p1 (s), p2 (s)), s (a, b), a evolu¸cão desta
frente de onda com o tempo t segundo o sistema mecˆanico. Isto é,
desejamos descobrir a fun¸cão

(q (s, t), p(s, t)) = ( x1 (s, t), x2 (s, t), p1 (s, t), p2 (s, t)) =

= (xs1 (t), xs2 (t), ps1 (t), ps2 (t))


que determina a posi¸cão da condi¸cão inicial

(q (s), p(s)) = ( x1 (s, 0), x2 (s, 0), p1 (s, 0), p2 (s, 0))

após decorrido tempo t.


185

Em outras palavras gostarı́amos de determinar a evolução tem-


poral de um feixe (uma frente de onda) de condi¸ cões iniciais. Como
veremos a seguir, a Mecˆanica Hamiltoniana permite tal tratamento.
Vamos agora analisar a evolu¸cão de frentes de onda de condi¸ cões
iniciais no espa¸co de fase da Mecˆanica Hamiltoniana.
Considere um Hamiltoniano H , por exemplo
2 2
1  1 
H (q, p) = U (q ) + p2i = U (x1 , x2 ) + p2i (9.4)
2 i=1
2 i=1

sendo assim, a equa¸cão

∂S ∂S
  ∂S
0=
∂t
+ H q,
∂q
=
∂t
+ H (q, ∇S )
de Hamilton-Jacobi, obtida anteriormente na Mecânica Hamiltoniana
é análoga à equação que descreve a evolução de uma onda em um meio

cont´ınuo.que para um sistema mecˆanico em geral da forma (9.4), a


Note
expressão (9.2) n˜ao é verdadeira.
Supondo por separa¸cão de vari´aveis que S é da forma S (q, t) =

φ(q ) t, então a equação diferencial parcial F = 0 associada à equação
de Hamilton-Jacobi é
1
0 = F (x1 , x2 ,φ,p 1 , p2 ) = U (x1 , x2 ) + (p21 + p22 ) −1=
2

1 ∂φ 2
U (x1 , x2 ) + (( ) +
 −∂φ 2
) 1 = H (x1 , x2 , p1 , p2 ) − 1,
2 ∂x 1 ∂x 2
onde
p1 = ∂φ , p2 = ∂φ .
∂x 1 ∂x 2
Vamos voltar a considerar um Hamiltoniano qualquer a partir
deste momento.
A equação diferencial parcial n˜ao linear de Hamilton-Jacobi

H (q, p) − 1 = H (q, ∇φ) − 1 = 0,


186 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

pode ser resolvida através do método das caracterı́sticas como foi


desenvolvido na Se¸cão 7. As equações das caracter´
ısticas para a F
definida acima neste caso s˜ao
∂F ∂H
x′1 = =
∂p1 ∂p 1
∂F ∂H
x′2 = =
∂p2 ∂p 2
∂F ∂F
φ′ = p 1 + p2
∂p 1 ∂p 2
∂F ∂H
p′1 = − ∂x =−
1 ∂x 1
∂F ∂H
p′2 = − = − (9.5)
∂x 2 ∂x 2
As primeiras duas e as ´ ultimas duas equa¸cões acima definem as
soluções do campo de vetores Hamiltoniano no plano ( x1 , x2 , p1 , p2 ).
Logo as(xcaracterı́sticas
no espaço de equação de Hamilton-Jacobi pro jetadas
1 , x2 , p1 , p2 ) são as solu¸cões das equações de Hamilton.
O Teorema de Hamilton-Jacobi (Teoremas 22 e 23), que apre-
sentamos na Se¸cão 9 [L], afirma que se pode passar diretamente da
solução completa para as caracterı́sticas da EDP de Hamilton-Jacobi.
A terceira equação de (9.5) afirma que as caracterı́sticas (soluções
da equação de Hamilton) ( x1 (t), x2 (t), p1 (t), p2 (t)) s˜ao tais que a
função
φ(x1 (t), x2 (t))
satisfaz
2 2

= pi Hpi = p i F pi .
dt i=1 i=1
 
Note que o resultado sobre caracterı́sticas acima é válido para
um Hamiltoniano qualquer H (q, p) e não apenas para Hamiltonianos
 n
naturais do tipo H (q, p) = 12 i=1 p2i + V (q ).
O método que vamos descrever a seguir vai determinar a evolução
de uma frente de onda ( q (s, t), p(s, t)) a partir de ( q (s), p(s)). Desta
maneira poderemos determinar a evolução temporal de feixes de con-
dições iniciais do problema mecˆanico (ver Propriedade Importante
187

a seguir). Esta questão é fundamental em Mecânica Estatı́stica e


Mecânica Quântica (ver [OA]). A propriedade importante descrita a
seguir, não é para um sistema mecânico qualquer, mas apenas para
um sistema associado a uma métrica Riemanniana. Lembre que é
muitas vezes possı́vel transformar por mudança de parametro tempo-
ral um problema mecânico em um problema geométrico (ver Teorema
20 e Corol´ario 21, Capı́tulo 2 [L]).
Propriedade Importante: Seja o Hamiltoniano

H (q, p) = a(q )p21 + 2c(q )p1 p2 + b(q )p22


q = (x1 , x2 ), p = (p1 , p2 ), e seja S (q, t) = φ(q ) t soluç˜
ao da respectiva
equaç˜
ao de Hamilton-Jacobi

∂S ∂S
 
0= + H q, ,
∂t ∂q

ou seja φ satisfaz
1 = H q, ∂φ ,
 
∂q
e a condi¸c˜ao inicial (ou de fronteira) (q (s), φ(s)) = ( q (s), 1).
ao S (x1 , x2 , t0 ) = S (x, t0 ) = 0 vai determinar para cada t0
Ent˜
fixo, a posi¸c˜ ao de q (s, t1 ) = (x1 (s, t1 ), x2 (s, t1 )), t1 = t1 (t0 ), das
curvas
(xs1 (t), xs2 (t)),
projeç˜ao no plano (x1 , x2 ) das curvas (xs1 (t), xs2 (t), ps1 (t), ps2 (t)), soluç˜
ao
do campo Hamiltoniano come¸cando no tempo t = 0 em

(x1 (s), x2 (s), p1 (s), p2 (s)),


s (a, b). Note que p(s) = (p1 (s), p2 (s)) deve satisfazer a Observaç˜
7.2 da Se¸c˜
ao 7.
ao
A Propriedade Importante segue do seguinte fato:

S (x, t) = S (x1 , x2 , t) = S ((x1 (s, t), x2 (s, t), t)

depende apenas de t (linearmente em t de fato) e as caracterı́sticas


são as solu¸cões do problema mecˆanico como vimos acima.
188 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

Seja φ(x1 , x2 ) solução da equa¸cão de Hamilton-Jacobi


0 = H (x1 , x2 , p1 , p2 ) − 1 = H (q, ∇φ(p)) − 1 = F (x , x ,φ,p
1 2 1 , p2 ),

que será analisada a seguir pelo método das caracter´


ısticas.
A função φ(x1 (s, t), x2 (s, t)) satisfaz

d (φ(x1 (s, t), x2 (s, t)) ∂φ ∂φ


= x1 s′ (t) + x2 s′ (t) =
dt ∂x 1 ∂x 2
p1 Hp1 + p2 Hp2 = p1 (2a(q )p1 + 2c(q )p2 ) + p2 (2c(q )p1 + 2b(q )p2 ) =
2H (q (s, t), p(s, t)).
É fácil ver pela Observa¸cão 46 que para o Hamiltoniano
H (q, p) = a(q )p21 + 2c(q )p1 p2 + b(q )p22 ,
a condição
F (x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) =
= H (x1 (s), x2 (s), p1 (s), p2 (s)) −1=0
significa que H (q (s, 0), p(s, 0)) = 1 para todo s.
Pelo Teorema de conservação do Hamiltoniano (Teorema 2, Capı́-
tulo 3 [L]) H (q (s, t), p(s, t)) é constante igual a 1. Logo, para todo s
d (φ(x1 (s, t), x2 (s, t))
= 2.
dt
Concluı́mos portanto que
dS (x, t)
=
d(φ(x) − t) = 2 − 1 = 1.
dt dt
Se assumirmos φ(x1 (s, 0), x2 (s, 0)) = φ(x1 (s), x2 (s)) = 1, ∀s ∈
(a, b) então S (x1 (s, t), x2 (s, t), t) = 1 + t.
Fica assim justificada a afirmação da Propriedade Importante
acima enunciada. Em breve apresentaremos exemplos em que uti-
lizaremos a propriedade acima descrita (Exemplos 9.5, 9.6 e 9.7).
Considere agora o caso particular em que H (x, p) = p21 + p22 , S
solução da equa¸cão da eikonal
   
∂S
2
+
∂S
2
=1
∂x 1 ∂x 2
189

com a condição inicial da frente de onda na posi¸ cão


2
q (s) = (x1 (s), x2 (s)) ∈R

dada. Então, pela Propriedade Importante φ(x) t = S (x, t) = 0,
vai descrever implicitamente a posição espacial da frente de onda no
tempo t1 .
Vamos considerar no tempo t = 0, condições iniciais ( x1 (s), x2 (s))
e perguntar a posi¸cão desta frente de onda ap´os decorrido tempo t.
Vamos utilizar o resultado mencionado p ela Propriedade Importante
visto anteriormente.
Vamos tentar resolver este problema através dos dois métodos
desenvolvidos antes: o método da integral completa e o método das
caracter´
ısticas.
Primeiro vamos aplicar o método das caracter´ ısticas.
Usando a notação da Se¸cão 7, a Equa¸cão diferencial parcial de 1 a
ordem não linear
2 2
∂φ ∂φ
   
∂x 1 + ∂x 2 =1

pode ser expressa como 0 = F (x1 , x2 ,φ,p 1 , p2 ) = 1 (p21 + p22 ) =



1 (φ2x + φ2y ) onde p1 = φx e p2 = φy .

Vamos analisar neste caso a express˜ ao das equa¸cões das carac-
ter´
ısticas da EDP, F (x1 , x2 ,φ,p 1 , p2 ) = 0 . Neste caso, a equa¸cão

p21 + p22 1 = 0,

ou seja, neste caso F (p1 , p2 ) = p21 + p22 1.

Usando a express˜ao das equa¸cões das caracter´
ısticas obtemos

dx1
dt = 2p1
dx2
= 2p2
dt

= 2p21 + 2p22
dt
dp1
=0
dt
190 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

dp2
= 0. (9.6)
dt
Observação 9.2. Note que no caso acima, o vetor gradiente da
frente de onda φ = p é colinear com x′ .

Observação 9.3. Das equaç˜ oes das caracterı́sticas acima, as carac-
ter´ısticas (x1 (t), x2 (t), φ(t), p1 (t), p2 (t)) devem portanto satisfazer
d2 x1 d
  dx1 d
2
= = (2pi ) = 0
dt dt dt dt

e  
d2 x2 d dx2 d
2
= = (2p2 ) = 0.
dt dt dt dt
Note que os valores p1 (t) e p2 (t) s˜ao constantes.
Da equaç˜ao acima segue que x1 (t) e x2 (t) s˜ao lineares em t, ou
seja, x1 (t) = 2p1 t + c1 e x2 (t) = 2p2 t + c2 .
A conclus˜ao é que a projeç˜ao das caracterı́sticas no plano x =
(x1 , x2 ) s˜
ao linhas retas.
Finalmente, φ′ (t) = 2p21 + 2p22 = 2(p21 + p22 ) = 2 1 = 2, pois por
×
hip´otese p21 + p22 = 1.
Logo φ(t) = 2t + c3 .
Sendo assim, conclu´ ımos finalmente que as caracterı́sticas s˜
ao re-
5
tas em R .
Vamos agora usar os resultados obtidos anteriormente para cal-
cular soluções da EDP via o método das caracter´
ısticas.
Exemplo 9.4. Vamos calcular a soluç˜
ao da equaç˜ao diferencial par-
cial
2 2
∂φ ∂φ
   
∂x 1 + ∂x 2 = 1,
sujeita às condiç˜oes

(x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) = (cos s, sin s, 1, cos s, sin s).

Observe que p1 (s) e p2 (s) s˜ao compatı́veis com (x1 (s), x2 (s), φ(s))
como é necess´
ario assumir no problema em considera¸c˜ao (Seç˜ao 7).
191

As caracter´ısticas j´ a foram calculadas acima, e portanto as carac-


ter´ısticas (xs1 (t), xs2 (t), φs (t), ps1 (t), ps2 (t)) obtidas a partir das condiç˜oes
iniciais
(cos s, sin s, 1, cos s, sin s),
s˜ao
xs1 (t) = 2p1 (s)t + cos s = 2 cos(s)t + cos(s)
xs2 (t) = 2p2 (s)t + sin s = 2sin( s)t + sin(s)
φs (t) = 2t + 1
ps1 (t) = cos s
ps2 (t) = sin s.

Observação 9.4. Note que a partir de p(s) = (p1 (s), p2 (s)) fixado, o
vetor ps (t) = (ps1 (t), ps2 (t)) n˜ao se altera, ou seja neste caso particular,
o momento se conserva.
Antes de expressar a fun¸c˜ao φ nas coordenadas (x1 , x2 ), devemos
relacionar as coordenadas (s, t) e as coordenadas (x1 , x2 ). 2 2
Ora, (x1 (s, t), x2 (s, t)) = (cos s(2t+1), sin s(2t+1)), logo x1 +x2 =
cos2 s(2t + 1)2 + sin2 s(2t + 1)2 = (2t + 1)2 .
Portanto,
t=
1  x21 + x22 −1

2
e como x1 = cos s(2t + 1) ent˜ao
x1 x1
s = arccos = arccos  .
2t + 1 x21 + x22

Em conclus˜ao
  x1 1  
(s(x1 , x2 ), t(x1 , x2 )) = arccos , x21 + x22 −1 .
x1 + x2 2
2 2

Como φ(s, t) = 2t + 1, concluı́mos que a soluç˜ao φ(x1 , x2 ) satis- 


fazendo as condiç˜oes iniciais pré-fixadas é φ(x1 , x2 ) = x21 + x22 .
Sugerimos ao leitor calcular φ2x1 + φ2x2 para testar e certificar-se
que realmente a φ acima descrita satisfaz φ2x1 + φ2x2 = 1.
192 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

A evolução de ( q (s, t), p(s, t)) a partir da frente de onda no tempo


t = 0, dada por ( q (s), p(s)) = (cos( s), sin(s), cos(s), sin(s)) pode ser
seguida para tempos t subsequentes através de φ, isto é, φ(q1 , q2 ) = t
determina a posição no tempo t da frente de onda acima considerada.
A conclusão neste caso, é que as frentes de ondas são cı́rculos com
o mesmo centro.
Exemplo 9.5. Vamos agora tentar encontrar a soluç˜ ao da equaç˜ao
diferencial parcial φ2x +φ2y = 1 através do método da solu¸
c˜ao completa.
Devemos tentar primeiramente encontrar uma famı́lia f a,b (x1 , x2 ) a
dois parˆametros (a, b) R2 de soluç˜oes de φ2x + φ2y = 1.

Vamos tentar encontrar a solu¸c˜ao pelo método de separaç˜ao de
vari´aveis. Suponhamos que φ possa ser escrita da forma φ(x1 , x2 ) =
f (x1 ) + g(x2 ).
Substituindo φ na equaç˜ao φ2x1 + φ2x2 = 1, obtemos f ′ (x1 )2 +
g ′ (x2 )2 = 1.
Como f ′ (x1 )2 = 1 g ′ (x2 )2 , ent˜ao f ′ (x1 ) n˜ao depende de x1 . Logo

f (x1 ) é constante. Da mesma forma g ′ (x2 ) também é constante.

Como f ′ (x1 )2 + g ′ (x2 )2 = 1, podemos escrever f ′ (x1 ) = cos a e
g ′ (x2 ) = sin a.
Portanto, f (x1 ) = x1 cos a + c1 e g(x2 ) = x2 sin a + c2 .
Finalmente conclu´
ımos que
f (x1 , x2 ,a,b ) = f (a,b) (x1 , x2 ) = x1 cos a + x2 sin a + b
é uma famı́lia completa de soluç˜oes da equa¸c˜ao diferencial parcial
φ2x1 + φ2x2 = 1.
Exemplo 9.6. Vamos agora encontrar a soluç˜ ao de φ2x1 + φ2x2 = 1
com as condiç˜oes iniciais (x1 (s), x2 (s), φ(s)) = (cos s, sin s, 1), 0 ≤

t 2π .
Como vimos antes no par´agrafo sobre envolt´orias, primeiro deve-
mos encontrar (a(s), b(s)) soluç˜ao de
1 = z(s) = x1 (s)cos a(s) + x2 (s)sin a(s) + b(s)
= cos s cos a(s) + sin s sin a(s) + b(s) (9.7)
e
∂f ′ ∂f ′
0 = z ′ (s) = x (s) + −
x (s) = ( cos a(s)sin s + sin a(s)cos s).
∂x 1 1 ∂x 2
(9.8)
193

E´ f´acil derivar que a(s) = s, b = 0 s˜ao as solu¸c˜oes do sistema


(9.7) e (9.8).
Devemos portanto considerar a famı́lia a um parˆametro s, dada
por

f t (x1 , x2 ) = x1 cos a(s) + x2 sin a(s) + 0 = x1 cos s + x2 sin s.

A envolt´oria desta famı́lia nos permitir´


a obter a solu¸c˜ao z(x1 , x2 ).
2∈
Fixe (x1 , x2 ) R , vamos encontrar quem é s(x1 ,x2 ) que satisfaz

∂f
0=
∂s
= −x 1 sin s + x2 cos s

e f (x1 , x2 ) = x1 cos s + x2 sin s.


Seja θ e r > 0 tal que x1 = r cos θ e x2 = r sin θ.
Logo

0= −x 1 sin+ x2 cos s = −r cos θ sin s + r sin θ cos s = −r sin(s − θ),


implica que
x2
s(x1 ,x2 ) = arctan .
x1
Portanto, u(x1 , x2 ) = x1 cos s(x1 ,x2 ) + x2 sin s(x1 ,x2 ) =

x2 + x2
= x1
x1
+ x2
x2
= 12 22 =
  x21 + x22 .
r r x1 + x2

Sendo assim obtivemos a solu¸ c˜ao da equa¸c˜ao da eikonal com a


condiç˜ao inicial (q (s), p(s), 1) utilizando o método da soluç˜ao com-
pleta.
A partir da solu¸c˜ao da equa¸c˜ao de Hamilton-Jacobi u, sabemos
pela Propriedade Importante que podemos determinar a evoluç˜ao das
frentes de onda de soluç˜oes do sistema mecˆanico (q (s, t), p(s, t)) a
partir de condiç˜oes iniciais (q (s), p(s)).
Exemplo 9.7. Seja a matriz

M=
  ã c̃
,
c̃ b̃
194 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

positiva definida e que define uma métrica Riemanniana


2

L = Mv,v  = ãv 1 + 2c̃v1 v2 + b̃v22 .

Neste caso, (ver (3.1) na Se¸c˜ao 2, Capı́tulo 3 [L])


H (x, p) = 1 M −1 p, p
4

é o Hamiltoniano associado ao Lagrangiano L dado pela métrica Ri-
emanniana (com coeficientes ã, b̃, c̃ constantes). Note que 14 M −1
também é positiva definida.
Sendo assim, se S (q, t) é da forma S (q ) t, a equa¸c˜ao −
∂S ∂S 1
0= + H (x, S ) = ∇ + M −1 S, S =  ∇ ∇
∂t ∂t 4

−1 +
 1 −1
M S, S∇ ∇
 = −1 +
 1
M −1 S, S ∇ ∇
4 4
vai descrever a evolu¸c˜ao de frentes de onda em um meio homogêneo
mas n˜ao isotr´opico.
Note que H também define uma forma quadr´atica positiva defi-
nida, pois se M é positiva definida, M −1 também é.
Das equaç˜oes das caracterı́sticas obtemos que p(t), q (t) s˜ao cons-
tantes pois a equaç˜ao diferencial definida por F n˜ao depende de z, x1 , x2 .
Sendo assim o vetor normal ` as distintas superfı́cies de nı́vel (evo-
luindo no tempo) a partir de um vetor inicial dado é constante.
Se assumirmos por exemplo que
1 −1
M =
 1 0
 ,
4 0 1/4

ou seja que  
1/4 0
M= ,
0 1
ent˜ao a equaç˜ao de Hamilton-Jacobi associada é

0= −1 +
   
∂S
2
+
1 ∂S
2
.
∂x 1 4 ∂x 2
195

 Uma soluç˜ao de tal equaç˜ao j´a foi considerada no exemplo S (x, t) =


x21 + 4x22 − t.
Neste caso um dist´urbio inicial no ponto (0,0) vai gerar frentes de
onda com forma de elipses. Um propriedade macrosc´opica, a forma
da frente de onda, é ent˜ao determinada por uma propriedade mi-
crosc´
opica.
S descreve a evolu¸c˜
ao em um meio homogêneo anisotr´ opico.
Exemplo 9.8. Uma métrica Riemanniana pode ter os coeficientes

a(x1 , x2 ), b(x1 , x2 ), c(x1 , x2 )

dependendo da vari´avel (x1 , x2 ). Considerando L o Lagrangiano as-


sociado à métrica Riemanniana
L = ã(x1 , x2 )p21 + 2c̃(x1 , x2 )p1 p2 + b̃(x1 , x2 )p22 ,

e seu correspondente Hamiltoniano H (ver (3.1) Seç˜ao 2, Cap´ıtulo 3).


Ent˜ao a equaç˜ao constitutiva natural ao problema é dado por

− ∂S
∂t
= H (x, ∇S )

onde
H (x, p) = H (x1 , x2 , p1 , p2 ) =
1 b̃(x1 , x2 )p21 − 2c̃(x , x )p p
1 2 1 2 + ã(x1 , x2 )p22
.
4 ãc̃ − b̃2

Para simplificar a notaç˜ao, podemos reescrever a express˜


ao acima
considerando

a=
1 b̃
, c=
1 c̃− , b=
1 ã
.
4 ãb̃ c̃2
− 4 ãb̃ c̃2
− 4 ãb̃ c̃2 −
Obtemos assim o Hamiltoniano
H (x, p) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 . (9.9)

− √
Supondo S (x, t) = t φ(x) temos ent˜ao a equa¸c˜ao de Hamilton-
Jacobi para tal H (ou para H , tanto faz)
1 = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 ,
196 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

onde p1 = φx1 , p2 = φx2 .


Sendo assim a equa¸c˜ao constitutiva do meio (ou seja a equa¸ c˜ao
de Hamilton-Jacobi) determina a equaç˜ao diferencial parcial 0 =
F (x1 , x2 ,φ,p 1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 1,

onde p1 = φx1 e p2 = φx2 .
Note que F n˜ao depende de φ, mas depende neste caso de x1 e
x2 . Sendo assim, as equaç˜ oes das caracterı́sticas n˜ ao determinar˜ao
mais (como no Exemplo 9.4) que p(t) é constante. Isto se deve à
dependência de H (x, p) em x e em p. A falta de homogeneidade e
isotropia do meio é descrita pela métrica Riemanniana L (ou mais
precisamente pela métrica Riemanniana H ). Note que neste caso
n˜ao estamos considerando nenhum termo correspondente `a energia
potencial. O Hamiltoniano neste caso é dado pelo m´ odulo ao quadra-
dado do vetor velocidade considerando a norma descrita pela métrica
Riemanniana. Lembre que para fins de c´alculo do traço das curvas
soluç˜oes do sistema (ver Se¸c˜ao 7), tanto faz tomar a raiz quadrada
ou n˜ao na express˜ao do Hamiltoniano acima.
Afirmamos que as geodésicas desta métrica Riemanniana nas co-
ordenadas (q, p) desempenhar˜ ao o papel das caracterı́sticas, pois a
equaç˜ao das caracter´ısticas para

0 = F (x1 , x2 ,z,p 1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 +b(x1 , x2 )p22 −1


s˜ao
∂F
x′1 (t) = = 2ap1 + 2cp2
∂p 1
∂F
x′2 (t) = = 2cp1 + 2bp2
∂p 2
∂F
p′1 (t) =
− ∂x
∂F
1
p′2 (t) = − ∂x .
2

e determinam as equa¸c˜oes das equaç˜oes geodésicas. Esta afirmaç˜ao


foi demonstrada anteriormente para um Hamiltoniano qualquer, isto
é, mostramos que as caracter´ısticas s˜
ao as trajet´orias do sistema Ha-
miltoniano (que no caso em consideraç˜ao s´o possui energia cinética).
197

As geod´ esicas s˜
ao portanto as caracterı́sticas da equaç˜ao diferen-
cial parcial
0 = F (x1 , x2 ,z,p 1 , p2 ) = a(x1 , x2 )p21 +2c(x1 , x2 )p1 p2 +b(x1 , x2 )p22 1.

A velocidade da luz é finita e ap´os uma normaliza¸c˜ao podemos
supor
inicialque esta no
q0 onde velocidade
tempo 0 éseigual a 1,a luz,
acende sendo assim,defixado
a frente onda um ponto

T é o
conjunto dos pontos de plano (x1 , x2 ) que distam T de q0 .
As envolt´orias por raios de luz (ou por geodésicas) determinam as
frentes de ondas num cristal conforme Observaç˜ao anterior.
A conclus˜ao final é que as geodésicas fazem o papel dos raios de
luz e das caracterı́sticas. Esta conclus˜ao traduz fielmente a rela¸c˜ao
entre a Mecˆanica Hamiltoniana e a propagaç˜ao de frentes de onda.
Note que no caso da métrica Riemanniana da esfera, a frente de

onda T emitida a partir de um polo q0 , ap´os um certo tempo T0
ir´a colapsar no outro polo (ver Figura 3.10 b)).
Este fenˆomeno, que nem sempre ocorre, é denominado de criaç˜ao
de c´austicas. Em termos matem´aticos dizemos que o aparecimento
das c´austicas est´a associado à existência de pontos conjugados. Refe-
rimos o leitor a [MC3] para maiores considera¸c˜oes sobre este t´opico.

Exercı́cio: No caso da métrica hiperbólica


1
 x˙1 2
+
x˙2 2
 ,
2 x22 x22
∂L x˙1
o momento p1 = ∂ x˙1 = x22
= x˙ . Calcule a equa¸cão de Hamilton-
1
Jacobi associada.

Observação
de 9.5.
uma métrica Em geral, para um H como acima (9.9), oriundo
Riemanniana
(x′1 , x′2 ) = (2 ap1 + 2cp2 , 2cp1 + 2bp2 ). (9.10)
Logo em geral x′ e p′ n˜ao s˜ao colineares.
No caso da métrica Euclidiana, no entanto, x e p são colineares
(ver Observação 48).
198 [CAP. 9: O PRINC ÍPIO DE HUYGENS EM MEC ÂNICA HAMILTONIANA

Observação 9.6. As equaç˜ oes das caracterı́sticas afirmam, no caso


de uma métrica Riemanniana geral, as geodésicas s˜ ao as caracter´ıs-

ticas (projetadas em (x1 ,...,x n )). Uma frente de onda t causada
por uma perturbaç˜ao pontual em q0 é constituı́do pelo conjunto dos
pontos que distam t de q0 .
Note que p é perpendicular à frente de onda, pois S = p, mas o

vetor q̇ n˜ao necessariamente (se o meio n˜ao for homogêneo e aniso-
tr´opico) conforme mostra a express˜ao (9.10) na Observa¸c˜ao 9.5 (ver
Figura 8.3).
Em conclusão, podemos afirmar que as considera¸cões feitas ante-
riormentes sobre raios da luz e geodésicas como geradores de frentes
de onda, foi a inspira¸cão para o ponto de vista de Hamilton de ten-
tar analisar a Mecˆanica Cl´assica através de um ponto de vista de
perturbação por frentes ondas de um meio contı́nuo.
Capı́tulo 10

A Equação da Onda

O que chamamos de raio de luz nas se¸ cões anteriores, correspondia


a geodésicas de uma métrica Riemanniana. Na verdade, uma carac-
terı́stica importante do raio de luz fı́sico real é o seu caráter ondu-
latório, o qual n˜ao foi considerado na nossa an´alise anterior [Lu].
A luz é um fenômeno eletromagnético, que obedece as equações
de Maxwell (ver [Go]). A partir desta equa¸cão, pode se mostrar que
a luz obedece a equa¸cão da onda em R3 .
Abstraindo o car´ater ondulatório da luz, conseguimos nas se¸ cões
anteriores entender o relacionamento da Ação com as frentes de onda
e as geodésicas.
Vamos descrever agora brevemente a luz (por abuso de linguagem
vamos chamar de raio de luz) como uma onda e relacionar o que foi
descrito anteriormente com este novo ponto de vista (ver Observação
10.2 ao fim desta se¸cão).

Referimos o leitor para [Go] para referências gerais sobre o as-


sunto.
Para isto necessitaremos considerar a equa¸cão da onda em R3

∂2φ ∂2φ ∂2φ 2


∂2φ
∂x 21
+
∂x 22
+
∂x 23
− ηc
2 ∂t 2
=0 (10.1)

onde η é uma constante.

199
200 [CAP. 10: A EQUAÇÃO DA ONDA

A solução φ(x1 , x2 , x3 , t) vai descrever a evolução da onda em um


meio com ı́ndice de refração η. O valor c é a velocidade da luz que é
uma constante universal.
Vamos primeiro tentar entender o que representa enfim um raio
de luz no tempo t0 e relacionar tal conceito com a equa¸cão acima. O
raio de luz (individualizado) no tempo t0 vai ser representado por

φ(x1 , x2 , x3 ) = φ(x1 , x2 , x3 , t0 ) =

= φ0 ei ( <x,r> − w t0 ) = φ0 ei (  ( x1 ,x2 ,x3 ) , ( r1 ,r2 ,r3 )  − w t0 ) , (10.2)


onde φ0 é uma constante, r = (r1 , r2 , r3 ) é um vetor constante e w
a constante que vai determinar a frequência da oscilação temporal.
Existe uma rela¸cão entre w e r que será descrita em breve.
Vamos agora tentar explicar ao leitor porque é natural considerar
tal φ para descrever um raio de luz (individualizado).
φ0 determina a amplitude do raio de luz.
O raio de luz “individualizado”descrito acima é tal

c { |
= (x1 , x2 , x3 ) φ(x1 , x2 , x3 , t0 ) = c }

t0 , c R, determina planos perpendiculares `a direção (r1 , r2 , r3 ).
Um raio de luz no tempo t0 é portanto descrito por uma série de
planos, por isso é também denominado de uma onda plana.
Note que para um t0 fixo o raio de luz contém uma informação
em todo o espa¸co de posi¸cões R3 (são os v´arios planos de nı́vel).
O leitor pode observar que qualquer fun¸cão g(α), onde

 
α = (x1 , x2 , x3 ), (r1 , r2 , r3 ) =< x, r >

também determinaria planos como superfı́cies de nı́vel.


Para descrever o raio de luz, assumimos também uma periodi-
cidade espacial (o raio de luz tem um car´ ater ondulatório) de φ.
Isto explica o termo ei <x,r> na expressão acima para φ. Em vez
de usar senos e cossenos estamos usando a nota¸ cão complexa para
ei  (x1 ,x2 ,x3 ),(r1 ,r2 ,r3 )  que é mais compacta. A periodicidade espacial
de φ vai depender do m´odulo

r  .
201

Vamos denominar este valor do perı́odo de fase ótica.


Sendo assim, para t0 fixo, o valor de φ se repete espacialmente na
direção r com per´ıodo 2rπ .
Esta periodicidade espacial vai acontecer também de maneira tem-
poral para x fixo quando variarmos t0 . Isto é expresso pelo termo
ei wt0 na expressão φ = φ0 ei(x,r−wt) = φ0 eix,r e−iwt . Logo para x
fixo, de tempos em tempos (com frequência w) repetem-se os valores
de φ.
Fica assim descrito de maneira geral como devemos entender o
raio de luz individualizado φ(x, t) = φ0 ei(x,r−wt) . Para cada w e
r fixos, associamos um raio de luz φ = φr,w . Tal φ = φ(x, t) =
φ0 ei(x,r−wt) é uma função que depende de ( x, t).
Considere w fixo e uma fun¸cão f (x) = ft0 (x) que vai descrever
um feixe da raios de luz no tempo t0 .
 
A variável real α = x, r como vimos antes vai determinar uma
periodicidade em eix,r = eiα e sendo assim podemos encar´a-lo como
um gerador de fun¸cões f (x) na variável x via Transformada de Fou-
rier. Ou seja f (x) vai ser uma combinação de φr para diferentes r (ou
seja um feixe de raios individualizados de luz φr dado pela express˜ao
(10.2)). Mais precisamente, dado f (x), considere a transformada de

Fourier fˆ(r) tal que f (x) = fˆ(r)(ei<r,x> )dr.
Logo

f (x, t) = f (x) e−i w t = (


 fˆ(r)(ei<x,r> )dr)e−iwt =
 fˆ(r)ei(<x,r>−wt) dr (10.3)

vai representar um feixe de raios de luz (note que w é constante e


independe de r).
f é determinada pela distribuição (ver [Ju] para defini¸cão) fˆ.
O que chamamos de luz é na verdade uma combinação dos raios
de luz individuais (10.2) dados por φ0 ei(α−wt) = φ0 ei(x,r−wt) via
transformada de Fourier como acima.
Se fˆ é o Delta de Dirac no ponto r0 com massa φ0 , então
f (x)e−iwt = φ0 ei<x,r0 > e−iwt = φ0 ei(<x,r0 >−wt) .
Recuperamos assim o raio de luz individualizado (10.2).
202 [CAP. 10: A EQUAÇÃO DA ONDA

O raio individualizado φ0 ei(α−wt) é na verdade uma abstração


do ponto de vista Fı́sico. A luz, quando observada, em geral é um
“pacote”com vários raios de luz individualizados (10.2), como aparece
em (10.3).
Para a correta defini¸cão do raio de luz, falta ainda mais uma
restrição. Vai existir uma rel ação entre r e w que vai advir da
equação da onda anteriormente apresentada. 
Vamos agora relacionar o raio de luz com a equa¸ cão da onda. O
raio de luz fisicamente observado é também solução da equa¸cão da
onda (ver [Go]).
Substituindo o raio de luz “individualizado”φ(x, t) = φ0 ei(r,x− w t)
na equação da onda
η2 ∂ 2 φ
∆φ − c2 ∂t 2
= 0,
η constante, obtemos que φ é solução da equa¸cão acima no caso em
que
ηw

r =
c
. (10.4)

Sendo assim, existe uma relação entre a periodicidade espacial r


e a periodicidade temporal w, determinada pela equa¸cão diferencial

parcial acima.
A igualdade (10.4) acima é chamada de relação de dispersão. Fi-
nalmente, com esta relação entre w e r, o raio de luz fica precisamente
bem definido.
Como sabemos, a equa¸cão da onda acima descrita (10.1) é linear.
Sendo assim, uma combina¸cão linear f (x)e−w i t de tais fun¸cões raio
de luz individualizados φ = φr (via Transformada de Fourier) também
vai ser solução da equa¸cão linear da onda
∂ 2φ ∂ 2φ ∂ 2φ 2
d2 φ
∂x 21
+
∂x 22
+
∂x 23
− ηc
2 dt2
= 0,

η constante.
Fica portanto esclarecido em que sentido φ = f (x)e−i w t (um feixe
de raios de luz) é solução da equa¸cão da onda com η fixo.
Vamos agora investigar o caso em que η(x) não é constante, e é
fracamente variável (ver Observação 10.1 a seguir) com a posi¸ cão x.
A ótica geométrica é o ramo da ciência interesssado em analisar
o caso em que η é fracamente variável com a posi¸cão. Uma relação
203

muito interessante e importante com a equa¸cão de Hamilton-Jacobi


vai aparecer.
Considere η(x) uma fun¸cão no R3 e a equa¸cão

dφ2 dφ2 dφ2 2 2

dx21
+
dx22
+
dx23
− η c(x) ddtφ =0
2 2
(10.5)

A análise que vamos fazer neste caso corresponde aos raios de luz
em um meio n˜ao homogêneo.
Uma solução φ para a equação com η variável, não vai mais neste
caso ser uma onda plana. A solu¸ cão que se busca é da forma

φ = eA(x)+i(S (x) k0 −w t) . (10.6)

w é uma constante, eA(x) vai representar a amplitude, o termo


i S (x) k0
e representa as frentes de onda espaciais (antes quando S era
da forma
 
S (x) = x, r

estas
e−i w tfrentes de onda
representa a periodicidade e k0 é uma
eram planas)temporal. A(x)constante. O termo
e S (x) tomam va-
lores reais.
Fica assim descrito de maneira esquem´atica a informa¸cão que nos
traz a express˜ao do raio de luz φ num meio em que η varia com
posição.
O problema em considera¸cão supõe que no infinito η é constante,
ou seja, que a regi˜ao em que η(x) depende de x está localizada apenas
em um aberto limitado.
Logo, para pontos x muito distantes, vale que a onda φ(x, t) se
comporta como uma onda plana. Logo, para tais pontos x, a solu¸cão
(10.6) deve ser da forma (10.3). Sendo assim, vale também a relação
de dispersão (10.4) mencionada anteriormente.
Neste caso e usando a nota¸cão acima, esta rela¸cão significa
w2
k02 = . (10.7)
c2
Vamos tentar agora relacionar a teoria descrita acima com a Te-
oria de Hamilton-Jacobi. Em particular dese jamos tentar entender
melhor o papel desempenhado por S .
204 [CAP. 10: A EQUAÇÃO DA ONDA

∇ ∇
Ora φ = φ (A + ik0 S ) e ∆φ = φ[ ∆(A + ik0 S ) + ∇(A +
ik0 S ) 2 ].

Esta última expressão é igual a
2 2 2
∆φ = φ[ ∆A + ik0 ∆S + ∇A − k ∇S  0 + 2ik0 ∇A, ∇S  ].
A equação da onda (usando (10.6)) torna-se ent˜ao
2 2 2
ik0 [ 2 ∇A, ∇S + ∆S ] φ + [ ∆A + ∇A| − k ∇S 0 + η 2 k02 ] φ = 0.

Como A, S são reais, a equa¸cão da onda representa


2
∆A + ∇A + k02 ( η 2 − ∇S  2
)=0

e
∆S + 2 ∇A, ∇S  = 0.
Logo, se S e A satisfazem tais equa¸cões, φ descreve um raio de
luz.

Observação 10.1. Vamos assumir agora que k02 é muito grande em


termos relativos com a parte ∆A + A 2 . Esta hip´otese traduz
∇ 
em termos matem´aticos precisos a afirmaç˜ao que “ η(x) é fracamente
vari´avel com a posi¸c˜ao x”feita anteriormente.
Portanto, com esta hip´otese,
∇  2
∆A + A
2 + (η 2 − ∇S  ) = 0 2
k0

significa aproximadamente que η 2 − ∇S  2


= 0, ou seja, que S sa-
tisfaz a Equaç˜ao de Hamilton-Jacobi
2 2 2
∂S ∂S ∂S 2
∂x 1
      + ∂x 2 + ∂x 3 = η (x). (10.8)

Esta equaç˜ao é a Equaç˜ao de Hamilton-Jacobi (9.3) para o Ha-


miltoniano
H (q, p) = p21 + p22 + p23 2
− η (x) + 1. (10.9)
Sendo assim, como vimos antes a fun¸ c˜ao S soluç˜ao da equa¸c˜ao
(10.8) acima, deve corresponder à Aç˜ao de um sistema mecˆanico.
205

O termo η corresponde a falta de homogeneidade do meio no caso


dos raios de luz num cristal.
Por exemplo, se η é constante igual a 1, a partir de (10.8) determi-
namos que S deve satisfazer a equaç˜ao de Hamilton-Jacobi autˆonoma
associada ao Hamiltoniano p21 + p22 + p23 , ou seja a equa¸c˜ao da eikonal.
Note que uma vez que se obtém S , a fun¸c˜ao A satisfazendo
∆S + 2 ∇A, ∇S  = 0,
pode ser facilmente obtida por integra¸c˜ao. Desta maneira, com as
hip´oteses acima, obtemos a solu¸c˜ao
φ = eA(x)+i(S (x) k0 −w t) .

Observação 10.2. O Lagrangiano associado a tal Hamiltoniano


(10.9) é
L(q, p) = 4( p21 + p22 + p23 ) + η 2 (x) − 1.
Pelo Teorema de Mauperitus (Teorema 20, Seç˜ao 7, Capı́tulo 2)
o problema mecˆanico associado a tal Lagrangiano, é equivalente a
considerar um Lagrangiano da forma
 
L̃(x1 , x2 , x3 , p1 , p2 , p3 ) = M (x)(p1 , p2 , p3 ), (p1 , p2 , p3 ) ,

onde M (x) é uma matriz positiva definida que depende da posi¸ c˜ao x.
Ou seja, as equa¸c˜oes da equaç˜ao de Hamilton do sistema (10.9) s˜ ao
geodésicas (a menos de reparametrizaç˜ao do tempo) de uma métrica
Riemanniana L (ver Seç˜ao 6, Capı́tulo 2 [L]).

Conclusão: Conclu´ımos que o S que aparece na express˜ao do feixe


da raios de luz φ deve ser aproximadamente igual à solução da equação
de Hamilton-Jacobi para um problema de Mecˆanica Clássica (se k0

for tomado
a ação bem
de um grande).
sistema Portanto,NoSlimite,
mecˆanico. corresponde aproximadamente
tomando k0 = , então ∞
S é realmente a ação de um sistema mecˆanico definido pelo Hamil-
toniano (10.9), como descrito acima. As superfı́cies com S constante
vão representar superfı́cies de fase constante. A Teoria de Hamilton-
Jacobi nos diz ent˜ao que a Mecˆanica Cl´assica corresponde `a Ótica
Geométrica (fazendo um limite em que k02 vai a ∞
). Este tipo de
resultado é essencial na Teoria semi-clássica da Mecânica Quântica.
206 [CAP. 10: A EQUAÇÃO DA ONDA

Finalmente, a partir do que foi dito acima, podemos justificar as


considerações das seções anteriores onde afirmamos que o raio de luz
deve ser visto como uma geodésica, na verdade corresponde a supor
que o raio de luz (10.3) que consideramos nesta se¸ cão está situado
em um meio em que k02 é muito grande (mais precisamente k0 = ). ∞
Essa relação compatibiliza dois pontos de vista que no passado
foram antagônicos: o ponto de vista de Newton que a luz é um raio
corpuscular e o ponto de vista de Hamilton que a luz é na verdade
uma frente de onda.
Capı́tulo 11

O Método da Fase
Estacionária e suas
Aplicações em Ótica

por Artur Lopes e Marcos Sebastiani

11.1 Introdução

Vamos considerar aqui fun¸cões C ∞ definidas em semi-reta reais


e tomando valores complexos F (τ ) : (d, + ) ∞ → C onde d é uma
constante real.
Definição 11.1. H (τ ) é de decrescimento r´
apido se para todo N vale
N
que H (τ )τ → 0 quando τ →∞ e o mesmo é v´
alido para as deri-
k
vadas de ordem k de H , ou seja para todo N vale que d dτ H (τ ) N
k →
τ 0,
quando τ →∞.
Definição 11.2. F (τ ) e G(τ ) tem mesmo comportamento assint´ otico
se F (τ ) −
G(τ ) é de decrescimento r´ apido e utiliza-se a notaç˜ao

207
208 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

F (τ ) ∼ G(τ )
Duas funções F e G que tem o mesmo comportamento assintótico
são quase que indistinguı́veis para valores de τ grandes.
O τ tem o significado de frequência em Ótica e no Eletromag-
netismo. Estamos interessados então apenas em situa¸cões em que a
frequência τ vai a infinito, ou seja, quando ela é muito grande. Neste
contexto, se H (τ ) tem decrescimento rápido, podemos dizer que para
τ grande podemos substituir ela pela fun¸cão nula ( H (τ ) 0). ∼
Nosso objetivo principal é analisar o assintótico de express˜oes da
forma 

F (τ ) = f (x)eiτ φ(x) dx
−∞
quando τ vai para infinito [1], [5], [6], [7] e [8].
Para se ter uma breve idéia da complexidade do problema consi-
dere φ(x) = x: note que neste caso quando τ esta fixo, mas é muito
grande, o termo eiτ x oscila muito com x, ou seja, uma pequena va-
riação de x faz variar bastante eiτ x ; a idéia heurı́stica básica aqui é
que essas oscila¸cões irão produzir cancelamentos e um comportanto
bem definido aparece disto tudo quando τ vai a infinito.
Em Ótica o f (x) representa a amplitude, τ a frequência e o φ(x)
a fase de uma onda que é descrita pela express˜ao acima [3], [4] e
[8]. O limite quando τ vai a infinito conduz a assim chamada Ótica
Geométrica [2] Section 9-8 .
Vamos assumir em todo o texto que f é de classe C ∞ .
Uma outra importante aplica¸cão do cálculo do assint´otico de tais
integrais é no estudo do limite semi-clássico da Mecânica Quântica:
neste caso τ = 1/h e h vai a zero [3], [5] e [2].
Como decorrência natural do que vamos analisar no texto vamos
apresentar brevemente a fundamenta¸cão matem´atica da teoria das
séries não convergentes. H. Poincare foi o primeiro matemático a
introduzir tais séries.
209

11.2 Fase Estacionária

Proposição 11.1. Seja f ∈ C ∞ (IR), ou seja uma fun¸c˜ao C ∞ com


0
suporte compacto, ent˜ao

iτ x
F (τ ) = −∞ f (x)e
 dx
é de decrescimento r´
apido.
Demonstração: De fato, segue de propriedades de Séries de Fourier
(apenas integração por partes) que

F (τ ) =
 ∞
f (x)e iτ x
dx =
−1 
∞ df (x)
eiτ x dx
−∞ iτ −∞ dx
e repetindo a integra¸cão por parte n vezes, obtemos

F (τ ) =
−1 
∞ dn f (x)
n
eiτ x dx.
(iτ )n −∞ dn x
n
Então |τ n F (τ )| ≤ (b − a)Maxa≤x≤b d dfn(xx) , onde o intervalo ( a, b)
contém o suporte de f e a, b são constantes reais.
Logo F (τ )τ n é limitada para todo n, portanto
F (τ )τ n−1 tende a zero para todo n quando τ vai a infinit o. Re-
sultado análogo vale para as derivadas k-ésimas. Logo, tal F (τ ) tem
decrescimento rápido. 

Utilizando o ponto de vista de equivalência , podemos dizer, do ∼


ponto de vista da Defini¸cão 11.2 que podemos substituir F (τ ) por 0
para τ grande, ou seja

F (τ ) =
 ∞
f (x)eiτ x dx ∼ 0.
−∞
Vamos agora analisar em geral outros tipos de funções F (τ ), como
por exemplo  ∞
F (τ ) = f (x)eiτ φ(x) dx
−∞
onde φ(x) é uma função qualquer que supomos doravante analı́tica.
No exemplo anterior φ(x) = x.
É possı́vel mostrar mais geralmente que:
210 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA


Proposição 11.2. Se φ (x) n˜
ao tem zeros no suporte de f ent˜
ao
vale que

F (τ ) =
 ∞
f (x)eiτ φ(x) dx ∼ 0.
−∞

Demostração: Para cada τ tal que φ (τ ) = 0, podemos escolher um



intervalo aberto Uτ = (τ ǫ, τ +ǫ) disjunto do suporte de f . Por outro


lado, para cada τ tal que φ (τ ) = 0 podemos escolher um intervalo


aberto Uτ = (τ ǫ, τ + ǫ) tal que φ (x) = 0, x U¯τ . Tomando  ∀ ∈
uma partição da unidade subordinada ao recobrimento assim obtido,
basta provar que  a
∼ 0,f (x)eiτ φ(x) dx
b

quando (a, b) contém o suporte de f e φ (x) 
= 0 em [ a, b]. O resultado
segue da proposi¸cão 1 pela mudan¸ca de coordenadas φ(x) = y. 
′ ′′

Se φ (a) = 0, φ (a) = 0 dizemos que a é ponto estacionário or-
′ ′′
dinário (é cr´
ıtico não degenerado para φ). Se φ (a) = 0, φ (a) = 0
dizemos que a é ponto de cáustica.
Um caso importante foi estudado por Fresnel, que corresponde a
φ(x) = x2 . Neste caso x = 0 é ponto estacionário ordinário para φ.
Lembre que
 ∞ 1 ∞ 2  √π
ix2 τ iπ/ 4
e dx = eiy dy =
√ √τ e
−∞ τ −∞

Desejamos calcular

F (τ ) =
 ∞
f (x)eiτ x dx
2

−∞
Ora
√π  ∞  ∞
iπ/ 4 iτ x2 2
F (τ ) − f (0) √ e = f (x)e dx − f (0) eiτ x dx =
τ −∞ −∞

= lim
 R
(f (x) − f (0))e iτ x2
dx.
R →∞ −R
211


c

Seja g(x) tal que f (x) f (0) = xg(x), onde g ∈ C ∞ (R) e g = x2
para x fora do suporte de f .
Ora
R R
iτ x2 2
(f (x) − f (0))e dx = xg(x)eiτ x dx =
R R
 − 2
eiτ x g(x)
 −
R

2iτ
|x=R
x= R − − 2iτ1 ′
g (x)eiτ x dx.
2

−R
f (0) f (0)
Se R é grande, g(R) = − R −
e g( R) = R .
Decorre da´ı que

lim
 R
(f (x) − f (0))e iτ x2
dx = − 2iτ1
 ∞ ′
g (x)eiτ x dx.
2

R →∞ −R −∞
Sendo assim,
√ i ∞ ′ 2
F (τ ) = eiπ/ 4 f (0) πτ −1/2 + g (x)eiτ x dx.

Note que por hip´otese de g, para cada τ fixo
 −∞

i ∞ ′  2
g (x)eiτ x dx
2τ −∞
é uma constante finita; esta integral vai a zero quando τ vai a infinito.
Como τ −1 vai a zero mais r´apido que τ −1/2 quando τ vai a infi-
√ 
∞ ′ 2
nito, o termo f (0) πτ −1/2 domina o termo 2iτ −∞ g (x)eiτ x dx na
convergência a zero de F (τ ) quando τ vai a infinito.
Fazendo o mesmo procedimento m vezes obtemos:
Proposição 11.3. Para todo m vale que se F (τ ) = −∞ f (x)eiτ x dx,
∞ 2

ent˜ao
F (τ ) =
m √
eiπ/4 π(i/2)k
f 2k (0) −k−1/2
τ +

(2k)!!
k=0

+(i/(2τ ))m+1
 ∞
h(x)eiτ x dx,
2

−∞
onde h(x) é uma funç˜ao em C tal que h(x)x2 é limitada e onde

(2k)!! = 2 4 6 ...(2(k − 1)) (2k).
212 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

A fun¸cão h acima é obtida recursivamente seguindo o procedi-


mento do caso m = 1. O termo dominante na convergência a zero da
expressão acima é de ordem τ −1/2 . Podemos afirmar que em prim eira

aproximação o termo dominante de F (τ ) é eiπ/4 f (0) πτ −1/2 .
Gostarı́amos de fazer m tender a infinto para se ter ent˜ ao uma
expressão completa de F (τ ) em série, mas este procedimento pode
incorrer em problemas de convergência da série; esta é a raz˜ ao para
introduzir a seguir o conceito de uma série convergir assintóticamente
a uma fun¸cão F (τ ).
Definição 11.3. Dizemos que 0 k

∞ g (τ ) converge assintoticamente

a F (τ ) C se fixados quaisquer r, s, existe M tal que para m fixo,

m M
m
dr F (τ ) dr gk (τ ) s

( r
d τ

dr τ

k =0
é limitada quando τ → ∞.
Usaremos a nota¸cão F (τ ) ∼ ∞
0 gk (τ ) que estende a nota¸ cão
anterior.

Note que a série acima não converge na maioria dos casos pelo
2k
teorema de E. Borel [8]; os termos f(2k(0)
)!! podem ser qualquer coisa!!!
A expressão acima, no entanto, faz completo sentido matemático,
se interpretada de acordo com a ´ultima definição. 
′ ∞ g′ (τ )
Observamos que por defini¸cão F (τ ) 0 k ∼
Usando a notação acima, podemos concluir das considera¸cões an-
teriores que
∞ √ f 2k (0) −k−1/2
F (τ ) ∼ eiπ/4 π(i/2)k τ (11.1)
(2k)!!
k =0
Quando na defini¸cão acima falamos em derivada r-ésima de F
estamos pensando
xemplo para r = 1 na express˜
usamos queao formal da derivada, ou seja, por e-

F ′ (τ ) =
 ∞
ix2 f (x)eiτ x dx
2

−∞
quando  ∞ 2
F (τ ) = f (x)eiτ x dx.
−∞
213

Mais geralmente, por indu¸cão

F (j )
(τ ) =
 ∞
(ix2 )j f (x)eiτ x dx.
2

−∞
Note que dependendo de f o termo π(i/2)k f(2k(0)
√ 2k

)!! pode ser qual-


quer coisa. De qualquer modo através de (1), no caso φ(x) = x2 , fo-
mos capazes de caracterizar o comportamento assint´otico de F para
τ grande.
Vamos apresentar a seguir, a tı́tulo de ilustração, um exemplo
que embora não seja exatamente o caso considerado acima d´a a idéia
exata das questões que desejamos analisar aqui.
O caso que vamos apresentar a baixo tem a vantagem de utilizar
apenas resultados elementares de C´alculo Diferencial e Integral.
Considere a fun¸cão F (τ ) tomando valores reais como fun¸ cão da
variável τ (vamos estar interessados apenas em valores grandes de τ ):
∞ e −τ x
F (τ ) = dx.
 0 1+x
Note que F (τ ) vai a zero quando τ vai a infinito.
Note que a principal diferen¸ca do caso acima para o caso anteri-
ormente considerado da fase estácionária (consideramos agora o caso
particular que corresponde na nota¸cão anterior a f (x) = 1/(1 + x) e
φ(x) = x), é que consideramos e−τ x e não e−iτ x ; no entanto as idéias
básicas que funcionam num caso funcionam no outro.
Vamos mostrar que tal fun¸cão F para valores grandes de τ pode
ser aproximada por uma série de potências que tem uma expressão
bem simples:
∞ ( 1)n n! −
.
τ n+1
n=0

Observe que tal série não é convergente!!! A utilidade de consi-
derar tal série deriva do seguinte fato: F (2) é mal aproximado por
 ∞ (−1)n n! , mas F (10) (neste caso τ = 10 pode ser considerado
n=0 2n+1
grande) é aproximado com erro percentual de menos de 0, 0006 por
 3 (−1)n n! ∞ (−1)n n! são 
n=0 10n+1 , ou seja os primeiros três termos de n=0 10n+1
3 (−1)n n!
|
tais que n=0 10n+1 −
F (10) |≤
F (10)0, 0006.
214 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Desejamos enfatizar que estamos dizendo acima que F (τ ) é apro-


(−1)n n!

ximado por ∞ n=0 τ n+1 apenas para valores grandes de τ !!!
A seguinte defini¸cão para F tomando valores reais é análoga a
anteriormente considerada para F tomando valores complexos.
Definição 11.4. Dizemos que ∞ g (τ ) converge assintoticamente
0 k


a F (τ ) R, quando τ vai a infinito, se fixados quaisquer r, s, existe
M tal que para m fixo, m M ≥

m
dr F (τ )  dr gk (τ ) s
| dr τ
− dr τ
τ|
k=0

é limitada quando τ . →∞
Neste caso dizemos que
∞
F (τ ) ∼ gn (τ ).
n=0

Existe uma diferença fundamental entre séries convergentes


n
n=0 an τ n
 ∞
n=0 an τ ∼= G(τ
F (τ )).e séries assintóticas, quando τ vai a infinito,
 N n
No primeiro caso, dado ǫ e τ , existe N tal que | a τ − n=0 n
G(τ )| < ǫ, enquanto no segundo caso, dado ǫ e N existe K > 0 tal
que |
 N n N
a τ − F (τ )| < ǫτ − para τ > K . Note que o K depende
n=0 n
de ǫ e N ; estamos considerando na aproxima¸cão um erro percentual
que leva em conta a grandeza do valor de τ utilizado.
Sendo assim, o que ocorre de fato no caso nas séries assintóticas,
é que para τ fixo a proximação é boa para N pequeno, mas fica ruim
para N de ordem maior que τ .
n
No nosso caso gn (τ ) = (−τ 1)
n+1
n!
e afirmamos que
∞ ( 1)n n!
F (τ ) ∼ −
n=0
τ n+1 ,

Vamos elaborar um pouco sobre o sentido do ∼; mais exatamente


vamos considerar a questão apenas para r = 0.
Ora,
N N
1 − (−1) x
=1 − x + x −··· 2
+ ( 1)N −1 xN −1 ,

1+x
215

portanto, para todo x


N −1
1 − ( 1)N xN

= ( 1)n xn + .
1+x 0
1+x
Usando a expansão acima na forma integral de F obtemos

− N −1 ( 1)n n!  ∞ e−τ x xN
F (τ ) = + ( 1)N
− dx.
n=0
τ n+1 0 1+x
Note que a parte esquerda do somat´ orio acima coincide com os
 (−1)n n!
primeiros N termos de ∞ n=0 τ n+1 , sendo assim o erro na aproxi-
 n

mação de F por n=0 (−τ 1) n!

n+1

EN (τ ) = ( 1) − N
 ∞ e −τ x x N
dx,
0 1+x
logo

|E N (τ ) |=
 ∞ e−τ x xN
dx <
 ∞ e−τ x xN
dx =
N!
,
0 1+x 0 1 τ N +1

Visto de outro modo


N 1
− − ( 1)n n!
N +1
|F (τ ) − τ n+1
|τ ≤ N!
n=0

e N ! é uma constante.
Sendo assim, na Defini¸cão 11.4, dado s = N + 1 devemos escolher
M = N . Note que para s = N + 1 fixado, a constante N ! é muito
grande (se N é grande) mas fixa.
Acreditamos que com o exemplo acima ficou claro o sentido da
afirmação
∞ ( 1)n n! −
F (τ )
τ n+1
, ∼
n=0
216 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

11.3 Fase não degenerada

Voltamos agora a considerar o caso em que F toma valores com-


plexos.
Vamos considerar agora o caso em que φ(x) possui v´arios pon-

tos crı́ticos
disjuntas pontos pp1i,.p2 ,... . Sejam Vi respectivamente vizinhanças
dosisolados
Considere Um coleção de abertos tal que m,i Um ∪
Vi = R, tal ∪
que pi não está em nenhum Um e ainda que a cobertura de R seja
localmente finita.
Seja θm , ǫi uma partição da unidade subordinada a parti¸cão. Es-
tamos usando a nota¸cão que θm tem suporte em Um e ǫi tem suporte
em Vi .
Sendo assim

F (τ ) =
 ∞
θm (x)f (x)e iτ φ(x)
dx +
 ∞
ǫm (x)f (x)eiτ φ(x) dx.
m −∞ m −∞
Observamos que ambas as somas são finitas e que basta pela Pro-
posição 11.2 examinar
 ∞
ǫm (x)f (x)eiτ φ(x) dx.
m −∞
ou seja, basta examinar individualmente

H (τ ) =
 ∞
f (x)eiτ φ(x) dx
−∞

quando o suporte de f está em um intervalo ( δ, δ ) e 0 é ponto cr´ıtico
isolado de φ (podemos transladar o problema e colocar o ponto crı́tico
no ponto 0).

umaNo caso emdeque


mudança 0 é não degenerado
coordenadas local x =φx(y)
′ (0) = 0 , φ′′ (0) = 0), existe
tal que φ(x(y)) = y 2 . 
Neste caso recaı́mos na Proposição 11.3, pois

H (τ ) =
 ∞
f (x)eiτ φ(x) dx =
 ∞ 2
f (x(y))eiτ y x′ (y)dy
−∞  −∞ (11.1)

iτ y 2
= g(y)e dy.
−∞
217

Vamos considerar com mais detalhe agora o caso em que todos


os pontos crı́ticos de φ são não-degenerados. Neste caso, temos que
escolher com mais cuidado os intervalos abertos Um , Vj .
É claro que φ(x) φ(pj ) = (x pj ))2 ψj (x), onde ψj é anal´ıtica e
− −
ψj (pj ) = 12 φ′′ (pj ). Seja µj = sgnφ′′ (pj ). Definimos a nova vari´avel

y = (x −p ) j
 µj ψj (x)

na vizinhança de pj . Temos

dy
(pj ) > 0.
dx

Tomamos Vj = (pj δj , pj + δj ) tal que seja v´alida a mudan¸ca de
variável neste intervalo. Depois escolhemos os Um tais que

Um
∩ pj − δj
, pj +
δj

2 2

seja vazio para todos m e j. Nestas condi¸cões:

 + ∞
ǫj (x)f (x)e iτ φ(x)
dx =
 pj +δj
ǫj (x)f (x)eiτ φ(x) dx =
−∞ pj δj

= eiτ φ(pj )
 p j +δ j
ǫj (x)f (x)eiτ (φ(x)−φ(pj )) dx =
pj δj

= eiτ φ(pj )
 y (pj +δj )
ǫj (x(y))f (x(y))eiµj τ y
2 dx
dy =
y (pj δj )
− dy

  +
∞ ǫ (x(y))f (x(y)) dx eiµj τ y dy,  2
= eiτ φ(pj ) j
−∞ dy
onde ǫj (x(y)) = 1 na vizinhan¸ca de 0. Seja:

d2k f (x(y)) dx

dy
cjk = (0).
dy2k
218 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Observamos que os cjk podem ser efetivamente calculados porque


as derivadas de x(y) calculam-se derivando sucessivamente a identi-


dade y = (x pj ) µj ψj (x) respeito de y.

1o¯ caso) φ′′ (pj ) > 0. Neste caso, µj = 1. Pelo visto antes,

 ∞+ dx √ π +∞ i
ǫj (x(y))f (x(y)) eiτ y dy ∼ πei
2
4
  k cjk −k− 12
τ .
−∞ dy 2 (2k)!!
k =0

2o¯ caso) φ′′ (pj ) < 0. Neste caso, µj = −1. Observemos que:
 + ∞
g(y)e−iτ y dy =
2
 +∞
ḡ(y)eiτ y2 dy
−∞ −∞
para toda g ∈ C0∞ (IR). Então,
+ ∞ + ∞ k
ǫj (x(y))f (x(y))
dx −iτ y2
dy
e dy ∼ √πe− iπ
4 − 2i cjk −k− 1
(2k)!!
τ 2.

 −∞ k=0
 
Finalmente,
 + ∞
f (x)eiτ φ(x) dx ∼
−∞
√      + ∞ i k
π
i4 iτ φ(pj ) π
  1
τ −k − 2
∼ π e e cjk +(−1) e−i k 4 e iτ φ(pj )
cjk .
2 (2k)!!
k=0 φ′′ (pj )>0 φ′′ (pj )<0

Por definição

dx dy
  −1 f (p j )
√2f (p )
j
cj 0 = f (pj ) (0) = f (pj ) (p j ) = =
dy dx µj ψj (pj ) |φ′′(p )| .j

Logo, da anterior resulta:  


 + ∞
f (x)eiτ φ(x) dx =
−∞
√  ei(τ φ(pj )+ 4 )
π
√ ei(τ φ(pj )− 4 ) − 12
  π

= |2π f (pj ) + 2π f (pj ) τ +0(τ −1 )
φ′′ (pj )>0
φ ′′ (pj ) |φ′′ (p )<0 j
| φ ′′ ( p j ) |
219

para τ → ∞
+ .
Fica então determinado o termo dominante de F (τ ) como o termo
1
a esquerda da ´ultima linha (vai a zero como τ − 2 ).

11.4 Aplicação às integrais de Airy generalizadas


Seja
F (τ ) =
 + ∞
eiτ φ(x) dx
−∞
onde φ(x) é um polinômio, a coeficientes reais, do qual todos os pon-
tos crı́ticos são não degenerados e cujo grau é n 2. ≥
Lema 11.1. A integral precedente converge para todoτ ∈ IR, τ > 0
e define uma fun¸c˜ao C ∞ de τ em (0, + ). ∞
Seja I um intervalo que contém no seu interior todas as raı́zes de

φ(x),
g(x) =φ 1(x) fe(x).
′ − φ′′ (x). Seja f ∈ C ∞(IR) tal que f (x) = 1 se x ∈ I . Seja
0

Então
 + ∞
eiτ φ(x) dx =
 + ∞
f (x)eiτ φ(x) dx +
 + ∞
g(x)eiτ φ(x) dx.
−∞ −∞ −∞
Como f tem suporte compacto o Lema 11.1 segue imediatamente
do lema seguinte, que provaremos depois.

Lema 11.2.  + ∞
g(x)eiτ φ(x) dx,
−∞
τ > 0, converge e define uma fun¸c˜
ao C ∞ de τ que tem decrescimento
r´apido para τ + .→ ∞
O Lema 11.2 nos diz também, que para ter o desenvolvimento
assintótico de F (τ ) basta ter o de
 + ∞
f (x)eiτ φ(x) dx.
−∞
220 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Mas este ´ultimo se calcula como antes, observando ainda que f = 1


na vizinhança de cada ponto crı́tico de φ.
Vamos aplicar o anterior `a função de Airy
+ ∞
1 1 3
Ai(t) = cos ω + tω dω
2π 3

e estudar seu comportamento para t



−∞
. → ±∞
 
Consideremos primeiro para t . → −∞
Então consideramos, para t → ∞
+ , a fun¸cão:


G(t) = Ai( t) =
1 +∞ 
cos
 1 3
ω − tω
 dω.
2π −∞ 3
2
Mudando de vari´avel: t = τ 3 obtemos
2
F (τ ) = G(τ ) =
3
1 +∞
cos
  1 3
ω −τ 2
3

ω dω.
2π −∞ 3
1
Mudemos agora a vari´avel de integra¸cão: ω = τ 3 (1 + x):

F (τ ) =
1 
τ 3 +∞ 1

cos τ (1 + x)3 τ (1 + x) dx −

2π −∞ 3

=
τ3
1 +∞
cos
1 3
x + x2−
2
τdx.
2π −∞ 3 3

Logo,

F (τ ) =
τ3
Re
1
+∞ iτ
e
   1
3
x3 +x2 − 2
3
dx
2π −∞
e estamos no caso anterior com:
1
φ(x) = x3 + x2
3
− 23 .
Os pontos crı́ticos são p1 = −2 e p = 0. Temos que:
2

2 2
φ(p1 ) = , φ′′ (p ) = −2, φ(p ) = − , φ′′ (p ) = 2.
1 2 2
3 3
221

Obtemos:

 √ i
  − 2
3
τ+ 4π
− i
 2
3
τ π
4 
F (τ ) =
τ
1
3
Re 2π
e
√2 √
+ 2π
e
√2 1
τ − + 0(τ −1 )
2

1 1
= π − 2 τ − 6 cos
 2τ − π4  + 0(τ − 3 )
2

Logo,  
2
G(t) = π − t− cos
1
t
2
1
4

3
3
2 − π4 + 0(t−1 )

resultado que melhora o de Olver página 103 mas que resulta também
de Olver página 392.
O mesmo método aplicado a Ai(t) para t + mostra que → ∞

Ai(t) 0 para t + . → ∞
Prova do Lema 11.2 . Vamos notar Ck∞ (IR) os espa¸co das fun¸cões
C ∞ f : IR C
I tais que, para todo j = 0, 1, , vale
→ ···
dj f
= 0( x −k ) ||
dxj
para x → ±∞ .
Por exemplo, se f ∈ C ∞ (IR) e se existe K > 0 tal que

p(x)
f (x) =
q (x)

| |≥| |
se x K , onde p, q são polinˆomios e (grau q -grau p) k, então ≥
f Ck∞ (IR).

Além disso, se f Ck∞ ((IR) e p(x) é um polinômio de grau m k
∈ ∈
então p(x)f (x) Ck∞−m ((IR). ≤
Afirmação: Para cada k = 1, 2, 3, ··· existe h ∈ C ∞ (IR) tal que
k
 + ∞
g(x)eiτ φ(x) dx = µ(τ )
 + ∞
h(x)eiτ φ(x) dx
−∞ −∞
(τ > 0) onde µ(τ ) = cte .τ −r com r ≥ k.
222 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Com efeito,
 + ∞
g(x)eiτ φ(x) dx =

1 +∞ g(x) iτ φ(x)
e iτ φ′ (x)dx
−∞ iτ −∞ φ′ (x)

g(x)
C ∞ (IR)
 φ′ (x) ∈ 
porque g é nula sobre um aberto que contém os zeros de φ′ . Logo,

 + ∞
g(x)e iτ φ(x)
dx =

1 g(x) iτ φ(x)
e +
i +∞
 + ∞
g1 (x)eiτ φ(x) dx

−∞ iτ φ′ (x) −∞ τ −∞
onde
p(x)
g1 (x) =
q (x)
||
para x bastante grande, com p, q polinômios e grau q -grau p = n
(lembremos que ( g(x) = 1 para x bastante grande). Logo, como

||
g(x) = 1 para x bastante grande e grau φ′ 1,
+ ∞
g(x)eiτ φ(x) dx =
||
i
 + ∞

g1 (x)eiτ φ(x) dx
−∞ τ −∞
onde g1 (x) ∈ Cn∞ (IR). Iterando este procedimento, decorre a afirmação.
Da afirmação com k = 2, j´a resulta que
 + ∞
g(x)eiτ φ(x) dx
−∞
é convergente e define G : (0; + ) CI . ∞→
Seja dado m(= 0, 1, 2,... ). Tomamos k > mn +2. Pela afirma¸cão:
+
G(τ ) = µ(τ )  ∞ h(x)eiτ φ(x) dx
−∞
onde a integral converge absolutamente, junto com todas as suas
derivadas respeito de τ até a ordem m. Como µ(τ ) = constante τ −r

com r k, decorre daı́ que G(τ ) é derivável até a ordem m e
dj G
= 0(τ −k )
dj τ
223

para 0 ≤ j ≤ m. Como m é arbitrário, G ∈ C ∞ (0, +∞) e G ∼ 0.

11.5 Fase com Pontos de Cáustica

O anterior d´a conta do caso em que os pontos crı́ticos s˜ao n˜ao


degenerados.
Supondo, por outro lado, que o ponto crı́tico seja degenerado
(cáustica), existe uma mudança de coordenadas local tal que φ(x(y)) =
ym , m 3.≥
Vamos portanto analisar o caso φ(x) = xm , m 3 (o caso φ(x) = ≥
m
− x é obtido a partir deste por conjugação).
Vamos assumir inicialmente, para simplificar, que f possa ser es-
crito como f (x) = xk g(x), onde g é constante igual a 1 numa vizi-
nhança de 0.
Como φ(x) = xm , m 3, temos então para cada k fixo que que

∞ ∞
k iτ xm iτ xm
Fk (τ ) = −∞ x g(x)e
 dx = −∞ f (x)e
 dx

satisfaz

Fk′ (τ ) =
 ∞ m
ixm f (x)eiτ x dx = 1/(mτ )
 ∞
(xf (x)) (ixm−1 mτ eiτ x )dx.
m

−∞ −∞
Integrando por partes,

F ′ (τ ) = −1/(mτ )
k
 ∞ m
(xf (x))′ eiτ x dx =
−∞
∞ m
∞ m
1/(mτ ) f (x)eiτ x dx 1/(mτ ) xf ′ (x) eiτ x dx =
−  −∞ −   ∞
−∞
m
−1/(mτ )F (τ ) − 1/(mτ )
k xf ′ (x) eiτ x dx.
−∞
Ou seja,

mτ F ′ (τ ) + Fk (τ ) = −
k
 ∞ m
xf ′ (x) eiτ x dx.
−∞
224 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Ora,

xf ′ (x) = kxk g(x) + xk+1 g ′ (x) = kf (x) + xk+1 g ′ (x).

Como 0 n˜ao está no suporte de g ′ (x), a Proposi¸cão 11.2 nos diz


finalmente que mτ Fk′ (τ ) + (k + 1)Fk (τ ) é de decrescimento rápido.
Como Fk está ı́mplicito na última equação,
∞ n˜ao sabemos
m  ainda
determinar o assint´otico de Fk (τ ) = −∞ xk g(x)eiτ x dx, onde g é
constante igual a 1 numa vizinhan¸ca de 0, mas sabemos que satisfaz
mτ Fk′ (τ ) + (k + 1)Fk (τ ) 0. Vamos a seguir determinar o assintótico

de Fk (τ ), mas antes precisamos uma defini¸cão que vai contemplar a
possibilidade de termos o conceito de uma série não convergente ser
solução de uma equa¸cão diferencial (no sentido assint´otico).
Definição 11.5. Sejam p0 (τ ), p1 (τ ),..,p n (τ ) polinˆ omios. Dizemos
que a fun¸c˜ao C ∞ , y(τ ), é soluç˜ao da equaç˜ao diferencial assint´otica
linear
dn y(τ ) dy(τ )
pn (τ ) n
+ ... + p1 (τ ) + p0 (τ )y(τ ) 0,

se dτ dτ ∼
n j
 d y(τ )
pj (τ )
j =0
dτ j

é de decrescimento r´
apido.
A partir da defini¸cão acima note que as considera¸cões feitas ante-
riormente mostram que Fk (τ ) é solução de
dy(τ )


+ (k + 1)y(τ ) ∼ 0,
ou equivalentemente
dy(τ )
mτ + (k + 1)y(τ ) = b(τ )

onde b(τ ) é de decrescimento rápido.
Uma solução particular da equa¸cão acima é

y(τ ) =
−1 τ − (k +1)/m
 ∞
x(k+1−m)/m b(x)dx
m τ
225

que é de decrescimento rápido.


A solução geral é cτ −(k+1)/m + y(τ ).
Decorre daı́ que existe constante ck tal que Fk (τ ) é assintotica-
mente equivalente a
ck τ −(k+1)/m . (11.2)

Concluı́mos portanto a análise do assint´otico de

Fk (τ ) =
 ∞
xk g(x)eiτ x dx
m

−∞
no caso em que g é constante igual a 1 numa vizinhança de 0. O valor
das constantes ck devem ser determinados em cada caso.
Vamos agora analisar o caso um pouco mais geral de f (x) =
xk g(x) (sem hip´oteses sobre g) com g qualquer em C0∞ , mas para
isto precisamos antes da seguinte:

Proposição 11.4. Dado g ∈ C ∞ e N ≥ 0 existe K ≥ 0 tal que


0

j j
τ N d j ∞ xk g(x)eiτ xm dx = τ N d j ∞ f (x)eiτ xm dx
 
dτ −∞ dτ −∞

→ ∞ e para todo j se k ≥ K .
é limitada para τ
Demonstração: Se k ≥ m, integrando por partes temos
 ∞ m
xk g(x)eiτ x dx = 1/(miτ )
 ∞ m
xk−m+1g(x)iτmxm−1 eiτ x dx =
−∞ −∞

−1/(miτ )
 ∞
(xk−m+1g(x))′ eiτ x dx
m

−∞
k m+1 k m
eiterar
(x −o c´alculo.
g(x))′ =Ox resultado
− h(x) onde
segueh(x)
de está em aC0∞
derivar , o queao
express˜ permite
v´arias
vezes. 

O caso em que φ(x) é anal´ıtica (não s´o da forma xm ) é obtido


a partir da proposi¸cão 4 e através de mudança de variável como em


(2) acima. Isto d´a conta do caso F (τ ) = −∞ xk g(x)eiτ φ(x) dx com
g C0∞ .

226 [CAP. 11: O M ÉTODO DA FASE ESTACIONÁRIA

Vamos agora, finalmente, analisar o caso mais geral de um f (x) 



qualquer e φ(x) analı́tica, isto é, o caso F (τ ) = −∞ f (x)eiτ φ(x) dx

com f C0 .∞
Escreva

f (x) = a0 + a1 x + a2 x2 + ... + ak 1x
k 1
− + xk g(x)

onde g C0∞ .

Podemos substituir na an´alise f (x) por f (x)h(x) onde h(x) tem
suporte em uma pequena vizinhan¸ca de 0 (usando uma parti¸cão da
unidade) ou seja, basta analisar o assint´otico de

F (τ ) =
 ∞
h(x)(a0 +a1 x+a2 x2 +...+ak−1 xk−1 +xk g(x))eiτ φ(x) dx =
−∞
 ∞
(h(x)a0 +h(x)a1 x+h(x)a2 x2+...+h(x)ak−1 xk−1+xkh(x)g(x))eiτ φ(x)dx.
−∞
Para o assintótico dos primeiros term os usamos (3) e para o termo
 ∞
xk h(x)g(x)eiτ φ(x) dx
−∞
usamos a Proposi¸cão 11.4. 

Resulta portanto que para F (τ ) = −∞ f (x)eiτ φ(x) dx com f ∈

C0 . existe desenvolvimento assintótico da forma
∞
F (τ ) = ck τ −(k+1)/m .
k =0

O primeiro valor ck não nulo do desenvolvimento acima, carac-


teriza o termo principal de decaimento de F (τ ) quanto τ , ou
seja ck τ −(k+1)/m é o termo principal do ponto de vista assintótico. →∞
O valor de tal k é denominado de expoente inicial ou invariante de
Malgrange. Referimos o leitor para [8] onde são apresentadas consi-
derações gerais sobre tal invariante.
O texto acima ilustra de maneira breve a fundamentação matemá-
tica da teoria das séries de potências não convergentes e sua rela¸cão
com as integrais oscilantes e ´otica.
Capı́tulo 12

Apêndice - Aplicação de
Primeiro Retorno para
Equações Diferenciais
Ordinárias

Considere uma equa¸cão diferencial ordin´aria x′ = f (x) definida para


x num aberto A em que f é de classe C 1 . Vamos supor que as soluções
x(t) estão sempre definidas para todo t real. Por defini¸cão, para t fixo,
φt (x) = y quando a solu¸cão x(t) de x′ (t) = f (x(t)), x(0) = x é tal
que x(t) = y.
Podemos considerar ent˜ao o fluxo φt : A → A, para todo t real.
φt é um difeomorfismo de A em A.
Recomendamos o leitor a [DL] e [So] para resultados gerais sobre
equações diferenciais ordin´arias e sistemas Hamiltonianos.
Uma solução x(t) de x′ = f (x) é dita periódica se existe t > 0 tal
que x(t) = x(0), ou seja φt (x) = x. Fica assim determinada a ´orbita
{ | ∈
periódica γ = φs (x) s [0, t) .}
Uma seção local de x, é um conjunto V obtido pela interse¸cão de
n
um hiperplano de dimens˜ao n 1 V − ⊂ R (um espaço afim n − 1

227
228 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.1:

dimensional) passando por x, com uma vizinhan¸ca U Rn de x




(V = H U ), tal que f (y) ∈H (colocando a srcem do vetor no
∀ ∈
ponto y, conforme figuras 12 e 13), y V = H U . ∩
Observação 12.1. Se V seç˜
ao local em x, ent˜ao os vetores f (y) = 0 
para todo y em V .


Seja γ uma ´orbita peri´odica de perı́odo t0 e V = H U seção

local passando por x γ . Podemos definir a aplic ação T de V em

H , que associa v V a y = T (v) tal que y é o menor valor t > 0,

tal que φt (v) H . Note que T (x) = x = φt0 (x). Logo como φt (x) é
cont´ ınuo em t e em x então T está bem definido para V seção local
pequena passando por x (ver Figuras 29 e 30).
Se T (x) = x dizemos que x é ponto fixo de T .
A aplicação T é denominada de aplicação de primeiro retorno da
seção local V . A aplicação de primeiro retorno permite analisar o
comportamento das ´orbitas vizinhas de γ .
Note que os tempos de primeiro retorno de pontos em x(t) (de-
finido γ ) e de outras solu¸ cões y(t) pr´oximas (começando na se¸cão
229

Figura 12.2:

V ) não s˜ao os mesmos (apenas aproximadamente os mesmos pela


continuidade do fluxo)

De fato, por exemplo se T (v) = v para todo v V , conclu´ımos

que todas as ´orbitas de x = f (x) que passam por V são periódica.
Vamos supor definida uma aplica¸cão diferenciável z(u) = v defi-
n−1 n
nida num aberto u Ṽ∈ ⊂ R ∈ ⊂
bijetiva sobre v V R . Assim,
podemos expressar T nas novas coordenadas u como T̃ : Ṽ → Ṽ
como T̃ (u) = z −1 ( T (z(u)) ). Podemos supor sem perda de generali-
dade que z(0) = x. Quando falarmos da a¸cão de T em V , estaremos
na verdade falando da a¸ cão de T̃ em Ṽ e quando falarmos em x
estaremos nos reportando ao u = 0.
Nas Figuras 12.1 e 12.2 mostramos um exemplo em que o campo
de vetores está definido no plano e portanto H tem dimensão 1.
A razão para tudo isto é que podemos falar agora na derivada
DT (v) da fun¸cão T . Para sermos absolutamente precisos deverı́amos
230 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.3:

falar da derivada D T̃ (u) de Rn−1 mas módulo a identifica¸cão acima


não vamos mais a partir de agora destacar tal diferen¸ ca.
Na Figura 12.4 as ´orbitas em torno de γ tem uma tendência a se
afastarem de γ .
Note na Figura 12.3 que as ´ orbitas em torno de γ tem uma
tendência a se aproximarem de γ .
Por sua vez, na Figura 12.5 as ´ orbitas em torno de γ tem uma
tendência a se afastarem de γ por uma lado e a se aproximarem de
γ por outro lado.
Este comportamento é capturado pela aplicação de primeiro re-
torno T . A Figura 12.6 ilustra a aplica¸ cão de primeiro das equa¸cões
diferenciais que tem como espa¸co de fase respectivamente as Figuras
12.3, 12.4 e 12.5.
Note a posição do gráfico de T em relação a diagonal ∆ na Figura
12.6.
231

Figura 12.4:

O ponto fundamental é que não pode ocorrer o que aparece na


Figura 12.7, pois os vetores f (x) sempre apontam para o mesmo lado
(ver Figura 12.8).
Definição 12.1. Se a derivada DT (x) da aplicaç˜ ao de primeiro re-
torno T (associada ao ponto fixo x) definida na se¸c˜ao local V da
´orbita γ tiver todas as raı́zes do polinˆ
omio caracter´
ıstico com m´ odulo
menor que 1, ent˜ao a trajet´oria γ é chamada de orbita
´ peri´odica atra-
tora.
Teorema 12.1. Se x é tal que a derivada DT (x) da aplicaç˜ ao de
primeiro retorno T (associada ao ponto fixo x) definida na se¸c˜ao
local V da ´orbita γ tiver todas as raı́zes do polinˆ
omio caracter´ıstico
com m´odulo menor que 1, ent˜ao a iteraç˜ao T n (v) = xn de um ponto

v H converge ao ponto fixo x quando n vai a infinito.
Demonstração: Como o fluxo é de classe C 1 (pois o campo é de
classe C 1 ) pode-se mostrar que a matriz derivada DT (v) varia conti-

nuamente com v V . Desta maneira, para uma vizinhan¸ca pequena
| | ∈
B de V , DT (v) < c < 1 para todo v B. Logo p ela desigualdade
| − | |−|
do valor médio (ver [Li1]) T (x) T (v) < c x v (T é uma contração
232 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.5:

Figura 12.6:
233

Figura 12.7: A figura descrita acima não pode ocorrer de Γ é uma


seção transversal

quando definida numa pequena vizinhança M de x conforme definição


que aparece no Capı́tulo 3). Sendo assim, como T n (x) = x, por
indução x T n (v) < cn x v e concluı́mos que T n (v)
| − | | −| →
x quando
n →∞ .
No caso f bidimensional e portanto T unidimensional a condi¸cão

| |
acima significa apenas que T (x) < 1. Neste caso, as ´orbitas das
soluções da equa¸cão diferencial que cortam V se aproximam de γ
conforme o teorema acima.

O papel
retorno dos autovalores
T (associada da matriz
a uma órbita DT da
periódica) aplicação
serem de primeiro
em módulo menor
que 1 desempenha um papel an´alogo ao dos autovalores da derivada
DF do campo de vetores F no caso de pontos de equilı́brio.
Se todos autovalores de DT tem módulo menor que 1 ent˜ao pode-
mos dizer que γ se comporta assim como uma espécie de “poço” (em
analogia com pontos de equilı́brio tipo poço) atraindo as trajet´orias
(com tempo crescente) com condições iniciais em um aberto pr´oximo
234 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

de si. Tal γ é um exemplo do que se chama um atrator periódico em


equações diferenciais.
Definição 12.2. Se a derivada DT (x) de T em x (ponto fixo de
T ) tiver todas raı́zes do polinˆ
omio caracterı́stico maiores que 1, a
trajet´
oria γ é chamada de orbita
´ peri´odica repulsora.
No caso unidimensional a condi¸ cão acima significa apenas que

|T (x)| > 1.
Nesse caso, as órbitas das solu¸cões da equa¸cão diferencial que
cortam V se afastam de γ . Podemos dizer que γ se comporta como
uma espécie de ”fonte”(em analogia com pontos de equilı́brio tipo
fonte) repelindo (com o tempo crescente) as trajetórias com condições
iniciais próximas de si . Tal γ é um exemplo do que se chama um
repulsor em equa¸cões diferenciais.
O papel da se¸ cão local é basicamente discretizar o tempo. A
dinâmica de φt (x) em tˆorno de γ pode ser analisada pela dinˆamica
de T n (v) na se¸cão local.
Note por exemplo que apenas partir do gr´ afico T do último caso
da 12.5 podemos deduzir que neste caso as trajet´ orias das solu¸cões
perto de γ se aproximam por um lado e se afastam pelo outro. Tudo
isto segue apenas da an´alise da seção local e da aplica¸cão de primeiro
retorno. Note que neste caso T ′ (x) = 1.
Se o fluxo preserva ´area então n˜ao pode ocorrer nem 12.4 nem
12.3.
Outra maneira de discretizar o tempo é considerar φ1 (y) = F (y).
F como vimos é um difeomorfismo e podemos obter várias proprie-
dades de φt (x) através dos iterados F n (x) = φn1 (x) = φn (x).
Este ponto de vista de analisar a dinˆ amica de uma equa¸cão dife-
rencial através de uma seção local T ou de um difeomorfismo F , tem
produzido uma série de resultados importantes na Teoria dos Sistema

Dinâmicos. O tempo
A hipótese torna-se uma
de os autovalores davari´avel discreta
aplica¸cão e n˜ao retorno
de primeiro cont´
ınua.
T
em x terem todos módulo menor que 1 desempen ha no caso de órbitas
periódicas uma papel an´alogo a hip´otese de todos os autovalores de
Df (x0 ) terem parte real negativa quando x0 é de equil´ıbrio.
Antes de prosseguirmos desejamos enfatizar que numa seção trans-
versal Γ local os vetores f (v) (com v ∈Γ) apontam todos sempre
para um mesmo lado. Sendo assim as traje t´orias soluções x(t) da
235

Figura 12.8:

equação diferencial x′ = f (x) que batem na se¸cão Γ entram sempre


pelo mesmo lado e saem pelo outro . Mais exatamente, “n˜ao” pode
ocorrer algo do tipo descrito pela Figura 35.
A Figura 12.13 descreve o que deve ocorrer em duas batidas sub-
sequentes numa seção transversal T da trajet´oria x(t) solu¸cão da
equação diferencial.
Podemos considerar a partir de um Hamiltoniano H (p, q ) definido
em R2n tomando valores reais a equa¸cão de Hamilton (Defini¸cão 3,
Capı́tulo 3 [L]). Obtemos assim uma EDO em R2 n . Os conceitos
descritos acima podem ser aplicados neste caso.
Vamos agora descrever brevemente como pode ser rico o compor-
tamento dinâmico das trajet´orias do fluxo de uma equa¸cão diferencial
autônoma em torno de uma ´orbita periódica. Referimos o leitor para
[DL], [PM] e [R] para demonstra¸cão dos resultados que vamos consi-
derar a seguir. Nosso objetivo nesta se¸cão é t˜
ao somente ilustrar com
figuras alguns dos comportamentos que caracterizam tais sistemas
em R3 .
236 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Considere uma se¸cão transversal P passando por z0 = z(t0 ) per-


tencente a uma trajet´oria peri´odica z(t) Rn de uma equa¸cão di-

ferencial de primeira ordem x′ = G(x) (neste caso o vetor tangente

z (t0 ) não está em P ). Na Figura 12.9 mostramos a aplica ção T in-
duzida por P de primeiro retorno no caso do R3 . Esta transforma¸cão
T : P P de primeiro retorno esta definida localmente em uma

vizinhança V em torno de z0 , de tal jeito que para y ∈ ⊂
V P ,

T (y) = x(t1 ) P , onde t1 é o valor do tempo na primeira vez que a

trajetória x(t) (solução de x = G(x) tal que x(0) = y) retorna a P .
O plano P é chamado de seção transversal em z(t0 ).

Figura 12.9:

Vamos considerar a seguir especificamente o caso tridimensional,


ou seja a aplica¸cão T de primeiro retorno para z(t), órbita periódica

para x = G(x), G : R3 → R3 , como mostra a Figura 12.9 ou 12.10.
O comportamento das trajet´orias em torno da ´orbita peri´odica
pode ser analisado através da aplicação T definida em uma vizinhança
de z0 = z(t0 ) em P , onde neste caso P é um plano bidimensional.
Note que T é um difeomorfismo local em torno de z0 = z(t0 ) P . ∈
237

Note também que z0 é ponto fixo para T , isto é, T (z0 ) = z0 .

Definição 12.3. Dizemos que a ´orbita peri´ odica z(t) R3 é hiper-



b´olica, se DT (z0 ) tem todos autovalores reais (no caso s˜ao dois) com
m´odulo diferente de 1. O ponto z0 ser´a dito ponto fixo hiperb´olico
para a aplicaç˜ao T de primeiro retorno.

Definição 12.4. Dizemos que a ´orbita peri´odica z(t) R3 é el´ıptica,



se DT (z0 ) tem os autovalores (no caso s˜ ao dois) com m´odulo igual
a 1. O ponto z0 ser´a dito ponto fixo elı́ptico para a aplicaç˜ao T de
primeiro retorno.

Os dois casos acima descrevem situações excludentes e que cobrem


todas as possibilidades (note que se os dois autovalores s˜ ao igual a 1,
dizemos que o ponto é el´ıptico)

Figura 12.10:
238 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.11:

Definição 12.5. O conjunto est´avel de z0 , ponto fixo hiperb´olico para



T de primeiro retorno a P , é o conjunto dos pontos y P tal que

lim T n (y) = z0 .
n →∞
Este conjunto é denotado por γe (z0 ).
Definição 12.6. O conjunto inst´avel de z0 , ponto fixo hiperb´olico
para T de primeiro retorno a P , é o conjunto dos pontos y P tal
que
lim T n (y) = z0 .

n→−∞
Este conjunto é denotado por γi (z0 ).
Na Figura 12.9 mostramos a posi¸cão dos dois conjuntos em torno
do ponto hiperbólico z0 . É possı́vel mostrar para z0 hiperbólico que
quando a matriz DT (z0 ) possui um autovalor real maior que 1 outro
239

real menor que 1 (ver [PM], [Ro2]) ent˜ao os conjuntos γi (z0 ) e γe (z0 )
são realmente curvas passando por z0 e a dinˆamica em torno deste
ponto é descrita pela Figura 12.9. Mais exatamente, as condi¸cões
iniciais y
n
∈ γe (z0 ) convergem a z0 através da evolução temporal
T , n > 0 e as condi¸cões iniciais y ∈γi (z0 ) convergem a z0 para
a evolução temporal com tempo negativo T n (y), n < 0.

Figura 12.12:

Se z0 é tal que a matriz DT (z0 ) possui os dois autovalores com


módulo menor que 1 (ver [PM], [Ro2]), ent˜ ao a dinˆamica em torno
240 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

deste ponto z0 é descrita por um atrator (ver [DL]). Mais exatamente,


as iterações T n (z) para z condição inicial convergem a z0 .
Este fenômeno não ocorre num sistema Hamiltoniano autˆonomo
pois o fluxo preserva volume 2 n dimensional (Capı́tulo 3 [L]).

Figura 12.13:

É também possı́vel mostrar para z hiperbólico que quando a ma-


triz DT (z0 ) possui os dois autovalores0módulo maior que 1 (ver [PM],
[Ro2]), então a dinˆamica em torno deste ponto z0 é descrita por um
repulsor (ver [DL]). Mais exatamente, as iterações T −n (z), n > 0 de z
condição inicial convergem a z0 . As itera¸cões positivas T n (z0 ), n > 0,
saem de qualquer vizinhan¸ca de z0 para n suficientemente grande.
Pontos y fora de γe (z0 ) e fora de γi (z0 ) possuem a propriedade
que T n (y), para algum n positivo e para algum n negativo, v˜ ao sair
241

fora da vizinhan¸ca V em trono de z0 onde T pode ser definida.

Observação 12.2. E ´ possı́vel mostrar que a Figura 12.9 ilustra tam-


bém localmente o espaço de fase das itera¸c˜oes de K (x) = dT (z0 )(x)
(onde dT (z0 ) = DT (z0 ) é a matriz derivada de T ) em torno do ponto
fixo K (0) = 0 no caso hiperb´ olico. Mais precisamente, K n (y) para di-

ferentes y (condiç˜oes iniciais em uma vizinhan¸ca de 0 R2 ) também
tem uma evoluç˜ao temporal semelhante a Figura 12.9, que é a figura

da evoluç˜ao temporal em torno de z0 P do sistema n˜ao linearizado
T (x) : P→ P.

Em resumo, localmente em torno de um ponto hiperb´ olico z0 , a


dinâmica de T e de seu linerizado dT são semelhantes (ver [PM] e
[Ro2] para demonstra¸cão).
Na Figura 12.14 mostramos uma ´ orbita periódica em R3 em que
aparece o fenˆomeno da ferradura. Isto segu e do fato da varieda-
de estavel e variadade instavel de um ponto x0 se interceptarem.
Mostramos na Figura 12.15 como se comporta a transforma¸ cão de
Poincare T na seção transversal. Neste caso é possı́vel mostrar que
ocorrem infinitas ´orbitas periódicas para o campo de vetores. Mais
precisamente se mostra que existem infinitos pontos peri´odicos para
T de perı́odos arbitrariamente grandes (ver [Ro2]).
Este fenômeno descoberto por H. Poincaré no problema dos três
corpos teve grande impacto na Mecˆanica Clássica e na moderna Te-
oria dos Sistemas Dinâmicos. Ele ilustra a grande comp lexidade
dinâmica que ocorre nesta situa¸cão (ver[Ro2] para mais detalhes).
Nas Figuras 12.10, 12.11 e 12.12 mostramos um exemplo do que
pode acontecer em alguns casos para a evolu¸ cão temporal de pon-
tos elı́pticos. Cada ponto inicial y tem a tendência de rodar em
tôrno de z0 ao longo de sua evolu¸cão temporal T n (y), n > 0. Neste
caso, o comportamento de T é aproximadamente o comportamento
n
da evolução temporal de K (x), n > 0, onde K é a derivada de T em
z0 , K = dT (z0 ) da transforma¸cão de primeiro retorno T da órbita
el´
ıptica z(t).
´ importante destacar que, diferentemente do
Observação 12.3. E
caso hiperb´olico (ver Observa¸c˜ao 12.1 e Figura 8.3), nem sempre a
evoluç˜ao temporal em torno de um ponto fixo elı́ptico vai seguir a
evoluç˜ao temporal K n (x) da derivada K = dT (z0 ), sugerida pela
242 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.14:

Figura 12.12. Fenˆomenos extremamente complexos podem suceder no


caso de uma ´orbita elı́ptica e estes exemplos s˜ao descritos na assim
chamada teoria KAM (ver [HK]).


φt doA Figura
campo 12.9 descreve
de vetores x o=que acontece
G(x) comdeasuma
em tˆorno trajet´orias do fluxo
´orbita periódica
hiperbólica z(t).
A Figura 12.12, mostra o que aconteceria se a ´ orbita peri´odica
elı́ptica fosse tal que a T de primeiro retorno tivesse em tˆorno de z0
um comportamento descrito pela Figura 3.3. Neste caso haveria um
contı́nuo de toros envolvendo z(t), cada toro sendo invariante pelo
fluxo (fenômeno KAM). O fenˆomeno de destrui¸cão de toros invari-
243

Figura 12.15:

antes por perturba¸cões é de fundamental importância em Sistemas


Dinâmicos [HK].

Definição 12.7.n Seja


x tal que exista um difeomorfismo
> 0 satisfazendo A, ponto
T n (x)T=:xAé dito →
ent˜ao peri´
um odico.
ponto
O menor de tais possı́veis valores n > 0 é chamado de per´ ıodo de x.
Um ponto fixo é um caso particular de ponto periódico.
Na Figura 12.13 mostramos a tra jetória periódica x(t) (ver Defini-
ção 22) de um campo de vetores G e mostramos também como pode
aparecer de maneira natural um ponto peri´ odico x (ver Definição
12.7) próximo ao ponto fixo para a aplica¸ cão de primeiro retorno T
(no caso um p onto de perı́odo 2) associada a uma ´orbita periódica
z(t) do campo de vetores G.
Se x é periódico para T , então

T j (x), j N = x, T (x), T 2 (x),...,T n−1 (x) .


{ ∈ } {
Note que se x é periódico para T com per´ıodo n, então
}
{x, T (x), T 2
(x),..,T n−1 (x)
}
também são pontos periódicos para T e tem perı́odo n.
O conjunto x, T (x), T 2 (x),..,T n1 (x) é chamado de órbita do
{ }
ponto periódico x por T
244 [CAP. 12: AP ÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Definição 12.8. Um ponto peri´odico x do difeomorfismo F com


per´ıodo n é dito hiperb´ olico para T = F n .
olico, se x é ponto fixo hiperb´
É fácil ver que se x é periódico hiperbólico, cada ponto pertencente
a sua ´orbita também é hiperbólico.
Definição 12.9. O conjunto est´ avel (respectivamente inst´avel) γe (x)
(respectivamente γi (x)) de um ponto peri´odico hiperb´olico x é a uni˜
ao
dos conjuntos est´aveis (respectivamente inst´aveis) de sua ´orbita.
Definição 12.10. Um ponto peri´odico x do difeomorfismo F com
per´ıodo n é dito el´ıptico, se x é ponto fixo el´ıptico para T = F n .
Um fluxo que preserva ´area no plano tem propriedades especiais.
Fixada uma seção transversal H a aplicação de primeiro retorno deve
ser a identidade; n˜ao pode ocorrer o que é descrito p ela Figura 12.3
e 12.4. Isto porque a ´ area da regi˜ao A seria maior do que a ´ area da
região B e o fluxo φt (para t o tempo de primeiro retorno da tra jetória
x(t)) levaria A em φt (A) = B (aproximadamente). Note que os tem-
pos de retorno de pontos em x(t) e de outras solu¸cões y(t) próximas
(começando na seção) não são os mesmos (apenas aproximadamente
os mesmos pela continuidade do fluxo).
Definição 12.11. Uma seç˜ ao H transversal ao fluxo (definido por
uma equaç˜ao diferencial x′ = f (x)) é dita global quando para qualquer
ponto x no espaço A onde est´a definida a equa¸c˜ao diferencial vale
∈ ∈
que existe t > 0 e s < 0 tal que φt (x) H e φs (x) H , onde φ é o
fluxo. Neste caso a ”toda”a dinˆamica do fluxo da equa¸c˜ao diferencial
x′ = f (x) pode ser capturada pela aplicaç˜ ao de primeiro retorno T
definida em H .
Nosso objetivo acima foi apenas descrever de maneira sum´ aria
o que acontece em torno das ´ orbitas periódicas z(t) de um sistema

mecânico. Como vimos,


mente da aplica¸cão este comportamen
de primeiro retorno T toinduzida
dependeem fundamental-
uma se¸cão
transversal P passando por z0 .
O estudo da itera¸cão de difeomorfismos é extremamente impor-
tante na Teoria dos Sistemas Dinâmicos e sua análise permite o enten-
dimento da aplicação T de primeiro retorno a uma se¸cão transversal.
Esta Teoria permite também analisar a dinâmica de F = φt0 , t0 fixo,
onde φt é o fluxo associado a um campo de vetores.
245

A partir do que foi discutido acima, o leitor pode assim perceber


a extrema complexidade que pode suceder na evolu¸cão temporal das
condições iniciais y em tôrno de uma órbita periódica de uma equação
diferencial, em especial dos sistemas Hamiltonianos.
Não foi possı́vel apresentar provas dos resultados acima descritos,
pois isto implicaria em ter que escrever nesta se¸ cão um livro com-
pleto de Sistemas Dinˆamicos. Nosso objetivo foi apenas apresentar
algumas ideias centrais que aparecem na pesquisa atual envolvendo o
entendimento da dinâmica global de Sistemas Mecˆanicos. Referimos
o leitor para [DL], [So], [PM], [R], [M], [CL], [S] e [HS] para referências
sobre vários aspectos da Teoria dos Sistemas Dinˆamicos.
Bibliografia

[AM] R. Abraham and J. Mardsen, Foundations of Mechanics, Ben-


jamin, 1980.

[ABC] B. Amaral, A. Baraviera and M. Terra Cunha, Mecânica Quântica


para Matemáticos em formação, Coloq. Bras. Mat. 2011,
IMPA, Rio de Janeiro
[Ap] A. Appel, Traite de Mecanique Rationnelle, Ed. Gauthier-
Villars, 1953.
[A1] V. I. Arnold, Mathematical Methods of Classical Mechanics,
Springer Verlag, 1978.
[A2] V. I. Arnold, Geometric Methods in the Theory of Ordinary
Differential Equations, Spri. Verla, 1983.
[A3] V. I. Arnold and A. Avez, Ergodic Probl ems of Classical Me-
chanics, Benjamin, 1968.
[Au1] S. Aubry, Analiticity breaking and Anderson localizat ion in in-
commensurate lattic es, Annals of the Israe l Phys. Soc., Vol 3
(1980).
[AU2] S. Aubry and P. Y. Le Daeron, The discrete Frenkel-Kontorova
model and its extensions, PhysicaD, Vol 8 (1983), pp 381-422
[B] V. Bangert, Mather sets for Twist maps and Geodesic s on Tori,
Dynamics Reported , 1-56, John Wiley, 1988.
[BG] I. Q. Barros e M. V. P. Garcia, Mecˆ anica Analı́tica Clássica,
Ed Edgar Blucher, 1995.
[BF] R. Bassanezi e W. Ferreira, Equações Diferenciais com Aplica-
ções, Edit Harbra, 1988.
[BS] C. Beck and F. Schlogl, Thermodynamics of Chaotic Systems :
an Introduction, Cambridge Press, 1993.
[BU] L. Bunimovich, On ergodic properties of nowhere dispersing
billiards, Comm in Math Phys, 65 pp 295-312, 1979.
248 BIBLIOGRAFIA

[MC1] M. do Carmo, Formas Diferenciais e aplica¸cões, 12 Coloq Bras


Mat., 1979.
[MC2] M. do Carmo, Geometria Riemanniana, Projeto Euclides, IMPA,
1988.

[MC3] M. do Carmo,
Prentice Differential Geometry of Curves and Surfaces,
Hall, 1976.
[CRZ] M. Carneiro, C. Ragazzo e S. Zan ata, Introdução à Dinâmica de
Aplicações do tipo Twist, Col´oquio Brasileiro de Matem´atica,
IMPA, RJ, 2005.
[CI] G. Contreras e R. Iturriaga, Global Minimiz ers of Autonomous
Lagrangians, 22 Colóquio Brasileiro de Matemática, IMPA, (1999)
[CLT] G. Contreras, A. Lopes and P. Thieullen, Lyapunov Minimizing
Measures; Erg Theo and Dyn Systems, n 21, (2001)
[CM] N. Chernov and R. Markarian, Chaotic Billiards, AMS, 2006.
[CFS] I. Cornfeld, S. Fomin and Ya Sinai, Ergodic Theory, Springer
Verlag, 1982.
[dL] R. de la Llave, A. Tutorial in KAM theo ry, Proc. Symp. Pure
Applied Math. 69, Amer. Math. Soc., Providence, RI, 2001
[De] R. Devaney, An introduction to Chaotic Dynamical Systems,
Benjamin, 1986.
[DL] C. Doering and A. O. Lopes, Equa ¸cões Diferenciais Ordinárias,
Matemática Universitária, IMPA, 2005
[Du] P. Duarte, Ann Inst Hen ry Poincare, Ann. Non-Lin, Vol 11 n4,

1994 pp 359-409.
[E] R. S. Ellis, Entropy, Large Deviations and Statistical Mecha-
nics, Sprin. Verlag, 1985.
[FMP] A. Fasano, S Marmi and B. Pelloni, Analy tical Mechanics: An
Introduction, Oxford Press
[Fa] J. Falconer, Fractal Geometry, John Wiley, 1990.
BIBLIOGRAFIA 249

[Fat] A. Fathi, Weak KAM Theorem in Lagrangian Dynmaics , pre-


print, 2011.
[Fe] P. Fernandez, Medida e Integração, Proj Euclides, 1976.
[Fi] D. Figueiredo, Análise de Fourier Series e Equações Diferenciais

Parciais, Projeto Euclides, IMPA, 1987.


[GF] I. M. Gelfand and S. V. Fomin, Calculus of Variations, Prentice
Hall, 1963.
[GP] Guillemin Pollack, Diferential Topology
[Go] H. Goldstein, Classical Mechanics, Addison-Wesley, 1972.
[GH] J. Guckenheimer and P. Holmes, Non-linear oscilations, Dy-
namical Systems and Bifurcations of Vector Fields, Springer
Verlag, 1983.
[Gu] J. Gutzwiller, Chaos in Classical and Quantum Mechanics,
Springer Verlag, 1990.
[H] M. Hermann, Sur le courbes invariantes par les diffeomorph ism
de l’anneau, Asterisque, Soc math Franc, 1983.
[LC] P. Le Calvez, Etude Topologique des applications deviant la
Vertical, Ensaios Matemáticos, SBM.
[H] D. T. Harr, Elements of Hamiltonian Mechanics, Pergamon
Press, 1982.
[HS] M. Hirsh and S. Smale, Differential Equations, Linear Algebra
and Dynamical Systems, Acad. Press, 1974.
[I] V. I´orio, EDP, Um curso de gradua¸ cão, Cole¸cão Matemática
Universitária, IMPA, Rio, 1989.
[Ja] B. James, Probabilidade: um curso intermediário, Projeto Eu-
clides, IMPA, 1982.
[Jo] F. John, Partial Differential Equations, Springer Verlag, 1975.
[PM] J. Palis and W. Melo, Introdução aos Sistemas Dinˆamicos, Proj
Euclides, IMPA, 1982.
250 BIBLIOGRAFIA

[G] H.-O. Georgii, Gibbs Measures and Phase Transitions. de Gruy-


ter, Berlin, (1988).
[Ju] R. Iorio Junior, Equações diferenciais parciais: uma introdução,
Projeto Euclides, IMPA, 1988.

[KH] A.
oryKatok and B. Hassen
of Dynamical blat,
Systems, Introduction
Cambridge to1995.
U. P., the Modern The-

[KMS] S. Kerckhoff, A. Mazur and J. Smillie, Ergodicity of billiard


flows and quadratic differentials, Ann of Math, Vol 124, N2,
293-311, 1986.
[Kh] A. Khintchine, Continued Fractions, Univ of Cicago Press, 1964.
[LL] L. Landau and E. Lifshitz, Mechanics, Pergamon Press, 1960.

[Le] Y. Lequain, Aproximação de um n´umero real por n´umeros ra-


cionais, Coloq Bras Mat 1993, IMPA.

[Lo] A. O. Lopes, In trodução à Mecânica Clássica, EDUSP, 2006


[LS] A. O. Lopes and M. Sebastiani, Poncelet pairs and the Twist
map associated to the Poncelet billiard, Real Analyses Ex-
change, vol. 35, ISSUE2, 335-374, 2010.

[LiLi] A. Lichtenberg and M. Liberman, Regular nd Stochastic Mo-


tion, Springer Verlag, 1983.
[Li1] E. L. Lima, Cur so de An´alise, vol II, Projeto Euclides, IMPA,
1989.
[Li2] E. L. Lima, Es paços Métricos, Proj Euclides, IMPA, 1977.

[Li3] E. L. Lima, Variedades Diferenciáveis, IMPA, RJ.


[Li4] E. L. Lima, Algebra Linear, Col. Mat. Universit´aria, IMPA,
Rio (1995).

[Lu] R. Luneburg, Mathematical Theory of Optics, Univ. of Cali-


fornia Press, (1964)
[M1] R. Ma˜né, Teoria Ergódica, Projeto Euclides, IMPA, 1982.
BIBLIOGRAFIA 251

[M2] R. Ma˜né, Global Variational Methods in Conservative Dyna-


mics, 18 Coloq Bras Mat, 1991.

[MR] J.Mardsen and T. Ratiu, Introduct ion to Mechanics and Sime-


try Springer Verlag, 1994

[MT] J. Marion and S. Thorton , Classical Dynamics, Hartcourt Brace


Dubl, 1988.

[Ma] R. Markarian, Introduction to the Ergodic Theory of Plane


Billiards, Dynamical Systems, Congress in Santiago do Chile
(1990), Ed by R.Bamon, R. Labarca, J. Palis and J. Lewowicz,
Longman Edit (1993), 327-439.

[MF] J. Mather and G. Forni, Action Minimiz ing orbits in Hamilto-


nian Systems, Lecture Notes in Math, Springer Verlag (1994).

[Me] J. D. Meiss, Sympletic maps, variational principles, and trans-


port, Reviews of Modern Physics, Vol 64, N3, July 1992

[MH] K. Meyer and G. Hal, Introduction to Hamiltonian Dynamics


Systems and the n-body problem, Springer Verlag, 1992.

[Mi] J. Milnor, Morse Theory, Princ Univ Press.

[Mo] J. Moser, Stable and Random Mot ions in Dynamical Syst ems,
Princeton Univ. Press, 1973

[O] E. Ott, Chaos in Dynamica l Systems, Camb Univ Press, 1993.

[IR] I. Percival and D. Richards, Introduction to Dynamics, Cam-


bridge Univ Press, 1982.

[PY] M. Pollicott and M. Yuri, Dynamical systems and Ergodic The-


ory, Academic Press, 1998

[N] A. L. Neto, Funções de uma vari´avel Complexa, Projeto Eucli-


des, IMPA, 1993.

[OA] A. Ozorio de Almeida , Sistemas Hamiltonianos: Caos e Quan-


tização, Edit UNICAMP.
252 BIBLIOGRAFIA

[PP] W. Parry and M. Pollicott, Zeta functions and the periodic orbit
structure of hyperbolic dynamics, Asterisque 187-188 (1990)
[R] S. N. Rasband, Dynamics, John Wiley, 1983.
[Ro1] C. Robinson, A global approxim ation theorem for Hamiltonian

Systems, Proc.
edit S. Chern andinS.Symp in AMS,
Smale, Pure Math,
1970. XIV, Global Analys is,
[Ro2] C. Robinson, Dynam ical Systems, CRC Press, 1995.
[Rud] W. Rudin, Real and Comple x Analysis, Mc Graw Hill, 1974.
[Rue] D. Ruelle, Thermodynamic Formalism, Adisson Wesley, 1978.
[SW] R. Saks e H. Wu, General Relativity for Mathematicians,
Springer-Verlgag, 1977.
[S] M. Sebastiani, O Teorema de Poncelet, Publicações Matemáti-
cas, IMPA, 2011.

[Si] Ya. Sinai, Dynamical System with elas tic reflections, Russian
Math Surveys, 25, pp 137-189, 1970.
[So] J. A Sottomayor, Lições de Equa¸cões Diferenciais Ordin´arias,
Projeto Euclides, IMPA, RJ.
[Ta] S. Tabachinov, Billiards, So c Math Franc, (1990)
[T] M. Tabor, Chaos and integrability in nonlinear dynamics, John
Wiley and Sons, 1989.
[W] E. T. Whittaker, A Treatise in the Analitical Dynamics of Par-
ticles and Rigid Bodies, Dover, 1944.

Você também pode gostar