Topicos de Mecanica Classica - Artur Lop PDF

Tópicos de
Mecânica Clássica
Publicações Matemáticas
Tópicos de
Mecânica Clássica
Artur Lopes
UFRGS
impa
Copyright  2012 by Artur Lopes
Impresso no Brasil / Printed in Brazil
Capa: Noni Geiger / Sérgio R. Vaz
Publicações Matemáticas
• Introdução à Topologia Diferencial – Elon Lages Lima
• Criptografia, Números Primos e Algoritmos – Manoel Lemos
• Introdução à Economia Dinâmica e Mercados Incompletos – Aloísio Araújo
• Conjuntos de Cantor, Dinâmica e Aritmética – Carlos Gustavo Moreira
• Geometria Hiperbólica – João Lucas Marques Barbosa
• Introdução à Economia Matemática – Aloísio Araújo
• Superfícies Mínimas – Manfredo Perdigão do Carmo
• The Index Formula for Dirac Operators: an Introduction – Levi Lopes de Lima
• Introduction to Symplectic and Hamiltonian Geometry – Ana Cannas da Silva
• Primos de Mersenne (e outros primos muito grandes) – Carlos Gustavo T. A. Moreira e Nicolau
Saldanha
• The Contact Process on Graphs – Márcia Salzano
• Canonical Metrics on Compact almost Complex Manifolds – Santiago R. Simanca
• Introduction to Toric Varieties – Jean-Paul Brasselet
• Birational Geometry of Foliations – Marco Brunella
• Introdução à Teoria das Probabilidades – Pedro J. Fernandez
• Teoria dos Corpos – Otto Endler
• Introdução à Dinâmica de Aplicações do Tipo Twist – Clodoaldo G. Ragazzo, Mário J. Dias
Carneiro e Salvador Addas Zanata
• Elementos de Estatística Computacional usando Plataformas de Software Livre/Gratuito –
Alejandro C. Frery e Francisco Cribari-Neto
• Uma Introdução a Soluções de Viscosidade para Equações de Hamilton-Jacobi – Helena J.
Nussenzveig Lopes, Milton C. Lopes Filho
• Elements of Analytic Hypoellipticity – Nicholas Hanges
• Métodos Clássicos em Teoria do Potencial – Augusto Ponce
• Variedades Diferenciáveis – Elon Lages Lima
• O Método do Referencial Móvel – Manfredo do Carmo
• A Student's Guide to Symplectic Spaces, Grassmannians and Maslov Index – Paolo Piccione e
Daniel Victor Tausk
• Métodos Topológicos en el Análisis no Lineal – Pablo Amster
• Tópicos em Combinatória Contemporânea – Carlos Gustavo Moreira e Yoshiharu Kohayakawa
• Uma Iniciação aos Sistemas Dinâmicos Estocásticos – Paulo Ruffino
• Compressive Sensing – Adriana Schulz, Eduardo A.B.. da Silva e Luiz Velho
• O Teorema de Poncelet – Marcos Sebastiani
• Cálculo Tensorial – Elon Lages Lima
• Aspectos Ergódicos da Teoria dos Números – Alexander Arbieto, Carlos Matheus e C. G.
Moreira
• A Survey on Hiperbolicity of Projective Hypersurfaces – Simone Diverio e Erwan Rousseau
• Algebraic Stacks and Moduli of Vector Bundles – Frank Neumann
• O Teorema de Sard e suas Aplicações – Edson Durão Júdice
• Tópicos de Mecânica Clássica – Artur Lopes
IMPA - ddic@impa.br - http://www.impa.br - ISBN: 978-85-244-0335-4

“mec˙New”
i i
2011/10/11
page 1
i i
Prefácio
O presente livro é uma sequência natural do material apresentado
no texto [Lo] do mesmo autor.
Os primeiros três capı́tulos do texto introduzem conceitos de Te-
oria Ergódica e sua relação com a Mecânica Clássica. Nestes capı́tulos
apresentamos exemplos de sistemas em que aparece o fenômeno KAM.
Como veremos a fundamentação matemática da Mecânica Es-
tatı́stica “a la Gibbs” necessita de fato de resultados de Teoria Ergó-
dica como o Teorema de Birkhoff. Referimos [Rue] e [PP] ao leitor
para maiores detalhes sobre este assunto.
Os capı́tulos de 5 a 6 abordam o Formalismo Simplético. Para
se analisar sistemas mecânicos de maneira intrı́nseca em variedades
diferenciáveis se necessita deste formalismo. Estes resultados podem
ser generalizados (ver [AM]) para dimensão infinita e permitem a
análise da equção de Korteg-de Vries, etc...
A equação de Hamilton-Jacobi e sua relação com o Princı́pio de
Huyghens é o tema dos capı́tulos 7 a 10. Nesta parte do livro é
abordado a relação entre frentes de onda e raios de luz que foi a
motivação principal para a introdução do ponto de vista hamiltoniano
na Mecânica Clássica.
No capı́tulo 11 (em conjunto com M. Sebastiani) apresentamos
algumas propriedades de integrais oscilantes que permitem o me-
lhor entendimento da ótica oscilatória (que foi abordado no capı́tulo
10) e que estão também relacionadas com o limite semi-clássico da
Mecânica Quântica.
O apêndice capı́tulo 12 apresenta algumas definições e exemplos
de aplicações de primeiro retorno induzidas em capı́tulos, pontos
periódicos hiperbólicos, elı́pticos, etc... conceitos estes que aparecem
anteriormente no texto.
Referimos o texto [DL] ao leitor para resultados gerais sobre
Equações Diferenciais Ordinárias que serão aqui utilizados.
Ressaltamos que o livro [FMP] apresenta uma grande quantidade
de material de Mecânica Clássica de uma maneira muito elegante e
com muitos detalhes nas demonstrações.
i i
i i
“mec˙New”
i i
2011/10/11
page 3
i i
Índice
1. A Ação Associada a Bilhares Convexos . . . . . . . . . . . . . . . . . . . . . . . 1
2. O Teorema Ergódico e a Hipótese de Boltzmannn . . . . . . . . . . . 17
3. A Teoria de Aubry para Quasi-Cristais e Exemplos do

Tipo KAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4. Formas Diferenciais em Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . 83
5. Formalismo Simplético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6. Linhas de Vortex em Mecânica Hamiltoniana . . . . . . . . . . . . . . . 140
7. E.D.P: Método das Caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 146
8. E.D.P: Método da Solução Completa . . . . . . . . . . . . . . . . . . . . . . . 162
9. O Princı́pio de Huygens em Mecânica Hamiltoniana . . . . . . . . 176
10. A Equação da Onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
11. O Método da Fase Estacionária - em conjunto com

Marcos Sebastiani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .207
12. Apêndice: Aplicação de Primeiro Retorno . . . . . . . . . . . . . . . . . 227
Bibliografias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247
i i
i i
“mec˙New”
i i
2011/10/11
page 4
i i
i i
i i
“mec˙New”
i i
2011/10/11
page 1
i i
Capı́tulo 1
A Ação Associada a
Bilhares Convexos
Vamos considerar a seguir bilhares determinados por uma curva con-

vexa e sua relação com fluxos Hamiltonianos. Este exemplo possibili-
tará introduzir de maneira natural alguns conceitos básicos do ponto
de vista estatı́stico (não determinı́stico) de se entender a mecânica.
Na próxima seção apresentaremos ao leitor os rudimentos da Te-
oria Ergódica. Nos reportaremos a alguns exemplos tratados na pre-
sente seção para ilustrar algumas propriedades que lá serão descritas.
Considere o movimento livre de uma partı́cula de massa 1 no plano
sujeito à ação do Hamiltoniano
1 2
p + p22 .
2 1
Como sabemos a trajetória da partı́cula se dará segundo uma
linha reta e pelo Teorema da Conservação da Energia Total (que
neste caso, é também apEnergia Cinética) a velocidade ao longo da
trajetória terá módulo p21 + p22 = c = constante.
Vamos descrever alguns resultados básicos na Teoria dos Bilhares
(ver [CM] e [CRZ]).
Suponha a existência de um recipiente circundando a partı́cula de
tal modo que vai impedir que a partı́cula vá embora para o infinito.
i i
i i
“mec˙New”
i i
2011/10/11
page 2
i i
2 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS
Mais precisamente, suponha que exista uma curva infinitamente

diferenciável C de Jordan (sem auto-interceção), que é parametrizada
por g : [0, c] → C ⊂ R2 no sentido anti-horário, g diferenciável e
g(0) = g(c). Considere a condição inicial (q0 , p0 ) ∈ R4 da partı́cula
de tal modo que q0 esteja contida no interior da região D delimitada
pela curva C e que a velocidade inicial p0 seja tal que kp0 k = 1 (logo
por conservação de energia este módulo se manterá constante igual a
1 para sempre).
Vamos supor que a região D é estritamente convexa (sem seg-
mentos retos), isto é, que dados dois pontos quaisquer q1 , q2 ∈ D, o
segmento de reta unindo q1 a q2 está estritamente contido no interior
da região delimitada por D.
A evolução temporal da partı́cula
(q(s), p(s)) = (q1 (s), q2 (s), p1 (s), p2 (s))
a partir da condição inicial (q0 , p0 ) = (q01 , q02 , p10 , p20 ) ∈ R4 será tal que
cada vez que a trajetória q(s) ∈ R2 , s ∈ R colide com a curva C,
ela reflete de tal modo que o ângulo de incidência com a tangente à
curva C seja igual ao ângulo de reflexão (ver Figura 1.1).
Desta maneira, se a trajetória for tal que q0 está inicialmente
na parte D interior à curva C, ela jamais sairá de D. Vamos su-
por também que as reflexões são elásticas, ou seja, não há perda de
energia. Sendo assim, este movimento estará restrito à superfı́cie
tridimensional em R4 determinada por p21 + p22 = 1.
Este modelo é uma boa aproximação para o que acontece com as
partı́culas de um gás contido em um recipiente fechado. O problema
em que estamos interessados nesta seção é analisar o que acontece
com a evolução temporal (q(s), p(s)) de “uma”partı́cula que no tempo
inicial s = 0 está exatamente em q0 ∈ D (ou em C) e com vetor
velocidade p0 . Problemas de acústica também podem ser modelados
por bilhares.
Considere g : [0, c] → C (c é o comprimento da curva) uma para-
metrização da curva C pelo comprimento de arco, isto é kg ′ (t)k = 1.
Vamos supor sem perda de generalidade que a curva C tenha com-
primento igual a 1 (caso contrário faça uma mudança de variáveis),
ou seja que c = 1.
Como entre cada batida o movimento é trivial (é descrito por
uma linha reta) podemos simplificar o problema tridimensional (na
i i
i i
“mec˙New”
i i
2011/10/11
page 3
i i
superfı́cie p21 + p22 = 1) para um problema bidimensional em que

q0 ∈ C da seguinte maneira: a posição inicial (q0 , p0 ) ∈ R4 tal que
(p10 )2 +(p20 )2 = 1 e q0 = (q01 , q02 ) ∈ C, pode serdescrita por (t, ϕ) onde
t ∈ [0, 1] é tal que g(t) = q0 , e ϕ ∈ − π2 , π2 é o ângulo de p0 com
a normal a C em q0 apontando para dentro de C (ver Figura 1.2).
Por convenção assumimos que ϕ = −π/2 corresponde a tangente t
da curva (orientada no sentido anti-horário).
O vetor p0 sempre aponta para dentro da curva C, logo seu ângulo
com a normal (apontando para dentro da curva) varia de −π/2 a π/2
como foi dito acima.
Por uma questão de conveniência em vez de ϕ, vamos usar a
variável θ = sin ϕ ∈ (−1, 1).
Segundo a convenção g ′ (t) corresponde a θ = −1.
Para descrever com mais exatidão a analogia que existe entre o
modêlo do bilhar e propriedades de sistemas hamiltonianos vamos
usar a seguinte notação, vamos associar t = q e θ = p. Sendo assim,
denotaremos indistintamente t = q = g(t) e também θ = p.
Dada a condição inicial (t0 , θ0 ), considere a trajetória (q(s), p(s))
(solução do fluxo Hamiltoniano começando em (q0 , p0 ) = (t0 , θ0 ))
q(s) ∈ D e após a primeira colisão e respectivo rebote obteremos
(q1 , p1 ), q1 ∈ C. Denotaremos por (t1 , θ1 ) os novos valores obtidos
nas coordenadas (t, θ) de tal jeito que g(t1 ) = q1 é exatamente o
ponto de C onde a trajetória q(s) determinada por (q(s), p(s)) vai
colidir com C pela primeira vez (ver Figura 1.2). O ângulo θ1 é
obtido como o valor do seno do ângulo (do vetor refletido) com a
normal (ver Figura 1.2).
O fato de assumir que a curva C é estritamente convexa implica
que T (t0 , θo ) = (t1 , θ1 ) esta bem definida e é continua. Devemos
assumir que a curva é parametrizada por uma função de Classe C 2
para que resulte um difeomorfismo a aplicação de primeiro retorno.
Fica assim, determinado um difeomorfismo
T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1),
onde T (t0 , θ0 ) = (t1 , θ1 ).

A diferenciabilidade do difeomorfismo é C 1 .
Vamos denotar por
E = [0, 1) × (−1, 1)
i i
i i
“mec˙New”
i i
2011/10/11
page 4
i i
a região bidimensional em que T vai estar definida. E representa

uma seção transversal (ver seção 12 para considerações gerais sobre
o assunto) na superfı́cie tridimensional p21 + p22 = 1.
Reduzimos assim um problema com tempo contı́nuo em dimensão
3 para um problema de dimensão 2 com tempo discreto, ou seja a
dinâmica temporal para o fluxo φt , t ∈ R transforma-se na dinâmica
temporal para T n , n ∈ N, onde T : E → E é um difeomorfismo. Este
segundo problema, em princı́pio, é mais simples e vai apresentar as
principais caracterı́sticas do primeiro.
Para entender o que acontece com com a evolução temporal φs (q, p),
s ∈ R, da partı́cula com posição inicial (q, p) = (t, θ), q ∈ C, basta
saber o que acontece com as sucessivas batidas determinadas por T
em C, ou seja pela órbita de (q, p) = (t, θ) dada por
(t, θ) , T (t, θ) , T (T (t, θ)) , ..., T n (t, θ) , ...,
pois entre cada batida a trajetória é uma linha reta. A linha quebrada
correspondendo aos vários rebotes desta evolução temporal t ∈ R
pode ser facilmente reconstruı́da a partir da informação da órbita de
(t0 , θ0 ).
Note que se a fronteira do bilhar for constituı́do por união de
curvas diferenciáveis como na Figura 1.4 e 2.1, existirão singulari-
dades devido aos vértices e isto cria uma pequena dificuldade (que
pode ser eliminada conforme veremos na próxima seção) na definição
de T . Alguns destes bilhares (como o da Figura 2.1) chamados dis-
persores ou de Sinai (ver [Mar] para definição), apresentam caos e
podem ser rigorosamente analisados adaptando técnicas de sistemas
hiperbólicos da Teoria dos Sistemas Dinâmicos e Teoria Ergódica (ver
Ro[1]). Os bilhares analisados aqui são focalizadores (em oposição aos
dispersores) e também podem exibir como veremos em alguns casos
comportamento caótico mas para sua análise rigorosa as técnicas em-
pregadas são de natureza distinta (e na verdade mais difı́cil) do que
as utilizadas no caso dispersor.
Bilhares são os exemplos naturais mais simples em que se observa
caos (ver Figura 2.2).
Para o leitor familiarizado com a teoria geométrica das equações
diferenciais ordinárias (ver [LL] e [So]) esclarecemos que o procedi-
mento acima (tomar a iteração do difeomorfismo T em vez do fluxo
i i
i i
“mec˙New”
i i
2011/10/11
page 5
i i
Figura 1.1:
φt ) é similar a tomar uma seção de Poincaré (global) para uma

equação diferencial. Neste sentido, a aplicação T pode ser enten-
dida da seguinte maneira. O movimento do bilhar se dá na região
invariante tridimensional p21 + p22 = 1. A região E (seção transversal
de acordo com a seção 12) vai ser constituı́da pelos pontos da forma
(q, p) onde q está na curva C (bordo de D) e p é um vetor de norma
1 em q e apontando para dentro da curva C.
Dada uma condição inicial em E, a aplicação T vai determinar o
primeiro retorno (seguido de uma simetria do ângulo de incidência
com a normal à curva) da trajetória (que se desloca na região tridi-
mensional) à seção transversal E (ver Figura 1.5).
Observação 1.1. Note que em geral se começarmos com uma con-

dição inicial (q0 , p0 ), e denotando por (pn , qn ) = T n (q0 , p0 ), se se-
guirmos os iterados (qn , pn ), tentando prever exatamente onde ele
vai estar no tempo (digamos) 1000, (isto é, qual o valor exato de
(q1000 , p1000 )) enfrentaremos sérias dificuldades. Um pequeno erro
na aproximação do valor exato de (q1 , p1 ) se propaga para (q2 , p2 )
e assim por diante, fazendo com que a previsão do valor exato de
(q1000 , p1000 ) seja bastante difı́cil. O ponto de vista acima descrito
pode ser entendido como o ponto de vista determinı́stico. Para o tipo
de problema que estamos considerando (bilhares em regiões convexas)
será melhor analisar a questão do ponto de vista da análise estatı́stica
das trajetórias. Para isto será necessário mostrar que T preserva
área, o que vai ser feito a seguir.
i i
i i
“mec˙New”
i i
2011/10/11
page 6
i i
Notação: Como estamos identificando t com q = g(t) (para sim-

plificar a notação), denote
S(q0 , q1 ) = kq0 − q1 k = S(q, Q)
(ou alternativamente
S(t0 , t1 ) = kg(t0 ) − g(t1 )k,
onde g(t0 ) = q = q0 , g(t1 ) = q1 = Q) o comprimento do segmento

ligando q0 a q1 . Como D é estritamente convexo, este segmento está
inteiramente contido em D.
∂S(q0 ,q1 )
Proposição 1.1. Seja (q1 , p1 ) = T (q0 , p0 ). Para q0 fixado, ∂q1 =
−p1 .
Demonstração: Como sabemos d<z(t)dt, z(t)> = 2 < z ′ (t) , z(t) >,

então usando a notação descrita acima onde q0 = g(t0 ) e q1 = g(t1 )
p
∂S(q0 , q1 ) d < g(t1 ) − g(t0 ) , g(t1 ) − g(t) ) >
= =
∂q1 dt1
1
< g ′ (t1 ) , g(t1 ) − g(t0 ) > .
kg(t1 ) − g(t0 )k
′
Como kg (t1 )k = 1 por hipótese, usando a expressão
< u, v >= kukkvk cos (ângulo formado por u e v),
obtemos que ∂S(q 0 ,q1 )

∂q1 é o cosseno do ângulo entre (g(t1 ) − g(t)) e
g ′ (t1 ), ou seja é igual ao cosseno do ângulo de incidência da partı́cula
em g(t1 ) com a tangente g ′ (t1 ) neste ponto. Como p1 = θ1 = sin φ1
é o seno do ângulo com a normal após o rebote, concluı́mos que
dS(q0 ,q1 )
dq1 = −p1 .
A troca de sinal é devido ao ângulo refletido.
Analogamente pode se mostrar que para q1 fixado ∂S(q 0 ,q1 )

∂q0 = p0 .
Sendo assim S define uma transformação que preserva área. Seguirá
do que foi descrito acima que:
i i
i i
“mec˙New”
i i
2011/10/11
page 7
i i
Figura 1.2:
Proposição 1.2. Fixe dois pontos q1 e q3 em C e considere A(q) =

A(t) a função de t = q ∈ [0, 1) (estamos usando a notação, de iden-
tificar g(t) = q ∈ C) tomando valores reais, tal que para todo valor
q ∈ C,
A(q) = S(q1 , q) + S(q, q3 ) = kq1 − qk + kq − q3 k.
Então, é equivalente dizer que A(q) = S(q1 , q) + S(q, q3 ) tem um
ponto crı́tico em q2 e dizer que a trajetória do bilhar em D, sai de
q1 , colide a seguir com C em q2 ∈ C e finalmente bate em q3 ∈ C.
∂S(q1 ,q2 )
Demonstração: Pela última proposição, ∂q2 = −p2 . De
∂S(q2 ,q3 )
maneira análoga se pode mostrar que ∂q2 = p2 .
Sendo assim, a partir do que vimos na última proposição, a condi-
ção da igualdade do ângulo de incidência e o ângulo de reflexão entre
os segmentos q1 , q2 e q2 , q3 no ponto q2 é equivalente a dizer que q2
satisfaz
∂S(q1 , q) ∂S(q, q3 )
+ = 0.
∂q ∂q
Esta última condição, por sua vez, é equivalente a A(q) ter q2
como ponto crı́tico.
A conclusão é que (q1 , p1 ) = T (q0 , p0 ) satisfaz as equações

∂S(q0 , q1 )
= p0
∂q
e
∂S(q0 , q1 )
= −p1 .
∂q1
i i
i i
“mec˙New”
i i
2011/10/11
page 8
i i
Figura 1.3:
Um cálculo fácil permite obter que
∂ 2 S(q0 , q1 ) p0 p1
= >0
∂q0 ∂q1 S(q0 , q1 )
ou seja,
∂ 2 S(t0 , t1 ) Senθ0 Senθ1
= >0
∂t0 ∂t1 S(t0 , t1 )
Mais tarde retornaremos a analisar esta expressão. Note que po-
demos tomar também S(q, Q) = −kq − Qk sem que alteremos em
nada o que foi descrito acima, apenas fazendo com que
∂ 2 S(q0 , q1 )
< 0.
∂q0 ∂q1
Mais tarde analisaremos transformações T obtidas a partir de S
e que satisfazem a última expressão acima.
Como vimos no Capı́tulo 3 [L], se T (q0 , p0 ) = (q1 , p1 ) é obtido
através de uma aplicação geradora de mudança de coordenadas
2
S(q0 , q1 ) tal que ∂ ∂q
S(q0 ,q1 )
0 ∂q1
6= 0 como acima, então T preserva área.
Note que foi necessário usar as coordenadas θ = sin ϕ e não ϕ para
obter que T : E → E preserva área.
Logo, para tal T vale que para qualquer aberto A, os conjuntos
A e T (A) tem a mesma área.
i i
i i
“mec˙New”
i i
2011/10/11
page 9
i i
Figura 1.4:
Definição 1.1. A aplicação kq1 − qk = S(q, q1 ) : [0, 1] × (−1, 1) → R

é denominada Ação associada ao bilhar definido pela curva C.
Uma conclusão que podemos obter do fato acima demonstrado

é que todos os pontos do bilhar são não errantes (ver Definição 5,
Capı́tulo 3 [L]). Isto segue de imediato do fato que T preserva área e
do Teorema de Poincaré (Teorema 5, Capı́tulo 3).
O Exemplo 13, Capı́tulo 1 [L], constituı́do por duas partı́culas
colidindo num intervalo, pode ser transformado num problema sobre
trajetórias no bilhar triangular. A demonstração que a aplicação no
bordo do bilhar preserva área também pode ser aplicada a tal bi-
lhar. Concluimos portanto que no caso do sistema de duas partı́culas
colidindo num intervalo, todos os pontos são não errantes.
O fato do difeomorfismo T do bilhar convexo preservar área, per-
mitirá também usar técnicas probabilı́sticas na análise das trajetórias
do sistema mecânico em consideração. Estes resultados serão apre-
sentados na próxima seção.
O resultado acima, sobre conservação de área é verdadeiro para
uma grande classe de interessantes e diferentes tipos de bilhares. A
evolução das trajetórias do bilhar vai depender no entanto de maneira
essencial da forma da curva C. Vamos mostrar isto através de alguns
exemplos.
i i
i i
“mec˙New”
i i
2011/10/11
page 10
i i
Figura 1.5:
Definição 1.2. Dizemos que V : E → R é uma integral primeira de

T se V (q, p) é contı́nua e constante ao longo das órbitas T n (q0 , p0 ) =
(qn , pn ).
A existência de tal V : [0, 1) × (−1, 1) → R implica na existência

de uma integral primeira Ṽ para φt em p21 + p22 = 1. Isto ocorre
porque, o sistema a tempo contı́nuo φt na superfı́cie tridimensional
p21 +p22 = 1, é obtido a partir de T apenas acrescentando retas ligando
x a T (x). Cada curva invariante em [0, 1) × (−1, 1) determina por-
tanto uma superfı́cie bidimensional invariante para φt na superfı́cie
tridimensional em p21 + p22 = 1.
Exemplo 1.1. O cı́rculo. Considere C um cı́rculo de raio 1. Em vez

da parametrização do cı́rculo por (cos 2πt, sen 2πt ), 0 ≤ t ≤ 1 vamos
usar as coordenadas 0 ≤ s < 2π para a posição q e −π/2 ≤ ϕ < π/2
para o ângulo com a normal. No caso do cı́rculo é fácil ver que
S(q, Q) = S(s0 , s1 ) = 2 sen ((s1 − s0 )/2).
Por propriedades elementares de geometria o ângulo ϕ não va-

ria ao longo de uma órbita e T é dado por T (s0 , ϕ0 ) = (s1 , ϕ1 ) =
(s0 + 2ϕ0 , ϕ0 ) É fácil ver que se a condição inicial for (s0 , ϕ0 ) =
i i
i i
“mec˙New”
i i
2011/10/11
page 11
i i
11
(q0 , p0 ) ∈ [0, 2π) × (−π/2, π/2), então para todo n, T n (q0 , p0 ) =

(qn , pn ) é tal que pn = p. Sendo assim se plotarmos várias trajetórias
{(q, p), T (q, p), T 2 , ..., T n (q, p)}, onde (q, p) são diferentes condições
iniciais, obteremos uma decomposição do espaço de fase (q, p) ∈
[0, 2π) × (−π/2, π/2), da forma apresentada na Figura 1.7.
Logo, a função V (q, p) = p (ou seja V (s, ϕ) = ϕ) é constante ao
longo de cada órbita. Portanto, tal V é uma integral primeira do
bilhar.
Como T (s0 , ϕ0 ) = (s0 + 2ϕ0 ), φ0 ) considere apenas a ação de T
na primeira ordenada g(s0 ) = s0 + 2ϕ0 (mod 1). Se 2ϕ0 for da
forma racional vezes 2π é fácil ver que todo ponto s0 será periódico.
Caso 2ϕ0 for da forma irracional vezes 2π então, conforme a próxima
seção, ocorre que para qualquer s0 fixado a órbita g j (s0 ), j > 0 será
densa em [0, 1). Neste último caso, naturalmente, não existem órbitas
periódicas.
Sendo assim, concluı́mos que a dinâmica da evolução temporal
de T n (s0 , ϕ0 ) fica completamente entendida e de acordo com a Fi-
gura 1.5. Se quisermos podemos mudar novamente coordenadas e
considerar alternativamente o problema nas coordenadas T n (t0 , θ0 )
obtendo os resultados análogos. Optamos pelas coordenadas (s, ϕ)
apenas porque as fórmulas de T e S neste caso ficam mais simples.
Exemplo 1.2. A elipse. Tomando várias condições iniciais (q, p) ∈

[0, 1) × (−1, 1) diferentes e tomando as correspondentes órbitas
{(q, p), T (q, p), ..., T n (q, p), ...}
obteremos uma decomposição do espaço de fase (q, p) ∈ [0, 1)×(−1, 1)

da forma apresentada na Figura 1.7.
A função
q 2 − ǫ2 cos2 ν
V (q, p) =
1 − ǫ2 cos2 ν
(onde ǫ é a excentricidade da elipse e ν é o ângulo de p com o eixo dos
x), por sua vez, é constante ao longo das órbitas do bilhar na elipse.
Um exame das curvas de nı́vel de tal G nos determina a Figura
que 1.7 descreve órbitas associadas a diversas condições iniciais. Da
mesma maneira como no cı́rculo algumas curvas de nı́vel serão tais
i i
i i
“mec˙New”
i i
2011/10/11
page 12
i i
Figura 1.6:
que as órbitas de condições iniciais sobre elas serão densas nela e em

algumas outras curvas tal não ocorre.
É possı́vel mostrar também que em algumas curvas de nı́vel o tj
de (tj , θj ) = T (t0 , θ0 ), j > 0 explora densamente on intervalo [0, 1] e
em outras não; a Figura 1.7 e 1.8 ilustra tal fato.
A existência de tal V : [0, 1) × (−1, 1) → R por sua vez implica na
existência de uma integral primeira Ṽ para φt em p21 + p22 = 1. Por-
tanto, da mesma maneira como no caso do cı́rculo, obtemos neste caso
uma integral primeira para o sistema a tempo contı́nuo associado.
Exemplo 1.3. O ovo (ver Figura 1.8). Tomando várias condições
iniciais (q, p) diferentes e tomando as correspondentes órbitas
{(q, p), T (q, p), ..., T n (q, p)}
obteremos uma decomposição do espaço de fase da forma apresentada
na Figura 1.8. Note que mesmo que a elipse e o ovo tenham for-
mas semelhantes, o espaço de fase do bilhar com fronteira dada pelo
ovo apresentado na Figura 1.8 é bastante diferente dos dois exem-
plo anteriores. Este sistema, aparentemente pelo que mostra a Fi-
gura 1.8 não existe função contı́nua V (definida em todo E e não
i i
i i
“mec˙New”
i i
2011/10/11
page 13
i i
13
constante) que seja constante em cada órbita {T n (x), n ∈ N} para

cada x = (q, p) ∈ E.
O Exemplo 1.3 (ver Figura 1.8) mostra uma combinação de com-

portamentos distintos (dependendo da órbita ou seja da condição ini-
cial escolhida); existe uma evidência numérica que existem algumas
curvas invariantes por T e também regiões bidimensionais invariantes
por T (que não são união de curvas invariantes conforme Figura 1.8).
Neste caso aparece o que se convenciona chamar de ilhas KAM e
que será analisado mais tarde no texto.
Nas curvas invariantes que aparecem na figura podem haver órbitas
periódicas, trajetórias com órbita densa, etc...
Exemplo 1.4. O estádio circular é o bilhar tal que a curva C tem

a forma apresentada na Figura 1.4. É constituı́do por duas retas
paralelas com comprimento l > 0 e por duas metades de um cı́rculo.
Tomando apenas “uma certa”condição inicial (q0 , p0 ) e plotando

a órbita de (q, p) até ordem n=999, isto é, plotando o conjunto
{(q, p), T (q, p), ..., T 999 (q, p)}
obtemos Figura 1.7 (figura da direita). A órbita T j (q0 , p0 ), j ∈

{1, 2, ..., n} parece se distribuir de maneira uniforme sobre E, isto
é o número de j ∈ {1, 2, ..., n − 1} em um aberto qualquer fixado A
dividido por 1000 parece ser proporcional a área de A.
Note que podem existir órbitas no estádio circular que não tem
o comportamento acima descrito: por exemplo órbitas periódicas de
perı́odo dois como aparece na Figura 1.6.
Na verdade para a ”maioria”das condições iniciais (q0 , p0 ) as ór-
bitas no estádio circular T j (q0 , p0 ) terão uma distribuição uniforme
como no caso da Figura 1.7 (figura da direita). Explicar o sentido
da palavra ”maioria”será um dos objetivos da próxima seção. Este
exemplo será um dos assim chamados sistemas ergódicos.
Observação 1.2. Note que o comportamento da trajetória T n (q, p)

neste último Exemplo 1.4 é totalmente distinto dos dois primeiros
Exemplos 1.1 e 1.2, onde cada trajetória esta confinada a uma curva
(um conjunto unidimensional) por causa da integral primeira V .
i i
i i
“mec˙New”
i i
2011/10/11
page 14
i i
Figura 1.7: Espaço de fase respectivamente do cı́rculo, elipse e esta-

dium.
O comportamento descrito pelo Exemplo 1.4 mostra uma situação

que é também diferente do Exemplo 1.3. No presente caso a tra-
jetória T n (x), x ∈ [0, 1) × (−1, 1) de um ponto escolhido ao acaso no
Exemplo 1.4 parece tentar explorar toda a região bidimensional E.
Mais precisamente, a órbita {T n (x)} tenta ocupar densamente todo
o espaço E = [0, 1)×(−1, 1) e neste caso, não parece existirem curvas
invariantes para tal T em E.
Este último bilhar Exemplo 1.4 é o protótipo de um sistema
ergódico (os Exemplos 1.1, 1.2 e 1.4 não o são) conceito que será
tornado preciso na próxima seção.
Para finalizar algumas considerações gerais sobre bilhares.
Observação 1.3. Generalizando o que foi afirmado na Proposição
1.2 é fácil ver que se q0 , q1 , q2 , ..., qn são sucessivas batidas em C de
uma órbita T j (q0 , θ0 ) então para q0 , qn fixos a função
A(x1 , x2 , ..., xn−1 ) = S(q0 , x1 ) + S(x1 , x2 ) + ... +

+ S(xn−2 , xn−1 ) + S(xn−1 , qn )
A : E n−1 → R tem (q1 , q2 , ..., qn−1 ) como ponto crı́tico. Temos assim
uma versão a tempo discreto do princı́pio mı́nima ação. Esta propri-
edade será analisada posteriormente com mais detalhe e também em
outros casos similares.
Note que para bilhares focalizadores (como descritos acima) se
em vez de considerarmos S(q0 , q1 ) = ||q0 − q1 || tomarmos S(q0 , q1 ) =
−||q0 − q1 || determinaremos também uma T que descreve a dinâmica
i i
i i
“mec˙New”
i i
2011/10/11
page 15
i i
15
Figura 1.8: O ovo e seu espaço de fase.
do bilhar (troca apenas a orientação da curva). A condição obtida

2 2
antes ∂ ∂q
S(q0 ,q1 )
0 ∂q1
> 0 neste último caso troca para ∂ ∂q S(q0 ,q1 )
0 ∂q1
< 0. No
caso S(q0 , q1 ) = ||q0 −q1 || a condição de mı́nimo para A da observação
acima significa obter trajetórias com mı́nimo comprimento. No outro
caso o princı́pio de mı́nima ação determina trajetórias com máximo
comprimento.
Para bilhares dispersores (ver Figura 2.1) podemos também consi-
derar S(q0 , q1 ) = ||q0 − q1 || ou S(q0 , q1 ) = −||q0 − q1 || correspondendo
2 2
respectivamente a ∂ ∂q S(q0 ,q1 )
0 ∂q1
< 0 e ∂ ∂qS(q0 ,q1 )
0 ∂q1
> 0 (observe a troca de
sinal em comparação com o caso focalizador).
O bilhar descrito pela Figura 2.1 em que o bordo do bilhar é
constituı́do por uma série de curvas diferenciáveis com a concavidade
para fora (que fazem um ângulo não nulo nas interceções) é conhecido
como bilhar de Sinai. Pode-se mostrar que o espaço de fase neste
caso é semelhante ao do caso do estadium, isto é, tomando um ponto
inicial (q0 , p0 ) fixado no bordo, os iterados (qn , pn ) = T n (q0 , p0 ) se
distribuem de maneira uniforme no espaço de fase. Referimos o leitor
a [Si], [Ma] e [Ta] para resultados gerais sobre o assunto.
Alguns tipos diferentes de bilhares são analisados em [S] e [LS.]
i i
i i
“mec˙New”
i i
2011/10/11
page 16
i i
A conclusão a que chegamos ao fim desta seção é que mesmo

para um campo Hamiltoniano sem energia potencial, a dinâmica da
evolução temporal do sistema mecânico associado pode ser muito
complexa, se assumirmos a existência de um recipiente contendo a
condição inical e com a qual a trajetória do sistema colide elastica-
mente.
Exercı́cios
1. Mostre que V (q, p) = p do Exemplo 1.1, é constante ao longo
das trajetórias do bilhar no cı́rculo.
2 2 2
2. Mostre que V (q, p) = q1−ǫ−ǫ cos ν
2 cos2 ν do Exemplo 1.2, é constante
ao longo das trajetórias do bilhar na elipse.
i i
i i
“mec˙New”
i i
2011/10/11
page 17
i i
Capı́tulo 2
O Teorema Ergódico e a
Hipótese de Boltzmann
Nesta seção vamos apresentar de maneira suscinta o Teorema Ergódico

e algumas de suas conseqüências. Primeiramente vamos apresentar o
Teorema Ergódico com tempo discreto e mais para o fim desta seção
o Teorema Ergódico com tempo contı́nuo.
Informamos ao leitor que o objetivo da presente seção é apenas
apresentar idéias e descrever resultados interessantes. Referimos para
os excelentes textos [M] e [KH] para a fundamentação matemática
rigorosa do que segue abaixo. O autor do presente livro escreveu
também notas [L2] onde estes tópicos são apresentados com todo
rigor matemático.
Ao fim da presente seção, o Exemplo 2.15 é um dos mais im-
portantes deste texto. Neste exemplo, mostraremos que sob certas
condições, vale a hipótese de Boltzmann (ver considerações a seguir)
em torno de um ponto de equilı́brio de um sistema integrável.
Como vimos anteriormente quando analisamos o bilhar na Seção
1, o entendimento do comportamento das órbitas do fluxo Hamilto-
niano
H(q1 , q2 , p1 , p2 ) = p21 + p22
restrito a um recipiente delimitado por uma curva C (na qual exis-
17
i i
i i
“mec˙New”
i i
2011/10/11
page 18
i i
18 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN
te um rebote quando a órbita colide com a curva) pode ser obtido

pela iteração de uma aplicação T induzida em uma seção transversal
bidimensional E (pelo primeiro retorno). Vamos apresentar um re-
sultado matemático que vai possibilitar entender melhor a evolução
temporal de tal sistema mecânico. Lembre que o difeomorfismo T
induzido pelo bilhar em C preserva área, pois é obtido através de
uma aplicação geradora S (ver Proposição 1.2 e Lema 11.1, Capı́tulo
3 [L]).
Definição 2.1. Uma probabilidade P definida em um conjunto aberto

X do Rn é uma lei que associa a cada subconjunto A ⊂ X um valor
P (A) ∈ [0, 1].
Uma probabilidade deve satisfazer também as seguintes proprie-
dades:
1) P (∅) = 0 (∅ é o conjunto vazio)
2) P (X)
= 1.
P∞
3) P ∪∞ i=1 Ai = i=1 P (Ai ) se os conjuntos Ai forem todos
disjuntos.
Na Seção 10 do Capı́tulo 3 (ver Exemplo 51 em [L]), introduzimos

um caso particular de probabilidade. Outras serão consideradas a
seguir.
Observação 2.1. Não dissemos nada a respeito da classe de subcon-

juntos A de X onde está definido tal probabilidade P .
P precisa ser definida numa sigma-algebra (ou seja, uma coleção
de conjuntos F tal que
a) X ∈ F,
b) se A ∈ F então X − A ∈ F
e c) para toda coleção enumerável An ∈ F vale que ∪n An ∈ F).
Para não entrar em detalhes técnicos, vamos apenas esclarecer

que muitas vezes que nem todos os subconjuntos A terão um valor de
probabilidade P (A). Felizmente, os conjuntos A que tem importância
no desenvolvimento que segue terão sempre um valor bem definido
de probabilidade. O leitor interessado na formalização matemática
de tais conceitos, que envolvem Teoria da Medida, sigma-álgebras,
i i
i i
“mec˙New”
i i
2011/10/11
page 19
i i
19
Figura 2.1:
etc..., podem encontrar uma ótima exposição do assunto em [Fe] e

[Rud].
A classe de subconjuntos A que vamos necessitar utilizar aqui
(e que terão um valor bem definido de probabilidade) incluem entre
outros os abertos com bordo diferenciável por partes.
Nosso ponto de vista aqui será apenas dar uma idéia dos conceitos
principais sem entrar em detalhes matemáticos mais sofisticados.
Vamos descrever brevemente agora que tipo de probabilidades P
vamos considerar a seguir.
Considere X ⊂ Rn , subconjunto aberto limitado com o bordo
constituido por uma curva diferenciável por partes, e uma função
continua não negativa ψ definida em X, tal que
Z Z
ψ(x)dx = ψ(x)dx1 dx2 ...dxn = 1.
X X
Se A for um conjunto aberto A ⊂ X com o bordo definido por

uma curva diferenciável por partes, Rutilizando a definição usual de
integral do Cálculo a várias variáveis, A ψ(x)dx existe e vamos definir
i i
i i
“mec˙New”
i i
2011/10/11
page 20
i i
Figura 2.2:
aR probabilidade P = Pψ sobre conjuntos A desta forma por P (A) =

A
ψ(x)dx.
É fácil ver que P satisfaz as leis 1) 2) 3) da Definição 2.1 acima,
para a coleção dos abertos A ⊂ X com bordo diferenciável por partes
(e suas uniões contáveis).
Desta maneira obtemos a partir de ψ uma probabilidade P = Pψ
definida em X associando valores P (A) a subconjuntos abertos A de
X com bordo diferenciável por partes.
Por exemplo, para um paralelepı́pedo B = (a1 , b2 )×(a2 , b2 )×...×
Rb Rb
(an , bn ) ⊂ X ⊂ Rn , obteremos que P (B) = a11 ... ann ψ(x)dx1 ...dxn .
As probabilidades P que estaremos interessados nesta seção serão
sempre do tipo acima descrito P = Pψ . ψ será denominada densidade
da probabilidade P = Pψ . Se ψ é constante diremos que Pψ é a
“probabilidade uniforme”em X. Neste caso,
área de A
P (A) = .
área de X
Fixada uma probabilidade P , a classe de conjuntos A ⊂ X so-
bre os quais necessitamos definir o que seria a probabilidade P (A),
i i
i i
“mec˙New”
i i
2011/10/11
page 21
i i
21
Figura 2.3:
no entanto, deve ser maior do que a classe dos abertos com bordo
diferenciável por partes. Será necessário por exemplo, no Teorema
Ergódico, falar sobre certos conjuntos A que não são abertos, mas
tem relevância no entendimento da evolução temporal do sistema.
Estes conjuntos serão denominados de conjuntos de probabilidade
total.
Muitos dos resultados que apresentaremos a seguir valem para
probabilidades mais gerais P (não só do tipo Pψ ), mas para não
entrarmos em problemas técnicos desnecessários, vamos considerar
apenas probabilidades deste tipo.
Definição 2.2. Dada uma probabilidade P em X, dizemos que um
conjunto A ⊂ X ⊂ Rn tem probabilidade zero para P se para qualquer
ǫ existe uma sequência de paralelepı́pedos
P∞ Bi , i ∈ N contidos em
X ⊂ Rn tal que A ⊂ ∪∞ i=1 Bi e i=1 P (B i ) < ǫ.
Para conjuntos A deste tipo, será verdade que P (A) = 0 (ver [Fe]
e [Rud]).
O critério de mostrar que um certo conjunto tem probabilidade
zero, mostrando que satisfaz a Definição 2.2 é extremamente útil.
Exemplo 2.1. Considere a probabilidade uniforme em [0, 1], que
atribui probabilidade b − a para todo intervalo [a, b] ⊂ [0, 1]. Para
esta probabilidade o conjunto dos racionais em [0, 1], isto é Q ∩ [0, 1]
(ou qualquer conjunto enumerável) tem probabilidade zero. Isto segue
i i
i i
“mec˙New”
i i
2011/10/11
page 22
i i
do fato que, dado ǫ, os conjuntos da forma Biǫ = Bi , i ∈ N

i
1 ǫ
Bi = x ∈ [0, 1] | |x − qi | <
2 2
cobrem Q, onde qi ∈ Q∩[0, 1], i ∈ N é uma enumeração dos racionais
em [0, 1]. Note que o comprimento total coberto pela união dos Bi , i ∈
N, é menor que ǫ qualquer dado.
Dada a probabilidade P = Pψ em X, a integral
R de uma função ϕ :
X → R com respeitoR a P , é por definição X ϕ(x)ψ(x)dx, expressão
que é denotada por ϕ(x)dP (x). R
Dado um conjunto A vale sempre que IA (x)dP (x) R = P (A)
R
Se P é a probabilidade uniforme em X, então ϕ(x)dP (x) =
ϕ(x)dx
X
.
área de X
Exemplo 2.2. Conjuntos de probabilidade zero aparecem natural-
mente na Teoria das Séries de Fourier. Suponha que duas funções f
e g são iguais em todos os pontos do intervalo [0,1], menos num con-
junto A de probabilidade uniforme 0 (no qual podem eventualmente
R1 R1
ser distintos), sendo assim, 0 f (x)dx = 0 g(x)dx. Este fato segue
facilmente da definição de integral (ver [Li1] e [Fe]). Concluı́mos
então que duas funções que diferem apenas num conjunto de medida
zero tem a mesma integral com respeito a dx.
Como as funções f (x)ei2πxn e g(x)ei2πnx também são iguais em
todos os pontos do intervalo (0, 1), menos num conjunto A de proba-
bilidade 0, então
Z 1 Z 1
i2πxn
f (x)e dx = g(x)ei2πnx dx.
0 0
Logo as duas funções f e g como acima possuem a mesma série

de Fourier, porque possuem os mesmos coeficientes de Fourier:
Z 1 Z 1
1 i2πxn 1
f (x)e dx = g(x)ei2πxn , ∀n ∈ Z.
2π 0 2π 0
A recı́proca também é verdadeira: duas funções que tem todos os
coeficientes de Fourier iguais são iguais a menos de um conjunto de
probabilidade dx nula.
i i
i i
“mec˙New”
i i
2011/10/11
page 23
i i
23
Logo, a Série de Fourier, não distingue uma f e g que são iguais

a menos de um conjunto de probabilidade uniforme zero.
Exemplo 2.3. Seja X = [0, 1] × [0, 1]. Se P (A) = área de A, para

cada A ⊂ [0, 1] × [0, 1] (esta probabilidade como vimos antes é cha-
mada de uniforme), então um conjunto tem probabilidade zero para
P , se puder ser coberto por uniões de retângulos tal que a soma das
áreas destes retângulos pode ser tomada arbitrariamente pequena.
Exemplo 2.4. Considere em X = [0, 1] o conjunto A obtido da se-

guinte maneira. Primeiro retire o terço central do intervalo [0,1],
a seguir retire dos dois intervalos que sobraram os terços do meio.
Obteremos assim 4 intervalos. Retire novamente de cada um dos
4 intervalos os terços médios e prossiga assim indefinidamente. Na
etapa n teremos ao todo 2n intervalos disjuntos. O conjunto que sobra
deste procedimento de retirar infinitamente terços dos intervalos que
vão sobrando, é mostrado de maneira aproximada na Figura 2.3. Este
conjunto é denominado conjunto de Cantor. Considere a probabili-
dade P tal que P ([a, b]) = b − a para qualquer intervalo [a, b] ⊂ [0, 1].
O conjunto de Cantor tem probabilidade 0 para tal P . Para provar
isto, basta cobrir o conjunto de Cantor por união de intervalos tal
que a soma dos intervalos é arbitrariamente pequena.
Note que os 2n intervalos que restam do procedimento na etapa

n
n, contem C e tem soma total dos comprimentos igual a 2n 31 . Como
2n
3 converge a zero, então o conjunto de Cantor tem probabilidade
zero em [0,1] para a probabilidade uniforme.
O conjunto de Cantor não é um conjunto aberto. Como o conjunto
de Cantor tem probabilidade zero é portanto um conjunto “ralo”(ou
seja, muito pequeno) no intervalo [0, 1]. Este conjunto é o exemplo
mais elementar de fractal (ver definição em [Fa]).
Note que foi fundamental usar o critério da Definição 2.2 para
dizer que o conjunto de Cantor tem probabilidade zero.
Os conjuntos de probabilidade zero são considerados desprezı́veis
na análise probabilı́stica. Ou seja, se uma propriedade é válida para
todos os pontos de E, menos para um conjunto de probabilidade zero,
então do ponto de vista probabilı́stico tal propriedade é verdadeira.
Se escolhessemos um ponto ao acaso no intervalo [0,1] de acordo com
i i
i i
“mec˙New”
i i
2011/10/11
page 24
i i
a Probabilidade P do último exemplo, este ponto não estaria no con-

junto de Cantor, pois este conjunto tem probabilidade 0.
Definição 2.3. Para uma certa probabilidade P definida em X, di-

zemos que um conjunto B tem probabilidade total para P se X − B
tem probabilidade zero para P .
Exemplo 2.5. O conjunto dos irracionais no intervalo [0,1], isto

é o conjunto [0, 1] − Q, tem probabilidade total para a probabilidade
uniforme, pois Q ∩ [0, 1] tem probabilidade zero.
Diz-se que uma propriedade é válida em P -quase toda parte, se

ela é válida num conjunto de probabilidade total para P . Quando se
diz que um ponto x é escolhido ao acaso segundo um probabilidade
P , x é na verdade ao acaso dentro de um conjunto de probabilidade
total B. Este ponto de vista (ou seja se preocupar apenas com o que
é verdadeiro P -quase toda parte) é a essência da Teoria da Probabi-
lidade.
Definição 2.4. Um ponto x escolhido num conjunto de probabili-

dade total é denominado de um ponto “genérico no sentido proba-
bilı́stico”(para a probabilidade P ).
Nosso objetivo a seguir é analisar do ponto de vista estatı́stico (ou

probabilı́stico) a evolução temporal da órbita T n (x) de um difeomor-
fismo T : X → X. Iremos considerar uma probabilidade P sobre X
e tentaremos fazer afirmações que tenham sentido do ponto de vista
probabilı́stico. Isto é, o que se pode dizer para as órbitas T n (x) se
x for escolhido num conjunto de probabilidade total para P ? Em
outras palavras, desejamos obter propriedades das órbitas T n (x) de
pontos x escolhidos ao acaso de acordo com a probabilidade P (ou
seja pontos x genéricos).
As probabilidades P que são úteis para o entendimento da evolução
temporal das órbitas T : X → X, devem ter algum tipo de relação
com T .
Esta relação será descrita pela próxima definição.
Definição 2.5. Dizemos que P probabilidade sobre X é invariante

para um difeomorfismo T se P (T (A)) = P (A) para qualquer conjunto
A ⊂ X.
i i
i i
“mec˙New”
i i
2011/10/11
page 25
i i
25
Exemplo 2.6. Na última seção mostramos que o difeomorfismo T

associado ao bilhar convexo preserva área em E = [0, 1) × (−1, 1)
(Proposição 1.2, Capı́tulo 1). Logo, se P é definido por
área de A
P (A) = ,
2
então P é invariante para tal T . Neste caso a densidade ψ(t, θ) = 21 ,
define Pψ = P .
Note que no caso da Figura 2.1 (bilhar dispersor) tı́nhamos difi-
culdade em definir T : E → E porque algumas trajetórias T (t0 , θ0 )
poderiam bater numa quina. Como estamos utilizando um ponto de
vista probabilı́stico ficaremos satisfeitos se T estiver bem definido em
um subconjunto K ⊂ E de P -probabilidade total. Em muitos casos
tal propriedade é verdadeira e a análise dinâmica que faz sentido será
na verdade de T : K → K (ver [Ma]).
No caso do bilhar dispersor (ou outro qualquer com quinas) con-
sidere L = {(q0 , p0 )| tal que T (q0 , p0 ) bate numa quina ou p1 = 1
ou −1 } (ou seja a reta a partir de q com ângulo p intersecta uma
quina ou fica tangente a um lado). É fácil ver que nos casos mais co-
muns o conjunto L é uma curva diferenciável por partes e tem medida
bidimensional em E nula.
Considere agora K = E − ∪n∈Z T n L. É fácil ver que em K todos
os iterados de T n estão bem definidos e perdemos do conjunto E um
conjunto de medida 0 (pois P (E) = P (K) = 1). Nada foi perdido do
ponto de vista probabilı́stico com esta restrição.
Exemplo: Seja T (x) = x + λ (mod 1), T : [0, 1] → [0, 1], onde
λ é uma constante, então a probabilidade uniforme (ou seja dx) é
invariante para T . Isto segue trivialmente do fato que a inclinação
do gráfico de T é 1, logo para cada intervalo A a imagem T (A) tem
o mesmo comprimento total (pode ser a união de dois intervalos)
que A.
Considere agora uma função ϕ : E → R, que na maioria das vezes
vai representar algum observável do sistema (por exemplo, o valor da
posição t (neste caso ϕ(t, θ) = t) na curva C do bilhar considerado
na seção anterior).
Ao longo da evolução temporal do sistema começando em x (ou
seja, a órbita {x, T (x), T 2 (x), ..., T n (x), ...} começando no ponto x ∈
i i
i i
“mec˙New”
i i
2011/10/11
page 26
i i
Figura 2.4:
E) estaremos interessados em calcular o valor médio de ϕ, denotado

por
1
ϕm (x) = (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)))
m
ao longo da órbita de x do tempo 0 até o tempo m − 1.
Fazendo o número de iterações m tender a infinito, obteremos a
média assintótica média do observável ϕ ao longo da evolução tem-
poral iniciada em x:
1
ϕ̂(x) = lim (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x))).
m→∞ m
Estaremos assim obtendo uma informação de natureza assintótica

desta evolução temporal. Um dos tópicos de maior interesse da
Mecânica Estatı́stica é saber o que acontece em termos probabilı́sticos
(em x) com as médias temporais ϕ̂(x) e sua dependência em x.
O fı́sico L. Boltzmann estava interessado em entender o sistema
de partı́culas (da ordem de 1023 partı́culas) de um gás delimitado por
i i
i i
“mec˙New”
i i
2011/10/11
page 27
i i
27
um recipiente fechado. Um sistema com tantas partı́culas é difı́cil de

ser analisado do ponto de vista determinı́stico. O sistema com ape-
nas “uma”partı́cula colidindo elasticamente com a fronteira de uma
região bidimensional que apresentamos na seção anterior já apresenta
dificuldades de análise determinı́stica como vimos anteriormente (ver
Observação 1.1, Capı́tulo 1 em [L]). Prever a evolução temporal de
uma partı́cula após decorrido em tempo t muito grande é muito difı́cil
(devido a acumulação de erros nas aproximações), imagine analisar
um número enorme de partı́culas (1023 ) como acontece em um gás
em um compartimento fechado. Sendo assim, faz mais sentido, per-
guntar sobre a probabilidade de encontrar uma partı́cula numa região
D do recipiente. Este é o ponto de vista probabilı́stico da Mecânica
e que é o objeto da Mecânica Estatı́stica. Estaremos interessados em
fazer afirmações para pontos x “genéricos no sentido probabilı́stico”.
Para fixar idéias vamos considerar a evolução temporal
{T (x), T 2 (x), ..., T n (x)}
quando x = (q, p) descreve a posição de “uma”partı́cula de um gás
que está em q com velocidade p. Considere agora ϕ um observável do
sistema (θ, ou temperatura, etc...), isto é, ϕ é uma função do espaço
de fase x = (q, p) ∈ E tomando valores em R. O que se pode dizer
do valor médio ϕ̂(x)?
A Hipótese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann, que foi enunciada por L. Boltzmann no meio do século
XIX, afirmava que fixado um nı́vel de energia H0 , este valor ϕ̂(x) não
deveria depender de x neste nı́vel de energia H0 (no caso de um gás
num recipiente fechado).
Bem, a referida hipótese em termos tão amplos não resultou ser
verdadeira. Primeiro, vamos tentar entender em termos Matemáticos
mais precisos o que L. Boltzmann estava querendo afirmar com a sua
Hipótese Ergódica. Mais tarde, tentaremos esclarecer o que não foi
confirmado de tal hipótese.
Em termos matemáticos mais precisos, o que L. Boltzmann estava
afirmando, na verdade, é que deve existir uma probabilidade natural
P definida no nı́vel de energia X = {(q, p), H(q, p) = H0 }, tal que
dado uma função ϕ sobre X, deveria existir uma constante c tal que
para P -quase todo ponto x no conjunto X (o nı́vel de energia H0 ), o
i i
i i
“mec˙New”
i i
2011/10/11
page 28
i i
valor ϕ̂(x) é igual a c. P seria uma probabilidade natural invariante

associada ao sistema de partı́culas de um gás. Ou seja, que existiria
um conjunto B contido no nı́vel de energia H0 tal que P (B) = 0 e
para qualquer x ∈ X − B, deveria ser verdade que ϕ̂(x) = c. Em
outras palavras, que ϕ̂ é constante para pontos genéricos no sentido
probabilı́stico.
O Teorema de Birkhoff que será apresentado a seguir vai se referir
a questão mencionada acima.
A evolução temporal das condições iniciais x que são fisicamente
observadas no sistema constituido pelo gás são as trajetórias que
começam em x, onde x é escolhido num conjunto de probabilidade
total em relação a uma probabilidade natural P . Esta propriedade é o
fundamento do ponto de vista probabilı́stico da Mecância Estatı́stica.
A probabilidade P é chamada algumas vezes de estado de Gibbs
(terminologia usada em homenagem ao matemático W. Gibbs) do
sistema mecânico (ver [Ru], [E], [BS] e [KH] para referências). Para
simplificar estamos supondo que o gás vai ser descrito por uma única
partı́cula para evitar analisar problemas relativos às colisões entre
partı́culas do gás.
Não vamos definir aqui o que é um estado de Gibbs, mas queremos
apenas mencionar que no caso do bilhar numa curva convexa ele é
a probabilidade uniforme em E = [0, 1) × (−1, 1) (conforme Exem-
plo 2.6).
Definição 2.6. Seja P uma probabilidade invariante para um dife-

omorfismo T : X → X. Dizemos que P é ergódica se toda vez que
T (A) = A, A ⊂ X, então P (A) = 0 ou P (A) = 1.
Em outras palavras, uma probabilidade P é ergódica quando não

existem conjuntos invariantes pela ação de T que não sejam triviais
(dizemos que um conjunto A ⊂ X é trivial se P (A) = 0 ou P (A) = 1).
Observação 2.2. Note que é sempre verdade (ver Definição 1.2) que
P (∅) = 0 (∅ é o conjunto vazio) e P (X) = 1 (onde X é o conjunto
onde P está definido), e ainda que T (∅) = ∅ e T (X) = X, por
isto a necessidade de enunciar a definição de probabilidade ergódica
como foi feito acima (e não apenas dizendo que não existem conjuntos
invariantes). Os conjuntos X e ∅ são triviais.
i i
i i
“mec˙New”
i i
2011/10/11
page 29
i i
29
Figura 2.5:
Exemplo : A transformação T (x) = x + λ (mod 1), onde λ é uma

constante irracional, T definida no intervalo [0, 1) (ou no cı́rculo S 1 )
é ergodica para dx.
Seja A tal que T −1 (A) = A, então IA (x) = IT −1 (A) (x) = IA (T (x))
para todo x ∈ [0, 1).
Expresse IA (x) como Série de Fourier
∞
X
IA (x) = an e2πinx .
n=−∞
Como IA (x) = IA (T (x)) temos que

∞
X ∞
X
IA (x) = an e2πinx = an e2πin(x+λ) = IA (T (x)).
n=−∞ n=−∞
Portanto
∞
X ∞
X
an e2πinx = an e2πinλ e2πinx .
n=−∞ n=−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 30
i i
Como os coeficientes de Fourier são únicos an e2πinλ = an para

todo n ∈ Z. Como λ é irracional então nλ não é inteiro para todo
n (a menos que n = 0). A conclusão é que an = 0 para todo n 6= 0.
Portanto IA is constante (a menos de um conjunto de medida zero),
mas como só assume os valores 0 ou 1, ela é, a menos de um conjunto
de medida
R zero a função
R constante 0 ou a função
R constante
R 1. Logo
µ(A) = IA (x)dx = 0dx = 0 ou µ(A) = IA (x)dx = 1dx = 1
(porque funções que diferem apenas em um conjunto de medida zero
tem a mesma integral).
Se λ é racional T (x) = x + λ (mod 1) não é ergodica.
Observação 2.3. Um gás em um recipiente fechado, ao longo da sua
evolução temporal, tenderá a ocupar densamente todo o espaço dis-
ponı́vel, não deixando espaço para existirem regiões invariantes. Esta
observação traduz em termos fı́sicos aproximados o que o conceito de
ergodicidade expressa em termos matemáticos.
O fato da transformação bilhar preservar área e do fluxo Hamil-
toniano preservar volume os qualificam para os métodos de Teoria
Ergódica [A3].
Seja um difeomorfismo T : E → E, P = Pϕ probabilidade inva-
riante sobre E para T e ϕ : E → R função tomando valores reais
(observável). O próximo resultado é válido em geral e não precisare-
mos assumir que T é a transformação induzida pelo primeiro retorno
a uma seção transversal de um fluxo Hamiltoniano no bilhar convexo.
Um dos resultados Matemáticos mais relevantes para a Mecânica
Estatı́stica é o Teorema Ergódico de G. Birkhoff (1935) que afirma o
seguinte:
Teorema 2.1. (Teorema de Birkhoff ) Seja ϕ : E → R contı́nua,
R = Pψ probabilidade ergódica para T : E → E e suponha que
P
ϕ(y)dP (y) < ∞, então, existe c ∈ R tal que para todo ponto x,
genérico no sentido probabilı́stico em relação a probabilidade P , vale
que
1
c = ϕ̂(x) = lim (ϕ(x) + ... + ϕ(T m−1 (x))).
m→∞ m
O valor c pode ser obtido como

Z
c = ϕ(y)dP (y),
i i
i i
“mec˙New”
i i
2011/10/11
page 31
i i
31
ou seja, a integral de ϕ em relação a P .

Para a prova e para considerações mais gerais sobre o Teoria
Ergódica, referimos o leitor para [PY], [M1], [CFS] e [KH]. Esta Te-
oria permite um melhor entendimento de questões fundamentais da
Mecânica Estatistica [PP] e [Ru]. O ponto de vista do formalismo
DLR da Mecânica Estatistica é descrito em [G].
Em resumo o teorema de Birkhoff diz que existe um conjunto A
tal que P (A) = 1 tal que para todo x ∈ A vale que a média temporal
assintótica
n−1
1 X
ϕ̂(x) = lim ϕ(T j (x))
m→∞ m
j=0
é igual à integral espacial

Z Z
ϕ(y)dP (y) = ϕ(y)ψ(y)dy.
E
Observação: Mostramos em exemplo anterior que T (x) = x + λ

(mod 1) é ergódica para a probabilidade uniforme (a P tal P ([a, b]) =
b − a). É fácil ver por indução que T n (x) = x + nλ (mod 1). Seja
[a, b] intervalo qualquer e considere ϕ(x) = I[a,b] (x).
Podemos aplicar o teorema ergódico também neste caso e concluir
que existe K ⊂ [0, 1] tal que P (K) = 1 e para todo x ∈ K
n−1 Z
ˆ (x) = lim 1 X
I[a,b] I[a,b] (T j (x)) = I[a,b] (y)dP (y) = b − a > 0.
m→∞ m
j=0
Note que T j (x) ∈ [a, b], se e só se, I[a,b] (T j (x)) = 1. Portanto,
para x ∈ K a órbita {T n (x)|n ∈ Z} visita o conjunto [a, b].
Logo as órbitas {T n (x)|n ∈ Z}, para x quase todo ponto (em
relação a P ), vão determinar conjuntos densos em [0, 1].
Exemplo 2.7. Considere o estádio circular (l > 2) do Exemplo 1.4

e que foi descrito na seção anterior.
Um resultado não trivial obtido recentemente por [Bu] afirma que
a probabilidade natural P (a área) associada ao bilhar no estádio é
ergódica, isto é, a aplicação induzida no bordo pelo primeiro retorno
i i
i i
“mec˙New”
i i
2011/10/11
page 32
i i
T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1) é ergódica para a probabilidade

uniforme.
Considere a, b valores em [0,1) e ϕ : E → R a função indicador
de A = (a, b) × (−1, 1).
Para A um subconjunto de X, IA (z), a função indicador de A, é
a função tal que IA (z) = 1 se z ∈ A e IA (z) = 0 se z não está está
em A. R R
É fácil ver que IA (x)ψ(x)dx = A ψ(x) = P (A).
No caso em consideração neste exemplo de bilhares em E = [0, 1)×
(−1, 1) ψ(x) é constante igual a 1/2.
A função ϕ = IA não é contı́nua (tem descontinuidades numa
curva diferenciável por partes), mas o Teorema Ergódico também é
válido para tal tipo de função ϕ (ver [M1] e [CFS]).
É fácil ver que para x fixo e m ∈ N e ϕ = IA
1
(ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x))
m
é igual a
#{j ∈ {0, 1, ..., m − 1} tal que T j (x) ∈ (a, b) × (−1, 1)}
.
m
Sendo assim o limite
1
ϕ̂(x) = lim (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)) ),
n→∞ m
neste caso expressa o valor médio de vezes que a trajetória começando

em x bate na região do bordo do bilhar compreendida entre g(a) e g(b),
(onde g é a parametrização do bordo do bilhar). Neste caso ϕ̂(x)
vai descrever o que chamamos de tempo de ocupação assintótico da
região A.
O conceito de tempo de ocupação já foi apresentado antes na
Definição 25, Capı́tulo 3 [L], mas vamos repeti-lo a seguir.
Definição 37*: Considere T : E → E difeomorfismo, A ⊂ E e
x = (q, p) ∈ E. Dizemos que x tem um tempo de ocupação assintótico
de A igual a ôA (x) se existe o limite
# vezes que T j (q, p) ∈ A, j ∈ {1, 2, ..., n}
lim = ôA (x).
n→∞ n
i i
i i
“mec˙New”
i i
2011/10/11
page 33
i i
33
O valor c = ϕ̂(x) = IˆA (x) = ôA (x) é constante para todo x (fora
de um conjunto de R probabilidade 0) pelo Teorema de Birkhoff, e é
R IA dP
igual a ϕdP = 2 = P (A) = área de A = (b − a). Portanto,
graças ao Teorema Ergódico podemos calcular no Exemplo 2.7 o valor
exato do tempo de ocupação assintótica ôA (x) do conjunto A para x
quase toda parte; este valor é b − a.
Sendo assim, podemos fazer a seguinte previsão: no bilhar no
estádio com l = 2 (que é ergódico), se formos observar a partı́cula
depois de 1000 rebotes, dentre estes 1000 rebotes, aproximadamente
um número (b − a)1000 deles foram no arco de curva compreendido
entre g(a) e g(b).
Vamos relembrar agora a Definição no Capı́tulo 1 de ponto perió-
dico.
Dizemos que uma órbita {T n (q, p), n ∈ N} é periódica se existe
m ∈ N tal T m (q, p) = (q, p). Neste caso
{T n (q, p) , n ∈ N} = {(q, p), T (q, p), ..., T m−1 (q, p)}.
O valor m é denominado perı́odo de (q, p).
Observação 2.4. Note que o resultado sobre o tempo de ocupação
ôA (x) = ϕ̂(x) no estádio l > 0 não pode ser verdade para tôdas
as condições iniciais x = (q, p). Na Figura 1.5, mostramos duas tra-
jetórias a e b na parte interna do estádio, que correspondem à órbitas
periódicas para T de perı́odo dois, respectivamente {(qa , pa ), T (qa , pa )}
e {(qb , pb ), T (qb , pb )}. Na Figura 1.6 mostramos também no espaço
de fase (q, p) ∈ [0, 1) × (−1, 1) as duas órbitas acima mencionadas.
Estas órbitas naturalmente vão determinar tempos de ocupação dife-
rentes para o conjunto A que aparece na Figura 3.25. O tempo de
ocupação assintótico de A para a órbita a é zero e para a órbita b é
um.
Note que o comportamento desta duas trajetórias é totalmente
distinto do comportamento da trajetória descrita pela Figura 1.7 apre-
sentada na última seção. Para “qualquer ponto inicial x escolhido ao
acaso” de acordo com a probabilidade uniforme, a órbita T n (x) gera
a Figura 1.7.
Não existe contradição entre a Figura 1.7 e 1.6, pois no úlimo
caso a posição da condição inicial (q0 , p0 ) é muito particular, e esta
i i
i i
“mec˙New”
i i
2011/10/11
page 34
i i
fora do conjunto de probabilidade total para o qual vale o Teorema

de Birkhoff. A explicação para este fato é que estas duas condições
iniciais (qa , pa ) e (qb .pb ) não serão condições “genéricas”no sentido
estabelecido pela Definição 2.4 e pelo Teorema Ergódico. No entanto,
se escolhermos ao acaso (de acordo com P uniforme) a condição
inicial (q0 , p0 ), então (q0 , p0 ) será genérica e portanto vai satisfazer
a propriedade que o tempo ocupação ôA para um certo conjunto A
fixado, existe e independe da condição inicial. Isto é o que afirma o
Teorema Ergódico para ϕ = IA !
É importante destacar que na análise matemática e probabilı́stica
dos bilhares, as órbitas periódicas (principalmente as de perı́odo muito
alto) desempenham um papel importantı́ssimo no entendimento da
dinâmica das trajetórias.
Exemplo 2.8. No caso do sistema de duas partı́culas
x = (x1 , x2 , v1 , v2 )
que foi considerado no Exemplo 13 da Seção 4, Capı́tulo 1 [L], existe

um conjunto A denso (ver Definição 13, Capı́tulo 1 [L]) em R2 tal
que quando as massas m1 e m2 são tais que (m1 , m2 ) ∈ B, então é
possı́vel mostrar (ver [KMS]) que a probabilidade natural P associada
ao bilhar triangular é ergódica.
Logo, no caso em que (m1 , m2 ) ∈ A, as médias ϕ̂(x) para qualquer
função contı́nua ϕ definida sobre o bilhar triangular são as mesmas,
independentes da condição inicial x (contanto que x seja escolhido
ao acaso de acordo com a probabilidade P ).
Podemos portanto, analogamente ao procedimento do exemplo an-
terior, obter o valor exato ôB , onde B corresponde ao evento: a
posição x1 e x2 ao colidirem estão no intervalo (0.2, 0.5). Do Te-
orema Ergódico segue que ôB = P (B) e ôB independe de x (para
x num conjunto de probabilidade total). O valor ôB pode então ser
calculado facilmente
√
a partir de P .
m2
Quando m1 ∈ Q, o sistema acima considerado não é ergódico.
√
Acreditamos que com estes dois últimos exemplos tenha ficado

transparente a importância do Teorema Ergódico de Birkhoff para a
análise de propriedades estatı́sticas das órbitas dos fluxos Hamiltoni-
anos.
i i
i i
“mec˙New”
i i
2011/10/11
page 35
i i
35
Note que se P é ergódica e é sempre positiva em abertos então para

x P-quase toda parte a órbita {x, T (x), .., T n (x), ...} é um conjunto
denso; de fato, dado um aberto A como P (A) > 0 então
Z
0 < P (A) = IA (x)dP (x) = oA (x) =
1
lim (IA (x) + IA (T (x)) + ... + IA (T m−1 (x)) ).
n→∞ m
Neste caso algum IA (T j (x)) é igual a 1.
Para um sistema ergódico, o Teorema de Birkhoff descreve a ma-
neira matemática exata como deve ser entendida a hipótese de Boltz-
mann.
A teoria de Kolmogorov-Arnold Moser (KAM) (ver [KH] e Seção
13, Capı́tulo 3 [L]) desenvolvido no meio deste século mostrou que
para uma grande quantidade de Hamiltonianos a propriedade da er-
godicidade não é válida. Vamos a seguir, através de um exemplo, dar
uma breve idéia porque não é verdade a Hipótese de Boltzmann em
sua formulação mais geral.
Consideraremos agora o bilhar no ovo (Exemplo 1.4, Capı́tulo 1)
e T a aplicação induzida no bordo do bilhar conforme mostra Figu-
ra 1.8.
Observação 2.5. No caso do bilhar no ovo, existe uma evidência
numérica de haver um união finita de curvas fechadas invariantes
γi , i ∈ {1, .., n} para T (ver Figura 1.8), mostra claramente que tal T
não é ergódica. Isto porque
( [0, 1) × (−1, 1) ) − ∪i γi
possui um conjunto invariante de probabilidade uniforme positiva (por
exemplo a união das partes internas das γi ).
Isto pode ser observado numericamente em um computador, con-
siderando órbitas começando em condições iniciais que estão respec-
tivamente no interior e no exterior da curva.
Concluı́mos então que existe uma evidência numérica de que tal
sistema não é ergódico.
Este fato contraria então a Hipótese Ergódica de Boltzmann pois
T representa a evolução temporal de uma partı́cula de uma gás num
recipiente fechado.
i i
i i
“mec˙New”
i i
2011/10/11
page 36
i i
O leitor poderia argumentar que já para o bilhar no cı́rculo (Exem-

plo 1.2) o difeomorfismo T não é ergódico para a probabilidade uni-
forme em [0, 1) × (−1, 1) (uma linha horizontal l = (θ0 , t) invariante
por T determina em [0, 1) × (−1, 1) duas componentes invariantes
por T de medida uniforme não nulas). Para ser mais preciso, cabe
ressaltar que a Hipótese Ergódica de Boltzmann é em geral relaxada
e enunciada para um conjunto denso de possı́veis bordos de bilha-
res. O exemplo acima é persistente, isto é, para curvas diferenciáveis
convexas γ, que estão C 1 próximas da curva do ovo, o espaço de
fase da aplicação T induzida pelo bilhar em γ continua a determinar
curvas invariantes. Sendo assim, existem ao menos duas regiões bi-
dimensionais invariantes de probabilidade positiva e portanto pode-se
dizer que existem bilhares que não podem ser aproximados por bilha-
res tais que o correspondente T seja ergódico para a probabilidade
uniforme em [0, 1) × (−1, 1). Portanto, o exemplo do bilhar no ovo
nos parece indicar indicar numericamente que a Hipótese Ergódica
de Boltzmann não é verdadeira em geral. No exemplo do estádio cir-
cular da seção anterior, por usa vez, a hipótese é confirmada pois o
sistema é ergódico.
Na verdade não estamos mostrando matematicamente que a Hi-
pótese Ergódica de Boltzmann não é verdadeira, estamos apenas su-
gerindo através de exemplos e figuras obtidas no computador que
existe uma forte evidência numérica de que esta hipótese não é ver-
dadeira. Na Teoria KAM se obtem resultados matemáticos precisos
que mostram exemplos onde a hipótese não é verdadeira (ver [KH]).
Na Seção 3 vamos mostrar para aplicação “standard”a existência
de curvas invariantes, e assim dar uma demontração matemática de
que realmente a hipótese ergódica em alguns casos particulares não é
verdadeira.
Em alguns outros casos particulares importantes, no entanto, a
hipótese de Boltzmann resultou ser verdadeira como por exemplo em
variedades de curvatura constante negativa (ver [KH] e [A2]).
Vamos agora analisar o Teorema Ergódico para tempo continuo.
Definição 2.7. Considere para todo t (−∞ < t < ∞), uma trans-
formação St do espaço X em si mesmo, St : X → X, que satisfaça a
seguinte condição: para quaisquer t1 , t2 , St1 ◦ St2 = St1 +t2 . Chama-
remos tal famı́lia de um sistema dinâmico a tempo contı́nuo.
i i
i i
“mec˙New”
i i
2011/10/11
page 37
i i
37
Exemplo 2.9. Dada uma equação diferencial x′ = G(x), x ∈ Rn , o

fluxo φt associado a tal equação (conforme Definição 21, Capı́tulo 1
[L]) é um exemplo de um sistema dinâmico a tempo contı́nuo St = φt .
Exemplo 2.10. Considere α número real e defina St : R → R por
St (x) = x + tα, para todo real t. St é um sistema dinâmico a tempo
contı́nuo.
Exemplo 2.11. Considere α número real e defina St : [0, 1) → [0, 1)
por St (x) = x + tα (mod 1) para todo real t. Este sistema dinâmico
será muito importante em nossas futuras considerações.
Definição 2.8. A probabilidade µ é dita invariante em relação ao
sistema dinâmico {St } se, para todo conjunto B ⊂ X e para qualquer
t real, µ(St B) = µ(B).
Uma maneira equivalente de dizer que uma medida µ é invariante
para
R St : Para Rtoda função contı́nua φ e para todo t real vale que
φ(x)dµ(x) = φ(St (x))dµ(x).
O Teorema de Liouville (Teorema 4, Capı́tulo 3 [L]) mostra que
se φt é o fluxo associado a um Hamiltoniano H, então para todo t, e
para todo aberto A vale que área φt (A) = área de A.
Logo, neste caso, o sistema dinâmico St = φt deixa invariante a
probabilidade uniforme.
O Exemplo 33 do Capı́tulo 3 [L] mostra um exemplo de proba-
bilidade invariante sobre uma curva γ obtida através do tempo de
ocupação assintótico.
Exemplo 2.12. É fácil ver que o sistema dinâmico St do Exem-
plo 2.11 deixa invariante a probabilidade µ definida sobre [0,1) por
µ( [a, b] ) = b − a. Esta probabilidade, como vimos antes se chama
probabilidade uniforme em [0,1).
Dada uma órbita periódica γ(s), s ∈ [0, b], tal que γ(0) = γ(b)
defina a medida µ tal que para toda função contı́nua φ temos
Z Z b
φ(x)dµ(x) = φ(γ(s))ds.
0
A medida µ assim definida é invariante; de fato, para t fixo

Z Z b
φ(St (x))dµ(x) = φ(St (γ(s)))ds =
0
i i
i i
“mec˙New”
i i
2011/10/11
page 38
i i
Z b Z b
φ(St (Ss (γ(0)))ds = φ(St+s (γ(0)))ds.
0 0
Fazendo a mudança de variável s → s + t, obtemos

Z Z b Z b Z
φ(St (x))dµ(x) = φ(Ss (γ(0))ds = φ(γ(s))ds = φ(x)dµ(x).
0 0
Definição 2.9. O fluxo St é dito ergódico para µ se para todo con-

junto A ⊂ X tal que St (A) = A, ∀t ∈ R, então µ(A) = 0 ou µ(A) = 1.
Vamos agora considerar St = φt o fluxo associado a um campo de

vetores Hamiltoniano H em (q, p) ∈ R2n restrito a uma superfı́cie de
Hamiltoniano H constante.
Suponha que a superfı́cie S de energia constante H0 seja com-
pacta. Neste caso, como veremos na Seção 5, existe sempre uma
probabilidade invariante P para o fluxo Hamiltoniano φt restrito à su-
perfı́cie H(q, p) = H0 de Hamiltoniano constante. Esta probabilidade
k
P é a probabilidade P = PH0 = P k com densidade ψ = k∇Hk
k∇Hk
sobre H(q, p) = H0 (ver Seção 5) onde k é apenas uma constante
para normalizar a probabilidade P .
Tal probabilidade P definida sobre S é positiva em abertos de
S, ou seja, dado x ∈ S e ǫ > 0, então P (B(x, ǫ) ∩ S) > 0, onde
B(x, ǫ) = {y ∈ R2n | |x − y| < ǫ}.
Vamos tentar colocar a afirmação de Boltzmann de uma maneira
matematicamente mais precisa do que a que foi feita pelo mesmo no
século XIX.
A Hipótese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann para Hamiltonianos é análoga à anteriormente descrita
(no caso em que o tempo é discreto n ∈ N).
A Hipótese Ergódica para Hamiltonianos afirma que para todo va-
lor de energia H0 , PH0 é ergódico para o fluxo φt restrito a
H(q, p) = H0 .
É importante não confundir a ação de fluxo φt sobre o espaço
(q, p) ∈ R2n com a ação (restrita) do fluxo φt sobre uma superfı́cie
de Energia constante H0 .
A questão da validade ou não da Hipótese Ergódica de Boltzmann
influenciou sobremaneira a Fı́sica e a Matemática do século XX.
i i
i i
“mec˙New”
i i
2011/10/11
page 39
i i
39
Contra-exemplo 68: Lembre que o fluxo Hamiltoniano φt preserva

volume em R2n ou seja preserva a probabilidade uniforme em cada
subconjunto aberto limitado invariante X ⊂ R2n . A probabilidade
P em X = R2n neste caso não é ergódica para φt . Isto porque um
sistema com uma integral primeira não pode ser ergódico (lembre que
H é integral primeira) como veremos a seguir.
Se tomarmos o aberto limitado A ⊂ X (com probabilidade posi-
tiva para P portanto) dos pontos x ∈ R2n tal que E1 < H(x) < E2 ,
então o fluxo Hamiltoniano φt deixa A invariante pelo Teorema de
Conservação do Hamiltoniano e no entanto 1 > P (A) > 0. Logo, em-
bora o fluxo Hamiltoniano deixe invariante a probabilidade P , não é
verdade que P é ergódico para φt .
Outra questão de natureza distinta é: será que φt é ergódico
quando restrito a uma superfı́cie S de energia constante H0 ?
Teorema 2.2. (Teorema de Birkhoff) Seja um Sistema Dinâmico St
definido em X, preservando a probabilidade
R ergódicaR P = Pψ . Então
para toda função contı́nua f tal que X f (x)dP (x) = X f (x)ψ(x)dx <
∞, existe uma constante c e existe um conjunto B de probabilidade
total tal que para todo ponto x ∈ B
Z Z
1 t 1 t
c = lim f (Sτ x)dτ = lim f (S−τ x)dτ.
t→∞ t 0 t→∞ t 0
O valor c naturalmente depende de f e pode ser obtido como

Z Z
c= f (y)dP (y) = f (y)ψ(y)dy.
X X
Vamos recordar mais uma vez a definição de tempo de ocupação

assintótico (ver Seção 10, Capı́tulo 3 [L]), desta vez no caso de tempo
contı́nuo t ∈ R.
Definição 37**: Dado um conjunto A ⊂ X e uma condição inicial
x ∈ X, Z
1 t
lim IA (Sτ x)dτ = ôA (x)
t→∞ t 0
é chamado de tempo de ocupação assintótico de A começando em x.

Uma consequência importante do teorema anterior é que, no caso
de P ser ergódico para St , então para todo x em um conjunto B de
i i
i i
“mec˙New”
i i
2011/10/11
page 40
i i
probabilidade total para P , a órbita de x pelo sistema dinâmico St (x)

determina um tempo de ocupação assintótico de um conjunto aberto
qualquer A ⊂ X tal que ô(A)(x) = P (A).
Isto é verdade, porque pelo Teorema 2.2, dado um subconjunto A
e considerando f = IA acima obtemos
Z t Z
1
lim IA (Sτ x)dτ = IA (z)dP (z) =
t→∞ t 0 X
Z
= dP (z) = P (A) = c = constante
A
para x em um conjunto B de probabilidade total para µ.

Logo, se um sistema é ergódico, existe B tal que P (B) = 1 e para
x ∈ B o tempo de ocupação assintótico de um conjunto aberto A não
depende do valor x.
A analogia do Teorema Ergódico com tempo contı́nuo t ∈ R para
o Teorema Ergódico com tempo discreto n ∈ N visto anteriormente
é transparente.
Examinaremos, agora, um tipo importante de sistema dinâmico
com tempo contı́nuo: o grupo de translações a um parâmetro no toro.
Seja X =Torn = S 1 × S 1 × ... × S 1 (n fatores) o toro de dimensão
n. Um ponto desse espaço pode ser representado pelo sistema de
números complexos z = (z1 , z2 , ..., zn ), |zk | = 1, 1 ≤ k ≤ n. Note que
é possı́vel escrever zk = e2πixk (xk ∈ R); então, o mesmo ponto z pode
ser identificado com o sistema de números reais x = (x1 , x2 , ..., xn ) ∈
[0, 1)n , definidos mod 1 (neste caso, podemos assumir que 0 ≤ xk <
1). A primeira notação é conhecida como multiplicativa, e a segunda,
como aditiva.
Sendo assim iremos identificar o toro com o conjunto [0, 1)n onde
identificamos faces opostas do paralelepı́pedo. Definiremos o sistema
dinâmico das translações no toro Torn pela expressão
St z = (z1 e2πiλ1 t , z2 e2πiλ2 t , ..., zn e2πiλn t )
ou, equivalentemente, com
St x = (x1 + λ1 t( mod 1), x2 + λ2 t( mod 1), ..., xn + λn t( mod 1)),
i i
i i
“mec˙New”
i i
2011/10/11
page 41
i i
41
onde λ1 , λ2 , ..., λn são números reais fixos. Cada St é dita uma

translação no toro, e por isso {St } é chamado um grupo de translações
a um parâmetro em Torn , definido pelo vetor λ = (λ1 , λ2Q , ..., λn ).
n
Note que a probabilidade uniforme no toro dµ = k=1 dxk é
invariante em relação a {St }. Isto porque, como St (A) é apenas um
transladado de A, ∀A, então St (A) e A tem a mesma área. Logo St
n
preserva o volume dx R 1 ...dxn . Note que µ(Tor ) = 1. Sendo assim se
definirmos µ(A) = A dx1 ...dxn , a probabilidade uniforme µ resulta
ser invariante para o sistema dinâmico St em [0, 1)n .
O conjunto dos vetores a(t) = (e2πiλ1 t , e2πiλ2 t , ..., e2πiλn t ), −∞ <
t < ∞, define a trajetória do zero através da evolução temporal do
sistema dinâmico St .
O Sistema Dinâmico St acima definido é muitas vezes chamado
condicionalmente periódico, sendo λk (1 ≤ k ≤ n) suas frequências.
Exemplo 2.13. O exemplo mais simples de tais sistemas St foi

apresentado nos Exemplos 2.11 e 2.12: para α fixo, St (x) = x +
αt(mod1), α 6= 0. Neste caso a probabilidade invariante P é a proba-
bilidade uniforme em [0, 1). Uma pergunta natural é quando que P é
ergódica para tal St .
Vamos mostrar agora que tal P é sempre ergódica para tal St .
Observação 2.6. Pode-se mostrar (ver [M1]) que um fluxo {St }

Ré ergódico para µ, se e só se, vale que para toda função f tal que
X
f dµ <R ∞ e f (St (x)) = f (x) para todo x, então é porque f (x) =
const. = X f dµ para um conjunto de pontos x em um conjunto B
de probabilidade total para µ.
Vamos usar o resultado mencionado na observação acima para

mostrar que St é ergódico para a probabilidade uniforme.
Considere fixado um ponto x ∈ [0, 1). Observe que variando t,
St (x) percorre todos os valores possı́veis y do intervalo [0, 1). Logo,
para uma dada função f , f (St (x)) = f (x) significa que para todo
y ∈ [0, 1), f (y) = f (x). Logo f é constante. Sendo assim pela última
observação St é ergódico.
Vamos apresentar agora uma outra prova da ergodicidade da St
acima definida, e que vai motivar a demonstração do próximo teo-
rema. Considere um função f que seja invariante para St , ou seja,
i i
i i
“mec˙New”
i i
2011/10/11
page 42
i i
f (St (x)) = f (x) para qualquer x ∈ [0, 1). Escreva f em série de

Fourier X
f (x) = cs e2πisx .
s∈Z
Como f é invariante
X X
f (St (x)) = cs e2πis(x+αt) = cs e2πisαt e2πisx =
s∈Z s∈Z
X
= cs e2πisx = f (x).
s∈Z
Logo, concluı́mos pela unicidade da Série de Fourier de uma função,

que ∀s ∈ Z, ∀t ∈ R, cs e2πisαt = cs , ou seja que se cs 6= 0, para todo
t vale que e2πiαst = 1. Portanto α s = 0, e como α 6= 0, isto é im-
possı́vel a menos que s = 0. Portanto, cs = 0 para s 6= 0. Logo f é
constante em quase toda parte com relação a probabilidade uniforme
P pois sua série de Fourier é constante igual a c.
Logo, pela última observação St (x) = x + αt é sempre ergódico.
Será que St (x1 , x2 , .., xn ) = (x1 + λ1 t(mod1), ..., xn + λn t(mod1))
também é ergódico para a probabilidade uniforme? A resposta é
: nem sempre! Será necessário assumir alguma hipótese sobre os
λ1 , .., λn . Estas condições serão estabelecidas pelo próximo teorema.
Teorema 2.3. Para que um fluxo condicionalmente periódico St seja
ergódico é necessário e suficiente que os números λ1 , λ2 , ..., λn sejam
racionalmente independentes, isto é, que igualdades da forma s1 λ1 +
s2 λ2 + ... + sn λn = 0, onde s1 , s2 , ..., sn ∈ Z sejam possı́veis apenas
quando s1 = s2 = ... = sn = 0.
Demonstração:
Vamos utilizar o critério estabelecido pela última observação para
demonstrar o resultado desejado.
Primeiro, provaremos a suficiência. Suponhamos que os números
λ1 , λ2 , ..., λn
sejam racionalmente independentes.

Vamos mostrar que qualquer f tal que f (St (x)) = f (x), é tal que
f é constante fora de um conjunto de probabilidade uniforme nula.
i i
i i
“mec˙New”
i i
2011/10/11
page 43
i i
43
A função f em Torn tomando valores reais, pode ser expandida

em uma série de Fourier que convirja na média quadrática, ou seja,
X
f (x) = cs e2πi(s1 x1 +s2 x2 +...+sn xn ) ,
s
onde s = (s1 , s2 , ..., sn ) ∈ Zn , e a soma é tomada sobre a famı́lias de

s ∈ Zn .
Da invariância de f obtemos
X
f (St x) = cs e2πi[s1 (x1 +λ1 t)+s2 (x2 +λ2 t)+...+sn (xn +λn t)]
s
X
= cs e2πi(s1 λ1 +s2 λ2 +...+sn λn )t . e2πi(s1 x1 +s2 x2 +...+sn xn ) = f (x)
s
X
= cs e2πi(s1 x1 +s2 x2 +...+sn xn ) ,
s
a menos de um conjunto de probabilidade uniforme zero (lembre que

a série de Fourier de uma função f é definida a menos de um conjunto
de probabilidade uniforme 0.
Em virtude da unicidade do coeficiente de Fourier,
cs = cs e2πi(s1 λ1 +...+sn λn )t ,
isto é, para todo s ou cs = 0 ou e2πi(s1 λ1 +...+sn λn )t = 1. A segunda

igualdade só é válida quando (s1 λ1 + ... + sn λn )t = p, onde p ∈ Z.
Como t é arbitrário, isto acontece apenas se s1 λ1 + ... + sn λn = 0,
ou seja, se s1 = ... = sn = 0, pois estamos supondo que λ1 , ..., λn
eram racionalmente independentes. Logo, para todo s 6= (0, 0, ..., 0),
temos que cs = 0. Note que o argumento não pode ser aplicado a c0 .
Portanto, todos os coeficientes de Fourier cs tais que s 6= 0 são nulos.
Logo, temos que f (x) = c0 = constante a menos de um conjunto de
probabilidade zero. Portanto, pela Observação 2.6, concluı́mos que
P é ergódica.
Agora, provaremos a necessidade. Suponhamos que haja um vetor
não-nulo s = (s1 , ..., sn ) com coordenadas inteiras tais que s1 λ1 +...+
sn λn = 0. Então, a função f tal que
f (x) = e2πi(s1 x1 +...+sn xn )
i i
i i
“mec˙New”
i i
2011/10/11
page 44
i i
não é constante (mod 0), mas é invariante em relação a St pois
f (St x) = e2πi[s1 (x1 +λ1 t)+...+sn (xn +λn t)]
= e2πi(s1 λ1 +...+sn λn )t .e2πi(s1 x1 +...+sn xn ) = f (x).

Portanto, {St } não é ergódico, o que é uma contradição. Assim,
completamos a prova do teorema.
Exemplo 2.14. Segue do teorema acima que o sistema dinâmico
St (x1 , x2 ) = (x1 + t (mod1), x2 + αt (mod1))
é ergódico, se, e somente se, α é irracional.
Considere agora o Hamiltoniano H(q, p) = p21 + p22 + ... + p2n .

Para p0 = (λ1 , λ2 , ..., λn ) fixado considere o subconjunto D do
R2n constituı́do pelos pontos da forma
(q, p0 ) = (q1 , q2 , ..., qn , p1 , ..., pn ) = (q1 , q2 , ..., qn , λ1 , ..., λn ),
onde (q1 , q2 , ..., qn ) ∈ [0, 1]n .

Podemos considerar que este sistema Hamiltoniano oriundo de tal
H(q, p) está definido em q ∈ Rn (mod 1), descrevendo assim um fluxo
Hamiltoniano no toro [0, 1)n .
É fácil ver que D é invariante para o fluxo Hamiltoniano φt gerado
por H. Por exemplo, D pode ser obtido através de superfı́cies de nı́vel
de integrais primeiras do tipo Vi (q, p) = pi = λi . É também fácil ver
a projeção π1 (φt ) (onde π1 (q, p) = q) do fluxo φt é na verdade igual
ao St (q) = π1 ◦ φt (q, p0 ) acima descrito.
Como a velocidade p(t) das soluções (q(t), p(t)) do Hamiltoniano
H é constante igual a p0 = (λ1 , ..., λn ) então podemos pensar que
St é apenas uma mudança de coordenadas π1 do fluxo Hamiltoni-
ano (restrito a D) determinado por tal H. Sendo assim entender a
evolução temporal do sistema dinâmico St das translações no toro é
na verdade entender a evolução de um sistema mecânico periódico
sem energia potencial.
Observação 2.7. Com relação ao Teorema acima há um esclareci-

mento importante a fazer: em todos os nossos argumentos, a condição
i i
i i
“mec˙New”
i i
2011/10/11
page 45
i i
45
de ergodicidade do fluxo no toro, foi equivalente a independência ra-

cional dos números λ1 , ..., λn ; ora, nem sempre a condição de inde-
pendência racional dos números λ1 , ..., λn é verdadeira (por exem-
plo, se todos os λi forem racionais). Felizmente, o conjunto dos
(λ1 , ..., λn ) que não são racionalmente independentes, tem probabi-
lidade zero em relação a probabilidade de dλ1 ...dλn em [0, 1)n (ver
Exercı́cio 5).
Sendo assim, escolhendo um conjunto de valores (λ1 , ..., λn ) ao
acaso em Rn de acordo com a probabilidade uniforme em dλ1 ...dλn
obteremos um sistema que tem ótimas propriedades estatı́sticas. Por-
tanto, do ponto de vista probabilı́stico podemos afirmar que o sistema
observado na natureza (escolhendo os λ1 , ..., λn com probabilidade to-
tal em Rn ) possui propriedades estatı́sticas ótimas para as trajetórias
começando em x num conjunto de probabilidade total.
Dizemos que um sistema tem propriedades estatı́sticas ótimas se
para um conjunto de probabilidade total de condições iniciais, as tra-
jetórias visitam uma dada região A com a mesma frequência assin-
tótica.
Note que a afirmação do sistema ter ótimas propriedades estatı́s-
ticas não pode ser feita para “todos”os possı́veis sistemas λ1 , ..., λn
condicionalmente periódicos.
Exemplo 2.15. Considere um ponto de equilı́brio de um sistema Ha-
miltoniano natural unidimensional H(q, p) = 12 p2 + V (q) onde V (q)
2
tem mı́nimo local em 0. Suponha que d dq V (q)
2 |q=0 > 0. O sistema Ha-
miltoniano em torno do ponto (0, 0) é integrável e as curvas de nı́vel
para o Hamiltoniano são curvas fechadas envolvendo o ponto (0, 0).
Conforme vimos na Seção 7, Capı́tulo 3 expressão (3.5) [L], o
fluxo Hamiltoniano pode ser localmente escrito em coordenadas ação
- ângulo (θ, I) através da equação
θ̇ = w(I) , I˙ = 0.
As soluções deste sistema, como vimos antes são da forma

(θ(t), I(t)) = (θ0 + w(I0 ) t, I0 ), onde (θ0 , I0 ) é a condição inicial.
Logo, em variáveis ação-ângulo, o fluxo Hamiltoniano φt restrito
a curva de nı́vel I = I0 = constante, é da forma φt (θ0 , I0 ) = (θ0 +
w(I0 )t, I0 ).
i i
i i
“mec˙New”
i i
2011/10/11
page 46
i i
A partir de φt , considerando apenas a variável θ, obtemos no nı́vel

de energia correspondente a I0 o sistema dinâmico
St (θ) = θ + w(I0 ) t (mod 1).
Este sistema dinâmico foi analisado anteriormente e é sempre

ergódico.
Retornando as variáveis (q, p) o resultado análogo será também
verdadeiro.
Desta maneira, pelo que vimos acima, o fluxo Hamiltoniano φt
restrito a uma curva de Energia constante, próxima ao ponto de
equilı́brio é ergódico. Sendo assim, a Hipótese Ergódica de Boltz-
mann é verdadeira neste caso.
Será que a mesma propriedade é válida para o caso análogo n-
dimensional? 2
Considere agora o sistema n-dimensional H(q, p) = |p|2 + V (q)
com q e p em Rn e suponha que V (q) tenha mı́nimo local em q =
0 ∈ Rn . Suponha ainda que V (q) = 21 a21 q12 + .. + 21 a2n qn2 . Esta
hipótese não é muito restritiva, na verdade, pode-se mostrar que em
um sentido genérico, todo campo Hamiltoniano da forma H(q, p) =
|p|2 + V (q) que tem mı́nimo local q0 para V , pode ser represen-
tado localmente através de mudanças de coordenadas deste forma
(ver [A-M] e [Milnor]).
A equação de Hamilton, neste caso, é separável em n equações
′′
qi − ai qi = 0, i ∈ {1, 2, ..., n}.
Não é difı́cil ver que cada plano (qi , pi ) é invariante pelo fluxo Ha-
miltoniano φt , que cada trajetória (qi (t), pi (t)) é periódica no plano
(qi , pi ) e que são válidos em cada um destes planos (qi , pi ) os resul-
tados que obtivemos na Seção 7, Capı́tulo 3 [L], obtendo variáveis
ação-ângulo (θi , I i ) e frequências wi = w(I i ) = ai , i ∈ {1, 2, ..., n}.
O fluxo Hamiltoniano φt em coordenadas ação-ângulo é dado por
(θi (t), I i (t)) = (θ0i + ai t (mod1), I0i ).
É fácil ver que o conjunto dos (θ1 , I 1 , θ2 , I 2 , ..., θn , I n ) tal que
I 1 = I01 , I 2 = I02 , ..., I n = I0n
define uma superfı́cie S invariante para o fluxo Hamiltoniano.
i i
i i
“mec˙New”
i i
2011/10/11
page 47
i i
47
Logo fixada a condição inicial (θ01 , I01 , θ02 , I02 , ..., θ0n , I0n ), de maneira
análoga ao caso unidimensional tratado acima, nas coordenadas
(θ1 , .., θn ) o fluxo Hamiltoniano φt restrito a S se escreve como
St (θ01 , ..., θ0n ) = (θ1 (t), θ2 (t), ..., θn (t)) =
= (θ01 + ai t(mod1), ..., θ0n + an t(mod1))

e define em S uma translação St condicionalmente periódica no sen-
tido anteriormente considerado.
Pergunta: O fluxo Hamiltoniano é ergódico quando restrito a tal
superfı́cie S?
Como veremos, a resposta é afirmativa se os ai são racionalmente
independentes.
Note que o resultado a seguir não é para a superfı́cie de Ener-
gia constante E, mas para a superfı́cie S acima definida (e que está
estritamente contida num nı́vel de Energia E).
A partir do Teorema 2.3 e da Observação 2.7, concluı́mos que no
caso do sistema mecânico com potencial V (q) = 21 a21 q12 + ... + 21 a2n qn2 ,
o fluxo φt = St é ergódico em S se os a1 , ..., an são escolhidos ao
acaso de acordo com a probabilidade uniforme. Em função do que
foi dito acima no caso de um sistema mecânico real, assumir que os
ai satisfazem tal propriedade é uma hipótese bastante razoável.
O resultado obtido para (θ1 , I 1 , ..., θn , I n ) pode ser tranferido via
mudanças de coordenadas para o sistema Hamiltoniano inicial nas
variáveis (q, p). Sendo assim, podemos afirmar neste caso, que lo-
calmente em torno do ponto de equilı́brio (0, 0) no plano (q, p), a
Hipótese de Boltzmann vale para a superfı́cie com variável Ação
I0i , i ∈ {1, 2, .., n} constante, se o potencial V (q) = 21 a21 q12 + ... 12 a2n qn2
é tal que os ai , i ∈ {1, .., n} são escolhidos ao acaso de acordo com
a probabilidade uniforme em Rn . Sendo assim, localmente e neste
sentido um pouco mais fraco (restrição sobre uma escolha ao acaso
dos ai ), a Hipótese de Boltzmann é verdadeira.
Chamamos a atenção para um fato: a ergodicidade do fluxo St
não implica a ergodicidade do difeomorfismo T = St para um valor t
fixo.
Agora nos concentraremos no estudo de uma das muitas aplicações
dos sistemas dinâmicos no toro: o problema de Lagrange, que surgiu
i i
i i
“mec˙New”
i i
2011/10/11
page 48
i i
de algumas questões de Mecânica Celeste e que tem estimulado o

desenvolvimento da teoria das funções quase periódicas.
Considere um sistema constituı́do por n pêndulos com hastes de
tamanhos distintos acoplados um ao outro e com o extremo inicial
fixo (ver Figura 2.4). Sejam n números complexos a1 , a2 , ..., an (n
vetores no plano). Examinaremos a curva no plano complexo dada
pela equação
z(t) = a1 e2πiλ1 t + a2 e2πiλ2 t + ... + an e2πiλn t .
O significado geométrico da função z é o seguinte: suponhamos

que haja um vetor a1 no plano, que o vetor a2 esteja ligado à extre-
midade de a1 e que cada um dos outros esteja ligado à extremidade
do anterior. Se a1 girar em torno de sua origem fixa (o ponto (0,0))
com velocidade angular constante λ1 , a2 girar ao mesmo tempo em
torno de sua origem (a extremidade de a1 ) com velocidade angular λ2
e assim por diante, a curva dada por z é a trajetória da extremidade
do vetor an . A Figura 2.5 ilustra o caso em que n = 3.
Suponhamos que z(t) não se anule para nenhum t. Então podemos
representar z(t) na forma
z(t) = r(t)e2πiφ(t) ,
onde φ é uma função contı́nua de t (veja a Figura 2.5).

Lagrange formulou a seguinte pergunta: “Existe
1
ω = lim φ(t),
t→∞ t
e, se existir, como podemos determiná-lo?” Em outras palavras,
com que velocidade angular média a extremidade do vetor an gira
em torno da origem do vetor a1 ?
A resposta, no caso em que
|a2 | + |a3 | + ... + |an | < |a1 | , (2.1)
é simples de ser obtida, pois φ(t) = λ1 t + α(t), onde α é uma função

limitada, ou seja, |α(t)| ≤ αmáx. Claramente, temos que ω = λ1 .
Isto se deve ao fato que a rotação limite de z(t) é determinada
apenas por a1 , pois as outras hastes são muito curtas em relação a
a1 .
i i
i i
“mec˙New”
i i
2011/10/11
page 49
i i
49
Se a desigualdade (2.1) não for válida, o problema torna-se razo-

avelmente difı́cil, sendo que o próprio Lagrange o resolveu somente
com dois vetores.
Consideraremos, agora o caso genérico com n hastes, onde exibi-
remos a relação entre esse problema e a teoria ergódica.
Tomando os logaritmos de ambos os lados da equação de z(t),
obtemos
1
φ(t) = Re log z(t) ,
2πi
(onde Re(z) representa a parte real de z, isto é, Re(a + bi) = a) e
então
n
P
′
λk ak e2πiλk t
dφ 1 z (t) k=1
(t) = Re = Re P n =
dt 2πi z(t)
ak e2πiλk t
k=1
n
P
λk |ak |e2πi(xk +λk t)
= Re k=1
Pn ,
|ak |e2πi(xk +λk t)
k=1
onde x = (x1 , x2 , ..., xn ) determina a posição inicial dos vetores a1 ,
a2 , ..., an , ou seja,
ak = |ak |e2πixk , 1 ≤ k ≤ n
(note que, utilizando a igualdade anterior, podemos escrever
z(t) = |a1 |e2πi(x1 +λ1 t) + |a2 |e2πi(x2 +λ2 t) + ... + |an |e2πi(xn +λn t) ).
Consideremos o toro Torn = [0, 1)n e o fluxo condicionalmente
periódico determinado pelo vetor λ = (λ1 , λ2 , ..., λn ). A medida uni-
forme µ no toro (visto como subconjunto do Rn ) é invariante para o
fluxo como já vimos antes. Suponhamos inicialmente que os números
λ1 , ..., λn sejam racionalmente independentes, de forma que o fluxo
correspondente seja ergódico.
Usando a notação aditiva, definamos a seguinte função em Torn :
Pn
λk |ak | e2πixk
k=1
f (x) = f (x1 , ..., xn ) = Re P n . (2.2)
|ak | e2πix k
k=1
i i
i i
“mec˙New”
i i
2011/10/11
page 50
i i
Então, é válida a igualdade

dφ
(t) = f (St x),
dt
e, por isso, Z t2
φ(t2 ) − φ(t1 ) = f (Sτ x)dτ.
t1
O limite que desejamos encontrar pode ser, portanto, reescrito

como Z
φ(t) 1 t
lim = lim f (Sτ x)dτ.
t→∞ t t→∞ t 0
Se a função f fosse limitada e contı́nua, este limite existiria para

todo x ∈Torn e seria, de acordo com o teorema ergódico, igual a
Z
f dµ.
Torn
Contudo, o denominador em (2.2) pode se anular. A condição
n
X
|ak |e2πixk = 0 (2.3)
k=1
é, na verdade, um sistema de duas equações em relação a x1 , ..., xn

(tanto a parte real como a imaginária da soma devem ser iguais a
zero). Isso implica que os pontos onde a equação (2.3) vale constituem
uma subvariedade diferenciável de codimensão 2 em Torn = [0, 1)n .
Portanto, o conjunto de todas as trajetórias que a interceptam é uma
subvariedade de dimensão n − 1, e sua probabilidade uniforme em
[0, 1)n é zero. Então, para uma trajetória escolhida aleatoriamente, a
equação (2.3) não vale com probabilidade 1. Usando essas considera-
ções, suponhamos que o teorema ergódico seja aplicável e substitua-
mos a integral ao longo da trajetória pela integral sobre o toro.
Temos que
n
P
Z Z λk |ak | e2πixk n
X
k=1
n
f dµ = Re n dx1 dx2 ...dxn = λk |ak | Wk ,
Tor Torn P
|ak | e2πixk k=1
k=1
i i
i i
“mec˙New”
i i
2011/10/11
page 51
i i
51
onde Z
e2πixk
Wk = Re n dx1 ...dxn .
Torn P |aj | e2πixj
j=1
É importante interpretarmos esse resultado. Para tal fim, deve-

mos reescrever a integral sobre o toro na forma de integrais iteradas,
efetuando a integração em relação a xk . Então,
Z Z 1
e2πixk
Wk = Re 2πixk
dxk dx1 ...dxk−1 dxk+1 ...dxn ,
Torn−1 0 B + |ak | e
onde B é o somatório de todos os termos tais que j 6= k.
Quando xk varia de 0 a 1, o ponto Z = B + |ak | e2πixk descreve
um cı́rculo C no plano complexo na Figura 2.5. Portanto,
Z 1 Z 1 ′ Z
e2πixk 1 Z (xk ) 1 1
2πixk
dxk = dxk = dZ.
0 B + |ak | e 2πi |ak | 0 Z(x k ) 2πi |ak | C Z
A última expressão é igual a 1|ak |, se o disco delimitado por C

contém a origem; caso contrário, é igual a zero.
O cı́rculo delimita um disco contendo a origem se |B| < |ak |.
Logo,
1
Wk = P (x1 , ..., xk−1 , xk+1 , ..., xn ) ∈ Torn−1 | |B| < |ak | ,
|ak |
onde P é a probabilidade de Lebesgue em Torn−1 .

A independência racional de λ1 , ..., λn implica a de
λ1 , ..., λk−1 , λk+1 , ..., λn .
Portanto, o fluxo em Torn−1 também é ergódico. Como, nesse

caso, o tempo relativo que uma trajetória escolhida aleatoriamente
permanece em um dado conjunto mensurável é igual à probabilidade
deste, o resultado obtido pode ser interpretado da seguinte maneira:
|ak | Wk é a parte desse tempo em que a rotação do vetor ak contribui
para a função φ.
O problema de Lagrange ilustra um fato que é bastante natural em
Mecânica Clássica: existe um conjunto desprezı́vel de situações ruins,
i i
i i
“mec˙New”
i i
2011/10/11
page 52
i i
mas para condições iniciais fora deste conjunto de probabilidade zero,

um resultado bastante forte e preciso do ponto de vista estatı́stico
pode ser enunciado para o sistema mecânico em consideração.
Exercı́cios
1. Mostre que se A = γ for uma curva diferenciável em [0, 1]×[0, 1],
então A tem probabilidade zero para probabilidade uniforme em
[0, 1] × [0, 1].
2. Considere P a probabilidade uniforme em [0, 1]. Mostre que se

F é um difeomorfismo de classe C 1 de [0, 1] em si mesmo e A
tem probabilidade zero, então F (A) tem probabilidade zero.
3. Seja T (x) = 2x (mod 1), T [0, 1] → [0, 1]. Mostre que T é in-
variante e é ergódica para a probabilidade uniforme P . Su-
gestão: considere um conjunto A e escreva IA em série de
Fourier. A seguir, suponha que T −1 (A) = A, e conclua que
IT −1 (A) (x) = IA ◦ T (x) = IA (x). O resultado é obtido igua-
lando os correspondentes coeficientes de Fourier de IA e IA ◦ T .
4. Mostre que se λ é irracional, então T (x) = x + λ (mod 1),

T [0, 1] → [0, 1], é tal que existe um conjunto K ⊂ [0, 1] tal que
para todo x ∈ K a órbita de x é densa em [0, 1].
5. Mostre que uma superfı́cie de dimensão d < n em Rn tem

probabilidade uniforme 0 em Rn
6. Mostre que o conjunto dos pontos (x1 , x2 , ..xn ) racionalmente

independentes tem medida total em Rn .
i i
i i
“mec˙New”
i i
2011/10/11
page 53
i i
Capı́tulo 3
A Teoria de Aubry para

Quase-Cristais e
Exemplos do Tipo
KAM
Vamos descrever a seguir uma versão discretizada da Ação de um

Sistema Hamiltoniano que é semelhante em um certo sentido ao pro-
cedimento que utilizamos na seção 11 na qual analisamos bilhares
determinados por curvas convexas. Neste modêlo o fênomeno deno-
minado KAM (de Arnold, Kolmogorov e Moser) irá aparecer e iremos
fazer uma análise matemática do problema em primeira aproximação.
Ressaltamos que alguns dos resultados apresentados nesta seção
não estão de todo formalizados de maneira matematicamente rigo-
rosa. Nosso objetivo é apresentar algumas das idéias e conceitos
principais como motivação para o estudo da Teoria de Aubry-Mather
[CRZ], [Au1], [Au2], [CI], [Fat], [M2], [MH], [MF], [dL], [B] e [LC].
A equação de Hamilton para o Hamiltoniano natural H(q, p) =
1 2
2 p − V (q), q, p ∈ R é
q̇ = p
53
i i
i i
“mec˙New”
i i
2011/10/11
page 54
i i
54 [CAP. 3: A TEORIA DE AUBRY
∂V
ṗ = .
∂q
Trocamos o sinal do potencial V acima apenas para obter ao fi-
nal de nossas considerações um sistema a tempo discreto dentro da
notação de Aubry [Au1] e [Au2].
Uma versão em diferenças finitas de tal equação é
qi+1 = qi + pi+1 ∆t
∂V
pi+1 = pi + ∆t |q .
∂qi i
Tomando ∆t = 1, obtemos
∂V
G(qi , pi ) = (qi+1 , pi+1 ) = (qi + pi+1 , pi |q ).
∂qi i
O leitor pode facilmente checar que tal transformação do plano
no plano preserva área, bastando para isso mostrar que a matriz
Jacobian tem determinante 1.
Aplicações do tipo acima representam uma versão discretizada
das equações de Hamilton e preservam área como veremos em breve
(ver Lema 3.1).
Na verdade existe um modêlo com real significado fı́sico que pode
ser representado por tal aplicação. Este modelo (ver [B], [MF], [Au1],
[Au2] e [Me] para mais detalhes) será brevemente descrito abaixo.
A teoria que vamos considerar agora aparece na análise de alguns
modelos fı́sicos para ions mergulhados em plasma. Consideraremos
também alguns exemplos da Teoria KAM que aparecem no modêlo.
Não iremos fazer uma análise completa da equação das curvas
que aparecem nos fenômenos da Teoria KAM (Kolmogorov-Arnold-
Moser), mas iremos apenas dar uma visão esquemática de como ana-
lisar a equação associada às curvas KAM em primeira aproximação.
O problema com esta simplificação permitirá ao leitor ter uma idéia
porque aparecem pequenos denominadores e propriedades da Teoria
dos Números (ver [Le] e [Kh] para referência) e das Séries de Fourier
(ver [Fi] e [Ju] para referência) na Teoria. Com esta simplificação
estaremos evitando certos detalhes técnicos complicados (mas im-
portantes [A2], [H] e [Ba]), e cuja dificuldade está acima do nı́vel que
desejamos manter no presente texto.
i i
i i
“mec˙New”
i i
2011/10/11
page 55
i i
55
Considere na reta real o Potencial V (u) periódico de perı́odo 1

e assuma também que V (0) = 0, V ′ (0) = 0 e V ′′ (u) > 0, ∀u ∈
(−1/2, 1/2] (ou alternativamente em (0, 1]). Vamos considerar (Fi-
gura 3.1) como um caso particular importante o exemplo em que
1
V (u) = (1 − cos 2πu).
2
O modelo que vamos analisar é descrito por vários átomos cuja
posição ui ∈ R é descrita por arranjos {ui }i∈Z , onde i ∈ Z. Estes
átomos formam uma cadeia e estão acoplados de forma que cada
átomo na posição ui sofre influência apenas dos átomos vizinhos nas
posições ui−1 e ui+1 .
Nosso objetivo é analisar os arranjos {ui }i∈Z que tem significado
fı́sico real. A seguir vamos descrever como são tais arranjos.
O termo de energia cinética na reta real será dado por
1 2
W (u) = u ,
2
que vai ser na verdade uma função da distância entre ui+1 e ui . Mais
precisamente, a energia cinética será dada por
1
W (ui+1 − ui ) = (ui+1 − ui )2 .
2
Fazendo um analogia com a Mecânica Clássica, o valor ui+11−ui

faz o papel da velocidade (ou momento) no modelo, e assim por sua
vez 12 (ui+1 − ui )2 desempenha o papel da Energia Cinética.
A idéia neste modelo é substituir equações diferenciais da Mecânica
Clássica por equações de diferenças. Deste modo, de maneira análoga,
é natural introduzir um parâmetro externo λ que vai estabelecer a
altura do poço do potencial λV .
De maneira análoga ao caso clássico (não discretizado), o La-
grangiano natural S agindo sobre cada partı́cula, é Energia Cinética
menos Energia Potencial, ou seja a ação individualizada ligando ui a
ui+1 vai ser dada por
S(ui+1 , ui ) = λV (ui ) + W (ui+1 − ui ) (3.1)
i i
i i
“mec˙New”
i i
2011/10/11
page 56
i i
Definição 3.1. Considere um arranjo {ui }i∈Z . Para n < m fixados,

a Ação Total do arranjo {ui }i∈Z de n a m é dada por
m−1
X m−1
X
φ({ui }) = λV (ui ) + W (ui+1 − ui ) = S(ui+1 , ui ).
i=n i=n
A Ação Total de n a m é a soma R das Ações individuais (3.1) e

corresponde na Mecânica Clássica à Sdq.
Definição 3.2. Um arranjo {ui }i∈Z vai ser minimal para a Ação
Total, se para todo n e m fixos n < m, e para todo arranjo {vi } tal
que vn = un e vm = um vale que
m−1
X
φ({ui }) = λV (ui ) + W (ui+1 − ui ) ≤ φ({vi }) =
i=n
m−1
X
= λV (vi ) + W (vi+1 − vi ).
i=n
A condição de um arranjo ser minimal, acima definida, é clara-

mente inspirada pelo Princı́pio de Mı́nima Ação (ver Seção 9, Capı́-
tulo 3 [L]).
Definição 3.3. Um arranjo {ui }i∈Z é crı́tico para a Ação Total se

para todo n e m, n < m fixados vale que
∂φ
= 0, ∀ i ∈ {n + 1, m − 1}.
∂ui
Isto é, um arranjo é crı́tico se mantendo os extremos un e um fixos

e variando as posições intermediárias ui , a expressão acima é crı́tica
para tais variações ui . Note a semelhança da última expressão com
a Proposição 1.2 da Seção 1 sobre bilhares convexos.
Todo arranjo minimal é claramente crı́tico, embora a recı́proca
não seja sempre verdadeira. Na teoria que vamos brevemente des-
crever a seguir, do ponto de vista fı́sico e também do ponto de vista
matemático, os resultados interessantes concernem os arranjos mini-
mais e não apenas os arranjos crı́ticos.
i i
i i
“mec˙New”
i i
2011/10/11
page 57
i i
57
Os arranjos que são fisicamente observados no problema acima

descrito são na verdade os arranjos minimais.
Primeiramente vamos determinar um método para encontrar ar-
ranjos crı́ticos.
Note que para um arranjo {ui }i∈Z , cada valor ui , n < i < m
aparece na ação total φ de n a m em apenas dois termos
S(ui+1 , ui ) + S(ui , ui−1 ) =
λV (ui ) + W (ui+1 − ui ) + λV (ui−1 ) + W (ui − ui−1 ).

Para calcular a expressão do arranjo crı́tico, derivamos a última
expressão em relação a ui e considerando V , W como acima, obtere-
mos
0 = λV ′ (ui ) − (ui+1 − ui ) + (ui − ui−1 ).
Logo, obtemos a equação
0 = λV ′ (ui ) + 2ui − (ui+1 + ui−1 ),
a qual toda solução crı́tica {ui }i∈Z deve satisfazer.

Sendo assim, obtemos de maneira equivalente
λ ui+1 + ui−1
− V ′ (ui ) = ui − . (3.2)
2 2
Por exemplo, como V (0) = 0 e W (0) = 0, concluı́mos que o
arranjo ui = 0, ∀i ∈ Z, é crı́tico para ação total.
Uma interpretação pictórica da expressão (3.1) é que a força (me-
nos a derivada do potencial)
λ
− V ′ (ui )
2
é equilibrada pelo deslocamento de ui da posição de equilı́brio (ponto
médio ui+1 +u
2
i−1
) da corda elástica ligando ui−1 a ui+1 (Lei de Hooke)
conforme mostra Figura 3.28.
Deste ponto de vista, o arranjo {ui }i∈Z parece descrever um
elástico fixo na posição un e um , em que pela Lei de Hooke, o afasta-
mento do elástico na posição ui da posição intermediária ui−1 +u2
i+1
,
é equilibrada pela força criada pelo potencial agindo em cada reta
x = i.
i i
i i
“mec˙New”
i i
2011/10/11
page 58
i i
O modelo acima descreve exatamente quase-cristais, que são ob-

jeto de estudo recente em Fı́sica da Matéria e da Teoria do Plasma
[Au].
Voltemos agora a analisar que propriedades podemos obter sobre
os arranjos crı́ticos definidos acima.
A expressão (3.2) para um arranjo crı́tico {ui }i∈Z pode ser ex-
pressa numa relação de três termos como
ui+1 = λV ′ (ui ) + 2ui − ui−1 .
No modelo em que V (u) = 12 (1 − cos 2πu), um arranjo crı́tico (ver

Definição 3.3) pode ser calculado conforme (3.2) por uma relação de
três termos
ui+1 = λπ sin 2πui + 2ui − ui−1 .
Logo o arranjo {ui }i∈Z pode ser calculado a partir de u0 e u1
inicial pela relação de três termos acima descrita.
Passando a uma relação de pares (ui+1 , ui ) obtemos

ui+1 ui 2ui + λπ sin 2πui − ui−1
=T =
ui ui−1 ui
a partir de coordenadas iniciais (u1 , u0 ) ∈ R2 .

As soluções crı́ticas {ui }i∈Z são obtidas portanto através das ór-
bitas de T .
É natural interpretar o momento pi como uma nova variável,
pi = ui − ui−1 ,
em função da analogia do problema descrito acima com a versão

discretizada da Mecânica Clássica no espaço de fase (p, q) = (p, u).
Vamos a seguir expressar a aplicação T mencionada anteriormente
em coordenadas (p, u).
Antes disso, note também que se {ui }i∈Z é arranjo crı́tico, {ui +
1}i∈Z também é arranjo crı́tico. Este fato nos sugere considerar os
ui (mod 1) para simplificar o problema.
Algumas vezes vamos considerar os ui tomados (mod 1) e outras
vezes não. No primeiro caso (ui , pi ) está em [0, 1)×[0, 1) e no segundo
caso (ui , pi ) está em R2 .
Para não confundir o leitor vamos reservar a letra q para u (mod 1).
i i
i i
“mec˙New”
i i
2011/10/11
page 59
i i
59
Seja qi o valor ui (módulo 1), como pi+1 = ui+1 − ui (mod 1) (que

é o mesmo que qi+1 − qi (mod 1)), obtemos a transformação acima
definida T agindo sobre ( pi , qi ) ∈ [0, 1) × [0, 1) como

pi pi+1 pi + λπ sin 2πqi (mod 1)
T = =
qi qi+1 pi+1 + qi (mod 1)
que é conhecida como a aplicação padrão, ou standard.

Logo a iteração de uma órbita T n (p0 , q0 ) = (pn , qn ), n ∈ Z a
partir de uma condição inicial (p0 , q0 ), vai definir na segunda variável
ui o arranjo {ui }i∈Z (a menos de um inteiro) a solução crı́tica do
problema acima descrito. Uma infinidade de soluções {qi }i∈Z são
possı́veis, basta tomar diferentes condições iniciais (p0 , q0 ). Faremos
a seguir (Definição 3.4, Capı́tulo 3) uma restrição que vai determinar
um arranjo {ui }i∈Z de maneira única.
Observo que tomar qi (mod 1) é bastante natural (ou seja supor
que o espaço de configuração é compacto), mas tomar pi (mod 1),
em princı́pio não. No caso do modêlo de quase-cristais, no entanto,
é natural esta segunda hipótese. Estas duas hipóteses de qualquer
jeito permitem considerar a iteração de T num espaço compacto (ou
seja fechado e limitado).
Duas trajetórias minimais não podem se cruzar duas vezes como
na Figura 3.2. Esta propriedade é conhecida como a condição Twist
(ver [CRZ] para mais detalhes).
Considerando potenciais V mais gerais (V (u) ou V (q) sempre
periódico de perı́odo 1) obterı́amos de maneira análoga uma T defi-
nida em [0, 1] × [0, 1] → [0, 1] × [0, 1] por
′
pi pi+1 pi + λV (qi )
T = = .
qi qi+1 pi+1 + qi
Não estamos colocando o termo (mod 1) na expressão acima, mas
ela está implı́cita no modelo em consideração.
A aplicação padrão preserva área. Mostraremos na verdade no
caso mais geral (não somente para V (q) = 12 (1 − cos 2πq)), que a
aplicação T , obtida acima a partir de um potencial V qualquer, pre-
serva área. As Figuras desta seção que descrevem iterações de T para
o caso de V (u) = 12 (1−cos 2πu) ocorrem também em outras situações
quando se considera um V geral.
i i
i i
“mec˙New”
i i
2011/10/11
page 60
i i
Vamos usar, a partir de agora, indistintamente as letras q ou u e

o contexto vai indicar qual da duas estamos considerando.
Note a semelhança da aplicação acima definida com a que apresen-
tamos no começo desta seção e associada à discretização da equação
de Hamilton.
Lema 3.1. A aplicação T dada por
′
pi pi+1 pi + λV (ui )
T = = (3.3)
ui ui+1 pi+1 + ui
preserva área.
Demonstração:
Vamos considerar S(Q, q) = S(un+1 , un ) abaixo.
Desejamos mostrar que
∂S
(un+1 , un ) = −pn
∂un
e
∂S
(un , un+1 ) = pn+1
∂un+1
A segunda equação acima descreve trivialmente o que acontece
com a variável pn pela iteração de T (p, u), pois
1
S(un+1 , un ) = λV (un ) + (un+1 − un )2
2
e pn+1 = (un+1 − un ).
A equação das trajetórias crı́ticas
∂φ ∂S ∂S
0= = (un+1 , un ) + (un , un−1 ).
∂un ∂un ∂un
Ora, como vimos
∂S
(un , un−1 ) = un − un−1 = pn .
∂un
Portanto, da equação da trajetória crı́tica
∂S ∂S
(un+1 , un ) = − (un , un−1 ) = −pn (3.4)
∂un ∂un
i i
i i
“mec˙New”
i i
2011/10/11
page 61
i i
61
Logo fica definida através de S uma função geradora de mudanças

de coordenadas
(pn , un ) = (p, q) → (pn+1 , un+1 ) = −(P, Q)
através de
1
S(Q, q) = S(un+1 , un ) = λV (un ) + (un+1 − un )2 =
2
1
= λV (q) + (Q − q)2 . (3.5)
2
Note que −(P (q, p), Q(q, p)) preservar área é equivalente a
(P (q, p), Q(q, p))
preservar área.
A função (pn , qn ) → (pn+1 , qn+1 ) assim definida é a T anteri-
ormente considerada. Fica assim determinado (ver Proposição 17,
Capı́tulo 3 [L]) que a transformação T preserva área e é da forma

pn pn+1
T = .
un un+1
onde
∂S ∂S
(un+1 , un ) = − (un , un−1 ) = −pn
∂un ∂un
e
∂S
(un+1 , un ) = pn+1 .
∂un+1

Existem infinitos possı́veis arranjos {ui }i∈Z . Necessitamos impor
condições de fronteira do seguinte tipo:
un − un′
lim =l
n−n′ →∞ n − n′
para assim determinar uma solução crı́tica única a partir de l.
Definição 3.4. Dada uma configuração crı́tica {ui }i∈Z , o valor l
dado por
un − un′
lim =l
n−n′ →∞ n − n′
é chamado distância média atômica (ou número de rotação).
i i
i i
“mec˙New”
i i
2011/10/11
page 62
i i
Na definição acima devemos considerar u1 e não qi .

Em princı́pio não há garantia de que exista tal limite para uma
configuração qualquer. l também é chamado de número de rotação
da configuração {ui }i∈Z .
Estamos considerando na expressão acima que os un , un′ não são
tomados (mod 1). Sendo assim l representa uma inclinação média do
conjunto de pontos (i, ui ), i ∈ Z, vista com subconjunto de pontos
do R2 .
Observe que quanto mais próximo de zero for l, o deslocamento
para a direita de n produzirá muitos pontos muito próximos ui (mod
1). Neste caso a distância média entre elementos ui deverá ser muito
menor do que para inclinações grandes de l. Fica assim justificado o
nome de distância média atômica. Pn
Outra interpretração de l é a seguinte: como un −un′ = i=n′ +1 pi ,
podemos pensar que l é o momento médio da trajetória. Isto porque
Pn
un − un′ ′ pi
= i=n +1′ .
n − n′ n−n
Propriedade Importante: É possı́vel mostrar (ver [Ba]) que fixado

l, sob certas condições, obtem-se um único arranjo minimal {ui }i∈Z
(no sentido da Definição 3.2) com tal valor de distância média atômica
l (momento médio).
Fazendo analogia com a Mecânica Clássica, fixados posição e mo-
mento médio, desejamos encontrar de maneira única uma solução
{ui }i∈bf Z (que será mı́nima) com aquela posição inicial e com aquele
momento médio.
No caso λ = 0, então ui = il+α (linear em i) é solução, e portanto,
ao menos neste caso trivial, sabemos que existe a inclinação media
associada a tal {ui }.
No caso λ = 0, se l é irracional, a solução ui = il + α (módulo 1)
será densa em [0,1] (ver [A2]).
A questão relevante no modelo acima descrito é analisar no caso
geral λ 6= 0, o arranjo minimal associado a cada valor l. Isto é
para cada condição de fronteira l, deseja-se encontrar propriedades
da solução minimal com inclinação média l.
Nesta direção, o seguinte Teorema (ver [Ba]), que não será de-
monstrado, é de fundamental importância.
i i
i i
“mec˙New”
i i
2011/10/11
page 63
i i
63
Teorema 3.1. Dada uma configuração {ui }i∈Z mı́nima, existem l

e α tal que para qualquer i, os valores ui e il + α (não estamos
considerando mod 1) estão no mesmo intervalo [mi , mi + 1] onde mi
é um número inteiro.
Segue portanto deste teorema que toda solução minimal tem um

valor de distância média atômica l.
Definição 3.5. O valor α acima apresentado é denominado a fase

da configuração crı́tica ui .
O próximo teorema vai apresentar um resultado bastante preciso

sobre as soluções minimais {ui }i∈Z . Antes necessitamos algumas de-
finições e resultados da Teoria dos Números (ver [A2], [Kh] e [Le]
para referências gerais sobre os tópicos que serão considerados aqui).
Definição 3.6. Um número l > 0 é do tipo Diofantino se existe

γ > 0, r > 2 tal que ∀ p, q ∈ N

l − p > γ 1 .

(3.6)
q qr
Um número deste tipo é mal aproximado por racionais , ou seja,

ele é “muito irracional”.
Lembre (ver Definição 2.2, Capı́tulo 2) que um subconjunto D da
reta tem medida zero se para qualquer ǫ pequenoPexiste uma cober-
∞
tura de D por intervalos [ai , bi ], i ∈ N tal que i=1 (b1 − ai ) < ǫ.
Ou seja D é desprezı́vel em termos de comprimento, embora possa
ser um conjunto até mesmo denso em R (por exemplo o conjunto dos
racionais tem medida zero).
Lembre também (ver Definição 2.3, Capı́tulo 2) que dizemos que
um subconjunto A tem medida total na reta, se o seu complementar
é desprezı́vel, ou seja que o seu complementar tem medida zero.
Observação 3.1. Se r > 2 e γ > 0 estão fixados, é possı́vel mostrar

(veja [A2]) que o conjunto de números que satisfazem (3.6) na defi-
nição acima, tem medida total em R. Sendo assim, se escolhermos
um número ao acaso de acordo com a probabilidade uniforme em
R, este número será Diofantino. Nem todos os números reais são
Diofantinos.
i i
i i
“mec˙New”
i i
2011/10/11
page 64
i i
Figura 3.1:
Todo número irracional pode ser aproximado por frações contı́nuas,

isto é, x pode ser expresso da seguinte forma
1
x = n0 + 1 , (3.7)
n1 + n2 + n 1
3 +...
onde os ni são números naturais.

O procedimento é o seguinte: dado x, subtraia sua parte inteira,
1
obtendo x − n0 ∈ (0, 1). Portanto, x−n 0
> 1. Seja n1 a parte inteira
1 1
de x−n0 , logo x1 = x−n0 − n1 ∈ (0, 1].
1
Portanto x = n0 + n1 +x1 .
Aplique agora o mesmo procedimento a x1 , isto é, considere n2 a

parte inteira de x11 e x2 = x11 − n2 ∈ (0, 1] obtendo assim
1
x = n0 + 1 .
n1 + n2 +x2
Repetindo o mesmo procedimento para x2 e indutivamente assim

por diante obtemos a expansão de x em frações contı́nuas (3.7). Os
números x tal que tal procedimento termina em algum instante n
(isto é, xn = 0 ou xn = 1) são os números x racionais.
i i
i i
“mec˙New”
i i
2011/10/11
page 65
i i
65
2 1.6
1.4
1.5
1.2
1 1
0.8
0.5
0.6
0 0.4
1 1.5 2 2.5 1.4 1.6 1.8 2 2.2 2.4 2.6
1.3 2
1.2
1.5
1.1
1 1
0.9
0.5
0.8
0.7 0
1.7 1.8 1.9 2 2.1 2.2 2.3 1 1.5 2 2.5 3
i i
i i
“mec˙New”
i i
2011/10/11
page 66
i i
2
1.75
1.5
1.5
1.25
1
1
0.75
0.5
0.5
0.25
0 0
1 1.5 2 2.5 3 1.2 1.3 1.4 1.5 1.6
2
1.4
1.5
1.2
theta
1
1
0.5
0.8
0.6 0
1 1.5 2 2.5 3
1.6 1.8 2 2.2 2.4 p
Seja x irracional e k ∈ N, vamos denotar por
pk 1
= n0 + 1
qk n1 + n2 + 1
n3 +...+ 1
nk
o aproximante de ordem k de x, onde pk , qk ∈ N.

O seguinte resultado é demonstrado em [A2].
Teorema 3.2. Para qualquer número real irracional x, aproximado
i i
i i
“mec˙New”
i i
2011/10/11
page 67
i i
67
for fração contı́nua da forma

1
x = n0 + 1
n1 + n2 + n 1
3 +...
ni ∈ N, i ∈ N, é válido que

x − pk < 1 .

qk qk2
Ou seja r > 2 na definição de número Diofantino é uma propri-
edade nem sempre satisfeita para x qualquer, mas tomando γ = 1 e
r = 2 é sempre possı́vel aproximar qualquer número real x por racio-
nais pqkk como acima no último Teorema. No que segue, será essencial
assumir que l é do tipo Diofantino satisfazendo (3.6) com r > 2.
A expansão em frações contı́nuas surgiu inicialmente em Mate-
mática como um procedimento eficaz para aproximar um número
irracional x por números racionais. A aproximção de x de ordem k
é obtida quebrando a expansão em frações contı́nuas no termo nk ,
obtendo assim um número racional pqkk .
Em geral a aproximação por frações contı́nuas é melhor que as
outras maneiras conhecidas (o erro decai como q12 como se pode ob-
k
servar pela última desigualdade).
Posteriormente, a expansão em frações contı́nuas se mostrou útil
e fundamental para analisar uma série de questões de Aritmética e
também em questões de Mecânica Clássica e Geometria Diferencial.
Note que quanto maiores forem os ni , maiores serão os correspon-
dentes qk , permitindo assim melhores aproximações por racionais do
numero irracional considerado.
Exemplo 3.1. O número π é aproximado em frações continuas de
ordem 3 por
p3 333
=
q3 106
A aproximação é de 6 casas decimais.
Exemplo 3.2. O número real β dado pela razão áurea satisfaz
√
1 5+1
β =1+ =
1 + 1+ 1 1 2
1+...
i i
i i
“mec˙New”
i i
2011/10/11
page 68
i i
e portanto é super mal aproximado por racionais (os qk crescem deva-

gar porque os ni = 1 são os menores possı́veis). Logo podemos dizer
que a razão áurea é o mais irracional dos números reais.
Para mostrar que este número β tem a expansão em frações con-
tı́nuas acima basta observar que β satisfaz a equação
1
1+ = β.
β
Vamos agora apresentar o resultado mais importante desta seção
e que é apresentado de maneira resumida em [Au].
Teorema 3.3. Suponha que l, a distância média entre átomos, seja

irracional para uma certa configuração minimal {ui }i∈Z , ou seja,
{ui }i∈Z satisfaz
(ui − ui+1 ) + (ui − ui−1 ) = −λV ′ (ui ) (mod1). (3.8)
e ainda é mı́nima no sentido da Definição 51, Capı́tulo 3.

Então existe f monótona crescente tal que
ui = f (il + α) (mod1).
a) Se f é descontı́nua, o conjunto das descontinuidades é denso.

b) Se o número l é Diofantino, então existe λcrı́tico (l) tal que
para λ < λcrı́tico (l) a função f é contı́nua.
i i
i i
“mec˙New”
i i
2011/10/11
page 69
i i
69
2
1.75
1.5
1.5
1.25
1
1
0.75
0.5
0.5
0.25
0 0
1.6 1.625 1.65 1.675 1.7 1.725 1.7 1.8 1.9 2 2.1 2.2 2.3
2
1.15
1.1
1.5
1.05
1 1
0.95
0.5
0.9
0.85
0
1.94 1.96 1.98 2 2.02 2.04 2.06 2.275 2.3 2.325 2.35 2.375 2.4
i i
i i
“mec˙New”
i i
2011/10/11
page 70
i i
2 2
1.5 1.5
1 1
0.5 0.5
0 0
1.06 1.08 1.1 1.12 1.14 0.96 0.98 1 1.02 1.04
2
2
1.5
1.5
theta
1
1
0.5
0.5
0
0 1 1.25 1.5 1.75 2 2.25
0.86 0.88 0.9 0.92 0.94 p
A diferenciabilidade de f vai depender da diferenciabildade de V

e também do valor λ. Dependendo de λ, em alguns casos f é continua
mas não é diferenciável, em alguns casos f é apenas diferenciável de
classe C k e em alguns casos f é analı́tica.
É usual e mais prático, em vez de dizer que existe f como acima,
dizer que existe g tal que
ui = f (il + α) = (il + α) + g(il + α). (3.9)
A existência de f é claramente equivalente a existência de g. Va-

mos a seguir mostrar que existe tal g.
i i
i i
“mec˙New”
i i
2011/10/11
page 71
i i
71
Figura 3.2:
Observação 3.2. No caso de haver uma função continua f , associ-

ado a um certo valor l irracional, as iterações da aplicação padrão T
a partir de um ponto inicial (p0 , u0 ) (ou seja u0 , u1 ) vão determinar
um arranjo {ui } denso (mod 1) em [0, 1], com inclinação média l e
tal que a correspondente órbita associada T n (p0 , u0 ) = (pn , un ) deter-
mina através do conjunto dos seus pontos de acumulação em R2 uma
curva de Jordan fechada no espaço de fase (p, u). Estas curvas são
chamadas de curvas KAM. O exemplo de uma curva KAM aparece
nas Figuras 3.3 e 12.12.
Vamos explicar ao leitor como determinar a curva KAM em [0, 1]×
[0, 1] no caso acima descrito. Ora (pn , un ) = (un − un−1 , un ), logo
(pn , un ) = (f (nl + α) − f (nl + α − l), f (nl + α)).
Logo, (pn , un ) (mod 1) está sobre a curva
(f (u) − f (u − l) (mod1) , f (u) (mod1)).
Se l é irracional, il + α determina um conjunto denso (mod 1)

de pontos no intervalo (0, 1) e portanto, como afirmamos, o conjunto
dos pontos de acumulação de (un , pn ) (mod 1) determina a curva
(f (u) − f (u − l) (mod1) , f (u) (mod1)) , u ∈ (0, 1).
Nem sempre a um valor irracional l vai corresponder uma curva

KAM.
Quando f não é continua (caso a) do Teorema 3.3, Capı́tulo 3),
fica então determinado pelo fecho da órbita T n (p0 , u0 ) um conjunto
“ralo”tipo Cantor (também chamado de conjunto de Aubry-Mather)
conforme mostra Figura 2.3.
i i
i i
“mec˙New”
i i
2011/10/11
page 72
i i
Demonstração do item b) do Teorema 3.3: Não vamos dar

uma demonstração completa do item b) do Teorema 3.3, mas apenas
analisar o problema em primeira aproximação. Vamos considerar λ
pequeno (λ < λcrı́tico ) e l Diofantino. Neste caso existirá f continua
e nosso objetivo a seguir é dar uma idéia aproximada porque tal
propriedade é verdadeira (referimos o leitor a [He], [LC], [Ba] e [MF]
para uma demonstração completa).
Vamos ver como aparece de maneira natural a condição do número
l ser Diofantino no problema em consideração. Substituindo ui =
il + α + g(il + α) na equação (ui − ui+1 ) + (ui − ui−1 ) = −λV ′ (ui )
obtemos
−λV ′ (ui ) = il + α + g(il + α) − ((i + 1)l + α)
−g((i + 1)l + α) + il + α + g(il + α) − ((i − 1)l + α) − g((i − 1)l + α) =

2g(il + α) − g(il + α + l) − g(il + α − l).
Desejamos saber se existe uma g analı́tica (ou continua ao menos)
satisfazendo a expressão acima
′
−λV (ui ) = 2g(il + α) − g(il + α + l) − g(il + α − l) (3.10)
Nosso procedimento será tentar descobrir que tipo de equação

deve satisfazer tal g na variável u.
l é irracional, logo os números da forma il+α ∈ Z determinam um
conjunto denso em [0, 1) (mod 1) conforme foi visto na seção anterior.
Observação 3.3. No caso geral (λ > λcrı́tico ) , nem sempre para

um arranjo {ui }i∈Z crı́tico é verdade que os ui são densos no inter-
valo [0,1] (embora o conjunto dos il + α seja denso em [0,1] se l é
irracional).
Isto se deve do fato que |un+1 − un | ≤ l + 2 (ver Teorema 3.1) e
da equação (3.2)
λV ′ (ui ) = (ui+1 + ui−1 ) − 2ui ≤ 2(l + 2),
logo
2(l + 2)
V ′ (ui ) ≤ .
λ
i i
i i
“mec˙New”
i i
2011/10/11
page 73
i i
73
Portanto, se λ for grande, V ′ (ui ) vai poder assumir apenas valores

pequenos. Seja z tal que V ′ (z) = 0, então somente uma pequena
vizinhança A = {u|V ′ (u) < 4lλ } de z poderá ser visitada pela órbita
{ui }i∈Z .
Sendo assim, neste caso, o conjunto dos ui não será denso em
[0, 1). Em muitos destes casos o fecho do conjunto dos ui (mod 1)
é um conjunto tipo Cantor de medida zero. Neste caso o raciocı́nio
que faremos a seguir, usando séries de Fourier não se aplica.
No que segue é essencial assumir que os ui (mod 1) sejam densos
em [0,1), e isto ocorre quando λ < λcrı́tico .
A equação (3.10) para g em primeira aproximação é dada por
′
λV (u) = 2g(u) − g(u + l) − g(u − l). (3.11)
A primeira aproximação resulta de supor que g(il + α) é pequeno

e portanto que ui seja aproximadamente igual a il + α (pois ui −
(il + α) = g(il + α)). Como os ui são densos, podemos substituir
na equação (3.10) os ui e os il + α por u ∈ [0, 1) e obter assim a
equação para g dada por (3.11). Esta aproximação é verdadeiramente
muito grosseira, mas o esquema da demonstração matemática começa
resolvendo a equação em primeira aproximação e depois resolvendo
uma sequência de melhores aproximações da equação (3.10) (ver [H]).
Não demonstraremos esta parte mais sofisticada do teorema aqui e
nos contentaremos apenas em entender a questão da primeira apro-
ximação. Desta maneira não entraremos em questões de dificuldade
técnica bastante grande.
Com as hipótese acima em mente, vamos proseguir na análise da
equação (3.9) para g em primeira aproximação, ou seja da equação
(3.11) para g.
Expandindo V ′ em Série de Fourier, obtemos
∞
X
V ′ (u) = Vm ei2πm u .
m=−∞
Vamos tentar obter g em Série de Fourier

∞
X
g(u) = gm ei2πm u .
m=−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 74
i i
Substituindo esta expressão na equação (3.11), obtemos

∞
λ X Vm
g(u) = − ei2πmu . (3.12)
2 m=−∞ (1 − cos 2πml)
Observe a existência de pequenos denominadores na equação aci-

ma. Isto porque o termo no denominador do quociente de cada termo
da série acima vai ficar próximo de zero, pois cos 2πml vai estar, para
certos valores de m, muito próximo de 1 (isto segue do fato que o
conjunto ml, n ∈ Z é denso (mod 1) em [0,1]). Sendo assim não há
garantia de que para todos valores de u a série formal (3.12) definida
acima convirja. Note no entanto que Vm também vai a zero e podem
haver compensações do denominador e numerador de cada termo da
série (3.12).
Se uma série converge absolutamente, ela converge. Sendo assim,
uma condição suficiente para convergência da série (3.12) acima é

Vm K
1 − cos(2πml) < m1+B (3.13)

K, B > 0, ou seja,
1/2
Vm K

1 − cos 2πml < 1+B . (3.14)
m 2
Ou seja, neste caso, o denominador de cada termo da série pode

ser pequeno, mas Vm é menor ainda.
Observação 3.4. Note que a condição suficiente acima descrita,

exige apenas que na última expressão 1+B 1
2 > 2 . A seguir vamos mos-
trar que tal propriedade é verdadeira para certos números l do tipo
Diofantino.
Quando 2πml está próximo de 2π(mod 1), então pela Fórmula de
Taylor
1
(1 − cos 2πml) ∼ 4π 2 (lm − n)2
2
onde n é o inteiro mais próximo de lm (estamos tomando a fórmula
de Taylor em torno de 2πn).
i i
i i
“mec˙New”
i i
2011/10/11
page 75
i i
75
Logo
Vm Vm
1 − cos(2πml) < K̃(4π)2 (lm − n)2 .

′
Se assumirmos que V (x) é analı́tica complexa na faixa em que a
parte imaginária de x é menor que ρ, então existe k, ρ tal que
|Vm | < k exp−2π|m|ρ (3.15)
Este resultado (3.15) pode ser facilmente obtido da fórmula in-
tegral de Cauchy de Variável Complexa (ver [N]), e considerando
um contorno retangular no plano complexo passando pelos pontos
−π, π, π + ρi, −π + ρi. Integrando neste contorno e usando o fato que
as integrais em dois lados do retângulo cancelam, segue o resultado.
′
Se V (z) não é analı́tica, mas apenas ν vezes diferenciável, então
k1
|Vm | < (3.16)
mν+1
para uma certa constante k1 (ver [Fi] seção 2.8).
′
Logo se V é ν vezes diferenciável,
12
Vm k2
1 − cos 2πml ≤ m(ν+1)/2 (lm − n) ,

onde k2 é uma constante.

Se l é número Diofantino, de (3.6)

l − n > γ 1 ,

r > 2.
m mr
O valor de r será especificado em breve.
Logo
1
|lm − n| > γ r−1
m
ou seja
1
γ < mr−1 .
|lm − n|
Concluindo
21 r−1
Vm < K3 m
1
= K3 ν+1 ,
1 − cos 2πml m(ν+1)/2 m 2 −r+1
i i
i i
“mec˙New”
i i
2011/10/11
page 76
i i
para uma certa constante K3 .

Tomando ν suficientemente grande
ν+1
−r+1 (3.17)
2
fica maior que 12 e assim, segundo a Observação 3.4, segue que (3.14)
é verdadeira e assim a série de Fourier da g que desejamos obter
converge.
Desta maneira, mostramos que sob certas condições existe solução
g contı́nua (em primeira aproximação) da equação (3.9) da curva
KAM (ver Observação 3.2).
Vamos fazer uma análise mais delicada da questão acima consi-
derada.
Estamos interessados em propriedades que são validas para todo
l em um conjunto de medida total. Sendo assim, podemos assumir
r = 2 + ε com ε pequeno (ver Observação 3.1 antes do teorema)
e concluir que para um conjunto de medida total de valores l (os
números Diofantinos), para valores λ menores que λcrı́tico , existe
uma curva KAM.
′
Neste caso, se V for apenas três vezes diferenciável já obtemos
de (3.17) (ver Observação 3.4) que
3+1 1
−r+1=2−2−ε+1>
2 2
pois
1
ε<
2
′
Sendo assim se V for três vêzes diferenciavel, a condição (3.13) é
válida para tal g e a Série de Fourier (3.12) de g converge, embora g
não seja necessariamente diferenciável (apenas contı́nua).
′
A conclusão final é que se V for três vezes diferenciável, então g
(ou seja f ) satisfazendo (3.8) e (3.9) existe é contı́nua e é expressa
através da Série de Fourier (3.9) acima descrita.
Se V ′ for mais de tres vezes diferenciável então as curvas obtidas
serão diferenciáveis. Quanto maior a classe de diferenciabilidade de
V ′ , maior será a classe de diferenciabilidade da g que define a curva
KAM.
i i
i i
“mec˙New”
i i
2011/10/11
page 77
i i
77
É realmente um fato muito interessante o fato que propriedades

topológicas (a existência de curvas KAM ou a existência de conjuntos
de Cantor invariantes, conforme aparece no conjunto das 16 figuras)
dependem de propriedades de diferenciabilidade de V ′ e também de
propriedades numéricas de l.
Considere um valor l de distância média atômica fixado.
Se V ′ for analı́tica, então pode-se mostrar que para pequenos va-
lores de λ, a função g é analı́tica.
Pode-se mostrar que para valores de λ um pouco maiores, a curva
invariante é diferenciável, mas não analı́tica (mesmo que V ′ seja
analı́tica).
Para valores de λ moderadamente grandes, a aplicação padrão
definida acima, vai apresentar exemplos em que a g acima considerada
é realmente continua mas não diferenciável e este fato vai assegurar
a existência de curvas KAM não diferenciáveis.
Em todos os casos considerados acima, existe curva KAM.
No conjunto das oito figuras, logo após a Figura 1.14, para vários
valores de λ, plotamos várias órbitas no espaço de fase de várias
aplicações padrão T = Tλ associados ao potencial λV (u) = λ 12 (1 −
cos 2πu).
No conjunto das oito figuras antes da Figura 1.5 mostramos o
espaço de fase de várias órbitas para T quando λ = 0. Note a seme-
lhança deste caso com o bilhar no cı́rculo do Exemplo 1.1, Capı́tulo 3.
As figuras do meio das oito correspondem a valores não muito
grandes nem muito pequenos de λ.
A última figura do primeiro conjunto mostra o espaço de fase de
T para o valor λ que fica localizado um pouco antes da destruição da
última curva KAM. Esta curva tem número de rotação l = β a razão
áurea.
Um fato relevante a ser destacado é que a medida que aumen-
tamos λ mais e mais as g associadas a l Diofantinos vão deixando
de ser contı́nuas. Este fenômeno é conhecido como a destruição das
curvas invariantes em teoria KAM. A medida que estas curvas vão
sendo destruidas, aparecem conjuntos ’ralos”tipo Cantor e também
regiões bidimensionais invariantes (ver Figura 3.32). As regiões bidi-
mensionais ocupam uma parte cada vez maior de [0, 1] × [0, 1] até que
finalmente para valores muito grandes de λ elas parecem ocupar todo
o [0, 1] × [0, 1] (ver última figura do conjunto dos primeiros oito).
i i
i i
“mec˙New”
i i
2011/10/11
page 78
i i
Figura 3.3:
As dezesseis figuras foram obtidas da seguinte maneira, tomando

um ponto (p0 , u0 ) inicial ao acaso, iteramos 10,000 vezes a condição
inicial e plotamos esta trajetória de
{(p0 , u0 ), T (p0 , u0 ), ..., T 10000 (p0 , u0 )}.
Observação 3.5. Note que muitas das evidências numéricas que

aparecem nas figuras obtidas em computador não correspondem sem-
pre a conclusões verdadeiras. Por exemplo, para λ grande, a última
figura do conjunto das oito primeiras, mostra que aparentemente o
sistema é ergódico quando restrito a uma região bidimensional (es-
cura) de área positiva. Poderia ocorrer que certas órbitas ficam encer-
radas em regiões bidimensionais invariantes muito próximas da pró-
pria órbita. O que se assemelha a uma órbita que parece ocupar den-
samente o espaço de fase, na verdade seria apenas um ponto elı́ptico
(ver definição na última seção do texto, Definição 12.4) de perı́odo
i i
i i
“mec˙New”
i i
2011/10/11
page 79
i i
79
muito grande. Este fato não poderia ser percebido pela resolução do
computador que gerou tais figuras. Tal situação que parece insólita,
de fato corre com alguns parâmetros da aplicação “padrão”(ver [Du]).
As figuras obtidas de simulações no computador podem ser de
grande valia no entendimento da riqueza de fenômenos que aparecem
num sistema mecânico. Note que a Figura 1.8 parece descrever a exis-
tência de pontos elı́pticos. Elas por si só, no entanto, não asseguram
a veracidade matemática do fenômeno que parecem descrever.
Conclusão: Considere um potencial V analı́tico. Para um valor

pequeno de λ, não existem mais curvas invariantes para T com l ra-
cional. Elas são destruidas e dão lugar a órbitas periódicas. Não
existem também curvas com l irracional não Diofantino. Subsistem
varias curvas KAM com l Diofantino, mas a medida que aumenta-
mos λ, mais e mais destas curvas vão sendo destruidas, dando razão
ao aparecimento de conjuntos fractais (muito pequenos, quase im-
perceptiveis) e a regiões bidimensionais invariantes. Quando uma
curva KAM é destruida, aparece em geral uma sequência alternada
de pontos periódicos elı́pticos e hiperbólicos (ver última figura do se-
gundo conjunto). Aparecem assim pontos hipebólicos que geram as-
sim um conjunto tipo ferradura (ver [R02] [Ka ][PM]). A seção 6.3 em
[DL] descreve este fenômeno. Entremeado neste conjunto, aparecem
“ilhas elı́pticas”. Estas “ilhas elı́pticas” em torno dos pontos elipti-
cos, por sua vez, possuem curvas invariantes e cada um desta curvas
tem número de rotação (ou distância média atômica) l em torno de
cada ponto elı́ptico. Estas curvas, por sua vez, se tem numero de
rotação l (em torno do ponto elı́ptico) racional ou não Diofantino,
logo são destruidas ao aumentar o parâmetro λ . Restam as cur-
vas (em torno deste ponto elı́ptico) com l Diofantino, as quais vão
sendo destruidas a medida que o parametro λ aumenta criando novas
sequências de pontos hiperbólicos e elı́pticos e assim por diante. Para
valores de λ muito grande, aparentemente, só existe uma região bidi-
mensional invariante, ou seja a probabilidade uniforme P é ergodico
para T . Dizemos aparentemente, por causa da Observação 3.5 acima.
Existe uma conjectura que diz que para valores λ grandes, o con-
junto de tais λ que determinam T = Tλ não ergódica, é muito pequeno
em termos da medida uniforme em λ ∈ R (ver [Du] para maiores con-
siderações a respeito do assunto). Este resultado implicaria então que
i i
i i
“mec˙New”
i i
2011/10/11
page 80
i i
para λ grande, a maioria das transformações T seria ergódica para a

Probabilidade uniforme.
A evolução do espaço de fase com o parâmetro λ descrita acima
é o que se chama de fenômeno KAM.
A destruição das curvas invariantes acima descritas, correspondem
a destruição de toros invariantes em torno de pontos elı́pticos de
aplicações de Poincaré de primeiro retorno, conforme foi descrito no
fim da Seção 7, Capı́tulo 1 [L].
Aplicações do tipo padrão formam uma classe mais geral de apli-
cações denominadas de tipo “twist”ou também chamadas “aplicações
que giram para a direita”.
Esta classe de aplicações é objeto de intenso estudo nos últimos
anos (ver [MF] e [M2]).
Definição 3.7. Seja T : [0, 1] × [0, 1] → [0, 1] × [0, 1], obtida a partir
de uma função geradora S(x, X), dizemos que T (x, y) é do tipo que
gira para a direita, se T = (T1 , T2 ), e existe C > 0 tal que
∂T1
C< < C −1 . (3.18)
∂y
Tal T preserva área (ou seja, preserva dxdy.
Para aplicações do tipo acima podemos considerar o problema

análogo: determinar as qi onde T (q0 , p0 ) = (qi , p1 ) tais que se q0 ,
q1 , q2 , ..., qn são sucessivas iteradas na variável q de uma órbita
T j (q0 , p0 ) então para q0 , qn fixos a função
A(x1 , x2 , ..., xn−1 ) =
= S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn ),

A : E n−1 → R tem (q1 , q2 , ..., qn−1 ) como ponto crı́tico (ou mı́nimo),
etc....
É fácil ver que a aplicação T definida por (3.3) gira para a direita
′′
pois ∂T ∂u = λV (u) > 0 e é obtida através de uma função geradora
1
S(q, Q).
Exemplo 3.3. (Bilhares convexos) Considere como na seção ante-

rior a ação S(ui , ui+1 ) = |ui −ui+1 |, ou seja a distância entre o ponto
i i
i i
“mec˙New”
i i
2011/10/11
page 81
i i
81
u
Pi me ui+1 no bordo do bilhar, e a ação total de n a m como a soma
i=n S(ui , ui+1 ). As trajetórias do bilhar determinam configurações
crı́ticas para a ação total. A aplicação T que determinamos para o
bilhar convexo é portanto análoga a T que estamos considerando na
presente seção.
O difeomorfismo T do bilhar convexo é a aplicação induzida pelo
primeiro retorno ao bordo do bilhar convexo. A aplicação T preserva
área como vimos na Proposição 17, Capı́tulo 3 [L]. É fácil mostrar que
tal T satisfaz (3.18) (ver [LC] e [CRZ] para prova). Logo, utilizando a
S acima, a transformação T induzida pelas batidas do bilhar no bordo
de um bilhar convexo define uma aplicação que gira para a direita.
Seja T : [0, 1] × [0, 1] → [0, 1] × [0, 1], obtida a partir de uma

função geradora S(x, X), dizemos que T (x, y) é do tipo que gira para
a esquerda, se T = (T1 , T2 ), e existe C > 0 tal que
∂T1
−C −1 < < −C.
∂y
No caso do bilhar do Sinai (ver definição na seção 1) se conside-

rarmos a ação S(q, Q) = |q − Q| obteremos uma função T que gira
para esquerda.
Esclarecemos ao leitor que a teoria em que ”minimizamos
S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn )
para aplicações que giram para a direita”é a mesma teoria em que

”maximizamos
para aplicações que giram para a esquerda”(ver [LC]).

Note no entanto que a teoria em que ”minimizamos
para aplicações que giram para a esquerda”é diferente a teoria em

que ”minimizamos
i i
i i
“mec˙New”
i i
2011/10/11
page 82
i i
para aplicações que giram para a direita”. No primeiro caso estare-

mos localizando conjuntos ”próximos”de pontos de sela e no segundo
conjuntos ”próximos”de pontos elı́pticos. Na última figura do pri-
meiro conjunto de oito vemos uma alternância de pontos elı́pticos e
pontos hiperbólicos em cada anel. Fixado uma aplicação T que gira
para a direita ”minimizar”ou ”maximizar”S vai determinar que tipo
de conjunto estamos tentando encontrar. As curvas KAM aparecem
apenas no problema em que minimizamos S.
Sendo assim no caso do bilhar do Sinai (ver definição na seção
1) é mais interessante considerar a ação S(q, Q) = −|q − Q| obtendo
assim uma função T que gira para direita.
Dada uma órbita periódica de um sistema Hamiltoniano, se a
aplicação de primeiro retorno T tem um ponto fixo elı́ptico, em geral
esta T é localmente uma aplicação que gira para a direita. Referimos
o leitor para [M2] para uma prova deste fato.
A teoria acima possui uma extensão para lagrangianos periódicos
e mais recentemente foi extendida para lagrangianos Autônomos. O
leitor pode encontrar um texto cobrindo tais assuntos em [CI] e [Fat].
Existe também uma teoria análoga para transformações expan-
sivas e sistemas tipo Anosov (ver [CLT]) em que se considera entre
outras coisas o expoente de Lyapunov.
Sendo assim, esperamos ter convencido ao leitor da importância
do entendimento dinâmico das aplicações que giram para a direi-
ta. Este entendimento possibilitaria a melhor compreensão de vários
problemas importantes da Mecânica Clássica. Muito trabalho ainda
será requerido para chegar ao entendimento matemático completo da
dinâmica de tais aplicações.
Exercı́cios
1. Mostre que a transformação T associada ao bilhar, considerada
na Seção 11, é do tipo que gira para a esquerda.
2. Mostre que os números Diofantinos tem probabilidade total na

reta.
i i
i i
“mec˙New”
i i
2011/10/11
page 83
i i
Capı́tulo 4
Formas Diferenciais em
Variedades
Nesta seção vamos apresentar de maneira resumida as principais pro-

priedades das formas diferenciais em variedades diferenciáveis, que
serão necessárias para o entendimento da próxima seção que analisará
o formalismo simplético. Referimos a [MC1] para o leitor que desejar
uma exposição mais completa do assunto abordado nesta seção.
O objetivo de considerar formas diferenciais como faremos a se-
guir, será apresentar no futuro (ver próxima seção) uma versão da
Mecânica Clśsica que seja intrı́nseca, isto é, que seja definida sem
apelo a coordenadas locais. Lembre que, por exemplo, para definir
o campo Hamiltoniano usamos a estrutura do R2n (necessitamos de
variáveis q e p separadas) de maneira essencial. Muitas vezes em
problemas fı́sicos concretos, não é natural supor que o sistema em
consideração seja um subconjunto do R2n . Isto vai nos conduzir ao
conceito de variedade diferenciável. Para definir o campo Hamiltoni-
ano necessitaremos também do conceito de formas diferenciais.
Dado p ∈ Rn , chamaremos de espaço tangente a Rn em p, e
denotaremos Rnp = (T Rn )p , o conjunto de todos os vetores tangentes
v do Rn , cuja origem está localizada no ponto p.
83
i i
i i
“mec˙New”
i i
2011/10/11
page 84
i i
84 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES
Mais precisamente, v ∈ Rnp determina a classe de todas as curvas

γ(t) ∈ Rn tal que γ(0) = p e γ ′ (0) = v.
Rnp é um espaço vetorial, e seu dual será (Rnp )∗ , isto é, o conjunto
de todos as transformações lineares f : Rnp → R.
Definição 4.1. Uma k-forma w em Rnp é por definição uma função
do tipo
w : Rnp × Rnp × · · · × Rnp → R
| {z }
k vezes
tal que w é linear em cada coordenada.

A forma w é dita alternada se ∀ i < j,
w(v1 , v2 , ..., vi , ..., vj , ..., vk ) = − w(v1 , v2 , ..., vj , ..., vi , ..., vk ).
Denotaremos para cada p ∈ Rn por Ωk (Rnp ), o conjunto das

funções k-lineares alternadas em Rnp tomando valores reais.
Note que se houver repetição de um elemento v na k-upla, então
w(v1 , v2 , ..., v, ..., v, .., vk ) = − w(v1 , v2 , ..., v, ..., v, ..., vk )
e portanto w(v1 , v2 , ..., v, ..., v, ..., vk ) = 0.

Exemplo 4.1. Em R3 a 3-forma w tal que w(v1 , v2 , v3 ) é o de-
terminante da matriz que tem como colunas (v1 , v2 , v3 ) é alternada.
Por exemplo, esta 3-forma satisfaz w(v1 , v2 , v3 ) = −w(v2 , v1 , v3 ) =
w(v2 , v3 , v1 ).
Exercı́cio: Mostre
Pk que se v1 é combinação linear de v2 , v3 , ..., vn ,
isto é, v1 = i=2 i vi , então w(v1 , v2 , ..., vn ) = 0. Em particular
α
para uma 2-forma w(v, v) = 0.
Este último conjunto Ωk (Rnp ) com a operação de soma de funções,
e multiplicação por escalar definidas de maneira usual, ((f + g)(x) =
f (x) + g(x) e (cf )(x) = cf (x), ∀x ∈ Rnp ), é um espaço vetorial.
Exemplo 4.2. Seja dx2 : R3 → R a projeção na segunda coordenada,
dx2 (y1 , y2 , y3 ) = y2 .
Então, dx2 ∈ R3∗ 3

p , para qualquer p ∈ R .
i i
i i
“mec˙New”
i i
2011/10/11
page 85
i i
85
As transformações lineares dxi : Rn → R, tal que
dxi (y1 , y2 , ..., yn ) = yi
são transformações (ou funcionais) lineares, que formam uma base

para Ω1 (Rnp ).
Observação 4.1. Ω1 (Rnp ) = (Rnp )∗ .
Note que dxi satisfaz dxi (ej ) = δi,j , i, j = 1, 2, ..., n, onde δi,j = 0
se i 6= j e δi,j = 1 se i = j.
Definição 4.2. Uma 1-forma ou forma exterior de grau 1 em um

aberto A do Rn , é uma aplicação ω definida em A ⊂ Rn tomando
valores em Ω1 (Rnp ), que associa a cada ponto p ∈ A ⊂ Rn , uma
funcão linear ω(p) : Rnp → R.
Como dx1 , dx2 , ..., dxn é base do espaço das transformações linea-
res, ω(p) poderá ser escrito como:
ω(p) = a1 (p)dx1 + a2 (p)dx2 + ... + an (p)dxn .
Se cada ai : A ⊂ Rn → R for diferenciável ∀ p ∈ A ⊂ Rn , diremos

que ω é uma 1-forma diferenciável ou forma exterior diferenciável de
grau 1.
Por abuso de notação, falaremos de uma forma diferencial em Rn
quando nos referirmos a uma 1-forma diferencial sobre um aberto
A ⊂ Rn .
Definição 4.3. Se ϕ1 , ϕ2 , ..., ϕk , são 1-formas lineares, podemos

obter um elemento
ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk
de Ωk (Rnp ), definindo:
(ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk )(v1 , v2 , . . . , vk ) = det([ϕi (vj )]).
Segue das propriedades do determinante, que (ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk )

é k-linear, alternada. É fácil ver que (ϕ1 ∧ · · · ∧ ϕk ) ∈ Ωk (Rnp ).
Em particular (dx1 ) ∧ · · · ∧ (dxk ) ∈ Ω(Rnp ). Denotaremos (dx1 ) ∧
· · · ∧ (dxk ) por (dx1 ∧ · · · ∧ dxk ).
i i
i i
“mec˙New”
i i
2011/10/11
page 86
i i
Proposição 4.1. O conjunto {(dxi1 ∧ dxi2 ∧ · · · ∧ dxik )}, i1 < i2 <

· · · < ik , onde ij ∈ {1, 2, . . . , n}, forma uma base para Ωk (Rnp ).
Demonstração: Primeiramente veremos que os elementos deste
conjunto são linearmente independentes. Suponha que
X
ai1 ···ik dxi1 ∧ · · · ∧ dxik = 0.
i1 <···<ik
Considere fixado j1 < ... < jk , ji ∈ {1, 2, . . . , n}, tal que o corres-
pondente aj1 ···jk não seja nulo. Então para qualquer k-upla de ı́ndices
i1 < ... < ik , dxi1 ∧ · · · ∧ dxik aplicado a (ej1 , . . . , ejk ) resulta ser
(dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) =

dxi1 (ej1 ) dxi1 (ej2 ) ··· dxi1 (ejk )

= det .. .. .. ..
. . . . .

dxik (ej1 ) dxik (ej2 ) ··· dxik (ejk )
Lembramos que

0, se i 6= j
dxi (ej ) =
1, se i = j
Logo (dxj1 ∧ · · · ∧ dxjk )(ej1 , . . . , ejk ) = 1 e portanto aj1 ,...jk (dxj1 ∧
· · · ∧ dxjk )(ej1 , . . . , ejk ) = aj1 ,...,jk .
Mantendo-se fixo (ej1 , . . . , ejk ) e fazendo-se todas as escolhas pos-
sı́veis (diferentes desta) para i1 < i2 < · · · < ik , il ∈ {1, 2, . . . , n},
obteremos:
∗
X
−aj1 j2 ···jk = ai1 ···ik (dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ),
i1 <···<ik
P∗
onde o significa que evitamos (i1 , ..., ik ) = (j1 , . . . jk ) no somatório
acima.
Note agora que se (i1 , i2 , · · · , ik ) é diferente de (j1 , ..., jk ) então
(dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) = 0.
Logo,
X
ai1 ···ik (dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) = 0 ⇒ aj1 ···jk = 0.
i1 <···<ik
i i
i i
“mec˙New”
i i
2011/10/11
page 87
i i
87
Obtivemos portanto uma contradição.

Logo o conjunto {(dxi1 ∧ dxi2 ∧ · · · ∧ dxik )p }, i1 < i2 < · · · < ik ,
onde ij ∈ {1, 2, . . . , n}, é linearmente independente em Ωk (Rnp ).
Mostraremos agora que se f ∈ Ωk (Rnp ), então f é uma combinação
linear da forma:
X
f= ai1 ···ik dxi1 ∧ · · · ∧ dxik .
i1 <···<ik
Para vermos isto, basta definirmos ai1 ···ik = f (ei1 , . . . , eik ) (lem-
bramos que f é k-linear alternada).
Definição 4.4. Uma k-forma (ou forma exterior de grau k) em um

aberto A, A ⊂ Rn (k ≥ 1) é uma aplicação ω que a cada p ∈ A ⊂ Rn
associa ω(p) ∈ Ωk (Rnp ).
Como vimos na última proposição, ω pode ser escrito como:
X
ω(p) = ai1 ···ik (p)(dxi1 ∧ · · · ∧ dxik ),
i1 <···<ik
ij ∈ {1, 2, . . . , n} onde ai1 ···ik : A ⊂ Rn → R.

Se estas funções ai1 ···ik forem diferenciáveis, ω é chamada uma
k-forma diferenciável.
Por abuso de linguagem, as k-formas sobre abertos A do Rn serão

chamadas de k-formas diferenciais em Rn .
Observação 4.2. A k-upla (i1 , . . . , ik ), i1 < · · · < ik será indicada

por I, e a notação a ser usada a partir de agora será:
X
ω= aI dxI ,
I
dxI = dxi1 ∧ · · · ∧ dxik .

Convenciona-se que uma 0-forma diferenciável em Rn é uma função
diferenciável f : A ⊂ Rn → R.
Se ω e ϕ são duas k-formas,
X X
ω= aI dxI , ϕ = bI dxI ,
I I
i i
i i
“mec˙New”
i i
2011/10/11
page 88
i i
podemos definir a soma:

X
ω+ϕ= (aI + bI )dxI
I
e a multiplicação de ω por escalar c ∈ R

X
cω = c aI dxI .
I
Estas propriedades determinam que o conjunto das k-formas di-

ferenciais em A aberto do Rn é um espaço vetorial.
Definição 4.5. Se ω é uma k-forma e ϕ uma s-forma, podemos

definir uma operação chamada produto exterior ω ∧ ϕ, obtendo uma
k + s-forma.
Se X
ω= aI dxI , I = (i1 , . . . , ik ) k-forma
I
X
ϕ= bJ dxJ , J = (j1 , . . . , js ) s-forma.
J
Por definição,
X
ω∧ϕ= aI bJ dxI ∧ dxJ ,
I,J
onde dxI ∧ dxJ = dxi1 ∧ ... ∧ dxik ∧ dxj1 ∧ ... ∧ dxjs .
Note que esta definição é compatı́vel com a Definição 4.3.

Por exemplo, (2dx1 +5dx3 )∧(5dx2 +4dx3 ) = 10dx1 ∧dx2 +8dx1 ∧
dx3 − 25dx2 ∧ dx3 .
Proposição 4.2. Se ω é uma k-forma, ϕ uma s-forma e θ uma

r-forma, teremos:
(a) (ω ∧ ϕ) ∧ θ = ω ∧ (ϕ ∧ θ)
(b) (ω ∧ ϕ) = (−1)ks ϕ ∧ ω
(c) ω ∧ (ϕ + θ) = ω ∧ ϕ + ω ∧ θ quando r = s.
i i
i i
“mec˙New”
i i
2011/10/11
page 89
i i
89
Demonstração: (a) e (c) são P conseqüências das

P definições acima.
Para o item (b), sejam ω = I aI dxI e ϕ = J bJ dxJ , onde I =
(i1 , . . . , ik ) e J = (j1 , . . . , js )
X
ω∧ϕ= aI bJ dxi1 ∧ · · · ∧ dxik ∧ dxj1 ∧ · · · ∧ dxjs =
I,J
X
= aI bJ (−1)dxi1 ∧ · · · ∧ dxik−1 ∧ dxj1 ∧ dxik ∧ dxj2 ∧ · · · ∧ dxjs =
I,J
X
= (−1)k aI bJ dxj1 ∧ dxi1 ∧ dxi2 ∧ · · · ∧ dxik ∧ dxj2 ∧ · · · ∧ dxjs ,
I,J
fazendo a mesma inversão para dxj2 , dxjn , . . . , dxjs , ao final teremos

realizado este raciocı́nio s-vezes, teremos s-vezes (−1)k à frente de
aI bJ , ou seja, (−1)ks , portanto ϕ ∧ ω = (−1)ks ω ∧ ϕ.
Note que uma n-forma diferenciável w em um aberto A do Rn é
sempre da forma w(x) = c(x) dx1 ∧ dx2 ∧ ... ∧ dxn , onde c : A → R é
uma função diferenciável.
Fixado x, para determinar c(x), basta tomar w(x)(e1 , e2 , ..., en ) =
c(x), onde ei , i ∈ {1, 2, .., n} é a base canônica do Rn .
Definição 4.6. Seja f : A ⊂ Rn → Rm uma função diferenciável,
então a derivada dfp : Rnp → Rm f (p) induz para cada ponto p ∈ A uma
transformação linear fp∗ : Ωk (Rm k n
f (p) ) → Ω (Rp ) do seguinte modo:
dado w ∈ Ωk (Rm ∗ k n
f (p) ), f (w) = w1 ∈ Ω (Rp ) é tal que
w1 (v1 , . . . , vk ) = fp∗ (ω)(v1 , . . . , vk ) = ω(dfp (v1 ), dfp (v2 ), . . . , dfp (vk )),
onde v1 , v2 , . . . , vk ∈ Rnp .
Fazendo p variar em Rn , obtemos uma aplicação f ∗ que leva k-
formas diferenciais do Rm em k-formas diferenciais do Rn .
Convenciona-se que f ∗ (g) = g ◦ f se g é uma 0-forma do Rm .
Enunciaremos a seguir algumas propriedades de f ∗ .
Proposição 4.3. Se f : A ⊂ Rn → Rm é diferenciável então:
(a) f ∗ (ω1 + ω2 ) = f ∗ (ω1 ) + f ∗ (ω2 ), onde ω1 e ω2 são k-formas.
(b) f ∗ (ω1 ∧ ω2 ) = f ∗ (ω1 ) ∧ f ∗ (ω2 ) onde ω1 e ω2 são 1-formas.
(c) f ∗ (gω) = f ∗ (g)f ∗ (ω) onde g é uma 0-forma do Rm e ω uma
k-forma do Rm .
i i
i i
“mec˙New”
i i
2011/10/11
page 90
i i
Demonstração:
(a) f ∗ (ω1 + ω2 )(p) (v1 , v2 , . . . , vk ) =
= (ω1 + ω2 )(f(p) )(dfp (v1 ), . . . , dfp (vk )) =
= ω1 (f(p) )(dfp (v1 , . . . , dfp (vk )) + ω2 (f(p) )(dfp (v1 ), . . . , dfp (vk )) =
= f ∗ (ω1 )(p) (v1 , . . . , vk ) + f ∗ (ω2 )(p) (v1 , . . . , vk ).
(b) f ∗ (ω1 ∧ ω2 )(p) (v1 , v2 ) = (ω1 ∧ ω2 )f (p) (dfp (v1 ), dfp (v2 )) =

ω (df (v )) ω1 f (p) (dfp (v2 ))
= det 1 f (p) p 1 =
ω2 f (p) (dfp (v2 )) ω2 f (p) (dfp (v2 ))
∗
f (ω ) (v ) f ∗ (ω1 )(p) (v2 )
= det ∗ 1 (p) 1 =
f (ω2 )(p) (v1 ) f ∗ (ω2 )(p) (v2 )
= (f ∗ (ω1 )(p) ∧ f ∗ (ω2 )(p) )(v1 , v2 ).
(c) f ∗ (gω)(p) (v1 , . . . , vk ) = (gω)(f(p) )(dfp (v1 ), . . . , dfp (vk )) =

= (g ◦ f )(p) f ∗ (ω)(p) (v1 , . . . , vk ) = f ∗ (g)(p) f ∗ (ω)(p) (v1 , v2 , . . . , vk ).

Estamos prontos agora para mostrar que a operação f ∗ é equiva-
lente à substituição de variáveis.
Seja f : A ⊂ Rn → Rm uma função diferenciável que associa
(x1 , . . . , xn ) a (y1 , y2 , . . . , ym ) da seguinte maneira:


 y1 = f1 (x1 , . . . , xn )

 y2 = f2 (x1 , . . . , xn )
..


 .

ym = fm (x1 , . . . , xn ).
P m
Seja ω = I aI dyI uma k-forma P do R , usando P a última pro-
posição, temos que: f (ω) = f ( I aI dyI ) = I f ∗ (aI )f ∗ (dyi1 ) ∧
∗ ∗
f ∗ (dyi2 )∧· · ·∧f ∗ (dyik ). Ora f ∗ (dyi )(v) = dyi (df (v)) = d(yi ◦f )(v) =
dfi (v) e f ∗ (aI ) = aI ◦ f = aI (f ), pois aI é uma o-forma (usamos
definição de f ∗ para 0-formas). Assim,
X
f ∗ (ω) = aI (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))dfi1 ∧dfi2 ∧· · ·∧dfik
I
i i
i i
“mec˙New”
i i
2011/10/11
page 91
i i
91
onde fi e dfi são funções de xj ,

n
X ∂fi
dfi = dxj ,
j=1
∂xj
portanto aplicar f ∗ a ω equivale a substituir em ω as variáveis yi e

suas diferenciais pelas funções xk e df (xk ).
Vimos na proposição anterior que a adição comuta com a substi-
tuição de variáveis (f ∗ (ω1 + ω2 ) = f ∗ (ω1 ) + f ∗ (ω2 )) veremos agora
que o produto exterior de duas formas diferenciais quaisquer também
comutam com a substituição de variáveis.
Na Seção 6, Capı́tulo 3 [L], quando consideramos mudanças de
variável
F (x, y) = (X(x, y), Y (x, y)),
a expressão de uma forma W na variável (X, Y ) era calculada na
variável (x, y). O Teorema 16 e a Proposição 17, Capı́tulo 3 [L],
são casos particulares da propriedade geral apresentada pela última
expressão. Por exemplo, expressar a forma diferencial W = dX ∧ dY
na variável (X, Y ) através de outra forma diferenciável w na variável
(x, y) corresponde a tomar w = F ∗ (W ), isto é, w = F ∗ (dX ∧ dY ) =
( ∂X ∂X ∂Y ∂Y
∂x dx + ∂y dy) ∧ ( ∂x dx + ∂y dy).
Exercı́cio: No caso geral, dados abertos A, B do Rn ,o difeomorfismo

f : A → B, e W (y) = c(y) dy1 ∧ ... ∧ dyn uma n-forma diferencial
em B, então a n-forma diferencial w = f ∗ (W ) em A é dada por
w(x) = c(f (x)) (det Df (x)) dy1 ∧ ... ∧ dyn = z(x) dy1 ∧ ... ∧ dyn . Isto
segue do fato que w(e1 , e2 , .., en ) = z(x).
Proposição 4.4. Seja f : A ⊂ Rn → Rm uma aplicação diferenciá-

vel que a cada (x1 , . . . , xn ) ∈ A ⊂ Rn , associa
(y1 , . . . , ym ) = (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))
∈ Rm então:
(a) f ∗ (ω ∧ϕ) = f ∗ (ω)∧f ∗ (ϕ), onde ω e ϕ são formas diferenciais
em Rm .
(b) (f ◦ g)∗ (ω) = g ∗ (f ∗ (ω)), onde g : Rp → Rn é uma aplicação
diferenciável.
i i
i i
“mec˙New”
i i
2011/10/11
page 92
i i
P P
Demonstração: Sejam ω = I aI dyI , ϕ = I bJ dyJ .
P
Sabemos que: ω ∧ ϕ = I,J aI bJ dyI ∧ dyJ .
P
(a) f ∗ (ω ∧ ϕ) = I,J aI (f1 , . . . , fm )bJ (f1 , . . . , fm )dfI ∧ dfJ =
f (ω) ∧ f ∗ (ϕ)
∗
P
(b) (f ◦ g)∗ (ω) = I aI ((f ◦ g)1 , . . . , (f ◦ g)m )d(f ◦ g)I =
P
= I aI (f1 (g1 , . . . , gn ), . . . , fm (g1 , . . . , gn ))dfI (dg1 , dg2 , . . . , dgn )
= g ∗ (f ∗ (ω))
Dada uma 0-forma diferenciável, ou seja, uma função diferenciável,
podemos obter uma 1-forma, efetuando a operação de derivação so-
bre f . Vamos definir agora uma operação sobre uma k-forma, a qual
chamaremos de diferencial exterior, que associa esta k-forma a uma
(k + 1)-forma.
P
Definição 4.7. Se ω = I aI dxI é uma k-forma diferencial, a di-
ferencial exterior de ω será a (k + 1)-forma diferencial definida da
seguinte maneira:
X
dω = daI ∧ dxI .
I
Proposição 4.5. (a) d(ω1 + ω2 ) = dω1 + dω2 , ω1 e ω2 são k-formas.

(b) d(ω1 ∧ ω2 ) = dω1 ∧ ω2 + (−1)k ω1 ∧ dω2 , ω1 uma k-forma e ω2
é uma s-forma.
(c) d(dω) = d2 ω = 0.
(d) d(f ∗ (ω)) = f ∗ (dω), onde ω é uma k-forma em Rm e f : A ⊂
R → Rm é uma aplicação diferenciável.
n
Observação 4.3. O item (d) nos diz que esta operação de tomar
derivada independe das coordenadas que usamos para representar ω.
Demonstração:
P P
(a) Sejam
P ω1 = I aI dxI e ω2 = I bI dxI duas k-formas e
ω1 + ω2 = I (aI + bI )dxI .
P P P
d(ω1 +ω2 ) = I d(aI +bI )∧dxI = I daI ∧dxI + I dbI ∧dxI =
dω1 + dω2
i i
i i
“mec˙New”
i i
2011/10/11
page 93
i i
93
P P
(b) ω1 = P I aI dxI uma k-forma e ω2 = J bJ dxJ uma s-forma,
ω1 ∧ ω2 = I,J aP I bJ dxI ∧ dxJ P
P d(ω 1 ∧ ω 2 ) = I,J d(aI bJ ) ∧ dxI ∧ dxJ = I,J daI bJ ∧ dxI ∧ dxJ +
I,J aJ db J ∧ dx I ∧ dx J =
P
= dω1 ∧ ω2 + (−1)k I,J aI dbJ (−1)k ∧ dxI ∧ dxJ = dω1 ∧ ω2 +
(−1)k ω1 ∧ dω2 .
(c) Demonstraremos este item usando indução em k.

Primeiramente provaremos a validade da asserção, para 0-formas.
Seja f : A ⊂ Rn → R.
n
! n
!
X ∂f X ∂f
d(df ) = d dxi = d ∧ dxi =
i=1
∂xi i=1
∂xi
n n
!
X X ∂2f
= dxj ∧ dxi =
i=1 j=1
∂xi ∂xj
X ∂2f X ∂2f
= dxj ∧ dxi + dxj ∧ dxi = 0,
i<j
∂xi ∂xj i>j
∂xi ∂xj
pois os coeficientes são iguais e dxj ∧ dxi = −dxi ∧ dxj , portanto

d(df ) = 0.
Suponhamos agora, por hipótese de indução, que tenhamos
d(dω) = 0, para uma k-forma ω, mostraremos que o mesmo vale para
uma (k + 1)-forma.
Toda a (k +1)-forma pode ser escrita como soma de (k +1)-formas
do tipo ω ∧ dxi . Pelo que provado no item (a), a soma comuta com a
diferenciação externa, portanto, temos que provar o item (c) apenas
para as (k + 1)-formas do tipo ω ∧ dxi .
d(d(ω ∧ dxi )) = d(dω ∧ dxi + (−1)k ω ∧ d(dxi )), ora xi : Rm → R
é uma 0-forma, logo d(dxi )) = 0, sendo assim
d(d(ω ∧ dxi )) = d(dω ∧ dxi ) = d(dω) ∧ dxi + (−1)k dω ∧ d(dxi ) = 0,
pois d d(ω) = 0 por hipótese de indução, e d(dxi )) = 0 também.
(d) Da mesma forma que fizemos no item (c), a demonstração
será feita por indução em k.
Provaremos o resultado inicialmente para uma 0-forma g : Rm → R.
i i
i i
“mec˙New”
i i
2011/10/11
page 94
i i
m
! m n
X ∂g X ∂g X ∂fi X ∂(g ◦ f )
∗ ∗
f (dg) = f dyi = dxj = dxj =
i=1
∂yi i=1
∂yi j=1 ∂xj j
∂xj
= d(g ◦ f ) = d(f ∗ g).

Suponhamos agora que d(f ∗ ω) = f ∗ (dω), para ω uma k-forma
provaremos que este resultado é válido para uma k + 1-forma.
Toda a k + 1-forma é escrita como uma soma finita de formas do
tipo ω ∧ dxi , mas tanto f ∗ , como “d”, comutam com a soma (pro-
posições anteriores), assim, temos apenas que provar este resultado
para k + 1-formas do tipo ω ∧ dxi .
f ∗ (d(ω ∧ dxi )) = f ∗ (dω ∧ dxi + (−1)k ω ∧ d(dxi )) = f ∗ (dω ∧ dxi ) =
f (dω) ∧ f ∗ (dxi ), mas por hipótese de indução f ∗ (dω) = d(f ∗ (ω)).
∗
Portanto,
f ∗ (d(ω ∧ dxi )) = d(f ∗ (ω)) ∧ f ∗ (dxi ) =
= d[f ∗ (ω) ∧ f ∗ (dxi )] = d(f ∗ (ω ∧ dxi )).

Definição 4.8. A integral de uma k-forma diferenciável w em Rn ,
sobre uma superfı́cie k-dimensional S ⊂ Rn , parametrizada por uma
única g(x1 , ..., xk ), g : U ⊂ Rk → Rn , U simplesmente conexo, (tal
superfı́cie é dita simples conforme Definição 12, Capı́tulo 1) é por
definição
Z Z
∂g ∂g ∂g
w= wg(x) , , ..., dx1 dx2 ...dxk
S U ∂x1 ∂x2 ∂xk
Esta definição engloba todas as definições de integral de forma

diferencial (integral de linha, de superfı́cies, sobre abertos etc.) apre-
sentadas na Seção 6, Capı́tulo 3.
Observação 4.4. Note que conforme o exercı́cio proposto anterior-
mente para uma n-forma diferencial
a(x) dx1 ∧ dx2 ∧ ... ∧ dxn
i i
i i
“mec˙New”
i i
2011/10/11
page 95
i i
95
em Rn , e f : A ⊂ Rn → Rn vale que
fx∗ (a(x) dx1 ∧ ... ∧ dxn ) = a(f (x)) (det Jac f )(x)dx1 ∧ ... ∧ dxn .
Deste modo se g1 : U1 → S e g2 : U2 → S forem duas cartas
coordenadas para S, aplicando este resultado para f = g1 ◦ (g2 )−1 ,
segue da fórmula de mudança de variáveis que
Z
∂g1 ∂g1 ∂g1
wg1 (x) , , ..., dx1 dx2 ...dxk =
U1 ∂x1 ∂x2 ∂xk
Z
∂g2 ∂g2 ∂g2
wg2 (x) , , ..., dx1 dx2 ...dxk .
U2 ∂x1 ∂x2 ∂xk
R
Logo, S w independe da escolha da carta coordenada e é assim
um conceito intrı́nseco.
Esta propriedade é similar a que foi considerada na Seção 10,
Capı́tulo 3 [L], sobre integrais de superfı́cies.
Exercı́cio: Mostre que dado f : A ⊂ Rn → A ⊂ Rn e w k-forma

diferencial, então f ∗ (w) = w, se e somente se, para toda superfı́cie
S ⊂ A de dimensão k
Z Z
w= f ∗ (w).
S S
Para a integral de uma forma diferencial sobre a superfı́cie simples

S estar bem definida, devemos fixar uma orientação sobre S (ver
Capı́tulo 3 [L]).
Para integrar superfı́cies k dimensionais não simples, que são ob-
tidas através de várias cartas g, utilizaremos partições da unidade
que serão apresentadas em breve (ver Definição 4.25).
Este procedimento será uma alternativa ao procedimento de co-
lar superfı́cies k dimensionais simples que foi desenvolvido na seção
Capı́tulo 3 [L]. Este procedimento poderá também ser utilizado para
integrar formas diferenciais em variedades.
Note que uma n-forma em Rn é sempre da forma a(x)dx1 ∧ dx2 ∧
... ∧ dxn .
Definição 4.9. Uma n-forma diferencial em Rn com a(x) ≥ 0 é
chamada uma forma volume sobre Rn .
i i
i i
“mec˙New”
i i
2011/10/11
page 96
i i
Figura 4.1:
Note que segue da definição acima que para uma forma volume
w = a(x)dx1 ∧ dx2 ∧ ... ∧ dxn em Rn , e para um aberto A ⊂ Rn
Z Z
w= a(x)dx1 dx2 ...dxn .
A A
Vamos agora introduzir o conceito de variedade diferenciável.

Seja M um conjunto. Um sistema de coordenadas locais ou carta
local em M é uma aplicação bijetiva fα : Uα → fα (Uα ) de um sub-
conjunto Uα ⊂ M sobre um aberto fα (Uα ) ⊂ Rn .
Dizemos que n é a dimensão de fα : Uα → fα (Uα ).
Para cada p ∈ Uα tem-se fα (p) = (x1 (p), ..., xn (p)). Os números
xi = xi (p), i = 1, ..., n são chamados as coordenadas do ponto p ∈ M
no sistema fα .
Definição 4.10. Um atlas de dimensão n sobre um conjunto M é
uma coleção U de sistemas de coordenadas locais fα : Uα → Rn em
M , cujos domı́nios Uα cobrem M . Os domı́nios Uα dos sistemas de
coordenadas fα ∈ U são chamados as vizinhanças coordenadas de U.
i i
i i
“mec˙New”
i i
2011/10/11
page 97
i i
97
Definição 4.11. Um conjunto M no qual existe um atlas de di-

mensão n chama-se uma variedade de dimensão n. Em outras pala-
vras, M é uma variedade de dimensão n se, e somente se, cada ponto
x de M existe fα : Uα → Rn carta local com x ∈ Uα .
Usaremos a seguinte notação: gα : Vα → Uα ⊂ M é a inversa de
fα : Uα → Vα ⊂ Rn . Logo Vα é um aberto em Rn .
Sendo assim, um variedade M de dimensão n pode ser alternativa-
mente definida por um atlas U cartas gα : Vα → M , tal que ∪α gα (Vα )
cobre todo M e onde para todo α, Vα é aberto de Rn .
Exemplo 4.3. Toda superfı́cie M ⊂ Rm de dimensão n é uma va-
riedade de dimensão n.
Dados os sistemas de coordenadas locais fα : Uα → Rm e fβ :
Uβ → Rn no conjunto M , tais que Uα ∩ Uβ 6= ∅, cada ponto p ∈
Uα ∩ Uβ tem coordenadas xi = xi (p) no sistema fα e coordenadas
y i = y i (p) relativamente ao sistema fβ .
A correspondência
(x1 (p), ..., xn (p)) ↔ (y 1 (p), ..., y n (p))
estabelece uma bijeção ϕαβ = fβ ◦ fα−1 : fα (Uα ∩ Uβ ) → fβ (Uβ ∩ Uα )
que é chamada mudança de coordenadas.
As mudanças de coordenadas são ditas C ∞ se elas são de Classe
k
C para todo k ∈ N. Todas as variedades, mudanças de coordenadas,
funções etc., que consideraremos no texto serão assumidas ser de
classe C ∞ .
Definição 4.12. Um atlas U de dimensão n sobre um conjunto M
diz-se diferenciável, de classe C ∞ (k ≥ 1), se todas as mudanças de
coordenadas ϕαβ = fβ ◦ fα−1 , fα , fβ ∈ U são aplicações de classe
C ∞.
Como ϕαβ = (ϕβα )−1 , e ϕβα é diferenciável segue-se que os ϕαβ
são, de fato, difeomorfismos de classe C ∞ (ver Figura 4.1). Em par-
ticular, se escrevemos ϕαβ : (x1 , ..., xn ) 7→ (y 1 , ..., y n ), então o deter-
minante jacobiano !
∂y i
det
∂xj
é não nulo em todo ponto de fα (Uα ∩ Uβ ).
i i
i i
“mec˙New”
i i
2011/10/11
page 98
i i
Definição 4.13. Uma variedade diferenciável, de dimensão n e classe

C ∞ é um par ordenado (M, U) onde M é um conjunto e U é um atlas
de dimensão n e classe C ∞ sobre M .
Na maioria das vezes vamos omitir o U quando nos referimos a
uma variedade M .
O espaço Rn é naturalmente uma variedade diferenciável com um
atlas U com uma única carta fα : Uα = Rn → Rn , onde fα (x) = x.
Definição 4.14. Uma variedade orientável M é uma variedade di-
ferenciável que admite um atlas cobrindo toda a variedade e de tal
jeito que as mudanças de carta coordenadas ϕαβ sempre satisfazem
a propriedade que que
!
∂y i
det > 0.
∂xj
Figura 4.2:
O conjunto de cartas que satisfazem tal propriedade é chamado

de uma orientação para a variedade. Quando falamos de uma varie-
dade M orientável, estamos implicitamente dizendo que fixamos uma
orientação em M , ou seja que fixamos um atlas como acima.
i i
i i
“mec˙New”
i i
2011/10/11
page 99
i i
99
Exercı́cio: O espaço Rn com o atlas U, constituı́do pelas cartas

f1 (x) = x e f2 (x) = 2x é uma variedade orientável.
Exemplo 4.4. O Plano Projetivo P 2 é uma variedade diferenciável
de dimensão dois como veremos a seguir. O plano projetivo P 2 é o
conjunto das retas r de R3 que passam pela origem (0,0,0) de R3 .
Uma tal reta é determinada por um ponto (x, y, z) 6= (0, 0, 0) de R3 e
os pontos (λx, λy, λz), λ 6= 0, determinam a mesma reta. Portanto,
P 2 é o espaço quociente de R3 −{(0, 0, 0)} pela relação de equivalência
que identifica (x, y, z) com (λx, λy, λz), λ 6= 0; os pontos de P 2 , que
são retas r passando pela origem, serão indicados por r = [x, y, z] =
{(x1 , y1 , z1 )| tal que existe λ 6= 0, tal que (x, y, z) = λ(x1 , y1 , z1 )}.
Qualquer elemento (x1 , y1 , z1 ) ∈ [x, y, z] pode ser tomado como
representante da classe, isto é, [x, y, z] = [x1 , y1 , z1 ].
Definimos em P 2 subconjuntos U1 , U2 , U3 por:
U1 = {[x, y, z]; x 6= 0},
U2 = {[x, y, z]; y 6= 0},

U3 = {[x, y, z]; z 6= 0}
e aplicações gi : R2 → Ui , i = 1, 2, 3, por:
g1 (u, v) = [1, u, v],
g2 (u, v) = [u, 1, v],

g3 (u, v) = [u, v, 1]
onde (u, v) ∈ R2 .
Em termos geométricos, U2 é o conjunto das retas de R3 que
passam pela origem e não pertencem ao plano xOz.
Afirmamos que as funções
fα1 = g1−1 , fα2 = g2−1 , fα3 = g3−1 ,
determinam um atlas C ∞ sobre P 2 . Com efeito, cada aplicação gi ,

i = 1, 2, 3, é evidentemente biunı́voca e
[
gi (R2 ) = P 2 .
i
i i
i i
“mec˙New”
i i
2011/10/11
page 100
i i
A última igualdade segue do fato que dado qualquer reta r, toman-

do um ponto (x, y, z) sobre ela e supondo (sem perda de generalidade)
que x 6= 0, então g1 (y/x, z/x) = r
Resta mostrar que fαi (Ui ∩ Uj ) é aberto em R2 e que fα−1 j
◦ fαi
é aı́ diferenciável. Demonstraremos este fato para i = 1, j = 2; os
outros casos são inteiramente análogos.
Os pontos de fα1 (U1 ∩ U2 ) são da forma (u, v), com u 6= 0, v 6= 0.
Portanto fα1 (U1 ∩ U2 ) é aberto em R2 e

−1 −1 1 v 1 v
fα2 ◦ fα1 (u, v) = fα2 [1, u, v] = g2 , 1, = ,
u u u u
é evidentemente diferenciável, como querı́amos.

Logo, P 2 admite um atlas C ∞ .
Pode-se mostrar que o plano projetivo não é uma variedade orien-
tável (ver por exemplo [Li3]).
Passaremos agora a estender às variedades diferenciáveis as noções
de Cálculo diferencial que são válidas em abertos do Rn .
Superfı́cies diferenciáveis de dimensão 2 podem ser obtidas via um
processo de colagem a partir de abertos do R2 (ver Figuras 4.2 e 4.3).
Definição 4.15. Seja S uma variedade diferenciável de dimensão n.
Uma função ϕ : S → R é diferenciável em p ∈ S se para alguma
parametrização gα : Vα → S, Vα ⊂ IRn com p ∈ gα (Vα ), tem-se que
ϕ ◦ gα : Vα → R é diferenciável no ponto gα−1 (p).
Diremos que ϕ é diferenciável em S se é diferenciável para todo
p ∈ S. A função ϕ ◦ gα é chamada a expressão de ϕ na parametriza-
ção gα .
É claro que esta definição independe da parametrização, pois se
gβ : Vβ → S é outra parametrização, com p ∈ gα (Vα ) ∩ gβ (Vβ ), então
ϕ ◦ gβ = (ϕ ◦ gα ) ◦ (gα−1 ◦ gβ ),
e assim ϕ ◦ gβ é diferenciável, se e somente se, ϕ ◦ gα é diferenciável

(pois é composta de aplicações diferenciáveis).
Um caso particular importante da definição acima é dado a seguir.
Definição 4.16. Seja S uma variedade de dimensão n. Uma curva
λ : I = (−ǫ, ǫ) ⊂ R → S é diferenciável em t ∈ I se, para alguma
i i
i i
“mec˙New”
i i
2011/10/11
page 101
i i
101
Figura 4.3:
parametrização gα : Vα → S, com λ(t) ∈ gα (Vα ), tem que gα−1 ◦ λ :

I → Rn é diferenciável em t.
A curva gα−1 ◦ λ = fα ◦ λ é chamada a expressão local de λ na
parametrização gα .
A verificação de que esta definição independe da parametrização
escolhida é análoga à anterior.
Gostarı́amos agora de definir a noção de vetor tangente a uma
variedade diferenciável S, e aı́ encontramos a nossa primeira dificul-
dade. Se a variedade S de dimensão n está contida no meio ambiente
Rk , então dada uma curva x(t) cuja imagem está contida em S faz
sentido x(t + δt) − x(t) ∈ Rk . A seguir tomando
x(t + δt) − x(t) ∈ Rk
lim = v ∈ Rk ,
δt→0 δt
obtemos o vetor tangente.
Quando S é definida intrinsecamente, S não é e nem está contida
num espaço vetorial, logo x(t + δt) − x(t) ∈ Rk não faz sentido.
Nosso problema se reduz então a definir de maneira alternativa o
vetor tangente a uma curva diferenciável λ : I → S. Por exemplo,
i i
i i
“mec˙New”
i i
2011/10/11
page 102
i i
quando S ⊂ R3 é superfı́cie de dimensão 2, o vetor tangente de λ

é simplesmente o vetor velocidade λ′ (t) de λ, como vetor de R3 .
Como não temos a estrutura ambiente de R3 , precisamos destacar
uma propriedade caracterı́stica do vetor tangente que não dependa
do espaço ambiente.
Para isto, seja v um vetor de R2 , com origem em p ∈ R2 e compo-
nentes (α, β). Escolha-se uma curva diferenciável λ : I = (−ǫ, ǫ) →
R2 com λ(0) = p e λ′ (0) = v = (α, β).
Se λ(t) = (u1 (t), u2 (t)), podemos escrever que
α = u′1 (0),
β = u′2 (0).
Observe-se agora que dada uma função ϕ, diferenciável em uma
vizinhança de p, podemos restringir ϕ a λ(t) e tomar a “derivada
direcional”de ϕ em relação a v, isto é

d(ϕ ◦ λ) ∂ϕ du1 ∂ϕ du2
= + =
dt t=0 ∂u1 dt ∂u2 dt t=0

∂ ∂
= α +β ϕ.
∂u1 t=0 ∂u2 t=0
Desta maneira, a “derivada direcional segundo v”é um operador
L sobre funções diferenciáveis que só depende de v. Esta será a pro-
priedade que tomaremos no caso geral para definir o vetor tangente
a uma curva.
O vetor v está associado de maneira única ao α e β que definem
o operador L = Lλ sobre funções ϕ tomando valores reais

∂ ∂
Lλ (ϕ) = L(ϕ) = α +β ϕ.
∂u1 t=0 ∂u2 t=0
Em outra palavras, optamos por determinar o vetor v por sua
ação sobre funções diferenciáveis em vez de tomar o objeto geométrico
v ∈ Rk .
Note que o operador acima depende de α e β e não da expressão
escolhida para λ (lembre que várias possı́veis curvas λ tem a mesma
tangente v = (α, β)).
i i
i i
“mec˙New”
i i
2011/10/11
page 103
i i
103
Um vetor tangente será considerado a seguir como um destes o-

peradores L : Dp → R obtidos a partir de um λ, agindo sobre Dp , o
conjunto das funções ϕ diferenciáveis em p.
Definição 4.17. Seja λ : I → S uma curva diferenciável em uma

variedade diferenciável S de dimensão n com λ(0) = p, e seja Dp
o conjunto das funções ϕ : S → R, diferenciáveis em p. O vetor
tangente a curva λ no ponto p é a função real L = Lλ : Dp → R tal
que para cada ϕ ∈ Dp ,

d
L(ϕ) = (ϕ ◦ λ) .
dt t=0
Um vetor tangente em p ∈ S é o vetor tangente de uma curva dife-

renciável λ : I → S, com λ(0) = p.
Muitas curvas distintas λ poderão determinar o mesmo operador

L = Lλ .
Denotaremos por Tp S o conjunto de tais vetores tangentes, ou
seja de tais operadores L. Algumas vezes, por abuso de linguagem,
vamos denotar o vetor tangente L = Lλ por λ′ (0), onde λ é um dos
λ tais que Lλ = L. Pode-se mostrar (ver considerações a seguir) que
o espaço Tp S de tais L = Lλ para diferentes λ, é um espaço vetorial
de dimensão n.
Note que vários λ podem determinar um mesmo L = Lλ . No caso
de superfı́cies de dimensão 2 em R3 , os λ que geram o mesmo L são
aqueles que determinam o mesmo vetor λ′ (0) = v ∈ R3 . Isto segue
do fato que os α e β acima ficam neste caso determinados de maneira
única a partir de v.
Algumas vezes, tais L da Definição 4.17 serão também denotados
por v ∈ Tp S.
Fixada uma parametrização
gα (u1 , u2 , ..., un ), e um ponto p ∈ S
∂
usaremos a notação ∂ui ∈ Dp para denotar o operador L definido
0
pela curva
x(t) = gα (u1 , u2 , ..., ui1 , ui + t, ui+1 , ..., un ),
onde gα (u1 , u2 , ..., un ) = p. Note que x(0) = p.
i i
i i
“mec˙New”
i i
2011/10/11
page 104
i i
Para mostrar que a noção acima L = Lλ possui as proprie-

dades usuais dos vetores tangentes, considere uma parametrização
gα : Vα → S, com
gα (0, 0, ..., 0) = p.
Seja ϕ uma função diferenciável em uma vizinhança de p e supo-
nhamos que ϕ ◦ gα se escreva como ϕ(u1 , u2 , ..., un ). Então é claro
que
′ dϕ(u1 (t), u2 (t), ..., un (t))
λ (0)(ϕ) = =
dt
t=0

∂ ∂
= α1 + ... + αn (ϕ)
∂u1 0 ∂un 0
onde αi = u′i (0). Decorre daı́ que

∂ ∂
λ′ (0) = α1 + ... + αn
∂u1 0 ∂un 0
onde
∂
, i ∈ {1, ..., n}
∂ui 0
são os vetores tangentes em p respectivamente às curvas
ui → λ(0, ..., ui , ..., 0).
Seja T o espaço vetorial gerado por

∂
, i ∈ {1, 2, ..., n}
∂ui 0
onde as operações são definidas como operações sobre funções.

Em resumo, como não podemos falar do vetor tangente da ma-
neira usual para superfı́cies, estamos substituindo o vetor tangente
pela sua ação sobre funções ϕ diferenciáveis.
Lema 4.1. O conjunto Tp (S) dos vetores tangentes v = Lλ a S em
p ∈ S coincide com T . O vetor (α1 , ..., αn ) ∈ Rn definido como
acima, é chamado de expressão local do vetor v segundo a carta gα .
A aplicação que leva (α1 , ..., αn ) em v é um isomorfismo de espaços
vetoriais.
i i
i i
“mec˙New”
i i
2011/10/11
page 105
i i
105
Demonstração: Pelo que acabamos de ver Tp (S) ⊂ T . Reciproca-

mente, se v ∈ T , então existem α1 , ..., αn ∈ R tal que

∂ ∂
v = α1 + ... + αn .
∂u1 0 ∂un 0
Seja λ : I → S uma curva, cuja expressão nas coordenadas

(u1 , u2 , ..., un ) da parametrização gα é u1 (t) = αi t,... un = αn t.
Então
′ ∂ ∂
Lλ = λ (0) = α1 + ... + αn ,
∂u1 0 ∂un 0
isto é, v ∈ Tp (S).
Decorre daı́ que a soma de elementos L de Tp (S), definida como
soma de funções, é ainda um elemento de Tp (S) e o mesmo se passa
com o produto por um número real. É imediato verificar que, com
estas operações, Tp (S) é um espaço vetorial. Além disso,

∂ ∂
, ...,
∂u1 0 ∂un 0
são vetores linearmente independentes que geram Tp (S). Portanto

Tp (S) tem dimensão n e é chamado o plano tangente de S em p.
A base
∂ ∂
, ...,
∂u1 0 ∂un 0
de Tp (S) é chamada a base associada à parametrização f no ponto p.

Voltemos à extensão das noções de Cálculo às variedades diferen-
ciáveis.
Definição 4.18. Dada uma variedade S, o fibrado tangente a S é o

conjunto ∪p∈S Tp (S) = T S.
Note que o fibrado tangente tem uma estrutura de variedade

diferenciável de dimensão 2n. De fato, dado uma parametrização
gα,β (u1 , ..., un ), a função Gα,β (u1 , ..., un , u̇1 , ..., u̇n ) que associa a cada
(u1 , ..., un ) e a cada vetor
(u̇1 , ..., u̇n )
i i
i i
“mec˙New”
i i
2011/10/11
page 106
i i
o operador L definido por por

∂ ∂
L = u̇1 + ... + u̇n ,
∂u1 0 ∂un 0
determina cartas coordenadas de R2n em T S. Estas cartas, é fácil

ver, determinam em T S uma estrutura de variedade diferenciável.
Um campo de vetores G numa variedade M de dimensão n é uma
escolha de um vetor v(p) = G(p) ∈ Tp M para todo p ∈ M . O campo
de vetores é diferenciável se para alguma (todas) carta coordenada
fα = gα1 tal que p ∈ Uα , a expressão local de G(p) em Rn (ver Lema
4.1), através da carta coordenada fα , em coordenadas locais em Rn
define um campo de vetores diferenciável em Rn .
Uma curva λ(t) em M é uma solução da equação diferencial asso-
ciada ao campo de vetores G, com condição inicial p0 no tempo t0 , se
λ′ (t) = G(λ(t)) e λ(t0 ) = p0 . Passando para cartas locais fα , a exis-
tência e unicidade de soluções de campos de vetores diferenciáveis G
em variedades segue de imediato do Teorema 10.8 [DL] de existência
e unicidade. A solução λ(t) em M é obtida através da carta coorde-
nada fα e da solução da equação diferencial de primeira ordem em
fα (Uα ) ⊂ Rn . Para valores grandes de t (muito maiores que t0 ) a
solução pode sair fora de uma carta coordenada. A solução λ(t), neste
caso, é obtida pela expressão em cada carta local e “colada”pedaço
a pedaço em M .
Definição 4.19. Seja uma aplicação h : S1 → S2 e p ∈ S1 . Diz-

se que h é diferenciável em p, se existem sistemas de coordenadas
g1 : V1 → S1 e g2 : V2 → S2 com p ∈ g1 (V1 ) e h(p) ∈ g2 (V2 ),
tais que g2−1 ◦ h ◦ g1 é diferenciável em g1−1 (p). A aplicação h diz-se
diferenciável em S1 se for diferenciável em p para todo p ∈ S1 .
De uma maneira análoga ao que consideramos nas definições an-

teriores, verifica-se que a definição acima não depende dos sistemas
de coordenadas escolhidas.
Definição 4.20. Um difeomorfismo h : S1 → S2 é uma aplicação

bijetiva de S1 sobre S2 , tal que h e sua inversa h−1 : S2 → S1 são
diferenciáveis.
i i
i i
“mec˙New”
i i
2011/10/11
page 107
i i
107
Definição 4.21. A derivada de uma aplicação diferenciável h : S1 →

S2 em p ∈ S1 é a aplicação dhp : Tp S1 → Th(p) S2 que a cada operador
v = L ∈ Tp S1 (agindo em Dp ) associa o operador ṽ = L̃ = dhp (v) ∈
Th(p) S2 (agindo em Dh(p) ), da seguinte maneira: se L = Lλ = λ′ (0)
, para alguma curva λ : I → S1 com λ(0) = p, então dhp (v) =
(h ◦ λ)′ (0) = L̃ = L̃h◦λ . É fácil ver que dhp independe da curva
λ e que é uma aplicação linear. Vamos denotar a derivada de h
por dh : T S1 → T S2 , repetindo o processo acima em cada ponto
p ∈ S1 , onde T S1 (respectivamente T S2 ) denota o fibrado tangente a
S1 (respectivamente S2 ).
Observação 4.5. Com a noção de diferencial, podemos obter a se-
guinte interpretação da base de Tp (S), associada a uma parametri-
zação gα : Vα → S. Suponhamos que gα (q) = p, q = (0, 0, ..., 0),
e sejam {e1 , ..., en } os vetores da base canonica de Rn (e que estão
associados aos operadores
∂
,
∂ui
i ∈ {1, 2, ..., n}). Então

d ∂
dgαq (ei ) = gα (0, ..., ui , ..., 0) =( )p ,
dui ui =0 ∂ui
formam um base de Tp S, se variamos i ∈ {1, 2, ..., n}.

Mais precisamente, para i ∈ {1, 2, ..., n} fixo e para cada ϕ ∈ Dp

∂ d
(ϕ) = ϕ ◦ gα (0, ..., ui , ..., 0)
∂ui p dui ui =0
é um elemento da base de Tp S.
Convém estendermos a definição de variedade, dada anterior-
mente, de modo a incluir as variedades com “bordo”. A definição
acima apresentada de variedade diferenciável não inclui, por exem-
plo, o conjunto M (o cilindro com bordo) dado por
M = {(x, y, z) ∈ R3 ; 1 = x2 + y 2 , 1 ≥ z0 ≥ 0},
pois a interseção V ∩M de qualquer vizinhança V em R3 de um ponto
p = (x, y, z0 ) do “bordo”de M com M não é sequer homeomorfa a
um aberto de R2 .
i i
i i
“mec˙New”
i i
2011/10/11
page 108
i i
Observamos, entretanto, que V ∩ M é homeomorfa a um aberto

do semi-plano {(u, v) ∈ R2 ; v ≤ 0}, enquanto que os pontos de M
que não estão no bordo se comportam como pontos de uma variedade
de dimensão 2. Isso nos sugere uma nova definição de variedade que
inclui a situação mencionada.
Um aberto do Rn é sempre uma variedade de dimensão N .

Chamaremos de semi-espaço superior H n ⊂ Rn ao conjunto dada
por
H n = {(x1 , ..., xn ) ∈ Rn ; x1 ≥ 0}.
Um aberto V de H n é a interseção de um aberto U de Rn com
H , isto é, V = U ∩ H n .
n
Diremos que uma função f : V → R, definida de um aberto V de

H n é diferenciável se existir uma função f¯ : U → R de um aberto U
de Rn contendo V , tal que a restrição de f¯ a V seja igual a f . Se f
é diferenciável em V a diferencial dfp é definida por dfp = df¯p .
Se o aberto V não contém pontos da forma (0, x2 , ..., xn ) então,
V é um aberto de Rn e a definição coincide com a usual. Se p é
da forma (0, x2 , ..., xn ), dfp está definida para todos os vetores de Rn
com origem p, e não apenas para os que “apontam”para o semi-espaço
superior H n . Tomando curvas diferenciáveis em V passando por p, é
fácil mostrar que a definição de dfp não depende da extensão f¯ de f .
A definição de aplicação diferenciável f : V → Rn , V aberto em
n
H é estabelecida de maneira análoga.
Daremos agora uma definição de variedade com bordo, de modo
a incluir a definição (Definição 4.13) anterior de variedade como caso
particular.
Definição 4.22. Uma variedade diferenciável (de dimensão n) com

bordo regular é um conjunto M e um atlas de aplicações gα : Vα ⊂
H n → M de Vα ⊂ H n tomando valores em M tais que:
1)
[
gα (Vα ) = M
α
2) para todo par α, β, com gα (Vα )∩gβ (Vβ ) = W 6= ∅, os conjuntos

gα−1 (W ), gβ−1 (W ) são abertos em H n e as aplicações gβ−1 ◦gα , gα−1 ◦gβ ,
aı́ definidas, são diferenciáveis em H n (no sentido acima descrito).
i i
i i
“mec˙New”
i i
2011/10/11
page 109
i i
109
Figura 4.4:
Denotaremos por fα : Uα ⊂ M → H n as inversas dos respectivos

gα : Vα → M .
Um ponto p ∈ M é chamado um ponto do bordo de M se para um
sistema de coordenadas gα−1 = fα : Uα → H n em torno de p se tem
gα−1 (p) = fα (p) = (0, x2 , ..., xn ).
Note que para algumas cartas gα podem ter domı́nio Vα em aber-
tos em {(x1 , ..., xn ) | x1 > 0} e outras domı́nios Vα que possuem pon-
tos da forma (0, x2 , .., xn ).
Estas últimas cartas vão cobrir pontos do bordo de M .
Exercı́cio: O cilindro {(x, y, z) | x2 + y 2 = 1 , 0 ≤ z ≤ 1} é uma
variedade com bordo.
As definições de diferenciabilidade de funções, plano tangente,
orientabilidade, etc., para variedades com bordo são introduzidas de
maneira inteiramente análoga às correspondentes definições para va-
riedades.
Proposição 4.6. A definição de ponto de bordo independe do sistema
de coordenadas.
Demonstração: Seja g1 : V1 → M um sistema de coordenadas em
torno do ponto p do bordo de M tal que g1 (q1 ) = p, onde q1 é da
forma (0, x2 , ..., xn ).
Suponhamos, por absurdo, que em outro sistema de coordenadas
g2 : V2 → M se tenha g2 (q2 ) = p, onde q2 é da forma (x1 , ..., xn ),
i i
i i
“mec˙New”
i i
2011/10/11
page 110
i i
x1 6= 0.
Seja W = g1 (V1 ) ∩ g2 (V2 ); aplicação
g1−1 ◦ g2 : g2−1 (W ) → g1−1 (W )
é um difeomorfismo. Como q2 é da forma (x1 , ..., xn ) com x1 6= 0,

existe uma vizinhança U de q2 , V ⊂ g2−1 (W ) que não intercepta o
eixo x1 .
Restringindo g1−1 ◦ g2 a U , teremos uma aplicação diferenciável
g1−1 ◦ g2 : U → H n
com jacobiano não nulo em q2 ∈ U . Pelo teorema da função inversa

(ver [Li1]), g1−1 ◦ g2 leva uma vizinhança V ⊂ U de q2 em Rn difeo-
morficamente sobre uma vizinhança g1−1 ◦ g2 (V ) ⊂ g1−1 ◦ g2 (U ) de q1
em Rn ; mas então, g1−1 ◦ g2 (V ) conteria pontos de forma (x1 , ..., xn )
com x1 > 0, o que contradiz o fato de g1−1 ◦g2 (V ) ⊂ g1−1 (S). Portanto
a hipótese de que q2 é da forma (x1 , ..., xn ) com x1 6= 0 leva a uma
contradição.
O conjunto dos pontos de bordo de M que é, portanto, bem deter-
minado, é chamado o bordo de M e indicado por ∂M . Se ∂M = ∅, a
Definição 4.19 coincide com a Definição 4.13 de variedade diferencial.

Proposição 4.7. O bordo ∂M de uma variedade diferenciável de
dimensão n com bordo é uma variedade diferenciável de dimensão
n − 1.
Demonstração: Seja p ∈ M um ponto do bordo de M e gα :
Vα → M um sistema de coordenadas em torno de p, i.e., Vα ⊂ H n é
aberto, gα é biunı́voca e gα (q) = p, onde q = (0, x2 , ..., xn ) ∈ U .
Seja Z̄α = Vα ∩{(x1 , x2 , ..., xn−1 , xn ) ∈ Rn ; x1 = 0}. Identificando
{(x1 , x2 , ..., xn ) ∈ Rn ; x1 = 0}
com Rn−1 , Z̄α é um conjunto aberto de Rn−1 .

Se denotarmos por ḡα a restrição de gα a Z̄α , então pela Pro-
posição 4.6, ḡα (Z̄α ) ⊂ ∂M . É fácil ver que a famı́lia {(Z̄α , ḡα )} é
uma estrutura diferenciável em ∂M . A definição de orientação é
apresentada na Definição 4.14.
i i
i i
“mec˙New”
i i
2011/10/11
page 111
i i
111
Proposição 4.8. Seja M uma variedade com bordo ∂M . Se M é

orientável, uma orientação de M induz uma orientação em ∂M .
Demonstração: Fixemos uma orientação em M , isto é, escolha-
mos uma famı́lia gα : Vα → M de sistemas de coordenadas tal que
{gα (Vα )} cobre M , e se gα (Vα ) ∩ gβ (Uβ ) 6= ∅ então a mudança de
coordenadas tem jacobiano positivo. Consideremos a famı́lia dos Vα
tal que gα (Vα ) ∩ ∂M 6= ∅. Como vimos na proposição anterior, a
famı́lia {(Z̄α , ḡα )} é uma estrutura diferenciável em ∂M .
Basta então mostrar que se ḡα e ḡβ são dois sistemas de coorde-
nadas tais que ḡα (Z̄α ) ∩ ḡβ (Z̄β ) 6= ∅, a mudança de coordenadas
α β
uα β
2 = u2 (u2 , ..., un )
..
.
α β
uα β
n = un (u2 , ..., un )
satisfaz a condição
∂(uα α
2 , ..., un )
> 0.
∂(uβ2 , ..., uβn )
Para isso, observamos que a mudança de coordenadas de gα : Vα →M
a gβ : Vβ → M satisfaz as condições
β
0 = uα β
2 (0, u2 , ..., un )
α β
uα β
2 = u2 (u2 , ..., un )
..
.
β
uα α β
n = un (0, u2 , ..., un ),
e portanto
∂(uα α
1 ...un )
(0, uβ2 , ..., uβn ) =
∂(uβ1 ...uβn )
∂uα ∂(uα α
2 , ..., un )
1
(0, uβ2 , ..., uβ2 ) (0, uβ2 , ..., uβn ) > 0.
∂uβ1 ∂(uβ2 , ..., uβn )
Além disso,
∂uα
1
(0, uβ2 , ..., uβn ) > 0,
∂uβ1
i i
i i
“mec˙New”
i i
2011/10/11
page 112
i i
β β
pois uα β
1 = 0 em (0, u2 , ..., un ) e torna-se negativo com u1 . Portanto
∂(uα α
2 , ..., un )
> 0.
∂(uβ2 , ..., uβn )

Toda variedade diferenciável é uma variedade diferenciável com
bordo.
Definição 4.23. Dada uma variedade diferenciável com V de di-

mensão n, uma k-forma w em V é uma aplicação k-linear alternada
em cada fibra Tz M, z ∈ V . Em outras palavras, wz (v1 , v2 , ..., vk ) para
cada z ∈ V fixo, é linear em cada vi , i ∈ {1, 2, ..., n} e é também
alternada.
Por exemplo as 1-formas são aplicações 1-lineares, e assim, para

cada z são transformações lineares em cada Tz M tomando valores
reais.
Definição 4.24. Uma k-forma diferenciável w em uma variedade

diferenciável V é uma k-forma em V tal que para cada carta de
coordenadas locais gα : Vα ⊂ V → Rn , nas coordenadas locais
(x1 , x2 , ..., xn ), a forma w é expressa como
X
aI (x1 , x2 , ..., xn )dxI
I
e os aI (x1 , x2 , ..., xn ) são diferenciáveis em (x1 , x2 , ..., xn ).

Denotamos Ωk (V ) o conjunto das k-formas diferenciáveis em V .
As definições introduzidas anteriormente para formas diferenciais

em Rn se estendem de maneira análoga para formas diferenciais em
variedades V .
Por exemplo, a derivada dw de w ∈ Ωk (V ) é uma (k + 1)-forma
diferenciável dw ∈ Ωk+1 (V ) tal que em coordenadas locais é igual a
derivada de w (em coordenadas locais). Em geral qualquer conceito
que seja local, como derivada, etc. definido em Rn vai se extender
para uma variedade diferenciável V de maneira semelhante à maneira
acima utilizada.
i i
i i
“mec˙New”
i i
2011/10/11
page 113
i i
113
Seja M variedade de dimensão n e N variedade de dimensão r,

dada uma aplicação f : M → N , e uma k-forma diferencial w ∈
Ωk (N ), f ∗ (w) ∈ Ωk (M ) é obtida através da expressão local de f e
usando a definição anterior para fp∗ : Ωn (Rr ) → Ωk (Rn ). Portanto,
f ∗ (Ωk (N )) ⊂ Ωk (M ).
Figura 4.5:
Ainda, se w1 ∈ Ωk (V ) é uma k-forma e w2 ∈ Ωj (V ) é uma j-

forma, a (k + j)-forma w1 ∧ w2 ∈ Ωk+j (V ) é por definição dada local-
mente pelo produto exterior destas duas formas em cartas locais. To-
dos estes conceitos estão bem definidos. A forma w1 ∧ w2 ∈ Ωk+j (V )
é chamada de produto exterior de w1 e w2 .
Vamos considerar a partir de agora que o leitor está familiarizado
com as análogas definições de formas diferenciais sobre Rn para as
variedades diferenciáveis M .
Lembre que o suporte de uma k-forma w (respectivamente, uma
função φ) é o conjunto dos pontos q tal que wq (respectivamente φ)
não é nula.
Uma subvariedade A contida na variedade V , é uma variedade tal
que seu conjunto de pontos x ∈ A está contido em V e a aplicação de
inclusão i : A → V é diferenciv́el (como aplicação entre variedades).
Exigimos ainda que a aplica cão i tenha derivada injetiva me todos
os pontos.
i i
i i
“mec˙New”
i i
2011/10/11
page 114
i i
Seja V variedade de dimensão n. Para definir integral de uma k-

forma w ∈ Ωk (V ) sobre uma sub-variedade A de dimensão r contida
na variedade V (ver Definição 4.33), necessitaremos de algum cuidado
especial (integrar não é um conceito local como derivar). Em primeiro
lugar, se a forma w que desejamos integrar tem suporte no domı́nio Uα
de uma carta coordenada fα : Uα ⊂ V → Rn , então a sub-variedade
A, em cordenadas locais x ∈ Rn , vai resultar numa superfı́cie de
dimensão k em Rn .
A integral de w em A é neste caso a integral da forma w em A
(superfı́cie n-dimensional) nas coordenadas locais (x1 , x2 , ..., xn ) em
Rn (ver Definição 4.8). Não é difı́cil ver que tal conceito está bem
definido.
O problema é como definir integral no caso em que o suporte
da forma w não cabe inteiramente dentro do domı́nio de uma carta
coordenada.
Definição 4.25. Seja M variedade diferenciável, um conjunto coor-
denadas locais fαi : Uαi ⊂ M → Rn , i ∈ N. Considere um conjunto
P∞ 0 ≤ φi , i ∈ N definidas em M tomando va-
de funções diferenciáveis
lores em R tal que i=1 φi (x) = 1 e tal que o suporte de cada φi (q)
esta contido em Uαi . Vamos supor ainda que em cada carta Uαi ape-
nas um número finito das φj são não nulas. Tal conjunto de funções
φi , i ∈ N é chamada de uma partição da unidade para M .
Pode-se mostrar (ver por exemplo [MC1]) que dada uma variedade
diferenciável M sempre existe uma partição da unidade para M .
A partir de uma partição da unidade podemos definir a integral
de uma k-forma w como veremos em breve.
Referimos o leitor a [Li4] para referências sobre produto interno
e formas quadráticas.
Definição 4.26. Uma estrutura Riemanniana em uma variedade di-
ferenciável M de dimensão n é uma escolha de uma forma quadrática
W (v), v ∈ T Mq , q ∈ M definida positiva em cada plano tangente
T Mq . Vamos também exigir que tal forma quadrática W quando ex-
pressa em coordenadas locais gα : Vα ⊂ M → Rm seja tal que os
coeficientes aij (x1 , ..., xn ) de
n
X
ai,j (x1 , ..., xn )vi vj
i,j=1
i i
i i
“mec˙New”
i i
2011/10/11
page 115
i i
115
sejam diferenciáveis em (x1 , ..., xn ) ∈ gα (Vα ).

Acima, vi , i ∈ {1, 2, ..., n} denota as componentes do vetor tan-
gente v nas coordenadas x = (x1 , ..., xn ).
M munida de tal estrutura é denominada variedade Riemanniana.
Uma forma quadrática W está sempre associada de maneira única

a um produto interno < , >=< u, v >, u, v em T Mq tal que vale
W (v) =< v, v >, ∀v ∈ T Mq . Reciprocamente, podemos definir <
u, v >, u, v ∈ T Mq a partir de W por < u, v >= 12 (W (u + v) −
W (u) − W (v)).
Denotaremos a variedade diferenciável M com tal estrutura Rie-
manniana por (M, < , > ).
Note que cada carta local gα determina uma métrica Riemanniana
n
X
ai,j (x1 , ..., xn )vi vj
i,j=1
em um aberto no Rn no sentido anteriormente considerado (ver De-

finição 1, Seção 2 e Definição 20, Seção 7 do Capı́tulo 2.)
Proposição 4.9. Toda variedade diferenciável admite uma métrica

Riemanniana.
Demonstração: Sejam fi : Ui →Rn coordenadas locais e φi : M →R

funções diferenciáveis que determinam uma partição da unidade.
Se v é vetor tangente a M no ponto p e se p ∈ Ui , denotaremos
vi1 , ..., vin as coordenadas de v segundo fi .
Seja Wi (v) = vi21 + ... + vi2n se v ∈ Ui e Wi (v) = 0 se v não está
em Ui . P
Então W = φWi é uma métrica Riemanniana em M . Para
provar isto, basta lembrar que a soma anterior é localmente finita.
O comprimento de uma curva γ(t), t ∈ [a, b] contida em M é
obtida considerando várias cartas fi : Ui → Rn , i ∈ {1, ..., s} de tal
modo que o traço da curva γ esteja contido em ∪si Ui , pois γ[a, b] é
compacto (ver Definição 4.32, Capı́tulo 3). A seguir, dividimos [a, b]
em intervalos [a, a1 ], [a1 , a2 ], [a2 , a3 ], ..., [as−1 , b] que definem uma
partição de [a, b] de tal modo que γ[ai , ai+1 ] ⊂ Ui . Podemos calcular
o comprimento de γ[ai , ai+1 ] passando a uma carta local fi : Ui → Rn
i i
i i
“mec˙New”
i i
2011/10/11
page 116
i i
(use a Definição 18, Seção 7, Capı́tulo 2 para o comprimento de uma

curva γ|[ai ,ai+1 ] segundo uma métrica Riemanniana num aberto do
Rn ). O comprimento de γ, denotado por kγk, é por definição a
soma dos comprimentos das curvas γ[ai , ai+1 ]. Pode-se mostrar que
este procedimento está bem definido, isto é, não depende das cartas
escolhidas.
Vamos apresentar as seguir algumas definições e propriedades de
espaços métricos. Referimos o leitor a [Li2] para uma exposição com-
pleta sobre o tópico.
Definição 4.27. Um espaço métrico M é um conjunto munido com

uma função d(x, y), x, y ∈ M , d : M × M → R, chamada distância
(ou métrica) tal que
a) d(x, y) ≥ 0 e ainda vale que d(x, y) = 0, se e só se, x = y;
b) d(x, y) ≤ d(x, z) + d(z, y), ∀x, y, z ∈ M ;
c) d(x, y) = d(y, x).
Vamos denotar tal espaço por (M, d).
Exemplo 4.5. Quando considerarmos M o espaço Rn , então d(x, y)

= kx − yk (onde k k é a norma Euclidiana) define uma métrica, isto
é, as propriedades a), b), c) acima são satisfeitas para tal d. Para
abertos do Rn , se nada for dito, estaremos considerando a métrica
d(x, y) = kx − yk.
Definição 4.28. Um aberto A no espaço métrico (M, d) é um con-

junto A ⊂ M tal que ∀x ∈ A, existe ǫ > 0 tal que
{y ∈ M | d(x, y) < ǫ} ⊂ A.
Definição 4.29. Um conjunto F contido em (M, d) é dito fechado

se o conjunto M − F é aberto.
Definição 4.30. Uma aplicação contı́nua F : M1 → M2 , entre dois

espaços métricos (M1 , d1 ) e (M2 , d2 ), é uma aplicação F tal que, para
todo ponto x ∈ M1 , vale que para todo ǫ > 0, existe δ > 0 tal que se
d(x, y) < δ então d(f (x), f (y)) < ǫ.
Definição 4.31. Um homeomorfismo h entre os espaços métricos

(M1 , d1 ) e (M2 , d2 ) é uma aplicação bijetiva tal que h e h−1 são
contı́nuas.
i i
i i
“mec˙New”
i i
2011/10/11
page 117
i i
117
Uma cobertura de um espaço métrico M é uma coleção de abertos

Ai contidos em M (onde i varia num conjunto qualquer de ı́ndices)
tal que M ⊂ ∪i Ai .
Definição 4.32. Um espaço métrico M é dito compacto se toda co-

bertura por abertos admite uma subcobertura finita.
Exemplo 4.6. Para uma superfı́cies S de dimensão k em Rn , sempre

podemos considerar a métrica induzida pelo Rn , ou seja d(x, y) = kx−
yk, x, y ∈ S define uma métrica em Rn . É possı́vel mostrar que toda
superfı́cie S que é fechada no espaço Rn e que seja também limitada
(isto é, existe K ∈ R tal que ∀x, y ∈ S, d(x, y) ≤ K) é compacta
com relação a tal métrica. Logo, neste caso, é possı́vel selecionar
a partir de um atlas qualquer de S, um novo atlas com apenas um
número finito de cartas coordenadas. Isto porque, o domı́nio Uα de
cada carta coordenada de um atlas é um aberto de S e S é compacta.
Dada uma variedade diferenciável M com uma estrutura Rieman-
niana, vamos mostrar que sempre é possı́vel obter uma métrica (no
sentido da Definição 4.24) a partir da métrica Riemanniana.
Exemplo 4.7. Considere (M, < , >) variedade Riemanniana. E-

xiste uma distância natural d = d< , > em M associada à estrutura
Riemanniana < , >, definida para (x, y) ∈ M por
d(x, y) = inf{kγk | γ[a, b] → M,
γ é curva em M ligando γ(a) = x a γ(b) = y}.
É possı́vel mostrar que tal d define realmente uma métrica em M

(ver [MC1] [Li3]).
Vamos supor a partir deste momento pelo resto do texto que a
variedade M que vamos considerar esteja equipada com uma métrica
Riemanniana < , > e com a distância d = d< , > associada à estrutura
Riemanniana < , > do Exemplo 4.7.
Sempre se pode equipar uma variedade M com uma estrutura
Riemanniana como vimos na Proposição 4.9 acima.
Quando falarmos de um aberto em M variedade Riemanniana,
estaremos nos referindo à Definição 4.28 e usando a distância d acima
descrita.
i i
i i
“mec˙New”
i i
2011/10/11
page 118
i i
É fácil mostrar que toda variedade diferenciável compacta M (com

uma métrica Riemanniana) admite um atlas com um número finito
de cartas coordenadas. Isto segue do fato que os domı́nios das cartas
coordenadas locais Uαi são abertos de M .
Dada uma estrutura Riemanniana numa variedade V , sempre que
considerarmos A subvariedade de V (ver Definição 4.33, Capı́tulo 3),
estaremos considerando em A a estrutura Riemanniana obtida pela
restrição da estrutura Riemanniana de V a A.
Definição 4.33. Quando dizemos que A é uma subvariedade da va-

riedade V (que possui uma métrica Riemanniana < , >), estamos
querendo dizer que o subconjunto de pontos de A está contido em
V , que a função inclusão i : (A, d1 ) → (V, d2 ) tal que i(x) = x é
um homeomorfismo de A sobre i(A) ⊂ V (com respeito à métrica d1
associada à estrutura Riemanniana induzida em A e d2 a métrica as-
sociada à estrutura Riemanniana em V ) e ainda que para todo p ∈ A
a derivada dip : Tp A → Tp V é injetiva.
Suponha que A seja subvariedade da variedade V . Quando dize-

mos que A é compacta, isto significa que estamos considerando em A
a distância d< , > = d< , >A obtida pela métrica Riemanniana < , >A ,
restrição da métrica Riemanniana de V a A. Sendo assim é possı́vel
mostrar que A está contida numa união finita de domı́nios Uαi de car-
tas de V . Na próxima definição estaremos utilizando as considerações
feitas acima.
Exemplo 4.8. Um exemplo de espaço métrico é o conjunto F das

funções contı́nuas F = {f | f : (a, b) → Rn , f contı́nua }, com a
distância d tal que d(f, g) = supremo {kf (x) − g(x)k}x∈(a,b) , onde
f, g ∈ F.
Exemplo 4.9. Um exemplo de espaço métrico é o conjunto F ∗ das

funções C 1 , F ∗ = {f | f : (a, b) → Rn , f é de classe C 1 }, com
a distância d tal que d(f, g) = supremo {kf (x) − g(x)k , kf ′ (x) −
g ′ (x)k}x∈(a,b) , onde f , g ∈ F ∗ .
A distância do Exemplo 4.9 foi anteriormente considerada na

Seção 2, Capı́tulo 2.
i i
i i
“mec˙New”
i i
2011/10/11
page 119
i i
119
Figura 4.6:
Definição 4.34. Dizemos que um conjunto B contido em um espaço

métrico M é denso em (M, d), se para todo x ∈ M e ǫ > 0, existe
y ∈ B tal que d(x, y) ≤ ǫ.
A definição acima generaliza a Definição 13, Capı́tulo 1 e e a

Definição 6, Capı́tulo 3.
Muitas das propriedades interessantes de um sistema mecânico,
embora não acontecam para todos os possı́veis sistemas, são no en-
tanto verdadeiras para sistemas que estão num subconjunto denso
B de tais sistemas (ver por exemplo no fim da Seção 7, Capı́tulo 1,
Exemplo 13, Capı́tulo 1, considerações após Definição 13, Capı́tulo 1
e considerações antes do Teorema 5, Capı́tulo 3).
Após as considerações anteriores, estamos agora prontos para defi-
nir a integral de uma forma diferencial numa variedade diferenciável.
Definição 4.35. Dada uma k-forma diferenciável w ∈ Ωk (V ) na

variedade Riemanniana diferenciável V de dimensão r e uma partição
da unidade φi , i ∈ N para V , a integral da k-forma w em uma sub-
variedade diferenciável compacta A, A ⊂ V de dimensão k (k ≤ r) é
i i
i i
“mec˙New”
i i
2011/10/11
page 120
i i
dada por
Z ∞ Z
X
w= φi (q)wq .
A i=1 A
Cada uma das integrais da soma da expressão da direita está bem

definida pois a k-forma φi w tem suporte em finitas Ui , domı́nio da
carta coordenada xi .
Pode-se mostrar que tal conceito está bem definido e a integral
não depende da partição da unidade φi , i ∈ N escolhida (ver [MC1]).
Exercı́cio: Mostre que dado f : V → V , V variedade diferenciável, e
w k-forma diferencial sobre V , então f ∗ (w) = w, se eR somente
R se, para
toda subvariedade S ⊂ V de dimensão k, vale que S w = S f ∗ (w).
O resultado principal desta seção é o Teorema de Stokes, que vale
em grande generalidade e que será apresentado a seguir.
Teorema 4.1. (Teorema de Stokes) Considere V variedade Rieman-
niana diferenciável de dimensão r. Dada uma n-forma diferenciável
w ∈ Ωn (V ), n ≤ r − 1 e uma variedade compacta C de dimensão
n + 1 com bordo ∂(C) de dimensão n, C subvariedade de V , então
Z Z
dw = w.
C ∂C
Para sermos mais precisos deverı́amos escrever a expressão acima

como: Z Z
dw = i∗ w,
C ∂C
onde i é a inclusão de ∂(C) em V (ver Definição 4.33).
No caso em que o bordo de C tenha várias componentes cone-
xas, no Teorema acima, devemos considerar em cada uma delas uma
orientação. Este procedimento de expressar ∂(C) como soma de com-
ponentes orientadas, por exemplo, ∂(C) = G1 + G2 + G3 , em que as
orientações das variedades Gi de dimensão n dependem duma ori-
entação da superfı́cie C, foi descrito acima na Proposição 4.8 (ver
também Seção 5, Capı́tulo 3).
O teorema de Stokes vai dizer no caso do exemplo mencionado
acima que Z Z Z Z
dw = w+ w+ w.
C G1 G2 G3
i i
i i
“mec˙New”
i i
2011/10/11
page 121
i i
121
Referimos o leitor a [MC1] para uma demonstração do teorema

acima.
Vamos considerar agora um exemplo de variedade diferenciável
(que vai ser importante para o que segue) obtida a partir de outra
variedade diferenciável M . Vamos definir agora o fibrado cotangente
à variedade M .
Definição 4.36. Para cada q ∈ M fixado, T Mq é o espaço vetorial
tangente a M em q. Considere T ∗ Mq o conjunto das transformações
lineares de T Mq em R. O conjunto T ∗ M é por definição o conjunto
∪q T ∗ Mq . Este conjunto será denominado fibrado cotangente à varie-
dade M .
Vamos assumir que M possua uma estrutura Riemanniana < , >.
Vamos agora equipar T ∗ M com um atlas diferenciável a partir de um
atlas diferenciável de M .
Dado q ∈ M considere < , >q =< , >. É fácil ver que para cada
q fixo e l ∈ T ∗ Mq , existe um único η = ηl ∈ T Mq tal que para todo
z ∈ T Mq , l(z) =< η, z >.
Fica assim definida uma aplicação que leva l em ηl e que estabelece
um isomorfismo de T ∗ Mq em T Mq .
Como estamos supondo que M possui uma estrutura Riemanni-
ana < , >, se fα : Uα ⊂ M → Rn é carta coordenada local, então
Xα : ∪x∈Vα T ∗ Mx → R2n dado por Xα (q, l) = (fα (q), dfαq (ηl )) define
carta coordenada local.
É possı́vel mostrar (ver [Li3]) que variando as possı́veis cartas
locais fα , as correspondentes cartas Xα assim obtidas definem uma
atlas diferenciável para T ∗ M .
Chama-se de fibra tangente sobre q o conjunto dos v ∈ T Mq .
Considere M variedade de dimensão n. Fixada uma carta fα :
Uα → Rn de M , tal que fα (x) = q, x ∈ Uα ⊂ M, q = (q1 , q2 , ..., qn ) ∈
Rn , e i ∈ {1, 2, ..., n} considere a aplicação projeção πi , tal que
πi (q, p) = qi .
Fica assim definida a transformação linear dqi : T Mq → R dife-
rencial de tal πi . Estas transfromações dqi formam uma base do
conjunto das transformações lineares de T Mq em R. Sendo assim,
dada uma transformação linear p : T Mq → R é usual denotar tal p
em coordenadas locais q = fα (x) como p = p1 dq1 + ... + pn dqn .
Chama-se de fibra cotangente sobre q o conjunto dos p ∈ T ∗ Mq .
i i
i i
“mec˙New”
i i
2011/10/11
page 122
i i
Um vetor v tangente a T ∗ M em (q, p) é portanto um elemento em

T ( T ∗ M ) que pode ser identificado com todas as curvas (q(t), p(t))
tal que (q(0), p(0)) = (q, p) e ainda que (q ′ (0), p′ (0)) determinam o
mesmo v ∈ T ( T ∗ M ) (ver Definição 4.17).
Exercı́cios
1. Mostre que a esfera x2 + y 2 + y 2 = 1 em R3 admite um atlas
C ∞ que a torna uma variedade orientável.
2. Mostre que o conjunto dos planos passando pela origem em R3

possui uma estrutura de variedade diferenciável.
3. Calcule dF para a transformação F : S → S, onde S é a esfera

de centro (0,0,0) e raio 1 em R3 e F (x, y, z) = (−x, −y, z).
4. Calcule a integral da 2-forma diferencial w = x1 dx1 ∧ dx2 +

x2 dx2 ∧ dx3 + x3 dx3 ∧ dx4 em Ω(R4 ) sobre a superfı́cie de di-
mensão 2 dada por x21 + x22 + x23 + x24 = 1 e x1 = 0.1.
5. Calcule a integral de dp1 ∧ dq1 + dp2 ∧ dq2 sobre a superfı́cie de

dimensão dois q12 +q22 +p21 +p22 = 1 e q1 = 0.1 em (q1 , q2 , p1 , p2 ) ∈
R4 .
i i
i i
“mec˙New”
i i
2011/10/11
page 123
i i
Capı́tulo 5
Formalismo Simplético
Nosso objetivo nesta seção é apresentar a equação de Hamilton de

maneira intrı́nseca, ou seja de uma maneira que seja independente
de coordenadas locais. Usaremos para isto o formalismo das formas
diferenciais. Vamos considerar nesta seção sistemas autônomos. Os
sistemas não autônomos serão analisados na próxima seção.
Na Mecânica Hamiltoniana as variáveis posição e momento são
independentes (na Mecânica Lagrangeana a posição e a velocidade
não são independentes). Este ponto de vista é desejável na Mecânica
Quântica [ABC].
Em primeiro lugar vamos considerar o espaço dual de Rn . Lembre
que este espaço, denotado por Rn∗ , é por definição o espaço das
transformações lineares l : Rn → R (ver Definição 4.36).
Para cada ponto q do Rn considere Rnq o espaço tangente a Rn
em q e Rn∗ q o espaço cotangente em q.
Uma base de Rn∗ q é dada por dq1 , dq2 , ..., dqn .
O conjunto dos elementos (q, l) onde q ∈ Rn e l ∈ Rn∗ q é chamado
de fibrado cotangente e é denotado por T ∗ Rn = ∪q Rn∗ q .
Note que Rn∗ = T ∗ Rn é uma variedade de dimensão 2n.
Nesta seção vamos introduzir o estudo de sistemas Hamiltonia-
nos em variedades no caso em que o Hamiltoniano não dependa do
tempo t.
Na próxima seção vamos considerar o caso não autônomo.
123
i i
i i
“mec˙New”
i i
2011/10/11
page 124
i i
124 [CAP. 5: FORMALISMO SIMPLÉTICO
Em primeiro lugar cumpre destacar que a expressão

∂H ∂H
q̇ = ṗ = − , (5.1)
∂p ∂q
(q, p) ∈ R2n , usa explicitamente a estrutura do R2n , em que dividi-
mos algumas coordenadas como p e outras como q. Caso tenhamos a
intenção de definir um Hamiltoniano e as equações de Hamilton (em
sistemas mecânicos em que o espço de configuração é uma variedade
diferenciável M ) de uma maneira análoga a (5.1), é necessário ex-
pressar tais equações de uma maneira independente da estrutura do
R2n .
Para este fim será natural introduzir formas diferenciais para ex-
pressar as equações de (5.1).
Considere
0 E
J=
−E 0
onde E é a matriz identidade em Rn . Sendo assim J é uma matriz
2n × 2n.
Note que J 2 = −I (a matriz identidade). J vai ser a expressão
matricial local do que vamos chamar abaixo de forma simplética.
No caso em que n = 1 obtemos

0 1
J=
−1 0
Considere agora a 2-forma diferencial
w(z, v) = hJz, vi =
= zn+1 v1 + zn+2 v2 + ... + z2n vn − z1 vn+1 − z2 vn+2 − ... − zn v2n ,

z, v ∈ R2n onde h, i é o produto interno Euclidiano. Note que w
é alternada. Tal forma diferencial será denominada mais tarde de
simplética.
Para cada valor de i ∈ {1, 2, ..., n}, considere a 2-forma dpi ∧
dqi nas variáveis (q, p) = (q1 , q2 , ..., qn , p1 , p2 , ..., pn ) ∈ R2n . Note
que para η = (η1 , ..., ηn , ηn+1 , ..., η2n ), θ = (θ1 , ..., θn , θn+1 , ..., θ2n ) a
expressão de dpi ∧ dqi quando aplicado a estes vetores é dada por
dpi ∧ dqi (η, θ) = θi ηn+i − ηi θn+i .
i i
i i
“mec˙New”
i i
2011/10/11
page 125
i i
125
Pn
Logo w pode ser escrita como w(η, θ) = i=1 dpi ∧ dqi (η, θ) =
dp ∧ dq(η, θ).
Observe agora que dado H(v, w) : R2n → R
 ∂H   ∂H 
∂q1 ∂p1
 ..   .. 

 .  
  . 

 ∂H   ∂H 
 ∂qn   ∂pn 
J ∂H = ∂H .
 ∂p1   − ∂q 1

   
 ..   .. 
 .   . 
∂H ∂H
∂pn − ∂q n
Sendo assim as Equações de Hamilton em R2n podem ser escritas

de maneira compacta como
∂H ∂H ∂H ∂H
(q̇, ṗ) = J(∇H) = ( , ..., ,− , ..., ).
∂p1 ∂pn ∂q1 ∂qn
J(∇H) define assim o campo de vetores Hamiltoniano.
Como sabemos,
∂H ∂H ∂H ∂H
dH = dq1 + ... + dqn + dp1 + ... + dpn
∂q1 ∂qn ∂p1 ∂pn
é uma 1-forma diferencial em ∈ R2n . Seja um vetor η ∈ R2n ,
η = (η1 , ..., η2n ).
Note que
n n
X ∂H X ∂H
dH(η) = ηi + ηn+i =
i=1
∂qi i=1
∂pi
* !+
∂H ∂H ∂H ∂H
(ηn+1 , ..., η2n , −η1 , ..., −ηn ), , ..., ,− , ..., − =
∂p1 ∂pn ∂q1 ∂qn
hJη, J(∇H)i = w(η, J(∇H)).
Em outras palavras ε = J(∇H) = ( ∂H ∂H
∂p , − ∂q ) é o único vetor em
R2n tal que para todo η, vale que w(η, ε) = dH(η).
i i
i i
“mec˙New”
i i
2011/10/11
page 126
i i

∂H ∂H
Observação 5.1. Podemos portanto afirmar que ε = ∂p , − ∂q é
o único vetor tal que para todo η ∈ R2n
w(η, ε) = (dp1 ∧ dq1 + ... + dpn ∧ dqn ) (η, ε) = dH(η).
A expressão acima é a que realmente pode ser tratada de maneira

intrı́nseca para fins de definição do campo de vetores Hamiltoniano
como veremos a seguir.
Vamos definir o Campo Hamiltoniano de maneira intrı́nseca em
uma variedade n-dimensional.
Dada uma superfı́cie de configuração M , o campo Hamiltoniano
para ser definido de maneira intrı́nseca, deverá ser definido sobre V ,
onde V é o fibrado cotangente T ∗ M = V .
Definição 5.1. Sobre uma variedade V de dimensão 2n, diz-se que

uma 2-forma w em V é não degenerada se para todo x ∈ V , vale que
∀ ε ∈ Tx V 6= 0 existe um η ∈ Tx V tal que wx (η, ε) 6= 0.
Definição 5.2. Uma forma w é chamada de forma simplética sobre

uma variedade V se w satisfaz dw = 0 e é também não degenerada.
Uma variedade V com uma 2-forma simplética w é chamada de uma
variedade simplética e será denotada por (V, w).
Pn
Exemplo 5.1. A 2-forma i=1 dpi ∧ dqi define uma estrutura sim-
plética sobre R2n .
Lembre que um campo de vetores G em uma superfı́cie V de

dimensão r é uma escolha de um vetor tangente G(x) ∈ T Vx para
cada x ∈ V .
Como vimos anteriormente, nesta seção,

∂H ∂H
(q̇, ṗ) = J(∇H) = ,− = G(q, p),
∂p ∂q
define o campo de vetores Hamiltoniano.

Vamos a seguir definir campos de vetores Hamiltonianos sobre
variedades simpléticas.
i i
i i
“mec˙New”
i i
2011/10/11
page 127
i i
127
Definição 5.3. Considere uma variedade simplética (V, w). Para

cada vetor ε ∈ T Vx tangente à variedade simplética (V, w) no ponto
x, associamos a 1-forma wε tal que
∀ η ∈ T Vx , wε (η) = w(η, ε).
Denote por A : T V → T ∗ V a aplicação tal que A(ε) = wε , onde
ε ∈ T Vx e wε ∈ T ∗ Vx foi definida acima.
Observe que A é isomorfismo linear entre dois espaços vetoriais
de mesma dimensão. Isto porque, A é injetiva de T Vx no espaço das
1-formas em T Vx∗ , isto é, A(ε) = 0 implica que ε = 0 (isto segue
facilmente de ∀ ε 6= 0 existe um η tal que wx (η, ε) 6= 0, ε, η ∈ T Vx ).
Considere agora In a inversa de A
In : T V ∗ → T V.
Definição 5.4. Dado H : V → R qualquer, onde (V, w) é uma vari-
edade simplética, o campo Hamiltoniano em M determinado por H
é por definição In(dH). Isto é, para x ∈ V fixo In(dH) = ε ∈ T Vx ,
onde wε (η) = w(η, ε) = dH(η), ∀η ∈ T Vx . Fica definido assim um
campo de vetores ε(x) = G(x) para todo x ∈ V , que será denominado
campo de vetores Hamiltoniano associado a H.
A definição acima é absolutamente natural após as considerações
que fizemos anteriormente nesta seção (ver Observação 5.1). Conside-
rando H(q, p) definido sobre (q, p) ∈ T ∗ Rn e w = dp∧dq recuperamos
a expressão do campo Hamiltoniano quando estamos nas coordenadas
locais de R2n .
Observe que para diferentes estruturas simpléticas w sobre a mes-
ma variedade V , podemos ter diferentes campos Hamiltonianos.
Note que dH (é uma transformação linear agindo em T Mx ) e w
(é uma transformação bilinear agindo em T Mx ) são definidos intrin-
secamente, logo o vetor ε foi definido de maneira intrı́nseca.
Vamos agora usar coordenadas locais x = (q, p) em V = T ∗ M
(ver Definição 4.36), p = p1 dq1 + ... + pn dqn transformação linear de
T Mq em R (M variedade de configuração) e denotar x = (x1 , ..., x2n )
por
x = (q1 , ..., qn , p1 , ..., pn )
e vetores tangentes por
(q1′ , ..., qn′ , p′1 , ..., p′n ) ∈ T ( T ∗ M )x .
i i
i i
“mec˙New”
i i
2011/10/11
page 128
i i
Proposição 5.1. Seja M variedade de dimensão n. O fibrado cotan-

gente T ∗ M , tem uma estrutura simplética natural w. Essa estrutura
simplética w, em coordenadas locais é dada por dp1 ∧dq1 +dp2 ∧dq2 +
... + dpn ∧ dqn .
Demonstração: Considere p : T Mq → R uma transformação linear

e (q, p) ∈ T ∗ M .
Vamos primeiramente definir uma 1-forma v em T ∗ M . A 2-forma
w = dv, derivada de tal forma v será a forma simplética que busca-
mos.
Seja ε ∈ T (T ∗ M )(q,p) um vetor tangente do fibrado cotangente
no ponto (q, p) onde p ∈ T ∗ Mq .
Um vetor tangente ε em T (T ∗ M )(q,p) é representado por uma
curva (q(t), p(t)) ∈ T ∗ M, t ∈ (−ǫ, ǫ), tal que (q1′ , ..., qn′ , p′1 , ..., p′n ) =
(q ′ (0), p′ (0)) = ε e (q(0), p(0)) = (q, p).
Considere agora a projeção π : T ∗ M → M tal que π(q, p) = q.
Para ε um vetor em T (T ∗ M ), temos que dπ(ε) ∈ T M (pois dπ :
T (T ∗ M ) → T M é a derivada da projeção π).
Definimos a 1-forma v em T ∗ M por
v(ε) = p(dπ(ε)) , ∀ε ∈ T (T ∗ M )(q,p) .
AfirmamosPnque esta 1-forma v em coordenadas locais se escreve

como pdq = i=1 pi dqi .
Vamos mostrar agora a afirmação mencionada acima. Considere
coordenadas locais (q, p) para T ∗ M .
Por definição
π : T ∗M → M
(q, p) → q = (q1 , q2 , ..., qn )
Logo dπ : T (T ∗ M ) → T M é apenas (dq1 , dq2 , ..., dqn ). Logo
dπ(ε) = (q1′ , ..., qn′ ).
A transformação linear p definida em T Mq tem coordenadas locais
p1 , p2 , ..., pn ,
isto é p é a transformação p1 dq1 + p2 dq2 + ... + pn dqnP

.
n
Finalmente, v(ε) = p(dπ(ε)) = pi q1′ + ... + p2 q2′ = i=1 pi dqi (ε).
Fica portanto demonstrada a afirmação que v = pdq.
i i
i i
“mec˙New”
i i
2011/10/11
page 129
i i
129
Considere agora w = dv.

É claro que dw = ddv = 0 (ver Proposição
Pn 4.5, Capı́tulo 2).
Note que em coordenadas locais w = i=1 dpi ∧ dqi = dp ∧ dq.
É fácil ver também que w é não degenerada, pois se ε = (ε1 , ..., ε2n ) 6=
0, então existe εi 6= 0 (suponhamos que i esteja entre os primeiros n do
vetor ε para simplificar a notação que segue). Portanto w(η, ε) 6= 0,
onde η = (η1 , ..., η2n ) é escolhido de tal modo que ηj = 0, para
j 6= n + i P e ηn+i = 1 (este fato segue da forma local de w(z, v) =<
n
Jz, v >= i=1 dpi ∧ dqi ).
Se o termo não nulo εi está entre os últimos n elementos do vetor
ε, um raciocı́nio análogo pode ser aplicado.
Concluı́mos assim que w como definida acima é uma forma sim-
plética.
Um resultado mais geral que o anterior, mas que não será demons-
trado no texto é o teorema de Darboux (ver [A1] para prova).
Teorema 5.1. (Teorema de Darboux) Dada uma variedade simplética
V de dimensão 2n e uma forma simplética w, para todo ponto x ∈ V ,
é possı́vel encontrar um sistema de coordenadas fα em torno de x
tal que fα : Uα → R2n , fα (x) = P(q1 , q2 , ..., qn , p1 , p2 , ..., pn ), tal que
n
nestas coordenadas w é da forma i=1 dpi ∧ dqi = dp ∧ dq.
Vamos mostrar agora um resultado muito importante.
Seja (M, w) uma estrutura simplética e H : T M ∗ → R Hamilto-
niano. Assuma que In(dH) define o campo de vetores Hamiltoniano
G(x) e seja φt : T ∗ M → T ∗ M o correspondente fluxo de difeomorfis-
mos associado ao campo, isto é,

d
φt x = In(dH)(x) = G(x).
dt t=0
Esse fluxo se chama o fluxo Hamiltoniano associado ao Hamilto-

niano H.
Uma variedade diferenciável A de dimensão dois com bordo é
simplesmente conexa se ela é difeomorfa a um aberto simplesmente
conexo do R2 .
Teorema 5.2. O fluxo Hamiltoniano φt sobre T M ∗ preserva a es-
trutura simplética natural w = dp ∧ dq, isto é, (φt )∗ w = w.
i i
i i
“mec˙New”
i i
2011/10/11
page 130
i i
Demonstração: Temos que mostrar (ver exercı́cio após Definição

4.35) que qualquer subvariedade (que sem perda de generalidade po-
demos assumir ser simplesmente conexa) A de dimensão 2, A ⊂ T ∗ M
com bordo diferenciável por partes é tal que
Z Z
w= w.
A φt (A)
Considere a superfı́cie de dimensão 3 , A × (0, τ ) ⊂ T ∗ M × R e

sua imagem pelo fluxo φt ,
Jτ = ∪t∈(0,τ ) ∪x∈A (φt (x), t) ⊂ T ∗ M × R,
então, ver Figura 4.4,
∂Jτ = −( ∪t∈(0,τ ) ∪x∈∂A (φt (x), t) + φτ A − A.
Denotaremos ∪t∈(0,τ ) ∪x∈∂A (φt (x), t) = Bτ , que é a superfı́cie de

dimensão 2 (que depende de τ ).
Note que w é uma forma diferencial em T M ∗ e assim podemos
pensar que é uma forma diferencial sobre T M ∗ × R que não depende
da segunda variável. Quando formos usar a seguir o teorema de Sto-
kes, lembre que a contribuição da integral em ∪t∈(0,τ ) ∪x∈δA (φt (x), t),
não vai depender do t na parte (., t) acima. Sendo assim, para simpli-
ficar a notação, algumas vezes vamos omitir a parte correspondente
a t nas integrais abaixo.
Primeiro, vamos mostrar que
Z Z Z
d
w= dH = dH,
dτ Bτ φτ (∂A) (φτ (δA),τ )
isto é, vamos mostrar equivalentemente que

Z Z Z !
τ
w= dH dt.
Bτ 0 φt (∂A)
Seja f (s), 0 < s ≤ 1 parametrização de ∂A.

Então ϕ(s, t) = (φt (f (s)), t) = φt (f (s)), 0 < s ≤ 1, 0 < t < τ ,
define uma parametrização da superfı́cie Bτ de dimensão 2.
i i
i i
“mec˙New”
i i
2011/10/11
page 131
i i
131
Por definição de integral de uma 2-forma diferencial

Z Z τ Z 1
w= w(η, ε)dsdt
Bτ 0 0
onde
∂ϕ
ε=
∂t
e
∂ϕ
, η=
δs
pois ϕ(s, t) = φt (f (s)) parametriza Bτ .
Note que ε é o vetor que define o campo Hamiltoniano.
Por definição de campo Hamiltoniano
∂ϕ
dH(η) = dH( ) = w(η, ε)
∂s
(ver Definição 5.4).
Logo
Z Z ! Z Z ! ! Z
τ τ 1
∂ϕ(s, t)
dH dt = dH ds dt = w.
0 φt (∂A) 0 0 ∂s Bτ
Assim concluı́mos que

Z Z
d
w= dH.
dτ Bτ φτ (∂A)
Ora pelo Teorema de Stokes,

Z Z
dH = H=0
φt (∂A) ∂(φt (∂A))
pois ∂(φt (∂(A))) = ∅.

Logo Z
w
Bτ
é constante.
i i
i i
“mec˙New”
i i
2011/10/11
page 132
i i
R R
Quando τ → 0, Bτ w converge a ∂A w = 0 (afinal estamos in-
tegrando uma 2-forma em uma superfı́cie com região bidimensional
convergindo a uma curva quando τ vai a zero).
Logo Z
w=0 (5.2)
Bτ
para todo τ .
Como w é simplética satisfaz dw = 0 então:
Z
0= dw. (5.3)
Jτ
Pelo teorema de Stokes

Z Z Z Z Z
dw = w= w− w− w. (5.4)
Jτ ∂Jτ φτ (A) A Bτ
Juntando as expressões (5.3) e (5.4) obtemos

Z Z Z Z Z
0= dw = w= w− w− w.
Jτ ∂Jτ φτ (A) A Bτ
R
Como o termo Bτ
w é zero por (5.2) concluı́mos que
Z Z
w= w,
φτ (A) A
ou seja, φt preserva a forma simplética w.

Definição 5.5. Dizemos que uma k-forma diferencial w é um inva-
riante integral absoluto para g : T ∗ M → T ∗ M se
Z Z
w= w
g(C) C
para toda variedade C de dimensão k contida em T ∗ M .

Equivalentemente, w é invariante integral absoluto para g : T ∗ M →
T M se g ∗ (w) = w.
∗
A proposição anterior mostrou que g ∗ (w) = w quando g = φt é

o fluxo Hamiltoniano para t fixo obtido a partir de H e w a forma
simplética natural (Proposição 5.1).
i i
i i
“mec˙New”
i i
2011/10/11
page 133
i i
133
Exemplo 5.2. Se g preserva área em R2 então w = dq ∧ dp é um

invariante integral absoluto de g.
Proposição 5.2. Se w1 e w2 são invariantes integrais de g, então

w1 ∧ w2 também é invariante integral de g.
Demonstração: Segue imediatamente do fato que
g ∗ (w1 ∧ w2 ) = (g ∗ w1 ) ∧ (g ∗ w2 ) = w1 ∧ w2
(ver Proposição 4.3 c)).

n
A 2n-forma diferencial (w) define um elemento de volume em
T ∗ M (ver Definição 4.9). Note que em coordenadas locais
wn = (dp ∧ dq)n = dp1 ∧ dp2 ∧ ... ∧ dpn ∧ dq1 ∧ dq2 ∧ ... ∧ dqn .
Proposição 5.3. O fluxo Hamiltoniano φt preserva o elemento de

volume (w)n .
Demonstração: Segue imediatamente do fato que g ∗ (wn ) = (g ∗ w)n

= (w)n , quando g = φt , t fixo, e do Teorema 5.2.
Definição 5.6. Uma transformação g, g : T ∗ M → T ∗ M que pre-

serva w, isto é, g ∗ w = w, é dita canônica.
Note que se g é canônica, g também preserva o elemento de volume

(w)n , pois g ∗ (wn ) = (g ∗ w)n = (w)n .
Definição 5.7. Uma k-forma w é dita invariante relativo para g :

T ∗ M → T ∗ M se Z Z
w= w
∂C g(∂C)
para toda subvariedade C de dimensão k com bordo contida em T ∗ M .
Proposição 5.4. Se w é invariante relativo para g : T ∗ M → T ∗ M

então dw é invariante absoluto para g.
Demonstração: Seja w invariante relativo e C subvariedade de di-

mensão k + 1 com bordo ∂(C) contida em T ∗ M . Note que o bordo
de ∂(C) é vazio.
i i
i i
“mec˙New”
i i
2011/10/11
page 134
i i
Logo pelo Teorema de Stokes

Z Z Z Z Z
dw = w= w= w= dw.
C ∂C g(∂C) ∂(g (C)) g(C)
Logo, concluı́mos que dw é invariante absoluto.

Vamos agora demonstrar a versão simplética do teorema de con-
servação do Hamiltoniano. Observe como a demonstração fica abre-
viada através do uso do formalismo simplético.
Teorema 5.3. (Lei de Conservação de Energia) A função H é cons-
tante ao longo das trajetórias do fluxo Hamiltoniano.
Demonstração: A derivada direcional de H na direção θ é dH(θ).
Por definição In(dH) é o Campo Hamiltoniano. Seja então η =
In(dH).
Então dH(η) = w(η, In(dH)) = w(η, η) = 0 (pois como w é
alternada w(η, η) = −w(η, η)).
Logo, H é constante ao longo do fluxo Hamiltoniano.
Dado um Hamiltoniano H(q, p), q ∈ M , variedade m-dimensional,
1
vamos mostrar agora que existe uma densidade natural k∇H(x)k que
define uma medida invariante para o fluxo Hamiltoniano restrito a
uma superfı́cie (2m − 1) dimensional de Energia total constante.
Considere uma superfı́cie S de dimensão m − 1 em Rm . Dado
m-vetores v1 , v2 , ..., vm em Rm , o volume determinado por estes ve-
tores é expresso por dx1 ∧ ... ∧ dxm (v1 , v2 , ..., vm ) (ver Definição 4.3).
O procedimento natural de induzir em S uma maneira de medir vo-
lume m − 1 dimensional em cada plano T Sx é o seguinte: dados
u1 , u2 , ..., um−1 ∈ T Sx , definimos o volume w̃(u1 , ..., um−1 ) determi-
nado por u1 , .., um−1 como
w̃(u1 , ..., um−1 ) = dx1 ∧ ... ∧ dxm (η, u1 , u2 , ..., um−1 ),
onde η é o vetor normal unitário (aqui estamos usando a métrica

Riemanniana) em S.
Geometricamente falando, estamos considerando um paralelepı́-
pedo m dimensional com altura η e dizendo que o volume m − 1
dimensional da base é o volume m-dimensional do paralelepı́pedo
η, u1 , .., um−1 (isto porque η tem altura 1).
i i
i i
“mec˙New”
i i
2011/10/11
page 135
i i
135
As considerações geométricas feitas acima devem esclarecer o lei-

tor para o procedimento que será utilizado na próxima proposição.
Vamos denotar por wn a forma volume usual em R2n = dq1 ∧ ... ∧
dqn ∧ dp1 ∧ ... ∧ dpn .
Proposição 5.5. Seja M = Rn variedade Riemanniana de dimensão
n com a métrica Riemanniana definida por <, >. Considere um
Hamiltoniano H(q, p) e w forma simplética natural (ver Proposição
56, Capı́tulo 3) sobre R2n = V = T ∗ M = T ∗ (Rn ). Então a forma
w̃ ((2n − 1)-forma diferencial) sobre uma superfı́cie compacta E =
{(q, p) | H(q, p) = c} (2n − 1 dimensional) de Hamiltoniano constante
(assuma que k∇H(x)k não se anule em E) dada por
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n )
k∇H(x)k x
é invariante para φt restrito a esta superfı́cie E.
Demonstração: Para c ∈ R fixo considere a variedade de dimensão
2n − 1
Ec = E = {x ∈ T ∗ M |H(x) = c}.
Como sabemos pelo Teorema de Conservação do Hamiltoniano,
E é invariante por φt .
A forma wn é forma volume sobre T ∗ M . Se M for o R2n então
n
w = dp1 ∧ ... ∧ dpn ∧ dq1 ∧ ... ∧ dqn . A forma volume natural sobre
a superfı́cie E de dimensão 2n − 1 é a forma ŵ tal que ∀ x ∈ E
ŵx (v2 , ..., v2n ) = wxn (ηx , v2 , ..., v2n )
onde ηx é o vetor normal a E (estamos assumindo uma orientação

em E) com norma 1 (estamos assumindo que existe uma métrica
Riemanniana, ou seja, que hηx , ηx i = kηx k2 = 1).
Considere sobre E a 2n − 1 forma diferencial
1
w̃x = ŵx ,
k∇H(x)k
isto é,
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n ).
k∇H(x)k x
i i
i i
“mec˙New”
i i
2011/10/11
page 136
i i
Vamos mostrar que w̃ = φ∗t (w̃) para qualquer t ∈ R. Logo φt vai

deixar invariante uma forma volume sobre E.
Antes, mostramos na Seção 2, Capı́tulo 3 que H ◦ φt = H, ∀t ∈ R.
Logo
dH ◦ dφt (x) = dH.
Portanto, ∀η ∈ T ∗ Mx ,
h∇Hφt (x) , dφt (x)(η)i = (dH ◦ dφt (x))(η) = dH(η) = h∇Hx , ηi.
Aplicando a última expressão a η = ∇Hx , obtemos h∇Hx , ∇Hx i =

k∇Hx k2 = h ∇Hφt (x) , dφt (x)(∇Hx ) i.
Como ∇H é normal à variedade E, temos que
∇Hx
ηx =
k∇Hx k
e
∇Hφt (x)
ηφt (x) = .
k∇Hφt (x) k
Logo a última igualdade pode ser reescrita como
* +
k∇H(x)k ∇Hφt (x)
= , dφt (x)(ηx ) = hηφt (x) , dφt (x)(ηx )i.
k∇Hφt (x) k k∇Hφt (x) k
Logo a projeção de dφt (x)(ηx ) sobre ηφt (x) é
k∇H(x)k
.
k∇Hφt (x) k
Sendo assim
k∇Hx k
dφt (x)(ηx ) = ηφ (x) + z1
k∇Hφt (x) k t
onde z1 ∈ T Eφt (x) .

Note que se ṽ2 , ṽ3 , ..., ṽ2n é uma base de T Eφt (x) , então existem
αi , i ∈ {2, ..., 2n} tal que
2n
X
z1 = αi ṽi .
i=2
i i
i i
“mec˙New”
i i
2011/10/11
page 137
i i
137
Logo
2n
!
X
wφnt (x) (z1 , ṽ2 , ṽ3 , ..., ṽ2n ) = wφnt (x) αi ṽi , ṽ2 , ..., ṽ2n =
i=2
2n
X
αi wφnt (x) (ṽi , ṽ2 , ṽ3 , ..., ṽi , ..., ṽ2n ) = 0.
i=2
É fácil ver a partir da última expressão que para qualquer

v2 , v3 , ..., vn ∈ T Eφt (x) , wφnt (x) (z1 , v2 , ..., v2n ) = 0.
Portanto, para qualquer v2 , v3 , ..., vn ∈ T Eφt (x)
!
k∇Hx k
wφnt (x) (dφt (x)(ηx ), v2 , ..., v2n ) = wφnt (x) ηφ (x) , v2 , ..., v2n .
k∇Hφt (x) k t
(5.5)
Vamos agora mostrar que φ∗t w̃ = w̃.
Ora, φ∗t (x)(w̃)(v2 , ..., v2n ) = w̃φt (x) (dφt (x)(v2 ), ..., dφt (x)(v2n ))
1
= wn (ηφ (x) , dφt (x)(v2 ), ..., dφt (x)(v2n ))
k∇Hφt (x) k φt (x) t
!
1 n k∇Hx k
= w ηφ (x) , dφt (x)(v2 ), ..., dφt (x)(v2n )
k∇Hx k φt (x) k∇Hφt (x) k t
1
= wn (dφt (x)(ηx ), dφt (x)(v2 ), ..., dφt (x)(v2n ))
k∇Hx k φt (x)
1
= wn (ηx , v2 , ..., v2n ).
k∇Hx k x
A última igualdade segue de φ∗t (x)(wn ) = wn (Proposição 5.3,
Capı́tulo 3) e a penúltima de (5.5).
Concluı́mos portanto que w̃ define uma densidade invariante para
φt restrito à superfı́cie de Hamiltoniano constante Ec . Este fato segue
de que
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n )
k∇H(x)k x
é invariante para φt , t ∈ R.
i i
i i
“mec˙New”
i i
2011/10/11
page 138
i i
Para obter uma probabilidade a partir de w̃ devemos multiplicar

w̃ pela constante k = R 1 w̃ .
E
Deixamos a cargo do leitor estender o resultado acima para varie-
dades simpléticas.
Para concluir esta seção, vamos agora descrever o procedimento
natural para se obter um Hamiltoniano a partir de uma Lagrangiano
L(q, q̇), definido sobre uma variedade de configuração M , q ∈ M ,
q̇ ∈ T Mq .
Para um Lagrangiano L, e para (q, q̇) fixo, vamos considerar que
dL
o momento p ∈ Rn∗ q é dado por p = dq̇ (q, q̇), isto p é a transformação
linear derivada de L em relação a q̇ no ponto (q, q̇).
Sendo assim, fixada a base dq1 , dq2 , ..., dqn , a 1-forma diferencial
(famı́lia de transformações lineares dependendo de q) p = ∂L ∂ q̇ nesta
base é dada por
∂L ∂L
p= dq1 + ... + dqn .
∂ q˙1 ∂ q˙n
Desta maneira dL dq̇ quando expressa na base dq1 , dq2 , ..., dqn , de-
termina o que anteriormente chamávamos de momento p.
Sendo assim, para cada q fixo fica associado a q̇ ∈ Rn de maneira
bem definida um elemento p ∈ Rn∗ q (contanto que a condição da
Observação 4, Capı́tulo 3), que vai ser o momento.
Uma questão importante é a seguinte: como obter H(q, p), (q, p) ∈
T ∗ M , a partir de L(q, q̇), (q, q̇) ∈ T M .
Para (q, q̇) fixo considere p = ∂L ∗
∂ q̇ ∈ T Mq .
Para q fixo obtemos assim uma associação de q̇ com p, defi-
nindo uma aplicação Bq : T Vq → T ∗ Vq tal que Bq (q̇) = p. Esta
2
aplicação é bijetiva se por exemplo ∂∂ q̇L > 0, conforme a Observação
4, Capı́tulo 3.
Vamos supor no que segue que tal Bq seja bijetivo para todo
q ∈V.
Considere um Lagrangiano L(q, q̇). Para (q, p) fixados, definimos
H(q, p) como
H(q, p) = p(Bq−1 (p)) − L(q, Bq−1 (p)) = p(q̇) − L(q, q̇),
onde Bq (q̇) = p.
Acima, p(Bq−1 (p)) significa aplicar a transformação linear p no
vetor tangente q̇ = Bq−1 (p).
i i
i i
“mec˙New”
i i
2011/10/11
page 139
i i
139
Note que o Lagrangiano é naturalmente definido no fibrado tan-

gente T M de uma variedade M de configuração, enquanto que o
Hamiltoniano é naturalmente definido no fibrado cotangente T ∗ M
da variedade de configuração.
Conclusão: Dada uma função H(q, p) definida no fibrado cotangente
a uma variedade M é possı́vel definir um campo de vetores sobre o
fibrado cotangente denominado campo Hamiltoniano. Isto porque, o
fibrado cotangente tem uma estrutura simplética natural.
Quando desejamos fazer alguma conta, podemos considerar um
certo sistema de coordenadas locais e assim obter resultados sobre o
sistema.
É mais natural proceder de maneira intrı́nseca como foi feito
acima, pois não existe razão para um certo sistema de coordenadas
ser privilegiado em relação aos outros.
As trajetórias deste campoR de vetores podem ser definidas também
como os extremais da ação γ pdq onde os extremos do caminho γ
estão fixos em γ(t1 ) = a, γ(t2 ) = b.
Este campo não é determinado por um único possı́vel Hamilto-
niano H, pois podemos somar a esta função uma forma w tal que
dw = 0, e claramente a Definição 96 não vai alterar o campo Hamil-
toniano que vamos obter.
Dada uma função sobre o fibrado tangente a uma variedade M ,
podemos obter um sistema Lagrangiano sobre o fibrado tangente. A
maneira de relacionar os dois sistemas foi descrita acima.
Exercı́cios
1. Para o Hamiltoniano do pêndulo sem atrito, calcule para cada
nı́vel de energia constante a densidade ψ do Teorema 63.
Assuma que o nı́vel de energia não passe pelo ponto (0,0) ou
(π, 0).
2. Mostre que o toro S1 × S1 admite um estrutura simplética.
i i
i i
“mec˙New”
i i
2011/10/11
page 140
i i
Capı́tulo 6
Linhas de Vortex em
Mecânica Hamiltoniana
Nesta seção vamos considerar apenas campos Hamiltonianos não au-

tônomos H(q, p, t). Vamos desenvolver o formalismo que permite
definir neste caso as equações de Hamilton de maneira intrı́nseca.
O ponto de vista será intrı́nseco e o leitor pode perceber que as
as demostrações utilizando tal ponto de vista serão simples e não
envolvem demasiado cálculo.
Proposição 6.1. Dado uma 2-forma w em R2n+1 , existe ξ 6= 0 tal

que w(ξ, η) = 0, ∀ η ∈ R2n+1 .
Demonstração: Uma forma diferencial é por definição alternada,

portanto é dado por w(ξ, η) = hAξ, ηi onde A é matriz alternada.
Ora o determinante de tal matriz (2n + 1) × (2n + 1) é zero pois
A∗ = −A e det A = det A∗ = det(−A) = (−1)2n+1 det A = − det A.
Logo existe um auto-vetor ξ 6= 0 com auto-valor 0 e, portanto,
w(ξ, η) = hAξ, ηi = h0, ηi = 0.
Definição 6.1. Uma 2-forma é dita não singular se
dim{ξ ∈ R2n+1 |w(ξ, η) = 0, ∀ η ∈ R2n+1 } = 1.
140
i i
i i
“mec˙New”
i i
2011/10/11
page 141
i i
141
Definição 6.2. Dada uma 2-forma w não singular, em cada ponto do

R2n+1 , o subespaço de dimensão 1 definido por algum ξ da Proposição
6.1 é chamada direção de vortex.
Definição 6.3. Seja w 2-forma diferencial não singular. Uma curva
diferenciável em R2n+1 cuja tangente em cada ponto está na direção
de vortex naquele ponto da 2-forma w é chamada uma linha de vortex
da 2-forma w.
Os teoremas de existência e unicidade de equações diferenciais
ordinárias asseguram localmente a existência das linhas de vortex,
bastando para isso assumir condições de suavidade (C ∞ ) da 2-forma
w não singular. Observe que enquanto a solução de uma equação dife-
rencial depende do tempo de maneira bem definida, a linha de vortex
é uma curva, para a qual poderı́amos ter várias parametrizações pelo
parâmetro t.
As linhas de vortex determinam o que se chama um campo de
linhas e não um campo de vetores (ver [MC3]).
Proposição 6.2. Considere em R2n+1 o Hamiltoniano H(p, q, t), a
1-forma w1 = pdq − Hdt e a 2-forma w2 = dw1 . Então as soluções
do sistema Hamiltoniano
dH dH
q̇ = ṗ = −
dp dq
são linhas de vortex de w2 .
Demonstração: Suponha que w2 seja não singular. Sendo assim
basta mostrar que ξ = (Hp , −Hq , 1) em (q, p, t) é direção de vortex da
2-forma w2 no ponto (q, p, t). Primeiro mostraremos este último fato,
e deixaremos ao leitor o trabalho de mostrar que w2 é não singular.
Ora, denote η por (q1 , p1 , t1 )

dH dH
w2 (ξ, η) = dw1 (ξ, η) = dp∧dq − (dp∧dt)− (dq ∧dt) (ξ, η) =
dp dq
= [(−Hq q1 − Hp p1 ) − Hp (Hq t1 − p1 ) − Hq (−Hp t1 − q1 ) = 0.
Logo ξ = (Hp , −Hq , 1) é a direção de vortex e as soluções de
ṗ = Hp e q̇ = −Hq são curvas de vortex.
Exercı́cio: Mostre que a forma w2 definida acima é não singular.
i i
i i
“mec˙New”
i i
2011/10/11
page 142
i i
142 [CAP. 6: LINHAS DE VORTEX EM MECÂNICA HAMILTONIANA
Exemplo 6.1. Vamos calcular em um exemplo a forma w2 = dw1

quando w1 = pdq − Hdt. Seja
p2 ω2
H(p, q) = + 0 q2
2 2
o Hamiltoniano do oscilador harmônico. Logo
2
p ω2
w1 = pdq − Hdt = pdq − + 0 q 2 dt
2 2
e w2 = dw1 = dp ∧ dq − pdp ∧ dt − qw02 dq ∧ dt.

Ora,
dH
q̇ = =p
dp
dH
ṗ = − = −ω02 q.
dq
Neste caso, temos realmente para η = (q1 , p1 , t1 ) e
ξ = (Hp , −Hq , 1) = (p, w02 q, 1) que
w2 (ξ, n) = [dp ∧ dq − pdq ∧ dt − qω02 dq ∧ dt] (ξ, n) =
(−ω02 qq1 − pp1 ) − p(−ω02 qt1 − p1 ) − qω0 (pt1 − q1 ) = 0.

Este exemplo serve apenas como ilustração do resultado mais geral
anteriormente demonstrado.
A conclusão importante do resultado que obtivemos acima é que
é possı́vel expressar as curvas soluções do Hamiltoniano através de
formas diferenciais, sem usar a estrutura global do R2n+1 . Isto per-
mitirá introduzir as equações de Hamilton (caso não autônomo) em
uma variedade diferenciável M . Deixamos a cargo do leitor fazer tal
extensão.
Considere em R2n+1 duas curvas fechadas γ˜1 e γ˜2 tal que γ˜2 é
obtida aplicando o fluxo Hamiltoniano à curva γ˜1 (ver Figura 4.5).
Definição 6.4. Duas curvas fechadas na situação acima serão de-
nominadas de “relacionadas pelo fluxo Hamiltoniano”.
Definição 6.5. A forma w1 = pdq−Hdt será chamada de invariante
de Poincaré-Cartan.
i i
i i
“mec˙New”
i i
2011/10/11
page 143
i i
143
Teorema 6.1. Sejam γ̃1 e Hγ̃2 duas curvas fechadas

H relacionadas pelo
fluxo Hamiltoniano, então γ̃1 pdq − Hdt = γ̃2 pdq − Hdt.
Demonstração: Seja w1 = pdq − Hdt a forma de Poincaré-Cartan,
então pelo Teorema de Stokes,
Z Z Z
dw1 = w1 − w1
σ γ̃1 γ̃2
onde σ é o tubo bidimensional que tem como bordo as duas curvas

γ̃1 e γ̃2 orientadas na direção positiva.
As curvas γ1 e γ2 da Figura 4.5 correspondem respectivamente a
γ̃1 e −γ̃2 .
A integral de Z
dw1 = 0,
σ
pois o vetor (−Hp , Hq , 1), tangente à superfı́cie com bordo σ, se anula
para a forma dw1 . Isto se deve a uma Proposição que foi anterior-
mente demonstrada.
Considere agora uma curva γ̃1 contida em um plano t1 = cons-
tante.
Sendo assim, considerando o campo (−Hp , Hq , 1) e a sua evolução
com t, é fácil ver que a curva γ̃2 que se obtém aplicando o fluxo
φt à curva γ̃1 , é tal que γ̃2 também está contida em um plano t =
constante, digamos t = t1 . Neste caso, a proposição acima diz apenas
que Z Z
pdq = pdq.
γ̃1 γ̃2
Isto porque Z Z
Hdt = Hdt = 0,
γ̃1 γ̃2
uma vez que não existe componente na direção t para os vetores

tangentes a γ̃1 ou γ̃2 .
Observe que todas as considerações que fizemos acima são válidas
em variedades diferenciáveis. Em outras palavras, não usamos em
nenhum momento propriedades do espaço R2n+1 .
Proposição 6.3. O fluxo (−Hq , Hq , 1) preserva volume em R2n+1 .
i i
i i
“mec˙New”
i i
2011/10/11
page 144
i i
144 [CAP. 6: LINHAS DE VORTEX EM MECÂNICA HAMILTONIANA
Demonstração: Seja γ˜1 curva fechada simples contida em t1 =

constante e γ˜2 outra curva obtida pela evolução do fluxo no tempo
t2 .
Então pelo teorema de Stokes em R2n ≡ R2n × t1 , temos
Z Z Z
pdq = dp ∧ dq
γ˜1 ∆1
2n 2n
onde ∆1 é a região de R ≡ R × t1 tal que δ∆1 = γ˜1 (ver Fi-
gura 4.5). Da mesma forma se φt (∆1 ) = ∆2 então δ∆2 = γ˜2 em
R2n = R2n × t2 , e ainda pelo teorema de Stokes
Z Z Z
pdq = dp ∧ dq.
γ˜1 ∆2
Como vimos antes

Z Z
pdq = pdq,
γ˜1 γ˜2
logo segue-se que

Z Z Z Z
dp ∧ dq = dp ∧ dq.
∆1 ∆2
Como o resultado vale para qualquer ∆1 (note que φt (∆1 ) = ∆2

e φt (γ˜1 ) = γ˜2 ) concluı́mos que φt preserva dp ∧ dq. Como
(dp ∧ dq)n = dp1 ∧ ... ∧ dpn ∧ dq1 ∧ ... ∧ dqn ,
concluı́mos que o fluxo Hamiltoniano φt em R2n preserva volume.

Observe que o resultado acima foi provado para Hamiltonianos
H(q, p, t) que dependem do tempo. Já havı́amos mostrado antes este
resultado, o teorema de Liouville, mas a demonstração acima pode
ser aplicada também a ao fibrado cotangente T ∗ M de uma variedade
diferenciável M .
Deixamos a cargo do leitor extender os resultados acima obtidos
no Rn para variedades diferenciáveis M de dimensão n.
Conclusão: A partir de um Hamiltoniano H(q, p, t), definido sobre
o produto cartesiano do fibrado tangente a uma variedade M por R,
i i
i i
“mec˙New”
i i
2011/10/11
page 145
i i
145
foi possı́vel definir um campo de vetores Hamiltoniano sobre o fibrado

cotangente a M .
Este campoR de vetores pode também ser caracterizado como os
extremais de γ pdq−Hdt, em que os extremos (e os tempos) γ(t1 ) = a
e γ(t2 ) = b estão fixos.
Este campo não é determinado por um único possı́vel Hamiltoni-
ano H, pois podemos somar a esta função uma forma w = dG, e os
valores da ação irão se alterar por uma valor fixo G(b) − G(a). Logo,
irão determinar os mesmos extremais.
Exercı́cio
1. Considere o Hamiltoniano H(q, p, t) = p2 + q 2 + t. Calcule as
linhas de vortex em R3 para tal Hamiltoniano.
i i
i i
“mec˙New”
i i
2011/10/11
page 146
i i
Capı́tulo 7
Equações Diferenciais
Parciais: Método das
Caracterı́sticas
Para analisar com mais profundidade a equação diferencial de Hamil-

ton-Jacobi necessitaremos primeiro analisar alguns aspectos da teoria
geral das equações diferenciais de primeira ordem. Referimos o leitor
para [Jo], [I] e [Ju] para uma exposição mais completa sobre o assunto.
Nosso objetivo nas próximas seções, será explicar a relação das
frentes de ondas com raios de luz. Esta relação é um dos pontos
centrais na formulação da Mecânica Hamiltoniana.
Primeiramente, necessitaremos analisar alguns tópicos da teoria
das equações diferenciais parciais.
Vamos começar analisando um exemplo bem simples que vai an-
tecipar as principais propriedades dos exemplos mais complexos de
equações diferenciais que serão analisados a seguir.
Considere a equação diferencial parcial de 1a ordem
∂u ∂u
x +y = 0. (7.1)
∂x ∂y
Desejamos encontrar quem é a função u(x, y) que satisfaz tal
146
i i
i i
“mec˙New”
i i
2011/10/11
page 147
i i
147
equação. Em geral existem infinitas soluções, pois se u é solução

então βu + α também é solução (β, α ∈ R são constantes quaisquer).
Observe que se u é solução de (7.1), então u(x, y) = B determina
uma curva cuja tangente (x′ , y ′ ) em (x, y) é colinear com (x, y). Isto
porque !
∂u ∂u
∇u = ,
∂x ∂y
é normal à curva de nı́vel e por hipótese de u ser solução de (7.1),
h(x, y), ∇ui = 0.
Vamos tentar determinar a expressão analı́tica de tais curvas
u(x, y) = constante = B.
Suponha que possamos obter a mencionada curva através da ex-

pressão u(x, y(x)) = B onde y(x) é obtido a partir de x pelo Teorema
da Função Implı́cita. Temos, portanto, que (1, y ′ (x)) é tangente a esta
curva, logo a partir do que afirmamos acima devemos ter que
y ′ (x) y(x)
= .
1 x
Logo
y ′ (x) 1
= ,
y(x) x
e portanto,
d d
(log y(x)) = log x.
dx dx
Sendo assim, log(y(x)) = log x+c, c ∈ R, e finalmente y(x) = ax para
algum a ∈ R. Logo u é constante em semi retas passando pela origem,
e portanto as curvas de nı́veis de u são tais semi-retas. Observe que
em (x, y) = (0, 0) não podemos fazer as considerações acima.
Note que se estabelecermos como condição de fronteira os valores
de u em uma curva diferenciável Γ que é cortada por cada uma das
semi-retas y = ax em apenas um ponto da curva Γ, pelo que de-
duzimos anteriormente, os valores da “possı́vel”(ainda não sabemos
se existe) solução u ficam necessariamente determinados. O valor
i i
i i
“mec˙New”
i i
2011/10/11
page 148
i i
148 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS
u(x, y) tem que ter o valor de u, oriundo da condição de fronteira,

na interceção da reta y = ax com a curva Γ. Isto é, se este ponto de
interceção for (x0 , y0 ), então escolheremos o valor u(x, y) para todo
ponto (x, y) desta semi-reta y = ax, como u(x, y) = u(x0 , y0 ). Com a
união deste feixe de retas cobre um aberto do plano, então podemos
definir u em um subconjunto aberto do plano.
Vamos mostrar que a u assim definida na verdade é realmente
solução de (7.1).
Fixado (x, y), pela maneira como estamos definindo u, a reta y =
ax é curva de nı́vel de u, logo ∇u é perpendicular a esta reta. Como
(x, y) está nesta reta, segue que < ∇u, (x, y) >= 0. Logo a u definida
acima realmente satisfaz a equação diferencial (7.1).
Em geral o problema que pode ocorrer é que a curva Γ (onde
é fixada a condição de fronteira) intercepte uma destas semi-retas
y = ax em mais de um ponto. Neste caso poderı́amos ter o problema
de não poder obter u de maneira bem definida. Se não ocorrer esta
situação, no entanto, então o problema está bem posto e a solução
existe e está bem definida (e única) da maneira como foi escolhido
acima.
Em outras palavras, a condições natural inicial (ou de fronteira)
do problema de Cauchy deve ser fixar o valor de u em uma curva Γ
que intercepta cada semi-reta passando pela origem em apenas um
ponto.
Agora vamos analisar a equação linear geral de primeira ordem.
Considere a equação diferencial parcial de 1a ordem em R2
∂u ∂u
a(x, y) + b(x, y) = 0. (7.2)
∂x ∂y
Gostarı́amos de encontrar a solução desta equação de uma ma-

neira semelhante à utilizada no exemplo anterior.
Da maneira análoga como no exemplo anterior, primeiro resolve-
remos o sistema de equações diferenciais ordinárias de 1a ordem
dx
= a(x, y)
dt
dy
= b(x, y). (7.3)
dt
i i
i i
“mec˙New”
i i
2011/10/11
page 149
i i
149
Observe agora o que acontece com a restrição de u (solução de

(7.2)) às soluções de (7.3):
d ∂u ′ ∂u ′ ∂u ∂u
u(x(t), y(t)) = x + y = a(x, y) + b(x, y) = 0.
dt ∂x ∂y ∂x ∂y
Logo u é constante ao longo das soluções de (7.3).

Sendo assim, se (x(t), y(t)) é uma solução de (7.3), então
h∇u(x(t), y(t)), (ẋ(t), ẏ(t))i = 0.
Logo, cada curva (x(t), y(t)) deve satisfazer a propriedade que

(ẋ(t), ẏ(t)) está na reta tangente à curva u(x, y) = c.
Se tomarmos agora uma curva Γ cortando em um e só um ponto
cada curva solução de (7.3), e fixando os valores de u em Γ de-
terminaremos a solução u(x, y) (pois u é constante em soluções de
(7.3)). Do mesmo modo como no exemplo anterior, basta dar o va-
lor u(x, y) = u(x0 , y0 ) para cada (x, y) sobre uma curva γ solução
de (7.3) tal que Γ ∩ γ = (x0 , y0 ). Uma curva com tais propriedades
define a condição natural de fronteira do problema.
Definição 7.1. As curvas soluções de (7.3) são chamadas curvas

caracterı́sticas de (7.2).
Exemplo 7.1. Considere a equação

∂u ∂u
y −x = 0, (7.4)
∂x ∂x
com a condição de fronteira (ou inicial) u(s, 0) = s2 , 0 ≤ s.
Uma outra maneira de especificar a condição de fronteira acima
é estabelecer que está fixa uma curva em R3 dada por
(x(s), y(s), u(s)) = (s, 0, s2 ),
no espaço das variáveis (x, y, u). Esta maneira, na verdade, é a que

usaremos na seqüência desta seção.
Neste caso a equação diferencial ordinária que define as carac-
terı́sticas é
ẋ = y
i i
i i
“mec˙New”
i i
2011/10/11
page 150
i i
Figura 7.1:
ẏ = −x.
As soluções desta equação são do tipo
(x(t), y(t)) = (r cos(t), −r sin(t)).
Para cada valor s considere (xs (t), ys (t)) a solução da equação di-
ferencial ordinária com condição inicial (s, 0). Pelo que vimos acima,
devemos escolher u(xs (t), ys (t)) = u(s, 0) = s2 . Em outras palavras,
u é constante em cı́rculos.
Se usarmos coordenadas (s, t) então u(s, t) = s2 , ou alternativa-
mente em coordenadas polares u(r, θ) = r2 .
Se desejarmos encontrar a soluçãop u na variável (x, y), ou seja
obter u(x, y), devemos substituir r = x2 + y 2 , θ = arctan y/x em
u(r, θ) e obter u(x, y) = x2 + y 2 . Fica assim determinada a solução
do problema (7.4) por um método que se baseou fundamentalmente
nas curvas caracterı́sticas.
Vamos considerar novamente o caso geral (7.2).
Definição 7.2. Dada a equação diferencial parcial
∂u ∂u
a(x, y) + b(x, y) = 0,
∂x ∂y
chamamos de superfı́cie integral da equação diferencial uma superfı́cie
na variável (x, y, u) ∈ R3 obtida como gráfico de u(x, y), onde u é
solução da equação diferencial.
i i
i i
“mec˙New”
i i
2011/10/11
page 151
i i
151
Observação 7.1. Uma condição necessária e suficiente para que

uma superfı́cie S ⊂ R3 seja uma superfı́cie integral de (7.2) é que
para cada (x, y, u) ∈ R3 , o vetor (a(x, y), b(x, y), 0) esteja no plano
tangente à superfı́cie S em (x, y, u). Isto porque como o vetor nor-
mal η = ( ∂u ∂u
∂x , ∂y , −1) é ortogonal a superfı́cie em (x, y, u) (isto é, η é
perpendicular ao plano tangente), então
∂u ∂u
hη, (a, b, 0)i = a+ b + 0 = 0.
∂x ∂y
Portanto, segue que (a, b, 0) estar no plano tangente a S em (x, y, u)

é uma condição necessária e suficiente para S ser superfı́cie integral.
Esta relação é válida para a equação linear (7.2). Vamos definir
em breve superfı́cie integral para uma EDP qualquer e neste caso a
análogoa relação será mais complexa.
Dada a equação diferencial (7.2), uma maneira geométrica de ob-
ter o conjunto de pontos S que define uma superfı́cie integral para esta
equação e satisfazendo uma condição de fronteira inicialmente fixada
é a seguinte: para cada condição inicial (x(s), y(s), u(s)), considere
(xs (t), ys (t)) curvas caracterı́sticas (solução de (7.3)) com condição
inicial no tempo t = 0 igual a (x(s), y(s)). Considere em R3 a su-
perfı́cie S obtida pela união das curvas
(xs (t), ys (t), u(s)),
onde s, t variam sem restrição (ver Figura 4.6).

Pictoricamente, para obter S, estamos varrendo a condição inicial
(x(s), y(s), u(s))
com curvas caracterı́sticas, ou seja soluções de (7.3).

Vamos mostrar agora que realmente tal superfı́cie S assim obtida
é uma superfı́cie integral de (7.2) com a condição de fronteira dada.
É obvio que S satisfaz a condição de fronteira.
Suponha agora que (x, y) possa ser obtido como (xs (t), ys (t)) para
algums valor de s, t. Para cada s fixo, o vetor

dxs (t) dys (t) du(s)
, , = (x′s (t), ys′ (t), 0) = (a(x, y), b(x, y), 0)
dt dt dt
i i
i i
“mec˙New”
i i
2011/10/11
page 152
i i
está no plano tangente a S em (x, y, u). Sendo assim pela Observação

45, S determina superfı́cie integral satisfazendo a condição de fron-
teira.
Note que foi necessário supor que (xs (t), ys (t)) cobre um aberto
do R2 para poder concluir a afirmação acima. Na verdade (s, t) de-
veria ser considerado como novas coordenadas adaptadas à solução
do problema. Voltando as antigas coordenadas (x, y) por mudança
de variável podemos obter
u(s(x, y), t(x, y)) = u(x, y)
como função de (x, y).

O procedimento acima é a essência do método das caracterı́sticas.
Encontramos a solução u de uma EDP resolvendo uma EDO. É mais
conveniente pensar no conjunto geométrico S ⊂ R3 de pontos do
gráfico da solução u em vez de diretamente com u(x, y) pois assim po-
demos ter a liberdade de considerar coordenadas (s, t) mais apropri-
adas (em função das caracterı́sticas) e finalmente encontrar a solução
final u em coordenadas (x, y) apenas através de um procedimento de
mudanças de coordenadas.
Vamos agora considerar o caso geral de uma equação diferencial
parcial de primeira ordem.
Considere uma função diferenciável de Classe C 2 , F : R5 → R,
F (x, y, z, p, q).
No contexto que vamos considerar a seguir z vai expressar a função

z(x, y) (será portanto uma variável dependente) solução da EDP que
será definida a partir de F e
∂z ∂z
p= ,q =
∂x ∂y
(serão também dependentes).

A equação diferencial parcial geral de primeira ordem pode ser
expressa através da condição

∂z ∂z
0 = F x, y, z(x, y), , = F (x, y, z, p, q), (3.55)
∂x ∂y
i i
i i
“mec˙New”
i i
2011/10/11
page 153
i i
153
Figura 7.2:
para uma certa F fixada.

Dada uma curva (x(s), y(s), z(s), p(s), q(s)), a < s < b (que faz o
papel de condição de fronteira) desejamos encontrar a solução z(x, y)
da EDP geral de primeira ordem de tal jeito que a solução z(x, y)
satisfaça a condição de fronteira z(x(s), y(s)) = z(s). Os valores
(q(s), p(s)) devem satisfazer certas condições como veremos a seguir.
Definição 7.3. Uma superfı́cie integral da equação diferencial parcial
F = 0 é uma superfı́cie S em R3 tal que é gráfico de uma função
z(x, y) que satisfaz
F (x, y, z(x, y), zx (x, y), zy (x, y)) = 0.
Encontrar superfı́cies integrais equivale a resolver (3.55).

Nesta seção, vamos desenvolver métodos geométricos que se apli-
cam a situações bem gerais e que são semelhantes aos anteriormente
usados. Através da condição de fronteira, vamos escolher condições
iniciais e a seguir vamos varrê-las com feixes de caracterı́sticas (que
serão adequadamente definidas) e assim finalmente iremos identificar
i i
i i
“mec˙New”
i i
2011/10/11
page 154
i i
Figura 7.3:
uma superfı́cie integral S. Encontrar a solução final em uma certa

variável (por exemplo (x, y)) é apenas uma questão de mudança de
coordenadas.
Procedendo de maneira semelhante a que fizemos antes, as carac-
terı́sticas serão obtidas como curvas soluções de equações diferenciais
ordinárias de tal jeito que F (x, y, z, p, q) é constante igual a zero ao
longo destas curvas soluções (x(t), y(t), z(t), p(t), q(t)). Nosso obje-
tivo inicial é encontrar a equação diferencial ordinária em R5 que vai
definir soluções com estas propriedades.
Afirmamos que se desejarmos que (x(t), y(t), z(t), p(t), q(t)) satis-
faça a propriedade acima descrita F (x(t), y(t), z(t), p(t), q(t)) = 0,
então esta curva deve satisfazer:
dx
= Fp (7.5)
dt
i i
i i
“mec˙New”
i i
2011/10/11
page 155
i i
155
dy
= Fq (7.6)
dt
dz
= pFp + qF q. (7.7)
dt
Mais duas equações serão adicionadas mais tarde para dp dq
dt e dt .
Primeiro queremos justificar a necessidade de assumir que as três
equações acima sejam satisfeitas.
Para (x0 , y0 , z0 ) fixados, resolvemos em p a equação
F (x0 , y0 , z0 , p, q(p)) = 0.
A equação do plano tangente a superfı́cie integral S passando por
(x0 , y0 , z0 )
determina que
∂z ∂z
(z − z0 ) = p(x − x0 ) + q(y − y0 ) = (x0 , y0 ) + (x0 , y0 ).
∂x ∂y
Sendo assim, teremos (z − z0 ) = p(x − x0 ) + q(p)(y − y0 ).

Derivando a última expressão em p obtemos
dq
0 = (x − x0 ) + (y − y0 ) . (7.8)
dp
Derivando em p a equação F (x0 , y0 , z0 , p, q(p)) = 0 obtemos
dq
Fp + Fq = 0. (7.9)
dp
Eliminando
dq
dp
das duas últimas equações ((7.8) e (7.9)), obtemos
x − x0 y − y0
= .
Fp Fq
i i
i i
“mec˙New”
i i
2011/10/11
page 156
i i
Assumindo agora que a curva (x(t), y(t), z(t)) está na superfı́cie

integral e que (x(0), y(0), z(0)) = (x0 , y0 , z0 ) então
x(t)−x0
Fp x(t) − x0 t
= = y(t)−y0
.
Fq y(t) − y0
t
Fazendo o limite em t tender a zero, obtemos
x′ (t) y ′ (t)
= .
Fp Fq
Isto justifica tomar x′ (t) = Fp e y ′ (t) = Fq .

Vamos agora justificar z ′ = pFp + qFq .
Ora
dz ∂z dx ∂z dy
= + = px′ + qy ′ .
dt ∂x dt ∂y dt
Como assumimos que x′ = Fp e y ′ = Fq , concluı́mos que z ′ =
Fp p + Fq q.
Concluı́mos portanto que (7.5), (7.6) e (7.7) são condições naturais
para as caracterı́sticas.
Seja a equação diferencial ordinária em R5 dada por
dx
= Fp (7.10)
dt
dy
= Fq (7.11)
dt
dz
= pFp + qFq (7.12)
dt
dp
= −Fx − pFz (7.13)
dt
dq
= −Fy − qFz (7.14)
dt
Estas equações são denominadas equações das caracterı́sticas.
Definição 7.4. As soluções do sistema de equações diferenciais or-

dinárias acima são denominadas de caracterı́sticas.
i i
i i
“mec˙New”
i i
2011/10/11
page 157
i i
157
Nosso objetivo é mostrar que F é constante ao longo das carac-

terı́sticas.
Antes porém, devemos justificar a escolha das equações das ca-
racterı́sticas.
Ora (7.10), (7.11) e (7.12) são nada mais que (7.5), (7.6) e (7.7).
Devemos portanto justificar apenas (7.13) e (7.14).
Suponha que (x(t), y(t), z(t), p(t), q(t)) pertence ao conjunto de
pontos de uma superfı́cie integral. Ora p(x(t), y(t)) e q(x(t), y(t))
satisfazem
dp dx dy
= px + py = px F p + py Fq (7.15)
dt dt dt
e
dq dx dy
= qx + qy = q x Fp + q y Fq . (7.16)
dt dt dt
Derivando F (x, y, z, p, q) = 0 em relação a x obtemos
z }| {
∂z ∂p ∂q
0 = Fx + Fz +Fp + Fq
∂x ∂x ∂x
= Fx + Fz p +Fp px + Fq qx . (7.17)
| {z }
Derivando F (x, y, z, p, q) = 0 em relação a y obtemos
z }| {
∂z ∂p ∂q
0 = Fy + Fz +Fp + Fq
∂y ∂y ∂y
= Fy + Fz q +Fp py + Fq qy (7.18)
| {z }
Como
∂2z ∂2z
= py = q x =
∂y∂x ∂x∂y
então juntando (7.15) e (7.17) e juntando (7.16) e (7.18) derivamos
(7.13) e (7.14), ou seja,
dp
= −Fx − Fz p
dt
dq
= −Fy − Fz q.
dt
i i
i i
“mec˙New”
i i
2011/10/11
page 158
i i
Fica assim justificado (7.13) e (7.14) e portanto as equações das

caracterı́sticas. Vamos então considerar a equação diferencial or-
dinária não linear em R5 dada por (7.10), (7.11), (7.12), (7.13) e
(7.14). Denotaremos tal equação por r′ = G(r) onde r ∈ R5 e
G : R5 → R5 .
Vamos voltar agora a considerar o problema de Cauchy que está-
vamos interessados em resolver, ou seja F (x, y, z, p, q) = 0 com uma
certa condição de fronteira dada por (x(s), y(s), z(s), p(s), q(s)). De-
sejamos encontrar pelo método das carcterı́sticas z(x, y) satisfazendo
as condições iniciais
(x(s), y(s), z(s), p(s), q(s)).
Observação 7.2. Note que estas 5 quantidades não podem ser esco-
lhidas independentemente pois devem obedecer as relações
dz ∂z dx ∂z dy dx dy
= + =p +q
ds ∂x ds ∂y ds ds ds
e
F (x(s), y(s), z(s), p(s), q(s)) = 0.
Sendo assim a condição inicial será dada apenas por
(x(s), y(s), z(s)). Os valores (p(s), q(s)) devem ser escolhidos satis-
fazendo as equações acima.
Por exemplo, se escolhemos z(s) constante sobre (x(s), y(s)), então
as duas equações acima são F (x(s), y(s), z(s), p(s), q(s)) = 0 e
p(s)x′ (s) + q(s)y ′ (s) = 0.
Como dissemos antes, a maneira correta de entender a condição
inicial na verdade é a seguinte, dada uma curva γ no plano, parame-
trizada por (x(s), y(s)) escolhemos os valores de z (ou u) em γ. Isto
equivale a escolher de fato a condição (x(s), y(s), z(s)).
Vamos agora encontrar a solução pelo método das caracterı́sticas.
Para cada valor s fixado considere a curva em R5
(xs (t), ys (t), zs (t), ps (t), qs (t)) =
solução de r′ = G(r) com condição inicial
r(0) = (x(s), y(s), z(s), p(s), q(s)).
i i
i i
“mec˙New”
i i
2011/10/11
page 159
i i
159
Figura 7.4:
Denotaremos por
x = x(s, t) = xs (t)
y = y(s, t) = ys (t)
z = z(s, t) = zs (t)
p = p(s, t) = ps (t)
q = q(s, t) = qs (t)
os valores obtidos com o procedimento acima.
Vamos considerar agora a superfı́cie S ⊂ R3 obtida varrendo a
condição de fronteira (x(s), y(s), z(s)) por curvas (xs (t), ys (t), zs (t))
obtidas a partir das curvas caracterı́sticas. Vamos mostrar que a S
assim definida é uma superfı́cie integral.
Para mostrar que S define uma superfı́cie integral, vamos agora
derivar
F (xs (t), ys (t), zs (t), ps (t), qs (t))
em relação a t.
i i
i i
“mec˙New”
i i
2011/10/11
page 160
i i
Usando as equações das caracterı́sticas

dF dx dy dz dp dq
= Fx + Fy + Fz + Fp + Fq =
dt dt dt dt dt dt
= Fx Fp + Fy Fq + Fz (pFp + qFq ) − Fp (Fx + pFz ) − Fq (Fy + qFz ) = 0.
Logo F é constante e não depende de t. Como assumimos que
(x(s), y(s), z(s))
está na superfı́cie integral e (p(s), q(s)) foram escolhidos de tal jeito

que F (x(s), y(s), z(s), p(s), q(s)) = 0, concluı́mos que
F (xs (t), ys (t), zs (t), ps (t), qs (t)) = 0
para qualquer s, t. Logo S é superfı́cie integral satisfazendo a condição

de fronteira. S pode ser definida como a superfı́cie bidimensional
definida por (xs (t), ys (t), zs (t)) (ver [Jo]).
Suponha que (x(s, t), y(s, t)) cobre um aberto do plano (x, y), in-
jetivamente em (s, t). Uma condição suficiente para tal propriedade
ocorrer localmente é (x′ (s), y ′ (s)) não ser colinear com (Fp , Fq ) =
(x′ (t), y ′ (t)) sobre a curva de condições iniciais. Se conseguirmos in-
verter a relação entre as variáveis (x(s, t), y(s, t)), obtendo
(s(x, y), t(x, y)), poderemos expressar a solução z(x, y) como
z(x, y) = z(s(x, y), t(x, y)),
onde z(s, t) = zs (t) foi obtida acima (ver [Jo]).

O conceito de superfı́cie integral permite pensar de maneira geo-
métrica, sem se preocupar com as variáveis (x, y), e assim descrever
a solução em coordenadas mais naturais que são (s, t). Finalmente,
podem obter z(x, y) através do desenvolvimento acima.
A equação de Hamilton-Jacobi é uma equação diferencial parcial
de primeira ordem, e o método das caracterı́sticas é um procedimento
natural para calcular soluções desta equação.
i i
i i
“mec˙New”
i i
2011/10/11
page 161
i i
161
Exercı́cios
1. Calcule a equação das caracterı́sticas para a equação diferencial
parcial de Hamilton-Jacobi

∂z ∂z
0 = 1 − H x, y, , = F (x, y, z, zx , zt ).
∂x ∂y
2. Encontre as caracterı́sticas da equação diferencial parcial x2 zx +

y 2 zy = 0, z(x, y) ∈ R, (x, y) ∈ R2 . A seguir determine uma
curva de condições iniciais tal que esteja bem definida a solução
do problema de Cauchy.
i i
i i
“mec˙New”
i i
2011/10/11
page 162
i i
Capı́tulo 8
Parciais: Método da
Solução Completa
Na seção anterior usamos o método das caracterı́sticas para resolver a

equação diferencial parcial geral de primeira ordem F (x, y, z, p, q)=0.
Nesta seção vamos nos concentrar no método da solução completa
para resolver (3.55). Este método também será importante para a
correta análise da equação de Hamilton-Jacobi.
Antes disso devemos analisar envoltórias de curvas e sua relação
com a propagação de ondas. Primeiramente no entanto, vamos ana-
lisar o caso mais simples de envoltórias de funções de uma variável
tomando valores reais.
Considere f (x, c) = fc (x) uma famı́lia a um parâmetro c ∈ R, de
funções, como por exemplo fc (x) = sin(x + c).
Definição 8.1. Dada uma famı́lia de curvas fc , a envoltória das
curvas (x, fc (x)) é o bordo da região de dimensão 2 obtida em R2
pela união de todas as curvas (x, fc (x)), c ∈ R.
Vamos mostrar que no caso do exemplo acima mencionado a en-
voltória é a união das retas y = 1 e y = −1.
162
i i
i i
“mec˙New”
i i
2011/10/11
page 163
i i
163
Para cada x0 ∈ R fixado, os dois pontos da envoltória que estão

situados na reta vertical passando por x0 podem ser determinados da
seguinte maneira: considere para cada possı́vel valor de c os possı́veis
valores f (x0 , c). Estes valores f (x0 , c) vão determinar um intervalo de
possı́veis valores. Os valores extremos deste intervalo devem corres-
ponder ao supremo e ao ı́nfimo de g(c) = f (x0 , c), onde g é encarado
como uma função da variável c. Logo tomando os dois valores c =
cx0 tal que g ′ (c) = 0 (ou seja ∂f ∂c = 0) temos que f (x, cx0 ) está na
envoltória da famı́lia fc .
Exemplo 8.1. Para fc (x) = sin(x + c), obtemos do desenvolvimento
acima a equação
∂f
0= (x, c) = cos(x + c),
∂c
logo
π π
(x + c) = ou − ,
2 2
portanto, teremos fc (x) = sin(x + c) = 1 ou fc (x) = sin(x + c) = −1.
Logo a envoltória da famı́lia fc é a união das retas y = −1 e y = 1
(ver Figura 7.1).
Exemplo 8.2. (Transformada de Legendre) Seja f : R → R e a
famı́lia de retas em R2
g(x, p) = gp (x) = xp − f (p).
p faz o papel do parâmetro da famı́lia de funções gp .

Para cada p ∈ R fixado xp − f (p) é a equação de uma reta na
variável x. A envoltória u desta famı́lia de retas é encontrada da
seguinte maneira: encontre p0 tal que
∂g
(x, p0 ) = 0,
∂p
a seguir tome
u(x) = xp0 − f (p0 ).
Dado x, estas equações equivalem a escolher p tal que x = f ′ (p)
e u(x) = xp − f (p), ou seja, u é a Transformada de Legendre de f .
i i
i i
“mec˙New”
i i
2011/10/11
page 164
i i
164 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA
Figura 8.1:
Alternativamente, podemos expressar as condições acima na ma-

neira mais familiar ao leitor, conforme Seção 3 deste capı́tulo: u(x) é
a transformada de Legendre de f se
u(x) = sup{xp − f (p)}.

p∈R
Vamos analisar agora famı́lias de superfı́cies em R3 parametriza-

das por c ∈ R. Por exemplo f (c, x, y) = fc (x, y) = sin(x + c) + y,
c ∈ R.
Definição 8.2. A envoltória da famı́lia de superfı́cies cujo gráfico é
(x, y, fc (x, y)) é por definição o bordo da região de dimensão 3 obtida
como união dos pontos do R3 da forma (x, y, fc (x, y)).
Para cada (x, y) o ponto da envoltória da forma (x, y, z) é aquele
tal que z = fc0 (x, y), onde se g(c) = fc (x, y) então c0 é obtido como o
i i
i i
“mec˙New”
i i
2011/10/11
page 165
i i
165
máximo ou mı́nimo para g na variável c. Em outras palavras devemos

encontrar c0 = c0 (x, y) tal que g ′ (c0 ) = 0, ou seja c0 tal que
∂f
(c, x, y) = 0,
∂c
e a seguir considerar (x, y, z) onde z = fc0 (x, y).
A função u(x, y) = fc0 (x,y) (x, y) define então através do seu gráfico
(x, y, u(x, y)) a envoltória da famı́lia. fc
Exemplo 8.3. Seja fc (x, y) = sin(x + c) + y, então c = c(x,y) deve

satisfazer
∂f
(c, x, y) = cos(x + c) = 0.
∂c
Ou seja,
π π
x+c= ou x + c = − ,
2 2
logo

π π
z = sin + y = 1 + y ou z = sin − + y = −1 + y.
2 2
A envoltória da famı́lia é, portanto, a união de dois planos (x, y, 1+

y) e (x, y, −1 + y).
Agora vamos voltar a considerar o problema de resolver equações

diferenciais parciais.
A equação diferencial parcial geral de 1a ordem para a função
de duas variáveis z(x, y) e suas derivadas zx = p e zy = q pode ser
escrita como
F (x, y, z, p, q) = 0, (8.1)
onde F : R5 → R tem derivadas parciais de segunda ordem contı́nuas.
Considere a condição de fronteira dada por uma curva (x(t), y(t), z(t)).
Um exemplo de tal tipo de equações diferenciais é F (x, y, z, p, q) =
(z − px − qy)2 + (1 + p2 + q 2 ) = 0. Este exemplo será analisado em
breve.
Nosso objetivo inicial será obter novas soluções de F = 0 a partir
de famı́lias de soluções de F = 0.
i i
i i
“mec˙New”
i i
2011/10/11
page 166
i i
O fato de z(x, y) ser solução de (8.1) nos dá uma relação no ponto
(x0 , y0 , z0 ) entre
∂z ∂z
p= (x0 , y0 , z0 ) e q = (x0 , y0 , z0 ).
∂x ∂y
Vamos considerar agora uma famı́lia fc (x, y) = z = f (x, y, c) de

soluções de (8.1), ou seja, para cada c fixado, z(x, y) = fc (x, y) é
solução de F = 0.
Vamos mostrar que a envoltória desta famı́lia de soluções nos de-
termina uma outra solução de F = 0.
A função g(x, y) cujo gráfico é a envoltória da famı́lia pode ser
obtida da seguinte maneira: para (x, y) fixados, encontre c0 tal que
∂f
(x, y, c0 ) = 0, (8.2)
∂c
e então obteremos z = g(x, y) = f (x, y, c0 ).
Note que c0 = c0 (x, y) na verdade depende de (x, y).
A envoltória g será f (x, y, c(x, y)) e satisfará então a equação
∂g ∂f ∂f ∂c ∂f
= + =
∂x ∂x ∂c ∂x ∂x
e
∂g ∂f ∂f ∂c ∂f
= + = .
∂y ∂y ∂c ∂y ∂y
Como fc (x, y) é solução de (8.1) então para fc (x, y) = fc(x,y) (x, y)
= g(x, y) a relação F (x, y, fc (x, y), p, q) = 0 é válida e portanto
F (x, y, g(x, y), p, q) = 0
pois
∂f ∂g ∂f ∂g
p= = e q= = .
∂x ∂x ∂y ∂y
Portanto g também satisfaz a equação diferencial parcial (8.1).
Note que nas considerações acima, nada foi dito sobre condições de
fronteira.
Obter mais uma solução g a partir de uma famı́lia fc não pa-
rece contribuir muito para a solução geral do problema (8.1). No
i i
i i
“mec˙New”
i i
2011/10/11
page 167
i i
167
entanto, se considerarmos famı́lias a dois parâmetros de soluções

z(x, y) = fa,b (x, y) = f (x, y, a, b), estaremos obtendo através de en-
voltórias uma informação não trivial como veremos a seguir. O ponto
fundamental é que desejamos encontrar soluções da EDP, F = 0, mas
sujeita a uma certa curva de valores de fronteira (x(s), y(s), z(s))
dada. Uma famı́lia a um parâmetro de soluções não permite isto, e
será necessário considerar famı́lias a dois parâmetros.
Escolha uma famı́lia a um parâmetro (a(s), b(s)) no espaço de
parâmetros (a, b). Esta famı́lia será determinada em breve no texto.
Considere a famı́lia a um parâmetro s ∈ R, z = f (x, y, a(s), b(s))
e sua envoltória (ver expressão (8.2)) z = f (x, y, a(s), b(s)) (onde s
satisfaz 0 = ∂f ∂f ′ ∂f ′
∂s = ∂a a + ∂b b ) que é também uma solução de F = 0
como vimos antes .
Vamos mostrar agora que dada uma curva de condições iniciais
em R3
(x(s), y(s), z(s)),
podemos tentar obter uma superfı́cie integral que contenha tal curva
a partir de uma escolha conveniente de (a(s), b(s)).
Seja então (x(s), y(s), z(s)) uma curva, a qual desejamos encon-
trar uma superfı́cie integral que a contenha.
Considere as duas equações
z(s) − f (x(s), y(s), a, b) = 0 (8.3)

∂f ′ ∂f ′
z′ − x (s) − y (s) = 0 (8.4)
∂x ∂y
obtendo assim uma relação de a e b em função de s (para s fixado
temos duas equações a duas incógnitas). Obtemos assim a(s) e b(s)
de tal jeito que satisfazem (8.3) e (8.4).
Com essa escolha de a(s) e b(s) vamos determinar uma famı́lia
a um parâmetro que vai determinar através da sua envoltória uma
supefı́cie integral passando por (x(s), y(s), z(s)).
Considere a famı́lia a um parâmetro
z = fs (x, y) = f (x, y, a(s), b(s)) (8.5)
e como vimos acima a sua correspondente equação da envoltória
z = f (x, y, a(s0 ), b(s0 )) (8.6)
i i
i i
“mec˙New”
i i
2011/10/11
page 168
i i
Figura 8.2:
onde s0 = s0 (x, y) satisfaz
∂f ∂f ′ ∂f ′
0= = a (s) + b (s). (8.7)
∂s ∂a ∂b
Seja g(x, y) a envoltória da famı́lia (8.5), isto é:
g(x, y) = f (x, y, a(s0 (x, y)), b(s0 (x, y))),
onde s = s0 (x, y) é obtido para (x, y) fixo satisfazendo (8.7).

Note que conforme já vimos antes, é sempre verdade que tal en-
voltória g(x, y) determina uma superfı́cie integral que é solução da
Equação Diferencial Parcial. A questão que nos interessa é se a
curva inicialmente dada pertence à superfı́cie integral S que obti-
vemos. Afirmamos que (x(s), y(s), z(s)) está na superfı́cie integral
da envoltória g(x, y), ou seja satisfaz (8.6) e (8.7). Isto é verdade
pois (8.6)
z(s) = f (x(s), y(s), a(s), b(s))
vem de (8.3) e da maneira como s foi escolhido.
Devemos mostrar agora que (8.7) e (8.4) são equivalentes.
i i
i i
“mec˙New”
i i
2011/10/11
page 169
i i
169
Ora de (8.3) z(s) = f (x(s), y(s), a(s), b(s)), logo derivando em

relação a s
∂f ′ ∂f ′ ∂f ′ ∂f ′
z ′ (s) = x (s) + y (s) + a (s) + b (s)
∂x ∂y ∂a ∂b
A expressão (8.4) nos diz que
∂f ′ ∂f ′
z′ = x (s) + y (s)
∂x ∂y
portanto
∂f ′ ∂f ′
a (s) + b (s) = 0.
∂a ∂b
Isto mostra que (8.7) é equivalente a (8.4).
Logo se a(s) b(s) satisfazem (8.3) e (8.4), então obtemos através de
g(x, y) acima, envoltória da familia fs , a solução da EDP satisfazendo
a condição de fronteira dada.
Portanto dado uma curva (x(s), y(s), z(s)) em R3 , através do
método exposto acima, podemos obter uma superfı́cie integral que
a contenha.
Definição 8.3. Uma famı́lia fa,b (x, y) a dois parâmetros (a, b) de
soluções de (8.1) é chamada uma solução completa de (8.1).
O método descrito acima, que permite através de uma famı́lia a
dois parâmetros (uma solução completa conforme a definição acima)
encontrar uma superfı́cie integral a partir de condições de fronteira é
chamado de método da solução completa.
Exemplo 8.4. Vamos resolver agora, através do método da solução
completa a EDP
!2 2 2 !
∂u ∂u ∂u ∂u
u− x− y − 1+ − = 0.
∂x ∂y ∂x ∂y
Isto é F (x, y, z, p, q) = (z − px − qy)2 − (1 + p2 + q 2 ) = 0. Seja a

famı́lia a dois parâmetros a e b (com a2 + b2 < 1)
−a −b 1
z=p x+ p y+ p = fa,b (x, y)
1 − (a2 + b2 ) 1 − (a2 + b2 ) 1 − (a2 + b2 )
i i
i i
“mec˙New”
i i
2011/10/11
page 170
i i
de soluções (uma solução completa).

Dada a curva z = 1, x = 1/2 cos θ, y = 1/2 sin θ, 0 ≤ θ ≤ 2π
então (8.3) significa:
−ax − by + 1
z=p ,
1 − (a2 + b2 )
ou seja,
p a b
1 − (a2 + b2 ) + cos θ + sin θ − 1 = 0. (8.8)
2 2
Já (8.4) significa
(a) (− sin θ) −b cos θ

0− p + p = 0,
1 − (a2 + b2 ) 2 2 1 − (a2 + b2 )
ou seja,
a sin θ − b cos θ = 0. (8.9)
De (8.8) e (8.9) se obtém a(θ) = 4/5 cos θ, b(θ) = 4/5 sin θ.
Logo a solução que buscamos z(x, y) (envoltória da famı́lia a um
parâmetro θ)
4 4 5
z = − x cos θ − y sin θ +
3 3 3
que fornece como solução o cone
4p 2 5
z=− x + y2 + .
3 3
A equação de Hamilton-Jacobi é de primeira ordem, e o método da
solução completa será utilizado em breve para analisar tal equação.
Anteriormente estávamos considerando envoltórias de funções. A-
gora iremos considerar envoltórias de curvas, obtendo resultados que
também serão muito importantes em Mecânica Hamiltoniana.
Vamos agora considerar famı́lias de curvas. Estas curvas serão
dadas implicitamente.
Definição 8.4. A envoltória de uma famı́lia de curvas dadas impli-

citamente será a curva que define o bordo da união de todas as curvas
da famı́lia.
i i
i i
“mec˙New”
i i
2011/10/11
page 171
i i
171
Considere a famı́lia a um parâmetro de curvas implicitamente da-

das por f (x, y, α) = 0, α ∈ R. Para cada α, 0 = fα (x, y) = f (x, y, α)
define implicitamente na variável (x, y) uma curva da famı́lia. Como
encontrar a curva C (ou curvas) que determinam a envoltória da
famı́lia fα ?
Teorema 8.1. Se a famı́lia a parâmetro α de curvas determinada

por
fα (x, y) = f (x, y, α) = 0
tem uma curva envoltória, então esta curva pode ser encontrada im-
plicitamente através da equação que se obtém substituindo α = αx,y ,
solução de
∂f (x, y, α)
= 0. (8.10)
∂α
em f (x, y, α) = 0.
Fica assim determinado implicitamente a envoltória por
0 = g(x, y) = F (x, y, αx,y ).
Demostração: Supondo por exemplo
∂f
(x̄, ȳ, ᾱ) 6= 0
∂y
então para (x, y, α) perto de (x̄, ȳ, ᾱ) tem-se
f (x, y, α) = 0 ⇔ y = g(x, α)
com g diferenciável. Pelo resultado anterior (8.2), a envoltória da

famı́lia de curvas gα (x) é dada por
∂g
(x̄, ᾱ) = 0.
∂α
Como f (x, g(x, α), α) = 0 para todo (x, α) próximo de (x̄, ᾱ), obtém-
se, diferenciando com relação a α,
∂f ∂g ∂f
0= (x, g(x, α), α) (x, α) + (x, g(x, α), α)
∂y ∂α ∂α
i i
i i
“mec˙New”
i i
2011/10/11
page 172
i i
e em particular, em (x̄, ᾱ):
∂f ∂g ∂f ∂f
0= (x̄, g(x̄, ᾱ), ᾱ) (x̄, ᾱ) + (x̄, g(x̄, ᾱ), ᾱ) = (x̄, ȳ, ᾱ),
∂y |∂α {z } ∂α | {z } ∂α
=ȳ
=0
i.e., a envoltória das curvas é dado equivalentemente por
∂f
(x̄, ȳ, ᾱ) = 0.
∂α
O caso
∂f
(x̄, ȳ, ᾱ) 6= 0
∂x
é análogo.
Exemplo 8.5. Vamos encontrar a envoltória da famı́lia de cı́rculos
f (x, y, α) = x2 + y 2 − 2αx − 2αy + α2 = 0
usando o último Teorema.

Esta famı́lia representa cı́rculos de raio kαk centrados nos pontos
da reta diagonal (α, α), ou seja, a famı́lia (x − α)2 + (y − α)2 = α2 .
Ora
∂f
= −(2x + 2y − 2α) = 0,
∂α
logo α = (x+y). Substituindo α = αx,y por (x+y) em f (x, y, α) = 0,
obtemos 0 = f (x, y, α) = (x−α)2 +(y−α)2 −α2 = y 2 +x2 −(x+y)2 =
−2xy.
Obtemos portanto a equação da envoltória como xy = 0, ou seja
a equação retas que definem os eixos de x e dos y. Geometricamente
é bem fácil se observar que realmente os eixos do x e y são a solução
do problema (ver Figura 7.2).
Vamos agora aplicar o resultado acima em uma situação que será

extremamente importante na teoria de propagação de ondas.
Exemplo 8.6. Seja uma função φ : R2 → R tal que para cada T ,

φ(x, y) = T determina uma curva de nı́vel diferenciável ΣT .
i i
i i
“mec˙New”
i i
2011/10/11
page 173
i i
173
Suponhamos que φ tem a seguinte propriedade: para T , ∆ > 0 a

curva ΣT +∆ é obtida como a envoltória por cı́rculos de raio ∆ sobre
a curva ΣT (ver Figuras 7.3 e 7.4).
Vamos mostrar que a função φ deve satisfazer a equação
!2 !2
∂φ ∂φ
1= + . (8.11)
∂x ∂y
Esta equação é conhecida como equação eikonal da ótica geomé-

trica.
Seja (x1 (α), x2 (α)) uma parametrização de ΣT . Então a famı́lia
f (x, y, α) = (x1 (α) − x)2 + (x2 (α) − y)2 − ∆2 = 0
vai definir implicitamente a equação de cı́rculos (na variável (x, y))

de raio ∆, centrados nos pontos da curva ΣT .
As Figuras 8.1 e 8.2 dão uma ideia dos distintos envoltórios ob-
tidos a partir de um objeto unidimensional genérico.
Como vimos antes a envoltória da famı́lia é obtido como a curva
∂f
na variável (x, y) que satisfaz as equações ∂α = 0 e f (x, y, α) = 0.
Sendo assim obtemos as equações:
∂f
0= = 2(x1 (α) − x)x′1 (α) + 2(x2 (α) − y)x′2 (α),
∂α
e (x1 (α) − x)2 + (x2 (α) − y)2 = ∆2 .
Resolvendo o sistema acima vamos encontrar (x(α), y(α)) para-
metrização de ΣT +∆ dependendo do ponto (x1 (α), x2 (α)) sobre a
curva ΣT . O ponto (x(α), y(α)) está na envoltória e dista ∆ de
(x1 (α), x2 (α)).
Da equação [(x1 (α) − x(α))x′1 (α) + (x2 (α) − y(α))x′2 (α)] = 0 con-
cluı́mos que para todo ∆(x1 (α) − x(α), x2 (α) − y(α)) é perpendicu-
lar ao vetor tangente (x′1 (α), x′2 (α)). Em outras palavras, (x1 (α) −
x(α), x2 (α) − y(α)) é normal a ΣT para todo ∆.
Como sabemos v∆ = −((x1 (α) − x(α)), x2 (α) − y(α)) para todo
∆ (pequeno) é colinear com ∇φ (que é perpendicular à superfı́cie de
nı́vel) e v∆ tem sempre norma ∆.
Portanto,
∇φ v∆
= .
k∇φk kv∆ k
i i
i i
“mec˙New”
i i
2011/10/11
page 174
i i
Como * +
∇φ
∇φ, = k∇φk,
k∇φk
então * +
v∆
∇φ, = k∇φk.
∆
Ora
φ(x + u1 ∆, y + u2 ∆) − φ(x, y)
h∇φ, ui = h∇φ, (u1 , u2 )i = lim ,
∆→0 ∆
logo * +
v∆
k∇φk = ∇φ, =
∆
" !
1 x(α) − x1 (α)
lim φ x1 (α) + ∆ ,
∆→0 ∆ ∆
! #
(y(α) − x2 (α))
x2 (α) + ∆ − φ(x1 (α), x2 (α))
∆
1 ∆+T −T
lim [φ(x(α), y(α)) − φ(x1 (α), x2 (α))] = lim = 1.
∆→0 ∆ ∆→0 ∆
Sendo assim, k∇φk = 1, ou seja,
!2 !2
∂φ ∂φ
+ = 1.
∂x ∂y
Concluı́mos, portanto, que uma função φ satisfazendo a proprie-

dade das envoltórias por cı́rculos de mesmo raio para as superfı́cies
de nı́vel ΣT , deve satisfazer a equação diferencial parcial acima.
Esta equação foi denominada anteriormente de Equação de Ha-
milton-Jacobi autônoma para o Hamiltoniano H(q, p) = p21 +p22 . Esta
equação não é linear. Para resolvê-la vamos aplicar os métodos para
calcular as soluções de equações diferenciais parciais de 1a ordem não
lineares a partir de condições de fronteira que consideramos antes.
i i
i i
“mec˙New”
i i
2011/10/11
page 175
i i
175
Figura 8.3:
Exercı́cio
1. Calcule pelo método da solução completa a solução da equação
diferencial parcial
2 2
∂S 1 ∂S
+ = 1,
∂x 4 ∂y
com a condição inicial (x(s), y(s), S(s)) = (s, 0, 1).
i i
i i
“mec˙New”
i i
2011/10/11
page 176
i i
Capı́tulo 9
O Princı́pio de Huygens
em Mecânica
Hamiltoniana
Vamos analisar a seguir a evolução de uma frente de onda em um

plano (o caso mais geral em Rn é semelhante). Para fixar idéias,
vamos supor que desejamos analisar a seguinte questão: largamos
uma pequena pedra ou um galho de árvore na superfı́cie de um lago
em repouso. A superfı́cie do lago será então percorrida por uma
frente de onda que se propaga a partir da excitação inicial causada
pela pedra ou galho (ver respectivamente Figuras 8.1 e 8.2).
Vamos denotar por Σt a posição espacial em R2 da frente de onda
no tempo t.
Observe nas Figuras 8.1 e 8.2 que a frente de onda Σt+∆ é (a parte
externa da) envoltória por cı́rculos de raio ∆ centrados na frente de
onda Σt . Essa propriedade é observada na natureza e em essência
expressa o seguinte fato. A frente de onda Σt+∆ poderia ser obtida
lançando ao mesmo tempo t várias pedrinhas sobre a posição da
frente de onda Σt . Esperando decorrer o tempo ∆ cada pedrinha
individualmente cria um cı́rculo (de raio ∆) de frente de onda. A
envoltória destes cı́rculos determina a frente de onda Σt+∆ .
176
i i
i i
“mec˙New”
i i
2011/10/11
page 177
i i
177
Essa propriedade é o que se denomina (em termos simplificados)

o princı́pio de Huygens.
O mesmo princı́pio é também válido para a propagação da luz a
partir de um ponto p0 onde acendemos a luz no tempo inicial t0 . A
luz tem velocidade finita e a separação entre a região iluminada num
tempo T e a região ainda não iluminada é a frente de onda.
Em certos cristais a luz não se propaga em linha reta e as frentes
de onda não são necessariamente cı́rculos. Podem haver direções em
que a luz tem mais facilidade de se propagar. Este fato se deve muitas
vezes à estrutura molecular do cristal e é conhecido como anisotropia,
ou não-homogeneidade do meio.
Para descrever matematicamente a evolução da frente de onda,
vamos supor que existe uma função S(x, t), S : Rn × R → R que vai
descrever de maneira implı́cita a posição da frente de onda, isto é,
dado t1 ∈ R, t1 > 0, S(x, t1 ) = 0, vai definir a hipersuperfı́cie Σt1 em
Rn , que define a frente de onda no tempo t1 . Vamos supor sempre
que
!2 ! !2
∂S ∂S 2 ∂S
+ + ... + 6= 0.
∂x1 ∂x2 ∂xn
Referimos o leitor para [BF] e [Jo] para uma explanação mais

completa dos tópicos a serem apresentados a seguir.
p
Exemplo 9.1. Considere S(x, t) = x21 + ... + x2n − t, então para
t > 0 a frente de onda Σp t será a esfera com raio t, ou seja, o conjunto
dos (x1 , ..., xn ) tal que x21 + ... + x2n − t = 0.
No caso n = 2, a função S descreve a evolução da frente de
onda de uma pequena pedra lançada no tempo t = 0 na superfı́cie
de um lago (na posição (0, 0)). É fácil ver geometricamente que a
propriedade da envoltória das curvas de nı́vel por cı́rculos é verdade
para tal S. Estamos neste caso supondo que a propagação da onda é
isotrópica e homogênea (vamos definir estes conceitos mais precisa-
mente em breve).
Note que tal S satisfaz a equação diferencial
2 2
∂S ∂S ∂S
+ =− = 1,
∂x1 ∂x2 ∂t
i i
i i
“mec˙New”
i i
2011/10/11
page 178
i i
178 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA
ou equivalentemente
s 2 2
∂S ∂S ∂S
+ =− = 1.
∂x1 ∂x2 ∂t
Note que esta equação corresponde

p a equação de Hamilton-Jacobi
para o Hamiltoniano H(q, p) = p21 + p22 . Este fato será analisado
com mais detalhe em breve.
p
Exemplo 9.2. Considere para x ∈ p R2 , S(x, t) = x21 + 4x22 − t,
então as frentes de onda são elipses x21 + 4x22 − t = 0. Nesse caso
estaremos descrevendo a evolução da frente de onda de um distúrbio
inicial no tempo 0 feito no ponto (0,0). A propagação não é ho-
mogênea pois a onda se propaga mais rapidamente na direção x1 .
S satisfaz neste caso a equação diferencial
2 2
∂S 1 ∂S ∂S
+ =− ,
∂x1 4 ∂x2 ∂t
ou equivalentemente
s 2 2
∂S 1 ∂S ∂S
+ =− .
∂x1 4 ∂x2 ∂t
Note que esta equação corresponde àq

equação de Hamilton-Jacobi as-
sociada ao Hamiltoniano H(q, p) = p21 + 14 p22 .
Este exemplo será analisado mais uma vez em breve.
Neste texto estaremos analisando, prioritariamente, propagação

homogênea e isotrópica. Sendo assim, a frente de onda Σt+∆ é ob-
tida como a envoltória de cı́rculos de mesmo raio com centro em
Σt . No outro caso terı́amos que fazer envoltórios com elipses e a ex-
centricidade de tais elipses depende da posição no caso de um meio
não-homogêneo e anisotrópico.
Considere uma S(x, t) : Rn+1 → R, que define implicitamente a
posição das frentes de onda conforme definimos anteriormente. Para
simplificar nossas considerações vamos supor ainda mais que exista
S(x) : Rn → R tal que S(x, t) = S(x) − t (esta expressão é análoga
i i
i i
“mec˙New”
i i
2011/10/11
page 179
i i
179
à expressão S(q, t) = S(q) − wt que usamos anteriormente quando

estávamos analisando soluções da equação de Hamilton-Jacobi na
Seção 8, Capı́tulo 3 [L]).
Que tipo de restrições tal função S deve satisfazer?
Suponha, 0 = S(x, t) = S(x) − t, para t fixo, vai descrever a curva
que estabelece a frente de onda no tempo t. Pelo princı́pio de Huygens
a curva de nı́vel no tempo t+∆ é obtida como a envoltória de cı́rculos
(o meio é homogeneo e isotrópico) de raio ∆ e centrados sobre a curva
de nı́vel no tempo t. Esta situação, no caso do plano, é exatamente
aquela que analisamos na seção anterior e sabemos portanto que neste
caso S deve satisfazer a equação da eikonal
!2 !2
∂S ∂S
+ = 1.
∂x1 ∂x2
É possı́vel também mostrar no caso geral do Rn , que a função S

deve satisfazer
!2 !2 !2
∂S ∂S ∂S
+ + ... + = 1.
∂x1 ∂x2 ∂xn
Esta equação é também denominada equação da eikonal e é um
caso particular de equação de Hamilton-Jacobi autônoma (ver (3.13)
Seção 8, Capı́tulo 3 [L]). A relação desta equação com a equação de
Hamilton será o objetivo das nossas próximas considerações.
A relação entre raios de luz e frentes de onda vai nos possibili-
tar entender a razão da introdução do ponto de vista de “frentes de
onda” de Hamilton de entender a Mecânica Clássica. Vamos a seguir
explicar melhor esta relação.
Na verdade este ponto de vista é, nada mais nada menos, que o
princı́pio de Huygens para a Mecânica Hamiltoniana.
Voltando ao caso geral, considere S(x, t) que vai descrever para
cada tempo t, a frente de onda no tempo t através da curva obtida
implicitamente pela equação S(x, t) = 0.
Suponha que x(t) vai descrever uma curva em Rn tal que ∀ t ∈ R,
x(t) ∈ Σt . Em outras palavras, x(t) vai estar sempre na frente de
onda. Sendo assim, S(x(t), t) = 0, ∀ t ∈ R, t > 0 e, portanto,
∂S ′ ∂S ′ ∂S ′ ∂S
x1 + x2 + ... + xn + =0
∂x1 ∂x2 ∂xn ∂t
i i
i i
“mec˙New”
i i
2011/10/11
page 180
i i
ou seja
∂S
h∇S, x′ i = − .
∂t
Observação 9.1. Considere S(x, t) que descreve através de S(x, t) =
0 a evolução temporal de uma frente de onda causada por uma fonte
pontual luminosa localizada em um ponto x0 . Para t fixo, a en-
voltória dos caminhos z(s), s ∈ [0, t] (todos com velocidade constante
kz ′ (s)k = 1, s ∈ (0, t)) com ponto inicial x0 = z(0) e ponto final z(t)
determina a frente de onda. Um caminho x(s) entre tantos possı́veis
z(s), que está localizado de tal jeito que x(t) está na frente de onda
S(x, t) = 0 vai representar o raio de luz fisicamente observável. Este
caminho x(s) é o que realmente se chama de raio de luz.
Ora, ∇S é perpendicular a Σt , logo a componente do vetor x′ (t)

∇S
na direção k∇Sk (normal à frente de onda) é
∂S
∂t
− .
k∇Sk
Em geral, nem sempre ∇S, o gradiente da função frente de onda

S, e x′ (t), o vetor tangente ao raio de luz x(t), são colineares, mas se
o meio é homogêneo e isotrópico, isto acontecerá como veremos em
breve.
Definição 9.1. A velocidade de propagação da frente de onda é por

definição o vetor velocidade de propagação normal à superfı́cie Σt ,
ou seja
∂S
∂t
− ∇S.
k∇Sk2
Definição 9.2. O módulo do vetor velocidade de frente de onda é
dado por
∂S
∂t
− > 0.
k∇Sk
O módulo do vetor frente de onda é a grandeza mais importante
que vai descrever a evolução temporal da frente de onda. A lei que
determina tal evolução será descrita a seguir.
i i
i i
“mec˙New”
i i
2011/10/11
page 181
i i
181
Assuma agora que S(x, t) = φ(x)−t, isto significa que a velocidade

de propagação da onda é
∂S
∂t 1 1
− = = .
k∇Sk k∇Sk k∇φk
Como já vimos antes no caso do plano, se o princı́pio de Huygens
é verdadeiro para φ então k∇φk = 1.
Sendo assim, assumir que S(x, t) é da forma φ(x) − t é assumir
que a velocidade de propagação da frente de onda é igual a 1. Se
desejássemos analisar uma situação em que a velocidade da frente
de onda é w então deverı́amos tentar encontrar S do tipo S(x, t) =
φ(x) − wt.
Neste caso, é fácil ver que a equação que descreve tal S é
p
k∇Sk = w.
Fica portanto justificado porque é bastante comum quando bus-

camos encontrar soluções da equação de Hamilton-Jacobi tentar en-
contrar soluções da forma S(q, t) = S(q) − wt.
Vamos analisar agora a propagação de ondas de um ponto de vista
bastante geral. Vamos descrever a lei fı́sica que S(x, t) deve satisfazer.
O módulo do vetor velocidade da propagação da onda deve sa-
tisfazer uma lei que é chamada de propriedade constitutiva do meio
contı́nuo. Essa lei, que como veremos a seguir é bastante natural,
envolve uma função H0 (x, p), onde x ∈ Rn , (mas definida apenas
para valores unitários, ou seja p ∈ Rn , kpk = 1) que vai descrever
propriedades microscópicas do meio. A lei determina que o módulo
do vetor velocidade de propagação da onda
∂S
∂t
−
k∇Sk
satisfaça !
∂S
∂t ∇S
− = H0 x, . (9.1)
k∇Sk k∇Sk
A equação diferencial parcial acima estabelece uma dependência
de ∂S ∇S
∂t em x e no vetor unitário k∇Sk . Esta dependência é estabele-
cida por H0 e expressa uma lei agindo a nı́vel local (microscópico)
i i
i i
“mec˙New”
i i
2011/10/11
page 182
i i
no sistema em consideração. H0 vai descrever a falta de homogenei-

dade e anisotropia (ou não) que existe no meio. Esta lei local (9.1)
vai determinar propriedades globais (macroscópicas) do sistema (por
exemplo a forma das frentes de onda a partir de uma perturbação
inicial em um certo ponto do meio) como veremos a seguir.
Através de considerações de natureza fı́sica e geométrica é natural
agora estabelecer que H seja homogênea na segunda variável, ou seja,
que
H(x, λp) = λH0 (x, p). (9.2)
Por exemplo, se estivermos analisando uma métrica Riemamnni-

ana < , > como Hamiltoniano, é mais natural neste caso, considerar
√ R
H = < , > em vez de H =< , >. Desta maneira a integral γ Hdt
de uma curva γ depende apenas do traço da curva (dos pontos da
curva) e não da parametrização utilizada.
∀ λ ∈ R, ou seja que para um vetor não unitário, H tem uma
dependência linear no comprimento do vetor p. Sendo assim a partir
de (9.1), a equação constitutiva do meio para S(x, t) que descreve a
evolução de uma frente de onda torna-se
∂S ∇S ∂S
+ k∇SkH0 (x, )= + H(x, ∇S) = 0. (9.3)
∂t k∇Sk ∂t
Esta equação foi denominada anteriormente (Definição 26, Seção

8, Capı́tulo 3 [L]) de equação de Hamilton-Jacobi.
O Hamiltoniano H desempenha portanto na Mecânica Hamilto-
niana o papel da lei constitutiva do meio na propagação de frentes
de onda.
Se S(x, t) for da forma S(x, t) = φ(x) − t, então a equação acima
torna-se
∂S
0= + H(x, ∇S) = −1 + H(x, ∇φ),
∂t
ou seja H(x, ∇φ) = 1.
Esta equação foi denominada em (3.13) na Seção 8, Capı́tulo 3
[L], de equação de Hamilton-Jacobi autônoma.
Como dissemos antes, no caso isotrópicop e homogêneo, devemos
considerar a métrica Euclidiana H(x, p) = p21 + p22 e então teremos
i i
i i
“mec˙New”
i i
2011/10/11
page 183
i i
183
a equação
s 2 2
∂S ∂S ∂S
− = H(x, ∇S) = + .
∂t ∂x1 ∂x2
Se S(x, t) = φ(x) − t, então a equação acima significa

!2 !2
∂φ ∂φ
1= + .
∂x1 ∂x2
A conclusão portanto é que a equação constitutiva

∂S
0= + H(x, ∇S)
∂t
é apenas uma descrição geral do princı́pio de Huygens e determina
uma equação do tipo Hamilton-Jacobi. p
Se H no caso bidimensional é dado por H(x, p) = p21 + p22 , então
esta última equação é a equação da eikonal.
Sendo assim a equação de Hamilton-Jacobi, neste caso particu-
lar, expressa a lei constitutiva do meio e esta equação determina a
propagação de frentes de onda num meio homogêneo e anisotrópico.
Podemos extrapolar o raciocı́nio acima e pensar que o Hamilto-
niano H(x, p) determina uma lei constitutiva no espaço da variável
x (de configuração), e que a equação de Hamilton-Jacobi descreve
frentes de onda de soluções do sistema mecânico.
A dependência de H0 (x, p) em p caracteriza a anisotropia do meio.
Definição 9.3. No caso em que H0 (x, p) não depende de p, o meio
é dito isotrópico.
Definição 9.4. Se H0 (x, p), por sua vez não depende de x, dizemos
que o meio é homogêneo.
Exemplo 9.3. Seja p o Hamiltoniano H(q, p) = a(q)p21 + 2c(q)p1 p2 +
2
b(q)p2 (ou H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22 ), q = (x1 , x2 ), p =
(p1 , p2 ), e suponha que exista solução da forma S(q, t) = S(q)−t para
a EDP de Hamilton-Jacobi associada, então
∂S ∂S p
0 = −1 + H(q, p) = + H(q, p) = + H(q, p)
∂t ∂t
i i
i i
“mec˙New”
i i
2011/10/11
page 184
i i
vai descrever em geral a evolução de frentes de onda no plano em um

meio anisotrópico e não homogêneo.
Note que no caso de propagação de ondas num meio contı́nuo, por
causa de (9.2), o H(q, p) deve ser
q
H(q, p) = a(x)p21 + 2c(x)p1 p2 + b(x)p22 ,
mas como vimos na equação acima, tanto faz tomar a raiz quadrada
ou não, para fins de calcular a equação de Hamilton-Jacobi.
Voltaremos a analisar este exemplo em breve.
Acreditamos que neste momento tenha ficado transparente a rela-

ção do princı́pio de Huygens com a Mecânica Hamiltoniana, em par-
ticular com a equação de Hamilton-Jacobi. A propagação de frentes
de onda é a inspiração principal para este ponto de vista da Mecânica
Clássica.
Uma boa justificativa porque os raios de luz podem ser inter-
pretados como geodésicas aparece na Observação 9.1 e subsequente
conclusão no fim da próxima seção.
A questão relevante do ponto de vista Fı́sico é a seguinte: consi-
dere um sistema Hamiltoniano definido por H(q, p) e
(q(t), p(t)) = (x1 (t), x2 (t), p1 (t), p2 (t))
solução do problema mecânico. Desejamos analisar a partir de uma

frente de onda de condições iniciais de posição e velocidade (q, p) =
(q(s), p(s)) = (x1 (s), x2 (s), p1 (s), p2 (s)), s ∈ (a, b), a evolução desta
frente de onda com o tempo t segundo o sistema mecânico. Isto é,
desejamos descobrir a função
(q(s, t), p(s, t)) = (x1 (s, t), x2 (s, t), p1 (s, t), p2 (s, t)) =
= (xs1 (t), xs2 (t), ps1 (t), ps2 (t))

que determina a posição da condição inicial
(q(s), p(s)) = (x1 (s, 0), x2 (s, 0), p1 (s, 0), p2 (s, 0))
após decorrido tempo t.
i i
i i
“mec˙New”
i i
2011/10/11
page 185
i i
185
Em outras palavras gostarı́amos de determinar a evolução tem-

poral de um feixe (uma frente de onda) de condições iniciais. Como
veremos a seguir, a Mecânica Hamiltoniana permite tal tratamento.
Vamos agora analisar a evolução de frentes de onda de condições
iniciais no espaço de fase da Mecânica Hamiltoniana.
Considere um Hamiltoniano H, por exemplo
2 2
1X 2 1X 2
H(q, p) = U (q) + pi = U (x1 , x2 ) + p (9.4)
2 i=1 2 i=1 i
sendo assim, a equação

!
∂S ∂S ∂S
0= + H q, = + H(q, ∇S)
∂t ∂q ∂t
de Hamilton-Jacobi, obtida anteriormente na Mecânica Hamiltoniana

é análoga à equação que descreve a evolução de uma onda em um meio
contı́nuo.
Note que para um sistema mecânico em geral da forma (9.4), a
expressão (9.2) não é verdadeira.
Supondo por separação de variáveis que S é da forma S(q, t) =
φ(q)−t, então a equação diferencial parcial F = 0 associada à equação
de Hamilton-Jacobi é
1
0 = F (x1 , x2 , φ, p1 , p2 ) = U (x1 , x2 ) + (p21 + p22 ) − 1 =
2

1 ∂φ 2 ∂φ 2
U (x1 , x2 ) + (( ) + ) − 1 = H(x1 , x2 , p1 , p2 ) − 1,
2 ∂x1 ∂x2
onde
∂φ ∂φ
p1 = , p2 = .
∂x1 ∂x2
Vamos voltar a considerar um Hamiltoniano qualquer a partir
deste momento.
A equação diferencial parcial não linear de Hamilton-Jacobi
H(q, p) − 1 = H(q, ∇φ) − 1 = 0,
i i
i i
“mec˙New”
i i
2011/10/11
page 186
i i
pode ser resolvida através do método das caracterı́sticas como foi

desenvolvido na Seção 7. As equações das caracterı́sticas para a F
definida acima neste caso são
∂F ∂H
x′1 = =
∂p1 ∂p1
∂F ∂H
x′2 = =
∂p2 ∂p2
∂F ∂F
φ ′ = p1 + p2
∂p1 ∂p2
∂F ∂H
p′1 = − =−
∂x1 ∂x1
∂F ∂H
p′2 = − =− (9.5)
∂x2 ∂x2
As primeiras duas e as últimas duas equações acima definem as
soluções do campo de vetores Hamiltoniano no plano (x1 , x2 , p1 , p2 ).
Logo as caracterı́sticas de equação de Hamilton-Jacobi projetadas
no espaço (x1 , x2 , p1 , p2 ) são as soluções das equações de Hamilton.
O Teorema de Hamilton-Jacobi (Teoremas 22 e 23), que apre-
sentamos na Seção 9 [L], afirma que se pode passar diretamente da
solução completa para as caracterı́sticas da EDP de Hamilton-Jacobi.
A terceira equação de (9.5) afirma que as caracterı́sticas (soluções
da equação de Hamilton) (x1 (t), x2 (t), p1 (t), p2 (t)) são tais que a
função
φ(x1 (t), x2 (t))
satisfaz
2 2
dφ X X
= pi Hpi = pi Fpi .
dt i=1 i=1
Note que o resultado sobre caracterı́sticas acima é válido para

um Hamiltoniano qualquer H(q, Pn p) e não apenas para Hamiltonianos
naturais do tipo H(q, p) = 12 i=1 p2i + V (q).
O método que vamos descrever a seguir vai determinar a evolução
de uma frente de onda (q(s, t), p(s, t)) a partir de (q(s), p(s)). Desta
maneira poderemos determinar a evolução temporal de feixes de con-
dições iniciais do problema mecânico (ver Propriedade Importante
i i
i i
“mec˙New”
i i
2011/10/11
page 187
i i
187
a seguir). Esta questão é fundamental em Mecânica Estatı́stica e

Mecânica Quântica (ver [OA]). A propriedade importante descrita a
seguir, não é para um sistema mecânico qualquer, mas apenas para
um sistema associado a uma métrica Riemanniana. Lembre que é
muitas vezes possı́vel transformar por mudança de parametro tempo-
ral um problema mecânico em um problema geométrico (ver Teorema
20 e Corolário 21, Capı́tulo 2 [L]).
Propriedade Importante: Seja o Hamiltoniano
H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22
q = (x1 , x2 ), p = (p1 , p2 ), e seja S(q, t) = φ(q)−t solução da respectiva

equação de Hamilton-Jacobi
!
∂S ∂S
0= + H q, ,
∂t ∂q
ou seja φ satisfaz
∂φ
1 = H q, ,
∂q
e a condição inicial (ou de fronteira) (q(s), φ(s)) = (q(s), 1).
Então S(x1 , x2 , t0 ) = S(x, t0 ) = 0 vai determinar para cada t0
fixo, a posição de q(s, t1 ) = (x1 (s, t1 ), x2 (s, t1 )), t1 = t1 (t0 ), das
curvas
(xs1 (t), xs2 (t)),
projeção no plano (x1 , x2 ) das curvas (xs1 (t), xs2 (t), ps1 (t), ps2 (t)), solução
do campo Hamiltoniano começando no tempo t = 0 em
(x1 (s), x2 (s), p1 (s), p2 (s)),
s ∈ (a, b). Note que p(s) = (p1 (s), p2 (s)) deve satisfazer a Observação
7.2 da Seção 7.
A Propriedade Importante segue do seguinte fato:
S(x, t) = S(x1 , x2 , t) = S((x1 (s, t), x2 (s, t), t)
depende apenas de t (linearmente em t de fato) e as caracterı́sticas

são as soluções do problema mecânico como vimos acima.
i i
i i
“mec˙New”
i i
2011/10/11
page 188
i i
Seja φ(x1 , x2 ) solução da equação de Hamilton-Jacobi

0 = H(x1 , x2 , p1 , p2 ) − 1 = H(q, ∇φ(p)) − 1 = F (x1 , x2 , φ, p1 , p2 ),
que será analisada a seguir pelo método das caracterı́sticas.
A função φ(x1 (s, t), x2 (s, t)) satisfaz
d (φ(x1 (s, t), x2 (s, t)) ∂φ ∂φ
= x1 s′ (t) + x2 s′ (t) =
dt ∂x1 ∂x2
p1 Hp1 + p2 Hp2 = p1 (2a(q)p1 + 2c(q)p2 ) + p2 (2c(q)p1 + 2b(q)p2 ) =
2H(q(s, t), p(s, t)).
É fácil ver pela Observação 46 que para o Hamiltoniano
H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22 ,
a condição
F (x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) =
= H(x1 (s), x2 (s), p1 (s), p2 (s)) − 1 = 0
significa que H(q(s, 0), p(s, 0)) = 1 para todo s.
Pelo Teorema de conservação do Hamiltoniano (Teorema 2, Capı́-
tulo 3 [L]) H(q(s, t), p(s, t)) é constante igual a 1. Logo, para todo s
d (φ(x1 (s, t), x2 (s, t))
= 2.
dt
Concluı́mos portanto que
dS(x, t) d(φ(x) − t)
= = 2 − 1 = 1.
dt dt
Se assumirmos φ(x1 (s, 0), x2 (s, 0)) = φ(x1 (s), x2 (s)) = 1, ∀s ∈
(a, b) então S(x1 (s, t), x2 (s, t), t) = 1 + t.
Fica assim justificada a afirmação da Propriedade Importante
acima enunciada. Em breve apresentaremos exemplos em que uti-
lizaremos a propriedade acima descrita (Exemplos 9.5, 9.6 e 9.7).
Considere agora o caso particular em que H(x, p) = p21 + p22 , S
solução da equação da eikonal
2 2
∂S ∂S
+ =1
∂x1 ∂x2
i i
i i
“mec˙New”
i i
2011/10/11
page 189
i i
189
com a condição inicial da frente de onda na posição
q(s) = (x1 (s), x2 (s)) ∈ R2
dada. Então, pela Propriedade Importante φ(x) − t = S(x, t) = 0,

vai descrever implicitamente a posição espacial da frente de onda no
tempo t1 .
Vamos considerar no tempo t = 0, condições iniciais (x1 (s), x2 (s))
e perguntar a posição desta frente de onda após decorrido tempo t.
Vamos utilizar o resultado mencionado pela Propriedade Importante
visto anteriormente.
Vamos tentar resolver este problema através dos dois métodos
desenvolvidos antes: o método da integral completa e o método das
caracterı́sticas.
Primeiro vamos aplicar o método das caracterı́sticas.
Usando a notação da Seção 7, a Equação diferencial parcial de 1a
ordem não linear !2 !2
∂φ ∂φ
+ =1
∂x1 ∂x2
pode ser expressa como 0 = F (x1 , x2 , φ, p1 , p2 ) = 1 − (p21 + p22 ) =

1 − (φ2x + φ2y ) onde p1 = φx e p2 = φy .
Vamos analisar neste caso a expressão das equações das carac-
terı́sticas da EDP, F (x1 , x2 , φ, p1 , p2 ) = 0 . Neste caso, a equação
é
p21 + p22 − 1 = 0,
ou seja, neste caso F (p1 , p2 ) = p21 + p22 − 1.
Usando a expressão das equações das caracterı́sticas obtemos
dx1
= 2p1
dt
dx2
= 2p2
dt
dφ
= 2p21 + 2p22
dt
dp1
=0
dt
i i
i i
“mec˙New”
i i
2011/10/11
page 190
i i
dp2
= 0. (9.6)
dt
Observação 9.2. Note que no caso acima, o vetor gradiente da
frente de onda ∇φ = p é colinear com x′ .
Observação 9.3. Das equações das caracterı́sticas acima, as carac-
terı́sticas (x1 (t), x2 (t), φ(t), p1 (t), p2 (t)) devem portanto satisfazer
!
d2 x1 d dx1 d
2
= = (2pi ) = 0
dt dt dt dt
e !
d2 x2 d dx2 d
= = (2p2 ) = 0.
dt2 dt dt dt
Note que os valores p1 (t) e p2 (t) são constantes.
Da equação acima segue que x1 (t) e x2 (t) são lineares em t, ou
seja, x1 (t) = 2p1 t + c1 e x2 (t) = 2p2 t + c2 .
A conclusão é que a projeção das caracterı́sticas no plano x =
(x1 , x2 ) são linhas retas.
Finalmente, φ′ (t) = 2p21 + 2p22 = 2(p21 + p22 ) = 2 × 1 = 2, pois por
hipótese p21 + p22 = 1.
Logo φ(t) = 2t + c3 .
Sendo assim, concluı́mos finalmente que as caracterı́sticas são re-
tas em R5 .
Vamos agora usar os resultados obtidos anteriormente para cal-
cular soluções da EDP via o método das caracterı́sticas.
Exemplo 9.4. Vamos calcular a solução da equação diferencial par-
cial !2 !2
∂φ ∂φ
+ = 1,
∂x1 ∂x2
sujeita às condições
(x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) = (cos s, sin s, 1, cos s, sin s).
Observe que p1 (s) e p2 (s) são compatı́veis com (x1 (s), x2 (s), φ(s))
como é necessário assumir no problema em consideração (Seção 7).
i i
i i
“mec˙New”
i i
2011/10/11
page 191
i i
191
As caracterı́sticas já foram calculadas acima, e portanto as carac-

terı́sticas (xs1 (t), xs2 (t), φs (t), ps1 (t), ps2 (t)) obtidas a partir das condições
iniciais
(cos s, sin s, 1, cos s, sin s),
são
xs1 (t) = 2p1 (s)t + cos s = 2 cos(s)t + cos(s)
xs2 (t) = 2p2 (s)t + sin s = 2 sin(s)t + sin(s)
φs (t) = 2t + 1
ps1 (t) = cos s
ps2 (t) = sin s.
Observação 9.4. Note que a partir de p(s) = (p1 (s), p2 (s)) fixado, o
vetor ps (t) = (ps1 (t), ps2 (t)) não se altera, ou seja neste caso particular,
o momento se conserva.
Antes de expressar a função φ nas coordenadas (x1 , x2 ), devemos
relacionar as coordenadas (s, t) e as coordenadas (x1 , x2 ).
Ora, (x1 (s, t), x2 (s, t)) = (cos s(2t+1), sin s(2t+1)), logo x21 +x22 =
cos s(2t + 1)2 + sin2 s(2t + 1)2 = (2t + 1)2 .
2
Portanto, q
1
t= x21 + x22 − 1
2
e como x1 = cos s(2t + 1) então
x1 x1
s = arccos = arccos p 2 .
2t + 1 x1 + x22
Em conclusão
q !
x1 1
(s(x1 , x2 ), t(x1 , x2 )) = arccos p 2 , x21 + x22 −1 .
x1 + x2 2
2
Como φ(s, t) = 2t + 1, concluı́mos que a solução φ(x p1 , x2 ) satis-

fazendo as condições iniciais pré-fixadas é φ(x1 , x2 ) = x21 + x22 .
Sugerimos ao leitor calcular φ2x1 + φ2x2 para testar e certificar-se
que realmente a φ acima descrita satisfaz φ2x1 + φ2x2 = 1.
i i
i i
“mec˙New”
i i
2011/10/11
page 192
i i
A evolução de (q(s, t), p(s, t)) a partir da frente de onda no tempo

t = 0, dada por (q(s), p(s)) = (cos(s), sin(s), cos(s), sin(s)) pode ser
seguida para tempos t subsequentes através de φ, isto é, φ(q1 , q2 ) = t
determina a posição no tempo t da frente de onda acima considerada.
A conclusão neste caso, é que as frentes de ondas são cı́rculos com
o mesmo centro.
Exemplo 9.5. Vamos agora tentar encontrar a solução da equação
diferencial parcial φ2x +φ2y = 1 através do método da solução completa.
Devemos tentar primeiramente encontrar uma famı́lia f a,b (x1 , x2 ) a
dois parâmetros (a, b) ∈ R2 de soluções de φ2x + φ2y = 1.
Vamos tentar encontrar a solução pelo método de separação de
variáveis. Suponhamos que φ possa ser escrita da forma φ(x1 , x2 ) =
f (x1 ) + g(x2 ).
Substituindo φ na equação φ2x1 + φ2x2 = 1, obtemos f ′ (x1 )2 +
g (x2 )2 = 1.
′
Como f ′ (x1 )2 = 1−g ′ (x2 )2 , então f ′ (x1 ) não depende de x1 . Logo

f (x1 ) é constante. Da mesma forma g ′ (x2 ) também é constante.
′
Como f ′ (x1 )2 + g ′ (x2 )2 = 1, podemos escrever f ′ (x1 ) = cos a e

′
g (x2 ) = sin a.
Portanto, f (x1 ) = x1 cos a + c1 e g(x2 ) = x2 sin a + c2 .
Finalmente concluı́mos que
f (x1 , x2 , a, b) = f (a,b) (x1 , x2 ) = x1 cos a + x2 sin a + b
é uma famı́lia completa de soluções da equação diferencial parcial
φ2x1 + φ2x2 = 1.
Exemplo 9.6. Vamos agora encontrar a solução de φ2x1 + φ2x2 = 1
com as condições iniciais (x1 (s), x2 (s), φ(s)) = (cos s, sin s, 1), 0 ≤
t ≤ 2π.
Como vimos antes no parágrafo sobre envoltórias, primeiro deve-
mos encontrar (a(s), b(s)) solução de
1 = z(s) = x1 (s) cos a(s) + x2 (s) sin a(s) + b(s)
= cos s cos a(s) + sin s sin a(s) + b(s) (9.7)
e
∂f ′ ∂f ′
0 = z ′ (s) = x (s) + x (s) = (− cos a(s) sin s + sin a(s) cos s).
∂x1 1 ∂x2
(9.8)
i i
i i
“mec˙New”
i i
2011/10/11
page 193
i i
193
É fácil derivar que a(s) = s, b = 0 são as soluções do sistema

(9.7) e (9.8).
Devemos portanto considerar a famı́lia a um parâmetro s, dada
por
f t (x1 , x2 ) = x1 cos a(s) + x2 sin a(s) + 0 = x1 cos s + x2 sin s.
A envoltória desta famı́lia nos permitirá obter a solução z(x1 , x2 ).

Fixe (x1 , x2 ) ∈ R2 , vamos encontrar quem é s(x1 ,x2 ) que satisfaz
∂f
0= = −x1 sin s + x2 cos s
∂s
e f (x1 , x2 ) = x1 cos s + x2 sin s.
Seja θ e r > 0 tal que x1 = r cos θ e x2 = r sin θ.
Logo
0 = −x1 sin +x2 cos s = −r cos θ sin s + r sin θ cos s = −r sin(s − θ),
implica que
x2
s(x1 ,x2 ) = arctan .
x1
Portanto, u(x1 , x2 ) = x1 cos s(x1 ,x2 ) + x2 sin s(x1 ,x2 ) =
x2 + x2
q
x1 x2
= x1 + x2 = p1 2 2 2 = x21 + x22 .
r r x1 + x2
Sendo assim obtivemos a solução da equação da eikonal com a

condição inicial (q(s), p(s), 1) utilizando o método da solução com-
pleta.
A partir da solução da equação de Hamilton-Jacobi u, sabemos
pela Propriedade Importante que podemos determinar a evolução das
frentes de onda de soluções do sistema mecânico (q(s, t), p(s, t)) a
partir de condições iniciais (q(s), p(s)).
Exemplo 9.7. Seja a matriz

ã c̃
M= ,
c̃ b̃
i i
i i
“mec˙New”
i i
2011/10/11
page 194
i i
positiva definida e que define uma métrica Riemanniana
L = hM v, vi = ãv12 + 2c̃v1 v2 + b̃v22 .
Neste caso, (ver (3.1) na Seção 2, Capı́tulo 3 [L])
1
H(x, p) = hM −1 p, pi
4
é o Hamiltoniano associado ao Lagrangiano L dado pela métrica Ri-
emanniana (com coeficientes ã, b̃, c̃ constantes). Note que 41 M −1
também é positiva definida.
Sendo assim, se S(q, t) é da forma S(q) − t, a equação
∂S ∂S 1
0= + H(x, ∇S) = + hM −1 ∇S, ∇Si =
∂t ∂t 4
r
1 −1 1
−1 + M ∇S, ∇S = −1 + hM −1 ∇S, ∇Si
4 4
vai descrever a evolução de frentes de onda em um meio homogêneo
mas não isotrópico.
Note que H também define uma forma quadrática positiva defi-
nida, pois se M é positiva definida, M −1 também é.
Das equações das caracterı́sticas obtemos que p(t), q(t) são cons-
tantes pois a equação diferencial definida por F não depende de z, x1 , x2 .
Sendo assim o vetor normal às distintas superfı́cies de nı́vel (evo-
luindo no tempo) a partir de um vetor inicial dado é constante.
Se assumirmos por exemplo que

1 −1 1 0
M = ,
4 0 1/4
ou seja que
1/4 0
M= ,
0 1
então a equação de Hamilton-Jacobi associada é
2 2
∂S 1 ∂S
0 = −1 + + .
∂x1 4 ∂x2
i i
i i
“mec˙New”
i i
2011/10/11
page 195
i i
195
p Uma solução de tal equação já foi considerada no exemplo S(x, t) =

x21 + 4x22 − t.
Neste caso um distúrbio inicial no ponto (0,0) vai gerar frentes de
onda com forma de elipses. Um propriedade macroscópica, a forma
da frente de onda, é então determinada por uma propriedade mi-
croscópica.
S descreve a evolução em um meio homogêneo anisotrópico.
Exemplo 9.8. Uma métrica Riemanniana pode ter os coeficientes
a(x1 , x2 ), b(x1 , x2 ), c(x1 , x2 )
dependendo da variável (x1 , x2 ). Considerando L o Lagrangiano as-

sociado à métrica Riemanniana
L = ã(x1 , x2 )p21 + 2c̃(x1 , x2 )p1 p2 + b̃(x1 , x2 )p22 ,
e seu correspondente Hamiltoniano H (ver (3.1) Seção 2, Capı́tulo 3).

Então a equação constitutiva natural ao problema é dado por
∂S
− = H(x, ∇S)
∂t
onde
H(x, p) = H(x1 , x2 , p1 , p2 ) =
1 b̃(x1 , x2 )p21 − 2c̃(x1 , x2 )p1 p2 + ã(x1 , x2 )p22
.
4 ãc̃ − b̃2
Para simplificar a notação, podemos reescrever a expressão acima
considerando
1 b̃ 1 −c̃ 1 ã
a= , c= , b= .
4 ãb̃ − c̃2 4 ãb̃ − c̃2 4 ãb̃ − c̃2
Obtemos assim o Hamiltoniano
H(x, p) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 . (9.9)
Supondo S(x, t) = t − φ(x)

√ temos então a equação de Hamilton-
Jacobi para tal H (ou para H, tanto faz)
1 = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 ,
i i
i i
“mec˙New”
i i
2011/10/11
page 196
i i
onde p1 = φx1 , p2 = φx2 .

Sendo assim a equação constitutiva do meio (ou seja a equação
de Hamilton-Jacobi) determina a equação diferencial parcial 0 =
F (x1 , x2 , φ, p1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 − 1,
onde p1 = φx1 e p2 = φx2 .
Note que F não depende de φ, mas depende neste caso de x1 e
x2 . Sendo assim, as equações das caracterı́sticas não determinarão
mais (como no Exemplo 9.4) que p(t) é constante. Isto se deve à
dependência de H(x, p) em x e em p. A falta de homogeneidade e
isotropia do meio é descrita pela métrica Riemanniana L (ou mais
precisamente pela métrica Riemanniana H). Note que neste caso
não estamos considerando nenhum termo correspondente à energia
potencial. O Hamiltoniano neste caso é dado pelo módulo ao quadra-
dado do vetor velocidade considerando a norma descrita pela métrica
Riemanniana. Lembre que para fins de cálculo do traço das curvas
soluções do sistema (ver Seção 7), tanto faz tomar a raiz quadrada
ou não na expressão do Hamiltoniano acima.
Afirmamos que as geodésicas desta métrica Riemanniana nas co-
ordenadas (q, p) desempenharão o papel das caracterı́sticas, pois a
equação das caracterı́sticas para
0 = F (x1 , x2 , z, p1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 − 1
são
∂F
x′1 (t) = = 2ap1 + 2cp2
∂p1
∂F
x′2 (t) = = 2cp1 + 2bp2
∂p2
∂F
p′1 (t) = −
∂x1
∂F
p′2 (t) = − .
∂x2
e determinam as equações das equações geodésicas. Esta afirmação

foi demonstrada anteriormente para um Hamiltoniano qualquer, isto
é, mostramos que as caracterı́sticas são as trajetórias do sistema Ha-
miltoniano (que no caso em consideração só possui energia cinética).
i i
i i
“mec˙New”
i i
2011/10/11
page 197
i i
197
As geodésicas são portanto as caracterı́sticas da equação diferen-

cial parcial
0 = F (x1 , x2 , z, p1 , p2 ) = a(x1 , x2 )p21 +2c(x1 , x2 )p1 p2 +b(x1 , x2 )p22 −1.
A velocidade da luz é finita e após uma normalização podemos
supor que esta velocidade é igual a 1, sendo assim, fixado um Pponto
inicial q0 onde no tempo 0 se acende a luz, a frente de onda T é o
conjunto dos pontos de plano (x1 , x2 ) que distam T de q0 .
As envoltórias por raios de luz (ou por geodésicas) determinam as
frentes de ondas num cristal conforme Observação anterior.
A conclusão final é que as geodésicas fazem o papel dos raios de
luz e das caracterı́sticas. Esta conclusão traduz fielmente a relação
entre a Mecânica Hamiltoniana e a propagação de frentes de onda.
Note
P que no caso da métrica Riemanniana da esfera, a frente de
onda T emitida a partir de um polo q0 , após um certo tempo T0
irá colapsar no outro polo (ver Figura 3.10 b)).
Este fenômeno, que nem sempre ocorre, é denominado de criação
de cáusticas. Em termos matemáticos dizemos que o aparecimento
das cáusticas está associado à existência de pontos conjugados. Refe-
rimos o leitor a [MC3] para maiores considerações sobre este tópico.
Exercı́cio: No caso da métrica hiperbólica

1 x˙1 2 x˙2 2
+ ,
2 x22 x22
∂L x˙1
o momento p1 = ∂ x˙1 = x22
6= x˙1 . Calcule a equação de Hamilton-
Jacobi associada.
Observação 9.5. Em geral, para um H como acima (9.9), oriundo

de uma métrica Riemanniana
(x′1 , x′2 ) = (2ap1 + 2cp2 , 2cp1 + 2bp2 ). (9.10)
Logo em geral x′ e p′ não são colineares.
No caso da métrica Euclidiana, no entanto, x e p são colineares
(ver Observação 48).
i i
i i
“mec˙New”
i i
2011/10/11
page 198
i i
Observação 9.6. As equações das caracterı́sticas afirmam, no caso

de uma métrica Riemanniana geral, as geodésicas são asPcaracterı́s-
ticas (projetadas em (x1 , ..., xn )). Uma frente de onda t causada
por uma perturbação pontual em q0 é constituı́do pelo conjunto dos
pontos que distam t de q0 .
Note que p é perpendicular à frente de onda, pois ∇S = p, mas o
vetor q̇ não necessariamente (se o meio não for homogêneo e aniso-
trópico) conforme mostra a expressão (9.10) na Observação 9.5 (ver
Figura 8.3).
Em conclusão, podemos afirmar que as considerações feitas ante-

riormentes sobre raios da luz e geodésicas como geradores de frentes
de onda, foi a inspiração para o ponto de vista de Hamilton de ten-
tar analisar a Mecânica Clássica através de um ponto de vista de
perturbação por frentes ondas de um meio contı́nuo.
i i
i i
“mec˙New”
i i
2011/10/11
page 199
i i
Capı́tulo 10
A Equação da Onda
O que chamamos de raio de luz nas seções anteriores, correspondia

a geodésicas de uma métrica Riemanniana. Na verdade, uma carac-
terı́stica importante do raio de luz fı́sico real é o seu caráter ondu-
latório, o qual não foi considerado na nossa análise anterior [Lu].
A luz é um fenômeno eletromagnético, que obedece as equações
de Maxwell (ver [Go]). A partir desta equação, pode se mostrar que
a luz obedece a equação da onda em R3 .
Abstraindo o caráter ondulatório da luz, conseguimos nas seções
anteriores entender o relacionamento da Ação com as frentes de onda
e as geodésicas.
Vamos descrever agora brevemente a luz (por abuso de linguagem
vamos chamar de raio de luz) como uma onda e relacionar o que foi
descrito anteriormente com este novo ponto de vista (ver Observação
10.2 ao fim desta seção).
Referimos o leitor para [Go] para referências gerais sobre o as-
sunto.
Para isto necessitaremos considerar a equação da onda em R3
∂ 2 φ ∂ 2 φ ∂ 2 φ η2 ∂ 2 φ
+ + − 2 2 =0 (10.1)
∂x21 ∂x22 ∂x23 c ∂t
onde η é uma constante.
199
i i
i i
“mec˙New”
i i
2011/10/11
page 200
i i
200 [CAP. 10: A EQUAÇÃO DA ONDA
A solução φ(x1 , x2 , x3 , t) vai descrever a evolução da onda em um

meio com ı́ndice de refração η. O valor c é a velocidade da luz que é
uma constante universal.
Vamos primeiro tentar entender o que representa enfim um raio
de luz no tempo t0 e relacionar tal conceito com a equação acima. O
raio de luz (individualizado) no tempo t0 vai ser representado por
φ(x1 , x2 , x3 ) = φ(x1 , x2 , x3 , t0 ) =
= φ0 ei ( < x , r >− w t0 ) = φ0 ei ( h ( x1 ,x2 ,x3 ) , ( r1 ,r2 ,r3 ) i − w t0 ) , (10.2)

onde φ0 é uma constante, r = (r1 , r2 , r3 ) é um vetor constante e w
a constante que vai determinar a frequência da oscilação temporal.
Existe uma relação entre w e r que será descrita em breve.
Vamos agora tentar explicar ao leitor porque é natural considerar
tal φ para descrever um raio de luz (individualizado).
φ0 determina a amplitude do raio de luz.
O raio de luz “individualizado”descrito acima é tal
X
= { (x1 , x2 , x3 ) | φ(x1 , x2 , x3 , t0 ) = c}
c
t0 , c ∈ R, determina planos perpendiculares à direção (r1 , r2 , r3 ).

Um raio de luz no tempo t0 é portanto descrito por uma série de
planos, por isso é também denominado de uma onda plana.
Note que para um t0 fixo o raio de luz contém uma informação
em todo o espaço de posições R3 (são os vários planos de nı́vel).
O leitor pode observar que qualquer função g(α), onde
α = h(x1 , x2 , x3 ), (r1 , r2 , r3 )i =< x, r >
também determinaria planos como superfı́cies de nı́vel.

Para descrever o raio de luz, assumimos também uma periodi-
cidade espacial (o raio de luz tem um caráter ondulatório) de φ.
Isto explica o termo ei <x,r> na expressão acima para φ. Em vez
de usar senos e cossenos estamos usando a notação complexa para
ei h (x1 ,x2 ,x3 ),(r1 ,r2 ,r3 ) i que é mais compacta. A periodicidade espacial
de φ vai depender do módulo
2π
.
krk
i i
i i
“mec˙New”
i i
2011/10/11
page 201
i i
201
Vamos denominar este valor do perı́odo de fase ótica.

Sendo assim, para t0 fixo, o valor de φ se repete espacialmente na
2π
direção r com perı́odo krk .
Esta periodicidade espacial vai acontecer também de maneira tem-
poral para x fixo quando variarmos t0 . Isto é expresso pelo termo
ei wt0 na expressão φ = φ0 ei(hx,ri−wt) = φ0 eihx,ri e−iwt . Logo para x
fixo, de tempos em tempos (com frequência w) repetem-se os valores
de φ.
Fica assim descrito de maneira geral como devemos entender o
raio de luz individualizado φ(x, t) = φ0 ei(hx,ri−wt) . Para cada w e
r fixos, associamos um raio de luz φ = φr,w . Tal φ = φ(x, t) =
φ0 ei(hx,ri−wt) é uma função que depende de (x, t).
Considere w fixo e uma função f (x) = ft0 (x) que vai descrever
um feixe da raios de luz no tempo t0 .
A variável real α = hx, ri como vimos antes vai determinar uma
periodicidade em eihx,ri = eiα e sendo assim podemos encará-lo como
um gerador de funções f (x) na variável x via Transformada de Fou-
rier. Ou seja f (x) vai ser uma combinação de φr para diferentes r (ou
seja um feixe de raios individualizados de luz φr dado pela expressão
(10.2)). Mais precisamente, dado f (x), considere a transformada de
R
Fourier fˆ(r) tal que f (x) = fˆ(r)(ei<r,x> )dr.
Logo
Z
f (x, t) = f (x) e−i w t = ( fˆ(r)(ei<x,r> )dr)e−iwt =
Z
fˆ(r)ei(<x,r>−wt) dr (10.3)
vai representar um feixe de raios de luz (note que w é constante e

independe de r).
f é determinada pela distribuição (ver [Ju] para definição) fˆ.
O que chamamos de luz é na verdade uma combinação dos raios
de luz individuais (10.2) dados por φ0 ei(α−wt) = φ0 ei(hx,ri−wt) via
transformada de Fourier como acima.
Se fˆ é o Delta de Dirac no ponto r0 com massa φ0 , então
f (x)e−iwt = φ0 ei<x,r0 > e−iwt = φ0 ei(<x,r0 >−wt) .
Recuperamos assim o raio de luz individualizado (10.2).
i i
i i
“mec˙New”
i i
2011/10/11
page 202
i i
O raio individualizado φ0 ei(α−wt) é na verdade uma abstração

do ponto de vista Fı́sico. A luz, quando observada, em geral é um
“pacote”com vários raios de luz individualizados (10.2), como aparece
em (10.3).
Para a correta definição do raio de luz, falta ainda mais uma
restrição. Vai existir uma relação entre krk e w que vai advir da
equação da onda anteriormente apresentada.
Vamos agora relacionar o raio de luz com a equação da onda. O
raio de luz fisicamente observado é também solução da equação da
onda (ver [Go]).
Substituindo o raio de luz “individualizado”φ(x, t) = φ0 ei(hr,xi− w t)
na equação da onda
η2 ∂ 2 φ
∆φ − 2 2 = 0,
c ∂t
η constante, obtemos que φ é solução da equação acima no caso em
que
ηw
krk = . (10.4)
c
Sendo assim, existe uma relação entre a periodicidade espacial krk
e a periodicidade temporal w, determinada pela equação diferencial
parcial acima.
A igualdade (10.4) acima é chamada de relação de dispersão. Fi-
nalmente, com esta relação entre w e r, o raio de luz fica precisamente
bem definido.
Como sabemos, a equação da onda acima descrita (10.1) é linear.
Sendo assim, uma combinação linear f (x)e−w i t de tais funções raio
de luz individualizados φ = φr (via Transformada de Fourier) também
vai ser solução da equação linear da onda
∂ 2 φ ∂ 2 φ ∂ 2 φ η 2 d2 φ
+ + − 2 2 = 0,
∂x21 ∂x22 ∂x23 c dt
η constante.
Fica portanto esclarecido em que sentido φ = f (x)e−i w t (um feixe
de raios de luz) é solução da equação da onda com η fixo.
Vamos agora investigar o caso em que η(x) não é constante, e é
fracamente variável (ver Observação 10.1 a seguir) com a posição x.
A ótica geométrica é o ramo da ciência interesssado em analisar
o caso em que η é fracamente variável com a posição. Uma relação
i i
i i
“mec˙New”
i i
2011/10/11
page 203
i i
203
muito interessante e importante com a equação de Hamilton-Jacobi

vai aparecer.
Considere η(x) uma função no R3 e a equação
dφ2 dφ2 dφ2 η 2 (x) d2 φ

+ + − =0 (10.5)
dx21 dx22 dx23 c2 dt2
A análise que vamos fazer neste caso corresponde aos raios de luz
em um meio não homogêneo.
Uma solução φ para a equação com η variável, não vai mais neste
caso ser uma onda plana. A solução que se busca é da forma
φ = eA(x)+i(S(x) k0 −w t) . (10.6)
w é uma constante, eA(x) vai representar a amplitude, o termo

i S(x) k0
e representa as frentes de onda espaciais (antes quando S era
da forma
S(x) = hx, ri
estas frentes de onda eram planas) e k0 é uma constante. O termo
e−i w t representa a periodicidade temporal. A(x) e S(x) tomam va-
lores reais.
Fica assim descrito de maneira esquemática a informação que nos
traz a expressão do raio de luz φ num meio em que η varia com
posição.
O problema em consideração supõe que no infinito η é constante,
ou seja, que a região em que η(x) depende de x está localizada apenas
em um aberto limitado.
Logo, para pontos x muito distantes, vale que a onda φ(x, t) se
comporta como uma onda plana. Logo, para tais pontos x, a solução
(10.6) deve ser da forma (10.3). Sendo assim, vale também a relação
de dispersão (10.4) mencionada anteriormente.
Neste caso e usando a notação acima, esta relação significa
w2
k02 = . (10.7)
c2
Vamos tentar agora relacionar a teoria descrita acima com a Te-
oria de Hamilton-Jacobi. Em particular desejamos tentar entender
melhor o papel desempenhado por S.
i i
i i
“mec˙New”
i i
2011/10/11
page 204
i i
Ora ∇φ = φ∇(A + ik0 S) e ∆φ = φ[ ∆(A + ik0 S) + k ∇(A +

ik0 S) k2 ].
Esta última expressão é igual a
∆φ = φ[ ∆A + ik0 ∆S + k∇Ak2 − k02 k∇Sk2 + 2ik0 h∇A, ∇Si ].
A equação da onda (usando (10.6)) torna-se então
ik0 [ 2h∇A, ∇Si + ∆S ] φ + [ ∆A + k∇A|k2 − k02 k∇Sk2 + η 2 k02 ] φ = 0.
Como A, S são reais, a equação da onda representa
∆A + k∇Ak2 + k02 ( η 2 − k∇S k2 ) = 0
e
∆S + 2 h∇A, ∇Si = 0.
Logo, se S e A satisfazem tais equações, φ descreve um raio de
luz.
Observação 10.1. Vamos assumir agora que k02 é muito grande em
termos relativos com a parte ∆A + k∇Ak2 . Esta hipótese traduz
em termos matemáticos precisos a afirmação que “η(x) é fracamente
variável com a posição x”feita anteriormente.
Portanto, com esta hipótese,
∆A + k∇Ak2
+ (η 2 − k∇Sk2 ) = 0
k02
significa aproximadamente que η 2 − k∇Sk2 = 0, ou seja, que S sa-

tisfaz a Equação de Hamilton-Jacobi
2 2 2
∂S ∂S ∂S
+ + = η 2 (x). (10.8)
∂x1 ∂x2 ∂x3
Esta equação é a Equação de Hamilton-Jacobi (9.3) para o Ha-

miltoniano
H(q, p) = p21 + p22 + p23 − η 2 (x) + 1. (10.9)
Sendo assim, como vimos antes a função S solução da equação
(10.8) acima, deve corresponder à Ação de um sistema mecânico.
i i
i i
“mec˙New”
i i
2011/10/11
page 205
i i
205
O termo η corresponde a falta de homogeneidade do meio no caso

dos raios de luz num cristal.
Por exemplo, se η é constante igual a 1, a partir de (10.8) determi-
namos que S deve satisfazer a equação de Hamilton-Jacobi autônoma
associada ao Hamiltoniano p21 +p22 +p23 , ou seja a equação da eikonal.
Note que uma vez que se obtém S, a função A satisfazendo
∆S + 2 h∇A, ∇Si = 0,
pode ser facilmente obtida por integração. Desta maneira, com as

hipóteses acima, obtemos a solução
φ = eA(x)+i(S(x) k0 −w t) .
Observação 10.2. O Lagrangiano associado a tal Hamiltoniano

(10.9) é
L(q, p) = 4(p21 + p22 + p23 ) + η 2 (x) − 1.
Pelo Teorema de Mauperitus (Teorema 20, Seção 7, Capı́tulo 2)
o problema mecânico associado a tal Lagrangiano, é equivalente a
considerar um Lagrangiano da forma
L̃(x1 , x2 , x3 , p1 , p2 , p3 ) = hM (x)(p1 , p2 , p3 ), (p1 , p2 , p3 )i,
onde M (x) é uma matriz positiva definida que depende da posição x.

Ou seja, as equações da equação de Hamilton do sistema (10.9) são
geodésicas (a menos de reparametrização do tempo) de uma métrica
Riemanniana L (ver Seção 6, Capı́tulo 2 [L]).
Conclusão: Concluı́mos que o S que aparece na expressão do feixe

da raios de luz φ deve ser aproximadamente igual à solução da equação
de Hamilton-Jacobi para um problema de Mecânica Clássica (se k0
for tomado bem grande). Portanto, S corresponde aproximadamente
a ação de um sistema mecânico. No limite, tomando k0 = ∞, então
S é realmente a ação de um sistema mecânico definido pelo Hamil-
toniano (10.9), como descrito acima. As superfı́cies com S constante
vão representar superfı́cies de fase constante. A Teoria de Hamilton-
Jacobi nos diz então que a Mecânica Clássica corresponde à Ótica
Geométrica (fazendo um limite em que k02 vai a ∞). Este tipo de
resultado é essencial na Teoria semi-clássica da Mecânica Quântica.
i i
i i
“mec˙New”
i i
2011/10/11
page 206
i i
Finalmente, a partir do que foi dito acima, podemos justificar as

considerações das seções anteriores onde afirmamos que o raio de luz
deve ser visto como uma geodésica, na verdade corresponde a supor
que o raio de luz (10.3) que consideramos nesta seção está situado
em um meio em que k02 é muito grande (mais precisamente k0 = ∞).
Essa relação compatibiliza dois pontos de vista que no passado
foram antagônicos: o ponto de vista de Newton que a luz é um raio
corpuscular e o ponto de vista de Hamilton que a luz é na verdade
uma frente de onda.
i i
i i
“mec˙New”
i i
2011/10/11
page 207
i i
Capı́tulo 11
O Método da Fase
Estacionária e suas
Aplicações em Ótica
por Artur Lopes e Marcos Sebastiani
11.1 Introdução
Vamos considerar aqui funções C ∞ definidas em semi-reta reais

e tomando valores complexos F (τ ) : (d, +∞) → C onde d é uma
constante real.
Definição 11.1. H(τ ) é de decrescimento rápido se para todo N vale
que H(τ )τ N → 0 quando τ → ∞ e o mesmo é válido para as deri-
k
vadas de ordem k de H, ou seja para todo N vale que d dτ H(τ ) N
k τ →0,
quando τ → ∞.
Definição 11.2. F (τ ) e G(τ ) tem mesmo comportamento assintótico
se F (τ ) − G(τ ) é de decrescimento rápido e utiliza-se a notação
207
i i
i i
“mec˙New”
i i
2011/10/11
page 208
i i
208 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA
F (τ ) ∼ G(τ )
Duas funções F e G que tem o mesmo comportamento assintótico

são quase que indistinguı́veis para valores de τ grandes.
O τ tem o significado de frequência em Ótica e no Eletromag-
netismo. Estamos interessados então apenas em situações em que a
frequência τ vai a infinito, ou seja, quando ela é muito grande. Neste
contexto, se H(τ ) tem decrescimento rápido, podemos dizer que para
τ grande podemos substituir ela pela função nula (H(τ ) ∼ 0).
Nosso objetivo principal é analisar o assintótico de expressões da
forma Z ∞
F (τ ) = f (x)eiτ φ(x) dx
−∞
quando τ vai para infinito [1], [5], [6], [7] e [8].

Para se ter uma breve idéia da complexidade do problema consi-
dere φ(x) = x: note que neste caso quando τ esta fixo, mas é muito
grande, o termo eiτ x oscila muito com x, ou seja, uma pequena va-
riação de x faz variar bastante eiτ x ; a idéia heurı́stica básica aqui é
que essas oscilações irão produzir cancelamentos e um comportanto
bem definido aparece disto tudo quando τ vai a infinito.
Em Ótica o f (x) representa a amplitude, τ a frequência e o φ(x)
a fase de uma onda que é descrita pela expressão acima [3], [4] e
[8]. O limite quando τ vai a infinito conduz a assim chamada Ótica
Geométrica [2] Section 9-8 .
Vamos assumir em todo o texto que f é de classe C ∞ .
Uma outra importante aplicação do cálculo do assintótico de tais
integrais é no estudo do limite semi-clássico da Mecânica Quântica:
neste caso τ = 1/h e h vai a zero [3], [5] e [2].
Como decorrência natural do que vamos analisar no texto vamos
apresentar brevemente a fundamentação matemática da teoria das
séries não convergentes. H. Poincare foi o primeiro matemático a
introduzir tais séries.
i i
i i
“mec˙New”
i i
2011/10/11
page 209
i i
209
11.2 Fase Estacionária
Proposição 11.1. Seja f ∈ C0∞ (IR), ou seja uma função C ∞ com

suporte compacto, então
Z ∞
F (τ ) = f (x)eiτ x dx
−∞
é de decrescimento rápido.
Demonstração: De fato, segue de propriedades de Séries de Fourier
(apenas integração por partes) que
Z ∞ Z
iτ x −1 ∞ df (x) iτ x
F (τ ) = f (x)e dx = e dx
−∞ iτ −∞ dx
e repetindo a integração por parte n vezes, obtemos
Z ∞ n
−1n d f (x) iτ x
F (τ ) = e dx.
(iτ )n −∞ dn x
n
Então |τ n F (τ )| ≤ (b − a)Maxa≤x≤b d dfn(x)
x , onde o intervalo (a, b)
contém o suporte de f e a, b são constantes reais.
Logo F (τ )τ n é limitada para todo n, portanto
F (τ )τ n−1 tende a zero para todo n quando τ vai a infinito. Re-
sultado análogo vale para as derivadas k-ésimas. Logo, tal F (τ ) tem
decrescimento rápido.
Utilizando o ponto de vista de equivalência ∼, podemos dizer, do
ponto de vista da Definição 11.2 que podemos substituir F (τ ) por 0
para τ grande, ou seja
Z ∞
F (τ ) = f (x)eiτ x dx ∼ 0.
−∞
Vamos agora analisar em geral outros tipos de funções F (τ ), como

por exemplo Z ∞
F (τ ) = f (x)eiτ φ(x) dx
−∞
onde φ(x) é uma função qualquer que supomos doravante analı́tica.
No exemplo anterior φ(x) = x.
É possı́vel mostrar mais geralmente que:
i i
i i
“mec˙New”
i i
2011/10/11
page 210
i i
′
Proposição 11.2. Se φ (x) não tem zeros no suporte de f então
vale que
Z ∞
F (τ ) = f (x)eiτ φ(x) dx ∼ 0.
−∞
′
Demostração: Para cada τ tal que φ (τ ) = 0, podemos escolher um
intervalo aberto Uτ = (τ −ǫ, τ +ǫ) disjunto do suporte de f . Por outro
′
lado, para cada τ tal que φ (τ ) 6= 0 podemos escolher um intervalo
′
aberto Uτ = (τ − ǫ, τ + ǫ) tal que φ (x) 6= 0, ∀x ∈ U¯τ . Tomando
uma partição da unidade subordinada ao recobrimento assim obtido,
basta provar que Z a
f (x)eiτ φ(x) dx ∼ 0,
b
′
quando (a, b) contém o suporte de f e φ (x) 6= 0 em [a, b]. O resultado
segue da proposição 1 pela mudança de coordenadas φ(x) = y.
′ ′′
Se φ (a) = 0, φ (a) 6= 0 dizemos que a é ponto estacionário or-
′ ′′
dinário (é crı́tico não degenerado para φ). Se φ (a) = 0, φ (a) = 0
dizemos que a é ponto de cáustica.
Um caso importante foi estudado por Fresnel, que corresponde a
φ(x) = x2 . Neste caso x = 0 é ponto estacionário ordinário para φ.
Lembre que
Z ∞ Z ∞ √
2 1 2 π
eix τ dx = √ eiy dy = √ eiπ/4
−∞ τ −∞ τ
Desejamos calcular
Z ∞
2
F (τ ) = f (x)eiτ x dx
−∞
Ora
√ Z ∞ Z ∞
π iπ/4 iτ x2 2
F (τ ) − f (0) √ e = f (x)e dx − f (0) eiτ x dx =
τ −∞ −∞
Z R
2
= lim (f (x) − f (0))eiτ x dx.
R→∞ −R
i i
i i
“mec˙New”
i i
2011/10/11
page 211
i i
211
′
c
Seja g(x) tal que f (x) − f (0) = xg(x), onde g ∈ C ∞ (R) e g = x2
para x fora do suporte de f .
Ora
Z R Z R
2 2
(f (x) − f (0))eiτ x dx = xg(x)eiτ x dx =
−R −R
2 Z R
eiτ x g(x) x=R 1 ′ 2
|x=−R − g (x)eiτ x dx.
2iτ 2iτ −R
Se R é grande, g(R) = − fR
(0)
e g(−R) = f R
(0)
.
Decorre daı́ que
Z R Z ∞
2 1 ′ 2
lim (f (x) − f (0))eiτ x dx = − g (x)eiτ x dx.
R→∞ −R 2iτ −∞
Sendo assim,
Z ∞
√ i ′ 2
F (τ ) = eiπ/4 f (0) πτ −1/2 + g (x)eiτ x dx.
2τ −∞
Note que por hipótese de g, para cada τ fixo

Z ∞
i ′ 2
g (x)eiτ x dx
2τ −∞
é uma constante finita; esta integral vai a zero quando τ vai a infinito.
Como τ −1 vai a√zero mais rápido que τ −1/2 Rquando τ vai a infi-
∞ ′ 2
nito, o termo f (0) πτ −1/2 domina o termo 2τi −∞ g (x)eiτ x dx na
convergência a zero de F (τ ) quando τ vai a infinito.
Fazendo o mesmo procedimento m vezes obtemos:
R∞ 2
Proposição 11.3. Para todo m vale que se F (τ ) = −∞ f (x)eiτ x dx,
então
m
X √ f 2k (0) −k−1/2
F (τ ) = eiπ/4 π(i/2)k τ +
(2k)!!
k=0
Z ∞
2
m+1
+(i/(2τ )) h(x)eiτ x dx,
−∞
∞
onde h(x) é uma função em C tal que h(x)x2 é limitada e onde
(2k)!! = 2 4 6...(2(k − 1)) (2k).
i i
i i
“mec˙New”
i i
2011/10/11
page 212
i i
A função h acima é obtida recursivamente seguindo o procedi-

mento do caso m = 1. O termo dominante na convergência a zero da
expressão acima é de ordem τ −1/2 . Podemos afirmar que
√ em primeira
aproximação o termo dominante de F (τ ) é eiπ/4 f (0) πτ −1/2 .
Gostarı́amos de fazer m tender a infinto para se ter então uma
expressão completa de F (τ ) em série, mas este procedimento pode
incorrer em problemas de convergência da série; esta é a razão para
introduzir a seguir o conceito de uma série convergir assintóticamente
a uma função F (τ ).
P∞
Definição 11.3. Dizemos que 0 gk (τ ) converge assintoticamente
a F (τ ) ∈ C se fixados quaisquer r, s, existe M tal que para m fixo,
m≥M
m
dr F (τ ) X dr gk (τ ) s
( r − )τ
d τ dr τ
k=0
é limitada quando τ → ∞.
P∞
Usaremos a notação F (τ ) ∼ 0 gk (τ ) que estende a notação
anterior.
Note que a série acima não converge na maioria dos casos pelo
2k
teorema de E. Borel [8]; os termos f(2k)!!
(0)
podem ser qualquer coisa!!!
A expressão acima, no entanto, faz completo sentido matemático,
se interpretada de acordo com a última definição.
P∞ ′
′
Observamos que por definição F (τ ) ∼ 0 gk (τ )
Usando a notação acima, podemos concluir das considerações an-
teriores que
∞
X √ f 2k (0) −k−1/2
F (τ ) ∼ eiπ/4 π(i/2)k τ (11.1)
(2k)!!
k=0
Quando na definição acima falamos em derivada r-ésima de F
estamos pensando na expressão formal da derivada, ou seja, por e-
xemplo para r = 1 usamos que
Z ∞
2
F ′ (τ ) = ix2 f (x)eiτ x dx
−∞
quando Z ∞
2
F (τ ) = f (x)eiτ x dx.
−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 213
i i
213
Mais geralmente, por indução

Z ∞
2
(j)
F (τ ) = (ix2 )j f (x)eiτ x dx.
−∞
√ 2k
Note que dependendo de f o termo π(i/2)k f(2k)!! (0)
pode ser qual-
quer coisa. De qualquer modo através de (1), no caso φ(x) = x2 , fo-
mos capazes de caracterizar o comportamento assintótico de F para
τ grande.
Vamos apresentar a seguir, a tı́tulo de ilustração, um exemplo
que embora não seja exatamente o caso considerado acima dá a idéia
exata das questões que desejamos analisar aqui.
O caso que vamos apresentar a baixo tem a vantagem de utilizar
apenas resultados elementares de Cálculo Diferencial e Integral.
Considere a função F (τ ) tomando valores reais como função da
variável τ (vamos estar interessados apenas em valores grandes de τ ):
Z ∞ −τ x
e
F (τ ) = dx.
0 1+x
Note que F (τ ) vai a zero quando τ vai a infinito.

Note que a principal diferença do caso acima para o caso anteri-
ormente considerado da fase estácionária (consideramos agora o caso
particular que corresponde na notação anterior a f (x) = 1/(1 + x) e
φ(x) = x), é que consideramos e−τ x e não e−iτ x ; no entanto as idéias
básicas que funcionam num caso funcionam no outro.
Vamos mostrar que tal função F para valores grandes de τ pode
ser aproximada por uma série de potências que tem uma expressão
bem simples:
∞
X (−1)n n!
.
n=0
τ n+1
Observe que tal série não é convergente!!! A utilidade de consi-
derar tal série deriva do seguinte fato: F (2) é mal aproximado por
P∞ (−1)n n!
n=0 2n+1 , mas F (10) (neste caso τ = 10 pode ser considerado
grande) é aproximado com erro percentual de menos de 0, 0006 por
P3 (−1)n n! P∞ (−1)n n!
n=0 10n+1 , ou seja os primeiros três termos de n=0 10n+1 são
P3 (−1)n n!
tais que | n=0 10n+1 − F (10)| ≤ F (10)0, 0006.
i i
i i
“mec˙New”
i i
2011/10/11
page 214
i i
Desejamos enfatizar que estamos dizendo acima que F (τ ) é apro-

P∞ n
ximado por n=0 (−1) n!
τ n+1 apenas para valores grandes de τ !!!
A seguinte definição para F tomando valores reais é análoga a
anteriormente considerada para F tomando valores complexos.
P∞
Definição 11.4. Dizemos que 0 gk (τ ) converge assintoticamente
a F (τ ) ∈ R, quando τ vai a infinito, se fixados quaisquer r, s, existe
M tal que para m fixo, m ≥ M
m
dr F (τ ) X dr gk (τ ) s
| − |τ
dr τ dr τ
k=0
é limitada quando τ → ∞.
Neste caso dizemos que
∞
X
F (τ ) ∼ gn (τ ).
n=0
P∞Existe numa diferença fundamental entre séries convergentes

P∞ n=0 an τ = G(τ ) e séries assintóticas, quando τ vai a infinito,
n
n=0 an τ ∼ F (τ ). PN
No primeiro caso, dado ǫ e τ , existe N tal que | n=0 an τ n −
G(τ )| < ǫ, enquanto no segundo caso, dado ǫ e N existe K > 0 tal
PN
que | n=0 an τ n −F (τ )| < ǫτ −N para τ > K. Note que o K depende
de ǫ e N ; estamos considerando na aproximação um erro percentual
que leva em conta a grandeza do valor de τ utilizado.
Sendo assim, o que ocorre de fato no caso nas séries assintóticas,
é que para τ fixo a proximação é boa para N pequeno, mas fica ruim
para N de ordem maior que τ .
n
No nosso caso gn (τ ) = (−1) n!
τ n+1 e afirmamos que
∞
X (−1)n n!
F (τ ) ∼ ,
n=0
τ n+1
Vamos elaborar um pouco sobre o sentido do ∼; mais exatamente

vamos considerar a questão apenas para r = 0.
Ora,
1 − (−1)N xN
= 1 − x + x2 − · · · + (−1)N −1 xN −1 ,
1+x
i i
i i
“mec˙New”
i i
2011/10/11
page 215
i i
215
portanto, para todo x

N −1
1 X (−1)N xN
= (−1)n xn + .
1+x 0
1+x
Usando a expansão acima na forma integral de F obtemos
N −1 Z ∞
X (−1)n n! e−τ x xN
F (τ ) = + (−1)N dx.
n=0
τ n+1 0 1+x
Note que a parte esquerda do somatório acima coincide com os
P∞ n
primeiros N termos de n=0 (−1)τ
n!
n+1 , sendo assim o erro na aproxi-
P∞ (−1)n n!
mação de F por n=0 τ n+1 é
Z ∞ −τ x N
N e x
EN (τ ) = (−1) dx,
0 1 + x
logo
Z ∞ Z ∞
e−τ x xN e−τ x xN N!
|EN (τ )| = dx < dx = N +1 ,
0 1+x 0 1 τ
Visto de outro modo

N −1
X (−1)n n! N +1
|F (τ ) − |τ ≤ N!
n=0
τ n+1
e N ! é uma constante.
Sendo assim, na Definição 11.4, dado s = N + 1 devemos escolher
M = N . Note que para s = N + 1 fixado, a constante N ! é muito
grande (se N é grande) mas fixa.
Acreditamos que com o exemplo acima ficou claro o sentido da
afirmação
∞
X (−1)n n!
F (τ ) ∼ ,
n=0
τ n+1
i i
i i
“mec˙New”
i i
2011/10/11
page 216
i i
11.3 Fase não degenerada
Voltamos agora a considerar o caso em que F toma valores com-

plexos.
Vamos considerar agora o caso em que φ(x) possui vários pon-
tos crı́ticos isolados p1 , p2 , .... Sejam Vi respectivamente vizinhanças
disjuntas dos pontos pi .
Considere Um coleção de abertos tal que ∪m,i Um ∪ Vi = R, tal
que pi não está em nenhum Um e ainda que a cobertura de R seja
localmente finita.
Seja θm , ǫi uma partição da unidade subordinada a partição. Es-
tamos usando a notação que θm tem suporte em Um e ǫi tem suporte
em Vi .
Sendo assim
XZ ∞ XZ ∞
F (τ ) = θm (x)f (x)eiτ φ(x) dx + ǫm (x)f (x)eiτ φ(x) dx.
m −∞ m −∞
Observamos que ambas as somas são finitas e que basta pela Pro-
posição 11.2 examinar
XZ ∞
ǫm (x)f (x)eiτ φ(x) dx.
m −∞
ou seja, basta examinar individualmente

Z ∞
H(τ ) = f (x)eiτ φ(x) dx
−∞
quando o suporte de f está em um intervalo (−δ, δ) e 0 é ponto crı́tico

isolado de φ (podemos transladar o problema e colocar o ponto crı́tico
no ponto 0).
No caso em que 0 é não degenerado φ′ (0) = 0, φ′′ (0) 6= 0), existe
uma mudança de coordenadas local x = x(y) tal que φ(x(y)) = y 2 .
Neste caso recaı́mos na Proposição 11.3, pois
Z ∞ Z ∞
2
iτ φ(x)
H(τ ) = f (x)e dx = f (x(y))eiτ y x′ (y)dy
−∞ −∞
Z ∞ (11.1)
iτ y 2
= g(y)e dy.
−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 217
i i
217
Vamos considerar com mais detalhe agora o caso em que todos

os pontos crı́ticos de φ são não-degenerados. Neste caso, temos que
escolher com mais cuidado os intervalos abertos Um , Vj .
É claro que φ(x) − φ(pj ) = (x − pj ))2 ψj (x), onde ψj é analı́tica e
ψj (pj ) = 12 φ′′ (pj ). Seja µj = sgnφ′′ (pj ). Definimos a nova variável
q
y = (x − pj ) µj ψj (x)
na vizinhança de pj . Temos
dy
(pj ) > 0.
dx
Tomamos Vj = (pj − δj , pj + δj ) tal que seja válida a mudança de
variável neste intervalo. Depois escolhemos os Um tais que

δj δj
Um ∩ pj − , pj +
2 2
seja vazio para todos m e j. Nestas condições:
Z +∞ Z pj +δj
ǫj (x)f (x)eiτ φ(x) dx = ǫj (x)f (x)eiτ φ(x) dx =
−∞ pj −δj
Z pj +δj
= eiτ φ(pj ) ǫj (x)f (x)eiτ (φ(x)−φ(pj )) dx =
pj −δj
Z y(pj +δj )
2 dx
= eiτ φ(pj ) ǫj (x(y))f (x(y))eiµj τ y dy =
y(pj −δj ) dy
Z +∞
dx iµj τ y2
= eiτ φ(pj ) ǫj (x(y))f (x(y)) e dy,
−∞ dy
onde ǫj (x(y)) = 1 na vizinhança de 0. Seja:

2k dx
d f (x(y)) dy
cjk = (0).
dy 2k
i i
i i
“mec˙New”
i i
2011/10/11
page 218
i i
Observamos que os cjk podem ser efetivamente calculados porque

as derivadas de x(y)
p calculam-se derivando sucessivamente a identi-
dade y = (x − pj ) µj ψj (x) respeito de y.
1o ′′
¯ caso) φ (pj ) > 0. Neste caso, µj = 1. Pelo visto antes,
Z +∞ +∞ k
dx iτ y2 √ iπ X i cjk −k− 1
ǫj (x(y))f (x(y)) e dy ∼ πe 4 τ 2.
−∞ dy 2 (2k)!!
k=0
2o ′′
¯ caso) φ (pj ) < 0. Neste caso, µj = −1. Observemos que:
Z +∞ Z +∞
−iτ y 2
g(y)e dy = ḡ(y)eiτ y2 dy
−∞ −∞
para toda g ∈ C0∞ (IR). Então,

Z +∞ +∞ k
dx −iτ y2 √ π
X i cjk −k− 1
ǫj (x(y))f (x(y)) e dy ∼ πe−i 4 − τ 2.
−∞ dy 2 (2k)!!
k=0
Finalmente, Z +∞
f (x)eiτ φ(x) dx ∼
−∞
+∞ k
" # 1
√ X i iπ
X
iτ φ(pj ) k −i π
X
iτ φ(pj ) τ −k− 2
∼ π e 4 e cjk +(−1) e 4 e cjk .
2 ′′ ′′
(2k)!!
k=0 φ (pj )>0 φ (pj )<0
Por definição
−1 √
dx dy f (pj ) 2f (pj )
cj0 = f (pj ) (0) = f (pj ) (pj ) =p =p .
dy dx µj ψj (pj ) |φ′′ (pj )|
Logo, da anterior resulta:

Z +∞
f (x)eiτ φ(x) dx =
−∞
" π π
#
√ X ei(τ φ(pj )+ 4 ) √ X ei(τ φ(pj )− 4 ) − 1
= 2π f (pj ) p + 2π f (pj ) p τ 2 +0(τ −1 )
|φ ′′ (p )| |φ ′′ (p )|
φ′′ (pj )>0 j φ′′ (p )<0 j
j
i i
i i
“mec˙New”
i i
2011/10/11
page 219
i i
219
para τ → +∞.
Fica então determinado o termo dominante de F (τ ) como o termo
1
a esquerda da última linha (vai a zero como τ − 2 ).
11.4 Aplicação às integrais de Airy generalizadas
Seja
Z +∞
F (τ ) = eiτ φ(x) dx
−∞
onde φ(x) é um polinômio, a coeficientes reais, do qual todos os pon-

tos crı́ticos são não degenerados e cujo grau é n ≥ 2.
Lema 11.1. A integral precedente converge para todo τ ∈ IR, τ > 0

e define uma função C ∞ de τ em (0, +∞).
Seja I um intervalo que contém no seu interior todas as raı́zes de

φ(x), φ′ (x) e φ′′ (x). Seja f ∈ C0∞ (IR) tal que f (x) = 1 se x ∈ I. Seja
g(x) = 1 − f (x).
Então
Z +∞ Z +∞ Z +∞
iτ φ(x) iτ φ(x)
e dx = f (x)e dx + g(x)eiτ φ(x) dx.
−∞ −∞ −∞
Como f tem suporte compacto o Lema 11.1 segue imediatamente

do lema seguinte, que provaremos depois.
Lema 11.2. Z +∞
g(x)eiτ φ(x) dx,
−∞
τ > 0, converge e define uma função C ∞ de τ que tem decrescimento

rápido para τ → +∞.
O Lema 11.2 nos diz também, que para ter o desenvolvimento

assintótico de F (τ ) basta ter o de
Z +∞
f (x)eiτ φ(x) dx.
−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 220
i i
Mas este último se calcula como antes, observando ainda que f = 1

na vizinhança de cada ponto crı́tico de φ.
Vamos aplicar o anterior à função de Airy
Z +∞
1 1 3
Ai(t) = cos ω + tω dω
2π −∞ 3
e estudar seu comportamento para t → ±∞.

Consideremos primeiro para t → −∞.
Então consideramos, para t → +∞, a função:
Z +∞
1 1 3
G(t) = Ai(−t) = cos ω − tω dω.
2π −∞ 3
2
Mudando de variável: t = τ 3 obtemos
Z +∞
2 1 1 3 2
F (τ ) = G(τ 3 ) = cos ω − τ 3 ω dω.
2π −∞ 3
1
Mudemos agora a variável de integração: ω = τ 3 (1 + x):
1 Z +∞
τ3 1
F (τ ) = τ (1 + x)3 − τ (1 + x) dx
cos
2π −∞ 3
1 Z +∞
τ3 1 3 2 2
= cos x +x − τ dx.
2π −∞ 3 3
Logo,
1 Z +∞ iτ 1 3 2 2
τ 3 3 x +x − 3
F (τ ) = Re e dx
2π −∞
e estamos no caso anterior com:

1 3 2
φ(x) = x + x2 − .
3 3
Os pontos crı́ticos são p1 = −2 e p2 = 0. Temos que:
2 2
φ(p1 ) = , φ′′ (p1 ) = −2, φ(p2 ) = − , φ′′ (p2 ) = 2.
3 3
i i
i i
“mec˙New”
i i
2011/10/11
page 221
i i
221
Obtemos:

2 π 2 π
" i − 3 τ + 4 i 3 τ − 4 ! #
1
τ3 √ e √ e 1
F (τ ) = Re 2π √ + 2π √ τ − 2 + 0(τ −1 )
2π 2 2

1 1 2 π 2
= π − 2 τ − 6 cos τ− + 0(τ − 3 )
3 4
Logo,
− 12 − 41 2 3 π
G(t) = π t cos t2 − + 0(t−1 )
3 4
resultado que melhora o de Olver página 103 mas que resulta também
de Olver página 392.
O mesmo método aplicado a Ai(t) para t → +∞ mostra que
Ai(t) ∼ 0 para t → +∞.
Prova do Lema 11.2. Vamos notar Ck∞ (IR) os espaço das funções
C ∞ f : IR → C
I tais que, para todo j = 0, 1, · · · , vale
dj f
= 0(|x|−k )
dxj
para x → ±∞.
Por exemplo, se f ∈ C ∞ (IR) e se existe K > 0 tal que
p(x)
f (x) =
q(x)
se |x| ≥ |K|, onde p, q são polinômios e (grau q-grau p) ≥ k, então

f ∈ Ck∞ (IR).
Além disso, se f ∈ Ck∞ ((IR) e p(x) é um polinômio de grau m ≤ k
∞
então p(x)f (x) ∈ Ck−m ((IR).
Afirmação: Para cada k = 1, 2, 3, · · · existe h ∈ Ck∞ (IR) tal que
Z +∞ Z +∞
g(x)eiτ φ(x) dx = µ(τ ) h(x)eiτ φ(x) dx
−∞ −∞
(τ > 0) onde µ(τ ) = cte.τ −r com r ≥ k.
i i
i i
“mec˙New”
i i
2011/10/11
page 222
i i
Com efeito,
Z +∞ Z
1 +∞ g(x) iτ φ(x)
g(x)eiτ φ(x) dx = e iτ φ′ (x)dx
−∞ iτ −∞ φ′ (x)
g(x)
∈ C ∞ (IR)
φ′ (x)
!
′
porque g é nula sobre um aberto que contém os zeros de φ . Logo,
Z +∞ +∞ Z
1 g(x) iτ φ(x) i +∞
g(x)eiτ φ(x) dx = e + g1 (x)eiτ φ(x) dx
−∞ iτ φ′ (x) −∞ τ −∞
onde
p(x)
g1 (x) =
q(x)
para |x| bastante grande, com p, q polinômios e grau q-grau p = n
(lembremos que (g(x) = 1 para |x| bastante grande). Logo, como
g(x) = 1 para |x| bastante grande e grau φ′ ≥ 1,
Z +∞ Z
i +∞
g(x)eiτ φ(x) dx = g1 (x)eiτ φ(x) dx
−∞ τ −∞
onde g1 (x) ∈ Cn∞ (IR). Iterando este procedimento, decorre a afirmação.
Da afirmação com k = 2, já resulta que
Z +∞
g(x)eiτ φ(x) dx
−∞
é convergente e define G : (0; +∞) → C. I

Seja dado m(= 0, 1, 2, ...). Tomamos k > mn + 2. Pela afirmação:
Z +∞
G(τ ) = µ(τ ) h(x)eiτ φ(x) dx
−∞
onde a integral converge absolutamente, junto com todas as suas

derivadas respeito de τ até a ordem m. Como µ(τ ) = constante τ −r
com r ≥ k, decorre daı́ que G(τ ) é derivável até a ordem m e
dj G
= 0(τ −k )
dj τ
i i
i i
“mec˙New”
i i
2011/10/11
page 223
i i
223
para 0 ≤ j ≤ m. Como m é arbitrário, G ∈ C ∞ (0, +∞) e G ∼ 0.
11.5 Fase com Pontos de Cáustica
O anterior dá conta do caso em que os pontos crı́ticos são não

degenerados.
Supondo, por outro lado, que o ponto crı́tico seja degenerado
(cáustica), existe uma mudança de coordenadas local tal que φ(x(y)) =
y m , m ≥ 3.
Vamos portanto analisar o caso φ(x) = xm , m ≥ 3 (o caso φ(x) =
−xm é obtido a partir deste por conjugação).
Vamos assumir inicialmente, para simplificar, que f possa ser es-
crito como f (x) = xk g(x), onde g é constante igual a 1 numa vizi-
nhança de 0.
Como φ(x) = xm , m ≥ 3, temos então para cada k fixo que que
Z ∞ Z ∞
m m
Fk (τ ) = xk g(x)eiτ x dx = f (x)eiτ x dx
−∞ −∞
satisfaz
Z ∞ Z ∞
iτ xm m
Fk′ (τ ) m
= ix f (x)e dx = 1/(mτ ) (xf (x)) (ixm−1 mτ eiτ x )dx.
−∞ −∞
Integrando por partes,

Z ∞
m
Fk′ (τ ) = −1/(mτ ) (xf (x))′ eiτ x dx =
−∞
Z ∞ Z ∞
m m
−1/(mτ ) f (x)eiτ x dx − 1/(mτ ) xf ′ (x) eiτ x dx =
−∞ −∞
Z ∞
m
−1/(mτ )Fk (τ ) − 1/(mτ ) xf ′ (x) eiτ x dx.
−∞
Ou seja,
Z ∞
m
mτ Fk′ (τ ) + Fk (τ ) = − xf ′ (x) eiτ x dx.
−∞
i i
i i
“mec˙New”
i i
2011/10/11
page 224
i i
Ora,
xf ′ (x) = kxk g(x) + xk+1 g ′ (x) = kf (x) + xk+1 g ′ (x).
Como 0 não está no suporte de g ′ (x), a Proposição 11.2 nos diz

finalmente que mτ Fk′ (τ ) + (k + 1)Fk (τ ) é de decrescimento rápido.
Como Fk está ı́mplicito na últimaRequação, não sabemos ainda
∞ m
determinar o assintótico de Fk (τ ) = −∞ xk g(x)eiτ x dx, onde g é
constante igual a 1 numa vizinhança de 0, mas sabemos que satisfaz
mτ Fk′ (τ )+ (k + 1)Fk (τ ) ∼ 0. Vamos a seguir determinar o assintótico
de Fk (τ ), mas antes precisamos uma definição que vai contemplar a
possibilidade de termos o conceito de uma série não convergente ser
solução de uma equação diferencial (no sentido assintótico).
Definição 11.5. Sejam p0 (τ ), p1 (τ ), .., pn (τ ) polinômios. Dizemos
que a função C ∞ , y(τ ), é solução da equação diferencial assintótica
linear
dn y(τ ) dy(τ )
pn (τ ) n
+ ... + p1 (τ ) + p0 (τ )y(τ ) ∼ 0,
dτ dτ
se
n
X dj y(τ )
pj (τ )
j=0
dτ j
é de decrescimento rápido.
A partir da definição acima note que as considerações feitas ante-
riormente mostram que Fk (τ ) é solução de
dy(τ )
mτ + (k + 1)y(τ ) ∼ 0,
dτ
ou equivalentemente
dy(τ )
mτ + (k + 1)y(τ ) = b(τ )
dτ
onde b(τ ) é de decrescimento rápido.
Uma solução particular da equação acima é
Z
−1 −(k+1)/m ∞ (k+1−m)/m
y(τ ) = τ x b(x)dx
m τ
i i
i i
“mec˙New”
i i
2011/10/11
page 225
i i
225
que é de decrescimento rápido.

A solução geral é cτ −(k+1)/m + y(τ ).
Decorre daı́ que existe constante ck tal que Fk (τ ) é assintotica-
mente equivalente a
ck τ −(k+1)/m . (11.2)
Concluı́mos portanto a análise do assintótico de
Z ∞
m
Fk (τ ) = xk g(x)eiτ x dx
−∞
no caso em que g é constante igual a 1 numa vizinhança de 0. O valor

das constantes ck devem ser determinados em cada caso.
Vamos agora analisar o caso um pouco mais geral de f (x) =
xk g(x) (sem hipóteses sobre g) com g qualquer em C0∞ , mas para
isto precisamos antes da seguinte:
Proposição 11.4. Dado g ∈ C0∞ e N ≥ 0 existe K ≥ 0 tal que

Z ∞ Z ∞
dj m dj m
τN xk g(x)eiτ x dx = τ N f (x)eiτ x dx
dτ j −∞ dτ j −∞
é limitada para τ → ∞ e para todo j se k ≥ K.
Demonstração: Se k ≥ m, integrando por partes temos

Z ∞ Z ∞
m m
xk g(x)eiτ x dx = 1/(miτ ) xk−m+1 g(x)iτ mxm−1 eiτ x dx =
−∞ −∞
Z ∞
m
−1/(miτ ) (xk−m+1 g(x))′ eiτ x dx
−∞
k−m+1 ′ k−m
e (x g(x)) = x h(x) onde h(x) está em C0∞ , o que permite
iterar o cálculo. O resultado segue de derivar a expressão várias
vezes.
O caso em que φ(x) é analı́tica (não só da forma xm ) é obtido

a partir da proposição 4 e através de mudança
R ∞ de variável como em
(2) acima. Isto dá conta do caso F (τ ) = −∞ xk g(x)eiτ φ(x) dx com
g ∈ C0∞ .
i i
i i
“mec˙New”
i i
2011/10/11
page 226
i i
Vamos agora, finalmente, analisar o caso maisRgeral de um f (x)

∞
qualquer e φ(x) analı́tica, isto é, o caso F (τ ) = −∞ f (x)eiτ φ(x) dx
com f ∈ C0∞ .
Escreva
f (x) = a0 + a1 x + a2 x2 + ... + ak−1 xk−1 + xk g(x)
onde g ∈ C0∞ .
Podemos substituir na análise f (x) por f (x)h(x) onde h(x) tem
suporte em uma pequena vizinhança de 0 (usando uma partição da
unidade) ou seja, basta analisar o assintótico de
Z ∞
F (τ ) = h(x)(a0 +a1 x+a2 x2 +...+ak−1 xk−1 +xk g(x))eiτ φ(x) dx =
−∞
Z ∞
(h(x)a0 +h(x)a1 x+h(x)a2 x2+...+h(x)ak−1 xk−1+xkh(x)g(x))eiτ φ(x)dx.
−∞
Para o assintótico dos primeiros termos usamos (3) e para o termo

Z ∞
xk h(x)g(x)eiτ φ(x) dx
−∞
usamos a Proposição 11.4. R∞

Resulta portanto que para F (τ ) = −∞ f (x)eiτ φ(x) dx com f ∈
C0∞ . existe desenvolvimento assintótico da forma
∞
X
F (τ ) = ck τ −(k+1)/m .
k=0
O primeiro valor ck não nulo do desenvolvimento acima, carac-

teriza o termo principal de decaimento de F (τ ) quanto τ → ∞, ou
seja ck τ −(k+1)/m é o termo principal do ponto de vista assintótico.
O valor de tal k é denominado de expoente inicial ou invariante de
Malgrange. Referimos o leitor para [8] onde são apresentadas consi-
derações gerais sobre tal invariante.
O texto acima ilustra de maneira breve a fundamentação matemá-
tica da teoria das séries de potências não convergentes e sua relação
com as integrais oscilantes e ótica.
i i
i i
“mec˙New”
i i
2011/10/11
page 227
i i
Capı́tulo 12
Apêndice - Aplicação de
Primeiro Retorno para
Ordinárias
Considere uma equação diferencial ordinária x′ = f (x) definida para

x num aberto A em que f é de classe C 1 . Vamos supor que as soluções
x(t) estão sempre definidas para todo t real. Por definição, para t fixo,
φt (x) = y quando a solução x(t) de x′ (t) = f (x(t)), x(0) = x é tal
que x(t) = y.
Podemos considerar então o fluxo φt : A → A, para todo t real.
φt é um difeomorfismo de A em A.
Recomendamos o leitor a [DL] e [So] para resultados gerais sobre
equações diferenciais ordinárias e sistemas Hamiltonianos.
Uma solução x(t) de x′ = f (x) é dita periódica se existe t > 0 tal
que x(t) = x(0), ou seja φt (x) = x. Fica assim determinada a órbita
periódica γ = {φs (x)|s ∈ [0, t)}.
Uma seção local de x, é um conjunto V obtido pela interseção de
um hiperplano de dimensão n − 1 V ⊂ Rn (um espaço afim n − 1
227
i i
i i
“mec˙New”
i i
2011/10/11
page 228
i i
228 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO
Figura 12.1:
dimensional) passando por x, com uma vizinhança U ⊂ Rn de x

(V = H ∩ U ), tal que f (y) 6∈ H (colocando a origem do vetor no
ponto y, conforme figuras 12 e 13), ∀y ∈ V = H ∩ U .
Observação 12.1. Se V seção local em x, então os vetores f (y) 6= 0

para todo y em V .
Seja γ uma órbita periódica de perı́odo t0 e V = H ∩ U seção

local passando por x ∈ γ. Podemos definir a aplicação T de V em
H, que associa v ∈ V a y = T (v) tal que y é o menor valor t > 0,
tal que φt (v) ∈ H. Note que T (x) = x = φt0 (x). Logo como φt (x) é
contı́nuo em t e em x então T está bem definido para V seção local
pequena passando por x (ver Figuras 29 e 30).
Se T (x) = x dizemos que x é ponto fixo de T .
A aplicação T é denominada de aplicação de primeiro retorno da
seção local V . A aplicação de primeiro retorno permite analisar o
comportamento das órbitas vizinhas de γ.
Note que os tempos de primeiro retorno de pontos em x(t) (de-
finido γ) e de outras soluções y(t) próximas (começando na seção
i i
i i
“mec˙New”
i i
2011/10/11
page 229
i i
229
Figura 12.2:
V ) não são os mesmos (apenas aproximadamente os mesmos pela

continuidade do fluxo)
De fato, por exemplo se T (v) = v para todo v ∈ V , concluı́mos
′
que todas as órbitas de x = f (x) que passam por V são periódica.
Vamos supor definida uma aplicação diferenciável z(u) = v defi-
nida num aberto u ∈ Ṽ ⊂ Rn−1 bijetiva sobre v ∈ V ⊂ Rn . Assim,
podemos expressar T nas novas coordenadas u como T̃ : Ṽ → Ṽ
como T̃ (u) = z −1 ( T (z(u)) ). Podemos supor sem perda de generali-
dade que z(0) = x. Quando falarmos da ação de T em V , estaremos
na verdade falando da ação de T̃ em Ṽ e quando falarmos em x
estaremos nos reportando ao u = 0.
Nas Figuras 12.1 e 12.2 mostramos um exemplo em que o campo
de vetores está definido no plano e portanto H tem dimensão 1.
A razão para tudo isto é que podemos falar agora na derivada
DT (v) da função T . Para sermos absolutamente precisos deverı́amos
i i
i i
“mec˙New”
i i
2011/10/11
page 230
i i
Figura 12.3:
falar da derivada DT̃ (u) de Rn−1 mas módulo a identificação acima

não vamos mais a partir de agora destacar tal diferença.
Na Figura 12.4 as órbitas em torno de γ tem uma tendência a se
afastarem de γ.
Note na Figura 12.3 que as órbitas em torno de γ tem uma
tendência a se aproximarem de γ.
Por sua vez, na Figura 12.5 as órbitas em torno de γ tem uma
tendência a se afastarem de γ por uma lado e a se aproximarem de
γ por outro lado.
Este comportamento é capturado pela aplicação de primeiro re-
torno T . A Figura 12.6 ilustra a aplicação de primeiro das equações
diferenciais que tem como espaço de fase respectivamente as Figuras
12.3, 12.4 e 12.5.
Note a posição do gráfico de T em relação a diagonal ∆ na Figura
12.6.
i i
i i
“mec˙New”
i i
2011/10/11
page 231
i i
231
Figura 12.4:
O ponto fundamental é que não pode ocorrer o que aparece na

Figura 12.7, pois os vetores f (x) sempre apontam para o mesmo lado
(ver Figura 12.8).
Definição 12.1. Se a derivada DT (x) da aplicação de primeiro re-
torno T (associada ao ponto fixo x) definida na seção local V da
órbita γ tiver todas as raı́zes do polinômio caracterı́stico com módulo
menor que 1, então a trajetória γ é chamada de órbita periódica atra-
tora.
Teorema 12.1. Se x é tal que a derivada DT (x) da aplicação de
primeiro retorno T (associada ao ponto fixo x) definida na seção
local V da órbita γ tiver todas as raı́zes do polinômio caracterı́stico
com módulo menor que 1, então a iteração T n (v) = xn de um ponto
v ∈ H converge ao ponto fixo x quando n vai a infinito.
Demonstração: Como o fluxo é de classe C 1 (pois o campo é de
classe C 1 ) pode-se mostrar que a matriz derivada DT (v) varia conti-
nuamente com v ∈ V . Desta maneira, para uma vizinhança pequena
B de V , |DT (v)| < c < 1 para todo v ∈ B. Logo pela desigualdade
do valor médio (ver [Li1]) |T (x)−T (v)| < c|x−v| (T é uma contração
i i
i i
“mec˙New”
i i
2011/10/11
page 232
i i
Figura 12.5:
Figura 12.6:
i i
i i
“mec˙New”
i i
2011/10/11
page 233
i i
233
Figura 12.7: A figura descrita acima não pode ocorrer de Γ é uma

seção transversal
quando definida numa pequena vizinhança M de x conforme definição

que aparece no Capı́tulo 3). Sendo assim, como T n (x) = x, por
indução |x − T n (v)| < cn |x − v| e concluı́mos que T n (v) → x quando
n → ∞.
No caso f bidimensional e portanto T unidimensional a condição
′
acima significa apenas que |T (x)| < 1. Neste caso, as órbitas das
soluções da equação diferencial que cortam V se aproximam de γ
conforme o teorema acima.
O papel dos autovalores da matriz DT da aplicação de primeiro
retorno T (associada a uma órbita periódica) serem em módulo menor
que 1 desempenha um papel análogo ao dos autovalores da derivada
DF do campo de vetores F no caso de pontos de equilı́brio.
Se todos autovalores de DT tem módulo menor que 1 então pode-
mos dizer que γ se comporta assim como uma espécie de “poço” (em
analogia com pontos de equilı́brio tipo poço) atraindo as trajetórias
(com tempo crescente) com condições iniciais em um aberto próximo
i i
i i
“mec˙New”
i i
2011/10/11
page 234
i i
de si. Tal γ é um exemplo do que se chama um atrator periódico em

equações diferenciais.
Definição 12.2. Se a derivada DT (x) de T em x (ponto fixo de
T ) tiver todas raı́zes do polinômio caracterı́stico maiores que 1, a
trajetória γ é chamada de órbita periódica repulsora.
No caso unidimensional a condição acima significa apenas que
′
|T (x)| > 1.
Nesse caso, as órbitas das soluções da equação diferencial que
cortam V se afastam de γ. Podemos dizer que γ se comporta como
uma espécie de ”fonte”(em analogia com pontos de equilı́brio tipo
fonte) repelindo (com o tempo crescente) as trajetórias com condições
iniciais próximas de si. Tal γ é um exemplo do que se chama um
repulsor em equações diferenciais.
O papel da seção local é basicamente discretizar o tempo. A
dinâmica de φt (x) em tôrno de γ pode ser analisada pela dinâmica
de T n (v) na seção local.
Note por exemplo que apenas partir do gráfico T do último caso
da 12.5 podemos deduzir que neste caso as trajetórias das soluções
perto de γ se aproximam por um lado e se afastam pelo outro. Tudo
isto segue apenas da análise da seção local e da aplicação de primeiro
retorno. Note que neste caso T ′ (x) = 1.
Se o fluxo preserva área então não pode ocorrer nem 12.4 nem
12.3.
Outra maneira de discretizar o tempo é considerar φ1 (y) = F (y).
F como vimos é um difeomorfismo e podemos obter várias proprie-
dades de φt (x) através dos iterados F n (x) = φn1 (x) = φn (x).
Este ponto de vista de analisar a dinâmica de uma equação dife-
rencial através de uma seção local T ou de um difeomorfismo F , tem
produzido uma série de resultados importantes na Teoria dos Sistema
Dinâmicos. O tempo torna-se uma variável discreta e não contı́nua.
A hipótese de os autovalores da aplicação de primeiro retorno T
em x terem todos módulo menor que 1 desempenha no caso de órbitas
periódicas uma papel análogo a hipótese de todos os autovalores de
Df (x0 ) terem parte real negativa quando x0 é de equilı́brio.
Antes de prosseguirmos desejamos enfatizar que numa seção trans-
versal Γ local os vetores f (v) (com v ∈ Γ) apontam todos sempre
para um mesmo lado. Sendo assim as trajetórias soluções x(t) da
i i
i i
“mec˙New”
i i
2011/10/11
page 235
i i
235
Figura 12.8:
equação diferencial x′ = f (x) que batem na seção Γ entram sempre

pelo mesmo lado e saem pelo outro. Mais exatamente, “não” pode
ocorrer algo do tipo descrito pela Figura 35.
A Figura 12.13 descreve o que deve ocorrer em duas batidas sub-
sequentes numa seção transversal T da trajetória x(t) solução da
equação diferencial.
Podemos considerar a partir de um Hamiltoniano H(p, q) definido
em R2n tomando valores reais a equação de Hamilton (Definição 3,
Capı́tulo 3 [L]). Obtemos assim uma EDO em R2 n . Os conceitos
descritos acima podem ser aplicados neste caso.
Vamos agora descrever brevemente como pode ser rico o compor-
tamento dinâmico das trajetórias do fluxo de uma equação diferencial
autônoma em torno de uma órbita periódica. Referimos o leitor para
[DL], [PM] e [R] para demonstração dos resultados que vamos consi-
derar a seguir. Nosso objetivo nesta seção é tão somente ilustrar com
figuras alguns dos comportamentos que caracterizam tais sistemas
em R3 .
i i
i i
“mec˙New”
i i
2011/10/11
page 236
i i
Considere uma seção transversal P passando por z0 = z(t0 ) per-

tencente a uma trajetória periódica z(t) ∈ Rn de uma equação di-
ferencial de primeira ordem x′ = G(x) (neste caso o vetor tangente
′
z (t0 ) não está em P ). Na Figura 12.9 mostramos a aplicação T in-
duzida por P de primeiro retorno no caso do R3 . Esta transformação
T : P → P de primeiro retorno esta definida localmente em uma
vizinhança V em torno de z0 , de tal jeito que para y ∈ V ⊂ P ,
T (y) = x(t1 ) ∈ P , onde t1 é o valor do tempo na primeira vez que a
′
trajetória x(t) (solução de x = G(x) tal que x(0) = y) retorna a P .
O plano P é chamado de seção transversal em z(t0 ).
Figura 12.9:
Vamos considerar a seguir especificamente o caso tridimensional,

ou seja a aplicação T de primeiro retorno para z(t), órbita periódica
′
para x = G(x), G : R3 → R3 , como mostra a Figura 12.9 ou 12.10.
O comportamento das trajetórias em torno da órbita periódica
pode ser analisado através da aplicação T definida em uma vizinhança
de z0 = z(t0 ) em P , onde neste caso P é um plano bidimensional.
Note que T é um difeomorfismo local em torno de z0 = z(t0 ) ∈ P .
i i
i i
“mec˙New”
i i
2011/10/11
page 237
i i
237
Note também que z0 é ponto fixo para T , isto é, T (z0 ) = z0 .
Definição 12.3. Dizemos que a órbita periódica z(t) ∈ R3 é hiper-

bólica, se DT (z0 ) tem todos autovalores reais (no caso são dois) com
módulo diferente de 1. O ponto z0 será dito ponto fixo hiperbólico
para a aplicação T de primeiro retorno.
Definição 12.4. Dizemos que a órbita periódica z(t) ∈ R3 é elı́ptica,

se DT (z0 ) tem os autovalores (no caso são dois) com módulo igual
a 1. O ponto z0 será dito ponto fixo elı́ptico para a aplicação T de
primeiro retorno.
Os dois casos acima descrevem situações excludentes e que cobrem

todas as possibilidades (note que se os dois autovalores são igual a 1,
dizemos que o ponto é elı́ptico)
Figura 12.10:
i i
i i
“mec˙New”
i i
2011/10/11
page 238
i i
Figura 12.11:
Definição 12.5. O conjunto estável de z0 , ponto fixo hiperbólico para

T de primeiro retorno a P , é o conjunto dos pontos y ∈ P tal que
lim T n (y) = z0 .
n→∞
Este conjunto é denotado por γe (z0 ).

Definição 12.6. O conjunto instável de z0 , ponto fixo hiperbólico
para T de primeiro retorno a P , é o conjunto dos pontos y ∈ P tal
que
lim T n (y) = z0 .
n→−∞
Este conjunto é denotado por γi (z0 ).

Na Figura 12.9 mostramos a posição dos dois conjuntos em torno
do ponto hiperbólico z0 . É possı́vel mostrar para z0 hiperbólico que
quando a matriz DT (z0 ) possui um autovalor real maior que 1 outro
i i
i i
“mec˙New”
i i
2011/10/11
page 239
i i
239
real menor que 1 (ver [PM], [Ro2]) então os conjuntos γi (z0 ) e γe (z0 )
são realmente curvas passando por z0 e a dinâmica em torno deste
ponto é descrita pela Figura 12.9. Mais exatamente, as condições
iniciais y ∈ γe (z0 ) convergem a z0 através da evolução temporal
T n , n > 0 e as condições iniciais y ∈ γi (z0 ) convergem a z0 para
a evolução temporal com tempo negativo T n (y), n < 0.
Figura 12.12:
Se z0 é tal que a matriz DT (z0 ) possui os dois autovalores com

módulo menor que 1 (ver [PM], [Ro2]), então a dinâmica em torno
i i
i i
“mec˙New”
i i
2011/10/11
page 240
i i
deste ponto z0 é descrita por um atrator (ver [DL]). Mais exatamente,

as iterações T n (z) para z condição inicial convergem a z0 .
Este fenômeno não ocorre num sistema Hamiltoniano autônomo
pois o fluxo preserva volume 2 n dimensional (Capı́tulo 3 [L]).
Figura 12.13:
É também possı́vel mostrar para z0 hiperbólico que quando a ma-

triz DT (z0 ) possui os dois autovalores módulo maior que 1 (ver [PM],
[Ro2]), então a dinâmica em torno deste ponto z0 é descrita por um
repulsor (ver [DL]). Mais exatamente, as iterações T −n (z), n > 0 de z
condição inicial convergem a z0 . As iterações positivas T n (z0 ), n > 0,
saem de qualquer vizinhança de z0 para n suficientemente grande.
Pontos y fora de γe (z0 ) e fora de γi (z0 ) possuem a propriedade
que T n (y), para algum n positivo e para algum n negativo, vão sair
i i
i i
“mec˙New”
i i
2011/10/11
page 241
i i
241
fora da vizinhança V em trono de z0 onde T pode ser definida.
Observação 12.2. É possı́vel mostrar que a Figura 12.9 ilustra tam-

bém localmente o espaço de fase das iterações de K(x) = dT (z0 )(x)
(onde dT (z0 ) = DT (z0 ) é a matriz derivada de T ) em torno do ponto
fixo K(0) = 0 no caso hiperbólico. Mais precisamente, K n (y) para di-
ferentes y (condições iniciais em uma vizinhança de 0 ∈ R2 ) também
tem uma evolução temporal semelhante a Figura 12.9, que é a figura
da evolução temporal em torno de z0 ∈ P do sistema não linearizado
T (x) : P → P .
Em resumo, localmente em torno de um ponto hiperbólico z0 , a

dinâmica de T e de seu linerizado dT são semelhantes (ver [PM] e
[Ro2] para demonstração).
Na Figura 12.14 mostramos uma órbita periódica em R3 em que
aparece o fenômeno da ferradura. Isto segue do fato da varieda-
de estavel e variadade instavel de um ponto x0 se interceptarem.
Mostramos na Figura 12.15 como se comporta a transformação de
Poincare T na seção transversal. Neste caso é possı́vel mostrar que
ocorrem infinitas órbitas periódicas para o campo de vetores. Mais
precisamente se mostra que existem infinitos pontos periódicos para
T de perı́odos arbitrariamente grandes (ver [Ro2]).
Este fenômeno descoberto por H. Poincaré no problema dos três
corpos teve grande impacto na Mecânica Clássica e na moderna Te-
oria dos Sistemas Dinâmicos. Ele ilustra a grande complexidade
dinâmica que ocorre nesta situação (ver[Ro2] para mais detalhes).
Nas Figuras 12.10, 12.11 e 12.12 mostramos um exemplo do que
pode acontecer em alguns casos para a evolução temporal de pon-
tos elı́pticos. Cada ponto inicial y tem a tendência de rodar em
tôrno de z0 ao longo de sua evolução temporal T n (y), n > 0. Neste
caso, o comportamento de T é aproximadamente o comportamento
da evolução temporal de K n (x), n > 0, onde K é a derivada de T em
z0 , K = dT (z0 ) da transformação de primeiro retorno T da órbita
elı́ptica z(t).
Observação 12.3. É importante destacar que, diferentemente do

caso hiperbólico (ver Observação 12.1 e Figura 8.3), nem sempre a
evolução temporal em torno de um ponto fixo elı́ptico vai seguir a
evolução temporal K n (x) da derivada K = dT (z0 ), sugerida pela
i i
i i
“mec˙New”
i i
2011/10/11
page 242
i i
Figura 12.14:
Figura 12.12. Fenômenos extremamente complexos podem suceder no

caso de uma órbita elı́ptica e estes exemplos são descritos na assim
chamada teoria KAM (ver [HK]).
A Figura 12.9 descreve o que acontece com as trajetórias do fluxo

′
φt do campo de vetores x = G(x) em tôrno de uma órbita periódica
hiperbólica z(t).
A Figura 12.12, mostra o que aconteceria se a órbita periódica
elı́ptica fosse tal que a T de primeiro retorno tivesse em tôrno de z0
um comportamento descrito pela Figura 3.3. Neste caso haveria um
contı́nuo de toros envolvendo z(t), cada toro sendo invariante pelo
fluxo (fenômeno KAM). O fenômeno de destruição de toros invari-
i i
i i
“mec˙New”
i i
2011/10/11
page 243
i i
243
Figura 12.15:
antes por perturbações é de fundamental importância em Sistemas

Dinâmicos [HK].
Definição 12.7. Seja um difeomorfismo T : A → A, então um ponto
x tal que exista n > 0 satisfazendo T n (x) = x é dito ponto periódico.
O menor de tais possı́veis valores n > 0 é chamado de perı́odo de x.
Um ponto fixo é um caso particular de ponto periódico.
Na Figura 12.13 mostramos a trajetória periódica x(t) (ver Defini-
ção 22) de um campo de vetores G e mostramos também como pode
aparecer de maneira natural um ponto periódico x (ver Definição
12.7) próximo ao ponto fixo para a aplicação de primeiro retorno T
(no caso um ponto de perı́odo 2) associada a uma órbita periódica
z(t) do campo de vetores G.
Se x é periódico para T , então
{T j (x), j ∈ N} = {x, T (x), T 2 (x), ..., T n−1 (x)}.
Note que se x é periódico para T com perı́odo n, então
{x, T (x), T 2 (x), .., T n−1 (x)}
também são pontos periódicos para T e tem perı́odo n.

O conjunto {x, T (x), T 2 (x), .., T n1 (x)} é chamado de órbita do
ponto periódico x por T
i i
i i
“mec˙New”
i i
2011/10/11
page 244
i i
Definição 12.8. Um ponto periódico x do difeomorfismo F com

perı́odo n é dito hiperbólico, se x é ponto fixo hiperbólico para T = F n .
É fácil ver que se x é periódico hiperbólico, cada ponto pertencente
a sua órbita também é hiperbólico.
Definição 12.9. O conjunto estável (respectivamente instável) γe (x)
(respectivamente γi (x)) de um ponto periódico hiperbólico x é a união
dos conjuntos estáveis (respectivamente instáveis) de sua órbita.
Definição 12.10. Um ponto periódico x do difeomorfismo F com
perı́odo n é dito elı́ptico, se x é ponto fixo elı́ptico para T = F n .
Um fluxo que preserva área no plano tem propriedades especiais.
Fixada uma seção transversal H a aplicação de primeiro retorno deve
ser a identidade; não pode ocorrer o que é descrito pela Figura 12.3
e 12.4. Isto porque a área da região A seria maior do que a área da
região B e o fluxo φt (para t o tempo de primeiro retorno da trajetória
x(t)) levaria A em φt (A) = B (aproximadamente). Note que os tem-
pos de retorno de pontos em x(t) e de outras soluções y(t) próximas
(começando na seção) não são os mesmos (apenas aproximadamente
os mesmos pela continuidade do fluxo).
Definição 12.11. Uma seção H transversal ao fluxo (definido por
uma equação diferencial x′ = f (x)) é dita global quando para qualquer
ponto x no espaço A onde está definida a equação diferencial vale
que existe t > 0 e s < 0 tal que φt (x) ∈ H e φs (x) ∈ H, onde φ é o
fluxo. Neste caso a ”toda”a dinâmica do fluxo da equação diferencial
x′ = f (x) pode ser capturada pela aplicação de primeiro retorno T
definida em H.
Nosso objetivo acima foi apenas descrever de maneira sumária
o que acontece em torno das órbitas periódicas z(t) de um sistema
mecânico. Como vimos, este comportamento depende fundamental-
mente da aplicação de primeiro retorno T induzida em uma seção
transversal P passando por z0 .
O estudo da iteração de difeomorfismos é extremamente impor-
tante na Teoria dos Sistemas Dinâmicos e sua análise permite o enten-
dimento da aplicação T de primeiro retorno a uma seção transversal.
Esta Teoria permite também analisar a dinâmica de F = φt0 , t0 fixo,
onde φt é o fluxo associado a um campo de vetores.
i i
i i
“mec˙New”
i i
2011/10/11
page 245
i i
245
A partir do que foi discutido acima, o leitor pode assim perceber

a extrema complexidade que pode suceder na evolução temporal das
condições iniciais y em tôrno de uma órbita periódica de uma equação
diferencial, em especial dos sistemas Hamiltonianos.
Não foi possı́vel apresentar provas dos resultados acima descritos,
pois isto implicaria em ter que escrever nesta seção um livro com-
pleto de Sistemas Dinâmicos. Nosso objetivo foi apenas apresentar
algumas ideias centrais que aparecem na pesquisa atual envolvendo o
entendimento da dinâmica global de Sistemas Mecânicos. Referimos
o leitor para [DL], [So], [PM], [R], [M], [CL], [S] e [HS] para referências
sobre vários aspectos da Teoria dos Sistemas Dinâmicos.
i i
i i
“mec˙New”
i i
2011/10/11
page 246
i i
i i
i i
“mec˙New”
i i
2011/10/11
page 247
i i
Bibliografia
[AM] R. Abraham and J. Mardsen, Foundations of Mechanics, Ben-

jamin, 1980.
[ABC] B. Amaral, A. Baraviera and M. Terra Cunha, Mecânica Quântica
para Matemáticos em formação, Coloq. Bras. Mat. 2011,
IMPA, Rio de Janeiro
[Ap] A. Appel, Traite de Mecanique Rationnelle, Ed. Gauthier-
Villars, 1953.
[A1] V. I. Arnold, Mathematical Methods of Classical Mechanics,
Springer Verlag, 1978.
[A2] V. I. Arnold, Geometric Methods in the Theory of Ordinary
Differential Equations, Spri. Verla, 1983.
[A3] V. I. Arnold and A. Avez, Ergodic Problems of Classical Me-
chanics, Benjamin, 1968.
[Au1] S. Aubry, Analiticity breaking and Anderson localization in in-
commensurate lattices, Annals of the Israel Phys. Soc., Vol 3
(1980).
[AU2] S. Aubry and P. Y. Le Daeron, The discrete Frenkel-Kontorova
model and its extensions, PhysicaD, Vol 8 (1983), pp 381-422
[B] V. Bangert, Mather sets for Twist maps and Geodesics on Tori,
Dynamics Reported , 1-56, John Wiley, 1988.
[BG] I. Q. Barros e M. V. P. Garcia, Mecânica Analı́tica Clássica,
Ed Edgar Blucher, 1995.
[BF] R. Bassanezi e W. Ferreira, Equações Diferenciais com Aplica-
ções, Edit Harbra, 1988.
[BS] C. Beck and F. Schlogl, Thermodynamics of Chaotic Systems:
an Introduction, Cambridge Press, 1993.
[BU] L. Bunimovich, On ergodic properties of nowhere dispersing
billiards, Comm in Math Phys, 65 pp 295-312, 1979.
i i
i i
“mec˙New”
i i
2011/10/11
page 248
i i
248 BIBLIOGRAFIA
[MC1] M. do Carmo, Formas Diferenciais e aplicações, 12 Coloq Bras

Mat., 1979.
[MC2] M. do Carmo, Geometria Riemanniana, Projeto Euclides, IMPA,
1988.
[MC3] M. do Carmo, Differential Geometry of Curves and Surfaces,
Prentice Hall, 1976.
[CRZ] M. Carneiro, C. Ragazzo e S. Zanata, Introdução à Dinâmica de
Aplicações do tipo Twist, Colóquio Brasileiro de Matemática,
IMPA, RJ, 2005.
[CI] G. Contreras e R. Iturriaga, Global Minimizers of Autonomous
Lagrangians, 22 Colóquio Brasileiro de Matemática, IMPA, (1999)
[CLT] G. Contreras, A. Lopes and P. Thieullen, Lyapunov Minimizing
Measures; Erg Theo and Dyn Systems, n 21, (2001)
[CM] N. Chernov and R. Markarian, Chaotic Billiards, AMS, 2006.
[CFS] I. Cornfeld, S. Fomin and Ya Sinai, Ergodic Theory, Springer
Verlag, 1982.
[dL] R. de la Llave, A. Tutorial in KAM theory, Proc. Symp. Pure
Applied Math. 69, Amer. Math. Soc., Providence, RI, 2001
[De] R. Devaney, An introduction to Chaotic Dynamical Systems,
Benjamin, 1986.
[DL] C. Doering and A. O. Lopes, Equações Diferenciais Ordinárias,
Matemática Universitária, IMPA, 2005
[Du] P. Duarte, Ann Inst Henry Poincare, Ann. Non-Lin, Vol 11 n4,
1994 pp 359-409.
[E] R. S. Ellis, Entropy, Large Deviations and Statistical Mecha-
nics, Sprin. Verlag, 1985.
[FMP] A. Fasano, S Marmi and B. Pelloni, Analytical Mechanics: An
Introduction, Oxford Press
[Fa] J. Falconer, Fractal Geometry, John Wiley, 1990.
i i
i i
“mec˙New”
i i
2011/10/11
page 249
i i
BIBLIOGRAFIA 249
[Fat] A. Fathi, Weak KAM Theorem in Lagrangian Dynmaics, pre-

print, 2011.
[Fe] P. Fernandez, Medida e Integração, Proj Euclides, 1976.
[Fi] D. Figueiredo, Análise de Fourier Series e Equações Diferenciais
Parciais, Projeto Euclides, IMPA, 1987.
[GF] I. M. Gelfand and S. V. Fomin, Calculus of Variations, Prentice
Hall, 1963.
[GP] Guillemin Pollack, Diferential Topology
[Go] H. Goldstein, Classical Mechanics, Addison-Wesley, 1972.
[GH] J. Guckenheimer and P. Holmes, Non-linear oscilations, Dy-
namical Systems and Bifurcations of Vector Fields, Springer
Verlag, 1983.
[Gu] J. Gutzwiller, Chaos in Classical and Quantum Mechanics,
Springer Verlag, 1990.
[H] M. Hermann, Sur le courbes invariantes par les diffeomorphism
de l’anneau, Asterisque, Soc math Franc, 1983.
[LC] P. Le Calvez, Etude Topologique des applications deviant la
Vertical, Ensaios Matemáticos, SBM.
[H] D. T. Harr, Elements of Hamiltonian Mechanics, Pergamon
Press, 1982.
[HS] M. Hirsh and S. Smale, Differential Equations, Linear Algebra
and Dynamical Systems, Acad. Press, 1974.
[I] V. Iório, EDP, Um curso de graduação, Coleção Matemática
Universitária, IMPA, Rio, 1989.
[Ja] B. James, Probabilidade: um curso intermediário, Projeto Eu-
clides, IMPA, 1982.
[Jo] F. John, Partial Differential Equations, Springer Verlag, 1975.
[PM] J. Palis and W. Melo, Introdução aos Sistemas Dinâmicos, Proj
Euclides, IMPA, 1982.
i i
i i
“mec˙New”
i i
2011/10/11
page 250
i i
250 BIBLIOGRAFIA
[G] H.-O. Georgii, Gibbs Measures and Phase Transitions. de Gruy-

ter, Berlin, (1988).
[Ju] R. Iorio Junior, Equações diferenciais parciais: uma introdução,

Projeto Euclides, IMPA, 1988.
[KH] A. Katok and B. Hassenblat, Introduction to the Modern The-

ory of Dynamical Systems, Cambridge U. P., 1995.
[KMS] S. Kerckhoff, A. Mazur and J. Smillie, Ergodicity of billiard

flows and quadratic differentials, Ann of Math, Vol 124, N2,
293-311, 1986.
[Kh] A. Khintchine, Continued Fractions, Univ of Cicago Press, 1964.
[LL] L. Landau and E. Lifshitz, Mechanics, Pergamon Press, 1960.
[Le] Y. Lequain, Aproximação de um número real por números ra-

cionais, Coloq Bras Mat 1993, IMPA.
[Lo] A. O. Lopes, Introdução à Mecânica Clássica, EDUSP, 2006
[LS] A. O. Lopes and M. Sebastiani, Poncelet pairs and the Twist

map associated to the Poncelet billiard, Real Analyses Ex-
change, vol. 35, ISSUE2, 335-374, 2010.
[LiLi] A. Lichtenberg and M. Liberman, Regular nd Stochastic Mo-

tion, Springer Verlag, 1983.
[Li1] E. L. Lima, Curso de Análise, vol II, Projeto Euclides, IMPA,

1989.
[Li2] E. L. Lima, Espaços Métricos, Proj Euclides, IMPA, 1977.
[Li3] E. L. Lima, Variedades Diferenciáveis, IMPA, RJ.
[Li4] E. L. Lima, Algebra Linear, Col. Mat. Universitária, IMPA,

Rio (1995).
[Lu] R. Luneburg, Mathematical Theory of Optics, Univ. of Cali-

fornia Press, (1964)
[M1] R. Mañé, Teoria Ergódica, Projeto Euclides, IMPA, 1982.
i i
i i
“mec˙New”
i i
2011/10/11
page 251
i i
BIBLIOGRAFIA 251
[M2] R. Mañé, Global Variational Methods in Conservative Dyna-

mics, 18 Coloq Bras Mat, 1991.
[MR] J.Mardsen and T. Ratiu, Introduction to Mechanics and Sime-

try Springer Verlag, 1994
[MT] J. Marion and S. Thorton, Classical Dynamics, Hartcourt Brace

Dubl, 1988.
[Ma] R. Markarian, Introduction to the Ergodic Theory of Plane

Billiards, Dynamical Systems, Congress in Santiago do Chile
(1990), Ed by R.Bamon, R. Labarca, J. Palis and J. Lewowicz,
Longman Edit (1993), 327-439.
[MF] J. Mather and G. Forni, Action Minimizing orbits in Hamilto-

nian Systems, Lecture Notes in Math, Springer Verlag (1994).
[Me] J. D. Meiss, Sympletic maps, variational principles, and trans-

port, Reviews of Modern Physics, Vol 64, N3, July 1992
[MH] K. Meyer and G. Hal, Introduction to Hamiltonian Dynamics

Systems and the n-body problem, Springer Verlag, 1992.
[Mi] J. Milnor, Morse Theory, Princ Univ Press.
[Mo] J. Moser, Stable and Random Motions in Dynamical Systems,

Princeton Univ. Press, 1973
[O] E. Ott, Chaos in Dynamical Systems, Camb Univ Press, 1993.
[IR] I. Percival and D. Richards, Introduction to Dynamics, Cam-

bridge Univ Press, 1982.
[PY] M. Pollicott and M. Yuri, Dynamical systems and Ergodic The-

ory, Academic Press, 1998
[N] A. L. Neto, Funções de uma variável Complexa, Projeto Eucli-

des, IMPA, 1993.
[OA] A. Ozorio de Almeida, Sistemas Hamiltonianos: Caos e Quan-

tização, Edit UNICAMP.
i i
i i
“mec˙New”
i i
2011/10/11
page 252
i i
252 BIBLIOGRAFIA
[PP] W. Parry and M. Pollicott, Zeta functions and the periodic orbit
structure of hyperbolic dynamics, Asterisque 187-188 (1990)
[R] S. N. Rasband, Dynamics, John Wiley, 1983.

[Ro1] C. Robinson, A global approximation theorem for Hamiltonian
Systems, Proc. in Symp in Pure Math, XIV, Global Analysis,
edit S. Chern and S. Smale, AMS, 1970.
[Ro2] C. Robinson, Dynamical Systems, CRC Press, 1995.
[Rud] W. Rudin, Real and Complex Analysis, Mc Graw Hill, 1974.
[Rue] D. Ruelle, Thermodynamic Formalism, Adisson Wesley, 1978.
[SW] R. Saks e H. Wu, General Relativity for Mathematicians,

Springer-Verlgag, 1977.
[S] M. Sebastiani, O Teorema de Poncelet, Publicações Matemáti-

cas, IMPA, 2011.
[Si] Ya. Sinai, Dynamical System with elastic reflections, Russian

Math Surveys, 25, pp 137-189, 1970.
[So] J. A Sottomayor, Lições de Equações Diferenciais Ordinárias,

Projeto Euclides, IMPA, RJ.
[Ta] S. Tabachinov, Billiards, Soc Math Franc, (1990)
[T] M. Tabor, Chaos and integrability in nonlinear dynamics, John

Wiley and Sons, 1989.
[W] E. T. Whittaker, A Treatise in the Analitical Dynamics of Par-

ticles and Rigid Bodies, Dover, 1944.
i i
i i

Topicos de Mecanica Classica - Artur Lop PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Topicos de Mecanica Classica - Artur Lop PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Tópicos de

IMPA - ddic@impa.br - http://www.impa.br - ISBN: 978-85-244-0335-4

1. A Ação Associada a Bilhares Convexos . . . . . . . . . . . . . . . . . . . . . . . 1

2. O Teorema Ergódico e a Hipótese de Boltzmannn . . . . . . . . . . . 17

3. A Teoria de Aubry para Quasi-Cristais e Exemplos do

4. Formas Diferenciais em Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5. Formalismo Simplético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

6. Linhas de Vortex em Mecânica Hamiltoniana . . . . . . . . . . . . . . . 140

7. E.D.P: Método das Caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 146

8. E.D.P: Método da Solução Completa . . . . . . . . . . . . . . . . . . . . . . . 162

9. O Princı́pio de Huygens em Mecânica Hamiltoniana . . . . . . . . 176

10. A Equação da Onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

11. O Método da Fase Estacionária - em conjunto com

12. Apêndice: Aplicação de Primeiro Retorno . . . . . . . . . . . . . . . . . 227

Vamos considerar a seguir bilhares determinados por uma curva con-

2 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Mais precisamente, suponha que exista uma curva infinitamente

superfı́cie p21 + p22 = 1) para um problema bidimensional em que

T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1),

onde T (t0 , θ0 ) = (t1 , θ1 ).

4 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

a região bidimensional em que T vai estar definida. E representa

(t, θ) , T (t, θ) , T (T (t, θ)) , ..., T n (t, θ) , ...,

φt ) é similar a tomar uma seção de Poincaré (global) para uma

Observação 1.1. Note que em geral se começarmos com uma con-

6 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Notação: Como estamos identificando t com q = g(t) (para sim-

S(q0 , q1 ) = kq0 − q1 k = S(q, Q)

S(t0 , t1 ) = kg(t0 ) − g(t1 )k,

onde g(t0 ) = q = q0 , g(t1 ) = q1 = Q) o comprimento do segmento

Demonstração: Como sabemos d<z(t)dt, z(t)> = 2 < z ′ (t) , z(t) >,

< u, v >= kukkvk cos (ângulo formado por u e v),

obtemos que ∂S(q 0 ,q1 )

Analogamente pode se mostrar que para q1 fixado ∂S(q 0 ,q1 )

Proposição 1.2. Fixe dois pontos q1 e q3 em C e considere A(q) =

A conclusão é que (q1 , p1 ) = T (q0 , p0 ) satisfaz as equações

8 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Um cálculo fácil permite obter que

Definição 1.1. A aplicação kq1 − qk = S(q, q1 ) : [0, 1] × (−1, 1) → R

Uma conclusão que podemos obter do fato acima demonstrado

10 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Definição 1.2. Dizemos que V : E → R é uma integral primeira de

A existência de tal V : [0, 1) × (−1, 1) → R implica na existência

Exemplo 1.1. O cı́rculo. Considere C um cı́rculo de raio 1. Em vez

Por propriedades elementares de geometria o ângulo ϕ não va-

(q0 , p0 ) ∈ [0, 2π) × (−π/2, π/2), então para todo n, T n (q0 , p0 ) =

Exemplo 1.2. A elipse. Tomando várias condições iniciais (q, p) ∈

{(q, p), T (q, p), ..., T n (q, p), ...}

obteremos uma decomposição do espaço de fase (q, p) ∈ [0, 1)×(−1, 1)

12 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

que as órbitas de condições iniciais sobre elas serão densas nela e em

constante) que seja constante em cada órbita {T n (x), n ∈ N} para

O Exemplo 1.3 (ver Figura 1.8) mostra uma combinação de com-

Exemplo 1.4. O estádio circular é o bilhar tal que a curva C tem

Tomando apenas “uma certa”condição inicial (q0 , p0 ) e plotando

{(q, p), T (q, p), ..., T 999 (q, p)}

obtemos Figura 1.7 (figura da direita). A órbita T j (q0 , p0 ), j ∈

Observação 1.2. Note que o comportamento da trajetória T n (q, p)

14 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.7: Espaço de fase respectivamente do cı́rculo, elipse e esta-

O comportamento descrito pelo Exemplo 1.4 mostra uma situação

A(x1 , x2 , ..., xn−1 ) = S(q0 , x1 ) + S(x1 , x2 ) + ... +

Figura 1.8: O ovo e seu espaço de fase.