Você está na página 1de 258

Tópicos de

Mecânica Clássica
Publicações Matemáticas

Tópicos de
Mecânica Clássica

Artur Lopes
UFRGS

impa
Copyright  2012 by Artur Lopes
Impresso no Brasil / Printed in Brazil
Capa: Noni Geiger / Sérgio R. Vaz
Publicações Matemáticas
• Introdução à Topologia Diferencial – Elon Lages Lima
• Criptografia, Números Primos e Algoritmos – Manoel Lemos
• Introdução à Economia Dinâmica e Mercados Incompletos – Aloísio Araújo
• Conjuntos de Cantor, Dinâmica e Aritmética – Carlos Gustavo Moreira
• Geometria Hiperbólica – João Lucas Marques Barbosa
• Introdução à Economia Matemática – Aloísio Araújo
• Superfícies Mínimas – Manfredo Perdigão do Carmo
• The Index Formula for Dirac Operators: an Introduction – Levi Lopes de Lima
• Introduction to Symplectic and Hamiltonian Geometry – Ana Cannas da Silva
• Primos de Mersenne (e outros primos muito grandes) – Carlos Gustavo T. A. Moreira e Nicolau
Saldanha
• The Contact Process on Graphs – Márcia Salzano
• Canonical Metrics on Compact almost Complex Manifolds – Santiago R. Simanca
• Introduction to Toric Varieties – Jean-Paul Brasselet
• Birational Geometry of Foliations – Marco Brunella
• Introdução à Teoria das Probabilidades – Pedro J. Fernandez
• Teoria dos Corpos – Otto Endler
• Introdução à Dinâmica de Aplicações do Tipo Twist – Clodoaldo G. Ragazzo, Mário J. Dias
Carneiro e Salvador Addas Zanata
• Elementos de Estatística Computacional usando Plataformas de Software Livre/Gratuito –
Alejandro C. Frery e Francisco Cribari-Neto
• Uma Introdução a Soluções de Viscosidade para Equações de Hamilton-Jacobi – Helena J.
Nussenzveig Lopes, Milton C. Lopes Filho
• Elements of Analytic Hypoellipticity – Nicholas Hanges
• Métodos Clássicos em Teoria do Potencial – Augusto Ponce
• Variedades Diferenciáveis – Elon Lages Lima
• O Método do Referencial Móvel – Manfredo do Carmo
• A Student's Guide to Symplectic Spaces, Grassmannians and Maslov Index – Paolo Piccione e
Daniel Victor Tausk
• Métodos Topológicos en el Análisis no Lineal – Pablo Amster
• Tópicos em Combinatória Contemporânea – Carlos Gustavo Moreira e Yoshiharu Kohayakawa
• Uma Iniciação aos Sistemas Dinâmicos Estocásticos – Paulo Ruffino
• Compressive Sensing – Adriana Schulz, Eduardo A.B.. da Silva e Luiz Velho
• O Teorema de Poncelet – Marcos Sebastiani
• Cálculo Tensorial – Elon Lages Lima
• Aspectos Ergódicos da Teoria dos Números – Alexander Arbieto, Carlos Matheus e C. G.
Moreira
• A Survey on Hiperbolicity of Projective Hypersurfaces – Simone Diverio e Erwan Rousseau
• Algebraic Stacks and Moduli of Vector Bundles – Frank Neumann
• O Teorema de Sard e suas Aplicações – Edson Durão Júdice
• Tópicos de Mecânica Clássica – Artur Lopes

IMPA - ddic@impa.br - http://www.impa.br - ISBN: 978-85-244-0335-4


“mec˙New”
i i
2011/10/11
page 1
i i

Prefácio
O presente livro é uma sequência natural do material apresentado
no texto [Lo] do mesmo autor.
Os primeiros três capı́tulos do texto introduzem conceitos de Te-
oria Ergódica e sua relação com a Mecânica Clássica. Nestes capı́tulos
apresentamos exemplos de sistemas em que aparece o fenômeno KAM.
Como veremos a fundamentação matemática da Mecânica Es-
tatı́stica “a la Gibbs” necessita de fato de resultados de Teoria Ergó-
dica como o Teorema de Birkhoff. Referimos [Rue] e [PP] ao leitor
para maiores detalhes sobre este assunto.
Os capı́tulos de 5 a 6 abordam o Formalismo Simplético. Para
se analisar sistemas mecânicos de maneira intrı́nseca em variedades
diferenciáveis se necessita deste formalismo. Estes resultados podem
ser generalizados (ver [AM]) para dimensão infinita e permitem a
análise da equção de Korteg-de Vries, etc...
A equação de Hamilton-Jacobi e sua relação com o Princı́pio de
Huyghens é o tema dos capı́tulos 7 a 10. Nesta parte do livro é
abordado a relação entre frentes de onda e raios de luz que foi a
motivação principal para a introdução do ponto de vista hamiltoniano
na Mecânica Clássica.
No capı́tulo 11 (em conjunto com M. Sebastiani) apresentamos
algumas propriedades de integrais oscilantes que permitem o me-
lhor entendimento da ótica oscilatória (que foi abordado no capı́tulo
10) e que estão também relacionadas com o limite semi-clássico da
Mecânica Quântica.
O apêndice capı́tulo 12 apresenta algumas definições e exemplos
de aplicações de primeiro retorno induzidas em capı́tulos, pontos
periódicos hiperbólicos, elı́pticos, etc... conceitos estes que aparecem
anteriormente no texto.
Referimos o texto [DL] ao leitor para resultados gerais sobre
Equações Diferenciais Ordinárias que serão aqui utilizados.
Ressaltamos que o livro [FMP] apresenta uma grande quantidade
de material de Mecânica Clássica de uma maneira muito elegante e
com muitos detalhes nas demonstrações.

i i

i i
“mec˙New”
i i
2011/10/11
page 3
i i

Índice

1. A Ação Associada a Bilhares Convexos . . . . . . . . . . . . . . . . . . . . . . . 1

2. O Teorema Ergódico e a Hipótese de Boltzmannn . . . . . . . . . . . 17

3. A Teoria de Aubry para Quasi-Cristais e Exemplos do


Tipo KAM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4. Formas Diferenciais em Variedades . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5. Formalismo Simplético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

6. Linhas de Vortex em Mecânica Hamiltoniana . . . . . . . . . . . . . . . 140

7. E.D.P: Método das Caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . 146

8. E.D.P: Método da Solução Completa . . . . . . . . . . . . . . . . . . . . . . . 162

9. O Princı́pio de Huygens em Mecânica Hamiltoniana . . . . . . . . 176

10. A Equação da Onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

11. O Método da Fase Estacionária - em conjunto com


Marcos Sebastiani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .207

12. Apêndice: Aplicação de Primeiro Retorno . . . . . . . . . . . . . . . . . 227

Bibliografias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

i i

i i
“mec˙New”
i i
2011/10/11
page 4
i i

i i

i i
“mec˙New”
i i
2011/10/11
page 1
i i

Capı́tulo 1

A Ação Associada a
Bilhares Convexos

Vamos considerar a seguir bilhares determinados por uma curva con-


vexa e sua relação com fluxos Hamiltonianos. Este exemplo possibili-
tará introduzir de maneira natural alguns conceitos básicos do ponto
de vista estatı́stico (não determinı́stico) de se entender a mecânica.
Na próxima seção apresentaremos ao leitor os rudimentos da Te-
oria Ergódica. Nos reportaremos a alguns exemplos tratados na pre-
sente seção para ilustrar algumas propriedades que lá serão descritas.
Considere o movimento livre de uma partı́cula de massa 1 no plano
sujeito à ação do Hamiltoniano
1 2 
p + p22 .
2 1
Como sabemos a trajetória da partı́cula se dará segundo uma
linha reta e pelo Teorema da Conservação da Energia Total (que
neste caso, é também apEnergia Cinética) a velocidade ao longo da
trajetória terá módulo p21 + p22 = c = constante.
Vamos descrever alguns resultados básicos na Teoria dos Bilhares
(ver [CM] e [CRZ]).
Suponha a existência de um recipiente circundando a partı́cula de
tal modo que vai impedir que a partı́cula vá embora para o infinito.

i i

i i
“mec˙New”
i i
2011/10/11
page 2
i i

2 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Mais precisamente, suponha que exista uma curva infinitamente


diferenciável C de Jordan (sem auto-interceção), que é parametrizada
por g : [0, c] → C ⊂ R2 no sentido anti-horário, g diferenciável e
g(0) = g(c). Considere a condição inicial (q0 , p0 ) ∈ R4 da partı́cula
de tal modo que q0 esteja contida no interior da região D delimitada
pela curva C e que a velocidade inicial p0 seja tal que kp0 k = 1 (logo
por conservação de energia este módulo se manterá constante igual a
1 para sempre).
Vamos supor que a região D é estritamente convexa (sem seg-
mentos retos), isto é, que dados dois pontos quaisquer q1 , q2 ∈ D, o
segmento de reta unindo q1 a q2 está estritamente contido no interior
da região delimitada por D.
A evolução temporal da partı́cula
(q(s), p(s)) = (q1 (s), q2 (s), p1 (s), p2 (s))
a partir da condição inicial (q0 , p0 ) = (q01 , q02 , p10 , p20 ) ∈ R4 será tal que
cada vez que a trajetória q(s) ∈ R2 , s ∈ R colide com a curva C,
ela reflete de tal modo que o ângulo de incidência com a tangente à
curva C seja igual ao ângulo de reflexão (ver Figura 1.1).
Desta maneira, se a trajetória for tal que q0 está inicialmente
na parte D interior à curva C, ela jamais sairá de D. Vamos su-
por também que as reflexões são elásticas, ou seja, não há perda de
energia. Sendo assim, este movimento estará restrito à superfı́cie
tridimensional em R4 determinada por p21 + p22 = 1.
Este modelo é uma boa aproximação para o que acontece com as
partı́culas de um gás contido em um recipiente fechado. O problema
em que estamos interessados nesta seção é analisar o que acontece
com a evolução temporal (q(s), p(s)) de “uma”partı́cula que no tempo
inicial s = 0 está exatamente em q0 ∈ D (ou em C) e com vetor
velocidade p0 . Problemas de acústica também podem ser modelados
por bilhares.
Considere g : [0, c] → C (c é o comprimento da curva) uma para-
metrização da curva C pelo comprimento de arco, isto é kg ′ (t)k = 1.
Vamos supor sem perda de generalidade que a curva C tenha com-
primento igual a 1 (caso contrário faça uma mudança de variáveis),
ou seja que c = 1.
Como entre cada batida o movimento é trivial (é descrito por
uma linha reta) podemos simplificar o problema tridimensional (na

i i

i i
“mec˙New”
i i
2011/10/11
page 3
i i

superfı́cie p21 + p22 = 1) para um problema bidimensional em que


q0 ∈ C da seguinte maneira: a posição inicial (q0 , p0 ) ∈ R4 tal que
(p10 )2 +(p20 )2 = 1 e q0 = (q01 , q02 ) ∈ C, pode serdescrita por (t, ϕ) onde
t ∈ [0, 1] é tal que g(t) = q0 , e ϕ ∈ − π2 , π2 é o ângulo de p0 com
a normal a C em q0 apontando para dentro de C (ver Figura 1.2).
Por convenção assumimos que ϕ = −π/2 corresponde a tangente t
da curva (orientada no sentido anti-horário).
O vetor p0 sempre aponta para dentro da curva C, logo seu ângulo
com a normal (apontando para dentro da curva) varia de −π/2 a π/2
como foi dito acima.
Por uma questão de conveniência em vez de ϕ, vamos usar a
variável θ = sin ϕ ∈ (−1, 1).
Segundo a convenção g ′ (t) corresponde a θ = −1.
Para descrever com mais exatidão a analogia que existe entre o
modêlo do bilhar e propriedades de sistemas hamiltonianos vamos
usar a seguinte notação, vamos associar t = q e θ = p. Sendo assim,
denotaremos indistintamente t = q = g(t) e também θ = p.
Dada a condição inicial (t0 , θ0 ), considere a trajetória (q(s), p(s))
(solução do fluxo Hamiltoniano começando em (q0 , p0 ) = (t0 , θ0 ))
q(s) ∈ D e após a primeira colisão e respectivo rebote obteremos
(q1 , p1 ), q1 ∈ C. Denotaremos por (t1 , θ1 ) os novos valores obtidos
nas coordenadas (t, θ) de tal jeito que g(t1 ) = q1 é exatamente o
ponto de C onde a trajetória q(s) determinada por (q(s), p(s)) vai
colidir com C pela primeira vez (ver Figura 1.2). O ângulo θ1 é
obtido como o valor do seno do ângulo (do vetor refletido) com a
normal (ver Figura 1.2).
O fato de assumir que a curva C é estritamente convexa implica
que T (t0 , θo ) = (t1 , θ1 ) esta bem definida e é continua. Devemos
assumir que a curva é parametrizada por uma função de Classe C 2
para que resulte um difeomorfismo a aplicação de primeiro retorno.
Fica assim, determinado um difeomorfismo

T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1),

onde T (t0 , θ0 ) = (t1 , θ1 ).


A diferenciabilidade do difeomorfismo é C 1 .
Vamos denotar por

E = [0, 1) × (−1, 1)

i i

i i
“mec˙New”
i i
2011/10/11
page 4
i i

4 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

a região bidimensional em que T vai estar definida. E representa


uma seção transversal (ver seção 12 para considerações gerais sobre
o assunto) na superfı́cie tridimensional p21 + p22 = 1.
Reduzimos assim um problema com tempo contı́nuo em dimensão
3 para um problema de dimensão 2 com tempo discreto, ou seja a
dinâmica temporal para o fluxo φt , t ∈ R transforma-se na dinâmica
temporal para T n , n ∈ N, onde T : E → E é um difeomorfismo. Este
segundo problema, em princı́pio, é mais simples e vai apresentar as
principais caracterı́sticas do primeiro.
Para entender o que acontece com com a evolução temporal φs (q, p),
s ∈ R, da partı́cula com posição inicial (q, p) = (t, θ), q ∈ C, basta
saber o que acontece com as sucessivas batidas determinadas por T
em C, ou seja pela órbita de (q, p) = (t, θ) dada por

(t, θ) , T (t, θ) , T (T (t, θ)) , ..., T n (t, θ) , ...,

pois entre cada batida a trajetória é uma linha reta. A linha quebrada
correspondendo aos vários rebotes desta evolução temporal t ∈ R
pode ser facilmente reconstruı́da a partir da informação da órbita de
(t0 , θ0 ).
Note que se a fronteira do bilhar for constituı́do por união de
curvas diferenciáveis como na Figura 1.4 e 2.1, existirão singulari-
dades devido aos vértices e isto cria uma pequena dificuldade (que
pode ser eliminada conforme veremos na próxima seção) na definição
de T . Alguns destes bilhares (como o da Figura 2.1) chamados dis-
persores ou de Sinai (ver [Mar] para definição), apresentam caos e
podem ser rigorosamente analisados adaptando técnicas de sistemas
hiperbólicos da Teoria dos Sistemas Dinâmicos e Teoria Ergódica (ver
Ro[1]). Os bilhares analisados aqui são focalizadores (em oposição aos
dispersores) e também podem exibir como veremos em alguns casos
comportamento caótico mas para sua análise rigorosa as técnicas em-
pregadas são de natureza distinta (e na verdade mais difı́cil) do que
as utilizadas no caso dispersor.
Bilhares são os exemplos naturais mais simples em que se observa
caos (ver Figura 2.2).
Para o leitor familiarizado com a teoria geométrica das equações
diferenciais ordinárias (ver [LL] e [So]) esclarecemos que o procedi-
mento acima (tomar a iteração do difeomorfismo T em vez do fluxo

i i

i i
“mec˙New”
i i
2011/10/11
page 5
i i

Figura 1.1:

φt ) é similar a tomar uma seção de Poincaré (global) para uma


equação diferencial. Neste sentido, a aplicação T pode ser enten-
dida da seguinte maneira. O movimento do bilhar se dá na região
invariante tridimensional p21 + p22 = 1. A região E (seção transversal
de acordo com a seção 12) vai ser constituı́da pelos pontos da forma
(q, p) onde q está na curva C (bordo de D) e p é um vetor de norma
1 em q e apontando para dentro da curva C.
Dada uma condição inicial em E, a aplicação T vai determinar o
primeiro retorno (seguido de uma simetria do ângulo de incidência
com a normal à curva) da trajetória (que se desloca na região tridi-
mensional) à seção transversal E (ver Figura 1.5).

Observação 1.1. Note que em geral se começarmos com uma con-


dição inicial (q0 , p0 ), e denotando por (pn , qn ) = T n (q0 , p0 ), se se-
guirmos os iterados (qn , pn ), tentando prever exatamente onde ele
vai estar no tempo (digamos) 1000, (isto é, qual o valor exato de
(q1000 , p1000 )) enfrentaremos sérias dificuldades. Um pequeno erro
na aproximação do valor exato de (q1 , p1 ) se propaga para (q2 , p2 )
e assim por diante, fazendo com que a previsão do valor exato de
(q1000 , p1000 ) seja bastante difı́cil. O ponto de vista acima descrito
pode ser entendido como o ponto de vista determinı́stico. Para o tipo
de problema que estamos considerando (bilhares em regiões convexas)
será melhor analisar a questão do ponto de vista da análise estatı́stica
das trajetórias. Para isto será necessário mostrar que T preserva
área, o que vai ser feito a seguir.

i i

i i
“mec˙New”
i i
2011/10/11
page 6
i i

6 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Notação: Como estamos identificando t com q = g(t) (para sim-


plificar a notação), denote

S(q0 , q1 ) = kq0 − q1 k = S(q, Q)

(ou alternativamente

S(t0 , t1 ) = kg(t0 ) − g(t1 )k,

onde g(t0 ) = q = q0 , g(t1 ) = q1 = Q) o comprimento do segmento


ligando q0 a q1 . Como D é estritamente convexo, este segmento está
inteiramente contido em D.
∂S(q0 ,q1 )
Proposição 1.1. Seja (q1 , p1 ) = T (q0 , p0 ). Para q0 fixado, ∂q1 =
−p1 .

Demonstração: Como sabemos d<z(t)dt, z(t)> = 2 < z ′ (t) , z(t) >,


então usando a notação descrita acima onde q0 = g(t0 ) e q1 = g(t1 )
p
∂S(q0 , q1 ) d < g(t1 ) − g(t0 ) , g(t1 ) − g(t) ) >
= =
∂q1 dt1

1
< g ′ (t1 ) , g(t1 ) − g(t0 ) > .
kg(t1 ) − g(t0 )k

Como kg (t1 )k = 1 por hipótese, usando a expressão

< u, v >= kukkvk cos (ângulo formado por u e v),

obtemos que ∂S(q 0 ,q1 )


∂q1 é o cosseno do ângulo entre (g(t1 ) − g(t)) e
g ′ (t1 ), ou seja é igual ao cosseno do ângulo de incidência da partı́cula
em g(t1 ) com a tangente g ′ (t1 ) neste ponto. Como p1 = θ1 = sin φ1
é o seno do ângulo com a normal após o rebote, concluı́mos que
dS(q0 ,q1 )
dq1 = −p1 .
A troca de sinal é devido ao ângulo refletido. 

Analogamente pode se mostrar que para q1 fixado ∂S(q 0 ,q1 )


∂q0 = p0 .
Sendo assim S define uma transformação que preserva área. Seguirá
do que foi descrito acima que:

i i

i i
“mec˙New”
i i
2011/10/11
page 7
i i

Figura 1.2:

Proposição 1.2. Fixe dois pontos q1 e q3 em C e considere A(q) =


A(t) a função de t = q ∈ [0, 1) (estamos usando a notação, de iden-
tificar g(t) = q ∈ C) tomando valores reais, tal que para todo valor
q ∈ C,
A(q) = S(q1 , q) + S(q, q3 ) = kq1 − qk + kq − q3 k.
Então, é equivalente dizer que A(q) = S(q1 , q) + S(q, q3 ) tem um
ponto crı́tico em q2 e dizer que a trajetória do bilhar em D, sai de
q1 , colide a seguir com C em q2 ∈ C e finalmente bate em q3 ∈ C.
∂S(q1 ,q2 )
Demonstração: Pela última proposição, ∂q2 = −p2 . De
∂S(q2 ,q3 )
maneira análoga se pode mostrar que ∂q2 = p2 .
Sendo assim, a partir do que vimos na última proposição, a condi-
ção da igualdade do ângulo de incidência e o ângulo de reflexão entre
os segmentos q1 , q2 e q2 , q3 no ponto q2 é equivalente a dizer que q2
satisfaz
∂S(q1 , q) ∂S(q, q3 )
+ = 0.
∂q ∂q
Esta última condição, por sua vez, é equivalente a A(q) ter q2
como ponto crı́tico. 

A conclusão é que (q1 , p1 ) = T (q0 , p0 ) satisfaz as equações


∂S(q0 , q1 )
= p0
∂q
e
∂S(q0 , q1 )
= −p1 .
∂q1

i i

i i
“mec˙New”
i i
2011/10/11
page 8
i i

8 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.3:

Um cálculo fácil permite obter que

∂ 2 S(q0 , q1 ) p0 p1
= >0
∂q0 ∂q1 S(q0 , q1 )

ou seja,
∂ 2 S(t0 , t1 ) Senθ0 Senθ1
= >0
∂t0 ∂t1 S(t0 , t1 )
Mais tarde retornaremos a analisar esta expressão. Note que po-
demos tomar também S(q, Q) = −kq − Qk sem que alteremos em
nada o que foi descrito acima, apenas fazendo com que

∂ 2 S(q0 , q1 )
< 0.
∂q0 ∂q1
Mais tarde analisaremos transformações T obtidas a partir de S
e que satisfazem a última expressão acima.
Como vimos no Capı́tulo 3 [L], se T (q0 , p0 ) = (q1 , p1 ) é obtido
através de uma aplicação geradora de mudança de coordenadas
2
S(q0 , q1 ) tal que ∂ ∂q
S(q0 ,q1 )
0 ∂q1
6= 0 como acima, então T preserva área.
Note que foi necessário usar as coordenadas θ = sin ϕ e não ϕ para
obter que T : E → E preserva área.
Logo, para tal T vale que para qualquer aberto A, os conjuntos
A e T (A) tem a mesma área.

i i

i i
“mec˙New”
i i
2011/10/11
page 9
i i

Figura 1.4:

Definição 1.1. A aplicação kq1 − qk = S(q, q1 ) : [0, 1] × (−1, 1) → R


é denominada Ação associada ao bilhar definido pela curva C.

Uma conclusão que podemos obter do fato acima demonstrado


é que todos os pontos do bilhar são não errantes (ver Definição 5,
Capı́tulo 3 [L]). Isto segue de imediato do fato que T preserva área e
do Teorema de Poincaré (Teorema 5, Capı́tulo 3).
O Exemplo 13, Capı́tulo 1 [L], constituı́do por duas partı́culas
colidindo num intervalo, pode ser transformado num problema sobre
trajetórias no bilhar triangular. A demonstração que a aplicação no
bordo do bilhar preserva área também pode ser aplicada a tal bi-
lhar. Concluimos portanto que no caso do sistema de duas partı́culas
colidindo num intervalo, todos os pontos são não errantes.
O fato do difeomorfismo T do bilhar convexo preservar área, per-
mitirá também usar técnicas probabilı́sticas na análise das trajetórias
do sistema mecânico em consideração. Estes resultados serão apre-
sentados na próxima seção.
O resultado acima, sobre conservação de área é verdadeiro para
uma grande classe de interessantes e diferentes tipos de bilhares. A
evolução das trajetórias do bilhar vai depender no entanto de maneira
essencial da forma da curva C. Vamos mostrar isto através de alguns
exemplos.

i i

i i
“mec˙New”
i i
2011/10/11
page 10
i i

10 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.5:

Definição 1.2. Dizemos que V : E → R é uma integral primeira de


T se V (q, p) é contı́nua e constante ao longo das órbitas T n (q0 , p0 ) =
(qn , pn ).

A existência de tal V : [0, 1) × (−1, 1) → R implica na existência


de uma integral primeira Ṽ para φt em p21 + p22 = 1. Isto ocorre
porque, o sistema a tempo contı́nuo φt na superfı́cie tridimensional
p21 +p22 = 1, é obtido a partir de T apenas acrescentando retas ligando
x a T (x). Cada curva invariante em [0, 1) × (−1, 1) determina por-
tanto uma superfı́cie bidimensional invariante para φt na superfı́cie
tridimensional em p21 + p22 = 1.

Exemplo 1.1. O cı́rculo. Considere C um cı́rculo de raio 1. Em vez


da parametrização do cı́rculo por (cos 2πt, sen 2πt ), 0 ≤ t ≤ 1 vamos
usar as coordenadas 0 ≤ s < 2π para a posição q e −π/2 ≤ ϕ < π/2
para o ângulo com a normal. No caso do cı́rculo é fácil ver que
S(q, Q) = S(s0 , s1 ) = 2 sen ((s1 − s0 )/2).

Por propriedades elementares de geometria o ângulo ϕ não va-


ria ao longo de uma órbita e T é dado por T (s0 , ϕ0 ) = (s1 , ϕ1 ) =
(s0 + 2ϕ0 , ϕ0 ) É fácil ver que se a condição inicial for (s0 , ϕ0 ) =

i i

i i
“mec˙New”
i i
2011/10/11
page 11
i i

11

(q0 , p0 ) ∈ [0, 2π) × (−π/2, π/2), então para todo n, T n (q0 , p0 ) =


(qn , pn ) é tal que pn = p. Sendo assim se plotarmos várias trajetórias
{(q, p), T (q, p), T 2 , ..., T n (q, p)}, onde (q, p) são diferentes condições
iniciais, obteremos uma decomposição do espaço de fase (q, p) ∈
[0, 2π) × (−π/2, π/2), da forma apresentada na Figura 1.7.
Logo, a função V (q, p) = p (ou seja V (s, ϕ) = ϕ) é constante ao
longo de cada órbita. Portanto, tal V é uma integral primeira do
bilhar.
Como T (s0 , ϕ0 ) = (s0 + 2ϕ0 ), φ0 ) considere apenas a ação de T
na primeira ordenada g(s0 ) = s0 + 2ϕ0 (mod 1). Se 2ϕ0 for da
forma racional vezes 2π é fácil ver que todo ponto s0 será periódico.
Caso 2ϕ0 for da forma irracional vezes 2π então, conforme a próxima
seção, ocorre que para qualquer s0 fixado a órbita g j (s0 ), j > 0 será
densa em [0, 1). Neste último caso, naturalmente, não existem órbitas
periódicas.
Sendo assim, concluı́mos que a dinâmica da evolução temporal
de T n (s0 , ϕ0 ) fica completamente entendida e de acordo com a Fi-
gura 1.5. Se quisermos podemos mudar novamente coordenadas e
considerar alternativamente o problema nas coordenadas T n (t0 , θ0 )
obtendo os resultados análogos. Optamos pelas coordenadas (s, ϕ)
apenas porque as fórmulas de T e S neste caso ficam mais simples.

Exemplo 1.2. A elipse. Tomando várias condições iniciais (q, p) ∈


[0, 1) × (−1, 1) diferentes e tomando as correspondentes órbitas

{(q, p), T (q, p), ..., T n (q, p), ...}

obteremos uma decomposição do espaço de fase (q, p) ∈ [0, 1)×(−1, 1)


da forma apresentada na Figura 1.7.

A função
q 2 − ǫ2 cos2 ν
V (q, p) =
1 − ǫ2 cos2 ν
(onde ǫ é a excentricidade da elipse e ν é o ângulo de p com o eixo dos
x), por sua vez, é constante ao longo das órbitas do bilhar na elipse.
Um exame das curvas de nı́vel de tal G nos determina a Figura
que 1.7 descreve órbitas associadas a diversas condições iniciais. Da
mesma maneira como no cı́rculo algumas curvas de nı́vel serão tais

i i

i i
“mec˙New”
i i
2011/10/11
page 12
i i

12 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.6:

que as órbitas de condições iniciais sobre elas serão densas nela e em


algumas outras curvas tal não ocorre.
É possı́vel mostrar também que em algumas curvas de nı́vel o tj
de (tj , θj ) = T (t0 , θ0 ), j > 0 explora densamente on intervalo [0, 1] e
em outras não; a Figura 1.7 e 1.8 ilustra tal fato.
A existência de tal V : [0, 1) × (−1, 1) → R por sua vez implica na
existência de uma integral primeira Ṽ para φt em p21 + p22 = 1. Por-
tanto, da mesma maneira como no caso do cı́rculo, obtemos neste caso
uma integral primeira para o sistema a tempo contı́nuo associado.
Exemplo 1.3. O ovo (ver Figura 1.8). Tomando várias condições
iniciais (q, p) diferentes e tomando as correspondentes órbitas
{(q, p), T (q, p), ..., T n (q, p)}
obteremos uma decomposição do espaço de fase da forma apresentada
na Figura 1.8. Note que mesmo que a elipse e o ovo tenham for-
mas semelhantes, o espaço de fase do bilhar com fronteira dada pelo
ovo apresentado na Figura 1.8 é bastante diferente dos dois exem-
plo anteriores. Este sistema, aparentemente pelo que mostra a Fi-
gura 1.8 não existe função contı́nua V (definida em todo E e não

i i

i i
“mec˙New”
i i
2011/10/11
page 13
i i

13

constante) que seja constante em cada órbita {T n (x), n ∈ N} para


cada x = (q, p) ∈ E.

O Exemplo 1.3 (ver Figura 1.8) mostra uma combinação de com-


portamentos distintos (dependendo da órbita ou seja da condição ini-
cial escolhida); existe uma evidência numérica que existem algumas
curvas invariantes por T e também regiões bidimensionais invariantes
por T (que não são união de curvas invariantes conforme Figura 1.8).
Neste caso aparece o que se convenciona chamar de ilhas KAM e
que será analisado mais tarde no texto.
Nas curvas invariantes que aparecem na figura podem haver órbitas
periódicas, trajetórias com órbita densa, etc...

Exemplo 1.4. O estádio circular é o bilhar tal que a curva C tem


a forma apresentada na Figura 1.4. É constituı́do por duas retas
paralelas com comprimento l > 0 e por duas metades de um cı́rculo.

Tomando apenas “uma certa”condição inicial (q0 , p0 ) e plotando


a órbita de (q, p) até ordem n=999, isto é, plotando o conjunto

{(q, p), T (q, p), ..., T 999 (q, p)}

obtemos Figura 1.7 (figura da direita). A órbita T j (q0 , p0 ), j ∈


{1, 2, ..., n} parece se distribuir de maneira uniforme sobre E, isto
é o número de j ∈ {1, 2, ..., n − 1} em um aberto qualquer fixado A
dividido por 1000 parece ser proporcional a área de A.
Note que podem existir órbitas no estádio circular que não tem
o comportamento acima descrito: por exemplo órbitas periódicas de
perı́odo dois como aparece na Figura 1.6.
Na verdade para a ”maioria”das condições iniciais (q0 , p0 ) as ór-
bitas no estádio circular T j (q0 , p0 ) terão uma distribuição uniforme
como no caso da Figura 1.7 (figura da direita). Explicar o sentido
da palavra ”maioria”será um dos objetivos da próxima seção. Este
exemplo será um dos assim chamados sistemas ergódicos.

Observação 1.2. Note que o comportamento da trajetória T n (q, p)


neste último Exemplo 1.4 é totalmente distinto dos dois primeiros
Exemplos 1.1 e 1.2, onde cada trajetória esta confinada a uma curva
(um conjunto unidimensional) por causa da integral primeira V .

i i

i i
“mec˙New”
i i
2011/10/11
page 14
i i

14 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

Figura 1.7: Espaço de fase respectivamente do cı́rculo, elipse e esta-


dium.

O comportamento descrito pelo Exemplo 1.4 mostra uma situação


que é também diferente do Exemplo 1.3. No presente caso a tra-
jetória T n (x), x ∈ [0, 1) × (−1, 1) de um ponto escolhido ao acaso no
Exemplo 1.4 parece tentar explorar toda a região bidimensional E.
Mais precisamente, a órbita {T n (x)} tenta ocupar densamente todo
o espaço E = [0, 1)×(−1, 1) e neste caso, não parece existirem curvas
invariantes para tal T em E.
Este último bilhar Exemplo 1.4 é o protótipo de um sistema
ergódico (os Exemplos 1.1, 1.2 e 1.4 não o são) conceito que será
tornado preciso na próxima seção.
Para finalizar algumas considerações gerais sobre bilhares.
Observação 1.3. Generalizando o que foi afirmado na Proposição
1.2 é fácil ver que se q0 , q1 , q2 , ..., qn são sucessivas batidas em C de
uma órbita T j (q0 , θ0 ) então para q0 , qn fixos a função

A(x1 , x2 , ..., xn−1 ) = S(q0 , x1 ) + S(x1 , x2 ) + ... +


+ S(xn−2 , xn−1 ) + S(xn−1 , qn )

A : E n−1 → R tem (q1 , q2 , ..., qn−1 ) como ponto crı́tico. Temos assim
uma versão a tempo discreto do princı́pio mı́nima ação. Esta propri-
edade será analisada posteriormente com mais detalhe e também em
outros casos similares.
Note que para bilhares focalizadores (como descritos acima) se
em vez de considerarmos S(q0 , q1 ) = ||q0 − q1 || tomarmos S(q0 , q1 ) =
−||q0 − q1 || determinaremos também uma T que descreve a dinâmica

i i

i i
“mec˙New”
i i
2011/10/11
page 15
i i

15

Figura 1.8: O ovo e seu espaço de fase.

do bilhar (troca apenas a orientação da curva). A condição obtida


2 2
antes ∂ ∂q
S(q0 ,q1 )
0 ∂q1
> 0 neste último caso troca para ∂ ∂q S(q0 ,q1 )
0 ∂q1
< 0. No
caso S(q0 , q1 ) = ||q0 −q1 || a condição de mı́nimo para A da observação
acima significa obter trajetórias com mı́nimo comprimento. No outro
caso o princı́pio de mı́nima ação determina trajetórias com máximo
comprimento.
Para bilhares dispersores (ver Figura 2.1) podemos também consi-
derar S(q0 , q1 ) = ||q0 − q1 || ou S(q0 , q1 ) = −||q0 − q1 || correspondendo
2 2
respectivamente a ∂ ∂q S(q0 ,q1 )
0 ∂q1
< 0 e ∂ ∂qS(q0 ,q1 )
0 ∂q1
> 0 (observe a troca de
sinal em comparação com o caso focalizador).
O bilhar descrito pela Figura 2.1 em que o bordo do bilhar é
constituı́do por uma série de curvas diferenciáveis com a concavidade
para fora (que fazem um ângulo não nulo nas interceções) é conhecido
como bilhar de Sinai. Pode-se mostrar que o espaço de fase neste
caso é semelhante ao do caso do estadium, isto é, tomando um ponto
inicial (q0 , p0 ) fixado no bordo, os iterados (qn , pn ) = T n (q0 , p0 ) se
distribuem de maneira uniforme no espaço de fase. Referimos o leitor
a [Si], [Ma] e [Ta] para resultados gerais sobre o assunto.
Alguns tipos diferentes de bilhares são analisados em [S] e [LS.]

i i

i i
“mec˙New”
i i
2011/10/11
page 16
i i

16 [CAP. 1: A AÇÃO ASSOCIADA A BILHARES CONVEXOS

A conclusão a que chegamos ao fim desta seção é que mesmo


para um campo Hamiltoniano sem energia potencial, a dinâmica da
evolução temporal do sistema mecânico associado pode ser muito
complexa, se assumirmos a existência de um recipiente contendo a
condição inical e com a qual a trajetória do sistema colide elastica-
mente.

Exercı́cios
1. Mostre que V (q, p) = p do Exemplo 1.1, é constante ao longo
das trajetórias do bilhar no cı́rculo.
2 2 2
2. Mostre que V (q, p) = q1−ǫ−ǫ cos ν
2 cos2 ν do Exemplo 1.2, é constante

ao longo das trajetórias do bilhar na elipse.

i i

i i
“mec˙New”
i i
2011/10/11
page 17
i i

Capı́tulo 2

O Teorema Ergódico e a
Hipótese de Boltzmann

Nesta seção vamos apresentar de maneira suscinta o Teorema Ergódico


e algumas de suas conseqüências. Primeiramente vamos apresentar o
Teorema Ergódico com tempo discreto e mais para o fim desta seção
o Teorema Ergódico com tempo contı́nuo.
Informamos ao leitor que o objetivo da presente seção é apenas
apresentar idéias e descrever resultados interessantes. Referimos para
os excelentes textos [M] e [KH] para a fundamentação matemática
rigorosa do que segue abaixo. O autor do presente livro escreveu
também notas [L2] onde estes tópicos são apresentados com todo
rigor matemático.
Ao fim da presente seção, o Exemplo 2.15 é um dos mais im-
portantes deste texto. Neste exemplo, mostraremos que sob certas
condições, vale a hipótese de Boltzmann (ver considerações a seguir)
em torno de um ponto de equilı́brio de um sistema integrável.
Como vimos anteriormente quando analisamos o bilhar na Seção
1, o entendimento do comportamento das órbitas do fluxo Hamilto-
niano
H(q1 , q2 , p1 , p2 ) = p21 + p22
restrito a um recipiente delimitado por uma curva C (na qual exis-

17

i i

i i
“mec˙New”
i i
2011/10/11
page 18
i i

18 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

te um rebote quando a órbita colide com a curva) pode ser obtido


pela iteração de uma aplicação T induzida em uma seção transversal
bidimensional E (pelo primeiro retorno). Vamos apresentar um re-
sultado matemático que vai possibilitar entender melhor a evolução
temporal de tal sistema mecânico. Lembre que o difeomorfismo T
induzido pelo bilhar em C preserva área, pois é obtido através de
uma aplicação geradora S (ver Proposição 1.2 e Lema 11.1, Capı́tulo
3 [L]).

Definição 2.1. Uma probabilidade P definida em um conjunto aberto


X do Rn é uma lei que associa a cada subconjunto A ⊂ X um valor
P (A) ∈ [0, 1].
Uma probabilidade deve satisfazer também as seguintes proprie-
dades:
1) P (∅) = 0 (∅ é o conjunto vazio)
2) P (X)
 = 1. 
P∞
3) P ∪∞ i=1 Ai = i=1 P (Ai ) se os conjuntos Ai forem todos

disjuntos.

Na Seção 10 do Capı́tulo 3 (ver Exemplo 51 em [L]), introduzimos


um caso particular de probabilidade. Outras serão consideradas a
seguir.

Observação 2.1. Não dissemos nada a respeito da classe de subcon-


juntos A de X onde está definido tal probabilidade P .
P precisa ser definida numa sigma-algebra (ou seja, uma coleção
de conjuntos F tal que
a) X ∈ F,
b) se A ∈ F então X − A ∈ F
e c) para toda coleção enumerável An ∈ F vale que ∪n An ∈ F).

Para não entrar em detalhes técnicos, vamos apenas esclarecer


que muitas vezes que nem todos os subconjuntos A terão um valor de
probabilidade P (A). Felizmente, os conjuntos A que tem importância
no desenvolvimento que segue terão sempre um valor bem definido
de probabilidade. O leitor interessado na formalização matemática
de tais conceitos, que envolvem Teoria da Medida, sigma-álgebras,

i i

i i
“mec˙New”
i i
2011/10/11
page 19
i i

19

Figura 2.1:

etc..., podem encontrar uma ótima exposição do assunto em [Fe] e


[Rud].
A classe de subconjuntos A que vamos necessitar utilizar aqui
(e que terão um valor bem definido de probabilidade) incluem entre
outros os abertos com bordo diferenciável por partes.
Nosso ponto de vista aqui será apenas dar uma idéia dos conceitos
principais sem entrar em detalhes matemáticos mais sofisticados.
Vamos descrever brevemente agora que tipo de probabilidades P
vamos considerar a seguir.
Considere X ⊂ Rn , subconjunto aberto limitado com o bordo
constituido por uma curva diferenciável por partes, e uma função
continua não negativa ψ definida em X, tal que
Z Z
ψ(x)dx = ψ(x)dx1 dx2 ...dxn = 1.
X X

Se A for um conjunto aberto A ⊂ X com o bordo definido por


uma curva diferenciável por partes, Rutilizando a definição usual de
integral do Cálculo a várias variáveis, A ψ(x)dx existe e vamos definir

i i

i i
“mec˙New”
i i
2011/10/11
page 20
i i

20 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

Figura 2.2:

aR probabilidade P = Pψ sobre conjuntos A desta forma por P (A) =


A
ψ(x)dx.
É fácil ver que P satisfaz as leis 1) 2) 3) da Definição 2.1 acima,
para a coleção dos abertos A ⊂ X com bordo diferenciável por partes
(e suas uniões contáveis).
Desta maneira obtemos a partir de ψ uma probabilidade P = Pψ
definida em X associando valores P (A) a subconjuntos abertos A de
X com bordo diferenciável por partes.
Por exemplo, para um paralelepı́pedo B = (a1 , b2 )×(a2 , b2 )×...×
Rb Rb
(an , bn ) ⊂ X ⊂ Rn , obteremos que P (B) = a11 ... ann ψ(x)dx1 ...dxn .
As probabilidades P que estaremos interessados nesta seção serão
sempre do tipo acima descrito P = Pψ . ψ será denominada densidade
da probabilidade P = Pψ . Se ψ é constante diremos que Pψ é a
“probabilidade uniforme”em X. Neste caso,

área de A
P (A) = .
área de X
Fixada uma probabilidade P , a classe de conjuntos A ⊂ X so-
bre os quais necessitamos definir o que seria a probabilidade P (A),

i i

i i
“mec˙New”
i i
2011/10/11
page 21
i i

21

Figura 2.3:

no entanto, deve ser maior do que a classe dos abertos com bordo
diferenciável por partes. Será necessário por exemplo, no Teorema
Ergódico, falar sobre certos conjuntos A que não são abertos, mas
tem relevância no entendimento da evolução temporal do sistema.
Estes conjuntos serão denominados de conjuntos de probabilidade
total.
Muitos dos resultados que apresentaremos a seguir valem para
probabilidades mais gerais P (não só do tipo Pψ ), mas para não
entrarmos em problemas técnicos desnecessários, vamos considerar
apenas probabilidades deste tipo.
Definição 2.2. Dada uma probabilidade P em X, dizemos que um
conjunto A ⊂ X ⊂ Rn tem probabilidade zero para P se para qualquer
ǫ existe uma sequência de paralelepı́pedos
P∞ Bi , i ∈ N contidos em
X ⊂ Rn tal que A ⊂ ∪∞ i=1 Bi e i=1 P (B i ) < ǫ.
Para conjuntos A deste tipo, será verdade que P (A) = 0 (ver [Fe]
e [Rud]).
O critério de mostrar que um certo conjunto tem probabilidade
zero, mostrando que satisfaz a Definição 2.2 é extremamente útil.
Exemplo 2.1. Considere a probabilidade uniforme em [0, 1], que
atribui probabilidade b − a para todo intervalo [a, b] ⊂ [0, 1]. Para
esta probabilidade o conjunto dos racionais em [0, 1], isto é Q ∩ [0, 1]
(ou qualquer conjunto enumerável) tem probabilidade zero. Isto segue

i i

i i
“mec˙New”
i i
2011/10/11
page 22
i i

22 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

do fato que, dado ǫ, os conjuntos da forma Biǫ = Bi , i ∈ N


  i 
1 ǫ
Bi = x ∈ [0, 1] | |x − qi | <
2 2
cobrem Q, onde qi ∈ Q∩[0, 1], i ∈ N é uma enumeração dos racionais
em [0, 1]. Note que o comprimento total coberto pela união dos Bi , i ∈
N, é menor que ǫ qualquer dado.
Dada a probabilidade P = Pψ em X, a integral
R de uma função ϕ :
X → R com respeitoR a P , é por definição X ϕ(x)ψ(x)dx, expressão
que é denotada por ϕ(x)dP (x). R
Dado um conjunto A vale sempre que IA (x)dP (x) R = P (A)
R
Se P é a probabilidade uniforme em X, então ϕ(x)dP (x) =
ϕ(x)dx
X
.
área de X
Exemplo 2.2. Conjuntos de probabilidade zero aparecem natural-
mente na Teoria das Séries de Fourier. Suponha que duas funções f
e g são iguais em todos os pontos do intervalo [0,1], menos num con-
junto A de probabilidade uniforme 0 (no qual podem eventualmente
R1 R1
ser distintos), sendo assim, 0 f (x)dx = 0 g(x)dx. Este fato segue
facilmente da definição de integral (ver [Li1] e [Fe]). Concluı́mos
então que duas funções que diferem apenas num conjunto de medida
zero tem a mesma integral com respeito a dx.
Como as funções f (x)ei2πxn e g(x)ei2πnx também são iguais em
todos os pontos do intervalo (0, 1), menos num conjunto A de proba-
bilidade 0, então
Z 1 Z 1
i2πxn
f (x)e dx = g(x)ei2πnx dx.
0 0

Logo as duas funções f e g como acima possuem a mesma série


de Fourier, porque possuem os mesmos coeficientes de Fourier:
Z 1 Z 1
1 i2πxn 1
f (x)e dx = g(x)ei2πxn , ∀n ∈ Z.
2π 0 2π 0
A recı́proca também é verdadeira: duas funções que tem todos os
coeficientes de Fourier iguais são iguais a menos de um conjunto de
probabilidade dx nula.

i i

i i
“mec˙New”
i i
2011/10/11
page 23
i i

23

Logo, a Série de Fourier, não distingue uma f e g que são iguais


a menos de um conjunto de probabilidade uniforme zero.

Exemplo 2.3. Seja X = [0, 1] × [0, 1]. Se P (A) = área de A, para


cada A ⊂ [0, 1] × [0, 1] (esta probabilidade como vimos antes é cha-
mada de uniforme), então um conjunto tem probabilidade zero para
P , se puder ser coberto por uniões de retângulos tal que a soma das
áreas destes retângulos pode ser tomada arbitrariamente pequena.

Exemplo 2.4. Considere em X = [0, 1] o conjunto A obtido da se-


guinte maneira. Primeiro retire o terço central do intervalo [0,1],
a seguir retire dos dois intervalos que sobraram os terços do meio.
Obteremos assim 4 intervalos. Retire novamente de cada um dos
4 intervalos os terços médios e prossiga assim indefinidamente. Na
etapa n teremos ao todo 2n intervalos disjuntos. O conjunto que sobra
deste procedimento de retirar infinitamente terços dos intervalos que
vão sobrando, é mostrado de maneira aproximada na Figura 2.3. Este
conjunto é denominado conjunto de Cantor. Considere a probabili-
dade P tal que P ([a, b]) = b − a para qualquer intervalo [a, b] ⊂ [0, 1].
O conjunto de Cantor tem probabilidade 0 para tal P . Para provar
isto, basta cobrir o conjunto de Cantor por união de intervalos tal
que a soma dos intervalos é arbitrariamente pequena.

Note que os 2n intervalos que restam do procedimento na etapa


n
n, contem C e tem soma total dos comprimentos igual a 2n 31 . Como
2n
3 converge a zero, então o conjunto de Cantor tem probabilidade
zero em [0,1] para a probabilidade uniforme.
O conjunto de Cantor não é um conjunto aberto. Como o conjunto
de Cantor tem probabilidade zero é portanto um conjunto “ralo”(ou
seja, muito pequeno) no intervalo [0, 1]. Este conjunto é o exemplo
mais elementar de fractal (ver definição em [Fa]).
Note que foi fundamental usar o critério da Definição 2.2 para
dizer que o conjunto de Cantor tem probabilidade zero.
Os conjuntos de probabilidade zero são considerados desprezı́veis
na análise probabilı́stica. Ou seja, se uma propriedade é válida para
todos os pontos de E, menos para um conjunto de probabilidade zero,
então do ponto de vista probabilı́stico tal propriedade é verdadeira.
Se escolhessemos um ponto ao acaso no intervalo [0,1] de acordo com

i i

i i
“mec˙New”
i i
2011/10/11
page 24
i i

24 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

a Probabilidade P do último exemplo, este ponto não estaria no con-


junto de Cantor, pois este conjunto tem probabilidade 0.

Definição 2.3. Para uma certa probabilidade P definida em X, di-


zemos que um conjunto B tem probabilidade total para P se X − B
tem probabilidade zero para P .

Exemplo 2.5. O conjunto dos irracionais no intervalo [0,1], isto


é o conjunto [0, 1] − Q, tem probabilidade total para a probabilidade
uniforme, pois Q ∩ [0, 1] tem probabilidade zero.

Diz-se que uma propriedade é válida em P -quase toda parte, se


ela é válida num conjunto de probabilidade total para P . Quando se
diz que um ponto x é escolhido ao acaso segundo um probabilidade
P , x é na verdade ao acaso dentro de um conjunto de probabilidade
total B. Este ponto de vista (ou seja se preocupar apenas com o que
é verdadeiro P -quase toda parte) é a essência da Teoria da Probabi-
lidade.

Definição 2.4. Um ponto x escolhido num conjunto de probabili-


dade total é denominado de um ponto “genérico no sentido proba-
bilı́stico”(para a probabilidade P ).

Nosso objetivo a seguir é analisar do ponto de vista estatı́stico (ou


probabilı́stico) a evolução temporal da órbita T n (x) de um difeomor-
fismo T : X → X. Iremos considerar uma probabilidade P sobre X
e tentaremos fazer afirmações que tenham sentido do ponto de vista
probabilı́stico. Isto é, o que se pode dizer para as órbitas T n (x) se
x for escolhido num conjunto de probabilidade total para P ? Em
outras palavras, desejamos obter propriedades das órbitas T n (x) de
pontos x escolhidos ao acaso de acordo com a probabilidade P (ou
seja pontos x genéricos).
As probabilidades P que são úteis para o entendimento da evolução
temporal das órbitas T : X → X, devem ter algum tipo de relação
com T .
Esta relação será descrita pela próxima definição.

Definição 2.5. Dizemos que P probabilidade sobre X é invariante


para um difeomorfismo T se P (T (A)) = P (A) para qualquer conjunto
A ⊂ X.

i i

i i
“mec˙New”
i i
2011/10/11
page 25
i i

25

Exemplo 2.6. Na última seção mostramos que o difeomorfismo T


associado ao bilhar convexo preserva área em E = [0, 1) × (−1, 1)
(Proposição 1.2, Capı́tulo 1). Logo, se P é definido por
área de A
P (A) = ,
2
então P é invariante para tal T . Neste caso a densidade ψ(t, θ) = 21 ,
define Pψ = P .
Note que no caso da Figura 2.1 (bilhar dispersor) tı́nhamos difi-
culdade em definir T : E → E porque algumas trajetórias T (t0 , θ0 )
poderiam bater numa quina. Como estamos utilizando um ponto de
vista probabilı́stico ficaremos satisfeitos se T estiver bem definido em
um subconjunto K ⊂ E de P -probabilidade total. Em muitos casos
tal propriedade é verdadeira e a análise dinâmica que faz sentido será
na verdade de T : K → K (ver [Ma]).
No caso do bilhar dispersor (ou outro qualquer com quinas) con-
sidere L = {(q0 , p0 )| tal que T (q0 , p0 ) bate numa quina ou p1 = 1
ou −1 } (ou seja a reta a partir de q com ângulo p intersecta uma
quina ou fica tangente a um lado). É fácil ver que nos casos mais co-
muns o conjunto L é uma curva diferenciável por partes e tem medida
bidimensional em E nula.
Considere agora K = E − ∪n∈Z T n L. É fácil ver que em K todos
os iterados de T n estão bem definidos e perdemos do conjunto E um
conjunto de medida 0 (pois P (E) = P (K) = 1). Nada foi perdido do
ponto de vista probabilı́stico com esta restrição.
Exemplo: Seja T (x) = x + λ (mod 1), T : [0, 1] → [0, 1], onde
λ é uma constante, então a probabilidade uniforme (ou seja dx) é
invariante para T . Isto segue trivialmente do fato que a inclinação
do gráfico de T é 1, logo para cada intervalo A a imagem T (A) tem
o mesmo comprimento total (pode ser a união de dois intervalos)
que A.
Considere agora uma função ϕ : E → R, que na maioria das vezes
vai representar algum observável do sistema (por exemplo, o valor da
posição t (neste caso ϕ(t, θ) = t) na curva C do bilhar considerado
na seção anterior).
Ao longo da evolução temporal do sistema começando em x (ou
seja, a órbita {x, T (x), T 2 (x), ..., T n (x), ...} começando no ponto x ∈

i i

i i
“mec˙New”
i i
2011/10/11
page 26
i i

26 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

Figura 2.4:

E) estaremos interessados em calcular o valor médio de ϕ, denotado


por
1
ϕm (x) = (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)))
m
ao longo da órbita de x do tempo 0 até o tempo m − 1.
Fazendo o número de iterações m tender a infinito, obteremos a
média assintótica média do observável ϕ ao longo da evolução tem-
poral iniciada em x:
1
ϕ̂(x) = lim (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x))).
m→∞ m

Estaremos assim obtendo uma informação de natureza assintótica


desta evolução temporal. Um dos tópicos de maior interesse da
Mecânica Estatı́stica é saber o que acontece em termos probabilı́sticos
(em x) com as médias temporais ϕ̂(x) e sua dependência em x.
O fı́sico L. Boltzmann estava interessado em entender o sistema
de partı́culas (da ordem de 1023 partı́culas) de um gás delimitado por

i i

i i
“mec˙New”
i i
2011/10/11
page 27
i i

27

um recipiente fechado. Um sistema com tantas partı́culas é difı́cil de


ser analisado do ponto de vista determinı́stico. O sistema com ape-
nas “uma”partı́cula colidindo elasticamente com a fronteira de uma
região bidimensional que apresentamos na seção anterior já apresenta
dificuldades de análise determinı́stica como vimos anteriormente (ver
Observação 1.1, Capı́tulo 1 em [L]). Prever a evolução temporal de
uma partı́cula após decorrido em tempo t muito grande é muito difı́cil
(devido a acumulação de erros nas aproximações), imagine analisar
um número enorme de partı́culas (1023 ) como acontece em um gás
em um compartimento fechado. Sendo assim, faz mais sentido, per-
guntar sobre a probabilidade de encontrar uma partı́cula numa região
D do recipiente. Este é o ponto de vista probabilı́stico da Mecânica
e que é o objeto da Mecânica Estatı́stica. Estaremos interessados em
fazer afirmações para pontos x “genéricos no sentido probabilı́stico”.
Para fixar idéias vamos considerar a evolução temporal
{T (x), T 2 (x), ..., T n (x)}
quando x = (q, p) descreve a posição de “uma”partı́cula de um gás
que está em q com velocidade p. Considere agora ϕ um observável do
sistema (θ, ou temperatura, etc...), isto é, ϕ é uma função do espaço
de fase x = (q, p) ∈ E tomando valores em R. O que se pode dizer
do valor médio ϕ̂(x)?
A Hipótese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann, que foi enunciada por L. Boltzmann no meio do século
XIX, afirmava que fixado um nı́vel de energia H0 , este valor ϕ̂(x) não
deveria depender de x neste nı́vel de energia H0 (no caso de um gás
num recipiente fechado).
Bem, a referida hipótese em termos tão amplos não resultou ser
verdadeira. Primeiro, vamos tentar entender em termos Matemáticos
mais precisos o que L. Boltzmann estava querendo afirmar com a sua
Hipótese Ergódica. Mais tarde, tentaremos esclarecer o que não foi
confirmado de tal hipótese.
Em termos matemáticos mais precisos, o que L. Boltzmann estava
afirmando, na verdade, é que deve existir uma probabilidade natural
P definida no nı́vel de energia X = {(q, p), H(q, p) = H0 }, tal que
dado uma função ϕ sobre X, deveria existir uma constante c tal que
para P -quase todo ponto x no conjunto X (o nı́vel de energia H0 ), o

i i

i i
“mec˙New”
i i
2011/10/11
page 28
i i

28 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

valor ϕ̂(x) é igual a c. P seria uma probabilidade natural invariante


associada ao sistema de partı́culas de um gás. Ou seja, que existiria
um conjunto B contido no nı́vel de energia H0 tal que P (B) = 0 e
para qualquer x ∈ X − B, deveria ser verdade que ϕ̂(x) = c. Em
outras palavras, que ϕ̂ é constante para pontos genéricos no sentido
probabilı́stico.
O Teorema de Birkhoff que será apresentado a seguir vai se referir
a questão mencionada acima.
A evolução temporal das condições iniciais x que são fisicamente
observadas no sistema constituido pelo gás são as trajetórias que
começam em x, onde x é escolhido num conjunto de probabilidade
total em relação a uma probabilidade natural P . Esta propriedade é o
fundamento do ponto de vista probabilı́stico da Mecância Estatı́stica.
A probabilidade P é chamada algumas vezes de estado de Gibbs
(terminologia usada em homenagem ao matemático W. Gibbs) do
sistema mecânico (ver [Ru], [E], [BS] e [KH] para referências). Para
simplificar estamos supondo que o gás vai ser descrito por uma única
partı́cula para evitar analisar problemas relativos às colisões entre
partı́culas do gás.
Não vamos definir aqui o que é um estado de Gibbs, mas queremos
apenas mencionar que no caso do bilhar numa curva convexa ele é
a probabilidade uniforme em E = [0, 1) × (−1, 1) (conforme Exem-
plo 2.6).

Definição 2.6. Seja P uma probabilidade invariante para um dife-


omorfismo T : X → X. Dizemos que P é ergódica se toda vez que
T (A) = A, A ⊂ X, então P (A) = 0 ou P (A) = 1.

Em outras palavras, uma probabilidade P é ergódica quando não


existem conjuntos invariantes pela ação de T que não sejam triviais
(dizemos que um conjunto A ⊂ X é trivial se P (A) = 0 ou P (A) = 1).

Observação 2.2. Note que é sempre verdade (ver Definição 1.2) que
P (∅) = 0 (∅ é o conjunto vazio) e P (X) = 1 (onde X é o conjunto
onde P está definido), e ainda que T (∅) = ∅ e T (X) = X, por
isto a necessidade de enunciar a definição de probabilidade ergódica
como foi feito acima (e não apenas dizendo que não existem conjuntos
invariantes). Os conjuntos X e ∅ são triviais.

i i

i i
“mec˙New”
i i
2011/10/11
page 29
i i

29

Figura 2.5:

Exemplo : A transformação T (x) = x + λ (mod 1), onde λ é uma


constante irracional, T definida no intervalo [0, 1) (ou no cı́rculo S 1 )
é ergodica para dx.
Seja A tal que T −1 (A) = A, então IA (x) = IT −1 (A) (x) = IA (T (x))
para todo x ∈ [0, 1).
Expresse IA (x) como Série de Fourier

X
IA (x) = an e2πinx .
n=−∞

Como IA (x) = IA (T (x)) temos que



X ∞
X
IA (x) = an e2πinx = an e2πin(x+λ) = IA (T (x)).
n=−∞ n=−∞

Portanto

X ∞
X
an e2πinx = an e2πinλ e2πinx .
n=−∞ n=−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 30
i i

30 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

Como os coeficientes de Fourier são únicos an e2πinλ = an para


todo n ∈ Z. Como λ é irracional então nλ não é inteiro para todo
n (a menos que n = 0). A conclusão é que an = 0 para todo n 6= 0.
Portanto IA is constante (a menos de um conjunto de medida zero),
mas como só assume os valores 0 ou 1, ela é, a menos de um conjunto
de medida
R zero a função
R constante 0 ou a função
R constante
R 1. Logo
µ(A) = IA (x)dx = 0dx = 0 ou µ(A) = IA (x)dx = 1dx = 1
(porque funções que diferem apenas em um conjunto de medida zero
tem a mesma integral).
Se λ é racional T (x) = x + λ (mod 1) não é ergodica.
Observação 2.3. Um gás em um recipiente fechado, ao longo da sua
evolução temporal, tenderá a ocupar densamente todo o espaço dis-
ponı́vel, não deixando espaço para existirem regiões invariantes. Esta
observação traduz em termos fı́sicos aproximados o que o conceito de
ergodicidade expressa em termos matemáticos.
O fato da transformação bilhar preservar área e do fluxo Hamil-
toniano preservar volume os qualificam para os métodos de Teoria
Ergódica [A3].
Seja um difeomorfismo T : E → E, P = Pϕ probabilidade inva-
riante sobre E para T e ϕ : E → R função tomando valores reais
(observável). O próximo resultado é válido em geral e não precisare-
mos assumir que T é a transformação induzida pelo primeiro retorno
a uma seção transversal de um fluxo Hamiltoniano no bilhar convexo.
Um dos resultados Matemáticos mais relevantes para a Mecânica
Estatı́stica é o Teorema Ergódico de G. Birkhoff (1935) que afirma o
seguinte:
Teorema 2.1. (Teorema de Birkhoff ) Seja ϕ : E → R contı́nua,
R = Pψ probabilidade ergódica para T : E → E e suponha que
P
ϕ(y)dP (y) < ∞, então, existe c ∈ R tal que para todo ponto x,
genérico no sentido probabilı́stico em relação a probabilidade P , vale
que
1
c = ϕ̂(x) = lim (ϕ(x) + ... + ϕ(T m−1 (x))).
m→∞ m

O valor c pode ser obtido como


Z
c = ϕ(y)dP (y),

i i

i i
“mec˙New”
i i
2011/10/11
page 31
i i

31

ou seja, a integral de ϕ em relação a P .


Para a prova e para considerações mais gerais sobre o Teoria
Ergódica, referimos o leitor para [PY], [M1], [CFS] e [KH]. Esta Te-
oria permite um melhor entendimento de questões fundamentais da
Mecânica Estatistica [PP] e [Ru]. O ponto de vista do formalismo
DLR da Mecânica Estatistica é descrito em [G].
Em resumo o teorema de Birkhoff diz que existe um conjunto A
tal que P (A) = 1 tal que para todo x ∈ A vale que a média temporal
assintótica
n−1
1 X
ϕ̂(x) = lim ϕ(T j (x))
m→∞ m
j=0

é igual à integral espacial


Z Z
ϕ(y)dP (y) = ϕ(y)ψ(y)dy.
E

Observação: Mostramos em exemplo anterior que T (x) = x + λ


(mod 1) é ergódica para a probabilidade uniforme (a P tal P ([a, b]) =
b − a). É fácil ver por indução que T n (x) = x + nλ (mod 1). Seja
[a, b] intervalo qualquer e considere ϕ(x) = I[a,b] (x).
Podemos aplicar o teorema ergódico também neste caso e concluir
que existe K ⊂ [0, 1] tal que P (K) = 1 e para todo x ∈ K
n−1 Z
ˆ (x) = lim 1 X
I[a,b] I[a,b] (T j (x)) = I[a,b] (y)dP (y) = b − a > 0.
m→∞ m
j=0

Note que T j (x) ∈ [a, b], se e só se, I[a,b] (T j (x)) = 1. Portanto,
para x ∈ K a órbita {T n (x)|n ∈ Z} visita o conjunto [a, b].
Logo as órbitas {T n (x)|n ∈ Z}, para x quase todo ponto (em
relação a P ), vão determinar conjuntos densos em [0, 1].

Exemplo 2.7. Considere o estádio circular (l > 2) do Exemplo 1.4


e que foi descrito na seção anterior.
Um resultado não trivial obtido recentemente por [Bu] afirma que
a probabilidade natural P (a área) associada ao bilhar no estádio é
ergódica, isto é, a aplicação induzida no bordo pelo primeiro retorno

i i

i i
“mec˙New”
i i
2011/10/11
page 32
i i

32 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

T : [0, 1) × (−1, 1) → [0, 1) × (−1, 1) é ergódica para a probabilidade


uniforme.
Considere a, b valores em [0,1) e ϕ : E → R a função indicador
de A = (a, b) × (−1, 1).
Para A um subconjunto de X, IA (z), a função indicador de A, é
a função tal que IA (z) = 1 se z ∈ A e IA (z) = 0 se z não está está
em A. R R
É fácil ver que IA (x)ψ(x)dx = A ψ(x) = P (A).
No caso em consideração neste exemplo de bilhares em E = [0, 1)×
(−1, 1) ψ(x) é constante igual a 1/2.
A função ϕ = IA não é contı́nua (tem descontinuidades numa
curva diferenciável por partes), mas o Teorema Ergódico também é
válido para tal tipo de função ϕ (ver [M1] e [CFS]).
É fácil ver que para x fixo e m ∈ N e ϕ = IA
1
(ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x))
m
é igual a
#{j ∈ {0, 1, ..., m − 1} tal que T j (x) ∈ (a, b) × (−1, 1)}
.
m
Sendo assim o limite
1
ϕ̂(x) = lim (ϕ(x) + ϕ(T (x)) + ... + ϕ(T m−1 (x)) ),
n→∞ m

neste caso expressa o valor médio de vezes que a trajetória começando


em x bate na região do bordo do bilhar compreendida entre g(a) e g(b),
(onde g é a parametrização do bordo do bilhar). Neste caso ϕ̂(x)
vai descrever o que chamamos de tempo de ocupação assintótico da
região A.
O conceito de tempo de ocupação já foi apresentado antes na
Definição 25, Capı́tulo 3 [L], mas vamos repeti-lo a seguir.
Definição 37*: Considere T : E → E difeomorfismo, A ⊂ E e
x = (q, p) ∈ E. Dizemos que x tem um tempo de ocupação assintótico
de A igual a ôA (x) se existe o limite
# vezes que T j (q, p) ∈ A, j ∈ {1, 2, ..., n}
lim = ôA (x).
n→∞ n

i i

i i
“mec˙New”
i i
2011/10/11
page 33
i i

33

O valor c = ϕ̂(x) = IˆA (x) = ôA (x) é constante para todo x (fora
de um conjunto de R probabilidade 0) pelo Teorema de Birkhoff, e é
R IA dP
igual a ϕdP = 2 = P (A) = área de A = (b − a). Portanto,
graças ao Teorema Ergódico podemos calcular no Exemplo 2.7 o valor
exato do tempo de ocupação assintótica ôA (x) do conjunto A para x
quase toda parte; este valor é b − a.
Sendo assim, podemos fazer a seguinte previsão: no bilhar no
estádio com l = 2 (que é ergódico), se formos observar a partı́cula
depois de 1000 rebotes, dentre estes 1000 rebotes, aproximadamente
um número (b − a)1000 deles foram no arco de curva compreendido
entre g(a) e g(b).
Vamos relembrar agora a Definição no Capı́tulo 1 de ponto perió-
dico.
Dizemos que uma órbita {T n (q, p), n ∈ N} é periódica se existe
m ∈ N tal T m (q, p) = (q, p). Neste caso
{T n (q, p) , n ∈ N} = {(q, p), T (q, p), ..., T m−1 (q, p)}.
O valor m é denominado perı́odo de (q, p).
Observação 2.4. Note que o resultado sobre o tempo de ocupação
ôA (x) = ϕ̂(x) no estádio l > 0 não pode ser verdade para tôdas
as condições iniciais x = (q, p). Na Figura 1.5, mostramos duas tra-
jetórias a e b na parte interna do estádio, que correspondem à órbitas
periódicas para T de perı́odo dois, respectivamente {(qa , pa ), T (qa , pa )}
e {(qb , pb ), T (qb , pb )}. Na Figura 1.6 mostramos também no espaço
de fase (q, p) ∈ [0, 1) × (−1, 1) as duas órbitas acima mencionadas.
Estas órbitas naturalmente vão determinar tempos de ocupação dife-
rentes para o conjunto A que aparece na Figura 3.25. O tempo de
ocupação assintótico de A para a órbita a é zero e para a órbita b é
um.
Note que o comportamento desta duas trajetórias é totalmente
distinto do comportamento da trajetória descrita pela Figura 1.7 apre-
sentada na última seção. Para “qualquer ponto inicial x escolhido ao
acaso” de acordo com a probabilidade uniforme, a órbita T n (x) gera
a Figura 1.7.
Não existe contradição entre a Figura 1.7 e 1.6, pois no úlimo
caso a posição da condição inicial (q0 , p0 ) é muito particular, e esta

i i

i i
“mec˙New”
i i
2011/10/11
page 34
i i

34 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

fora do conjunto de probabilidade total para o qual vale o Teorema


de Birkhoff. A explicação para este fato é que estas duas condições
iniciais (qa , pa ) e (qb .pb ) não serão condições “genéricas”no sentido
estabelecido pela Definição 2.4 e pelo Teorema Ergódico. No entanto,
se escolhermos ao acaso (de acordo com P uniforme) a condição
inicial (q0 , p0 ), então (q0 , p0 ) será genérica e portanto vai satisfazer
a propriedade que o tempo ocupação ôA para um certo conjunto A
fixado, existe e independe da condição inicial. Isto é o que afirma o
Teorema Ergódico para ϕ = IA !
É importante destacar que na análise matemática e probabilı́stica
dos bilhares, as órbitas periódicas (principalmente as de perı́odo muito
alto) desempenham um papel importantı́ssimo no entendimento da
dinâmica das trajetórias.
Exemplo 2.8. No caso do sistema de duas partı́culas

x = (x1 , x2 , v1 , v2 )

que foi considerado no Exemplo 13 da Seção 4, Capı́tulo 1 [L], existe


um conjunto A denso (ver Definição 13, Capı́tulo 1 [L]) em R2 tal
que quando as massas m1 e m2 são tais que (m1 , m2 ) ∈ B, então é
possı́vel mostrar (ver [KMS]) que a probabilidade natural P associada
ao bilhar triangular é ergódica.
Logo, no caso em que (m1 , m2 ) ∈ A, as médias ϕ̂(x) para qualquer
função contı́nua ϕ definida sobre o bilhar triangular são as mesmas,
independentes da condição inicial x (contanto que x seja escolhido
ao acaso de acordo com a probabilidade P ).
Podemos portanto, analogamente ao procedimento do exemplo an-
terior, obter o valor exato ôB , onde B corresponde ao evento: a
posição x1 e x2 ao colidirem estão no intervalo (0.2, 0.5). Do Te-
orema Ergódico segue que ôB = P (B) e ôB independe de x (para
x num conjunto de probabilidade total). O valor ôB pode então ser
calculado facilmente

a partir de P .
m2
Quando m1 ∈ Q, o sistema acima considerado não é ergódico.

Acreditamos que com estes dois últimos exemplos tenha ficado


transparente a importância do Teorema Ergódico de Birkhoff para a
análise de propriedades estatı́sticas das órbitas dos fluxos Hamiltoni-
anos.

i i

i i
“mec˙New”
i i
2011/10/11
page 35
i i

35

Note que se P é ergódica e é sempre positiva em abertos então para


x P-quase toda parte a órbita {x, T (x), .., T n (x), ...} é um conjunto
denso; de fato, dado um aberto A como P (A) > 0 então
Z
0 < P (A) = IA (x)dP (x) = oA (x) =

1
lim (IA (x) + IA (T (x)) + ... + IA (T m−1 (x)) ).
n→∞ m
Neste caso algum IA (T j (x)) é igual a 1.
Para um sistema ergódico, o Teorema de Birkhoff descreve a ma-
neira matemática exata como deve ser entendida a hipótese de Boltz-
mann.
A teoria de Kolmogorov-Arnold Moser (KAM) (ver [KH] e Seção
13, Capı́tulo 3 [L]) desenvolvido no meio deste século mostrou que
para uma grande quantidade de Hamiltonianos a propriedade da er-
godicidade não é válida. Vamos a seguir, através de um exemplo, dar
uma breve idéia porque não é verdade a Hipótese de Boltzmann em
sua formulação mais geral.
Consideraremos agora o bilhar no ovo (Exemplo 1.4, Capı́tulo 1)
e T a aplicação induzida no bordo do bilhar conforme mostra Figu-
ra 1.8.
Observação 2.5. No caso do bilhar no ovo, existe uma evidência
numérica de haver um união finita de curvas fechadas invariantes
γi , i ∈ {1, .., n} para T (ver Figura 1.8), mostra claramente que tal T
não é ergódica. Isto porque
( [0, 1) × (−1, 1) ) − ∪i γi
possui um conjunto invariante de probabilidade uniforme positiva (por
exemplo a união das partes internas das γi ).
Isto pode ser observado numericamente em um computador, con-
siderando órbitas começando em condições iniciais que estão respec-
tivamente no interior e no exterior da curva.
Concluı́mos então que existe uma evidência numérica de que tal
sistema não é ergódico.
Este fato contraria então a Hipótese Ergódica de Boltzmann pois
T representa a evolução temporal de uma partı́cula de uma gás num
recipiente fechado.

i i

i i
“mec˙New”
i i
2011/10/11
page 36
i i

36 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

O leitor poderia argumentar que já para o bilhar no cı́rculo (Exem-


plo 1.2) o difeomorfismo T não é ergódico para a probabilidade uni-
forme em [0, 1) × (−1, 1) (uma linha horizontal l = (θ0 , t) invariante
por T determina em [0, 1) × (−1, 1) duas componentes invariantes
por T de medida uniforme não nulas). Para ser mais preciso, cabe
ressaltar que a Hipótese Ergódica de Boltzmann é em geral relaxada
e enunciada para um conjunto denso de possı́veis bordos de bilha-
res. O exemplo acima é persistente, isto é, para curvas diferenciáveis
convexas γ, que estão C 1 próximas da curva do ovo, o espaço de
fase da aplicação T induzida pelo bilhar em γ continua a determinar
curvas invariantes. Sendo assim, existem ao menos duas regiões bi-
dimensionais invariantes de probabilidade positiva e portanto pode-se
dizer que existem bilhares que não podem ser aproximados por bilha-
res tais que o correspondente T seja ergódico para a probabilidade
uniforme em [0, 1) × (−1, 1). Portanto, o exemplo do bilhar no ovo
nos parece indicar indicar numericamente que a Hipótese Ergódica
de Boltzmann não é verdadeira em geral. No exemplo do estádio cir-
cular da seção anterior, por usa vez, a hipótese é confirmada pois o
sistema é ergódico.
Na verdade não estamos mostrando matematicamente que a Hi-
pótese Ergódica de Boltzmann não é verdadeira, estamos apenas su-
gerindo através de exemplos e figuras obtidas no computador que
existe uma forte evidência numérica de que esta hipótese não é ver-
dadeira. Na Teoria KAM se obtem resultados matemáticos precisos
que mostram exemplos onde a hipótese não é verdadeira (ver [KH]).
Na Seção 3 vamos mostrar para aplicação “standard”a existência
de curvas invariantes, e assim dar uma demontração matemática de
que realmente a hipótese ergódica em alguns casos particulares não é
verdadeira.
Em alguns outros casos particulares importantes, no entanto, a
hipótese de Boltzmann resultou ser verdadeira como por exemplo em
variedades de curvatura constante negativa (ver [KH] e [A2]).
Vamos agora analisar o Teorema Ergódico para tempo continuo.
Definição 2.7. Considere para todo t (−∞ < t < ∞), uma trans-
formação St do espaço X em si mesmo, St : X → X, que satisfaça a
seguinte condição: para quaisquer t1 , t2 , St1 ◦ St2 = St1 +t2 . Chama-
remos tal famı́lia de um sistema dinâmico a tempo contı́nuo.

i i

i i
“mec˙New”
i i
2011/10/11
page 37
i i

37

Exemplo 2.9. Dada uma equação diferencial x′ = G(x), x ∈ Rn , o


fluxo φt associado a tal equação (conforme Definição 21, Capı́tulo 1
[L]) é um exemplo de um sistema dinâmico a tempo contı́nuo St = φt .
Exemplo 2.10. Considere α número real e defina St : R → R por
St (x) = x + tα, para todo real t. St é um sistema dinâmico a tempo
contı́nuo.
Exemplo 2.11. Considere α número real e defina St : [0, 1) → [0, 1)
por St (x) = x + tα (mod 1) para todo real t. Este sistema dinâmico
será muito importante em nossas futuras considerações.
Definição 2.8. A probabilidade µ é dita invariante em relação ao
sistema dinâmico {St } se, para todo conjunto B ⊂ X e para qualquer
t real, µ(St B) = µ(B).
Uma maneira equivalente de dizer que uma medida µ é invariante
para
R St : Para Rtoda função contı́nua φ e para todo t real vale que
φ(x)dµ(x) = φ(St (x))dµ(x).
O Teorema de Liouville (Teorema 4, Capı́tulo 3 [L]) mostra que
se φt é o fluxo associado a um Hamiltoniano H, então para todo t, e
para todo aberto A vale que área φt (A) = área de A.
Logo, neste caso, o sistema dinâmico St = φt deixa invariante a
probabilidade uniforme.
O Exemplo 33 do Capı́tulo 3 [L] mostra um exemplo de proba-
bilidade invariante sobre uma curva γ obtida através do tempo de
ocupação assintótico.
Exemplo 2.12. É fácil ver que o sistema dinâmico St do Exem-
plo 2.11 deixa invariante a probabilidade µ definida sobre [0,1) por
µ( [a, b] ) = b − a. Esta probabilidade, como vimos antes se chama
probabilidade uniforme em [0,1).
Dada uma órbita periódica γ(s), s ∈ [0, b], tal que γ(0) = γ(b)
defina a medida µ tal que para toda função contı́nua φ temos
Z Z b
φ(x)dµ(x) = φ(γ(s))ds.
0

A medida µ assim definida é invariante; de fato, para t fixo


Z Z b
φ(St (x))dµ(x) = φ(St (γ(s)))ds =
0

i i

i i
“mec˙New”
i i
2011/10/11
page 38
i i

38 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

Z b Z b
φ(St (Ss (γ(0)))ds = φ(St+s (γ(0)))ds.
0 0

Fazendo a mudança de variável s → s + t, obtemos


Z Z b Z b Z
φ(St (x))dµ(x) = φ(Ss (γ(0))ds = φ(γ(s))ds = φ(x)dµ(x).
0 0

Definição 2.9. O fluxo St é dito ergódico para µ se para todo con-


junto A ⊂ X tal que St (A) = A, ∀t ∈ R, então µ(A) = 0 ou µ(A) = 1.

Vamos agora considerar St = φt o fluxo associado a um campo de


vetores Hamiltoniano H em (q, p) ∈ R2n restrito a uma superfı́cie de
Hamiltoniano H constante.
Suponha que a superfı́cie S de energia constante H0 seja com-
pacta. Neste caso, como veremos na Seção 5, existe sempre uma
probabilidade invariante P para o fluxo Hamiltoniano φt restrito à su-
perfı́cie H(q, p) = H0 de Hamiltoniano constante. Esta probabilidade
k
P é a probabilidade P = PH0 = P k com densidade ψ = k∇Hk
k∇Hk
sobre H(q, p) = H0 (ver Seção 5) onde k é apenas uma constante
para normalizar a probabilidade P .
Tal probabilidade P definida sobre S é positiva em abertos de
S, ou seja, dado x ∈ S e ǫ > 0, então P (B(x, ǫ) ∩ S) > 0, onde
B(x, ǫ) = {y ∈ R2n | |x − y| < ǫ}.
Vamos tentar colocar a afirmação de Boltzmann de uma maneira
matematicamente mais precisa do que a que foi feita pelo mesmo no
século XIX.
A Hipótese Ergódica de Boltzmann: A Hipótese Ergódica de
Boltzmann para Hamiltonianos é análoga à anteriormente descrita
(no caso em que o tempo é discreto n ∈ N).
A Hipótese Ergódica para Hamiltonianos afirma que para todo va-
lor de energia H0 , PH0 é ergódico para o fluxo φt restrito a
H(q, p) = H0 .
É importante não confundir a ação de fluxo φt sobre o espaço
(q, p) ∈ R2n com a ação (restrita) do fluxo φt sobre uma superfı́cie
de Energia constante H0 .
A questão da validade ou não da Hipótese Ergódica de Boltzmann
influenciou sobremaneira a Fı́sica e a Matemática do século XX.

i i

i i
“mec˙New”
i i
2011/10/11
page 39
i i

39

Contra-exemplo 68: Lembre que o fluxo Hamiltoniano φt preserva


volume em R2n ou seja preserva a probabilidade uniforme em cada
subconjunto aberto limitado invariante X ⊂ R2n . A probabilidade
P em X = R2n neste caso não é ergódica para φt . Isto porque um
sistema com uma integral primeira não pode ser ergódico (lembre que
H é integral primeira) como veremos a seguir.
Se tomarmos o aberto limitado A ⊂ X (com probabilidade posi-
tiva para P portanto) dos pontos x ∈ R2n tal que E1 < H(x) < E2 ,
então o fluxo Hamiltoniano φt deixa A invariante pelo Teorema de
Conservação do Hamiltoniano e no entanto 1 > P (A) > 0. Logo, em-
bora o fluxo Hamiltoniano deixe invariante a probabilidade P , não é
verdade que P é ergódico para φt .
Outra questão de natureza distinta é: será que φt é ergódico
quando restrito a uma superfı́cie S de energia constante H0 ?
Teorema 2.2. (Teorema de Birkhoff) Seja um Sistema Dinâmico St
definido em X, preservando a probabilidade
R ergódicaR P = Pψ . Então
para toda função contı́nua f tal que X f (x)dP (x) = X f (x)ψ(x)dx <
∞, existe uma constante c e existe um conjunto B de probabilidade
total tal que para todo ponto x ∈ B
Z Z
1 t 1 t
c = lim f (Sτ x)dτ = lim f (S−τ x)dτ.
t→∞ t 0 t→∞ t 0

O valor c naturalmente depende de f e pode ser obtido como


Z Z
c= f (y)dP (y) = f (y)ψ(y)dy.
X X

Vamos recordar mais uma vez a definição de tempo de ocupação


assintótico (ver Seção 10, Capı́tulo 3 [L]), desta vez no caso de tempo
contı́nuo t ∈ R.
Definição 37**: Dado um conjunto A ⊂ X e uma condição inicial
x ∈ X, Z
1 t
lim IA (Sτ x)dτ = ôA (x)
t→∞ t 0

é chamado de tempo de ocupação assintótico de A começando em x.


Uma consequência importante do teorema anterior é que, no caso
de P ser ergódico para St , então para todo x em um conjunto B de

i i

i i
“mec˙New”
i i
2011/10/11
page 40
i i

40 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

probabilidade total para P , a órbita de x pelo sistema dinâmico St (x)


determina um tempo de ocupação assintótico de um conjunto aberto
qualquer A ⊂ X tal que ô(A)(x) = P (A).
Isto é verdade, porque pelo Teorema 2.2, dado um subconjunto A
e considerando f = IA acima obtemos
Z t Z
1
lim IA (Sτ x)dτ = IA (z)dP (z) =
t→∞ t 0 X

Z
= dP (z) = P (A) = c = constante
A

para x em um conjunto B de probabilidade total para µ.


Logo, se um sistema é ergódico, existe B tal que P (B) = 1 e para
x ∈ B o tempo de ocupação assintótico de um conjunto aberto A não
depende do valor x.
A analogia do Teorema Ergódico com tempo contı́nuo t ∈ R para
o Teorema Ergódico com tempo discreto n ∈ N visto anteriormente
é transparente.
Examinaremos, agora, um tipo importante de sistema dinâmico
com tempo contı́nuo: o grupo de translações a um parâmetro no toro.
Seja X =Torn = S 1 × S 1 × ... × S 1 (n fatores) o toro de dimensão
n. Um ponto desse espaço pode ser representado pelo sistema de
números complexos z = (z1 , z2 , ..., zn ), |zk | = 1, 1 ≤ k ≤ n. Note que
é possı́vel escrever zk = e2πixk (xk ∈ R); então, o mesmo ponto z pode
ser identificado com o sistema de números reais x = (x1 , x2 , ..., xn ) ∈
[0, 1)n , definidos mod 1 (neste caso, podemos assumir que 0 ≤ xk <
1). A primeira notação é conhecida como multiplicativa, e a segunda,
como aditiva.
Sendo assim iremos identificar o toro com o conjunto [0, 1)n onde
identificamos faces opostas do paralelepı́pedo. Definiremos o sistema
dinâmico das translações no toro Torn pela expressão

St z = (z1 e2πiλ1 t , z2 e2πiλ2 t , ..., zn e2πiλn t )

ou, equivalentemente, com

St x = (x1 + λ1 t( mod 1), x2 + λ2 t( mod 1), ..., xn + λn t( mod 1)),

i i

i i
“mec˙New”
i i
2011/10/11
page 41
i i

41

onde λ1 , λ2 , ..., λn são números reais fixos. Cada St é dita uma


translação no toro, e por isso {St } é chamado um grupo de translações
a um parâmetro em Torn , definido pelo vetor λ = (λ1 , λ2Q , ..., λn ).
n
Note que a probabilidade uniforme no toro dµ = k=1 dxk é
invariante em relação a {St }. Isto porque, como St (A) é apenas um
transladado de A, ∀A, então St (A) e A tem a mesma área. Logo St
n
preserva o volume dx R 1 ...dxn . Note que µ(Tor ) = 1. Sendo assim se
definirmos µ(A) = A dx1 ...dxn , a probabilidade uniforme µ resulta
ser invariante para o sistema dinâmico St em [0, 1)n .
O conjunto dos vetores a(t) = (e2πiλ1 t , e2πiλ2 t , ..., e2πiλn t ), −∞ <
t < ∞, define a trajetória do zero através da evolução temporal do
sistema dinâmico St .
O Sistema Dinâmico St acima definido é muitas vezes chamado
condicionalmente periódico, sendo λk (1 ≤ k ≤ n) suas frequências.

Exemplo 2.13. O exemplo mais simples de tais sistemas St foi


apresentado nos Exemplos 2.11 e 2.12: para α fixo, St (x) = x +
αt(mod1), α 6= 0. Neste caso a probabilidade invariante P é a proba-
bilidade uniforme em [0, 1). Uma pergunta natural é quando que P é
ergódica para tal St .

Vamos mostrar agora que tal P é sempre ergódica para tal St .

Observação 2.6. Pode-se mostrar (ver [M1]) que um fluxo {St }


Ré ergódico para µ, se e só se, vale que para toda função f tal que
X
f dµ <R ∞ e f (St (x)) = f (x) para todo x, então é porque f (x) =
const. = X f dµ para um conjunto de pontos x em um conjunto B
de probabilidade total para µ.

Vamos usar o resultado mencionado na observação acima para


mostrar que St é ergódico para a probabilidade uniforme.
Considere fixado um ponto x ∈ [0, 1). Observe que variando t,
St (x) percorre todos os valores possı́veis y do intervalo [0, 1). Logo,
para uma dada função f , f (St (x)) = f (x) significa que para todo
y ∈ [0, 1), f (y) = f (x). Logo f é constante. Sendo assim pela última
observação St é ergódico.
Vamos apresentar agora uma outra prova da ergodicidade da St
acima definida, e que vai motivar a demonstração do próximo teo-
rema. Considere um função f que seja invariante para St , ou seja,

i i

i i
“mec˙New”
i i
2011/10/11
page 42
i i

42 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

f (St (x)) = f (x) para qualquer x ∈ [0, 1). Escreva f em série de


Fourier X
f (x) = cs e2πisx .
s∈Z

Como f é invariante
X X
f (St (x)) = cs e2πis(x+αt) = cs e2πisαt e2πisx =
s∈Z s∈Z
X
= cs e2πisx = f (x).
s∈Z

Logo, concluı́mos pela unicidade da Série de Fourier de uma função,


que ∀s ∈ Z, ∀t ∈ R, cs e2πisαt = cs , ou seja que se cs 6= 0, para todo
t vale que e2πiαst = 1. Portanto α s = 0, e como α 6= 0, isto é im-
possı́vel a menos que s = 0. Portanto, cs = 0 para s 6= 0. Logo f é
constante em quase toda parte com relação a probabilidade uniforme
P pois sua série de Fourier é constante igual a c.
Logo, pela última observação St (x) = x + αt é sempre ergódico.
Será que St (x1 , x2 , .., xn ) = (x1 + λ1 t(mod1), ..., xn + λn t(mod1))
também é ergódico para a probabilidade uniforme? A resposta é
: nem sempre! Será necessário assumir alguma hipótese sobre os
λ1 , .., λn . Estas condições serão estabelecidas pelo próximo teorema.
Teorema 2.3. Para que um fluxo condicionalmente periódico St seja
ergódico é necessário e suficiente que os números λ1 , λ2 , ..., λn sejam
racionalmente independentes, isto é, que igualdades da forma s1 λ1 +
s2 λ2 + ... + sn λn = 0, onde s1 , s2 , ..., sn ∈ Z sejam possı́veis apenas
quando s1 = s2 = ... = sn = 0.
Demonstração:
Vamos utilizar o critério estabelecido pela última observação para
demonstrar o resultado desejado.
Primeiro, provaremos a suficiência. Suponhamos que os números

λ1 , λ2 , ..., λn

sejam racionalmente independentes.


Vamos mostrar que qualquer f tal que f (St (x)) = f (x), é tal que
f é constante fora de um conjunto de probabilidade uniforme nula.

i i

i i
“mec˙New”
i i
2011/10/11
page 43
i i

43

A função f em Torn tomando valores reais, pode ser expandida


em uma série de Fourier que convirja na média quadrática, ou seja,
X
f (x) = cs e2πi(s1 x1 +s2 x2 +...+sn xn ) ,
s

onde s = (s1 , s2 , ..., sn ) ∈ Zn , e a soma é tomada sobre a famı́lias de


s ∈ Zn .
Da invariância de f obtemos
X
f (St x) = cs e2πi[s1 (x1 +λ1 t)+s2 (x2 +λ2 t)+...+sn (xn +λn t)]
s
X
= cs e2πi(s1 λ1 +s2 λ2 +...+sn λn )t . e2πi(s1 x1 +s2 x2 +...+sn xn ) = f (x)
s
X
= cs e2πi(s1 x1 +s2 x2 +...+sn xn ) ,
s

a menos de um conjunto de probabilidade uniforme zero (lembre que


a série de Fourier de uma função f é definida a menos de um conjunto
de probabilidade uniforme 0.
Em virtude da unicidade do coeficiente de Fourier,

cs = cs e2πi(s1 λ1 +...+sn λn )t ,

isto é, para todo s ou cs = 0 ou e2πi(s1 λ1 +...+sn λn )t = 1. A segunda


igualdade só é válida quando (s1 λ1 + ... + sn λn )t = p, onde p ∈ Z.
Como t é arbitrário, isto acontece apenas se s1 λ1 + ... + sn λn = 0,
ou seja, se s1 = ... = sn = 0, pois estamos supondo que λ1 , ..., λn
eram racionalmente independentes. Logo, para todo s 6= (0, 0, ..., 0),
temos que cs = 0. Note que o argumento não pode ser aplicado a c0 .
Portanto, todos os coeficientes de Fourier cs tais que s 6= 0 são nulos.
Logo, temos que f (x) = c0 = constante a menos de um conjunto de
probabilidade zero. Portanto, pela Observação 2.6, concluı́mos que
P é ergódica.
Agora, provaremos a necessidade. Suponhamos que haja um vetor
não-nulo s = (s1 , ..., sn ) com coordenadas inteiras tais que s1 λ1 +...+
sn λn = 0. Então, a função f tal que

f (x) = e2πi(s1 x1 +...+sn xn )

i i

i i
“mec˙New”
i i
2011/10/11
page 44
i i

44 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

não é constante (mod 0), mas é invariante em relação a St pois

f (St x) = e2πi[s1 (x1 +λ1 t)+...+sn (xn +λn t)]

= e2πi(s1 λ1 +...+sn λn )t .e2πi(s1 x1 +...+sn xn ) = f (x).


Portanto, {St } não é ergódico, o que é uma contradição. Assim,
completamos a prova do teorema. 

Exemplo 2.14. Segue do teorema acima que o sistema dinâmico

St (x1 , x2 ) = (x1 + t (mod1), x2 + αt (mod1))

é ergódico, se, e somente se, α é irracional.

Considere agora o Hamiltoniano H(q, p) = p21 + p22 + ... + p2n .


Para p0 = (λ1 , λ2 , ..., λn ) fixado considere o subconjunto D do
R2n constituı́do pelos pontos da forma

(q, p0 ) = (q1 , q2 , ..., qn , p1 , ..., pn ) = (q1 , q2 , ..., qn , λ1 , ..., λn ),

onde (q1 , q2 , ..., qn ) ∈ [0, 1]n .


Podemos considerar que este sistema Hamiltoniano oriundo de tal
H(q, p) está definido em q ∈ Rn (mod 1), descrevendo assim um fluxo
Hamiltoniano no toro [0, 1)n .
É fácil ver que D é invariante para o fluxo Hamiltoniano φt gerado
por H. Por exemplo, D pode ser obtido através de superfı́cies de nı́vel
de integrais primeiras do tipo Vi (q, p) = pi = λi . É também fácil ver
a projeção π1 (φt ) (onde π1 (q, p) = q) do fluxo φt é na verdade igual
ao St (q) = π1 ◦ φt (q, p0 ) acima descrito.
Como a velocidade p(t) das soluções (q(t), p(t)) do Hamiltoniano
H é constante igual a p0 = (λ1 , ..., λn ) então podemos pensar que
St é apenas uma mudança de coordenadas π1 do fluxo Hamiltoni-
ano (restrito a D) determinado por tal H. Sendo assim entender a
evolução temporal do sistema dinâmico St das translações no toro é
na verdade entender a evolução de um sistema mecânico periódico
sem energia potencial.

Observação 2.7. Com relação ao Teorema acima há um esclareci-


mento importante a fazer: em todos os nossos argumentos, a condição

i i

i i
“mec˙New”
i i
2011/10/11
page 45
i i

45

de ergodicidade do fluxo no toro, foi equivalente a independência ra-


cional dos números λ1 , ..., λn ; ora, nem sempre a condição de inde-
pendência racional dos números λ1 , ..., λn é verdadeira (por exem-
plo, se todos os λi forem racionais). Felizmente, o conjunto dos
(λ1 , ..., λn ) que não são racionalmente independentes, tem probabi-
lidade zero em relação a probabilidade de dλ1 ...dλn em [0, 1)n (ver
Exercı́cio 5).
Sendo assim, escolhendo um conjunto de valores (λ1 , ..., λn ) ao
acaso em Rn de acordo com a probabilidade uniforme em dλ1 ...dλn
obteremos um sistema que tem ótimas propriedades estatı́sticas. Por-
tanto, do ponto de vista probabilı́stico podemos afirmar que o sistema
observado na natureza (escolhendo os λ1 , ..., λn com probabilidade to-
tal em Rn ) possui propriedades estatı́sticas ótimas para as trajetórias
começando em x num conjunto de probabilidade total.
Dizemos que um sistema tem propriedades estatı́sticas ótimas se
para um conjunto de probabilidade total de condições iniciais, as tra-
jetórias visitam uma dada região A com a mesma frequência assin-
tótica.
Note que a afirmação do sistema ter ótimas propriedades estatı́s-
ticas não pode ser feita para “todos”os possı́veis sistemas λ1 , ..., λn
condicionalmente periódicos.
Exemplo 2.15. Considere um ponto de equilı́brio de um sistema Ha-
miltoniano natural unidimensional H(q, p) = 12 p2 + V (q) onde V (q)
2
tem mı́nimo local em 0. Suponha que d dq V (q)
2 |q=0 > 0. O sistema Ha-
miltoniano em torno do ponto (0, 0) é integrável e as curvas de nı́vel
para o Hamiltoniano são curvas fechadas envolvendo o ponto (0, 0).
Conforme vimos na Seção 7, Capı́tulo 3 expressão (3.5) [L], o
fluxo Hamiltoniano pode ser localmente escrito em coordenadas ação
- ângulo (θ, I) através da equação

θ̇ = w(I) , I˙ = 0.

As soluções deste sistema, como vimos antes são da forma


(θ(t), I(t)) = (θ0 + w(I0 ) t, I0 ), onde (θ0 , I0 ) é a condição inicial.
Logo, em variáveis ação-ângulo, o fluxo Hamiltoniano φt restrito
a curva de nı́vel I = I0 = constante, é da forma φt (θ0 , I0 ) = (θ0 +
w(I0 )t, I0 ).

i i

i i
“mec˙New”
i i
2011/10/11
page 46
i i

46 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

A partir de φt , considerando apenas a variável θ, obtemos no nı́vel


de energia correspondente a I0 o sistema dinâmico

St (θ) = θ + w(I0 ) t (mod 1).

Este sistema dinâmico foi analisado anteriormente e é sempre


ergódico.
Retornando as variáveis (q, p) o resultado análogo será também
verdadeiro.
Desta maneira, pelo que vimos acima, o fluxo Hamiltoniano φt
restrito a uma curva de Energia constante, próxima ao ponto de
equilı́brio é ergódico. Sendo assim, a Hipótese Ergódica de Boltz-
mann é verdadeira neste caso.
Será que a mesma propriedade é válida para o caso análogo n-
dimensional? 2
Considere agora o sistema n-dimensional H(q, p) = |p|2 + V (q)
com q e p em Rn e suponha que V (q) tenha mı́nimo local em q =
0 ∈ Rn . Suponha ainda que V (q) = 21 a21 q12 + .. + 21 a2n qn2 . Esta
hipótese não é muito restritiva, na verdade, pode-se mostrar que em
um sentido genérico, todo campo Hamiltoniano da forma H(q, p) =
|p|2 + V (q) que tem mı́nimo local q0 para V , pode ser represen-
tado localmente através de mudanças de coordenadas deste forma
(ver [A-M] e [Milnor]).
A equação de Hamilton, neste caso, é separável em n equações
′′
qi − ai qi = 0, i ∈ {1, 2, ..., n}.

Não é difı́cil ver que cada plano (qi , pi ) é invariante pelo fluxo Ha-
miltoniano φt , que cada trajetória (qi (t), pi (t)) é periódica no plano
(qi , pi ) e que são válidos em cada um destes planos (qi , pi ) os resul-
tados que obtivemos na Seção 7, Capı́tulo 3 [L], obtendo variáveis
ação-ângulo (θi , I i ) e frequências wi = w(I i ) = ai , i ∈ {1, 2, ..., n}.
O fluxo Hamiltoniano φt em coordenadas ação-ângulo é dado por
(θi (t), I i (t)) = (θ0i + ai t (mod1), I0i ).
É fácil ver que o conjunto dos (θ1 , I 1 , θ2 , I 2 , ..., θn , I n ) tal que

I 1 = I01 , I 2 = I02 , ..., I n = I0n

define uma superfı́cie S invariante para o fluxo Hamiltoniano.

i i

i i
“mec˙New”
i i
2011/10/11
page 47
i i

47

Logo fixada a condição inicial (θ01 , I01 , θ02 , I02 , ..., θ0n , I0n ), de maneira
análoga ao caso unidimensional tratado acima, nas coordenadas
(θ1 , .., θn ) o fluxo Hamiltoniano φt restrito a S se escreve como

St (θ01 , ..., θ0n ) = (θ1 (t), θ2 (t), ..., θn (t)) =

= (θ01 + ai t(mod1), ..., θ0n + an t(mod1))


e define em S uma translação St condicionalmente periódica no sen-
tido anteriormente considerado.
Pergunta: O fluxo Hamiltoniano é ergódico quando restrito a tal
superfı́cie S?
Como veremos, a resposta é afirmativa se os ai são racionalmente
independentes.
Note que o resultado a seguir não é para a superfı́cie de Ener-
gia constante E, mas para a superfı́cie S acima definida (e que está
estritamente contida num nı́vel de Energia E).
A partir do Teorema 2.3 e da Observação 2.7, concluı́mos que no
caso do sistema mecânico com potencial V (q) = 21 a21 q12 + ... + 21 a2n qn2 ,
o fluxo φt = St é ergódico em S se os a1 , ..., an são escolhidos ao
acaso de acordo com a probabilidade uniforme. Em função do que
foi dito acima no caso de um sistema mecânico real, assumir que os
ai satisfazem tal propriedade é uma hipótese bastante razoável.
O resultado obtido para (θ1 , I 1 , ..., θn , I n ) pode ser tranferido via
mudanças de coordenadas para o sistema Hamiltoniano inicial nas
variáveis (q, p). Sendo assim, podemos afirmar neste caso, que lo-
calmente em torno do ponto de equilı́brio (0, 0) no plano (q, p), a
Hipótese de Boltzmann vale para a superfı́cie com variável Ação
I0i , i ∈ {1, 2, .., n} constante, se o potencial V (q) = 21 a21 q12 + ... 12 a2n qn2
é tal que os ai , i ∈ {1, .., n} são escolhidos ao acaso de acordo com
a probabilidade uniforme em Rn . Sendo assim, localmente e neste
sentido um pouco mais fraco (restrição sobre uma escolha ao acaso
dos ai ), a Hipótese de Boltzmann é verdadeira.
Chamamos a atenção para um fato: a ergodicidade do fluxo St
não implica a ergodicidade do difeomorfismo T = St para um valor t
fixo.
Agora nos concentraremos no estudo de uma das muitas aplicações
dos sistemas dinâmicos no toro: o problema de Lagrange, que surgiu

i i

i i
“mec˙New”
i i
2011/10/11
page 48
i i

48 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

de algumas questões de Mecânica Celeste e que tem estimulado o


desenvolvimento da teoria das funções quase periódicas.
Considere um sistema constituı́do por n pêndulos com hastes de
tamanhos distintos acoplados um ao outro e com o extremo inicial
fixo (ver Figura 2.4). Sejam n números complexos a1 , a2 , ..., an (n
vetores no plano). Examinaremos a curva no plano complexo dada
pela equação

z(t) = a1 e2πiλ1 t + a2 e2πiλ2 t + ... + an e2πiλn t .

O significado geométrico da função z é o seguinte: suponhamos


que haja um vetor a1 no plano, que o vetor a2 esteja ligado à extre-
midade de a1 e que cada um dos outros esteja ligado à extremidade
do anterior. Se a1 girar em torno de sua origem fixa (o ponto (0,0))
com velocidade angular constante λ1 , a2 girar ao mesmo tempo em
torno de sua origem (a extremidade de a1 ) com velocidade angular λ2
e assim por diante, a curva dada por z é a trajetória da extremidade
do vetor an . A Figura 2.5 ilustra o caso em que n = 3.
Suponhamos que z(t) não se anule para nenhum t. Então podemos
representar z(t) na forma

z(t) = r(t)e2πiφ(t) ,

onde φ é uma função contı́nua de t (veja a Figura 2.5).


Lagrange formulou a seguinte pergunta: “Existe
1
ω = lim φ(t),
t→∞ t
e, se existir, como podemos determiná-lo?” Em outras palavras,
com que velocidade angular média a extremidade do vetor an gira
em torno da origem do vetor a1 ?
A resposta, no caso em que

|a2 | + |a3 | + ... + |an | < |a1 | , (2.1)

é simples de ser obtida, pois φ(t) = λ1 t + α(t), onde α é uma função


limitada, ou seja, |α(t)| ≤ αmáx. Claramente, temos que ω = λ1 .
Isto se deve ao fato que a rotação limite de z(t) é determinada
apenas por a1 , pois as outras hastes são muito curtas em relação a
a1 .

i i

i i
“mec˙New”
i i
2011/10/11
page 49
i i

49

Se a desigualdade (2.1) não for válida, o problema torna-se razo-


avelmente difı́cil, sendo que o próprio Lagrange o resolveu somente
com dois vetores.
Consideraremos, agora o caso genérico com n hastes, onde exibi-
remos a relação entre esse problema e a teoria ergódica.
Tomando os logaritmos de ambos os lados da equação de z(t),
obtemos  
1
φ(t) = Re log z(t) ,
2πi
(onde Re(z) representa a parte real de z, isto é, Re(a + bi) = a) e
então
n
P
 ′
 λk ak e2πiλk t
dφ 1 z (t) k=1
(t) = Re = Re P n =
dt 2πi z(t)
ak e2πiλk t
k=1
n
P
λk |ak |e2πi(xk +λk t)
= Re k=1
Pn ,
|ak |e2πi(xk +λk t)
k=1
onde x = (x1 , x2 , ..., xn ) determina a posição inicial dos vetores a1 ,
a2 , ..., an , ou seja,
ak = |ak |e2πixk , 1 ≤ k ≤ n
(note que, utilizando a igualdade anterior, podemos escrever
z(t) = |a1 |e2πi(x1 +λ1 t) + |a2 |e2πi(x2 +λ2 t) + ... + |an |e2πi(xn +λn t) ).
Consideremos o toro Torn = [0, 1)n e o fluxo condicionalmente
periódico determinado pelo vetor λ = (λ1 , λ2 , ..., λn ). A medida uni-
forme µ no toro (visto como subconjunto do Rn ) é invariante para o
fluxo como já vimos antes. Suponhamos inicialmente que os números
λ1 , ..., λn sejam racionalmente independentes, de forma que o fluxo
correspondente seja ergódico.
Usando a notação aditiva, definamos a seguinte função em Torn :
Pn
λk |ak | e2πixk
k=1
f (x) = f (x1 , ..., xn ) = Re P n . (2.2)
|ak | e2πix k

k=1

i i

i i
“mec˙New”
i i
2011/10/11
page 50
i i

50 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

Então, é válida a igualdade



(t) = f (St x),
dt
e, por isso, Z t2
φ(t2 ) − φ(t1 ) = f (Sτ x)dτ.
t1

O limite que desejamos encontrar pode ser, portanto, reescrito


como Z
φ(t) 1 t
lim = lim f (Sτ x)dτ.
t→∞ t t→∞ t 0

Se a função f fosse limitada e contı́nua, este limite existiria para


todo x ∈Torn e seria, de acordo com o teorema ergódico, igual a
Z
f dµ.
Torn
Contudo, o denominador em (2.2) pode se anular. A condição
n
X
|ak |e2πixk = 0 (2.3)
k=1

é, na verdade, um sistema de duas equações em relação a x1 , ..., xn


(tanto a parte real como a imaginária da soma devem ser iguais a
zero). Isso implica que os pontos onde a equação (2.3) vale constituem
uma subvariedade diferenciável de codimensão 2 em Torn = [0, 1)n .
Portanto, o conjunto de todas as trajetórias que a interceptam é uma
subvariedade de dimensão n − 1, e sua probabilidade uniforme em
[0, 1)n é zero. Então, para uma trajetória escolhida aleatoriamente, a
equação (2.3) não vale com probabilidade 1. Usando essas considera-
ções, suponhamos que o teorema ergódico seja aplicável e substitua-
mos a integral ao longo da trajetória pela integral sobre o toro.
Temos que
n
P
Z Z λk |ak | e2πixk n
X
k=1
n
f dµ = Re n dx1 dx2 ...dxn = λk |ak | Wk ,
Tor Torn P
|ak | e2πixk k=1
k=1

i i

i i
“mec˙New”
i i
2011/10/11
page 51
i i

51

onde Z
e2πixk
Wk = Re n dx1 ...dxn .
Torn P |aj | e2πixj
j=1

É importante interpretarmos esse resultado. Para tal fim, deve-


mos reescrever a integral sobre o toro na forma de integrais iteradas,
efetuando a integração em relação a xk . Então,
Z Z 1 
e2πixk
Wk = Re 2πixk
dxk dx1 ...dxk−1 dxk+1 ...dxn ,
Torn−1 0 B + |ak | e
onde B é o somatório de todos os termos tais que j 6= k.
Quando xk varia de 0 a 1, o ponto Z = B + |ak | e2πixk descreve
um cı́rculo C no plano complexo na Figura 2.5. Portanto,
Z 1 Z 1 ′ Z
e2πixk 1 Z (xk ) 1 1
2πixk
dxk = dxk = dZ.
0 B + |ak | e 2πi |ak | 0 Z(x k ) 2πi |ak | C Z

A última expressão é igual a 1|ak |, se o disco delimitado por C


contém a origem; caso contrário, é igual a zero.
O cı́rculo delimita um disco contendo a origem se |B| < |ak |.
Logo,
1  
Wk = P (x1 , ..., xk−1 , xk+1 , ..., xn ) ∈ Torn−1 | |B| < |ak | ,
|ak |

onde P é a probabilidade de Lebesgue em Torn−1 .


A independência racional de λ1 , ..., λn implica a de

λ1 , ..., λk−1 , λk+1 , ..., λn .

Portanto, o fluxo em Torn−1 também é ergódico. Como, nesse


caso, o tempo relativo que uma trajetória escolhida aleatoriamente
permanece em um dado conjunto mensurável é igual à probabilidade
deste, o resultado obtido pode ser interpretado da seguinte maneira:
|ak | Wk é a parte desse tempo em que a rotação do vetor ak contribui
para a função φ.
O problema de Lagrange ilustra um fato que é bastante natural em
Mecânica Clássica: existe um conjunto desprezı́vel de situações ruins,

i i

i i
“mec˙New”
i i
2011/10/11
page 52
i i

52 [CAP. 2: O TEOREMA ERGÓDICO E A HIPÓTESE DE BOLTZMANN

mas para condições iniciais fora deste conjunto de probabilidade zero,


um resultado bastante forte e preciso do ponto de vista estatı́stico
pode ser enunciado para o sistema mecânico em consideração.

Exercı́cios
1. Mostre que se A = γ for uma curva diferenciável em [0, 1]×[0, 1],
então A tem probabilidade zero para probabilidade uniforme em
[0, 1] × [0, 1].

2. Considere P a probabilidade uniforme em [0, 1]. Mostre que se


F é um difeomorfismo de classe C 1 de [0, 1] em si mesmo e A
tem probabilidade zero, então F (A) tem probabilidade zero.
3. Seja T (x) = 2x (mod 1), T [0, 1] → [0, 1]. Mostre que T é in-
variante e é ergódica para a probabilidade uniforme P . Su-
gestão: considere um conjunto A e escreva IA em série de
Fourier. A seguir, suponha que T −1 (A) = A, e conclua que
IT −1 (A) (x) = IA ◦ T (x) = IA (x). O resultado é obtido igua-
lando os correspondentes coeficientes de Fourier de IA e IA ◦ T .

4. Mostre que se λ é irracional, então T (x) = x + λ (mod 1),


T [0, 1] → [0, 1], é tal que existe um conjunto K ⊂ [0, 1] tal que
para todo x ∈ K a órbita de x é densa em [0, 1].

5. Mostre que uma superfı́cie de dimensão d < n em Rn tem


probabilidade uniforme 0 em Rn

6. Mostre que o conjunto dos pontos (x1 , x2 , ..xn ) racionalmente


independentes tem medida total em Rn .

i i

i i
“mec˙New”
i i
2011/10/11
page 53
i i

Capı́tulo 3

A Teoria de Aubry para


Quase-Cristais e
Exemplos do Tipo
KAM

Vamos descrever a seguir uma versão discretizada da Ação de um


Sistema Hamiltoniano que é semelhante em um certo sentido ao pro-
cedimento que utilizamos na seção 11 na qual analisamos bilhares
determinados por curvas convexas. Neste modêlo o fênomeno deno-
minado KAM (de Arnold, Kolmogorov e Moser) irá aparecer e iremos
fazer uma análise matemática do problema em primeira aproximação.
Ressaltamos que alguns dos resultados apresentados nesta seção
não estão de todo formalizados de maneira matematicamente rigo-
rosa. Nosso objetivo é apresentar algumas das idéias e conceitos
principais como motivação para o estudo da Teoria de Aubry-Mather
[CRZ], [Au1], [Au2], [CI], [Fat], [M2], [MH], [MF], [dL], [B] e [LC].
A equação de Hamilton para o Hamiltoniano natural H(q, p) =
1 2
2 p − V (q), q, p ∈ R é
q̇ = p

53

i i

i i
“mec˙New”
i i
2011/10/11
page 54
i i

54 [CAP. 3: A TEORIA DE AUBRY

∂V
ṗ = .
∂q
Trocamos o sinal do potencial V acima apenas para obter ao fi-
nal de nossas considerações um sistema a tempo discreto dentro da
notação de Aubry [Au1] e [Au2].
Uma versão em diferenças finitas de tal equação é

qi+1 = qi + pi+1 ∆t
∂V
pi+1 = pi + ∆t |q .
∂qi i
Tomando ∆t = 1, obtemos
∂V
G(qi , pi ) = (qi+1 , pi+1 ) = (qi + pi+1 , pi |q ).
∂qi i
O leitor pode facilmente checar que tal transformação do plano
no plano preserva área, bastando para isso mostrar que a matriz
Jacobian tem determinante 1.
Aplicações do tipo acima representam uma versão discretizada
das equações de Hamilton e preservam área como veremos em breve
(ver Lema 3.1).
Na verdade existe um modêlo com real significado fı́sico que pode
ser representado por tal aplicação. Este modelo (ver [B], [MF], [Au1],
[Au2] e [Me] para mais detalhes) será brevemente descrito abaixo.
A teoria que vamos considerar agora aparece na análise de alguns
modelos fı́sicos para ions mergulhados em plasma. Consideraremos
também alguns exemplos da Teoria KAM que aparecem no modêlo.
Não iremos fazer uma análise completa da equação das curvas
que aparecem nos fenômenos da Teoria KAM (Kolmogorov-Arnold-
Moser), mas iremos apenas dar uma visão esquemática de como ana-
lisar a equação associada às curvas KAM em primeira aproximação.
O problema com esta simplificação permitirá ao leitor ter uma idéia
porque aparecem pequenos denominadores e propriedades da Teoria
dos Números (ver [Le] e [Kh] para referência) e das Séries de Fourier
(ver [Fi] e [Ju] para referência) na Teoria. Com esta simplificação
estaremos evitando certos detalhes técnicos complicados (mas im-
portantes [A2], [H] e [Ba]), e cuja dificuldade está acima do nı́vel que
desejamos manter no presente texto.

i i

i i
“mec˙New”
i i
2011/10/11
page 55
i i

55

Considere na reta real o Potencial V (u) periódico de perı́odo 1


e assuma também que V (0) = 0, V ′ (0) = 0 e V ′′ (u) > 0, ∀u ∈
(−1/2, 1/2] (ou alternativamente em (0, 1]). Vamos considerar (Fi-
gura 3.1) como um caso particular importante o exemplo em que

1
V (u) = (1 − cos 2πu).
2
O modelo que vamos analisar é descrito por vários átomos cuja
posição ui ∈ R é descrita por arranjos {ui }i∈Z , onde i ∈ Z. Estes
átomos formam uma cadeia e estão acoplados de forma que cada
átomo na posição ui sofre influência apenas dos átomos vizinhos nas
posições ui−1 e ui+1 .
Nosso objetivo é analisar os arranjos {ui }i∈Z que tem significado
fı́sico real. A seguir vamos descrever como são tais arranjos.
O termo de energia cinética na reta real será dado por

1 2
W (u) = u ,
2
que vai ser na verdade uma função da distância entre ui+1 e ui . Mais
precisamente, a energia cinética será dada por

1
W (ui+1 − ui ) = (ui+1 − ui )2 .
2

Fazendo um analogia com a Mecânica Clássica, o valor ui+11−ui


faz o papel da velocidade (ou momento) no modelo, e assim por sua
vez 12 (ui+1 − ui )2 desempenha o papel da Energia Cinética.
A idéia neste modelo é substituir equações diferenciais da Mecânica
Clássica por equações de diferenças. Deste modo, de maneira análoga,
é natural introduzir um parâmetro externo λ que vai estabelecer a
altura do poço do potencial λV .
De maneira análoga ao caso clássico (não discretizado), o La-
grangiano natural S agindo sobre cada partı́cula, é Energia Cinética
menos Energia Potencial, ou seja a ação individualizada ligando ui a
ui+1 vai ser dada por

S(ui+1 , ui ) = λV (ui ) + W (ui+1 − ui ) (3.1)

i i

i i
“mec˙New”
i i
2011/10/11
page 56
i i

56 [CAP. 3: A TEORIA DE AUBRY

Definição 3.1. Considere um arranjo {ui }i∈Z . Para n < m fixados,


a Ação Total do arranjo {ui }i∈Z de n a m é dada por
m−1
X m−1
X
φ({ui }) = λV (ui ) + W (ui+1 − ui ) = S(ui+1 , ui ).
i=n i=n

A Ação Total de n a m é a soma R das Ações individuais (3.1) e


corresponde na Mecânica Clássica à Sdq.

Definição 3.2. Um arranjo {ui }i∈Z vai ser minimal para a Ação
Total, se para todo n e m fixos n < m, e para todo arranjo {vi } tal
que vn = un e vm = um vale que
m−1
X
φ({ui }) = λV (ui ) + W (ui+1 − ui ) ≤ φ({vi }) =
i=n

m−1
X
= λV (vi ) + W (vi+1 − vi ).
i=n

A condição de um arranjo ser minimal, acima definida, é clara-


mente inspirada pelo Princı́pio de Mı́nima Ação (ver Seção 9, Capı́-
tulo 3 [L]).

Definição 3.3. Um arranjo {ui }i∈Z é crı́tico para a Ação Total se


para todo n e m, n < m fixados vale que

∂φ
= 0, ∀ i ∈ {n + 1, m − 1}.
∂ui

Isto é, um arranjo é crı́tico se mantendo os extremos un e um fixos


e variando as posições intermediárias ui , a expressão acima é crı́tica
para tais variações ui . Note a semelhança da última expressão com
a Proposição 1.2 da Seção 1 sobre bilhares convexos.
Todo arranjo minimal é claramente crı́tico, embora a recı́proca
não seja sempre verdadeira. Na teoria que vamos brevemente des-
crever a seguir, do ponto de vista fı́sico e também do ponto de vista
matemático, os resultados interessantes concernem os arranjos mini-
mais e não apenas os arranjos crı́ticos.

i i

i i
“mec˙New”
i i
2011/10/11
page 57
i i

57

Os arranjos que são fisicamente observados no problema acima


descrito são na verdade os arranjos minimais.
Primeiramente vamos determinar um método para encontrar ar-
ranjos crı́ticos.
Note que para um arranjo {ui }i∈Z , cada valor ui , n < i < m
aparece na ação total φ de n a m em apenas dois termos

S(ui+1 , ui ) + S(ui , ui−1 ) =

λV (ui ) + W (ui+1 − ui ) + λV (ui−1 ) + W (ui − ui−1 ).


Para calcular a expressão do arranjo crı́tico, derivamos a última
expressão em relação a ui e considerando V , W como acima, obtere-
mos
0 = λV ′ (ui ) − (ui+1 − ui ) + (ui − ui−1 ).
Logo, obtemos a equação

0 = λV ′ (ui ) + 2ui − (ui+1 + ui−1 ),

a qual toda solução crı́tica {ui }i∈Z deve satisfazer.


Sendo assim, obtemos de maneira equivalente
λ ui+1 + ui−1
− V ′ (ui ) = ui − . (3.2)
2 2
Por exemplo, como V (0) = 0 e W (0) = 0, concluı́mos que o
arranjo ui = 0, ∀i ∈ Z, é crı́tico para ação total.
Uma interpretação pictórica da expressão (3.1) é que a força (me-
nos a derivada do potencial)
λ
− V ′ (ui )
2
é equilibrada pelo deslocamento de ui da posição de equilı́brio (ponto
médio ui+1 +u
2
i−1
) da corda elástica ligando ui−1 a ui+1 (Lei de Hooke)
conforme mostra Figura 3.28.
Deste ponto de vista, o arranjo {ui }i∈Z parece descrever um
elástico fixo na posição un e um , em que pela Lei de Hooke, o afasta-
mento do elástico na posição ui da posição intermediária ui−1 +u2
i+1
,
é equilibrada pela força criada pelo potencial agindo em cada reta
x = i.

i i

i i
“mec˙New”
i i
2011/10/11
page 58
i i

58 [CAP. 3: A TEORIA DE AUBRY

O modelo acima descreve exatamente quase-cristais, que são ob-


jeto de estudo recente em Fı́sica da Matéria e da Teoria do Plasma
[Au].
Voltemos agora a analisar que propriedades podemos obter sobre
os arranjos crı́ticos definidos acima.
A expressão (3.2) para um arranjo crı́tico {ui }i∈Z pode ser ex-
pressa numa relação de três termos como

ui+1 = λV ′ (ui ) + 2ui − ui−1 .

No modelo em que V (u) = 12 (1 − cos 2πu), um arranjo crı́tico (ver


Definição 3.3) pode ser calculado conforme (3.2) por uma relação de
três termos
ui+1 = λπ sin 2πui + 2ui − ui−1 .
Logo o arranjo {ui }i∈Z pode ser calculado a partir de u0 e u1
inicial pela relação de três termos acima descrita.
Passando a uma relação de pares (ui+1 , ui ) obtemos
     
ui+1 ui 2ui + λπ sin 2πui − ui−1
=T =
ui ui−1 ui

a partir de coordenadas iniciais (u1 , u0 ) ∈ R2 .


As soluções crı́ticas {ui }i∈Z são obtidas portanto através das ór-
bitas de T .
É natural interpretar o momento pi como uma nova variável,

pi = ui − ui−1 ,

em função da analogia do problema descrito acima com a versão


discretizada da Mecânica Clássica no espaço de fase (p, q) = (p, u).
Vamos a seguir expressar a aplicação T mencionada anteriormente
em coordenadas (p, u).
Antes disso, note também que se {ui }i∈Z é arranjo crı́tico, {ui +
1}i∈Z também é arranjo crı́tico. Este fato nos sugere considerar os
ui (mod 1) para simplificar o problema.
Algumas vezes vamos considerar os ui tomados (mod 1) e outras
vezes não. No primeiro caso (ui , pi ) está em [0, 1)×[0, 1) e no segundo
caso (ui , pi ) está em R2 .
Para não confundir o leitor vamos reservar a letra q para u (mod 1).

i i

i i
“mec˙New”
i i
2011/10/11
page 59
i i

59

Seja qi o valor ui (módulo 1), como pi+1 = ui+1 − ui (mod 1) (que


é o mesmo que qi+1 − qi (mod 1)), obtemos a transformação acima
definida T agindo sobre ( pi , qi ) ∈ [0, 1) × [0, 1) como
     
pi pi+1 pi + λπ sin 2πqi (mod 1)
T = =
qi qi+1 pi+1 + qi (mod 1)

que é conhecida como a aplicação padrão, ou standard.


Logo a iteração de uma órbita T n (p0 , q0 ) = (pn , qn ), n ∈ Z a
partir de uma condição inicial (p0 , q0 ), vai definir na segunda variável
ui o arranjo {ui }i∈Z (a menos de um inteiro) a solução crı́tica do
problema acima descrito. Uma infinidade de soluções {qi }i∈Z são
possı́veis, basta tomar diferentes condições iniciais (p0 , q0 ). Faremos
a seguir (Definição 3.4, Capı́tulo 3) uma restrição que vai determinar
um arranjo {ui }i∈Z de maneira única.
Observo que tomar qi (mod 1) é bastante natural (ou seja supor
que o espaço de configuração é compacto), mas tomar pi (mod 1),
em princı́pio não. No caso do modêlo de quase-cristais, no entanto,
é natural esta segunda hipótese. Estas duas hipóteses de qualquer
jeito permitem considerar a iteração de T num espaço compacto (ou
seja fechado e limitado).
Duas trajetórias minimais não podem se cruzar duas vezes como
na Figura 3.2. Esta propriedade é conhecida como a condição Twist
(ver [CRZ] para mais detalhes).
Considerando potenciais V mais gerais (V (u) ou V (q) sempre
periódico de perı́odo 1) obterı́amos de maneira análoga uma T defi-
nida em [0, 1] × [0, 1] → [0, 1] × [0, 1] por
     ′ 
pi pi+1 pi + λV (qi )
T = = .
qi qi+1 pi+1 + qi
Não estamos colocando o termo (mod 1) na expressão acima, mas
ela está implı́cita no modelo em consideração.
A aplicação padrão preserva área. Mostraremos na verdade no
caso mais geral (não somente para V (q) = 12 (1 − cos 2πq)), que a
aplicação T , obtida acima a partir de um potencial V qualquer, pre-
serva área. As Figuras desta seção que descrevem iterações de T para
o caso de V (u) = 12 (1−cos 2πu) ocorrem também em outras situações
quando se considera um V geral.

i i

i i
“mec˙New”
i i
2011/10/11
page 60
i i

60 [CAP. 3: A TEORIA DE AUBRY

Vamos usar, a partir de agora, indistintamente as letras q ou u e


o contexto vai indicar qual da duas estamos considerando.
Note a semelhança da aplicação acima definida com a que apresen-
tamos no começo desta seção e associada à discretização da equação
de Hamilton.
Lema 3.1. A aplicação T dada por
     ′ 
pi pi+1 pi + λV (ui )
T = = (3.3)
ui ui+1 pi+1 + ui
preserva área.
Demonstração:
Vamos considerar S(Q, q) = S(un+1 , un ) abaixo.
Desejamos mostrar que
∂S
(un+1 , un ) = −pn
∂un
e
∂S
(un , un+1 ) = pn+1
∂un+1
A segunda equação acima descreve trivialmente o que acontece
com a variável pn pela iteração de T (p, u), pois
1
S(un+1 , un ) = λV (un ) + (un+1 − un )2
2
e pn+1 = (un+1 − un ).
A equação das trajetórias crı́ticas
∂φ ∂S ∂S
0= = (un+1 , un ) + (un , un−1 ).
∂un ∂un ∂un
Ora, como vimos
∂S
(un , un−1 ) = un − un−1 = pn .
∂un
Portanto, da equação da trajetória crı́tica
∂S ∂S
(un+1 , un ) = − (un , un−1 ) = −pn (3.4)
∂un ∂un

i i

i i
“mec˙New”
i i
2011/10/11
page 61
i i

61

Logo fica definida através de S uma função geradora de mudanças


de coordenadas
(pn , un ) = (p, q) → (pn+1 , un+1 ) = −(P, Q)
através de
1
S(Q, q) = S(un+1 , un ) = λV (un ) + (un+1 − un )2 =
2
1
= λV (q) + (Q − q)2 . (3.5)
2
Note que −(P (q, p), Q(q, p)) preservar área é equivalente a
(P (q, p), Q(q, p))
preservar área.
A função (pn , qn ) → (pn+1 , qn+1 ) assim definida é a T anteri-
ormente considerada. Fica assim determinado (ver Proposição 17,
Capı́tulo 3 [L]) que a transformação T preserva área e é da forma
   
pn pn+1
T = .
un un+1
onde
∂S ∂S
(un+1 , un ) = − (un , un−1 ) = −pn
∂un ∂un
e
∂S
(un+1 , un ) = pn+1 .
∂un+1

Existem infinitos possı́veis arranjos {ui }i∈Z . Necessitamos impor
condições de fronteira do seguinte tipo:
un − un′
lim =l
n−n′ →∞ n − n′
para assim determinar uma solução crı́tica única a partir de l.
Definição 3.4. Dada uma configuração crı́tica {ui }i∈Z , o valor l
dado por
un − un′
lim =l
n−n′ →∞ n − n′

é chamado distância média atômica (ou número de rotação).

i i

i i
“mec˙New”
i i
2011/10/11
page 62
i i

62 [CAP. 3: A TEORIA DE AUBRY

Na definição acima devemos considerar u1 e não qi .


Em princı́pio não há garantia de que exista tal limite para uma
configuração qualquer. l também é chamado de número de rotação
da configuração {ui }i∈Z .
Estamos considerando na expressão acima que os un , un′ não são
tomados (mod 1). Sendo assim l representa uma inclinação média do
conjunto de pontos (i, ui ), i ∈ Z, vista com subconjunto de pontos
do R2 .
Observe que quanto mais próximo de zero for l, o deslocamento
para a direita de n produzirá muitos pontos muito próximos ui (mod
1). Neste caso a distância média entre elementos ui deverá ser muito
menor do que para inclinações grandes de l. Fica assim justificado o
nome de distância média atômica. Pn
Outra interpretração de l é a seguinte: como un −un′ = i=n′ +1 pi ,
podemos pensar que l é o momento médio da trajetória. Isto porque
Pn
un − un′ ′ pi
= i=n +1′ .
n − n′ n−n

Propriedade Importante: É possı́vel mostrar (ver [Ba]) que fixado


l, sob certas condições, obtem-se um único arranjo minimal {ui }i∈Z
(no sentido da Definição 3.2) com tal valor de distância média atômica
l (momento médio).
Fazendo analogia com a Mecânica Clássica, fixados posição e mo-
mento médio, desejamos encontrar de maneira única uma solução
{ui }i∈bf Z (que será mı́nima) com aquela posição inicial e com aquele
momento médio.
No caso λ = 0, então ui = il+α (linear em i) é solução, e portanto,
ao menos neste caso trivial, sabemos que existe a inclinação media
associada a tal {ui }.
No caso λ = 0, se l é irracional, a solução ui = il + α (módulo 1)
será densa em [0,1] (ver [A2]).
A questão relevante no modelo acima descrito é analisar no caso
geral λ 6= 0, o arranjo minimal associado a cada valor l. Isto é
para cada condição de fronteira l, deseja-se encontrar propriedades
da solução minimal com inclinação média l.
Nesta direção, o seguinte Teorema (ver [Ba]), que não será de-
monstrado, é de fundamental importância.

i i

i i
“mec˙New”
i i
2011/10/11
page 63
i i

63

Teorema 3.1. Dada uma configuração {ui }i∈Z mı́nima, existem l


e α tal que para qualquer i, os valores ui e il + α (não estamos
considerando mod 1) estão no mesmo intervalo [mi , mi + 1] onde mi
é um número inteiro.

Segue portanto deste teorema que toda solução minimal tem um


valor de distância média atômica l.

Definição 3.5. O valor α acima apresentado é denominado a fase


da configuração crı́tica ui .

O próximo teorema vai apresentar um resultado bastante preciso


sobre as soluções minimais {ui }i∈Z . Antes necessitamos algumas de-
finições e resultados da Teoria dos Números (ver [A2], [Kh] e [Le]
para referências gerais sobre os tópicos que serão considerados aqui).

Definição 3.6. Um número l > 0 é do tipo Diofantino se existe


γ > 0, r > 2 tal que ∀ p, q ∈ N

l − p > γ 1 .

(3.6)
q qr

Um número deste tipo é mal aproximado por racionais , ou seja,


ele é “muito irracional”.
Lembre (ver Definição 2.2, Capı́tulo 2) que um subconjunto D da
reta tem medida zero se para qualquer ǫ pequenoPexiste uma cober-

tura de D por intervalos [ai , bi ], i ∈ N tal que i=1 (b1 − ai ) < ǫ.
Ou seja D é desprezı́vel em termos de comprimento, embora possa
ser um conjunto até mesmo denso em R (por exemplo o conjunto dos
racionais tem medida zero).
Lembre também (ver Definição 2.3, Capı́tulo 2) que dizemos que
um subconjunto A tem medida total na reta, se o seu complementar
é desprezı́vel, ou seja que o seu complementar tem medida zero.

Observação 3.1. Se r > 2 e γ > 0 estão fixados, é possı́vel mostrar


(veja [A2]) que o conjunto de números que satisfazem (3.6) na defi-
nição acima, tem medida total em R. Sendo assim, se escolhermos
um número ao acaso de acordo com a probabilidade uniforme em
R, este número será Diofantino. Nem todos os números reais são
Diofantinos.

i i

i i
“mec˙New”
i i
2011/10/11
page 64
i i

64 [CAP. 3: A TEORIA DE AUBRY

Figura 3.1:

Todo número irracional pode ser aproximado por frações contı́nuas,


isto é, x pode ser expresso da seguinte forma
1
x = n0 + 1 , (3.7)
n1 + n2 + n 1
3 +...

onde os ni são números naturais.


O procedimento é o seguinte: dado x, subtraia sua parte inteira,
1
obtendo x − n0 ∈ (0, 1). Portanto, x−n 0
> 1. Seja n1 a parte inteira
1 1
de x−n0 , logo x1 = x−n0 − n1 ∈ (0, 1].
1
Portanto x = n0 + n1 +x1 .

Aplique agora o mesmo procedimento a x1 , isto é, considere n2 a


parte inteira de x11 e x2 = x11 − n2 ∈ (0, 1] obtendo assim

1
x = n0 + 1 .
n1 + n2 +x2

Repetindo o mesmo procedimento para x2 e indutivamente assim


por diante obtemos a expansão de x em frações contı́nuas (3.7). Os
números x tal que tal procedimento termina em algum instante n
(isto é, xn = 0 ou xn = 1) são os números x racionais.

i i

i i
“mec˙New”
i i
2011/10/11
page 65
i i

65

2 1.6

1.4

1.5

1.2

1 1

0.8

0.5

0.6

0 0.4
1 1.5 2 2.5 1.4 1.6 1.8 2 2.2 2.4 2.6

1.3 2

1.2

1.5

1.1

1 1

0.9

0.5

0.8

0.7 0
1.7 1.8 1.9 2 2.1 2.2 2.3 1 1.5 2 2.5 3

i i

i i
“mec˙New”
i i
2011/10/11
page 66
i i

66 [CAP. 3: A TEORIA DE AUBRY

2
1.75

1.5

1.5

1.25

1
1

0.75

0.5
0.5

0.25

0 0
1 1.5 2 2.5 3 1.2 1.3 1.4 1.5 1.6

2
1.4

1.5
1.2
theta

1
1

0.5
0.8

0.6 0
1 1.5 2 2.5 3
1.6 1.8 2 2.2 2.4 p

Seja x irracional e k ∈ N, vamos denotar por

pk 1
= n0 + 1
qk n1 + n2 + 1
n3 +...+ 1
nk

o aproximante de ordem k de x, onde pk , qk ∈ N.


O seguinte resultado é demonstrado em [A2].

Teorema 3.2. Para qualquer número real irracional x, aproximado

i i

i i
“mec˙New”
i i
2011/10/11
page 67
i i

67

for fração contı́nua da forma


1
x = n0 + 1
n1 + n2 + n 1
3 +...

ni ∈ N, i ∈ N, é válido que

x − pk < 1 .

qk qk2
Ou seja r > 2 na definição de número Diofantino é uma propri-
edade nem sempre satisfeita para x qualquer, mas tomando γ = 1 e
r = 2 é sempre possı́vel aproximar qualquer número real x por racio-
nais pqkk como acima no último Teorema. No que segue, será essencial
assumir que l é do tipo Diofantino satisfazendo (3.6) com r > 2.
A expansão em frações contı́nuas surgiu inicialmente em Mate-
mática como um procedimento eficaz para aproximar um número
irracional x por números racionais. A aproximção de x de ordem k
é obtida quebrando a expansão em frações contı́nuas no termo nk ,
obtendo assim um número racional pqkk .
Em geral a aproximação por frações contı́nuas é melhor que as
outras maneiras conhecidas (o erro decai como q12 como se pode ob-
k
servar pela última desigualdade).
Posteriormente, a expansão em frações contı́nuas se mostrou útil
e fundamental para analisar uma série de questões de Aritmética e
também em questões de Mecânica Clássica e Geometria Diferencial.
Note que quanto maiores forem os ni , maiores serão os correspon-
dentes qk , permitindo assim melhores aproximações por racionais do
numero irracional considerado.
Exemplo 3.1. O número π é aproximado em frações continuas de
ordem 3 por
p3 333
=
q3 106
A aproximação é de 6 casas decimais.
Exemplo 3.2. O número real β dado pela razão áurea satisfaz

1 5+1
β =1+ =
1 + 1+ 1 1 2
1+...

i i

i i
“mec˙New”
i i
2011/10/11
page 68
i i

68 [CAP. 3: A TEORIA DE AUBRY

e portanto é super mal aproximado por racionais (os qk crescem deva-


gar porque os ni = 1 são os menores possı́veis). Logo podemos dizer
que a razão áurea é o mais irracional dos números reais.
Para mostrar que este número β tem a expansão em frações con-
tı́nuas acima basta observar que β satisfaz a equação
1
1+ = β.
β
Vamos agora apresentar o resultado mais importante desta seção
e que é apresentado de maneira resumida em [Au].

Teorema 3.3. Suponha que l, a distância média entre átomos, seja


irracional para uma certa configuração minimal {ui }i∈Z , ou seja,
{ui }i∈Z satisfaz

(ui − ui+1 ) + (ui − ui−1 ) = −λV ′ (ui ) (mod1). (3.8)

e ainda é mı́nima no sentido da Definição 51, Capı́tulo 3.


Então existe f monótona crescente tal que

ui = f (il + α) (mod1).

a) Se f é descontı́nua, o conjunto das descontinuidades é denso.


b) Se o número l é Diofantino, então existe λcrı́tico (l) tal que
para λ < λcrı́tico (l) a função f é contı́nua.

i i

i i
“mec˙New”
i i
2011/10/11
page 69
i i

69

2
1.75

1.5

1.5

1.25

1
1

0.75

0.5
0.5

0.25

0 0
1.6 1.625 1.65 1.675 1.7 1.725 1.7 1.8 1.9 2 2.1 2.2 2.3

2
1.15

1.1

1.5

1.05

1 1

0.95

0.5

0.9

0.85
0
1.94 1.96 1.98 2 2.02 2.04 2.06 2.275 2.3 2.325 2.35 2.375 2.4

i i

i i
“mec˙New”
i i
2011/10/11
page 70
i i

70 [CAP. 3: A TEORIA DE AUBRY

2 2

1.5 1.5

1 1

0.5 0.5

0 0
1.06 1.08 1.1 1.12 1.14 0.96 0.98 1 1.02 1.04

2
2

1.5
1.5
theta

1
1

0.5
0.5

0
0 1 1.25 1.5 1.75 2 2.25
0.86 0.88 0.9 0.92 0.94 p

A diferenciabilidade de f vai depender da diferenciabildade de V


e também do valor λ. Dependendo de λ, em alguns casos f é continua
mas não é diferenciável, em alguns casos f é apenas diferenciável de
classe C k e em alguns casos f é analı́tica.
É usual e mais prático, em vez de dizer que existe f como acima,
dizer que existe g tal que

ui = f (il + α) = (il + α) + g(il + α). (3.9)

A existência de f é claramente equivalente a existência de g. Va-


mos a seguir mostrar que existe tal g.

i i

i i
“mec˙New”
i i
2011/10/11
page 71
i i

71

Figura 3.2:

Observação 3.2. No caso de haver uma função continua f , associ-


ado a um certo valor l irracional, as iterações da aplicação padrão T
a partir de um ponto inicial (p0 , u0 ) (ou seja u0 , u1 ) vão determinar
um arranjo {ui } denso (mod 1) em [0, 1], com inclinação média l e
tal que a correspondente órbita associada T n (p0 , u0 ) = (pn , un ) deter-
mina através do conjunto dos seus pontos de acumulação em R2 uma
curva de Jordan fechada no espaço de fase (p, u). Estas curvas são
chamadas de curvas KAM. O exemplo de uma curva KAM aparece
nas Figuras 3.3 e 12.12.
Vamos explicar ao leitor como determinar a curva KAM em [0, 1]×
[0, 1] no caso acima descrito. Ora (pn , un ) = (un − un−1 , un ), logo
(pn , un ) = (f (nl + α) − f (nl + α − l), f (nl + α)).
Logo, (pn , un ) (mod 1) está sobre a curva

(f (u) − f (u − l) (mod1) , f (u) (mod1)).

Se l é irracional, il + α determina um conjunto denso (mod 1)


de pontos no intervalo (0, 1) e portanto, como afirmamos, o conjunto
dos pontos de acumulação de (un , pn ) (mod 1) determina a curva

(f (u) − f (u − l) (mod1) , f (u) (mod1)) , u ∈ (0, 1).

Nem sempre a um valor irracional l vai corresponder uma curva


KAM.
Quando f não é continua (caso a) do Teorema 3.3, Capı́tulo 3),
fica então determinado pelo fecho da órbita T n (p0 , u0 ) um conjunto
“ralo”tipo Cantor (também chamado de conjunto de Aubry-Mather)
conforme mostra Figura 2.3.

i i

i i
“mec˙New”
i i
2011/10/11
page 72
i i

72 [CAP. 3: A TEORIA DE AUBRY

Demonstração do item b) do Teorema 3.3: Não vamos dar


uma demonstração completa do item b) do Teorema 3.3, mas apenas
analisar o problema em primeira aproximação. Vamos considerar λ
pequeno (λ < λcrı́tico ) e l Diofantino. Neste caso existirá f continua
e nosso objetivo a seguir é dar uma idéia aproximada porque tal
propriedade é verdadeira (referimos o leitor a [He], [LC], [Ba] e [MF]
para uma demonstração completa).
Vamos ver como aparece de maneira natural a condição do número
l ser Diofantino no problema em consideração. Substituindo ui =
il + α + g(il + α) na equação (ui − ui+1 ) + (ui − ui−1 ) = −λV ′ (ui )
obtemos

−λV ′ (ui ) = il + α + g(il + α) − ((i + 1)l + α)

−g((i + 1)l + α) + il + α + g(il + α) − ((i − 1)l + α) − g((i − 1)l + α) =


2g(il + α) − g(il + α + l) − g(il + α − l).
Desejamos saber se existe uma g analı́tica (ou continua ao menos)
satisfazendo a expressão acima

−λV (ui ) = 2g(il + α) − g(il + α + l) − g(il + α − l) (3.10)

Nosso procedimento será tentar descobrir que tipo de equação


deve satisfazer tal g na variável u.
l é irracional, logo os números da forma il+α ∈ Z determinam um
conjunto denso em [0, 1) (mod 1) conforme foi visto na seção anterior.

Observação 3.3. No caso geral (λ > λcrı́tico ) , nem sempre para


um arranjo {ui }i∈Z crı́tico é verdade que os ui são densos no inter-
valo [0,1] (embora o conjunto dos il + α seja denso em [0,1] se l é
irracional).
Isto se deve do fato que |un+1 − un | ≤ l + 2 (ver Teorema 3.1) e
da equação (3.2)

λV ′ (ui ) = (ui+1 + ui−1 ) − 2ui ≤ 2(l + 2),

logo
2(l + 2)
V ′ (ui ) ≤ .
λ

i i

i i
“mec˙New”
i i
2011/10/11
page 73
i i

73

Portanto, se λ for grande, V ′ (ui ) vai poder assumir apenas valores


pequenos. Seja z tal que V ′ (z) = 0, então somente uma pequena
vizinhança A = {u|V ′ (u) < 4lλ } de z poderá ser visitada pela órbita
{ui }i∈Z .
Sendo assim, neste caso, o conjunto dos ui não será denso em
[0, 1). Em muitos destes casos o fecho do conjunto dos ui (mod 1)
é um conjunto tipo Cantor de medida zero. Neste caso o raciocı́nio
que faremos a seguir, usando séries de Fourier não se aplica.
No que segue é essencial assumir que os ui (mod 1) sejam densos
em [0,1), e isto ocorre quando λ < λcrı́tico .
A equação (3.10) para g em primeira aproximação é dada por

λV (u) = 2g(u) − g(u + l) − g(u − l). (3.11)

A primeira aproximação resulta de supor que g(il + α) é pequeno


e portanto que ui seja aproximadamente igual a il + α (pois ui −
(il + α) = g(il + α)). Como os ui são densos, podemos substituir
na equação (3.10) os ui e os il + α por u ∈ [0, 1) e obter assim a
equação para g dada por (3.11). Esta aproximação é verdadeiramente
muito grosseira, mas o esquema da demonstração matemática começa
resolvendo a equação em primeira aproximação e depois resolvendo
uma sequência de melhores aproximações da equação (3.10) (ver [H]).
Não demonstraremos esta parte mais sofisticada do teorema aqui e
nos contentaremos apenas em entender a questão da primeira apro-
ximação. Desta maneira não entraremos em questões de dificuldade
técnica bastante grande.
Com as hipótese acima em mente, vamos proseguir na análise da
equação (3.9) para g em primeira aproximação, ou seja da equação
(3.11) para g.
Expandindo V ′ em Série de Fourier, obtemos

X
V ′ (u) = Vm ei2πm u .
m=−∞

Vamos tentar obter g em Série de Fourier



X
g(u) = gm ei2πm u .
m=−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 74
i i

74 [CAP. 3: A TEORIA DE AUBRY

Substituindo esta expressão na equação (3.11), obtemos



λ X Vm
g(u) = − ei2πmu . (3.12)
2 m=−∞ (1 − cos 2πml)

Observe a existência de pequenos denominadores na equação aci-


ma. Isto porque o termo no denominador do quociente de cada termo
da série acima vai ficar próximo de zero, pois cos 2πml vai estar, para
certos valores de m, muito próximo de 1 (isto segue do fato que o
conjunto ml, n ∈ Z é denso (mod 1) em [0,1]). Sendo assim não há
garantia de que para todos valores de u a série formal (3.12) definida
acima convirja. Note no entanto que Vm também vai a zero e podem
haver compensações do denominador e numerador de cada termo da
série (3.12).
Se uma série converge absolutamente, ela converge. Sendo assim,
uma condição suficiente para convergência da série (3.12) acima é

Vm K
1 − cos(2πml) < m1+B (3.13)

K, B > 0, ou seja,
1/2
Vm K

1 − cos 2πml < 1+B . (3.14)
m 2

Ou seja, neste caso, o denominador de cada termo da série pode


ser pequeno, mas Vm é menor ainda.

Observação 3.4. Note que a condição suficiente acima descrita,


exige apenas que na última expressão 1+B 1
2 > 2 . A seguir vamos mos-
trar que tal propriedade é verdadeira para certos números l do tipo
Diofantino.
Quando 2πml está próximo de 2π(mod 1), então pela Fórmula de
Taylor
1
(1 − cos 2πml) ∼ 4π 2 (lm − n)2
2
onde n é o inteiro mais próximo de lm (estamos tomando a fórmula
de Taylor em torno de 2πn).

i i

i i
“mec˙New”
i i
2011/10/11
page 75
i i

75

Logo
Vm Vm
1 − cos(2πml) < K̃(4π)2 (lm − n)2 .


Se assumirmos que V (x) é analı́tica complexa na faixa em que a
parte imaginária de x é menor que ρ, então existe k, ρ tal que
|Vm | < k exp−2π|m|ρ (3.15)
Este resultado (3.15) pode ser facilmente obtido da fórmula in-
tegral de Cauchy de Variável Complexa (ver [N]), e considerando
um contorno retangular no plano complexo passando pelos pontos
−π, π, π + ρi, −π + ρi. Integrando neste contorno e usando o fato que
as integrais em dois lados do retângulo cancelam, segue o resultado.

Se V (z) não é analı́tica, mas apenas ν vezes diferenciável, então
k1
|Vm | < (3.16)
mν+1
para uma certa constante k1 (ver [Fi] seção 2.8).

Logo se V é ν vezes diferenciável,
12
Vm k2
1 − cos 2πml ≤ m(ν+1)/2 (lm − n) ,

onde k2 é uma constante.


Se l é número Diofantino, de (3.6)

l − n > γ 1 ,

r > 2.
m mr
O valor de r será especificado em breve.
Logo
1
|lm − n| > γ r−1
m
ou seja
1
γ < mr−1 .
|lm − n|
Concluindo
21 r−1
Vm < K3 m
1
= K3 ν+1 ,
1 − cos 2πml m(ν+1)/2 m 2 −r+1

i i

i i
“mec˙New”
i i
2011/10/11
page 76
i i

76 [CAP. 3: A TEORIA DE AUBRY

para uma certa constante K3 .


Tomando ν suficientemente grande
ν+1
−r+1 (3.17)
2
fica maior que 12 e assim, segundo a Observação 3.4, segue que (3.14)
é verdadeira e assim a série de Fourier da g que desejamos obter
converge.
Desta maneira, mostramos que sob certas condições existe solução
g contı́nua (em primeira aproximação) da equação (3.9) da curva
KAM (ver Observação 3.2).
Vamos fazer uma análise mais delicada da questão acima consi-
derada.
Estamos interessados em propriedades que são validas para todo
l em um conjunto de medida total. Sendo assim, podemos assumir
r = 2 + ε com ε pequeno (ver Observação 3.1 antes do teorema)
e concluir que para um conjunto de medida total de valores l (os
números Diofantinos), para valores λ menores que λcrı́tico , existe
uma curva KAM.

Neste caso, se V for apenas três vezes diferenciável já obtemos
de (3.17) (ver Observação 3.4) que

3+1 1
−r+1=2−2−ε+1>
2 2
pois
1
ε<
2

Sendo assim se V for três vêzes diferenciavel, a condição (3.13) é
válida para tal g e a Série de Fourier (3.12) de g converge, embora g
não seja necessariamente diferenciável (apenas contı́nua).

A conclusão final é que se V for três vezes diferenciável, então g
(ou seja f ) satisfazendo (3.8) e (3.9) existe é contı́nua e é expressa
através da Série de Fourier (3.9) acima descrita.
Se V ′ for mais de tres vezes diferenciável então as curvas obtidas
serão diferenciáveis. Quanto maior a classe de diferenciabilidade de
V ′ , maior será a classe de diferenciabilidade da g que define a curva
KAM. 

i i

i i
“mec˙New”
i i
2011/10/11
page 77
i i

77

É realmente um fato muito interessante o fato que propriedades


topológicas (a existência de curvas KAM ou a existência de conjuntos
de Cantor invariantes, conforme aparece no conjunto das 16 figuras)
dependem de propriedades de diferenciabilidade de V ′ e também de
propriedades numéricas de l.
Considere um valor l de distância média atômica fixado.
Se V ′ for analı́tica, então pode-se mostrar que para pequenos va-
lores de λ, a função g é analı́tica.
Pode-se mostrar que para valores de λ um pouco maiores, a curva
invariante é diferenciável, mas não analı́tica (mesmo que V ′ seja
analı́tica).
Para valores de λ moderadamente grandes, a aplicação padrão
definida acima, vai apresentar exemplos em que a g acima considerada
é realmente continua mas não diferenciável e este fato vai assegurar
a existência de curvas KAM não diferenciáveis.
Em todos os casos considerados acima, existe curva KAM.
No conjunto das oito figuras, logo após a Figura 1.14, para vários
valores de λ, plotamos várias órbitas no espaço de fase de várias
aplicações padrão T = Tλ associados ao potencial λV (u) = λ 12 (1 −
cos 2πu).
No conjunto das oito figuras antes da Figura 1.5 mostramos o
espaço de fase de várias órbitas para T quando λ = 0. Note a seme-
lhança deste caso com o bilhar no cı́rculo do Exemplo 1.1, Capı́tulo 3.
As figuras do meio das oito correspondem a valores não muito
grandes nem muito pequenos de λ.
A última figura do primeiro conjunto mostra o espaço de fase de
T para o valor λ que fica localizado um pouco antes da destruição da
última curva KAM. Esta curva tem número de rotação l = β a razão
áurea.
Um fato relevante a ser destacado é que a medida que aumen-
tamos λ mais e mais as g associadas a l Diofantinos vão deixando
de ser contı́nuas. Este fenômeno é conhecido como a destruição das
curvas invariantes em teoria KAM. A medida que estas curvas vão
sendo destruidas, aparecem conjuntos ’ralos”tipo Cantor e também
regiões bidimensionais invariantes (ver Figura 3.32). As regiões bidi-
mensionais ocupam uma parte cada vez maior de [0, 1] × [0, 1] até que
finalmente para valores muito grandes de λ elas parecem ocupar todo
o [0, 1] × [0, 1] (ver última figura do conjunto dos primeiros oito).

i i

i i
“mec˙New”
i i
2011/10/11
page 78
i i

78 [CAP. 3: A TEORIA DE AUBRY

Figura 3.3:

As dezesseis figuras foram obtidas da seguinte maneira, tomando


um ponto (p0 , u0 ) inicial ao acaso, iteramos 10,000 vezes a condição
inicial e plotamos esta trajetória de

{(p0 , u0 ), T (p0 , u0 ), ..., T 10000 (p0 , u0 )}.

Observação 3.5. Note que muitas das evidências numéricas que


aparecem nas figuras obtidas em computador não correspondem sem-
pre a conclusões verdadeiras. Por exemplo, para λ grande, a última
figura do conjunto das oito primeiras, mostra que aparentemente o
sistema é ergódico quando restrito a uma região bidimensional (es-
cura) de área positiva. Poderia ocorrer que certas órbitas ficam encer-
radas em regiões bidimensionais invariantes muito próximas da pró-
pria órbita. O que se assemelha a uma órbita que parece ocupar den-
samente o espaço de fase, na verdade seria apenas um ponto elı́ptico
(ver definição na última seção do texto, Definição 12.4) de perı́odo

i i

i i
“mec˙New”
i i
2011/10/11
page 79
i i

79

muito grande. Este fato não poderia ser percebido pela resolução do
computador que gerou tais figuras. Tal situação que parece insólita,
de fato corre com alguns parâmetros da aplicação “padrão”(ver [Du]).
As figuras obtidas de simulações no computador podem ser de
grande valia no entendimento da riqueza de fenômenos que aparecem
num sistema mecânico. Note que a Figura 1.8 parece descrever a exis-
tência de pontos elı́pticos. Elas por si só, no entanto, não asseguram
a veracidade matemática do fenômeno que parecem descrever.

Conclusão: Considere um potencial V analı́tico. Para um valor


pequeno de λ, não existem mais curvas invariantes para T com l ra-
cional. Elas são destruidas e dão lugar a órbitas periódicas. Não
existem também curvas com l irracional não Diofantino. Subsistem
varias curvas KAM com l Diofantino, mas a medida que aumenta-
mos λ, mais e mais destas curvas vão sendo destruidas, dando razão
ao aparecimento de conjuntos fractais (muito pequenos, quase im-
perceptiveis) e a regiões bidimensionais invariantes. Quando uma
curva KAM é destruida, aparece em geral uma sequência alternada
de pontos periódicos elı́pticos e hiperbólicos (ver última figura do se-
gundo conjunto). Aparecem assim pontos hipebólicos que geram as-
sim um conjunto tipo ferradura (ver [R02] [Ka ][PM]). A seção 6.3 em
[DL] descreve este fenômeno. Entremeado neste conjunto, aparecem
“ilhas elı́pticas”. Estas “ilhas elı́pticas” em torno dos pontos elipti-
cos, por sua vez, possuem curvas invariantes e cada um desta curvas
tem número de rotação (ou distância média atômica) l em torno de
cada ponto elı́ptico. Estas curvas, por sua vez, se tem numero de
rotação l (em torno do ponto elı́ptico) racional ou não Diofantino,
logo são destruidas ao aumentar o parâmetro λ . Restam as cur-
vas (em torno deste ponto elı́ptico) com l Diofantino, as quais vão
sendo destruidas a medida que o parametro λ aumenta criando novas
sequências de pontos hiperbólicos e elı́pticos e assim por diante. Para
valores de λ muito grande, aparentemente, só existe uma região bidi-
mensional invariante, ou seja a probabilidade uniforme P é ergodico
para T . Dizemos aparentemente, por causa da Observação 3.5 acima.
Existe uma conjectura que diz que para valores λ grandes, o con-
junto de tais λ que determinam T = Tλ não ergódica, é muito pequeno
em termos da medida uniforme em λ ∈ R (ver [Du] para maiores con-
siderações a respeito do assunto). Este resultado implicaria então que

i i

i i
“mec˙New”
i i
2011/10/11
page 80
i i

80 [CAP. 3: A TEORIA DE AUBRY

para λ grande, a maioria das transformações T seria ergódica para a


Probabilidade uniforme.
A evolução do espaço de fase com o parâmetro λ descrita acima
é o que se chama de fenômeno KAM.
A destruição das curvas invariantes acima descritas, correspondem
a destruição de toros invariantes em torno de pontos elı́pticos de
aplicações de Poincaré de primeiro retorno, conforme foi descrito no
fim da Seção 7, Capı́tulo 1 [L].
Aplicações do tipo padrão formam uma classe mais geral de apli-
cações denominadas de tipo “twist”ou também chamadas “aplicações
que giram para a direita”.
Esta classe de aplicações é objeto de intenso estudo nos últimos
anos (ver [MF] e [M2]).

Definição 3.7. Seja T : [0, 1] × [0, 1] → [0, 1] × [0, 1], obtida a partir
de uma função geradora S(x, X), dizemos que T (x, y) é do tipo que
gira para a direita, se T = (T1 , T2 ), e existe C > 0 tal que

∂T1
C< < C −1 . (3.18)
∂y

Tal T preserva área (ou seja, preserva dxdy.

Para aplicações do tipo acima podemos considerar o problema


análogo: determinar as qi onde T (q0 , p0 ) = (qi , p1 ) tais que se q0 ,
q1 , q2 , ..., qn são sucessivas iteradas na variável q de uma órbita
T j (q0 , p0 ) então para q0 , qn fixos a função

A(x1 , x2 , ..., xn−1 ) =

= S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn ),


A : E n−1 → R tem (q1 , q2 , ..., qn−1 ) como ponto crı́tico (ou mı́nimo),
etc....
É fácil ver que a aplicação T definida por (3.3) gira para a direita
′′
pois ∂T ∂u = λV (u) > 0 e é obtida através de uma função geradora
1

S(q, Q).

Exemplo 3.3. (Bilhares convexos) Considere como na seção ante-


rior a ação S(ui , ui+1 ) = |ui −ui+1 |, ou seja a distância entre o ponto

i i

i i
“mec˙New”
i i
2011/10/11
page 81
i i

81

u
Pi me ui+1 no bordo do bilhar, e a ação total de n a m como a soma
i=n S(ui , ui+1 ). As trajetórias do bilhar determinam configurações
crı́ticas para a ação total. A aplicação T que determinamos para o
bilhar convexo é portanto análoga a T que estamos considerando na
presente seção.
O difeomorfismo T do bilhar convexo é a aplicação induzida pelo
primeiro retorno ao bordo do bilhar convexo. A aplicação T preserva
área como vimos na Proposição 17, Capı́tulo 3 [L]. É fácil mostrar que
tal T satisfaz (3.18) (ver [LC] e [CRZ] para prova). Logo, utilizando a
S acima, a transformação T induzida pelas batidas do bilhar no bordo
de um bilhar convexo define uma aplicação que gira para a direita.

Seja T : [0, 1] × [0, 1] → [0, 1] × [0, 1], obtida a partir de uma


função geradora S(x, X), dizemos que T (x, y) é do tipo que gira para
a esquerda, se T = (T1 , T2 ), e existe C > 0 tal que

∂T1
−C −1 < < −C.
∂y

No caso do bilhar do Sinai (ver definição na seção 1) se conside-


rarmos a ação S(q, Q) = |q − Q| obteremos uma função T que gira
para esquerda.
Esclarecemos ao leitor que a teoria em que ”minimizamos

S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn )

para aplicações que giram para a direita”é a mesma teoria em que


”maximizamos

S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn )

para aplicações que giram para a esquerda”(ver [LC]).


Note no entanto que a teoria em que ”minimizamos

S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn )

para aplicações que giram para a esquerda”é diferente a teoria em


que ”minimizamos

S(q0 , x1 ) + S(x1 , x2 ) + ... + S(xn−2 , xn−1 ) + S(xn−1 , qn )

i i

i i
“mec˙New”
i i
2011/10/11
page 82
i i

82 [CAP. 3: A TEORIA DE AUBRY

para aplicações que giram para a direita”. No primeiro caso estare-


mos localizando conjuntos ”próximos”de pontos de sela e no segundo
conjuntos ”próximos”de pontos elı́pticos. Na última figura do pri-
meiro conjunto de oito vemos uma alternância de pontos elı́pticos e
pontos hiperbólicos em cada anel. Fixado uma aplicação T que gira
para a direita ”minimizar”ou ”maximizar”S vai determinar que tipo
de conjunto estamos tentando encontrar. As curvas KAM aparecem
apenas no problema em que minimizamos S.
Sendo assim no caso do bilhar do Sinai (ver definição na seção
1) é mais interessante considerar a ação S(q, Q) = −|q − Q| obtendo
assim uma função T que gira para direita.
Dada uma órbita periódica de um sistema Hamiltoniano, se a
aplicação de primeiro retorno T tem um ponto fixo elı́ptico, em geral
esta T é localmente uma aplicação que gira para a direita. Referimos
o leitor para [M2] para uma prova deste fato.
A teoria acima possui uma extensão para lagrangianos periódicos
e mais recentemente foi extendida para lagrangianos Autônomos. O
leitor pode encontrar um texto cobrindo tais assuntos em [CI] e [Fat].
Existe também uma teoria análoga para transformações expan-
sivas e sistemas tipo Anosov (ver [CLT]) em que se considera entre
outras coisas o expoente de Lyapunov.
Sendo assim, esperamos ter convencido ao leitor da importância
do entendimento dinâmico das aplicações que giram para a direi-
ta. Este entendimento possibilitaria a melhor compreensão de vários
problemas importantes da Mecânica Clássica. Muito trabalho ainda
será requerido para chegar ao entendimento matemático completo da
dinâmica de tais aplicações.

Exercı́cios
1. Mostre que a transformação T associada ao bilhar, considerada
na Seção 11, é do tipo que gira para a esquerda.

2. Mostre que os números Diofantinos tem probabilidade total na


reta.

i i

i i
“mec˙New”
i i
2011/10/11
page 83
i i

Capı́tulo 4

Formas Diferenciais em
Variedades

Nesta seção vamos apresentar de maneira resumida as principais pro-


priedades das formas diferenciais em variedades diferenciáveis, que
serão necessárias para o entendimento da próxima seção que analisará
o formalismo simplético. Referimos a [MC1] para o leitor que desejar
uma exposição mais completa do assunto abordado nesta seção.
O objetivo de considerar formas diferenciais como faremos a se-
guir, será apresentar no futuro (ver próxima seção) uma versão da
Mecânica Clśsica que seja intrı́nseca, isto é, que seja definida sem
apelo a coordenadas locais. Lembre que, por exemplo, para definir
o campo Hamiltoniano usamos a estrutura do R2n (necessitamos de
variáveis q e p separadas) de maneira essencial. Muitas vezes em
problemas fı́sicos concretos, não é natural supor que o sistema em
consideração seja um subconjunto do R2n . Isto vai nos conduzir ao
conceito de variedade diferenciável. Para definir o campo Hamiltoni-
ano necessitaremos também do conceito de formas diferenciais.
Dado p ∈ Rn , chamaremos de espaço tangente a Rn em p, e
denotaremos Rnp = (T Rn )p , o conjunto de todos os vetores tangentes
v do Rn , cuja origem está localizada no ponto p.

83

i i

i i
“mec˙New”
i i
2011/10/11
page 84
i i

84 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Mais precisamente, v ∈ Rnp determina a classe de todas as curvas


γ(t) ∈ Rn tal que γ(0) = p e γ ′ (0) = v.
Rnp é um espaço vetorial, e seu dual será (Rnp )∗ , isto é, o conjunto
de todos as transformações lineares f : Rnp → R.
Definição 4.1. Uma k-forma w em Rnp é por definição uma função
do tipo
w : Rnp × Rnp × · · · × Rnp → R
| {z }
k vezes

tal que w é linear em cada coordenada.


A forma w é dita alternada se ∀ i < j,

w(v1 , v2 , ..., vi , ..., vj , ..., vk ) = − w(v1 , v2 , ..., vj , ..., vi , ..., vk ).

Denotaremos para cada p ∈ Rn por Ωk (Rnp ), o conjunto das


funções k-lineares alternadas em Rnp tomando valores reais.
Note que se houver repetição de um elemento v na k-upla, então

w(v1 , v2 , ..., v, ..., v, .., vk ) = − w(v1 , v2 , ..., v, ..., v, ..., vk )

e portanto w(v1 , v2 , ..., v, ..., v, ..., vk ) = 0.


Exemplo 4.1. Em R3 a 3-forma w tal que w(v1 , v2 , v3 ) é o de-
terminante da matriz que tem como colunas (v1 , v2 , v3 ) é alternada.
Por exemplo, esta 3-forma satisfaz w(v1 , v2 , v3 ) = −w(v2 , v1 , v3 ) =
w(v2 , v3 , v1 ).

Exercı́cio: Mostre
Pk que se v1 é combinação linear de v2 , v3 , ..., vn ,
isto é, v1 = i=2 i vi , então w(v1 , v2 , ..., vn ) = 0. Em particular
α
para uma 2-forma w(v, v) = 0.
Este último conjunto Ωk (Rnp ) com a operação de soma de funções,
e multiplicação por escalar definidas de maneira usual, ((f + g)(x) =
f (x) + g(x) e (cf )(x) = cf (x), ∀x ∈ Rnp ), é um espaço vetorial.
Exemplo 4.2. Seja dx2 : R3 → R a projeção na segunda coordenada,

dx2 (y1 , y2 , y3 ) = y2 .

Então, dx2 ∈ R3∗ 3


p , para qualquer p ∈ R .

i i

i i
“mec˙New”
i i
2011/10/11
page 85
i i

85

As transformações lineares dxi : Rn → R, tal que

dxi (y1 , y2 , ..., yn ) = yi

são transformações (ou funcionais) lineares, que formam uma base


para Ω1 (Rnp ).

Observação 4.1. Ω1 (Rnp ) = (Rnp )∗ .

Note que dxi satisfaz dxi (ej ) = δi,j , i, j = 1, 2, ..., n, onde δi,j = 0
se i 6= j e δi,j = 1 se i = j.

Definição 4.2. Uma 1-forma ou forma exterior de grau 1 em um


aberto A do Rn , é uma aplicação ω definida em A ⊂ Rn tomando
valores em Ω1 (Rnp ), que associa a cada ponto p ∈ A ⊂ Rn , uma
funcão linear ω(p) : Rnp → R.
Como dx1 , dx2 , ..., dxn é base do espaço das transformações linea-
res, ω(p) poderá ser escrito como:

ω(p) = a1 (p)dx1 + a2 (p)dx2 + ... + an (p)dxn .

Se cada ai : A ⊂ Rn → R for diferenciável ∀ p ∈ A ⊂ Rn , diremos


que ω é uma 1-forma diferenciável ou forma exterior diferenciável de
grau 1.
Por abuso de notação, falaremos de uma forma diferencial em Rn
quando nos referirmos a uma 1-forma diferencial sobre um aberto
A ⊂ Rn .

Definição 4.3. Se ϕ1 , ϕ2 , ..., ϕk , são 1-formas lineares, podemos


obter um elemento
ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk
de Ωk (Rnp ), definindo:

(ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk )(v1 , v2 , . . . , vk ) = det([ϕi (vj )]).

Segue das propriedades do determinante, que (ϕ1 ∧ ϕ2 ∧ · · · ∧ ϕk )


é k-linear, alternada. É fácil ver que (ϕ1 ∧ · · · ∧ ϕk ) ∈ Ωk (Rnp ).
Em particular (dx1 ) ∧ · · · ∧ (dxk ) ∈ Ω(Rnp ). Denotaremos (dx1 ) ∧
· · · ∧ (dxk ) por (dx1 ∧ · · · ∧ dxk ).

i i

i i
“mec˙New”
i i
2011/10/11
page 86
i i

86 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Proposição 4.1. O conjunto {(dxi1 ∧ dxi2 ∧ · · · ∧ dxik )}, i1 < i2 <


· · · < ik , onde ij ∈ {1, 2, . . . , n}, forma uma base para Ωk (Rnp ).
Demonstração: Primeiramente veremos que os elementos deste
conjunto são linearmente independentes. Suponha que
X
ai1 ···ik dxi1 ∧ · · · ∧ dxik = 0.
i1 <···<ik

Considere fixado j1 < ... < jk , ji ∈ {1, 2, . . . , n}, tal que o corres-
pondente aj1 ···jk não seja nulo. Então para qualquer k-upla de ı́ndices
i1 < ... < ik , dxi1 ∧ · · · ∧ dxik aplicado a (ej1 , . . . , ejk ) resulta ser
(dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) =


dxi1 (ej1 ) dxi1 (ej2 ) ··· dxi1 (ejk )


= det .. .. .. ..
. . . . .

dxik (ej1 ) dxik (ej2 ) ··· dxik (ejk )
Lembramos que

0, se i 6= j
dxi (ej ) =
1, se i = j
Logo (dxj1 ∧ · · · ∧ dxjk )(ej1 , . . . , ejk ) = 1 e portanto aj1 ,...jk (dxj1 ∧
· · · ∧ dxjk )(ej1 , . . . , ejk ) = aj1 ,...,jk .
Mantendo-se fixo (ej1 , . . . , ejk ) e fazendo-se todas as escolhas pos-
sı́veis (diferentes desta) para i1 < i2 < · · · < ik , il ∈ {1, 2, . . . , n},
obteremos:

X
−aj1 j2 ···jk = ai1 ···ik (dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ),
i1 <···<ik
P∗
onde o significa que evitamos (i1 , ..., ik ) = (j1 , . . . jk ) no somatório
acima.
Note agora que se (i1 , i2 , · · · , ik ) é diferente de (j1 , ..., jk ) então
(dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) = 0.
Logo,
X
ai1 ···ik (dxi1 ∧ · · · ∧ dxik )(ej1 , . . . , ejk ) = 0 ⇒ aj1 ···jk = 0.
i1 <···<ik

i i

i i
“mec˙New”
i i
2011/10/11
page 87
i i

87

Obtivemos portanto uma contradição.


Logo o conjunto {(dxi1 ∧ dxi2 ∧ · · · ∧ dxik )p }, i1 < i2 < · · · < ik ,
onde ij ∈ {1, 2, . . . , n}, é linearmente independente em Ωk (Rnp ).
Mostraremos agora que se f ∈ Ωk (Rnp ), então f é uma combinação
linear da forma:
X
f= ai1 ···ik dxi1 ∧ · · · ∧ dxik .
i1 <···<ik

Para vermos isto, basta definirmos ai1 ···ik = f (ei1 , . . . , eik ) (lem-
bramos que f é k-linear alternada). 

Definição 4.4. Uma k-forma (ou forma exterior de grau k) em um


aberto A, A ⊂ Rn (k ≥ 1) é uma aplicação ω que a cada p ∈ A ⊂ Rn
associa ω(p) ∈ Ωk (Rnp ).
Como vimos na última proposição, ω pode ser escrito como:
X
ω(p) = ai1 ···ik (p)(dxi1 ∧ · · · ∧ dxik ),
i1 <···<ik

ij ∈ {1, 2, . . . , n} onde ai1 ···ik : A ⊂ Rn → R.


Se estas funções ai1 ···ik forem diferenciáveis, ω é chamada uma
k-forma diferenciável.

Por abuso de linguagem, as k-formas sobre abertos A do Rn serão


chamadas de k-formas diferenciais em Rn .

Observação 4.2. A k-upla (i1 , . . . , ik ), i1 < · · · < ik será indicada


por I, e a notação a ser usada a partir de agora será:
X
ω= aI dxI ,
I

dxI = dxi1 ∧ · · · ∧ dxik .


Convenciona-se que uma 0-forma diferenciável em Rn é uma função
diferenciável f : A ⊂ Rn → R.
Se ω e ϕ são duas k-formas,
X X
ω= aI dxI , ϕ = bI dxI ,
I I

i i

i i
“mec˙New”
i i
2011/10/11
page 88
i i

88 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

podemos definir a soma:


X
ω+ϕ= (aI + bI )dxI
I

e a multiplicação de ω por escalar c ∈ R


X
cω = c aI dxI .
I

Estas propriedades determinam que o conjunto das k-formas di-


ferenciais em A aberto do Rn é um espaço vetorial.

Definição 4.5. Se ω é uma k-forma e ϕ uma s-forma, podemos


definir uma operação chamada produto exterior ω ∧ ϕ, obtendo uma
k + s-forma.
Se X
ω= aI dxI , I = (i1 , . . . , ik ) k-forma
I
X
ϕ= bJ dxJ , J = (j1 , . . . , js ) s-forma.
J

Por definição,
X
ω∧ϕ= aI bJ dxI ∧ dxJ ,
I,J

onde dxI ∧ dxJ = dxi1 ∧ ... ∧ dxik ∧ dxj1 ∧ ... ∧ dxjs .

Note que esta definição é compatı́vel com a Definição 4.3.


Por exemplo, (2dx1 +5dx3 )∧(5dx2 +4dx3 ) = 10dx1 ∧dx2 +8dx1 ∧
dx3 − 25dx2 ∧ dx3 .

Proposição 4.2. Se ω é uma k-forma, ϕ uma s-forma e θ uma


r-forma, teremos:
(a) (ω ∧ ϕ) ∧ θ = ω ∧ (ϕ ∧ θ)
(b) (ω ∧ ϕ) = (−1)ks ϕ ∧ ω
(c) ω ∧ (ϕ + θ) = ω ∧ ϕ + ω ∧ θ quando r = s.

i i

i i
“mec˙New”
i i
2011/10/11
page 89
i i

89

Demonstração: (a) e (c) são P conseqüências das


P definições acima.
Para o item (b), sejam ω = I aI dxI e ϕ = J bJ dxJ , onde I =
(i1 , . . . , ik ) e J = (j1 , . . . , js )
X
ω∧ϕ= aI bJ dxi1 ∧ · · · ∧ dxik ∧ dxj1 ∧ · · · ∧ dxjs =
I,J
X
= aI bJ (−1)dxi1 ∧ · · · ∧ dxik−1 ∧ dxj1 ∧ dxik ∧ dxj2 ∧ · · · ∧ dxjs =
I,J
X
= (−1)k aI bJ dxj1 ∧ dxi1 ∧ dxi2 ∧ · · · ∧ dxik ∧ dxj2 ∧ · · · ∧ dxjs ,
I,J

fazendo a mesma inversão para dxj2 , dxjn , . . . , dxjs , ao final teremos


realizado este raciocı́nio s-vezes, teremos s-vezes (−1)k à frente de
aI bJ , ou seja, (−1)ks , portanto ϕ ∧ ω = (−1)ks ω ∧ ϕ. 
Note que uma n-forma diferenciável w em um aberto A do Rn é
sempre da forma w(x) = c(x) dx1 ∧ dx2 ∧ ... ∧ dxn , onde c : A → R é
uma função diferenciável.
Fixado x, para determinar c(x), basta tomar w(x)(e1 , e2 , ..., en ) =
c(x), onde ei , i ∈ {1, 2, .., n} é a base canônica do Rn .
Definição 4.6. Seja f : A ⊂ Rn → Rm uma função diferenciável,
então a derivada dfp : Rnp → Rm f (p) induz para cada ponto p ∈ A uma
transformação linear fp∗ : Ωk (Rm k n
f (p) ) → Ω (Rp ) do seguinte modo:
dado w ∈ Ωk (Rm ∗ k n
f (p) ), f (w) = w1 ∈ Ω (Rp ) é tal que

w1 (v1 , . . . , vk ) = fp∗ (ω)(v1 , . . . , vk ) = ω(dfp (v1 ), dfp (v2 ), . . . , dfp (vk )),
onde v1 , v2 , . . . , vk ∈ Rnp .
Fazendo p variar em Rn , obtemos uma aplicação f ∗ que leva k-
formas diferenciais do Rm em k-formas diferenciais do Rn .
Convenciona-se que f ∗ (g) = g ◦ f se g é uma 0-forma do Rm .
Enunciaremos a seguir algumas propriedades de f ∗ .
Proposição 4.3. Se f : A ⊂ Rn → Rm é diferenciável então:
(a) f ∗ (ω1 + ω2 ) = f ∗ (ω1 ) + f ∗ (ω2 ), onde ω1 e ω2 são k-formas.
(b) f ∗ (ω1 ∧ ω2 ) = f ∗ (ω1 ) ∧ f ∗ (ω2 ) onde ω1 e ω2 são 1-formas.
(c) f ∗ (gω) = f ∗ (g)f ∗ (ω) onde g é uma 0-forma do Rm e ω uma
k-forma do Rm .

i i

i i
“mec˙New”
i i
2011/10/11
page 90
i i

90 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Demonstração:
(a) f ∗ (ω1 + ω2 )(p) (v1 , v2 , . . . , vk ) =
= (ω1 + ω2 )(f(p) )(dfp (v1 ), . . . , dfp (vk )) =
= ω1 (f(p) )(dfp (v1 , . . . , dfp (vk )) + ω2 (f(p) )(dfp (v1 ), . . . , dfp (vk )) =
= f ∗ (ω1 )(p) (v1 , . . . , vk ) + f ∗ (ω2 )(p) (v1 , . . . , vk ).
(b) f ∗ (ω1 ∧ ω2 )(p) (v1 , v2 ) = (ω1 ∧ ω2 )f (p) (dfp (v1 ), dfp (v2 )) =

ω (df (v )) ω1 f (p) (dfp (v2 ))
= det 1 f (p) p 1 =
ω2 f (p) (dfp (v2 )) ω2 f (p) (dfp (v2 ))

f (ω ) (v ) f ∗ (ω1 )(p) (v2 )
= det ∗ 1 (p) 1 =
f (ω2 )(p) (v1 ) f ∗ (ω2 )(p) (v2 )

= (f ∗ (ω1 )(p) ∧ f ∗ (ω2 )(p) )(v1 , v2 ).

(c) f ∗ (gω)(p) (v1 , . . . , vk ) = (gω)(f(p) )(dfp (v1 ), . . . , dfp (vk )) =


= (g ◦ f )(p) f ∗ (ω)(p) (v1 , . . . , vk ) = f ∗ (g)(p) f ∗ (ω)(p) (v1 , v2 , . . . , vk ).

Estamos prontos agora para mostrar que a operação f ∗ é equiva-
lente à substituição de variáveis.
Seja f : A ⊂ Rn → Rm uma função diferenciável que associa
(x1 , . . . , xn ) a (y1 , y2 , . . . , ym ) da seguinte maneira:


 y1 = f1 (x1 , . . . , xn )

 y2 = f2 (x1 , . . . , xn )
..


 .

ym = fm (x1 , . . . , xn ).
P m
Seja ω = I aI dyI uma k-forma P do R , usando P a última pro-
posição, temos que: f (ω) = f ( I aI dyI ) = I f ∗ (aI )f ∗ (dyi1 ) ∧
∗ ∗

f ∗ (dyi2 )∧· · ·∧f ∗ (dyik ). Ora f ∗ (dyi )(v) = dyi (df (v)) = d(yi ◦f )(v) =
dfi (v) e f ∗ (aI ) = aI ◦ f = aI (f ), pois aI é uma o-forma (usamos
definição de f ∗ para 0-formas). Assim,
X
f ∗ (ω) = aI (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))dfi1 ∧dfi2 ∧· · ·∧dfik
I

i i

i i
“mec˙New”
i i
2011/10/11
page 91
i i

91

onde fi e dfi são funções de xj ,


n
X ∂fi
dfi = dxj ,
j=1
∂xj

portanto aplicar f ∗ a ω equivale a substituir em ω as variáveis yi e


suas diferenciais pelas funções xk e df (xk ).
Vimos na proposição anterior que a adição comuta com a substi-
tuição de variáveis (f ∗ (ω1 + ω2 ) = f ∗ (ω1 ) + f ∗ (ω2 )) veremos agora
que o produto exterior de duas formas diferenciais quaisquer também
comutam com a substituição de variáveis.
Na Seção 6, Capı́tulo 3 [L], quando consideramos mudanças de
variável
F (x, y) = (X(x, y), Y (x, y)),
a expressão de uma forma W na variável (X, Y ) era calculada na
variável (x, y). O Teorema 16 e a Proposição 17, Capı́tulo 3 [L],
são casos particulares da propriedade geral apresentada pela última
expressão. Por exemplo, expressar a forma diferencial W = dX ∧ dY
na variável (X, Y ) através de outra forma diferenciável w na variável
(x, y) corresponde a tomar w = F ∗ (W ), isto é, w = F ∗ (dX ∧ dY ) =
( ∂X ∂X ∂Y ∂Y
∂x dx + ∂y dy) ∧ ( ∂x dx + ∂y dy).

Exercı́cio: No caso geral, dados abertos A, B do Rn ,o difeomorfismo


f : A → B, e W (y) = c(y) dy1 ∧ ... ∧ dyn uma n-forma diferencial
em B, então a n-forma diferencial w = f ∗ (W ) em A é dada por
w(x) = c(f (x)) (det Df (x)) dy1 ∧ ... ∧ dyn = z(x) dy1 ∧ ... ∧ dyn . Isto
segue do fato que w(e1 , e2 , .., en ) = z(x).

Proposição 4.4. Seja f : A ⊂ Rn → Rm uma aplicação diferenciá-


vel que a cada (x1 , . . . , xn ) ∈ A ⊂ Rn , associa

(y1 , . . . , ym ) = (f1 (x1 , . . . , xn ), . . . , fm (x1 , . . . , xn ))

∈ Rm então:
(a) f ∗ (ω ∧ϕ) = f ∗ (ω)∧f ∗ (ϕ), onde ω e ϕ são formas diferenciais
em Rm .
(b) (f ◦ g)∗ (ω) = g ∗ (f ∗ (ω)), onde g : Rp → Rn é uma aplicação
diferenciável.

i i

i i
“mec˙New”
i i
2011/10/11
page 92
i i

92 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

P P
Demonstração: Sejam ω = I aI dyI , ϕ = I bJ dyJ .
P
Sabemos que: ω ∧ ϕ = I,J aI bJ dyI ∧ dyJ .
P
(a) f ∗ (ω ∧ ϕ) = I,J aI (f1 , . . . , fm )bJ (f1 , . . . , fm )dfI ∧ dfJ =
f (ω) ∧ f ∗ (ϕ)

P
(b) (f ◦ g)∗ (ω) = I aI ((f ◦ g)1 , . . . , (f ◦ g)m )d(f ◦ g)I =
P
= I aI (f1 (g1 , . . . , gn ), . . . , fm (g1 , . . . , gn ))dfI (dg1 , dg2 , . . . , dgn )
= g ∗ (f ∗ (ω)) 
Dada uma 0-forma diferenciável, ou seja, uma função diferenciável,
podemos obter uma 1-forma, efetuando a operação de derivação so-
bre f . Vamos definir agora uma operação sobre uma k-forma, a qual
chamaremos de diferencial exterior, que associa esta k-forma a uma
(k + 1)-forma.
P
Definição 4.7. Se ω = I aI dxI é uma k-forma diferencial, a di-
ferencial exterior de ω será a (k + 1)-forma diferencial definida da
seguinte maneira:
X
dω = daI ∧ dxI .
I

Proposição 4.5. (a) d(ω1 + ω2 ) = dω1 + dω2 , ω1 e ω2 são k-formas.


(b) d(ω1 ∧ ω2 ) = dω1 ∧ ω2 + (−1)k ω1 ∧ dω2 , ω1 uma k-forma e ω2
é uma s-forma.
(c) d(dω) = d2 ω = 0.
(d) d(f ∗ (ω)) = f ∗ (dω), onde ω é uma k-forma em Rm e f : A ⊂
R → Rm é uma aplicação diferenciável.
n

Observação 4.3. O item (d) nos diz que esta operação de tomar
derivada independe das coordenadas que usamos para representar ω.

Demonstração:
P P
(a) Sejam
P ω1 = I aI dxI e ω2 = I bI dxI duas k-formas e
ω1 + ω2 = I (aI + bI )dxI .
P P P
d(ω1 +ω2 ) = I d(aI +bI )∧dxI = I daI ∧dxI + I dbI ∧dxI =
dω1 + dω2

i i

i i
“mec˙New”
i i
2011/10/11
page 93
i i

93

P P
(b) ω1 = P I aI dxI uma k-forma e ω2 = J bJ dxJ uma s-forma,
ω1 ∧ ω2 = I,J aP I bJ dxI ∧ dxJ P
P d(ω 1 ∧ ω 2 ) = I,J d(aI bJ ) ∧ dxI ∧ dxJ = I,J daI bJ ∧ dxI ∧ dxJ +
I,J aJ db J ∧ dx I ∧ dx J =
P
= dω1 ∧ ω2 + (−1)k I,J aI dbJ (−1)k ∧ dxI ∧ dxJ = dω1 ∧ ω2 +
(−1)k ω1 ∧ dω2 .

(c) Demonstraremos este item usando indução em k.


Primeiramente provaremos a validade da asserção, para 0-formas.
Seja f : A ⊂ Rn → R.
n
! n
!
X ∂f X ∂f
d(df ) = d dxi = d ∧ dxi =
i=1
∂xi i=1
∂xi

n n
!
X X ∂2f
= dxj ∧ dxi =
i=1 j=1
∂xi ∂xj

X ∂2f X ∂2f
= dxj ∧ dxi + dxj ∧ dxi = 0,
i<j
∂xi ∂xj i>j
∂xi ∂xj

pois os coeficientes são iguais e dxj ∧ dxi = −dxi ∧ dxj , portanto


d(df ) = 0.
Suponhamos agora, por hipótese de indução, que tenhamos
d(dω) = 0, para uma k-forma ω, mostraremos que o mesmo vale para
uma (k + 1)-forma.
Toda a (k +1)-forma pode ser escrita como soma de (k +1)-formas
do tipo ω ∧ dxi . Pelo que provado no item (a), a soma comuta com a
diferenciação externa, portanto, temos que provar o item (c) apenas
para as (k + 1)-formas do tipo ω ∧ dxi .
d(d(ω ∧ dxi )) = d(dω ∧ dxi + (−1)k ω ∧ d(dxi )), ora xi : Rm → R
é uma 0-forma, logo d(dxi )) = 0, sendo assim
d(d(ω ∧ dxi )) = d(dω ∧ dxi ) = d(dω) ∧ dxi + (−1)k dω ∧ d(dxi ) = 0,
pois d d(ω) = 0 por hipótese de indução, e d(dxi )) = 0 também.
(d) Da mesma forma que fizemos no item (c), a demonstração
será feita por indução em k.
Provaremos o resultado inicialmente para uma 0-forma g : Rm → R.

i i

i i
“mec˙New”
i i
2011/10/11
page 94
i i

94 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

m
! m n
X ∂g X ∂g X ∂fi X ∂(g ◦ f )
∗ ∗
f (dg) = f dyi = dxj = dxj =
i=1
∂yi i=1
∂yi j=1 ∂xj j
∂xj

= d(g ◦ f ) = d(f ∗ g).


Suponhamos agora que d(f ∗ ω) = f ∗ (dω), para ω uma k-forma
provaremos que este resultado é válido para uma k + 1-forma.
Toda a k + 1-forma é escrita como uma soma finita de formas do
tipo ω ∧ dxi , mas tanto f ∗ , como “d”, comutam com a soma (pro-
posições anteriores), assim, temos apenas que provar este resultado
para k + 1-formas do tipo ω ∧ dxi .
f ∗ (d(ω ∧ dxi )) = f ∗ (dω ∧ dxi + (−1)k ω ∧ d(dxi )) = f ∗ (dω ∧ dxi ) =
f (dω) ∧ f ∗ (dxi ), mas por hipótese de indução f ∗ (dω) = d(f ∗ (ω)).

Portanto,

f ∗ (d(ω ∧ dxi )) = d(f ∗ (ω)) ∧ f ∗ (dxi ) =

= d[f ∗ (ω) ∧ f ∗ (dxi )] = d(f ∗ (ω ∧ dxi )).



Definição 4.8. A integral de uma k-forma diferenciável w em Rn ,
sobre uma superfı́cie k-dimensional S ⊂ Rn , parametrizada por uma
única g(x1 , ..., xk ), g : U ⊂ Rk → Rn , U simplesmente conexo, (tal
superfı́cie é dita simples conforme Definição 12, Capı́tulo 1) é por
definição
Z Z  
∂g ∂g ∂g
w= wg(x) , , ..., dx1 dx2 ...dxk
S U ∂x1 ∂x2 ∂xk

Esta definição engloba todas as definições de integral de forma


diferencial (integral de linha, de superfı́cies, sobre abertos etc.) apre-
sentadas na Seção 6, Capı́tulo 3.
Observação 4.4. Note que conforme o exercı́cio proposto anterior-
mente para uma n-forma diferencial

a(x) dx1 ∧ dx2 ∧ ... ∧ dxn

i i

i i
“mec˙New”
i i
2011/10/11
page 95
i i

95

em Rn , e f : A ⊂ Rn → Rn vale que
fx∗ (a(x) dx1 ∧ ... ∧ dxn ) = a(f (x)) (det Jac f )(x)dx1 ∧ ... ∧ dxn .
Deste modo se g1 : U1 → S e g2 : U2 → S forem duas cartas
coordenadas para S, aplicando este resultado para f = g1 ◦ (g2 )−1 ,
segue da fórmula de mudança de variáveis que
Z  
∂g1 ∂g1 ∂g1
wg1 (x) , , ..., dx1 dx2 ...dxk =
U1 ∂x1 ∂x2 ∂xk
Z  
∂g2 ∂g2 ∂g2
wg2 (x) , , ..., dx1 dx2 ...dxk .
U2 ∂x1 ∂x2 ∂xk
R
Logo, S w independe da escolha da carta coordenada e é assim
um conceito intrı́nseco.
Esta propriedade é similar a que foi considerada na Seção 10,
Capı́tulo 3 [L], sobre integrais de superfı́cies.

Exercı́cio: Mostre que dado f : A ⊂ Rn → A ⊂ Rn e w k-forma


diferencial, então f ∗ (w) = w, se e somente se, para toda superfı́cie
S ⊂ A de dimensão k
Z Z
w= f ∗ (w).
S S

Para a integral de uma forma diferencial sobre a superfı́cie simples


S estar bem definida, devemos fixar uma orientação sobre S (ver
Capı́tulo 3 [L]).
Para integrar superfı́cies k dimensionais não simples, que são ob-
tidas através de várias cartas g, utilizaremos partições da unidade
que serão apresentadas em breve (ver Definição 4.25).
Este procedimento será uma alternativa ao procedimento de co-
lar superfı́cies k dimensionais simples que foi desenvolvido na seção
Capı́tulo 3 [L]. Este procedimento poderá também ser utilizado para
integrar formas diferenciais em variedades.
Note que uma n-forma em Rn é sempre da forma a(x)dx1 ∧ dx2 ∧
... ∧ dxn .
Definição 4.9. Uma n-forma diferencial em Rn com a(x) ≥ 0 é
chamada uma forma volume sobre Rn .

i i

i i
“mec˙New”
i i
2011/10/11
page 96
i i

96 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Figura 4.1:

Note que segue da definição acima que para uma forma volume
w = a(x)dx1 ∧ dx2 ∧ ... ∧ dxn em Rn , e para um aberto A ⊂ Rn
Z Z
w= a(x)dx1 dx2 ...dxn .
A A

Vamos agora introduzir o conceito de variedade diferenciável.


Seja M um conjunto. Um sistema de coordenadas locais ou carta
local em M é uma aplicação bijetiva fα : Uα → fα (Uα ) de um sub-
conjunto Uα ⊂ M sobre um aberto fα (Uα ) ⊂ Rn .
Dizemos que n é a dimensão de fα : Uα → fα (Uα ).
Para cada p ∈ Uα tem-se fα (p) = (x1 (p), ..., xn (p)). Os números
xi = xi (p), i = 1, ..., n são chamados as coordenadas do ponto p ∈ M
no sistema fα .
Definição 4.10. Um atlas de dimensão n sobre um conjunto M é
uma coleção U de sistemas de coordenadas locais fα : Uα → Rn em
M , cujos domı́nios Uα cobrem M . Os domı́nios Uα dos sistemas de
coordenadas fα ∈ U são chamados as vizinhanças coordenadas de U.

i i

i i
“mec˙New”
i i
2011/10/11
page 97
i i

97

Definição 4.11. Um conjunto M no qual existe um atlas de di-


mensão n chama-se uma variedade de dimensão n. Em outras pala-
vras, M é uma variedade de dimensão n se, e somente se, cada ponto
x de M existe fα : Uα → Rn carta local com x ∈ Uα .
Usaremos a seguinte notação: gα : Vα → Uα ⊂ M é a inversa de
fα : Uα → Vα ⊂ Rn . Logo Vα é um aberto em Rn .
Sendo assim, um variedade M de dimensão n pode ser alternativa-
mente definida por um atlas U cartas gα : Vα → M , tal que ∪α gα (Vα )
cobre todo M e onde para todo α, Vα é aberto de Rn .
Exemplo 4.3. Toda superfı́cie M ⊂ Rm de dimensão n é uma va-
riedade de dimensão n.
Dados os sistemas de coordenadas locais fα : Uα → Rm e fβ :
Uβ → Rn no conjunto M , tais que Uα ∩ Uβ 6= ∅, cada ponto p ∈
Uα ∩ Uβ tem coordenadas xi = xi (p) no sistema fα e coordenadas
y i = y i (p) relativamente ao sistema fβ .
A correspondência
(x1 (p), ..., xn (p)) ↔ (y 1 (p), ..., y n (p))
estabelece uma bijeção ϕαβ = fβ ◦ fα−1 : fα (Uα ∩ Uβ ) → fβ (Uβ ∩ Uα )
que é chamada mudança de coordenadas.
As mudanças de coordenadas são ditas C ∞ se elas são de Classe
k
C para todo k ∈ N. Todas as variedades, mudanças de coordenadas,
funções etc., que consideraremos no texto serão assumidas ser de
classe C ∞ .
Definição 4.12. Um atlas U de dimensão n sobre um conjunto M
diz-se diferenciável, de classe C ∞ (k ≥ 1), se todas as mudanças de
coordenadas ϕαβ = fβ ◦ fα−1 , fα , fβ ∈ U são aplicações de classe
C ∞.
Como ϕαβ = (ϕβα )−1 , e ϕβα é diferenciável segue-se que os ϕαβ
são, de fato, difeomorfismos de classe C ∞ (ver Figura 4.1). Em par-
ticular, se escrevemos ϕαβ : (x1 , ..., xn ) 7→ (y 1 , ..., y n ), então o deter-
minante jacobiano !
∂y i
det
∂xj
é não nulo em todo ponto de fα (Uα ∩ Uβ ).

i i

i i
“mec˙New”
i i
2011/10/11
page 98
i i

98 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Definição 4.13. Uma variedade diferenciável, de dimensão n e classe


C ∞ é um par ordenado (M, U) onde M é um conjunto e U é um atlas
de dimensão n e classe C ∞ sobre M .
Na maioria das vezes vamos omitir o U quando nos referimos a
uma variedade M .
O espaço Rn é naturalmente uma variedade diferenciável com um
atlas U com uma única carta fα : Uα = Rn → Rn , onde fα (x) = x.
Definição 4.14. Uma variedade orientável M é uma variedade di-
ferenciável que admite um atlas cobrindo toda a variedade e de tal
jeito que as mudanças de carta coordenadas ϕαβ sempre satisfazem
a propriedade que que
!
∂y i
det > 0.
∂xj

Figura 4.2:

O conjunto de cartas que satisfazem tal propriedade é chamado


de uma orientação para a variedade. Quando falamos de uma varie-
dade M orientável, estamos implicitamente dizendo que fixamos uma
orientação em M , ou seja que fixamos um atlas como acima.

i i

i i
“mec˙New”
i i
2011/10/11
page 99
i i

99

Exercı́cio: O espaço Rn com o atlas U, constituı́do pelas cartas


f1 (x) = x e f2 (x) = 2x é uma variedade orientável.
Exemplo 4.4. O Plano Projetivo P 2 é uma variedade diferenciável
de dimensão dois como veremos a seguir. O plano projetivo P 2 é o
conjunto das retas r de R3 que passam pela origem (0,0,0) de R3 .
Uma tal reta é determinada por um ponto (x, y, z) 6= (0, 0, 0) de R3 e
os pontos (λx, λy, λz), λ 6= 0, determinam a mesma reta. Portanto,
P 2 é o espaço quociente de R3 −{(0, 0, 0)} pela relação de equivalência
que identifica (x, y, z) com (λx, λy, λz), λ 6= 0; os pontos de P 2 , que
são retas r passando pela origem, serão indicados por r = [x, y, z] =
{(x1 , y1 , z1 )| tal que existe λ 6= 0, tal que (x, y, z) = λ(x1 , y1 , z1 )}.
Qualquer elemento (x1 , y1 , z1 ) ∈ [x, y, z] pode ser tomado como
representante da classe, isto é, [x, y, z] = [x1 , y1 , z1 ].
Definimos em P 2 subconjuntos U1 , U2 , U3 por:

U1 = {[x, y, z]; x 6= 0},

U2 = {[x, y, z]; y 6= 0},


U3 = {[x, y, z]; z 6= 0}
e aplicações gi : R2 → Ui , i = 1, 2, 3, por:

g1 (u, v) = [1, u, v],

g2 (u, v) = [u, 1, v],


g3 (u, v) = [u, v, 1]
onde (u, v) ∈ R2 .
Em termos geométricos, U2 é o conjunto das retas de R3 que
passam pela origem e não pertencem ao plano xOz.
Afirmamos que as funções

fα1 = g1−1 , fα2 = g2−1 , fα3 = g3−1 ,

determinam um atlas C ∞ sobre P 2 . Com efeito, cada aplicação gi ,


i = 1, 2, 3, é evidentemente biunı́voca e
[
gi (R2 ) = P 2 .
i

i i

i i
“mec˙New”
i i
2011/10/11
page 100
i i

100 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

A última igualdade segue do fato que dado qualquer reta r, toman-


do um ponto (x, y, z) sobre ela e supondo (sem perda de generalidade)
que x 6= 0, então g1 (y/x, z/x) = r
Resta mostrar que fαi (Ui ∩ Uj ) é aberto em R2 e que fα−1 j
◦ fαi
é aı́ diferenciável. Demonstraremos este fato para i = 1, j = 2; os
outros casos são inteiramente análogos.
Os pontos de fα1 (U1 ∩ U2 ) são da forma (u, v), com u 6= 0, v 6= 0.
Portanto fα1 (U1 ∩ U2 ) é aberto em R2 e
   
−1 −1 1 v 1 v
fα2 ◦ fα1 (u, v) = fα2 [1, u, v] = g2 , 1, = ,
u u u u

é evidentemente diferenciável, como querı́amos.


Logo, P 2 admite um atlas C ∞ .
Pode-se mostrar que o plano projetivo não é uma variedade orien-
tável (ver por exemplo [Li3]).
Passaremos agora a estender às variedades diferenciáveis as noções
de Cálculo diferencial que são válidas em abertos do Rn .
Superfı́cies diferenciáveis de dimensão 2 podem ser obtidas via um
processo de colagem a partir de abertos do R2 (ver Figuras 4.2 e 4.3).
Definição 4.15. Seja S uma variedade diferenciável de dimensão n.
Uma função ϕ : S → R é diferenciável em p ∈ S se para alguma
parametrização gα : Vα → S, Vα ⊂ IRn com p ∈ gα (Vα ), tem-se que
ϕ ◦ gα : Vα → R é diferenciável no ponto gα−1 (p).
Diremos que ϕ é diferenciável em S se é diferenciável para todo
p ∈ S. A função ϕ ◦ gα é chamada a expressão de ϕ na parametriza-
ção gα .
É claro que esta definição independe da parametrização, pois se
gβ : Vβ → S é outra parametrização, com p ∈ gα (Vα ) ∩ gβ (Vβ ), então

ϕ ◦ gβ = (ϕ ◦ gα ) ◦ (gα−1 ◦ gβ ),

e assim ϕ ◦ gβ é diferenciável, se e somente se, ϕ ◦ gα é diferenciável


(pois é composta de aplicações diferenciáveis).
Um caso particular importante da definição acima é dado a seguir.
Definição 4.16. Seja S uma variedade de dimensão n. Uma curva
λ : I = (−ǫ, ǫ) ⊂ R → S é diferenciável em t ∈ I se, para alguma

i i

i i
“mec˙New”
i i
2011/10/11
page 101
i i

101

Figura 4.3:

parametrização gα : Vα → S, com λ(t) ∈ gα (Vα ), tem que gα−1 ◦ λ :


I → Rn é diferenciável em t.
A curva gα−1 ◦ λ = fα ◦ λ é chamada a expressão local de λ na
parametrização gα .
A verificação de que esta definição independe da parametrização
escolhida é análoga à anterior.
Gostarı́amos agora de definir a noção de vetor tangente a uma
variedade diferenciável S, e aı́ encontramos a nossa primeira dificul-
dade. Se a variedade S de dimensão n está contida no meio ambiente
Rk , então dada uma curva x(t) cuja imagem está contida em S faz
sentido x(t + δt) − x(t) ∈ Rk . A seguir tomando
x(t + δt) − x(t) ∈ Rk
lim = v ∈ Rk ,
δt→0 δt
obtemos o vetor tangente.
Quando S é definida intrinsecamente, S não é e nem está contida
num espaço vetorial, logo x(t + δt) − x(t) ∈ Rk não faz sentido.
Nosso problema se reduz então a definir de maneira alternativa o
vetor tangente a uma curva diferenciável λ : I → S. Por exemplo,

i i

i i
“mec˙New”
i i
2011/10/11
page 102
i i

102 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

quando S ⊂ R3 é superfı́cie de dimensão 2, o vetor tangente de λ


é simplesmente o vetor velocidade λ′ (t) de λ, como vetor de R3 .
Como não temos a estrutura ambiente de R3 , precisamos destacar
uma propriedade caracterı́stica do vetor tangente que não dependa
do espaço ambiente.
Para isto, seja v um vetor de R2 , com origem em p ∈ R2 e compo-
nentes (α, β). Escolha-se uma curva diferenciável λ : I = (−ǫ, ǫ) →
R2 com λ(0) = p e λ′ (0) = v = (α, β).
Se λ(t) = (u1 (t), u2 (t)), podemos escrever que

α = u′1 (0),

β = u′2 (0).
Observe-se agora que dada uma função ϕ, diferenciável em uma
vizinhança de p, podemos restringir ϕ a λ(t) e tomar a “derivada
direcional”de ϕ em relação a v, isto é
 
d(ϕ ◦ λ) ∂ϕ du1 ∂ϕ du2
= + =
dt t=0 ∂u1 dt ∂u2 dt t=0
     
∂ ∂
= α +β ϕ.
∂u1 t=0 ∂u2 t=0
Desta maneira, a “derivada direcional segundo v”é um operador
L sobre funções diferenciáveis que só depende de v. Esta será a pro-
priedade que tomaremos no caso geral para definir o vetor tangente
a uma curva.
O vetor v está associado de maneira única ao α e β que definem
o operador L = Lλ sobre funções ϕ tomando valores reais
     
∂ ∂
Lλ (ϕ) = L(ϕ) = α +β ϕ.
∂u1 t=0 ∂u2 t=0
Em outra palavras, optamos por determinar o vetor v por sua
ação sobre funções diferenciáveis em vez de tomar o objeto geométrico
v ∈ Rk .
Note que o operador acima depende de α e β e não da expressão
escolhida para λ (lembre que várias possı́veis curvas λ tem a mesma
tangente v = (α, β)).

i i

i i
“mec˙New”
i i
2011/10/11
page 103
i i

103

Um vetor tangente será considerado a seguir como um destes o-


peradores L : Dp → R obtidos a partir de um λ, agindo sobre Dp , o
conjunto das funções ϕ diferenciáveis em p.

Definição 4.17. Seja λ : I → S uma curva diferenciável em uma


variedade diferenciável S de dimensão n com λ(0) = p, e seja Dp
o conjunto das funções ϕ : S → R, diferenciáveis em p. O vetor
tangente a curva λ no ponto p é a função real L = Lλ : Dp → R tal
que para cada ϕ ∈ Dp ,

d
L(ϕ) = (ϕ ◦ λ) .
dt t=0

Um vetor tangente em p ∈ S é o vetor tangente de uma curva dife-


renciável λ : I → S, com λ(0) = p.

Muitas curvas distintas λ poderão determinar o mesmo operador


L = Lλ .
Denotaremos por Tp S o conjunto de tais vetores tangentes, ou
seja de tais operadores L. Algumas vezes, por abuso de linguagem,
vamos denotar o vetor tangente L = Lλ por λ′ (0), onde λ é um dos
λ tais que Lλ = L. Pode-se mostrar (ver considerações a seguir) que
o espaço Tp S de tais L = Lλ para diferentes λ, é um espaço vetorial
de dimensão n.
Note que vários λ podem determinar um mesmo L = Lλ . No caso
de superfı́cies de dimensão 2 em R3 , os λ que geram o mesmo L são
aqueles que determinam o mesmo vetor λ′ (0) = v ∈ R3 . Isto segue
do fato que os α e β acima ficam neste caso determinados de maneira
única a partir de v.
Algumas vezes, tais L da Definição 4.17 serão também denotados
por v ∈ Tp S.
Fixada uma parametrização
  gα (u1 , u2 , ..., un ), e um ponto p ∈ S

usaremos a notação ∂ui ∈ Dp para denotar o operador L definido
0
pela curva

x(t) = gα (u1 , u2 , ..., ui1 , ui + t, ui+1 , ..., un ),

onde gα (u1 , u2 , ..., un ) = p. Note que x(0) = p.

i i

i i
“mec˙New”
i i
2011/10/11
page 104
i i

104 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Para mostrar que a noção acima L = Lλ possui as proprie-


dades usuais dos vetores tangentes, considere uma parametrização
gα : Vα → S, com
gα (0, 0, ..., 0) = p.
Seja ϕ uma função diferenciável em uma vizinhança de p e supo-
nhamos que ϕ ◦ gα se escreva como ϕ(u1 , u2 , ..., un ). Então é claro
que
′ dϕ(u1 (t), u2 (t), ..., un (t))
λ (0)(ϕ) = =
dt
t=0
     
∂ ∂
= α1 + ... + αn (ϕ)
∂u1 0 ∂un 0
onde αi = u′i (0). Decorre daı́ que
   
∂ ∂
λ′ (0) = α1 + ... + αn
∂u1 0 ∂un 0

onde  

, i ∈ {1, ..., n}
∂ui 0
são os vetores tangentes em p respectivamente às curvas

ui → λ(0, ..., ui , ..., 0).

Seja T o espaço vetorial gerado por


 

, i ∈ {1, 2, ..., n}
∂ui 0

onde as operações são definidas como operações sobre funções.


Em resumo, como não podemos falar do vetor tangente da ma-
neira usual para superfı́cies, estamos substituindo o vetor tangente
pela sua ação sobre funções ϕ diferenciáveis.
Lema 4.1. O conjunto Tp (S) dos vetores tangentes v = Lλ a S em
p ∈ S coincide com T . O vetor (α1 , ..., αn ) ∈ Rn definido como
acima, é chamado de expressão local do vetor v segundo a carta gα .
A aplicação que leva (α1 , ..., αn ) em v é um isomorfismo de espaços
vetoriais.

i i

i i
“mec˙New”
i i
2011/10/11
page 105
i i

105

Demonstração: Pelo que acabamos de ver Tp (S) ⊂ T . Reciproca-


mente, se v ∈ T , então existem α1 , ..., αn ∈ R tal que
   
∂ ∂
v = α1 + ... + αn .
∂u1 0 ∂un 0

Seja λ : I → S uma curva, cuja expressão nas coordenadas


(u1 , u2 , ..., un ) da parametrização gα é u1 (t) = αi t,... un = αn t.
Então    
′ ∂ ∂
Lλ = λ (0) = α1 + ... + αn ,
∂u1 0 ∂un 0
isto é, v ∈ Tp (S).
Decorre daı́ que a soma de elementos L de Tp (S), definida como
soma de funções, é ainda um elemento de Tp (S) e o mesmo se passa
com o produto por um número real. É imediato verificar que, com
estas operações, Tp (S) é um espaço vetorial. Além disso,
   
∂ ∂
, ...,
∂u1 0 ∂un 0

são vetores linearmente independentes que geram Tp (S). Portanto


Tp (S) tem dimensão n e é chamado o plano tangente de S em p. 
A base     
∂ ∂
, ...,
∂u1 0 ∂un 0

de Tp (S) é chamada a base associada à parametrização f no ponto p.


Voltemos à extensão das noções de Cálculo às variedades diferen-
ciáveis.

Definição 4.18. Dada uma variedade S, o fibrado tangente a S é o


conjunto ∪p∈S Tp (S) = T S.

Note que o fibrado tangente tem uma estrutura de variedade


diferenciável de dimensão 2n. De fato, dado uma parametrização
gα,β (u1 , ..., un ), a função Gα,β (u1 , ..., un , u̇1 , ..., u̇n ) que associa a cada
(u1 , ..., un ) e a cada vetor

(u̇1 , ..., u̇n )

i i

i i
“mec˙New”
i i
2011/10/11
page 106
i i

106 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

o operador L definido por por


   
∂ ∂
L = u̇1 + ... + u̇n ,
∂u1 0 ∂un 0

determina cartas coordenadas de R2n em T S. Estas cartas, é fácil


ver, determinam em T S uma estrutura de variedade diferenciável.
Um campo de vetores G numa variedade M de dimensão n é uma
escolha de um vetor v(p) = G(p) ∈ Tp M para todo p ∈ M . O campo
de vetores é diferenciável se para alguma (todas) carta coordenada
fα = gα1 tal que p ∈ Uα , a expressão local de G(p) em Rn (ver Lema
4.1), através da carta coordenada fα , em coordenadas locais em Rn
define um campo de vetores diferenciável em Rn .
Uma curva λ(t) em M é uma solução da equação diferencial asso-
ciada ao campo de vetores G, com condição inicial p0 no tempo t0 , se
λ′ (t) = G(λ(t)) e λ(t0 ) = p0 . Passando para cartas locais fα , a exis-
tência e unicidade de soluções de campos de vetores diferenciáveis G
em variedades segue de imediato do Teorema 10.8 [DL] de existência
e unicidade. A solução λ(t) em M é obtida através da carta coorde-
nada fα e da solução da equação diferencial de primeira ordem em
fα (Uα ) ⊂ Rn . Para valores grandes de t (muito maiores que t0 ) a
solução pode sair fora de uma carta coordenada. A solução λ(t), neste
caso, é obtida pela expressão em cada carta local e “colada”pedaço
a pedaço em M .

Definição 4.19. Seja uma aplicação h : S1 → S2 e p ∈ S1 . Diz-


se que h é diferenciável em p, se existem sistemas de coordenadas
g1 : V1 → S1 e g2 : V2 → S2 com p ∈ g1 (V1 ) e h(p) ∈ g2 (V2 ),
tais que g2−1 ◦ h ◦ g1 é diferenciável em g1−1 (p). A aplicação h diz-se
diferenciável em S1 se for diferenciável em p para todo p ∈ S1 .

De uma maneira análoga ao que consideramos nas definições an-


teriores, verifica-se que a definição acima não depende dos sistemas
de coordenadas escolhidas.

Definição 4.20. Um difeomorfismo h : S1 → S2 é uma aplicação


bijetiva de S1 sobre S2 , tal que h e sua inversa h−1 : S2 → S1 são
diferenciáveis.

i i

i i
“mec˙New”
i i
2011/10/11
page 107
i i

107

Definição 4.21. A derivada de uma aplicação diferenciável h : S1 →


S2 em p ∈ S1 é a aplicação dhp : Tp S1 → Th(p) S2 que a cada operador
v = L ∈ Tp S1 (agindo em Dp ) associa o operador ṽ = L̃ = dhp (v) ∈
Th(p) S2 (agindo em Dh(p) ), da seguinte maneira: se L = Lλ = λ′ (0)
, para alguma curva λ : I → S1 com λ(0) = p, então dhp (v) =
(h ◦ λ)′ (0) = L̃ = L̃h◦λ . É fácil ver que dhp independe da curva
λ e que é uma aplicação linear. Vamos denotar a derivada de h
por dh : T S1 → T S2 , repetindo o processo acima em cada ponto
p ∈ S1 , onde T S1 (respectivamente T S2 ) denota o fibrado tangente a
S1 (respectivamente S2 ).
Observação 4.5. Com a noção de diferencial, podemos obter a se-
guinte interpretação da base de Tp (S), associada a uma parametri-
zação gα : Vα → S. Suponhamos que gα (q) = p, q = (0, 0, ..., 0),
e sejam {e1 , ..., en } os vetores da base canonica de Rn (e que estão
associados aos operadores

,
∂ui
i ∈ {1, 2, ..., n}). Então

d ∂
dgαq (ei ) = gα (0, ..., ui , ..., 0) =( )p ,
dui ui =0 ∂ui

formam um base de Tp S, se variamos i ∈ {1, 2, ..., n}.


Mais precisamente, para i ∈ {1, 2, ..., n} fixo e para cada ϕ ∈ Dp

∂ d
(ϕ) = ϕ ◦ gα (0, ..., ui , ..., 0)
∂ui p dui ui =0

é um elemento da base de Tp S.
Convém estendermos a definição de variedade, dada anterior-
mente, de modo a incluir as variedades com “bordo”. A definição
acima apresentada de variedade diferenciável não inclui, por exem-
plo, o conjunto M (o cilindro com bordo) dado por
M = {(x, y, z) ∈ R3 ; 1 = x2 + y 2 , 1 ≥ z0 ≥ 0},
pois a interseção V ∩M de qualquer vizinhança V em R3 de um ponto
p = (x, y, z0 ) do “bordo”de M com M não é sequer homeomorfa a
um aberto de R2 .

i i

i i
“mec˙New”
i i
2011/10/11
page 108
i i

108 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Observamos, entretanto, que V ∩ M é homeomorfa a um aberto


do semi-plano {(u, v) ∈ R2 ; v ≤ 0}, enquanto que os pontos de M
que não estão no bordo se comportam como pontos de uma variedade
de dimensão 2. Isso nos sugere uma nova definição de variedade que
inclui a situação mencionada.

Um aberto do Rn é sempre uma variedade de dimensão N .


Chamaremos de semi-espaço superior H n ⊂ Rn ao conjunto dada
por
H n = {(x1 , ..., xn ) ∈ Rn ; x1 ≥ 0}.
Um aberto V de H n é a interseção de um aberto U de Rn com
H , isto é, V = U ∩ H n .
n

Diremos que uma função f : V → R, definida de um aberto V de


H n é diferenciável se existir uma função f¯ : U → R de um aberto U
de Rn contendo V , tal que a restrição de f¯ a V seja igual a f . Se f
é diferenciável em V a diferencial dfp é definida por dfp = df¯p .
Se o aberto V não contém pontos da forma (0, x2 , ..., xn ) então,
V é um aberto de Rn e a definição coincide com a usual. Se p é
da forma (0, x2 , ..., xn ), dfp está definida para todos os vetores de Rn
com origem p, e não apenas para os que “apontam”para o semi-espaço
superior H n . Tomando curvas diferenciáveis em V passando por p, é
fácil mostrar que a definição de dfp não depende da extensão f¯ de f .
A definição de aplicação diferenciável f : V → Rn , V aberto em
n
H é estabelecida de maneira análoga.
Daremos agora uma definição de variedade com bordo, de modo
a incluir a definição (Definição 4.13) anterior de variedade como caso
particular.

Definição 4.22. Uma variedade diferenciável (de dimensão n) com


bordo regular é um conjunto M e um atlas de aplicações gα : Vα ⊂
H n → M de Vα ⊂ H n tomando valores em M tais que:
1)
[
gα (Vα ) = M
α

2) para todo par α, β, com gα (Vα )∩gβ (Vβ ) = W 6= ∅, os conjuntos


gα−1 (W ), gβ−1 (W ) são abertos em H n e as aplicações gβ−1 ◦gα , gα−1 ◦gβ ,
aı́ definidas, são diferenciáveis em H n (no sentido acima descrito).

i i

i i
“mec˙New”
i i
2011/10/11
page 109
i i

109

Figura 4.4:

Denotaremos por fα : Uα ⊂ M → H n as inversas dos respectivos


gα : Vα → M .
Um ponto p ∈ M é chamado um ponto do bordo de M se para um
sistema de coordenadas gα−1 = fα : Uα → H n em torno de p se tem
gα−1 (p) = fα (p) = (0, x2 , ..., xn ).
Note que para algumas cartas gα podem ter domı́nio Vα em aber-
tos em {(x1 , ..., xn ) | x1 > 0} e outras domı́nios Vα que possuem pon-
tos da forma (0, x2 , .., xn ).
Estas últimas cartas vão cobrir pontos do bordo de M .
Exercı́cio: O cilindro {(x, y, z) | x2 + y 2 = 1 , 0 ≤ z ≤ 1} é uma
variedade com bordo.
As definições de diferenciabilidade de funções, plano tangente,
orientabilidade, etc., para variedades com bordo são introduzidas de
maneira inteiramente análoga às correspondentes definições para va-
riedades.
Proposição 4.6. A definição de ponto de bordo independe do sistema
de coordenadas.
Demonstração: Seja g1 : V1 → M um sistema de coordenadas em
torno do ponto p do bordo de M tal que g1 (q1 ) = p, onde q1 é da
forma (0, x2 , ..., xn ).
Suponhamos, por absurdo, que em outro sistema de coordenadas
g2 : V2 → M se tenha g2 (q2 ) = p, onde q2 é da forma (x1 , ..., xn ),

i i

i i
“mec˙New”
i i
2011/10/11
page 110
i i

110 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

x1 6= 0.
Seja W = g1 (V1 ) ∩ g2 (V2 ); aplicação

g1−1 ◦ g2 : g2−1 (W ) → g1−1 (W )

é um difeomorfismo. Como q2 é da forma (x1 , ..., xn ) com x1 6= 0,


existe uma vizinhança U de q2 , V ⊂ g2−1 (W ) que não intercepta o
eixo x1 .
Restringindo g1−1 ◦ g2 a U , teremos uma aplicação diferenciável

g1−1 ◦ g2 : U → H n

com jacobiano não nulo em q2 ∈ U . Pelo teorema da função inversa


(ver [Li1]), g1−1 ◦ g2 leva uma vizinhança V ⊂ U de q2 em Rn difeo-
morficamente sobre uma vizinhança g1−1 ◦ g2 (V ) ⊂ g1−1 ◦ g2 (U ) de q1
em Rn ; mas então, g1−1 ◦ g2 (V ) conteria pontos de forma (x1 , ..., xn )
com x1 > 0, o que contradiz o fato de g1−1 ◦g2 (V ) ⊂ g1−1 (S). Portanto
a hipótese de que q2 é da forma (x1 , ..., xn ) com x1 6= 0 leva a uma
contradição.
O conjunto dos pontos de bordo de M que é, portanto, bem deter-
minado, é chamado o bordo de M e indicado por ∂M . Se ∂M = ∅, a
Definição 4.19 coincide com a Definição 4.13 de variedade diferencial.

Proposição 4.7. O bordo ∂M de uma variedade diferenciável de
dimensão n com bordo é uma variedade diferenciável de dimensão
n − 1.
Demonstração: Seja p ∈ M um ponto do bordo de M e gα :
Vα → M um sistema de coordenadas em torno de p, i.e., Vα ⊂ H n é
aberto, gα é biunı́voca e gα (q) = p, onde q = (0, x2 , ..., xn ) ∈ U .
Seja Z̄α = Vα ∩{(x1 , x2 , ..., xn−1 , xn ) ∈ Rn ; x1 = 0}. Identificando

{(x1 , x2 , ..., xn ) ∈ Rn ; x1 = 0}

com Rn−1 , Z̄α é um conjunto aberto de Rn−1 .


Se denotarmos por ḡα a restrição de gα a Z̄α , então pela Pro-
posição 4.6, ḡα (Z̄α ) ⊂ ∂M . É fácil ver que a famı́lia {(Z̄α , ḡα )} é
uma estrutura diferenciável em ∂M . A definição de orientação é
apresentada na Definição 4.14.

i i

i i
“mec˙New”
i i
2011/10/11
page 111
i i

111

Proposição 4.8. Seja M uma variedade com bordo ∂M . Se M é


orientável, uma orientação de M induz uma orientação em ∂M .
Demonstração: Fixemos uma orientação em M , isto é, escolha-
mos uma famı́lia gα : Vα → M de sistemas de coordenadas tal que
{gα (Vα )} cobre M , e se gα (Vα ) ∩ gβ (Uβ ) 6= ∅ então a mudança de
coordenadas tem jacobiano positivo. Consideremos a famı́lia dos Vα
tal que gα (Vα ) ∩ ∂M 6= ∅. Como vimos na proposição anterior, a
famı́lia {(Z̄α , ḡα )} é uma estrutura diferenciável em ∂M .
Basta então mostrar que se ḡα e ḡβ são dois sistemas de coorde-
nadas tais que ḡα (Z̄α ) ∩ ḡβ (Z̄β ) 6= ∅, a mudança de coordenadas
α β
uα β
2 = u2 (u2 , ..., un )

..
.
α β
uα β
n = un (u2 , ..., un )

satisfaz a condição
∂(uα α
2 , ..., un )
> 0.
∂(uβ2 , ..., uβn )
Para isso, observamos que a mudança de coordenadas de gα : Vα →M
a gβ : Vβ → M satisfaz as condições
β
0 = uα β
2 (0, u2 , ..., un )

α β
uα β
2 = u2 (u2 , ..., un )
..
.
β
uα α β
n = un (0, u2 , ..., un ),

e portanto
∂(uα α
1 ...un )
(0, uβ2 , ..., uβn ) =
∂(uβ1 ...uβn )
∂uα ∂(uα α
2 , ..., un )
1
(0, uβ2 , ..., uβ2 ) (0, uβ2 , ..., uβn ) > 0.
∂uβ1 ∂(uβ2 , ..., uβn )
Além disso,
∂uα
1
(0, uβ2 , ..., uβn ) > 0,
∂uβ1

i i

i i
“mec˙New”
i i
2011/10/11
page 112
i i

112 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

β β
pois uα β
1 = 0 em (0, u2 , ..., un ) e torna-se negativo com u1 . Portanto

∂(uα α
2 , ..., un )
> 0.
∂(uβ2 , ..., uβn )


Toda variedade diferenciável é uma variedade diferenciável com
bordo.

Definição 4.23. Dada uma variedade diferenciável com V de di-


mensão n, uma k-forma w em V é uma aplicação k-linear alternada
em cada fibra Tz M, z ∈ V . Em outras palavras, wz (v1 , v2 , ..., vk ) para
cada z ∈ V fixo, é linear em cada vi , i ∈ {1, 2, ..., n} e é também
alternada.

Por exemplo as 1-formas são aplicações 1-lineares, e assim, para


cada z são transformações lineares em cada Tz M tomando valores
reais.

Definição 4.24. Uma k-forma diferenciável w em uma variedade


diferenciável V é uma k-forma em V tal que para cada carta de
coordenadas locais gα : Vα ⊂ V → Rn , nas coordenadas locais
(x1 , x2 , ..., xn ), a forma w é expressa como
X
aI (x1 , x2 , ..., xn )dxI
I

e os aI (x1 , x2 , ..., xn ) são diferenciáveis em (x1 , x2 , ..., xn ).


Denotamos Ωk (V ) o conjunto das k-formas diferenciáveis em V .

As definições introduzidas anteriormente para formas diferenciais


em Rn se estendem de maneira análoga para formas diferenciais em
variedades V .
Por exemplo, a derivada dw de w ∈ Ωk (V ) é uma (k + 1)-forma
diferenciável dw ∈ Ωk+1 (V ) tal que em coordenadas locais é igual a
derivada de w (em coordenadas locais). Em geral qualquer conceito
que seja local, como derivada, etc. definido em Rn vai se extender
para uma variedade diferenciável V de maneira semelhante à maneira
acima utilizada.

i i

i i
“mec˙New”
i i
2011/10/11
page 113
i i

113

Seja M variedade de dimensão n e N variedade de dimensão r,


dada uma aplicação f : M → N , e uma k-forma diferencial w ∈
Ωk (N ), f ∗ (w) ∈ Ωk (M ) é obtida através da expressão local de f e
usando a definição anterior para fp∗ : Ωn (Rr ) → Ωk (Rn ). Portanto,
f ∗ (Ωk (N )) ⊂ Ωk (M ).

Figura 4.5:

Ainda, se w1 ∈ Ωk (V ) é uma k-forma e w2 ∈ Ωj (V ) é uma j-


forma, a (k + j)-forma w1 ∧ w2 ∈ Ωk+j (V ) é por definição dada local-
mente pelo produto exterior destas duas formas em cartas locais. To-
dos estes conceitos estão bem definidos. A forma w1 ∧ w2 ∈ Ωk+j (V )
é chamada de produto exterior de w1 e w2 .
Vamos considerar a partir de agora que o leitor está familiarizado
com as análogas definições de formas diferenciais sobre Rn para as
variedades diferenciáveis M .
Lembre que o suporte de uma k-forma w (respectivamente, uma
função φ) é o conjunto dos pontos q tal que wq (respectivamente φ)
não é nula.
Uma subvariedade A contida na variedade V , é uma variedade tal
que seu conjunto de pontos x ∈ A está contido em V e a aplicação de
inclusão i : A → V é diferenciv́el (como aplicação entre variedades).
Exigimos ainda que a aplica cão i tenha derivada injetiva me todos
os pontos.

i i

i i
“mec˙New”
i i
2011/10/11
page 114
i i

114 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Seja V variedade de dimensão n. Para definir integral de uma k-


forma w ∈ Ωk (V ) sobre uma sub-variedade A de dimensão r contida
na variedade V (ver Definição 4.33), necessitaremos de algum cuidado
especial (integrar não é um conceito local como derivar). Em primeiro
lugar, se a forma w que desejamos integrar tem suporte no domı́nio Uα
de uma carta coordenada fα : Uα ⊂ V → Rn , então a sub-variedade
A, em cordenadas locais x ∈ Rn , vai resultar numa superfı́cie de
dimensão k em Rn .
A integral de w em A é neste caso a integral da forma w em A
(superfı́cie n-dimensional) nas coordenadas locais (x1 , x2 , ..., xn ) em
Rn (ver Definição 4.8). Não é difı́cil ver que tal conceito está bem
definido.
O problema é como definir integral no caso em que o suporte
da forma w não cabe inteiramente dentro do domı́nio de uma carta
coordenada.
Definição 4.25. Seja M variedade diferenciável, um conjunto coor-
denadas locais fαi : Uαi ⊂ M → Rn , i ∈ N. Considere um conjunto
P∞ 0 ≤ φi , i ∈ N definidas em M tomando va-
de funções diferenciáveis
lores em R tal que i=1 φi (x) = 1 e tal que o suporte de cada φi (q)
esta contido em Uαi . Vamos supor ainda que em cada carta Uαi ape-
nas um número finito das φj são não nulas. Tal conjunto de funções
φi , i ∈ N é chamada de uma partição da unidade para M .
Pode-se mostrar (ver por exemplo [MC1]) que dada uma variedade
diferenciável M sempre existe uma partição da unidade para M .
A partir de uma partição da unidade podemos definir a integral
de uma k-forma w como veremos em breve.
Referimos o leitor a [Li4] para referências sobre produto interno
e formas quadráticas.
Definição 4.26. Uma estrutura Riemanniana em uma variedade di-
ferenciável M de dimensão n é uma escolha de uma forma quadrática
W (v), v ∈ T Mq , q ∈ M definida positiva em cada plano tangente
T Mq . Vamos também exigir que tal forma quadrática W quando ex-
pressa em coordenadas locais gα : Vα ⊂ M → Rm seja tal que os
coeficientes aij (x1 , ..., xn ) de
n
X
ai,j (x1 , ..., xn )vi vj
i,j=1

i i

i i
“mec˙New”
i i
2011/10/11
page 115
i i

115

sejam diferenciáveis em (x1 , ..., xn ) ∈ gα (Vα ).


Acima, vi , i ∈ {1, 2, ..., n} denota as componentes do vetor tan-
gente v nas coordenadas x = (x1 , ..., xn ).
M munida de tal estrutura é denominada variedade Riemanniana.

Uma forma quadrática W está sempre associada de maneira única


a um produto interno < , >=< u, v >, u, v em T Mq tal que vale
W (v) =< v, v >, ∀v ∈ T Mq . Reciprocamente, podemos definir <
u, v >, u, v ∈ T Mq a partir de W por < u, v >= 12 (W (u + v) −
W (u) − W (v)).
Denotaremos a variedade diferenciável M com tal estrutura Rie-
manniana por (M, < , > ).
Note que cada carta local gα determina uma métrica Riemanniana
n
X
ai,j (x1 , ..., xn )vi vj
i,j=1

em um aberto no Rn no sentido anteriormente considerado (ver De-


finição 1, Seção 2 e Definição 20, Seção 7 do Capı́tulo 2.)

Proposição 4.9. Toda variedade diferenciável admite uma métrica


Riemanniana.

Demonstração: Sejam fi : Ui →Rn coordenadas locais e φi : M →R


funções diferenciáveis que determinam uma partição da unidade.
Se v é vetor tangente a M no ponto p e se p ∈ Ui , denotaremos
vi1 , ..., vin as coordenadas de v segundo fi .
Seja Wi (v) = vi21 + ... + vi2n se v ∈ Ui e Wi (v) = 0 se v não está
em Ui . P
Então W = φWi é uma métrica Riemanniana em M . Para
provar isto, basta lembrar que a soma anterior é localmente finita.
O comprimento de uma curva γ(t), t ∈ [a, b] contida em M é
obtida considerando várias cartas fi : Ui → Rn , i ∈ {1, ..., s} de tal
modo que o traço da curva γ esteja contido em ∪si Ui , pois γ[a, b] é
compacto (ver Definição 4.32, Capı́tulo 3). A seguir, dividimos [a, b]
em intervalos [a, a1 ], [a1 , a2 ], [a2 , a3 ], ..., [as−1 , b] que definem uma
partição de [a, b] de tal modo que γ[ai , ai+1 ] ⊂ Ui . Podemos calcular
o comprimento de γ[ai , ai+1 ] passando a uma carta local fi : Ui → Rn

i i

i i
“mec˙New”
i i
2011/10/11
page 116
i i

116 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

(use a Definição 18, Seção 7, Capı́tulo 2 para o comprimento de uma


curva γ|[ai ,ai+1 ] segundo uma métrica Riemanniana num aberto do
Rn ). O comprimento de γ, denotado por kγk, é por definição a
soma dos comprimentos das curvas γ[ai , ai+1 ]. Pode-se mostrar que
este procedimento está bem definido, isto é, não depende das cartas
escolhidas.
Vamos apresentar as seguir algumas definições e propriedades de
espaços métricos. Referimos o leitor a [Li2] para uma exposição com-
pleta sobre o tópico.

Definição 4.27. Um espaço métrico M é um conjunto munido com


uma função d(x, y), x, y ∈ M , d : M × M → R, chamada distância
(ou métrica) tal que
a) d(x, y) ≥ 0 e ainda vale que d(x, y) = 0, se e só se, x = y;
b) d(x, y) ≤ d(x, z) + d(z, y), ∀x, y, z ∈ M ;
c) d(x, y) = d(y, x).
Vamos denotar tal espaço por (M, d).

Exemplo 4.5. Quando considerarmos M o espaço Rn , então d(x, y)


= kx − yk (onde k k é a norma Euclidiana) define uma métrica, isto
é, as propriedades a), b), c) acima são satisfeitas para tal d. Para
abertos do Rn , se nada for dito, estaremos considerando a métrica
d(x, y) = kx − yk.

Definição 4.28. Um aberto A no espaço métrico (M, d) é um con-


junto A ⊂ M tal que ∀x ∈ A, existe ǫ > 0 tal que

{y ∈ M | d(x, y) < ǫ} ⊂ A.

Definição 4.29. Um conjunto F contido em (M, d) é dito fechado


se o conjunto M − F é aberto.

Definição 4.30. Uma aplicação contı́nua F : M1 → M2 , entre dois


espaços métricos (M1 , d1 ) e (M2 , d2 ), é uma aplicação F tal que, para
todo ponto x ∈ M1 , vale que para todo ǫ > 0, existe δ > 0 tal que se
d(x, y) < δ então d(f (x), f (y)) < ǫ.

Definição 4.31. Um homeomorfismo h entre os espaços métricos


(M1 , d1 ) e (M2 , d2 ) é uma aplicação bijetiva tal que h e h−1 são
contı́nuas.

i i

i i
“mec˙New”
i i
2011/10/11
page 117
i i

117

Uma cobertura de um espaço métrico M é uma coleção de abertos


Ai contidos em M (onde i varia num conjunto qualquer de ı́ndices)
tal que M ⊂ ∪i Ai .

Definição 4.32. Um espaço métrico M é dito compacto se toda co-


bertura por abertos admite uma subcobertura finita.

Exemplo 4.6. Para uma superfı́cies S de dimensão k em Rn , sempre


podemos considerar a métrica induzida pelo Rn , ou seja d(x, y) = kx−
yk, x, y ∈ S define uma métrica em Rn . É possı́vel mostrar que toda
superfı́cie S que é fechada no espaço Rn e que seja também limitada
(isto é, existe K ∈ R tal que ∀x, y ∈ S, d(x, y) ≤ K) é compacta
com relação a tal métrica. Logo, neste caso, é possı́vel selecionar
a partir de um atlas qualquer de S, um novo atlas com apenas um
número finito de cartas coordenadas. Isto porque, o domı́nio Uα de
cada carta coordenada de um atlas é um aberto de S e S é compacta.
Dada uma variedade diferenciável M com uma estrutura Rieman-
niana, vamos mostrar que sempre é possı́vel obter uma métrica (no
sentido da Definição 4.24) a partir da métrica Riemanniana.

Exemplo 4.7. Considere (M, < , >) variedade Riemanniana. E-


xiste uma distância natural d = d< , > em M associada à estrutura
Riemanniana < , >, definida para (x, y) ∈ M por

d(x, y) = inf{kγk | γ[a, b] → M,

γ é curva em M ligando γ(a) = x a γ(b) = y}.

É possı́vel mostrar que tal d define realmente uma métrica em M


(ver [MC1] [Li3]).
Vamos supor a partir deste momento pelo resto do texto que a
variedade M que vamos considerar esteja equipada com uma métrica
Riemanniana < , > e com a distância d = d< , > associada à estrutura
Riemanniana < , > do Exemplo 4.7.
Sempre se pode equipar uma variedade M com uma estrutura
Riemanniana como vimos na Proposição 4.9 acima.
Quando falarmos de um aberto em M variedade Riemanniana,
estaremos nos referindo à Definição 4.28 e usando a distância d acima
descrita.

i i

i i
“mec˙New”
i i
2011/10/11
page 118
i i

118 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

É fácil mostrar que toda variedade diferenciável compacta M (com


uma métrica Riemanniana) admite um atlas com um número finito
de cartas coordenadas. Isto segue do fato que os domı́nios das cartas
coordenadas locais Uαi são abertos de M .
Dada uma estrutura Riemanniana numa variedade V , sempre que
considerarmos A subvariedade de V (ver Definição 4.33, Capı́tulo 3),
estaremos considerando em A a estrutura Riemanniana obtida pela
restrição da estrutura Riemanniana de V a A.

Definição 4.33. Quando dizemos que A é uma subvariedade da va-


riedade V (que possui uma métrica Riemanniana < , >), estamos
querendo dizer que o subconjunto de pontos de A está contido em
V , que a função inclusão i : (A, d1 ) → (V, d2 ) tal que i(x) = x é
um homeomorfismo de A sobre i(A) ⊂ V (com respeito à métrica d1
associada à estrutura Riemanniana induzida em A e d2 a métrica as-
sociada à estrutura Riemanniana em V ) e ainda que para todo p ∈ A
a derivada dip : Tp A → Tp V é injetiva.

Suponha que A seja subvariedade da variedade V . Quando dize-


mos que A é compacta, isto significa que estamos considerando em A
a distância d< , > = d< , >A obtida pela métrica Riemanniana < , >A ,
restrição da métrica Riemanniana de V a A. Sendo assim é possı́vel
mostrar que A está contida numa união finita de domı́nios Uαi de car-
tas de V . Na próxima definição estaremos utilizando as considerações
feitas acima.

Exemplo 4.8. Um exemplo de espaço métrico é o conjunto F das


funções contı́nuas F = {f | f : (a, b) → Rn , f contı́nua }, com a
distância d tal que d(f, g) = supremo {kf (x) − g(x)k}x∈(a,b) , onde
f, g ∈ F.

Exemplo 4.9. Um exemplo de espaço métrico é o conjunto F ∗ das


funções C 1 , F ∗ = {f | f : (a, b) → Rn , f é de classe C 1 }, com
a distância d tal que d(f, g) = supremo {kf (x) − g(x)k , kf ′ (x) −
g ′ (x)k}x∈(a,b) , onde f , g ∈ F ∗ .

A distância do Exemplo 4.9 foi anteriormente considerada na


Seção 2, Capı́tulo 2.

i i

i i
“mec˙New”
i i
2011/10/11
page 119
i i

119

Figura 4.6:

Definição 4.34. Dizemos que um conjunto B contido em um espaço


métrico M é denso em (M, d), se para todo x ∈ M e ǫ > 0, existe
y ∈ B tal que d(x, y) ≤ ǫ.

A definição acima generaliza a Definição 13, Capı́tulo 1 e e a


Definição 6, Capı́tulo 3.
Muitas das propriedades interessantes de um sistema mecânico,
embora não acontecam para todos os possı́veis sistemas, são no en-
tanto verdadeiras para sistemas que estão num subconjunto denso
B de tais sistemas (ver por exemplo no fim da Seção 7, Capı́tulo 1,
Exemplo 13, Capı́tulo 1, considerações após Definição 13, Capı́tulo 1
e considerações antes do Teorema 5, Capı́tulo 3).
Após as considerações anteriores, estamos agora prontos para defi-
nir a integral de uma forma diferencial numa variedade diferenciável.

Definição 4.35. Dada uma k-forma diferenciável w ∈ Ωk (V ) na


variedade Riemanniana diferenciável V de dimensão r e uma partição
da unidade φi , i ∈ N para V , a integral da k-forma w em uma sub-
variedade diferenciável compacta A, A ⊂ V de dimensão k (k ≤ r) é

i i

i i
“mec˙New”
i i
2011/10/11
page 120
i i

120 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

dada por
Z ∞ Z
X
w= φi (q)wq .
A i=1 A

Cada uma das integrais da soma da expressão da direita está bem


definida pois a k-forma φi w tem suporte em finitas Ui , domı́nio da
carta coordenada xi .
Pode-se mostrar que tal conceito está bem definido e a integral
não depende da partição da unidade φi , i ∈ N escolhida (ver [MC1]).
Exercı́cio: Mostre que dado f : V → V , V variedade diferenciável, e
w k-forma diferencial sobre V , então f ∗ (w) = w, se eR somente
R se, para
toda subvariedade S ⊂ V de dimensão k, vale que S w = S f ∗ (w).
O resultado principal desta seção é o Teorema de Stokes, que vale
em grande generalidade e que será apresentado a seguir.
Teorema 4.1. (Teorema de Stokes) Considere V variedade Rieman-
niana diferenciável de dimensão r. Dada uma n-forma diferenciável
w ∈ Ωn (V ), n ≤ r − 1 e uma variedade compacta C de dimensão
n + 1 com bordo ∂(C) de dimensão n, C subvariedade de V , então
Z Z
dw = w.
C ∂C

Para sermos mais precisos deverı́amos escrever a expressão acima


como: Z Z
dw = i∗ w,
C ∂C
onde i é a inclusão de ∂(C) em V (ver Definição 4.33).
No caso em que o bordo de C tenha várias componentes cone-
xas, no Teorema acima, devemos considerar em cada uma delas uma
orientação. Este procedimento de expressar ∂(C) como soma de com-
ponentes orientadas, por exemplo, ∂(C) = G1 + G2 + G3 , em que as
orientações das variedades Gi de dimensão n dependem duma ori-
entação da superfı́cie C, foi descrito acima na Proposição 4.8 (ver
também Seção 5, Capı́tulo 3).
O teorema de Stokes vai dizer no caso do exemplo mencionado
acima que Z Z Z Z
dw = w+ w+ w.
C G1 G2 G3

i i

i i
“mec˙New”
i i
2011/10/11
page 121
i i

121

Referimos o leitor a [MC1] para uma demonstração do teorema


acima.
Vamos considerar agora um exemplo de variedade diferenciável
(que vai ser importante para o que segue) obtida a partir de outra
variedade diferenciável M . Vamos definir agora o fibrado cotangente
à variedade M .
Definição 4.36. Para cada q ∈ M fixado, T Mq é o espaço vetorial
tangente a M em q. Considere T ∗ Mq o conjunto das transformações
lineares de T Mq em R. O conjunto T ∗ M é por definição o conjunto
∪q T ∗ Mq . Este conjunto será denominado fibrado cotangente à varie-
dade M .
Vamos assumir que M possua uma estrutura Riemanniana < , >.
Vamos agora equipar T ∗ M com um atlas diferenciável a partir de um
atlas diferenciável de M .
Dado q ∈ M considere < , >q =< , >. É fácil ver que para cada
q fixo e l ∈ T ∗ Mq , existe um único η = ηl ∈ T Mq tal que para todo
z ∈ T Mq , l(z) =< η, z >.
Fica assim definida uma aplicação que leva l em ηl e que estabelece
um isomorfismo de T ∗ Mq em T Mq .
Como estamos supondo que M possui uma estrutura Riemanni-
ana < , >, se fα : Uα ⊂ M → Rn é carta coordenada local, então
Xα : ∪x∈Vα T ∗ Mx → R2n dado por Xα (q, l) = (fα (q), dfαq (ηl )) define
carta coordenada local.
É possı́vel mostrar (ver [Li3]) que variando as possı́veis cartas
locais fα , as correspondentes cartas Xα assim obtidas definem uma
atlas diferenciável para T ∗ M .
Chama-se de fibra tangente sobre q o conjunto dos v ∈ T Mq .
Considere M variedade de dimensão n. Fixada uma carta fα :
Uα → Rn de M , tal que fα (x) = q, x ∈ Uα ⊂ M, q = (q1 , q2 , ..., qn ) ∈
Rn , e i ∈ {1, 2, ..., n} considere a aplicação projeção πi , tal que
πi (q, p) = qi .
Fica assim definida a transformação linear dqi : T Mq → R dife-
rencial de tal πi . Estas transfromações dqi formam uma base do
conjunto das transformações lineares de T Mq em R. Sendo assim,
dada uma transformação linear p : T Mq → R é usual denotar tal p
em coordenadas locais q = fα (x) como p = p1 dq1 + ... + pn dqn .
Chama-se de fibra cotangente sobre q o conjunto dos p ∈ T ∗ Mq .

i i

i i
“mec˙New”
i i
2011/10/11
page 122
i i

122 [CAP. 4: FORMAS DIFERENCIAIS EM VARIEDADES

Um vetor v tangente a T ∗ M em (q, p) é portanto um elemento em


T ( T ∗ M ) que pode ser identificado com todas as curvas (q(t), p(t))
tal que (q(0), p(0)) = (q, p) e ainda que (q ′ (0), p′ (0)) determinam o
mesmo v ∈ T ( T ∗ M ) (ver Definição 4.17).

Exercı́cios
1. Mostre que a esfera x2 + y 2 + y 2 = 1 em R3 admite um atlas
C ∞ que a torna uma variedade orientável.

2. Mostre que o conjunto dos planos passando pela origem em R3


possui uma estrutura de variedade diferenciável.

3. Calcule dF para a transformação F : S → S, onde S é a esfera


de centro (0,0,0) e raio 1 em R3 e F (x, y, z) = (−x, −y, z).

4. Calcule a integral da 2-forma diferencial w = x1 dx1 ∧ dx2 +


x2 dx2 ∧ dx3 + x3 dx3 ∧ dx4 em Ω(R4 ) sobre a superfı́cie de di-
mensão 2 dada por x21 + x22 + x23 + x24 = 1 e x1 = 0.1.

5. Calcule a integral de dp1 ∧ dq1 + dp2 ∧ dq2 sobre a superfı́cie de


dimensão dois q12 +q22 +p21 +p22 = 1 e q1 = 0.1 em (q1 , q2 , p1 , p2 ) ∈
R4 .

i i

i i
“mec˙New”
i i
2011/10/11
page 123
i i

Capı́tulo 5

Formalismo Simplético

Nosso objetivo nesta seção é apresentar a equação de Hamilton de


maneira intrı́nseca, ou seja de uma maneira que seja independente
de coordenadas locais. Usaremos para isto o formalismo das formas
diferenciais. Vamos considerar nesta seção sistemas autônomos. Os
sistemas não autônomos serão analisados na próxima seção.
Na Mecânica Hamiltoniana as variáveis posição e momento são
independentes (na Mecânica Lagrangeana a posição e a velocidade
não são independentes). Este ponto de vista é desejável na Mecânica
Quântica [ABC].
Em primeiro lugar vamos considerar o espaço dual de Rn . Lembre
que este espaço, denotado por Rn∗ , é por definição o espaço das
transformações lineares l : Rn → R (ver Definição 4.36).
Para cada ponto q do Rn considere Rnq o espaço tangente a Rn
em q e Rn∗ q o espaço cotangente em q.
Uma base de Rn∗ q é dada por dq1 , dq2 , ..., dqn .
O conjunto dos elementos (q, l) onde q ∈ Rn e l ∈ Rn∗ q é chamado
de fibrado cotangente e é denotado por T ∗ Rn = ∪q Rn∗ q .
Note que Rn∗ = T ∗ Rn é uma variedade de dimensão 2n.
Nesta seção vamos introduzir o estudo de sistemas Hamiltonia-
nos em variedades no caso em que o Hamiltoniano não dependa do
tempo t.
Na próxima seção vamos considerar o caso não autônomo.

123

i i

i i
“mec˙New”
i i
2011/10/11
page 124
i i

124 [CAP. 5: FORMALISMO SIMPLÉTICO

Em primeiro lugar cumpre destacar que a expressão


∂H ∂H
q̇ = ṗ = − , (5.1)
∂p ∂q
(q, p) ∈ R2n , usa explicitamente a estrutura do R2n , em que dividi-
mos algumas coordenadas como p e outras como q. Caso tenhamos a
intenção de definir um Hamiltoniano e as equações de Hamilton (em
sistemas mecânicos em que o espço de configuração é uma variedade
diferenciável M ) de uma maneira análoga a (5.1), é necessário ex-
pressar tais equações de uma maneira independente da estrutura do
R2n .
Para este fim será natural introduzir formas diferenciais para ex-
pressar as equações de (5.1).
Considere  
0 E
J=
−E 0
onde E é a matriz identidade em Rn . Sendo assim J é uma matriz
2n × 2n.
Note que J 2 = −I (a matriz identidade). J vai ser a expressão
matricial local do que vamos chamar abaixo de forma simplética.
No caso em que n = 1 obtemos
 
0 1
J=
−1 0
Considere agora a 2-forma diferencial

w(z, v) = hJz, vi =

= zn+1 v1 + zn+2 v2 + ... + z2n vn − z1 vn+1 − z2 vn+2 − ... − zn v2n ,


z, v ∈ R2n onde h, i é o produto interno Euclidiano. Note que w
é alternada. Tal forma diferencial será denominada mais tarde de
simplética.
Para cada valor de i ∈ {1, 2, ..., n}, considere a 2-forma dpi ∧
dqi nas variáveis (q, p) = (q1 , q2 , ..., qn , p1 , p2 , ..., pn ) ∈ R2n . Note
que para η = (η1 , ..., ηn , ηn+1 , ..., η2n ), θ = (θ1 , ..., θn , θn+1 , ..., θ2n ) a
expressão de dpi ∧ dqi quando aplicado a estes vetores é dada por

dpi ∧ dqi (η, θ) = θi ηn+i − ηi θn+i .

i i

i i
“mec˙New”
i i
2011/10/11
page 125
i i

125

Pn
Logo w pode ser escrita como w(η, θ) = i=1 dpi ∧ dqi (η, θ) =
dp ∧ dq(η, θ).
Observe agora que dado H(v, w) : R2n → R
 ∂H   ∂H 
∂q1 ∂p1
 ..   .. 

 .  
  . 

 ∂H   ∂H 
 ∂qn   ∂pn 
J ∂H = ∂H .
 ∂p1   − ∂q 1

   
 ..   .. 
 .   . 
∂H ∂H
∂pn − ∂q n

Sendo assim as Equações de Hamilton em R2n podem ser escritas


de maneira compacta como
∂H ∂H ∂H ∂H
(q̇, ṗ) = J(∇H) = ( , ..., ,− , ..., ).
∂p1 ∂pn ∂q1 ∂qn
J(∇H) define assim o campo de vetores Hamiltoniano.
Como sabemos,
∂H ∂H ∂H ∂H
dH = dq1 + ... + dqn + dp1 + ... + dpn
∂q1 ∂qn ∂p1 ∂pn

é uma 1-forma diferencial em ∈ R2n . Seja um vetor η ∈ R2n ,

η = (η1 , ..., η2n ).

Note que
n n
X ∂H X ∂H
dH(η) = ηi + ηn+i =
i=1
∂qi i=1
∂pi
* !+
∂H ∂H ∂H ∂H
(ηn+1 , ..., η2n , −η1 , ..., −ηn ), , ..., ,− , ..., − =
∂p1 ∂pn ∂q1 ∂qn
hJη, J(∇H)i = w(η, J(∇H)).
Em outras palavras ε = J(∇H) = ( ∂H ∂H
∂p , − ∂q ) é o único vetor em
R2n tal que para todo η, vale que w(η, ε) = dH(η).

i i

i i
“mec˙New”
i i
2011/10/11
page 126
i i

126 [CAP. 5: FORMALISMO SIMPLÉTICO

 
∂H ∂H
Observação 5.1. Podemos portanto afirmar que ε = ∂p , − ∂q é
o único vetor tal que para todo η ∈ R2n

w(η, ε) = (dp1 ∧ dq1 + ... + dpn ∧ dqn ) (η, ε) = dH(η).

A expressão acima é a que realmente pode ser tratada de maneira


intrı́nseca para fins de definição do campo de vetores Hamiltoniano
como veremos a seguir.
Vamos definir o Campo Hamiltoniano de maneira intrı́nseca em
uma variedade n-dimensional.
Dada uma superfı́cie de configuração M , o campo Hamiltoniano
para ser definido de maneira intrı́nseca, deverá ser definido sobre V ,
onde V é o fibrado cotangente T ∗ M = V .

Definição 5.1. Sobre uma variedade V de dimensão 2n, diz-se que


uma 2-forma w em V é não degenerada se para todo x ∈ V , vale que
∀ ε ∈ Tx V 6= 0 existe um η ∈ Tx V tal que wx (η, ε) 6= 0.

Definição 5.2. Uma forma w é chamada de forma simplética sobre


uma variedade V se w satisfaz dw = 0 e é também não degenerada.
Uma variedade V com uma 2-forma simplética w é chamada de uma
variedade simplética e será denotada por (V, w).
Pn
Exemplo 5.1. A 2-forma i=1 dpi ∧ dqi define uma estrutura sim-
plética sobre R2n .

Lembre que um campo de vetores G em uma superfı́cie V de


dimensão r é uma escolha de um vetor tangente G(x) ∈ T Vx para
cada x ∈ V .
Como vimos anteriormente, nesta seção,
 
∂H ∂H
(q̇, ṗ) = J(∇H) = ,− = G(q, p),
∂p ∂q

define o campo de vetores Hamiltoniano.


Vamos a seguir definir campos de vetores Hamiltonianos sobre
variedades simpléticas.

i i

i i
“mec˙New”
i i
2011/10/11
page 127
i i

127

Definição 5.3. Considere uma variedade simplética (V, w). Para


cada vetor ε ∈ T Vx tangente à variedade simplética (V, w) no ponto
x, associamos a 1-forma wε tal que
∀ η ∈ T Vx , wε (η) = w(η, ε).
Denote por A : T V → T ∗ V a aplicação tal que A(ε) = wε , onde
ε ∈ T Vx e wε ∈ T ∗ Vx foi definida acima.
Observe que A é isomorfismo linear entre dois espaços vetoriais
de mesma dimensão. Isto porque, A é injetiva de T Vx no espaço das
1-formas em T Vx∗ , isto é, A(ε) = 0 implica que ε = 0 (isto segue
facilmente de ∀ ε 6= 0 existe um η tal que wx (η, ε) 6= 0, ε, η ∈ T Vx ).
Considere agora In a inversa de A
In : T V ∗ → T V.
Definição 5.4. Dado H : V → R qualquer, onde (V, w) é uma vari-
edade simplética, o campo Hamiltoniano em M determinado por H
é por definição In(dH). Isto é, para x ∈ V fixo In(dH) = ε ∈ T Vx ,
onde wε (η) = w(η, ε) = dH(η), ∀η ∈ T Vx . Fica definido assim um
campo de vetores ε(x) = G(x) para todo x ∈ V , que será denominado
campo de vetores Hamiltoniano associado a H.
A definição acima é absolutamente natural após as considerações
que fizemos anteriormente nesta seção (ver Observação 5.1). Conside-
rando H(q, p) definido sobre (q, p) ∈ T ∗ Rn e w = dp∧dq recuperamos
a expressão do campo Hamiltoniano quando estamos nas coordenadas
locais de R2n .
Observe que para diferentes estruturas simpléticas w sobre a mes-
ma variedade V , podemos ter diferentes campos Hamiltonianos.
Note que dH (é uma transformação linear agindo em T Mx ) e w
(é uma transformação bilinear agindo em T Mx ) são definidos intrin-
secamente, logo o vetor ε foi definido de maneira intrı́nseca.
Vamos agora usar coordenadas locais x = (q, p) em V = T ∗ M
(ver Definição 4.36), p = p1 dq1 + ... + pn dqn transformação linear de
T Mq em R (M variedade de configuração) e denotar x = (x1 , ..., x2n )
por
x = (q1 , ..., qn , p1 , ..., pn )
e vetores tangentes por
(q1′ , ..., qn′ , p′1 , ..., p′n ) ∈ T ( T ∗ M )x .

i i

i i
“mec˙New”
i i
2011/10/11
page 128
i i

128 [CAP. 5: FORMALISMO SIMPLÉTICO

Proposição 5.1. Seja M variedade de dimensão n. O fibrado cotan-


gente T ∗ M , tem uma estrutura simplética natural w. Essa estrutura
simplética w, em coordenadas locais é dada por dp1 ∧dq1 +dp2 ∧dq2 +
... + dpn ∧ dqn .

Demonstração: Considere p : T Mq → R uma transformação linear


e (q, p) ∈ T ∗ M .
Vamos primeiramente definir uma 1-forma v em T ∗ M . A 2-forma
w = dv, derivada de tal forma v será a forma simplética que busca-
mos.
Seja ε ∈ T (T ∗ M )(q,p) um vetor tangente do fibrado cotangente
no ponto (q, p) onde p ∈ T ∗ Mq .
Um vetor tangente ε em T (T ∗ M )(q,p) é representado por uma
curva (q(t), p(t)) ∈ T ∗ M, t ∈ (−ǫ, ǫ), tal que (q1′ , ..., qn′ , p′1 , ..., p′n ) =
(q ′ (0), p′ (0)) = ε e (q(0), p(0)) = (q, p).
Considere agora a projeção π : T ∗ M → M tal que π(q, p) = q.
Para ε um vetor em T (T ∗ M ), temos que dπ(ε) ∈ T M (pois dπ :
T (T ∗ M ) → T M é a derivada da projeção π).
Definimos a 1-forma v em T ∗ M por

v(ε) = p(dπ(ε)) , ∀ε ∈ T (T ∗ M )(q,p) .

AfirmamosPnque esta 1-forma v em coordenadas locais se escreve


como pdq = i=1 pi dqi .
Vamos mostrar agora a afirmação mencionada acima. Considere
coordenadas locais (q, p) para T ∗ M .
Por definição
π : T ∗M → M
(q, p) → q = (q1 , q2 , ..., qn )
Logo dπ : T (T ∗ M ) → T M é apenas (dq1 , dq2 , ..., dqn ). Logo
dπ(ε) = (q1′ , ..., qn′ ).
A transformação linear p definida em T Mq tem coordenadas locais

p1 , p2 , ..., pn ,

isto é p é a transformação p1 dq1 + p2 dq2 + ... + pn dqnP


.
n
Finalmente, v(ε) = p(dπ(ε)) = pi q1′ + ... + p2 q2′ = i=1 pi dqi (ε).
Fica portanto demonstrada a afirmação que v = pdq.

i i

i i
“mec˙New”
i i
2011/10/11
page 129
i i

129

Considere agora w = dv.


É claro que dw = ddv = 0 (ver Proposição
Pn 4.5, Capı́tulo 2).
Note que em coordenadas locais w = i=1 dpi ∧ dqi = dp ∧ dq.
É fácil ver também que w é não degenerada, pois se ε = (ε1 , ..., ε2n ) 6=
0, então existe εi 6= 0 (suponhamos que i esteja entre os primeiros n do
vetor ε para simplificar a notação que segue). Portanto w(η, ε) 6= 0,
onde η = (η1 , ..., η2n ) é escolhido de tal modo que ηj = 0, para
j 6= n + i P e ηn+i = 1 (este fato segue da forma local de w(z, v) =<
n
Jz, v >= i=1 dpi ∧ dqi ).
Se o termo não nulo εi está entre os últimos n elementos do vetor
ε, um raciocı́nio análogo pode ser aplicado.
Concluı́mos assim que w como definida acima é uma forma sim-
plética. 
Um resultado mais geral que o anterior, mas que não será demons-
trado no texto é o teorema de Darboux (ver [A1] para prova).
Teorema 5.1. (Teorema de Darboux) Dada uma variedade simplética
V de dimensão 2n e uma forma simplética w, para todo ponto x ∈ V ,
é possı́vel encontrar um sistema de coordenadas fα em torno de x
tal que fα : Uα → R2n , fα (x) = P(q1 , q2 , ..., qn , p1 , p2 , ..., pn ), tal que
n
nestas coordenadas w é da forma i=1 dpi ∧ dqi = dp ∧ dq.
Vamos mostrar agora um resultado muito importante.
Seja (M, w) uma estrutura simplética e H : T M ∗ → R Hamilto-
niano. Assuma que In(dH) define o campo de vetores Hamiltoniano
G(x) e seja φt : T ∗ M → T ∗ M o correspondente fluxo de difeomorfis-
mos associado ao campo, isto é,

d
φt x = In(dH)(x) = G(x).
dt t=0

Esse fluxo se chama o fluxo Hamiltoniano associado ao Hamilto-


niano H.
Uma variedade diferenciável A de dimensão dois com bordo é
simplesmente conexa se ela é difeomorfa a um aberto simplesmente
conexo do R2 .
Teorema 5.2. O fluxo Hamiltoniano φt sobre T M ∗ preserva a es-
trutura simplética natural w = dp ∧ dq, isto é, (φt )∗ w = w.

i i

i i
“mec˙New”
i i
2011/10/11
page 130
i i

130 [CAP. 5: FORMALISMO SIMPLÉTICO

Demonstração: Temos que mostrar (ver exercı́cio após Definição


4.35) que qualquer subvariedade (que sem perda de generalidade po-
demos assumir ser simplesmente conexa) A de dimensão 2, A ⊂ T ∗ M
com bordo diferenciável por partes é tal que
Z Z
w= w.
A φt (A)

Considere a superfı́cie de dimensão 3 , A × (0, τ ) ⊂ T ∗ M × R e


sua imagem pelo fluxo φt ,

Jτ = ∪t∈(0,τ ) ∪x∈A (φt (x), t) ⊂ T ∗ M × R,

então, ver Figura 4.4,

∂Jτ = −( ∪t∈(0,τ ) ∪x∈∂A (φt (x), t) + φτ A − A.

Denotaremos ∪t∈(0,τ ) ∪x∈∂A (φt (x), t) = Bτ , que é a superfı́cie de


dimensão 2 (que depende de τ ).
Note que w é uma forma diferencial em T M ∗ e assim podemos
pensar que é uma forma diferencial sobre T M ∗ × R que não depende
da segunda variável. Quando formos usar a seguir o teorema de Sto-
kes, lembre que a contribuição da integral em ∪t∈(0,τ ) ∪x∈δA (φt (x), t),
não vai depender do t na parte (., t) acima. Sendo assim, para simpli-
ficar a notação, algumas vezes vamos omitir a parte correspondente
a t nas integrais abaixo.
Primeiro, vamos mostrar que
Z Z Z
d
w= dH = dH,
dτ Bτ φτ (∂A) (φτ (δA),τ )

isto é, vamos mostrar equivalentemente que


Z Z Z !
τ
w= dH dt.
Bτ 0 φt (∂A)

Seja f (s), 0 < s ≤ 1 parametrização de ∂A.


Então ϕ(s, t) = (φt (f (s)), t) = φt (f (s)), 0 < s ≤ 1, 0 < t < τ ,
define uma parametrização da superfı́cie Bτ de dimensão 2.

i i

i i
“mec˙New”
i i
2011/10/11
page 131
i i

131

Por definição de integral de uma 2-forma diferencial


Z Z τ Z 1
w= w(η, ε)dsdt
Bτ 0 0

onde
∂ϕ
ε=
∂t
e
∂ϕ
, η=
δs
pois ϕ(s, t) = φt (f (s)) parametriza Bτ .
Note que ε é o vetor que define o campo Hamiltoniano.
Por definição de campo Hamiltoniano

∂ϕ
dH(η) = dH( ) = w(η, ε)
∂s
(ver Definição 5.4).
Logo
Z Z ! Z Z ! ! Z
τ τ 1
∂ϕ(s, t)
dH dt = dH ds dt = w.
0 φt (∂A) 0 0 ∂s Bτ

Assim concluı́mos que


Z Z
d
w= dH.
dτ Bτ φτ (∂A)

Ora pelo Teorema de Stokes,


Z Z
dH = H=0
φt (∂A) ∂(φt (∂A))

pois ∂(φt (∂(A))) = ∅.


Logo Z
w

é constante.

i i

i i
“mec˙New”
i i
2011/10/11
page 132
i i

132 [CAP. 5: FORMALISMO SIMPLÉTICO

R R
Quando τ → 0, Bτ w converge a ∂A w = 0 (afinal estamos in-
tegrando uma 2-forma em uma superfı́cie com região bidimensional
convergindo a uma curva quando τ vai a zero).
Logo Z
w=0 (5.2)

para todo τ .
Como w é simplética satisfaz dw = 0 então:
Z
0= dw. (5.3)

Pelo teorema de Stokes


Z Z Z Z Z
dw = w= w− w− w. (5.4)
Jτ ∂Jτ φτ (A) A Bτ

Juntando as expressões (5.3) e (5.4) obtemos


Z Z Z Z Z
0= dw = w= w− w− w.
Jτ ∂Jτ φτ (A) A Bτ
R
Como o termo Bτ
w é zero por (5.2) concluı́mos que
Z Z
w= w,
φτ (A) A

ou seja, φt preserva a forma simplética w. 


Definição 5.5. Dizemos que uma k-forma diferencial w é um inva-
riante integral absoluto para g : T ∗ M → T ∗ M se
Z Z
w= w
g(C) C

para toda variedade C de dimensão k contida em T ∗ M .


Equivalentemente, w é invariante integral absoluto para g : T ∗ M →
T M se g ∗ (w) = w.

A proposição anterior mostrou que g ∗ (w) = w quando g = φt é


o fluxo Hamiltoniano para t fixo obtido a partir de H e w a forma
simplética natural (Proposição 5.1).

i i

i i
“mec˙New”
i i
2011/10/11
page 133
i i

133

Exemplo 5.2. Se g preserva área em R2 então w = dq ∧ dp é um


invariante integral absoluto de g.

Proposição 5.2. Se w1 e w2 são invariantes integrais de g, então


w1 ∧ w2 também é invariante integral de g.

Demonstração: Segue imediatamente do fato que

g ∗ (w1 ∧ w2 ) = (g ∗ w1 ) ∧ (g ∗ w2 ) = w1 ∧ w2

(ver Proposição 4.3 c)). 


n
A 2n-forma diferencial (w) define um elemento de volume em
T ∗ M (ver Definição 4.9). Note que em coordenadas locais

wn = (dp ∧ dq)n = dp1 ∧ dp2 ∧ ... ∧ dpn ∧ dq1 ∧ dq2 ∧ ... ∧ dqn .

Proposição 5.3. O fluxo Hamiltoniano φt preserva o elemento de


volume (w)n .

Demonstração: Segue imediatamente do fato que g ∗ (wn ) = (g ∗ w)n


= (w)n , quando g = φt , t fixo, e do Teorema 5.2. 

Definição 5.6. Uma transformação g, g : T ∗ M → T ∗ M que pre-


serva w, isto é, g ∗ w = w, é dita canônica.

Note que se g é canônica, g também preserva o elemento de volume


(w)n , pois g ∗ (wn ) = (g ∗ w)n = (w)n .

Definição 5.7. Uma k-forma w é dita invariante relativo para g :


T ∗ M → T ∗ M se Z Z
w= w
∂C g(∂C)

para toda subvariedade C de dimensão k com bordo contida em T ∗ M .

Proposição 5.4. Se w é invariante relativo para g : T ∗ M → T ∗ M


então dw é invariante absoluto para g.

Demonstração: Seja w invariante relativo e C subvariedade de di-


mensão k + 1 com bordo ∂(C) contida em T ∗ M . Note que o bordo
de ∂(C) é vazio.

i i

i i
“mec˙New”
i i
2011/10/11
page 134
i i

134 [CAP. 5: FORMALISMO SIMPLÉTICO

Logo pelo Teorema de Stokes


Z Z Z Z Z
dw = w= w= w= dw.
C ∂C g(∂C) ∂(g (C)) g(C)

Logo, concluı́mos que dw é invariante absoluto. 


Vamos agora demonstrar a versão simplética do teorema de con-
servação do Hamiltoniano. Observe como a demonstração fica abre-
viada através do uso do formalismo simplético.
Teorema 5.3. (Lei de Conservação de Energia) A função H é cons-
tante ao longo das trajetórias do fluxo Hamiltoniano.
Demonstração: A derivada direcional de H na direção θ é dH(θ).
Por definição In(dH) é o Campo Hamiltoniano. Seja então η =
In(dH).
Então dH(η) = w(η, In(dH)) = w(η, η) = 0 (pois como w é
alternada w(η, η) = −w(η, η)).
Logo, H é constante ao longo do fluxo Hamiltoniano. 
Dado um Hamiltoniano H(q, p), q ∈ M , variedade m-dimensional,
1
vamos mostrar agora que existe uma densidade natural k∇H(x)k que
define uma medida invariante para o fluxo Hamiltoniano restrito a
uma superfı́cie (2m − 1) dimensional de Energia total constante.
Considere uma superfı́cie S de dimensão m − 1 em Rm . Dado
m-vetores v1 , v2 , ..., vm em Rm , o volume determinado por estes ve-
tores é expresso por dx1 ∧ ... ∧ dxm (v1 , v2 , ..., vm ) (ver Definição 4.3).
O procedimento natural de induzir em S uma maneira de medir vo-
lume m − 1 dimensional em cada plano T Sx é o seguinte: dados
u1 , u2 , ..., um−1 ∈ T Sx , definimos o volume w̃(u1 , ..., um−1 ) determi-
nado por u1 , .., um−1 como

w̃(u1 , ..., um−1 ) = dx1 ∧ ... ∧ dxm (η, u1 , u2 , ..., um−1 ),

onde η é o vetor normal unitário (aqui estamos usando a métrica


Riemanniana) em S.
Geometricamente falando, estamos considerando um paralelepı́-
pedo m dimensional com altura η e dizendo que o volume m − 1
dimensional da base é o volume m-dimensional do paralelepı́pedo
η, u1 , .., um−1 (isto porque η tem altura 1).

i i

i i
“mec˙New”
i i
2011/10/11
page 135
i i

135

As considerações geométricas feitas acima devem esclarecer o lei-


tor para o procedimento que será utilizado na próxima proposição.
Vamos denotar por wn a forma volume usual em R2n = dq1 ∧ ... ∧
dqn ∧ dp1 ∧ ... ∧ dpn .
Proposição 5.5. Seja M = Rn variedade Riemanniana de dimensão
n com a métrica Riemanniana definida por <, >. Considere um
Hamiltoniano H(q, p) e w forma simplética natural (ver Proposição
56, Capı́tulo 3) sobre R2n = V = T ∗ M = T ∗ (Rn ). Então a forma
w̃ ((2n − 1)-forma diferencial) sobre uma superfı́cie compacta E =
{(q, p) | H(q, p) = c} (2n − 1 dimensional) de Hamiltoniano constante
(assuma que k∇H(x)k não se anule em E) dada por
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n )
k∇H(x)k x
é invariante para φt restrito a esta superfı́cie E.
Demonstração: Para c ∈ R fixo considere a variedade de dimensão
2n − 1
Ec = E = {x ∈ T ∗ M |H(x) = c}.
Como sabemos pelo Teorema de Conservação do Hamiltoniano,
E é invariante por φt .
A forma wn é forma volume sobre T ∗ M . Se M for o R2n então
n
w = dp1 ∧ ... ∧ dpn ∧ dq1 ∧ ... ∧ dqn . A forma volume natural sobre
a superfı́cie E de dimensão 2n − 1 é a forma ŵ tal que ∀ x ∈ E

ŵx (v2 , ..., v2n ) = wxn (ηx , v2 , ..., v2n )

onde ηx é o vetor normal a E (estamos assumindo uma orientação


em E) com norma 1 (estamos assumindo que existe uma métrica
Riemanniana, ou seja, que hηx , ηx i = kηx k2 = 1).
Considere sobre E a 2n − 1 forma diferencial
1
w̃x = ŵx ,
k∇H(x)k
isto é,
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n ).
k∇H(x)k x

i i

i i
“mec˙New”
i i
2011/10/11
page 136
i i

136 [CAP. 5: FORMALISMO SIMPLÉTICO

Vamos mostrar que w̃ = φ∗t (w̃) para qualquer t ∈ R. Logo φt vai


deixar invariante uma forma volume sobre E.
Antes, mostramos na Seção 2, Capı́tulo 3 que H ◦ φt = H, ∀t ∈ R.
Logo
dH ◦ dφt (x) = dH.
Portanto, ∀η ∈ T ∗ Mx ,

h∇Hφt (x) , dφt (x)(η)i = (dH ◦ dφt (x))(η) = dH(η) = h∇Hx , ηi.

Aplicando a última expressão a η = ∇Hx , obtemos h∇Hx , ∇Hx i =


k∇Hx k2 = h ∇Hφt (x) , dφt (x)(∇Hx ) i.
Como ∇H é normal à variedade E, temos que
∇Hx
ηx =
k∇Hx k
e
∇Hφt (x)
ηφt (x) = .
k∇Hφt (x) k
Logo a última igualdade pode ser reescrita como
* +
k∇H(x)k ∇Hφt (x)
= , dφt (x)(ηx ) = hηφt (x) , dφt (x)(ηx )i.
k∇Hφt (x) k k∇Hφt (x) k

Logo a projeção de dφt (x)(ηx ) sobre ηφt (x) é

k∇H(x)k
.
k∇Hφt (x) k

Sendo assim
k∇Hx k
dφt (x)(ηx ) = ηφ (x) + z1
k∇Hφt (x) k t

onde z1 ∈ T Eφt (x) .


Note que se ṽ2 , ṽ3 , ..., ṽ2n é uma base de T Eφt (x) , então existem
αi , i ∈ {2, ..., 2n} tal que
2n
X
z1 = αi ṽi .
i=2

i i

i i
“mec˙New”
i i
2011/10/11
page 137
i i

137

Logo
2n
!
X
wφnt (x) (z1 , ṽ2 , ṽ3 , ..., ṽ2n ) = wφnt (x) αi ṽi , ṽ2 , ..., ṽ2n =
i=2

2n
X
αi wφnt (x) (ṽi , ṽ2 , ṽ3 , ..., ṽi , ..., ṽ2n ) = 0.
i=2

É fácil ver a partir da última expressão que para qualquer


v2 , v3 , ..., vn ∈ T Eφt (x) , wφnt (x) (z1 , v2 , ..., v2n ) = 0.
Portanto, para qualquer v2 , v3 , ..., vn ∈ T Eφt (x)
!
k∇Hx k
wφnt (x) (dφt (x)(ηx ), v2 , ..., v2n ) = wφnt (x) ηφ (x) , v2 , ..., v2n .
k∇Hφt (x) k t
(5.5)
Vamos agora mostrar que φ∗t w̃ = w̃.
Ora, φ∗t (x)(w̃)(v2 , ..., v2n ) = w̃φt (x) (dφt (x)(v2 ), ..., dφt (x)(v2n ))
1
= wn (ηφ (x) , dφt (x)(v2 ), ..., dφt (x)(v2n ))
k∇Hφt (x) k φt (x) t
!
1 n k∇Hx k
= w ηφ (x) , dφt (x)(v2 ), ..., dφt (x)(v2n )
k∇Hx k φt (x) k∇Hφt (x) k t
1
= wn (dφt (x)(ηx ), dφt (x)(v2 ), ..., dφt (x)(v2n ))
k∇Hx k φt (x)
1
= wn (ηx , v2 , ..., v2n ).
k∇Hx k x
A última igualdade segue de φ∗t (x)(wn ) = wn (Proposição 5.3,
Capı́tulo 3) e a penúltima de (5.5).
Concluı́mos portanto que w̃ define uma densidade invariante para
φt restrito à superfı́cie de Hamiltoniano constante Ec . Este fato segue
de que
1
w̃x (v2 , v3 , ..., v2n ) = wn (ηx , v2 , ..., v2n )
k∇H(x)k x
é invariante para φt , t ∈ R. 

i i

i i
“mec˙New”
i i
2011/10/11
page 138
i i

138 [CAP. 5: FORMALISMO SIMPLÉTICO

Para obter uma probabilidade a partir de w̃ devemos multiplicar


w̃ pela constante k = R 1 w̃ .
E
Deixamos a cargo do leitor estender o resultado acima para varie-
dades simpléticas.
Para concluir esta seção, vamos agora descrever o procedimento
natural para se obter um Hamiltoniano a partir de uma Lagrangiano
L(q, q̇), definido sobre uma variedade de configuração M , q ∈ M ,
q̇ ∈ T Mq .
Para um Lagrangiano L, e para (q, q̇) fixo, vamos considerar que
dL
o momento p ∈ Rn∗ q é dado por p = dq̇ (q, q̇), isto p é a transformação
linear derivada de L em relação a q̇ no ponto (q, q̇).
Sendo assim, fixada a base dq1 , dq2 , ..., dqn , a 1-forma diferencial
(famı́lia de transformações lineares dependendo de q) p = ∂L ∂ q̇ nesta
base é dada por
∂L ∂L
p= dq1 + ... + dqn .
∂ q˙1 ∂ q˙n
Desta maneira dL dq̇ quando expressa na base dq1 , dq2 , ..., dqn , de-
termina o que anteriormente chamávamos de momento p.
Sendo assim, para cada q fixo fica associado a q̇ ∈ Rn de maneira
bem definida um elemento p ∈ Rn∗ q (contanto que a condição da
Observação 4, Capı́tulo 3), que vai ser o momento.
Uma questão importante é a seguinte: como obter H(q, p), (q, p) ∈
T ∗ M , a partir de L(q, q̇), (q, q̇) ∈ T M .
Para (q, q̇) fixo considere p = ∂L ∗
∂ q̇ ∈ T Mq .
Para q fixo obtemos assim uma associação de q̇ com p, defi-
nindo uma aplicação Bq : T Vq → T ∗ Vq tal que Bq (q̇) = p. Esta
2
aplicação é bijetiva se por exemplo ∂∂ q̇L > 0, conforme a Observação
4, Capı́tulo 3.
Vamos supor no que segue que tal Bq seja bijetivo para todo
q ∈V.
Considere um Lagrangiano L(q, q̇). Para (q, p) fixados, definimos
H(q, p) como
H(q, p) = p(Bq−1 (p)) − L(q, Bq−1 (p)) = p(q̇) − L(q, q̇),
onde Bq (q̇) = p.
Acima, p(Bq−1 (p)) significa aplicar a transformação linear p no
vetor tangente q̇ = Bq−1 (p).

i i

i i
“mec˙New”
i i
2011/10/11
page 139
i i

139

Note que o Lagrangiano é naturalmente definido no fibrado tan-


gente T M de uma variedade M de configuração, enquanto que o
Hamiltoniano é naturalmente definido no fibrado cotangente T ∗ M
da variedade de configuração.
Conclusão: Dada uma função H(q, p) definida no fibrado cotangente
a uma variedade M é possı́vel definir um campo de vetores sobre o
fibrado cotangente denominado campo Hamiltoniano. Isto porque, o
fibrado cotangente tem uma estrutura simplética natural.
Quando desejamos fazer alguma conta, podemos considerar um
certo sistema de coordenadas locais e assim obter resultados sobre o
sistema.
É mais natural proceder de maneira intrı́nseca como foi feito
acima, pois não existe razão para um certo sistema de coordenadas
ser privilegiado em relação aos outros.
As trajetórias deste campoR de vetores podem ser definidas também
como os extremais da ação γ pdq onde os extremos do caminho γ
estão fixos em γ(t1 ) = a, γ(t2 ) = b.
Este campo não é determinado por um único possı́vel Hamilto-
niano H, pois podemos somar a esta função uma forma w tal que
dw = 0, e claramente a Definição 96 não vai alterar o campo Hamil-
toniano que vamos obter.
Dada uma função sobre o fibrado tangente a uma variedade M ,
podemos obter um sistema Lagrangiano sobre o fibrado tangente. A
maneira de relacionar os dois sistemas foi descrita acima.

Exercı́cios
1. Para o Hamiltoniano do pêndulo sem atrito, calcule para cada
nı́vel de energia constante a densidade ψ do Teorema 63.
Assuma que o nı́vel de energia não passe pelo ponto (0,0) ou
(π, 0).

2. Mostre que o toro S1 × S1 admite um estrutura simplética.

i i

i i
“mec˙New”
i i
2011/10/11
page 140
i i

Capı́tulo 6

Linhas de Vortex em
Mecânica Hamiltoniana

Nesta seção vamos considerar apenas campos Hamiltonianos não au-


tônomos H(q, p, t). Vamos desenvolver o formalismo que permite
definir neste caso as equações de Hamilton de maneira intrı́nseca.
O ponto de vista será intrı́nseco e o leitor pode perceber que as
as demostrações utilizando tal ponto de vista serão simples e não
envolvem demasiado cálculo.

Proposição 6.1. Dado uma 2-forma w em R2n+1 , existe ξ 6= 0 tal


que w(ξ, η) = 0, ∀ η ∈ R2n+1 .

Demonstração: Uma forma diferencial é por definição alternada,


portanto é dado por w(ξ, η) = hAξ, ηi onde A é matriz alternada.
Ora o determinante de tal matriz (2n + 1) × (2n + 1) é zero pois
A∗ = −A e det A = det A∗ = det(−A) = (−1)2n+1 det A = − det A.
Logo existe um auto-vetor ξ 6= 0 com auto-valor 0 e, portanto,
w(ξ, η) = hAξ, ηi = h0, ηi = 0. 

Definição 6.1. Uma 2-forma é dita não singular se

dim{ξ ∈ R2n+1 |w(ξ, η) = 0, ∀ η ∈ R2n+1 } = 1.

140

i i

i i
“mec˙New”
i i
2011/10/11
page 141
i i

141

Definição 6.2. Dada uma 2-forma w não singular, em cada ponto do


R2n+1 , o subespaço de dimensão 1 definido por algum ξ da Proposição
6.1 é chamada direção de vortex.
Definição 6.3. Seja w 2-forma diferencial não singular. Uma curva
diferenciável em R2n+1 cuja tangente em cada ponto está na direção
de vortex naquele ponto da 2-forma w é chamada uma linha de vortex
da 2-forma w.
Os teoremas de existência e unicidade de equações diferenciais
ordinárias asseguram localmente a existência das linhas de vortex,
bastando para isso assumir condições de suavidade (C ∞ ) da 2-forma
w não singular. Observe que enquanto a solução de uma equação dife-
rencial depende do tempo de maneira bem definida, a linha de vortex
é uma curva, para a qual poderı́amos ter várias parametrizações pelo
parâmetro t.
As linhas de vortex determinam o que se chama um campo de
linhas e não um campo de vetores (ver [MC3]).
Proposição 6.2. Considere em R2n+1 o Hamiltoniano H(p, q, t), a
1-forma w1 = pdq − Hdt e a 2-forma w2 = dw1 . Então as soluções
do sistema Hamiltoniano
dH dH
q̇ = ṗ = −
dp dq
são linhas de vortex de w2 .
Demonstração: Suponha que w2 seja não singular. Sendo assim
basta mostrar que ξ = (Hp , −Hq , 1) em (q, p, t) é direção de vortex da
2-forma w2 no ponto (q, p, t). Primeiro mostraremos este último fato,
e deixaremos ao leitor o trabalho de mostrar que w2 é não singular.
Ora, denote η por (q1 , p1 , t1 )
 
dH dH
w2 (ξ, η) = dw1 (ξ, η) = dp∧dq − (dp∧dt)− (dq ∧dt) (ξ, η) =
dp dq
= [(−Hq q1 − Hp p1 ) − Hp (Hq t1 − p1 ) − Hq (−Hp t1 − q1 ) = 0.
Logo ξ = (Hp , −Hq , 1) é a direção de vortex e as soluções de
ṗ = Hp e q̇ = −Hq são curvas de vortex. 
Exercı́cio: Mostre que a forma w2 definida acima é não singular.

i i

i i
“mec˙New”
i i
2011/10/11
page 142
i i

142 [CAP. 6: LINHAS DE VORTEX EM MECÂNICA HAMILTONIANA

Exemplo 6.1. Vamos calcular em um exemplo a forma w2 = dw1


quando w1 = pdq − Hdt. Seja
p2 ω2
H(p, q) = + 0 q2
2 2
o Hamiltoniano do oscilador harmônico. Logo
 2 
p ω2
w1 = pdq − Hdt = pdq − + 0 q 2 dt
2 2

e w2 = dw1 = dp ∧ dq − pdp ∧ dt − qw02 dq ∧ dt.


Ora,
dH
q̇ = =p
dp
dH
ṗ = − = −ω02 q.
dq
Neste caso, temos realmente para η = (q1 , p1 , t1 ) e
ξ = (Hp , −Hq , 1) = (p, w02 q, 1) que

w2 (ξ, n) = [dp ∧ dq − pdq ∧ dt − qω02 dq ∧ dt] (ξ, n) =

(−ω02 qq1 − pp1 ) − p(−ω02 qt1 − p1 ) − qω0 (pt1 − q1 ) = 0.


Este exemplo serve apenas como ilustração do resultado mais geral
anteriormente demonstrado.
A conclusão importante do resultado que obtivemos acima é que
é possı́vel expressar as curvas soluções do Hamiltoniano através de
formas diferenciais, sem usar a estrutura global do R2n+1 . Isto per-
mitirá introduzir as equações de Hamilton (caso não autônomo) em
uma variedade diferenciável M . Deixamos a cargo do leitor fazer tal
extensão.
Considere em R2n+1 duas curvas fechadas γ˜1 e γ˜2 tal que γ˜2 é
obtida aplicando o fluxo Hamiltoniano à curva γ˜1 (ver Figura 4.5).
Definição 6.4. Duas curvas fechadas na situação acima serão de-
nominadas de “relacionadas pelo fluxo Hamiltoniano”.
Definição 6.5. A forma w1 = pdq−Hdt será chamada de invariante
de Poincaré-Cartan.

i i

i i
“mec˙New”
i i
2011/10/11
page 143
i i

143

Teorema 6.1. Sejam γ̃1 e Hγ̃2 duas curvas fechadas


H relacionadas pelo
fluxo Hamiltoniano, então γ̃1 pdq − Hdt = γ̃2 pdq − Hdt.
Demonstração: Seja w1 = pdq − Hdt a forma de Poincaré-Cartan,
então pelo Teorema de Stokes,
Z Z Z
dw1 = w1 − w1
σ γ̃1 γ̃2

onde σ é o tubo bidimensional que tem como bordo as duas curvas


γ̃1 e γ̃2 orientadas na direção positiva.
As curvas γ1 e γ2 da Figura 4.5 correspondem respectivamente a
γ̃1 e −γ̃2 .
A integral de Z
dw1 = 0,
σ
pois o vetor (−Hp , Hq , 1), tangente à superfı́cie com bordo σ, se anula
para a forma dw1 . Isto se deve a uma Proposição que foi anterior-
mente demonstrada. 
Considere agora uma curva γ̃1 contida em um plano t1 = cons-
tante.
Sendo assim, considerando o campo (−Hp , Hq , 1) e a sua evolução
com t, é fácil ver que a curva γ̃2 que se obtém aplicando o fluxo
φt à curva γ̃1 , é tal que γ̃2 também está contida em um plano t =
constante, digamos t = t1 . Neste caso, a proposição acima diz apenas
que Z Z
pdq = pdq.
γ̃1 γ̃2

Isto porque Z Z
Hdt = Hdt = 0,
γ̃1 γ̃2

uma vez que não existe componente na direção t para os vetores


tangentes a γ̃1 ou γ̃2 .
Observe que todas as considerações que fizemos acima são válidas
em variedades diferenciáveis. Em outras palavras, não usamos em
nenhum momento propriedades do espaço R2n+1 .
Proposição 6.3. O fluxo (−Hq , Hq , 1) preserva volume em R2n+1 .

i i

i i
“mec˙New”
i i
2011/10/11
page 144
i i

144 [CAP. 6: LINHAS DE VORTEX EM MECÂNICA HAMILTONIANA

Demonstração: Seja γ˜1 curva fechada simples contida em t1 =


constante e γ˜2 outra curva obtida pela evolução do fluxo no tempo
t2 .
Então pelo teorema de Stokes em R2n ≡ R2n × t1 , temos
Z Z Z
pdq = dp ∧ dq
γ˜1 ∆1

2n 2n
onde ∆1 é a região de R ≡ R × t1 tal que δ∆1 = γ˜1 (ver Fi-
gura 4.5). Da mesma forma se φt (∆1 ) = ∆2 então δ∆2 = γ˜2 em
R2n = R2n × t2 , e ainda pelo teorema de Stokes
Z Z Z
pdq = dp ∧ dq.
γ˜1 ∆2

Como vimos antes


Z Z
pdq = pdq,
γ˜1 γ˜2

logo segue-se que


Z Z Z Z
dp ∧ dq = dp ∧ dq.
∆1 ∆2

Como o resultado vale para qualquer ∆1 (note que φt (∆1 ) = ∆2


e φt (γ˜1 ) = γ˜2 ) concluı́mos que φt preserva dp ∧ dq. Como

(dp ∧ dq)n = dp1 ∧ ... ∧ dpn ∧ dq1 ∧ ... ∧ dqn ,

concluı́mos que o fluxo Hamiltoniano φt em R2n preserva volume. 


Observe que o resultado acima foi provado para Hamiltonianos
H(q, p, t) que dependem do tempo. Já havı́amos mostrado antes este
resultado, o teorema de Liouville, mas a demonstração acima pode
ser aplicada também a ao fibrado cotangente T ∗ M de uma variedade
diferenciável M .
Deixamos a cargo do leitor extender os resultados acima obtidos
no Rn para variedades diferenciáveis M de dimensão n.
Conclusão: A partir de um Hamiltoniano H(q, p, t), definido sobre
o produto cartesiano do fibrado tangente a uma variedade M por R,

i i

i i
“mec˙New”
i i
2011/10/11
page 145
i i

145

foi possı́vel definir um campo de vetores Hamiltoniano sobre o fibrado


cotangente a M .
Este campoR de vetores pode também ser caracterizado como os
extremais de γ pdq−Hdt, em que os extremos (e os tempos) γ(t1 ) = a
e γ(t2 ) = b estão fixos.
Este campo não é determinado por um único possı́vel Hamiltoni-
ano H, pois podemos somar a esta função uma forma w = dG, e os
valores da ação irão se alterar por uma valor fixo G(b) − G(a). Logo,
irão determinar os mesmos extremais.

Exercı́cio
1. Considere o Hamiltoniano H(q, p, t) = p2 + q 2 + t. Calcule as
linhas de vortex em R3 para tal Hamiltoniano.

i i

i i
“mec˙New”
i i
2011/10/11
page 146
i i

Capı́tulo 7

Equações Diferenciais
Parciais: Método das
Caracterı́sticas

Para analisar com mais profundidade a equação diferencial de Hamil-


ton-Jacobi necessitaremos primeiro analisar alguns aspectos da teoria
geral das equações diferenciais de primeira ordem. Referimos o leitor
para [Jo], [I] e [Ju] para uma exposição mais completa sobre o assunto.
Nosso objetivo nas próximas seções, será explicar a relação das
frentes de ondas com raios de luz. Esta relação é um dos pontos
centrais na formulação da Mecânica Hamiltoniana.
Primeiramente, necessitaremos analisar alguns tópicos da teoria
das equações diferenciais parciais.
Vamos começar analisando um exemplo bem simples que vai an-
tecipar as principais propriedades dos exemplos mais complexos de
equações diferenciais que serão analisados a seguir.
Considere a equação diferencial parcial de 1a ordem
∂u ∂u
x +y = 0. (7.1)
∂x ∂y
Desejamos encontrar quem é a função u(x, y) que satisfaz tal

146

i i

i i
“mec˙New”
i i
2011/10/11
page 147
i i

147

equação. Em geral existem infinitas soluções, pois se u é solução


então βu + α também é solução (β, α ∈ R são constantes quaisquer).
Observe que se u é solução de (7.1), então u(x, y) = B determina
uma curva cuja tangente (x′ , y ′ ) em (x, y) é colinear com (x, y). Isto
porque !
∂u ∂u
∇u = ,
∂x ∂y

é normal à curva de nı́vel e por hipótese de u ser solução de (7.1),

h(x, y), ∇ui = 0.

Vamos tentar determinar a expressão analı́tica de tais curvas

u(x, y) = constante = B.

Suponha que possamos obter a mencionada curva através da ex-


pressão u(x, y(x)) = B onde y(x) é obtido a partir de x pelo Teorema
da Função Implı́cita. Temos, portanto, que (1, y ′ (x)) é tangente a esta
curva, logo a partir do que afirmamos acima devemos ter que

y ′ (x) y(x)
= .
1 x
Logo
y ′ (x) 1
= ,
y(x) x
e portanto,
d d
(log y(x)) = log x.
dx dx
Sendo assim, log(y(x)) = log x+c, c ∈ R, e finalmente y(x) = ax para
algum a ∈ R. Logo u é constante em semi retas passando pela origem,
e portanto as curvas de nı́veis de u são tais semi-retas. Observe que
em (x, y) = (0, 0) não podemos fazer as considerações acima.
Note que se estabelecermos como condição de fronteira os valores
de u em uma curva diferenciável Γ que é cortada por cada uma das
semi-retas y = ax em apenas um ponto da curva Γ, pelo que de-
duzimos anteriormente, os valores da “possı́vel”(ainda não sabemos
se existe) solução u ficam necessariamente determinados. O valor

i i

i i
“mec˙New”
i i
2011/10/11
page 148
i i

148 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

u(x, y) tem que ter o valor de u, oriundo da condição de fronteira,


na interceção da reta y = ax com a curva Γ. Isto é, se este ponto de
interceção for (x0 , y0 ), então escolheremos o valor u(x, y) para todo
ponto (x, y) desta semi-reta y = ax, como u(x, y) = u(x0 , y0 ). Com a
união deste feixe de retas cobre um aberto do plano, então podemos
definir u em um subconjunto aberto do plano.
Vamos mostrar que a u assim definida na verdade é realmente
solução de (7.1).
Fixado (x, y), pela maneira como estamos definindo u, a reta y =
ax é curva de nı́vel de u, logo ∇u é perpendicular a esta reta. Como
(x, y) está nesta reta, segue que < ∇u, (x, y) >= 0. Logo a u definida
acima realmente satisfaz a equação diferencial (7.1).
Em geral o problema que pode ocorrer é que a curva Γ (onde
é fixada a condição de fronteira) intercepte uma destas semi-retas
y = ax em mais de um ponto. Neste caso poderı́amos ter o problema
de não poder obter u de maneira bem definida. Se não ocorrer esta
situação, no entanto, então o problema está bem posto e a solução
existe e está bem definida (e única) da maneira como foi escolhido
acima.
Em outras palavras, a condições natural inicial (ou de fronteira)
do problema de Cauchy deve ser fixar o valor de u em uma curva Γ
que intercepta cada semi-reta passando pela origem em apenas um
ponto.
Agora vamos analisar a equação linear geral de primeira ordem.
Considere a equação diferencial parcial de 1a ordem em R2

∂u ∂u
a(x, y) + b(x, y) = 0. (7.2)
∂x ∂y

Gostarı́amos de encontrar a solução desta equação de uma ma-


neira semelhante à utilizada no exemplo anterior.
Da maneira análoga como no exemplo anterior, primeiro resolve-
remos o sistema de equações diferenciais ordinárias de 1a ordem

dx
= a(x, y)
dt

dy
= b(x, y). (7.3)
dt

i i

i i
“mec˙New”
i i
2011/10/11
page 149
i i

149

Observe agora o que acontece com a restrição de u (solução de


(7.2)) às soluções de (7.3):

d ∂u ′ ∂u ′ ∂u ∂u
u(x(t), y(t)) = x + y = a(x, y) + b(x, y) = 0.
dt ∂x ∂y ∂x ∂y

Logo u é constante ao longo das soluções de (7.3).


Sendo assim, se (x(t), y(t)) é uma solução de (7.3), então

h∇u(x(t), y(t)), (ẋ(t), ẏ(t))i = 0.

Logo, cada curva (x(t), y(t)) deve satisfazer a propriedade que


(ẋ(t), ẏ(t)) está na reta tangente à curva u(x, y) = c.
Se tomarmos agora uma curva Γ cortando em um e só um ponto
cada curva solução de (7.3), e fixando os valores de u em Γ de-
terminaremos a solução u(x, y) (pois u é constante em soluções de
(7.3)). Do mesmo modo como no exemplo anterior, basta dar o va-
lor u(x, y) = u(x0 , y0 ) para cada (x, y) sobre uma curva γ solução
de (7.3) tal que Γ ∩ γ = (x0 , y0 ). Uma curva com tais propriedades
define a condição natural de fronteira do problema.

Definição 7.1. As curvas soluções de (7.3) são chamadas curvas


caracterı́sticas de (7.2).

Exemplo 7.1. Considere a equação


∂u ∂u
y −x = 0, (7.4)
∂x ∂x
com a condição de fronteira (ou inicial) u(s, 0) = s2 , 0 ≤ s.
Uma outra maneira de especificar a condição de fronteira acima
é estabelecer que está fixa uma curva em R3 dada por

(x(s), y(s), u(s)) = (s, 0, s2 ),

no espaço das variáveis (x, y, u). Esta maneira, na verdade, é a que


usaremos na seqüência desta seção.
Neste caso a equação diferencial ordinária que define as carac-
terı́sticas é
ẋ = y

i i

i i
“mec˙New”
i i
2011/10/11
page 150
i i

150 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

Figura 7.1:

ẏ = −x.
As soluções desta equação são do tipo

(x(t), y(t)) = (r cos(t), −r sin(t)).

Para cada valor s considere (xs (t), ys (t)) a solução da equação di-
ferencial ordinária com condição inicial (s, 0). Pelo que vimos acima,
devemos escolher u(xs (t), ys (t)) = u(s, 0) = s2 . Em outras palavras,
u é constante em cı́rculos.
Se usarmos coordenadas (s, t) então u(s, t) = s2 , ou alternativa-
mente em coordenadas polares u(r, θ) = r2 .
Se desejarmos encontrar a soluçãop u na variável (x, y), ou seja
obter u(x, y), devemos substituir r = x2 + y 2 , θ = arctan y/x em
u(r, θ) e obter u(x, y) = x2 + y 2 . Fica assim determinada a solução
do problema (7.4) por um método que se baseou fundamentalmente
nas curvas caracterı́sticas.
Vamos considerar novamente o caso geral (7.2).
Definição 7.2. Dada a equação diferencial parcial
∂u ∂u
a(x, y) + b(x, y) = 0,
∂x ∂y
chamamos de superfı́cie integral da equação diferencial uma superfı́cie
na variável (x, y, u) ∈ R3 obtida como gráfico de u(x, y), onde u é
solução da equação diferencial.

i i

i i
“mec˙New”
i i
2011/10/11
page 151
i i

151

Observação 7.1. Uma condição necessária e suficiente para que


uma superfı́cie S ⊂ R3 seja uma superfı́cie integral de (7.2) é que
para cada (x, y, u) ∈ R3 , o vetor (a(x, y), b(x, y), 0) esteja no plano
tangente à superfı́cie S em (x, y, u). Isto porque como o vetor nor-
mal η = ( ∂u ∂u
∂x , ∂y , −1) é ortogonal a superfı́cie em (x, y, u) (isto é, η é
perpendicular ao plano tangente), então

∂u ∂u
hη, (a, b, 0)i = a+ b + 0 = 0.
∂x ∂y

Portanto, segue que (a, b, 0) estar no plano tangente a S em (x, y, u)


é uma condição necessária e suficiente para S ser superfı́cie integral.
Esta relação é válida para a equação linear (7.2). Vamos definir
em breve superfı́cie integral para uma EDP qualquer e neste caso a
análogoa relação será mais complexa.
Dada a equação diferencial (7.2), uma maneira geométrica de ob-
ter o conjunto de pontos S que define uma superfı́cie integral para esta
equação e satisfazendo uma condição de fronteira inicialmente fixada
é a seguinte: para cada condição inicial (x(s), y(s), u(s)), considere
(xs (t), ys (t)) curvas caracterı́sticas (solução de (7.3)) com condição
inicial no tempo t = 0 igual a (x(s), y(s)). Considere em R3 a su-
perfı́cie S obtida pela união das curvas

(xs (t), ys (t), u(s)),

onde s, t variam sem restrição (ver Figura 4.6).


Pictoricamente, para obter S, estamos varrendo a condição inicial

(x(s), y(s), u(s))

com curvas caracterı́sticas, ou seja soluções de (7.3).


Vamos mostrar agora que realmente tal superfı́cie S assim obtida
é uma superfı́cie integral de (7.2) com a condição de fronteira dada.
É obvio que S satisfaz a condição de fronteira.
Suponha agora que (x, y) possa ser obtido como (xs (t), ys (t)) para
algums valor de s, t. Para cada s fixo, o vetor
 
dxs (t) dys (t) du(s)
, , = (x′s (t), ys′ (t), 0) = (a(x, y), b(x, y), 0)
dt dt dt

i i

i i
“mec˙New”
i i
2011/10/11
page 152
i i

152 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

está no plano tangente a S em (x, y, u). Sendo assim pela Observação


45, S determina superfı́cie integral satisfazendo a condição de fron-
teira.
Note que foi necessário supor que (xs (t), ys (t)) cobre um aberto
do R2 para poder concluir a afirmação acima. Na verdade (s, t) de-
veria ser considerado como novas coordenadas adaptadas à solução
do problema. Voltando as antigas coordenadas (x, y) por mudança
de variável podemos obter

u(s(x, y), t(x, y)) = u(x, y)

como função de (x, y).


O procedimento acima é a essência do método das caracterı́sticas.
Encontramos a solução u de uma EDP resolvendo uma EDO. É mais
conveniente pensar no conjunto geométrico S ⊂ R3 de pontos do
gráfico da solução u em vez de diretamente com u(x, y) pois assim po-
demos ter a liberdade de considerar coordenadas (s, t) mais apropri-
adas (em função das caracterı́sticas) e finalmente encontrar a solução
final u em coordenadas (x, y) apenas através de um procedimento de
mudanças de coordenadas.
Vamos agora considerar o caso geral de uma equação diferencial
parcial de primeira ordem.
Considere uma função diferenciável de Classe C 2 , F : R5 → R,

F (x, y, z, p, q).

No contexto que vamos considerar a seguir z vai expressar a função


z(x, y) (será portanto uma variável dependente) solução da EDP que
será definida a partir de F e

∂z ∂z
p= ,q =
∂x ∂y

(serão também dependentes).


A equação diferencial parcial geral de primeira ordem pode ser
expressa através da condição
 
∂z ∂z
0 = F x, y, z(x, y), , = F (x, y, z, p, q), (3.55)
∂x ∂y

i i

i i
“mec˙New”
i i
2011/10/11
page 153
i i

153

Figura 7.2:

para uma certa F fixada.


Dada uma curva (x(s), y(s), z(s), p(s), q(s)), a < s < b (que faz o
papel de condição de fronteira) desejamos encontrar a solução z(x, y)
da EDP geral de primeira ordem de tal jeito que a solução z(x, y)
satisfaça a condição de fronteira z(x(s), y(s)) = z(s). Os valores
(q(s), p(s)) devem satisfazer certas condições como veremos a seguir.
Definição 7.3. Uma superfı́cie integral da equação diferencial parcial
F = 0 é uma superfı́cie S em R3 tal que é gráfico de uma função
z(x, y) que satisfaz

F (x, y, z(x, y), zx (x, y), zy (x, y)) = 0.

Encontrar superfı́cies integrais equivale a resolver (3.55).


Nesta seção, vamos desenvolver métodos geométricos que se apli-
cam a situações bem gerais e que são semelhantes aos anteriormente
usados. Através da condição de fronteira, vamos escolher condições
iniciais e a seguir vamos varrê-las com feixes de caracterı́sticas (que
serão adequadamente definidas) e assim finalmente iremos identificar

i i

i i
“mec˙New”
i i
2011/10/11
page 154
i i

154 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

Figura 7.3:

uma superfı́cie integral S. Encontrar a solução final em uma certa


variável (por exemplo (x, y)) é apenas uma questão de mudança de
coordenadas.
Procedendo de maneira semelhante a que fizemos antes, as carac-
terı́sticas serão obtidas como curvas soluções de equações diferenciais
ordinárias de tal jeito que F (x, y, z, p, q) é constante igual a zero ao
longo destas curvas soluções (x(t), y(t), z(t), p(t), q(t)). Nosso obje-
tivo inicial é encontrar a equação diferencial ordinária em R5 que vai
definir soluções com estas propriedades.
Afirmamos que se desejarmos que (x(t), y(t), z(t), p(t), q(t)) satis-
faça a propriedade acima descrita F (x(t), y(t), z(t), p(t), q(t)) = 0,
então esta curva deve satisfazer:
dx
= Fp (7.5)
dt

i i

i i
“mec˙New”
i i
2011/10/11
page 155
i i

155

dy
= Fq (7.6)
dt
dz
= pFp + qF q. (7.7)
dt
Mais duas equações serão adicionadas mais tarde para dp dq
dt e dt .
Primeiro queremos justificar a necessidade de assumir que as três
equações acima sejam satisfeitas.
Para (x0 , y0 , z0 ) fixados, resolvemos em p a equação

F (x0 , y0 , z0 , p, q(p)) = 0.

A equação do plano tangente a superfı́cie integral S passando por

(x0 , y0 , z0 )

determina que

∂z ∂z
(z − z0 ) = p(x − x0 ) + q(y − y0 ) = (x0 , y0 ) + (x0 , y0 ).
∂x ∂y

Sendo assim, teremos (z − z0 ) = p(x − x0 ) + q(p)(y − y0 ).


Derivando a última expressão em p obtemos

dq
0 = (x − x0 ) + (y − y0 ) . (7.8)
dp

Derivando em p a equação F (x0 , y0 , z0 , p, q(p)) = 0 obtemos

dq
Fp + Fq = 0. (7.9)
dp

Eliminando
dq
dp
das duas últimas equações ((7.8) e (7.9)), obtemos

x − x0 y − y0
= .
Fp Fq

i i

i i
“mec˙New”
i i
2011/10/11
page 156
i i

156 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

Assumindo agora que a curva (x(t), y(t), z(t)) está na superfı́cie


integral e que (x(0), y(0), z(0)) = (x0 , y0 , z0 ) então
x(t)−x0
Fp x(t) − x0 t
= = y(t)−y0
.
Fq y(t) − y0
t

Fazendo o limite em t tender a zero, obtemos

x′ (t) y ′ (t)
= .
Fp Fq

Isto justifica tomar x′ (t) = Fp e y ′ (t) = Fq .


Vamos agora justificar z ′ = pFp + qFq .
Ora
dz ∂z dx ∂z dy
= + = px′ + qy ′ .
dt ∂x dt ∂y dt
Como assumimos que x′ = Fp e y ′ = Fq , concluı́mos que z ′ =
Fp p + Fq q.
Concluı́mos portanto que (7.5), (7.6) e (7.7) são condições naturais
para as caracterı́sticas.
Seja a equação diferencial ordinária em R5 dada por

dx
= Fp (7.10)
dt
dy
= Fq (7.11)
dt
dz
= pFp + qFq (7.12)
dt
dp
= −Fx − pFz (7.13)
dt
dq
= −Fy − qFz (7.14)
dt
Estas equações são denominadas equações das caracterı́sticas.

Definição 7.4. As soluções do sistema de equações diferenciais or-


dinárias acima são denominadas de caracterı́sticas.

i i

i i
“mec˙New”
i i
2011/10/11
page 157
i i

157

Nosso objetivo é mostrar que F é constante ao longo das carac-


terı́sticas.
Antes porém, devemos justificar a escolha das equações das ca-
racterı́sticas.
Ora (7.10), (7.11) e (7.12) são nada mais que (7.5), (7.6) e (7.7).
Devemos portanto justificar apenas (7.13) e (7.14).
Suponha que (x(t), y(t), z(t), p(t), q(t)) pertence ao conjunto de
pontos de uma superfı́cie integral. Ora p(x(t), y(t)) e q(x(t), y(t))
satisfazem
dp dx dy
= px + py = px F p + py Fq (7.15)
dt dt dt
e
dq dx dy
= qx + qy = q x Fp + q y Fq . (7.16)
dt dt dt
Derivando F (x, y, z, p, q) = 0 em relação a x obtemos
z }| {
∂z ∂p ∂q
0 = Fx + Fz +Fp + Fq
∂x ∂x ∂x
= Fx + Fz p +Fp px + Fq qx . (7.17)
| {z }
Derivando F (x, y, z, p, q) = 0 em relação a y obtemos
z }| {
∂z ∂p ∂q
0 = Fy + Fz +Fp + Fq
∂y ∂y ∂y

= Fy + Fz q +Fp py + Fq qy (7.18)
| {z }
Como
∂2z ∂2z
= py = q x =
∂y∂x ∂x∂y
então juntando (7.15) e (7.17) e juntando (7.16) e (7.18) derivamos
(7.13) e (7.14), ou seja,

dp
= −Fx − Fz p
dt
dq
= −Fy − Fz q.
dt

i i

i i
“mec˙New”
i i
2011/10/11
page 158
i i

158 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

Fica assim justificado (7.13) e (7.14) e portanto as equações das


caracterı́sticas. Vamos então considerar a equação diferencial or-
dinária não linear em R5 dada por (7.10), (7.11), (7.12), (7.13) e
(7.14). Denotaremos tal equação por r′ = G(r) onde r ∈ R5 e
G : R5 → R5 .
Vamos voltar agora a considerar o problema de Cauchy que está-
vamos interessados em resolver, ou seja F (x, y, z, p, q) = 0 com uma
certa condição de fronteira dada por (x(s), y(s), z(s), p(s), q(s)). De-
sejamos encontrar pelo método das carcterı́sticas z(x, y) satisfazendo
as condições iniciais

(x(s), y(s), z(s), p(s), q(s)).

Observação 7.2. Note que estas 5 quantidades não podem ser esco-
lhidas independentemente pois devem obedecer as relações

dz ∂z dx ∂z dy dx dy
= + =p +q
ds ∂x ds ∂y ds ds ds
e
F (x(s), y(s), z(s), p(s), q(s)) = 0.
Sendo assim a condição inicial será dada apenas por
(x(s), y(s), z(s)). Os valores (p(s), q(s)) devem ser escolhidos satis-
fazendo as equações acima.
Por exemplo, se escolhemos z(s) constante sobre (x(s), y(s)), então
as duas equações acima são F (x(s), y(s), z(s), p(s), q(s)) = 0 e
p(s)x′ (s) + q(s)y ′ (s) = 0.
Como dissemos antes, a maneira correta de entender a condição
inicial na verdade é a seguinte, dada uma curva γ no plano, parame-
trizada por (x(s), y(s)) escolhemos os valores de z (ou u) em γ. Isto
equivale a escolher de fato a condição (x(s), y(s), z(s)).
Vamos agora encontrar a solução pelo método das caracterı́sticas.
Para cada valor s fixado considere a curva em R5

(xs (t), ys (t), zs (t), ps (t), qs (t)) =

solução de r′ = G(r) com condição inicial

r(0) = (x(s), y(s), z(s), p(s), q(s)).

i i

i i
“mec˙New”
i i
2011/10/11
page 159
i i

159

Figura 7.4:

Denotaremos por

x = x(s, t) = xs (t)

y = y(s, t) = ys (t)
z = z(s, t) = zs (t)
p = p(s, t) = ps (t)
q = q(s, t) = qs (t)
os valores obtidos com o procedimento acima.
Vamos considerar agora a superfı́cie S ⊂ R3 obtida varrendo a
condição de fronteira (x(s), y(s), z(s)) por curvas (xs (t), ys (t), zs (t))
obtidas a partir das curvas caracterı́sticas. Vamos mostrar que a S
assim definida é uma superfı́cie integral.
Para mostrar que S define uma superfı́cie integral, vamos agora
derivar
F (xs (t), ys (t), zs (t), ps (t), qs (t))
em relação a t.

i i

i i
“mec˙New”
i i
2011/10/11
page 160
i i

160 [CAP. 7: MÉTODO DAS CARACTERÍSTICAS

Usando as equações das caracterı́sticas


dF dx dy dz dp dq
= Fx + Fy + Fz + Fp + Fq =
dt dt dt dt dt dt
= Fx Fp + Fy Fq + Fz (pFp + qFq ) − Fp (Fx + pFz ) − Fq (Fy + qFz ) = 0.
Logo F é constante e não depende de t. Como assumimos que

(x(s), y(s), z(s))

está na superfı́cie integral e (p(s), q(s)) foram escolhidos de tal jeito


que F (x(s), y(s), z(s), p(s), q(s)) = 0, concluı́mos que

F (xs (t), ys (t), zs (t), ps (t), qs (t)) = 0

para qualquer s, t. Logo S é superfı́cie integral satisfazendo a condição


de fronteira. S pode ser definida como a superfı́cie bidimensional
definida por (xs (t), ys (t), zs (t)) (ver [Jo]).
Suponha que (x(s, t), y(s, t)) cobre um aberto do plano (x, y), in-
jetivamente em (s, t). Uma condição suficiente para tal propriedade
ocorrer localmente é (x′ (s), y ′ (s)) não ser colinear com (Fp , Fq ) =
(x′ (t), y ′ (t)) sobre a curva de condições iniciais. Se conseguirmos in-
verter a relação entre as variáveis (x(s, t), y(s, t)), obtendo
(s(x, y), t(x, y)), poderemos expressar a solução z(x, y) como

z(x, y) = z(s(x, y), t(x, y)),

onde z(s, t) = zs (t) foi obtida acima (ver [Jo]).


O conceito de superfı́cie integral permite pensar de maneira geo-
métrica, sem se preocupar com as variáveis (x, y), e assim descrever
a solução em coordenadas mais naturais que são (s, t). Finalmente,
podem obter z(x, y) através do desenvolvimento acima.
A equação de Hamilton-Jacobi é uma equação diferencial parcial
de primeira ordem, e o método das caracterı́sticas é um procedimento
natural para calcular soluções desta equação.

i i

i i
“mec˙New”
i i
2011/10/11
page 161
i i

161

Exercı́cios
1. Calcule a equação das caracterı́sticas para a equação diferencial
parcial de Hamilton-Jacobi
 
∂z ∂z
0 = 1 − H x, y, , = F (x, y, z, zx , zt ).
∂x ∂y

2. Encontre as caracterı́sticas da equação diferencial parcial x2 zx +


y 2 zy = 0, z(x, y) ∈ R, (x, y) ∈ R2 . A seguir determine uma
curva de condições iniciais tal que esteja bem definida a solução
do problema de Cauchy.

i i

i i
“mec˙New”
i i
2011/10/11
page 162
i i

Capı́tulo 8

Equações Diferenciais
Parciais: Método da
Solução Completa

Na seção anterior usamos o método das caracterı́sticas para resolver a


equação diferencial parcial geral de primeira ordem F (x, y, z, p, q)=0.
Nesta seção vamos nos concentrar no método da solução completa
para resolver (3.55). Este método também será importante para a
correta análise da equação de Hamilton-Jacobi.
Antes disso devemos analisar envoltórias de curvas e sua relação
com a propagação de ondas. Primeiramente no entanto, vamos ana-
lisar o caso mais simples de envoltórias de funções de uma variável
tomando valores reais.
Considere f (x, c) = fc (x) uma famı́lia a um parâmetro c ∈ R, de
funções, como por exemplo fc (x) = sin(x + c).
Definição 8.1. Dada uma famı́lia de curvas fc , a envoltória das
curvas (x, fc (x)) é o bordo da região de dimensão 2 obtida em R2
pela união de todas as curvas (x, fc (x)), c ∈ R.
Vamos mostrar que no caso do exemplo acima mencionado a en-
voltória é a união das retas y = 1 e y = −1.

162

i i

i i
“mec˙New”
i i
2011/10/11
page 163
i i

163

Para cada x0 ∈ R fixado, os dois pontos da envoltória que estão


situados na reta vertical passando por x0 podem ser determinados da
seguinte maneira: considere para cada possı́vel valor de c os possı́veis
valores f (x0 , c). Estes valores f (x0 , c) vão determinar um intervalo de
possı́veis valores. Os valores extremos deste intervalo devem corres-
ponder ao supremo e ao ı́nfimo de g(c) = f (x0 , c), onde g é encarado
como uma função da variável c. Logo tomando os dois valores c =
cx0 tal que g ′ (c) = 0 (ou seja ∂f ∂c = 0) temos que f (x, cx0 ) está na
envoltória da famı́lia fc .
Exemplo 8.1. Para fc (x) = sin(x + c), obtemos do desenvolvimento
acima a equação
∂f
0= (x, c) = cos(x + c),
∂c
logo
π π
(x + c) = ou − ,
2 2
portanto, teremos fc (x) = sin(x + c) = 1 ou fc (x) = sin(x + c) = −1.
Logo a envoltória da famı́lia fc é a união das retas y = −1 e y = 1
(ver Figura 7.1).
Exemplo 8.2. (Transformada de Legendre) Seja f : R → R e a
famı́lia de retas em R2

g(x, p) = gp (x) = xp − f (p).

p faz o papel do parâmetro da famı́lia de funções gp .


Para cada p ∈ R fixado xp − f (p) é a equação de uma reta na
variável x. A envoltória u desta famı́lia de retas é encontrada da
seguinte maneira: encontre p0 tal que
∂g
(x, p0 ) = 0,
∂p
a seguir tome
u(x) = xp0 − f (p0 ).
Dado x, estas equações equivalem a escolher p tal que x = f ′ (p)
e u(x) = xp − f (p), ou seja, u é a Transformada de Legendre de f .

i i

i i
“mec˙New”
i i
2011/10/11
page 164
i i

164 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

Figura 8.1:

Alternativamente, podemos expressar as condições acima na ma-


neira mais familiar ao leitor, conforme Seção 3 deste capı́tulo: u(x) é
a transformada de Legendre de f se

u(x) = sup{xp − f (p)}.


p∈R

Vamos analisar agora famı́lias de superfı́cies em R3 parametriza-


das por c ∈ R. Por exemplo f (c, x, y) = fc (x, y) = sin(x + c) + y,
c ∈ R.
Definição 8.2. A envoltória da famı́lia de superfı́cies cujo gráfico é
(x, y, fc (x, y)) é por definição o bordo da região de dimensão 3 obtida
como união dos pontos do R3 da forma (x, y, fc (x, y)).
Para cada (x, y) o ponto da envoltória da forma (x, y, z) é aquele
tal que z = fc0 (x, y), onde se g(c) = fc (x, y) então c0 é obtido como o

i i

i i
“mec˙New”
i i
2011/10/11
page 165
i i

165

máximo ou mı́nimo para g na variável c. Em outras palavras devemos


encontrar c0 = c0 (x, y) tal que g ′ (c0 ) = 0, ou seja c0 tal que

∂f
(c, x, y) = 0,
∂c
e a seguir considerar (x, y, z) onde z = fc0 (x, y).
A função u(x, y) = fc0 (x,y) (x, y) define então através do seu gráfico
(x, y, u(x, y)) a envoltória da famı́lia. fc

Exemplo 8.3. Seja fc (x, y) = sin(x + c) + y, então c = c(x,y) deve


satisfazer
∂f
(c, x, y) = cos(x + c) = 0.
∂c
Ou seja,
π π
x+c= ou x + c = − ,
2 2
logo
   
π π
z = sin + y = 1 + y ou z = sin − + y = −1 + y.
2 2

A envoltória da famı́lia é, portanto, a união de dois planos (x, y, 1+


y) e (x, y, −1 + y).

Agora vamos voltar a considerar o problema de resolver equações


diferenciais parciais.
A equação diferencial parcial geral de 1a ordem para a função
de duas variáveis z(x, y) e suas derivadas zx = p e zy = q pode ser
escrita como
F (x, y, z, p, q) = 0, (8.1)
onde F : R5 → R tem derivadas parciais de segunda ordem contı́nuas.
Considere a condição de fronteira dada por uma curva (x(t), y(t), z(t)).
Um exemplo de tal tipo de equações diferenciais é F (x, y, z, p, q) =
(z − px − qy)2 + (1 + p2 + q 2 ) = 0. Este exemplo será analisado em
breve.
Nosso objetivo inicial será obter novas soluções de F = 0 a partir
de famı́lias de soluções de F = 0.

i i

i i
“mec˙New”
i i
2011/10/11
page 166
i i

166 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

O fato de z(x, y) ser solução de (8.1) nos dá uma relação no ponto
(x0 , y0 , z0 ) entre

∂z ∂z
p= (x0 , y0 , z0 ) e q = (x0 , y0 , z0 ).
∂x ∂y

Vamos considerar agora uma famı́lia fc (x, y) = z = f (x, y, c) de


soluções de (8.1), ou seja, para cada c fixado, z(x, y) = fc (x, y) é
solução de F = 0.
Vamos mostrar que a envoltória desta famı́lia de soluções nos de-
termina uma outra solução de F = 0.
A função g(x, y) cujo gráfico é a envoltória da famı́lia pode ser
obtida da seguinte maneira: para (x, y) fixados, encontre c0 tal que

∂f
(x, y, c0 ) = 0, (8.2)
∂c
e então obteremos z = g(x, y) = f (x, y, c0 ).
Note que c0 = c0 (x, y) na verdade depende de (x, y).
A envoltória g será f (x, y, c(x, y)) e satisfará então a equação

∂g ∂f ∂f ∂c ∂f
= + =
∂x ∂x ∂c ∂x ∂x
e
∂g ∂f ∂f ∂c ∂f
= + = .
∂y ∂y ∂c ∂y ∂y
Como fc (x, y) é solução de (8.1) então para fc (x, y) = fc(x,y) (x, y)
= g(x, y) a relação F (x, y, fc (x, y), p, q) = 0 é válida e portanto

F (x, y, g(x, y), p, q) = 0

pois
∂f ∂g ∂f ∂g
p= = e q= = .
∂x ∂x ∂y ∂y
Portanto g também satisfaz a equação diferencial parcial (8.1).
Note que nas considerações acima, nada foi dito sobre condições de
fronteira.
Obter mais uma solução g a partir de uma famı́lia fc não pa-
rece contribuir muito para a solução geral do problema (8.1). No

i i

i i
“mec˙New”
i i
2011/10/11
page 167
i i

167

entanto, se considerarmos famı́lias a dois parâmetros de soluções


z(x, y) = fa,b (x, y) = f (x, y, a, b), estaremos obtendo através de en-
voltórias uma informação não trivial como veremos a seguir. O ponto
fundamental é que desejamos encontrar soluções da EDP, F = 0, mas
sujeita a uma certa curva de valores de fronteira (x(s), y(s), z(s))
dada. Uma famı́lia a um parâmetro de soluções não permite isto, e
será necessário considerar famı́lias a dois parâmetros.
Escolha uma famı́lia a um parâmetro (a(s), b(s)) no espaço de
parâmetros (a, b). Esta famı́lia será determinada em breve no texto.
Considere a famı́lia a um parâmetro s ∈ R, z = f (x, y, a(s), b(s))
e sua envoltória (ver expressão (8.2)) z = f (x, y, a(s), b(s)) (onde s
satisfaz 0 = ∂f ∂f ′ ∂f ′
∂s = ∂a a + ∂b b ) que é também uma solução de F = 0
como vimos antes .
Vamos mostrar agora que dada uma curva de condições iniciais
em R3
(x(s), y(s), z(s)),
podemos tentar obter uma superfı́cie integral que contenha tal curva
a partir de uma escolha conveniente de (a(s), b(s)).
Seja então (x(s), y(s), z(s)) uma curva, a qual desejamos encon-
trar uma superfı́cie integral que a contenha.
Considere as duas equações

z(s) − f (x(s), y(s), a, b) = 0 (8.3)


∂f ′ ∂f ′
z′ − x (s) − y (s) = 0 (8.4)
∂x ∂y
obtendo assim uma relação de a e b em função de s (para s fixado
temos duas equações a duas incógnitas). Obtemos assim a(s) e b(s)
de tal jeito que satisfazem (8.3) e (8.4).
Com essa escolha de a(s) e b(s) vamos determinar uma famı́lia
a um parâmetro que vai determinar através da sua envoltória uma
supefı́cie integral passando por (x(s), y(s), z(s)).
Considere a famı́lia a um parâmetro

z = fs (x, y) = f (x, y, a(s), b(s)) (8.5)

e como vimos acima a sua correspondente equação da envoltória

z = f (x, y, a(s0 ), b(s0 )) (8.6)

i i

i i
“mec˙New”
i i
2011/10/11
page 168
i i

168 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

Figura 8.2:

onde s0 = s0 (x, y) satisfaz

∂f ∂f ′ ∂f ′
0= = a (s) + b (s). (8.7)
∂s ∂a ∂b

Seja g(x, y) a envoltória da famı́lia (8.5), isto é:

g(x, y) = f (x, y, a(s0 (x, y)), b(s0 (x, y))),

onde s = s0 (x, y) é obtido para (x, y) fixo satisfazendo (8.7).


Note que conforme já vimos antes, é sempre verdade que tal en-
voltória g(x, y) determina uma superfı́cie integral que é solução da
Equação Diferencial Parcial. A questão que nos interessa é se a
curva inicialmente dada pertence à superfı́cie integral S que obti-
vemos. Afirmamos que (x(s), y(s), z(s)) está na superfı́cie integral
da envoltória g(x, y), ou seja satisfaz (8.6) e (8.7). Isto é verdade
pois (8.6)
z(s) = f (x(s), y(s), a(s), b(s))
vem de (8.3) e da maneira como s foi escolhido.
Devemos mostrar agora que (8.7) e (8.4) são equivalentes.

i i

i i
“mec˙New”
i i
2011/10/11
page 169
i i

169

Ora de (8.3) z(s) = f (x(s), y(s), a(s), b(s)), logo derivando em


relação a s
∂f ′ ∂f ′ ∂f ′ ∂f ′
z ′ (s) = x (s) + y (s) + a (s) + b (s)
∂x ∂y ∂a ∂b
A expressão (8.4) nos diz que
∂f ′ ∂f ′
z′ = x (s) + y (s)
∂x ∂y
portanto
∂f ′ ∂f ′
a (s) + b (s) = 0.
∂a ∂b
Isto mostra que (8.7) é equivalente a (8.4).
Logo se a(s) b(s) satisfazem (8.3) e (8.4), então obtemos através de
g(x, y) acima, envoltória da familia fs , a solução da EDP satisfazendo
a condição de fronteira dada.
Portanto dado uma curva (x(s), y(s), z(s)) em R3 , através do
método exposto acima, podemos obter uma superfı́cie integral que
a contenha.
Definição 8.3. Uma famı́lia fa,b (x, y) a dois parâmetros (a, b) de
soluções de (8.1) é chamada uma solução completa de (8.1).
O método descrito acima, que permite através de uma famı́lia a
dois parâmetros (uma solução completa conforme a definição acima)
encontrar uma superfı́cie integral a partir de condições de fronteira é
chamado de método da solução completa.
Exemplo 8.4. Vamos resolver agora, através do método da solução
completa a EDP
!2  2  2 !
∂u ∂u ∂u ∂u
u− x− y − 1+ − = 0.
∂x ∂y ∂x ∂y

Isto é F (x, y, z, p, q) = (z − px − qy)2 − (1 + p2 + q 2 ) = 0. Seja a


famı́lia a dois parâmetros a e b (com a2 + b2 < 1)
−a −b 1
z=p x+ p y+ p = fa,b (x, y)
1 − (a2 + b2 ) 1 − (a2 + b2 ) 1 − (a2 + b2 )

i i

i i
“mec˙New”
i i
2011/10/11
page 170
i i

170 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

de soluções (uma solução completa).


Dada a curva z = 1, x = 1/2 cos θ, y = 1/2 sin θ, 0 ≤ θ ≤ 2π
então (8.3) significa:

−ax − by + 1
z=p ,
1 − (a2 + b2 )

ou seja,
p a b
1 − (a2 + b2 ) + cos θ + sin θ − 1 = 0. (8.8)
2 2
Já (8.4) significa

(a) (− sin θ) −b cos θ


0− p + p = 0,
1 − (a2 + b2 ) 2 2 1 − (a2 + b2 )

ou seja,
a sin θ − b cos θ = 0. (8.9)
De (8.8) e (8.9) se obtém a(θ) = 4/5 cos θ, b(θ) = 4/5 sin θ.
Logo a solução que buscamos z(x, y) (envoltória da famı́lia a um
parâmetro θ)
4 4 5
z = − x cos θ − y sin θ +
3 3 3
que fornece como solução o cone
4p 2 5
z=− x + y2 + .
3 3
A equação de Hamilton-Jacobi é de primeira ordem, e o método da
solução completa será utilizado em breve para analisar tal equação.
Anteriormente estávamos considerando envoltórias de funções. A-
gora iremos considerar envoltórias de curvas, obtendo resultados que
também serão muito importantes em Mecânica Hamiltoniana.
Vamos agora considerar famı́lias de curvas. Estas curvas serão
dadas implicitamente.

Definição 8.4. A envoltória de uma famı́lia de curvas dadas impli-


citamente será a curva que define o bordo da união de todas as curvas
da famı́lia.

i i

i i
“mec˙New”
i i
2011/10/11
page 171
i i

171

Considere a famı́lia a um parâmetro de curvas implicitamente da-


das por f (x, y, α) = 0, α ∈ R. Para cada α, 0 = fα (x, y) = f (x, y, α)
define implicitamente na variável (x, y) uma curva da famı́lia. Como
encontrar a curva C (ou curvas) que determinam a envoltória da
famı́lia fα ?

Teorema 8.1. Se a famı́lia a parâmetro α de curvas determinada


por
fα (x, y) = f (x, y, α) = 0
tem uma curva envoltória, então esta curva pode ser encontrada im-
plicitamente através da equação que se obtém substituindo α = αx,y ,
solução de
∂f (x, y, α)
= 0. (8.10)
∂α
em f (x, y, α) = 0.
Fica assim determinado implicitamente a envoltória por

0 = g(x, y) = F (x, y, αx,y ).

Demostração: Supondo por exemplo

∂f
(x̄, ȳ, ᾱ) 6= 0
∂y

então para (x, y, α) perto de (x̄, ȳ, ᾱ) tem-se

f (x, y, α) = 0 ⇔ y = g(x, α)

com g diferenciável. Pelo resultado anterior (8.2), a envoltória da


famı́lia de curvas gα (x) é dada por

∂g
(x̄, ᾱ) = 0.
∂α
Como f (x, g(x, α), α) = 0 para todo (x, α) próximo de (x̄, ᾱ), obtém-
se, diferenciando com relação a α,

∂f ∂g ∂f
0= (x, g(x, α), α) (x, α) + (x, g(x, α), α)
∂y ∂α ∂α

i i

i i
“mec˙New”
i i
2011/10/11
page 172
i i

172 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

e em particular, em (x̄, ᾱ):

∂f ∂g ∂f ∂f
0= (x̄, g(x̄, ᾱ), ᾱ) (x̄, ᾱ) + (x̄, g(x̄, ᾱ), ᾱ) = (x̄, ȳ, ᾱ),
∂y |∂α {z } ∂α | {z } ∂α
=ȳ
=0

i.e., a envoltória das curvas é dado equivalentemente por

∂f
(x̄, ȳ, ᾱ) = 0.
∂α
O caso
∂f
(x̄, ȳ, ᾱ) 6= 0
∂x
é análogo. 

Exemplo 8.5. Vamos encontrar a envoltória da famı́lia de cı́rculos

f (x, y, α) = x2 + y 2 − 2αx − 2αy + α2 = 0

usando o último Teorema.


Esta famı́lia representa cı́rculos de raio kαk centrados nos pontos
da reta diagonal (α, α), ou seja, a famı́lia (x − α)2 + (y − α)2 = α2 .
Ora
∂f
= −(2x + 2y − 2α) = 0,
∂α
logo α = (x+y). Substituindo α = αx,y por (x+y) em f (x, y, α) = 0,
obtemos 0 = f (x, y, α) = (x−α)2 +(y−α)2 −α2 = y 2 +x2 −(x+y)2 =
−2xy.
Obtemos portanto a equação da envoltória como xy = 0, ou seja
a equação retas que definem os eixos de x e dos y. Geometricamente
é bem fácil se observar que realmente os eixos do x e y são a solução
do problema (ver Figura 7.2).

Vamos agora aplicar o resultado acima em uma situação que será


extremamente importante na teoria de propagação de ondas.

Exemplo 8.6. Seja uma função φ : R2 → R tal que para cada T ,


φ(x, y) = T determina uma curva de nı́vel diferenciável ΣT .

i i

i i
“mec˙New”
i i
2011/10/11
page 173
i i

173

Suponhamos que φ tem a seguinte propriedade: para T , ∆ > 0 a


curva ΣT +∆ é obtida como a envoltória por cı́rculos de raio ∆ sobre
a curva ΣT (ver Figuras 7.3 e 7.4).
Vamos mostrar que a função φ deve satisfazer a equação
!2 !2
∂φ ∂φ
1= + . (8.11)
∂x ∂y

Esta equação é conhecida como equação eikonal da ótica geomé-


trica.
Seja (x1 (α), x2 (α)) uma parametrização de ΣT . Então a famı́lia

f (x, y, α) = (x1 (α) − x)2 + (x2 (α) − y)2 − ∆2 = 0

vai definir implicitamente a equação de cı́rculos (na variável (x, y))


de raio ∆, centrados nos pontos da curva ΣT .
As Figuras 8.1 e 8.2 dão uma ideia dos distintos envoltórios ob-
tidos a partir de um objeto unidimensional genérico.
Como vimos antes a envoltória da famı́lia é obtido como a curva
∂f
na variável (x, y) que satisfaz as equações ∂α = 0 e f (x, y, α) = 0.
Sendo assim obtemos as equações:
∂f
0= = 2(x1 (α) − x)x′1 (α) + 2(x2 (α) − y)x′2 (α),
∂α
e (x1 (α) − x)2 + (x2 (α) − y)2 = ∆2 .
Resolvendo o sistema acima vamos encontrar (x(α), y(α)) para-
metrização de ΣT +∆ dependendo do ponto (x1 (α), x2 (α)) sobre a
curva ΣT . O ponto (x(α), y(α)) está na envoltória e dista ∆ de
(x1 (α), x2 (α)).
Da equação [(x1 (α) − x(α))x′1 (α) + (x2 (α) − y(α))x′2 (α)] = 0 con-
cluı́mos que para todo ∆(x1 (α) − x(α), x2 (α) − y(α)) é perpendicu-
lar ao vetor tangente (x′1 (α), x′2 (α)). Em outras palavras, (x1 (α) −
x(α), x2 (α) − y(α)) é normal a ΣT para todo ∆.
Como sabemos v∆ = −((x1 (α) − x(α)), x2 (α) − y(α)) para todo
∆ (pequeno) é colinear com ∇φ (que é perpendicular à superfı́cie de
nı́vel) e v∆ tem sempre norma ∆.
Portanto,
∇φ v∆
= .
k∇φk kv∆ k

i i

i i
“mec˙New”
i i
2011/10/11
page 174
i i

174 [CAP. 8: MÉTODO DA SOLUÇÃO COMPLETA

Como * +
∇φ
∇φ, = k∇φk,
k∇φk
então * +
v∆
∇φ, = k∇φk.

Ora
φ(x + u1 ∆, y + u2 ∆) − φ(x, y)
h∇φ, ui = h∇φ, (u1 , u2 )i = lim ,
∆→0 ∆
logo * +
v∆
k∇φk = ∇φ, =

" !
1 x(α) − x1 (α)
lim φ x1 (α) + ∆ ,
∆→0 ∆ ∆
 ! #
(y(α) − x2 (α))
x2 (α) + ∆ − φ(x1 (α), x2 (α))

1 ∆+T −T
lim [φ(x(α), y(α)) − φ(x1 (α), x2 (α))] = lim = 1.
∆→0 ∆ ∆→0 ∆
Sendo assim, k∇φk = 1, ou seja,
!2 !2
∂φ ∂φ
+ = 1.
∂x ∂y

Concluı́mos, portanto, que uma função φ satisfazendo a proprie-


dade das envoltórias por cı́rculos de mesmo raio para as superfı́cies
de nı́vel ΣT , deve satisfazer a equação diferencial parcial acima.
Esta equação foi denominada anteriormente de Equação de Ha-
milton-Jacobi autônoma para o Hamiltoniano H(q, p) = p21 +p22 . Esta
equação não é linear. Para resolvê-la vamos aplicar os métodos para
calcular as soluções de equações diferenciais parciais de 1a ordem não
lineares a partir de condições de fronteira que consideramos antes.

i i

i i
“mec˙New”
i i
2011/10/11
page 175
i i

175

Figura 8.3:

Exercı́cio
1. Calcule pelo método da solução completa a solução da equação
diferencial parcial
 2  2
∂S 1 ∂S
+ = 1,
∂x 4 ∂y

com a condição inicial (x(s), y(s), S(s)) = (s, 0, 1).

i i

i i
“mec˙New”
i i
2011/10/11
page 176
i i

Capı́tulo 9

O Princı́pio de Huygens
em Mecânica
Hamiltoniana

Vamos analisar a seguir a evolução de uma frente de onda em um


plano (o caso mais geral em Rn é semelhante). Para fixar idéias,
vamos supor que desejamos analisar a seguinte questão: largamos
uma pequena pedra ou um galho de árvore na superfı́cie de um lago
em repouso. A superfı́cie do lago será então percorrida por uma
frente de onda que se propaga a partir da excitação inicial causada
pela pedra ou galho (ver respectivamente Figuras 8.1 e 8.2).
Vamos denotar por Σt a posição espacial em R2 da frente de onda
no tempo t.
Observe nas Figuras 8.1 e 8.2 que a frente de onda Σt+∆ é (a parte
externa da) envoltória por cı́rculos de raio ∆ centrados na frente de
onda Σt . Essa propriedade é observada na natureza e em essência
expressa o seguinte fato. A frente de onda Σt+∆ poderia ser obtida
lançando ao mesmo tempo t várias pedrinhas sobre a posição da
frente de onda Σt . Esperando decorrer o tempo ∆ cada pedrinha
individualmente cria um cı́rculo (de raio ∆) de frente de onda. A
envoltória destes cı́rculos determina a frente de onda Σt+∆ .

176

i i

i i
“mec˙New”
i i
2011/10/11
page 177
i i

177

Essa propriedade é o que se denomina (em termos simplificados)


o princı́pio de Huygens.
O mesmo princı́pio é também válido para a propagação da luz a
partir de um ponto p0 onde acendemos a luz no tempo inicial t0 . A
luz tem velocidade finita e a separação entre a região iluminada num
tempo T e a região ainda não iluminada é a frente de onda.
Em certos cristais a luz não se propaga em linha reta e as frentes
de onda não são necessariamente cı́rculos. Podem haver direções em
que a luz tem mais facilidade de se propagar. Este fato se deve muitas
vezes à estrutura molecular do cristal e é conhecido como anisotropia,
ou não-homogeneidade do meio.
Para descrever matematicamente a evolução da frente de onda,
vamos supor que existe uma função S(x, t), S : Rn × R → R que vai
descrever de maneira implı́cita a posição da frente de onda, isto é,
dado t1 ∈ R, t1 > 0, S(x, t1 ) = 0, vai definir a hipersuperfı́cie Σt1 em
Rn , que define a frente de onda no tempo t1 . Vamos supor sempre
que
!2 ! !2
∂S ∂S 2 ∂S
+ + ... + 6= 0.
∂x1 ∂x2 ∂xn

Referimos o leitor para [BF] e [Jo] para uma explanação mais


completa dos tópicos a serem apresentados a seguir.
p
Exemplo 9.1. Considere S(x, t) = x21 + ... + x2n − t, então para
t > 0 a frente de onda Σp t será a esfera com raio t, ou seja, o conjunto
dos (x1 , ..., xn ) tal que x21 + ... + x2n − t = 0.
No caso n = 2, a função S descreve a evolução da frente de
onda de uma pequena pedra lançada no tempo t = 0 na superfı́cie
de um lago (na posição (0, 0)). É fácil ver geometricamente que a
propriedade da envoltória das curvas de nı́vel por cı́rculos é verdade
para tal S. Estamos neste caso supondo que a propagação da onda é
isotrópica e homogênea (vamos definir estes conceitos mais precisa-
mente em breve).
Note que tal S satisfaz a equação diferencial
 2  2
∂S ∂S ∂S
+ =− = 1,
∂x1 ∂x2 ∂t

i i

i i
“mec˙New”
i i
2011/10/11
page 178
i i

178 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

ou equivalentemente
s 2  2
∂S ∂S ∂S
+ =− = 1.
∂x1 ∂x2 ∂t

Note que esta equação corresponde


p a equação de Hamilton-Jacobi
para o Hamiltoniano H(q, p) = p21 + p22 . Este fato será analisado
com mais detalhe em breve.
p
Exemplo 9.2. Considere para x ∈ p R2 , S(x, t) = x21 + 4x22 − t,
então as frentes de onda são elipses x21 + 4x22 − t = 0. Nesse caso
estaremos descrevendo a evolução da frente de onda de um distúrbio
inicial no tempo 0 feito no ponto (0,0). A propagação não é ho-
mogênea pois a onda se propaga mais rapidamente na direção x1 .
S satisfaz neste caso a equação diferencial
 2  2
∂S 1 ∂S ∂S
+ =− ,
∂x1 4 ∂x2 ∂t

ou equivalentemente
s 2  2
∂S 1 ∂S ∂S
+ =− .
∂x1 4 ∂x2 ∂t

Note que esta equação corresponde àq


equação de Hamilton-Jacobi as-
sociada ao Hamiltoniano H(q, p) = p21 + 14 p22 .
Este exemplo será analisado mais uma vez em breve.

Neste texto estaremos analisando, prioritariamente, propagação


homogênea e isotrópica. Sendo assim, a frente de onda Σt+∆ é ob-
tida como a envoltória de cı́rculos de mesmo raio com centro em
Σt . No outro caso terı́amos que fazer envoltórios com elipses e a ex-
centricidade de tais elipses depende da posição no caso de um meio
não-homogêneo e anisotrópico.
Considere uma S(x, t) : Rn+1 → R, que define implicitamente a
posição das frentes de onda conforme definimos anteriormente. Para
simplificar nossas considerações vamos supor ainda mais que exista
S(x) : Rn → R tal que S(x, t) = S(x) − t (esta expressão é análoga

i i

i i
“mec˙New”
i i
2011/10/11
page 179
i i

179

à expressão S(q, t) = S(q) − wt que usamos anteriormente quando


estávamos analisando soluções da equação de Hamilton-Jacobi na
Seção 8, Capı́tulo 3 [L]).
Que tipo de restrições tal função S deve satisfazer?
Suponha, 0 = S(x, t) = S(x) − t, para t fixo, vai descrever a curva
que estabelece a frente de onda no tempo t. Pelo princı́pio de Huygens
a curva de nı́vel no tempo t+∆ é obtida como a envoltória de cı́rculos
(o meio é homogeneo e isotrópico) de raio ∆ e centrados sobre a curva
de nı́vel no tempo t. Esta situação, no caso do plano, é exatamente
aquela que analisamos na seção anterior e sabemos portanto que neste
caso S deve satisfazer a equação da eikonal
!2 !2
∂S ∂S
+ = 1.
∂x1 ∂x2

É possı́vel também mostrar no caso geral do Rn , que a função S


deve satisfazer
!2 !2 !2
∂S ∂S ∂S
+ + ... + = 1.
∂x1 ∂x2 ∂xn
Esta equação é também denominada equação da eikonal e é um
caso particular de equação de Hamilton-Jacobi autônoma (ver (3.13)
Seção 8, Capı́tulo 3 [L]). A relação desta equação com a equação de
Hamilton será o objetivo das nossas próximas considerações.
A relação entre raios de luz e frentes de onda vai nos possibili-
tar entender a razão da introdução do ponto de vista de “frentes de
onda” de Hamilton de entender a Mecânica Clássica. Vamos a seguir
explicar melhor esta relação.
Na verdade este ponto de vista é, nada mais nada menos, que o
princı́pio de Huygens para a Mecânica Hamiltoniana.
Voltando ao caso geral, considere S(x, t) que vai descrever para
cada tempo t, a frente de onda no tempo t através da curva obtida
implicitamente pela equação S(x, t) = 0.
Suponha que x(t) vai descrever uma curva em Rn tal que ∀ t ∈ R,
x(t) ∈ Σt . Em outras palavras, x(t) vai estar sempre na frente de
onda. Sendo assim, S(x(t), t) = 0, ∀ t ∈ R, t > 0 e, portanto,
∂S ′ ∂S ′ ∂S ′ ∂S
x1 + x2 + ... + xn + =0
∂x1 ∂x2 ∂xn ∂t

i i

i i
“mec˙New”
i i
2011/10/11
page 180
i i

180 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

ou seja
∂S
h∇S, x′ i = − .
∂t
Observação 9.1. Considere S(x, t) que descreve através de S(x, t) =
0 a evolução temporal de uma frente de onda causada por uma fonte
pontual luminosa localizada em um ponto x0 . Para t fixo, a en-
voltória dos caminhos z(s), s ∈ [0, t] (todos com velocidade constante
kz ′ (s)k = 1, s ∈ (0, t)) com ponto inicial x0 = z(0) e ponto final z(t)
determina a frente de onda. Um caminho x(s) entre tantos possı́veis
z(s), que está localizado de tal jeito que x(t) está na frente de onda
S(x, t) = 0 vai representar o raio de luz fisicamente observável. Este
caminho x(s) é o que realmente se chama de raio de luz.

Ora, ∇S é perpendicular a Σt , logo a componente do vetor x′ (t)


∇S
na direção k∇Sk (normal à frente de onda) é

∂S
∂t
− .
k∇Sk

Em geral, nem sempre ∇S, o gradiente da função frente de onda


S, e x′ (t), o vetor tangente ao raio de luz x(t), são colineares, mas se
o meio é homogêneo e isotrópico, isto acontecerá como veremos em
breve.

Definição 9.1. A velocidade de propagação da frente de onda é por


definição o vetor velocidade de propagação normal à superfı́cie Σt ,
ou seja
∂S
∂t
− ∇S.
k∇Sk2
Definição 9.2. O módulo do vetor velocidade de frente de onda é
dado por
∂S
∂t
− > 0.
k∇Sk
O módulo do vetor frente de onda é a grandeza mais importante
que vai descrever a evolução temporal da frente de onda. A lei que
determina tal evolução será descrita a seguir.

i i

i i
“mec˙New”
i i
2011/10/11
page 181
i i

181

Assuma agora que S(x, t) = φ(x)−t, isto significa que a velocidade


de propagação da onda é
∂S
∂t 1 1
− = = .
k∇Sk k∇Sk k∇φk
Como já vimos antes no caso do plano, se o princı́pio de Huygens
é verdadeiro para φ então k∇φk = 1.
Sendo assim, assumir que S(x, t) é da forma φ(x) − t é assumir
que a velocidade de propagação da frente de onda é igual a 1. Se
desejássemos analisar uma situação em que a velocidade da frente
de onda é w então deverı́amos tentar encontrar S do tipo S(x, t) =
φ(x) − wt.
Neste caso, é fácil ver que a equação que descreve tal S é
p
k∇Sk = w.

Fica portanto justificado porque é bastante comum quando bus-


camos encontrar soluções da equação de Hamilton-Jacobi tentar en-
contrar soluções da forma S(q, t) = S(q) − wt.
Vamos analisar agora a propagação de ondas de um ponto de vista
bastante geral. Vamos descrever a lei fı́sica que S(x, t) deve satisfazer.
O módulo do vetor velocidade da propagação da onda deve sa-
tisfazer uma lei que é chamada de propriedade constitutiva do meio
contı́nuo. Essa lei, que como veremos a seguir é bastante natural,
envolve uma função H0 (x, p), onde x ∈ Rn , (mas definida apenas
para valores unitários, ou seja p ∈ Rn , kpk = 1) que vai descrever
propriedades microscópicas do meio. A lei determina que o módulo
do vetor velocidade de propagação da onda
∂S
∂t

k∇Sk
satisfaça !
∂S
∂t ∇S
− = H0 x, . (9.1)
k∇Sk k∇Sk
A equação diferencial parcial acima estabelece uma dependência
de ∂S ∇S
∂t em x e no vetor unitário k∇Sk . Esta dependência é estabele-
cida por H0 e expressa uma lei agindo a nı́vel local (microscópico)

i i

i i
“mec˙New”
i i
2011/10/11
page 182
i i

182 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

no sistema em consideração. H0 vai descrever a falta de homogenei-


dade e anisotropia (ou não) que existe no meio. Esta lei local (9.1)
vai determinar propriedades globais (macroscópicas) do sistema (por
exemplo a forma das frentes de onda a partir de uma perturbação
inicial em um certo ponto do meio) como veremos a seguir.
Através de considerações de natureza fı́sica e geométrica é natural
agora estabelecer que H seja homogênea na segunda variável, ou seja,
que
H(x, λp) = λH0 (x, p). (9.2)

Por exemplo, se estivermos analisando uma métrica Riemamnni-


ana < , > como Hamiltoniano, é mais natural neste caso, considerar
√ R
H = < , > em vez de H =< , >. Desta maneira a integral γ Hdt
de uma curva γ depende apenas do traço da curva (dos pontos da
curva) e não da parametrização utilizada.
∀ λ ∈ R, ou seja que para um vetor não unitário, H tem uma
dependência linear no comprimento do vetor p. Sendo assim a partir
de (9.1), a equação constitutiva do meio para S(x, t) que descreve a
evolução de uma frente de onda torna-se

∂S ∇S ∂S
+ k∇SkH0 (x, )= + H(x, ∇S) = 0. (9.3)
∂t k∇Sk ∂t

Esta equação foi denominada anteriormente (Definição 26, Seção


8, Capı́tulo 3 [L]) de equação de Hamilton-Jacobi.
O Hamiltoniano H desempenha portanto na Mecânica Hamilto-
niana o papel da lei constitutiva do meio na propagação de frentes
de onda.
Se S(x, t) for da forma S(x, t) = φ(x) − t, então a equação acima
torna-se
∂S
0= + H(x, ∇S) = −1 + H(x, ∇φ),
∂t
ou seja H(x, ∇φ) = 1.
Esta equação foi denominada em (3.13) na Seção 8, Capı́tulo 3
[L], de equação de Hamilton-Jacobi autônoma.
Como dissemos antes, no caso isotrópicop e homogêneo, devemos
considerar a métrica Euclidiana H(x, p) = p21 + p22 e então teremos

i i

i i
“mec˙New”
i i
2011/10/11
page 183
i i

183

a equação
s 2  2
∂S ∂S ∂S
− = H(x, ∇S) = + .
∂t ∂x1 ∂x2

Se S(x, t) = φ(x) − t, então a equação acima significa


!2 !2
∂φ ∂φ
1= + .
∂x1 ∂x2

A conclusão portanto é que a equação constitutiva


∂S
0= + H(x, ∇S)
∂t
é apenas uma descrição geral do princı́pio de Huygens e determina
uma equação do tipo Hamilton-Jacobi. p
Se H no caso bidimensional é dado por H(x, p) = p21 + p22 , então
esta última equação é a equação da eikonal.
Sendo assim a equação de Hamilton-Jacobi, neste caso particu-
lar, expressa a lei constitutiva do meio e esta equação determina a
propagação de frentes de onda num meio homogêneo e anisotrópico.
Podemos extrapolar o raciocı́nio acima e pensar que o Hamilto-
niano H(x, p) determina uma lei constitutiva no espaço da variável
x (de configuração), e que a equação de Hamilton-Jacobi descreve
frentes de onda de soluções do sistema mecânico.
A dependência de H0 (x, p) em p caracteriza a anisotropia do meio.
Definição 9.3. No caso em que H0 (x, p) não depende de p, o meio
é dito isotrópico.
Definição 9.4. Se H0 (x, p), por sua vez não depende de x, dizemos
que o meio é homogêneo.
Exemplo 9.3. Seja p o Hamiltoniano H(q, p) = a(q)p21 + 2c(q)p1 p2 +
2
b(q)p2 (ou H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22 ), q = (x1 , x2 ), p =
(p1 , p2 ), e suponha que exista solução da forma S(q, t) = S(q)−t para
a EDP de Hamilton-Jacobi associada, então
∂S ∂S p
0 = −1 + H(q, p) = + H(q, p) = + H(q, p)
∂t ∂t

i i

i i
“mec˙New”
i i
2011/10/11
page 184
i i

184 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

vai descrever em geral a evolução de frentes de onda no plano em um


meio anisotrópico e não homogêneo.
Note que no caso de propagação de ondas num meio contı́nuo, por
causa de (9.2), o H(q, p) deve ser
q
H(q, p) = a(x)p21 + 2c(x)p1 p2 + b(x)p22 ,

mas como vimos na equação acima, tanto faz tomar a raiz quadrada
ou não, para fins de calcular a equação de Hamilton-Jacobi.
Voltaremos a analisar este exemplo em breve.

Acreditamos que neste momento tenha ficado transparente a rela-


ção do princı́pio de Huygens com a Mecânica Hamiltoniana, em par-
ticular com a equação de Hamilton-Jacobi. A propagação de frentes
de onda é a inspiração principal para este ponto de vista da Mecânica
Clássica.
Uma boa justificativa porque os raios de luz podem ser inter-
pretados como geodésicas aparece na Observação 9.1 e subsequente
conclusão no fim da próxima seção.
A questão relevante do ponto de vista Fı́sico é a seguinte: consi-
dere um sistema Hamiltoniano definido por H(q, p) e

(q(t), p(t)) = (x1 (t), x2 (t), p1 (t), p2 (t))

solução do problema mecânico. Desejamos analisar a partir de uma


frente de onda de condições iniciais de posição e velocidade (q, p) =
(q(s), p(s)) = (x1 (s), x2 (s), p1 (s), p2 (s)), s ∈ (a, b), a evolução desta
frente de onda com o tempo t segundo o sistema mecânico. Isto é,
desejamos descobrir a função

(q(s, t), p(s, t)) = (x1 (s, t), x2 (s, t), p1 (s, t), p2 (s, t)) =

= (xs1 (t), xs2 (t), ps1 (t), ps2 (t))


que determina a posição da condição inicial

(q(s), p(s)) = (x1 (s, 0), x2 (s, 0), p1 (s, 0), p2 (s, 0))

após decorrido tempo t.

i i

i i
“mec˙New”
i i
2011/10/11
page 185
i i

185

Em outras palavras gostarı́amos de determinar a evolução tem-


poral de um feixe (uma frente de onda) de condições iniciais. Como
veremos a seguir, a Mecânica Hamiltoniana permite tal tratamento.
Vamos agora analisar a evolução de frentes de onda de condições
iniciais no espaço de fase da Mecânica Hamiltoniana.
Considere um Hamiltoniano H, por exemplo
2 2
1X 2 1X 2
H(q, p) = U (q) + pi = U (x1 , x2 ) + p (9.4)
2 i=1 2 i=1 i

sendo assim, a equação


!
∂S ∂S ∂S
0= + H q, = + H(q, ∇S)
∂t ∂q ∂t

de Hamilton-Jacobi, obtida anteriormente na Mecânica Hamiltoniana


é análoga à equação que descreve a evolução de uma onda em um meio
contı́nuo.
Note que para um sistema mecânico em geral da forma (9.4), a
expressão (9.2) não é verdadeira.
Supondo por separação de variáveis que S é da forma S(q, t) =
φ(q)−t, então a equação diferencial parcial F = 0 associada à equação
de Hamilton-Jacobi é
1
0 = F (x1 , x2 , φ, p1 , p2 ) = U (x1 , x2 ) + (p21 + p22 ) − 1 =
2
 
1 ∂φ 2 ∂φ 2
U (x1 , x2 ) + (( ) + ) − 1 = H(x1 , x2 , p1 , p2 ) − 1,
2 ∂x1 ∂x2
onde
∂φ ∂φ
p1 = , p2 = .
∂x1 ∂x2
Vamos voltar a considerar um Hamiltoniano qualquer a partir
deste momento.
A equação diferencial parcial não linear de Hamilton-Jacobi

H(q, p) − 1 = H(q, ∇φ) − 1 = 0,

i i

i i
“mec˙New”
i i
2011/10/11
page 186
i i

186 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

pode ser resolvida através do método das caracterı́sticas como foi


desenvolvido na Seção 7. As equações das caracterı́sticas para a F
definida acima neste caso são
∂F ∂H
x′1 = =
∂p1 ∂p1
∂F ∂H
x′2 = =
∂p2 ∂p2
∂F ∂F
φ ′ = p1 + p2
∂p1 ∂p2
∂F ∂H
p′1 = − =−
∂x1 ∂x1
∂F ∂H
p′2 = − =− (9.5)
∂x2 ∂x2
As primeiras duas e as últimas duas equações acima definem as
soluções do campo de vetores Hamiltoniano no plano (x1 , x2 , p1 , p2 ).
Logo as caracterı́sticas de equação de Hamilton-Jacobi projetadas
no espaço (x1 , x2 , p1 , p2 ) são as soluções das equações de Hamilton.
O Teorema de Hamilton-Jacobi (Teoremas 22 e 23), que apre-
sentamos na Seção 9 [L], afirma que se pode passar diretamente da
solução completa para as caracterı́sticas da EDP de Hamilton-Jacobi.
A terceira equação de (9.5) afirma que as caracterı́sticas (soluções
da equação de Hamilton) (x1 (t), x2 (t), p1 (t), p2 (t)) são tais que a
função
φ(x1 (t), x2 (t))
satisfaz
2 2
dφ X X
= pi Hpi = pi Fpi .
dt i=1 i=1

Note que o resultado sobre caracterı́sticas acima é válido para


um Hamiltoniano qualquer H(q, Pn p) e não apenas para Hamiltonianos
naturais do tipo H(q, p) = 12 i=1 p2i + V (q).
O método que vamos descrever a seguir vai determinar a evolução
de uma frente de onda (q(s, t), p(s, t)) a partir de (q(s), p(s)). Desta
maneira poderemos determinar a evolução temporal de feixes de con-
dições iniciais do problema mecânico (ver Propriedade Importante

i i

i i
“mec˙New”
i i
2011/10/11
page 187
i i

187

a seguir). Esta questão é fundamental em Mecânica Estatı́stica e


Mecânica Quântica (ver [OA]). A propriedade importante descrita a
seguir, não é para um sistema mecânico qualquer, mas apenas para
um sistema associado a uma métrica Riemanniana. Lembre que é
muitas vezes possı́vel transformar por mudança de parametro tempo-
ral um problema mecânico em um problema geométrico (ver Teorema
20 e Corolário 21, Capı́tulo 2 [L]).
Propriedade Importante: Seja o Hamiltoniano

H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22

q = (x1 , x2 ), p = (p1 , p2 ), e seja S(q, t) = φ(q)−t solução da respectiva


equação de Hamilton-Jacobi
!
∂S ∂S
0= + H q, ,
∂t ∂q

ou seja φ satisfaz  
∂φ
1 = H q, ,
∂q
e a condição inicial (ou de fronteira) (q(s), φ(s)) = (q(s), 1).
Então S(x1 , x2 , t0 ) = S(x, t0 ) = 0 vai determinar para cada t0
fixo, a posição de q(s, t1 ) = (x1 (s, t1 ), x2 (s, t1 )), t1 = t1 (t0 ), das
curvas
(xs1 (t), xs2 (t)),
projeção no plano (x1 , x2 ) das curvas (xs1 (t), xs2 (t), ps1 (t), ps2 (t)), solução
do campo Hamiltoniano começando no tempo t = 0 em

(x1 (s), x2 (s), p1 (s), p2 (s)),

s ∈ (a, b). Note que p(s) = (p1 (s), p2 (s)) deve satisfazer a Observação
7.2 da Seção 7.
A Propriedade Importante segue do seguinte fato:

S(x, t) = S(x1 , x2 , t) = S((x1 (s, t), x2 (s, t), t)

depende apenas de t (linearmente em t de fato) e as caracterı́sticas


são as soluções do problema mecânico como vimos acima.

i i

i i
“mec˙New”
i i
2011/10/11
page 188
i i

188 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

Seja φ(x1 , x2 ) solução da equação de Hamilton-Jacobi


0 = H(x1 , x2 , p1 , p2 ) − 1 = H(q, ∇φ(p)) − 1 = F (x1 , x2 , φ, p1 , p2 ),
que será analisada a seguir pelo método das caracterı́sticas.
A função φ(x1 (s, t), x2 (s, t)) satisfaz
d (φ(x1 (s, t), x2 (s, t)) ∂φ ∂φ
= x1 s′ (t) + x2 s′ (t) =
dt ∂x1 ∂x2
p1 Hp1 + p2 Hp2 = p1 (2a(q)p1 + 2c(q)p2 ) + p2 (2c(q)p1 + 2b(q)p2 ) =
2H(q(s, t), p(s, t)).
É fácil ver pela Observação 46 que para o Hamiltoniano
H(q, p) = a(q)p21 + 2c(q)p1 p2 + b(q)p22 ,
a condição
F (x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) =
= H(x1 (s), x2 (s), p1 (s), p2 (s)) − 1 = 0
significa que H(q(s, 0), p(s, 0)) = 1 para todo s.
Pelo Teorema de conservação do Hamiltoniano (Teorema 2, Capı́-
tulo 3 [L]) H(q(s, t), p(s, t)) é constante igual a 1. Logo, para todo s
d (φ(x1 (s, t), x2 (s, t))
= 2.
dt
Concluı́mos portanto que
dS(x, t) d(φ(x) − t)
= = 2 − 1 = 1.
dt dt
Se assumirmos φ(x1 (s, 0), x2 (s, 0)) = φ(x1 (s), x2 (s)) = 1, ∀s ∈
(a, b) então S(x1 (s, t), x2 (s, t), t) = 1 + t.
Fica assim justificada a afirmação da Propriedade Importante
acima enunciada. Em breve apresentaremos exemplos em que uti-
lizaremos a propriedade acima descrita (Exemplos 9.5, 9.6 e 9.7).
Considere agora o caso particular em que H(x, p) = p21 + p22 , S
solução da equação da eikonal
 2  2
∂S ∂S
+ =1
∂x1 ∂x2

i i

i i
“mec˙New”
i i
2011/10/11
page 189
i i

189

com a condição inicial da frente de onda na posição

q(s) = (x1 (s), x2 (s)) ∈ R2

dada. Então, pela Propriedade Importante φ(x) − t = S(x, t) = 0,


vai descrever implicitamente a posição espacial da frente de onda no
tempo t1 .
Vamos considerar no tempo t = 0, condições iniciais (x1 (s), x2 (s))
e perguntar a posição desta frente de onda após decorrido tempo t.
Vamos utilizar o resultado mencionado pela Propriedade Importante
visto anteriormente.
Vamos tentar resolver este problema através dos dois métodos
desenvolvidos antes: o método da integral completa e o método das
caracterı́sticas.
Primeiro vamos aplicar o método das caracterı́sticas.
Usando a notação da Seção 7, a Equação diferencial parcial de 1a
ordem não linear !2 !2
∂φ ∂φ
+ =1
∂x1 ∂x2

pode ser expressa como 0 = F (x1 , x2 , φ, p1 , p2 ) = 1 − (p21 + p22 ) =


1 − (φ2x + φ2y ) onde p1 = φx e p2 = φy .
Vamos analisar neste caso a expressão das equações das carac-
terı́sticas da EDP, F (x1 , x2 , φ, p1 , p2 ) = 0 . Neste caso, a equação

p21 + p22 − 1 = 0,
ou seja, neste caso F (p1 , p2 ) = p21 + p22 − 1.
Usando a expressão das equações das caracterı́sticas obtemos

dx1
= 2p1
dt
dx2
= 2p2
dt

= 2p21 + 2p22
dt
dp1
=0
dt

i i

i i
“mec˙New”
i i
2011/10/11
page 190
i i

190 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

dp2
= 0. (9.6)
dt
Observação 9.2. Note que no caso acima, o vetor gradiente da
frente de onda ∇φ = p é colinear com x′ .
Observação 9.3. Das equações das caracterı́sticas acima, as carac-
terı́sticas (x1 (t), x2 (t), φ(t), p1 (t), p2 (t)) devem portanto satisfazer
!
d2 x1 d dx1 d
2
= = (2pi ) = 0
dt dt dt dt

e !
d2 x2 d dx2 d
= = (2p2 ) = 0.
dt2 dt dt dt
Note que os valores p1 (t) e p2 (t) são constantes.
Da equação acima segue que x1 (t) e x2 (t) são lineares em t, ou
seja, x1 (t) = 2p1 t + c1 e x2 (t) = 2p2 t + c2 .
A conclusão é que a projeção das caracterı́sticas no plano x =
(x1 , x2 ) são linhas retas.
Finalmente, φ′ (t) = 2p21 + 2p22 = 2(p21 + p22 ) = 2 × 1 = 2, pois por
hipótese p21 + p22 = 1.
Logo φ(t) = 2t + c3 .
Sendo assim, concluı́mos finalmente que as caracterı́sticas são re-
tas em R5 .
Vamos agora usar os resultados obtidos anteriormente para cal-
cular soluções da EDP via o método das caracterı́sticas.
Exemplo 9.4. Vamos calcular a solução da equação diferencial par-
cial !2 !2
∂φ ∂φ
+ = 1,
∂x1 ∂x2
sujeita às condições

(x1 (s), x2 (s), φ(s), p1 (s), p2 (s)) = (cos s, sin s, 1, cos s, sin s).

Observe que p1 (s) e p2 (s) são compatı́veis com (x1 (s), x2 (s), φ(s))
como é necessário assumir no problema em consideração (Seção 7).

i i

i i
“mec˙New”
i i
2011/10/11
page 191
i i

191

As caracterı́sticas já foram calculadas acima, e portanto as carac-


terı́sticas (xs1 (t), xs2 (t), φs (t), ps1 (t), ps2 (t)) obtidas a partir das condições
iniciais
(cos s, sin s, 1, cos s, sin s),
são
xs1 (t) = 2p1 (s)t + cos s = 2 cos(s)t + cos(s)
xs2 (t) = 2p2 (s)t + sin s = 2 sin(s)t + sin(s)
φs (t) = 2t + 1
ps1 (t) = cos s
ps2 (t) = sin s.

Observação 9.4. Note que a partir de p(s) = (p1 (s), p2 (s)) fixado, o
vetor ps (t) = (ps1 (t), ps2 (t)) não se altera, ou seja neste caso particular,
o momento se conserva.
Antes de expressar a função φ nas coordenadas (x1 , x2 ), devemos
relacionar as coordenadas (s, t) e as coordenadas (x1 , x2 ).
Ora, (x1 (s, t), x2 (s, t)) = (cos s(2t+1), sin s(2t+1)), logo x21 +x22 =
cos s(2t + 1)2 + sin2 s(2t + 1)2 = (2t + 1)2 .
2

Portanto, q
1 
t= x21 + x22 − 1
2
e como x1 = cos s(2t + 1) então
x1 x1
s = arccos = arccos p 2 .
2t + 1 x1 + x22

Em conclusão
q !
x1 1
(s(x1 , x2 ), t(x1 , x2 )) = arccos p 2 , x21 + x22 −1 .
x1 + x2 2
2

Como φ(s, t) = 2t + 1, concluı́mos que a solução φ(x p1 , x2 ) satis-


fazendo as condições iniciais pré-fixadas é φ(x1 , x2 ) = x21 + x22 .
Sugerimos ao leitor calcular φ2x1 + φ2x2 para testar e certificar-se
que realmente a φ acima descrita satisfaz φ2x1 + φ2x2 = 1.

i i

i i
“mec˙New”
i i
2011/10/11
page 192
i i

192 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

A evolução de (q(s, t), p(s, t)) a partir da frente de onda no tempo


t = 0, dada por (q(s), p(s)) = (cos(s), sin(s), cos(s), sin(s)) pode ser
seguida para tempos t subsequentes através de φ, isto é, φ(q1 , q2 ) = t
determina a posição no tempo t da frente de onda acima considerada.
A conclusão neste caso, é que as frentes de ondas são cı́rculos com
o mesmo centro.
Exemplo 9.5. Vamos agora tentar encontrar a solução da equação
diferencial parcial φ2x +φ2y = 1 através do método da solução completa.
Devemos tentar primeiramente encontrar uma famı́lia f a,b (x1 , x2 ) a
dois parâmetros (a, b) ∈ R2 de soluções de φ2x + φ2y = 1.
Vamos tentar encontrar a solução pelo método de separação de
variáveis. Suponhamos que φ possa ser escrita da forma φ(x1 , x2 ) =
f (x1 ) + g(x2 ).
Substituindo φ na equação φ2x1 + φ2x2 = 1, obtemos f ′ (x1 )2 +
g (x2 )2 = 1.

Como f ′ (x1 )2 = 1−g ′ (x2 )2 , então f ′ (x1 ) não depende de x1 . Logo


f (x1 ) é constante. Da mesma forma g ′ (x2 ) também é constante.

Como f ′ (x1 )2 + g ′ (x2 )2 = 1, podemos escrever f ′ (x1 ) = cos a e



g (x2 ) = sin a.
Portanto, f (x1 ) = x1 cos a + c1 e g(x2 ) = x2 sin a + c2 .
Finalmente concluı́mos que
f (x1 , x2 , a, b) = f (a,b) (x1 , x2 ) = x1 cos a + x2 sin a + b
é uma famı́lia completa de soluções da equação diferencial parcial
φ2x1 + φ2x2 = 1.
Exemplo 9.6. Vamos agora encontrar a solução de φ2x1 + φ2x2 = 1
com as condições iniciais (x1 (s), x2 (s), φ(s)) = (cos s, sin s, 1), 0 ≤
t ≤ 2π.
Como vimos antes no parágrafo sobre envoltórias, primeiro deve-
mos encontrar (a(s), b(s)) solução de
1 = z(s) = x1 (s) cos a(s) + x2 (s) sin a(s) + b(s)
= cos s cos a(s) + sin s sin a(s) + b(s) (9.7)
e
∂f ′ ∂f ′
0 = z ′ (s) = x (s) + x (s) = (− cos a(s) sin s + sin a(s) cos s).
∂x1 1 ∂x2
(9.8)

i i

i i
“mec˙New”
i i
2011/10/11
page 193
i i

193

É fácil derivar que a(s) = s, b = 0 são as soluções do sistema


(9.7) e (9.8).
Devemos portanto considerar a famı́lia a um parâmetro s, dada
por

f t (x1 , x2 ) = x1 cos a(s) + x2 sin a(s) + 0 = x1 cos s + x2 sin s.

A envoltória desta famı́lia nos permitirá obter a solução z(x1 , x2 ).


Fixe (x1 , x2 ) ∈ R2 , vamos encontrar quem é s(x1 ,x2 ) que satisfaz

∂f
0= = −x1 sin s + x2 cos s
∂s
e f (x1 , x2 ) = x1 cos s + x2 sin s.
Seja θ e r > 0 tal que x1 = r cos θ e x2 = r sin θ.
Logo

0 = −x1 sin +x2 cos s = −r cos θ sin s + r sin θ cos s = −r sin(s − θ),

implica que
x2
s(x1 ,x2 ) = arctan .
x1
Portanto, u(x1 , x2 ) = x1 cos s(x1 ,x2 ) + x2 sin s(x1 ,x2 ) =

x2 + x2
q
x1 x2
= x1 + x2 = p1 2 2 2 = x21 + x22 .
r r x1 + x2

Sendo assim obtivemos a solução da equação da eikonal com a


condição inicial (q(s), p(s), 1) utilizando o método da solução com-
pleta.
A partir da solução da equação de Hamilton-Jacobi u, sabemos
pela Propriedade Importante que podemos determinar a evolução das
frentes de onda de soluções do sistema mecânico (q(s, t), p(s, t)) a
partir de condições iniciais (q(s), p(s)).

Exemplo 9.7. Seja a matriz


 
ã c̃
M= ,
c̃ b̃

i i

i i
“mec˙New”
i i
2011/10/11
page 194
i i

194 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

positiva definida e que define uma métrica Riemanniana

L = hM v, vi = ãv12 + 2c̃v1 v2 + b̃v22 .

Neste caso, (ver (3.1) na Seção 2, Capı́tulo 3 [L])

1
H(x, p) = hM −1 p, pi
4
é o Hamiltoniano associado ao Lagrangiano L dado pela métrica Ri-
emanniana (com coeficientes ã, b̃, c̃ constantes). Note que 41 M −1
também é positiva definida.
Sendo assim, se S(q, t) é da forma S(q) − t, a equação

∂S ∂S 1
0= + H(x, ∇S) = + hM −1 ∇S, ∇Si =
∂t ∂t 4
  r
1 −1 1
−1 + M ∇S, ∇S = −1 + hM −1 ∇S, ∇Si
4 4
vai descrever a evolução de frentes de onda em um meio homogêneo
mas não isotrópico.
Note que H também define uma forma quadrática positiva defi-
nida, pois se M é positiva definida, M −1 também é.
Das equações das caracterı́sticas obtemos que p(t), q(t) são cons-
tantes pois a equação diferencial definida por F não depende de z, x1 , x2 .
Sendo assim o vetor normal às distintas superfı́cies de nı́vel (evo-
luindo no tempo) a partir de um vetor inicial dado é constante.
Se assumirmos por exemplo que
 
1 −1 1 0
M = ,
4 0 1/4

ou seja que  
1/4 0
M= ,
0 1
então a equação de Hamilton-Jacobi associada é
 2  2
∂S 1 ∂S
0 = −1 + + .
∂x1 4 ∂x2

i i

i i
“mec˙New”
i i
2011/10/11
page 195
i i

195

p Uma solução de tal equação já foi considerada no exemplo S(x, t) =


x21 + 4x22 − t.
Neste caso um distúrbio inicial no ponto (0,0) vai gerar frentes de
onda com forma de elipses. Um propriedade macroscópica, a forma
da frente de onda, é então determinada por uma propriedade mi-
croscópica.
S descreve a evolução em um meio homogêneo anisotrópico.
Exemplo 9.8. Uma métrica Riemanniana pode ter os coeficientes

a(x1 , x2 ), b(x1 , x2 ), c(x1 , x2 )

dependendo da variável (x1 , x2 ). Considerando L o Lagrangiano as-


sociado à métrica Riemanniana

L = ã(x1 , x2 )p21 + 2c̃(x1 , x2 )p1 p2 + b̃(x1 , x2 )p22 ,

e seu correspondente Hamiltoniano H (ver (3.1) Seção 2, Capı́tulo 3).


Então a equação constitutiva natural ao problema é dado por
∂S
− = H(x, ∇S)
∂t
onde
H(x, p) = H(x1 , x2 , p1 , p2 ) =
1 b̃(x1 , x2 )p21 − 2c̃(x1 , x2 )p1 p2 + ã(x1 , x2 )p22
.
4 ãc̃ − b̃2
Para simplificar a notação, podemos reescrever a expressão acima
considerando
1 b̃ 1 −c̃ 1 ã
a= , c= , b= .
4 ãb̃ − c̃2 4 ãb̃ − c̃2 4 ãb̃ − c̃2
Obtemos assim o Hamiltoniano

H(x, p) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 . (9.9)

Supondo S(x, t) = t − φ(x)


√ temos então a equação de Hamilton-
Jacobi para tal H (ou para H, tanto faz)

1 = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 ,

i i

i i
“mec˙New”
i i
2011/10/11
page 196
i i

196 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

onde p1 = φx1 , p2 = φx2 .


Sendo assim a equação constitutiva do meio (ou seja a equação
de Hamilton-Jacobi) determina a equação diferencial parcial 0 =
F (x1 , x2 , φ, p1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 − 1,
onde p1 = φx1 e p2 = φx2 .
Note que F não depende de φ, mas depende neste caso de x1 e
x2 . Sendo assim, as equações das caracterı́sticas não determinarão
mais (como no Exemplo 9.4) que p(t) é constante. Isto se deve à
dependência de H(x, p) em x e em p. A falta de homogeneidade e
isotropia do meio é descrita pela métrica Riemanniana L (ou mais
precisamente pela métrica Riemanniana H). Note que neste caso
não estamos considerando nenhum termo correspondente à energia
potencial. O Hamiltoniano neste caso é dado pelo módulo ao quadra-
dado do vetor velocidade considerando a norma descrita pela métrica
Riemanniana. Lembre que para fins de cálculo do traço das curvas
soluções do sistema (ver Seção 7), tanto faz tomar a raiz quadrada
ou não na expressão do Hamiltoniano acima.
Afirmamos que as geodésicas desta métrica Riemanniana nas co-
ordenadas (q, p) desempenharão o papel das caracterı́sticas, pois a
equação das caracterı́sticas para

0 = F (x1 , x2 , z, p1 , p2 ) = a(x1 , x2 )p21 + 2c(x1 , x2 )p1 p2 + b(x1 , x2 )p22 − 1

são
∂F
x′1 (t) = = 2ap1 + 2cp2
∂p1
∂F
x′2 (t) = = 2cp1 + 2bp2
∂p2
∂F
p′1 (t) = −
∂x1
∂F
p′2 (t) = − .
∂x2

e determinam as equações das equações geodésicas. Esta afirmação


foi demonstrada anteriormente para um Hamiltoniano qualquer, isto
é, mostramos que as caracterı́sticas são as trajetórias do sistema Ha-
miltoniano (que no caso em consideração só possui energia cinética).

i i

i i
“mec˙New”
i i
2011/10/11
page 197
i i

197

As geodésicas são portanto as caracterı́sticas da equação diferen-


cial parcial
0 = F (x1 , x2 , z, p1 , p2 ) = a(x1 , x2 )p21 +2c(x1 , x2 )p1 p2 +b(x1 , x2 )p22 −1.
A velocidade da luz é finita e após uma normalização podemos
supor que esta velocidade é igual a 1, sendo assim, fixado um Pponto
inicial q0 onde no tempo 0 se acende a luz, a frente de onda T é o
conjunto dos pontos de plano (x1 , x2 ) que distam T de q0 .
As envoltórias por raios de luz (ou por geodésicas) determinam as
frentes de ondas num cristal conforme Observação anterior.
A conclusão final é que as geodésicas fazem o papel dos raios de
luz e das caracterı́sticas. Esta conclusão traduz fielmente a relação
entre a Mecânica Hamiltoniana e a propagação de frentes de onda.
Note
P que no caso da métrica Riemanniana da esfera, a frente de
onda T emitida a partir de um polo q0 , após um certo tempo T0
irá colapsar no outro polo (ver Figura 3.10 b)).
Este fenômeno, que nem sempre ocorre, é denominado de criação
de cáusticas. Em termos matemáticos dizemos que o aparecimento
das cáusticas está associado à existência de pontos conjugados. Refe-
rimos o leitor a [MC3] para maiores considerações sobre este tópico.

Exercı́cio: No caso da métrica hiperbólica


 
1 x˙1 2 x˙2 2
+ ,
2 x22 x22
∂L x˙1
o momento p1 = ∂ x˙1 = x22
6= x˙1 . Calcule a equação de Hamilton-
Jacobi associada.

Observação 9.5. Em geral, para um H como acima (9.9), oriundo


de uma métrica Riemanniana
(x′1 , x′2 ) = (2ap1 + 2cp2 , 2cp1 + 2bp2 ). (9.10)
Logo em geral x′ e p′ não são colineares.
No caso da métrica Euclidiana, no entanto, x e p são colineares
(ver Observação 48).

i i

i i
“mec˙New”
i i
2011/10/11
page 198
i i

198 [CAP. 9: O PRINCÍPIO DE HUYGENS EM MECÂNICA HAMILTONIANA

Observação 9.6. As equações das caracterı́sticas afirmam, no caso


de uma métrica Riemanniana geral, as geodésicas são asPcaracterı́s-
ticas (projetadas em (x1 , ..., xn )). Uma frente de onda t causada
por uma perturbação pontual em q0 é constituı́do pelo conjunto dos
pontos que distam t de q0 .
Note que p é perpendicular à frente de onda, pois ∇S = p, mas o
vetor q̇ não necessariamente (se o meio não for homogêneo e aniso-
trópico) conforme mostra a expressão (9.10) na Observação 9.5 (ver
Figura 8.3).

Em conclusão, podemos afirmar que as considerações feitas ante-


riormentes sobre raios da luz e geodésicas como geradores de frentes
de onda, foi a inspiração para o ponto de vista de Hamilton de ten-
tar analisar a Mecânica Clássica através de um ponto de vista de
perturbação por frentes ondas de um meio contı́nuo.

i i

i i
“mec˙New”
i i
2011/10/11
page 199
i i

Capı́tulo 10

A Equação da Onda

O que chamamos de raio de luz nas seções anteriores, correspondia


a geodésicas de uma métrica Riemanniana. Na verdade, uma carac-
terı́stica importante do raio de luz fı́sico real é o seu caráter ondu-
latório, o qual não foi considerado na nossa análise anterior [Lu].
A luz é um fenômeno eletromagnético, que obedece as equações
de Maxwell (ver [Go]). A partir desta equação, pode se mostrar que
a luz obedece a equação da onda em R3 .
Abstraindo o caráter ondulatório da luz, conseguimos nas seções
anteriores entender o relacionamento da Ação com as frentes de onda
e as geodésicas.
Vamos descrever agora brevemente a luz (por abuso de linguagem
vamos chamar de raio de luz) como uma onda e relacionar o que foi
descrito anteriormente com este novo ponto de vista (ver Observação
10.2 ao fim desta seção).
Referimos o leitor para [Go] para referências gerais sobre o as-
sunto.
Para isto necessitaremos considerar a equação da onda em R3

∂ 2 φ ∂ 2 φ ∂ 2 φ η2 ∂ 2 φ
+ + − 2 2 =0 (10.1)
∂x21 ∂x22 ∂x23 c ∂t

onde η é uma constante.

199

i i

i i
“mec˙New”
i i
2011/10/11
page 200
i i

200 [CAP. 10: A EQUAÇÃO DA ONDA

A solução φ(x1 , x2 , x3 , t) vai descrever a evolução da onda em um


meio com ı́ndice de refração η. O valor c é a velocidade da luz que é
uma constante universal.
Vamos primeiro tentar entender o que representa enfim um raio
de luz no tempo t0 e relacionar tal conceito com a equação acima. O
raio de luz (individualizado) no tempo t0 vai ser representado por

φ(x1 , x2 , x3 ) = φ(x1 , x2 , x3 , t0 ) =

= φ0 ei ( < x , r >− w t0 ) = φ0 ei ( h ( x1 ,x2 ,x3 ) , ( r1 ,r2 ,r3 ) i − w t0 ) , (10.2)


onde φ0 é uma constante, r = (r1 , r2 , r3 ) é um vetor constante e w
a constante que vai determinar a frequência da oscilação temporal.
Existe uma relação entre w e r que será descrita em breve.
Vamos agora tentar explicar ao leitor porque é natural considerar
tal φ para descrever um raio de luz (individualizado).
φ0 determina a amplitude do raio de luz.
O raio de luz “individualizado”descrito acima é tal
X
= { (x1 , x2 , x3 ) | φ(x1 , x2 , x3 , t0 ) = c}
c

t0 , c ∈ R, determina planos perpendiculares à direção (r1 , r2 , r3 ).


Um raio de luz no tempo t0 é portanto descrito por uma série de
planos, por isso é também denominado de uma onda plana.
Note que para um t0 fixo o raio de luz contém uma informação
em todo o espaço de posições R3 (são os vários planos de nı́vel).
O leitor pode observar que qualquer função g(α), onde

α = h(x1 , x2 , x3 ), (r1 , r2 , r3 )i =< x, r >

também determinaria planos como superfı́cies de nı́vel.


Para descrever o raio de luz, assumimos também uma periodi-
cidade espacial (o raio de luz tem um caráter ondulatório) de φ.
Isto explica o termo ei <x,r> na expressão acima para φ. Em vez
de usar senos e cossenos estamos usando a notação complexa para
ei h (x1 ,x2 ,x3 ),(r1 ,r2 ,r3 ) i que é mais compacta. A periodicidade espacial
de φ vai depender do módulo

.
krk

i i

i i
“mec˙New”
i i
2011/10/11
page 201
i i

201

Vamos denominar este valor do perı́odo de fase ótica.


Sendo assim, para t0 fixo, o valor de φ se repete espacialmente na

direção r com perı́odo krk .
Esta periodicidade espacial vai acontecer também de maneira tem-
poral para x fixo quando variarmos t0 . Isto é expresso pelo termo
ei wt0 na expressão φ = φ0 ei(hx,ri−wt) = φ0 eihx,ri e−iwt . Logo para x
fixo, de tempos em tempos (com frequência w) repetem-se os valores
de φ.
Fica assim descrito de maneira geral como devemos entender o
raio de luz individualizado φ(x, t) = φ0 ei(hx,ri−wt) . Para cada w e
r fixos, associamos um raio de luz φ = φr,w . Tal φ = φ(x, t) =
φ0 ei(hx,ri−wt) é uma função que depende de (x, t).
Considere w fixo e uma função f (x) = ft0 (x) que vai descrever
um feixe da raios de luz no tempo t0 .
A variável real α = hx, ri como vimos antes vai determinar uma
periodicidade em eihx,ri = eiα e sendo assim podemos encará-lo como
um gerador de funções f (x) na variável x via Transformada de Fou-
rier. Ou seja f (x) vai ser uma combinação de φr para diferentes r (ou
seja um feixe de raios individualizados de luz φr dado pela expressão
(10.2)). Mais precisamente, dado f (x), considere a transformada de
R
Fourier fˆ(r) tal que f (x) = fˆ(r)(ei<r,x> )dr.
Logo
Z
f (x, t) = f (x) e−i w t = ( fˆ(r)(ei<x,r> )dr)e−iwt =
Z
fˆ(r)ei(<x,r>−wt) dr (10.3)

vai representar um feixe de raios de luz (note que w é constante e


independe de r).
f é determinada pela distribuição (ver [Ju] para definição) fˆ.
O que chamamos de luz é na verdade uma combinação dos raios
de luz individuais (10.2) dados por φ0 ei(α−wt) = φ0 ei(hx,ri−wt) via
transformada de Fourier como acima.
Se fˆ é o Delta de Dirac no ponto r0 com massa φ0 , então

f (x)e−iwt = φ0 ei<x,r0 > e−iwt = φ0 ei(<x,r0 >−wt) .

Recuperamos assim o raio de luz individualizado (10.2).

i i

i i
“mec˙New”
i i
2011/10/11
page 202
i i

202 [CAP. 10: A EQUAÇÃO DA ONDA

O raio individualizado φ0 ei(α−wt) é na verdade uma abstração


do ponto de vista Fı́sico. A luz, quando observada, em geral é um
“pacote”com vários raios de luz individualizados (10.2), como aparece
em (10.3).
Para a correta definição do raio de luz, falta ainda mais uma
restrição. Vai existir uma relação entre krk e w que vai advir da
equação da onda anteriormente apresentada.
Vamos agora relacionar o raio de luz com a equação da onda. O
raio de luz fisicamente observado é também solução da equação da
onda (ver [Go]).
Substituindo o raio de luz “individualizado”φ(x, t) = φ0 ei(hr,xi− w t)
na equação da onda
η2 ∂ 2 φ
∆φ − 2 2 = 0,
c ∂t
η constante, obtemos que φ é solução da equação acima no caso em
que
ηw
krk = . (10.4)
c
Sendo assim, existe uma relação entre a periodicidade espacial krk
e a periodicidade temporal w, determinada pela equação diferencial
parcial acima.
A igualdade (10.4) acima é chamada de relação de dispersão. Fi-
nalmente, com esta relação entre w e r, o raio de luz fica precisamente
bem definido.
Como sabemos, a equação da onda acima descrita (10.1) é linear.
Sendo assim, uma combinação linear f (x)e−w i t de tais funções raio
de luz individualizados φ = φr (via Transformada de Fourier) também
vai ser solução da equação linear da onda
∂ 2 φ ∂ 2 φ ∂ 2 φ η 2 d2 φ
+ + − 2 2 = 0,
∂x21 ∂x22 ∂x23 c dt
η constante.
Fica portanto esclarecido em que sentido φ = f (x)e−i w t (um feixe
de raios de luz) é solução da equação da onda com η fixo.
Vamos agora investigar o caso em que η(x) não é constante, e é
fracamente variável (ver Observação 10.1 a seguir) com a posição x.
A ótica geométrica é o ramo da ciência interesssado em analisar
o caso em que η é fracamente variável com a posição. Uma relação

i i

i i
“mec˙New”
i i
2011/10/11
page 203
i i

203

muito interessante e importante com a equação de Hamilton-Jacobi


vai aparecer.
Considere η(x) uma função no R3 e a equação

dφ2 dφ2 dφ2 η 2 (x) d2 φ


+ + − =0 (10.5)
dx21 dx22 dx23 c2 dt2

A análise que vamos fazer neste caso corresponde aos raios de luz
em um meio não homogêneo.
Uma solução φ para a equação com η variável, não vai mais neste
caso ser uma onda plana. A solução que se busca é da forma

φ = eA(x)+i(S(x) k0 −w t) . (10.6)

w é uma constante, eA(x) vai representar a amplitude, o termo


i S(x) k0
e representa as frentes de onda espaciais (antes quando S era
da forma
S(x) = hx, ri
estas frentes de onda eram planas) e k0 é uma constante. O termo
e−i w t representa a periodicidade temporal. A(x) e S(x) tomam va-
lores reais.
Fica assim descrito de maneira esquemática a informação que nos
traz a expressão do raio de luz φ num meio em que η varia com
posição.
O problema em consideração supõe que no infinito η é constante,
ou seja, que a região em que η(x) depende de x está localizada apenas
em um aberto limitado.
Logo, para pontos x muito distantes, vale que a onda φ(x, t) se
comporta como uma onda plana. Logo, para tais pontos x, a solução
(10.6) deve ser da forma (10.3). Sendo assim, vale também a relação
de dispersão (10.4) mencionada anteriormente.
Neste caso e usando a notação acima, esta relação significa

w2
k02 = . (10.7)
c2
Vamos tentar agora relacionar a teoria descrita acima com a Te-
oria de Hamilton-Jacobi. Em particular desejamos tentar entender
melhor o papel desempenhado por S.

i i

i i
“mec˙New”
i i
2011/10/11
page 204
i i

204 [CAP. 10: A EQUAÇÃO DA ONDA

Ora ∇φ = φ∇(A + ik0 S) e ∆φ = φ[ ∆(A + ik0 S) + k ∇(A +


ik0 S) k2 ].
Esta última expressão é igual a

∆φ = φ[ ∆A + ik0 ∆S + k∇Ak2 − k02 k∇Sk2 + 2ik0 h∇A, ∇Si ].

A equação da onda (usando (10.6)) torna-se então

ik0 [ 2h∇A, ∇Si + ∆S ] φ + [ ∆A + k∇A|k2 − k02 k∇Sk2 + η 2 k02 ] φ = 0.

Como A, S são reais, a equação da onda representa

∆A + k∇Ak2 + k02 ( η 2 − k∇S k2 ) = 0

e
∆S + 2 h∇A, ∇Si = 0.
Logo, se S e A satisfazem tais equações, φ descreve um raio de
luz.
Observação 10.1. Vamos assumir agora que k02 é muito grande em
termos relativos com a parte ∆A + k∇Ak2 . Esta hipótese traduz
em termos matemáticos precisos a afirmação que “η(x) é fracamente
variável com a posição x”feita anteriormente.
Portanto, com esta hipótese,

∆A + k∇Ak2
+ (η 2 − k∇Sk2 ) = 0
k02

significa aproximadamente que η 2 − k∇Sk2 = 0, ou seja, que S sa-


tisfaz a Equação de Hamilton-Jacobi
 2  2  2
∂S ∂S ∂S
+ + = η 2 (x). (10.8)
∂x1 ∂x2 ∂x3

Esta equação é a Equação de Hamilton-Jacobi (9.3) para o Ha-


miltoniano
H(q, p) = p21 + p22 + p23 − η 2 (x) + 1. (10.9)
Sendo assim, como vimos antes a função S solução da equação
(10.8) acima, deve corresponder à Ação de um sistema mecânico.

i i

i i
“mec˙New”
i i
2011/10/11
page 205
i i

205

O termo η corresponde a falta de homogeneidade do meio no caso


dos raios de luz num cristal.
Por exemplo, se η é constante igual a 1, a partir de (10.8) determi-
namos que S deve satisfazer a equação de Hamilton-Jacobi autônoma
associada ao Hamiltoniano p21 +p22 +p23 , ou seja a equação da eikonal.
Note que uma vez que se obtém S, a função A satisfazendo

∆S + 2 h∇A, ∇Si = 0,

pode ser facilmente obtida por integração. Desta maneira, com as


hipóteses acima, obtemos a solução

φ = eA(x)+i(S(x) k0 −w t) .

Observação 10.2. O Lagrangiano associado a tal Hamiltoniano


(10.9) é
L(q, p) = 4(p21 + p22 + p23 ) + η 2 (x) − 1.
Pelo Teorema de Mauperitus (Teorema 20, Seção 7, Capı́tulo 2)
o problema mecânico associado a tal Lagrangiano, é equivalente a
considerar um Lagrangiano da forma

L̃(x1 , x2 , x3 , p1 , p2 , p3 ) = hM (x)(p1 , p2 , p3 ), (p1 , p2 , p3 )i,

onde M (x) é uma matriz positiva definida que depende da posição x.


Ou seja, as equações da equação de Hamilton do sistema (10.9) são
geodésicas (a menos de reparametrização do tempo) de uma métrica
Riemanniana L (ver Seção 6, Capı́tulo 2 [L]).

Conclusão: Concluı́mos que o S que aparece na expressão do feixe


da raios de luz φ deve ser aproximadamente igual à solução da equação
de Hamilton-Jacobi para um problema de Mecânica Clássica (se k0
for tomado bem grande). Portanto, S corresponde aproximadamente
a ação de um sistema mecânico. No limite, tomando k0 = ∞, então
S é realmente a ação de um sistema mecânico definido pelo Hamil-
toniano (10.9), como descrito acima. As superfı́cies com S constante
vão representar superfı́cies de fase constante. A Teoria de Hamilton-
Jacobi nos diz então que a Mecânica Clássica corresponde à Ótica
Geométrica (fazendo um limite em que k02 vai a ∞). Este tipo de
resultado é essencial na Teoria semi-clássica da Mecânica Quântica.

i i

i i
“mec˙New”
i i
2011/10/11
page 206
i i

206 [CAP. 10: A EQUAÇÃO DA ONDA

Finalmente, a partir do que foi dito acima, podemos justificar as


considerações das seções anteriores onde afirmamos que o raio de luz
deve ser visto como uma geodésica, na verdade corresponde a supor
que o raio de luz (10.3) que consideramos nesta seção está situado
em um meio em que k02 é muito grande (mais precisamente k0 = ∞).
Essa relação compatibiliza dois pontos de vista que no passado
foram antagônicos: o ponto de vista de Newton que a luz é um raio
corpuscular e o ponto de vista de Hamilton que a luz é na verdade
uma frente de onda.

i i

i i
“mec˙New”
i i
2011/10/11
page 207
i i

Capı́tulo 11

O Método da Fase
Estacionária e suas
Aplicações em Ótica

por Artur Lopes e Marcos Sebastiani

11.1 Introdução

Vamos considerar aqui funções C ∞ definidas em semi-reta reais


e tomando valores complexos F (τ ) : (d, +∞) → C onde d é uma
constante real.
Definição 11.1. H(τ ) é de decrescimento rápido se para todo N vale
que H(τ )τ N → 0 quando τ → ∞ e o mesmo é válido para as deri-
k
vadas de ordem k de H, ou seja para todo N vale que d dτ H(τ ) N
k τ →0,
quando τ → ∞.
Definição 11.2. F (τ ) e G(τ ) tem mesmo comportamento assintótico
se F (τ ) − G(τ ) é de decrescimento rápido e utiliza-se a notação

207

i i

i i
“mec˙New”
i i
2011/10/11
page 208
i i

208 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

F (τ ) ∼ G(τ )

Duas funções F e G que tem o mesmo comportamento assintótico


são quase que indistinguı́veis para valores de τ grandes.
O τ tem o significado de frequência em Ótica e no Eletromag-
netismo. Estamos interessados então apenas em situações em que a
frequência τ vai a infinito, ou seja, quando ela é muito grande. Neste
contexto, se H(τ ) tem decrescimento rápido, podemos dizer que para
τ grande podemos substituir ela pela função nula (H(τ ) ∼ 0).
Nosso objetivo principal é analisar o assintótico de expressões da
forma Z ∞
F (τ ) = f (x)eiτ φ(x) dx
−∞

quando τ vai para infinito [1], [5], [6], [7] e [8].


Para se ter uma breve idéia da complexidade do problema consi-
dere φ(x) = x: note que neste caso quando τ esta fixo, mas é muito
grande, o termo eiτ x oscila muito com x, ou seja, uma pequena va-
riação de x faz variar bastante eiτ x ; a idéia heurı́stica básica aqui é
que essas oscilações irão produzir cancelamentos e um comportanto
bem definido aparece disto tudo quando τ vai a infinito.
Em Ótica o f (x) representa a amplitude, τ a frequência e o φ(x)
a fase de uma onda que é descrita pela expressão acima [3], [4] e
[8]. O limite quando τ vai a infinito conduz a assim chamada Ótica
Geométrica [2] Section 9-8 .
Vamos assumir em todo o texto que f é de classe C ∞ .
Uma outra importante aplicação do cálculo do assintótico de tais
integrais é no estudo do limite semi-clássico da Mecânica Quântica:
neste caso τ = 1/h e h vai a zero [3], [5] e [2].
Como decorrência natural do que vamos analisar no texto vamos
apresentar brevemente a fundamentação matemática da teoria das
séries não convergentes. H. Poincare foi o primeiro matemático a
introduzir tais séries.

i i

i i
“mec˙New”
i i
2011/10/11
page 209
i i

209

11.2 Fase Estacionária

Proposição 11.1. Seja f ∈ C0∞ (IR), ou seja uma função C ∞ com


suporte compacto, então
Z ∞
F (τ ) = f (x)eiτ x dx
−∞

é de decrescimento rápido.
Demonstração: De fato, segue de propriedades de Séries de Fourier
(apenas integração por partes) que
Z ∞ Z
iτ x −1 ∞ df (x) iτ x
F (τ ) = f (x)e dx = e dx
−∞ iτ −∞ dx
e repetindo a integração por parte n vezes, obtemos
Z ∞ n
−1n d f (x) iτ x
F (τ ) = e dx.
(iτ )n −∞ dn x
n
Então |τ n F (τ )| ≤ (b − a)Maxa≤x≤b d dfn(x)
x , onde o intervalo (a, b)
contém o suporte de f e a, b são constantes reais.
Logo F (τ )τ n é limitada para todo n, portanto
F (τ )τ n−1 tende a zero para todo n quando τ vai a infinito. Re-
sultado análogo vale para as derivadas k-ésimas. Logo, tal F (τ ) tem
decrescimento rápido. 
Utilizando o ponto de vista de equivalência ∼, podemos dizer, do
ponto de vista da Definição 11.2 que podemos substituir F (τ ) por 0
para τ grande, ou seja
Z ∞
F (τ ) = f (x)eiτ x dx ∼ 0.
−∞

Vamos agora analisar em geral outros tipos de funções F (τ ), como


por exemplo Z ∞
F (τ ) = f (x)eiτ φ(x) dx
−∞
onde φ(x) é uma função qualquer que supomos doravante analı́tica.
No exemplo anterior φ(x) = x.
É possı́vel mostrar mais geralmente que:

i i

i i
“mec˙New”
i i
2011/10/11
page 210
i i

210 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA


Proposição 11.2. Se φ (x) não tem zeros no suporte de f então
vale que
Z ∞
F (τ ) = f (x)eiτ φ(x) dx ∼ 0.
−∞

Demostração: Para cada τ tal que φ (τ ) = 0, podemos escolher um
intervalo aberto Uτ = (τ −ǫ, τ +ǫ) disjunto do suporte de f . Por outro

lado, para cada τ tal que φ (τ ) 6= 0 podemos escolher um intervalo

aberto Uτ = (τ − ǫ, τ + ǫ) tal que φ (x) 6= 0, ∀x ∈ U¯τ . Tomando
uma partição da unidade subordinada ao recobrimento assim obtido,
basta provar que Z a
f (x)eiτ φ(x) dx ∼ 0,
b

quando (a, b) contém o suporte de f e φ (x) 6= 0 em [a, b]. O resultado
segue da proposição 1 pela mudança de coordenadas φ(x) = y. 
′ ′′
Se φ (a) = 0, φ (a) 6= 0 dizemos que a é ponto estacionário or-
′ ′′
dinário (é crı́tico não degenerado para φ). Se φ (a) = 0, φ (a) = 0
dizemos que a é ponto de cáustica.
Um caso importante foi estudado por Fresnel, que corresponde a
φ(x) = x2 . Neste caso x = 0 é ponto estacionário ordinário para φ.
Lembre que
Z ∞ Z ∞ √
2 1 2 π
eix τ dx = √ eiy dy = √ eiπ/4
−∞ τ −∞ τ

Desejamos calcular
Z ∞
2
F (τ ) = f (x)eiτ x dx
−∞

Ora

√ Z ∞ Z ∞
π iπ/4 iτ x2 2
F (τ ) − f (0) √ e = f (x)e dx − f (0) eiτ x dx =
τ −∞ −∞
Z R
2
= lim (f (x) − f (0))eiτ x dx.
R→∞ −R

i i

i i
“mec˙New”
i i
2011/10/11
page 211
i i

211


c
Seja g(x) tal que f (x) − f (0) = xg(x), onde g ∈ C ∞ (R) e g = x2
para x fora do suporte de f .
Ora
Z R Z R
2 2
(f (x) − f (0))eiτ x dx = xg(x)eiτ x dx =
−R −R
2 Z R
eiτ x g(x) x=R 1 ′ 2
|x=−R − g (x)eiτ x dx.
2iτ 2iτ −R

Se R é grande, g(R) = − fR
(0)
e g(−R) = f R
(0)
.
Decorre daı́ que
Z R Z ∞
2 1 ′ 2
lim (f (x) − f (0))eiτ x dx = − g (x)eiτ x dx.
R→∞ −R 2iτ −∞
Sendo assim,
Z ∞
√ i ′ 2
F (τ ) = eiπ/4 f (0) πτ −1/2 + g (x)eiτ x dx.
2τ −∞

Note que por hipótese de g, para cada τ fixo


Z ∞
i ′ 2
g (x)eiτ x dx
2τ −∞
é uma constante finita; esta integral vai a zero quando τ vai a infinito.
Como τ −1 vai a√zero mais rápido que τ −1/2 Rquando τ vai a infi-
∞ ′ 2
nito, o termo f (0) πτ −1/2 domina o termo 2τi −∞ g (x)eiτ x dx na
convergência a zero de F (τ ) quando τ vai a infinito.
Fazendo o mesmo procedimento m vezes obtemos:
R∞ 2
Proposição 11.3. Para todo m vale que se F (τ ) = −∞ f (x)eiτ x dx,
então
m
X √ f 2k (0) −k−1/2
F (τ ) = eiπ/4 π(i/2)k τ +
(2k)!!
k=0
Z ∞
2
m+1
+(i/(2τ )) h(x)eiτ x dx,
−∞

onde h(x) é uma função em C tal que h(x)x2 é limitada e onde
(2k)!! = 2 4 6...(2(k − 1)) (2k).

i i

i i
“mec˙New”
i i
2011/10/11
page 212
i i

212 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

A função h acima é obtida recursivamente seguindo o procedi-


mento do caso m = 1. O termo dominante na convergência a zero da
expressão acima é de ordem τ −1/2 . Podemos afirmar que
√ em primeira
aproximação o termo dominante de F (τ ) é eiπ/4 f (0) πτ −1/2 .
Gostarı́amos de fazer m tender a infinto para se ter então uma
expressão completa de F (τ ) em série, mas este procedimento pode
incorrer em problemas de convergência da série; esta é a razão para
introduzir a seguir o conceito de uma série convergir assintóticamente
a uma função F (τ ).
P∞
Definição 11.3. Dizemos que 0 gk (τ ) converge assintoticamente
a F (τ ) ∈ C se fixados quaisquer r, s, existe M tal que para m fixo,
m≥M
m
dr F (τ ) X dr gk (τ ) s
( r − )τ
d τ dr τ
k=0
é limitada quando τ → ∞.
P∞
Usaremos a notação F (τ ) ∼ 0 gk (τ ) que estende a notação
anterior.
Note que a série acima não converge na maioria dos casos pelo
2k
teorema de E. Borel [8]; os termos f(2k)!!
(0)
podem ser qualquer coisa!!!
A expressão acima, no entanto, faz completo sentido matemático,
se interpretada de acordo com a última definição.
P∞ ′

Observamos que por definição F (τ ) ∼ 0 gk (τ )
Usando a notação acima, podemos concluir das considerações an-
teriores que

X √ f 2k (0) −k−1/2
F (τ ) ∼ eiπ/4 π(i/2)k τ (11.1)
(2k)!!
k=0
Quando na definição acima falamos em derivada r-ésima de F
estamos pensando na expressão formal da derivada, ou seja, por e-
xemplo para r = 1 usamos que
Z ∞
2
F ′ (τ ) = ix2 f (x)eiτ x dx
−∞

quando Z ∞
2
F (τ ) = f (x)eiτ x dx.
−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 213
i i

213

Mais geralmente, por indução


Z ∞
2
(j)
F (τ ) = (ix2 )j f (x)eiτ x dx.
−∞

√ 2k
Note que dependendo de f o termo π(i/2)k f(2k)!! (0)
pode ser qual-
quer coisa. De qualquer modo através de (1), no caso φ(x) = x2 , fo-
mos capazes de caracterizar o comportamento assintótico de F para
τ grande.
Vamos apresentar a seguir, a tı́tulo de ilustração, um exemplo
que embora não seja exatamente o caso considerado acima dá a idéia
exata das questões que desejamos analisar aqui.
O caso que vamos apresentar a baixo tem a vantagem de utilizar
apenas resultados elementares de Cálculo Diferencial e Integral.
Considere a função F (τ ) tomando valores reais como função da
variável τ (vamos estar interessados apenas em valores grandes de τ ):
Z ∞ −τ x
e
F (τ ) = dx.
0 1+x

Note que F (τ ) vai a zero quando τ vai a infinito.


Note que a principal diferença do caso acima para o caso anteri-
ormente considerado da fase estácionária (consideramos agora o caso
particular que corresponde na notação anterior a f (x) = 1/(1 + x) e
φ(x) = x), é que consideramos e−τ x e não e−iτ x ; no entanto as idéias
básicas que funcionam num caso funcionam no outro.
Vamos mostrar que tal função F para valores grandes de τ pode
ser aproximada por uma série de potências que tem uma expressão
bem simples:

X (−1)n n!
.
n=0
τ n+1
Observe que tal série não é convergente!!! A utilidade de consi-
derar tal série deriva do seguinte fato: F (2) é mal aproximado por
P∞ (−1)n n!
n=0 2n+1 , mas F (10) (neste caso τ = 10 pode ser considerado
grande) é aproximado com erro percentual de menos de 0, 0006 por
P3 (−1)n n! P∞ (−1)n n!
n=0 10n+1 , ou seja os primeiros três termos de n=0 10n+1 são
P3 (−1)n n!
tais que | n=0 10n+1 − F (10)| ≤ F (10)0, 0006.

i i

i i
“mec˙New”
i i
2011/10/11
page 214
i i

214 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Desejamos enfatizar que estamos dizendo acima que F (τ ) é apro-


P∞ n
ximado por n=0 (−1) n!
τ n+1 apenas para valores grandes de τ !!!
A seguinte definição para F tomando valores reais é análoga a
anteriormente considerada para F tomando valores complexos.
P∞
Definição 11.4. Dizemos que 0 gk (τ ) converge assintoticamente
a F (τ ) ∈ R, quando τ vai a infinito, se fixados quaisquer r, s, existe
M tal que para m fixo, m ≥ M
m
dr F (τ ) X dr gk (τ ) s
| − |τ
dr τ dr τ
k=0

é limitada quando τ → ∞.
Neste caso dizemos que

X
F (τ ) ∼ gn (τ ).
n=0

P∞Existe numa diferença fundamental entre séries convergentes


P∞ n=0 an τ = G(τ ) e séries assintóticas, quando τ vai a infinito,
n
n=0 an τ ∼ F (τ ). PN
No primeiro caso, dado ǫ e τ , existe N tal que | n=0 an τ n −
G(τ )| < ǫ, enquanto no segundo caso, dado ǫ e N existe K > 0 tal
PN
que | n=0 an τ n −F (τ )| < ǫτ −N para τ > K. Note que o K depende
de ǫ e N ; estamos considerando na aproximação um erro percentual
que leva em conta a grandeza do valor de τ utilizado.
Sendo assim, o que ocorre de fato no caso nas séries assintóticas,
é que para τ fixo a proximação é boa para N pequeno, mas fica ruim
para N de ordem maior que τ .
n
No nosso caso gn (τ ) = (−1) n!
τ n+1 e afirmamos que

X (−1)n n!
F (τ ) ∼ ,
n=0
τ n+1

Vamos elaborar um pouco sobre o sentido do ∼; mais exatamente


vamos considerar a questão apenas para r = 0.
Ora,
1 − (−1)N xN
= 1 − x + x2 − · · · + (−1)N −1 xN −1 ,
1+x

i i

i i
“mec˙New”
i i
2011/10/11
page 215
i i

215

portanto, para todo x


N −1
1 X (−1)N xN
= (−1)n xn + .
1+x 0
1+x
Usando a expansão acima na forma integral de F obtemos
N −1 Z ∞
X (−1)n n! e−τ x xN
F (τ ) = + (−1)N dx.
n=0
τ n+1 0 1+x
Note que a parte esquerda do somatório acima coincide com os
P∞ n
primeiros N termos de n=0 (−1)τ
n!
n+1 , sendo assim o erro na aproxi-
P∞ (−1)n n!
mação de F por n=0 τ n+1 é
Z ∞ −τ x N
N e x
EN (τ ) = (−1) dx,
0 1 + x
logo

Z ∞ Z ∞
e−τ x xN e−τ x xN N!
|EN (τ )| = dx < dx = N +1 ,
0 1+x 0 1 τ

Visto de outro modo


N −1
X (−1)n n! N +1
|F (τ ) − |τ ≤ N!
n=0
τ n+1

e N ! é uma constante.
Sendo assim, na Definição 11.4, dado s = N + 1 devemos escolher
M = N . Note que para s = N + 1 fixado, a constante N ! é muito
grande (se N é grande) mas fixa.
Acreditamos que com o exemplo acima ficou claro o sentido da
afirmação

X (−1)n n!
F (τ ) ∼ ,
n=0
τ n+1

i i

i i
“mec˙New”
i i
2011/10/11
page 216
i i

216 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

11.3 Fase não degenerada

Voltamos agora a considerar o caso em que F toma valores com-


plexos.
Vamos considerar agora o caso em que φ(x) possui vários pon-
tos crı́ticos isolados p1 , p2 , .... Sejam Vi respectivamente vizinhanças
disjuntas dos pontos pi .
Considere Um coleção de abertos tal que ∪m,i Um ∪ Vi = R, tal
que pi não está em nenhum Um e ainda que a cobertura de R seja
localmente finita.
Seja θm , ǫi uma partição da unidade subordinada a partição. Es-
tamos usando a notação que θm tem suporte em Um e ǫi tem suporte
em Vi .
Sendo assim
XZ ∞ XZ ∞
F (τ ) = θm (x)f (x)eiτ φ(x) dx + ǫm (x)f (x)eiτ φ(x) dx.
m −∞ m −∞

Observamos que ambas as somas são finitas e que basta pela Pro-
posição 11.2 examinar
XZ ∞
ǫm (x)f (x)eiτ φ(x) dx.
m −∞

ou seja, basta examinar individualmente


Z ∞
H(τ ) = f (x)eiτ φ(x) dx
−∞

quando o suporte de f está em um intervalo (−δ, δ) e 0 é ponto crı́tico


isolado de φ (podemos transladar o problema e colocar o ponto crı́tico
no ponto 0).
No caso em que 0 é não degenerado φ′ (0) = 0, φ′′ (0) 6= 0), existe
uma mudança de coordenadas local x = x(y) tal que φ(x(y)) = y 2 .
Neste caso recaı́mos na Proposição 11.3, pois
Z ∞ Z ∞
2
iτ φ(x)
H(τ ) = f (x)e dx = f (x(y))eiτ y x′ (y)dy
−∞ −∞
Z ∞ (11.1)
iτ y 2
= g(y)e dy.
−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 217
i i

217

Vamos considerar com mais detalhe agora o caso em que todos


os pontos crı́ticos de φ são não-degenerados. Neste caso, temos que
escolher com mais cuidado os intervalos abertos Um , Vj .
É claro que φ(x) − φ(pj ) = (x − pj ))2 ψj (x), onde ψj é analı́tica e
ψj (pj ) = 12 φ′′ (pj ). Seja µj = sgnφ′′ (pj ). Definimos a nova variável
q
y = (x − pj ) µj ψj (x)

na vizinhança de pj . Temos

dy
(pj ) > 0.
dx
Tomamos Vj = (pj − δj , pj + δj ) tal que seja válida a mudança de
variável neste intervalo. Depois escolhemos os Um tais que
 
δj δj
Um ∩ pj − , pj +
2 2

seja vazio para todos m e j. Nestas condições:

Z +∞ Z pj +δj
ǫj (x)f (x)eiτ φ(x) dx = ǫj (x)f (x)eiτ φ(x) dx =
−∞ pj −δj

Z pj +δj
= eiτ φ(pj ) ǫj (x)f (x)eiτ (φ(x)−φ(pj )) dx =
pj −δj
Z y(pj +δj )
2 dx
= eiτ φ(pj ) ǫj (x(y))f (x(y))eiµj τ y dy =
y(pj −δj ) dy
Z +∞  
dx iµj τ y2
= eiτ φ(pj ) ǫj (x(y))f (x(y)) e dy,
−∞ dy
onde ǫj (x(y)) = 1 na vizinhança de 0. Seja:
 
2k dx
d f (x(y)) dy
cjk = (0).
dy 2k

i i

i i
“mec˙New”
i i
2011/10/11
page 218
i i

218 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Observamos que os cjk podem ser efetivamente calculados porque


as derivadas de x(y)
p calculam-se derivando sucessivamente a identi-
dade y = (x − pj ) µj ψj (x) respeito de y.

1o ′′
¯ caso) φ (pj ) > 0. Neste caso, µj = 1. Pelo visto antes,
Z +∞ +∞  k
dx iτ y2 √ iπ X i cjk −k− 1
ǫj (x(y))f (x(y)) e dy ∼ πe 4 τ 2.

−∞ dy 2 (2k)!!
k=0

2o ′′
¯ caso) φ (pj ) < 0. Neste caso, µj = −1. Observemos que:
Z +∞ Z +∞
−iτ y 2
g(y)e dy = ḡ(y)eiτ y2 dy
−∞ −∞

para toda g ∈ C0∞ (IR). Então,


Z +∞ +∞  k
dx −iτ y2 √ π
X i cjk −k− 1
ǫj (x(y))f (x(y)) e dy ∼ πe−i 4 − τ 2.

−∞ dy 2 (2k)!!
k=0

Finalmente, Z +∞
f (x)eiτ φ(x) dx ∼
−∞
+∞  k
" # 1
√ X i iπ
X
iτ φ(pj ) k −i π
X
iτ φ(pj ) τ −k− 2
∼ π e 4 e cjk +(−1) e 4 e cjk .
2 ′′ ′′
(2k)!!
k=0 φ (pj )>0 φ (pj )<0

Por definição
 −1 √
dx dy f (pj ) 2f (pj )
cj0 = f (pj ) (0) = f (pj ) (pj ) =p =p .
dy dx µj ψj (pj ) |φ′′ (pj )|

Logo, da anterior resulta:


Z +∞
f (x)eiτ φ(x) dx =
−∞
" π π
#
√ X ei(τ φ(pj )+ 4 ) √ X ei(τ φ(pj )− 4 ) − 1
= 2π f (pj ) p + 2π f (pj ) p τ 2 +0(τ −1 )
|φ ′′ (p )| |φ ′′ (p )|
φ′′ (pj )>0 j φ′′ (p )<0 j
j

i i

i i
“mec˙New”
i i
2011/10/11
page 219
i i

219

para τ → +∞.
Fica então determinado o termo dominante de F (τ ) como o termo
1
a esquerda da última linha (vai a zero como τ − 2 ).

11.4 Aplicação às integrais de Airy generalizadas

Seja
Z +∞
F (τ ) = eiτ φ(x) dx
−∞

onde φ(x) é um polinômio, a coeficientes reais, do qual todos os pon-


tos crı́ticos são não degenerados e cujo grau é n ≥ 2.

Lema 11.1. A integral precedente converge para todo τ ∈ IR, τ > 0


e define uma função C ∞ de τ em (0, +∞).

Seja I um intervalo que contém no seu interior todas as raı́zes de


φ(x), φ′ (x) e φ′′ (x). Seja f ∈ C0∞ (IR) tal que f (x) = 1 se x ∈ I. Seja
g(x) = 1 − f (x).
Então
Z +∞ Z +∞ Z +∞
iτ φ(x) iτ φ(x)
e dx = f (x)e dx + g(x)eiτ φ(x) dx.
−∞ −∞ −∞

Como f tem suporte compacto o Lema 11.1 segue imediatamente


do lema seguinte, que provaremos depois.

Lema 11.2. Z +∞
g(x)eiτ φ(x) dx,
−∞

τ > 0, converge e define uma função C ∞ de τ que tem decrescimento


rápido para τ → +∞.

O Lema 11.2 nos diz também, que para ter o desenvolvimento


assintótico de F (τ ) basta ter o de
Z +∞
f (x)eiτ φ(x) dx.
−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 220
i i

220 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Mas este último se calcula como antes, observando ainda que f = 1


na vizinhança de cada ponto crı́tico de φ.
Vamos aplicar o anterior à função de Airy
Z +∞  
1 1 3
Ai(t) = cos ω + tω dω
2π −∞ 3

e estudar seu comportamento para t → ±∞.


Consideremos primeiro para t → −∞.
Então consideramos, para t → +∞, a função:
Z +∞  
1 1 3
G(t) = Ai(−t) = cos ω − tω dω.
2π −∞ 3
2
Mudando de variável: t = τ 3 obtemos
Z +∞  
2 1 1 3 2
F (τ ) = G(τ 3 ) = cos ω − τ 3 ω dω.
2π −∞ 3
1
Mudemos agora a variável de integração: ω = τ 3 (1 + x):
1 Z +∞  
τ3 1
F (τ ) = τ (1 + x)3 − τ (1 + x) dx
cos
2π −∞ 3
1 Z +∞  
τ3 1 3 2 2
= cos x +x − τ dx.
2π −∞ 3 3

Logo,  
1 Z +∞ iτ 1 3 2 2
τ 3 3 x +x − 3
F (τ ) = Re e dx
2π −∞

e estamos no caso anterior com:


1 3 2
φ(x) = x + x2 − .
3 3
Os pontos crı́ticos são p1 = −2 e p2 = 0. Temos que:
2 2
φ(p1 ) = , φ′′ (p1 ) = −2, φ(p2 ) = − , φ′′ (p2 ) = 2.
3 3

i i

i i
“mec˙New”
i i
2011/10/11
page 221
i i

221

Obtemos:
   
2 π 2 π
"  i − 3 τ + 4 i 3 τ − 4 ! #
1
τ3 √ e √ e 1
F (τ ) = Re 2π √ + 2π √ τ − 2 + 0(τ −1 )
2π 2 2
 
1 1 2 π 2
= π − 2 τ − 6 cos τ− + 0(τ − 3 )
3 4

Logo,  
− 12 − 41 2 3 π
G(t) = π t cos t2 − + 0(t−1 )
3 4
resultado que melhora o de Olver página 103 mas que resulta também
de Olver página 392.
O mesmo método aplicado a Ai(t) para t → +∞ mostra que
Ai(t) ∼ 0 para t → +∞.
Prova do Lema 11.2. Vamos notar Ck∞ (IR) os espaço das funções
C ∞ f : IR → C
I tais que, para todo j = 0, 1, · · · , vale

dj f
= 0(|x|−k )
dxj
para x → ±∞.
Por exemplo, se f ∈ C ∞ (IR) e se existe K > 0 tal que

p(x)
f (x) =
q(x)

se |x| ≥ |K|, onde p, q são polinômios e (grau q-grau p) ≥ k, então


f ∈ Ck∞ (IR).
Além disso, se f ∈ Ck∞ ((IR) e p(x) é um polinômio de grau m ≤ k

então p(x)f (x) ∈ Ck−m ((IR).
Afirmação: Para cada k = 1, 2, 3, · · · existe h ∈ Ck∞ (IR) tal que
Z +∞ Z +∞
g(x)eiτ φ(x) dx = µ(τ ) h(x)eiτ φ(x) dx
−∞ −∞

(τ > 0) onde µ(τ ) = cte.τ −r com r ≥ k.

i i

i i
“mec˙New”
i i
2011/10/11
page 222
i i

222 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Com efeito,
Z +∞ Z
1 +∞ g(x) iτ φ(x)
g(x)eiτ φ(x) dx = e iτ φ′ (x)dx
−∞ iτ −∞ φ′ (x)

g(x)
∈ C ∞ (IR)
φ′ (x)
!

porque g é nula sobre um aberto que contém os zeros de φ . Logo,

Z +∞  +∞ Z
1 g(x) iτ φ(x) i +∞
g(x)eiτ φ(x) dx = e + g1 (x)eiτ φ(x) dx
−∞ iτ φ′ (x) −∞ τ −∞

onde
p(x)
g1 (x) =
q(x)
para |x| bastante grande, com p, q polinômios e grau q-grau p = n
(lembremos que (g(x) = 1 para |x| bastante grande). Logo, como
g(x) = 1 para |x| bastante grande e grau φ′ ≥ 1,
Z +∞ Z
i +∞
g(x)eiτ φ(x) dx = g1 (x)eiτ φ(x) dx
−∞ τ −∞
onde g1 (x) ∈ Cn∞ (IR). Iterando este procedimento, decorre a afirmação.
Da afirmação com k = 2, já resulta que
Z +∞
g(x)eiτ φ(x) dx
−∞

é convergente e define G : (0; +∞) → C. I


Seja dado m(= 0, 1, 2, ...). Tomamos k > mn + 2. Pela afirmação:
Z +∞
G(τ ) = µ(τ ) h(x)eiτ φ(x) dx
−∞

onde a integral converge absolutamente, junto com todas as suas


derivadas respeito de τ até a ordem m. Como µ(τ ) = constante τ −r
com r ≥ k, decorre daı́ que G(τ ) é derivável até a ordem m e
dj G
= 0(τ −k )
dj τ

i i

i i
“mec˙New”
i i
2011/10/11
page 223
i i

223

para 0 ≤ j ≤ m. Como m é arbitrário, G ∈ C ∞ (0, +∞) e G ∼ 0.

11.5 Fase com Pontos de Cáustica

O anterior dá conta do caso em que os pontos crı́ticos são não


degenerados.
Supondo, por outro lado, que o ponto crı́tico seja degenerado
(cáustica), existe uma mudança de coordenadas local tal que φ(x(y)) =
y m , m ≥ 3.
Vamos portanto analisar o caso φ(x) = xm , m ≥ 3 (o caso φ(x) =
−xm é obtido a partir deste por conjugação).
Vamos assumir inicialmente, para simplificar, que f possa ser es-
crito como f (x) = xk g(x), onde g é constante igual a 1 numa vizi-
nhança de 0.
Como φ(x) = xm , m ≥ 3, temos então para cada k fixo que que
Z ∞ Z ∞
m m
Fk (τ ) = xk g(x)eiτ x dx = f (x)eiτ x dx
−∞ −∞

satisfaz
Z ∞ Z ∞
iτ xm m
Fk′ (τ ) m
= ix f (x)e dx = 1/(mτ ) (xf (x)) (ixm−1 mτ eiτ x )dx.
−∞ −∞

Integrando por partes,


Z ∞
m
Fk′ (τ ) = −1/(mτ ) (xf (x))′ eiτ x dx =
−∞
Z ∞ Z ∞
m m
−1/(mτ ) f (x)eiτ x dx − 1/(mτ ) xf ′ (x) eiτ x dx =
−∞ −∞
Z ∞
m
−1/(mτ )Fk (τ ) − 1/(mτ ) xf ′ (x) eiτ x dx.
−∞

Ou seja,
Z ∞
m
mτ Fk′ (τ ) + Fk (τ ) = − xf ′ (x) eiτ x dx.
−∞

i i

i i
“mec˙New”
i i
2011/10/11
page 224
i i

224 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Ora,

xf ′ (x) = kxk g(x) + xk+1 g ′ (x) = kf (x) + xk+1 g ′ (x).

Como 0 não está no suporte de g ′ (x), a Proposição 11.2 nos diz


finalmente que mτ Fk′ (τ ) + (k + 1)Fk (τ ) é de decrescimento rápido.
Como Fk está ı́mplicito na últimaRequação, não sabemos ainda
∞ m
determinar o assintótico de Fk (τ ) = −∞ xk g(x)eiτ x dx, onde g é
constante igual a 1 numa vizinhança de 0, mas sabemos que satisfaz
mτ Fk′ (τ )+ (k + 1)Fk (τ ) ∼ 0. Vamos a seguir determinar o assintótico
de Fk (τ ), mas antes precisamos uma definição que vai contemplar a
possibilidade de termos o conceito de uma série não convergente ser
solução de uma equação diferencial (no sentido assintótico).
Definição 11.5. Sejam p0 (τ ), p1 (τ ), .., pn (τ ) polinômios. Dizemos
que a função C ∞ , y(τ ), é solução da equação diferencial assintótica
linear
dn y(τ ) dy(τ )
pn (τ ) n
+ ... + p1 (τ ) + p0 (τ )y(τ ) ∼ 0,
dτ dτ
se
n
X dj y(τ )
pj (τ )
j=0
dτ j

é de decrescimento rápido.
A partir da definição acima note que as considerações feitas ante-
riormente mostram que Fk (τ ) é solução de
dy(τ )
mτ + (k + 1)y(τ ) ∼ 0,

ou equivalentemente
dy(τ )
mτ + (k + 1)y(τ ) = b(τ )

onde b(τ ) é de decrescimento rápido.
Uma solução particular da equação acima é
Z
−1 −(k+1)/m ∞ (k+1−m)/m
y(τ ) = τ x b(x)dx
m τ

i i

i i
“mec˙New”
i i
2011/10/11
page 225
i i

225

que é de decrescimento rápido.


A solução geral é cτ −(k+1)/m + y(τ ).
Decorre daı́ que existe constante ck tal que Fk (τ ) é assintotica-
mente equivalente a
ck τ −(k+1)/m . (11.2)
Concluı́mos portanto a análise do assintótico de
Z ∞
m
Fk (τ ) = xk g(x)eiτ x dx
−∞

no caso em que g é constante igual a 1 numa vizinhança de 0. O valor


das constantes ck devem ser determinados em cada caso.
Vamos agora analisar o caso um pouco mais geral de f (x) =
xk g(x) (sem hipóteses sobre g) com g qualquer em C0∞ , mas para
isto precisamos antes da seguinte:

Proposição 11.4. Dado g ∈ C0∞ e N ≥ 0 existe K ≥ 0 tal que


Z ∞ Z ∞
dj m dj m
τN xk g(x)eiτ x dx = τ N f (x)eiτ x dx
dτ j −∞ dτ j −∞

é limitada para τ → ∞ e para todo j se k ≥ K.

Demonstração: Se k ≥ m, integrando por partes temos


Z ∞ Z ∞
m m
xk g(x)eiτ x dx = 1/(miτ ) xk−m+1 g(x)iτ mxm−1 eiτ x dx =
−∞ −∞
Z ∞
m
−1/(miτ ) (xk−m+1 g(x))′ eiτ x dx
−∞
k−m+1 ′ k−m
e (x g(x)) = x h(x) onde h(x) está em C0∞ , o que permite
iterar o cálculo. O resultado segue de derivar a expressão várias
vezes. 

O caso em que φ(x) é analı́tica (não só da forma xm ) é obtido


a partir da proposição 4 e através de mudança
R ∞ de variável como em
(2) acima. Isto dá conta do caso F (τ ) = −∞ xk g(x)eiτ φ(x) dx com
g ∈ C0∞ .

i i

i i
“mec˙New”
i i
2011/10/11
page 226
i i

226 [CAP. 11: O MÉTODO DA FASE ESTACIONÁRIA

Vamos agora, finalmente, analisar o caso maisRgeral de um f (x)



qualquer e φ(x) analı́tica, isto é, o caso F (τ ) = −∞ f (x)eiτ φ(x) dx
com f ∈ C0∞ .
Escreva

f (x) = a0 + a1 x + a2 x2 + ... + ak−1 xk−1 + xk g(x)

onde g ∈ C0∞ .
Podemos substituir na análise f (x) por f (x)h(x) onde h(x) tem
suporte em uma pequena vizinhança de 0 (usando uma partição da
unidade) ou seja, basta analisar o assintótico de

Z ∞
F (τ ) = h(x)(a0 +a1 x+a2 x2 +...+ak−1 xk−1 +xk g(x))eiτ φ(x) dx =
−∞
Z ∞
(h(x)a0 +h(x)a1 x+h(x)a2 x2+...+h(x)ak−1 xk−1+xkh(x)g(x))eiτ φ(x)dx.
−∞

Para o assintótico dos primeiros termos usamos (3) e para o termo


Z ∞
xk h(x)g(x)eiτ φ(x) dx
−∞

usamos a Proposição 11.4. R∞


Resulta portanto que para F (τ ) = −∞ f (x)eiτ φ(x) dx com f ∈
C0∞ . existe desenvolvimento assintótico da forma

X
F (τ ) = ck τ −(k+1)/m .
k=0

O primeiro valor ck não nulo do desenvolvimento acima, carac-


teriza o termo principal de decaimento de F (τ ) quanto τ → ∞, ou
seja ck τ −(k+1)/m é o termo principal do ponto de vista assintótico.
O valor de tal k é denominado de expoente inicial ou invariante de
Malgrange. Referimos o leitor para [8] onde são apresentadas consi-
derações gerais sobre tal invariante.
O texto acima ilustra de maneira breve a fundamentação matemá-
tica da teoria das séries de potências não convergentes e sua relação
com as integrais oscilantes e ótica.

i i

i i
“mec˙New”
i i
2011/10/11
page 227
i i

Capı́tulo 12

Apêndice - Aplicação de
Primeiro Retorno para
Equações Diferenciais
Ordinárias

Considere uma equação diferencial ordinária x′ = f (x) definida para


x num aberto A em que f é de classe C 1 . Vamos supor que as soluções
x(t) estão sempre definidas para todo t real. Por definição, para t fixo,
φt (x) = y quando a solução x(t) de x′ (t) = f (x(t)), x(0) = x é tal
que x(t) = y.
Podemos considerar então o fluxo φt : A → A, para todo t real.
φt é um difeomorfismo de A em A.
Recomendamos o leitor a [DL] e [So] para resultados gerais sobre
equações diferenciais ordinárias e sistemas Hamiltonianos.
Uma solução x(t) de x′ = f (x) é dita periódica se existe t > 0 tal
que x(t) = x(0), ou seja φt (x) = x. Fica assim determinada a órbita
periódica γ = {φs (x)|s ∈ [0, t)}.
Uma seção local de x, é um conjunto V obtido pela interseção de
um hiperplano de dimensão n − 1 V ⊂ Rn (um espaço afim n − 1

227

i i

i i
“mec˙New”
i i
2011/10/11
page 228
i i

228 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.1:

dimensional) passando por x, com uma vizinhança U ⊂ Rn de x


(V = H ∩ U ), tal que f (y) 6∈ H (colocando a origem do vetor no
ponto y, conforme figuras 12 e 13), ∀y ∈ V = H ∩ U .

Observação 12.1. Se V seção local em x, então os vetores f (y) 6= 0


para todo y em V .

Seja γ uma órbita periódica de perı́odo t0 e V = H ∩ U seção


local passando por x ∈ γ. Podemos definir a aplicação T de V em
H, que associa v ∈ V a y = T (v) tal que y é o menor valor t > 0,
tal que φt (v) ∈ H. Note que T (x) = x = φt0 (x). Logo como φt (x) é
contı́nuo em t e em x então T está bem definido para V seção local
pequena passando por x (ver Figuras 29 e 30).
Se T (x) = x dizemos que x é ponto fixo de T .
A aplicação T é denominada de aplicação de primeiro retorno da
seção local V . A aplicação de primeiro retorno permite analisar o
comportamento das órbitas vizinhas de γ.
Note que os tempos de primeiro retorno de pontos em x(t) (de-
finido γ) e de outras soluções y(t) próximas (começando na seção

i i

i i
“mec˙New”
i i
2011/10/11
page 229
i i

229

Figura 12.2:

V ) não são os mesmos (apenas aproximadamente os mesmos pela


continuidade do fluxo)
De fato, por exemplo se T (v) = v para todo v ∈ V , concluı́mos

que todas as órbitas de x = f (x) que passam por V são periódica.
Vamos supor definida uma aplicação diferenciável z(u) = v defi-
nida num aberto u ∈ Ṽ ⊂ Rn−1 bijetiva sobre v ∈ V ⊂ Rn . Assim,
podemos expressar T nas novas coordenadas u como T̃ : Ṽ → Ṽ
como T̃ (u) = z −1 ( T (z(u)) ). Podemos supor sem perda de generali-
dade que z(0) = x. Quando falarmos da ação de T em V , estaremos
na verdade falando da ação de T̃ em Ṽ e quando falarmos em x
estaremos nos reportando ao u = 0.
Nas Figuras 12.1 e 12.2 mostramos um exemplo em que o campo
de vetores está definido no plano e portanto H tem dimensão 1.
A razão para tudo isto é que podemos falar agora na derivada
DT (v) da função T . Para sermos absolutamente precisos deverı́amos

i i

i i
“mec˙New”
i i
2011/10/11
page 230
i i

230 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.3:

falar da derivada DT̃ (u) de Rn−1 mas módulo a identificação acima


não vamos mais a partir de agora destacar tal diferença.
Na Figura 12.4 as órbitas em torno de γ tem uma tendência a se
afastarem de γ.
Note na Figura 12.3 que as órbitas em torno de γ tem uma
tendência a se aproximarem de γ.
Por sua vez, na Figura 12.5 as órbitas em torno de γ tem uma
tendência a se afastarem de γ por uma lado e a se aproximarem de
γ por outro lado.
Este comportamento é capturado pela aplicação de primeiro re-
torno T . A Figura 12.6 ilustra a aplicação de primeiro das equações
diferenciais que tem como espaço de fase respectivamente as Figuras
12.3, 12.4 e 12.5.
Note a posição do gráfico de T em relação a diagonal ∆ na Figura
12.6.

i i

i i
“mec˙New”
i i
2011/10/11
page 231
i i

231

Figura 12.4:

O ponto fundamental é que não pode ocorrer o que aparece na


Figura 12.7, pois os vetores f (x) sempre apontam para o mesmo lado
(ver Figura 12.8).
Definição 12.1. Se a derivada DT (x) da aplicação de primeiro re-
torno T (associada ao ponto fixo x) definida na seção local V da
órbita γ tiver todas as raı́zes do polinômio caracterı́stico com módulo
menor que 1, então a trajetória γ é chamada de órbita periódica atra-
tora.
Teorema 12.1. Se x é tal que a derivada DT (x) da aplicação de
primeiro retorno T (associada ao ponto fixo x) definida na seção
local V da órbita γ tiver todas as raı́zes do polinômio caracterı́stico
com módulo menor que 1, então a iteração T n (v) = xn de um ponto
v ∈ H converge ao ponto fixo x quando n vai a infinito.
Demonstração: Como o fluxo é de classe C 1 (pois o campo é de
classe C 1 ) pode-se mostrar que a matriz derivada DT (v) varia conti-
nuamente com v ∈ V . Desta maneira, para uma vizinhança pequena
B de V , |DT (v)| < c < 1 para todo v ∈ B. Logo pela desigualdade
do valor médio (ver [Li1]) |T (x)−T (v)| < c|x−v| (T é uma contração

i i

i i
“mec˙New”
i i
2011/10/11
page 232
i i

232 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.5:

Figura 12.6:

i i

i i
“mec˙New”
i i
2011/10/11
page 233
i i

233

Figura 12.7: A figura descrita acima não pode ocorrer de Γ é uma


seção transversal

quando definida numa pequena vizinhança M de x conforme definição


que aparece no Capı́tulo 3). Sendo assim, como T n (x) = x, por
indução |x − T n (v)| < cn |x − v| e concluı́mos que T n (v) → x quando
n → ∞.
No caso f bidimensional e portanto T unidimensional a condição

acima significa apenas que |T (x)| < 1. Neste caso, as órbitas das
soluções da equação diferencial que cortam V se aproximam de γ
conforme o teorema acima.
O papel dos autovalores da matriz DT da aplicação de primeiro
retorno T (associada a uma órbita periódica) serem em módulo menor
que 1 desempenha um papel análogo ao dos autovalores da derivada
DF do campo de vetores F no caso de pontos de equilı́brio.
Se todos autovalores de DT tem módulo menor que 1 então pode-
mos dizer que γ se comporta assim como uma espécie de “poço” (em
analogia com pontos de equilı́brio tipo poço) atraindo as trajetórias
(com tempo crescente) com condições iniciais em um aberto próximo

i i

i i
“mec˙New”
i i
2011/10/11
page 234
i i

234 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

de si. Tal γ é um exemplo do que se chama um atrator periódico em


equações diferenciais.
Definição 12.2. Se a derivada DT (x) de T em x (ponto fixo de
T ) tiver todas raı́zes do polinômio caracterı́stico maiores que 1, a
trajetória γ é chamada de órbita periódica repulsora.
No caso unidimensional a condição acima significa apenas que

|T (x)| > 1.
Nesse caso, as órbitas das soluções da equação diferencial que
cortam V se afastam de γ. Podemos dizer que γ se comporta como
uma espécie de ”fonte”(em analogia com pontos de equilı́brio tipo
fonte) repelindo (com o tempo crescente) as trajetórias com condições
iniciais próximas de si. Tal γ é um exemplo do que se chama um
repulsor em equações diferenciais.
O papel da seção local é basicamente discretizar o tempo. A
dinâmica de φt (x) em tôrno de γ pode ser analisada pela dinâmica
de T n (v) na seção local.
Note por exemplo que apenas partir do gráfico T do último caso
da 12.5 podemos deduzir que neste caso as trajetórias das soluções
perto de γ se aproximam por um lado e se afastam pelo outro. Tudo
isto segue apenas da análise da seção local e da aplicação de primeiro
retorno. Note que neste caso T ′ (x) = 1.
Se o fluxo preserva área então não pode ocorrer nem 12.4 nem
12.3.
Outra maneira de discretizar o tempo é considerar φ1 (y) = F (y).
F como vimos é um difeomorfismo e podemos obter várias proprie-
dades de φt (x) através dos iterados F n (x) = φn1 (x) = φn (x).
Este ponto de vista de analisar a dinâmica de uma equação dife-
rencial através de uma seção local T ou de um difeomorfismo F , tem
produzido uma série de resultados importantes na Teoria dos Sistema
Dinâmicos. O tempo torna-se uma variável discreta e não contı́nua.
A hipótese de os autovalores da aplicação de primeiro retorno T
em x terem todos módulo menor que 1 desempenha no caso de órbitas
periódicas uma papel análogo a hipótese de todos os autovalores de
Df (x0 ) terem parte real negativa quando x0 é de equilı́brio.
Antes de prosseguirmos desejamos enfatizar que numa seção trans-
versal Γ local os vetores f (v) (com v ∈ Γ) apontam todos sempre
para um mesmo lado. Sendo assim as trajetórias soluções x(t) da

i i

i i
“mec˙New”
i i
2011/10/11
page 235
i i

235

Figura 12.8:

equação diferencial x′ = f (x) que batem na seção Γ entram sempre


pelo mesmo lado e saem pelo outro. Mais exatamente, “não” pode
ocorrer algo do tipo descrito pela Figura 35.
A Figura 12.13 descreve o que deve ocorrer em duas batidas sub-
sequentes numa seção transversal T da trajetória x(t) solução da
equação diferencial.
Podemos considerar a partir de um Hamiltoniano H(p, q) definido
em R2n tomando valores reais a equação de Hamilton (Definição 3,
Capı́tulo 3 [L]). Obtemos assim uma EDO em R2 n . Os conceitos
descritos acima podem ser aplicados neste caso.
Vamos agora descrever brevemente como pode ser rico o compor-
tamento dinâmico das trajetórias do fluxo de uma equação diferencial
autônoma em torno de uma órbita periódica. Referimos o leitor para
[DL], [PM] e [R] para demonstração dos resultados que vamos consi-
derar a seguir. Nosso objetivo nesta seção é tão somente ilustrar com
figuras alguns dos comportamentos que caracterizam tais sistemas
em R3 .

i i

i i
“mec˙New”
i i
2011/10/11
page 236
i i

236 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Considere uma seção transversal P passando por z0 = z(t0 ) per-


tencente a uma trajetória periódica z(t) ∈ Rn de uma equação di-
ferencial de primeira ordem x′ = G(x) (neste caso o vetor tangente

z (t0 ) não está em P ). Na Figura 12.9 mostramos a aplicação T in-
duzida por P de primeiro retorno no caso do R3 . Esta transformação
T : P → P de primeiro retorno esta definida localmente em uma
vizinhança V em torno de z0 , de tal jeito que para y ∈ V ⊂ P ,
T (y) = x(t1 ) ∈ P , onde t1 é o valor do tempo na primeira vez que a

trajetória x(t) (solução de x = G(x) tal que x(0) = y) retorna a P .
O plano P é chamado de seção transversal em z(t0 ).

Figura 12.9:

Vamos considerar a seguir especificamente o caso tridimensional,


ou seja a aplicação T de primeiro retorno para z(t), órbita periódica

para x = G(x), G : R3 → R3 , como mostra a Figura 12.9 ou 12.10.
O comportamento das trajetórias em torno da órbita periódica
pode ser analisado através da aplicação T definida em uma vizinhança
de z0 = z(t0 ) em P , onde neste caso P é um plano bidimensional.
Note que T é um difeomorfismo local em torno de z0 = z(t0 ) ∈ P .

i i

i i
“mec˙New”
i i
2011/10/11
page 237
i i

237

Note também que z0 é ponto fixo para T , isto é, T (z0 ) = z0 .

Definição 12.3. Dizemos que a órbita periódica z(t) ∈ R3 é hiper-


bólica, se DT (z0 ) tem todos autovalores reais (no caso são dois) com
módulo diferente de 1. O ponto z0 será dito ponto fixo hiperbólico
para a aplicação T de primeiro retorno.

Definição 12.4. Dizemos que a órbita periódica z(t) ∈ R3 é elı́ptica,


se DT (z0 ) tem os autovalores (no caso são dois) com módulo igual
a 1. O ponto z0 será dito ponto fixo elı́ptico para a aplicação T de
primeiro retorno.

Os dois casos acima descrevem situações excludentes e que cobrem


todas as possibilidades (note que se os dois autovalores são igual a 1,
dizemos que o ponto é elı́ptico)

Figura 12.10:

i i

i i
“mec˙New”
i i
2011/10/11
page 238
i i

238 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.11:

Definição 12.5. O conjunto estável de z0 , ponto fixo hiperbólico para


T de primeiro retorno a P , é o conjunto dos pontos y ∈ P tal que

lim T n (y) = z0 .
n→∞

Este conjunto é denotado por γe (z0 ).


Definição 12.6. O conjunto instável de z0 , ponto fixo hiperbólico
para T de primeiro retorno a P , é o conjunto dos pontos y ∈ P tal
que
lim T n (y) = z0 .
n→−∞

Este conjunto é denotado por γi (z0 ).


Na Figura 12.9 mostramos a posição dos dois conjuntos em torno
do ponto hiperbólico z0 . É possı́vel mostrar para z0 hiperbólico que
quando a matriz DT (z0 ) possui um autovalor real maior que 1 outro

i i

i i
“mec˙New”
i i
2011/10/11
page 239
i i

239

real menor que 1 (ver [PM], [Ro2]) então os conjuntos γi (z0 ) e γe (z0 )
são realmente curvas passando por z0 e a dinâmica em torno deste
ponto é descrita pela Figura 12.9. Mais exatamente, as condições
iniciais y ∈ γe (z0 ) convergem a z0 através da evolução temporal
T n , n > 0 e as condições iniciais y ∈ γi (z0 ) convergem a z0 para
a evolução temporal com tempo negativo T n (y), n < 0.

Figura 12.12:

Se z0 é tal que a matriz DT (z0 ) possui os dois autovalores com


módulo menor que 1 (ver [PM], [Ro2]), então a dinâmica em torno

i i

i i
“mec˙New”
i i
2011/10/11
page 240
i i

240 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

deste ponto z0 é descrita por um atrator (ver [DL]). Mais exatamente,


as iterações T n (z) para z condição inicial convergem a z0 .
Este fenômeno não ocorre num sistema Hamiltoniano autônomo
pois o fluxo preserva volume 2 n dimensional (Capı́tulo 3 [L]).

Figura 12.13:

É também possı́vel mostrar para z0 hiperbólico que quando a ma-


triz DT (z0 ) possui os dois autovalores módulo maior que 1 (ver [PM],
[Ro2]), então a dinâmica em torno deste ponto z0 é descrita por um
repulsor (ver [DL]). Mais exatamente, as iterações T −n (z), n > 0 de z
condição inicial convergem a z0 . As iterações positivas T n (z0 ), n > 0,
saem de qualquer vizinhança de z0 para n suficientemente grande.
Pontos y fora de γe (z0 ) e fora de γi (z0 ) possuem a propriedade
que T n (y), para algum n positivo e para algum n negativo, vão sair

i i

i i
“mec˙New”
i i
2011/10/11
page 241
i i

241

fora da vizinhança V em trono de z0 onde T pode ser definida.

Observação 12.2. É possı́vel mostrar que a Figura 12.9 ilustra tam-


bém localmente o espaço de fase das iterações de K(x) = dT (z0 )(x)
(onde dT (z0 ) = DT (z0 ) é a matriz derivada de T ) em torno do ponto
fixo K(0) = 0 no caso hiperbólico. Mais precisamente, K n (y) para di-
ferentes y (condições iniciais em uma vizinhança de 0 ∈ R2 ) também
tem uma evolução temporal semelhante a Figura 12.9, que é a figura
da evolução temporal em torno de z0 ∈ P do sistema não linearizado
T (x) : P → P .

Em resumo, localmente em torno de um ponto hiperbólico z0 , a


dinâmica de T e de seu linerizado dT são semelhantes (ver [PM] e
[Ro2] para demonstração).
Na Figura 12.14 mostramos uma órbita periódica em R3 em que
aparece o fenômeno da ferradura. Isto segue do fato da varieda-
de estavel e variadade instavel de um ponto x0 se interceptarem.
Mostramos na Figura 12.15 como se comporta a transformação de
Poincare T na seção transversal. Neste caso é possı́vel mostrar que
ocorrem infinitas órbitas periódicas para o campo de vetores. Mais
precisamente se mostra que existem infinitos pontos periódicos para
T de perı́odos arbitrariamente grandes (ver [Ro2]).
Este fenômeno descoberto por H. Poincaré no problema dos três
corpos teve grande impacto na Mecânica Clássica e na moderna Te-
oria dos Sistemas Dinâmicos. Ele ilustra a grande complexidade
dinâmica que ocorre nesta situação (ver[Ro2] para mais detalhes).
Nas Figuras 12.10, 12.11 e 12.12 mostramos um exemplo do que
pode acontecer em alguns casos para a evolução temporal de pon-
tos elı́pticos. Cada ponto inicial y tem a tendência de rodar em
tôrno de z0 ao longo de sua evolução temporal T n (y), n > 0. Neste
caso, o comportamento de T é aproximadamente o comportamento
da evolução temporal de K n (x), n > 0, onde K é a derivada de T em
z0 , K = dT (z0 ) da transformação de primeiro retorno T da órbita
elı́ptica z(t).

Observação 12.3. É importante destacar que, diferentemente do


caso hiperbólico (ver Observação 12.1 e Figura 8.3), nem sempre a
evolução temporal em torno de um ponto fixo elı́ptico vai seguir a
evolução temporal K n (x) da derivada K = dT (z0 ), sugerida pela

i i

i i
“mec˙New”
i i
2011/10/11
page 242
i i

242 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Figura 12.14:

Figura 12.12. Fenômenos extremamente complexos podem suceder no


caso de uma órbita elı́ptica e estes exemplos são descritos na assim
chamada teoria KAM (ver [HK]).

A Figura 12.9 descreve o que acontece com as trajetórias do fluxo



φt do campo de vetores x = G(x) em tôrno de uma órbita periódica
hiperbólica z(t).
A Figura 12.12, mostra o que aconteceria se a órbita periódica
elı́ptica fosse tal que a T de primeiro retorno tivesse em tôrno de z0
um comportamento descrito pela Figura 3.3. Neste caso haveria um
contı́nuo de toros envolvendo z(t), cada toro sendo invariante pelo
fluxo (fenômeno KAM). O fenômeno de destruição de toros invari-

i i

i i
“mec˙New”
i i
2011/10/11
page 243
i i

243

Figura 12.15:

antes por perturbações é de fundamental importância em Sistemas


Dinâmicos [HK].
Definição 12.7. Seja um difeomorfismo T : A → A, então um ponto
x tal que exista n > 0 satisfazendo T n (x) = x é dito ponto periódico.
O menor de tais possı́veis valores n > 0 é chamado de perı́odo de x.
Um ponto fixo é um caso particular de ponto periódico.
Na Figura 12.13 mostramos a trajetória periódica x(t) (ver Defini-
ção 22) de um campo de vetores G e mostramos também como pode
aparecer de maneira natural um ponto periódico x (ver Definição
12.7) próximo ao ponto fixo para a aplicação de primeiro retorno T
(no caso um ponto de perı́odo 2) associada a uma órbita periódica
z(t) do campo de vetores G.
Se x é periódico para T , então

{T j (x), j ∈ N} = {x, T (x), T 2 (x), ..., T n−1 (x)}.

Note que se x é periódico para T com perı́odo n, então

{x, T (x), T 2 (x), .., T n−1 (x)}

também são pontos periódicos para T e tem perı́odo n.


O conjunto {x, T (x), T 2 (x), .., T n1 (x)} é chamado de órbita do
ponto periódico x por T

i i

i i
“mec˙New”
i i
2011/10/11
page 244
i i

244 [CAP. 12: APÊNDICE: APLICAÇÃO DE PRIMEIRO RETORNO

Definição 12.8. Um ponto periódico x do difeomorfismo F com


perı́odo n é dito hiperbólico, se x é ponto fixo hiperbólico para T = F n .
É fácil ver que se x é periódico hiperbólico, cada ponto pertencente
a sua órbita também é hiperbólico.
Definição 12.9. O conjunto estável (respectivamente instável) γe (x)
(respectivamente γi (x)) de um ponto periódico hiperbólico x é a união
dos conjuntos estáveis (respectivamente instáveis) de sua órbita.
Definição 12.10. Um ponto periódico x do difeomorfismo F com
perı́odo n é dito elı́ptico, se x é ponto fixo elı́ptico para T = F n .
Um fluxo que preserva área no plano tem propriedades especiais.
Fixada uma seção transversal H a aplicação de primeiro retorno deve
ser a identidade; não pode ocorrer o que é descrito pela Figura 12.3
e 12.4. Isto porque a área da região A seria maior do que a área da
região B e o fluxo φt (para t o tempo de primeiro retorno da trajetória
x(t)) levaria A em φt (A) = B (aproximadamente). Note que os tem-
pos de retorno de pontos em x(t) e de outras soluções y(t) próximas
(começando na seção) não são os mesmos (apenas aproximadamente
os mesmos pela continuidade do fluxo).
Definição 12.11. Uma seção H transversal ao fluxo (definido por
uma equação diferencial x′ = f (x)) é dita global quando para qualquer
ponto x no espaço A onde está definida a equação diferencial vale
que existe t > 0 e s < 0 tal que φt (x) ∈ H e φs (x) ∈ H, onde φ é o
fluxo. Neste caso a ”toda”a dinâmica do fluxo da equação diferencial
x′ = f (x) pode ser capturada pela aplicação de primeiro retorno T
definida em H.
Nosso objetivo acima foi apenas descrever de maneira sumária
o que acontece em torno das órbitas periódicas z(t) de um sistema
mecânico. Como vimos, este comportamento depende fundamental-
mente da aplicação de primeiro retorno T induzida em uma seção
transversal P passando por z0 .
O estudo da iteração de difeomorfismos é extremamente impor-
tante na Teoria dos Sistemas Dinâmicos e sua análise permite o enten-
dimento da aplicação T de primeiro retorno a uma seção transversal.
Esta Teoria permite também analisar a dinâmica de F = φt0 , t0 fixo,
onde φt é o fluxo associado a um campo de vetores.

i i

i i
“mec˙New”
i i
2011/10/11
page 245
i i

245

A partir do que foi discutido acima, o leitor pode assim perceber


a extrema complexidade que pode suceder na evolução temporal das
condições iniciais y em tôrno de uma órbita periódica de uma equação
diferencial, em especial dos sistemas Hamiltonianos.
Não foi possı́vel apresentar provas dos resultados acima descritos,
pois isto implicaria em ter que escrever nesta seção um livro com-
pleto de Sistemas Dinâmicos. Nosso objetivo foi apenas apresentar
algumas ideias centrais que aparecem na pesquisa atual envolvendo o
entendimento da dinâmica global de Sistemas Mecânicos. Referimos
o leitor para [DL], [So], [PM], [R], [M], [CL], [S] e [HS] para referências
sobre vários aspectos da Teoria dos Sistemas Dinâmicos.

i i

i i
“mec˙New”
i i
2011/10/11
page 246
i i

i i

i i
“mec˙New”
i i
2011/10/11
page 247
i i

Bibliografia

[AM] R. Abraham and J. Mardsen, Foundations of Mechanics, Ben-


jamin, 1980.
[ABC] B. Amaral, A. Baraviera and M. Terra Cunha, Mecânica Quântica
para Matemáticos em formação, Coloq. Bras. Mat. 2011,
IMPA, Rio de Janeiro
[Ap] A. Appel, Traite de Mecanique Rationnelle, Ed. Gauthier-
Villars, 1953.
[A1] V. I. Arnold, Mathematical Methods of Classical Mechanics,
Springer Verlag, 1978.
[A2] V. I. Arnold, Geometric Methods in the Theory of Ordinary
Differential Equations, Spri. Verla, 1983.
[A3] V. I. Arnold and A. Avez, Ergodic Problems of Classical Me-
chanics, Benjamin, 1968.
[Au1] S. Aubry, Analiticity breaking and Anderson localization in in-
commensurate lattices, Annals of the Israel Phys. Soc., Vol 3
(1980).
[AU2] S. Aubry and P. Y. Le Daeron, The discrete Frenkel-Kontorova
model and its extensions, PhysicaD, Vol 8 (1983), pp 381-422
[B] V. Bangert, Mather sets for Twist maps and Geodesics on Tori,
Dynamics Reported , 1-56, John Wiley, 1988.
[BG] I. Q. Barros e M. V. P. Garcia, Mecânica Analı́tica Clássica,
Ed Edgar Blucher, 1995.
[BF] R. Bassanezi e W. Ferreira, Equações Diferenciais com Aplica-
ções, Edit Harbra, 1988.
[BS] C. Beck and F. Schlogl, Thermodynamics of Chaotic Systems:
an Introduction, Cambridge Press, 1993.
[BU] L. Bunimovich, On ergodic properties of nowhere dispersing
billiards, Comm in Math Phys, 65 pp 295-312, 1979.

i i

i i
“mec˙New”
i i
2011/10/11
page 248
i i

248 BIBLIOGRAFIA

[MC1] M. do Carmo, Formas Diferenciais e aplicações, 12 Coloq Bras


Mat., 1979.
[MC2] M. do Carmo, Geometria Riemanniana, Projeto Euclides, IMPA,
1988.
[MC3] M. do Carmo, Differential Geometry of Curves and Surfaces,
Prentice Hall, 1976.
[CRZ] M. Carneiro, C. Ragazzo e S. Zanata, Introdução à Dinâmica de
Aplicações do tipo Twist, Colóquio Brasileiro de Matemática,
IMPA, RJ, 2005.
[CI] G. Contreras e R. Iturriaga, Global Minimizers of Autonomous
Lagrangians, 22 Colóquio Brasileiro de Matemática, IMPA, (1999)
[CLT] G. Contreras, A. Lopes and P. Thieullen, Lyapunov Minimizing
Measures; Erg Theo and Dyn Systems, n 21, (2001)
[CM] N. Chernov and R. Markarian, Chaotic Billiards, AMS, 2006.
[CFS] I. Cornfeld, S. Fomin and Ya Sinai, Ergodic Theory, Springer
Verlag, 1982.
[dL] R. de la Llave, A. Tutorial in KAM theory, Proc. Symp. Pure
Applied Math. 69, Amer. Math. Soc., Providence, RI, 2001
[De] R. Devaney, An introduction to Chaotic Dynamical Systems,
Benjamin, 1986.
[DL] C. Doering and A. O. Lopes, Equações Diferenciais Ordinárias,
Matemática Universitária, IMPA, 2005
[Du] P. Duarte, Ann Inst Henry Poincare, Ann. Non-Lin, Vol 11 n4,
1994 pp 359-409.
[E] R. S. Ellis, Entropy, Large Deviations and Statistical Mecha-
nics, Sprin. Verlag, 1985.
[FMP] A. Fasano, S Marmi and B. Pelloni, Analytical Mechanics: An
Introduction, Oxford Press
[Fa] J. Falconer, Fractal Geometry, John Wiley, 1990.

i i

i i
“mec˙New”
i i
2011/10/11
page 249
i i

BIBLIOGRAFIA 249

[Fat] A. Fathi, Weak KAM Theorem in Lagrangian Dynmaics, pre-


print, 2011.
[Fe] P. Fernandez, Medida e Integração, Proj Euclides, 1976.
[Fi] D. Figueiredo, Análise de Fourier Series e Equações Diferenciais
Parciais, Projeto Euclides, IMPA, 1987.
[GF] I. M. Gelfand and S. V. Fomin, Calculus of Variations, Prentice
Hall, 1963.
[GP] Guillemin Pollack, Diferential Topology
[Go] H. Goldstein, Classical Mechanics, Addison-Wesley, 1972.
[GH] J. Guckenheimer and P. Holmes, Non-linear oscilations, Dy-
namical Systems and Bifurcations of Vector Fields, Springer
Verlag, 1983.
[Gu] J. Gutzwiller, Chaos in Classical and Quantum Mechanics,
Springer Verlag, 1990.
[H] M. Hermann, Sur le courbes invariantes par les diffeomorphism
de l’anneau, Asterisque, Soc math Franc, 1983.
[LC] P. Le Calvez, Etude Topologique des applications deviant la
Vertical, Ensaios Matemáticos, SBM.
[H] D. T. Harr, Elements of Hamiltonian Mechanics, Pergamon
Press, 1982.
[HS] M. Hirsh and S. Smale, Differential Equations, Linear Algebra
and Dynamical Systems, Acad. Press, 1974.
[I] V. Iório, EDP, Um curso de graduação, Coleção Matemática
Universitária, IMPA, Rio, 1989.
[Ja] B. James, Probabilidade: um curso intermediário, Projeto Eu-
clides, IMPA, 1982.
[Jo] F. John, Partial Differential Equations, Springer Verlag, 1975.
[PM] J. Palis and W. Melo, Introdução aos Sistemas Dinâmicos, Proj
Euclides, IMPA, 1982.

i i

i i
“mec˙New”
i i
2011/10/11
page 250
i i

250 BIBLIOGRAFIA

[G] H.-O. Georgii, Gibbs Measures and Phase Transitions. de Gruy-


ter, Berlin, (1988).

[Ju] R. Iorio Junior, Equações diferenciais parciais: uma introdução,


Projeto Euclides, IMPA, 1988.

[KH] A. Katok and B. Hassenblat, Introduction to the Modern The-


ory of Dynamical Systems, Cambridge U. P., 1995.

[KMS] S. Kerckhoff, A. Mazur and J. Smillie, Ergodicity of billiard


flows and quadratic differentials, Ann of Math, Vol 124, N2,
293-311, 1986.

[Kh] A. Khintchine, Continued Fractions, Univ of Cicago Press, 1964.

[LL] L. Landau and E. Lifshitz, Mechanics, Pergamon Press, 1960.

[Le] Y. Lequain, Aproximação de um número real por números ra-


cionais, Coloq Bras Mat 1993, IMPA.

[Lo] A. O. Lopes, Introdução à Mecânica Clássica, EDUSP, 2006

[LS] A. O. Lopes and M. Sebastiani, Poncelet pairs and the Twist


map associated to the Poncelet billiard, Real Analyses Ex-
change, vol. 35, ISSUE2, 335-374, 2010.

[LiLi] A. Lichtenberg and M. Liberman, Regular nd Stochastic Mo-


tion, Springer Verlag, 1983.

[Li1] E. L. Lima, Curso de Análise, vol II, Projeto Euclides, IMPA,


1989.

[Li2] E. L. Lima, Espaços Métricos, Proj Euclides, IMPA, 1977.

[Li3] E. L. Lima, Variedades Diferenciáveis, IMPA, RJ.

[Li4] E. L. Lima, Algebra Linear, Col. Mat. Universitária, IMPA,


Rio (1995).

[Lu] R. Luneburg, Mathematical Theory of Optics, Univ. of Cali-


fornia Press, (1964)

[M1] R. Mañé, Teoria Ergódica, Projeto Euclides, IMPA, 1982.

i i

i i
“mec˙New”
i i
2011/10/11
page 251
i i

BIBLIOGRAFIA 251

[M2] R. Mañé, Global Variational Methods in Conservative Dyna-


mics, 18 Coloq Bras Mat, 1991.

[MR] J.Mardsen and T. Ratiu, Introduction to Mechanics and Sime-


try Springer Verlag, 1994

[MT] J. Marion and S. Thorton, Classical Dynamics, Hartcourt Brace


Dubl, 1988.

[Ma] R. Markarian, Introduction to the Ergodic Theory of Plane


Billiards, Dynamical Systems, Congress in Santiago do Chile
(1990), Ed by R.Bamon, R. Labarca, J. Palis and J. Lewowicz,
Longman Edit (1993), 327-439.

[MF] J. Mather and G. Forni, Action Minimizing orbits in Hamilto-


nian Systems, Lecture Notes in Math, Springer Verlag (1994).

[Me] J. D. Meiss, Sympletic maps, variational principles, and trans-


port, Reviews of Modern Physics, Vol 64, N3, July 1992

[MH] K. Meyer and G. Hal, Introduction to Hamiltonian Dynamics


Systems and the n-body problem, Springer Verlag, 1992.

[Mi] J. Milnor, Morse Theory, Princ Univ Press.

[Mo] J. Moser, Stable and Random Motions in Dynamical Systems,


Princeton Univ. Press, 1973

[O] E. Ott, Chaos in Dynamical Systems, Camb Univ Press, 1993.

[IR] I. Percival and D. Richards, Introduction to Dynamics, Cam-


bridge Univ Press, 1982.

[PY] M. Pollicott and M. Yuri, Dynamical systems and Ergodic The-


ory, Academic Press, 1998

[N] A. L. Neto, Funções de uma variável Complexa, Projeto Eucli-


des, IMPA, 1993.

[OA] A. Ozorio de Almeida, Sistemas Hamiltonianos: Caos e Quan-


tização, Edit UNICAMP.

i i

i i
“mec˙New”
i i
2011/10/11
page 252
i i

252 BIBLIOGRAFIA

[PP] W. Parry and M. Pollicott, Zeta functions and the periodic orbit
structure of hyperbolic dynamics, Asterisque 187-188 (1990)

[R] S. N. Rasband, Dynamics, John Wiley, 1983.


[Ro1] C. Robinson, A global approximation theorem for Hamiltonian
Systems, Proc. in Symp in Pure Math, XIV, Global Analysis,
edit S. Chern and S. Smale, AMS, 1970.

[Ro2] C. Robinson, Dynamical Systems, CRC Press, 1995.

[Rud] W. Rudin, Real and Complex Analysis, Mc Graw Hill, 1974.

[Rue] D. Ruelle, Thermodynamic Formalism, Adisson Wesley, 1978.

[SW] R. Saks e H. Wu, General Relativity for Mathematicians,


Springer-Verlgag, 1977.

[S] M. Sebastiani, O Teorema de Poncelet, Publicações Matemáti-


cas, IMPA, 2011.

[Si] Ya. Sinai, Dynamical System with elastic reflections, Russian


Math Surveys, 25, pp 137-189, 1970.

[So] J. A Sottomayor, Lições de Equações Diferenciais Ordinárias,


Projeto Euclides, IMPA, RJ.

[Ta] S. Tabachinov, Billiards, Soc Math Franc, (1990)

[T] M. Tabor, Chaos and integrability in nonlinear dynamics, John


Wiley and Sons, 1989.

[W] E. T. Whittaker, A Treatise in the Analitical Dynamics of Par-


ticles and Rigid Bodies, Dover, 1944.

i i

i i

Você também pode gostar