Você está na página 1de 69

Mecanica Classica

Esmerindo de Sousa Bernardes


DFCMIFSCUSP
e-mail: sousa@if.sc.usp.br
http: marconi.if.sc.usp.br
26 de Fevereiro de 2002
2
Conte udo
1 O Formalismo de Hamilton 5
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Equacoes de movimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 O princpio diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.2 O princpio integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Lagrangianas e hamiltonianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 Simetrias e leis de conservacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6 Geometria simplectica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.1 Metrica simplectica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.2 Transformac oes simplecticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.3 Parenteses de Poisson e de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7 Transforma coes canonicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7.1 Denicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.7.2 Equacao de Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7.3 Evolu cao temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.7.4 Teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
A Transformacoes Lineares 31
A.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
A.2 Transforma coes lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
A.2.1 Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
A.2.2 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
A.3 Transforma coes innitesimais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
A.4 Transforma coes especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
A.4.1 Transformac oes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
A.4.2 Transformac oes de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
A.4.3 Transformac oes simplecticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
B Rotacoes Espaciais 39
B.1 Corpo rgido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
B.2 O grupo das rotacoes espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
B.3 A algebra de Lie correspondente ao grupo das rotacoes . . . . . . . . . . . . . . . . . . . . . . 42
B.4

Angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
B.5 Relacao entre SO(3) e SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
B.6 Polinomios de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
C Relatividade Especial 53
C.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
C.2 Propriedades do espaco-tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
C.3 Transforma coes de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
C.4 Dinamica Relativstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
C.5 Partcula livre em um campo eletromagnetico . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3
4 CONTE

UDO
D Calculo Variacional 67
D.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
D.2 Deslocamentos virtuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
D.3 Equacoes de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Captulo 1
O Formalismo de Hamilton
1.1 Introducao
A forma analtica da Mecanica como introduzida por Euler e Lagrange, reformulada mais tarde por Hamilton,
difere consideravelmente da forma vetorial introduzida por Newton. Na formulacao vetorial, a lei fundamental
da Mecanica introduzida por Newton, massa aceleracao = forca, valida apenas para uma unica partcula
associada a uma determinada massa, determina o movimento de uma partcula massiva sujeita `a forcas
conhecidas. Em um sistema de partculas, a equacao de Newton deve ser aplicada a cada partcula que
compoe o sistema apos a determinacao das forcas presentes devido `as demais partculas do sistema. Na
abordagem analtica (via o formalismo de Lagrange ou de Hamilton) a situacao e invertida: a partcula nao
e mais uma unidade isolada, mas parte de um todo, de um sistema. Para compensar a necessidade de uma
forca resultante em cada partcula, a mecanica analtica considera uma unica funcao escalar (energia cinetica
ou o trabalho realizado) a qual contem todas as informacoes pertinentes `as forcas, as quais podem ser obtidas
por simples diferenciacao de uma funcao escalar.

E comum encontrarmos certos vnculos entre as partculas de um sistema mecanico. Por exemplo, as
distancias relativas entre as partculas de um solido nao podem mudar. Estes vnculos sao mantidos por fortes
forcas internas. Ao contrario do tratamento vetorial (newtoniano), o tratamento analtico (lagrangiano ou
hamiltoniano) nao requer o conhecimento destas forcas internas. Os vnculos sao considerados como condicoes
auxiliares na determinacao das equacoes de movimento do sistema.
As equacoes de movimento de um sistema mecanico complicado sao constitudas por um n umero grande de
equacoes diferenciais. A abordagem analtica nos da um princpio para determinarmos todas estas equacoes
de movimento. Dada uma quantidade fundamental, denominada acao, o princpio de que esta quantidade
seja estacionaria, conhecido como princpio da acao mnima ou formulacao hamiltoniana, fornece todas as
equacoes diferenciais associadas ao movimento do sistema. Hoje, este princpio e a base para a formulacao
da maioria das teorias fsicas modernas. Alem disto, a formulacao hamiltoniana nao depende da escolha do
sistema de coordenadas. Isto implica na invariabilidade (ou invariancia) das equacoes de movimento, co-
nhecidas como equacoes de Hamilton, com relacao `a sistemas de coordenadas. Em suma, as (re-)formulacoes
de Lagrange e de Hamilton (bem como outras) nao introduzem fatos novos `aqueles revelados pela formula cao
newtoniana, mas nos permite reinterpreta-los de forma completamente nova e abrangente. Abrangente o
suciente para podermos conectar fatos, aparentemente distintos, em uma mesma teoria.
Estaremos interessados aqui em descrever os fundamentos da formula cao hamiltoniana numa linguagem
matematica moderna composta basicamente pelo conceito de simetria. daremos enfase nas transformacoes
simplecticas como exemplo de transformacoes canonicas, na equacao de Hamilton-Jacobi, no teorema de
Liouville para a evolucao temporal de sistemas hamiltonianos, no uso das variaveis de anglo-acao para a
descricao de movimentos periodicos, nas secoes de Poincare usadas na caracterizacao da dinamica e na
reformula c ao do princpio de Hamilton no contexto da relatividade especial. Todos os topicos discutidos
nesta apostila foram retirados das seguintes referencias classicas:
C. Lanczos, The Variational Principles of Mechanics, Toronto (1970, quarta edicao);
H. Goldstein, Classical mechanics, Addison-Wesley (1980, segunda edicao);
5
6 1. O Formalismo de Hamilton
E. C. G. Sudarshan & N. Mukunda, Classical Dynamics: A Modern Perspective, John Wiley (1974).
L. Landau & E. Lifshitz, Teoria do Campo, Mir (1980).
O estudante interessado por um ponto de vista atraves de ferramentas matematicas modernas pode consultar
os seguintes textos (em ordem de complexidade):
W. F. Wreszinski, Mecanica Classica Moderna, EDUSP (1997);
V. I. Arnold, Mathematical Methods of Classical Mechanics, Springer (1978);
R. Abraham & J. E. Marsden, Foundations of Mechanics, Benjamin (1978).
1.2 Coordenadas generalizadas
Apesar das tecnicas vetorias serem muito adequadas aos problemas de estatica, elas sao inadequadas para
a cinematica onde as tecnicas analticas sao empregadas com muito sucesso. Este sucesso e devido ao uso
de coordenadas em sua concepcao matematica abstrata. Assim, a mecanica analtica e uma ciencia comple-
tamente matematica. O mundo fsico e traduzido em relacoes matematicas com a ajuda de coordenadas.
Apos trabalharmos com coordenadas como quantidades algebricas, os resultados devem ser traduzidos de
volta `a realidade fsica. Vale ressaltar que nos nao precisamos especicar a natureza das coordenadas que
traduzem uma determinada realidade fsica para o domnio da matematica. No entanto, as tecnicas analticas
exigem uma generalizacao do conceito de coordenadas cartesianas. Qualquer conjunto de parametros que
possam caracterizar sicamente um determinado sistema pode ser escolhido como um conjunto adequado de
coordenadas. Estas novas coordenadas sao denominadas de coordenadas generalizadas.
Consideremos um sistema composto por N partculas e sujeito a m vnculos.

E possvel especicar
univocamente tal sistema por n = 3N m coordenadas generalizadas q
i
(i = 1, . . . , n) de tal modo que as
coordenadas cartesianas sejam funcoes destas novas coordenadas:
x
k
= x
k
(q
1
, . . . , q
n
), y
k
= y
k
(q
1
, . . . , q
n
), z
k
= z
k
(q
1
, . . . , q
n
), k = 1, 2, . . . , N , (1.1)
ou, usando uma notacao esticada,
x
r
= x
r
(q), r = 1, 2, . . . , 3N , (1.2)
onde q = q
1
, . . . , q
n
. As equacoes de vnculos sao, essencialmente, de dois tipos: 1) descritas pelo anulamento
(e/ou desigualdades) de certas funcoes das 3N coordenadas cartesianas,

k
(x
1
, . . . , x
3N
) = 0, k = 1, 2, . . . , m; (1.3)
2) descritas por relacoes lineares nao-integraveis entre os diferenciais das coordenadas cartesianas. O n umero
n, denominado de graus de liberdade, e uma constante caracterstica de cada sistema. Por exemplo, um solido
tem apenas seis graus de liberdade (quais sao?), embora possa ser composto por uma quantidade muito grande
de partculas.
As coordenadas generalizadas nao precisam ter sempre um signicado geometrico. Mas e necessario que a
relacao entre as 3N coordenadas cartesianas e as n coordenadas generalizadas seja dada por funcoes analticas
(contnuas e diferenciaveis), de valores unicos e invertveis (jacobiano nao nulo). Estas condicoes podem
apenas ser violadas em pontos isolados, denominados de pontos singulares. Outra observa cao importante:
a escolha dos parametros q
i
deve ser feita de tal forma que os valores assumidos por eles proporcionem a
quase totalidade dos valores assumidos pelas coordenadas x
r
.
Uma vez que a dinamica de um dado sistema e caracterizada por n coordenadas generalizadas q
i
, entao as
funcoes q
i
(t) representam a solucao para a dinamica deste sistema. Portanto, podemos formar um espaco real
n-dimensional com tais coordenadas generalizadas, conhecido como espaco de conguracao do sistema. Um
determinado ponto no espaco de conguracao representa univocamente um dado estado (ou conguracao)
do sistema. Em outras palavras, todo o sistema mecanico pode ser trocado por um unico ponto no espaco
de conguracao. As curvas q
i
(t), entre dois instantes de tempo, sao conhecidas como trajetorias do espaco de
conguracao. Vale ressaltar que elas nao representam as trajetorias reais do sistema no espaco tridimensional.
1. Equacoes de movimento 7
Einstein mostrou que o espaco euclideano e uma aproxima cao para a geometria da nossa realidade fsica,
aproxima cao valida apenas em regioes innitesimais. Segundo a teoria da relatividade geral de Einstein,
a geometria da nossa realidade e melhor descrita pela geometria riemanniana (em quatro dimensoes). A
geometria riemanniana e totalmente caracterizada por uma matriz simetrica e invertvel g
kl
denominada de
metrica. Tanto a curvatura intrnseca do espaco quanto as distancias innitesimais ds sao calculadas em
funcao da metrica. Em particular, para a geometria euclideana, g
kl
=
kl
. A distancia innitesimal entre
dois pontos de um espaco riemanniano
ds
2
=
n

k,l=1
g
kl
q
k
q
l
, (1.4)
e uma constante perante qualquer transformacao de coordenadas.
Consideremos um sistema mecanico, composto de N partculas, representado em um espaco de con-
guracao de 3N dimensoes (demonstre que ele e euclideano). Consideremos tambem m vnculos neste sistema.
Cada um destes vnculos representa uma hipersuperfcie no espaco de 3N dimensoes. A interseccao destas
superfcies m dimensionais com o espaco 3N-dimensional gera um subespaco de n = 3N m dimensoes.
Este subespaco nao e mais euclideano, mas sim um espaco curvo, riemanniano. A substituicao das 3N
coordenadas euclideanas pelas n coordenadas generalizadas faz com que a distancia innitesimal no espaco
de conguracao seja dada por
ds
2
=
n

k,l=1
a
kl
q
k
q
l
, (1.5)
onde a
kl
(q) sao funcoes das coordenadas generalizadas (prove). Continuando nesta linha, o movimento de um
sistema mecanico arbitrario pode ser estudado como o movimento de uma partcula livre em um determinado
espaco riemanniano. Assim, o problema mecanico e transformado em um problema de geometria diferencial.
1.3 Equac oes de movimento
As equacoes de movimento descobertas por Lagrange (e tambem por Euler) podem ser determinadas por
dois princpios variacionais. Em um caso, variacoes (ou deslocamentos virtuais, descritos no Apendice D)
innitesimais em torno de um estado do sistema em um determinado instante sao tomadas. As equacoes
de movimento sao obtidas impondo que o trabalho das forcas atuantes (incluindo as forcas de inercia,
introduzidas por DAlembert) no sistema seja nulo para qualquer varia cao innitesimal em torno do estado
de equilbrio. Portanto, este e um princpio diferencial, pois precisamos conhecer o estado do sistema apenas
em um dado instante de tempo. No outro caso, as equacoes de movimento sao obtidas efetuando variacoes
innitesimais em torno da trajetoria atual (no espaco de conguracao) em um dado intervalo de tempo. Neste
caso, precisamos considerar todas as possveis trajetorias no espaco de conguracao entre dois instantes de
tempo e, da, a denominacao de princpio integral (devido a Hamilton).
1.3.1 O princpio diferencial
Consideremos um sistema com N partculas, descrito por 3N coordenadas cartesianas x
r
, r = 1, . . . , 3N.
Vamos supor que estas coordenadas satisfazem m equacoes de vnculos da forma

k
(x; t) = 0, k = 1, 2, . . . , m. (1.6)
Vnculos deste tipo sao denominados de holonomicos. Como as forcas necessarias para manter estes vnculos
nao realizam trabalho, elas podem ser eliminadas das equacoes de movimento pela substituicao das 3N
coordenadas cartesianas por n = 3N m coordenadas generalizadas (linearmente independentes) q
s
, s =
1, . . . , n:
x
r
= x
r
(q; t), r = 1, . . . , 3N . (1.7)
Estas equacoes podem ser invertidas:
q
s
= q
s
(x; t), s = 1, . . . , n. (1.8)
8 1. O Formalismo de Hamilton
Diferenciando a (1.7) com relacao ao tempo, teremos
x
r

d
dt
x
r
(q; t) =
n

s=1
x
r
q
s
q
s
+
x
r
t
. (1.9)
Esta e uma nova funcao de q e q (velocidades generalizadas). Considerando q e q como linearmente indepen-
dentes, entao
x
r
q
s
=
x
r
q
s
. (1.10)
A m de efetuarmos variacoes innitesimais nas coordenadas e calcularmos o trabalho correspondente,
devemos permitir que as coordenadas generalizadas q dependam de um parametro real de tal forma que
q
s
= q
s
( = 0) e que admita uma expansao de Taylor em torno de :
q
s
( + ) = q
s
() +
dq
s
d

+O(
2
). (1.11)
Isto nos permite denir as variacoes das coordenadas q
s
como
q
s
q
s
( + ) q
s
() =
dq
s
d

. (1.12)
Portanto, as varia coes q
s
podem ser vistas como diferenciais ordinarias. Desde que o parametro nao tem
um papel importante, iremos manter apenas a notacao q
s
, mas tendo sempre em mente que estas varia coes
sao derivadas ordinarias. Uma conseq uencia imediata desta denicao para as varia coes e a interdependencia
entre as varia c oes das coordenadas e das velocidades generalizadas:
d
dt
q
s
= q
s
. (1.13)
Dito isto, podemos calcular as variacoes correspondentes nas coordenadas cartesianas usando a regra da
cadeia, pois elas sao funcoes das coordenadadas generalizadas:
x
r
=
n

s=1
x
r
q
s
q
s
=
n

s=1
x
r
q
s
q
s
, (1.14)
onde utilizamos o resultado (1.10).
Denotando por F
r
a resultante das forcas (exceto as de vnculos) em cada partcula e C
r
as forcas de
vnculos (internas), a primeira lei de Newton toma a forma
m
r
x
r
= F
r
+ C
r
, r = 1, . . . , 3N. (1.15)
O trabalho total devido aos deslocamentos x
r
, levando em conta que as forcas de vnculos nao realizam
trabalho, e:
3N

r=1
m
r
x
r
x
r
=
3N

r=1
F
r
x
r
. (1.16)
Segundo o princpio de DAlembert, as equacoes de movimento estao contidas nesta equacao, a qual pode
ser reescrita como
3N

r=1
_
F
r
m
r
x
r
_
x
r
= 0. (1.17)
O termo com o sinal negativo e a forca de inercia. No entanto, como as coordenadas cartesianas nao sao
linearmente independentes, devemos passar a Eq. (1.16) para as coordenadas generalizadas com o auxlio de
(1.14). Devido `a independencia das variacoes q
s
, a Eq. (1.16) e equivalente a
3N

r=1
m
r
x
r
x
r
q
s
=
3N

r=1
F
r
x
r
q
s
Q
s
, (1.18)
1. Equacoes de movimento 9
onde Q
s
sao as for cas generalizadas. Introduzindo a energia cinetica total do sistema,
T =
1
2
3N

r=1
m
r
x
2
r
, (1.19)
na Eq. (1.18), podemos escreve-la de novo como:
Q
s
=
d
dt
T
q
s

T
q
s
. (1.20)
Em geral, o trabalho feito pelas forcas F
r
devido `as varia coes nas coordenadas,
W = F
r
x
r
= Q
s
q
s
, (1.21)
nao dependem apenas das conguracoes (estados) nais e, portanto, nao e um diferencial exato. No entanto,
podemos nos restringir aos casos em que a forca generalizada Q
s
e derivada de uma funcao escalar V (q, q; t),
denominada de potencial:
Q
s
=
d
dt
V
q
s

V
q
s
. (1.22)
Os principais sistemas fsicos estao nesta categoria. Os sistemas que tem um potencial independente da
velocidade sao denominados de conservativos. As equacoes de movimento para os casos que obedecem a
Eq. (1.22) podem ser derivadas de uma unica funcao (escalar) denominada de lagrangiana:
L(q, q; t) = T(q, q; t) V (q, q; t). (1.23)
Substituindo a (1.22) em (1.20), obteremos as equacoes de movimento de Lagrange,
d
dt
L
q
s

L
q
s
= 0. (1.24)
A forma destas equacoes de movimento tem duas caractersticas importantes: 1) a lagrangiana nao e deter-
minada de forma unica. Em geral, temos a liberdade de adicionar na lagrangiana a derivada temporal de
uma func ao arbitraria das coordenadas e do tempo,
L L +

F(q; t), (1.25)
sem alterar as equacoes de movimento (1.24); 2) a equacao de Lagrange e invariante por transformacoes
pontuais de coordenadas no espaco de conguracao,
q
s
= q
s
( q; t), (1.26)
onde q sao as novas coordenadas.
Um exemplo muito importante, que ilustra todo o procedimento descrito ate aqui, e dado por uma
partcula (nao-relativstica) em um campo eletromagnetico. Vamos escrever a forca de Lorentz na forma
F(r, r; t) = eE(r; t) +
e
c
r B(r; t), (1.27)
e as equac oes para os campos em termos dos potenciais na forma
E(r; t) = (r; t)
1
c

t
A(r; t), B(r; t) = A(r; t). (1.28)
O problema maior aqui e saber quem e o potencial que leve a forca de Lorentz na equacao de Lagrange
(1.24). Apos algum esforco, chegaremos `a conclusao que este potencial e
V = e
e
c
r A. (1.29)
10 1. O Formalismo de Hamilton
1.3.2 O princpio integral
As equac oes de Lagrange (1.24) obtidas na secao anterior foram determinadas considerando apenas as pro-
priedades locais das trajetorias no espaco de conguracoes. Isto e, foi usado apenas deslocamentos virtuais
(ou deslocamentos independentes) em um dado instante de tempo. No entanto, esta nao e a unica forma que
temos para determinar as equacoes de movimento ou, equivalentemente, a trajetoria de um sistema dinamico
no espaco de conguracoes. Existe uma outra forma de derivar as equacoes de Lagrange considerando pro-
priedades globais (em intervalos de tempo nitos) das trajetorios no espaco de conguracoes. Neste caso, as
equacoes de movimento sao obtidas atraves de uma condicao imposta numa funcao escalar denominada de
acao: sempre que ela atingir um ponto extremo (maximo, mnimo ou de inexao), as equacoes de Lagrange
serao obtidas. Esta e a essencia do princpio variacional (integral ou global) devido a Hamilton, o qual
passaremos a discutir em detalhes.

E importante frisar que a acao desempenha um papel central nas teorias
modernas de campos (classicos e quanticos).
Seja C qualquer trajetoria conectando as conguracoes Q
1
= q(t
1
) e Q
2
= q(t
2
). As velocidades em
qualquer ponto de C sao dadas por
q
s
(t) =
d
dt
q
s
(t). (1.30)
Como a lagrangiana L do sistema e uma funcao das coordenadas q(t) e das velocidades q(t), entao a integral
[C]
_
t2
t1
dtL(q, q; t), (1.31)
tera um valor para cada curva C. Esta integral e denominada de acao. Matematicamente, a acao (1.31)
e um funcional, pois o seu valor depende das formas funcionais das coordenadas e da lagrangiana. Seja
C

uma outra curva innitesimalmente proxima `a curva C. Isto implica que os pontos extremos da curva
C

, Q

1
= q

(t

1
) e Q

2
= q

(t

2
), tambem diferem apenas innitesimalmente dos pontos extremos da curva
C. Considerando estas duas curvas arbitrarias, podemos sempre denir dois tipos de varia coes para as
coordenadas. Um tipo de varia cao e dado por medidas efetuadas independentemente nas coordendas em um
mesmo instante de tempo:
q
s
(t) q
s
(t) q
s
(t). (1.32)
As variac oes correspondentes nas velocidades sao:
d
dt
q
s
(t) = q
s
(t) = q
s
(t) q
s
(t). (1.33)
Denominaremos este tipo de variacao de deslocamentos virtuais (veja o Apendice D). O outro tipo, deno-
minado de varia cao total, e denido em instantes de tempo diferentes:
q
s
(t) q
s
(t

) q
s
(t). (1.34)
Alem de podermos comparar os valores das coordenadas nas duas curvas, podemos tambem, a qualquer
momento, comparar os dois relogios sobre as curvas C e C

:
t t

t. (1.35)
Todas estas variacoes, tanto nas coordenadas, velocidades e no tempo, estao interligadas. Para uam veri-
cacao, basta considerarmos varia coes innitesimais. Entao, ate primeira ordem na serie de Taylor, teremos
q
s
(t

) = q
s
(t + t) = q
s
(t) + q
s
(t)t. (1.36)
Esta expressao nos possibilita relacionar as duas variacoes q
s
(t) e q
s
(t) na forma
q
s
(t) = q
s
(t) + q
s
(t)t. (1.37)

E importante salientar que as coordenadas sao funcoes analticas do tempo (portanto, admitem expansoes
em series de potencias) e que todos os termos contendo innitesimais de ordem superior, como q t, nas
expansoes anteriores foram desprezados. Resta apenas calcularmos a varia cao da lagrangiana devido `as
1. Equacoes de movimento 11
variac oes nas coordenadas para podermos enunciar o princpio variacional de Hamilton. A lagrangiana
sendo uma funcao das coordenadas de cada trajetoria pode ser escrita, ate primeira ordem, em um dado
instante, como
L(q
s
, q
s
; t) = L(q
s
+ q
s
, q
s
+ q
s
; t)
= L(q
s
, q
s
; t) +
n

s=1
_
L
q
s
q
s
+
L
q
s
q
s
_
.
(1.38)
A variac ao na acao e:
= [C

] [C] =
_
t

2
t

1
dt L(q
s
, q
s
; t)
_
t2
t1
dt L(q
s
, q
s
; t)
=
_
t2
t
1
dt
_
L(q
s
, q
s
; t) L(q
s
, q
s
; t)

+
_
t2+t
t
2
dt L(q
s
, q
s
; t)
_
t1+t
t
1
dt L(q
s
, q
s
; t)
=
_
t2
t1
dt
n

s=1
_
L
q
s
q
s
+
L
q
s
q
s
_
+Lt

t2
t1
=
_
t2
t1
dt
n

s=1
_
L
q
s

d
dt
L
q
s
_
q
s
+
_
Lt +
n

s=1
L
q
s
q
s
_

t2
t
1
=
_
t
2
t
1
dt
n

s=1
_
L
q
s

d
dt
L
q
s
_
q
s
+
_
n

s=1
p
s
q
s
Ht
_

t2
t
1
,
(1.39)
onde
p
s

L
q
s
, H
n

s=1
p
s
q
s
L(q, q; t) (1.40)
sao as variaveis conjugadas `as coordenadas q
s
e ao tempo t, respectivamente. Veremos que estas variaveis
conjugadas desempenharao um papel importante na formulacao hamiltoniana. Vale notar que a variacao
calculada na ultima linha de (1.39) depende apenas da curva C e nao mais da curva C

.
Consideremos inicialmente a situacao particular onde variacoes nas trajetorias sao feitas de forma a
manter os extremos xos:
t

t
2
t1
= q
s

t
2
t1
= 0. (1.41)
Neste caso, podemos reescrever a (1.39) como
=
_
t
2
t
1
dt
n

s=1
_
L
q
s

d
dt
L
q
s
_
q
s
. (1.42)
Vemos entao que [C] = 0, pois esta varia cao e diretamente proporcional `as equacoes de Lagrange as quais
sao validas para a trajetoria C (atual) do sistema (as variacoes nas coordenadas generalizadas sao todas
independentes). Reciprocamente, podemos armar que se impormos que varia coes na trajetoria em que o
sistema se encontra devam se anular, mantendo os pontos extremos da trajetoria xos, entao as equacoes
de Lagrange sao obtidas. Portanto, elegantemente, podemos caracterizar, no espaco de conguracoes, a
dinamica de um dado sistema assim: a trajeoria atual desse sistema e aquela que deixa a acao (1.31)
estacionaria, isto e, as varia coes de primeira ordem sao nulas. Este e o princpio de Hamilton. As
equacoes de Lagrange sao derivadas deste princpio.
Vamos considerar agora o caso mais geral em que os extremos nao sao mais mantidos xos. Admitindo
que as equac oes de Lagrange sao validas na trajetoria C, neste caso, a Eq. (1.39) pode ser reescrita como:
[C] =
_
n

s=1
p
s
q
s
Ht
_

t
2
t
1
. (1.43)
Como esta variacao depende apenas das variacoes totais nos pontos extremos, podemos estender o princpio de
hamilton trocando a condicao [C] = 0 pela condicao (1.43), isto e, que a variacao [C] dependa apenas
12 1. O Formalismo de Hamilton
dos pontos extremos. Note que as equacoes de Lagrange continuam sendo derivadas deste princpio. As
quantidades p
s
e H tambem sao conhecidas como o momentum generalizado e hamiltoniana, respectivamente.
Em termos do momentum generalizado p
s
, as equacoes de Lagrange (1.24) podem ser reescritas em termos
dos momenta generalizados (1.40) simplesmente como
p
s
=
L
q
s
, p
s
=
L
q
s
. (1.44)
Vamos recapitular o que zemos ate aqui. Nos reformulamos a dinamica newtoniana construindo um
espaco formado por pontos que representam, em um dado instante de tempo, a conguracao do sistema.
Esta conguracao e caracterizada por um determinado conjunto de parametros independentes os quais foram
denominados de coordenadas generalizadas. Assim, a dinamica do sistema sera representada por trajetorias
no espaco de conguracoes. As equacoes de movimento newtonianas foram substitudas pelas equacoes de
Lagrange, determinadas exclusivamente pela lagrangiana do sistema, como uma conseq uencia do princpio
de Hamilton.
1.4 Lagrangianas e hamiltonianas
Existe uma alternativa `a formulacao lagrangiana denominada de formula cao hamiltoniana. Enquanto que as
variaveis basicas na formula cao lagrangiana sao as coordenadas generalizadas q e suas respectivas derivadas
q, na formula cao hamiltoniana as variaveis basicas sao as coordenadas generalizadas q e seus momenta conju-
gados p. Esta e, e foi assim historicamente, a forma adequada para o desenvolvimento da Fsica Quantica. A
Eq. (1.40) contem a relacao entre a lagrangiana e a hamiltoniana, a nova funcao que determinara as equacoes
de movimento. Desta forma, as velocidades q devem ser substitudas pelos momenta p, ou seja, q = q(q, p; t),
sempre que for possvel. Naturalmente, as novas equacoes de movimento, denominadas de equacoes de Ha-
milton, tambem deverao advir do mesmo princpio variacional. Para vericar isto, precisaremos construir
um espaco formados pelas coordenadas generalizadas q e os momenta conjugados p. Este espaco e denomi-
nado de espaco de fase. Cada ponto neste espaco de 2n componentes determina univocamente um estado
do sistema em um dado instante de tempo. Assim, como no espaco de conguracoes, a dinamica de um
dado sistema fsico sera representada por uma trajetoria (superfcie) no espaco de fase a qual obedecera as
equacoes de movimento de Hamilton, as quais serao determinadas em seguida.
Dado dois pontos no espaco de fase, P
1
= (q(t
1
), p(t
1
)) e P
2
= (q(t
2
), p(t
2
)), podemos imaginar o sistema
indo do ponto P
1
, no tempo t
1
, ate o ponto P
2
, no tempo t
2
> t
1
, em uma trajetoria (. Cada ponto desta
curva no espaco de fase e do tipo P(t) = (q(t), p(t)), sujeito `a condicao de contorno P
i
= (q(t
i
), p(t
i
)),
i = 1, 2. Com o auxlio da relacao (1.40) entre a lagrangiana e a hamiltoniana, podemos denir uma acao
no espaco de fase (um funcional da trajetoria () a partir da acao (1.31) no espaco de conguracoes:
[(] =
_
t
2
t
1
Ldt =
_
t
2
t
1
_
n

s=1
p(t) q(t) H(q
s
(t), p
s
(t), t)
_
dt. (1.45)
Vamos agora considerar pequenas varia coes na trajetoria ( decorrentes de variacoes independentes p(t) e
q(t) nas coordenadas p(t) e q(t), respectivamente. Os pontos extremos tambem sofrerao variacoes. Estas
variac oes no espaco de fase serao identicas `aquelas do espaco de conguracoes, ou seja, teremos dois tipos de
variac oes: uma denotada por , onde as coordenadas sao comparadas em trajetorias diferentes (( e (

) no
mesmo tempo, e outra denotada por (varia cao total), onde as coordenadas sao comparadas em trajetorias
diferentes e em tempos diferentes. Por exemplo, considerando apenas os termos de primeira ordem nas
variac oes, a quantidade p

s
(t) q
s
(t) pode ser reescrita como:
p

s
(t) q
s
(t) = (p
s
+ p
s
)( q
s
+ q
s
) = p
s
q
s
+ p
s
q
s
+ q
s
p
s
. (1.46)
Utilizando a relacao (1.37) que relaciona os dois tipos de variacoes, podemos reescrever a quantidade
p
s
(t)q
s
(t) como:
p
s
(t)q
s
(t) = p
s
(q
s
q
s
t) = p
s
q
s
p
s
q
s
t. (1.47)
1. Lagrangianas e hamiltonianas 13
Quando a hamiltoniana e avaliada em (

, diferindo apenas innitesimalmente de (, pode ser escrita, ate


primeira ordem nas variacoes, como:
H(q

, p

; t) = H(q, p, t) + H(q + q, p + p; t) = H(q, p; t) +


n

s=1
_
H
q
s
q
s
+
H
p
s
p
s
_
. (1.48)
Calculemos agora a variacao na acao (1.45):
= [(

] [(]
=
_
t

2
t

1
dt
_
n

s=1
p

s
(t) q
s
(t) H(q

(t), p

(t), t)
_

_
t2
t1
dt
_
n

s=1
p
s
(t) q
s
(t) H(q(t), p(t), t)
_
=
_
t2
t
1
dt
_
n

s=1
_
p

s
q
s
p
s
q
s

H(q

, p

; t) + H(q, p; t)
_
+
_
t

2
t
2
dtL(q

, p

; t)
_
t

1
t
1
dtL(q, p; t)
=
_
t
2
t
1
dt
n

s=1
__
q
s

H
p
s
_
p
s
+ p
s
q
s

H
q
s
q
s
_
+
_
L(q

, p

; t) L(q, p; t)
_
t

t
2
t1
=
_
t
2
t
1
dt
n

s=1
__
q
s

H
p
s
_
p
s

_
p
s
+
H
q
s
_
q
s
_
+
_
n

s=1
p
s
q
s
Ht
_

t2
t1
,
(1.49)
onde utilizamos os tres ultimos resultados e integra cao por partes. Novamente, requerendo que esta varia cao
dependa apenas dos pontos extremos,
=
_
Ht
n

s=1
p
s
q
s
_

t
2
t
1
= , (1.50)
entao obtemos as equacoes de Hamilton para o movimento como conseq uencia:
q
s
=
H
p
s
, p
s
=
H
q
s
. (1.51)
Vale notar que a variacao da acao (1.50) contem informacoes dinamicas importantes, principalmente para
a relatividade especial (veja o Apendice C). Estas informacoes surgem na seguinte situacao. Consideremos
que a evoluc ao dinamica do sistema esteja em sua trajetoria real e que as varia coes t e q
s
sejam nulas
em t
1
(esta condicao nao e necessaria mas simplica os calculos seguintes). Consideremos agora o ponto
extremo t
2
em qualquer lugar sobre a trajetoria do sistema. Isto signica que podemos interpretar a acao
como uma funcao de q, p e t, cujo diferencial total e
(p, q; t) =
n

s=1
_

q
s
q
s
+

p
s
p
s
_
+

t
t. (1.52)
No entanto, vemos em (1.50) que este diferencial tem uma forma muito particular quando restringimos a
acao sobre a trajetoria real do sistema,
=
n

s=1
p
s
q
s
Ht. (1.53)
Portanto, comparando estas duas expressoes, temos que
p
s
=

q
s
,
H =

t
,
(1.54)
isto e, o momentum generalizado e a derivada parcial da acao em relacao `a variavel conjugada (coordenadas
generalizadas) e a hamiltoniana e a derivada parcial da acao em relacao ao tempo (variavel conjugada `a
14 1. O Formalismo de Hamilton
hamiltoniana). Note que a acao nao possui uma dependencia com o momentum generalizado devido `a forma
particular da varia cao (1.50). Na relatividade especial, a quantidade H/c sera a componente temporal do
quadrivetor momentum linear.
Algumas observacoes importantes. Embora as equacoes diferenciais de Hamilton sejam de primeira
ordem, elas formam um sistema com o dobro de equacoes em relacao ao conjunto das equacoes diferenciais
de Lagrange, as quais sao de segunda ordem no espaco de conguracoes. Isto acarreta um contraste curioso
entre os dois formalismos. Dado dois pontos no espaco de conguracoes, sempre podemos encontrar uma
trajetoria conectando estes dois pontos. Isto e possvel devido `a arbitrariedade na escolha da velocidade inicial
q (devemos lembrar que uma equacao diferencial de segunda ordem necessita de duas constantes iniciais).
A situac ao no espaco de fase e completamente diferente devido `as equacoes de Hamilton serem de primeira
ordem. Como uma equacao diferencial de primeira requer apenas uma constante inicial, entao uma trajetoria
no espaco de fase e determinada completamente pela fase inicial (posicao e momentum generalizado). Desta
forma, em geral nao sera possvel garantir que uma determinada trajetoria satisfazendo as equacoes de
Hamilton passe por dois pontos escolhidos previamente no espaco de fase. No entanto, veremos que os dois
formalismos, lagrangiano e hamiltoniano, sao completamente equivalentes. Naturalmente, para cada escolha
da velocidade inicial no espaco de conguracoes havera uma curva diferente no espaco de fase correspondendo
aos mesmos pontos xos para as coordenadas generalizadas.
Resta mostrar que o formalismo lagrangiano e hamiltoniano sao equivalentes. Consideraremos aqui o
caso em que as velocidades generalizadas q possam ser escritas em funcao das coordenadas generalizadas
q e seus momenta conjugados p. Isto signica que a primeira equacao em (1.40) que dene p = p(q, q; t)
possa ser invertida para as velocidades q = q(q, p; t). Tendo em vista esta consideracao, desejamos encontrar
um funcao H(q, p; t) que contenha as equacoes de movimento de Hamilton e que esteja relacionada com a
lagrangiana L(q, q; t) atraves da transformacao em (1.40). Uma indicacao de como encontrar tal funcao H
e dada pelas equacoes de Lagrange na forma (1.44). Como o lado esquerda dela nao envolve explicitamente
as velocidades q, devemos procurar por uma funcao H

(q, p; t) tal que


p
s
=
L
q
s

q
= k
H

q
s

p
, (1.55)
onde k e uma constante. Assim, o lado direito de (1.44) tambem nao contera as velocidades q explicitamente.
A questao agora e saber se existe tal funcao H

(q, p; t) e qual sua relacao com a hamiltoniana H(q, p; t). As


respostas estao contidas na soma dos diferenciais de L(q, q; t) e H

(q, p; t):
dL(q, q; t) =
n

s=1
_
L
q
s
dq
s
+
L
q
s
d q
s
_
+
L
t
=
n

s=1
_
L
q
s
dq
s
+ p
s
d q
s
_
+
L
t
dt,
dH

(q, p; t) =
n

s=1
_
H

q
s
dq
s
+
H

p
s
dp
s
_
+
H

t
dt.
(1.56)
Usando a relacao p
s
d q
s
= d(p
s
q
s
) q
s
dp
s
, a soma desses diferenciais pode ser reescrita como
d
_
H

s
p
s
q
s
+ L
_
=
n

s=1
_
(1 + k)
H

q
s
dq
s
+
_
H

p
s
q
s
_
dp
s
_
+

t
(L + H

)dt. (1.57)
Podemos ver entao que o lado direito desta expressao e o diferencial exato de uma funcao dependente de q,
p e t. No entanto, o lado esquerdo contem termos dependentes de q, os quais podem ser eliminados caso
possamos denir uma nova funcao H(q, p; t),
H(q, p; t) =

s
p
s
q
s
L(q, q; t). (1.58)
A soma desses diferenciais anteriores em termos desta funcao H pode ser reescrita como
d(H

H) =
n

s=1
_
(1 + k)
H

q
s
dq
s
+
_
H

p
s
q
s
_
dp
s
_
+

t
(L + H

)dt
=
n

s=1
_

q
s
(H

H)dq
s
+

p
s
(H

H)dp
s
_
+

t
(H

H)dt.
(1.59)
1. Lagrangianas e hamiltonianas 15
Portanto a funcao H

(q, p; t) existe quando H(q, p; t) for da forma (1.40) e as relacoes seguintes (equacoes de
Hamilton) forem satisfeitas:
H

p
s
q
s
=

p
s
(H

H) q
s
=
H
p
s
, (1.60)
(1 + k)
H

q
s
=

q
s
(H

H) p
s
=
H
q
s
, (1.61)

t
(L + H

) =

t
(H

H)
L
t
=
H
t
. (1.62)
Note que a ultima relacao envolvendo as derivadas parciais no tempo de L e H sao ineditas. Podemos
tambem inverter todo o processo: obter as equacoes de Lagrange a partir das equacoes de Hamilton. Para
tal basta escrevermos a lagrangiana na forma
L(q, q; t) =
n

s=1
p
s
q
s
H(q, p; t), (1.63)
e calcular o seu diferencial total nos dois membros,
dL(q, q; t) =
n

s=1
_
L
q
s
dq
s
+
L
q
s
d q
s
_
+
L
t
dt
=
n

s=1
_
p
s
d q
s
+ q
s
dp
s

H
q
s
dq
s

H
p
s
dp
s
_

H
t
dt
=
n

s=1
_

H
q
s
dq
s
+ p
s
d q
s
_

H
t
dt.
(1.64)
Comparando a primeira e a ultima linha desta expressao teremos as equacoes de Lagrange
p
s
=
L
q
s
=
H
q
s
, (1.65)
p
s
=
L
q
s
(1.66)

L
t
=
H
t
. (1.67)
A transformacao (1.40), discutida no paragrafo anterior, e um exemplo de uma transformacao de contato.
Uma transformacao de contato (de primeira ordem) pode ser denida da seguinte forma. Seja F = F(x, y)
uma funcao arbitraria, onde x e y sao linearmente independentes. Por exemplo, x = q e y = q. Uma
transformacao da forma
x = x(x, F),

F =

F(x, F), (1.68)
e uma transformacao de contato se a condicao seguinte for satisfeita:
dF
F
x
dx = d

F


F
x
d x. (1.69)
Em geral, qualquer funcao G( x, y,

F; x, y, F) (funcao geratriz) satisfazendo
G( x, y,

F; x, y, F) = 0,
G
x
+
F
x
G
F
= 0,
G
x
+


F
x
G


F
= 0, (1.70)
gera uma transformacao de contato. Note que podemos, em princpio, substituir a variavel x por x nas
transformacoes (1.68). Caso esta substituicao possa ser efetuada, a nova funcao

F sera uma funcao de x
e y. Por razoes historicas, o caso particular onde x = F/x em (1.68) e conhecido como transforma cao
de Legendre. Tais transformacoes sao muito importantes em Mecanica e Termodinamica. Por exemplo,
a transformacao (1.40) e uma transformacao de Legendre com y = q, x = q, F = L(q, q; t), x = p e

F = H(q, p; t). A funcao geratriz e G = H L + p q = 0.


16 1. O Formalismo de Hamilton
1.5 Simetrias e leis de conservacao
O conceito matematico de simetria desempenha um papel de destaque em varias areas da Fsica contem-
poranea. Por exemplo, a maior parte do nosso conhecimento sobre o mundo subatomico e muito bem
explicada pelo Modelo Padrao. Este modelo unica tres das quatro forcas basicas que temos conhecimento
ate o presente: forca eletromagnetica (mantem os eletrons ligados ao n ucleo), forca fraca (mantem os n ucleos
coesos) e forca forte (conna os constituintes basicos no interior de protons e neutrons). Simetria, quando ex-
pressada matematicamente atraves dos grupos de Lie, uma homenagem a Marius Sophus Lie (18421899) pela
descoberta das propriedades innitesimais dos grupos de transformacoes contnuas,
12
e o elemento comum
nesta descric ao unicada. Cada uma destas tres forcas e descrita por campos, denominados de Yang-Mills,
os quais tem suas propriedades gerais controladas pelas algebras de Lie (u(1) para o eletromagnetismo, su(2)
para as forcas fracas e su(3) para as forcas fortes). Alem disto, essas teorias sao todas invariantes por trans-
formacoes de Lorentz, um grupo de Lie do tipo SO(1,3). A situacao nao e diferente no mundo macroscopico,
principalmente em relacao ao macrocosmos obedecendo `a Relatividade Geral, onde todas as leis (ou teorias)
fsicas devem ser invariantes por transformacoes gerais de coordenadas em um espaco-tempo curvo. Essas
transformacoes formam um grupo de Lie conhecido como o grupo dos difeomorsmos. Portanto, simetria tem
sido um dos principais guias para o estabelecimento das leis fsicas que temos conhecimento ate o momento
e continua sendo indispensavel na construcao de novas teorias como, por exemplo, supercordas. Igualmente
importante ao uso de simetria como princpio para o estabelecimento de leis fsicas, devemos mencionar os
processos de quebra de simetria presentes na natureza. Essas quebras de simetria, na realidade, por des-
creverem interacoes e suas evolu coes, e que nos permitem construir formula coes matematicas de fenomenos
naturais.
O conceito de simetria pode ser melhor entendido atraves do conceito de equivalencia. Dois objetos
sao equivalentes quando puderem ser relacionados por transformacoes. Estas transformacoes podem ser
translacoes, rotacoes, reexoes, transformacoes de coordenadas, etc. Podemos assim chamar de simetria
um conjunto de equivalencias de um determinado objeto. Em geral, leis de conservacao surgem como
conseq uencia de propriedades de simetria. Isto foi demonstrado rigorosamente no comeco do Sec. XX por
Emmy Amalie Noether (18321935). Por exemplo, a conserva cao da energia mecanica e conseq uencia da
lagrangiana ser invariante no tempo; da mesma forma, a conservacao de momentum (linear ou angular) e
conseq uencia da lagrangiana ser invariante por translacoes e rotacoes espaciais.
Do ponto de vista dinamico, e de importancia pratica e teorica precisar o conceito de constante de
movimento e quantidade conservada. Qualquer funcao F(q, q; t) = C constante sobre cada uma das possveis
trajetorias no espaco de conguracao e uma constante de movimento. Uma quantidade conservada e uma
constante de movimento que nao depende explicitamente do tempo. Das equacoes de Lagrange (1.44),
p
s
=
L
q
s
, p
s
=
L
q
s
, (1.71)
podemos ver que se a uma determinada coordenada, digamos q

, nao aparece explicitamente na lagrangiana,


entao o momentum conjugado p

e uma constante de movimento,


p

=
L
q

= 0. (1.72)
Tais coordenadas q

sao denominadas de coordenadas cclicas. Para um sistema com n graus de liberdade,


existe 2n constantes de movimento, no maximo, linearmente independentes. Admitindo que a hamiltoniana
H seja a variavel conjugada da coordenada temporal t, entao o resultado acima tambem pode ser usado para
1
Um grupo G e um conjunto de elementos {f, g, h, . . .} compartilhando as quatro propriedades seguintes: I) o produto
entre dois elementos sempre e um outro elemento do grupo, isto e g h G; II) o produto e associativo: f (g h) = (f g) h;
III) sempre existe um elemento neutro I, tal que I g = g I = g, g G; IV) sempre existe um elemento inverso g
1
, tal que
g g
1
= g
1
g = I, g G.
2
Em geral, um grupo contnuo, como o grupo das rotacoes espaciais, tem um n umero innito de elementos, pois um elemento
do grupo depende continuamente em um ou mais parametros reais. Portanto o estudo das propriedades gerais do grupo como
um todo e uma tarefa laboriosa. Lie mostrou que o estudo de um conjunto com um n umero muito reduzido de elementos
derivados dos elementos do grupo em torno da identidade e suciente para estabelecer a maior parte das propriedades gerais
de um grupo contnuo. Esse conjunto reduzido forma a algebra de Lie associada ao grupo de Lie.
1. Simetrias e leis de conserva cao 17
estabelecer que H tambem sera uma quantidade conservada. De fato, usando as equacoes (1.67), teremos
dH
dt
=

s
d
dt
(p
s

q
s
)
d
dt
L(q, q; t) =
L
t
=
H
t
. (1.73)
Portanto, sempre que a lagrangiana ou a hamiltoniana nao depender explicitamente do tempo, a hamiltoniana
H sera uma quantidade conservada. Portanto, simetria por translacoes temporais implica na conservacao da
variavel conjugada H. Em particular, quando a energia cinetica de um dado sistema puder ser escrita numa
forma quadratica nas velocidades e a energia potencial numa forma independente das velocidades,
T( q; t) =
1
2

rs
m
rs
q
r
q
s
, V = V (q; t), (1.74)
entao a hamiltoniana H em (1.40) pode ser interpretada como sendo a energia total do sistema,
H =

s
p
s
q
s
L =

s
L
q
s
q
s
T + V = T + V. (1.75)
Vimos que as equacoes de Lagrange (1.24) sao invariantes a transformacoes pontuais dadas em (1.26),
q
s
= q
s
( q; t). (1.76)
Em geral, o valor numerico da lagrangiana nao e alterado em uma transformacao deste tipo. Porem a forma
funcional da lagrangiana sera alterada:
L(q, q; t) = L
_
q( q), q( q,

q); t
_
=

L( q,

q; t), (1.77)
onde, usando (1.76),
q
s
=

r
q
s
q
r

q
r
+
q
s
t
= q
s
( q,

q)
q
s


q
r
=
q
s
q
r
. (1.78)
Vamos vericar o efeito da transformacao (1.76) no espaco de fase. Devida `a invariabilidade das equacoes
de Lagrange,

p
s
=

L
q
s
, (1.79)
o novo momentum conjugado p pode ser denido da forma usual
p
s
=


q
s

L( q,

q; t) =


q
s
L
_
q( q), q( q,

q); t
_
=

r
L
q
r
q
r


q
s
=

r
p
r
q
r
q
s
.
(1.80)
Este resultado nos mostra que, dada a transformacao (1.76), o novo momentum p esta automaticamente
denido em (1.80). Portanto, existira uma transformacao no espaco de fase, (q, p) ( q, p),
q
s
= q
s
(q; t), p
s
= p
s
(p, q; t) =

r
p
r
q
r
q
s
, (1.81)
correspondente `a transformacao (1.76). Como as equacoes de Lagrange sao equivalentes `as equacoes de
Hamilton, entao esta transformacao no espaco de fase tambem devera preservar as equacoes de Hamilton.
Vale observar que a transformacao no espaco de fase dada em (1.81), na sua forma independente do tempo
q = q( q), e uma transformacao de contato. Para vericarmos isto, basta tomarmos x = q, F = L e

F =

L
em (1.68). Neste caso, a (1.69) e (1.81) fornecem
p
s
d q
s
= p
s
d

q
s
. (1.82)
18 1. O Formalismo de Hamilton
Veremos que as transformacoes de contato formam apenas um conjunto particular das transformacoes no
espaco de fase que preservam as equacoes de Hamilton. Embora as transformacoes de coordenadas nitas,
como as transformacoes de contato, tenham uma importancia evidente, pois elas possibilitam as equacoes
de movimento serem reescritas numa forma mais simples, ainda podemos aprender muito sobre constantes
de movimento analisando somente transformacoes innitesimais. Transforma coes innitesimais podem ser
vistas como um dos innitos passos sucessivos necessarios para efetuarmos uma transformacao nita. Em
geral, podemos escrever uma transformacao innitesimal na forma
q
s
= q
s
+
r

=1

()s
(q, q; t) = q
s
+ q
s
, q
s
=
r

=1

()s
, [

[ 1, (1.83)
onde

, = 1, 2, . . . , r, sao quantidades constantes linearmente independentes e muito pequena (parametros


da transformacao innitesimal) e
()s
(q, q; t) e a funcao que caracteriza a transformacao de coordenadas.
Esta funcao ira denir o que sera a transformacao. Por exemplo, uma translacao espacial, rotacoes espaciais,
etc. Considerando o efeito de uma transformacao innitesimal na forma funcional da lagrangiana, podere-
mos inferir que quantidades serao conservadas como conseq uencia da invariabilidade da forma funcional da
lagrangiana. Uma varia cao q
s
nas coordenadas causa uma varia cao correspondente na lagrangiana:
L = L(q

, q

; t) L(q, q; t) = L(q + q, q + q; t) L(q, q; t)


=

s
_
L
q
s
q
s
+
L
q
s
q
s
_
=

,s

_
L
q
s

()s
+
L
q
s

()s
_
=

,s

_
p
s

()s
+ p
s

()s
_
=

d
dt

s
p
s

()s
,
(1.84)
onde, como usual, zemos uso das equacoes de Lagrange (1.44). Lembrando que as constantes

sao
linearmente independentes, podemos ver da expressao anterior que a quantidade
n

s=1
p
s

()s
(1.85)
e uma constante de movimento quando a varia cao L for nula. A variacao L = 0 signica que a lagrangiana
L e invariante `a transformacao de coordenadas innitesimal dada em (1.83). Este resultado e uma versao
simplicada do teorema de Noether. Mesmo quando a varia cao da lagrangiana nao e exatamente nula, ainda
podemos obter constantes de movimento. Por exemplo, quando
L =
r

=1

dF

dt
, (1.86)
onde F

e uma funcao arbitraria , ainda teremos a quantidade

s
p
s

()s
F

(1.87)
como uma constante de movimento. Nesta situacao dizemos que a lagrangiana e quasi-invariante.

E ilustrativo considerarmos o caso de uma partcula livre em movimento translacional ou rotacional. Em


qualquer um destes dois casos teremos apenas tres graus de liberdade, s = 1, 2, 3. Assim, as coordenadas
generalizadas q
s
podem ser interpretadas como as componentes espaciais x
k
, k = 1, 2, 3, do vetor posicao
e as variaveis conjugadas como as componentes do momentum linear. Consideremos inicialmente uma
transformacao com um unico parametro innitesimal e independente das coordenadas,

k
= a
k
, (1.88)
correspondendo a uma translacao espacial por um vetor a constante. Entao, de acordo com (1.85), as
componentes p
k
do momentum linear p sao quantidades conservadas. Portanto, podemos armar que a
1. Simetrias e leis de conserva cao 19
invariabilidade da lagrangiana por translacoes espaciais implica na conservacao do momentum linear. Con-
sideremos agora o movimento de rotacao da partcula em torno de um eixo xo, sem translacoes. Essas
rotacoes tridimensionais podem ser parametrizadas por tres parametros
i
, i = 1, 2, 3, e uma dependencia
com as coordenadas da forma (veja a Eq. (B.24) no Apendice B):

(i)k
=
3

j=1

ijk
x
j
, (1.89)
onde
ijk
e o tensor completamente anti-simetrico de Levi-Civita (Tullio Levi-Civita, 18731941) em tres
dimensoes.
3
Assim, da Eq. (1.85), as componentes do momentum angular
L
i
=
3

j,k=1

ijk
x
j
p
k
= (r p)
i
, (1.90)
sao quantidades conservadas. Portanto, invariabilidade rotacional na lagrangiana implica na conservacao
do momentum angular. Em todos os exemplos dados ate agora, quando a lagrangiana e invariante por
transformacoes em uma determinada variavel (tempo, posicao e angulo de rotacao) a variavel conjugada
correspondente (hamiltoniana ou energia, momentum linear e angular, respectivamente) e conservada.
A analise das condicoes que uma determinada quantidade F deva ter para ser uma quantidade conservada
e melhor analisada no espaco de fase. Esta facilidade e devida ao diferencial total de uma funcao arbitraria
F(q, p; t) no espaco de fase depender apenas das variaveis basicas (p, q) e possivelmente do tempo:
4

F =
d
dt
F(q, p; t) =

s
_
F
q
s
q
s
+
F
p
s
p
s
_
+
F
t
=

s
_
F
q
s
H
p
s

F
p
s
H
q
s
_
+
F
t
= [F, H]
(q,p)
+
F
t
,
(1.91)
onde utilizamos as equacoes de Hamilton (1.51) e a denicao seguinte:
[F, H]
(q,p)
= [H, F]
(q,p)
=

s
_
F
q
s
H
p
s

F
p
s
H
q
s
_
. (1.92)
Esta quantidade, de importancia fundamental para o formalismo hamiltoniano, e denominada de parenteses
de Poisson (Simeon Denis Poisson, 17811840). Podemos ver que F(q, p), sem a dependencia explcita no
tempo, sera uma quantidade conservada sempre que [F, H]
(q,p)
= 0. Como [H, H]
(q,p)
= 0 para uma funcao
arbitraria H, devido `a propriedade de anti-simetria do parentese de Poisson, entao a hamiltoniana sem uma
dependencia explcita do tempo sera uma quantidade conservada.
Sendo F uma funcao arbitraria no espaco de fase, entao podemos considerar as equacoes de Hamilton
(1.51) como casos particulares da derivada total em (1.91), com F = q e F = p, respectivamente:
q
s
= [q
s
, H]
(q,p)
, p
s
= [p
s
, H]
(q,p)
. (1.93)
Tambem pode ser vericado diretamente da denicao (1.92) que os parenteses de Poisson das variaveis basicas
(q, p), consideradas como independentes, sao
[q
s
, q
r
]
(q,p)
= [p
s
, p
r
]
(q,p)
= 0, [q
s
, p
r
]
(q,p)
=
rs
. (1.94)
3
Este tensor e completamente anti-simetrico em quaisquer dois ndices, igual a zero para ndices repetidos e igual a um
(menos um) para permutacoes positivas (negativas). Uma permutacao e positiva (negativa) quando o n umero de transposicoes
(permuta cao envolvendo dois elementos) para voltar `a identidade for par (mpar).
4
No espaco de conguracao o diferencial total contem tambem aceleracoes, alem das coordenadas e velocidades.
20 1. O Formalismo de Hamilton
1.6 Geometria simplectica
1.6.1 Metrica simplectica
O parentese de Poisson denido em (1.92) possui varias propriedades importantes. A determinacao e analise
de suas utilidades podem ser efetuadas de forma muito simples quando uma estrutura metrica e introduzida
no espaco de fase. A m de construir esta estrutura metrica, vamos inicialmente modicar a nossa forma
de escrever um ponto (q, p) no espaco de fase em um determinado tempo t. Considerando um sistema com
n graus de liberdade, denotaremos um ponto no espaco de fase pelo vetor contravariante

, = 1, . . . , 2n,
onde
(

) = (q
1
, . . . , q
n
, p
1
, . . . , p
n
). (1.95)
As componentes covariantes correspondentes serao determinadas pela metrica simplectica
5
:

, (

) = (p
1
, . . . , p
n
, q
1
, . . . , q
n
), (1.96)
onde

=
_

_
1 se n e = n + ,
1 se n e = n + ,
0 todos os demais casos;

=
_

_
1 se n e = n + ,
1 se n e = n + ,
0 todos os demais casos.
(1.97)
Estas componentes anti-simetricas da metrica satisfazem as relacoes usuais de ortogonalidade:

. (1.98)
Como exemplo, consideremos n = 2. Neste caso, as componentes contravariantes e covariantes da metrica
podem ser agrupadas numa matriz 4 4:
(

) =
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
, (

) =
0 0 1 0
0 0 0 1
1 0 0 0
0 1 0 0
. (1.99)
O espaco de fase com a metrica (1.97) e denominado de espaco de fase simplectico. Devido `a forma da metrica
em (1.97), a operacao de contracao

neste espaco e anti-simetrica:

. (1.100)
Quando o valor da operacao de contracao em uma das componentes entre dois objetos dados e zero, diz-se
que estes objetos sao anti-ortogonais. Portanto, qualquer objeto e anti-ortogonal a si mesmo:

= 0. (1.101)
1.6.2 Transformacoes simplecticas
Vamos denotar por V
2n
o espaco de fase simplectico. O conjunto de todos os pontos neste espaco forma um
espaco vetorial de dimensao 2n. Seja , S, T, . . . o conjunto das transformacoes lineares, : V
2n
V
2n
,
em V
2n
. As transformacoes de coordenadas no espaco de fase simplectico que matem invariante a operacao
de contracao,

, = , = , (1.102)
sao denominadas de transformacoes simplecticas.
6
Devido `a condicao quadratica em (1.102), as componentes
matriciais R

da transformacao simplectica ,

= R

, (1.103)
5
A palavra simplectico em grego signica entrelacado. Note que a metrica simplectica troca sempre q com p e p com q.
6
No Apendice A e feita uma discussao mais ampla sobre transformacoes lineares e suas propriedades.
1. Geometria simplectica 21
nao sao todas linearmente independentes, mas satisfazem a seguinte relacao quadratica:
R

(R
1
)

(R
1
)

. (1.104)
Como

e anti-simetrico, estas relacoes envolvem n(2n 1) elementos de matriz da transformacao .


Portanto, somente n(2n + 1) elementos serao linearmente independentes. De (1.104) podemos escrever os
elementos de matriz de uma transformacao inversa (admitindo que ela exista):
(R
1
)

= R

. (1.105)
Ainda admitindo a existencia da inversa, podemos escrever a transformacao correspondente para as compo-
nentes covariantes

= R

= (R
1
)

. (1.106)
Assim, enquanto as componentes contravariantes (1.103) transformam com a matriz da transformacao pro-
priamente dita, as componentes covariantes (1.106) transformam com a matriz inversa. Deniremos como
tensor no espaco de fase simplectico qualquer objeto cujas componentes sejam funcoes das coordenadas , e
possivelmente do tempo, que transformam da mesma forma que as componentes das coordenadas em (1.103)
e (1.106). O n umero de ndices (ou entradas) aparecendo nas componentes de um tensor e denominado
de ordem do tensor. Por exemplo, sendo T

um tensor de ordem dois, entao sabemos que, por denicao,


suas componentes deverao transformarem-se como:
T

. (1.107)
Um tensor e uma quantidade invariante quando suas componentes transformadas forem identicas `as compo-
nentes originais. Por exemplo, a metrica simplectica

e um tensor covariante de ordem dois, anti-simetrico


e invariante. O caracter invariante pode ser visto da relacao quadratica em (1.104). Estes resultados tambem
estao comentados na Subsecao A.4.3 do Apendice A. Mostramos tambem naquele apendice que as trans-
formacoes simplecticas formam o grupo simplectico Sp(2n), contendo n(2n + 1) geradores, os quais formam
uma algebra de Lie e podem ser representados por matrizes simetricas de traco nulo.
1.6.3 Parenteses de Poisson e de Lagrange
A metrica simplectica e a operacao de contra cao nos permite reescrever os parenteses de Poisson, denidos
em (1.92), numa forma simplicada. Sejam F
k
(; t), k = 1, . . . , r, funcoes arbitrarias denidas no espaco de
fase (veja o Apendice A). Entao o parentese de Poisson denido em (1.92) pode ser escrito como:
[F
k
, F
l
]

F
k,
F
l,
= F
k,
F
l
,
, F
k,
=
F
k

. (1.108)
Assim, podemos ver que o parentese de Poisson e invariante por transformacoes simplecticas, devido `a
contra c ao no lado direito. Devido `a propriedade de anti-simetria (1.100) desta mesma contracao, o parentese
de Poisson e anti-simetrico,
[F
k
, F
l
]

= [F
l
, F
k
]

[F
k
, F
k
]

= 0. (1.109)
Vemos de (1.108) que as variaveis basicas do espaco de fase satisfazem
[

,
=

. (1.110)
Note que o parentese de Poisson precisa de duas funcoes no espaco de fase para entao transforma-las
em uma outra funcao do espaco de fase. Uma quantidade com esta caracterstica de modicar funcoes e
denominada de operador. O parentese de Poisson (1.108) e um operador bi-linear, isto e, linear nas posicoes
ocupadas por F
k
e F
l
. Como ele e anti-simetrico, precisamos mostrar a linearidade em apenas uma de suas
duas entradas:
[F
i
+ F
k
, F
l
]

= (F
i
+ F
k
)
,
F
l
,
= [F
i
, F
l
]

+ [F
k
, F
l
]

, R. (1.111)
22 1. O Formalismo de Hamilton
Isto signica que temos uma maneira natural, dada pelo parentese de Poisson, de combinarmos duas funcoes
no espaco de fase simplectico, ou de efetuarmos um produto entre elas que seje bi-linear, para produzir
uma terceira. No contexto de algebra linear, o parentese de Poisson dene uma algebra no espaco das funcoes
denidas no espaco de fase simplectico. Os parenteses de Poisson satisfazem outra propriedade importante:
a identidade de Jacobi (Carl Gustav Jacob Jacobi, 18041851),
_
F
i
, [F
k
, F
l
]

+
_
F
l
, [F
i
, F
k
]

+
_
F
k
, [F
l
, F
i
]

= 0. (1.112)
Esta propriedade pode ser demonstrada facilmente usando a denicao (1.108) e a propriedade de anti-
simetria da metrica simplectica. Uma algebra bi-linear, anti-simetrica e obedecendo `a identidade de Jacobi
e denominada de algebra de Lie (Marius Sophus Lie, 18421899). Para nalizar, notemos que o parentese de
Poisson e um operador derivada:
[F
i
, F
k
F
l
]

= (F
i
F
k
)
,
F
l
,
= F
i
[F
k
, F
l
]

+ [F
i
, F
l
]

F
k
. (1.113)
As equac oes de Hamilton (1.93) podem ser reescritas numa forma ainda mais simples em termos de
(1.108),

= [

, H]

H
,
= H
,
. (1.114)
As componentes covariantes

podem ser escritas imediatamente das componentes contravariantes:


= [

, H]

= H
,
. (1.115)
Como exemplo, consideremos n = 1. Entao (

) = (p, q) e (

) = ( p, q). Assim, teremos as equacoes de


Hamilton esperadas: (

) = ( p, q) = (H
,
) = (H/q, H/p).
Ha uma outra quantidade importante diretamente relacionada com o parentese de Poisson, denominada
de parentese de Lagrange. Esta nova quantidade sera importante na denicao de transformacoes canonicas.
Iremos precisar de uma conjunto com 2n funcoes F

= F

(; t), linearmente independentes, no espaco de


fase para denirmos o parentese de Lagrange como
F

, F

= F

, F

. (1.116)
Estamos assumindo aqui que possamos inverter as relacoes F

= F

(; t) para escrevermos

(F; t).
Isto signica que o jacobiano,
J = det M, M

=
F

, (M
1
)

, M

(M
1
)

, (1.117)
desta transformacao e diferente de zero. Esta condicao J ,= 0 nos permite relacionar o parentese de Lagrange
com o parentese de Poisson:

[F

, F

, F

(M
1
)

(M
1
)

(M
1
)

(M
1
)

(M
1
)

= M

(M
1
)

.
(1.118)
Portanto, dado um dos parenteses podemos calcular o outro por esta relacao. Naturalmente, as relacoes
(1.118) com F = reduzem-se nas relacoes seguintes:

. (1.119)
Note que este parentese de Lagrange e um tensor covariante de ordem dois. Em geral, os parenteses de
Lagrange nao sao bi-lineares e nem satisfazem a identidade de Jacobi.
1. Transformacoes canonicas 23
1.7 Transformac oes canonicas
1.7.1 Denicao
Consideremos uma transformacao de coordenadas arbitraria, porem invertvel, no espaco de fase:

() ou q

= q

(q, p; t), p

= p

(q, p; t). (1.120)


Dada esta transformacao, queremos saber o seu efeito nas equacoes de Hamilton (1.114). Por exemplo, a
transformacao
q

= a q, p

= b p, a e b constantes, (1.121)
denominada de transformacao de escala, produz as seguintes modicacoes nas equacoes de Hamilton:
a q =
ab
b
H
p


q

= ab
H
p

,
b p =
ab
a
H
q


p

= ab
H
q

.
(1.122)
Podemos ver destas relacoes que a escolha H

= ab H mantem invariante a forma funcional das equacoes de


Hamilton. Esta transformacao de escala altera a lagrangiana correspondente pelo mesmo fator:
L

=
n

s=1
p
s
q
s
H

= ab
_
n

s=1
p
s
q
s
H
_
= ab L. (1.123)
Consideremos outro exemplo similar dado pela transformacao
q

= p, p

= q, (1.124)
denominada de inversao de coordenadas. Neste caso, as equacoes de Hamilton sao alteradas para
q =

p

=
H
p
=
H
q

=
(H)
q

,
p =

q

=
H
q
=
H
p

=
(H)
p

.
(1.125)
Portanto, a nova hamiltoniana H

= H preserva a forma funcional das equacoes de Hamilton. Sera util


calcular o parentese de Poisson para estas duas transformacoes:
(

) = (aq, bp) [

= ab

,
(

) = (p, q) [

.
(1.126)
Note que a escolha ab = 1 deixa a metrica simplectica invariante por transformacoes de escala.
Considerando que as equacoes de Hamilton (1.114) estao escritas numa forma covariante no espaco
de fase simplectico, caracterizado pela metrica simplectica (1.97), portanto, sempre que transformacoes
de coordenadas lineares preservarem a metrica simplectica (1.97), entao a forma funcional das equacoes de
Hamilton tambem serao preservadas. Isto e o que esperamos devido `a discussao sobre transformacoes lineares
feita no Apendice A. Estas transformacoes lineares que deixam invariante a metrica simplectica,
[

] =

, (1.127)
e que, conseq uentemente, preservam a forma funcional das equacoes de Hamilton,

= [

, H

], H

= H

; t), (1.128)
sao denominadas de transforma coes canonicas lineares. Podemos ver que as transformacoes que discutimos
nos dois exemplos anteriores (escala e inversao de coordenadas) nao preservam a metrica, embora a forma
das equacoes de Hamilton sejam preservadas. Portanto, elas nao sao canonicas.
24 1. O Formalismo de Hamilton
A condicao (1.127) foi obtida considerando apenas transformacoes lineares. No entanto, muitos outros
tipos de transformacoes de coordenadas, alem das lineares, tambem satisfazem a condicao (1.127). Isto
signica que podemos obter a condicao (1.127), denindo uma transformacao canonica, por outro cami-
nho. Usaremos o princpio de Hamilton para caracterizar as transformacoes canonicas e, ao mesmo tempo,
estabelecer um programa para determina-las.
Consideremos como sendo a trajetoria atual de um dado sistema dinamico no espaco de fase. Esta
mesma trajetoria pode ser descrita em termos das coordenadas ou em termos das coordenadas transfor-
madas

(). Desta forma, sobre a mesma trajetoria, as acoes


[] =
_
dt L, L =
n

s=1
p
s
q
s
H,

[] =
_
dt L

, L

=
n

s=1
p
s

q

s
H

,
(1.129)
devem fornecer as mesmas equacoes de movimento:
[] =
_
n

s=1
p
s
q
s
Ht
_

B
A
= [, H]

[] =
_
n

s=1
p
s

s
H

t
_

= [

, H

.
(1.130)
Portanto, as lagrangianas L

e L devem ser proporcionais: L

= c L. Porem, vimos no exemplo da trans-


formacao de escala (1.121) que este fator pode ser feito igual `a unidade mediante uma escolha apropriada
dos parametros de uma transformacao de escala. No entanto, como o princpio de Hamilton admite uma
contribui cao nao-nula na variacao da acao que determina as equacoes de hamilton, entao podemos adicionar
`a relacao L

= L a derivada temporal total de uma funcao arbitraria no espaco de fase:


L

= L +
dF
dt
. (1.131)
Assim, a variacao da acao tera termos diferentes de zero apenas nos pontos extremos da trajetoria. Vimos
anteriormente que a forma funcional das equacoes de Lagrange no espaco de conguracao nao e alterada
quando F(q; t), isto e, a funcao F e independente das velocidades q. Aqui, certamente a forma das equacoes de
Lagrange sera alterada. Pode haver situacoes em que a propria lagrangiana sera nula para a trajetoria real do
sistema dinamico. Estamos fazendo uso aqui da lagrangiana apenas por conveniencia, pois as transformacoes
de coordenadas estao ocorrendo no espaco de fase. Considerando todas as quantidades na relacao anterior
expressas em termos das coordenadas

, teremos:
L

=
n

s=1
p
s

q

s
H

= L
_
q(

), p(

); t
_
+
d
dt
F(

; t)
=

r,s
p
r
_
q
r
q
s

s
+
q
s
p
s

s
+
q
r
t
_
H +

s
_
F
q
s

s
+
F
p
s

s
_
+
F
t
=

s
_

r
p
r
q
r
q
s
+
F
q
s
_

q

s
+

s
_

r
p
r
q
r
p
s
+
F
p
s
_

p

s
+

r
p
r
q
r
t
+
F
t
H.
(1.132)
Sendo as variaveis

linearmente independentes, bem como suas derivadas


, entao a identidade anterior


fornece as relacoes seguintes:
F
q
s
= p
s

r
p
r
q
r
q
s
,
F
p
s
=

r
p
r
q
r
p
s
,
(1.133)
1. Transformacoes canonicas 25
e
H

= H

r
p
r
q
r
t

F
t
. (1.134)
As duas primeiras destas relacoes sao equacoes diferenciais que determinam a funcao F(

). Conhecendo F,
a terceira relacao determina a nova lagrangiana H

. A funcao F e denominado por isto de funcao geratriz


da transformacao canonica. A igualdade das derivadas mistas de segunda ordem de F nas variaveis

e
uma condicao necessaria e suciente para garantir a solucao do sistema de equacoes diferenciais parciais de
primeira ordem formado pelas duas primeiras equacoes. Assim, da primeira equacao em (1.133), a condicao

2
F
q
r
q
s
=

2
F
q
s
q
r
(1.135)
resulta em
q
r
, q
s

= 0. (1.136)
De forma analoga, a condicao

2
F
p
r
p
s
=

2
F
p
s
p
r
(1.137)
sobre a segunda equacao em (1.133), fornece
p
r
, p
s

= 0. (1.138)
A terceira condicao de integrabilidade,

2
F
p
r
q
s
=

2
F
q
s
p
r
, (1.139)
resulta em
q
r
, p
s

=
rs
. (1.140)
Caso tivessemos mantido a constante c introduzida inicialmente entre L e L

(L

= c L) ela teria aparecido


multiplicando os parenteses de Lagrange. Em suma, a condicao

, (1.141)
garante que a transformacao

() e canonica. Podemos ver desta relacao que a metrica simplectica perma-


nece de fato invariante. Naturalmente, podemos inverter estas relacoes, com o auxlio de (1.118), envolvendo
os parenteses de Lagrange e reescreve-las em termos dos parenteses de Poisson, como em (1.127). Portanto,
transformacoes canonicas formam um conjunto contendo muitos tipos de transformacoes de coordenadas no
espaco de fase. As transformacoes lineares formam um subconjunto deste conjunto maior.
Como exemplo pratico, vamos considerar uma partcula de massa m sujeita a um potencial harmonico
unidimensional com a constante de mola dada por k. A lagrangiana correspondente deste sistema massa-mola
e
L =
1
2
m q
2

1
2
kq
2
. (1.142)
A equacao de Lagrange correspondente e simplesmente
p =
L
q
, p =
L
q
q +
2
q = 0,
2
=
k
m
. (1.143)
Passemos agora para o espaco de fase onde a hamiltoniana correspondente e:
H = p q L =
1
2m
p
2
+
1
2
kq
2
. (1.144)
Esta hamiltoniana fornece as seguintes equacoes de movimento (na forma de um sistema de equacoes dife-
renciais lineares de primeira ordem):
q =
H
p
=
1
m
p, p =
H
q
= k q q +
2
q = 0. (1.145)
26 1. O Formalismo de Hamilton
A transformacao de coordenadas (dilatacao canonica)
q

=
_
k

q, p

=
_
1
m
p, (1.146)
e uma transformacao canonica. A geratriz neste caso e independente da fase (q

, p

). Considerando que
estas transformacoes sao independentes do tempo, entao H

= H. Assim, substituindo as variaveis (q, p) na


hamiltoniana pelas novas variaveis (q

, p

), teremos
H

=

2
_
q
2
+ p
2
_
. (1.147)
As novas equacoes de movimento serao determinadas pela mesma forma funcional anterior:

=
H

= p

,

p

=
H

= q

+
2
q

= 0. (1.148)
Nestes dois casos temos que resolver um sistema de equacoes diferenciais acopladas. No entanto, a trans-
formacao canonica
q

=
1

2
_
QiP
_
, p

=
i

2
_
Q + iP
_
P = iQ

, (1.149)
desacopla as equacoes de movimento. Neste caso, a funcao geratriz ainda pode ser considerada independente
(explicitamente) do tempo, porem nao mais das novas coordenadas:
F =
i
4
_
Q
2
2iQP + P
2
_
. (1.150)
Novamente, a nova hamiltoniana H

sera obtida da antiga H

por uma simples substituicao de variaveis:


H

= i QP. (1.151)
As equacoes de Hamilton neste caso sao:

Q =
H

P
= i Q,

P =
H

= i P. (1.152)
Vale notar que a lagrangiana corresponde e
L

= P

QH

= P

Q + i QP. (1.153)
Assim, quando as equacoes de movimento sao utilizadas, teremos L

= 0. Isto tambem acontece com a


lagrangiana correspondente `a equacao de Dirac.
1.7.2 Equacao de Hamilton-Jacobi
Consideramos na Secao anterior que a funcao geratriz dependesse das variaveis (q

, p

) e possivelmente do
tempo. Neste caso as duas equacoes diferenciais em (1.133) determinam a geratriz F(q

, p

; t). Tendo a
geratriz, a equacao em (1.134) determina a nova hamiltoniana. As equacoes de movimento provenientes
desta nova hamiltoniana podem ser mais simples do que as originais, permitindo assim a sua solucao de
forma menos trabalhosa. No entanto, podemos usar transformacoes de coordenadas de varias outras formas
com o objetivo de obter a solucao das equacoes de movimento, isto e, (t, , ), com e sendo as 2n
constantes de integracao necessarias para podermos resolver as equacoes de Hamilton. Estas sao funcoes
da fase inicial
0
em algum instante inicial t = t
0
. Ha apenas quatro tipos distintos de efetuarmos este
programa. Estes quatro tipos estao sumariados na Tabela 1.1.
A Tabela 1.1 mostra na segunda coluna as variaveis independentes utilizadas para determinar cada
transformacao. Estas variaveis independentes sao sempre uma mistura igual das variaveis antigas e das
variaveis novas

. Qualquer variacao neste percentual e essencialmente uma combina cao dos quatro tipos
de transformacoes apresentadas na Tabela 1.1. Caso o conjunto contendo as 2n coordenadas escolhidas
1. Transformacoes canonicas 27
nao seja linearmente independente, os multiplicadores de Lagrange devem ser usados. A terceira coluna
contem a func ao geratriz apropriada a cada uma das escolhas das coordenadas independentes. A quarta
coluna apresenta as equacoes diferenciais resultantes da condicao (1.131) apos a consideracao das variaveis
independentes listadas na segunda coluna. A quinta coluna exibe a condicao que a geratriz deve satisfazer
para que seja possvel escrever as novas coordenadas independentes em funcao de todas as antigas coordenadas
apos as equacoes diferenciais na quarta coluna terem sido resolvidas. Esta condicao e essencialmente a
condicao de um jacobiano diferente de zero para que uma transformacao de coordenadas seja invertvel.
Tipo Vars. Geratriz Equacoes Jacobiano
I (q, q

) F
I
= F p =
F
I
q
, p

=
F
I
q

, H

= H +
F
I
t
det

2
F
I
qq

,= 0
II (q, p

) F
II
=

n
s=1
p

s
q
s
F p =
F
II
q
, q

=
F
II
p

, H

= H +
F
II
t
det

2
F
II
qp

,= 0
III (p, q

) F
III
=

n
s=1
p
s
q
s
+ F q =
F
III
p
, p

=
F
III
q

, H

= H
F
III
t
det

2
F
III
pq

,= 0
IV (p, p

) F
IV
=

n
s=1
_
p
s
q
s
p

s
q
s
+ F
_
q =
F
IV
p
, q

=
F
IV
p

, H

= H
F
IV
t
det

2
F
IV
pp

,= 0
Tabela 1.1: Os quatro tipos independentes de transformacoes canonicas. Qualquer outra escolha para as
variaveis independentes sera uma combina cao destas apresentadas na segunda coluna.
O objetivo das transformacoes canonicas e auxiliar a resolucao das equacoes de Hamilton, isto e, deter-
minar a dependencia temporal das coordenadas generalizadas no espaco de fase, (
0
, t). Como as equacoes
de Hamilton sao de primeira ordem, a especicacao de 2n constantes iniciais
0
e suciente para determinar
univocamente as trajetorias (t,
0
). Assim, podemos determinar a transformacao canonica que leve as
coordenadas (t) nas coordenadas

independentes do tempo. Isto e, evidentemente, uma forma de resol-


ver as equac oes de Hamilton, pois teremos, apos a transformacao,

(; t). Estas relacoes podem ser


invertidas para (t,

). Sendo

independentes do tempo, entao podemos relaciona-las com as constantes


de integracao. Nesse sentido, as transformacoes canonicas do tipo II sao indispensaveis.
Uma forma de garantir que as novas coordenadas
0
serao independentes do tempo e requerer que a nova
hamiltoniana H

; t) seja nula. Assim,

= [

, H

= 0]

= 0. (1.154)
Esta condicao H

= 0, juntamente com a informacao contida na quarta coluna da Tabela 1.1 para uma
transformacao do tipo II, nos permite escrever, em um determinado tempo t,
H(q, p; t) +
F
II
t
= 0, p = p(q, p

; t), F
II
= F
II
(q, p

; t). (1.155)
Ainda da Tabela 1.1, para uma transformacao do tipo II, temos
p =
F
II
q
. (1.156)
Substituindo esta relacao em H(q, p; t), obteremos
H
_
q,
F
II
q
; t
_
+
F
II
t
= 0. (1.157)
Esta e a equacao diferencial de Hamilton-Jacobi para a geratriz. Ela e uma equacao diferencial contendo n+1
derivadas parciais. No entanto, podemos observar que a geratriz F
II
nao aparece explicitamente na equacao
de Hamilton-Jacobi, mas apenas as suas derivadas. Conseq uentemente, uma das constantes de integracao
deve ser aditiva, o que nao ira importar para a determinacao da nova hamiltoniana H

em (1.134) (ate mesmo


porque H

= 0). Portanto, a solucao da equacao de Hamilton-Jacobi (1.157) e da forma F


II
(q; ; t), onde
sao as n constantes de integracao. Caso tivessemos um sistema de n equacoes linearmente independentes
28 1. O Formalismo de Hamilton
envolvendo a geratriz e um outro conjunto de n constantes , independentes do tempo, entao poderamos
resolver este sistema e determinar q = q(t, , ). Estas equacoes existem e sao determinadas por
q

=
F
II
p

. (1.158)
Esta relac ao e uma conseq uencia da transformacao ser do tipo II, como pode ser visto da Tabela 1.1. Fazendo
= p

e = q

, entao esta relacao fornece q = q(t, , ). Desta forma as equacoes de Hamilton sao resolvidas
pela transformacao canonica do tipo II.
A geratriz F
II
e uma funcao, ou melhor, um funcional, ao qual ja fomos apresentados. De fato, para
vericarmos isto, basta calcularmos a derivada temporal total dela (lembrando que

sao independentes do
tempo):

F
II
=
n

s=1
_
F
II
q
s
q
s
+
F
II
p
s

s
+
F
II
t
=
n

s=1
p
s
q
s
+
F
II
t
= L. (1.159)
Portanto, a geratriz F
II
e o funcional acao
=
_
dt L. (1.160)
Isto signica que a acao , alem de fornecer as equacoes para a dinamica do sistema, gera a transformacao

0
(t), isto e, de uma fase inicial
0
, em um tempo inicial t
0
, para uma fase (t), em tempo arbitrario t.
1.7.3 Evolucao temporal
Vamos considerar aqui uma situacao envolvendo uma classe particular de transformacoes canonicas muito
importante para a Fsica Teorica Basica. Consideremos o conjunto das transformacoes canonicas lineares
7
R(a) que forma um grupo de Lie dependente de um unico parametro a. Vamos admitir aqui que a aplicacao
exponencial (A.34) seja valida em todo o domnio do parametro a. Assim, dado um ponto inicial
0
= (0)
no espaco de fase, a transformacao R(a) leva o ponto
0
no ponto (a):
(a) = R(a)
0
= e
a

0
,

L =
R
a

a0
. (1.161)
Estamos denotando por

L o gerador da transformacao R e supondo que a identidade seja R(0). Como
no exemplo do grupo das rotacoes no plano perpendicular ao eixo de rotacao apresentado no Apendice A,
Eq. (A.14), a transformacao linear R(a) descreve uma curva (a) no espaco de fase.
Vamos requerer que a transformacao linear R(a) em (1.161) seja canonica. Isto signica que a metrica
simplectica deve ser preservada (invariante) para cada valor do parametro a da transformacao. Esta condicao
de invariancia da metrica dene tambem uma transformacao simplectica. Consideremos dois pontos in-
nitesimalmente proximos no espaco de fase: (a) e (a + a), com a 0. Neste caso, considerando a
aplicacao exponencial em (1.161), podemos escrever, ate primeira ordem em a,
(a + a) = R(a + a)
0
= e
a

L
e
a

0
= (1 + a

L)(a). (1.162)
Impondo que a metrica simplectica seja preservada,

=
_

+ a

+ a

=

L

, (1.163)
entao, ate primeira ordem em a, esta condicao implica em
_

=
_

. (1.164)
Reescrevendo os parenteses de Poisson explicitamente,

ou
,
=
,
, (1.165)
7
Veja a discussao sobre transformacoes lineares, grupos e algebras de Lie no Apendice A.
1. Transformacoes canonicas 29
facilita a identicacao das funcoes contnuas

como sendo componentes de um gradiente:

= [

, ]

. (1.166)
Analisando a estrutura de (1.166), podemos identicar o gerador

L com o operador diferencial [ , ]

. Assim,
a acao deste operador em qualquer funcao F() no espaco de fase e efetuada pelo parentese de Poisson,

LF() = [F, ]

,

L = [ , ]

. (1.167)
Isto signica que a acao do gerador

L e invariante por transformacoes lineares simplecticas (ou canonicas):

LF()

= [F, ]

=

LF()

0
= [F, ]

0
. (1.168)
Supondo que a funcao escalar seja conhecida, a relacao (1.162) pode ser reescrita como uma equacao
diferencial para (a):
d
da
= lim
a0
(a + a) (a)
a
=

L = [, ()]

= [, (
0
)]
0
. (1.169)
De fato, a solucao desta equacao diferencial e a aplicacao exponencial (1.161). A ultima igualdade e devida
`a invariancia da acao do gerador

L e ao fato de ser um campo escalar cuja forma funcional e constante:
() = (
0
). A funcao escalar presente na denicao (1.167) nao pode depender explicitamente do
parametro a, pois o gerador

L nao depende de a. No entanto, ela pode ter uma dependencia implcita em a
atraves de , = ((a)). Porem, podemos ver que mesmo a derivada total de em relacao ao parametro
a e zero:
d
da
=

da
=

[, ]

= 0,

a
= 0 () = (
0
). (1.170)
Este resultado e importante, pois precisamos conhecer a funcao escalar apenas na origem para efetuar uma
transformacao canonica linear gerada por de forma innitesimal.
Vamos considerar aqui o efeito de uma transformacao simplectica na forma funcional de uma funcao
arbitraria F() no espaco de fase. Ate primeira ordem em a, podemos escrever
F( a

) = F() a

= F() a [, F]

= [,

. (1.171)
Isto implica na seguinte equacao diferencial para a funcao F, levando em conta a invariancia do parenteses
de Poisson:
dF
da
= [, F]

= [, F(
0
)]
0
. (1.172)
Portanto, a nova forma funcional F

a
e dada pela transformacao simplectica
F((a)) = e
a

H
F(
0
) = F

a
(
0
),

H = [, ]
0
. (1.173)
Tendo visto a conseq uencia de uma transformacao simplectica em uma funcao arbitraria, devemos investigar
tambem o comportamento do parentese de Poisson sob uma transformacao simplectica. Como sempre, ate
primeira ordem em a, teremos
[A( a

), B( a

)]

= [A, B]

a
__
A, [, B]

+
_
[, A]

, B

_
= [A, B]

a
_
, [A, B]

= [A, B]

a
_
, [A(
0
), B(
0
)]
0

0
.
(1.174)
Isto signica que o parentese de Poisson [A, B]

obedece a equacao diferencial de uma transformacao


simplectica,
d
da
[A, B]

=
_
, [A(
0
), B(
0
)]

0
, (1.175)
30 1. O Formalismo de Hamilton
e, portanto,
[A(), B()]

= [ e
a

H
A(
0
), e
a

H
B(
0
)]

0
= e
a

H
[A(
0
), B(
0
)]

0
. (1.176)
Suponha que o parametro da transformacao canonica seja o tempo, a = t, e = H(), onde H() e
a hamiltoniana (explicitamente independente do tempo). Entao das discussoes anteriores, a solucao formal
das equacoes de movimento de hamilton,
= [H, ]

= [H(
0
),
0
]

0
, (1.177)
pode ser interpretada como sendo uma transformacao simplectica nita no espaco de fase:
(t) = e
a

H

0
,

H
0
= [H(
0
),
0
]

0
. (1.178)
Dado uma fase inicial
0
, em algum instante inicial, entao a fase (t) em um instante posterior e determinada
por uma transformacao canonica que e uma transformacao simplectica, cujo gerador e essencialmente a
hamiltoniana H calculada em
0
. Vimos anteriormente que a acao (integral da lagrangiana) e a geratriz da
transformacao do tipo II a qual estabelece a equacao de Hamilton-Jacobi. Portanto, a evolucao temporal das
variaveis dinamicas ocorre de acordo a uma transformacao canonica no espaco de fase que pode ser vista de
duas formas equivalentes: uma transformacao canonica nao-linear gerada pela lagrangiana (atraves da acao)
ou por uma transformacao simplectica, que e canonica e linear e, portanto, forma um grupo contnuo, gerada
somente pela hamiltoniana. No ultimo caso, o tempo e o parametro da transformacao e a hamiltoniana nao
depende explicitamente do tempo. Assim, a hamiltoniana descreve a forma innitesimal do movimento no
espaco de fase, enquanto que a acao descreve a forma nita deste movimento. Este resultado foi utilizado
por Feynman em Mecanica Quantica.
1.7.4 Teorema de Liouville
Apendice A
Transformac oes Lineares
A.1 Introducao
Alguns tipos de transformacoes lineares sao muito importantes para varias areas da Fsica. Esta importancia
e devida ao fato de transformacoes lineares formarem um grupo o qual e a linguagem matematica para o
conceito de simetria em Fsica. Estaremos interessados aqui em tres tipos especiais de transformacoes line-
ares: I) transformacoes ortogonais em espacos euclideanos, as quais formam o grupo das rotacoes espaciais;
II) transformacoes ortogonais no espaco de Minkowski, as quais formam o grupo de Lorentz da Relatividade
Especial; e III) transformac oes simplecticas no espaco de fase, as quais formam o grupo simplectico. A
importancia de cada um desses grupos de simetria reside nos fatos seguintes: o grupo das rotacoes espaciais
e de extrema importancia para a teoria do momentum angular; o grupo de Lorentz e a base da Relativi-
dade Especial de Einstein por conter as contracoes de FitzGerald-Lorentz; e o grupo simplectico contem as
transformacoes canonicas, as quais sao fundamentais para a dinamica classica.
Como transformacoes lineares atuam em algum espaco vetorial, precisaremos denir algumas quantidades
basicas antes de denirmos transformacoes lineares. Inicialmente, faremos uso da nocao abstrata de um
espaco vetorial, sem nos preocupar com a realidade fsica desse espaco vetorial. Apos a denicao de uma
transformacao linear, daremos uma interpretacao fsica ao espaco vetorial abstrato como sendo o espaco
euclideano tridimensional, ou o espaco quadridimensional de Minkowski ou o espaco de fase do formalismo
hamiltoniano.
A.2 Transformac oes lineares
Seja V
n
um espaco vetorial de dimensao n. Vamos denotar por x e y dois pontos (vetores) quaisquer de V
n
.
Uma aplicacao em V
n
e uma regra que associa pontos de uma dada regiao de V
n
a pontos de uma outra
regiao do mesmo espaco V
n
ou de um outro espaco, como o conjunto dos n umeros reais R, e vice-versa. Por
exemplo, uma funcao F em V
n
e uma aplicacao de V
n
no conjunto dos n umeros reais:
F : V
n
R, F(x) R, x V
n
. (A.1)
Uma curva real (forma parametrica) em V
n
e uma aplicacao dos n umeros reais R em V
n
:
: R V
n
, (t) V
n
, t R. (A.2)
Uma transforma cao linear em V
n
e uma aplicacao de V
n
em V
n
,
: V
n
V
n
, x V
n
, x V
n
, (A.3)
satisfazendo a seguinte regra (linearidade):
(x + y) = x + y, x, y V
n
, R. (A.4)
31
32 A. Transformacoes Lineares
Como qualquer vetor x em V
n
pode ser escrito como uma combinacao linear dos vetores e
i
de uma
determinada base,
x = (x
1
, , x
n
) =
n

i=1
x
i
e
i
, x
i
R, (A.5)
entao podemos escrever a acao de uma transformacao linear numa forma matricial. Para tal, precisamos
conhecer a acao da transformacao linear em cada vetor e
i
. A acao de uma transformacao linear em e
i
sera um outro vetor e

i
= e
i
em V
n
,
1
cujas componentes vamos denotar por R
i
j
:
e

i
= e
i
=
n

j=1
R
j
i
e
j
, R
j
i
R. (A.6)
Assim, podemos representar a acao de uma transformacao linear por uma matriz R cujos elementos de
matriz sao R
i
j
, com i denotando as posicoes das linhas e j as posicoes das colunas. Em relacao a algum
sistema de coordenadas, a acao de uma transformacao linear em um vetor arbitrario pode ser escrita da
seguinte forma:
y = x =
n

i=1
x
i
e
i
=

i,k
x
i
R
k
i
e
k
=
n

k=1
y
k
e
k
y
k
=
n

i=1
R
k
i
x
i
. (A.7)
Note que as componentes y
k
e os vetores de base e
k
transformam-se de formas distintas. Qualquer quantidade
(vetor, tensor, etc.) cujas componentes transformam como os vetores de base, isto e, como em (A.6), elas sao
denominadas de covariantes. Quando tais componentes transformam como em (A.7), elas sao denominadas
de contravariantes.
A.2.1 Grupos de Lie
Dada uma transformacao linear , y = x, podemos denir uma outra transformacao linear
1
como
sendo a transformacao oposta a : x =
1
y. Esta transformacao
1
e denominada de inversa. Em termos
matriciais, podemos ver de (A.7) que a condicao det R ,= 0 deve ser vericada para garantir a existencia da
transformacao linear inversa. A sua matriz correspondente e a matriz inversa R
1
. Ao contrario da inversa
que depende de uma condicao envolvendo o determinante da matriz correspondente, a transformacao linear
identidade 1 sempre existe. A identidade e a aplicacao trivial: x = 1x, x V
n
. A sua matriz correspondente
e a matriz identidade I. Seja G = I, R, S, T, . . . o conjunto das transformacoes lineares invertveis contendo
a identidade. Podemos usar a composicao o entre aplicacoes, ou o produto matricial usual RS, para
denir um produto entre duas transformacoes. Entao os elementos desse conjunto satisfazem as seguintes
propriedades:
Fechamento: RS G, R, S G; (A.8)
Identidade: IR = RI = R, R G; (A.9)
Inversibilidade: R
1
R = RR
1
= I, R G; (A.10)
Associatividade: (RS)T = R(ST), R, S, T G. (A.11)
Qualquer conjunto satisfazendo estas quatro condicoes, em relacao a algum produto previamente denido,
e denominado de grupo. O produto entre os elementos de um grupo e uma operacao envolvendo dois
elementos do grupo. Como resultado desta operacao binaria, um outro elemento do grupo e criado. Em
muitos exemplos de grupos, o produto nao e simplesmente o produto usual.

E importante frisar que um
grupo esta denido apenas quando esta operacao binaria entre seus elementos estiver denida. Por exemplo, o
conjunto dos n umeros inteiros (positivos e negativos, incluindo o zero) forma um grupo em relacao `a operacao
binaria denida pela adicao, porem este mesmo conjunto nao forma um grupo em relacao `a multiplicacao
com a presenca do zero.
A teoria dos grupos e uma area da matematica muito bem desenvolvida. Isto signica que a teoria dos
grupos estabelece muitas propriedades gerais e abstratas sobre os elementos de um grupo. Rotacoes espaciais
1
Estamos adotando o ponto de vista em que a base permanece inalterada e o os vetores sao alterados.
A. Transforma coes lineares 33
e transformacoes de Lorentz sao exemplos tpicos de grupos como estruturas matematicas de relevancia para a
Fsica. Em geral, transformacoes lineares de coordenadas tendem a modicar a forma de certas quantidades
fsicas. No entanto, algumas transformacoes particulares podem deixar certas operacoes ou quantidades
inalteradas. Neste caso, dizemos que tais quantidades ou operacoes admitem um determinado grupo de
simetria. Por exemplo, as transformacoes de Lorentz deixam a operacao de contra cao (ou o modulo de um
vetor) no espaco-tempo invariante.
Um grupo pode conter uma quantidade nita ou innita de elementos. Por exemplo, todas as operacoes
de simetria de um triangulo eq uilatero formam um grupo nito (tambem denominado de grupo discreto), isto
e, um grupo com uma quantidade nita de elementos:
C
3v
= I, C
3
, C
2
3
,
1
,
2
,
3
. (A.12)
A transformacao identidade esta representada por I. Ha duas rotacoes em torno do eixo perpendicular ao
plano do triangulo que passa pelo baricentro, uma de 120

(C
3
) e outra de 240

(C
2
3
). As tres transformacoes
restantes
i
sao reexoes por espelhos perpendiculares ao plano do triangulo e contendo o baricentro e um
dos tres vertices. Este grupo C
3v
e o grupo de simetria de um triangulo eq uilatero. Grupos nitos sao muito
importantes em Fsica do Estado Solido e Fsica Molecular.
Em geral, os elementos de um grupo nito sao transformacoes por quantidades nitas e discretas. No en-
tanto, podemos ter tambem grupos formados por transformacoes contnuas, denominados de grupos contnuos.
Qualquer grupo contnuo possui innitos elementos. Por exemplo, o conjunto innito das rotacoes,
R() =
_
_
cos() sen () 0
sen () cos() 0
0 0 1
_
_
, det R() = 1. (A.13)
por um angulo 0 < 2 em torno do eixo z, perpendicular ao plano x y, forma um grupo contnuo.
Para cada valor do parametro 0 < 2, ha uma unica rotacao R() e a sua inversa R
1
(). A identidade
e obtida quando = 0 (ou em = 2). A rotacao inversa de R() pode ser escrita concisamente como a
rotacao R(), isto e, como uma rotacao no sentido contrario da rotacao R(). Tambem pode ser vericado
diretamente que o produto matricial entre duas rotacoes R() e R() e outra rotacao R(), com = +.
Observe que o parametro novo e uma funcao analtica dos parametros antigos e . Vejamos a acao deste
grupo nos vetores espaciais r = (x, y, z). Entao,
r

= R() r
x

= xcos() ysen (),


y

= xsen () + y cos(),
z

= z.
(A.14)
Desta forma, podemos interpretar a acao da rotacao R() no vetor r como o movimento do ponto (x, y, z)
sobre uma curva C(), que e uma circunferencia de raio
_
x
2
+ y
2
centrada na origem a uma altura z do
plano x y, descrita parametricamente pelas duas primeiras equacoes em (A.14). Portanto, a curva C() e
o lugar geometrico da transformacao R().
Estaremos interessados aqui nos grupos contnuos de transformacoes lineares. Em geral, os elementos de
um grupo contnuo G dependem de um certo n umero r de parametros reais a
1
, , a
r
. Um grupo contnuo
com uma dependencia analtica em seus parametros e denominado de grupo de Lie.
2
Esta dependencia
analtica nos parametros a

, = 1, . . . , r, deve ser entendida da seguinte forma. Dados dois elementos R(a)


e R(b) de um grupo de Lie G, entao o elemento R(c) = R(a)R(b) depende analiticamente dos parametros
a e b, isto e, c = f(a, b) e uma funcao analtica. Iremos aqui distinguir os grupos de Lie, relacionados com
rotacoes espaciais no espaco euclideano, rotacoes no espaco-tempo e o grupo das transformacoes simplecticas
no espaco de fase, denindo um processo de medida invariante a estas transformacoes lineares.
2
Os grupos de Lie e suas algebras associadas foram descobertos por Marius Sophus Lie (18421899) e, independentemente,
por Wilhelm Karl Joseph Killing (18471923). Lie estava estudando tecnicas para encontrar solucoes de equacoes diferenciais
por quadraturas via transformacoes lineares. Este trabalho foi inspirado nos trabalhos de Evariste Galois (18111832) quem
inventou (ou descobriu) a nocao de grupo.
34 A. Transformacoes Lineares
A.2.2 Tensores
Podemos denir um processo de medida em um espaco vetorial V
n
como sendo uma funcao real bilinear
em V
n
V
n
(produto cartesiano),
: V
n
V
n
R, (x, y) R, x, y V
n
, (A.15)
tal que
(x + ay, z) = (x, z) + a(y, z),
(z, x + ay) = (z, x) + a(z, y), x, y, z V
n
, a R.
(A.16)
Esta func ao e denominada tambem de forma bilinear em V
n
. Vale observar que uma forma quadratica
bilinear qualquer sempre pode ser escrita como a soma de uma forma simetrica
+
,

+
(x, y) =
1
2
_
(x, y) + (x, y)
_
,
+
(y, x) =
+
(x, y), (A.17)
e outra anti-simetrica

(x, y) =
1
2
_
(x, y) (x, y)
_
,

(y, x) =

(x, y). (A.18)


De fato, das duas equacoes anteriores, temos
(x, y) =
+
(x, y) +

(x, y). (A.19)


Veremos que a denicao de uma forma bilinear coincide com a nossa nocao intuitiva de produto escalar
entre vetores no espaco euclideano tridimensional. Em termos de coordenadas, a denicao (A.15) pode ser
reescrita como:
(x, y) =

i,k
x
i
y
k
(e
i
, e
k
) =

i,k
g
ik
x
i
y
k
, g
ik
= (e
i
, e
k
). (A.20)
Os n umeros reais (e
i
, e
k
) podem ser agrupados em uma matriz (g
ik
), a qual e denominada de metrica em
V
n
. Quando a metrica (g
ik
), associada com uma dada forma bilinear , possuir uma inversa, a inversa sera
denotada por (g
ik
),
n

k=1
g
jk
g
ki
=
n

k=1
g
ik
g
kj
=
i
j
. (A.21)
A metrica contem informacoes sobre as orienta coes relativas entre os vetores de uma determinada base. Um
espaco vetorial equipado com uma metrica e um espaco metrico. A metrica e a quantidade que caracteriza um
espaco metrico de forma unica. Quando falamos de um espaco euclideano, ou de um espaco de Minkowski,
temos sempre em mente uma metrica especca para cada um desses espacos.
Uma metrica nos permite reescrever as componentes de vetores em V
n
numa forma alternativa. As
componentes x
k
sao denominadas de contravariantes. A outra possibilidade e:
x
k
=
n

i=1
g
ki
x
i
= g
ki
x
i
(soma implcita em i), x
k
= g
ki
x
i
(soma implcita em i). (A.22)
As componentes x
k
sao denominadas de covariantes. As componentes covariantes sao de grande valia para
o formalismo em si. Por exemplo, fazendo uso das componentes covariantes denidas em (A.22), podemos
reescrever concisamente a forma bilinear em (A.20) como:
(x, y) = x
k
y
k
(soma implcita em k). (A.23)
Estamos usando, desde (A.22), a convencao de soma implcita. Nesta convencao, sempre omitiremos o smbolo
de soma quando ha uma soma envolvendo ndices covariante e contravariante. Este tipo de soma envolvendo
um ndice contravariante e um ndice covariante e tambem denominada de contracao. Veremos que a con-
tracao (A.23) coincide com a nossa maneira usual de calcular o produto escalar entre os vetores x e y no
espaco euclideano tridimensional.
A. Transforma coes lineares 35
Tendo denido em (A.20) um processo de medida pela metrica g
ik
, podemos especicar os diferentes
grupos de simetria formados por transformacoes lineares que deixam a forma bilinear (A.23) invariante. Seja
(R
k
i
) a matriz de uma transformacoes linear . Entao,
x
k
= R
k
i
u
i
, y
k
= R
k
i
v
i
. (A.24)
Usando (A.23), teremos:
(x, y) = x
k
y
k
= g
kl
x
k
y
l
= g
kl
R
k
i
R
l
j
u
i
v
j
(u, v) = u
i
v
i
= g
ij
u
i
v
j
.
(A.25)
Requerendo que (x, y) = (u, v), podemos concluir que os elementos de matriz da transformacao linear
devem satisfazer as seguintes relacoes quadraticas:
g
kl
R
k
i
R
l
j
= g
ij
. (A.26)
Podemos ver que as componentes g
kl
da metrica transformam-se como os vetores de base em (A.6). Portanto,
elas sao componentes covariantes. A quantidade das relacoes (A.26) depende apenas das propriedades da
metrica (simetrica, anti-simetrica, simplectica, etc.). Calculando o determinante nos dois lados de (A.26),
teremos:
[(det R)[
2
= 1. (A.27)
Vemos entao que o determinante de qualquer transformacao linear preservando a forma bilinear (A.23) tem
de ter modulo unitario (1). Em geral, temos de escolher as transformacoes com [(det R)[ = 1, pois a
identidade tem determinante igual a um e ela e necessaria para a formacao de um grupo. No entanto as
demais transformacoes com determinante de modulo negativo tambem sao importantes em Fsica por estarem
associadas a inversoes espaciais e temporais. As relacoes (A.26) podem tambem ser escritas em termos dos
elementos de matriz (R
1
)
k
i
da transformacao inversa:
g
kl
= (R
1
)
i
k
(R
1
)
j
l
g
ij
. (A.28)
De qualquer uma destas relacoes quadraticas, podemos calcular facilmente os elementos de matriz da trans-
formacao inversa:
(R
1
)
i
j
= g
jk
R
k
l
g
li
= R
j
i
. (A.29)
Portanto, qualquer transformacao linear que deixa a forma bilinear (A.23) invariante deve satisfazer as
relacoes quadraticas (A.26) ou, equivalentemente, (A.28). Neste caso, a matriz da transformacao inversa e
calculada facilmente por (A.29), uma vez tendo a forma explcita da metrica. Usando a denicao (A.22),
podemos ver de (A.7) que as componentes covariantes x
k
transformam-se com a matriz inversa:
y
k
= (R
1
)
i
k
x
i
. (A.30)
Ha muitas quantidades matematicas de interesse fsico que precisam de mais de dois ndices para serem
especicadas completamente. Em geral, as componentes de tais quantidades sao funcoes em V
n
. Neste caso,
uma transformacao linear pode alterar a forma destas quantidades de maneira imprevisvel. No entanto,
existe uma classe formada por quantidades cujas componentes mudam da mesma forma que as componentes
(contravariantes, (A.7), e covariantes, (A.30)) dos vetores em V
n
. Estas quantidades especiais sao denomi-
nadas de tensores. Note que a denicao de tensores apresentada aqui depende da existencia de um grupo
de transformacoes lineares. Os tensores, por exibirem estas propriedades sao candidatos naturais a serem
utilizados em qualquer modelo fsico. A quantidade de ndices (ou entradas) disponveis em um tensor e de-
nominada de ordem do tensor. Assim, um escalar e um tensor de ordem zero, um vetor e um tensor de ordem
um, uma matriz e um tensor de ordem dois, etc. Por exemplo, dado que a quantidade T
i
k
e um tensor de
ordem dois, entao sabemos exatamente como suas componentes modicam-se mediante uma transformacao
linear R:
T
i
k
R
i
j
(R
1
)
l
k
T
j
l
. (A.31)
Portanto, a Eq. (A.28) mostra que a metrica e um tensor covariante de ordem dois. A Eq. (A.28) tambem
nos diz que a metrica e uma quantidade invariante, pois suas componentes sao as mesmas, antes e depois da
transformacao. Naturalmente, isto e equivalente a dizer que a forma bilinear correspondente e invariante `a
transformacao dada.
36 A. Transformacoes Lineares
A.3 Transformac oes innitesimais
Sophus Lie mostrou que uma transformacao nita (quando os parametros da transformacao variam em um
intervalo nito) pode ser gerada por sucessivas transformacoes innitesimais (quando os parametros da
transformacao variam innitesimalmente). Seja R(a) um elemento de um grupo de Lie G. Podemos redenir
os parametros a

, = 1, . . . , r, de modo a obter o elemento identidade I quando todos os parametros forem


nulos,
I = R(a)

a=0
. (A.32)
Vamos considerar aqui os elementos do grupo na vizinhanca da identidade, a 0. Neste caso, podemos
expandir o elemento R(a) em serie de Taylor em torno da identidade,
R(a) = I +
r

=1
a

+O(a
2
), L

=
R
a

a=0
. (A.33)
Na maioria dos casos, o raio de convergencia desta expansao e suciente para estudarmos a maioria das
propriedades globais (ito e, longe da identidade, em contraste com as propriedades innitesimais denidas
em torno da identidade) de um dado grupo de Lie atraves da relacao exponencial
R(a) = exp
_
r

=1
a

_
, e
L

k=0
L
k

k!
. (A.34)
Note que esta relacao exponencial tem a mesma expansao (A.33) em torno da identidade. As r quantidades
L

, linearmente independentes, sao os geradores do grupo. Estes geradores formam uma base para uma
algebra
3
denida em relacao ao produto de Lie:
[L

, L

] = L

=
r

=1
C

, C

R. (A.35)
Esta algebra e denominada de algebra de Lie associada ao grupo de Lie. Assim, conhecendo as propriedades
de um conjunto nito de geradores, podemos conhecer quase todas as propriedades globais dos elementos
do grupo associado (um grupo innito). A dimensao da algebra de Lie e igual ao n umero de parametros do
grupo de Lie correspondente. As constantes C

em (A.35) sao as constantes de estrutura da algebra. A


menos de uma transformacao linear constante, as constantes de estrutura sao as impressoes digitais de
uma algebra de Lie. Duas algebras serao isomorcas quando tiverem as mesmas constantes de estrutura (ou
quando as constantes de estrutura de uma algebra puderem ser transformadas nas constantes de estrutura
da outra algebra).
O produto de Lie denido em (A.35) possui tres propriedades fundamentais: I) o produto de Lie e
anti-simetrico,
[L

, L

] = [L

, L

]; (A.36)
II) ele e bilinear,
[L

, L

+ aL

] = [L

, L

] + a[L

, L

]; (A.37)
III) ele satisfaz a identidade de Jacobi,
_
L

, [L

, L

+
_
L

, [L

, L

+
_
L

, [L

, L

= 0. (A.38)
Estas propriedades denem uma algebra de Lie. Vimos que podemos representar transformacoes lineares
por matrizes em um espaco de dimensao nita. Assim, da expansao de Taylor dos elementos de um grupo
de Lie em torno da identidade, Eq. (A.33), e das relacoes quadraticas (A.26), podemos calcular as condicoes
nos elementos de matriz dos geradores (L

)
i
k
, impostas pela condicao da metrica ser invariante:
g
ij
=
_

k
i
+
r

=1
a

(L

)
k
i
__

l
j
+
r

=1
a

(L

)
l
j
_
g
kl
(L

)
k
l
g
ik
+ (L

)
k
i
g
kl
= 0. (A.39)
3
Uma algebra e um espaco vetorial dotado de um produto entre seus elementos cujo resultado e outro elemento deste
mesmo espaco vetorial. Fazendo uso da linguagem de aplicacoes introduzida anteriormente, este produto e uma aplicacao tal
que : V V V . Quando o produto for bilinear, entao a algebra correspondente e denominada de algebra linear.
A. Transforma coes especiais 37
Estas relacoes implicam que estas matrizes dos geradores possuem traco nulo:
(L

)
k
l
g
ik
+ (L

)
k
i
g
kl
= 0 (L

)
k
k
= 0. (A.40)
Isto esta condizente com a relacao exponencial (A.34), pois
det R(a) = exp
_
r

=1
a

trL

_
= 1, trL

= (L

)
k
k
= 0. (A.41)
A.4 Transformac oes especiais
A.4.1 Transformacoes ortogonais
As transformacoes ortogonais sao transformacoes lineares reais no espaco euclideano V
n
= R
n
, de dimensao
n, que preservam a metrica euclideana, cujos elementos de matriz sao
4
g
ik
=
ik
. (A.42)
Esta metrica e simetrica. Para n = 3, temos o espaco tridimensional usual. Sendo o tensor metrico igual `a
identidade, a denicao (A.20) de uma forma bilinear coincide com a denicao usual de produto escalar:
(Rx, Rx) = (x, x) = x
2
=
n

k=1
x
2
k
. (A.43)
Em um espaco euclideano, as componentes covariantes identicam-se com as componentes contravariantes.
Assim, nao ha necessidade de observarmos a posicao de ndices covariantes e contravariantes em qualquer
quantidade tensorial.
A condicao de invariabilidade da metrica euclideana, expressa nas relacoes quadraticas (A.26), fornece
n(n+1)/2 relacoes de vnculos entre os elementos de matriz R
ik
de uma transformacao ortogonal. Portanto,
apenas n(n1)/2 elementos de matriz R
ki
sao independentes. Isto signica que o grupo ortogonal, formado
pelas transformacoes ortogonais, possui n(n 1)/2 geradores L

, = 1, . . . , n(n 1)/2. Os elementos de


matriz destes geradores devem satisfazer a relacao de anti-simetria,
(L

)
ik
= (L

)
ki
, (A.44)
proveniente de (A.39) e da simetria da metrica euclideana (A.42). Desta forma, a condicao de ortogonalidade
nos elementos do grupo corresponde `a condicao de anti-simetria nos elementos da algebra correspondente.
Os elementos de matriz da transformacao ortogonal inversa podem ser calculados facilmente usando (A.29),
(R
1
)
ik
= R
ki
. (A.45)
Isto signica que a matriz inversa de uma transformacao ortogonal e calculada simplesmente realizando uma
operacao de transposicao real.
Na teoria dos grupos de Lie, o grupo ortogonal e denotado por SO(n) e a algebra correspondente por
so(n). A letra S signica que as matrizes que representam os elementos do grupo possuem determinante
igual a um (traco nulo na algebra). O grupo SO(3) e fundamental para a teoria do momentum angular em
Fsica. Este grupo e o grupo formado pelas rotacoes espaciais, quando estas sao vistas como transformacoes
lineares no espaco tridimensional. Portanto, ele e tambem um subgrupo do grupo de Lorentz. A algebra
associada, so(3), e a algebra formada pelas componentes do momentum angular. O grupo SO(3) tambem
e muito importante em Metodos Matematicos para a Fsica, pois os elementos de matriz sao as funcoes
especiais de Legendre e todas as propriedades destas funcoes podem ser vistas como conseq uencia direta das
propriedades dos grupos de Lie aplicadas ao grupo SO(3).
4
A metrica em um espaco euclideano pode sempre ser transformada numa metrica proporcional `a identidade. Isto signica
que qualquer base pode ser ortonormalizada.
38 A. Transformacoes Lineares
A.4.2 Transformacoes de Lorentz
As transformacoes de Lorentz sao transformacoes lineares reais no espaco-tempo V
n
= M
4
, de dimensao
n = 4, que preservam a metrica (simetrica) de Minkowski, cujos elementos de matriz sao
(g

) = (g

) =
_
_
_
_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_
_
_
_
, , = 0, 1, 2, 3. (A.46)
A condic ao de invariabilidade da metrica de Minkowski, expressa nas relacoes quadraticas (A.26), fornece
4(4 + 1)/2 = 10 relacoes de vnculos entre os elementos de matriz

de uma transformacao de Lorentz.


Portanto, apenas seis elementos de matriz sao independentes. Isto signica que o grupo de Lorentz, formado
pelas transformacoes de Lorentz, possui seis geradores L
k
, k = 1, . . . , 6. Os elementos de matriz destes
geradores devem satisfazer a relacao de anti-simetria,
(L
k
)

= (L
k
)

, (A.47)
proveniente de (A.39) e da simetria da metrica de Minkowski (A.46). Os elementos de matriz da trans-
formacao de Lorentz inversa podem ser calculados facilmente usando (A.29),
(
1
)

= g

. (A.48)
Na teoria dos grupos de Lie, o grupo de Lorentz e denotado por SO(1,3) e a algebra correspondente por
so(1,3). A letra S signica que as matrizes que representam os elementos do grupo possuem determinante
igual a um (traco nulo na algebra). O grupo SO(1,3) e fundamental para a teoria da relatividade especial
de Einstein.
A.4.3 Transformacoes simplecticas
As transformacoes simplecticas sao transformacoes lineares reais no espaco de fase V
2n
, de dimensao 2n, que
preservam a metrica simplectica, cujos elementos de matriz sao

=
_

_
1 se n e = n + ,
1 se n e = n + ,
0 todos os demais casos;

=
_

_
1 se n e = n + ,
1 se n e = n + ,
0 todos os demais casos.
(A.49)
Esta metrica e anti-simetrica. Como conseq uencia desta anti-simetria, a forma bilinear (A.20) e sempre nula
quando x = y,
(x, x) = 0, x V
2n
. (A.50)
A condicao de invariabilidade da metrica simplectica, expressa nas relacoes quadraticas (A.26), fornece
n(2n1) relacoes de vnculos entre os elementos de matriz R

de uma transformacao simplectica. Portanto,


apenas n(2n + 1) elementos de matriz R

sao independentes. Isto signica que o grupo simplectico possui


n(2n + 1) geradores L
k
, k = 1, . . . , n(2n + 1). Os elementos de matriz destes geradores devem satisfazer a
relacao de simetria,
(L
k
)

= (L
k
)

, (A.51)
proveniente de (A.39) e da anti-simetria da metrica simplectica (A.49). Os elementos de matriz da trans-
formacao simplectica inversa podem ser calculados facilmente usando (A.29),
(R
1
)

= R

. (A.52)
Na teoria dos grupos de Lie, o grupo simplectico e denotado por Sp(2n) e a algebra correspondente por
sp(2n). A letra S signica que as matrizes que representam os elementos do grupo possuem determinante
igual a um (traco nulo na algebra). O grupo Sp(2n) e fundamental para o formalismo hamiltoniano, pois as
transformacoes canonicas no espaco de fase formam, naturalmente, um grupo.
Apendice B
Rota coes Espaciais
B.1 Corpo rgido
Devido `a importancia das rotacoes espaciais em muitas areas da Fsica, iremos discutir aqui suas principais
propriedades, principalmente aquelas relacionadas com grupos contnuos. Vamos considerar inicialmente os
possveis movimentos de um corpo rgido. Um corpo rgido, tambem conhecido por solido, e um sistema de
massas pontuais sujeitas `a forcas de vnculos que mantem as distancias constantes entre pares de massas.
O movimento mais geral de um solido consiste em uma translacao (deslocamentos espaciais numa dada
direcao) conjunta com uma rotacao (movimento giratorio em torno de um eixo xo no solido). Leonhard
Euler (18071873) provou que o movimento mais geral de um solido em torno de um ponto xo e uma
rotacao. Michel Chasles (17931880) mostrou que e possvel escolher um sistema de coordenadas no solido
de tal forma que a direcao do eixo de rotacao coincida com a direcao da translacao. Sendo necessario tres
graus de liberdade para especicar o movimento de translacao e outros tres para especicar a orienta cao de
um sistema de coordenadas xo no solido em relacao a um determinado sistema de coordenadas externo,
entao um corpo rgido e completamente especicado no espaco por apenas seis graus de liberdade. Este
n umero independe da quantidade de massas pontuais internas ao solido. Nas discussoes seguintes, estaremos
interessados apenas nas rotacoes.
Por denicao, a rotacao de um vetor tridimensional faz com que ele gire em torno de uma determinada
direcao sem alterar seu comprimento. Como vetores e pontos materiais em um solido podem ser especi-
cados de forma unica em um sistema de coordenadas no espaco, uma rotacao pode ser vista como uma
transformacao linear de coordenadas ortogonal em um espaco euclideano tridimensional. Uma descricao
matematica precisa de transformacoes lineares e suas propriedades, incluindo as rotacoes espaciais, esta feita
no Apendice A.
B.2 O grupo das rotacoes espaciais
Vimos na Subsecao A.4.1 que uma transformacao ortogonal em um espaco euclideano tridimensional tem tres
geradores. Isto signica que uma transformacao ortogonal tridimensional e caracterizada por tres parametros
reais, correspondendo aos tres graus de liberdade de uma rotacao espacial de um solido. Devemos fazer
uma escolha destes tres parametros que irao representar uma determinada rotacao. Usaremos aqui duas
parametrizacoes entre varias possibilidades.
Iniciaremos pela parametrizacao onde uma rotacao arbitraria e especicada por uma rotacao por um
angulo , 0 < 2, em torno de um dado eixo = (
1
,
2
,
3
), sendo que o modulo de e numericamente
igual ao angulo de rotacao ,
= [[ =
_

2
1
+
2
2
+
2
3
. (B.1)
As componentes (
1
,
2
,
3
) sao os parametros da rotacao. Iremos denotar por n o versor na direcao e
sentido do eixo de rotacao,
n =

. (B.2)
39
40 B. Rotacoes Espaciais
Assim, podemos tambem denotar uma determinada rotacao por (n, ). Podemos vericar que as rotacoes
(n, ) e (n, 2 ) sao equivalentes. Isto signica que a ponta do vetor forma uma superfcie esferica de
raio para cada valor de , sendo que dois pontos diametralmente opostos nesta superfcie sao equivalentes
(fornecem a mesma rotacao para o solido). Esta ambig uidade pode ser removida parcialmente limitando
ao intervalo 0 < . Agora, apenas quando = teremos pontos equivalentes numa superfcie esferica
de raio . Esta e uma caracterstica (global) das rotacoes espaciais e nao pode ser eliminada.
Passemos agora ao problema de determinar os elementos de matriz R
ik
para uma rotacao arbitraria.
Vamos supor que o vetor r, com a sua extremidade em P, seja rodado no sentido anti-horario de um angulo
pela rotac ao (n, ). Entao ele descrevera o arco PQ numa circunferencia de raio [nr[ (projecao do vetor
r perpendicular ao eixo de rotacao n). Vamos denotar por N o centro desta circunferencia e por O a origem
do sistema de coordenadas xo no corpo rgido. O vetor rodado r

com a extremidade em Q pode ser escrito


como uma soma vetorial da forma
r

ON +

NM +

MQ, (B.3)
onde M e um ponto sobre a reta NP. Este ponto M e determinado pela projecao do vetor

NQ sobre o vetor

NP:

NM =

NP cos = cos
_
r (r n) n

, (B.4)
onde
[

NP[ = [

NQ[ = [n r[ e

NP = r (r n) n. (B.5)
O vetor

MQ e a projecao do vetor

NQ sobre o vetor n r, perpendicular a

NP,

MQ = sen n r. (B.6)
Fazendo uso destas relacoes, o vetor r

em (B.3) pode ser reescrito como


r

= r cos + (r n) n(1 cos ) +n r sen . (B.7)


Portanto, os elementos de matriz em coordenadas cartesianas sao
R
ik
=
ik
cos +
i

k
1 cos

2

3

l=1

ikl

l
sen

, (B.8)
onde
ikl
e o tensor de Levi-Civita(Tullio Levi-Civita, 18731941).
1
Naturalmente, a identidade R = I
corresponde `a situacao =
k
= 0, como pode ser facilmente vericada na expressao anterior. Usando um
pouco de esforco algebrico, podemos checar diretamente da Eq. (B.8) que estas matrizes tem determinante
igual a um, como esperado (ver Apendice A):
det R =
1
6

ijk

rst

ijk

rst
R
ir
R
js
R
kt
= 1. (B.9)
Tambem pode ser vericado diretamente de (B.8) que a inversa e igual `a transposta (matrizes ortogonais):
R
1
= R
T
. (B.10)
Vimos no Apendice A que as transformacoes ortogonais deixam a metrica euclideana invariante. Isto tambem
pode ser vericado aqui usando a (B.10). De fato, sendo a metrica euclideana um tensor de ordem dois
diagonal, g
ij
=
ij
, temos

ij

ij
R
ir
R
js
=

i
R
ir
R
is
=

i
R
T
ri
R
is
=
rs
. (B.11)
1
Ele e completamente anti-simetrico em quaisquer dois ndices (isto implica que para dois ndices iguais este tensor e zero).
Quando as tres componentes de
ikl
sao distintas o valor do tensor pode ser apenas 1. Sera +1 (1) quando a seq uencia ikl
formar uma permutacao par (mpar) de 123. Uma permutacao ikl e par (mpar) quando o n umero de transposicoes (troca de
dois n umeros) para reobter 123 for par (mpar). Por exemplo, 132 e uma permuta cao mpar e 231 e par.
B. O grupo das rotacoes espaciais 41
Neste espaco de dimensao tres existe apenas um outro tensor invariante: o tensor de Levi-Civita. De fato,
usando a (B.9) e

ijk

2
ijk
= 6 temos

ijk

ijk
R
ir
R
js
R
kt
=
rst
. (B.12)
Usando este fato, podemos mostrar diretamente da (B.8) que o produto S = R()R() de duas rotacoes
arbitrarias R() e R() e tambem uma rotacao, isto e, uma matriz ortogonal,
S
T
=
_
R()R()
_
T
= R
T
()R
T
() SS
T
= I S
1
= S
T
, (B.13)
com determinante +1,
det S =
1
6

ijk

rst

ijk

rst
S
ir
S
js
S
kt
=
1
6

lmn
_

ijk

ijk
R
il
R
jm
R
kn
_

rst

rst
R
lr
R
ms
R
nt
_

=
1
6

lmn

2
lmn
= 1.
(B.14)
Portanto, as rotacoes (B.8) formam um grupo de Lie de ordem tres.
Consideremos uma rotacao em torno do eixo z: = (0, 0, ). Neste caso, a matriz de rotacao correspon-
dente e
R() =
_
_
cos() sen () 0
sen () cos() 0
0 0 1
_
_
. (B.15)
Consideremos ainda neste exemplo particular a derivada desta matriz em relacao ao angulo de rotacao :

R() =
d
d
R() =
_
_
sen () cos() 0
cos() sen () 0
0 0 0
_
_
. (B.16)
No limite 0 (identidade) esta matriz torna-se em
L
z
=

R(0) =
_
_
0 1 0
1 0 0
0 0 0
_
_
. (B.17)
Podemos ver que esta matriz e anti-simetrica e de traco nulo. Igualmente importante e a observa cao que
esta matriz L
z
, quando exponenciada, gera a matriz de rotacao R():
R() = e
L
z
=

k=0
(L
z
)
k
k!
. (B.18)
Portanto, uma rotacao pode ser escrita como a exponencial de uma matriz constante multiplicada pelo
parametro (angulo) caracterizando a rotacao. Dizemos que a matriz L
z
gera a rotacao R().
Exerccio 1 Calcule explicitamente a matriz de rotacao 3 3 cujos elementos de matriz estao dados em
(B.8).
Exerccio 2 Verique as Eqs. (B.9), (B.12) e (B.18).
42 B. Rotacoes Espaciais
B.3 A algebra de Lie correspondente ao grupo das rotac oes
Podemos generalizar o procedimento anterior e calcular os tres geradores linearmente independentes L
k
,
k = 1, 2, 3, para uma rotac ao arbitraria R(
1
,
2
,
3
). Inicialmente, temos de calcular a derivada dos
elementos de matriz R
ij
:
R
ij

k
=
ij

sen +
_

ik

+
jk

3
_
_
1 cos
_

+
_

2

ijk
_
sen


_
3

l=1

ijl

_
cos
sen

_
. (B.19)
Os geradores L
k
sao calculados tomando o limite
k
0 na identidade ( = 0):
L
1
= lim

1
0
R

=0
=
_
_
0 0 0
0 0 1
0 1 0
_
_
,
L
2
= lim

2
0
R

=0
=
_
_
0 0 1
0 0 0
1 0 0
_
_
,
L
3
= lim

3
0
R

=0
=
_
_
0 1 0
1 0 0
0 0 0
_
_
.
(B.20)
Note que os elementos matriciais destas matrizes L
i
podem ser escritos numa forma compacta como
(L
i
)
jk
=
ijk
. (B.21)
Estas matrizes anti-simetricas e de traco nulo geram a matriz de rotacao R() cujos elementos de matriz
sao os mesmos em (B.8):
R() = e

1
L
1
+
2
L
2
+
3
L
3
. (B.22)

E interessante escrever os elementos de matriz desta exponencial para rotacoes innitesimais,


i
1,
R
ij

ij
+

k
(L
k
)
ij
=
ij

kij

k
. (B.23)
Assim, a acao de uma rotacao innitesimal e dada por
x

i
=

l
R
il
x
l
= x
i

k,l

kil

k
x
l
= x
i
+

ik
(x),
ik
(x) =

ikl
x
l
. (B.24)
As matrizes (B.20) possuem relacoes de comutacao,
[L
i
, L
j
] L
i
L
j
L
j
L
i
=

ijk
L
k
, (B.25)
identicas `aquelas dos operadores de momentum angular na forma diferencial,
L
i
=
_
r p
_
i
=

j,k

ijk
x
j

x
k
. (B.26)
Portanto, podemos dizer que as componentes do momentum angular sao os geradores das rotacoes espaciais.
Podemos ver em (B.25) que o comutador
[A, B] = AB BA, (B.27)
B. A algebra de Lie correspondente ao grupo das rotacoes 43
dene um produto no espaco das matrizes 33 anti-simetricas de traco nulo o qual e anti-simetrico, bilinear,
[A, B] = [B, A],
[A + B, C] = [A, C] + [B, C], ,
(B.28)
e satisfaz a identidade de Jacobi (Carl Gustav Jacob Jacobi, 18041851),
_
A, [B, C]

+
_
C, [A, B]

+
_
B, [C, A]

= 0. (B.29)
Este produto e conhecido como produto de Lie. Qualquer espaco vetorial equipado com um produto entre seus
elementos que produza um outro de seus elementos forma uma algebra. Assim, o conjunto das matrizes L
k
forma uma algebra de Lie denotada por so(3). A letra s signica que as matrizes representando esta algebra
possuem traco nulo, correspondendo a matrizes com determinante unitario no grupo. A letra o signica
que as matrizes nesta algebra sao anti-simetricas as quais geram matrizes ortogonais no grupo. Em geral as
algebras de Lie sao denotadas pelos mesmos smbolos denotando os grupos de Lie mas em letras min usculas.
Os n umeros
ijk
em (B.25) sao denominados de constantes de estrutura da algebra e fazem o papel de uma
carteira de identidade da algebra. Duas algebras com as mesmas constantes de estrutura sao ditas serem
isomorcas. O isomorsmo entre duas algebras signica que tais algebras podem ser consideradas as mesmas,
que as constantes de estruturas de uma delas podem ser transformadas nas constantes de estrutura da outra.
Naturalmente existe uma forma canonica para escrever as constantes de estrutura para todas as algebras de
Lie possveis. Por exemplo, podemos reescrever os geradores L
k
na forma
J
k
= iL
k
, i
2
= 1. (B.30)
Neste caso, as novas constantes de estrutura serao i
klm
,
[J
k
, J
l
] = i
3

m=1

klm
J
m
. (B.31)
A forma canonica para as constantes de estrutura da algebra so(3) e uma dada pelos geradores J
3
e J

,
J

= J
1
iJ
2
= iL
1
L
2
. (B.32)
As novas relacoes de comutacao sao agora
[J
3
, J

] = J

,
[J
+
, J

] = 2J
3
.
(B.33)
Os grupos de Lie correspondentes a algebras isomorcas sao ditos serem apenas localmente isomorcos, pois
as algebras sao determinadas apenas em torno da identidade do grupo. Isto signica que as algebras de Lie
contem todas as informacoes pertinentes aos seus grupos associados em torno da identidade (propriedades
locais). No entanto, muitas das propriedades globais (longe da identidade) podem ser determinadas tambem
por propriedades da algebra.
Vale notar que as matrizes L
i
por serem linearmente independentes,
3

i=1
c
i
L
i
= 0
33
c
i
= 0, (B.34)
onde 0
33
e a matriz nula 3 3, formam uma base para o espaco vetorial complexo formado pelas matrizes
anti-simetricas de traco nulo. Qualquer matriz anti-simetrica M de traco nulo pode ser escrita como uma
combina c ao linear das tres matrizes L
i
,
M =
3

i=1
c
i
L
i
, c
i
C. (B.35)
44 B. Rotacoes Espaciais
Estas matrizes formam, portanto, uma base para algebra a so(3). Esta algebra e complexa, pois as constantes
c
i
utilizadas na combinacao linear acima sao complexas.

E comum escrevermos o nome do conjunto numerico
(real ou complexo) ao qual pertence as constantes c
i
junto com o nome da algebra (ou do grupo). Neste
caso teremos so(3,C). No entanto, continuaremos a escrever so(3) ao inves de so(3,C), por pura conveniencia.
Comparando (B.26) e (B.20) podemos ver que os elementos de uma algebra podem ser escritos (realizados)
em diferentes formas. Podemos assim, idealizar uma algebra arbitraria de forma abstrata, isto e, sem
dizer explicitamente que objetos matematicos (matrizes, operadores lineares, transformacoes, etc.) sao ou
representam seus elementos (forma concreta). Neste caso, as constantes de estrutura que denem as relacoes
de comutacao da algebra devem ser conhecidas a priori. Um resultado que torna as algebras de Lie em
instrumentos de importancia em Fsica e que as regras para representar os elementos abstratos de uma
determinada algebra sao todas conhecidas. Estas regras sao conhecidas como teoria de representa cao para
as algebras de Lie.
Uma algebra de Lie nao contem elementos que nao sejam combinacoes lineares dos elementos de base.
Polinomios, por exemplo, nao fazem parte da algebra. No entanto, alguns polinomios sao de grande im-
portancia. Por exemplo, para a algebra so(3) em questao, o polinomio
L
2
= (L
2
1
+ L
2
2
+ L
2
3
) = 2I, (B.36)
comuta com todos os elementos L
i
,
[L
2
, L
i
] = 0. (B.37)
Analogamente,
J
2
= J
2
3
+
1
2
(J
+
J

+ J

J
+
) = J
3
(J
3
1) + J
+
J

(B.38)
comuta com J
3
e J

. Este operador quadratico (L


2
ou J
2
) nos elementos da algebra e unico e e conhecido
como operador de Casimir (Hendrik Bugt Casimir, 19092000). Tambem sao conhecidas todas as regras
para determinar quem sao os polinomios mais gerais que comutam com todos os elementos de qualquer
algebra de Lie. Em geral, nas aplicacoes fsicas os elementos das algebras de Lie ou funcoes destes elementos
desempenham o papel de observaveis, isto e, operadores associados a alguma realidade fsica mensuravel.
Os elementos do grupo, por serem obtidos por uma exponenciacao dos elementos da algebra, desempenham
o papel dos operadores de evolucao, os quais sao exponenciais dos observaveis (hamiltonianas, etc.).
Quais as matrizes, de dimensao nita, que satisfazem as relacoes de comutacao (B.33) e (B.38)? Estas
matrizes sao os representantes dos elementos da algebra de momentum angular. Vamos requerer tambem
que tais matrizes satisfacam
J

= J

, J

3
= J
3
. (B.39)
Isto e suciente para construirmos representa coes hermiteanas (unitarias no grupo, devido `a exponenciacao),
J
+
+ J

e i(J
+
J

), por exemplo. Vamos escolher J


3
, J
2
para serem diagonalizados simultaneamente:
J
3
[j, m) = m[j, m), (B.40)
J
2
[j, m) = j(j + 1)[j, m), (B.41)
onde j e m, com [m[ j, sao inteiros ou semi-inteiros para garantir que as matrizes da representacao sejam
nitas (como veremos adiante). Vale observar aqui algumas propriedades importantes associados `a notacao
em (B.40) e (B.41). Primeiro, alguma poucas palavras sobre a ideia basica da teoria de representa coes: em
geral, os elementos de qualquer algebra sao completamente inertes, isto e, eles nao atuam em espaco vetorial
nenhum (a nao ser o proprio espaco vetorial formado pela algebra per si). Acontece que cada espaco vetorial
carrega consigo um conjunto de operadores lineares. Sao estes operadores lineares que serao usados para
representar os elementos de uma determinada algebra, numa relacao unvoca. Em um estagio posterior, cada
operador agindo em um espaco vetorial previamente escolhido (ou construdo) sera representado por uma
matriz pelo processo usual. Em geral, usamos o mesmo nome para identicar os elementos da algebra e os
seus operadores associados, bem como suas matrizes. No nosso caso, temos um espaco vetorial, denominado
de espaco portador das representacoes, onde cada vetor de base (escolhida como ortonormal) e descrito por
[j, m) ou, sucintamente, por [m), uma vez que j xa a dimensao (2j +1) de cada representa cao. Segundo: a
produto escalar e feito com a imagem especular j, m[, denominado de bra, do vetor [j, m), denominado de
ket. Assim, por construcao:
j, m[j, m

) =
mm
. (B.42)
B. A algebra de Lie correspondente ao grupo das rotacoes 45
Terceiro: os elementos de matriz de qualquer operador A na base [j, m) sao especicados por
A
mm
= j, m[A[j, m

) = (j, m[A

)[j, m

), (B.43)
onde a expressao central exemplica a acao `a direita para o operador A e o ultimo termo exemplica a acao
`a esquerda. Portanto, como quarta observa cao, qualquer operador agindo em um bra deve agir com o seu
conjugado transposto. Todas estas regras praticas estao em conformidade com a maneira correta de denir
produtos escalares em espacos vetoriais complexos.
Usando as Eqs. (B.33) podemos ver que os novos vetores J

[m) sao autovetores de J


3
como autovalores
m1. De fato, abrindo o produto de Lie e re-agrupando os termos semelhantes, temos
J
3
_
J
+
[j, m)
_
= (m + 1)J
+
[j, m). (B.44)
Portanto, o novo vetor J
+
[j, m) e autovetor de J
3
com autovalor m + 1, mas conforme (B.40), este vetor
deve ser proporcional ao vetor [j, m + 1). Assim, apos uma normalizacao conveniente, podemos fazer
J

[j, m) = A

(j, m)[j, m1). (B.45)


Naturalmente, os valores de m devem ser inteiros ou semi-inteiros, pois em caso contrario teramos uma
quantidade innita de novos vetores produzidos pela acao repetida de J

. Portanto, [m[ j e a dimensao


das matrizes de cada representacao xada por j sera 2j + 1. Isto signica que
A
+
(j, j) = 0 A
+
(j, m) (j m)
A

(j, j) = 0 A

(j, m) (j + m).
(B.46)
Os coecientes A

nao sao independentes. De (B.43), permitindo J


+
(ou J

) agir a direita e a esquerda,


teremos
j, m + 1[J
+
[j, m) = A
+
(j, m)j, m + 1[j, m + 1) = A
+
(j, m)
= (j, m + 1[J

+
)[j, m) = (j, m + 1[J

)[j, m)
= A

(j, m + 1)j, m[j, m) = A

(j, m + 1),
(B.47)
de onde conclumos que
A
+
(j, m) = A

(j, m + 1). (B.48)


Usando as regras de selecao (B.46) e a relacao (B.48), temos
A
+
(j, m) = (j m)A

+
(j, m) = A

(j, m + 1) = (j + m + 1)A

(j, m + 1). (B.49)


Uma solucao para esta equacao e
A

+
(j, m) = (j + m + 1), A

(j, m + 1) = (j m). (B.50)


Reunindo todas as informacoes obtidas ate aqui, teremos:
A
+
(j, m) (j m)(j + m + 1)
A

(j, m) (j + m)(j m + 1).


(B.51)
Usando a segunda relacao de comutac ao em (B.33), podemos xar a forma destes elementos de matriz:
j, m[[J
+
, J

][j, m) = 2m A
2
+
(j, m1) A
2
+
(j, m) = 2m. (B.52)
Portanto,
A

(j, m) =
_
j(j + 1) m(m1). (B.53)
Vale notar que estas matrizes calculadas pelas equacoes (B.40) e (B.45) sao irredutveis, isto e, nao admitem
transformacoes de similaridade a m de reduzi-las a uma forma diagonal, mesmo que seja por blocos menores
que 2j + 1. Consideremos os casos particulares j = 1/2 e j = 1. Para j = 1/2, temos
J
3
=
_
1/2 0
0 1/2
_
, J
+
=
_
0 1
0 0
_
, J

=
_
0 0
1 0
_
, (B.54)
46 B. Rotacoes Espaciais
ou, usando as matrizes de Pauli,
2J
1
=
1
=
_
0 1
1 0
_
, 2J
2
=
2
=
_
0 i
i 0
_
, 2J
3
=
3
=
_
1 0
0 1
_
. (B.55)
Para j = 1, temos
J
3
=
_
_
1 0 0
0 0 0
0 0 1
_
_
, J
+
=

2
_
_
0 1 0
0 0 1
0 0 0
_
_
, J

2
_
_
0 0 0
1 0 0
0 1 0
_
_
. (B.56)
Exerccio 3 Mostre que o operador de Casimir (B.36) comuta com todos as elementos da algebra so(3).
Exerccio 4 Prove a Eq. (B.53)
Exerccio 5 Calcule as matrizes da representcao j = 3/2 e j = 2.
B.4

Angulos de Euler
Uma rotac ao tambem pode ser parametrizada pelos tres angulos que caracterizam a posicao relativa entre
dois sistemas de coordenadas (e
i
e e

i
) xos em um corpo rgido. Estes angulos sao conhecidos como angulos
de Euler e serao denotados por (, , ). Desta forma, esta parametrizacao e dependente de um sistema
de coordenadas. Os angulos de Euler podem ser denidos da seguinte forma: I) uma rotacao R(e
3
, ) em
torno do eixo e
3
por um angulo , 0 < 2. O sistema (e
1
, e
2
, e
3
) e levado ao sistema intermediario
(e

1
, e

2
, e
3
); II) uma rotacao R(e

2
, ) em torno do eixo intermediario e

2
por um angulo , 0 < . O
sistema (e

1
, e

2
, e
3
) e levado ao sistema intermediario (e

1
, e

2
, e

3
); III) uma rotacao R(e

3
, ) em torno do
eixo e

3
por um angulo , 0 < 2. Assim, uma rotacao arbitraria R(, , ) pode ser escrita como o
produto das rotacoes denindo os angulos de Euler:
R(, , ) = R(e

3
, )R(e

2
, )R(e
3
, ). (B.57)
Infelizmente, aparece uma dependencia dos sistemas de coordenadas e

i
e e

i
na equacao anterior.

E conveni-
ente, em geral, escrever uma rotacao envolvendo apenas um sistema de coordenadas, por exemplo e
i
. Para
tal, devemos observar que
SR(n, )S
1
= R(Sn, ), (B.58)
onde S e uma rotacao arbitraria. Uma maneira de vericarmos este resultado e vericando se o novo eixo
de rotacao Sn e invariante perante `a rotacao SR(n, )S
1
, pois qualquer rotacao deixa apenas o seu eixo
de rotacao inalterado. De fato, o vetor Sn e invariante pela rotacao SR(n, )S
1
:
SR(n, )S
1
Sn = SR(n, )n = Sn. (B.59)
Alem disto, [Sn[ = [n[, pois uma rotacao nao modica o modulo dos vetores. Como uma rotacao em torno
de algum eixo sempre o deixa invariante, entao segue-se o lado direito da (B.58). Desta forma, o eixo
intermediario e

2
pode ser obtido pela rotacao R(e
3
, ):
R(e

2
, ) = R(e
3
, )R(e
2
, )R
1
(e
3
, ), (B.60)
e, analogamente, o eixo e

3
e obtido pela rotacao R(e

2
, ),
R(e

3
, ) = R(e

2
, )R(e
3
, )R
1
(e

2
, ). (B.61)
Substituindo estas duas expressoes em (B.57), obteremos
R(, , ) = R(e
3
, )R(e
2
, )R(e
3
, ) = e
iJ3
e
iJ2
e
iJ3
. (B.62)
Note que utilizamos o fato de duas rotacoes em torno do mesmo eixo comutarem,
R
1
(e
3
, )R(e
3
, ) = R(e
3
, )R
1
(e
3
, ). (B.63)
B.

Angulos de Euler 47
Tendo em vista as representacoes irredutveis (B.40) e (B.45), podemos calcular as respectivas matrizes
de rotacao atraves da Eq. (B.62),
R(, , )[j, m) =
j

=j
R
m

m
[m

), (B.64)
onde
R
m

m
(, , ) = e
im

e
im
d
j
m

m
(), d
j
m

m
() = jm

[ e
iJ2
[jm). (B.65)
Consideremos o caso particular j = 1/2. De (B.55) e lembrando que
2
i
= I, temos
d
1/2
() = e

i
2
2
=
_
cos(/2) sen (/2)
sen (/2) cos(/2)
_
(B.66)
e
R(, , ) =
_
e

i
2
(+)
cos(/2) e

i
2
()
sen (/2)
e

i
2
(+)
sen (/2) e
i
2
(+)
cos(/2)
_
. (B.67)
Escolhendo n = S z em (B.58), temos, para alguma rotacao S,
R(n, 2) = SR( z, 2)S
1
. (B.68)
No entanto, na base [jm), a rotacao R( z, 2) e representada pela matriz
jm

[R( z, 2)[jm) = e
im2

mm
= (1)
2m

mm
= (1)
2j

mm
, (B.69)
lembrando que 2m, assim como 2j, e sempre um inteiro par ou mpar. Portanto, de volta `a (B.68), temos
R(n, 2) = (1)
2j
I. (B.70)
Isto signica que para as representa coes com j semi-inteiro e necessario duas voltas (4) para retornar-se
ao ponto de partida. Assim, teremos representacoes para as rotacoes espaciais apenas quando j for um
inteiro, pois para uma rotacao espacial basta uma volta de 2 para retornar-se ao ponto de partida. Vejamos
algumas propriedades das matrizes (B.62). A inversa de (B.62) e a matriz
R
1
(, , ) = R(, , ), (B.71)
como pode ser vericado diretamente de (B.65). Devido `as matrizes representando J

em (B.40) e (B.45)
serem reais, entao de (B.32) temos J

2
= J
2
. Portanto,
R

(, , ) = R(, , ) = R
1
(, , ) d

m
() = d
m

m
(). (B.72)
Escolhendo n = S z em (B.58), entao
det R(n, ) = det(SR( z, )S
1
) = det R( z, ) =
j

m=j
e
im
= 1. (B.73)
Exerccio 6 Prove que se S for uma rotacao qualquer, representada por uma matriz ortogonal, entao o
vetor S tera o mesmo modulo do vetor .
Exerccio 7 Prove a Eq. (B.66) usando
e
iJ
2
=

k=0
(iJ
2
)
k
k!
. (B.74)
Exerccio 8 Prove as Eqs. (B.71)(B.73).
48 B. Rotacoes Espaciais
B.5 Relacao entre SO(3) e SU(2)
Consideremos um espaco vetorial de dimensao dois. Vamos denotar por
+
,

uma base neste espaco.


Seja
= (
+
,

) =
+

+
+

,
k
C, (B.75)
um vetor arbitrario, denominado de espinor, neste espaco. Seja tambem
U =
_


_
(B.76)
uma transformacao linear unitaria,
U
1
= U

, det [U[
2
= 1. (B.77)
Iremos escolher det U = 1 para que tais transformacoes lineares possam formar um grupo, denominado de
SU(2). Estas condicoes de unitariedade implicam em
[[
2
+[[
2
= 1, =

, =

. (B.78)
Portanto, apenas tres parametros sao independentes em (B.76). Estes tres parametros podem ser escolhidos
como as componentes reais de um vetor espacial, por exemplo, r = (x, y, z). Usando as matrizes de Pauli
(B.55) como base, qualquer matriz unitaria X
22
pode ser escrita como
X =
3

i=1
x
i

i
=
_
z x iy
x + iy z
_
. (B.79)
Podemos vericar que esta construcao nos permite identicar que as transformacoes unitarias (B.76) induzem
transformacoes ortogonais no espaco tridimensional. De fato, seja X

o resultado de uma transformacao de


similaridade da forma
X

= UXU

= (U)X(U

). (B.80)
Como esta transformacao preserva o determinante, entao
det X = r
2
= (x
2
+ y
2
+ z
2
) = det X

= r
2
. (B.81)
Isto signica que o vetor r sofreu a acao de uma rotacao R. A correspondencia U R e 2:1, pois podemos
usar U e U em (B.80). Esta relacao entre estes dois grupos SU(2) e SO(3) esta intimamente relacionada
como o fato das representa coes irredutveis da algebra so(3) admitir tambem valores semi-inteiros para j.
Os valores inteiros de j correspondem `as representa coes do grupo SO(3) bem como de SU(2), enquanto que
os valores semi-inteiros correspondem a representacoes exclusivas do grupo SU(2). Por isso, o grupo SU(2) e
denominado de grupo de cobertura do grupo SO(3). Em outras palavras os grupos SO(3) e SU(2) possuem
a mesma algebra. Neste caso, eles sao ditos serem localmente isomorcos, so(3) su(2).
Sendo a matriz (B.66) uma matriz unitaria 2 2, vamos usa-la para transformar as componentes de um
espinor arbitrario,

= d
1/2
()

+
=
+
cos(/2)

sen (/2),

=
+
sen (/2) +

cos(/2). (B.82)
Podemos encontrar uma expressao analtica para os elementos de matriz para d
j
mm
() permitindo que a
matriz atue no produto tensorial de ordem n = 2j

(m)
=
(
+
)
j+m
(

)
jm
_
(j + m)!(j m)!
. (B.83)
Os vetores
(m)
comportam-se como vetores irredutveis de uma representa cao j do grupo SU(2). Assim,

(m)
=
j

=j
d
j
mm

(m

)
. (B.84)
B. Relacao entre SO(3) e SU(2) 49
Desenvolvendo o lado esquerdo desta expressao usando (B.82) e comparando com o lado direito, apos algum
esforco para reorganizar todas as somas do lado esquerdo, obteremos
d
j
mm
() =

k
(1)
k
_
(j + m)!(j m)!(j + m

)!(j m

)!
k!(j + mk)!(j m

k)!(k m + m

)!

(cos

2
)
2j+mm

2k
(sen

2
)
2km+m

, (B.85)
onde a soma deve ser efetuada para todos os valores de k os quais sejam condizentes com todos os tres
fatoriais no denominador. Como exemplo, tomemos j = 1/2. Para m = m

= 1/2, o unico valor possvel e


k = 0. Para m = 1/2 e m

= 1/2, temos k = 1 enquanto que para m = 1/2 e m

= 1/2 temos k = 0 e
assim por adiante. Os elementos de matriz (B.85) possuem uma propriedade de simetria muito importante:
d
j
m,m
= (1)
mm

d
j
mm
. (B.86)
Foi dito anteriormente que os estados (B.83) comportam-se como vetores irredutveis de uma repre-
senta cao j do grupo SU(2).

E instrutivo vericarmos esta armacao. Primeiro, deniremos uma acao dos
elementos J
3
e J

da algebra su(2) nos estados (B.83). Isto pode ser feito realizando a algebra su(2) por
operadores diferenciais agindo nas componentes espinariais

. Para tal, iremos precisar de operadores de


criacao (a

) e destruicao (a

), denidos por
a

, a

, (B.87)
satisfazendo relacoes de comutacao bosonicas:
[a

, a

] = 1, [a

, a

] = [a

, a

] = [a

, a

] = 0. (B.88)
O metodo de Schwinger constitue um procedimento geral para realizar os elementos de uma determinada
algebra por operadores bosonicos: I) obtenha uma representacao matricial fundamental para a algebra em
questao, por exemplo, as matrizes (B.54) para a algebra su(2); II) realize os elementos da algebra atraves da
construcao
J
3
=
_
a
+
a

_
_
1/2 0
0 1/2
__
a

+
a

_
=
1
2
(a
+
a

+
a

), (B.89)
J
+
=
_
a
+
a

_
_
0 1
0 0
__
a

+
a

_
= a
+
a

=
+

, (B.90)
J

=
_
a
+
a

_
_
0 0
1 0
__
a

+
a

_
= a

+
=

+. (B.91)
Agora, podemos vericar que a acao destes operadoes nos estados (B.83) e a mesma encontrada em (B.53).
Exerccio 9 Usando a condicao de unitariedade (B.77), verique as relacoes (B.78).
Exerccio 10 Prove a Eq. (B.85). Sugestao: Desenvolva os primeiros termos da soma do lado esquerdo de
(B.84), reorganize os termos e prossiga por inducao.
Exerccio 11 Prove a Eq. (B.86). Sugestao: Faca alguns casos particulares, depois verique que, em geral,
k

k = mm

, onde

k representa os novos valores possveis na soma em k para m e m

, e uma solucao
possvel.
Exerccio 12 Usando (B.89)(B.91), mostre que os estados (B.83) compostam-se como vetores irredutveis
da representacao j da algebra su(2).
50 B. Rotacoes Espaciais
B.6 Polin omios de Jacobi
Vamos denotar por g os elementos de um determinado grupo de Lie G e por R

(g) as matriz de alguma


representa c ao irredutvel de dimensao n para G. Entao
n
_
d
g
R

ik
(g)R

rs
(g) =

is

kr
, (B.92)
onde d
g
e um fator peso de integracao conhecido por medida invariante normalizada, a qual depende da
forma especca de cada parametrizacao. Para a parametrizacao dada pelos angulos de Euler, temos

g
= sin d. (B.93)
Alem da condicao de ortogonalidade (B.92), os elementos de matriz R

rs
(g) formam uma base completa.
Estes resultados valem para um grupo de Lie qualquer e sao conhecidos como o teorema de Peter-Weyl.
Estaremos interessados aqui explicitamente no grupo das rotacoes. Neste caso, usando os elementos de
matriz encontrados em (B.65) e (B.85), as relacoes de ortogonalidades (B.92) tornam-se em

2j + 1
2
_
d cos d
j
ik
()d
j

rs
() =
jj

is

kr
. (B.94)
Os passos seguintes nos permitira identicar os elementos matriz (B.65) com os polinomios de Jacobi.
Iniciemos calculando os deslocamentos innitesimais nos tres angulos de Euler para a rotacao (B.62):
i

R(, , ) = J
3
R = R
_
R
1
J
3
R

, (B.95)
i

R(, , ) = J
3
R = R
_
e
iJ
3
J
2
e
iJ
3

, (B.96)
i

R(, , ) = RJ
3
. (B.97)
Expandindo as exponenciais relevantes em (B.63) e usando as relacoes de comuta cao (B.33) e a denicao
(B.32), podemos escrever os termos entre colchetes no lado direito das derivadas anteriores na forma
R
1
J
3
R =
1
2
sen
_
e
i
J
+
+ e
i
J

_
+ cos J
3
, (B.98)
e
iJ
3
J
2
e
iJ
3
=
i
2
_
e
i
J
+
e
i
J

_
. (B.99)
Usando estes dois conjuntos de relacoes, podemos isolar os geradores J
3
e J

:
RJ

= e
i
_
i
sen
_

cos

_
R, (B.100)
RJ
3
= i

R. (B.101)
Calculando os elementos de matriz entre os estados [jm) e [jm

), estas tres equacoes fornecem as seguintes


relacoes de recorrencia para d
j
mm
():
_
j(j + 1) m

(m

1) d
j
m,m

+1
() =
_


1
sen
_
mm

cos
_
_
d
j
mm
(). (B.102)
Podemos obter uma equacao diferencial para os elementos de matriz R
j
mm
usando o operador de Casimir
(B.38) e calculando os elementos de matriz de RJ
2
:
RJ
2
= R(J
2
3
J
3
+ J
+
J

)
=
_
e
i
_


i
sen
_

cos

_
_
e
i
_


i
sen
_

cos

_
_

2
i

_
R.
(B.103)
B. Polin omios de Jacobi 51
Os elementos de matriz deste operador sao dados por
_
1
sen

sen

+
1
sen
2

_

2

2
+

2

2
2 cos

2

_
+ j(j + 1)
_
R
j
mm
= 0, (B.104)
ou, usando (B.65),
_
1
sen
d
d
sen
d
d

1
sen
2

_
m
2
+ m
2
2mm

cos ) + j(j + 1)
_
d
j
mm
() = 0. (B.105)
Esta ultima equacao pode ser transformada na equacao de Jacobi,
_
(1 z
2
)
d
2
dz
2
+
_
2(2 + + )z

d
dz
+ l(l + + + 1)
_
P
,
l
(z) = 0, (B.106)
apos a identicacao
d
j
mm
() =

(j + m)!(j m)!
(j + m

)!(j m

)!
_
cos

2
_
m+m
_
sen

2
_
m

m
P
mm

,m+m

jm
(cos ). (B.107)
A equacao (B.104) para m

= 0 e = 0 e restringindo os valores de j a inteiros l, torna-se em


_
1
sen

sen

+
1
sen
2

2
+ j(j + 1)
_
R
j
m,0
(, , 0) = 0. (B.108)
Esta e a mesma equacao diferencial satisfeita pelos harmonicos esfericos Y
lm
(, ), apos a identicacao
Y
lm
(, ) =
_
2l + 1
4
[R
j
m,0
(, , 0)]

. (B.109)
52 B. Rotacoes Espaciais
Apendice C
Relatividade Especial
C.1 Introducao
A teoria da relatividade especial descreve de que forma os aspectos relativos de uma realidade fsica podem
diferir em conseq uencia do estado de movimento relativo entre observadores. No entanto, ela dene tambem
os aspectos absolutos da mesma realidade fsica. Assim, ao contrario da crenca popular, a teoria da relativi-
dade especial nao e uma teoria do tudo e relativo. Melhor seria dizer que ela e uma teoria das aparencias
sao relativas e do que e absoluto em uma realidade fsica.
A sua essencia e bem ilustrada considerando-se dois observadores em movimento uniforme. Vamos supor
que sejamos um dos observadores e que estamos vendo o outro referencial em um movimento uniforme em
relacao ao nosso referencial. Vamos imaginar tambem que seja possvel realizar um experimento no mesmo
instante em que o outro observador passe por nos. Segundo a relatividade especial, ambos observadores
veriam o mesmo experimento, mas cada um anotaria distancias e intervalos de tempo distintos. Contudo,
para a tranq uilidade de todos, a teoria da relatividade especial deve ser usada para converter os dados de um
observador para o outro, fazendo com que ambos concordem plenamente sobre os resultados do experimento.
Desta forma, a teoria da relatividade especial nos mostra que certos aspectos de uma realidade fsica sao
absolutos apesar de haver uma aparencia peculiar a cada observador. Por exemplo, segundo `a relatividade
especial, I) o comprimento de um objeto em movimento uniforme em relacao a nos encurta na direcao de
seu movimento. Quanto maior a velocidade do objeto, menor sera o comprimento do objeto visto por nos
na direcao do movimento. No limite em que o objeto esteja viajando `a velocidade da luz, o objeto tera um
comprimento nulo segundo nossa observa cao; II) o momentum linear de um objeto em movimento aumenta
com a sua velocidade. Para nos o objeto adquiri momentum linear extra com o movimento. No limite em
que o objeto esteja movimentando-se `a velocidade da luz, sua massa deve ser innita, requerendo assim uma
quantidade innita de energia para se movimentar. Portanto, nenhum objeto massivo podera deslocar-se
com uma velocidade superior `a velocidade da luz; III) relogios em movimento tornam-se mais lentos quando
vistos por nos. Na velocidade da luz, o relogio para por completo de marcar o tempo. Esta propriedade
certamente redene a nocao intuitiva de simultaneidade. Eventos simultaneos para um observador nao serao
mais simult aneos para o outro observador. Estes tres exemplos marcantes sobre aparencias de uma realidade
fsica e o ponto de vista de um dos dois observadores. No entanto, contrariando o primeiro, o outro observador
solidario ao objeto em movimento nao registra qualquer alteracao na forma e na massa de seus objetos e
nem qualquer alteracao em seus relogios.
Talvez ainda mais profundo seja a revela cao feita pela teoria da relatividade sobre a natureza do espaco
onde a nossa realidade fsica ocorre e a equivalencia entre materia e energia. Ao contrario da crenca humana
em um tempo absoluto, separado do espaco tridimensional euclideano, a natureza do nosso espaco funde
tempo e espaco numa estrutura unica: o espaco-tempo. O espaco-tempo nao e um espaco quadridimensional
euclideano, mas sim um espaco (pseudo) riemanniano. Em um espaco pseudo-riemanniano, ao contrario de
um espaco euclideano, podemos ter o modulo de um vetor igual a zero sem que o vetor seja nulo. De acordo
com a relatividade especial, cada evento numa realidade fsica deve ser identicado em um determinado
referencial pela sua posicao espacial e o tempo em que este evento ocorreu. Materia e energia e outra fusao
surpreendente revelada pela teoria da relatividade especial. Apesar da inequivalencia aparente entre materia
53
54 C. Relatividade Especial
e energia, elas sao sicamente equivalentes. Materia pode ser convertida em energia, e vice-versa. Portanto,
a Relatividade Especial revelou `a humanidade aspectos ate entao escondidos profundamente: tempo e espaco
formam uma estrutura unica e a equivalencia entre massa e energia.
Podemos tomar, como ponto de partida para a elaboracao da teoria da relatividade especial por Albert
Einstein (18791955) no incio do Sec. XX, o conito entre a relatividade galileana e a vericacao da in-
variabilidade da velocidade da luz. Segundo a relatividade galileana, as leis da Mecanica sao validas em
quaisquer referenciais em movimento uniforme (referenciais inerciais). Isto signica que e impossvel distin-
guir dois referenciais inerciais (ou o estado de movimento de um deles) atraves de experimentos mecanicos.

E importante frisar que na relatividade galileana o tempo e absoluto, isto e, ele e o mesmo para todos os
referenciais. Apenas posicoes e distancias sao dependentes do observador. Assim, contrariamente a todas as
expectativas newtonianas, a velocidade da luz nao obedecia ao teorema da adicao de velocidades decorrente
da relatividade galileana. A velocidade da luz sempre mostrava-se independente do observador em todos
os experimentos realizados. Ela foi medida, provavelmente pela primeira vez, em 1675 por Olaus Roemer
atraves de observa coes astronomicas proporcionadas pelos eclipses lunares em J upiter. Somente em 1926, Al-
bert Abraham Michelson (18521931) pode medir a velocidade da luz atraves de tecnicas de interferometria
com a acuracia que a conhecemos nos dias atuais.
Outro conito na epoca de Einstein eram as incertezas fsicas e losocas sobre o signicado de estar ou
nao em movimento. As leis da mecanica newtoniana, indispensaveis para a Engenharia e tambem para a
Fsica, foram construdas com base em referenciais inerciais (ausencia absoluta de movimento). No entanto,
jamais tais referenciais foram encontrados, apesar de sabermos da validade das leis da fsica newtoniana.
A incapacidade de detecccao de sistemas inerciais certamente foi um problema conceitual que preocupava
muitos. Einstein foi um deles. A melhor explicacao para a falha em encontrar um referencial inercial foi
a teoria do

Eter. Segundo a teoria do eter, o universo inteiro esta permeado por um substancia invisvel,
inodora, e sem qualquer outra propriedade fsica diretamente mensuravel. O eter estava em todo lugar e
dentro de tudo e em repouso absoluto.
1
Assim, o eter colocava um m na busca pelos sistemas inerciais.
Apos a unicacao denitiva entre eletricidade e magnetismo, descoberta em 1870 por James Clerk Maxwell
(18311879), o eter tambem foi idealizado como o meio de propagacao para as ondas eletromagneticas, das
quais a luz visvel tambem e formada. Acontece que ate o incio do Sec. XX, acreditava-se que fenomenos
ondulatorios pudessem existir apenas em meios materiais, em analogia com ondas sonoras. Apesar das
equacoes de Maxwell evidenciarem a possibilidade de propagacao de ondas eletromagneticas no vacuo, mesmo
assim o eter foi evocado para servir como meio de propagacao da luz. O proprio Maxwell em 1878 foi um
dos primeiros a observar que o intervalo de tempo gasto para a luz efetuar um percurso de ida e volta
entre dois pontos muda de valor quando estes dois pontos sao movidos conjuntamente atraves do eter e
sem arrasta-lo. Em 1881, Michelson realizou um experimento, usando tecnicas de interferometria
2
, para
medir os deslocamentos previstos por Maxwell devido ao movimento do interferometro, solidario `a Terra,
atraves do eter. O principal objetivo de Michelson era comprovar a existencia do eter. Ao contrario das
expectativas, Michelson obteve nem vestgios de tais desvios. No entanto, como havia sido apontado por
Lorentz, Michelson tinha avaliado erroneamente a razao entre o desvio a ser observado e o erro experimental
em seu equipamento. Era preciso aumentar a precisao do equipamento. Em 1887, em colaboracao com
Edward Williams Morley (18381923), um outro experimento de interferometria muito mais sosticado foi
realizado. Este experimento mostrou de forma conclusiva que os deslocamentos previsto por Maxwell nao
existiam.
3
Como conclusao, Michelson teve de admitir que o eter era arrastado pelo movimento da Terra.
Sem d uvidas, este resultado chocou a comunidade cientca da epoca, alem de colocar em d uvida a existencia
do referencial inercial.
No entanto, uma hipotese melhor foi proposta em 1889 por George Francis FitzGerald (18511901):
talvez a pressao do eter sobre a materia a comprimisse da mesma forma que um objeto elastico e comprimido
na direcao de seu movimento em um uido. Desta forma, um dos bracos do interferometro poderia ter sido
encolhido por uma quantidade correspondente `a alteracao na velocidade da luz, de forma a nao causar
qualquer padrao de interferencia no interferometro. O ponto maximo desta hipotese e que ela nao poderia
1
O eter foi uma substancia inventada por Aristoteles (384322, a.c.) como o quinto elemento do qual os corpos celestes eram
feitos. Os cientistas do Sec. 19 apenas aperfeicoaram esta concepcao de Aristoteles.
2
Albert A. Michelson foi o inventor do interfer ometro e o primeiro cientista americano a receber um premio Nobel. O premio
foi concedido a ele em 1907 pela invenc ao de instrumentos oticos de precisao e as decorrentes investigac oes realizadas com eles.
3
Michelson a Morley repetiram este experimento por varias vezes ate 1929.
C. Introduc ao 55
assim jamais ser provada falsa, uma vez que tudo, incluindo reguas e os objetos a serem medidos, deveriam
ter seus comprimentos reduzidos na direcao do movimento. Embora a hipotese das contracoes de FitzGerald
nao tivesse chamado a atencao da comunidade cientca de imediato, em 1892 Hendrik Antoon Lorentz
(18531928)
4
restabeleceu as ideias de FitzGerald sobre as contracoes. Em um trabalho publicado em
1899, Lorentz deu uma base matematica rigorosa para as contracoes de FitzGerald, estabelecendo assim as
transformacoes de Lorentz como nos as conhecemos hoje, as quais sao fundamentais para a teoria especial
da relatividade.
5
O objetivo de Lorentz era explicar o resultado do experimento de Michelson-Morley.
Lorentz, como Michelson, acreditava na existencia do eter e chegou `a conclusao que a dimensao de um
corpo rgido se modica um pouco em conseq uencia do seu movimento atraves do eter. Trabalhando nesta
linha, Lorentz foi capaz de estabelecer as expressoes matematicas das contracoes de FitzGerald. O Trabalho
nal de Lorentz foi publicado em 1904.
Em todos os trabalhos de Lorentz, em momento algum, ha um rompimento com a hipotese do eter e,
conseq uentemente, de um tempo absoluto. No entanto, em face ao resultado do experimento de Michelson-
Morley e da tentativa de Lorentz em explica-lo atraves da hipotese de FitzGerald, Jules Henri Poincare
(18541912) havia apontando em varias oportunidades a necessidade de estender a relatividade galileana
a toda a Fsica. Em 1905, no mesmo ano da publicacao dos trabalhos de Einstein sobre a relatividade
especial, havia proposto que a impossibilidade de demonstrar o repouso absoluto fosse uma lei universal.
Poincare tambem mostrou que as transformacoes de Lorentz, conjuntamente com as rotacoes espaciais,
formam um grupo contnuo da famlia O(1,3) dos grupos de Lie. Esse grupo foi denominado de grupo de
Lorentz por Poincare, em homenagem ao Lorentz. Mais tarde, o conjunto formado pelo grupo de Lorentz e
as translacoes no espaco-tempo por uma quantidade xa foi denominado de grupo de Poincare. Ainda em
1905, Albert Einstein, entao completamente desconhecido da comunidade cientca, submeteu um trabalho
radicalmente diferente dos demais, rompendo com a hipotese do eter.
6
Einstein simplesmente armou que o eter nao existe, pois todos os experimentos falharam em detecta-lo.
Alem disto, as equacoes de Maxwell possibilitam a propagacao da luz na ausencia de materia. Portanto, o
eter e totalmente dispensavel. Conseq uentemente, o repouso absoluto foi outra vtima de Einstein. Para que
privilegiar um unico sistema de referencias?, perguntou Einstein. As leis fsicas devem ser independentes
da escolha de um referencial. Como havia armado Poincare, Einstein deniu referenciais inerciais atraves
do proprio movimento uniforme relativo entre eles. Einstein usou apenas dois postulados em seu trabalho:
I) que as leis da Fsicas sao as mesmas em qualquer sistema inercial, e II) que a velocidade da luz e a
mesma em qualquer sistema inercial. Com apenas estes dois postulados, ele derivou as transformacoes de
Lorentz e interpretou as contra coes de FitzGerald como conseq uencia apenas do estado de movimento e nada
mais. Embora Einstein, nao tivesse a intencao de explicar o resultado experimental de Michelson-Morley,
certamente os seus dois princpios estavam de acordo com os experimentos. Ainda em 1905, Einstein publicou
outro trabalho mostrando a equivalencia entre massa e energia. Os trabalhos de Einstein ganharam aceitacao
a partir do envolvimento de Max Karl Ernst Ludwig Planck (18581947) com o assunto em 1908. Ainda em
1908, Hermann Minkowski (1864-1909) mostrou que a teoria da relatividade especial de Einstein era melhor
interpretada numa geometria pseudo-riemanniana. Minkowski mostrou tambem que a teoria newtoniana da
gravita cao era inconsistente com a relatividade. Em 1912, Einstein e Lorentz foram indicados para o premio
Nobel daquele ano, mas incertezas sobre a comprova cao experimental da teoria da relatividade especial
impediu uma decisao favoravel.
Apesar das modicacoes profundas e imediatas causadas pela relatividade especial, o fato dela envolver
apenas referenciais em movimento uniforme incomodava Einstein. Ele queria que as leis fsicas fossem as
mesmas em qualquer tipo de referencial. Em 1915, Einstein revela `a humanidade a teoria da relatividade
geral como uma solucao `as limitacoes da relatividade especial.
4
Lorentz era um especialista na teoria eletromagnetica de Maxwell. Ele propos, mesmo antes da descoberta dos eletrons, que
ondas eletromagneticas estivessem associadas com oscilacoes de cargas eletricas no interior atomico. Ele explicou tambem pela
primeira vez o efeito de um campo magnetico no comprimento de onda da radiacao eletromagnetica. Este efeito foi observado
experimentalmente por um aluno dele, Pieter Zeeman (18651943). Ambos receberam um premio Nobel em 1902.
5
Joseph Larmor (18571942) tambem escreveu as transformacoes de FitzGerald-Lorentz, independentemente de Lorentz, em
1898.
6
Einstein armou que desconhecia os trabalhos de Lorentz e Poincare, bem como o resultado dos experimentos de Michelson-
Morley.
56 C. Relatividade Especial
C.2 Propriedades do espaco-tempo
Vamos considerar dois referenciais O e O

em movimento uniforme. Vamos supor, por comodidade, que


o referencial O

tem uma velocidade de modulo v na direcao positiva do eixo x do referencial O. Vamos


supor tambem que o eixo x

coincida com o eixo x e que os eixos y

e z

sejam paralelos aos eixos y e z,


respectivamente. Imaginemos dois eventos em O. O primeiro deles, por exemplo, a emissao de um sinal com
a velocidade da luz (c) sera identicado no espaco-tempo pelas coordenadas (ct
1
, x
1
, y
1
, z
1
) do referencial
O. O outro, a chegada do sinal, sera identicado por (ct
2
, x
2
, y
2
, z
2
). Observando a propagacao desse sinal
em O, concluiremos que ele percorrera a distancia c(t
2
t
1
) a qual deve ser identica `a distancia espacial
_
(x
2
x
1
)
2
+ (y
2
y
1
)
2
+ (z
2
z
1
)
2
entre os dois eventos. Portanto,
c
2
(t
2
t
1
)
2

_
(x
2
x
1
)
2
+ (y
2
y
1
)
2
+ (z
2
z
1
)
2

= 0. (C.1)
De forma analoga, a observa cao da propagacao do sinal luminoso no referencial O

nos leva a uma conclusao


analoga em virtude da velocidade da luz ser a mesma em qualquer referencial,
c
2
(t

2
t

1
)
2

_
(x

2
x

1
)
2
+ (y

2
y

1
)
2
+ (z

2
z

1
)
2

= 0. (C.2)
A quantidade
ds
2
= c
2
dt
2
(dx
2
+ dy
2
+ dz
2
), (C.3)
e denominada de intervalo innitesimal no espaco-tempo. Ela e o analogo da distancia innitesimal no espaco
euclideano. Vimos no exemplo acima que o intervalo entre dois eventos, cujo sinal de propagacao viaja na
velocidade da luz, e nulo em qualquer sistema de coordenadas. Isto e uma conseq uencia direta da velocidade
da luz ser a mesma em todos os referenciais. Restam duas opcoes alem do intervalo nulo: i) intervalos do
genero tempo, ds
2
> 0; e ii) intervalos do genero espaco, ds
2
< 0. Assumindo que o espaco-tempo seja
homogeneo e que o espaco seja isotropico podemos mostrar que o intervalo innitesimal ds
2
e o mesmo em
todos os referenciais inerciais. De fato, sendo os diferenciais ds
2
e ds
2
de mesma ordem e nulos em qualquer
sistema de coordenadas para eventos ocorrendo na velocidade da luz, entao eles devem ser proporcionais
ds
2
= a([v[)ds
2
. (C.4)
Devido `a homogeineidade e isotropia, a constante a(v) pode depender apenas do modulo da velocidade
relativa entre os dois sistemas de coordenadas. Esta constante de proporcionalidade nao pode depender das
coordenadas devido `a homogeneidade do espaco-tempo pois, caso contrario, pontos diferentes no espaco-
tempo nao seriam equivalentes. Ela tambem nao pode depender da direcao e sentido da velocidade relativa
entre os sistemas de coordenadas para poder preservar a isotropia do espaco, ou seja, todas as direcoes
espaciais sao equivalentes (isto nao e mais verdade para o espaco-tempo). Consideremos entao tres sistemas.
Seja v
1
e v
2
as velocidades relativas de dois deles em relacao ao terceiro e v
12
a velocidade relativa entre os
dois primeiros. Assim, teremos
ds
2
= a(v
1
)ds
2
1
,
ds
2
= a(v
2
)ds
2
2
,
ds
2
1
= a(v
12
)ds
2
2
.
(C.5)
Comparando estas relacoes, teremos
a(v
12
) =
a(v
2
)
a(v
1
)
. (C.6)
Como v
12
depende tambem do angulo entre os vetores velocidades v
1
e v
2
, o lado esquerdo da identidade
acima dependera tambem deste angulo. No entanto, este tipo de dependencia nao aparece no lado direito.
Portanto, a constante a deve ser tambem independente do modulo da velocidade relativa. Neste caso, a
identidade anterior implica em a = 1.
Sabendo que o intervalo e uma quantidade invariante, devido `a invariabilidade da velocidade da luz,
podemos dar uma interpreta cao fsica para os intervalos do genero tempo e espaco. Vamos denotar por s
2
12
o intervalo entre dois eventos em O,
s
2
12
= c
2
t
2
12
r
2
12
, (C.7)
C. Propriedades do espaco-tempo 57
com
t
12
= t
2
t
1
, r
2
12
= (x
2
x
1
)
2
+ (y
2
y
1
)
2
+ (z
2
z
1
)
2
. (C.8)
Da invariabilidade do intervalo, temos
s
2
12
= c
2
t
2
12
r
2
12
= c
2
t

2
12
r

2
12
= s

2
12
. (C.9)
Suponha agora que os eventos aconte cam na mesma posicao espacial no referencial O

. Entao r

2
12
= 0 e
s
2
12
= c
2
t
2
12
r
2
12
= c
2
t

2
12
> 0 r
12
< ct
12
. (C.10)
Isto signica que se o intervalo s
12
entre dois eventos for do genero tempo, s
2
12
> 0, entao sera possvel
encontrar um referencial no qual os mesmos eventos acontecam no mesmo ponto espacial. Isto somente sera
possvel quando a velocidade de propagacao entre os eventos for menor que a velocidade da luz. Neste caso
podemos falar em causa e efeito, pois como nenhum evento podera ocorrer com uma velocidade maior que a
da luz, nunca teremos o efeito antes da causa. Em outras palavras, quando o intervalo e do genero tempo,
podemos dar um sentido absoluto para antes e depois. Por outro lado nao podemos dizer o mesmo a
respeito dos intervalos do genero espaco s
2
12
< 0. Neste caso e possvel encontrar um referencial onde os
eventos acontecam simultaneamente, t

12
= 0. Entao,
s
2
12
= c
2
t
2
12
r
2
12
= r

2
12
< 0 r
12
> ct
12
. (C.11)
Neste caso poderemos ter propagacoes numa velocidade maior que a da luz.
Para uma maior clareza nos desenvolvimentos formais, devemos adotar algumas convencoes sobre a
notacao de vetores no espaco-tempo. Um vetor no espaco-tempo sera denotado pelas suas quatro compo-
nentes, correspondendo `as projecoes nos quatro eixos independentes do espaco tempo. Por exemplo, o vetor
posicao no espaco-tempo sera denotado por coordenadas x

, = 0, 1, 2, 3. Em termos das coordenadas


espaciais, teremos
(x

) = (x
0
, x
1
, x
2
, x
3
) = (ct, x, y, z), x

R. (C.12)
Adotaremos ndices gregos para as componentes de um vetor no espaco-tempo e ndices latinos para as
componentes de um vetor no espaco euclideano tridimensional. Assim,
(x
k
) = (x
1
, x
2
, x
3
) = (x, y, z) = r. (C.13)
Para falarmos sobre comprimentos, isto e, para efetuarmos medidas, precisaremos de uma metrica no
espaco-tempo, contendo informacoes sobre a orientacao relativa entre todos os vetores de base. A metrica
(g

) e uma matriz quadrada 44, simetrica e invertvel Conhecendo a metrica, podemos efetuar o produto
escalar entre quaisquer vetores fazendo uso da denicao da forma bilinear (A.20),
ds
2
= (dx, dx) = dx

dx

= (dx

) (g

) (dx

). (C.14)
Comparando esta denicao com a denicao de intervalo feita em (C.3), vemos que a metrica (g

) para o
espaco-tempo e:
(g

) =
_
_
_
_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_
_
_
_
, , = 0, 1, 2, 3. (C.15)
Note que se tivessemos uma velocidade da luz diferente em cada referencial, nao poderamos ter chegado nesta
conclusao. Esta metrica e denominada de metrica de Minkowski. Ela e uma conseq uencia da invariabilidade
da velocidade da luz. A matriz (C.15) possui as seguintes propriedades: i) ela e simetrica, g

= g

; ii)
g = det(g

) = 1; iii) a sua inversa e igual a ela mesma. No entanto, precisaremos designar os elementos
da inversa por g

para podermos utilizar a conven cao de soma implcita (veja o Apendice A).
7
Assim,
g

= g

= g

. (C.16)
7
Estamos adotando a convencao que ha uma soma sempre que houver ndices repetidos numa mesma expressao. Porem, e
preciso que os ndices aparecam numa diagonal, isto e, um ndice para cima e o outro para baixo (sub-ndice).
58 C. Relatividade Especial
Tambem dizemos que foi feita uma contracao nos ndices onde ha uma soma. Note que o traco da metrica
denido por uma contra cao e 4, isto e, g

.
O espaco-tempo com a metrica (C.15) e denominado de espaco de Minkowski (Hermann Minkowski,
18641909). Ele foi o primeiro a notar em 1907 que o trabalho de Albert Einstein (18791955) sobre a
relatividade especial em 1905, envolvendo as transformacoes de Lorentz (Hendrik Antoon Lorentz, 1853
1928), era melhor compreendido em um espaco nao-euclideano. Em um espaco euclideano, ao contrario de
um espaco nao-euclideano, a metrica deve possuir os seus autovalores todos positivos e nao-nulos (positivos
denidos). Em um espaco nao-euclideano sempre podemos denir dois tipos de vetores relacionados pela
metrica. Por exemplo, podemos denir o vetor no espaco-tempo (x

), associado ao vetor posicao (x

), como
x

= g

, (x

) = (ct, x, y, z). (C.17)


Desta forma, o produto escalar denido em (C.14) pode ser escrito em termos de componentes como
ds
2
= ds

ds

= ds

ds

= ds

ds

. (C.18)

E muito importante a posicao dos ndices nesta conven cao. Em geral, para uma matriz arbitraria as formas
(A

), (A

), (A

) e (A

) sao distintas.

E importante tambem observar o balanco da quantidade de
ndices que estao nas posicoes superior e inferior nos dois lados de uma expressao.
C.3 Transformac oes de Lorentz
Quais as transformacoes de coordenadas entre dois sistemas inerciais que preserva intervalos no espaco-
tempo? Em qualquer espaco, euclideano ou nao, ha apenas duas transformacoes de coordenadas com tal
caracterstica: i) translacoes do sistema de coordenadas como um todo em alguma direcao pre-xada, a qual
nao nos interessa no momento; e ii) rotacoes. Vamos denotar por

os elementos de matriz (reais) de uma


rotacao no espaco-tempo de Minkowski. Entao, as coordenadas em dois sistemas O e O

estarao relacionados
da forma seguinte:
x

. (C.19)
A condicao de invariabilidade de intervalos no espaco-tempo requer que
x

= g

= x

= g

,
(C.20)
a qual implica em
g

= g

. (C.21)
Esta equacao impoe restricoes severas sobre os elementos de matrizes das rotacoes no espaco-tempo. Note que
estas propriedades destas transformacoes deixa qualquer contracao invariante. Podemos calcular facilmente
de (C.21) os elementos de matriz para a transformacao inversa. Para tal, basta contrairmos um dos dois
ndices livres com a metrica:
g

= g

(
1
)

= g

. (C.22)
A transformacao correspondente para as coordenadas x

tambem pode ser calculada sem diculdades:


x

= g

= g

= g

. (C.23)
Reescrevendo as relacoes (C.21) em termos matriciais, podemos ver que elas implicam que o determinante
destas matrizes de rotacao deve ser unitario:
g = g det() = 1. (C.24)
Como transformacoes de coordenadas formam um grupo quando a identidade estiver presente entre elas,
faremos a escolha det() = +1 para assegurar a presenca da identidade. O conjunto destas rotacoes forma o
grupo de Lorentz. Este grupo contnuo e um grupo de Lie nao-compacto da famlia SO(1,3) (transformacoes
C. Transformacoes de Lorentz 59
ortogonais no espaco de Minkowski com a metrica dada em (C.15)). Naturalmente, o grupo de Lorentz
contem o grupo das rotacoes como subgrupo:
_
_
_
_
1 0 0 0
0
0 R
i
j
0
_
_
_
_
, (C.25)
onde R
i
j
sao os elementos de matriz das rotacoes espaciais.
Qualquer vetor no espaco-tempo de Minkowski que e modicado pela rotacao (

) e denominado de
quadrivetor. Os demais objetos com mais ndices, como matrizes, cujos ndices sao modicados mediante
uma contracao com as componentes

sao denominados de quadritensores (ou simplesmente tensores).


A quantidade de ndices (ou entradas) em um tensor e a ordem do tensor. Desta forma, um escalar e um
tensor de ordem zero, um vetor e um tensor de ordem um e uma matriz e um tensor de ordem dois. De
acordo com a posicao dos ndices de um vetor, ele sera denominado de contravariante (posicao superior) ou
covariante (posicao inferior). Assim, o quadrivetor posicao (x

) e um vetor contravariante, enquanto que


(x

) e um vetor covariante. As palavras covariante e contravariante devem ser entendidas aqui signicando
modicando-se da mesma forma e modicando-se de forma contraria aos vetores de base do espaco-
tempo, respectivamente. De fato, seja e

os versores de base. Entao, de acordo com o ponto de vista onde


os vetores de base e que sofrem modicacoes,
(x

) = x

= x

, e

. (C.26)
Assim, cada componente contravariante de um tensor sera modicada pela matriz

e cada componente
covariante sera modicada pela matriz inversa

. Como exemplo, consideremos uma quantidade T

com
sendo um tensor. Entao podemos assegurar que
T

. (C.27)
Em particular, a metrica e um tensor invariante. De fato, pois podemos ver de (C.21) que suas componentes
sao inalteradas perante uma rotacao do grupo de Lorentz. Vale observar que ha um quadrivetor natural no
espaco de Minkowski: o gradiente no espaco-tempo denido como
(

) =
_
1
c
t,
_
,

=

x

. (C.28)
De fato, sob uma transformacao de coordenadas do tipo (C.19) (ou do tipo (C.23)), o gradiente no espaco-
tempo transforma como

=

x

=
x

, (C.29)
o qual transforma de acordo com a lei de transformacao de um quadrivetor covariante. Portanto, o laplaciano
no espaco tempo,

=
1
c
2

2
t
2

2
, (C.30)
e outra quantidade invariante `as transformacoes de Lorentz.
Note que devido `a simetria da metrica, as relacoes em (C.21) totalizam 10 relacoes independentes entre
as 16 componentes da matriz de rotacao no espaco-tempo. Cada uma das seis componentes independentes

corresponde a uma rotacao dos seis possveis planos ortogonais no espaco tempo: xy, xz e yz para
as rotacoes puramente espaciais e xt, yt e zt para as demais. Por comodidade, trataremos aqui apenas as
rotacoes no plano xt, isto e, rotacoes mantendo os demais eixos y e z inalterados. A matriz correspondente
a esta rotacao particular tem a forma
(

) =
_
_
_
_

0
0

0
1
0 0

1
0

1
1
0 0
0 0 1 0
0 0 0 1
_
_
_
_
. (C.31)
60 C. Relatividade Especial
As condic oes (C.21) fornecem as relacoes seguintes entre os quatro elementos da matriz acima,
(
0
0
)
2
(
1
0
)
2
= 1,
(
0
1
)
2
(
1
1
)
2
= 1,

0
0

0
1

1
0

1
1
= 0.
(C.32)
Podemos ver das duas primeiras relacoes que
0
0
,=
1
0
bem como
0
1
,=
1
1
. Assim, a ultima destas
relacoes e satisfeita quando

1
1
=
0
0
,
1
0
=
0
1
, (C.33)
onde e uma constante. Esta constante pode ser determinada requerendo que o determinante desta matriz
seja unitario:
det(

) =
0
0

1
1

1
0

0
1
=
_
(
0
0
)
2
(
1
0
)
2

= = 1 = 1. (C.34)
Portanto, devemos procurar parametrizar
0
0
e
0
1
, por exemplo, satisfazendo
(
0
0
)
2
(
0
1
)
2
= 1, (
0
0
)
2
1. (C.35)
As funcoes trigonometricas hiperbolicas possuem tais propriedades. Assim, podemos escrever

0
0
= cosh(),
0
1
= senh(), 0 < . (C.36)
Para nalizar, devemos relacionar o parametro real com as quantidades fsicas relevantes. Neste caso,
a velocidade da luz c e a velocidade relativa v dos dois referenciais. Para tal, vamos observar um ponto
especco no referencial O

: a origem (x

1
= 0). Assim, apos a transformacao acima ser aplicada teremos
x
0
= ct = cosh()x

0
x
1
= x = senh()x

0
_
tanh() =
x
ct
= . (C.37)
Das relac oes trigonometricas
tanh() =
senh()
cosh()
, cosh
2
() senh
2
() = 1, (C.38)
temos
senh() = , cosh() = , =
1
_
1
2
= 1 +
1
2

2
+O(
4
), (C.39)
de onde podemos ver que para baixas velocidades, < 1, obtemos as transformacoes de Galileu
x = x

+ vt

, t = t

. (C.40)
Considerando ainda a transformacao de Lorentz particular dada em (C.31), a qual corresponde ao refe-
rencial O

movendo-se com velocidade v na direcao positiva do eixo x do referencial O e com os demais eixos
espaciais paralelos aos eixos do referencial O, podemos calcular como distancias e intervalos de tempo estao
relacionados em dois referenciais em movimento relativo uniforme. A distancia x
12
= x
2
x
1
no referencial O
esta relacionada com a distancia x

12
= x

2
x

1
no referencial O

, ambas medidas na direcao do movimento,


pelas transformacoes (C.31),
x
12
= ct

12
+ x

12
= x

12
, (C.41)
onde utilizamos as relacoes (C.39) e o fato que medidas de distancias devem ser efetuadas no mesmo instante
de tempo, portanto t

12
= 0. De forma analoga, os intervalos de tempo t
12
= t
2
t
1
e t

12
= t

2
t

1
estao
relacionados por
ct
12
= ct

12
+ x

12
= ct

12
, (C.42)
onde utilizamos o fato que medidas de intervalos de tempo devem ser efetuadas no mesmo local, portanto
x

12
= 0. Estes resultados indicam que tanto a regua quanto o relogio que estao em movimento em relacao
ao referencial O sofrem uma contracao por um fator em relacao `a regua e ao relogio do referencial O.
Medidas feitas com instrumentos solidarios aos objetos em movimento sao denominadas de proprias.
C. Dinamica Relativstica 61
C.4 Dinamica Relativstica
Consideremos o movimento arbitrario de uma partcula de massa m visto de um referencial uniforme O.
Embora esse movimento nao seja retilneo e uniforme, ainda podemos considerar um referencial O

solidario
a esta partcula para cada instante de tempo como sendo uniforme. Assim, em cada instante de tempo, po-
demos aplicar uma transformacao de Lorentz para relacionar estes dois referenciais. Neste caso, a velocidade
relativa entre os dois referenciais em consideracao e uma velocidade instantanea.
Como o tempo no espaco de Minkowski nao tem um papel distinto das demais coordenadas espaciais,
podemos utilizar qualquer parametro para descrever a trajetoria de uma partcula no espaco-tempo. Tais
trajetorias sao denominadas de linhas do universo da partcula. Os pontos da linha do universo determinam
as coordenadas da partcula para cada valor do parametro sendo usado. Um parametro conveniente e o
proprio comprimento da trajetoria medido ao longo da linha do universo.
Nos paragrafos subseq uentes, estaremos interessados em estabelecer as equacoes de movimento numa
forma covariante para uma partcula massiva e carregada (eletricamente neutra). Tais equacoes deverao
estar relacionadas com aquelas da dinamica newtoniana no limite apropriado.
Vamos iniciar estudando algumas propriedades geometricas das trajetorias no espaco-tempo quando
parametrizadas pelo proprio comprimento destas. No nosso referencial O, a partcula percorre a distancia
innitesimal dr =
_
dx
2
+ dy
2
+ dz
2
durante um intervalo innitesimal de tempo dt. Assim, vemos esta
partcula com uma velocidade cujo modulo e v = dr/dt. O intervalo ds, medido no referencial O, e
ds
2
= c
2
dt
2
dr
2
(C.43)
Este intervalo e o mesmo intervalo observado no referencial O

, solidario `a partcula (dr

= 0):
ds
2
= c
2
dt

2
. (C.44)
Portanto, fazendo uso da contra cao temporal (C.42), teremos que o comprimento da trajetoria esta direta-
mente ligado ao tempo proprio da partcula:
ds = cdt

=
1
cdt, =
1
_
1 v
2
/c
2
. (C.45)
Considerando que a linha do universo de uma partcula seja parametrizada pelo intervalo s, x

= x

(s),
podemos, como no caso newtoniano, denir um quadrivetor velocidade u

(s) para a partcula como sendo


a tangente `a sua trajetoria:
u

=
dx

ds
, (u

) =
_
1,
v
c
_
. (C.46)
Note que: I) este quadrivetor e uma grandeza adimensional; II) suas componentes espaciais sao formadas
pelas componentes da velocidade da partcula vista do nosso referencial; III) cu

tem dimensao de velocidade:


c(u

) = (c, v). (C.47)


No limite 1, a parte espacial deste quadrivetor e a velocidade newtoniana v. Outra propriedade
importante: o modulo do quadrivetor velocidade e sempre igual a um,
u

=
dx

ds
dx

ds
=
ds
2
ds
2
= 1. (C.48)
Isto implica que as componentes u

nao sao linearmente independentes. Desta forma, o movimento da


partcula estara restrito a uma superfcie do espaco-tempo determinada pela condicao u

= 1. Prosse-
guindo com a analogia newtoniana, podemos denir uma aceleracao no espaco-tempo como:
a

=
d
2
x

ds
2
=
du

ds
. (C.49)
Devido `a condicao (C.48) este quadrivetor sera sempre perpendicular `a velocidade,
d
ds
u

= 2u

du

ds
= 0 u

du

ds
= 0. (C.50)
62 C. Relatividade Especial
No regime newtoniano, o conte udo dinamico para uma partcula livre esta contido inteiramente no mo-
mentum linear: a variacao do momentum linear e nula. Prosseguindo com a nossa analogia newtoniana,
vamos procurar denir um quadrivetor que possa ser utilizado para denir momentum no espaco-tempo.
Faremos isto, em parte, com o auxlio do princpio de Hamilton. Vimos na Secao 1.4 que as variaveis p
e H, conjugadas `a posicao e ao tempo, respectivamente, podem ser denidas, como em (1.54), em termos
das varia coes innitesimais da posicao r e do tempo t, respectivamente. Para uma unica partcula livre, a
variac ao innitesimal da acao correspondente, Eq. (1.53), e dada por
= p r Ht =
_
d(Ht p r), (C.51)
onde p e o momentum linear e H a hamiltoniana. No caso de uma partcula livre, vimos na Subsecao 1.5,
que a hamiltoniana e a energia (puramente cinetica) mecanica da partcula.
Vamos supor aqui que a acao de uma partcula livre no espaco-tempo ainda seja aquela cuja varia cao
esta calculada em (C.51). Naturalmente, devemos redenir a nossa nocao de momentum no espaco-tempo.
A variac ao (C.51) e um escalar e pode ser reescrita numa forma covariante:
=
_
H
c
ct p r
_
= p

, (C.52)
onde denimos o quadrivetor momentum linear como
(p

) =
_
H
c
, p
_
. (C.53)
Este vetor tem de ser um quadrivetor, pois x

e um quadrivetor e e um escalar. Note que a componente


espacial deste quadrivetor e o momentum linear newtoniano. Portanto, temos um otimo candidato para o
tensor momentum linear para uma partcula livre no espaco-tempo. Por analogia com o caso de uma
partcula nao-relativstica, gostaramos que este quadrivetor momentum linear pudesse ser escrito em termos
do quadrivetor velocidade,
p

= u

, (C.54)
onde e uma constante. O valor desta constante pode ser determinado considerando o limite nao-relativstico
da componente temporal da expressao anterior:
p
0
=
H
c
= u
0
=
_
1 +
1
2
v
2
c
2
_
. (C.55)
Sendo H a energia cinetica e considerando que `a energia mecanica pode sempre ser adicionada uma constante
arbitraria, vemos que a constante deve ser mc. Portanto, o quadrivetor momentum linear para uma
partcula livre relativstica e
p

= mcu

. (C.56)
Combinando esta conclusao com a denicao (C.53), teremos que as componentes temporal H/c e espacial p
do quadrivetor momentum p

espacial sao
H = mc
2
, p = mv. (C.57)
No regime newtoniano, estas componentes tornam-se em:
H mc
2
+
1
2
mv
2
, p mv. (C.58)
Portanto, mesmo para o repouso, a partcula tem uma quantidade de energia, mc
2
, devido exclusivamente `a
sua massa m (denominada de massa de repouso). Isto sugere que massa e energia devem ser identicadas e,
conseq uentemente, podem ser convertidas uma na outra.
Vamos calcular o modulo do quadrivetor momentum. Usando (C.53) e (C.56) teremos,
p

=
H
2
c
2
p
2
= (mc)
2
H
2
= m
2
c
4
+ p
2
c
2
, (C.59)
C. Dinamica Relativstica 63
onde p e o modulo do momentum linear espacial. Esta e a celebrada relacao de dispersao encontrada por
Einstein. Podemos ver de (C.53), que mesmo uma partcula nao tendo massa de repouso, m = 0, ela ainda
tera um momentum linear no espaco-tempo. Por outro lado, vemos de (C.56) que a unica forma de evitar
que p

seja nulo e permitir v = c no fator da componente temporal de p

. Tais partculas viajando `a


velocidade da luz existem e algumas delas sao muito importantes para a vida como um todo: sao os fotons,
os constituintes basicos da radiacao eletromagnetica.
Prosseguindo com a analogia newtoniana, vamos denir uma forca no espaco-tempo como sendo a
variac ao do momentum dado em (C.53):
f

=
d
ds
p

=

c
_

H
c
, F
_
, F =
d
dt
p. (C.60)
Devido `a relacao de ortogonalidade (C.49), a componente temporal f
o
esta relacionada `a componente espacial
F:
f

=
2
_
f
o

1
c
F v
_
= 0 f
o
=

H
c
=
F v
c
= mc . (C.61)
Podemos ver que, novamente, cf

tem a dimensao de forca e que no limite newtoniano, 1, a componente


temporal do quadrivetor forca e a varia cao de energia no tempo (potencia) e a parte espacial de cf

e a forca
newtoniana. Assim, podemos denir uma partcula livre no espaco de Minkowski pela condicao f

= 0.
Esta denicao e condizente com a denicao de partcula livre na mecanica newtoniana (F = 0). No entanto,
a relatividade geral nos permite outra interpreta cao para o termo partcula livre como veremos adiante.
Em geral, uma partcula na presenca de algum potencial arbitrario estara sujeita a uma forca f

satis-
fazendo obrigatoriamente a relacao de ortogonalidade com a velocidade, Eq. (C.61). Duas classes de forcas,
de interesse fsico, obedecendo tal condicao sao: I) forcas do tipo eletromagneticas,
f

=
e
c
u

, F

= A
,
A
,
, (A

) = (, A), (C.62)
onde e e a carga eletrica, F

e um tensor covariante de ordem dois, anti-simetrico


8
, representando o campo
eletromagnetico como uma entidade fsica (e matematica) unica (como descoberto por Maxwell) e A

o
tensor representando os potenciais eletrico e magnetico. Note que o tensor eletromagnetico ainda contnua
sendo o gradiente de um potencial; e II) forcas do tipo gravitacionais,
f

, (C.63)
onde a quantidade

9
e calculada atraves das derivadas das componentes do tensor campo gravitacional
g

(x):

=
1
2
_
g
,
+ g
,
g
,
_
,

, g
,
=
g

. (C.64)
O campo gravitacional g

(x) tem uma interpretacao geometrica muito interessante: ele tambem o tensor
metrico do espaco-tempo. Desta forma, temos uma relacao perfeita entre Fsica e Geometria. Apesar da
similaridade entre a expressao matematica destas duas forcas, elas possuem caractersticas fsicas muito
distintas. A primeira observa cao e que, ao contrario de

, F

e um tensor. Assim, as trajetorias deter-


minadas em (C.63), denominadas de geodesicas, sao dependentes de um sistema de coordenadas particular.
Em (C.63), os potenciais

tem uma interpretacao geometrica clara: eles determinam a curvatura do


espaco-tempo, isto e, uma medida de quanto o espaco-tempo difere do espaco euclideano. Sempre que hou-
ver uma grande concentracao de energia em um determinado lugar no espaco-tempo, havera uma curvatura.
Isto muda radicalmente a gravita cao newtoniana. Para Newton, sempre havera uma atracao entre massas
atraves da acao de forcas instantaneas. No contexto da Relatividade Geral, lar das forcas representadas
por (C.63), a situacao e muito diferente: nao ha forcas genunas entre massas. Massas, como uma forma
de energia, deforma o espaco-tempo de forma a criar verdadeiros caminhos por onde tais massas devem
8
Um tensor covariante, completamente anti-simetrico tambem e denominado de forma diferencial.
9
As quantidades

sap denominadas de smbolos de Christoel ou de coecientes de conexao. Elas nao sao componentes
de um tensor de ordem tres, mas compoem as componenetes do tensor de curvatura, de ordem quatro, o qual mede o desvio de
um espaco curvo em relacao ao espaco euclideano.
64 C. Relatividade Especial
passar, sem ter qualquer outro caminho como opcao. Assim, a Terra deforma o espaco-tempo de forma a
vermos objetos suspensos nas proximidades da superfcie dela caindo em direcao ao seu centro. De modo
analogo, o sol, muito mais massivo, deforma o espaco tempo em seu redor, criando os caminhos por onde
os seus varios planetas podem passar. Tanto os planetas quanto os objetos na superfcie da Terra simples-
mente percorrem os unicos caminhos disponveis, livres de quaisquer forcas. Na Relatividade Geral nao ha a
necessidade da forca gravitacional newtoniana. Neste caso, podemos estender o nosso conceito de partcula
livre. Por outro lado, ate o momento, nao ha qualquer interpreta cao geometrica presente no lado direito da
Eq. (C.62). Estas diferencas apontadas aqui, e outras que fogem ao nvel deste humilde texto, representam
atualmente o maior desao intelectual dentro da Fsica Teorica (basica): a Relatividade Geral, ao contrario
do Eletromagnetismo, nao e compatvel com a Mecanica Quantica.
Naturalmente, a condicao de forca nula para uma partcula livre devera tambem ser uma conseq uencia
do princpio de Hamilton. Tendo isto em mente, podemos percorrer o caminho inverso que leva ao princpio
de Hamilton na forma (C.52) para determinarmos a acao correspondente. A partir da acao teremos a
lagrangiana e as equacoes de movimento. Em (C.52) temos a integral de um diferencial total
=
_
d
_
p

_
=
_
dp

_
p

_
dx

_
=
_
mc
_
ds
_
. (C.65)
Portanto, a acao procurada e
= mc
_
ds =
_
Ldt, (C.66)
onde ds e o intervalo innitesimal
ds =
_
dx

dx

_1
2
, (C.67)
e L a lagrangiana correspondente
L = mc
2

1
. (C.68)
Note que a acao e invariante por transformacoes de Lorentz, mas a lagrangiana denida acima nao e invari-
ante. Esta lagrangiana e uma funcao das derivadas temporais das coordenadas espaciais. Assim, obteremos
apenas a parte espacial das equacoes de movimento partindo das equacoes de Lagrange para esta lagrangiana.
No entanto, usando o princpio de Hamilton e a acao (para uma partcula livre, no sentido newtoniano),
= mc
_
ds, (C.69)
podemos obter todas as equacoes de movimento (C.60):
= mc
_
B
A
ds = mc
_
B
A

_
dx

dx

_1
2
= mc
_
B
A
dx

(dx

)
ds
= mc
_
B
A
u

d(x

) = mc
_
B
A
d(u

) + mc
_
B
A
du

=
_
p

B
A
+
_
B
A
dp

(C.70)
Para que a varia cao da acao dependa apenas dos pontos extremos A e B, entao dp

= 0, ou seja, a forca
f

deve ser nula. Note que a denicao do momentum linear p

= mcu

foi feita na ultima linha.


C.5 Partcula livre em um campo eletromagnetico
Tendo discutido a acao covariante para uma partcula livre, e instrutivo fazer uma discussao breve sobre as
alteracoes provocadas pela presenca de um campo eletromagnetico na vizinhanca da partcula. Certamente
teremos que adicionar um termo
P
, devido ao potencial eletromagnetico, `a acao
C
, correspondente `a
parte cinetica e dada por

C
= mc
_
ds. (C.71)
C. Partcula livre em um campo eletromagnetico 65
Como no caso cinetico, esta acao
P
, devido aos potenciais eletromagneticos e A, deve ser escrita numa
forma invariante `as transformacoes de Lorentz denidas em (C.19) e (C.21). Isto signica que devemos
reescrever a energia potencial eletromagnetica,
V = e
e
c
r A, (C.72)
denida em (1.29), numa forma covariante. Denindo o quadrivetor potencial A

como
A

= (, A), (C.73)
podemos vericar que
u

=

e
V, (C.74)
onde e e a carga eletrica da partcula. A acao
P
deve conter informacoes sobre o campo eletromagnetico,
dadas pelo quadrivetor A

, bem como sobre a forma de intera cao da propria partcula com o campo. Esta
derradeira informacao esta contida na carga eletrica e. Levando em conta que qualquer acao deve ser um
escalar, a forma covariante mais simples combinando estas informacoes e

P
=
e
c
_
A

dx

, (C.75)
onde o fator 1/c foi introduzido para que a forca f

resultante pertenca `a classe dada em (C.62). Desta


forma, uma acao adequada para uma partcula de massa m e carga e em um campo eletromagnetico dado
por A

e
= mc
_
ds
e
c
_
A

dx

. (C.76)
Podemos agora usar o teorema de Hamilton para determinar as equacoes de movimento partindo desta acao:
= mc
_
B
A
ds
e
c
_
(A

dx

)
=
_
B
A
_
p

+
e
c
A

_
d(x

)
e
c
_
A

,
dx

=
_
p

+
e
c
A

_
x

B
A
+
_
B
A
_
d
_
p

+
e
c
A

e
c
A
,
dx

_
x

.
(C.77)
Para que dependa apenas dos pontos extremos A e B devemos ter
d
_
p

+
e
c
A

e
c
A
,
dx

= dp

e
c
_
A
,
A
,
_
dx

= 0. (C.78)
Portanto, a forca covariante pode ser escrita como
f

=
dp

ds
=
e
c
u

, (C.79)
onde
F

= A
,
A
,
. (C.80)
Este tensor anti-simetrico representa o campo eletromagnetico (derivadas dos potenciais) como uma entidade
fsica unica, uma expressao matematica da descoberta de Maxwell (James Clerk Maxwell, 18311879).
Note que o termo nao nulo na variacao da acao em (C.77) re-dene a nossa nocao de momentum linear
como variavel conjugada `a posicao. Isto signica que nao poderemos mais denotar esta variavel conjugada
por p

. Assim,
p

+
e
c
A

, (C.81)
onde p

e a variavel conjugada `a posicao x

na dinamica relativstica covariante.



E esta nova variavel
que sera utilizada na quantizacao do campo eletromagnetico. Ela tambem e sinonimo da expressao fsica
acoplamento mnimo.
66 C. Relatividade Especial
Apendice D
Calculo Variacional
D.1 Introducao
Por comodidade, vamos considerar aqui uma funcao arbitraria F(q, q; t) no espaco de conguracoes. Po-
deramos ter escolhido qualquer forma para a dependencia funcional da funcao F. Tambem poderamos ter
escolhido uma funcao no espaco de fase. Vamos denir como pontos estacionarios, os pontos q(t) onde a
taxa de varia cao da funcao F(q, q; t) e nula em todas as direcoes:
F
q
k
= 0. (D.1)
Nestes pontos estacionarios, a funcao F pode assumir valores extremos:
1. Valor maximo (local ou global). Neste caso a segunda derivada de F deve ser negativa;
2. Valor mnimo (local ou global). Neste caso a segunda derivada de F deve ser positiva;
3. Maximo e mnimo simultaneos (ponto de inexao). Neste caso, a funcao podera apresentar um maximo
(ou mnimo) para certas direcoes e um valor mnimo (maximo) nas demais direcoes. Um exemplo
familiar e a sela (destas que usamos para montar).
Portanto, a caracterizacao de valores extremos (maximos, mnimos, inexoes) de funcoes ordinarias requerem
ferramentas do calculo diferencial ordinario. Estamos assumindo aqui que deslocamentos innitesimais nas
coordenadas q possam ser efetuados livremente em todas as direcoes (deslocamentos reversveis). Isto nao e
verdade nas bordas (contornos) do domnio de validade da das coordenadas q. Nos contornos, podemos ter
maximos e mnimos sem termos pontos estacionarios.
Consideremos agora uma integral denida da funcao F,
I[q(t)] =
_
B
A
F(q(t), q(t); t) dt. (D.2)
O valor desta integral depende da forma funcional da coordenada q(t). Mudando a forma funcional de q(t)
sistematicamente, teremos uma funcao de funcoes, denominada de funcional I[q(t)]. Naturalmnete, podemos
perguntar quem sao os pontos estacionarios (melhor seria: funcoes estacionarias) deste funcional I[q(t)].
As ferramentas adequadas para caracterizar estes pontos estacionarios pertencem ao caculo variacional.
Assim, podemos armar que o calculo variacional se preocupa com os valores extremos de certas integrais
denidas.
D.2 Deslocamentos virtuais
No calculo diferencial ordinario, um deslocamento innitesimal dt no parametro t, provoca um deslocamento
innitesimal dq em q(t). Esta variacao innitesimal em q, por sua vez, provova uma variacao innitesimal
67
68 D. Calculo Variacional
na funcao F(q(t), q(t); t):
dF(q(t), q(t); t) =
n

k=1
_
F
q
k
dq
k
+
F
q
k
d q
k
_
+
F
t
dt. (D.3)
Portanto todos os deslocamentos virtuais, dF, dq e d q dependem de dt. Esta e uma caracterstica do calculo
diferencial ordinario: os deslocamento innitesimais das coordenadas nao sao independentes das variacoes
innitesimais de seus parametros.
Consideremos agora variacoes innitesimais q e t independentes. Estas varia coes sao denominadas de
deslocamentos virtuais. Note que estamos usando o smbolo inves de d (esta notacao foi introduzida por
Lagrange). Assim,
F(q(t), q(t); t) =
n

k=1
_
F
q
k
q
k
+
F
q
k
q
k
_
+
F
t
t. (D.4)
A unica diferenca aqui com o calulo diferencial ordinario e independencia dos deslocamentos innitesimais
q
k
(para todos os k) e t. Para caracterizar os valores extremos de integrais denidas, podemos escolher
t = 0, os deslocamentos innitesimais q
k
(t) serao feitos todos no mesmo instante de tempo. Desta forma,
um deslocamento virtual representa uma alteracao innitesimal na forma funcional da coordenada q(t):
q(t) q(t) + q(t), q(t) (t), [[ 0, (D.5)
onde (t) e uma funcao analtica arbitraria. Deslocamentos virtuais possuem duas propriedades importantes:
eles comutam com o diferencial e a integral ordinarios. Sendo o deslocamento virtual q(t) uma funcao do
tempo, seu diferencial ordinario e
d q(t) = d(t). (D.6)
Por outro lado, o deslocamento virtual das velocidades generalizadas sao
q(t) =

q(t) q(t) =
_
q(t) +

(t)
_
q(t) =

(t). (D.7)
Como as funcoes e

sao arbitrarias, podemos escolher

= . neste caso, teremos


d q(t) = dq(t). (D.8)
De forma analoga, o deslocamento virtual da integral denida pode ser calculado:

_
B
A
F dt =
_
B
A

F dt
_
B
A
F dt =
_
B
A
(

F F) dt =
_
B
A
F dt. (D.9)
Estas duas propriedades do calculo variacional sao sucientes para caracterizarmos os pontos extremos da
integral denida I[q(t)].
D.3 Equac oes de Lagrange
Quem e a funcao q(t) tal que I[q(t)] = 0?. Vejamos:
I[q(t)] =
_
B
A
F(q(t), q(t); t) dt =
_
B
A
n

k=1
_
F
q
k
q
k
+
F
q
k
q
k
_
dt (D.10)
=
_
B
A
n

k=1
_
F
q
k

d
dt
_
F
q
k
__
q
k
dt +
_
F
q
k
q
k
_

B
A
= 0. (D.11)
Escolhendo q
k
= 0 nos extremos A e B e lembrando que os deslocamentos virtuais q
k
sao independentes,
entao
I[q(t)] = 0
F
q
k

d
dt
_
F
q
k
_
= 0. (D.12)
D. Equac oes de Lagrange 69
Isto signica que as funcoes q(t) que extremam o funcional I[q(t)] satisfazem as equacoes diferenciais de
Lagrange,
F
q
k

d
dt
_
F
q
k
_
= 0. (D.13)

Você também pode gostar