Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Topologia 4
1.1 Topologia da Linha e do Plano . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Linha Real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Espaços Topológicos: Definições . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Cálculo Variacional 5
2.1 Formulação do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Equação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 A ’Segunda Forma’ da Equação de Euler . . . . . . . . . . . . . . . . . . . 7
2.4 Funções com Diversas Variáveis Dependentes . . . . . . . . . . . . . . . . . 8
2.5 As equações de Euler Quando Condições Auxiliares São Impostas . . . . . 8
2.6 A Notação δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Mecânica Lagrangiana 13
3.1 Mecânica de uma Partícula . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Mecânica de um Sistema de Partículas . . . . . . . . . . . . . . . . . . . . 17
3.3 Vínculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Princípio de D’Alembert e Equações de Lagrange . . . . . . . . . . . . . . 24
3.5 Potenciais Dependentes da Velocidade e Função de Dissipação . . . . . . . 32
3.6 Derivação das Equações de Lagrange pelo Princípio de Hamilton . . . . . . 37
3.7 Extensão do Princípio de Hamilton para Sistemas Não-Holonômicos . . . . 37
3.8 Vantagens da Formulação do Princípio Variacional . . . . . . . . . . . . . . 37
3.9 Teoremas de Conservação e Propriedades de Simetria . . . . . . . . . . . . 37
3.10 Função Energia e Conservação da Energia . . . . . . . . . . . . . . . . . . 37
5 Eletromagnetismo 84
5.1 Tensor Eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1.1 Derivação do Tensor Eletromagnético Através da Formulação Co-
variante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1.2 Derivação do Tensor Eletromagnético Através do Princípio Variacional 87
5.2 Transformações de Lorentz dos Campos Elétricos e Magnéticos . . . . . . . 93
5.3 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
2
7.4 O Limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.5 Dilatação Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
3
CAPÍTULO 1 TOPOLOGIA
1 Topologia
1.1 Topologia da Linha e do Plano
1.1.1 Linha Real
2 Cálculo Variacional
2.1 Formulação do Problema
O problema básico do cálculo de variações é determinar a função y(x) de tal modo
que a integral Z x2
S= f {y(x), y 0 (x); x}dx (2.1.1)
x1
onde η(x) é alguma função de x que tem derivada contínua e que desaparece em x1
e x2 , porque a função variada y(α, x) deve ser idêntica a y(x) nos pontos finais do
caminho:η(x1 ) = η(x2 ) = 0. A situação é descrita esquematicamente na Figura 2.1.1.
Se funções do tipo dado pela Eq.(2.1.2) forem consideradas, a integral S torna um funci-
Figura 2.1.1: A função y(x) é o caminho que faz do funcional S um extremo. As funções
vizinhas y(x) + αη(x) desaparecem nos pontos finais e podem estar próximas a y(x), mas
não são o extremo.
1
Uma noção matemática de um funcional pode ser conferida no Apêndice B
2
Não é necessário que os limites de integração sejam considerados fixos. Se eles puderem variar, o
problema aumenta para encontrar não somente y(x) mas também x1 e x2 de modo que S seja um extremo.
onal de parâmetro α:
Z x2
S(α) = f {y(α, x), y 0 (α, x); x}dx (2.1.3)
x1
A condição que a integral tem um valor estacionário (isto é, que um extremo resulta)
é que S seja independente de α na primeira ordem ao longo do caminho que resulta no
extremo (α = 0), ou, de modo equivalente, que
∂S
=0 (2.1.4)
∂α α=0
para todas as funções η(x). Esta é somente uma condição necessária, não suficiente.
∂f d ∂f
− =0 (2.2.7)
∂y dx ∂y 0
df d ∂f dy ∂f dy 0 ∂f
= f {y, y 0 , x} = + 0 +
dx dx ∂y dx ∂y dx ∂x
(2.3.1)
∂f ∂f ∂f
= y0 + y” 0 +
∂y ∂y ∂x
Também
d 0∂f ∂f d ∂f
y 0 = y” 0
+ y0 (2.3.2)
dx ∂y ∂y dx ∂y 0
ou, substituindo da Eq.(2.3.1) para y”(∂f /∂y 0 ),
d 0 ∂f df ∂f ∂f d ∂f
y 0 = − − y0 + y0
dx ∂y dx ∂x ∂y dx ∂y 0
(2.3.3)
df ∂f 0 d ∂f ∂f
= − +y −
dx ∂x dx ∂y 0 ∂y
∂f
f − y0 = constante (2.3.5)
∂y 0
3
Derivada primeiro por Euler em 1744.Quando aplicada a sistemas mecânicos, é conhecida como
equação de Euler-Lagrange.
ou simplesmente
f = f {yi (x), yi0 (x); x} (2.4.2)
e as variações ∂y/∂α e ∂z/∂α não são mais independentes, então as expressões entre
parênteses na Eq.(2.5.2) não desaparecem separadamente em α = 0
Ao diferenciar g na Eq.(2.5.3), temos
∂g ∂y ∂g ∂z
dg = + dα = 0 (2.5.4)
∂y ∂α ∂z ∂α
∂g ∂g
η1 (x) = − η2 (x) (2.5.6)
∂y ∂z
A Eq.(2.5.2) se torna
Z x2
∂S ∂f d ∂f ∂f d ∂f
= − η1 (x) + − η2 (x) dx (2.5.7)
∂α x1 ∂y dx ∂y 0 ∂z dx ∂z 0
η2 (x) ∂g/∂y
=− (2.5.8)
η1 (x) ∂g/∂z
temos
Z x2
∂S ∂f d ∂f ∂f d ∂f ∂g/∂y
= − + − η1 (x) dx (2.5.9)
∂α x1 ∂y dx ∂y 0 ∂z dx ∂z 0 ∂g/∂z
Esta última equação agora contém a função única arbitrária η1 (x), que não está, de
nenhum modo, restrita pela Eq.(2.5.5), e ao requerer a condição da Eq.(2.1.4), a expressão
nos colchetes deve desaparecer. Desse modo, temos
−1 −1
∂f d ∂f ∂g ∂f d ∂f ∂g
− = − (2.5.10)
∂y dx ∂y 0 ∂y ∂z dx ∂z 0 ∂z
de x, os dois lados da Eq.(2.5.10) podem ser estabelecidos como iguais a uma função de
x, que formulamos como −λ(x):
∂f d ∂f ∂g
− + λ(x) = 0
∂y dx ∂y 0 ∂y
(2.5.11)
∂f d ∂f ∂g
− 0
+ λ(x) = 0
∂z dx ∂z ∂z
A solução completa para o problema agora depende de encontrar três funções: y(x), z(x)
e λ(x). Mas há três relações que podem ser utilizadas: as duas Eqs.(2.5.11) e a equação
de restrição Eq.(2.5.3). Desse modo, há um número suficiente de relações que permitem
uma solução completa. Note que, aqui λ(x) é considerado indeterminado 4 e é obtido
como parte da solução. A função λ(x) é conhecida como multiplicador indeterminado de
Lagrange;
Para o caso geral de diversas variáveis dependentes e varias condições auxiliares, temos
o seguinte conjunto de equações:
∂f d ∂f X ∂gj
− 0
+ λj (x) =0 (2.5.12)
∂yi dx ∂yi j
∂y i
gj {yi ; x} = 0 (2.5.13)
que possui um valor fixo para o comprimento da curva (l). Este segundo funcional repre-
senta uma restrição de integral.
Do mesmo modo que fizemos anteriormente, há uma constante λ tal que y(x) seja a
solução extrema do funcional Z b
(f + λ g) dx (2.5.17)
a
2.6 A Notação δ
Em análises que utilizam o cálculo de variações, utilizamos rotineiramente uma notação
simplificada para representar a variação. Desse modo, a Eq.(2.2.6) que pode ser formulada
como Z x2
∂S ∂f d ∂f ∂y
dα = − 0
dα dx (2.6.1)
∂α x1 ∂y dx ∂y ∂α
pode ser expressada como
Z x2
∂f d ∂f
δS = − δy dx (2.6.2)
x1 ∂y dx ∂y 0
onde
∂S
dα = δS
∂α
(2.6.3)
∂y
dα = δy
∂α
A condição do extremo então se torna
Z x2
δS = δ f {y, y 0 ; x} dx = 0 (2.6.4)
x1
3 Mecânica Lagrangiana
O movimento dos corpos materiais foi o assunto de algumas das primeiras pesquisas
realizadas pelos pioneiros da física. De seus esforços, desenvolveu-se um vasto campo
conhecido como mecânica analítica ou dinâmica, ou simplesmente, mecânica. No século
atual, o termo ’mecânica clássica’ passou a ser amplamente utilizado para denotar este
ramo da física em contraste com as teorias físicas mais recentes, especialmente a mecânica
quântica. Seguiremos esse uso, interpretando o nome para incluir o tipo de mecânica
que surge da teoria da relatividade especial. O objetivo desta capítulo e do próximo
é desenvolver a estrutura da mecânica clássica e delinear algumas de suas aplicações do
interesse atual na física pura. A base para qualquer apresentação da mecânica é uma série
de conceitos físicos fundamentais, como espaço, tempo, simultaneidade, massa e força. Na
maior parte, entretanto, esses conceitos não serão aqui analisados criticamente, ao invés,
eles serão assumidos como termos indefinidos cujos significados são familiares ao leitor.
Devido a sua interação com objetos externos e campos, a partícula pode presenciar forças
de vários tipos, como por exemplo, a força gravitacional ou eletrodinâmica; a soma vetorial
destas forças exercidas sob a partícula é a força total F. A mecânica da partícula é tratada
na segunda lei de Newton do movimento, na qual afirma que existe referenciais nos quais
o movimento da partícula é descrito pela equação diferencial
dp
F= = ṗ, (3.1.3)
dt
ou
d
F= (mv). (3.1.4)
dt
Em muitos casos, a massa da partícula é constante e a Eq.(3.1.4) se reduz a
dv
F=m = ma (3.1.5)
dt
d2 r
a= . (3.1.6)
dt2
onde r é o vetor radial da partícula em relação a O. Observe que a ordem dos fatores é
importante. Agora iremos definir o momento da força ou torque em relação a O como
N = r × F. (3.1.8)
onde o primeiro termo no lado direito obviamente desaparece. Como consequência desta
identidade, a Eq.(3.1.9) toma a forma abaixo
d dL
N= (r × mv) = = L̇ (3.1.11)
dt dt
observe que tanto N quanto L dependem do ponto O, ao qual os momentos foram tomados.
Como no caso da Eq.(3.1.3), a equação do torque, (3.1.11), também produz um teorema
de conservação, sendo
Em seguida consideremos o trabalho realizado por uma força externa F sob uma
partícula que se move de um ponto 1 para um ponto 2. Por definição, este trabalho é
Z 2
W12 = F · ds . (3.1.12)
1
Para uma massa constante (como sera assumido daqui em diante ao menos que seja
especificado o contrário), a integral na Eq.(3.1.12) se reduz a
Z Z Z
dv m d 2
F · ds = m · v dt = (v ) dt,
dt 2 dt
e portanto
m 2
W12 = (v2 − v12 ). (3.1.13)
2
A quantidade escalar mv 2 /2 é chamada de energia cinética da partícula e é denotado por
T , devido a isso o trabalho realizado é igual a variação na energia cinética:
W12 = T2 − T1 . (3.1.14)
Se a força do campo é tal que o trabalho W12 é o mesmo para qualquer caminho físico
possível entre os pontos 1 e 2, então a força (e o sistema) é dito ser conservativo. Uma
descrição alternativa de um sistema conservativo é obtida imaginando a partícula sendo
levada do ponto 1 ao ponto 2 por um caminho possível e então retornando para o ponto 1
por outro caminho. A independência de W12 do caminho particular implica que o trabalho
realizado ao longo de um circuito fechado qualquer é zero, i.e.
I
F · ds = 0. (3.1.15)
Fisicamente é claro que o sistema não pode ser conservativo se uma força de atrito ou
outras forças dissipativas estão presentes, já que F·ds graças ao atrito será sempre positivo
e a integral não pode desaparecer.
ou
∂V
Fs = − , (3.1.17)
∂s
na qual é equivalente a Eq.(3.1.16). Observe que na Eq.(3.1.16) podemos adicionar a V
qualquer quantidade constante no espaço, sem afetar os nossos resultados. Consequente-
mente o nível zero de V é arbitrário.
Para um sistema conservativo, o trabalho realizado pelas forças é
W12 = V1 − V2 . (3.1.18)
T1 + V1 = T2 + V2 (3.1.19)
A força aplicada a uma partícula pode ser em varias oportunidades dada por um
gradiente de uma função escalar que depende explicitamente da posição da partícula e do
tempo. Entretanto, o trabalho realizado pela partícula quando viaja uma distância ds,
∂V
F · ds = − ds,
∂s
não é mais a variação total em −V durante o deslocamento, visto que V também varia
explicitamente com o tempo a medida que a partícula se move. Consequentemente, o
trabalho realizado da partícula para ir do ponto 1 ao ponto 2 não é mais a diferença
na função V entre estes pontos. Enquanto a energia total T + V pode continuar sendo
definida, contudo a mesma não é mais conservada durante o curso do movimento da
partícula.
(e)
onde Fi representa a força externa, e Fji é a força interna atuando na i-ésima partícula
devido a j-ésima partícula (Fii , naturalmente, é zero). Iremos assumir que Fij (assim
(e)
como Fi ) obedece a terceira lei de Newton do movimento em sua forma original: que
as forças nas quais duas partículas exercem uma na outra são iguais e opostas. Esta
afirmação (na qual não é válida para todos os tipos de força) é algumas vezes referida
como lei fraca da ação e reação.
Somando sobre todas as partículas, a Eq.(3.2.1) toma a forma
d2 X X (e) X
mi ri = F i + Fji
dt2 i i i,j,i6=j
X (e) 1 X (3.2.2)
= Fi + (Fji + Fij )
i
2 i,j,i6=j
A primeira soma no lado direito é simplesmente a força externa total F(e) , enquanto o
segundo termo desaparece, visto que a lei da ação e reação afirma que cada par Fji + Fij
é zero. Para reduzir o lado esquerdo da equação, definimos o vetor R como a média dos
vetores radiais das partículas, ponderada em proporção com as suas massas:
P P
mi ri mi ri
R= P = (3.2.3)
mi M
O vetor R define um ponto conhecido como centro de massa, ou mais vagamente como
centro de gravidade, do sistema (Figura ). Com esta definição, (3.2.2) se reduz a
d2 R X (e)
M = Fi ≡ F(e) , (3.2.4)
dt2 i
na qual afirma que o centro de massa se move como se a força externa total estivesse
agindo sob toda a massa do sistema concentrada no centro de massa. Forças puramente
internas, se obedecem a terceira lei de Newton, portanto não possuem efeito no movimento
do centro de massa. Um exemplo frequentemente citado é o movimento de um projétil
explodindo - o centro de massa dos fragmentos viajam como se o projétil ainda estivesse
em uma única peça (negligenciando a resistência do ar). O mesmo principio é envolvido
em jatos e foguetes de propulsão. A fim de que o movimento do centro de massa não seja
afetado, a ejeção dos gases de propulsão em alta velocidade devem ser contrabalanceadas
pelo movimento do veículo para a frente em uma velocidade mais lenta.
O último termo no lado direito da Eq.(3.2.6) pode ser considerado uma soma de pares na
forma
ri × Fji + rj × Fij = (ri − rj ) × Fji (3.2.7)
devido a Fij = Fji pela 3◦ Lei de Newton, mas ri − rj é igual ao vetor rij de j para i
(cf.Fig.3.2.1), então o lado direito da Eq.(3.2.7) pode ser escrito como
rij × Fji
Se as forças internas entre duas partículas, além de serem iguais e opostas, também
permaneçam ao longo da linha que unem as partículas - uma condição conhecida como
lei forte da ação e reação - então todos esses produtos vetoriais somem. A soma sob os
pares é zero através desta afirmação e a Eq.(3.2.6) pode ser escrita na forma
dL
= N(e) . (3.2.8)
dt
(Talvez valha a pena enfatizar que este é um teorema vetorial ; i.e., Lz sera conservado
(e) (e) (e)
se Nz é zero, mesmo que Nx e Ny não o sejam.)
Observe que a conservação do momento linear na ausência de forças aplicadas pres-
supõe que a lei fraca da ação e reação é válida para as forças internas. A conservação
do momento angular total do sistema na ausência de torques aplicados requer a validade
da lei forte da ação e reação - que as forças internas sejam centrais. Muitas das forças
familiares na física, tais como a da gravidade, satisfazem a forma forte desta lei. Entre-
tanto, é possível encontrar forças nas quais a ação e a reação são iguais mesmo quando as
forças não são centrais (veja abaixo). Em um sistema que envolva cargas em movimento,
as forças entre as cargas previstas pela lei de Biot-Savart de fato violam ambas as forças
da lei da ação e reação.5 Equações (3.2.5) e (3.2.8), e seus correspondentes teoremas de
conservação, não são aplicáveis nestes casos, ao menos na forma dada aqui. Normalmente,
é possível encontrar alguma generalização de P ou L na qual é conservada. Logo, em um
sistema isolado de cargas em movimento, é a soma do momento angular mecânico e do
’momento angular’ eletromagnético do campo que é conservado.
5
Se duas cargas estão se movendo uniformemente com vetores velocidades paralelos que não são
perpendiculares as linhas que unem as cargas, então as forças mútuas líquidas são iguais e opostas,
contudo não estão ao longo do vetor que une as cargas. Considere, adicionalmente, duas cargas se
movendo (instantaneamente) tal que uma das cargas se move em direção a outra, na qual por sua vez se
move em um angulo reto em relação a primeira, então a segunda carga exerce uma força magnética na
primeira não nula, sem experienciar qualquer força magnética de reação naquele instante.
A Equação (3.2.5) afirma que o momento linear total do sistema é o mesmo como se
toda a massa do sistema fosse concentrada no centro de massa e se movesse com ele. O
teorema análogo para o momento angular é mais complicado. Tomando a origem O como
ponto de referência, o momento angular total do sistema é
X
L= ri × pi .
i
Façamos com que R seja o vetor posição do centro de massa em relação a O, e tomemos
r0i como sendo o vetor posição da i-ésima partícula em relação ao centro de massa. Então,
temos (cf. Fig.3.2.2)
ri = r0i + R (3.2.9)
e
vi = vi0 + v
onde
dR
v=
dt
dr0i
vi0 =
dt
Os últimos dois termos nesta expressão desaparecem, pois ambos possuem o fator mi r0i ,
P
que, será reconhecido, como definindo o vetor posição do centro de massa no próprio
sistema de coordenadas cuja origem é o centro de massa e , consequentemente é um vetor
nulo, uma forma de ver isto é multiplicar a Eq.(3.2.9) por mi
mi ri = mi r0i + mi R
P
e então somar para todo i, observando que i mi ri = M R, obtemos que
X
mi r0i = 0
i
XZ 2 XZ 2 X Z 2
(e)
W12 = Fi · dsi = Fi · dsi + Fji · dsi . (3.2.11)
i 1 i 1 i,j,i6=j 1
XZ 2 X Z 2 XZ 2
1 2
Fi · ds = i] mi v̇i · vi dt = d mi vi .
i 1 1 i 1 2
[
Consequentemente, o trabalho realizado ainda pode ser escrito como a diferença entre as
1X
T = mi vi2 (3.2.12)
2 i
1X
T = (v + vi0 ) · (v + vi0 )
2 i
!
1X 1X d X
= mi v 2 + mi vi02 + v · mi r0i ,
2 i 2 i dt i
A energia cinética, assim como o momento angular, também consiste em duas partes: a
energia cinética obtida como se toda a massa fosse concentrada no centro de massa, mais
a energia cinética do movimento em relação ao centro de massa.
Considere agora o lado direito da Eq.(3.2.11). No caso especial que as forças externas
são deriváveis em termos de um gradiente de um potencial, o primeiro termo pode ser
escrito como
X Z 2 (e) XZ 2 P 2
Fi · dsi = − ∇i Vi · dsi = − i Vi
1 1 1
i i
onde o subscrito i no operador del indica que as derivadas são tomadas com respeitos
as componentes de ri . Se as forças internas também são conservativas, então as forças
mutuas entre a i-ésima e j-ésima partículas, Fij e Fji , podem ser obtidas por uma função
potencial Vij . Para satisfazer a lei forte da ação e reação, Vij pode ser uma função somente
da distância entre as partículas:
onde f é alguma função escalar. Se Vij fosse também uma função da diferença de alguns
outros pares de vetores associados com as partículas, tais como as suas velocidades ou
(entrando no domínio da física moderna) os seus momentos angulares ’spin’ intrínsecos,
então as forças ainda seriam iguais e opostas, mas não necessariamente estariam ao longo
da direção entre as partículas.
Quando as forças são todas conservativas, o segundo termo na Eq.(3.2.11) pode ser
reescrito como uma soma sob todos os pares de partículas, com o termo de cada par sendo
da forma Z 2
− (∇i Vij · dsi + ∇j Vij · dsj ).
1
Se o vetor diferença ri −rj é denotado por rij , e se ∇ij representa o gradiente com respeito
a rij , então
∇i Vij = ∇ij Vij = −∇j Vij .
e
dsi − dsj = dri − drj = drij ,
1 X 2
Z
1 X 2
− ∇ij Vij · drij = − Vij . (3.2.17)
2 i,j,i6=j 1 2 i,j,i6=j 1
1
O fator aparece na Eq.(3.2.17) porque, ao somar tanto em i quanto em j cada membro
2
de um dado par é incluído duas vezes, primeiro no somatório i e então no somatório j.
Destas considerações, fica claro que se as forças externas e internas são ambas derivadas
de potenciais, é então possível definir uma energia potencial total, V , do sistema
X 1 X
V = Vi + Vij , (3.2.18)
i
2 i,j,i6=j
pode variar a medida que o sistema muda com o tempo. Somente para a classe particular
de sistemas conhecidos como corpos rígidos é que a energia potencial interna será sempre
constante. Formalmente, um corpo rígido pode ser definido como um sistema de partículas
cujas distâncias rij são fixadas e não podem variar com o tempo. Em tal caso, os vetores
drij somente podem ser perpendiculares aos correspondentes rij , e portanto a Fij , para
ver isto observe que se um vetor arbitrário A possui magnitude constante, isto é, A · A =
constante, então,
d dA dA
(A · A) = 2A · ⇒A· =0
dt dt dt
Deste modo, em um corpo rígido as forças internas não realizam trabalho, e o potencial
interno deve permanecer constante. Visto que a energia potencial é sempre, em qual-
quer caso, incerta em termos de uma constante aditiva, um potencial invariante pode ser
completamente desconsiderado na discussão do movimento do sistema.
3.3 Vínculos
Até o momento, nenhuma física nova foi apresentada. Decompondo Fi na força aplicada
(a)
Fi , e na força de vínculo, fi ,
(a)
Fi = Fi + fi (3.4.2)
Agora nos restringimos para sistemas cujo trabalho virtual das forças de vínculo é zero.
Vimos que esta condição permanece válida para corpos rígidos e é válida para vários outros
vínculos. Portanto, se uma partícula é vinculada a se mover em uma superfície, a força
∂f
f (r + dr, t + dt) = 0 ⇒ ∇ · dr + dt = 0. (3.4.5)
∂t
Fi = ṗi ,
na qual afirma que uma partícula no sistema estará em equilíbrio sob uma igual a força
real mais uma ’força efetiva reversa’ −ṗi . Ao invés de (3.4.6), podemos imediatamente
escrever
X
(Fi − ṗi ) · δri = 0, (3.4.7)
i
e, novamente reduzindo para os termos das forças aplicadas e forças de vínculos, temos
como resultado
X (a) X
(Fi − ṗi ) · δri + fi · δri = 0,
i i
Iremos novamente nos restringir para sistemas cujo trabalho virtual das forças de vínculo
somem e portanto obtemos
X (a)
(Fi − ṗi ) · δri = 0 (3.4.8)
i
ri = ri (q1 , q2 , . . . , qn , t) (3.4.9)
Similarmente, um deslocamento arbitrário virtual δri pode ser relacionado com o deslo-
camento virtual δqi por
X ∂ri
δri = δqj (3.4.11)
j
∂qj
Observe que não há uma variação no tempo, δt, envolvida acima, visto que o deslocamento
virtual por definição considera somente o deslocamento das coordenadas. (Somente então
o deslocamento virtual é perpendicular à força de restrição se a própria restrição mudar
com o tempo.)
Em termos de coordenadas generalizadas, o trabalho virtual de Fi se torna
X X ∂ri
Fi · δri = Fi · δqj
i i,j
∂qj
X (3.4.12)
= Qj δqj ,
j
X ∂ri
Qj = Fi · (3.4.13)
i
∂qj
pois vi = vi (q, q̇, t), assim o segundo termo no lado esquerdo da Eq.(3.4.8) pode ser
expandido em
X d ∂ P 1
∂ P 1
2 2
i mi vi − i mi vi − Qj δqj
j
dt ∂ q̇ j 2 ∂q j 2
(Eq.(3.4.8)) se torna
X d ∂T ∂T
− − Qj δqj = 0. (3.4.17)
dt ∂ q̇j ∂qj
Até agora, nenhuma restrição foi feita sobre a natureza das restrições, a não ser que
elas não devem realizar trabalho em um deslocamento virtual. Se, entretanto, os vínculos
são holonômicos, então é possível encontrar conjuntos de coordenadas independentes qj
nas quais possuem as condições de vínculo implicitamente nas equações de transformação
r = r1 (q1 , q2 , . . . , q3N −k , t)
..
.
rN = rN (q1 , q2 , . . . , q3N −k , t)
Qualquer deslocamento virtual δqj é então independente de δqk , e deste modo a única
forma na qual a Eq.(3.4.17) é válida é se cada coeficiente individual desaparece:
d ∂T ∂T
− − Qj (3.4.18)
dt ∂ q̇j ∂qj
Fi = −∇i V
L = T − V, (3.4.21)
As Eqs.(3.4.18) tornam-se
d ∂L ∂L
− = 0, (3.4.22)
dt ∂ q̇j ∂qj
expressão conhecida como ’equações de Lagrange’.
Observe que, para um determinado conjunto de equações de movimento, não há escolha
única da Lagrangiana tal que as Eqs.(3.4.22) conduzam às equações de movimento nas
coordenadas generalizadas fornecidas. Iremos provar agora um teorema que será bastante
utilizado
d
L0 = L + F (q1 , . . . , qn , t) (3.4.23)
dt
também satisfaz as equações de Lagrange, onde F é qualquer função arbitrária dos seus
argumentos, contanto que seja diferenciável.
dF X ∂F ∂F
= q̇j +
dt j
∂qj ∂t
∂L0 ∂L0
d d ∂ dF ∂ dF
− − + =0
dt ∂ q̇i dt ∂ q̇i dt ∂qi ∂qi dt
ou seja,
∂L0 ∂L0 X ∂ 2F ∂ 2F
d d ∂F
− = − q̇j +
dt ∂ q̇i ∂qi dt ∂qi j
∂qi ∂qj ∂qi ∂t
=0
pois observe que
d
∂F
X ∂ 2F ∂ 2F
= q̇j +
dt ∂qi j
∂qj ∂qi ∂t∂qi
qi = qi (s1 , . . . , sn , t), i = 1, . . . , N.
Em outras palavras, a forma das equações de Lagrange é invariante sob uma transformação
ponto a ponto.
∂ ∂L ∂qk ∂L ∂ q̇k
L(q, q̇, t) = +
∂sj ∂qk ∂sj ∂ q̇k ∂sj
(3.4.25)
∂L ∂qk
=
∂qk ∂sj
∂ ∂L ∂qk ∂L ∂ q̇k
L(q, q̇, t) = +
∂ ṡj ∂qk ∂ ṡj ∂ q̇k ∂ ṡj
(3.4.26)
∂L ∂ q̇k
=
∂ q̇k ∂ ṡj
logo,
d ∂L ∂L d ∂L ∂ q̇k ∂L ∂qk
− = −
dt ∂ ṡj ∂sj dt ∂ q̇k ∂ ṡj ∂qk ∂sj
notemos que
∂qk ∂ q̇k
=
∂sj ∂ ṡj
portanto,
d ∂L ∂L d ∂L ∂L ∂qk
− = −
dt ∂ ṡj ∂sj dt ∂ q̇k ∂qk ∂sj
o termo em colchetes é nulo, pois por hipótese as equações de Lagrange são satisfeitas em
relação a qk , deste modo
d ∂L ∂L
− =0
dt ∂ ṡj ∂sj
Em tal caso, as Eqs.(3.4.22) continuam válidas por (3.4.18) com a Lagrangiana dada por
L = T − U. (3.5.2)
1 ∂B
∇×E+ =0 (3.5.4)
c ∂t
e
B=∇×A (3.5.5)
porém, se o rotacional de um vetor K é nulo, segue que existe uma função ψ tal que
K = ∇ψ, logo aplicando isso em (3.5.6), segue que existe φ = φ(q, t) tal que
1 ∂A
E+ = −∇φ
c ∂t
1 ∂A
⇒ E = −∇φ − (3.5.7)
c ∂t
substituindo (3.5.5) e (3.5.7) em (3.5.3), obtemos
1 ∂A 1
F = Q −∇φ − + v × (∇ × A) (3.5.8)
c ∂t c
v × (∇ × A) = ∇(v · A) − (v · ∇)A
Ademais,
∂A dA ∂ dA
= − q̇i A= − (v · ∇)A
∂t dt ∂qi dt
logo
1 dA 1 1 1
F = Q −∇φ − + (v · ∇)A + ∇(v · A) − (v · ∇)A
c dt c c c
1 dA 1
⇒ F = Q −∇φ − + ∇(v · A) (3.5.9)
c dt c
assim,
∂ 1 dA 1 ∂
F =Q − φ− + (v · A) (3.5.10)
∂q c dt c ∂q
Porém, sabemos que
∂ d ∂
F =− U+ U (3.5.11)
∂q dt ∂ q̇
note que podemos reescrever (3.5.10) como
∂ Q ∂ d ∂ Q
F = −Q φ + (v · A) + − v·A
∂q c ∂q dt ∂ q̇ c
visto que, como A não depende de q̇, sua derivada parcial em relação ao mesmo será nula,
e ∂v/∂ q̇ = 1, deste modo temos que
Q
U = Qφ − (v · A) (3.5.12)
c
m Q
L=T −U = (v · v) − Qφ + (v · A) (3.5.13)
2 c
onde L contem o potencial das forças conservativas como antes, e Qj representa a força que
não surge de um potencial. Tal situação ocorre frequentemente quando forças de atrito
estão presente. Constantemente acontece da força de atrito ser proporcional a velocidade
da partícula, em tal situação sua componente x possui a forma
Ffx = −kx vx .
Forças de atrito deste tipo podem ser postas em termos de uma função F , conhecida
como função de dissipação de Rayleigh, e definida como
1X 2 2 2
F= (kx vix + ky viy + kz viz ). (3.5.18)
2 i
Onde o somatório é sob todas as partículas do sistema. Da sua definição fica claro que
∂F
F fx = − ,
∂vx
Ou, simbolicamente,
Ff = −∇v F . (3.5.19)
Também podemos dar uma interpretação física a função de dissipação. O trabalho feito
pelo sistema contra o atrito é
dWf = −Ff · dr
= −Ff · v dt
= (kx vx2 + ky vy2 + kz vz2 ) dt
devido a isso, duas funções escalares, L e F , devem ser especificadas para se obter as
equações do movimento. Um exemplo é a lei de Stokes, segundo a qual uma esfera de
raio a se movendo a velocidade v, em um meio de viscosidade η experimenta uma força
de arrasto Ff = 6πηav.
Até agora foi mostrado que, para sistemas onde podemos definir um Lagrangiano,
i.e., sistemas holonômicos com forças aplicadas derivadas de um potencial ordinário ou
generalizado e restrições que não realizam trabalho, temos uma maneira muito conveniente
de obter as equações do movimento. Fomos levados à formulação Lagrangiana pelo desejo
de eliminar as forças de restrição das equações do movimento e, ao atingir esse objetivo,
obtivemos muitos outros benefícios. As equações de Newton nos forçavam a trabalhar com
muitos vetores de força e aceleração. Com o método Lagrangiano apenas trabalhamos com
duas funções escalares, T e V , nas quais simplificam em muito o problema.
Uma receita de bolo simples pode agora ser estabelecida para todos os problemas da
X1 2
∂ri
M0 = mi ,
i
2 ∂t
X ∂ri ∂ri
Mj = mi · , (3.5.23)
i
∂t ∂qj
X ∂ri ∂ri
Mjk = mi ·
i
∂qj ∂qk
Logo, a energia cinética do sistema sempre poderá ser escrita como a soma de três funções
homogêneas das velocidades generalizadas,
T = T0 + T1 + T2 , (3.5.24)
ou
dτ
dt = r (4.1.3)
v2
1− 2
c
Visto que (4.1.3) torna dτ < dt, este efeito em dt é chamado de ’dilatação do tempo’:
relógios em movimento aparentam se mover mais devagar.
v 1
β= , e γ=p , (4.2.1)
c 1 − β2
ct − βx
ct̄ = p = γ(ct − βx) (4.2.2)
1 − β2
x − βct
x̄ = p = γ(x − βct) (4.2.3)
1 − β2
ȳ = y (4.2.4)
z̄ = z. (4.2.5)
Onde · é o produto escalar usual. O fator de Lorentz γ continua com a mesma definição
para um boost arbitrário, já que o mesmo só depende da magnitude da velocidade relativa.
A definição β~ = ~v /c com magnitude 0 ≤ β < 1 é também usada por alguns autores.
Podemos expressar ~rk como função do vetor velocidade relativa unitário v̂, já que como
~rk é paralelo ao vetor velocidade relativa ~v , segue que ~rk = k~v onde k é uma constante,
~rk ~v
= k = kv̂
v v
~rk r
= v̂
v v
(rv) (~r · ~v )
~rk = v̂ = v̂ = (~r · v̂)v̂ (4.2.11)
v v
onde usamos o fato de que como ~r é paralelo a ~v , segue que rv = (~r · ~v ). Pela primeira
equação em (4.2.7), têm-se que ~r⊥ = ~r − ~rk , aplicando a última equação a este resultado,
temos que
~r̄⊥ = ~r⊥ = ~r − (~r · v̂)v̂
ou,
(β~ · ~r)β(γ
~ − 1)
~
~r̄ = ~r + − βγct (4.2.13)
β2
na qual fornece a relação entre os dois conjuntos de eixos quando estão alinhados. Uma
outra maneira de expressar esta expressão para velocidades arbitrárias é através da re-
~ = ΛX
X̄ ~ (4.2.14)
~ eX
Onde tratamos X̄ ~ como matrizes colunas (vetores) e Λ é a matriz simétrica
γ −γβx −γβy −γβz
2
−γβ 1 + (γ − 1) βx βx βy βx βz
x (γ − 1) 2 (γ − 1) 2
β2 β β
Λ=
βx βy βy2 βy βz (4.2.15)
−γβy (γ − 1) 2 1 + (γ − 1) 2 (γ − 1) 2
β β β
βx βz βz βy β2
−γβz (γ − 1) 2 (γ − 1) 2 1 + (γ − 1) z2
β β β
ou se usarmos
x0 = ct, x1 = x, x2 = y x3 = z (4.2.16)
onde passamos a utilizar a convenção de soma sobre índices repetidos de Einstein: toda
vez que um índice aparecer repetido, tal como ν nesta última equação, deve-se efetuar
uma soma de 0 a 3 sobre tal índice. Convencionaremos, também, que índices gregos
tais como α, β, µ, ν, . . . assumem os valores 0, 1, 2, 3. Os coeficientes da transformação de
Lorentz Λµ̄ν são dados por (4.2.15), e podem ser dados na seguinte forma compacta:
β i βj
Λīj = δ ij + (γ − 1) (4.2.19)
β2
Estas transformações mapeiam a origem de S e a origem de S 0 para (0, 0, 0, 0). Conse-
quentemente, a origem das coordenadas de ambos correspondem a mesma localização no
espaço-tempo. Se isto não for desejado, pode-se fazer uma simples translação, e obter a
forma mais geral da transformação:
~ = ΛX
X̄ ~ +C
~ (4.2.20)
Tal 4-vetor é o vetor tangente a curva. Iremos adotar a notação de que as componentes
de vetores são escritas com sobrescritos tal como T 0 , T 1 , T 2 , T 3 .Apesar da maneira como
desenhamos vetores tangentes, eles não possuem qualquer extensão no espaço-tempo. As
flechas que desenhamos simplesmente nos ajudam a visualizar o vetor. Em cada ponto
ao longo da curva, o vetor tangente possui direção e magnitude. Para curvas que são do
tipo-tempo, o tempo próprio, τ , é a escolha usual para o parâmetro λ. As coordenadas
do laboratório são então x0 = ct(τ ), x1 = x(τ ), x2 = y(τ ), x3 = z(τ ), e a tangente a esta
~ de uma partícula viajando ao longo da curva X.
curva é a quadrivelocidade, U, ~ A Equação
(4.3.1) torna-se
d(ct) dxi
u0 = = γc, ui = = γv i (4.3.2)
dτ dτ
onde v i = dxi / dτ é a normal tri-velocidade com (~v )2 = (v x )2 + (v y )2 + (v z )2 . Visto que
a 4-velocidade de uma partícula é definida sob uma variedade de parâmetros λ, existe
um conjunto infinito de 4-velocidades para a partícula, um para cada valor de λ. Esse
conjunto de vetores é denominado um campo vetorial.
Em um referencial O existem quatro vetores especiais, definidos por suas componentes:
ê0 = (1, 0, 0, 0)
ê1 = (0, 1, 0, 0)
(4.3.3)
ê2 = (0, 0, 1, 0)
ê3 = (0, 0, 0, 1)
chamamos estes vetores de vetores de base do referencial O, e eles possuem a propriedade
especial de que qualquer vetor no referencial O pode ser escrito como uma combinação
~ = (A0 , A1 , A2 , A3 ), então
linear deles, isto é, se A
Geralmente, cada referencial possui seu próprio vetor de base, e pela Equação (4.3.3)
podemos ver que a β-ésima componente de êα é 1 se β = α e 0 se β 6= α, ou de outra
forma
(êα )β = δ βα (4.3.5)
A discussão que nos levou a Eq.(4.3.4) poderia ter sido aplicada para qualquer referencial,
então a mesma deve ser válida para um referencial Ō:
~ = Aβ̄ êβ̄
A
Porém, o conjunto {Aβ̄ } é diferente de {Aα }, assim como o conjunto {êβ̄ } é diferente de
~ é covariante, e as duas somas são as mesmas:
{êα }, contudo por definição o forma de A
e isto possui uma consequência importante: através desta equação deduziremos a lei de
transformação para os vetores de base, i.e., a relação entre {êα } e {êβ̄ }. Lembremos que
Aβ̄ = Λβ̄ α Aα , logo
Aα êα = Λβ̄ α Aα êβ̄
Isto nos dá a lei pela qual a mudança dos vetores de base obedece. Não é uma trans-
formação de componentes: Tal equação nos dá a base {êα } de O como uma combinação
linear da base {êβ̄ } de Ō.
A única coisa que a transformação de Lorentz Λβ̄ α depende é da velocidade relativa
entre os referenciais. Vamos por um momento mostrar isto explicitamente escrevendo
Então,
êα = Λβ̄ α (~v )êβ̄ . (4.3.8)
Nesta equação usei ν e µ̄ nos índices para evitar confusão com a fórmula anterior. Podemos
fazer µ̄ = β̄, já que o mesmo se trata de um índice livre, na Eq.(4.3.9) e então substituir
o resultado na Eq.(4.3.8) para obter que:
visto que os vetores de base são linearmente independentes, segue que nenhum deles pode
ser escrito como uma combinação linear dos demais, e portanto a igualdade acima nos
permite deduzir que se α 6= ν, então Λβ̄ α (~v )Λν β̄ (−~v ) = 0, pois êα não pode ser escrito
como uma combinação linear dos êν , isto é, são L.I., e se α = ν, então Λβ̄ α (~v )Λν β̄ (−~v ) = 1,
pois trata-se do mesmo vetor, deste modo
Isto expressa o fato de que a matriz [Λν β̄ (−~v )] é a inversa de [Λβ̄ α (~v )], já que a soma em β̄
é exatamente a operação que realizamos quando multiplicamos duas matrizes. A matriz
(δ να ) é, é claro, a matriz identidade.
A expressão para a mudança das componentes de um vetor,
Aβ̄ = Λβ̄ α Aα
também possui inversa. Multipliquemos ambos os lados por Λν β̄ (−~v ) e somemos em β̄.
Obtemos
Λν β̄ (−~v )Aβ̄ = Λν β̄ (−~v )Λβ̄ α (~v )Aα
= δ να Aα
= Aν .
Que nos diz que as componentes de A ~ em O são obtidas de Ō através de uma transfor-
mação de Lorentz com −~v , o que, é claro, está correto.
Pela definição, as componentes de qualquer 4-vetor podem ser expressas por valores
das projeções do vetor ao longo de um conjunto de vetores de base, ê0 , ê1 , ê2 , ê3 , onde as
coordenadas são medidas ao longo da direção dada por tais vetores. A posição de um
~ ) é escrito como:
ponto da curva X(τ
~ ) = xµ êµ
X(τ (4.3.13)
~ µ
~ = dX = dx êµ = uµ êµ
U (4.3.14)
dτ dτ
O ηαβ são as componentes de um tensor métrico associado com a base de vetores êα . Por
exemplo, considere o espaço de Minkowski bidimensional com coordenadas ct e x e um
vetor ~v = (a, b). Então η(~v , ~v ) = a2 − b2 e η00 = 1, η11 = −1.
A forma de ηαβ é definida através da forma para o intervalo. Isto nos sugere considerar
pequenos deslocamentos. Se o vetor deslocamento relativo entre dois pontos é pequeno,
ele pode ser escrito como
dζ~ = ∆xα êα (4.3.17)
10
Iremos definir isto de uma forma mais formal posteriormente.
(∆s)2 = dζ~ · dζ~ = ∆xα ∆xβ êα · êβ = ηαβ ∆xα ∆xβ
= (c∆t)2 − (∆x)2 − (∆y)2 − (∆z)2 .
que permanece válida para qualquer tensor métrico. O tensor métrico para o sistema de
coordenadas de Minkowski, usando a convenção + − −−, possui a seguinte representação
tensorial 11
1 0 0 0
0 −1 0 0
η= 0 0 −1 0
(4.3.19)
0 0 0 −1
O produto escalar de dois vetores nesse sistema de coordenadas é
~ ·V
U ~ = uα v β ηαβ = u0 v 0 − u1 v 1 − u2 v 2 − u3 v 3 (4.3.20)
ds2 = ηαβ dxα dxβ = ds̄2 = ηµ̄ν̄ dxµ̄ dxν̄ = ηµ̄ν̄ Λµ̄α dxα Λν̄ β dxβ (4.3.21)
ΛT ηΛ = η (4.3.24)
11
A notação utilizada para representar uma matriz é , enquanto para tensores é usada . Matrizes
são usadas para relacionar diferentes referenciais de coordenadas, enquanto que tensores são objetos físicos
geométricos.
Multiplicando esta última equação pela direita por η e notando que η 2 = I (para provar
isto basta multiplica a matriz da métrica por ela mesma, uma forma mais formal e menos
trabalhosa será mostrada até o fim do capítulo) , resulta ΛT ηΛη = I, o que mostra que
ΛT η é a inversa de Λη. Como a inversa de uma matriz pela esquerda coincide com a
inversa pela direita, temos também ΛηΛT η = I, donde
ΛηΛT = η (4.3.25)
que é uma condição equivalente a (4.3.24). Uma transformação de Lorentz é uma espécie
de rotação no espaço-tempo, e a matriz associada é ortogonal em relação à métrica η do
espaço de Minkowski.
Agora iremos provar que o conjunto das transformações de Lorentz formam um grupo,
chamado de grupo de Lorentz. Lembremos antes da definição de grupo:
Um conjunto forma um grupo quando para dois elementos do conjunto, digamos x1 e
x2 , o ’produto’ x1 x2 possa ser definido de tal forma que:
1.(Fechamento) O produto x1 x2 pertence ao conjunto.
2.(Associatividade) Para quaisquer elementos x1 , x2 e x3 do conjunto, (x1 x2 )x3 =
x1 (x2 x3 ).
3.(Identidade) Existe um elemento identidade I no conjunto que satisfaz Ix = xI = x
para qualquer elemento x.
4.(Inverso) Para qualquer elemento x, existe um elemento x−1 no conjunto que satisfaz
x−1 x = xx−1 = I.
No nosso caso, o conjunto é todas as matrizes 4 × 4 que satisfazem ΛT ηΛ = η,
e tomaremos a multiplicação ordinária de matrizes como o ’produto’ no qual define o
grupo.
A prova é direta:
1. Suponha Λ1 e Λ2 pertencem ao conjunto12 . Então,13
Portanto, det Λ 6= 0 e consequentemente sua inversa existe. Provemos agora que pertence
ao conjunto: multiplicando ΛT ηΛ = η por (Λ−1 )T pelo lado esquerdo e por Λ−1 pelo lado
direito,
(Λ−1 )T · ΛT η Λ · Λ−1 = (Λ−1 )T ηΛ−1
| {z } | {z }
(Λ·Λ−1 )T =I I
isto completa a prova de que Λ formam um grupo desde que satisfaçam (4.3.25).
Vale ressaltar que a definição (4.3.25) das transformação de Lorentz abrange uma
classe muito mais ampla de transformações lineares do que as transformações de Lorentz
puras da forma (4.2.14). Por exemplo, uma rotação dos eixos espaciais constitui uma
transformação de Lorentz consoante com a nossa definição geral, pois não afeta o tempo e
deixa invariante a distância espacial entre dois pontos. A inversão espacial t̄ = t, ~r̄ = −~r
e a inversão temporal t̄ = t, ~r̄ = ~r também constituem exemplos de transformações de
Lorentz, pois ambas preservam ds2 .
De (4.3.28) segue que
det Λ = ±1 (4.3.30)
donde, finalmente
Λ0̄0 ≥ +1 ou Λ0̄0 ≤ −1 (4.3.33)
logo,
xµ̄ − δ µ̄ν xν = ω µ̄ν xν + µ̄
O conjunto das transformações de Lorentz restritas L↑+ é o único setor que forma um
subgrupo do grupo de Lorentz. Este subgrupo é chamado de grupo de Lorentz restrito.
A única parte não trivial da demonstração de que L↑+ constitui um grupo é a verificação
de que o produto de duas matrizes de Lorentz ortócronas é também uma matriz ortócrona.
Sejam Λ e Λ̄ duas transformações de Lorentz ortócronas consecutivas e seja Λ̄¯ = Λ̄ · Λ.
¯ µ̄ = Λ̄µ̄ Λα , de modo que
Então Λ̄ β α β
Pondo ~a = (Λ̄0̄1 , Λ̄0̄2 , Λ̄0̄3 ), ~b = (Λ1̄0 , Λ2̄0 , Λ3̄0 ) e usando (4.3.32) bem como sua análoga
decorrente de (4.3.25), ficamos com
¯ 0̄ = √1 + a2 √1 + b2 + ~a · ~b,
Λ̄ (4.3.35)
0
donde
¯ 0̄ ≥ 1 + ab + ~a · ~b
Λ̄ (4.3.37)
0
A transformação de Lorentz homogênea mais geral irá envolver tanto uma variação
de velocidade quanto uma rotação de coordenadas. A transformação de velocidade é
denominada boost e possui a forma da Eq.(4.2.15). Qualquer transformação de Lorentz
homogênea, Λ, pode ser escrita como
Λ = R · Λ0 = Λ00 · R0 (4.3.38)
1 (1 + ββ 0 )
p =p p
1 − β 002 1 − β 2 1 − β 02
(1 − β 2 )(1 − β 02 )
1 − β 002 =
(1 + ββ 0 )2
isolando-se β 00
00β + β0
β = (4.3.42)
1 + ββ 0
e
γ0 −γ 0 βx0 0 −γ 0 βy0 0 0
β 020 βx0 0 βy0 0
−γ βx0 1 + (γ 0 − 1) x02
0 0
(γ 0 − 1) 02 0
Λ0 =
β β
(4.3.44)
0 0
β 0 β 0 βy020
−γ βy (γ 0 − 1) x 02y
0 0 0
1 + (γ − 1) 02 0
β β
0 0 0 1
βy0
βx00 = β, βy00 = , β 002 = β 2 , e γ 00 = γ, (4.3.46)
γ
e a Eq.(4.3.45) se torna
γ 00 −γ 00 βx00 −γ 00 βy00 0
00 00
γ 00
00
−γ βx 0 0
Λ ≈−γ 00 β 00 γ 00 β 00 β 00
(4.3.47)
y x y 1 0
0 0 0 1
Finalmente, a matriz de rotação induzida pela rotação de S1 para S3 , após alguma sim-
plificação algébrica e desprezando alguns termos de ordem alta em β~ 00 , é
1 0 0 0
βy00
0 1 (γ − 1) 0
R = Λ00 · Λ3−1 =
β
(4.3.49)
βy00
0 −(γ − 1) 1 0
β
0 0 0 1
O que mostra que R implica que S3 é rotacionado com respeito a S1 em relação ao eixo
z através de um ângulo infinitesimal:
βy00
γ−1
∆Ω = (γ − 1) = βy00 β . (4.3.50)
β β2
Definição 4.4.1. Um tensor do tipo N0 é uma função de N vetores nos números reais,
Vejamos o que esta definição significa. Neste momento, iremos apenas aceitar a nota-
ção N0 ; sua justificação virá mais tarde. A regra para o produto escalar, satisfaz a nossa
definição de um tensor 02 . É uma lei que toma dois vetores, por exemplo A ~ e B,
~ e produz
~ · (β B)
A ~ = β(A
~ · B)
~
~ · (B
A ~ + C)
~ =A~B
~ +A ~C
~
Para nos proporcionar uma concretude para esta noção de produto escalar como sendo
um tensor, lembremos que o tensor métrico η é por definição
~ B)
η(A, ~ =A
~ · B.
~ (4.4.2)
Então pela discussão anterior, η( , ) é uma função na qual se toma dois argumentos, e
que é linear
η(αA ~ + β B,
~ C)
~ = αη(A,~ C)
~ + βη(B,
~ C),
~ (4.4.3)
0
4.4.2 Os Tensores 1
: Forma-1
(Esta é a mesma maneira pela qual o vetor Aα êα é mantido como independente do refe-
rencial.) Esta transformação inversa dá origem a palavra ’dual’ no ’espaço vetorial dual’.
A propriedade de se transformar com o vetor de base nos dá o motivo de co em ’vetor co-
variante’ e sua forma curta ’co-vetor’. Visto que as componentes de um vetor ordinário se
transformam de maneira oposta aos vetores de base (afim de manter Aβ êβ independente
do referencial), eles são frequentemente chamados de vetores ’covariantes’. A maioria
destes nomes estão fora de moda; ’vetores’ e ’vetores duais’ ou ’formas-1’ são os nomes
modernos. A razão do ’co’ e ’contra’ terem sido abandonados é que eles misturam duas
coisas bastante diferentes: a transformação da base é a expressão dos novos vetores em
termos dos antigos; a transformação das componentes é a expressão do mesmo objeto em
termos da nova base.
Visto que todo o conjunto de formas-1 formam um espaço vetorial, podemos usar
qualquer conjunto de quatro formas-1 linearmente independentes como uma base. (Como
em qualquer espaço vetorial, formas-1 são ditas serem linearmente independentes se uma
combinação linear não trivial de formas-1 é igual a forma-1 zero. A forma-1 zero é aquela
na qual o valor em qualquer vetor é nula.) Entretanto, na seção anterior já utilizamos os
vetores de base {êα } para definir as componentes de uma forma-1. Isto sugere que somos
capazes de utilizar o vetor de base para definir uma base forma-1 associada {ω̃ α , α =
0, . . . , 3}, na qual é chama de base dual de {êα }, sobre os quais a forma-1 possui as
componentes definidas acima. Isto é, queremos um conjunto {ω̃ α } tal que
p̃ = pα ω̃ α . (4.4.9)
~ e forma-1 p̃:
equação deve implicar que para qualquer vetor A
~ = pα Aα
p̃(A)
δ αβ = ω̃ α (êβ ) (4.4.12)
Comparando com a Eq.(4.4.5), vemos que esta equação nos dá a β-ésima componente
da α-ésima base forma-1. Portanto a mesma define a base da α-ésima forma-1. Podemos
ω̃ 0 = (1, 0, 0, 0),
ω̃ 1 = (0, 1, 0, 0),
ω̃ 2 = (0, 0, 1, 0),
ω̃ 3 = (0, 0, 0, 1).
É importante entender dois pontos aqui. Um é que a Eq.(4.4.12) define a base {ω̃ α }
em termos da base {êα }. Os vetor de base induz uma única e conveniente base forma-1.
Esta não é a única base forma-1 possível, mas é tão útil ter a relação, Eq.(4.4.12), entre
as bases que sempre as usaremos. A relação, Eq.(4.4.12), é entre as bases, não entre seus
pares individuais, tal como ω̃ 0 e ê0 . Ou seja, se mudarmos ê0 , enquanto deixamos ê1 , ê2 e
ê3 inalterados, então em geral isto induz uma mudança não somente em ω̃ 0 , mas também
em ω̃ 1 , ω̃ 2 e ω̃ 3 . O segundo ponto para entender é que, apesar de podemos descrever
tanto vetores como formas-1 apenas dando um conjunto de quatro componente, o seus
significados geométricos são bastante diferentes. Não se deve perder a noção de que as
componentes só nos dizem uma parte da história. A base contém o resto da informação.
Isto é, um conjunto de números (0, 2, −1, 5) sozinho não nos diz nada; para que tenha
algum significado, devemos dizer se estas são as componentes de um vetor de base ou
de uma base forma-1 e, é claro, qual dos infinito números de bases possíveis está sendo
utilizado.
Nos falta definir como {ω̃ α } se transforma sob uma mudança de base. Ou de outra
forma, cada referencial possui seu próprio conjunto único {ω̃ α }; como os pertencentes a
dois referenciais estão relacionados? A derivação aqui é análoga a feita para os vetores de
base.
pβ ω̃ β = pᾱ ω̃ ᾱ
= Λβᾱ pβ ω̃ ᾱ
⇒ ω̃ β = Λβᾱ ω̃ ᾱ
Isto é o mesmo do que para as componentes de um vetor, e opostos aos das componentes
de uma forma-1.
Usualmente imaginamos vetores como flechas, caso precisarmos ter uma visualização
dos mesmos. É similarmente útil ter uma representação de uma forma-1. Antes de mais
nada, elas não são flechas. Sua representação deve refletir o fato de que as ditas cujas
mapeiam vetores em números reais. Um vetor por si próprio não mapeia automatica-
mente um outro vetor em um número real. Para realizar isto, um vetor necessita do
tensor métrico a fim de definir o produto escalar. Com uma métrica diferente, os mesmos
vetores irão produzir um produto escalar diferente. Daí dois vetores sozinhos não nos dão
um número. A representação para formas-1 utilizadas por matemáticos é mostrada na
Fig.4.4.2. Uma forma-1 consiste de uma série de superfícies. A ’magnitude’ da mesma
é dada pelo espaçamento entre as superfícies: quanto maior o espaçamento menor é sua
magnitude. Nesta visão, o número produzido quando uma forma-1 atua como um vetor
é dada pelo número de superfícies perfuradas pela flecha do vetor. Deste modo, quanto
mais próximo o espaçamento é, maior o número (compare (b) e (c) na Fig.4.4.2). Em
um espaço quadridimensional, as superfícies são tridimensionais. Uma forma-1 não define
uma direção única, dado que não se trata de um vetor. Ademais, a mesma define uma
forma de ’fatiar’ o espaço. Com o intuito de justificar esta visualização, devemos olhar
para uma forma-1 particular, o gradiente, faremos isso mais adiante, antes entretanto
faremos uma explicação física.
Considere o quadrimomento ~P de uma partícula, um elétron, por exemplo. O mesmo
possui uma onda de de Broglie associada. De um padrão de difração, pode-se determinar
não somente o comprimento das ondas de de Broglie, mas também o padrão feito no
espaço pelas superfícies de iguais fases inteiras φ = 7, φ = 8, φ = 9, . . .. Este padrão
de superfícies, representado por k̃, nos fornece uma simples ilustração de como pode-se
encontrar facilmente uma forma-1.
O padrão de superfícies no espaço feito por tal forma-1: para que serve? Tome dois
pontos próximos no espaço-tempo, P e P0 . Faça uma flecha V ~ = P − P0 de P0 até P.
Ela será perfurada por um certo número de ondas de De broglie de superfícies de fases
~
inteiras (veja a Figura 4.4.3). O número de superfícies perfurada é denotado por k̃(V).
Normalmente nem P0 nem P estão em pontos de fase inteira. Portanto pode-se e
iremos imaginar, como uniformemente interpolados entre as superfícies de fase inteiras,
uma infinitude de superfícies com todos os valores de fase intermediários. Com a ajuda
~ = φ(P) − φ(P0 ) pode ser determinado.
deles, o valor preciso de k̃(V)
Para tornar isto matematicamente simples, considere k̃ não como um padrão global
das superfícies de onda de de Broglie, mas sim como um padrão local próximo a um ponto
específico no espaço-tempo. Assim como o vetor U ~ = dP representa o comportamento
dτ
local de uma partícula na sua linha de mundo (aproximação linear para uma linha curvada
em geral), então a forma-1 k̃ representa a forma local das superfícies de onda de de Broglie
(aproximações lineares; superfícies planas e igualmente espaçados; veja a Figura 4.4.4)
dP
Assim como uma flecha ~P = m representa a melhor aproximação linear para a
dτ
linha de mundo de uma partícula próximo a P0 , os planos de superfícies da forma-1 k̃
nos fornece a melhor aproximação linear as superfícies curvas da onda de de Broglie de
uma partícula, e k̃ por si próprio é a função linear que melhor aproxima a fase φ de de
Broglie em um ponto próximo a P0 .
Figura 4.4.4: Esta é uma figura com proposito duplo. (a) Ela ilustra a forma-1 k̃ da onda
de de Broglie em um evento P0 (família de superfícies planas igualmente espaçadas, ou
’hiperplanos’ aproximando as superfícies de fase constante). (b) Ela ilustra o gradiente dφ˜
de uma função φ, no qual possui a mesma orientação que as superfícies planas, k̃ = dφ. ˜
˜ é diferente - diferentes superfícies orientadas e espaçamento
Em eventos diferentes, k̃ = dφ
diferente. A mudança em φ entre a cauda e a ponta de qualquer vetor curto V ~ é igual ao
˜ ~ ˜ ~
número de superfícies dφ perfuradas por V, dφ(V); no qual é igual a 0, 5 na figura.
Não existe forma-1 mais simples que o gradiente, df ˜ , de uma função f . Gradiente é
uma forma-1? como pode? Não é conhecido que o gradiente é um vetor? Sim, de fato,
mas somente porque não se está familiarizado com o conceito mais apropriado de forma-1.
Os hiperplanos representando df ˜ em um ponto P0 são apenas superfícies niveladas do
próprio f , exceto por achatamentos e ajustes de iguais espaçamentos. Mais precisamente,
eles são superfícies de níveis de uma função linear que aproxima f em uma vizinhança
infinitesimal de P0 .
Porque do nome ’gradiente’ ? Se deve ao fato de que df ˜ descreve as variações de
primeira ordem em f em uma vizinhança de P0 :
[Compare a ideia fundamental de ’derivada’ como algo que ’é a melhor aproximação linear
para algo em um ponto’ - uma ideia que funciona mesmo para funções cujos valores e
argumentos são vetores de dimensões infinitas!]
~ construa a curva P(λ) definida por P(λ) − P0 = λV;
Tome qualquer vetor V; ~ e
O ’operador diferencial’
d
∂V~ = , (4.4.15)
dλ ~
λ=0,ao longo de uma curva P (λ) − P0 = λV
o que isso faz diferenciando, é chamado de ’operador derivada direcional ao longo do vetor
~ A derivada direcional ∂~ f e o gradiente df
V.’ ˜ são intimamente relacionados, como se
V
ver ao aplicar ∂V~ à Eq.(4.4.13) e calculando-se o resultado em um ponto P0
df (P0 ) d ˜
∂V~ f = + [df (P − P0 )]
| dλ
{z } dλ
| {z }
~
=λV
=0
˜ (V)
⇒ ∂V~ f = df ~ (4.4.16)
Este resultado, expresso em palavras, é: df ˜ é uma máquina linear para calcular a taxa
de variação de f ao longo de qualquer vetor desejado V. ~ Insira V
~ em df˜ ; o resultado (’o
~ suficientemente pequeno,
número de superfícies perfuradas’) é ∂V~ f - no qual, para um V
é simplesmente a diferença em f entre a ponta e a cauda de V. ~
Para encontrar a representação de coordenadas do operador derivada direcional ∂V~ ,
reescrevamos a Eq.(4.4.15) utilizando o calculo elementar
dxα
d ∂
∂V~ = =
dλ P0 dλ ~
em P0 ao longo da curva P(λ) − P0 = λV ∂xα
| {z }
vα
o resultado é
∂
∂V~ = v α . (4.4.17)
∂xα
e analogamente,
df (P0 ) d ˜ ˜ (êα )
∂êα f = + [df (P − P0 )] = df (4.4.18)
dλ dλ | {z }
| {z } =λêα
=0
dxβ
d ∂ ∂
∂êα = = = (4.4.19)
dλ P0 dλ em P0 ao longo da curva P(λ) − P0 = λêα ∂xβ ∂xα
| {z }
(eα )β =δαβ
daí
˜ (êα ) = ∂f
df (4.4.20)
∂xα
˜ , nas quais são denotadas por fα , são dadas por
As componentes do gradiente forma-1 df
˜ = fα ω̃ α
df
∂f
= f,α (4.4.23)
∂xα
˜ serão denotadas por f,α
então, as componentes do gradiente forma-1 df
˜ = f,α ω̃ α
df (4.4.24)
˜ = ∂f dx
df ˜ α (4.4.26)
∂xα
um vetor normal ser definido precisamos do produto escalar: o vetor normal deve ser
ortogonal a todos os vetores tangentes a superfície. Isto só pode ser definido somente
através do tensor métrico. Mas uma forma-1 normal pode ser definida sem fazer referência
a métrica. Uma forma-1 é dita ser normal a uma superfície se o seu valor é zero em cada
vetor tangente a superfície. Se a superfície é fechada e divide o espaço-tempo em ’dentro’
e ’fora’, uma normal é dita ser uma forma-1 normal externa se é uma forma-1 normal e
seu valor em vetores que apontam para fora da superfície é positivo.
Um exemplo disto é: o gradiente df ˜ é normal a todas as superfícies de f constante,
para provar isto observemos que se f é constante, então
f (λ + dλ) = f (λ)
logo,
df
=0
dλ
daí,
∂f dxα ∂f α
α
= T =0
∂x dλ ∂xα
onde T α é a componente do vetor tangente a superfície, segue que
∂f β α
⇒ T δ β =0
∂xα
∂f ˜ α β ˜ (T~ ) = 0
⇒ dx (T êβ ) = df
∂xα
que é justamente a nossa definição.
0
4.4.7 Os Tensores 2
métrico como um tensor deste tipo, mas o mais simples deste tipo é o produto de duas
formas-1, formado de acordo com a seguinte regra: se p̃ e q̃ são formas-1, então o produto
p̃ ⊗ q̃ é o tensor 02 no qual, quando abastecido com os vetores A ~ eB
~ nos seus argumentos,
produz o número p̃(A)q̃( ~ B),~ i.e. assim como o produto dos números produzidos por um
tensor 01 . O símbolo ⊗ é chamado de ’sinal do produto tensorial’ e é uma notação formal
para mostrar como o tensor 02 é formado por formas-1. Note que ⊗ não é comutativo:
~ B),
p̃ ⊗ q̃ e q̃ ⊗ p̃ são tensores diferentes. O primeiro nos dá p̃(A)q̃( ~ já o segundo q̃(A)p̃(
~ B). ~
O tensor mais geral 02 não é um simples produto tensorial, mas pode sempre ser
representado como a soma de tais tensores. Para ver isto, primeiro devemos considerar
as componentes de um tensor 02 arbitrário f :
Visto que cada índice pode ter quatro valores, existem 16 componentes, e elas podem ser
pensadas como sendo alinhadas em uma matriz. O valor de f em vetores arbitrários é
~ B)
f (A, ~ = f (Aα êα , B β êβ )
Podemos formar uma base para este tensor? Isto é, podemos definir um conjunto de 16
tensores 02 representados por ω̃ αβ tal que
f = fαβ ω̃ αβ ? (4.4.29)
ora mas
fµν = δ αµ δ βν fαβ
δ αµ = ω̃ α (êµ ), e δ βν = ω̃ β (êβ ).
o que implica
ω̃ αβ (êµ , êν ) = ω̃ α (êµ )ω̃ β (êβ )
f = fαβ ω̃ α ⊗ ω̃ β (4.4.32)
Esta é uma maneira pela qual um tensor geral 02 é a soma sobre simples tensores do
produto tensorial.
4.4.8 Simetrias
Um tensor 02 toma dois argumentos, e sua ordem é importante, como vimos. O com-
portamento do valor do tensor sob uma mudança de seus argumentos é uma propriedade
importante do mesmo. Um tensor f é chamado simétrico se
~ B)
f (A, ~ = f (B,
~ A)
~ ~ B.
∀A, ~ (4.4.33)
~ = êα e B
Colocando A ~ = êβ , isto implica que suas componentes são
0
Isto é similar a condição de simetria de uma matriz. Um tensor, do tipo 2
, h arbitrário
pode definir um novo simétrico h(s) pela regra
1
h(s)αβ = (hαβ + hβα ). (4.4.36)
2
Isto é uma propriedade matemática tão importante que uma notação especial é usada
para a mesma:
1
h(αβ) = (hαβ + hβα ). (4.4.37)
2
Portanto, os números h(αβ) são as componentes do tensor simétrico formado através de h.
Similarmente, um tensor f é chamado de anti-simétrico se
~ B)
f (A, ~ = −f (B,
~ A),
~ ~ B,
∀A, ~ (4.4.38)
1
h(A)αβ = (hαβ − hβα ). (4.4.41)
2
1
h[αβ] = (hαβ − hβα ). (4.4.42)
2
Note que
1 1
hαβ = (hαβ + hβα ) + (hαβ − hβα )
2 2 (4.4.43)
= h(αβ) + h[αβ] .
Então qualquer tensor 02 pode ser dividido unicamente em suas partes simétricas e anti-
simétricas.
O tensor métrico η é simétrico como foi apontado mais cedo:
~ B)
η(A, ~ = η(B,
~ A).
~ (4.4.44)
Iremos introduzir agora o que veremos mais tarde como o papel fundamental da mé-
trica na geometria diferencial, que é atuar como um mapeamento entre vetores e formas-1.
~
Para ver como isto funciona, considere ηe um único vetor V. Visto que η requer dois
argumentos vetoriais, a expressão η V, ~ está incompleta: quando outro vetor for for-
necido, ela se tornará um número. Portanto, η V, ~ é considerada como uma função de
vetores (que devem preencher o espaço vazio na mesma), mais precisamente é uma função
linear de vetores produzindo números reais: uma forma-1. A chamaremos de Ṽ :
~
η V, = Ṽ ( ) , (4.5.1)
onde o espaço em branco dentro do parêntese é uma forma de indica que um argumento
~ para V
vetorial deve ser fornecido. Então Ṽ é a forma-1 que leva um vetor A ~ · A:
~
~ ≡ η(V,
Ṽ (A) ~ A)
~ =V
~ ·A
~ (4.5.2)
~ · êα = êα · V
Vα = Ṽ (êα ) = V ~
= êα · (V β êβ )
= (êα · êβ )V β
Vα = ηαβ V β . (4.5.3)
~ = (a, b, c, d)
V
então,
Ṽ = (a, −b, −c, −d)
~ pela mudança de sinal nas componentes espaciais.
As componentes de Ṽ são obtidas de V
4.5.1 ~
O Inverso: Indo de à para A
Será que a métrica também fornece uma forma de encontrar um vetor A ~ que é relaci-
onado a uma forma-1 dada Ã? A resposta é sim. Considere a Eq.(4.5.3). Ela nos diz que
{Vα } é obtido multiplicando {V β } pela matriz (ηαβ ). Se esta matriz possuir uma inversa,
então poderíamos usa-la para obter {V β } de {Vα }. Esta inversa existe se e somente se
(ηαβ ) possui um determinante não nulo. Mas visto que (ηαβ ) é a matriz diagonal com
entradas (1, −1, −1, −1), seu determinante é simplesmente −1. Uma inversa deve existir,
e chamaremos suas componentes de η αβ . Então, dado {Aβ } podemos achar {Aα }:
Aα = η αβ Aβ . (4.5.4)
Aβ = ηβα Aα .
ηµα η αβ = δ βµ (4.5.5)
então,
1 = δ 00 = η00 η 00 ⇒ η 00 = 1
|{z}
=1
e
δ iβ = ηβν η νi
= ηβ0 η 0i + ηβj η ji
tomemos β = 0,
δ i0 = η0ν η νi
= η00 η 0i + η0j η ji
|{z} |{z}
=1 =0
0i 0i
=η ⇒η =0
e por fim, tomemos β = k,
δ ik = ηkν η νi
= ηk0 η 0i + ηkj η ji
|{z} |{z}
=0 =−δkj
= −δkj η ji ⇒ η ji = −δ ji ,
η 00 = +1, η 0i = 0, η ij = −δ ij , (4.5.6)
então (η αβ ) é idêntico a (ηαβ ). Portanto, para ir de uma forma-1 para um vetor, simples-
mente mude o sinal das componentes espaciais.
Se tivéssemos simplesmente tentado definir o ’vetor gradiente’ de uma função como o vetor
com essas componentes, sem primeiro discutir formas-1, a leitura teria sido justificada por
ser mais do que um pouco cética. A métrica não-Euclidiana da Relatividade Especial nos
força a ser cuidadoso com a distinção básica entre formas-1 e vetores: não pode ser varrida
para debaixo do tapete.
p
a b ... q = ap + bq + . . . (4.5.8)
..
.
é um número real, então o vetor linha pode ser considerado como a forma-1 dos vetores
colunas. A operação de encontrar um elemento de um espaço através de um do outro é
chamado de ’adjunto’ e é 1 − 1 e invertível. Um exemplo menos trivial surge na mecânica
quântica. Uma função de onda (a amplitude de probabilidade que é a solução da equação
de Schrodinger) é um campo escalar complexo φ(~x), e é desenhado através do espaço de
Hilbert para todas essas funções. Este espaço de Hilbert é um espaço vetorial, visto que
seus elementos (funções) satisfazem os axiomas de um espaço vetorial. Qual é o espaço
dual das formas-1? A dica crucial é que o produto interno de duas funções φ(~x) e ψ(~x) não
é φ(~x)ψ(~x)d3 x mas, em vez, é φ∗ (~x)ψ(~x)d3 x, o asterisco denota o complexo conjugado.
R R
A função φ∗ (~x) atua como uma forma-1 cujo valor em ψ(~x) é a sua integral com ele. A
operação do complexo conjugado atua como o nosso tensor métrico. transformando um
vetor φ(~x) (no espaço de Hilbert) em uma forma-1 φ∗ (~x). O fato de que φ∗ (~x) é também
uma função no espaço de Hilbert é, neste nível, uma distração (é equivalente a dizer que
os membros do conjunto (1, −1, 0, 0) podem ser as componentes de um vetor ou de uma
forma-1.) O ponto importante é que na integral φ∗ (~x)ψ(~x)d3 x, a função φ∗ (~x) está
R
atuando como uma forma-1, produzindo um numero complexo através do vetor ψ(~x).
Uma forma-1 p̃ é definida para ter a mesma magnitude associada ao vetor ~P. Portanto
escrevemos
p̃2 = ~P2 = ηαβ pα pβ . (4.5.9)
Mas visto que ηαβ e η βν são as matrizes inversas uma da outra, nossa soma em β colapsa,
e
p̃2 = η αµ pµ pα (4.5.11)
Portanto, o tensor métrico inverso pode ser usado diretamente para encontrar a magnitude
de p̃ a partir de suas componentes.
Esta é a mesma regra, de fato, utilizada para vetores. Por definição, isto é invariante.
Formas-1 são tipo-tempo, tipo-espaço, ou nulas, assim como são os seus vetores associados.
Assim como para vetores, podemos agora definir o produto interno para formas-1. Isto
é
1
(p̃ + q̃)2 − p̃2 − q̃ 2 .
p̃ · q̃ = (4.5.13)
2
Esta expressão em termos de suas componentes é, não surpreendentemente
p̃ · q̃ = p0 q0 − p1 q1 − p2 q2 − p3 q3 . (4.5.14)
Um vetor é dito ser normal a uma superfície se a sua forma-1 associada é uma forma-1
normal. A Eq.(4.5.1) nos mostra que esta definição é equivalente a usual adotada para
vetores serem ortogonais a todos os vetores tangentes. Um vetor normal ou forma-1
normal é dito ser uma normal unitária se sua magnitude é ±1 (Não podemos demandar
que seja +1, já que vetores do tipo-espaço possuem magnitudes negativas. Tudo que
podemos fazer é multiplicar o vetor ou a forma-1 por um fator geral para transformar sua
magnitude para ±1.) Observe que normais nulas não podem ser normais unitárias.
Uma superfície tridimensional é dita ser tipo-tempo, tipo-espaço, ou nula de acordo
com qual tipo de classe a sua normal é.
Desta forma iremos retirar os vetores de sua posição especial, na qual eram tidos como
coisas ’atuadas’ por tensores, e iremos considerar os mesmos também como tensores,
especificamente como funções lineares de uma única forma-1 em números reais. A última
notação na Eq.(4.5.15) é nova, e enfatiza o estado igualitário dos dois objetos.
Generalizando isto, iremos definir:
Um tensor M0 é uma função linear de M formas-1 nos números reais.
os seus valores quando a base forma-1 ω̃ α é o seu argumento. Note que tensores M0
Neste ponto, o aluno pode se preocupar que toda a álgebra tensorial se tornou circular:
formas-1 foram definidas em termos de vetores, contudo agora definimos vetores em termos
de formas-1. Esta ’dualidade’ é o coração da teoria, porém não é circular. O que significa
que podemos fazer o que físicos fazem, que é identificar vetores com deslocamentos ∆~x e
coisas parecidas (como p~ e ~v ) e então gerar todos os tensores M
N
pelas regras da álgebra
tensorial; estes tensores herdam um significado físico através do significado original dado
aos vetores. Entretanto, podemos igualmente bem associar formas-1 com objetos físicos
(gradientes, por exemplo) e recuperar a álgebra inteira deste ponto inicial. O poder da
matemática é que não é preciso (ou desejado) dizer o que os vetores ou formas-1 são.
Simplesmente damos regras para manipula-los. A associação de, digamos, p~ como um
vetor é a interface entre a física e a matemática: é como fazemos um modelo matemático
do mundo físico. A geometria faz o mesmo. Ele adiciona à noção desses abstratos espaços
Da mesma forma que a métrica mapeia um vetor V ~ em uma forma-1 Ṽ, ela mapeia
N N −1 N
um tensor M em um tensor M +1
. Similarmente, a inversa mapeia um tensor M
em
N +1
um tensor M −1 . Normalmente, eles recebem o mesmo nome, e são distinguidos somente
pela posição dos seus índices. Suponha que T αβγ são as componentes de um tensor 21 .
Então
T αβγ = ηβµ T αµγ (4.5.17)
dice), enquanto
T αβγ = η γµ T αβµ (4.5.19)
Mas na direita nós temos apenas o produto matricial de duas matrizes que são a inversa
uma da outra, então tal produto se trata da matriz identidade. Visto que um índice está
levantado enquanto o outro está abaixado, só pode ser o delta de Kronecker, escrevemos
como
η αβ = δ αβ . (4.5.21)
são iguais aos elementos da matriz inversa da matriz das suas componentes ’covariantes’.
É o único tensor para o qual isto é verdade.
Suponha, que como foi feito para funções, que nos movemos ao longo de uma linha de
mundo com parâmetro τ , tempo próprio. A taxa de variação de T,
dT T(τ + ∆τ ) − T(τ )
= lim , (4.5.23)
dτ ∆τ →0 ∆τ
não é muito difícil de se calcular. Visto que as bases formas-1 e vetores são as mesmas
em qualquer lugar (i.e. ω̃ α (τ + ∆τ ) = ω̃ α (τ )), segue que
dT αβ
dT
= ω̃ β ⊗ êα , (4.5.24)
dτ dτ
dT αβ
= T αβ,γ U γ . (4.5.25)
dτ
Agora, o objeto dT/dτ é um tensor 11 , pois como foi visto na Eq.(4.5.23) o mesmo é
definido para a ser diferença entre dois tensores deste rank. Da Eq.(4.5.24) e (4.5.25)
temos, que para qualquer vetor U,
dT
= (T αβ,γ ω̃ β ⊗ êα )U γ , (4.5.26)
dτ
assim,
∇T = (T αβ,γ ω̃ β ⊗ ω̃ γ ⊗ êα ) (4.5.27)
1
é um tensor 2
. Este tensor é chamado de gradiente de T.
Esta derivada faz uso do fato de que os vetores de base (e portanto as bases forma-1)
são constantes em todos os lugares. Iremos ver que não podemos assumir isto no espaço
curvo da relatividade geral, e levar isto em conta será o nosso ponto de entrada na teoria!
O produto externo é mais um outro processo para produzir novos tensores a partir de
antigos. É meramente um produto de tensores anti-simetrizado: dado dois vetores U ~ e
V~ , o produto externo deles, o ’bivetor’ U
~ ∧ V~ , é definido por
~ ∧ V~ = U
U ~ ⊗ V~ − V~ ⊗ U
~; (4.5.30)
além disso,
α̃ ∧ β̃ = (αj ω̃ j ) ∧ (βk ω̃ k ) = αj βk ω̃ j ∧ ω̃ k (4.5.33)
e
α̃ ∧ β̃ = −β̃ ∧ α̃ = −(βj ω̃ j ) ∧ (αk ω̃ k ) = −βj αk ω̃ j ∧ ω̃ k (4.5.34)
1
α̃ ∧ β̃ = (αj βk − βj αk )ω̃ j ∧ ω̃ k . (4.5.35)
2
~ , V~ , W
De três vetores U ~ pode-se construir um tri-vetor
~ ∧ V~ ∧ W
U ~ = (U~ ∧ V~ ) ∧ W
~ =U ~ ∧ (V~ ∧ W
~)
=U ~ ⊗ V~ ⊗ W ~ + V~ ⊗ W
~ ⊗U ~ +W~ ⊗U ~ ⊗ V~ (4.5.36)
− V~ ⊗ U
~ ⊗W ~ −U~ ⊗W ~ ⊗ V~ − W~ ⊗ V~ ⊗ U~.
~ ∧ V~ = αV~ ∧ V~ = 0
U
~ ∧U
W ~ ∧ V~ = αU
~ ∧U
~ ∧ V~ + bV~ ∧ U
~ ∧ V~ = 0 (4.5.37)
α̃ ∧ β̃ = (−1)pq β̃ ∧ α̃ (4.5.38)
~,U
(N ~ , V~ , W
~ ) muda de sinal quando dois vetores quaisquer são permutados. (4.5.39)
Escolha um referencial de Lorentz arbitrário, mas especifico, com ê0 apontando em direção
ao futuro e ê1 , ê2 , ê3 um conjunto de vetores de base destros. As componentes covariante
de neste referencial são
0123 = (ê0 , ê1 , ê2 , ê3 ) = +1 (4.5.40)
E (
+1 Se µνλρ é uma permutação par de 0, 1, 2, 3, e
µνλρ (4.5.43)
−1 Se µνλρ é uma permutação ímpar de 0, 1, 2, 3.
Para mostrar isto, lembremos que se um tensor é anti-simétrico, então ao permutarmos
dois índices quaisquer, o valor da componente do tensor muda de sinal, como o tensor de
Levi-Civita é anti-simétrico faremos µ = λ, assim µνµρ = −µνµρ , trocamos um índice µ
com o outro, ⇒ µνµρ = 0, como poderíamos ter permutado dois índices quaisquer, desde
que os mesmos fossem iguais, segue que isso é válido de forma geral e assim provamos
(4.5.42). Mostremos agora (4.5.43):
Sabemos que 0123 = +1, suponha que permutemos dois índices quaisquer desta com-
ponente, pela definição de anti-simetria, segue que esta nova componente do tensor deverá
mudar de sinal, isto é, ser igual a −1, se trocarmos novamente dois índices do mesmo,
então deveremos novamente mudar o sinal da componente, e o mesmo será igual a +1,
assim, por indução, se tivermos 2n permutações de índices, com n ∈ N, então a nova
componente terá sinal igual a +1, se efetuarmos 2n + 1 permutações de índices, então o
seu sinal será −1.
Agora, mostremos que
µνλρ = −µνλρ (4.5.44)
onde o ’caso contrário’ ocorre se αβγ não é uma permutação par nem ímpar de µνλ,
então αβγρ deve conter um índice repetido e portanto αβγρ é igual a 0. Além disso, por
(4.5.44),
αβγρ = −αβγρ
então
−µνλρ se αβγ forem uma permutação par de µνλ
αβγρ = +µνλρ se αβγ é uma permutação ímpar de µνλ (4.5.48)
0 caso contrário.
Note que, embora haja uma soma implica sobre ρ na Eq.(4.5.46), existe somente um
termo nesta soma que não é nulo, dado que ρ deve ser diferente dos outros 3 índices.
Logo, temos uma justificativa para escrever αβγρ µνλρ = ±(µνλρ )2 . Em seguida, fazemos
uma contração em (4.5.46) no terceiro índice para obter
pelo último termo, vemos que λ e ρ devem ser diferentes dos demais índices, então para
α, β, µ, ν fixados, só resta dois valores possíveis para lambda, e portanto o termo do lado
esquerdo, δ λλ , é igual a 2, deste modo
ou,
1 1
δ αβµν = δ αβλµνλ = − αβλρ µνλρ (4.5.50)
2 2
analogamente, façamos uma contração na Eq.(4.5.50) de β com ν, por argumentos simi-
lares aos que utilizamos para chegar na Eq.(4.5.50), temos 3 opções para o β, e deste
modo
1 1
δ αµ δ ββ = δ αβµβ = δ αβλµβλ = − αβλρ µβλρ
|{z} 2 2
3
o que implica
1 1 1
δ αµ = δ αβµβ = δ αβλµβλ = − αβλρ µβλρ (4.5.51)
3 3! 3!
1 1
Vimos que δ αβµν = − αβλρ µνλρ = αβλρ µνλρ , segue que os índices λρ devem ser dife-
2 2
rentes de µν, porém sempre poderemos permutar λ com ρ, isto é, poderemos ter αβλρ e
αβρλ e o mesmo com µνλρ e µνρλ , observemos que tal permutação não irá mudar o sinal
da expressão dado que existe dois . Para uma permutação par de αβ de µν temos que
(sem soma para índices repetidos)
1
δ αβµν = (µνλρ µνλρ + µνρλ µνρλ )
2
1
= (1 + 1)
2
=1
já para uma permutação ímpar de αβ de µν temos que (sem soma para índices repetidos)
1
δ αβµν = (µνλρ µνλρ + µνρλ µνρλ )
2
1 (4.5.52)
= (−1 − 1)
2
= −1
Portanto,
+1 se αβ forem uma permutação par de µν
δ αβµν = −1 se αβ é uma permutação ímpar de µν (4.5.53)
0 caso contrário.
Finalmente, o delta de Kronecker usual é definido neste caso como [olhe novamente para
a Eq.(4.5.51)]
1
δ αµ = δ αβµβ
3
se α = µ, então β pode assumir 3 outros valores distintos e visto que αβ = µβ temos que
αβ é uma permutação par de µβ, daí δ αβµβ = 1 para cada um dos valores de β, assim
(sem soma para índices repetidos)
1
δ αα = (1 + 1 + 1) = 1 (4.5.54)
3
e se α 6= µ, não irá existir outros termos na soma nos quais αβ é uma permutação par ou
ímpar de µβ, logo todos os termos são nulos. Concluímos então que
(
+1 se α = µ,
δ αµ = (4.5.55)
0 caso contrário.
4.5.11 Duals
Qualquer vetor J,~ qualquer tensor antissimétrico de rank dois F (Fαβ = F[αβ] ), e
qualquer tensor antissimétrico de rank três B (Bαβγ = B[αβγ] ) pode ser utilizado para se
construir novos tensores definidos por
∗
Jαβγ = J µ µαβγ
∗ 1
Fαβ = F µν µναβ
2
∗ 1 λµν
Bα = B λµνα (4.5.58)
3!
Chama-se ∗ J~ o ’dual’ de J,
~ ∗ F o dual de F, e ∗ B o dual de B. [Um uso anterior e
totalmente distinto da palavra ’dual’, chamado de conjunto de bases forma-1 {ω̃ α } , duais
a um conjunto de vetores de base {~eα }, caso hω̃ α , ~eβ i = δ αβ . Felizmente, não há motivos
para confusão entre os dois tipos de dualidade. Um relaciona conjuntos de vetores a
conjuntos de formas-1. O outro relaciona um tensor antissimétrico de rank p a um tensor
antissimétrico de rank 4 − p.] Mostremos que
∗∗ ~ ~ ∗∗ ∗∗
J = J, F = −F, B = B. (4.5.59)
∗∗ 1∗
Jζ = Jαβγ αβγζ
3!
1
= J µ µαβγ αβγζ
3!
1
= − µαβγ ζαβγ J µ
3!
ζ
=J
1
Provemos agora a segunda relação, tendo em vista que ∗ Fαβ = F µν µναβ , temos
2
∗∗ 1∗
F ζξ = Fαβ αβζξ
2
1
= F µν µναβ αβζξ
4
1
= F µν αβζξ αβµν
2
1
= − F µν (δ ζµ δ ξν − δ ζν δ ξµ )
2
1 ζξ
= − (F − |{z} F ξζ )
2 ζξ
−F
= −F ξζ
1 λµν
Por fim, provemos a última relação, levando em conta que ∗ Bα = B λµνα
3!
∗∗
B ζξκ = ∗ Bα αζξκ
1
= B λµν λµνα αζξκ
3!
1
= − B λµν αλµν αζξκ
3!
daí,
1
∗∗
B ζξκ = − (−B λµν δ ζλ δ ξµ δ κν + B λµν δ ζλ δ ξν δ κµ + B λµν δ ζν δ ξµ δ κλ − B λµν δ ζν δ ξλ δ κµ
3!
− B λµν δ ζµ δ ξν δ κλ + B λµν δ ζµ δ ξλ δ κν )
1
⇒ ∗∗ B ζξκ = − (−B ζξκ + B ζκξ κξζ
|{z} − B
|{z} + B
ξκζ
|{z} − B
κζξ
|{z} + B
ξζκ
|{z} )
3!
−B ζξκ −B ζξκ B ζξκ B ζξκ −B ζξκ
= B ζξκ
conforme queríamos demonstrar.
5 Eletromagnetismo
5.1 Tensor Eletromagnético
5.1.1 Derivação do Tensor Eletromagnético Através da Formulação Covari-
ante
Sabemos que
~ = (U 0 , U i ) = γu (c, ~u)
U
e
d~P
dm d~p
= γu c ,
dτ dt dt
logo,
d~P ~
2 2 dm d~p
· U = γu c − · ~u
dτ dt dt
escolhendo o referencial de repouso da partícula (~u = 0 ⇒ dm/dt = 0)
d~P ~
·U=0
dτ
dP µ
⇒ Uµ = 0 (5.1.1)
dτ
ou,
dP 0 dP i
U0 + Ui = 0
dτ dτ
o que implica em
dP 0 dP i dpi
U0 = − Ui = −γu2 ui (5.1.2)
dτ dτ |{z} dt
|{z} γu ui
i
γu dp
dt
dP 0 dpi
γu
=− ui (5.1.3)
dτ c dt
dpi e
= (cE i + ijk uj Bk ) (5.1.4)
dt c
16
Estamos utilizando o sistema de unidades Gaussiano, onde
1 4π
→ µ0 →
4π c2
1
B→ B E → E.
c
dP 0 e
= −γu [E i ui + ijk ui uj Bk ]
dτ c (5.1.5)
e
= −γu (Ei ui )
c
d~P
0
dpi
dP
= , γu
dτ dτ dt (5.1.6)
eγu
= (−Em um , cE i + ijk uj Bk )
c
~ é inserindo em um funcional
interpretando tal equação é possível ver que o Quadrivetor U
(aqui, um tensor do tipo 11 , chamado de tensor eletromagnético e representado por F) e
tem como resultado um outro Quadrivetor, isto pode ser expresso como:
d~P e ~
= F(U)
dτ c
ou,
dP µ e
= F µν U ν (5.1.7)
dτ c
então, para µ = 0
dP 0 e 0 0
F 0 U + F 0i U i
=
dτ c
e 0
cF 0 γu + F 0i (γu ui )
=
c
eγu 0
cF 0 + F 0i ui
=
c
dP 0 eγu
ora, mas por (5.1.5), = (−Em um ), consequentemente
dτ c
eγu eγu 0
(−Em um ) = cF 0 + F 0i ui
c c
⇒ −Em um = cF 00 + F 0i ui
F 0i = −Ei , F 00 = 0 (5.1.8)
aplicando µ = i = 1, 2, 3 em (5.1.7)
dP i e
= (F i0 U 0 + F ij U j )
dτ c
e i
cF 0 γu + F ij (γu uj )
=
c
eγu i
cF 0 + F ij uj
=
c
entretanto, por (5.1.6)
dP i eγu
= (cE i + ijk uj Bk )
dτ c
comparando as duas últimas equações:
cF i0 + F ij uj = cE i + ijk uj Bk
= cη ik Ek + ijk ηjm um Bk
= c(−δ ik )Ek + ijk (−δjm )um Bk
= −cEi − ijk uj Bk
Deste modo, o tensor eletromagnético é dado por (lembre-se de que estamos utilizando a
definição de que 123 = −1)
0 −E1 −E2 −E3
α
−E1 0 B3 −B 2
F β
= (5.1.10)
−E −B 0 B
2 3 1
−E3 B2 −B1 0
frequentemente este tensor é visto na sua forma covariante obtida por um abaixamento
de índice com a métrica:
Fαβ = ηαγ F γβ ; (5.1.11)
0 −E1 −E2 −E3
E1 0 B3 −B 2
kFαβ k =
E −B
(5.1.12)
2 3 0 B1
E3 B2 −B1 0
e a forma contravariante é obtida por um levantamento de índices do tipo
F αβ = η αµ η βν Fµν (5.1.13)
0 E1 E2 E3
αβ
−E1 0 B3 −B 2
F
= (5.1.14)
−E −B 0 B1
2 3
−E3 B2 −B1 0
A ação de uma partícula que se move num campo eletromagnético dado é composta
de duas partes: a ação da partícula livre (??) e de um termo que descreve a interação
da partícula com o campo. Este último deve conter tanto as grandezas características da
partícula quanto as grandeza que caracterizam o campo.
Parece que as propriedades da partícula são definidas, no que concerne à sua interação,
por um único parâmetro, chamado carga e da partícula, podendo ser positivo, negativo
ou nulo. As propriedades do campo em si são caracterizadas por um 4-vetor Ai chamado
4−potencial, cujas componentes são funções das coordenadas e do tempo. Essas grandezas
são expressas na ação por meio do termo
Z b
e
Ai dxi (5.1.15)
c a
Para provar isto iremos calcular a energia potencial U do campo eletromagnético, supo-
nhamos uma partícula que esteja sobre a ação da força de Lorentz, dada por
d~p e ~ ~
= (cE + ~u × B)
dt c
~
~ + 1 ∂B = 0
~ ×E
∇
c ∂t
~ =∇
B ~ ×A
~
~ ×M
do cálculo vetorial sabemos que ∇ ~ = 0, onde M ~ é um campo vetorial é um indicativo
~ =M
da possível existência de um campo escalar tal que ∇ϕ ~ , assumiremos que ϕ satisfaz
todas as condições necessárias para que o mesmo seja um potencial, deste modo
~
~ + 1 ∂ A = −∇φ
E ~
c ∂t
ou,
~
~ = − 1 ∂ A − ∇ϕ
E ~ (5.1.16)
c ∂t
~ =∇
substituindo (5.1.16) e B ~ ×A
~ na força de Lorentz, obtém-se:
!
d~p e ∂ ~
A
= ~ −
−c∇ϕ ~ ×A
+ ~u × ∇ ~ (5.1.17)
dt c ∂t
lembremos que
~
dA ~
~ A
= (~u · ∇) ~ + ∂A (5.1.18)
dt ∂t
e pela regra BAC − CAB:
~ ×A
~u × ∇ ~ = ∇(~
~ u · A)
~ − (~u · ∇)
~ A~ (5.1.19)
d~p ~ L+ d ∇
~ u UL
= −∇U (5.1.21)
dt dt
~ eϕ − e ~u · A
~ + d −eA ~ = d~p = −∇U
~ L+ d ∇
h i
−∇ ~ u UL
c dt c dt dt
d h e ~i d h~ e i
~ , então
contudo − A = ∇u − ~u · A
dt c dt c
~ eϕ − e ~u · A
~ + d ∇
h e
~ = d~p = −∇U
~ L+ d ∇
i
−∇ ~ u − ~u · A ~ u UL
c dt c dt dt
ou seja,
e ~
UL = eϕ − ~u · A (5.1.22)
c
r
u2 2
Podemos escrever a Lagrangiana do sistema como L = K −UL , onde K = −m0 c 1 − 2
c
é a energia cinética e UL é a energia potencial, deste modo a ação para uma carga em um
campo eletromagnético se escreve
Z b
S= L dt
a
r
b b b
u2
Z Z Z
e~
= −m0 c c 1 − 2 dt − eϕ dt + A · ~u dt
a c a a c
r
u2
ou, lembrando que c 1 − dt = ds
c2
Z b Z b
e
S= −m0 c ds − Aµ dxµ (5.1.24)
a c a
Onde construímos um 4-vetor A , que possui componentes espaciais dadas pelo vetor
~ chamado potencial vetor do campo e uma componente temporal dada
tridimensional A,
por ϕ, chamada potencial escalar do campo. De modo que
A~ = (Ai , φ) (5.1.25)
onde a função integrante é a Lagrangiana para uma carga num campo eletromagnético
r
u2 e ~
L = −m0 c2 1− + A · ~u − eϕ (5.1.27)
c2 c
e~
Esta expressão difere da Lagrangiana para uma partícula livre pelos termos A · ~u − eϕ,
c
∂L
que descrevem a interação da carga com o campo. A derivada é a quantidade de
∂~u
m0~ue~
p~ = r + A (5.1.28)
u2 c
1− 2
c
m0 c2
H=r + eϕ (5.1.29)
u2
1− 2
c
e finalmente r e ~ 2
H= m20 c2 + c2 p~ − A + eϕ (5.1.31)
c
que é a Hamiltoniana do sistema.
De acordo com o princípio da ação mínima,
Z b
e
δS = δ −m0 c ds − Aµ dxµ = 0 (5.1.32)
a c
dxµ dxµ
p
Assim, como ds =
Z bh p e i
δS = −m0 cδ( dxµ dxµ ) − δ(Aµ dxµ )
a c
Z bh p e i
⇒ δS = −m0 cδ( dxµ dxµ ) − δ(Aµ dxµ )
a c
Z b η
∂ p µ ∂ dx e e
⇒ δS = −m0 c η( dxµ dx ) dα − Aµ δ(dxµ ) − (δAµ ) dxµ
a ∂ dx ∂α c c
Z b µ
−m c ∂ dx µ ∂ dxµ
= p 0 µ dxµ η
η δ(dx ) + dx
η
η δ(dx )
a 2 dxµ dx ∂ dx ∂ dx
Z b Z b
e µ e
− Aµ δ(dx ) − (δAµ ) dxµ
a c a c
vemos que, por um abaixamento e levantamento de índice, dxµ ∂ dxµ = dxµ ∂ dxµ , segue
que Z b
−m0 c µ η e µ e µ
δS = dxµ δ η (δ dx ) − Aµ δ(dx ) − (δAµ ) dx
a ds c c
Z b
−m0 c µ e µ e µ
= dxµ (δ dx ) − Aµ δ(dx ) − (δAµ ) dx = 0
a ds c c
Lembremos da seguinte relação
∂ ∂xµ
δ(dxµ ) = (dxµ ) dα = d dα = d(δxµ )
∂α ∂α
Assim, Z b
dxµ µ e µ e µ
δS = m0 c d(δ x ) + Aµ d(δ x ) + (δAµ ) dx = 0
a ds c c
Integremos por partes os dois primeiros termos sob o sinal de soma, por exemplo
tomando dξ = d(δxµ ) e η = m0 c dxµ / ds na primeira integral. Ainda escrevamos no
primeiro termo dxµ / ds = Uµ , são as componentes da 4-velocidade. Então:
b Z b e b Z b e Z b
e
µ
δS = m0 cUµ δx − µ µ
m0 cδx dUµ + Aµ δx − µ
δx dAµ + (δAµ ) dxµ = 0
a a c a a c a c
(5.1.33)
o primeiro e o terceiro termo da igualdade acima são nulos, pois fazemos variar a integral
observando as condições: (δxµ )a = (δxµ )b = 0. Aliás,
∂Aν µ ∂Aµ ν
δAν = δx , dAµ = dx
∂xµ ∂xν
então Z b
e ∂Aµ ν µ e ν ∂Aν µ
µ
δS = −m0 c dUµ δx − dx δx + dx δx =0
a c ∂xν c ∂xµ
dUµ
Escrevamos no primeiro termo dUµ = ds, no segundo e no terceiro termo dxν =
ds
U ν ds. Então,
Z b
dUµ e ∂Aν ∂Aµ ν
δS = −m0 c + µ
− U δxµ ds = 0
a ds c ∂x ∂xν
Ponhamos
∂Aν ∂Aµ
Fµν = µ
− (5.1.35)
∂x ∂xν
O tensor Fµν é o já definido tensor do campo eletromagnético. As equações de movimento
(5.1.34) tomam a forma:
dUµ e
m0 c = Fµν U ν (5.1.36)
ds c
Essas quatro equações (para µ = 0, 1, 2, 3) são as do movimento de uma carga em um
campo eletromagnético sob a forma quadridimensional.
Resulta da definição do tensor Fµν que
Ez̄ = F3̄0̄
= Λα3̄ Λβ 0̄ Fαβ
= Λ03̄ Λ00̄ F00 + Λ03̄ Λ30̄ F03 + Λ33̄ Λ00̄ F30 + Λ33̄ Λ30̄ F33
= γ 2 β F00 +γ 2 β 2 F03 +γ 2 F30 + γ 2 β F33 (5.2.2)
|{z} |{z} |{z}
0 −F30 0
= γ 2 (1 − β 2 )F30 = F30
= Ez
Enquanto que
Ex̄ = F1̄0̄ = Λα1̄ Λβ 0̄ Fαβ
= Λ11̄ Λ00̄ F10 + Λ11̄ Λ30̄ F13
(5.2.3)
= γF10 + γβF13
= γ(Ex − βBy )
de forma análoga,
Eȳ = F2̄0̄ = Λα2̄ Λβ 0̄ Fαβ
= Λ22̄ Λ00̄ F20 + Λ22̄ Λ30̄ F23
(5.2.4)
= γF20 + γβF23
= γ(Ey + βBx )
já o campo magnético,
Bz̄ = F1̄2̄ = Λα1̄ Λβ 2̄ Fαβ
(5.2.5)
= Λ11̄ Λ22̄ F12 = F12 = Bz ,
~ =E
Ē ~ k, ~ = γ(E
Ē ~ ⊥ + β~ × B
~ ⊥ ),
k ⊥
~ =B ~ = γ(B (5.2.8)
B̄ k
~ k, B̄ ⊥
~ ⊥ − β~ × E
~ ⊥ ).
˜ α ⊗ dx
F = Fαβ dx ˜ β,
1 ˜ β + 1 Fαβ dx
˜ α ⊗ dx ˜ α ⊗ dx
˜ β
F = Fαβ dx
2 2
como os índices são mudos, podemos trocar β por α no segundo termo do lado direito da
equação:
1 ˜ β + 1 Fβα dx
˜ α ⊗ dx ˜ β ⊗ dx
˜ α
F = Fαβ dx
2 2
assim utilizando-se do fato de que Fαβ = −Fβα , e
˜ α ∧ dx
dx ˜ β = dx
˜ α ⊗ dx
˜ β − dx
˜ β ⊗ dx
˜ α (5.3.1)
obtemos que
1 ˜ α ∧ dx
˜ β.
F = Fαβ dx (5.3.2)
2
Qualquer forma-2 pode ser expressa desta maneira. Deste modo, o tensor eletromagnético
é dado por
˜ 0 ∧ dx
2F =F01 dx ˜ 1 + F02 dx
˜ 0 ∧ dx
˜ 2 + F03 dx
˜ 0 ∧ dx
˜ 3 + F10 dx
˜ 1 ∧ dx
˜ 0 + F12 dx
˜ 1 ∧ dx
˜ 2
˜ 1 ∧ dx
+ F13 dx ˜ 3 + F20 dx
˜ 2 ∧ dx
˜ 0 + F21 dx
˜ 2 ∧ dx
˜ 1 + F23 dx
˜ 2 ∧ dx
˜ 3 + F30 dx
˜ 3 ∧ dx
˜ 0
˜ 3 ∧ dx
+ F31 dx ˜ 1 + F32 dx
˜ 3 ∧ dx
˜ 2
˜ 0 ∧ dx
2F =(F01 − F10 )dx ˜ 1 + (F02 − F20 )dx
˜ 0 ∧ dx
˜ 2 + (F03 − F30 )dx
˜ 0 ∧ dx
˜ 3
˜ 1 ∧ dx
+ (F12 − F21 )dx ˜ 2 + (F13 − F31 )dx
˜ 1 ∧ dx
˜ 3 + (F23 − F32 )dx
˜ 2 ∧ dx
˜ 3
˜ 0 ∧ dx
F = F01 dx ˜ 1 + F02 dx
˜ 0 ∧ dx
˜ 2 + F03 dx
˜ 0 ∧ dx
˜ 3 + F12 dx
˜ 1 ∧ dx
˜ 2 + F13 dx
˜ 1 ∧ dx
˜ 3 + F23 dx
˜ 2 ∧ dx
˜ 3
(5.3.3)
⇒ F = −Ex dct˜ ∧ dx˜ + −Ey dct ˜ ∧ dy
˜ − Ez dct
˜ ∧ dz˜ + Bz dx˜ ∧ dy˜ − By dx˜ ∧ dz˜ + Bx dy
˜ ∧ dz˜
˜ ∧ dct
⇒ F = Ex dx ˜ + Ey dy
˜ ∧ dct
˜ + Ez dz
˜ ∧ dct
˜ + Bz dx
˜ ∧ dy
˜ + By dz
˜ ∧ dx
˜ + Bx dy
˜ ∧ dz
˜ (5.3.4)
˜ = ∂Ex dy
⇒ ∇F ˜ ∧ dx ˜ + ∂Ex dz
˜ ∧ dct ˜ ∧ dx ˜ + ∂Ey dx
˜ ∧ dct ˜ ∧ dy ˜ + ∂Ey dz
˜ ∧ dct ˜ ∧ dy
˜ ∧ dct
˜
∂y ∂z ∂x ∂z
∂Ez ˜ ˜ + ∂Ez dy
˜ ∧ dct ˜ ∧ dz ˜ + ∂Bz dct
˜ ∧ dct ˜ ∧ dx
˜ ∧ dy˜ + ∂Bz dz
˜ ∧ dx
˜ ∧ dy
˜
+ dx ∧ dz
∂x ∂y ∂ct ∂z
∂By ˜ ˜ + ∂By dy
˜ ∧ dx ˜ ∧ dz
˜ ∧ dx˜ + ∂Bx dct
˜ ∧ dy
˜ ∧ dz˜ + ∂Bx dx
˜ ∧ dy
˜ ∧ dz
˜
+ dct ∧ dz
∂ct ∂y ∂ct ∂x
˜ ∧ (dz
observe que dy ˜ ∧ dx)
˜ = dy
˜ ∧ (−dx
˜ ∧ dz)
˜ = −(dy ˜ ∧ dx)
˜ ∧ dz
˜ = (dx
˜ ∧ dy)
˜ ∧ dz,
˜ efetuando
processos similares na equação acima, pode-se escrever a mesma como:
˜ = ∂B x ∂B y ∂B z ˜ ∧ dy
˜ ∧ dz˜ + 1 ∂B x ∂E z ∂E y ˜ ∧ dy˜ ∧ dz
˜
∇F + + dx + − dct
∂x ∂y ∂z c ∂t ∂y ∂z
1 ∂By ∂Ex ∂Ez ˜ ˜ ∧ dx
˜ + 1 ∂B z ∂E y ∂E x ˜ ∧ dx
˜ ∧ dy.
˜
+ + − dct ∧ dz + − dct
c ∂t ∂z ∂x c ∂t ∂x ∂y
(5.3.6)
Duas das quatro equações de Maxwell nos diz que
~
1 ∂B
~ = 0,
div B e ~ = 0.
+ rot E (5.3.7)
c ∂t
˜ =0
∇F (5.3.8)
Figura 6.1.1: Um sistema discreto de pontos de igual massa conectados por molas, é tido
como uma aproximação para uma corda elástica continua.
1X
T = mη̇i2 (6.1.1)
2 i
1X
V = k(ηi+1 − ηi )2 (6.1.2)
2 i
1 X 2
mη̇i − k(ηi+1 − ηi )2
L=T −V = (6.1.3)
2 i
2 " n #: 0
2
1 ∂ ηi+1 − ηi 1 ∂ X ηj+1 − η j
− ka − ka
2 ∂ηi a 2 ∂ηi j=i+1
a
d m ∂ η̇j2
1d ∂L
=
a dt ∂ η̇i
dt 2a ∂ η̇i
m dη̇j
= δji
a dt
m
= η̈i
a
As equações de movimento de Lagrange para as coordenadas ηi são
m ηi+1 − ηi ηi − ηi−1
η̈i − ka + ka =0 (6.1.5)
a a2 a2
ϕ(x + a, t) − ϕ(x, t) ∂ϕ
lim =
a→0 a ∂x
n
!
1 X m 1 X ηi+1 − ηi
L = lim a lim η̇ 2 lim − lim a lim ka lim lim
2 a→0 i=1 i→x i a,m→0 a 2 a→0 i a→0 | {z }
a→0 i→x a
| {z }
µ Y
Finalmente, o somatório sob um número discretos de partículas se torna uma integral sob
x, o comprimento da corda, e a Lagrangiana (6.1.4) aparece como
Z " 2 2 #
1 ∂ϕ ∂ϕ
L= µ −Y dx (6.1.6)
2 ∂t ∂x
m 1
ηi+1 − ηi
1
ηi − ηi−1
lim lim η̈i − lim ka lim lim + lim ka lim lim =0
a,m→0 a i→x a→0 a→0 a i→x a a→0 a→0 a i→x a
∂ 2ϕ
1 ϕ(x + a) − ϕ(x) 1 ϕ(x) − ϕ(x − a)
⇒ µ 2 − Y lim lim + Y lim lim =0
∂t a→0 a a→0 a a→0 a a→0 a
∂ϕ ∂ϕ
2
−
∂ ϕ ∂a x ∂a x−a
⇒ µ 2 − Y lim =0
∂t a→0 a
∂ 2ϕ ∂ 2ϕ
⇒µ 2 −Y 2 =0 (6.1.7)
∂x ∂x
a equação de onda unidimensional familiar, que possui uma velocidade de propagação
dada por s
Y
v= (6.1.8)
µ
A Equação (6.1.8) é a bastante conhecida relação da velocidade de ondas longitudinais.
Este exemplo simples é suficiente para ilustrar as características salientes da transpo-
sição de um sistema discreto para um contínuo. O fato mais importante a entender é o
papel desempenhado pela coordenada de posição x. Ela não é uma coordenada generali-
zada; mas sim serve meramente como um índice contínuo substituindo o índice discreto i.
Assim como cada valor de i corresponde a uma coordenada generalizada diferente, ηi , do
sistema, então aqui para cada valor de x existe uma coordenada generalizada ϕ(x, t). Se
o sistema contínuo for tridimensional, ao invés de unidimensional como antes, as coorde-
nadas generalizadas serão distinguidas pelos três índices contínuos x, y, z, e escreveremos
ϕ(x, y, z, t). Note que as quantidades x, y, z, e t são completamente independentes uma
da outra, e aparecem somente como variáveis explicitas em ϕ. A Equação (6.1.6) também
mostra que a Lagrangiana aparece como uma integral sob o índice contínuo x; no caso
A Lagrangiana total, indo de acordo com a Eq.(6.1.10), é então a integral de L sob todo
o intervalo x que define o sistema, e o princípio de Hamilton no limite do sistema contínuo
aparece como Z Z 2
δI = δ L dx dt = 0 (6.2.2)
1
Como foi exigido que ϕ fosse uma função bem comportada, segue que o teorema de
Schwarz deve ser válido, e podemos permutar as derivadas parciais, deste modo
" #
Z t2 Z x2
∂I ∂L ∂ϕ ∂L ∂ ∂ϕ ∂L ∂ ∂ϕ
= dx dt + + ∂ϕ (6.2.5)
∂α t1 x1 ∂ϕ ∂α ∂ ∂ϕ
∂t
∂t ∂α ∂ ∂x ∂x ∂α
Façamos uma integração por partes em relação a variável t no segundo termo da integral,
produzindo assim
" ! #t2 !
Z x2 Z t2 Z x2 Z x2 Z t2
∂L ∂ ∂ϕ d ∂L ∂ϕ d ∂L ∂ϕ
dt dx = dx − dt dx
x1 t1 ∂ ∂ϕ ∂t
∂t |
∂α x1 dt ∂ ∂ϕ
∂t
∂α
t1
x1 t1 dt ∂ ∂ϕ
∂t
∂α
|{z} {z }
u dv
Devido a variação de ϕ, isto é, αζ, desaparecer nos extremos, o primeiro termo no lado
direito da equação se anula, produzindo
!
Z x2 Z t2 Z x2 Z t2
∂L ∂ ∂ϕ d ∂L ∂ϕ
dt dx = − dt dx (6.2.6)
x1 t1 ∂ ∂ϕ
∂t
∂t ∂α x1 t1 dt ∂ ∂ϕ
∂t
∂α
Devido a variação de ϕ, isto é, αζ, desaparecer nos extremos, o primeiro termo no lado
∂ϕ
isolemos ∂α
, após isso multipliquemos por dα e apliquemos o limite de α → 0
Z t2 Z x2 " ! !#
∂I
∂L d ∂L d ∂L ∂ϕ
dα = dx dt − − dα
∂α α=0
t1 x1 ∂ϕ dt ∂ ∂ϕ
∂t
dx ∂ ∂ϕ
∂x
∂α α=0
ou de forma similar,
" ! !#
t2 x2
Z Z
∂L d ∂L d ∂L ∂ϕ
dx dt − − =0 (6.2.9)
t1 x1 ∂ϕ dt ∂ ∂ϕ
∂t
dx ∂ ∂ϕ
∂x
∂α α=0
∂L ∂ϕ ∂L ∂ϕ ∂L
=µ , = −Y , =0
∂ϕ ∂t ∂ϕ ∂x ∂ϕ
∂ ∂
∂t ∂x
Logo, como desejado, a Eq.(6.2.10), se reduz apropriadamente para a equação do movi-
mento, (6.1.7).
A formulação Lagrangiana desenvolvida até aqui para sistemas contínuos unidimen-
sionais necessita obviamente ser estendida para os casos bi e tridimensional, como por
exemplo, um sólido elástico geral. Ademais, ao invés de uma quantidade de campo ϕ
poderá existir vários; como por exemplo, deslocamentos a partir da posição de equilíbrio
seriam descritos por um vetor espacial ϕ ~ com três componentes. Não é difícil realizar
os passos matemáticos para a situação mais geral por um paralelismo próximo ao caso
unidimensional de uma componente. Todavia, as fórmulas se tornam longas e incomodas
caso as escreva da mesma maneira, especialmente em virtude das derivadas. Um ganho
considerável na simplicidade da notação pode ser alcançado ao observar que o tempo t e
as coordenadas espaciais x, y, z efetuam o mesmo papel matemático no princípio de Ha-
milton. As quantidades de campo são funções tanto das coordenadas quanto do tempo,
nas quais são tratadas como variáveis independentes. Nenhuma variação das quantidades
de campo ocorrem nos limites de integração no princípio de Hamilton tanto sobre o tempo
quanto sobre o espaço.
É matematicamente conveniente pensar em termos do espaço quadridimensional com
coordenadas x0 = ct, x1 = x, x2 = y, x3 = z. Nenhum significado físico está implícito
para este espaço. A notação habitual será adotada, uma letra romana sobrescrita refere-
se apenas às três coordenadas do espaço físico, uma letra grega sobrescrita ou subscrita
refere-se a todas as quatro coordenadas. Além disso, utilizaremos a convenção da soma de
Einstein pelo resto do capítulo. As várias componentes das quantidades do campo serão
simbolizadas por um subscrito ρ, na qual pode abranger uma infinidade de formas. Às
vezes, ele representará um único índice com dois, três, quatro ou mais valores. Ou pode
representar vários índices. Assim, se a quantidade do campo for um tensor espacial de
segunda ordem, então ρ realmente se refere a dois índices subscritos. Por fim, a derivada
de uma quantidade de campo em relação a qualquer uma das quatro coordenadas xν será
denotada pelo subíndice ν separado de ρ por uma vírgula. Onde houver apenas uma
quantidade de campo, o índice não aparece. Exemplos são
∂ϕ ∂ϕ ∂ 2 ϕi
ϕρ,ν ≡ ; ϕ,j ≡ ; ϕi,µν = (6.2.11)
∂xν ∂xj ∂xµ ∂xν
em que (dxi ) = dx1 dx2 dx3 , todavia ela raramente ocorre explicitamente. O princípio de
Hamilton aparece como uma integral sob uma região o 4-espaço:
Z
δI = δ dV L = 0 (6.2.14)
A segunda integral some no limite quando α tende a zero, como pode ser visto de várias
maneiras. Podemos examiná-la termo por termo: realizando a integração para um xν
particular de cada termo da derivada, que então desaparece porque a derivada em relação
a α é zero nos extremos. Ou podemos transformar a integral pelo teorema da divergência
quadridimensional para uma integral sob a superfície limitada pela região de integração no
4-espaço. A integral de superfície novamente some já que a variação de ϕρ na vizinhança
das funções de campo correta é nula na superfície. A Eq.(6.2.16) no limite em que α tende
a zero portanto se reduz para
Z
∂I ∂L d ∂L ∂ϕρ
= dV − (6.2.17)
∂α α→0 ∂ϕρ dxν ∂ϕρ,ν ∂α α→0
Novamente, a natureza arbitrária da variação de cada ϕρ implica que a Eq.(6.2.17) só é
dL ∂L ∂L ∂L
µ
= ϕρ,µ + ϕρ,µν + µ (6.3.1)
dx ∂ϕρ ∂ϕρ,ν ∂x
∂L d ∂L
Devido as equações do movimento, Eq.(6.2.18), = ν , assim a Eq.(6.3.1)
∂ϕρ dx ∂ϕρ,ν
se torna
dL d ∂L ∂L ∂L
µ
= ν ϕρ,µ + ϕρ,µν + µ
dx dx ∂ϕρ,ν ∂ϕρ,ν ∂x
(6.3.2)
d ∂L ∂L
= ν ϕρ,µ + µ
dx ∂ϕρ,ν ∂x
Combinando as derivadas totais, isto pode ser escrito como
d ∂L ∂L
ν
ϕρ,µ − L δµν = − µ (6.3.3)
dx ∂ϕρ,ν ∂x
dT µν
= Tµ ν,ν = 0 (6.3.4)
dxν
∂L ∂Li
pi = =a (6.4.1)
∂ η̇i ∂ η̇i
pois,
∂L ∂ X ∂Li
=a Lk = a
∂ η̇i ∂ η̇i k ∂ η̇i
visto que como Lk é função de η̇k , teremos que somente a i-ésima componente Li irá
sobreviver a derivação. A Hamiltoniana para o sistema é portanto
X X ∂Li
H≡ pi η̈i − L = a η̇i − L
i i
∂ η̇i
ou,
X ∂Li
H= a η̇i − Li (6.4.2)
i
∂ η̇i
O momenta canônico individual pi , como dado pela Eq.(6.4.1), tende a zero no limite
contínuo, todavia podemos definir uma densidade de momentum, π, que permanece finita:
pi ∂L
lim ≡π= (6.4.4)
a→0 a ∂ ϕ̇
A Equação (6.4.3) está na forma de uma integral espacial sob uma densidade Hamiltoni-
ana, H , definida por
H = π ϕ̇ − L (6.4.5)
Embora a formulação Hamiltoniana possa ser introduzida de uma forma bastante di-
reta para campos clássicos, observe que este procedimento escolhe a variável de tempo
para um tratamento especial. É, portanto, divergente ao desenvolvimento que demos
para a formulação Lagrangiana, onde as variáveis independentes de tempo e espaço eram
tratadas simetricamente. Por esta razão, a abordagem Hamiltoniana, pelo menos como
onde foi assumido que a dependência funcional sobre ϕ̇ρ pode ser eliminada através da
inversão das equações de definição (6.4.6). Desta definição segue que
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ
ρ
= ϕ̇ρ + π λ ρ − (6.4.11)
∂π ∂π ∂ ϕ̇λ ∂π ρ
∂H ∂
= (π λ ϕ̇λ − L )
∂ϕρ ∂ϕρ
∂ ϕ̇λ ∂π λ ∂L
= πλ + ϕ̇λ −
∂ϕρ ∂ϕρ ∂ϕρ
logo,
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ ∂L ∂L
= πλ − − =− (6.4.12)
∂ϕρ ∂ϕρ ∂ ϕ̇λ ∂ϕρ ∂ϕρ ∂ϕρ
Utilizando as equações de Lagrange, isto pode ser escrito como
∂H ∂ ∂L ∂ ∂L ∂ ∂L
=− µ =− − i
∂ϕρ ∂x ∂ϕρ,µ ∂t ∂ ϕ̇ρ ∂x ∂ϕρ,i
ρ
(6.4.13)
∂π ∂ ∂L
= − i
∂t ∂x ∂ϕρ,i
Devido a aparência de L , continuamos a não possuir uma forma útil. Por uma derivação
exatamente paralela, todavia, encontramos que
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ ∂L ∂L
= πλ − − =− (6.4.14)
∂ϕρ,i ∂ϕρ,i ∂ ϕ̇λ ∂ϕρ,i ∂ϕρ,i ∂ϕρ,i
∂H ∂π ρ
Z Z Z
∂S 4 4 ∂ ∂ϕρ ∂H ∂ϕρ
⇒ = d x ϕρ,0 − ρ
+ dx π − d4 x
ρ
∂α ∂π ∂α ∂α ∂t ∂ϕρ ∂α
Z Z ρ (6.4.17)
∂H ∂ ∂ϕρ 4 ∂H ∂ ∂π
− dx4 − dx ρ
∂ϕρ,i ∂α ∂xi ∂π ,i ∂α ∂xi
lembrando que
∂π ρ ∂π ρ
∂ ∂ϕρ ∂ ∂ϕρ ∂ ∂
= , =
∂α ∂xµ ∂xµ ∂α ∂α ∂xµ ∂xµ ∂α
Podemos reescrever (6.4.17):
∂H ∂π ρ
Z Z Z Z
∂S 4 3 ∂ ∂ϕρ ρ 4 ∂H ∂ϕρ
⇒ = d x ϕρ,0 − + d x dt π − d x
∂α ∂π ρ ∂α ∂t ∂α ∂ϕρ ∂α
Z Z Z Z ρ
∂ ∂ϕρ ∂H ∂ ∂π ∂H
− dt dx3 i − dt dx3
∂x ∂α ∂ϕρ,i ∂α ∂x ∂π ρ,i
i
(6.4.18)
tendo em mente que
Z Z Z Z
∂ ∂ϕρ ∂ϕρ ∂ϕρ
dx 3
dt ρ
π = d 3
x π ρ,0 − d4 x π ρ,0
∂t ∂α ∂α ∂α
d d dAi
Ai f = (f Ai
) − f
dxi dxi dxi
∂H dϕρ ∂ϕρ
fazendo f = ∂ϕρ /∂α, Ai = e lembrando que i
= , pois ϕρ = ϕρ (xi , t),
∂ϕρ,i dx ∂xi
obtém-se
∂H ∂ ∂ϕρ d ∂ϕρ ∂H d ∂H ∂ϕρ
i
= i − i
∂ϕρ,i ∂x ∂α dx ∂α ∂ϕρ,i dx ∂ϕρ,i ∂α
o que implica
Z Z Z I Z
∂ 3 ∂ϕρ ∂H ∂H ∂ϕρ d
4 ∂H ∂ϕρ
− dt dx =− dt dai + dx
∂xi ∂α ∂ϕρ,i ∂ϕρ,i ∂α dxi ∂ϕρ,i ∂α
∂π ρ ∂H ∂π ρ ∂π ρ
Z Z Z I Z
∂ 3 ∂H d
4 ∂H
− dt dx =− dt dai ρ,i + dx
∂xi ∂α ∂π ρ,i ∂π ∂α dxi ∂π ρ,i ∂α
∂π ρ
Z Z Z I Z
∂3 ∂H ∂H ρ 4 d ∂H
− dt dx dα = − dt dai ρ,i δπ + dx δπ ρ
∂xi ∂π ρ,i ∂α ∂π dxi ∂π ρ,i
Z
4 d ∂H
= dx δπ ρ
dxi ∂π ρ,i
(6.4.21)
ρ
pois as variações δπ se anulam na superfície que limita a região espacial de V . Daí
Z
4 ρ ∂H d ∂H ∂H d ∂H ρ
δS = d x −π ,0 − + i δϕρ + ϕρ,0 − + i ρ δπ = 0
∂ϕρ dx ∂ϕρ,i ∂π ρ dx ∂π ,i
(6.4.22)
ρ
Igualando a zero os coeficientes de δϕρ e δπ obtemos
∂H d ∂H
ϕρ,0 = ρ
− i ρ (6.4.23)
∂π dx ∂π ,i
∂H d ∂H
π ρ,0 = − + i (6.4.24)
∂ϕρ dx ∂ϕρ,i
que são as equações de campo na forma Hamiltoniana. As Eqs.(6.4.23) e (6.4.24) podem
ser postas em uma notação mais próxima a das equações de Hamilton para um sistema
discreto através da introdução da noção de derivada de um funcional, na qual é definida
como
δ ∂ d ∂
= − i (6.4.25)
δψ ∂ψ dx ∂ψ,i
assim as Eqs.(6.4.23) e (6.4.24) se tornam
δH δH
ϕρ,0 = π ρ,0 = − (6.4.26)
δπ ρ δϕρ
tempo e espaço.
Existe uma forma de se lidar os campos clássicos na qual fornece quase toda a formu-
lação Hamiltoniana da mecânica discreta. A ideia principal por trás desse tratamento é
substituir a variável ou índice do espaço contínuo por um índice discreto não enumerável.
Pode-se ver como fazer isto nos referindo novamente as oscilações longitudinais de uma
corda elástica. Vamos supor que a corda possui comprimento finito L = x2 − x1 . A exi-
gência de que ϕ deve desaparecer nas extremidades é uma condição de contorno que pode
ser efetuada fisicamente colocando-se a corda entre duas paredes perfeitamente rígidas.
Daí a amplitude da oscilação pode ser representada por uma série de Fourier:
∞
X 2πn(x − x1 )
ϕ(x) = qn sin (6.4.28)
n=0
2L
Aqui ~k é um vetor de onda que só pode tomar magnitudes e direções discretas, de modo
que apenas números inteiros (ou às vezes meio-inteiros) de comprimentos de onda se
encaixam em uma determinada dimensão linear. Dizemos que ~k possui espectro discreto.
O índice escalar k representa alguma ordem do conjunto de índices inteiros usados para
denumerar os valores discretos de ~k, e V o volume do sistema, que aparecem em um fator
de normalização. Uma vez que ϕ é real, devemos ter q ∗ = q−k
A ortogonalidade da exponencial sob o volume pode afirmada pela relação
Z
1 ~ ~0
ei(k−k )·~r dV = δkk0 (6.4.30)
V
1 X ~
π(~r, t) = 1/2
pk (t)e−ik·~r (6.4.32)
V k
∂φ ∂φ
onde µ0 é uma constante, φ,λ = λ
, e φ,λ = g λν ν . Observe, que como exigido, L
∂x ∂x
é um escalar global. Expresso em termos das variáveis do espaço e tempo, L é escrito
como (em que φ,0 = ∂φ/∂t)
L = φ,0 φ∗,0 − c2 ∇φ
~ · ∇φ
~ ∗ − µ2 c2 φφ∗
0 (6.6.2)
∂L ∂L
= c2 φ,ν , = −µ20 c2 φ (6.6.3)
∂φ∗,ν ∂φ∗
As equações de campo básicas satisfeitas tanto por φ quanto por φ∗ são conhecidas como a
equação de Klein-Gordon complexa e, como dada aqui, representada o análogo relativístico
da equação de Schrodinger para uma partícula carregada de spin zero e energia de massa
de repouso µ0 .
O tensor energia momento definido pela Eq.(colocar equação aqui) possui as seguintes
componentes
Tµν = c2 φ,µ φ∗,ν + c2 φ∗,µ φν + c2 (φ,λ φ∗,λ + µ20 φφ∗ )gµν (6.6.9)
∂L ∂L
π= = φ∗,0 π∗ = = φ,0 (6.6.10)
∂φ,0 ∂φ∗,0
Segue que a densidade Hamiltoniana (na qual possui a mesma magnitude que T00 ) toma
a forma
H ≡ πφ,0 + π ∗ φ∗,0 − L
(6.6.11)
~ · ∇φ
= ππ ∗ + c2 ∇φ ~ ∗ + µ0 c2 φφ∗
Por enquanto, tudo o que faremos aqui é ilustrar a transformação para a representação do
momento. As expansões (6.4.29) e (6.4.32) podem ser introduzidas na densidade Hamil-
toniana, já que a equação de Klein-Gordon tem por solução uma equação do tipo onda,
assumindo que as condições de fronteira se estendem ao infinito, pode-se usar o método
das transformadas de Fourier. Visto que o campo não é real, não temos que qk∗ = q−k . Na
verdade, qk e qk∗ agora representam dois conjuntos independentes discretos de coordenadas,
um representando φ e o outro φ∗ . O Hamiltoniano total é a soma das integrais de volume
sob os três termos na Eq.(6.6.11). Como um exemplo padrão, calculemos µ20 φφ∗ dV,
R
1 X ~
φ(~r, t) = qk (t)eik·~r
V 1/2 k
e analogamente,
1 X ~0
φ∗ (~r, t) = 1/2
qk∗0 (t)e−ik ·~r
V k0
daí
µ20 X
Z Z
∗ ~ ~0
µ20 φφ dV = qk qk∗0 ei(k−k )·~r dV (6.6.12)
V k,k0
pela Eq.(6.4.30) Z
1 ~ ~0
ei(k−k )·~r dV = δkk0
V
o que reduz a Eq.(6.6.12) para
Z Z
∗
X 1 i(~k−~k0 )·~
µ20 φφ dV = µ20 qk qk∗0 e r
dV
k,k0
V
| {z } (6.6.13)
δkk0
= µ20 qk qk∗
O único termo que exige outra nota especial é aquele que envolve a divergência, para isto
note que " #
~ =∇ ~ 1 X ~
ik·~
r i~k X ~
∇φ 1/2
q k (t)e = 1/2
qk (t)eik·~r
V k
V k
e " #
~∗ ~ 1 X ~0 −i~k 0 X ∗ ~0
∇φ =∇ qk∗0 (t)e−ik ·~r = qk0 (t)e−ik ·~r
V 1/2 k
V 1/2
k
logo,
Z Z
~ dV = (i~k) · (−ik )
~ · ∇φ ∗ ~0
X 1 i(~k−~k0 )·~
∇φ qk (t)qk∗0 e r
dV
k,k0
V
| {z } (6.6.14)
δkk0
= k 2 qk (t)qk∗ (t)
1 X ~
π(~r, t) = 1/2
pk (t)e−ik·~r
V k
similarmente,
1 X ~0
π ∗ (~r, t) = 1/2
p∗k0 (t)eik ·~r
V k0
daí, Z
∗
X 1 ~ ~0
ππ = pk (t)p∗k0 e−i(k−k )·~r
V
k,k0 (6.6.15)
= pk p∗k
integrando a Eq.(6.6.11)
Z Z Z Z
H dV = ππ dV +c∗ 2 ~ · ∇φ
∇φ ~ ∗ dV +µ2 c2
0 φφ∗ dV
H dV:
R
substituindo as Eqs.(6.6.13), (6.6.14) e (6.6.15), e tendo em mente que H =
(O fator 1/2 é introduzido aqui por pura conveniência; e claramente não afeta a forma
das equações do movimento.) A equação de campo associada é então
∂ 2φ 1 ∂ 2φ
2
− 2 2 = µ20 φ (6.6.19)
∂x c ∂t
∂ 2φ 1 ∂ 2φ
− = µ20 sin φ (6.6.21)
∂x2 c2 ∂t2
onde k e ωk são relacionados pela relação de dispersão, Eq.(6.6.17). Para o campo que
obedece a equação de seno-Gordon, é muito mais complicado de se aplicar a representação
dos momentum, devido a presença do termo cos φ em H . Mas ainda podemos resolver
a equação seno-Gordon por meio de algo semelhante a uma onda viajante. Uma solução
para φ na Eq.(6.6.21) na qual possui a forma de uma perturbação viajando com uma
velocidade v, todavia mantendo sua forma, deve ser uma função somente de τ = t − x/v.
Neste caso, a Eq.(6.6.21) se reduz para
d2 φ
− A sin φ = 0 (6.6.26)
dτ 2
em que
µ20 c2 v 2
A= (6.6.27)
c2 − v 2
já que
1 d2 φ
∂ ∂φ ∂τ d ∂τ dφ
= =
∂x ∂x ∂x dτ ∂x dτ v 2 dτ 2
e analogamente,
1 d2 φ
1 ∂ ∂φ 1 ∂τ d ∂τ dφ
= 2 =
c2 ∂t ∂t c ∂t dτ ∂t dτ c2 dτ 2
consequentemente,
∂ 2φ 1 ∂ 2φ 1 d2 φ
1
− = µ20 sin φ ⇒ − = µ20 sin φ
∂x2 c2 ∂t2 v 2 c2 dτ 2
c2 − v 2 d 2 φ
⇒ 2 2 2
= µ20 sin φ
c v dτ
d2 φ µ 2 c2 v 2
⇒ 2 = 20 2 sin φ
dτ c −v
∂φ ∂φ ∂ 3φ
+ αφ +ν 3 =0 (6.6.28)
∂t ∂x ∂x
onde α e ν são constantes. Essas ondas solitárias que preservam sua forma mesmo por
meio de interações foram chamadas de ’solitons’ e encontraram muitas aplicações em
toda a física, da física de partículas elementares até a física do estado sólido. A equação
pendular de seno-Gordon , por exemplo, foi utilizada para descrever familias de partículas
elementares, e também aparece em conexão com a teoria da junção Josephson.
C. O Campo Eletromagnético18
Devemos representar as equações de campo e o formalismo para o campo eletromag-
nético em termos do formalismo Lagrangiano. Se as componentes Aµ do potencial eletro-
magnético são tratadas como quantidades de campo, então uma densidade Lagrangiana
adequada para o campo eletromagnético é19
Fλρ F λρ 1 λ
L =− − j Aλ (6.6.29)
4 c
com
Fλρ = ∂λ Aρ − ∂ρ Aλ (6.6.30)
definamos
Aµ,ν ≡ ∂µ Aν (6.6.31)
assim,
∂F λρ
∂L 1 ∂Fλρ λρ
=− F + Fλρ
∂Aµ,ν 4 ∂Aµ,ν ∂Aµ,ν
1 ∂Fλρ λρ κξ ∂ λα ρβ
=− F + ηλκ ηρξ F η η Fαβ
4 ∂Aµ,ν ∂Aµ,ν
1 ∂Fλρ λρ αλ ρβ κξ ∂Fαβ
=− F + η ηλκ ηξρ η F
4 ∂Aµ,ν ∂Aµ,ν
1 ∂Fλρ λρ ∂Fαβ
=− F + δ ακ δ βξ F κξ
4 ∂Aµ,ν ∂Aµ,ν
1 ∂Fλρ λρ ∂Fαβ
=− F + F αβ
4 ∂Aµ,ν ∂Aµ,ν
1 ∂Fλρ λρ λρ ∂Fλρ
=− F +F
4 ∂Aµ,ν ∂Aµ,ν
Concluímos então que
∂L 1 ∂L F λρ ∂Fλρ
= − j µ; =− (6.6.32)
∂Aµ c ∂Aµ,ν 2 ∂Aµ,ν
18
Parte da dificuldade de se lidar com o campo eletromagnético decorre do fato de que as componentes
Aµ não são inteiramente independentes; para serem únicas, elas devem ser conectadas por meio de alguma
condição de calibre, tal como
µ
·A ~ = ∂A = ∇ ~ ·A~ + µ0 0 ∂φ = 0
∂xµ ∂t
Contudo, será suficiente para atingir os nossos objetivos se tratarmos as condições de calibre como vínculos
’fracos’.
19
A densidade Lagrangiana da Eq.(6.6.29) é adequada no sistema de unidades de Heaviside-Lorentz,
muito usado na teoria quântica de campos. No sistema gaussiano, o fator 1/4 deve ser substituído por
1/16π.
∂Fλρ
= δ µλ δ νρ − δ µρ δ νλ (6.6.33)
∂Aµ,ν
∂Aλ,ρ ∂Aρ,λ
= δ µλ δ νρ , = δ µρ δ νλ
∂Aµ,ν ∂Aµ,ν
∂L F λρ µ ν
=− (δ λ δ ρ − δ µρ δ νλ )
∂Aµ,ν 2
1 (6.6.34)
= − (F µν − F νµ )
2
= −F µν
dF µν 1
ν
− jµ = 0 (6.6.35)
dx c
onde ~s(t) é uma posição do espaço, digamos, de uma partícula em um tempo t (contanto
que ~s esteja dentro do volume de integração). Portanto, a carga espacial e a densidade
e
~j = eδ(~r − ~s)~u(~r) (6.6.38)
7 O Princípio da Equivalência
O princípio da Equivalência da gravitação e inércia nos diz como um sistema físico
arbitrário se relaciona com um campo gravitacional externo. Devemos primeiramente ver
o que este princípio nos diz, e então no final deste capítulo devemos olhar algumas de suas
consequências. Entretanto, a técnica matemática apropriada para a aplicação do princípio
da Equivalência é a analise tensorial, e somente após completarmos nossa introdução para
a análise tensorial mais adiante é que seremos capazes de fazer uso de todo o conteúdo
deste princípio.
d2~xN X
mN = mN ~
g + F~ (~xN − ~xM ) (7.1.1)
dt2 M
1
x~0 = ~x − ~g t2 , t0 = t (7.1.2)
2
Então ~g será cancelado pela ’força’ de inercia, tomando a derivada temporal em (7.1.2)
dx~0 d~x
0
= − ~g t
dt dt
d2 x~0 d2~x
m 02 = m 2 − m~g
dt dt
agora substituindo (7.1.1) no primeiro termo do lado direito da equação encontramos que
a equação do movimento se tornará
d2 x~0 N X
mN = F~ (x~0 N − x~0 M ) (7.1.3)
dt02 M
Há uma certa imprecisão sobre o que queremos dizer por ’a mesma forma vista em
um sistema de coordenadas cartesianas não acelerado’, para evitar qualquer possível am-
biguidade podemos especificar que por isso queremos dizer a forma dada às leis da na-
tureza pela Relatividade Especial. Existe também uma dúvida sobre o quão pequeno
é ’suficientemente pequeno.’ Grosseiramente falando, queremos dizer que a região deve
ser pequena o suficiente para que o campo gravitacional seja sensivelmente constante ao
longo da mesma, entretanto só seremos mais precisos quando soubermos como representar
o campo gravitacional matematicamente.
O leitor mais atento pode ter percebido uma certa semelhança entre o princípio da
Equivalência e o axioma no qual Gauss tomou como a base da geometria não-Euclideana.
O princípio da Equivalência nos diz que em todo ponto do espaço-tempo podemos erguer
dτ = −ηαβ dξ α dξ β (7.2.2)
Agora suponha que utilizemos outro sistema de coordenadas xµ , no qual pode ser um
sistema de coordenadas Cartesiano em repouso no laboratório, mas também pode ser
curvilíneo, acelerado, rotacionado, ou o que quer que desejamos. O sistema de coordenadas
em queda livre ξ α são funções de xµ , lembremos que pela regra da cadeia
d α µ ∂ξ α dxµ
ξ [x (τ )] = (7.2.3)
dτ ∂xµ dτ
e a Eq.(7.2.1) se torna
d d α µ
0= ξ [x (τ )]
dτ dτ
d ∂ξ α dxµ
=
dτ ∂xµ dτ
α µ
d ∂ξ dx ∂ξ α d2 xµ
= + µ
dτ ∂xµ dτ ∂x dτ 2
α µ
∂ξ α d2 xµ
∂ dξ dx
= +
∂xµ dτ dτ ∂xµ dτ 2
α ν µ
∂ξ α d2 xµ
∂ ∂ξ dx dx
= +
∂xµ ∂xν dτ dτ ∂xµ dτ 2
∂ 2 ξ α dxµ dxν ∂ξ α ∂
ν µ
∂ξ α d2 xµ
dx dx
= + +
∂xµ ∂xν dτ dτ ∂xν ∂xµ dτ dτ ∂xµ dτ 2
∂ 2 ξ α dxµ dxν ∂ξ α d2 xµ
0= +
∂xµ ∂xν dτ dτ ∂xµ dτ 2
∂xλ
multiplicando ambos os lados por , e utilizando a familiar regra do produto:
∂ξ α
∂ξ α ∂xλ
= δ λµ
∂xµ ∂ξ α
d2 xλ µ
λ dx dx
ν
0= + Γµν (7.2.4)
dτ 2 dτ dτ
∂xλ ∂ 2 ξ α
Γλµν ≡ (7.2.5)
∂ξ α ∂xµ ∂xν
∂ξ α ∂ξ β
gµν ≡ ηαβ (7.2.8)
∂xµ ∂xν
d2 x µ ν
µ dx dx
µ
+ Γ νλ =0 (7.2.9)
dσ 2 dσ dσ
dxµ dxν
0 = −gµν (7.2.10)
dσ dσ
com Γµνλ e gµν dados por (7.2.5) e (7.2.8).
A propósito, tanto em (7.2.4) quanto em (7.2.9) não precisamos conhecer quem são τ e
σ para encontrar o movimento da nossa partícula, já que estas equações quando resolvidas
resultam em xµ (τ ) ou xµ (σ), e τ ou σ podem ser eliminados para darem ~x(t). O objetivo
de (7.2.7) é nos dizer como calcular o tempo próprio, assim como o objetivo de (7.2.10)
é impor as condições iniciais apropriadas para uma partícula sem massa. Em particular,
a Eq.(7.2.10) nos conta qual é o tempo dt para um fóton viajar uma distância d~x, sendo
determinado pela equação quadrática:21
lembrando que i e j são somatórios de 1 até 3. A solução é dada pela conhecida fórmula
de Bhaskara:
21
Observe que o tensor métrico é simétrico, já que
∂ξ α ∂ξ β ∂ξ β ∂ξ α ∂ξ α ∂ξ β
gµν ≡ η αβ = η βα = ηαβ = gνµ
∂xµ ∂xν ∂xµ ∂xν ∂xν ∂xµ
onde usamos o fato dos índices serem mudos na passagem do segundo para o terceiro termo, e do fato do
tensor métrico de Minkowski ser simétrico, isto é, ηαβ = ηβα .
q
−2gi0 dxi ± (2gi0 dxi )(2gj0 dxj ) − 4g00 gij dxi dxj
dt =
2g00
resolvendo,
1
q
i i j
dt = −gi0 dx ± (gi0 gj0 − g00 gij ) dx dx (7.2.11)
g00
e o tempo requerido para a luz viajar ao longo de qualquer caminho pode ser calculado
ao integrar dt ao longo dessa curva.
Os valores do tensor métrico gµν e da conexão afim Γλµν em um ponto X de um
sistema de coordenadas arbitrárias xµ nos fornece informação suficiente para determinar
as coordenadas localmente inerciais ξ α (x) na vizinhança de X. Primeiro, multipliquemos
a Eq.(7.2.5) por ∂ξ β /∂xλ e utilizemos da regra do produto
∂ξ β ∂xλ
= δ βα
∂xλ ∂ξ α
assim,
∂xλ ∂ 2 ξ α λ ∂ξ β ∂xλ ∂ 2 ξ α ∂ξ β λ
= Γµν ⇒ = Γ
∂ξ α ∂xµ ∂xν ∂xλ ∂ξ α ∂xµ ∂xν ∂xλ µν
| {z }
δ βα
∂ 2ξα λ ∂ξ
α
= Γµν (7.2.12)
∂xµ ∂xν ∂xλ
1 ∂ 2ξα
α α ∂ξ α µ µ
ξ (x) = ξ (X) + (x − X ) + (xµ − X µ )(xν − X ν ) + · · ·
∂xµ xµ =X µ 2! |∂xµ{z∂xν}
∂ξ α
Γλ
µν
∂xλ
α
α 1 ∂ξ λ µ
∂ξ
= ξ α (X) + (x µ
− X µ
) + Γ (x − X µ )(xν − X ν ) + · · ·
∂xµ xµ =X µ
2 ∂xλ µν
ou,
1
ξ α (x) = aα + bαµ (xµ − X µ ) + bαλ Γλµν (xµ − X µ )(xν − X ν ) + · · · (7.2.13)
2
onde,
∂ξ α (X)
aα = ξ α (X), bαλ = (7.2.14)
∂X λ
Graças a Eq.(7.2.8) também vemos que
∂ξ α ∂ξ β
gµν = ηαβ
∂xµ ∂xν
∂ξ α ∂ξ β
∂gµν ∂
λ
= ηαβ
∂x ∂xλ ∂xµ ∂xν
aplicando a regra do produto para derivadas e lembrando do fato de que ηαβ é constante,
obtemos que
∂gµν ∂ 2 ξ α ∂ξ β ∂ξ α ∂ 2 ξ β
= ηαβ + ηαβ
∂xλ ∂xλ ∂xµ ∂xν ∂xµ ∂xλ ∂xν
∂ 2ξα ρ ∂ξ
α
e relembremos da Eq.(7.2.12), = Γµν , logo
∂xµ ∂xν ∂xρ
α β α β
∂gµν ρ ∂ξ ∂ξ ρ ∂ξ ∂ξ
= Γλµ ρ ν ηαβ + Γλν µ ρ ηαβ
∂xλ ∂x ∂x ∂x ∂x
analogamente,
∂gλν
= Γκµλ gκν + Γκµν gκλ (7.3.2)
∂xµ
e
∂gµλ
= Γκνµ gκλ + Γκνλ gκµ (7.3.3)
∂xν
Antes de resolvermos para Γ, é necessário apontar uma sutileza na derivação da
Eq.(7.3.1) que foi escondida na nossa notação bastante compacta. Quando erguemos
um sistema de coordenadas localmente inercia, ξ α (x), o fazemos em um ponto específico
X, e as coordenadas que são localmente inerciais em X devem ser demarcadas, como
α
ξX (x). Portanto, as Eqs.(7.2.8) e (7.2.12) devem ser apropriadamente escritas como
!
α β
∂ξX (x) ∂ξX (x)
gµν (X) = ηαβ (7.3.4)
∂xµ ∂xν
x=X
∂ 2 ξX
α α
(x) ∂ξX (x)
= Γλµν (X) (7.3.5)
∂x ∂xν
µ
x=X ∂xλ x=X
∂ 2 ξX
α
(x)
(7.3.6)
∂X ∂xµ
λ
x=X
e não parecem ter nada a ver com a métrica ou a conexão afim. Para lidar com esse segundo
tipo de termo, é necessário aguçar um pouco nossa interpretação do que se entende por
’localmente inercial’ no Princípio de Equivalência. Veremos mais adiante que as primeiras
derivadas do tensor métrico devem ser medidas comparando as taxas de relógios idênticos
separados por uma distância espaço-temporal infinitesimal. Consequentemente, devemos
interpretar o Princípio da Equivalência como significando que o sistema de coordenadas
α
localmente inercial ξX que construímos em um dado ponto X pode ser escolhido tal que
as primeiras derivadas do tensor métrico somem em X. Em um sistema de coordenadas
α
ξX , o tensor métrico em um ponto X̄ é dado pela Eq.(7.3.4) como
β
!
α
X ∂ξX̄ (x) ∂ξX̄ (x)
gγδ (X̄) = γ δ
ηαβ
∂ξX (x) ∂ξX (x)
x=X̄
e nossa interpretação do Princípio da Equivalência nos diz que esta quantidade é esta-
cionária em X̄ quando X̄ = X. A fim de se utilizar esta informação, introduzimos um
sistema arbitrário de coordenadas xµ do ’laboratório’, e escrevemos
β
!
α
∂ξX̄ (x) ∂ξX̄ (x)
gµν (X̄) ≡ ηαβ
∂xµ ∂xν
x=X̄
β
!
α γ δ
∂ξX̄ (x) ∂ξX (x) ∂ξX̄ (x) ∂ξX (x)
= γ δ
ηαβ
∂ξX (x) ∂xµ ∂ξX (x) ∂xν
x=X̄
β
! β
!
α α
∂ξX̄ (x) ∂ξX̄ (x) ∂ξX̄ (x) ∂ξX̄ (x)
= γ δ
ηαβ γ δ
∂ξX (x) ∂ξX (x) ∂ξX (x) ∂ξX (x)
β
!x=X̄ x=X̄
α
X ∂ξX̄ (x) ∂ξX̄ (x)
gγδ (X̄) γ δ
∂ξX (x) ∂ξX (x)
x=X̄
λ
Diferenciando em relação a X̄ e tomando X̄ = X obtemos então (devido ao fato de que
X
gγδ (X̄) é estacionário)
γ
∂gµν (X) X ∂ δ
∂ξX (x) ∂ξX (x)
= gγδ (X)
∂X λ ∂xλ ∂xµ ∂xν x=X
2 γ δ γ 2 δ
∂ ξX (x) ∂ξX (x) ∂ξX (x) ∂ ξX (x)
= ηγδ +
∂xλ ∂xµ ∂xν ∂xµ ∂xλ ∂xν x=X
∂xλ ∂ 2 ξ α ∂xλ ∂ 2 ξ α
Γλµν ≡ = = Γλνµ
∂ξ α ∂xµ ∂xν ∂ξ α ∂xν ∂xµ
Desta forma,
∂gµν ∂gλν ∂gµλ
λ
+ µ
− = 2Γκλµ gκν (7.3.7)
∂x ∂x ∂xν
Definimos a matriz g νσ como sendo a inversa de gνσ , ou seja,
g νσ gκν = δ σκ (7.3.8)
1 ∂gµν ∂gλν ∂gµλ
⇒ Γσλµ = g νσ + − (7.3.9)
2 ∂x λ ∂x µ ∂xν
O inverso do tensor métrico é dado por
∂xν ∂xσ
g νσ ≡ g σν ≡ η αβ (7.3.10)
∂ξ α ∂ξ β
∂xν ∂ξ γ
α ν
= δ γα
∂ξ ∂x
encontra-se
como os índices σ e κ são mudos, segue que podemos permuta-los no primeiro e terceiro
termo do lado direito da igualdade acima:
utilizando-se do fato de que tanto o tensor métrico quanto a conexão afim são simétricos,
obtemos finalmente que
d dxµ dxν
gµν =0
dτ dτ dτ
isto é,
dxµ dxν
= −Cgµν (7.3.12)
dτ dτ
onde C é uma constante de movimento. Portanto, uma vez que escolhamos as condições
iniciais de tal forma que dτ 2 = −gµν dxµ dxν , temos que C = 1, e (7.3.12) irá afirmar
que dτ 2 = −gµν dxµ dxν continua válida ao longo do caminho percorrido pela partícula.
Similarmente, para uma partícula sem massa a condição inicial é dada por C = 0 (com
τ sendo substituído por um outro parâmetro σ) e as equações do movimento irão manter
Agora varrendo o caminho de xµ (p) até xµ (p) + δxµ (p), mantendo fixos os extremos, isto
é, colocando δxµ = 0 em pA e pB . A variação em TBA é22 dada por (no nosso caso
1/2
dxµ dxν dxµ
f = −gµν , y = xµ ⇒ y 0 = , x = p.)
dp dp dp
1/2 1/2
B
dxµ dxν B
dxµ dxν dδxλ
Z Z
λ ∂ ∂
δTBA = δx −gµν dp − λ −gµν dp
A ∂xλ dp dp A dx dp dp dp
∂
dp
(onde usamos o fato de que µ e ν são índices mudos). O primeiro fator no integrando é
dτ dxµ dxν
somente dp/dτ , já que = −gµν , então a integral é dada por
dp dp dp
B
1 ∂gµν λ dxµ dp dxν dδxµ dp dxν
Z
δTBA =− δx + gµν dp
A 2 ∂xλ dp dτ dp dp dτ dp
Z B
1 ∂gµν λ dxµ dp dxν dτ dδxµ dp dxν dτ
=− δx + gµν dp
A 2 ∂xλ dp dτ dτ dp dp dτ dτ dp
22
Lembremos da notação delta:
Z B Z B
0 ∂f ∂f 0
δS = δf (y, y ; x) dx = δy + 0 δy dx
A A ∂y ∂y
∂y
onde δy = dα, assim
∂α
Z B Z B
0 dy d ∂f ∂f dδy ∂f d ∂f
δy = δ = (δy) → δS = δy + 0 dx = − δy dx
dx dx A ∂y ∂y dx A ∂y dx ∂y 0
B
1 ∂gµν λ dxµ dxν dδxµ dxν
Z
⇒ δTBA = − δx + g µν dτ
A 2 ∂xλ dτ dτ dτ dτ
dp
note que dp = dτ . Podemos agora integrar por partes, negligenciando a contribui-
dτ
ção dos extremos dado que δxµ desaparece em A e B. Isto nos dá
B B
dxν dδxµ
1 ∂gµν λ dxµ dxν
Z Z
δTBA = − δx dτ − gµν dτ
A 2 ∂xλ dτ dτ A | {zdτ} | dτ{z }
u dv
Z B µ ν
Z B ν
1 ∂gµν λ dx dx d dx (7.3.13)
=− δx dτ + gµν δxµ dτ
A 2 ∂xλ dτ dτ A dτ dτ
ZB
µ ν
1 ∂gµν dx dx ∂gλν dx dxν d 2 xνσ
=− − − g λν δxλ dτ
A 2 ∂xλ dτ dτ ∂xσ dτ dτ dτ 2
Lembremos da Eq.(7.3.7)
dxµ dxν
a multiplicando por :
dτ dτ
1 ∂gµλ dxµ dxν 1 ∂gνλ dxµ dxν dxµ dxν ∂gλν dxσ dxν
κ
B
Z
ν dτ dτ
+ µ dτ dτ
− gκλ Γνµ − σ dτ dτ
δTBA =− λ
δx dτ 2 ∂x 2 ∂x dτ dτ ∂x
d 2 xν
A −gλν 2
dτ
podemos utilizar do fato de que estamos trabalhando com índices mudos e escrever:
1 ∂gνλ dxσ dxν 1 ∂gνλ dxσ dxν dxµ dxσ ∂gλν dxσ dxν
ν
B
Z
σ dτ dτ
+ σ dτ dτ
− gλν Γσµ − σ dτ dτ
δTBA =− λ
δx dτ 2 ∂x 2 ∂x dτ dτ ∂x
d 2 xν
A −gλν 2
dτ
tendo em mente que o tensor métrico é simétrico gνλ = gλν vemos que a soma do primeiro
termo com o segundo termo do integrando se anula com o quarto termo, similarmente
Γνσµ = Γνµσ , encontramos que
Z B
µ σ
λ ν dx dx d 2 xν
δTBA = − δx dτ −gνλ Γσµ − gλν 2
A dτ dτ dτ
ou seja, Z B
dxµ dxσ d2 xν
δTBA = Γνσµ + gλν δxλ dτ (7.3.14)
A dτ dτ dτ 2
Consequentemente o caminho no espaço-tempo efetuado pela partícula que obedece as
equações (7.2.4) para uma queda livre será tal que o tempo próprio decorrido é um extremo
(e usualmente um mínimo), isto é,
δTBA = 0
1 ∂g00
Γµ00 = − g µν ν
2 ∂x
Finalmente, visto que o campo é fraco, podemos adotar um sistema de coordenadas
Cartesiano próximo no qual
1 ∂
Γα00 = − (η αβ + hαβ ) ν (η00 + h00 )
2 ∂x
1 αβ ∂ 1 αβ ∂ 1 0
=− η η + − η h00 − h > ∂ (η + h )
00 αβ 00 00
2 ∂xν |{z} 2 ∂xν 2 ∂xν
−1
1 ∂h00
= − η αβ β
2 ∂x
ou, 2
d2~x
1 dt ~ 00
2
= ∇h
dτ 2 ∂τ
para µ = 0, tendo em mente que η 0ν = δ 0ν , encontramos
2
d2 t 1 0ν ∂h00 dt
= δ
dτ 2 2 ∂xν dτ
2
1 ∂h00 dt
=
2 ∂t dτ
d2 t
=0
dτ 2
A solução para d2 t/dτ 2 = 0 é que dt/dτ é igual a uma constante, então dividindo a
equação d2 xi /dτ 2 por (dt/dτ )2 , encontramos
d2~x 1~
2
= ∇h00 (7.4.2)
dt 2
d2~x ~
= −∇φ (7.4.3)
dt2
GM
φ=− (7.4.4)
r
Além disso, o sistema de coordenadas deve ser tornar Minkowskiano a grandes distância,
então h00 some no infinito, e se definirmos φ para desaparecer no infinito [como em (7.4.4)],
achamos que o valor da constante é nulo, daí h00 = −2φ, e retornando para a métrica
(7.4.1)
g00 = −(1 + 2φ) (7.4.5)
Em particular, se o relógio estiver em repouso, então dxi /dt = 0 e dx0 /dt = dt/dt = 1, e
isto se torna
dt
= (−g00 )−1/2 (7.5.2)
∆t
Não podemos observar os fatores de dilatação do tempo que aparecem nas Eqs.(7.5.1)
e (7.5.2) meramente medindo o intervalo de tempo dt entre os tiques e comparando com
o valor ∆t especificado pelo fabricante, porque os campos gravitacionais afetam nossos
padrões de tempo exatamente da mesma forma que afeta o relógio em estudo. Ou seja, se
nosso relógio padrão diz que um determinado processo físico leva 1 segundo em repouso
na ausência de gravitação, então ele também nos dirá que o mesmo leva 1 segundo na
presença de gravitação, já que tanto o relógio padrão quanto o processo são afetados pela
campo da mesma forma. Todavia, podemos comparar os fatores de dilatação temporal
em dois pontos diferentes em um campo. Por exemplo, suponha que em um ponto 1
observamos a luz proveniente de uma transição atômica particular em um ponto 2. Se os
pontos 1 e 2 estão em repouso em um campo gravitacional estacionário, então o tempo
que leva para uma crista de onda viajar de 2 para 1 será uma constante, e dado pela
integral da Eq.(7.2.11) sob o caminho, e portanto o tempo entre a chegada no ponto 1
de cristas sucessivas será igual ao tempo ∆t2 entre a sua partida no ponto 2, dado pela
Eq.(7.5.2) como
dt2 = ∆t [−g00 (x2 )]−1/2
Se a mesma transição atômica ocorre em um ponto 1, então o tempo entre as cristas das
Portanto, para uma dada transição atômica, a razão da frequência (observada no ponto
1) da luz do ponto 2 para aquela da luz do ponto 1 será
1/2
ν2 g00 (x2 )
= (7.5.3)
ν1 g00 (x1 )
ν2 ∆ν
No limite para campos fracos g00 ≈ −1 − 2φ e φ 1, daí =1+ , em que
ν1 ν
∆ν
= φ(x2 ) − φ(x1 ) (7.5.4)
ν
(Para um campo gravitacional uniforme, este resultado poderia ser derivado diretamente
do Princípio da Equivalência, sem a introdução da métrica ou da conexão afim.)
Vamos aplicar a Eq.(??) ao caso da luz da superfície do Sol observada da Terra. O
potencial gravitacional do Sol pode ser calculado como
GMS
φS = −
RS
MS = 1, 97 × 1033 g
RS = 0, 695 × 106 km
e G é a constante gravitacional
(Aqui usamos a nossa convenção de que c = 1 para colocar 1 s = 3 × 1010 cm; nas unidades
c.g.s. a quantidade 7, 41 × 10−29 cm / g m teria que ser chamada G/c2 .) Encontramos que
o potencial na superfície do sol é
φS = −2, 12 × 10−6
8 Análise Tensorial
Já observamos que o Princípio da Equivalência da Gravitação e Inércia estabelece
uma profunda analogia entre a geometria não-Euclideana e a teoria da gravitação. Este
capítulo é dedicado a linguagem comum a ambos, a da análise tensorial.
∂xµ̄
V µ̄ = V ν (8.2.1)
∂xν
∂xµ̄ ν
dxµ̄ = dx (8.2.2)
∂xν
então a diferencial da coordenada é um vetor contravariante. Uma regra de transforma-
ção bastante parecida é a do vetor covariante Uµ , na qual sob uma transformação de
coordenadas xµ → xµ̄ se transforma em
∂xν̄ µ
Uν̄ = dx (8.2.3)
∂xµ
∂φ ∂xν ∂φ
= (8.2.4)
∂xµ̄ ∂xµ̄ ∂xν
∂φ ∂ φ̄
uma vez que φ̄ = φ já que trata-se de um escalar, isto é, µ̄
= . Tal equação está
∂x ∂xµ̄
em total acordo com (8.2.3).
Através dos vetores covariantes e contravariantes podemos imediatamente generalizar
para os tensores. Um tensor com índices levantados µ, ν, . . . e índices abaixados κ, λ, . . .
se transforma como o produto de vetores contravariantes U µ W ν · · · e vetores covariantes
Vκ Yλ · · · . Por exemplo, sob uma transformação de coordenadas xµ → xµ̄ um tensor T µν λ
irá se transformar em
∂xµ̄ ∂xρ ∂xλ̄ κ σ
T µ̄ν̄ λ̄ = T (8.2.5)
∂xκ ∂xν̄ ∂xσ ρ
Se todos os índices estiverem levantados o tensor é chamado de contravariante; se todos
os índices estiverem abaixados o tensor é chamado de contravariante; de outra forma ele
é chamado de tensor misto. O exemplo mais importante é o tensor métrico, definido na
Seção (7.2) para um sistema de coordenadas gerais xµ por
∂ξ α ∂ξ β
gµν = ηαβ µ ν (8.2.6)
∂x ∂x
∂ξ α ∂ξ β
gµ̄ν̄ = ηαβ
∂xµ̄ ∂xν̄
∂ξ α ∂xρ ∂ξ β ∂xσ
= ηαβ ρ µ̄ σ ν̄
∂x ∂x ∂x ∂x
∂ξ ∂ξ β ∂xρ ∂xσ
α
= ηαβ ρ σ
∂x ∂x ∂xµ̄ ∂xν̄
e portanto
∂xρ ∂xσ
gµ̄ν̄ = gρσ (8.2.7)
∂xµ̄ ∂xν̄
Vemos que gµν é de fato um tensor covariante. Assumiremos que gµν possui um inverso,
tal hipótese é plausível pois podemos representar o mesmo como uma matriz, e a exi-
gência para que uma dada matriz possua inversa é que seu determinante seja diferente
de zero, o que é garantido pela relação (8.2.6). Portanto, sua inversa deve ser um tensor
contravariante, assumamos por hipótese que g λµ é o inverso de gµν , logo
g λµ gµν = δ λν
devemos ter
δ λ̄ν̄ = g λ̄µ̄ gµ̄ν̄
∂xρ ∂xσ
= g λ̄µ̄ µ̄ ν̄ gρσ
∂x ∂x
multiplicando ambos os lados por ∂xν̄ /∂xκ :
∂xν̄ λ̄ ρ
λ̄µ̄ ∂x ∂x ∂x
ν̄ σ
δ = g gρσ
∂xκ ν̄ ∂xµ̄ |∂xκ{z∂xν̄}
δ σκ
obtém-se
∂xλ̄ λ̄µ̄ ∂x
ρ
= g δ σ gρσ
∂xκ ∂xµ̄ κ
sabemos que δ σκ = 1 para σ = κ, portanto para esta componente:
∂xλ̄ λ̄µ̄ ∂x
ρ
= g gρκ
∂xκ ∂xµ̄
∂xλ̄ κη λ̄µ̄ ∂x
ρ
g = g gρκ g κη
∂xκ ∂xµ̄ | {z }
δ ηρ
∂xρ η
= g λ̄µ̄ δ
∂xµ̄ ρ
∂xλ̄ κη λ̄µ̄ ∂x
η
g = g
∂xκ ∂xµ̄
∂xλ̄ ∂xµ̄ κη
g λ̄µ̄ =
g (8.2.8)
∂xκ ∂xη
como exigido para um tensor contravariante. Finalmente, o delta de Kronecker δ µν é um
tensor misto, pois
∂xµ ∂xκ̄
δ µν =
∂xκ̄ ∂xν
∂xρ̄ ∂xν µ ∂xµ ∂xρ̄ ∂xκ̄ ∂xν
⇒ µ σ̄
δ ν = κ̄ µ ν σ̄
= δ ρ̄κ̄ δ κ̄σ̄
∂x ∂x ∂x ∂x ∂x ∂x
logo,
∂xρ̄ ∂xν µ
δ ρ̄σ̄ = δ (8.2.9)
∂xµ ∂xσ̄ ν
Tirando os escalares e o zero, δ µν (juntamente com os seus produtos diretos) é o único
tensor cujas componentes são as mesmas em todos os sistemas de coordenadas.
Um vetor é apenas um tensor com um único índice e um escalar é um tensor com
nenhum índice, então geralmente não será necessário dar aos vetores e aos escalares algum
tratamento especial. Todavia, o leitor deve ser advertido de que nem toda coisa é um
tensor; em particular, a conexão afim Γνµλ apesar de sua aparência, não é um tensor.
Agora podemos reconhecer uma classe diversa de equações invariantes: Qualquer equa-
ção será invariante sob transformações gerais de coordenadas, caso ela afirme a igualdade
de dois tensores com os mesmos índices levantados e abaixados. Por exemplo, se Aµν λ
e B µν λ são dois tensores com a regra de transformação (8.2.5), e se em um sistema de
coordenadas xµ̄ tivermos Aµ̄ν̄ λ̄ = B µ̄ν̄ λ̄ então obviamente em um sistema de coordenadas
xµ teremos Aµν λ = B µν λ , para provar isto é bastante simples, dado que
Aµ̄ν̄ λ̄ = B µ̄ν̄ λ̄
T µν ≡ aAµν + bB µν
(B) Produto Direto. O produto das componentes de dois tensores produz um tensor
cujos índices levantados e abaixados consiste em todos os índices levantados e abaixados
dos dois tensores originais. Por exemplo, se Aµν e B ρ são tensores, e
T µν ρ ≡ Aµν B ρ
T µ̄ν̄ ρ̄ ≡ Aµ̄ν̄ B ρ̄
∂xµ̄ ∂xκ λ ∂xρ̄ σ
= A B
∂xλ ∂xν κ ∂xσ
∂xµ̄ ∂xκ ∂xρ̄ λ σ
= A B
∂xλ ∂xν ∂xσ κ
∂xµ̄ ∂xκ ∂xρ̄ λ σ
= T
∂xλ ∂xν ∂xσ κ
T µρ = T µν ρσ
∂xµ̄ ∂xρ̄ κη
= T
∂xκ ∂xη
Estas três operações podem é claro serem combinadas de varias formas. Uma particu-
laridade importante da combinação de operações resulta no levantamento e abaixamento
de índices. Se tomarmos o produto direto de um tensor contravariante ou misto T com
o tensor métrico gµν , e contrairmos o índice µ com um dos índices contravariantes de T ,
obtemos um novo tensor no qual seu índice contravariante é substituído por um índice
covariante ν. Por exemplo, se T µρσ é um tensor, e caso definirmos
Sν ρσ ≡ gµν T µρσ
então pelas regras (B) e (C), Sν ρσ será um tensor. Similarmente, se tomarmos o produto
direto de um tensor covariante ou mixado T com o tensor métrico inverso g µν , e então
contrairmos o índice µ com um dos índices covariantes de T , iremos obter um novo tensor
no qual seu índice covariante é trocado por um índice contravariante ν. Por exemplo, se
Sµ ρσ é um tensor, caso definamos
Rνρσ ≡ g µν Sµ ρσ
segue que Rνρσ é também um tensor. Observe que abaixar um índice e então levanta-
lo novamente nos dá o tensor original de volta; por exemplo, nos casos citados acima,
abaixamos um índice em T para obter S e então o levantamos novamente para obter R,
logo R = T , pois
Rνρσ ≡ g µν Sµ ρσ ≡ g µν gµλ T λρσ
= δ νλ T λρσ = T νρσ
Pelo levantamento e abaixamento de índices podemos escrever um tensor com N índices
de 2N formas diferentes. Visto que todas elas são fisicamente equivalentes, comumente é
usado o mesmo símbolo para todos os 2N tensores, os distinguindo somente pelas locali-
g µλ gλν = δ µν
g λµ g κν gµν = g κν g λµ gµν = g λµ δ κµ = g λκ
A lei da transformação para o tensor métrico pode ser considerada como uma equação
matricial
∂xρ ∂xσ
gµ̄ν̄ = gρσ
∂xµ̄ ∂xν̄
e tomando o determinante, encontramos que
2
∂x
ḡ = g (8.4.2)
∂ x̄
∂xµ ∂xλ̄
= δ µν
∂xλ̄ ∂xν
Qualquer densidade tensorial de comprimento W pode ser expressa como um tensor or-
dinário vezes um fator g −W/2 . Por exemplo, se uma densidade tensorial F µν de rank W
possível a regra de transformação
W
∂ x̄ ∂xµ̄ ∂xκ λ
F µ̄ν̄ = F κ (8.4.4)
∂x ∂xλ ∂xν̄
e utilizando (8.4.2), vemos que ao eleva-la por um fator W/2 e então multiplica-la por
F µ̄ν̄ :
2 !W/2
∂x
ḡ W/2 = g W/2
∂ x̄
W W
∂x ∂ x̄ ∂xµ̄ ∂xκ W/2 λ
⇒ ḡ W/2
F µ̄ν̄ = g F κ
∂ x̄ ∂x ∂xλ ∂xν̄
| {z }
∂ x̄ −W
∂x
assim,
∂xµ̄ ∂xκ W/2 λ
g F κ
ḡ W/2 F µ̄ν̄ = (8.4.5)
∂xλ ∂xν̄
A importância da densidade tensorial surge do teorema fundamental do cálculo, que
sob uma transformação geral de coordenadas x → x̄, o elemento de volume d4 x se torna
4
∂ x̄
4
∂x
d x
d x̄ =
(8.4.6)
Deste modo µνλκ é uma densidade tensorial de comprimento −1. Podemos formar um
tensor ordinário contravariante ao multiplicar µνλκ por g −1/2 . Também podemos formar
uma densidade covariante ao baixar os índices na forma usual, ou seja,
uma densidade tensorial de comprimento W − 2. Por (B) e (C) segue que o levantamento
e abaixamento de índice não muda o comprimento da densidade tensorial.
∂xλ̄ ∂ 2 ξ α
Γλ̄µ̄ν̄ ≡
∂ξ α ∂xµ̄ ∂xν̄
∂xλ̄ ∂xρ ∂
σ α
∂x ∂ξ
= ρ α µ̄
∂x ∂ξ ∂x ∂xν̄ ∂xσ
∂xλ̄ ∂xρ ∂ξ α ∂
σ
∂xλ̄ ∂xρ ∂xσ ∂
α
∂x ∂ξ
= ρ α σ µ̄ ν̄
+ ρ α ν̄ µ̄
∂x ∂ξ ∂x ∂x ∂x ∂x ∂ξ ∂x ∂x ∂xσ
∂xλ̄ ∂xρ ∂xσ ∂xτ ∂ 2 ξ α ∂ 2 xσ ∂ξ α
= +
∂xρ ∂ξ α ∂xν̄ ∂xµ̄ ∂xτ ∂xσ ∂xµ̄ ∂xν̄ ∂xσ
∂xλ̄ ∂xτ ∂xσ ∂xρ ∂ 2 ξ α ∂xλ̄ ∂xρ ∂ξ α ∂ 2 xσ
= +
∂xρ ∂xµ̄ ∂xν̄ ∂ξ α ∂xτ ∂xσ ∂xρ ∂ξ α ∂xσ ∂xµ̄ ∂xν̄
| {z } | {z }
Γρτ σ δ ρσ
o primeiro termo no lado direito é justamente o que seria esperado caso Γλµν fosse um
tensor, o segundo termo é não-homogêneo, e o torna um não tensor.
A análise tensorial nos fornece uma forma bastante simples de estabelecer uma relação
entre Γλµν e gµν . Note que
∂xρ ∂xσ
∂ ∂
gµ̄ν̄ = gρσ µ̄ ν̄
∂xκ̄ ∂xκ̄ ∂x ∂x
∂gρσ ∂x ∂xσ
ρ
∂ 2 xρ ∂xσ ∂xρ ∂ 2 xσ
= + g ρσ + g ρσ
∂xκ̄ ∂xµ̄ ∂xν̄ ∂xk̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
τ ρ σ 2 ρ σ
∂gρσ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
= + gρσ + gρσ
∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xk̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
daí
onde usamos o fato de que os índices são mudos e a simetria do tensor métrico. Desta
forma
É útil ter em mãos uma fórmula alternativa para o termo não-homogêneo na regra de
transformação de Γλµν . Diferenciando a identidade
∂xλ̄ ∂xρ
ρ ν̄
= δ λ̄ν̄
∂x ∂x
!
λ̄ ρ
∂
∂x ∂x ∂
= (δ λ̄ν̄ )
∂xµ̄
ρ
∂x ∂x ν̄ ∂x µ̄
!
∂xρ ∂ ∂xλ̄ ∂xλ̄ ∂ 2 xρ
⇒ + =0
∂xν̄ ∂xµ̄ ∂xρ ∂xρ ∂xµ̄ ∂xν̄
Primeiro, note que as Eqs.(8.5.11) e (8.5.12) são válidas na ausência de gravidade, porque
colocando Γµνλ igual a zero e gµν igual a ηµν obtemos
d2 xµ
=0 e dτ 2 = −ηµν dxµ dxν
dτ 2
e estas são as equações corretas para uma partícula livre na relatividade especial. Se-
gundo, observe que (8.5.11) e (8.5.12) são invariantes sob uma transformação geral de
coordenadas, para
d2 xµ̄ d ∂xµ̄ dxν
=
dτ 2 dτ ∂xν dτ
∂xµ̄ d2 xν dxν d ∂xµ̄
= +
∂xν dτ 2 dτ dτ ∂xν
∂xµ̄ d2 xν dxν ∂
µ̄
dx
= + (8.5.13)
ν
∂x dτ 2 dτ ∂x ν dτ
∂xµ̄ d2 xν dxν ∂
µ̄ λ
∂x dx
= +
∂xν dτ 2 dτ ∂xν ∂xλ dτ
∂xµ̄ d2 xν ∂ 2 xµ̄ dxλ dxν
= +
∂xν dτ 2 ∂xν ∂xλ dτ dτ
assim como (8.5.10) nos dá
∂xµ̄ ν
V µ̄ = V
∂xν
∂V µ̄ ∂xµ̄ ∂V ν ∂xµ̄
∂
= ν
+ V ν λ̄
∂x λ̄ ∂x ∂x λ̄ ∂x ∂xν
∂V µ̄ ∂xµ̄ ∂xρ ∂V ν ν ∂x
ρ
∂ 2 xµ̄
⇒ = + V (8.6.1)
∂xλ̄ ∂xν ∂xλ̄ ∂xρ ∂xλ̄ ∂xρ ∂xν
O primeiro termo no lado direito é o que seria esperado caso ∂V µ /∂xλ fosse um tensor; o
segundo termo é o que destrói o comportamento tensorial.
Apesar de ∂V µ /∂xλ não ser um tensor, podemos utiliza-lo para construir um tensor.
∂V µ̄ ∂xµ̄ ∂xρ ∂V ν
µ̄ κ̄
+ Γ λ̄κ̄
V = + Γνρσ V σ (8.6.3)
∂xλ̄ ∂xν ∂xλ̄ ∂xρ
∂V µ
V µ;λ ≡ λ
+ Γµλκ V κ (8.6.4)
∂x
∂xµ̄ ∂xρ ν
V µ̄;λ̄ = V
∂xν ∂xλ̄ ;ρ
∂xρ
Vµ̄ = Vρ
∂xµ̄
∂xρ ∂xσ
∂Vµ̄ λ̄ ∂Vρ
− Γ V
µ̄ν̄ λ̄ = − Γκρσ Vκ (8.6.7)
∂xν̄ ∂xµ̄ ∂xν̄ ∂xσ
Portanto, definimos a derivada covariante de um vetor covariante como
∂Vµ
Vµ;ν = − Γλµν Vλ (8.6.8)
∂xν
∂xρ ∂xσ
Vµ̄;ν̄ = Vρ;σ (8.6.9)
∂xµ̄ ∂xν̄
É obvio como estas definições são estendidas para tensores gerais. A derivada covari-
ante com respeito a xρ de um tensor T é igual a ∂T /∂xρ , adicionado de um termo para
cada índice µ contravariante dado por Γµνρ vezes T com µ sendo substituído por ν, menos
um termo Γκλρ para cada índice covariante λ vezes T com λ sendo substituído por κ. Por
exemplo,
∂ µσ
T µσλ;ρ = T λ + Γµρν T νσλ + Γσρν T µνλ − Γκλρ T µσκ (8.6.10)
∂xρ
para ver isto, observe que
!
∂ τ̄ ξ̄ ∂ ∂xτ̄ ∂xξ̄ ∂xλ µσ
η̄
T ζ̄ = T λ
∂x ∂xη̄ ∂xµ ∂xσ ∂xζ̄
∂xρ ∂ 2 xτ̄ ∂xξ̄ ∂xλ µσ ∂xρ ∂xτ̄ ∂ 2 xξ̄ ∂xλ µσ ∂xτ̄ ∂xξ̄ ∂ 2 xλ µσ
= T λ + T λ + T λ
∂xη̄ ∂xρ ∂xµ ∂xσ ∂xζ̄ ∂xη̄ ∂xµ ∂xρ ∂xσ ∂xζ̄ ∂xµ ∂xσ ∂xη̄ ∂xζ̄
∂xρ ∂xτ̄ ∂xξ̄ ∂xλ ∂
+ η̄ µ σ ζ̄ ρ T µσλ
∂x ∂x ∂x ∂x ∂x
e
analogamente,
" #
∂xξ̄ ∂xρ ∂xν σ ∂ 2 xξ̄ ∂xρ ∂xν ∂xτ̄ ∂xγ̄ ∂xλ µχ
Γξ̄η̄γ̄ T τ̄ γ̄ζ̄ = Γ − T λ
∂xσ ∂xη̄ ∂xγ̄ ρν ∂xρ ∂xν ∂xη̄ ∂xγ̄ ∂xµ ∂xχ ∂xζ̄
∂xξ̄ ∂xρ ∂xτ̄ ∂xλ σ µν ∂ 2 xξ̄ ∂xρ ∂xτ̄ ∂xλ µν
= Γ T − T λ
∂xσ ∂xη̄ ∂xµ ∂xζ̄ ρν λ ∂xρ ∂xν ∂xη̄ ∂xµ ∂xζ̄
e
deste modo,
assim, vemos que no lado direito da equação o primeiro termo se anula com o sexto termo,
o segundo termo se anula com o oitavo termo e o terceiro termo se anula com o último
termo. Portanto,
riais. A maneira mais fácil de fazer isto é lembrarmos de que caso F seja uma densidade
tensorial de comprimento W , então g W/2 F é um tensor ordinário. Sua derivada covariante
também será um tensor, e o multiplicando por g −W/2 obtém-se de volta uma densidade
tensorial de comprimento W . Consequentemente, a derivada covariante de uma densidade
tensorial de comprimento W é definida como
não sendo necessário checar se isto é ou não uma densidade de tensorial de comprimento
W . A consequência é que a derivada covariante em relação a xρ de uma densidade tensorial
F de comprimento W é construída como se a mesma fosse um tensor ordinário, exceto
que adicionamos um termo extra (W/2g(F······ (∂g/∂xρ ). Por exemplo,
∂ W ∂g µ
F µλ;ρ ≡ F µλ + Γµρν F νλ − Γκλρ F µκ + F (8.6.12)
∂x ρ 2g ∂xρ λ
∂
(αAµν + βB µν );λ = (αAµν + βB µν ) + Γµλτ (αAτ ν + βB τν ) − Γκνλ (αAµκ + βB µκ )
∂xλ
∂ ∂
= α λ Aµν + αΓµλτ Aτ ν − αΓκνλ Aµκ + β λ B µν + βΓµλτ B τν − βΓκνλ B µκ
∂x ∂x
µ µ
= αA ν;λ + βB ν;λ
(8.6.13)
(B) A derivada covariante de um produto direto de tensores obedece a fórmula de
Leibniz. Por exemplo,
∂
(Aµν B λ );ρ = (Aµν B λ ) + Γµρσ (Aσν B λ ) + Γλρσ (Aµν B σ ) − Γκνρ (Aµκ B λ )
∂xρ
∂ ∂ (8.6.14)
= B λ ρ Aµν + Aµν ρ B λ − B λ Γκνρ Aµκ + Aµν Γλρσ B σ
∂x ∂x
µ λ µ λ
= A ν;ρ B + A ν B ;ρ
∂ µλ
T µλλ;ρ = T λ + Γµρν T νλλ + Γλρν T µνλ − Γκλρ T µλκ
∂xρ
∂ µλ
= T λ + Γµρν T νλλ + Γλρν T µνλ − Γλνρ T µνλ
∂xρ |{z} (8.6.15)
Γλ
ρν
∂ µλ
= T λ + Γµρν T νλλ
∂xρ
Também note que a derivada covariante do tensor métrico é nula, pois ele desaparece
nas coordenadas localmente inerciais, onde Γµνλ e ∂gµν /∂xλ somem, e um tensor que é nulo
em um sistema de coordenadas também o é em todos os sistemas. O mesmo resultado
pode ser obtido mais diretamente observando que
∂gµν
gµν;λ = λ
− Γρλµ gρν − Γρλν gρµ
∂x
gµν;λ = 0 (8.6.16)
(Este argumento pode ser invertido para fornecer outra forma de se derivar a relação entre
gµν e Γλµν .) Também podemos mostrar da mesma forma que a derivada covariante das
outras formas do tensor métrico também se anulam, isto é,
g µν;λ = 0 (8.6.17)
∂g µν
g µν;λ = + Γµσλ g σν + Γνλσ g µσ
∂xλ
∂S
S;u = (8.7.1)
∂xµ
∂Vµ
Vµ;ν ≡ − Γλµν Vλ
∂xν
∂gµλ µρ ∂gµλ
lembre-se de que devido a simetria do tensor métrico g ρµ = g , então
∂xρ ∂xρ
1 ∂gρµ
Γµµλ = g µρ λ (8.7.4)
2 ∂x
Podemos calcular isto facilmente se lembrarmos que para uma matriz arbitrária M ,
−1 ∂ ∂
Tr M (x) λ M (x) = ln Det M (x) (8.7.5)
∂x ∂xλ
onde Det denota o determinante e Tr denota o traço, ou seja, a soma dos elementos da
diagonal. Para provar (8.7.5), primeiramente, provemos o seguinte teorema
Teorema 8.7.1. Seja T = S −1 AS, onde T é uma matriz diagonal e S é a matriz dos
autovetores de A, então
det(eA ) = eTr(A) (8.7.6)
Demonstração:
Sabemos que por definição
A2
eA = I + A + + ···
2!
daí
(S −1 A)(AS)
S −1 eA S = S −1 IS + S −1 AS + + ···
2!
−1 (T S −1 )(ST )
= SS + T + + ···
2!
T2
=I +T + + ···
2!
= eT
ou eA = SeT S −1 logo,
já que det(S −1 ) = det−1 (S). Lembre-se de que por T ser a matriz diagonal com elementos
dados pelos autovalores de A, segue que eT é a matriz triangular com eλ1 , eλ2 , . . . na
diagonal (a prova disto parte diretamente da definição de exponencial e do fato de que
o produto de uma matriz diagonal por ela mesma é igual a uma matriz diagonal com
os elementos da matriz diagonal original ao quadrado), portanto det(eT ) = eλ1 eλ2 · · · =
P
e λi = eTr T . Contudo,
deste modo,
(M −1 δM )2 (M −1 δM )3 (M −1 δM )4
ln(I + M −1 δM ) = M −1 δM − + − + ···
2 3 4
δ ln(Det M ) = Tr M −1 δM
∂
Tomando δ = , obtemos (8.7.5). Aplicando (8.7.5) para o caso onde M é a matriz
∂xλ
gρµ ,
∂g ρµ
∂
Tr g νρ λ ln Det gρµ=
∂xλ
∂x
P
lembremos que o traço de uma matriz Bij é i Bii , logo
∂g ρµ ∂
g µρ λ
= ln g
∂x ∂xλ
1 ∂ ∂
Γµµλ = λ
ln g = ln g 1/2
2 ∂x ∂xλ
1 ∂ √
⇒ Γµµλ = √ g (8.7.8)
g ∂xλ
√
d 1 dx 1 1 dx 1 d x
pois ln x(t) = e = √ . Com (8.7.3), encontramos que a divergência
dt x dt 2 x dt x dt
covariante é precisamente
1 √ ∂V µ
µ 1 ∂ √
V ;µ =√ g µ +√ g Vλ
g ∂x g ∂xλ
(8.7.9)
1 ∂ √ µ
=√ ( gV )
g ∂xµ
Uma consequência imediata é a forma covariante do teorema de Gauss: Se V µ some no
infinito, então
√
Z
d4 x gV µ;µ = 0 (8.7.10)
√ √
Note o aparecimento do fator g que torna d4 x g invariante.
Podemos também utilizar (8.7.8) para simplificar as fórmulas para a divergência co-
variante de um tensor. Por exemplo,
∂T µν
T µν;µ ≡ µ
+ Γµµλ T λν + Γνµλ T µλ
∂x
1 √ ∂T µν
1 ∂ √
T µν;µ =√ g + √ g T λν + Γνµλ T µλ
g ∂xµ g ∂xλ
1 ∂ √ µν
⇒ T µν;µ = √ ( gT ) + Γνµλ T µλ (8.7.11)
g ∂xµ
Em especial, se T µλ = −T λµ , então o último termo desaparece, pois multiplicando T µλ =
= −Γνλµ T λµ
= −Γνµλ T µλ
∂Aµν
Aµν;λ = λ
− Γρµλ Aρν − Γρνλ Aµρ
∂x
Aµν = −Aνµ
Se adicionarmos duas vezes a Aµν;λ o mesmo tensor mas com índices permutados cicli-
camente, obtemos em virtude da simetria de Γρµλ e da anti simetria de Aρν que todos os
termos Γ se cancelam:
∂Aµν ∂Aλµ
Aµν;λ + Aλµ;ν + Aνλ;µ = λ
− Γρµλ Aρν − Γρνλ Aµρ + ν
− Γρλν Aρµ −Γρµν Aλρ
∂x ∂x | {z }
−Γρνλ Aµρ
∂Aνλ
+ µ
− Γρνµ Aρλ − Γρλµ Aνρ
∂x | {z } | {z }
−Γρµν Aλρ −Γρµλ Aρν
produzindo
As funções (8.8.1) e (8.8.2) são consideradas unívocas e com derivadas contínuas, de modo
que há uma única correspondência entre (ξ 1 , ξ 2 , ξ 3 ) e (x1 , x2 , x3 ).
Dado um ponto P de coordenadas retangulares (ξ 1 , ξ 2 , ξ 3 ) podemos, com as equações
(8.8.2), associá-lo a um conjunto único de coordenadas (x1 , x2 , x3 ) chamadas coordenadas
curvilíneas de P .
As superfícies x1 = c1 , x2 = c2 , x3 = c3 , onde c1 , c2 e c3 são constantes, chamam-
se superfícies coordenadas, e cortam-se aos pares em curvas chamadas curvas ou linhas
coordenadas. Se as superfícies se interceptam em ângulos retos o sistema de coordenadas
curvilíneas é dito ortogonal. As curvas coordenadas x1 , x2 e x3 de um sistema curvilíneo
são análogas aos eixos coordenados ξ 1 , ξ 2 , ξ 3 de um sistema retangular.
Seja ~r = 3i=1 ξ i ξˆi o vetor posição de um ponto P . Assim por (8.8.1) segue que o
P
∂~r
1
~e1 = ∂x
∂~r
∂x1
donde
∂~r
= h1~e1
∂x1
onde
∂~r
h1 = 1
∂x
De maneira geral,
∂~r
= hi~ei i = 1, 2, 3 (8.8.3)
∂xi
onde
∂~r
hi = i i = 1, 2, 3. (8.8.4)
∂x
De ~r = ~r(x1 , x2 , x3 ) temos
3 3
X ∂~r i
X
d~r = i
dx = hi dxi ~ei (8.8.5)
i=1
∂x i=1
bolizada por ds, como ds2 = d~r · d~r. De tal modo que
3
! 3
! 3
2
X ∂~r X ∂~r X
i j ∂~r ∂~r
ds = i
dxi · j
dxj = dx dx ·
i=1
∂x j=1
∂x i,j=1
∂xi ∂xj
∂~r ∂~r
gij = · (8.8.6)
∂xi ∂xj
∂~r ∂~r
gij = · = hi hj (~ei · ~ej ) (8.8.8)
∂xi ∂xj
Temos que
∂~r
dxi
d~ri = (8.8.12)
∂xi
onde d~ri é a variação do vetor posição ao longo da curva xi , mantendo as outras curvas
diferentes de i constantes. O volume elementar em um sistema de coordenadas curvilíneas
ortogonal é definido como o produto misto dos vetores d~r1 , d~r2 , d~r3 ,
∂~r 1 ∂~r 2 ∂~r 3
dV =
1
dx · 2
dx × 3
dx
∂x ∂x ∂x
√
dV = g dx1 dx2 dx3 (8.8.16)
Demonstração:
Sabemos que
∂~r ∂~r ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3
gij = · = + i i+ i i
∂xi ∂xj ∂xi ∂xj ∂x ∂x ∂x ∂x
com i, j = 1, 2, 3. Logo, empregando o seguinte teorema da multiplicação de determinan-
tes, det M det N = det(M N )
a11 a12 a13 A11 A12 A13
a21 a22 a23 A21 A22 A23
a31 a32 a33 A31 A32 A33
a11 A11 + a12 A12 + a13 A13 a11 A21 + a12 A22 + a13 A23 a11 A31 + a12 A32 + a13 A33
= a21 A11 + a22 A12 + a23 A13 a21 A21 + a22 A22 + a23 A23 a21 A31 + a22 A32 + a23 A33
a31 A11 + a32 A12 + a33 A13 a31 A21 + a32 A22 + a33 A23 a31 A31 + a32 A32 + a33 A33
temos
1 2 1
∂ξ
∂ξ 2 ∂ξ 3 ∂ξ
∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3
∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1
2
∂~r ∂~r ∂~r ∂ξ 1 ∂ξ 2 3
∂ξ ∂ξ 1 ∂ξ 2 ∂ξ ∂ξ 1
3
∂ξ 2 3
∂ξ
· × = =
∂x1 ∂x2 ∂x3 ∂x2
∂x2 ∂x2 ∂x2
∂x2 ∂x2 ∂x2 ∂x2 ∂x2
∂ξ 1 ∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3
3
∂x3 ∂x3
3
∂x ∂x ∂x3 ∂x3 ∂x3 ∂x3 ∂x3
1 1
∂ξ ∂ξ ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3
+ +
∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 + + + +
∂x1 ∂x2 ∂x1 ∂x2 ∂x1 ∂x2 ∂x1 ∂x3 ∂x1 ∂x3 ∂x1 ∂x3
∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 1
∂ξ ∂ξ 1 2
∂ξ ∂ξ 2 3
∂ξ ∂ξ 3
= + + + + + +
∂x2 ∂x1 ∂x2 ∂x1 ∂x1 ∂x1 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3
∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3
3 1 + + + + + +
∂x ∂x ∂x3 ∂x1 ∂x3 ∂x1 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3 ∂x3 ∂x3 ∂x3 ∂x3 ∂x3
g11 g12 g13
= g21 g22 g23 = g
g31 g32 g33
o que demonstra a primeira parte do teorema. Já para a segunda, note que o volume
elementar é dado por
∂~r 1 ∂~r 2 ∂~r 3
dV =
dx · dx × dx
∂x1 ∂x2 ∂x3
∂~r ∂~r ∂~r
1 2 3
=
∂x1 · ∂x2 × ∂x3
dx dx dx
√
= g dx1 dx2 dx3
demonstrando assim o teorema.
Comparando (8.8.16) com (8.8.14) vemos que
√
g = h1 h2 h3 (8.8.17)
g ij = h−1 −1 ij
i hj δ (8.8.19)
onde lembremos que o fator (Det g)−1/2 surge para transformar a densidade tensorial
ijk Vj;k em um tensor.Por exemplo, a primeira componente do rotacional é
~ × V~ )1 = h1
X 1 ∂
(∇ 1jk j hk V̄K
j,k
h1 h2 h3 ∂x
que se torna
~ × V~ )1 = 1 ∂ ∂
(∇ 2
h3 V̄3 − 3 h2 V̄2 (8.8.23)
h2 h3 ∂x ∂x
O divergente do vetor V não é mais nada do que a divergência covariante (8.7.9):
X X ∂
~ · V~ ≡
∇ V i;i = (Det g)−1/2 (Det g)1/2 V i
∂x i
i i
−1 ∂ ∂ ∂
= (h1 h2 h3 ) 1
h1 h2 h3 V 1 + 2 h1 h2 h3 V 2 + 3 h1 h2 h3 V 3 (8.8.24)
∂x ∂x ∂x
−1 ∂ ∂ ∂
= (h1 h2 h3 ) h2 h3 V̄1 + 2 h1 h3 V̄2 + 3 h1 h2 V̄3
∂x1 ∂x ∂x
∂S
ou combinando (8.8.24) com (8.8.21), isto é fazendo V̄i em (8.8.24) igual a h−1
i de
∂xi
(8.8.21), obtém-se:
~ 2 S ≡ (h1 h2 h3 )−1 ∂ h2 h3 ∂S ∂ h1 h3 ∂S ∂ h1 h2 ∂S
∇ + 2 + 3 (8.8.26)
∂x1 h1 ∂x1 ∂x h2 ∂x2 ∂x h3 ∂x3
O leitor pode facilmente checar que as fórmulas usuais para o gradiente, rotacional,
divergente e Laplaciano são obtidas, caso hi tome as formas apropriadas para as coorde-
nadas esféricas ou cilíndricas.
µ̄ ∂xµ̄ ν
A (τ ) = A (τ ) (8.9.1)
∂xν
Deve ser observado que as derivadas parciais ∂xµ̄ /∂xν devem ser calculada em xν = xν (τ ),
devido a isso as mesmas dependem somente de τ . Portanto, diferenciando em relação a
τ , encontramos dois termos,
A derivada segunda ∂ 2 xµ̄ /∂xν ∂xλ é a mesma responsável pelo termo inomogêneo na fór-
mula de transformação (8.5.10) para a conexão afim, pela Eq.(8.6.2)
zimos:
daí somos levados a definir a derivada covariante ao longo de uma curva xµ (τ ) por
DT µν dT µν dxλ ρ dxλ µ
≡ + Γµλρ T ν − Γσλν T (8.9.7)
Dτ dτ dτ dτ σ
e
DT µ̄ν̄ ∂xµ̄ ∂xσ DT ρσ
= (8.9.8)
Dτ ∂xρ ∂xν̄ Dτ
As propriedades da diferenciação covariante descritas nas Seções 6 a 8 podem ser facil-
mente estendidas para derivadas covariantes ao longo de uma curva.
Deve ser mencionado que a derivada covariante de um campo tensorial ao longo de uma
curva pode ser determinada a partir da sua derivada covariante ordinária; por exemplo,
se T µν é um campo tensorial, então
DT µν dxλ
= T µν;λ (8.9.9)
Dτ dτ
tal relação pode ser derivada da seguinte forma: Sabemos que
∂T µν
T µν;λ = λ
+ Γµρλ T ρν − Γσνλ T µσ
∂x
multiplicando por dxλ /dτ em ambos os lados e utilizando o fato de Γ ser simétrico, obtém-
se
µ dxλ ∂T µν dxλ µ dx
λ
ρ σ dx
λ
T ν;λ = λ
+ Γλρ T ν − Γλν T µσ
dτ ∂x dτ dτ dτ
vemos que o lado direito da equação acima é justamente o lado direito da Eq.(8.9.7), o
que prova (8.9.9). Contudo veremos em capítulos posteriores que tensores definidos ao
longo de curvas nem sempre podem ser promovidos a campos tensoriais, e para estes, a
derivada D/Dτ é a única derivada covariante disponível.
É comum que um vetor Aµ (τ ) transportado ao longo de uma curva por uma partícula
não mude em τ quando visto de um referencial ξx(τ ) que é localmente inercial em x(τ ).
(Isto é verdadeiro para o momentum de uma partícula e para o spin caso esteja-se sujeito
a forças puramente gravitacionais, isto será mostrado posteriormente) Neste referencial a
conexão afim assim como dAµ /dτ somem, daí
DAµ
=0 (8.9.10)
Dτ
Sendo esta uma afirmação covariante, e verdadeira em x(τ ) no sistema localmente inercial
ξx(τ ) , deve portanto ser válida em todos os sistemas de coordenadas. O vetor Aµ é então
sujeito ás equações diferenciais de primeira ordem
dAµ dxλ ν
= −Γµνλ A (8.9.11)
dτ dτ
que define Aµ para todo τ , dado Aµ em algum τ inicial. Um vetor Aµ (τ ) definido desta
forma ao longo de uma curva xµ (τ ) é dito ser definido por um transporte paralelo. Qualquer
tensor pode ser definido ao longo de uma curva por um transporte paralelo ao ser exigido
que sua derivada covariante ao longo desta curva desapareça.
∂
Aα (x) → Aα (x) + ϕ(x) (8.10.2)
∂xα
onde e é a carga da partícula representada por ψ, e ϕ(x) é uma função arbitrária das
coordenadas do espaço-tempo xα . Como devemos construir equações invariantes de cali-
bre? Observe que a derivada de um campo carregado ψ não muda sob transformações de
calibre como ψ, mas sim
∂ ∂
α
ψ(x) → [ψ(x)eieϕ(x) ]
∂x ∂xα
ieϕ(x) ∂ψ(x) ∂ϕ(x)
=e + ieψ(x)
∂xα ∂xα
assim como a derivada de tensores não se comporta como um tensor sob transformações
gerais de coordenadas. Segue que equações tais como
∂ ∂
(2 − m2 )ψ(x) = 0 onde 2 ≡ η αβ
∂xα ∂xβ
não são invariante por calibre, assim como também não é geralmente covariante. Também
observe que o potencial eletromagnético Aµ (x) obedece a uma lei de transformação de ca-
libre inomogênea, assim como a conexão afim obedece a lei de transformação inomogênea
(8.5.2) para transformações gerais de coordenadas. Na análise tensorial juntamos deri-
vadas de tensores com a conexão afim para formar as ’derivadas covariantes’, nas quais
se transformam como tensores. Na eletrodinâmica, juntamos derivadas de campos e o
potencial vetor para criar as ’derivadas de calibre covariante’
∂
Dα ψ(x) ≡ − ieAα (x) ψ(x) (8.10.3)
∂xα
∂ψ ∂ψ(x) ∂ϕ(x)
α
→ eieϕ(x) α
+ eieϕ(x) ieψ(x)
∂x ∂x ∂xα
e
∂ϕ
−ieAα (x)ψ(x) → −ie Aα (x) + α ψ(x)eieϕ(x)
∂x
deste modo, somando as duas equações anteriores
o segundo termo se cancela com o último termo da equação acima, logo vemos que a
derivada de calibre covariante se transforma como os campos,
Uma equação que é invariante sob transformações de calibre com ϕ constante (tal inva-
riância é simplesmente exigir a conservação de carga) será também invariante sob uma
transformação geral de calibre (8.10.1) - (8.10.2) desde que seja construída apenas a partir
de campos ψ(x) e suas derivadas covariantes de calibre Dα ψ(x), assim como uma equação
que é invariante sob a transformação de Lorentz será invariante sob transformações gerais
de coordenadas, desde que seja construída a partir de tensores e suas derivadas covarian-
tes. Por exemplo, podemos escrever uma equação invariante por calibre na qual poderia
representar o efeito do eletromagnetismo em um campo escalar carregado ψ(x) como
[η αβ Dα Dβ + m2 ]ψ(x) = 0 (8.10.5)
e
[Dα ψ(x)]† → [Dα ψ(x)]† e−ieϕ(x)
logo,
n o
Jα (x) → [ψ † (x)e−ieϕ ][eieϕ Dα ψ(x)] − [ψ(x)eieϕ ][e−ieϕ [Dα ψ(x)]† ] = Jα (x)
∂ψ † (x)
∂ψ(x)
⇒ D J (x) = −ie
α α α †
− ieA (x)ψ (x) − ieAα (x)ψ(x)
∂xα ∂xα
†
∂ψ(x) α ∂ψ (x) †
− − ieA (x)ψ(x) − ieAα (x)ψ (x)
∂xα ∂xα
o
+ψ † D α Dα ψ(x) − ψ(x)D α [Dα ψ(x)]†
†
∂ψ(x) ∂ψ † (x)
∂ α ∂ψ (x) ∂ψ(x) α α †
J (x) = −ie − ieA (x)ψ(x) − + ieA (x)ψ (x)
∂xα ∂xα ∂xα ∂xα ∂xα
o
† α α α α †
+ψ (x)(D + ieA (x))Dα ψ(x) − ψ(x)[(D + ieA (x))Dα ψ(x)]
∂ α
J (x) = ψ † (x)D α Dα ψ(x) − ψ(x)[D α Dα ψ(x)]†
∂xα
e utilizando (8.10.5), ou seja D α Dα ψ(x) = −m2 ψ(x), isto resulta
∂ α
J (x) = 0
∂xα
Podemos utilizar esta corrente no lado direito das equações de Maxwell abaixo,
∂ αβ
F = −J β
∂xα
e estas equações também serão invariantes por calibre. Veremos nos próximos capítulos
que as equações de campo para a gravidade são construídas de maneira análoga.
A analogia entre a invariância de calibre da eletrodinâmica e a covariância geral da
relatividade geral podem ser estendidas para uma simetria dinâmica similar, chamada
quiralidade, que governa as interações mesons-pi. Uma explicação adequada deste assunto
daria para outro livro.
formalismo geral, conhecido como teoria das formas diferenciais. Infelizmente, a notação
bastante abstrata e compacta associada com este formalismo impediu seriamente nos
últimos anos a comunicação entre matemáticos puros e físicos. Esta seção apresenta
alguns dos resultados fundamentais da teoria das formas diferenciais, todavia na notação
tensorial na qual é familiar para os físicos, ao invés da notação recôndita preferida pelos
matemáticos.
Um tensor covariante de rank p, no qual é antissimétrico sob uma mudança de qualquer
par de índices, será chamado de forma-p. Em n dimensões, o número de componentes da
forma-p é apenas o coeficiente binomial
n n!
≡ (8.11.1)
p p!(n − p)!
Por exemplo, um campo escalar é uma forma-0, um campo vetorial covariante é uma
forma-1, e um tensor covariante antissimétrico com dois índices é uma forma-2.
Combinações lineares de formas-p são formas-p. Entretanto, o produto direto sµν··· tρσ···
de uma forma-p sµν··· e uma forma-q tρσ··· não é uma forma (p + q), pois a mesma não é
completamente antissimétrica. Podemos formar uma forma-(p + q), s ∧ t pela antissime-
trização do produto direto:
onde, em geral, ’Antissim’ denota uma média sob todas as permutações II dos índices,
1 X
Antissim{uµ1 µ2 ···µm } ≡ δII uµII1 µII2 ···µIIm (8.11.3)
m! II
com o fator de sinal δII sendo +1 ou −1 de acordo com II consistir de uma permutação
par ou ímpar dos pares de índices individuais:
(
+1 II par
δII = (8.11.4)
−1 II ímpar
O produto direto antissimétrico (8.11.2) é conhecido como produto exterior. Por exemplo,
o produto exterior de uma forma-0 s e uma forma-1 tµ é simplesmente o produto ordinário
(s ∧ t)µ ≡ stµ
assim como o produto exterior de uma forma-1 sµ e uma forma-1 tν é uma forma-2
1
(s ∧ t)µν ≡ (sµ tν − sν tµ )
2
(s ∧ t) ∧ u = s ∧ (t ∧ u) (8.11.5)
e bilinear,
(α1 s1 + α2 s2 ) ∧ t = α1 (s1 ∧ t) + α2 (s2 ∧ t)
(8.11.6)
s ∧ (α1 t1 + α2 t2 ) = α1 (s ∧ t1 ) + α2 (s ∧ t2 )