Relatividade Geral

Sumário
1 Topologia 4
1.1 Topologia da Linha e do Plano . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Linha Real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Espaços Topológicos: Definições . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Cálculo Variacional 5
2.1 Formulação do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Equação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 A ’Segunda Forma’ da Equação de Euler . . . . . . . . . . . . . . . . . . . 7
2.4 Funções com Diversas Variáveis Dependentes . . . . . . . . . . . . . . . . . 8
2.5 As equações de Euler Quando Condições Auxiliares São Impostas . . . . . 8
2.6 A Notação δ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3 Mecânica Lagrangiana 13
3.1 Mecânica de uma Partícula . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Mecânica de um Sistema de Partículas . . . . . . . . . . . . . . . . . . . . 17
3.3 Vínculos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Princípio de D’Alembert e Equações de Lagrange . . . . . . . . . . . . . . 24
3.5 Potenciais Dependentes da Velocidade e Função de Dissipação . . . . . . . 32
3.6 Derivação das Equações de Lagrange pelo Princípio de Hamilton . . . . . . 37
3.7 Extensão do Princípio de Hamilton para Sistemas Não-Holonômicos . . . . 37
3.8 Vantagens da Formulação do Princípio Variacional . . . . . . . . . . . . . . 37
3.9 Teoremas de Conservação e Propriedades de Simetria . . . . . . . . . . . . 37
3.10 Função Energia e Conservação da Energia . . . . . . . . . . . . . . . . . . 37
4 Relatividade Especial na Linguagem Tensorial 38

4.1 Postulados Básicos da Teoria da Relatividade Especial . . . . . . . . . . . 38
4.2 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2.1 Transformações de Coordenadas . . . . . . . . . . . . . . . . . . . . 39
4.3 Vetores, Tensor Métrico e Grupo de Lorentz . . . . . . . . . . . . . . . . . 44
4.3.1 Vetores de Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3.2 Vetores e Tensor Métrico . . . . . . . . . . . . . . . . . . . . . . . . 47
4.3.3 Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.3.4 Adição de Velocidades e Precessão de Thomas . . . . . . . . . . . . 52
4.4 Forma-1 e Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.1 Definições de Tensores . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.4.2 Os Tensores 01 : Forma-1 . . . . . . . . . . . .

. . . . . . . . . . . 57
4.4.3 Bases Forma-1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.4.4 A Visualização de uma Forma-1 . . . . . . . . . . . . . . . . . . . . 60
4.4.5 Gradientes e Derivadas Direcionais . . . . . . . . . . . . . . . . . . 63
4.4.6 Forma-1 Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.7 Os Tensores 02 . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . 66
4.4.8 Simetrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
M

4.5 Métrica como um Mapeamento de Vetores em Formas-1 e Tensores N
. . 69
4.5.1 O Inverso: Indo de Ã para A ~ . . . . . . . . . . . . . . . . . . . . . . 70
4.5.2 Por que Distinguir Formas-1 de Vetores? . . . . . . . . . . . . . . . 71
4.5.3 Magnitude e Produto Escalar de Formas-1 . . . . . . . . . . . . . . 72
4.5.4 Vetores Normais e Formas-1 Normais Unitárias . . . . . . . . . . . 73
4.5.5 Vetores como Funções de Formas-1 . . . . . . . . . . . . . . . . . . 73
4.5.6 Raciocínio Circular? . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.5.7 Levantamento e Abaixamento de índices . . . . . . . . . . . . . . . 75
4.5.8 Diferenciação de Tensores . . . . . . . . . . . . . . . . . . . . . . . 76
4.5.9 Produto Externo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.5.10 Tensor de Levi-Civita e Duais . . . . . . . . . . . . . . . . . . . . . 78
4.5.11 Duals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5 Eletromagnetismo 84
5.1 Tensor Eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1.1 Derivação do Tensor Eletromagnético Através da Formulação Co-
variante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.1.2 Derivação do Tensor Eletromagnético Através do Princípio Variacional 87
5.2 Transformações de Lorentz dos Campos Elétricos e Magnéticos . . . . . . . 93
5.3 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
6 Introdução as Formulações Lagrangianas e Hamiltoniana para sistemas

e campos contínuos 98
6.1 A transição de um Sistema Discreto para um Sistema Contínuo . . . . . . 98
6.2 A Formulação Lagrangiana para Sistemas Contínuos . . . . . . . . . . . . . 102
6.3 Tensor Energia-Momento e Teoremas de Conservação . . . . . . . . . . . . 108
6.4 Formulação Hamiltoniana . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6.5 Teoria de Campos Relativísticos . . . . . . . . . . . . . . . . . . . . . . . . 116
6.6 Exemplos de Teorias de Campos Relativísticos . . . . . . . . . . . . . . . . 117
6.7 Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
7 O Princípio da Equivalência 127

7.1 O Enunciado do Princípio . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.2 Forças Gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
7.3 Relação entre gµν e Γλµν . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
2
7.4 O Limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.5 Dilatação Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
8 Análise Tensorial 145

8.1 O Princípio de Covariância . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.2 Vetores e Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
8.3 Álgebra Tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.4 Densidades Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.5 Transformação da Conexão Afim . . . . . . . . . . . . . . . . . . . . . . . 157
8.6 Diferenciação Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
8.7 Gradiente, Rotacional e Divergente . . . . . . . . . . . . . . . . . . . . . . 167
8.8 Análise Vetorial em Coordenadas Ortogonais . . . . . . . . . . . . . . . . . 171
8.9 Diferenciação Covariante ao Longo de uma Curva . . . . . . . . . . . . . . 177
8.10 A Analogia Eletromagnética . . . . . . . . . . . . . . . . . . . . . . . . . . 179
8.11 Formas-p e as Derivadas Exteriores . . . . . . . . . . . . . . . . . . . . . . 182
8.12 Efeitos Gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
3
CAPÍTULO 1 TOPOLOGIA
1 Topologia
1.1 Topologia da Linha e do Plano
1.1.1 Linha Real
O conjunto de números reais, denotados por R, desempenha um papel determinante

na matemática, e em particular, na análise.
1.2 Espaços Topológicos: Definições
Notas para um Curso de Relatividade - Macêdo 4

CAPÍTULO 2 CÁLCULO VARIACIONAL
2 Cálculo Variacional
2.1 Formulação do Problema
O problema básico do cálculo de variações é determinar a função y(x) de tal modo
que a integral Z x2
S= f {y(x), y 0 (x); x}dx (2.1.1)
x1
seja um extremo. Na Eq.(2.1.1), y 0 (x) = dy/dx e o ponto-e-vírgula em f separa a variável

independente x da variável dependente y(x) e sua derivada. O funcional1 depende da
função y(x), e os limites de integração são fixados2 . A função y(x) é então variada até
um valor extremo de S ser encontrado. Queremos dizer que, se uma função y = y(x)
der à integral S um valor mínimo, então, qualquer função vizinha, independentemente de
quão próxima for a y(x), deve fazer S aumentar. A definição de função vizinha pode ser
feita como segue. Damos a todas as funções possíveis y uma representação paramétrica
y = y(α, x) de modo que, para α = 0, y = y(0, x) = y(x) seja a função que produza um
extremo para S. Podemos, então, formular
y(α, x) = y(0, x) + α η(x) (2.1.2)
onde η(x) é alguma função de x que tem derivada contínua e que desaparece em x1
e x2 , porque a função variada y(α, x) deve ser idêntica a y(x) nos pontos finais do
caminho:η(x1 ) = η(x2 ) = 0. A situação é descrita esquematicamente na Figura 2.1.1.
Se funções do tipo dado pela Eq.(2.1.2) forem consideradas, a integral S torna um funci-
Figura 2.1.1: A função y(x) é o caminho que faz do funcional S um extremo. As funções
vizinhas y(x) + αη(x) desaparecem nos pontos finais e podem estar próximas a y(x), mas
não são o extremo.
1
Uma noção matemática de um funcional pode ser conferida no Apêndice B
2
Não é necessário que os limites de integração sejam considerados fixos. Se eles puderem variar, o
problema aumenta para encontrar não somente y(x) mas também x1 e x2 de modo que S seja um extremo.

onal de parâmetro α:
Z x2
S(α) = f {y(α, x), y 0 (α, x); x}dx (2.1.3)
x1
A condição que a integral tem um valor estacionário (isto é, que um extremo resulta)
é que S seja independente de α na primeira ordem ao longo do caminho que resulta no
extremo (α = 0), ou, de modo equivalente, que

∂S
=0 (2.1.4)
∂α α=0
para todas as funções η(x). Esta é somente uma condição necessária, não suficiente.
2.2 Equação de Euler

Para determinar o resultado da condição expressa pela Eq.(2.1.4), executemos a dife-
renciação na Eq.(2.1.3): Z x2
∂S ∂
= f {y, y 0 ; x}dx (2.2.1)
∂α ∂α x1
uma vez que os limites da integração são fixados, a operação diferencial afeta somente a
integração. Assim, Z x2
∂f ∂y 0

∂S ∂f ∂y
= + dx (2.2.2)
∂α x1 ∂y ∂α ∂y 0 ∂α
A partir da Eq.(2.1.2), temos
∂y
= η(x)
∂α (2.2.3)
∂y 0
= η 0 (x)
∂α
A Eq.(2.2.2) se torna
Z x2
∂S ∂f ∂f 0
= η(x) + 0 η (x) dx (2.2.4)
∂α x1 ∂y ∂y
O segundo termo na integração pode ser integrado por partes:

Z x2
x2 Z x2
∂f 0 ∂f d ∂f
η (x)dx = η(x) − η(x)dx (2.2.5)
x1 ∂y 0 ∂y 0 x1 x1 dx ∂y 0
O termo de integração desaparece porque η(x1 ) = η(x2 ) = 0. Portanto, a Eq.(2.2.2) se

torna Z x2
∂S ∂f d ∂f
= η(x) − η(x) dx
∂α x1 ∂y dx ∂y 0
Z x2 (2.2.6)
∂f d ∂f
= − η(x) dx
x1 ∂y dx ∂y 0

A integral na Eq.(2.2.6) agora parece ser independente de α. Mas as funções y e y 0

com relação a que derivadas de f são tomadas, ainda são funções de α. Uma vez que
(∂S/∂α)|α=0 deve desaparecer para o valor extremo e η(x) é uma função arbitrária (sujeita
às condições já colocadas), a integração na Eq.(2.2.6) deve desaparecer para α = 0:
∂f d ∂f
− =0 (2.2.7)
∂y dx ∂y 0
onde agora y e y 0 são as funções originais,independente de α. O resultado é conhecido

como equação de Euler,3 que é uma condição necessária para S ter um valor extremo.
2.3 A ’Segunda Forma’ da Equação de Euler

Uma segunda equação pode ser derivada da equação de Euler que é conveniente para
funções que não dependem explicitamente de x: ∂f /∂x = 0. Primeiro observamos que,
para qualquer função f (y, y 0 , x), a derivada é uma soma de termos
df d ∂f dy ∂f dy 0 ∂f
= f {y, y 0 , x} = + 0 +
dx dx ∂y dx ∂y dx ∂x
(2.3.1)
∂f ∂f ∂f
= y0 + y” 0 +
∂y ∂y ∂x
Também
d 0∂f ∂f d ∂f
y 0 = y” 0
+ y0 (2.3.2)
dx ∂y ∂y dx ∂y 0
ou, substituindo da Eq.(2.3.1) para y”(∂f /∂y 0 ),

d 0 ∂f df ∂f ∂f d ∂f
y 0 = − − y0 + y0
dx ∂y dx ∂x ∂y dx ∂y 0
(2.3.3)
df ∂f 0 d ∂f ∂f
= − +y −
dx ∂x dx ∂y 0 ∂y
o último termo desaparece devido à equação de Euler (Eq.(2.2.7). Portanto,

∂f d ∂f
0
− f −y 0 =0 (2.3.4)
∂x dx ∂y
Podemos utilizá-la chamando-a de ’segunda forma’ da equação de Euler, nos casos em

que f não depende explicitamente de x, e ∂f /∂x = 0. Então,
∂f
f − y0 = constante (2.3.5)
∂y 0
3
Derivada primeiro por Euler em 1744.Quando aplicada a sistemas mecânicos, é conhecida como
equação de Euler-Lagrange.

2.4 Funções com Diversas Variáveis Dependentes

A equação de Euler derivada anteriormente é a solução do problema de variação no
qual se deseja encontrar a função única y(x) de tal modo que a integral do funcional f
seja um extremo. O caso mais comum encontrado na mecânica é aquele em que f é um
funcional de diversas variáveis dependentes:
f = f {y1 (x), y10 (x), y2 (x), y20 (x), . . . ; x} (2.4.1)
ou simplesmente
f = f {yi (x), yi0 (x); x} (2.4.2)
com i = 1, 2, . . . , n. Em analogia com a Eq.(2.1.2), formulamos
yi (α, x) = yi (0, x) + αηi (x) (2.4.3)
O desenvolvimento ocorre de modo análogo [cf. a Eq.(2.2.6)], que resulta em

Z x2 X ∂f
∂S d ∂f
= − ηi dx (2.4.4)
∂α x1 i
∂yi dx ∂yi0
Como as variações individuais −ηi (x)− são todas independentes, o desaparecimento da

Eq.(2.4.4), quando avaliada em α = 0, requer o desaparecimento separado de cada ex-
pressão entre parênteses:
∂f d ∂f
− =0 (2.4.5)
∂yi dx ∂yi0
com i = 1, 2, . . . , n
2.5 As equações de Euler Quando Condições Auxiliares São Im-

postas
Suponha que desejamos encontrar, por exemplo, o caminho mais curto entre dois
pontos em uma superfície. Então, além das condições já discutidas, há a condição que o
caminho tem que satisfazer a equação da superfície, digamos g{yi ; x}.Essas equações são
chamadas de equações de restrição. Considere o caso no qual
f = f {yi , yi0 ; x} = f {y, y 0 , z, z 0 ; x} (2.5.1)
A equação correspondente à Eq.(2.2.6) para o caso de duas variáveis é

Z x2
∂S ∂f d ∂f ∂y ∂f d ∂f ∂z
= − + − dx (2.5.2)
∂α x1 ∂y dx ∂y 0 ∂α ∂z dx ∂z 0 ∂α

Mas, agora, também existe uma equação de restrição da forma
g{yi ; x} = g{y, z; x} = 0 (2.5.3)
e as variações ∂y/∂α e ∂z/∂α não são mais independentes, então as expressões entre
parênteses na Eq.(2.5.2) não desaparecem separadamente em α = 0
Ao diferenciar g na Eq.(2.5.3), temos

∂g ∂y ∂g ∂z
dg = + dα = 0 (2.5.4)
∂y ∂α ∂z ∂α
Onde nenhum termo em x aparece desde que ∂x/∂α = 0. Agora,

)
y(α, x) = y(x) + αη1 (x)
(2.5.5)
z(α, x) = z(x) + αη2 (x)
Portanto, ao determinar ∂y/∂α e ∂z/∂α a partir da Eq.(2.5.5) e inserir no termo entre

parênteses da Eq.(2.5.4), que, em geral, deve ser zero, obtemos
∂g ∂g
η1 (x) = − η2 (x) (2.5.6)
∂y ∂z
A Eq.(2.5.2) se torna
Z x2
∂S ∂f d ∂f ∂f d ∂f
= − η1 (x) + − η2 (x) dx (2.5.7)
∂α x1 ∂y dx ∂y 0 ∂z dx ∂z 0
Ao fazer a fatoração η1 (x) fora dos colchetes e formular a Eq.(2.5.6) como
η2 (x) ∂g/∂y
=− (2.5.8)
η1 (x) ∂g/∂z
temos
Z x2
∂S ∂f d ∂f ∂f d ∂f ∂g/∂y
= − + − η1 (x) dx (2.5.9)
∂α x1 ∂y dx ∂y 0 ∂z dx ∂z 0 ∂g/∂z
Esta última equação agora contém a função única arbitrária η1 (x), que não está, de
nenhum modo, restrita pela Eq.(2.5.5), e ao requerer a condição da Eq.(2.1.4), a expressão
nos colchetes deve desaparecer. Desse modo, temos
−1 −1
∂f d ∂f ∂g ∂f d ∂f ∂g
− = − (2.5.10)
∂y dx ∂y 0 ∂y ∂z dx ∂z 0 ∂z
O lado esquerdo desta equação envolve somente derivadas de f e g em relação a y e y 0 , e o

lado direito envolve somente derivadas em relação a z e z 0 . Como y e z são ambas funções

de x, os dois lados da Eq.(2.5.10) podem ser estabelecidos como iguais a uma função de
x, que formulamos como −λ(x):
∂f d ∂f ∂g 
− + λ(x) = 0
∂y dx ∂y 0 ∂y



(2.5.11)
∂f d ∂f ∂g



− 0
+ λ(x) = 0 
∂z dx ∂z ∂z
A solução completa para o problema agora depende de encontrar três funções: y(x), z(x)
e λ(x). Mas há três relações que podem ser utilizadas: as duas Eqs.(2.5.11) e a equação
de restrição Eq.(2.5.3). Desse modo, há um número suficiente de relações que permitem
uma solução completa. Note que, aqui λ(x) é considerado indeterminado 4 e é obtido
como parte da solução. A função λ(x) é conhecida como multiplicador indeterminado de
Lagrange;
Para o caso geral de diversas variáveis dependentes e varias condições auxiliares, temos
o seguinte conjunto de equações:
∂f d ∂f X ∂gj
− 0
+ λj (x) =0 (2.5.12)
∂yi dx ∂yi j
∂y i
gj {yi ; x} = 0 (2.5.13)
Se i = 1, 2, . . . , m, e j = 1, 2, . . . , n, a Eq.(2.5.12) representa m equações em m + n

desconhecidos, mas também há n equações de restrição (Eq.(2.5.13). Desse modo, há
m + n equações em m + n desconhecidos, e o sistema é solucionável.
A Eq.(2.5.13) é equivalente ao conjunto de n equações diferenciais
X ∂gj
dyi = 0 (2.5.14)
i
∂yi
com i = 1, 2, . . . , m e j = 1, 2, . . . , n. Em problemas de mecânica, as equações de restrição

são equações frequentemente diferenciais ao invés de equações de álgebra. Portanto,
equações como a Eq.(2.5.14) são, às vezes, mais úteis que as equações representadas pela
Eq.(2.5.13).
A equação de restrição também pode aparecer em forma integral. Considere o pro-
blema isoperimétrico que é apresentado, para encontrar a curva y = y(x) para o qual o
funcional Z b
S[y] = f {y, y 0 ; x}dx (2.5.15)
a
possui um extremo, e a curva y(x) satisfaz condições de contorno y(a) = A e y(b) = B

4
A função λ(x) foi introduzida em Mécanique analytique de Lagrange (Paris, 1788)

assim como o segundo funcional

Z b
K[y] = g{y, y 0 ; x}dx (2.5.16)
a
que possui um valor fixo para o comprimento da curva (l). Este segundo funcional repre-
senta uma restrição de integral.
Do mesmo modo que fizemos anteriormente, há uma constante λ tal que y(x) seja a
solução extrema do funcional Z b
(f + λ g) dx (2.5.17)
a
A curva y(x) então satisfará a equação diferencial

∂f d ∂f ∂g d ∂g
− +λ − =0 (2.5.18)
∂y dx ∂y 0 ∂y dx ∂y 0
sujeita às restrições y(a) = A,y(b) = B e K[y] = l.
2.6 A Notação δ
Em análises que utilizam o cálculo de variações, utilizamos rotineiramente uma notação
simplificada para representar a variação. Desse modo, a Eq.(2.2.6) que pode ser formulada
como Z x2
∂S ∂f d ∂f ∂y
dα = − 0
dα dx (2.6.1)
∂α x1 ∂y dx ∂y ∂α
pode ser expressada como
Z x2
∂f d ∂f
δS = − δy dx (2.6.2)
x1 ∂y dx ∂y 0
onde
∂S

dα = δS 

∂α 

(2.6.3)
∂y


dα = δy 

∂α
A condição do extremo então se torna
Z x2
δS = δ f {y, y 0 ; x} dx = 0 (2.6.4)
x1

Usando o símbolo de variação δ dentro da integral (porque, por hipótese, os limites de

integração não são afetados pela variação), temos
Z x2
δS = δf dx
x
Z 1x2 (2.6.5)
∂f ∂f 0
= δy + 0 δy dx
x1 ∂y ∂y
Mas
0 dy d
δy = δ = (δy) (2.6.6)
dx dx
então Z x2
∂f ∂f d
δS = δy + 0 δy dx (2.6.7)
x1 ∂y ∂y dx
Ao integrar o segundo termo por partes como antes encontramos
Z x2
∂f d ∂f
δS = − δy dx (2.6.8)
x1 ∂y dx ∂y 0
Como a variação δy é arbitrária, a condição do extremo δS = 0 requer que a integração

desapareça, resultando, assim, na equação de Euler.
Embora a notação δ seja frequentemente utilizada, é importante entender que é so-
mente uma expressão simplificada de quantidades diferenciais mais precisas. O caminho
variado representado por δy pode ser pensado fisicamente como um deslocamento virtual
do caminho real consistente com todas as forças e restrições(ver Figura 2.6.1). Esta va-
riação δy se distingue de um deslocamento diferencial real dy pela condição que dt = 0 -
isto é, o tempo é fixo. O caminho variado δy, na verdade, não precisa corresponder a um
caminho possível de movimento. A variação deve desaparecer nos pontos finais.
Figura 2.6.1: O caminho variado é um deslocamento virtual δy do caminho real consistente

com todas as forças e restrições.

CAPÍTULO 3 MECÂNICA LAGRANGIANA
3 Mecânica Lagrangiana
O movimento dos corpos materiais foi o assunto de algumas das primeiras pesquisas
realizadas pelos pioneiros da física. De seus esforços, desenvolveu-se um vasto campo
conhecido como mecânica analítica ou dinâmica, ou simplesmente, mecânica. No século
atual, o termo ’mecânica clássica’ passou a ser amplamente utilizado para denotar este
ramo da física em contraste com as teorias físicas mais recentes, especialmente a mecânica
quântica. Seguiremos esse uso, interpretando o nome para incluir o tipo de mecânica
que surge da teoria da relatividade especial. O objetivo desta capítulo e do próximo
é desenvolver a estrutura da mecânica clássica e delinear algumas de suas aplicações do
interesse atual na física pura. A base para qualquer apresentação da mecânica é uma série
de conceitos físicos fundamentais, como espaço, tempo, simultaneidade, massa e força. Na
maior parte, entretanto, esses conceitos não serão aqui analisados criticamente, ao invés,
eles serão assumidos como termos indefinidos cujos significados são familiares ao leitor.
3.1 Mecânica de uma Partícula

Iremos começar enunciando a primeira Lei de Newton
• Primeira Lei de Newton.
Existem sistema de referência, ditos inerciais, em relação aos quais toda partícula
isolada descreve um movimento retilíneo uniforme.
A existência de um referencial inercial implica a existência de uma infinidade de outros,
todos movendo-se entre si em linha reta com velocidade constante. Neste postulado está
implícita a noção newtoniana de tempo absoluto, que ’flui uniformemente sem relação
com qualquer coisa externa’ e é o mesmo em todos os referenciais inerciais. Considera-se
’isolada’ uma partícula suficientemente afastada de todos os objetos materiais.
Seja r o vetor radial de uma partícula em relação a alguma origem conhecida e v seu
vetor velocidade:
dr
v= . (3.1.1)
dt
O momento linear p de uma partícula é definido como o produto de sua massa por sua
velocidade:
p = mv. (3.1.2)
Devido a sua interação com objetos externos e campos, a partícula pode presenciar forças
de vários tipos, como por exemplo, a força gravitacional ou eletrodinâmica; a soma vetorial
destas forças exercidas sob a partícula é a força total F. A mecânica da partícula é tratada
na segunda lei de Newton do movimento, na qual afirma que existe referenciais nos quais
o movimento da partícula é descrito pela equação diferencial
dp
F= = ṗ, (3.1.3)
dt

ou
d
F= (mv). (3.1.4)
dt
Em muitos casos, a massa da partícula é constante e a Eq.(3.1.4) se reduz a
dv
F=m = ma (3.1.5)
dt
onde a é o vetor aceleração da partícula definido por
d2 r
a= . (3.1.6)
dt2
A equação do movimento é portanto uma equação diferencial de segunda ordem, presu-

mindo que F não dependa de derivadas de ordem mais alta.
Um referencial no qual a Eq.(3.1.3) é válida é chamado de inercial ou sistema Gali-
leano. Mesmo dentro da mecânica clássica, a noção de um sistema inercial é algo como
uma idealização. Na prática, entretanto, é geralmente viável configurar um sistema de co-
ordenadas que se aproxime das propriedades desejadas conforme necessário. Para muitos
propósitos, um referencial fixado na Terra (o ’referencial do laboratório’) é uma aproxi-
mação suficiente para um referencial inercial, enquanto para propósitos astronômicos é
necessário construir um sistema inercial tendo como referência galáxias distantes. .
Muitas das conclusões importantes da mecânica podem ser expressas na forma de teo-
remas de conservação, nos quais indicam sob quais condições várias quantidades mecânicas
são constantes no tempo. A Equação (3.1.3) fornece diretamente o primeiro destes,
Teorema 3.1.1. Teorema de Conservação para o Momento Linear de uma Partícula: Se
a força total, F, é nula, então p = 0 e o momento linear, p, é conservado.
O momento angular de uma partícula em relação a um ponto O, denotado por L, é
definido como
L = r × p, (3.1.7)
onde r é o vetor radial da partícula em relação a O. Observe que a ordem dos fatores é
importante. Agora iremos definir o momento da força ou torque em relação a O como
N = r × F. (3.1.8)
A equação análoga a (3.1.3) para N é obtida formando o produto vetorial de r com a

Eq.(3.1.4):
d
r × F = N = r × (mv). (3.1.9)
dt
A Equação (3.1.9) pode ser escrita em uma forma diferente através da seguinte identidade
vetorial:
d d
(r × mv) = v × mv + r × (mv), (3.1.10)
dt dt
onde o primeiro termo no lado direito obviamente desaparece. Como consequência desta
identidade, a Eq.(3.1.9) toma a forma abaixo
d dL
N= (r × mv) = = L̇ (3.1.11)
dt dt
observe que tanto N quanto L dependem do ponto O, ao qual os momentos foram tomados.
Como no caso da Eq.(3.1.3), a equação do torque, (3.1.11), também produz um teorema
de conservação, sendo
Teorema 3.1.2. Teorema de Conservação para o Momento Angular de uma partícula:

Se o torque total, N, é zero então L̇ = 0, e o momento angular L é conservado.
Em seguida consideremos o trabalho realizado por uma força externa F sob uma
partícula que se move de um ponto 1 para um ponto 2. Por definição, este trabalho é
Z 2
W12 = F · ds . (3.1.12)
1
Para uma massa constante (como sera assumido daqui em diante ao menos que seja
especificado o contrário), a integral na Eq.(3.1.12) se reduz a
Z Z Z
dv m d 2
F · ds = m · v dt = (v ) dt,
dt 2 dt
e portanto
m 2
W12 = (v2 − v12 ). (3.1.13)
2
A quantidade escalar mv 2 /2 é chamada de energia cinética da partícula e é denotado por
T , devido a isso o trabalho realizado é igual a variação na energia cinética:
W12 = T2 − T1 . (3.1.14)
Se a força do campo é tal que o trabalho W12 é o mesmo para qualquer caminho físico
possível entre os pontos 1 e 2, então a força (e o sistema) é dito ser conservativo. Uma
descrição alternativa de um sistema conservativo é obtida imaginando a partícula sendo
levada do ponto 1 ao ponto 2 por um caminho possível e então retornando para o ponto 1
por outro caminho. A independência de W12 do caminho particular implica que o trabalho
realizado ao longo de um circuito fechado qualquer é zero, i.e.
I
F · ds = 0. (3.1.15)
Fisicamente é claro que o sistema não pode ser conservativo se uma força de atrito ou
outras forças dissipativas estão presentes, já que F·ds graças ao atrito será sempre positivo
e a integral não pode desaparecer.

Através de um teorema bastante conhecido da analise vetorial, uma condição necessária

e suficiente para que o trabalho, W12 seja independente do caminho físico tomado pela
partícula é que F seja o gradiente de alguma função escalar da posição:
F = −∇V (r), (3.1.16)
onde V é chamado de potencial, ou energia potencial. A existência de V pode ser inferida

intuitivamente por um argumento simples. Se W12 é independente do caminho de integra-
ção entre os pontos extremos 1 e 2, é sempre possível expressar W12 como uma variação
em uma quantidade que depende apenas da posição das extremidades. Esta quantidade
pode ser designada por −V , devido a isso para a diferencial de comprimento do caminho
temos a relação
F · ds = −dV
ou
∂V
Fs = − , (3.1.17)
∂s
na qual é equivalente a Eq.(3.1.16). Observe que na Eq.(3.1.16) podemos adicionar a V
qualquer quantidade constante no espaço, sem afetar os nossos resultados. Consequente-
mente o nível zero de V é arbitrário.
Para um sistema conservativo, o trabalho realizado pelas forças é
W12 = V1 − V2 . (3.1.18)
Combinando a Eq.(3.1.18) com a Eq.(3.1.14), obtemos como resultado
T1 + V1 = T2 + V2 (3.1.19)
na qual afirma em símbolos que
Teorema 3.1.3. Teorema de Conservação da Energia para uma partícula: Se as forças

atuando em uma partícula são conservativas, então a energia total da partícula, T + v, é
conservada.
A força aplicada a uma partícula pode ser em varias oportunidades dada por um
gradiente de uma função escalar que depende explicitamente da posição da partícula e do
tempo. Entretanto, o trabalho realizado pela partícula quando viaja uma distância ds,
∂V
F · ds = − ds,
∂s
não é mais a variação total em −V durante o deslocamento, visto que V também varia
explicitamente com o tempo a medida que a partícula se move. Consequentemente, o
trabalho realizado da partícula para ir do ponto 1 ao ponto 2 não é mais a diferença

na função V entre estes pontos. Enquanto a energia total T + V pode continuar sendo
definida, contudo a mesma não é mais conservada durante o curso do movimento da
partícula.
3.2 Mecânica de um Sistema de Partículas

Na generalização das ideias da seção anterior para sistemas com muitas partículas,
devemos distinguir entre forças externas atuando nas partículas devido a fontes externas
ao sistema, e forças internas em, digamos, alguma partícula i graças as demais partículas
no sistema. Portanto, a equação do movimento (segunda lei de Newton) para a i-ésima
partícula é escrita como
X
Fji + Fi (e) = ṗi , (3.2.1)
j
(e)
onde Fi representa a força externa, e Fji é a força interna atuando na i-ésima partícula
devido a j-ésima partícula (Fii , naturalmente, é zero). Iremos assumir que Fij (assim
(e)
como Fi ) obedece a terceira lei de Newton do movimento em sua forma original: que
as forças nas quais duas partículas exercem uma na outra são iguais e opostas. Esta
afirmação (na qual não é válida para todos os tipos de força) é algumas vezes referida
como lei fraca da ação e reação.
Somando sobre todas as partículas, a Eq.(3.2.1) toma a forma
d2 X X (e) X
mi ri = F i + Fji
dt2 i i i,j,i6=j
X (e) 1 X (3.2.2)
= Fi + (Fji + Fij )
i
2 i,j,i6=j
A primeira soma no lado direito é simplesmente a força externa total F(e) , enquanto o
segundo termo desaparece, visto que a lei da ação e reação afirma que cada par Fji + Fij
é zero. Para reduzir o lado esquerdo da equação, definimos o vetor R como a média dos
vetores radiais das partículas, ponderada em proporção com as suas massas:
P P
mi ri mi ri
R= P = (3.2.3)
mi M
O vetor R define um ponto conhecido como centro de massa, ou mais vagamente como
centro de gravidade, do sistema (Figura ). Com esta definição, (3.2.2) se reduz a
d2 R X (e)
M = Fi ≡ F(e) , (3.2.4)
dt2 i
na qual afirma que o centro de massa se move como se a força externa total estivesse
agindo sob toda a massa do sistema concentrada no centro de massa. Forças puramente

internas, se obedecem a terceira lei de Newton, portanto não possuem efeito no movimento
do centro de massa. Um exemplo frequentemente citado é o movimento de um projétil
explodindo - o centro de massa dos fragmentos viajam como se o projétil ainda estivesse
em uma única peça (negligenciando a resistência do ar). O mesmo principio é envolvido
em jatos e foguetes de propulsão. A fim de que o movimento do centro de massa não seja
afetado, a ejeção dos gases de propulsão em alta velocidade devem ser contrabalanceadas
pelo movimento do veículo para a frente em uma velocidade mais lenta.
Figura 3.2.1: O centro de massa de um sistema de partículas.
Pela Eq.(3.2.3), o momento linear total do sistema,

X dri dR
P= mi =M , (3.2.5)
dt dt
é a massa total do sistema vezes a velocidade do centro de massa. Consequentemente, a

equação do movimento para o centro de massa, Eq.(3.2.5), pode ser reafirmada como
Teorema 3.2.1. Teorema de Conservação para o Momento Linear de um Sistema de

Partículas: Se a força externa total é zero, então o momento linear total é conservado.
Obtemos o momento angular total do sistema formando o produto vetorial ri × pi e

somando sobre i. Se esta operação é feita na Eq.(3.2.1), estes resultados, com a adição
da identidade, (3.1.10),
X X d
(ri × ṗi ) = (ri × pi ) = L̇
i i
dt
X (e)
X
= ri × Fi + ri × Fji
i i,j,i6=j
(3.2.6)
!
X (e) 1 X
= ri × Fi + ri × Fji + rj × Fij
i
2 i,j,i6=j

O último termo no lado direito da Eq.(3.2.6) pode ser considerado uma soma de pares na
forma
ri × Fji + rj × Fij = (ri − rj ) × Fji (3.2.7)
devido a Fij = Fji pela 3◦ Lei de Newton, mas ri − rj é igual ao vetor rij de j para i
(cf.Fig.3.2.1), então o lado direito da Eq.(3.2.7) pode ser escrito como
rij × Fji
Se as forças internas entre duas partículas, além de serem iguais e opostas, também
permaneçam ao longo da linha que unem as partículas - uma condição conhecida como
lei forte da ação e reação - então todos esses produtos vetoriais somem. A soma sob os
pares é zero através desta afirmação e a Eq.(3.2.6) pode ser escrita na forma
dL
= N(e) . (3.2.8)
dt
A derivada temporal do momento angular total é portanto igual ao momento da força

externa sob um dado ponto. Correspondentemente a Eq.(3.2.8) é
Teorema 3.2.2. Teorema de Conservação para o Momento Angular Total: L é constante

no tempo se o torque (externo) aplicado é zero.
(Talvez valha a pena enfatizar que este é um teorema vetorial ; i.e., Lz sera conservado
(e) (e) (e)
se Nz é zero, mesmo que Nx e Ny não o sejam.)
Observe que a conservação do momento linear na ausência de forças aplicadas pres-
supõe que a lei fraca da ação e reação é válida para as forças internas. A conservação
do momento angular total do sistema na ausência de torques aplicados requer a validade
da lei forte da ação e reação - que as forças internas sejam centrais. Muitas das forças
familiares na física, tais como a da gravidade, satisfazem a forma forte desta lei. Entre-
tanto, é possível encontrar forças nas quais a ação e a reação são iguais mesmo quando as
forças não são centrais (veja abaixo). Em um sistema que envolva cargas em movimento,
as forças entre as cargas previstas pela lei de Biot-Savart de fato violam ambas as forças
da lei da ação e reação.5 Equações (3.2.5) e (3.2.8), e seus correspondentes teoremas de
conservação, não são aplicáveis nestes casos, ao menos na forma dada aqui. Normalmente,
é possível encontrar alguma generalização de P ou L na qual é conservada. Logo, em um
sistema isolado de cargas em movimento, é a soma do momento angular mecânico e do
’momento angular’ eletromagnético do campo que é conservado.
5
Se duas cargas estão se movendo uniformemente com vetores velocidades paralelos que não são
perpendiculares as linhas que unem as cargas, então as forças mútuas líquidas são iguais e opostas,
contudo não estão ao longo do vetor que une as cargas. Considere, adicionalmente, duas cargas se
movendo (instantaneamente) tal que uma das cargas se move em direção a outra, na qual por sua vez se
move em um angulo reto em relação a primeira, então a segunda carga exerce uma força magnética na
primeira não nula, sem experienciar qualquer força magnética de reação naquele instante.

A Equação (3.2.5) afirma que o momento linear total do sistema é o mesmo como se
toda a massa do sistema fosse concentrada no centro de massa e se movesse com ele. O
teorema análogo para o momento angular é mais complicado. Tomando a origem O como
ponto de referência, o momento angular total do sistema é
X
L= ri × pi .
i
Façamos com que R seja o vetor posição do centro de massa em relação a O, e tomemos
r0i como sendo o vetor posição da i-ésima partícula em relação ao centro de massa. Então,
temos (cf. Fig.3.2.2)
ri = r0i + R (3.2.9)
e
vi = vi0 + v
onde
dR
v=
dt
Figura 3.2.2: Os vetores envolvidos na mudança do ponto de referência para o momento

angular.
é a velocidade do centro de massa relativa a O, e
dr0i
vi0 =
dt
é a velocidade da i-ésima partícula relativa ao sistema do centro de massa. Utilizando da

Eq.(3.2.9), o momento angular total toma a forma

X X
L= ri × mi vi = (r0i + R) × mi (vi0 + v)
i i
!
X X X d X
= R × mi v + r0i × mi vi0 + mi r0i ×v+R× mi r0i
i i i
dt i
Os últimos dois termos nesta expressão desaparecem, pois ambos possuem o fator mi r0i ,
P
que, será reconhecido, como definindo o vetor posição do centro de massa no próprio
sistema de coordenadas cuja origem é o centro de massa e , consequentemente é um vetor
nulo, uma forma de ver isto é multiplicar a Eq.(3.2.9) por mi
mi ri = mi r0i + mi R
P
e então somar para todo i, observando que i mi ri = M R, obtemos que
X
mi r0i = 0
i
como esperado. Reescrevendo os termos remanescentes, o momento angular total em

relação a O é
X
L = R × Mv + r0i × p0i . (3.2.10)
i
Em palavras, a Eq.(3.2.10) afirma que o momento angular total em relação ao ponto O

é o momento angular do movimento concentrado no centro de massa, mais o momento
angular do movimento em relação ao centro de massa. A forma da Eq.(3.2.10) enfatiza
que em geral L depende da origem O, através do vetor R. O momento angular será
independente do ponto de referência somente se o centro de massa estiver em repouso
com respeito a O. Neste caso, o primeiro termo em (3.2.10) desaparece, e L sempre se
reduz ao momento angular tomado com respeito ao centro de massa.
Finalmente, vamos considerar a equação da energia. Como no caso de uma única
partícula, nós calculamos o trabalho realizado por todas as forças que movem o sistema
de uma configuração inicial 1, para uma configuração final 2:
XZ 2 XZ 2 X Z 2
(e)
W12 = Fi · dsi = Fi · dsi + Fji · dsi . (3.2.11)
i 1 i 1 i,j,i6=j 1
Novamente. as equações do movimento podem se reduzir a integrais
XZ 2 X Z 2 XZ 2
1 2
Fi · ds = i] mi v̇i · vi dt = d mi vi .
i 1 1 i 1 2
[
Consequentemente, o trabalho realizado ainda pode ser escrito como a diferença entre as

energias cinéticas final e inicial:

W12 = T2 − T1 ,
onde T , a energia cinética do sistema, é
1X
T = mi vi2 (3.2.12)
2 i
Fazendo uso das transformações para as coordenadas do centro de massa, dadas na

Eq.(3.2.9), também podemos escrever T como
1X
T = (v + vi0 ) · (v + vi0 )
2 i
!
1X 1X d X
= mi v 2 + mi vi02 + v · mi r0i ,
2 i 2 i dt i
e pelo motivo já enfatizado no cálculo do momento angular, o último termo desaparece,

nos levando a
1 1X
T = M v2 + mi vi02 (3.2.13)
2 2 i
A energia cinética, assim como o momento angular, também consiste em duas partes: a
energia cinética obtida como se toda a massa fosse concentrada no centro de massa, mais
a energia cinética do movimento em relação ao centro de massa.
Considere agora o lado direito da Eq.(3.2.11). No caso especial que as forças externas
são deriváveis em termos de um gradiente de um potencial, o primeiro termo pode ser
escrito como
X Z 2 (e) XZ 2 P 2
Fi · dsi = − ∇i Vi · dsi = − i Vi
1 1 1
i i
onde o subscrito i no operador del indica que as derivadas são tomadas com respeitos
as componentes de ri . Se as forças internas também são conservativas, então as forças
mutuas entre a i-ésima e j-ésima partículas, Fij e Fji , podem ser obtidas por uma função
potencial Vij . Para satisfazer a lei forte da ação e reação, Vij pode ser uma função somente
da distância entre as partículas:
Vij = Vij (|ri − rj |). (3.2.14)
As forças são então automaticamente iguais e opostas,
Fj = −∇i Vij = +∇j Vij = −Fij (3.2.15)

e permanecem ao longo da linha que unem as duas partículas,
∇Vij (|ri − rj |) = (ri − rj )f, (3.2.16)
onde f é alguma função escalar. Se Vij fosse também uma função da diferença de alguns
outros pares de vetores associados com as partículas, tais como as suas velocidades ou
(entrando no domínio da física moderna) os seus momentos angulares ’spin’ intrínsecos,
então as forças ainda seriam iguais e opostas, mas não necessariamente estariam ao longo
da direção entre as partículas.
Quando as forças são todas conservativas, o segundo termo na Eq.(3.2.11) pode ser
reescrito como uma soma sob todos os pares de partículas, com o termo de cada par sendo
da forma Z 2
− (∇i Vij · dsi + ∇j Vij · dsj ).
1
Se o vetor diferença ri −rj é denotado por rij , e se ∇ij representa o gradiente com respeito
a rij , então
∇i Vij = ∇ij Vij = −∇j Vij .
e
dsi − dsj = dri − drj = drij ,
de modo que o termo para ij−ésimo par possui a forma

Z
− ∇ij Vij · drij .
O trabalho total que surge das forças internas se reduzem para
1 X 2
Z
1 X 2
− ∇ij Vij · drij = − Vij . (3.2.17)

2 i,j,i6=j 1 2 i,j,i6=j 1
1
O fator aparece na Eq.(3.2.17) porque, ao somar tanto em i quanto em j cada membro
2
de um dado par é incluído duas vezes, primeiro no somatório i e então no somatório j.
Destas considerações, fica claro que se as forças externas e internas são ambas derivadas
de potenciais, é então possível definir uma energia potencial total, V , do sistema
X 1 X
V = Vi + Vij , (3.2.18)
i
2 i,j,i6=j
tal que a energia total T + V é conservada, que é o análogo do teorema de conservação

(3.1.19) para uma única partícula.
O segundo termo no lado direito da Eq.(3.2.18) será chamado de energia potencial
interna do sistema. Em geral, a mesna não é necessariamente nula e, mais importante,

pode variar a medida que o sistema muda com o tempo. Somente para a classe particular
de sistemas conhecidos como corpos rígidos é que a energia potencial interna será sempre
constante. Formalmente, um corpo rígido pode ser definido como um sistema de partículas
cujas distâncias rij são fixadas e não podem variar com o tempo. Em tal caso, os vetores
drij somente podem ser perpendiculares aos correspondentes rij , e portanto a Fij , para
ver isto observe que se um vetor arbitrário A possui magnitude constante, isto é, A · A =
constante, então,
d dA dA
(A · A) = 2A · ⇒A· =0
dt dt dt
Deste modo, em um corpo rígido as forças internas não realizam trabalho, e o potencial
interno deve permanecer constante. Visto que a energia potencial é sempre, em qual-
quer caso, incerta em termos de uma constante aditiva, um potencial invariante pode ser
completamente desconsiderado na discussão do movimento do sistema.
3.3 Vínculos
3.4 Princípio de D’Alembert e Equações de Lagrange

Um deslocamento virtual (infinitesimal) de um sistema se refere a uma mudança na
configuração do sistema como resultado de qualquer mudança infinitesimal arbitrária das
coordenadas δri , consistente com as forças e os vínculos impostos ao sistema em um dado
instante t. O deslocamento é chamado virtual para o distinguir do deslocamento real do
sistema ocorrendo em um intervalo de tempo dt, durante o qual as forças e os vínculos
podem estar mudando. Suponha que o sistema está em equilíbrio; i.e., a força total em
cada partícula desaparece, Fi = 0. Então, claramente o produto escalar Fi · δri , que é o
trabalho virtual da força Fi no deslocamento δri , também some. A soma desses produtos
que desaparecem para todas as partículas também deve ser zero:
X
Fi · δri = 0 (3.4.1)
i
Até o momento, nenhuma física nova foi apresentada. Decompondo Fi na força aplicada
(a)
Fi , e na força de vínculo, fi ,
(a)
Fi = Fi + fi (3.4.2)
devido a isso, a Eq.(3.4.1) se torna

X (a)
X
Fi · δri + fi · δri = 0 (3.4.3)
i i
Agora nos restringimos para sistemas cujo trabalho virtual das forças de vínculo é zero.
Vimos que esta condição permanece válida para corpos rígidos e é válida para vários outros
vínculos. Portanto, se uma partícula é vinculada a se mover em uma superfície, a força

de vínculo é perpendicular a superfície, enquanto que o deslocamento virtual deve ser

tangente a mesma, e consequentemente o trabalho virtual desaparece. Para mostrar isto,
basta ver que, se f (r, t) = 0 é a equação da superfície, então um deslocamento virtual
deve ser consistente com o vínculo, ou seja, o ponto r e o ponto deslocado r + δr devem
pertencer à superfície no mesmo instante t:
f (r + δr, t) = 0 ⇒ f (r, t) + ∇f · δr = 0 ⇒ ∇ · δr = 0. (3.4.4)
Como ∇f é perpendicular à superfície no instante t, o deslocamento virtual δr é tangente

à superfície nesse instante.
Isto deixa de ser verdade se forças de deslizamento por atrito estão presente, e devemos
excluir tais sistemas da nossa formulação. A restrição não irá nos prejudicar, já que forças
de deslizamento por atrito são em suma fenômenos macroscópicos. Por outro lado, as
forças de rolamento por atrito não violam esta condição, pois as forças atuam em um
ponto no qual esta momentaneamente em repouso e podem não realizar trabalho em um
deslocamento infinitesimal consistente com o vínculo de rolamento. Observe que se a
partícula é restrita a uma superfície que está se movendo com o tempo, a força de vínculo
é instantaneamente perpendicular a esta superfície e o trabalho durante um deslocamento
virtual continua sendo nulo, mesmo que o trabalho durante o deslocamento real, no tempo
dt, não suma necessariamente, pois um deslocamento real dr se dá num intervalo de tempo
dt. Portanto, para que a partícula permaneça na superfície é preciso que
∂f
f (r + dr, t + dt) = 0 ⇒ ∇ · dr + dt = 0. (3.4.5)
∂t
Vê-se, assim, que dr não é tangente à superfície se ∂f /∂t 6= 0. Somente o deslocamento

virtual realizado a tempo fixo é tangente à superfície mesmo que ela esteja em movimento.
Temos portanto como condição para o equilíbrio de um sistema que o trabalho virtual
das forças aplicadas sja nulo:
X (a)
Fi · δri = 0 (3.4.6)
i
A Equação (3.4.6) é frequentemente chamada de principio dos trabalhos virtuais. Note

(a)
que os coeficientes de δri não podem mais ser definidos como nulos; i.e., em geral Fi 6= 0,
visto que os δri não são completamente independentes, mas são conectados pelos vínculos.
Afim de igualar os coeficientes a zero, devemos transformar o principio em uma forma que
envolva o deslocamento virtual dos qi , nos quais são independentes. A Equação (3.4.6)
satisfaz nossas ambições no sentido de não conter fi , contudo a mesma só funciona com a
estática; desejamos uma condição que envolva o movimento geral do sistema.
Para obter tal principio, usaremos um artificio pensado primeiro por James Bernoulli

e desenvolvido por D’Alembert. A equação do movimento,
Fi = ṗi ,
pode ser escrita como

Fi − ṗi = 0,
na qual afirma que uma partícula no sistema estará em equilíbrio sob uma igual a força
real mais uma ’força efetiva reversa’ −ṗi . Ao invés de (3.4.6), podemos imediatamente
escrever
X
(Fi − ṗi ) · δri = 0, (3.4.7)
i
e, novamente reduzindo para os termos das forças aplicadas e forças de vínculos, temos
como resultado
X (a) X
(Fi − ṗi ) · δri + fi · δri = 0,
i i
Iremos novamente nos restringir para sistemas cujo trabalho virtual das forças de vínculo
somem e portanto obtemos
X (a)
(Fi − ṗi ) · δri = 0 (3.4.8)
i
que é comumente chamado de principio de D’Alembert. Alcançamos assim o nosso ob-

jetivo, onde as forças de restrição já não mais aparecem, e o sobrescrito (a) pode ser
retirado sem ambiguidade. Apesar de ainda não estar em uma forma útil para fornecer
as equações do movimento para o sistema. Devemos então transformar o principio para
uma expressão que envolva o deslocamento virtual das coordenadas generalizadas, que
são independentes entre si (para vínculos holonômicos), devido a isso os coeficientes de
δqi podem ser igualados separadamente a zero.
A mudança de ri para a linguagem dos qj começa das equações de transformação
ri = ri (q1 , q2 , . . . , qn , t) (3.4.9)
(assumindo a existência de n coordenadas independentes), e é realizadas através da usual

’regra da cadeia’ do calculo diferencial parcial. Portanto, vi é expresso em termos de q̇k
pela fórmula
dri X ∂ri ∂ri
vi = = q̇k + . (3.4.10)
dt k
∂q k ∂t
Similarmente, um deslocamento arbitrário virtual δri pode ser relacionado com o deslo-
camento virtual δqi por
X ∂ri
δri = δqj (3.4.11)
j
∂qj
Observe que não há uma variação no tempo, δt, envolvida acima, visto que o deslocamento

virtual por definição considera somente o deslocamento das coordenadas. (Somente então
o deslocamento virtual é perpendicular à força de restrição se a própria restrição mudar
com o tempo.)
Em termos de coordenadas generalizadas, o trabalho virtual de Fi se torna
X X ∂ri
Fi · δri = Fi · δqj
i i,j
∂qj
X (3.4.12)
= Qj δqj ,
j
onde o Qj é chamado de componente da força generalizada, definido como
X ∂ri
Qj = Fi · (3.4.13)
i
∂qj
Note que como os q 0 s não precisam ter necessariamente dimensão de comprimento, os

Q0 s não precisam necessariamente terem dimensão de força, mas Qj δqj deve sempre ter
dimensão de trabalho. Por exemplo, Qj pode ser o torque Nj e dqj o ângulo diferencial
dθj , o que torna Nj dθj uma diferencial de trabalho.
Iremos olhar agora o outro termo (3.4.8), que pode ser escrito como
X X
ṗ · δri = mi r̈i · δri
i
Expressando δri pela Eq.(3.4.11), isto se torna

X ∂ri
mi r̈i · δqj
i,j
∂qj
Considere agora a relação

X ∂ri X d ∂ri d ∂ri
mi r̈i · = mi ṙi · − mi ṙi · (3.4.14)
i
∂qj i
dt ∂qj dt ∂qj
No último termo da Eq.(3.4.14) podemos intercambiar a diferenciação em relação a t e

qj , pois, em analogia com (3.4.10)

!
∂vi ∂ X ∂ri ∂ri
= q̇k +
∂qj ∂qj k
∂qk ∂t
X ∂ 2 ri ∂ri
= q̇k +
∂qk ∂qj ∂qj ∂t
k
(3.4.15)
X ∂ ∂ri ∂ ∂ri
= q̇k +
k
∂qk ∂qj ∂t ∂qj

d ∂ri
=
dt ∂qj
Pela Eq.(3.4.10) também vemos que

!
∂vi ∂ X ∂ri ∂ri
= q̇k +
∂ q˙j ∂ q˙j ∂qk ∂t
k (3.4.16)
∂ri
=
∂qj
Substituindo essas mudanças em (3.4.14) nos levam ao seguinte resultado

X ∂ri X d ∂vi ∂vi
mi r̈i · = mi vi · − mi vi ·
i
∂qj i
dt ∂ q̇ j ∂qj
" " !# !#
X d ∂ X1 ∂ X1
= mi vi2 − mi vi2
i
dt ∂ q̇ j i
2 ∂q j i
2
pois vi = vi (q, q̇, t), assim o segundo termo no lado esquerdo da Eq.(3.4.8) pode ser
expandido em
X d ∂ P 1
∂ P 1

2 2
i mi vi − i mi vi − Qj δqj
j
dt ∂ q̇ j 2 ∂q j 2
Identificando i 12 mi vi2 como a energia cinética do sistema T , o principio de D’Alembert

P
(Eq.(3.4.8)) se torna
X d ∂T ∂T
− − Qj δqj = 0. (3.4.17)
dt ∂ q̇j ∂qj
Note que em um sistema de coordenadas cartesianas, a derivada parcial de T com respeito

a qj desaparece. Portanto, falando na linguagem da geometria diferencial, este termo
surgem da curvatura das coordenadas qj . Em coordenadas polares, por exemplo, é na
derivada parcial de T em relação a uma coordenada angular que o termo da aceleração
centrípeta aparece.

Até agora, nenhuma restrição foi feita sobre a natureza das restrições, a não ser que
elas não devem realizar trabalho em um deslocamento virtual. Se, entretanto, os vínculos
são holonômicos, então é possível encontrar conjuntos de coordenadas independentes qj
nas quais possuem as condições de vínculo implicitamente nas equações de transformação
r = r1 (q1 , q2 , . . . , q3N −k , t)
..
.
rN = rN (q1 , q2 , . . . , q3N −k , t)
Qualquer deslocamento virtual δqj é então independente de δqk , e deste modo a única
forma na qual a Eq.(3.4.17) é válida é se cada coeficiente individual desaparece:

d ∂T ∂T
− − Qj (3.4.18)
dt ∂ q̇j ∂qj
Existem n equações deste tipo ao todo.

Quando as forças são deriváveis de uma função potencial escalar V ,
Fi = −∇i V
Consequentemente a força generalizada pode ser escrita como

X ∂ri X ∂ri
Qj = Fi · =− ∇i V · ,
i
∂qj i
∂q j
na qual é exatamente a mesma expressão para a derivada parcial da função −V (r1 , r2 , . . . , rN , t)

com respeito a qj :
∂V
Qj = − . (3.4.19)
∂qi
As Equações (3.4.18) podem então ser colocadas como

d ∂T ∂
− (T − V ) = 0 (3.4.20)
dt ∂ q̇j ∂qj
As equações do movimento na forma (3.4.20) não são necessariamente restritas a sistemas

conservativos, somente se V não é uma função explicita do tempo é que o sistema sera
conservativo. Como foi aqui definido, o potencial V não depende das velocidades gene-
ralizadas. Assim sendo, podemos incluir o termo V na derivada parcial com respeito a
q̇j :
d ∂(T − V ) ∂(T − V )
− = 0.
dt ∂ q̇j ∂qj

ou, definindo uma nova função, o Lagrangiano L, como
L = T − V, (3.4.21)
As Eqs.(3.4.18) tornam-se
d ∂L ∂L
− = 0, (3.4.22)
dt ∂ q̇j ∂qj
expressão conhecida como ’equações de Lagrange’.
Observe que, para um determinado conjunto de equações de movimento, não há escolha
única da Lagrangiana tal que as Eqs.(3.4.22) conduzam às equações de movimento nas
coordenadas generalizadas fornecidas. Iremos provar agora um teorema que será bastante
utilizado
Teorema 3.4.1. Se L é a Lagrangiana para um sistema de n graus de liberdade satisfa-

zendo as equações de Lagrange, então
d
L0 = L + F (q1 , . . . , qn , t) (3.4.23)
dt
também satisfaz as equações de Lagrange, onde F é qualquer função arbitrária dos seus
argumentos, contanto que seja diferenciável.
Demonstração: Temos que
dF X ∂F ∂F
= q̇j +
dt j
∂qj ∂t
Por hipótese sabemos que L = L0 − dF/dt satisfaz as equações de Lagrange, portanto,
∂L0 ∂L0

d d ∂ dF ∂ dF
− − + =0
dt ∂ q̇i dt ∂ q̇i dt ∂qi ∂qi dt
ou seja,
∂L0 ∂L0 X ∂ 2F ∂ 2F

d d ∂F
− = − q̇j +
dt ∂ q̇i ∂qi dt ∂qi j
∂qi ∂qj ∂qi ∂t
=0
pois observe que
d

∂F
X ∂ 2F ∂ 2F
= q̇j +
dt ∂qi j
∂qj ∂qi ∂t∂qi
Teorema 3.4.2. Seja q1 , . . . , qn um conjunto de coordenadas generalizadas independentes

de um sistema com n graus de liberdade, com Lagrangiana L(q, q̇, t). Suponha que ocorra

uma transformação para outro conjunto de coordenadas independentes s1 , . . . , sn através

de uma equação de transformação do tipo
qi = qi (s1 , . . . , sn , t), i = 1, . . . , N.
(Tal transformação é chamada de transformação ponto a ponto.) Mostre que se a função

Lagrangiana é expressa como função de sj , ṡj , e t através das equações de transformação,
então L satisfaz as equações de Lagrange com respeito as coordenadas s:

d ∂L ∂L
− = 0. (3.4.24)
dt ∂ ṡj ∂sj
Em outras palavras, a forma das equações de Lagrange é invariante sob uma transformação
ponto a ponto.
Demonstração: Temos que
∂ ∂L ∂qk ∂L ∂ q̇k
L(q, q̇, t) = +
∂sj ∂qk ∂sj ∂ q̇k ∂sj
(3.4.25)
∂L ∂qk
=
∂qk ∂sj
visto que q̇i = q̇i (ṡ1 , . . . , ṡn , t), e similarmente
∂ ∂L ∂qk ∂L ∂ q̇k
L(q, q̇, t) = +
∂ ṡj ∂qk ∂ ṡj ∂ q̇k ∂ ṡj
(3.4.26)
∂L ∂ q̇k
=
∂ q̇k ∂ ṡj
logo,
d ∂L ∂L d ∂L ∂ q̇k ∂L ∂qk
− = −
dt ∂ ṡj ∂sj dt ∂ q̇k ∂ ṡj ∂qk ∂sj
notemos que
∂qk ∂ q̇k
=
∂sj ∂ ṡj
portanto,
d ∂L ∂L d ∂L ∂L ∂qk
− = −
dt ∂ ṡj ∂sj dt ∂ q̇k ∂qk ∂sj
o termo em colchetes é nulo, pois por hipótese as equações de Lagrange são satisfeitas em
relação a qk , deste modo
d ∂L ∂L
− =0
dt ∂ ṡj ∂sj


3.5 Potenciais Dependentes da Velocidade e Função de Dissipa-

ção
As equações de Lagrange podem ser postas na forma (3.4.22) mesmo se não existir
uma função potencial, V , no sentido usual, contanto que a força generalizada seja obtida
de uma função potencial U (qj , q̇j ) pela seguinte forma

∂U d ∂U
Qj = − + . (3.5.1)
∂qj dt ∂ q̇j
Em tal caso, as Eqs.(3.4.22) continuam válidas por (3.4.18) com a Lagrangiana dada por
L = T − U. (3.5.2)
Aqui U pode ser chamado de ’potencial generalizado’, ou ’potencial dependente da ve-

locidade’. O interesse de usar tal ’potencial’ não é puramente acadêmico, já que pode
ser aplicado a um importante tipo de força de campo, a saber, forças eletromagnéticas
em cargas em movimento. Tendo em vista a sua importância, uma digressão sobre este
assunto vale a pena.
Considere uma carga elétrica Q(se estivermos trabalhando com coordenadas cartesi-
anas usaremos q), de massa m se movendo a velocidade, v, em uma região sem carga
contendo tanto um campo elétrico, E, quando um campo magnético, B, nos quais podem
depender do tempo e da posição. A carga sofre o efeito de uma força, chamada de força
de Lorentz, dada por
1
F = Q E + (v × B) . (3.5.3)
c
das equações de Maxwell (em unidades de Gauss)
1 ∂B
∇×E+ =0 (3.5.4)
c ∂t
e
B=∇×A (3.5.5)
onde A = A(q, t) é o potencial vetorial magnético, substituindo (3.5.5) em (3.5.4) obtém-

se
1∂
∇×E+ (∇ × A) = 0
c ∂t

1 ∂A
⇒∇×E+∇× =0
c ∂t

1 ∂A
⇒∇× E+ =0 (3.5.6)
c ∂t

porém, se o rotacional de um vetor K é nulo, segue que existe uma função ψ tal que
K = ∇ψ, logo aplicando isso em (3.5.6), segue que existe φ = φ(q, t) tal que
1 ∂A
E+ = −∇φ
c ∂t
1 ∂A
⇒ E = −∇φ − (3.5.7)
c ∂t
substituindo (3.5.5) e (3.5.7) em (3.5.3), obtemos

1 ∂A 1
F = Q −∇φ − + v × (∇ × A) (3.5.8)
c ∂t c
usando a identidade BAC − CAB, a saber
v × (∇ × A) = ∇(v · A) − (v · ∇)A
Ademais,
∂A dA ∂ dA
= − q̇i A= − (v · ∇)A
∂t dt ∂qi dt
logo
1 dA 1 1 1
F = Q −∇φ − + (v · ∇)A + ∇(v · A) − (v · ∇)A
c dt c c c

1 dA 1
⇒ F = Q −∇φ − + ∇(v · A) (3.5.9)
c dt c
assim,
∂ 1 dA 1 ∂
F =Q − φ− + (v · A) (3.5.10)
∂q c dt c ∂q
Porém, sabemos que
∂ d ∂
F =− U+ U (3.5.11)
∂q dt ∂ q̇
note que podemos reescrever (3.5.10) como

∂ Q ∂ d ∂ Q
F = −Q φ + (v · A) + − v·A
∂q c ∂q dt ∂ q̇ c
visto que, como A não depende de q̇, sua derivada parcial em relação ao mesmo será nula,
e ∂v/∂ q̇ = 1, deste modo temos que
Q
U = Qφ − (v · A) (3.5.12)
c

e a lagrangiana do sistema se torna
m Q
L=T −U = (v · v) − Qφ + (v · A) (3.5.13)
2 c
Consideremos apenas a componente x das equações de Lagrange,

Q ∂Ax ∂Ay ∂Az ∂φ 1 dAx
mẍ = vx + vy + vz −Q + (3.5.14)
c ∂x ∂x ∂x ∂x c dt
A derivada total temporal de Ax é relacionada com a derivada temporal da partícula

através de
dAx ∂Ax
= + v · ∇Ax
dt ∂t
(3.5.15)
∂Ax ∂Ax ∂Ax ∂Ax
= + vx + vy + vz .
∂t ∂x ∂y ∂z
A Equação (3.5.5) nos dá

∂Ay ∂Ax ∂Az ∂Ax
(v × B)x = vy − + vz − . (3.5.16)
∂x ∂y ∂x ∂z
Combinando estas expressões obtemos a equação do movimento na direção x

1
mẍ = q Ex + (v × B)x . (3.5.17)
c
Em uma comparação de componente por componente, Eqs.(3.5.17) e (3.5.3), mostrando

que a equação da força de Lorentz é derivada das Eqs.(3.5.5), (3.5.7) e (3.5.12).
Observe que se nem todas as forças atuando no sistema são derivadas de um potenciais,
então as equações de Lagrange também podem ser escritas na forma

d ∂L ∂L
− = Qj .
dt ∂ q̇j ∂qj
onde L contem o potencial das forças conservativas como antes, e Qj representa a força que
não surge de um potencial. Tal situação ocorre frequentemente quando forças de atrito
estão presente. Constantemente acontece da força de atrito ser proporcional a velocidade
da partícula, em tal situação sua componente x possui a forma
Ffx = −kx vx .
Forças de atrito deste tipo podem ser postas em termos de uma função F , conhecida
como função de dissipação de Rayleigh, e definida como
1X 2 2 2
F= (kx vix + ky viy + kz viz ). (3.5.18)
2 i

Onde o somatório é sob todas as partículas do sistema. Da sua definição fica claro que
∂F
F fx = − ,
∂vx
Ou, simbolicamente,
Ff = −∇v F . (3.5.19)
Também podemos dar uma interpretação física a função de dissipação. O trabalho feito
pelo sistema contra o atrito é
dWf = −Ff · dr
= −Ff · v dt
= (kx vx2 + ky vy2 + kz vz2 ) dt
consequentemente, 2F é a taxa de dissipação da energia devido ao atrito. A componente

da força generalizada resultante da força de atrito é então dada por
X ∂ri X ∂ri
Qj = Ffi · =− ∇v F ·
i
∂qj ∂qj
X ∂ ṙi
=− ∇v F · (3.5.20)
∂ q̇j
∂F
=− .
∂ q̇j
As equações de Lagrange com a presença de dissipação se tornam

d ∂L ∂L ∂F
− + = 0, (3.5.21)
dt ∂ q̇j ∂qj ∂ q̇j
devido a isso, duas funções escalares, L e F , devem ser especificadas para se obter as
equações do movimento. Um exemplo é a lei de Stokes, segundo a qual uma esfera de
raio a se movendo a velocidade v, em um meio de viscosidade η experimenta uma força
de arrasto Ff = 6πηav.
Até agora foi mostrado que, para sistemas onde podemos definir um Lagrangiano,
i.e., sistemas holonômicos com forças aplicadas derivadas de um potencial ordinário ou
generalizado e restrições que não realizam trabalho, temos uma maneira muito conveniente
de obter as equações do movimento. Fomos levados à formulação Lagrangiana pelo desejo
de eliminar as forças de restrição das equações do movimento e, ao atingir esse objetivo,
obtivemos muitos outros benefícios. As equações de Newton nos forçavam a trabalhar com
muitos vetores de força e aceleração. Com o método Lagrangiano apenas trabalhamos com
duas funções escalares, T e V , nas quais simplificam em muito o problema.
Uma receita de bolo simples pode agora ser estabelecida para todos os problemas da

mecânica aos quais a formulação Lagrangiana é aplicável. Temos apenas de escrever T e

V em coordenadas generalizadas, formar L com eles, e substituir em (3.4.22) para obter
as equações do movimento. A transformação necessária para levar T e V das coordenadas
cartesianas para as coordenadas generalizadas é obtida pelas equações de transformação
(3.4.8) . Portanto, T em geral é dado por
!2
X1 X1 X ∂ri ∂ri
T = mi vi2 = mi q̇j +
i
2 i
2 j
∂qj ∂t
É claro que ao se realizar a expansão, a expressão para T em coordenadas generalizadas

terá a forma
X 1X
T = M0 + Mj q̇j + Mjk q̇j q̇k , (3.5.22)
j
2 j,k
onde M0 , Mj , Mjk são funções definidas dos r0 s e t e consequentemente dos q 0 s e t. De

fato, uma comparação mostra que
X1 2
∂ri
M0 = mi ,
i
2 ∂t
X ∂ri ∂ri
Mj = mi · , (3.5.23)
i
∂t ∂qj
X ∂ri ∂ri
Mjk = mi ·
i
∂qj ∂qk
Logo, a energia cinética do sistema sempre poderá ser escrita como a soma de três funções
homogêneas das velocidades generalizadas,
T = T0 + T1 + T2 , (3.5.24)
onde T0 é independente das velocidades generalizadas, T1 é linear nas velocidades, e T2

é quadrático nas velocidades. Se as equações de transformações não possuem o tempo
explicitamente, como pode ocorrer quando os vínculos são independentes do tempo (es-
cleronômicos), então somente o último termo em (3.5.22) não desaparece, e T é sempre
da forma homogênea quadrática nas velocidades generalizadas.

3.6 Derivação das Equações de Lagrange pelo Princípio de Ha-

milton
3.7 Extensão do Princípio de Hamilton para Sistemas Não-Holonômicos
3.8 Vantagens da Formulação do Princípio Variacional
3.9 Teoremas de Conservação e Propriedades de Simetria
3.10 Função Energia e Conservação da Energia

CAPÍTULO 4 RELATIVIDADE ESPECIAL NA LINGUAGEM TENSORIAL
4 Relatividade Especial na Linguagem Tensorial

Antes de mais nada, devemos lembrar que este capítulo funciona tanto como uma
revisão dos conteúdos anteriores quanto como uma nova abordagem sobre os mesmos. No
fim do século dezenove, a comunidade de físicos tinha duas descrições incompatíveis da
natureza, a mecânica Newtoniana e a teoria eletromagnética de Maxwell. A mecânica
Newtoniana assumia que todos os referenciais inerciais são equivalentes, enquanto que
as equações de onda de Maxwell resultava em uma velocidade da luz universal que im-
plicava em um referencial inercial com preferência. Albert Einstein desenvolveu a teoria
especial da relatividade para substituir a mecânica Newtoniana com uma teoria que seja
consistente com a teoria eletromagnética incluindo sua implicação. Após uma breve pes-
quisa histórica, devemos rever as hipóteses da teoria especial e as consequências destas
hipóteses. Iremos então examinar o formalismo do cenário geométrico do espaço-tempo
resultante. Por último, desenvolveremos o formalismo Lagrangiano e tentaremos expressar
os resultados de uma forma relativística adequada.
4.1 Postulados Básicos da Teoria da Relatividade Especial

Einstein usou dois postulados para desenvolver o que se tornou conhecida como teoria
especial da relatividade:
1. As leis da física são as mesmas para todos os observadores inerciais.
2. A velocidade da luz é a mesma para todos os observadores inerciais.
Uma formulação da física que explicitamente incorpora estes dois postulados é dita
ser covariante. Visto que a velocidade da luz, c, é a mesma em todos os sistemas de
coordenadas, é razoável considerar o valor numérico de c como um fator de conversão
entre as unidades usadas na medição do espaço e as unidades utilizadas na mensuração
do tempo. Então, c dt é o intervalo temporal medido nas mesmas unidades que usamos
para medir unidades espaciais. Na unidade do sistema SI, c dt tem dimensão de metros.
Muitos livros e artigos em relatividade colocam c = 1 e medem tempo e espaço em metros.
No material que se segue, não faremos isso e mostrarem a dependência explicita de c.
Vimos que para satisfazer estes dois postulados, o espaço e o tempo da Relatividade
Especial consistem em um uma única entidade, na qual nos referimos como espaço-tempo.
Este espaço-tempo é uma estrutura geométrica dentro da qual representamos a física.
Além disso, sabemos que o quadrado da distância no espaço-tempo, d s2 , entre dois pontos
A e B é dado por
ds2 = c2 dt2 − dr2 (4.1.1)
onde o intervalo é entre os dois pontos A e B. O espaço quadridimensional é frequente-

mente chamado de espaço de Minkowski para distingui-lo do espaço Euclideano quadri-
dimensional. Visto que o intervalo entre dois eventos do espaço-tempo é uma quantidade

geométrica, todos os observadores inerciais medem coordenadas que preservam o valor do

intervalo quadrado, (ds)2 . Se S e S̄ são dois referenciais inerciais diferentes, então
ds̄2 = ds2 (4.1.2)
Portanto, (ds)2 é dito ser o quadrado de um intervalo do espaço-tempo invariante. Para

isto ser possível, as transformações entre as coordenadas em S̄ e S, devem envolver a
velocidade relativa entre os referenciais tanto nas partes espaciais quanto nas temporais;
ou seja, a coordenada temporal não pode ser mais independente da transformação. Isso
significa que a divisão relativa do espaço-tempo em espaço e tempo será diferente para
diferentes observadores inerciais. Uma vez que o tempo medido no referencial do labo-
ratório é diferente do medido por um observado em repouso com respeito ao corpo a ser
estudado, devemos distinguir estes tempos. Fazemos isto chamando o intervalo de tempo
medido por um relógio em repouso em relação ao corpo por tempo próprio do referencial
do corpo, enquanto o outro observador inercial utiliza um tempo no qual é frequentemente
categorizado como tempo do laboratório. Como um especial da Eq.(4.1.1), considere a re-
lação entre o tempo próprio, τ , mensurado por um observador em repouso com respeito
a um objeto no referencial S̄, no qual se move a uma velocidade, ~v , em respeito a um
referencial do laboratório S. No referencial de repouso do objeto, não existe movimento,
então as Eqs.(4.1.1) e (4.1.2) nos dão que:
2
2 2 2 dr̃
c (dτ ) = c(dt) − (dt)2
dt
= c(dt)2 − v 2 (dt)2
v2

2 2
= c (dt) 1 − 2
c
ou
dτ
dt = r (4.1.3)
v2
1− 2
c
Visto que (4.1.3) torna dτ < dt, este efeito em dt é chamado de ’dilatação do tempo’:
relógios em movimento aparentam se mover mais devagar.
4.2 Transformações de Lorentz

4.2.1 Transformações de Coordenadas
O conjunto mais simples de transformações que preservam a invariância do intervalo,

ds2 , é chamado de Transformações de Lorentz. Estas transformações são simples no
sentido de que elas são lineares nas coordenadas e caso a velocidade relativa vá para zero,
as transformações se tornam nas transformações identidade. Se considerarmos sistemas

de coordenadas cartesianos paralelos, S e S̄, cuja origem coincidem em t = t̄ = 0, e

possuem a velocidade relativa v ao longo do eixo x quando medida por S, e definamos
v 1
β= , e γ=p , (4.2.1)
c 1 − β2
então as seguintes quatro equações relacionam os dois conjuntos de coordenadas6
ct − βx
ct̄ = p = γ(ct − βx) (4.2.2)
1 − β2
x − βct
x̄ = p = γ(x − βct) (4.2.3)
1 − β2
ȳ = y (4.2.4)
z̄ = z. (4.2.5)
Como matriz, estas transformações aparecem como

    
ct̄ γ −γβ 0 0 ct
 0   
x  −γβ γ 0 0 x
 
 = (4.2.6)
y 0   0 0 1 0 y
 
  
z0 0 0 0 1 z
No limite β 1, Eqs.(4.2.6) se reduzem as transformações de Galileu, como é esperado.

A generalização para uma orientação arbitrária da velocidade relatividade aos eixos
é direta. Uma vez que estamos considerando o espaço-tempo como uma entidade qua-
dridimensional, esperaríamos lidar com vetores quadridimensionais. Utilizando a notação
(ct, x, y, z) = (ct, ~r), um único boost7 em uma direção arbitrária depende totalmente do
vetor8 velocidade relativa ~v com magnitude |~v | = v na qual não pode ser igual ou exceder
c, ou seja 0 ≤ v ≤ c.
Somente o tempo e as coordenadas paralelas a direção do movimento relativo se alte-
ram, enquanto coordenadas perpendiculares não. Com isto em mente, dividamos o vetor
espacial ~r medido por um observador F , e ~r̄ mensurado por um observador F̄ , em suas
6
Lembremos que provamos isto no capítulo: Fundamentos da Relatividade Especial.
7
Para uma definição formal do que é um boost veja a nota de rodapé 11 deste capítulo.
8
No material que se segue representaremos tri-vetores por setas com letras minúsculas, como o tri-vetor
~
~
posição ~r, já quadrivetores serão representados por letras maiúsculas como o quadrivetor velocidade U,
já tensores de segunda ordem em diante serão representados por letras em negrito, como o tensor métrico
η e matriz por um traço embaixo da letra, como a matriz de transformação de Lorentz Λ.

Figura 4.2.1: Um observador no referencial F ver F 0 se mover com velocidade ~v , enquanto

F 0 observa F se mover com velocidade −~v . Os eixos de coordenadas de cada referencial
permanecem paralelos e ortogonais. O vetor posição medido em cada referencial é dividido
em suas componentes paralelas e perpendiculares a direção do vetor velocidade relativa
~v . Esquerda: Configuração Padrão. Direita: Configuração Inversa.
componentes perpendiculares (⊥) e paralelas (k) a ~v .
~r = ~r⊥ + ~rk e ~r̄ = ~r̄⊥ + ~r̄k (4.2.7)
então as transformações são

~rk · ~v

ct̄ = γ ct − (4.2.8)
c

~v
~r̄k = γ ~rk − ct (4.2.9)
c
~r̄⊥ = ~r⊥ (4.2.10)
Onde · é o produto escalar usual. O fator de Lorentz γ continua com a mesma definição
para um boost arbitrário, já que o mesmo só depende da magnitude da velocidade relativa.
A definição β~ = ~v /c com magnitude 0 ≤ β < 1 é também usada por alguns autores.
Podemos expressar ~rk como função do vetor velocidade relativa unitário v̂, já que como
~rk é paralelo ao vetor velocidade relativa ~v , segue que ~rk = k~v onde k é uma constante,

dividindo ambos os lados por v, encontramos que
~rk ~v
= k = kv̂
v v
tomando a norma em ambos os lados, segue que k = r/v, daí
~rk r
= v̂
v v
multiplicando ambos os lados da igualdade por v, vemos que
(rv) (~r · ~v )
~rk = v̂ = v̂ = (~r · v̂)v̂ (4.2.11)
v v
onde usamos o fato de que como ~r é paralelo a ~v , segue que rv = (~r · ~v ). Pela primeira
equação em (4.2.7), têm-se que ~r⊥ = ~r − ~rk , aplicando a última equação a este resultado,
temos que
~r̄⊥ = ~r⊥ = ~r − (~r · v̂)v̂
aplicando (4.2.11) em (4.2.9), encontra-se:

h v i
~r̄k = γ (~r · v̂)v̂ − v̂ct
c
somando as duas equações anteriores, tendo em mente a segunda equação de (4.2.7),

acha-se: h v i
~r̄ = ~r − (~r · v̂)v̂ + γ (~r · v̂)v̂ − v̂ct (4.2.12)
c
utilizando do fato de que
~v
~v β~
v̂ = = vc = = β̂
v β
c
temos que (4.2.12) pode ser reescrita como:
~r̄ = ~r + (γ − 1)(~r · β̂)β̂ − βγ β̂ct
ou,
(β~ · ~r)β(γ
~ − 1)
~
~r̄ = ~r + − βγct (4.2.13)
β2
na qual fornece a relação entre os dois conjuntos de eixos quando estão alinhados. Uma
outra maneira de expressar esta expressão para velocidades arbitrárias é através da re-

~ = (ct̄, ~r̄), então9

~ = (ct, ~r) e X̄
presentação matricial consideremos X
~ = ΛX
X̄ ~ (4.2.14)
~ eX
Onde tratamos X̄ ~ como matrizes colunas (vetores) e Λ é a matriz simétrica
 
γ −γβx −γβy −γβz
2
−γβ 1 + (γ − 1) βx βx βy βx βz 

x (γ − 1) 2 (γ − 1) 2 
β2 β β 
 

Λ=
 βx βy βy2 βy βz  (4.2.15)
−γβy (γ − 1) 2 1 + (γ − 1) 2 (γ − 1) 2 
β β β 


 βx βz βz βy β2 
−γβz (γ − 1) 2 (γ − 1) 2 1 + (γ − 1) z2
β β β
ou se usarmos
x0 = ct, x1 = x, x2 = y x3 = z (4.2.16)
A transformação de Lorentz homogênea (4.2.14) pode ser escrita na forma
xµ̄ = Λµ̄0 x0 + Λµ̄1 x1 + Λµ̄2 x2 + Λµ̄3 x3 ≡ Λµ̄ν xν (4.2.17)
onde passamos a utilizar a convenção de soma sobre índices repetidos de Einstein: toda
vez que um índice aparecer repetido, tal como ν nesta última equação, deve-se efetuar
uma soma de 0 a 3 sobre tal índice. Convencionaremos, também, que índices gregos
tais como α, β, µ, ν, . . . assumem os valores 0, 1, 2, 3. Os coeficientes da transformação de
Lorentz Λµ̄ν são dados por (4.2.15), e podem ser dados na seguinte forma compacta:
Λ0̄0 = γ Λ0̄i = Λī0 = −γβi (4.2.18)
β i βj
Λīj = δ ij + (γ − 1) (4.2.19)
β2
Estas transformações mapeiam a origem de S e a origem de S 0 para (0, 0, 0, 0). Conse-
quentemente, a origem das coordenadas de ambos correspondem a mesma localização no
espaço-tempo. Se isto não for desejado, pode-se fazer uma simples translação, e obter a
forma mais geral da transformação:
~ = ΛX
X̄ ~ +C
~ (4.2.20)
~ é a translação espaço-temporal. Esta é a Trans-

onde Λ é a rotação espaço-temporal e C
formação de Poincaré ou Transformação de Lorentz inomogênea.
9
Tal transformação é chamada de Transformação de Lorentz homogênea.

4.3 Vetores, Tensor Métrico e Grupo de Lorentz

4.3.1 Vetores de Base
Façamos uma pequena digressão. Considere uma curva arbitrária unidimensional em

um espaço 4-dimensional, X,~ descrita por um parâmetro λ, onde para um dado λ as
coordenadas do ponto da curva podem ser escritas como x0 (λ), x1 (λ), x2 (λ), x3 (λ). Em
textos introdutórios um 4-vetor, T~ , é definido por esta curva como uma flecha cuja cauda
está localizada no evento A pertencente a curva e cabeça está em um evento B onde
T~A B = X ~B − X
~ A . Entretanto, ao invés de definir o vetor nos dois pontos, podemos
utilizar o parâmetro λ, no qual é a medida do comprimento ao longo da curva de A até
B, escrevendo !
d ~
X
T~A B = (4.3.1)
dλ
λ=0
Tal 4-vetor é o vetor tangente a curva. Iremos adotar a notação de que as componentes
de vetores são escritas com sobrescritos tal como T 0 , T 1 , T 2 , T 3 .Apesar da maneira como
desenhamos vetores tangentes, eles não possuem qualquer extensão no espaço-tempo. As
flechas que desenhamos simplesmente nos ajudam a visualizar o vetor. Em cada ponto
ao longo da curva, o vetor tangente possui direção e magnitude. Para curvas que são do
tipo-tempo, o tempo próprio, τ , é a escolha usual para o parâmetro λ. As coordenadas
do laboratório são então x0 = ct(τ ), x1 = x(τ ), x2 = y(τ ), x3 = z(τ ), e a tangente a esta
~ de uma partícula viajando ao longo da curva X.
curva é a quadrivelocidade, U, ~ A Equação
(4.3.1) torna-se
d(ct) dxi
u0 = = γc, ui = = γv i (4.3.2)
dτ dτ
onde v i = dxi / dτ é a normal tri-velocidade com (~v )2 = (v x )2 + (v y )2 + (v z )2 . Visto que
a 4-velocidade de uma partícula é definida sob uma variedade de parâmetros λ, existe
um conjunto infinito de 4-velocidades para a partícula, um para cada valor de λ. Esse
conjunto de vetores é denominado um campo vetorial.
Em um referencial O existem quatro vetores especiais, definidos por suas componentes:
ê0 = (1, 0, 0, 0)
ê1 = (0, 1, 0, 0)
(4.3.3)
ê2 = (0, 0, 1, 0)
ê3 = (0, 0, 0, 1)
chamamos estes vetores de vetores de base do referencial O, e eles possuem a propriedade
especial de que qualquer vetor no referencial O pode ser escrito como uma combinação

~ = (A0 , A1 , A2 , A3 ), então
linear deles, isto é, se A
~ = A0 ê0 + A1 ê1 + A2 ê2 + A3 ê3

A
(4.3.4)
= Aα êα .
Geralmente, cada referencial possui seu próprio vetor de base, e pela Equação (4.3.3)
podemos ver que a β-ésima componente de êα é 1 se β = α e 0 se β 6= α, ou de outra
forma
(êα )β = δ βα (4.3.5)
A discussão que nos levou a Eq.(4.3.4) poderia ter sido aplicada para qualquer referencial,
então a mesma deve ser válida para um referencial Ō:
~ = Aβ̄ êβ̄
A
Porém, o conjunto {Aβ̄ } é diferente de {Aα }, assim como o conjunto {êβ̄ } é diferente de
~ é covariante, e as duas somas são as mesmas:
{êα }, contudo por definição o forma de A
Aα êα = Aβ̄ êβ̄ (4.3.6)
e isto possui uma consequência importante: através desta equação deduziremos a lei de
transformação para os vetores de base, i.e., a relação entre {êα } e {êβ̄ }. Lembremos que
Aβ̄ = Λβ̄ α Aα , logo
Aα êα = Λβ̄ α Aα êβ̄
⇒ Aα (êα − Λβ̄ α êβ̄ ) = 0

~ é um vetor
esta equação deve ser verdadeira para todos os conjuntos {Aα }, visto que A
arbitrário, deduzimos que
êα = Λβ̄ α êβ̄ (4.3.7)
Isto nos dá a lei pela qual a mudança dos vetores de base obedece. Não é uma trans-
formação de componentes: Tal equação nos dá a base {êα } de O como uma combinação
linear da base {êβ̄ } de Ō.
A única coisa que a transformação de Lorentz Λβ̄ α depende é da velocidade relativa
entre os referenciais. Vamos por um momento mostrar isto explicitamente escrevendo
Λβ̄ α = Λβ̄ α (~v ).
Então,
êα = Λβ̄ α (~v )êβ̄ . (4.3.8)
Se a base de O é obtida de Ō pela transformação com velocidade ~v , então o reverso deve

também ser possível, se usarmos −~v . Portanto, devemos ter que
êµ̄ = Λν µ̄ (−~v )êν . (4.3.9)
Nesta equação usei ν e µ̄ nos índices para evitar confusão com a fórmula anterior. Podemos
fazer µ̄ = β̄, já que o mesmo se trata de um índice livre, na Eq.(4.3.9) e então substituir
o resultado na Eq.(4.3.8) para obter que:
êα = Λβ̄ α (~v )Λν β̄ (−~v )êν (4.3.10)
visto que os vetores de base são linearmente independentes, segue que nenhum deles pode
ser escrito como uma combinação linear dos demais, e portanto a igualdade acima nos
permite deduzir que se α 6= ν, então Λβ̄ α (~v )Λν β̄ (−~v ) = 0, pois êα não pode ser escrito
como uma combinação linear dos êν , isto é, são L.I., e se α = ν, então Λβ̄ α (~v )Λν β̄ (−~v ) = 1,
pois trata-se do mesmo vetor, deste modo
Λβ̄ α (~v )Λν β̄ (−~v ) = δ να ,
isto implica que

êα = δ να êν (4.3.11)
na qual é uma identidade.

Vamos mudar a ordem da multiplicação acima e escrever a importante fórmula
Λν β̄ (−~v )Λβ̄ α (~v ) = δ να . (4.3.12)
Isto expressa o fato de que a matriz [Λν β̄ (−~v )] é a inversa de [Λβ̄ α (~v )], já que a soma em β̄
é exatamente a operação que realizamos quando multiplicamos duas matrizes. A matriz
(δ να ) é, é claro, a matriz identidade.
A expressão para a mudança das componentes de um vetor,
Aβ̄ = Λβ̄ α Aα
também possui inversa. Multipliquemos ambos os lados por Λν β̄ (−~v ) e somemos em β̄.
Obtemos
Λν β̄ (−~v )Aβ̄ = Λν β̄ (−~v )Λβ̄ α (~v )Aα
= δ να Aα
= Aν .
Que nos diz que as componentes de A ~ em O são obtidas de Ō através de uma transfor-
mação de Lorentz com −~v , o que, é claro, está correto.

4.3.2 Vetores e Tensor Métrico
Pela definição, as componentes de qualquer 4-vetor podem ser expressas por valores
das projeções do vetor ao longo de um conjunto de vetores de base, ê0 , ê1 , ê2 , ê3 , onde as
coordenadas são medidas ao longo da direção dada por tais vetores. A posição de um
~ ) é escrito como:
ponto da curva X(τ
~ ) = xµ êµ
X(τ (4.3.13)
Em particular, a 4-velocidade dada na Eq.(4.3.2) se torna
~ µ
~ = dX = dx êµ = uµ êµ
U (4.3.14)
dτ dτ
A magnitude da 4-velocidade é um escalar cujos valores variam a medida que λ muda.

Este conjunto de magnitudes é um exemplo de campo escalar. Para converter um 4-
campo vetorial para um campo escalar, precisamos do que é chamado de funcional. Um
funcional é uma função cujo argumento são funções., no qual pode converter um par
de vetores em uma função escalar em cada ponto do espaço-tempo. Em outras palavras,
desejamos definir o produto escalar de dois vetores ou de campos vetoriais. Esta conversão
de um 4-campo vetorial (ou dois diferentes campos vetoriais) para um campo escalar é
um exemplo de mapeamento. Se ambos os vetores são os mesmos, então este escalar seria
o quadrado do comprimento do vetor, e quando os vetores são diferentes, é chamado de
produto escalar de vetores. Tal funcional é chamado de tensor métrico, η.10 O funcional
tensor métrico pode ser considerado como uma maquina com dois slots (ambos sendo
linear) na qual você insere dois vetores para produzir um escalar (uma função de valor
real). Isto é,
η(~u, ~v ) = η(~v , ~u) = ~u · ~v (4.3.15)
é o produto escalar. Em particular, se os vetores de base são colocados na métrica,
ηαβ = η(êα , êβ ) = êα · êβ . (4.3.16)
O ηαβ são as componentes de um tensor métrico associado com a base de vetores êα . Por
exemplo, considere o espaço de Minkowski bidimensional com coordenadas ct e x e um
vetor ~v = (a, b). Então η(~v , ~v ) = a2 − b2 e η00 = 1, η11 = −1.
A forma de ηαβ é definida através da forma para o intervalo. Isto nos sugere considerar
pequenos deslocamentos. Se o vetor deslocamento relativo entre dois pontos é pequeno,
ele pode ser escrito como
dζ~ = ∆xα êα (4.3.17)
10
Iremos definir isto de uma forma mais formal posteriormente.

Reescrevendo a Eq.(4.3.17) na forma usual. Vemos que para coordenadas de Minkowski
(∆s)2 = dζ~ · dζ~ = ∆xα ∆xβ êα · êβ = ηαβ ∆xα ∆xβ
= (c∆t)2 − (∆x)2 − (∆y)2 − (∆z)2 .
Para deslocamentos infinitesimais isto pode ser escrito como
ds2 = ηαβ dxα dxβ (4.3.18)
que permanece válida para qualquer tensor métrico. O tensor métrico para o sistema de
coordenadas de Minkowski, usando a convenção + − −−, possui a seguinte representação
tensorial 11  
1 0 0 0
 
0 −1 0 0 
η= 0 0 −1 0 
 (4.3.19)
 
0 0 0 −1
O produto escalar de dois vetores nesse sistema de coordenadas é
~ ·V
U ~ = uα v β ηαβ = u0 v 0 − u1 v 1 − u2 v 2 − u3 v 3 (4.3.20)
4.3.3 Grupo de Lorentz
A transformação de Lorentz mais geral possível é definida como qualquer transforma-

ção linear da forma xµ̄ = Λµ̄α xα que deixa ds2 invariante, isto é
ds2 = ηαβ dxα dxβ = ds̄2 = ηµ̄ν̄ dxµ̄ dxν̄ = ηµ̄ν̄ Λµ̄α dxα Λν̄ β dxβ (4.3.21)
para deslocamentos dxs arbitrários. Assim, resulta
Λµ̄α ηµ̄ν̄ Λν̄ β dxα dxβ = ηαβ dxα dxβ (4.3.22)
donde, face à arbitrariedade dos dx
Λµ̄α ηµ̄ν̄ Λν̄ β = ηαβ (4.3.23)
Esta é a equação que caracteriza Λ como matriz de uma transformação de Lorentz. Em

notação matricial a Eq.(4.3.23) equivale a
ΛT ηΛ = η (4.3.24)
11

A notação utilizada para representar uma matriz é , enquanto para tensores é usada . Matrizes
são usadas para relacionar diferentes referenciais de coordenadas, enquanto que tensores são objetos físicos
geométricos.

Multiplicando esta última equação pela direita por η e notando que η 2 = I (para provar
isto basta multiplica a matriz da métrica por ela mesma, uma forma mais formal e menos
trabalhosa será mostrada até o fim do capítulo) , resulta ΛT ηΛη = I, o que mostra que
ΛT η é a inversa de Λη. Como a inversa de uma matriz pela esquerda coincide com a
inversa pela direita, temos também ΛηΛT η = I, donde
ΛηΛT = η (4.3.25)
que é uma condição equivalente a (4.3.24). Uma transformação de Lorentz é uma espécie
de rotação no espaço-tempo, e a matriz associada é ortogonal em relação à métrica η do
espaço de Minkowski.
Agora iremos provar que o conjunto das transformações de Lorentz formam um grupo,
chamado de grupo de Lorentz. Lembremos antes da definição de grupo:
Um conjunto forma um grupo quando para dois elementos do conjunto, digamos x1 e
x2 , o ’produto’ x1 x2 possa ser definido de tal forma que:
1.(Fechamento) O produto x1 x2 pertence ao conjunto.
2.(Associatividade) Para quaisquer elementos x1 , x2 e x3 do conjunto, (x1 x2 )x3 =
x1 (x2 x3 ).
3.(Identidade) Existe um elemento identidade I no conjunto que satisfaz Ix = xI = x
para qualquer elemento x.
4.(Inverso) Para qualquer elemento x, existe um elemento x−1 no conjunto que satisfaz
x−1 x = xx−1 = I.
No nosso caso, o conjunto é todas as matrizes 4 × 4 que satisfazem ΛT ηΛ = η,
e tomaremos a multiplicação ordinária de matrizes como o ’produto’ no qual define o
grupo.
A prova é direta:
1. Suponha Λ1 e Λ2 pertencem ao conjunto12 . Então,13
(Λ1 · Λ2 )T η(Λ1 · Λ2 ) = ΛT2 · ΛT1 ηΛ1 · Λ2 = ΛT2 ηΛ2 = η (4.3.26)
2. A multiplicação de matrizes é, de fato, associativa:
(Λ1 · Λ2 ) · Λ3 = Λ1 · (Λ2 · λ3 ) (4.3.27)
3. A matriz identidade I pertence ao conjunto (I T ηI = η), e satisfaz I · Λ = Λ · I = Λ

para qualquer elemento.
4. Primeiro devemos mostrar que det Λ 6= 0, pois é a condição para existência da
12
Ou seja, ΛT1 ηΛ1 = η e ΛT2 ηΛ2 = η.
13
Lembre-se de que (A · B)T = B T · AT .

matriz inversa. Deste modo, tomemos o determinante de ΛT ηΛ = η,14
det ΛT det η det Λ = det η ⇒ (det Λ)2 = 1, (4.3.28)

| {z } | {z } | {z }
det Λ −1 −1
Portanto, det Λ 6= 0 e consequentemente sua inversa existe. Provemos agora que pertence
ao conjunto: multiplicando ΛT ηΛ = η por (Λ−1 )T pelo lado esquerdo e por Λ−1 pelo lado
direito,
(Λ−1 )T · ΛT η Λ · Λ−1 = (Λ−1 )T ηΛ−1
| {z } | {z }
(Λ·Λ−1 )T =I I
⇒ η = (Λ−1 )T ηΛ−1 (4.3.29)
isto completa a prova de que Λ formam um grupo desde que satisfaçam (4.3.25).
Vale ressaltar que a definição (4.3.25) das transformação de Lorentz abrange uma
classe muito mais ampla de transformações lineares do que as transformações de Lorentz
puras da forma (4.2.14). Por exemplo, uma rotação dos eixos espaciais constitui uma
transformação de Lorentz consoante com a nossa definição geral, pois não afeta o tempo e
deixa invariante a distância espacial entre dois pontos. A inversão espacial t̄ = t, ~r̄ = −~r
e a inversão temporal t̄ = t, ~r̄ = ~r também constituem exemplos de transformações de
Lorentz, pois ambas preservam ds2 .
De (4.3.28) segue que
det Λ = ±1 (4.3.30)
Uma transformação de Lorentz com determinante +1 é dita própria, e é dita imprópria

se o determinante é −1. Qualquer transformação de Lorentz pura é própria.
Tomando α = β = 0 em (4.3.23) obtém-se
1 = η00 = Λµ̄0 ηµ̄ν̄ Λν̄0 = (Λ0̄0 )2 − (Λ1̄0 )2 − (Λ2̄0 )2 − (Λ3̄0 )2 , (4.3.31)
isolando (Λ0̄0 )2 , encontra-se:
(Λ0̄0 )2 = 1 + (Λ1̄0 )2 + (Λ2̄0 )2 + (Λ3̄0 )2 ≥ 1 (4.3.32)
donde, finalmente
Λ0̄0 ≥ +1 ou Λ0̄0 ≤ −1 (4.3.33)
Se Λ0̄0 ≥ +1 a transformação de Lorentz é dita ortócrona (preserva o sentido do tempo); se

Λ0̄0 ≤ −1 a transformação de Lorentz é dita não-ortócrona (inverte o sentido do tempo).
Qualquer transformação de Lorentz pura, que conecta referenciais com eixos paralelos e
14
Se lembre da propriedade det(M ·N ) = det M det N com M e N sendo matrizes quadradas de mesmo
rank.

em movimento relativo com velocidade constante, é ortócrona.15 Uma inversão temporal

é uma transformação de Lorentz não-ortócrona. As transformações próprias e ortócro-
nas são chamadas de transformações de Lorentz restritas. As transformações de Lorentz
infinitesimais desempenham um papel muito importante no estudo das propriedades do
grupo de Lorentz. Assim, se por exemplo um vetor difere de outro apenas infinitesimal-
mente, então x0 = x + δx = (1 + δω)x, onde δωx = δx, deste modo iremos definir uma
transformação infinitesimal como
xµ̄ = Λµ̄ν xν + µ̄

= (δ µ̄ν + ω µ̄ν )xν + µ̄
logo,
xµ̄ − δ µ̄ν xν = ω µ̄ν xν + µ̄
⇒ δxµ̄ = ω µ̄ν xν + µ̄
Uma transformação de Lorentz infinitesimal é necessariamente restrita porque só difere

infinitesimalmente da transformação identidade, que é própria e ortócrona, e uma varia-
ção infinitesimal não pode provocar um salto finito nem em Λ0̄0 nem no determinante de
Λ. Portanto, somente as transformações de Lorentz restritas podem ser construídas por
aplicação de sucessivas transformações de Lorentz infinitesimais. A presente discussão
estabelece que o conjunto das transformações de Lorentz se decompõe em quatro subcon-
juntos disjuntos, chamados de setores do grupo de Lorentz e denotados por L↑+ , L↓+ , L↑− e
L↓− .
L↑+ : det Λ = +1 e Λ0̄0 ≥ +1

L↑+ : det Λ = +1 e Λ0̄0 ≤ −1
L↓− : det Λ = −1 e Λ0̄0 ≥ +1
L↓− : det Λ = −1 e Λ0̄0 ≤ −1
O conjunto das transformações de Lorentz restritas L↑+ é o único setor que forma um
subgrupo do grupo de Lorentz. Este subgrupo é chamado de grupo de Lorentz restrito.
A única parte não trivial da demonstração de que L↑+ constitui um grupo é a verificação
de que o produto de duas matrizes de Lorentz ortócronas é também uma matriz ortócrona.
Sejam Λ e Λ̄ duas transformações de Lorentz ortócronas consecutivas e seja Λ̄¯ = Λ̄ · Λ.
¯ µ̄ = Λ̄µ̄ Λα , de modo que
Então Λ̄ β α β
¯ 0̄ = Λ̄0̄ Λ0 + Λ̄0̄ Λ1 + Λ̄0̄ Λ2 + Λ̄0̄ Λ3

Λ̄ (4.3.34)
0 0 0 1 0 2 0 3 0
15
As transformações de Lorentz puras também costumam ser chamadas de ’boosts’, deste modo um
boost é uma transformação de Lorentz na qual conecta referenciais com eixos paralelos e em movimento
relativo com velocidade constante.

Pondo ~a = (Λ̄0̄1 , Λ̄0̄2 , Λ̄0̄3 ), ~b = (Λ1̄0 , Λ2̄0 , Λ3̄0 ) e usando (4.3.32) bem como sua análoga
decorrente de (4.3.25), ficamos com
¯ 0̄ = √1 + a2 √1 + b2 + ~a · ~b,
Λ̄ (4.3.35)
0
onde a = |~a| e b = |~b|. Mas

√ √ √ p
1 + a2 1 + b2 = 1 + a2 + b2 + a2 b2 = (1 + ab)2 + (a − b)2 ≥ 1 + ab (4.3.36)
donde
¯ 0̄ ≥ 1 + ab + ~a · ~b
Λ̄ (4.3.37)
0
¯ 0̄ ≥ 1, como queríamos demonstrar.

Levando em conta que ~a · ~b ≥ −ab, obtemos Λ̄ 0
4.3.4 Adição de Velocidades e Precessão de Thomas
A transformação de Lorentz homogênea mais geral irá envolver tanto uma variação
de velocidade quanto uma rotação de coordenadas. A transformação de velocidade é
denominada boost e possui a forma da Eq.(4.2.15). Qualquer transformação de Lorentz
homogênea, Λ, pode ser escrita como
Λ = R · Λ0 = Λ00 · R0 (4.3.38)
onde R é a matriz de rotação usual, e Λ0 , no qual é chamado de transformação de Lorentz

restrita ou própria, corresponde a um boost puro. Visto que R não é simétrico e Λ0
é simétrico, Λ será, em geral, não simétrico. Também, dado que Λ0 e R são matrizes,
R · Λ0 6= Λ0 · R. Deve existir outras duas transformações Λ00 e R0 tal que R · Λ0 = Λ00 · R0 .
Para qualquer transformação de Lorentz, Λ, existe uma transformação inversa, Λ−1 ,
tal que
Λ · Λ−1 = Λ−1 · Λ = I (4.3.39)
onde I é a matriz diagonal unitária 4 × 4 com elementos δαβ . A existência de um inverso

coloca quatro restrições nos elementos da diagonal e seis nos elementos fora da diagonal,
resultando em um total de dez restrições na transformação de Lorentz. Existem então
somente seis componentes independentes. Três dessas correspondem as componentes do
vetor velocidade relativa e três correspondem aos ângulos de Euler da rotação.
Considere três sistemas inerciais, S1 , S2 e S3 , com o eixo x alinhado. Façamos S2 ser
movido a uma velocidade v ao longo da direção x comum em relação a S1 e deixemos
S2 ser movido a uma velocidade v 0 ao longo da direção x comum com respeito a S2 . A

transformação de Lorentz de S1 para S3 é dada por

   
γ0 −γ 0 β 0 0 0 γ −γβ 0 0
 0 0
γ0
  
−γ β 0 0 −γβ γ 0 0 
Λ1−3 = · 
 0 0 1 0  0 0 1 0 
   
0 0 0 1 0 0 0 1
  (4.3.40)
γγ 0 (1 + ββ 0 ) −γγ 0 (β + β 0 ) 0 0
−γγ 0 (β + β 0 ) γγ 0 (1 + ββ 0 ) 0 0
 
= 

 0 0 1 0
0 0 0 1
Façamos β 00 ser a velocidade de S3 em relação a S1 e γ 00 o fator associado, então Λ1−3

pode ser escrito como uma única transformação de Lorentz com a velocidade β 00 e o seu
associado γ 00 como  
γ 00 −γ 00 β 00 0 0
 00 00 00

−γ β γ 0 0 
Λ1−3 =  0
 (4.3.41)
 0 1 0 

0 0 0 1
e, visto que estas duas formas de Λ1−3 devem ser as mesmas, temos ao comparar os termos
da segunda linha e segunda coluna de ambas as matrizes
1 (1 + ββ 0 )
p =p p
1 − β 002 1 − β 2 1 − β 02
elevando ambos os lados ao quadrado e invertendo
(1 − β 2 )(1 − β 02 )
1 − β 002 =
(1 + ββ 0 )2
isolando-se β 00
002 (1 − β 2 )(1 − β 02 ) (1 + ββ 0 )2 − (1 − β 2 )(1 − β 02 )

β =1− =
(1 + ββ 0 )2 (1 + ββ 0 )2
1 + 2ββ 0 + β 2 β 02 − 1 + β 2 + β 02 − β 2 β 02
=
(1 + ββ 0 )2
β 2 + 2ββ 0 + β 02 (β + β 0 )2
= =
(1 + ββ 0 )2 (1 + ββ 0 )
tirando a raiz, obtém-se finalmente
00β + β0
β = (4.3.42)
1 + ββ 0
Esta é a equação da adição de velocidades relativísticas para velocidades paralelas.

O produto de quaisquer duas transformações, Λ1 e Λ2 é também uma transformação

de Lorentz, Λ3 . Tal uma transformação de Lorentz irá, em geral, envolver não somente
um boost, mas também irá incluir uma rotação dos eixos de coordenadas. Se tanto Λ1
quanto Λ2 são boosts puros, mas suas velocidades não são paralelos, então Λ3 irá envolver
uma rotação em adição a um boost. Esta rotação é chamada de rotação da precessão
de Thomas. A forma usual para a precessão de Thomas assume que o segundo boost,
Λ2 possui uma velocidade pequena se comparada ao primeiro boost, Λ1 e também que a
mesma é pequena se comparada a velocidade da luz. Por exemplo, a precessão de Thomas
pode ser observada para um giroscópio orbitando a Terra ou para elétrons em átomos.
Considere três referenciais inerciais S1 , S2 , e S3 , com S2 se movendo a uma velocidade
β~ com respeito a S1 E S3 se movendo a uma velocidade β~ 0 com respeito a S2 . Sem perca
de generalidade, podemos tomar o eixo de S1 de tal forma que β~ é ao longo do eixo x de
S1 e β~ 0 encontra-se no plano x0 y 0 de S2 ; isto é, β, β 0 define o plano x0 , y 0 de S2 . Façamos
Λ representar a transformação de S1 para S2 e Λ0 a transformação de S2 para S3 com γ
e γ 0 associados a β~ e β~0 respectivamente. Então,
 
γ −γβ 0 0
 
−γβ γ 0 0 
Λ=
 0
 (4.3.43)
 0 1 0
0 0 0 1
e  
γ0 −γ 0 βx0 0 −γ 0 βy0 0 0

β 020 βx0 0 βy0 0 
−γ βx0 1 + (γ 0 − 1) x02
 0 0
(γ 0 − 1) 02 0

Λ0 = 
 β β 
(4.3.44)
0 0
β 0 β 0 βy020 
 −γ βy (γ 0 − 1) x 02y
 0 0 0
1 + (γ − 1) 02 0

 β β 
0 0 0 1
Assumamos que as componentes de β~ 0 são pequenas o suficiente e somente precisam ser

consideradas até primeira ordem dada pela multiplicação de matrizes da Eq.(4.3.43) e
(4.3.44)  
γγ 0 −γγ 0 β −γ 0 βy0 0 0
 
00 0
 −γβ γ 0 0
Λ =Λ ·Λ= −γγ 0 β 0 γβγ 0 β 0 0
 (4.3.45)
 y 0 y γ 0

0 0 0 1
Visto que Λ00 não é simétrico, ele deve então corresponder a uma rotação e um boost.
Devemos escrever a velocidade de S3 quando observada por S1 por β~ 00 .
Visto que os elementos fora da diagonal correspondentes ao eixo z são nulos, esta
rotação é em relação a um eixo perpendicular ao plano xy. O boost de S1 para S3 é
denotado por Λ00 , e iremos assumir que β~ 0 é pequeno se comparado a β~ e muito pequeno

se comparado a velocidade da luz (γ 0 ≈ 1). Então, até primeira ordem, as componentes

não nulas de β 00 são (dado que a velocidade perpendicular a x é pequena, podemos ignora-
la até primeira ordem a distinção entre y, y 0 , e y 00 )
βy0
βx00 = β, βy00 = , β 002 = β 2 , e γ 00 = γ, (4.3.46)
γ
e a Eq.(4.3.45) se torna
 
γ 00 −γ 00 βx00 −γ 00 βy00 0
 00 00
γ 00

00
−γ βx 0 0
Λ ≈−γ 00 β 00 γ 00 β 00 β 00
 (4.3.47)
 y x y 1 0

0 0 0 1
Nesta aproximação, uma transformação de Lorentz pura de S3 para S1 (a transformação

inversa) seria correspondente a um boost extenso no eixo x00 de −βx00 e um pequeno boost
no eixo y 00 de −βy00 . O boost de Lorentz para tal transformação é
 
γ 00 γ 00 βx00 γ 00 βy00 0

 00 00 βy00 
γ βx γ 00 (γ 00 − 1) 00 0

Λ3−1 =
 βx 
(4.3.48)
00
 00 00 β y

γ βy (γ 00 − 1) 00 1 0

 βx 
0 0 0 1
Finalmente, a matriz de rotação induzida pela rotação de S1 para S3 , após alguma sim-
plificação algébrica e desprezando alguns termos de ordem alta em β~ 00 , é
 
1 0 0 0
 βy00 
0 1 (γ − 1) 0
 
R = Λ00 · Λ3−1 =
 β 
(4.3.49)
βy00 
0 −(γ − 1) 1 0
 
 β 
0 0 0 1
O que mostra que R implica que S3 é rotacionado com respeito a S1 em relação ao eixo
z através de um ângulo infinitesimal:
βy00

γ−1
∆Ω = (γ − 1) = βy00 β . (4.3.50)
β β2

4.4 Forma-1 e Tensores

4.4.1 Definições de Tensores
Faremos a seguinte definição de um tensor:
Definição 4.4.1. Um tensor do tipo N0 é uma função de N vetores nos números reais,

na qual é linear em cada um dos seus N argumentos.
Vejamos o que esta definição significa. Neste momento, iremos apenas aceitar a nota-
ção N0 ; sua justificação virá mais tarde. A regra para o produto escalar, satisfaz a nossa

definição de um tensor 02 . É uma lei que toma dois vetores, por exemplo A ~ e B,
~ e produz

um único número real A ~ · B.

~ Para ver que o mesmo é linear nos seus argumentos, vejamos
que a linearidade no primeiro argumento é o mesmo que
~ ·B~ = (αaµ )bν ηµν = α(aµ bν )ηµν = α(A~ · B)

~


 (αA)
e (4.4.1)
 ~ ~ ~

~ ·C~ +B
~ ·C
~
(A + B) · C = (a + b )c ηµν = aµ cν ηµν + bµ cν ηµν = A
µ µ ν
enquanto que no segundo argumento
~ · (β B)
A ~ = β(A
~ · B)
~
~ · (B
A ~ + C)
~ =A~B
~ +A ~C
~
Para nos proporcionar uma concretude para esta noção de produto escalar como sendo
um tensor, lembremos que o tensor métrico η é por definição
~ B)
η(A, ~ =A
~ · B.
~ (4.4.2)
Então pela discussão anterior, η( , ) é uma função na qual se toma dois argumentos, e
que é linear
η(αA ~ + β B,
~ C)
~ = αη(A,~ C)
~ + βη(B,
~ C),
~ (4.4.3)
e similarmente para o segundo o argumento. O valor de η nos dois argumentos, denotado

~ B),
por η(A, ~ é o produto escalar, um número real.
Observe que a definição de tensor não faz menção as componentes dos vetores. Um
tensor deve ser uma regra na qual nos dá o mesmo número real independente do referencial
inercial, cujas componentes do vetor é calculado. Isto nos permite considerar o tensor
como uma função dos vetores neles mesmos ao invés de em suas componentes, e isto
pode, algumas vezes, nos ajudar conceitualmente.
Note que uma função ordinária da posição, f (t, x, y, z), é uma função de valores reais
de vetor algum. É portanto classificada como um tensor 00 .


0

4.4.2 Os Tensores 1
: Forma-1
Um tensor do tipo 01 é chamado de co-vetor, vetor covariante, ou forma-1. Frequen-

temente estes nomes são intercambiados, mesmo em um único livro-texto ou referência.

Façamos com que uma forma-1 arbitrária seja chamada de p̃. (Adotamos aqui a
notação na qual um ∼ acima de uma letra denota uma forma-1, assim como uma letra
com flecha denota um vetor.) Então p̃, suprido com um vetor como argumento, nos dá um
número real: p̃(Ã) é um número real. Suponha que q̃ seja outra forma-1. Então podemos
definir )
s̃ = p̃ + q̃,
(4.4.4)
r̃ = αp̃,
Com estas regras, o conjunto de todas as formas-1 satisfazem os axiomas para um espaço
vetorial, o que explica seus outros nomes. Este espaço é chamado de ’espaço vetorial dual’
para distingui-lo do espaço de todos os vetores como A.~
Quando discutimos sobre vetores focamos bastante no estudo de suas componentes e
de suas transformações. Vamos fazer isto para p̃. As componentes de p̃ são chamadas de
pα :
pα = p̃(êα ). (4.4.5)
Qualquer componente com um único índice subscrito é, por convenção, a componente de

uma forma-1; um índice sobrescrito representa a componente de um vetor. Em termos
~ é
das componentes, p̃(A)
~ = p̃(Aα êα )
p̃(A)
~ = Aα p̃(êα )
p̃(A) (4.4.6)
~ = Aα pα .
p̃(A)
O segundo passo segue da linearidade, na qual por sua vez é o coração da definição que foi
dada aos tensores. Então o número real p̃(A) ~ é facilmente encontrado como sendo a soma
A0 p0 + A1 p1 + A2 p2 + A3 p3 . Observe que todos os termos possuem sinais positivos: esta
operação é chamada de contração de A ~ e p̃, e é mais fundamental do que o produto escalar
na análise tensorial, já que pode ser efetuada entre qualquer forma-1 e um vetor sem que
seja necessário fazer referência a outros tensores. Vimos por exemplo que dois vetores não
podem fazer um escalar (o produto escalar dos dois) sem a ajuda de um terceiro tensor,
o tensor métrico.
As componentes de p̃ na base êβ̄ são
pβ̄ = p̃(êβ̄ ) = p̃(Λαβ̄ êα )

(4.4.7)
= Λαβ̄ p̃(êα ) = Λαβ̄ pα .
Comparando isto com

êβ̄ = Λαβ̄ êα ,

vemos que as componentes de uma forma-1 se transformam exatamente da mesma maneira

que o vetor de base e de forma oposta as componentes dos vetores. Por ’oposta’, eu
quero dizer utilizando a transformação inversa. Este uso da inversa garante que Aα pα é
~ e forma-1 p̃. Esta é uma observação
independente do referencial para qualquer vetor A
tão importante que a provaremos explicitamente:
Aᾱ pᾱ = (Λᾱβ Aβ )(Λµᾱ pµ ),

= Λµᾱ Λᾱβ Aβ pµ ,
(4.4.8)
= δ µβ Aβ pµ ,
= Aβ pβ .
(Esta é a mesma maneira pela qual o vetor Aα êα é mantido como independente do refe-
rencial.) Esta transformação inversa dá origem a palavra ’dual’ no ’espaço vetorial dual’.
A propriedade de se transformar com o vetor de base nos dá o motivo de co em ’vetor co-
variante’ e sua forma curta ’co-vetor’. Visto que as componentes de um vetor ordinário se
transformam de maneira oposta aos vetores de base (afim de manter Aβ êβ independente
do referencial), eles são frequentemente chamados de vetores ’covariantes’. A maioria
destes nomes estão fora de moda; ’vetores’ e ’vetores duais’ ou ’formas-1’ são os nomes
modernos. A razão do ’co’ e ’contra’ terem sido abandonados é que eles misturam duas
coisas bastante diferentes: a transformação da base é a expressão dos novos vetores em
termos dos antigos; a transformação das componentes é a expressão do mesmo objeto em
termos da nova base.
4.4.3 Bases Forma-1
Visto que todo o conjunto de formas-1 formam um espaço vetorial, podemos usar
qualquer conjunto de quatro formas-1 linearmente independentes como uma base. (Como
em qualquer espaço vetorial, formas-1 são ditas serem linearmente independentes se uma
combinação linear não trivial de formas-1 é igual a forma-1 zero. A forma-1 zero é aquela
na qual o valor em qualquer vetor é nula.) Entretanto, na seção anterior já utilizamos os
vetores de base {êα } para definir as componentes de uma forma-1. Isto sugere que somos
capazes de utilizar o vetor de base para definir uma base forma-1 associada {ω̃ α , α =
0, . . . , 3}, na qual é chama de base dual de {êα }, sobre os quais a forma-1 possui as
componentes definidas acima. Isto é, queremos um conjunto {ω̃ α } tal que
p̃ = pα ω̃ α . (4.4.9)
(Observe que utilizar um índice levantado em ω̃ α permite operarmos a convenção de soma.)

O {ω̃ α } são quatro formas-1 distintas, assim como {êα } são quatro vetores distintos. Esta

~ e forma-1 p̃:
equação deve implicar que para qualquer vetor A
~ = pα Aα
p̃(A)
que pode ser reescrita como

~ = δ α pα Aβ
p̃(A) (4.4.10)
β
Mas por (4.4.9)

~ = pα ω̃ α (A)
p̃(A) ~
= pα ω̃ α (Aβ êβ ) (4.4.11)

= pα Aβ ω̃ α (êβ )
igualando (4.4.10) com (4.4.11), vemos que
δ αβ = ω̃ α (êβ ) (4.4.12)
Figura 4.4.1: Os vetores de base e forma-1 de um referencial lorentziano de coordenadas

e α (êβ ) = δ αβ .
particular. As formas-1 de base são estabelecidas de tal forma que ω
Comparando com a Eq.(4.4.5), vemos que esta equação nos dá a β-ésima componente
da α-ésima base forma-1. Portanto a mesma define a base da α-ésima forma-1. Podemos

escrever estas componentes explicitamente como
ω̃ 0 = (1, 0, 0, 0),
ω̃ 1 = (0, 1, 0, 0),
ω̃ 2 = (0, 0, 1, 0),
ω̃ 3 = (0, 0, 0, 1).
É importante entender dois pontos aqui. Um é que a Eq.(4.4.12) define a base {ω̃ α }
em termos da base {êα }. Os vetor de base induz uma única e conveniente base forma-1.
Esta não é a única base forma-1 possível, mas é tão útil ter a relação, Eq.(4.4.12), entre
as bases que sempre as usaremos. A relação, Eq.(4.4.12), é entre as bases, não entre seus
pares individuais, tal como ω̃ 0 e ê0 . Ou seja, se mudarmos ê0 , enquanto deixamos ê1 , ê2 e
ê3 inalterados, então em geral isto induz uma mudança não somente em ω̃ 0 , mas também
em ω̃ 1 , ω̃ 2 e ω̃ 3 . O segundo ponto para entender é que, apesar de podemos descrever
tanto vetores como formas-1 apenas dando um conjunto de quatro componente, o seus
significados geométricos são bastante diferentes. Não se deve perder a noção de que as
componentes só nos dizem uma parte da história. A base contém o resto da informação.
Isto é, um conjunto de números (0, 2, −1, 5) sozinho não nos diz nada; para que tenha
algum significado, devemos dizer se estas são as componentes de um vetor de base ou
de uma base forma-1 e, é claro, qual dos infinito números de bases possíveis está sendo
utilizado.
Nos falta definir como {ω̃ α } se transforma sob uma mudança de base. Ou de outra
forma, cada referencial possui seu próprio conjunto único {ω̃ α }; como os pertencentes a
dois referenciais estão relacionados? A derivação aqui é análoga a feita para os vetores de
base.
pβ ω̃ β = pᾱ ω̃ ᾱ
= Λβᾱ pβ ω̃ ᾱ
⇒ ω̃ β = Λβᾱ ω̃ ᾱ
Isto é o mesmo do que para as componentes de um vetor, e opostos aos das componentes
de uma forma-1.
4.4.4 A Visualização de uma Forma-1
Usualmente imaginamos vetores como flechas, caso precisarmos ter uma visualização
dos mesmos. É similarmente útil ter uma representação de uma forma-1. Antes de mais
nada, elas não são flechas. Sua representação deve refletir o fato de que as ditas cujas
mapeiam vetores em números reais. Um vetor por si próprio não mapeia automatica-
mente um outro vetor em um número real. Para realizar isto, um vetor necessita do
tensor métrico a fim de definir o produto escalar. Com uma métrica diferente, os mesmos

Figura 4.4.2: (a) A representação de uma forma-1 é complementar a do vetor como

uma flecha. (b) O valor de uma forma-1 para um dado vetor é o número de superfície
perfuradas pela fecha. (c) O valor de uma forma-1 menor em um mesmo vetor é um
número menor de superfícies. Quanto maior uma forma-1, mais intenso é o fatiamento
em sua representação.
vetores irão produzir um produto escalar diferente. Daí dois vetores sozinhos não nos dão
um número. A representação para formas-1 utilizadas por matemáticos é mostrada na
Fig.4.4.2. Uma forma-1 consiste de uma série de superfícies. A ’magnitude’ da mesma
é dada pelo espaçamento entre as superfícies: quanto maior o espaçamento menor é sua
magnitude. Nesta visão, o número produzido quando uma forma-1 atua como um vetor
é dada pelo número de superfícies perfuradas pela flecha do vetor. Deste modo, quanto
mais próximo o espaçamento é, maior o número (compare (b) e (c) na Fig.4.4.2). Em
um espaço quadridimensional, as superfícies são tridimensionais. Uma forma-1 não define
uma direção única, dado que não se trata de um vetor. Ademais, a mesma define uma
forma de ’fatiar’ o espaço. Com o intuito de justificar esta visualização, devemos olhar
para uma forma-1 particular, o gradiente, faremos isso mais adiante, antes entretanto
faremos uma explicação física.
Considere o quadrimomento ~P de uma partícula, um elétron, por exemplo. O mesmo
possui uma onda de de Broglie associada. De um padrão de difração, pode-se determinar
não somente o comprimento das ondas de de Broglie, mas também o padrão feito no
espaço pelas superfícies de iguais fases inteiras φ = 7, φ = 8, φ = 9, . . .. Este padrão
de superfícies, representado por k̃, nos fornece uma simples ilustração de como pode-se
encontrar facilmente uma forma-1.
O padrão de superfícies no espaço feito por tal forma-1: para que serve? Tome dois
pontos próximos no espaço-tempo, P e P0 . Faça uma flecha V ~ = P − P0 de P0 até P.
Ela será perfurada por um certo número de ondas de De broglie de superfícies de fases
~
inteiras (veja a Figura 4.4.3). O número de superfícies perfurada é denotado por k̃(V).
Normalmente nem P0 nem P estão em pontos de fase inteira. Portanto pode-se e
iremos imaginar, como uniformemente interpolados entre as superfícies de fase inteiras,

Figura 4.4.3: O vetor separação V ~ = P − P0 entre dois eventos próximos P0

e P; uma forma-1 σ̃; e a perfuração de σ̃ por V ~ nos dá o número σ̃(V) ~ =
(número de superfícies perfuradas) = 4, 4. Quando σ̃ são as superfícies de fases cons-
~ é a diferença de fase entre os
tantes de ondas de de Broglie para um elétron, então σ̃(V)
eventos P0 e P. Observe que σ̃ não é totalmente especificado por suas superfícies; uma
orientação também é necessária.
uma infinitude de superfícies com todos os valores de fase intermediários. Com a ajuda
~ = φ(P) − φ(P0 ) pode ser determinado.
deles, o valor preciso de k̃(V)
Para tornar isto matematicamente simples, considere k̃ não como um padrão global
das superfícies de onda de de Broglie, mas sim como um padrão local próximo a um ponto
específico no espaço-tempo. Assim como o vetor U ~ = dP representa o comportamento
dτ
local de uma partícula na sua linha de mundo (aproximação linear para uma linha curvada
em geral), então a forma-1 k̃ representa a forma local das superfícies de onda de de Broglie
(aproximações lineares; superfícies planas e igualmente espaçados; veja a Figura 4.4.4)
dP
Assim como uma flecha ~P = m representa a melhor aproximação linear para a
dτ
linha de mundo de uma partícula próximo a P0 , os planos de superfícies da forma-1 k̃
nos fornece a melhor aproximação linear as superfícies curvas da onda de de Broglie de
uma partícula, e k̃ por si próprio é a função linear que melhor aproxima a fase φ de de
Broglie em um ponto próximo a P0 .
φ(P) = φ(P0 ) + k̃(P − P0 ) + termos de ordem mais alta de (P − P0 ).

Figura 4.4.4: Esta é uma figura com proposito duplo. (a) Ela ilustra a forma-1 k̃ da onda
de de Broglie em um evento P0 (família de superfícies planas igualmente espaçadas, ou
’hiperplanos’ aproximando as superfícies de fase constante). (b) Ela ilustra o gradiente dφ˜
de uma função φ, no qual possui a mesma orientação que as superfícies planas, k̃ = dφ. ˜
˜ é diferente - diferentes superfícies orientadas e espaçamento
Em eventos diferentes, k̃ = dφ
diferente. A mudança em φ entre a cauda e a ponta de qualquer vetor curto V ~ é igual ao
˜ ~ ˜ ~
número de superfícies dφ perfuradas por V, dφ(V); no qual é igual a 0, 5 na figura.
4.4.5 Gradientes e Derivadas Direcionais
Não existe forma-1 mais simples que o gradiente, df ˜ , de uma função f . Gradiente é
uma forma-1? como pode? Não é conhecido que o gradiente é um vetor? Sim, de fato,
mas somente porque não se está familiarizado com o conceito mais apropriado de forma-1.
Os hiperplanos representando df ˜ em um ponto P0 são apenas superfícies niveladas do
próprio f , exceto por achatamentos e ajustes de iguais espaçamentos. Mais precisamente,
eles são superfícies de níveis de uma função linear que aproxima f em uma vizinhança
infinitesimal de P0 .
Porque do nome ’gradiente’ ? Se deve ao fato de que df ˜ descreve as variações de
primeira ordem em f em uma vizinhança de P0 :
˜ (P − P0 ) + (termos não lineares)

f (P) = f (P0 ) + df (4.4.13)
[Compare a ideia fundamental de ’derivada’ como algo que ’é a melhor aproximação linear
para algo em um ponto’ - uma ideia que funciona mesmo para funções cujos valores e
argumentos são vetores de dimensões infinitas!]
~ construa a curva P(λ) definida por P(λ) − P0 = λV;
Tome qualquer vetor V; ~ e

diferencie a função f ao longo desta curva:

d df
∂V~ f = f [P(λ)] = (4.4.14)
dλ λ=0 dλ P0
O ’operador diferencial’

d
∂V~ = , (4.4.15)
dλ ~
λ=0,ao longo de uma curva P (λ) − P0 = λV
o que isso faz diferenciando, é chamado de ’operador derivada direcional ao longo do vetor
~ A derivada direcional ∂~ f e o gradiente df
V.’ ˜ são intimamente relacionados, como se
V
ver ao aplicar ∂V~ à Eq.(4.4.13) e calculando-se o resultado em um ponto P0
df (P0 ) d ˜
∂V~ f = + [df (P − P0 )]
| dλ
{z } dλ
| {z }
~
=λV
=0
˜ (V)
⇒ ∂V~ f = df ~ (4.4.16)
Este resultado, expresso em palavras, é: df ˜ é uma máquina linear para calcular a taxa
de variação de f ao longo de qualquer vetor desejado V. ~ Insira V
~ em df˜ ; o resultado (’o
~ suficientemente pequeno,
número de superfícies perfuradas’) é ∂V~ f - no qual, para um V
é simplesmente a diferença em f entre a ponta e a cauda de V. ~
Para encontrar a representação de coordenadas do operador derivada direcional ∂V~ ,
reescrevamos a Eq.(4.4.15) utilizando o calculo elementar
dxα

d ∂
∂V~ = =
dλ P0 dλ ~
em P0 ao longo da curva P(λ) − P0 = λV ∂xα
| {z }
vα
o resultado é
∂
∂V~ = v α . (4.4.17)
∂xα
e analogamente,
df (P0 ) d ˜ ˜ (êα )
∂êα f = + [df (P − P0 )] = df (4.4.18)
dλ dλ | {z }
| {z } =λêα
=0
enquanto que o operador é dado por
dxβ

d ∂ ∂
∂êα = = = (4.4.19)
dλ P0 dλ em P0 ao longo da curva P(λ) − P0 = λêα ∂xβ ∂xα
| {z }
(eα )β =δαβ

daí
˜ (êα ) = ∂f
df (4.4.20)
∂xα
˜ , nas quais são denotadas por fα , são dadas por
As componentes do gradiente forma-1 df
˜ = fα ω̃ α
df
se f = xβ , então por (4.4.19)

∂xβ
∂êα xβ = (4.4.21)
∂xα
portanto,
β
˜ β (êα ) = ∂êα xβ = ∂x = δ β = ω̃ β (êα )
dx α
∂xα
consequentemente,
˜ β
ω̃ β = dx (4.4.22)
Usaremos a seguinte notação para derivadas
∂f
= f,α (4.4.23)
∂xα
˜ serão denotadas por f,α
então, as componentes do gradiente forma-1 df
˜ = f,α ω̃ α
df (4.4.24)
onde usamos f,α visto que

˜ (êα )
f,α = df
= ∂êα f (4.4.25)
∂f
=
∂xα
onde na segunda linha utilizamos (4.4.18) e (4.4.19) na terceira linha. Portanto, em
˜ são apenas
acordo com a ideia do cálculo elementar de gradiente, as componentes de df
as derivadas parciais ao longo dos eixos coordenados, isto é,:
˜ = ∂f dx
df ˜ α (4.4.26)
∂xα
(Lembre-se de que dx ˜ α = ω̃ α .) Tal fórmula sugere, corretamente que df

˜ é uma versão
rigorosa da ’diferencial’ do cálculo elementar.
4.4.6 Forma-1 Normal
Assim como o gradiente, o conceito de vetor normal - um vetor ortogonal a uma

superfície - é um dos quais é substituído mais naturalmente pela forma-1 normal. Para

um vetor normal ser definido precisamos do produto escalar: o vetor normal deve ser
ortogonal a todos os vetores tangentes a superfície. Isto só pode ser definido somente
através do tensor métrico. Mas uma forma-1 normal pode ser definida sem fazer referência
a métrica. Uma forma-1 é dita ser normal a uma superfície se o seu valor é zero em cada
vetor tangente a superfície. Se a superfície é fechada e divide o espaço-tempo em ’dentro’
e ’fora’, uma normal é dita ser uma forma-1 normal externa se é uma forma-1 normal e
seu valor em vetores que apontam para fora da superfície é positivo.
Um exemplo disto é: o gradiente df ˜ é normal a todas as superfícies de f constante,
para provar isto observemos que se f é constante, então
f (λ + dλ) = f (λ)
logo,
df
=0
dλ
daí,
∂f dxα ∂f α
α
= T =0
∂x dλ ∂xα
onde T α é a componente do vetor tangente a superfície, segue que
∂f β α
⇒ T δ β =0
∂xα
∂f ˜ α β ˜ (T~ ) = 0
⇒ dx (T êβ ) = df
∂xα
que é justamente a nossa definição.
0

4.4.7 Os Tensores 2
Tensores do tipo 02 possuem dois vetores como argumentos. Já encontramos o tensor

métrico como um tensor deste tipo, mas o mais simples deste tipo é o produto de duas
formas-1, formado de acordo com a seguinte regra: se p̃ e q̃ são formas-1, então o produto
p̃ ⊗ q̃ é o tensor 02 no qual, quando abastecido com os vetores A ~ eB
~ nos seus argumentos,

produz o número p̃(A)q̃( ~ B),~ i.e. assim como o produto dos números produzidos por um
tensor 01 . O símbolo ⊗ é chamado de ’sinal do produto tensorial’ e é uma notação formal

para mostrar como o tensor 02 é formado por formas-1. Note que ⊗ não é comutativo:

~ B),
p̃ ⊗ q̃ e q̃ ⊗ p̃ são tensores diferentes. O primeiro nos dá p̃(A)q̃( ~ já o segundo q̃(A)p̃(
~ B). ~
O tensor mais geral 02 não é um simples produto tensorial, mas pode sempre ser

representado como a soma de tais tensores. Para ver isto, primeiro devemos considerar
as componentes de um tensor 02 arbitrário f :

fαβ = f (êα , êβ ) (4.4.27)

Visto que cada índice pode ter quatro valores, existem 16 componentes, e elas podem ser
pensadas como sendo alinhadas em uma matriz. O valor de f em vetores arbitrários é
~ B)
f (A, ~ = f (Aα êα , B β êβ )
= Aα B β f (êα , êβ ) (4.4.28)

= Aα B β fαβ
Podemos formar uma base para este tensor? Isto é, podemos definir um conjunto de 16
tensores 02 representados por ω̃ αβ tal que

f = fαβ ω̃ αβ ? (4.4.29)
Para este ser o caso teríamos que possuir
fµν = f (êµ , êν ) = fαβ ω̃ αβ (êµ , êν )
ora mas
fµν = δ αµ δ βν fαβ
então, isto implica, como antes, que
ω̃ αβ (êµ , êν ) = δ αµ δ βν (4.4.30)
contudo, lembremos que
δ αµ = ω̃ α (êµ ), e δ βν = ω̃ β (êβ ).
o que implica
ω̃ αβ (êµ , êν ) = ω̃ α (êµ )ω̃ β (êβ )
Podemos concluir que

ω̃ αβ = ω̃ α ⊗ ω̃ β . (4.4.31)
0

Então os tensores ω̃ α ⊗ ω̃ β são as bases para todos os tensores 2
, e conseguimos escrever
f = fαβ ω̃ α ⊗ ω̃ β (4.4.32)
Esta é uma maneira pela qual um tensor geral 02 é a soma sobre simples tensores do

produto tensorial.

4.4.8 Simetrias
Um tensor 02 toma dois argumentos, e sua ordem é importante, como vimos. O com-

portamento do valor do tensor sob uma mudança de seus argumentos é uma propriedade
importante do mesmo. Um tensor f é chamado simétrico se
~ B)
f (A, ~ = f (B,
~ A)
~ ~ B.
∀A, ~ (4.4.33)
~ = êα e B
Colocando A ~ = êβ , isto implica que suas componentes são
fαβ = fβα (4.4.34)
0

Isto é similar a condição de simetria de uma matriz. Um tensor, do tipo 2
, h arbitrário
pode definir um novo simétrico h(s) pela regra
h(s) (A, ~ = 1 h(A,

~ B) ~ + 1 h(B,
~ B) ~ A)
~ (4.4.35)
2 2
pois observe que h(s) (A, ~ = 1 h(A,

~ B) ~ + 1 h(B,
~ B) ~ = 1 h(B,
~ A) ~ + 1 h(A,
~ A) ~ B)
~ = h(s) (B,
~ A).
~
2 2 2 2
Para as componentes isto implica
1
h(s)αβ = (hαβ + hβα ). (4.4.36)
2
Isto é uma propriedade matemática tão importante que uma notação especial é usada
para a mesma:
1
h(αβ) = (hαβ + hβα ). (4.4.37)
2
Portanto, os números h(αβ) são as componentes do tensor simétrico formado através de h.
Similarmente, um tensor f é chamado de anti-simétrico se
~ B)
f (A, ~ = −f (B,
~ A),
~ ~ B,
∀A, ~ (4.4.38)
fαβ = −fβ,α . (4.4.39)

0

Um tensor, do tipo 2
, anti-simétrico pode ser formado como
h(A) (A, ~ = 1 h(A,

~ B) ~ − 1 h(B,
~ B) ~ A),
~ (4.4.40)
2 2
1
h(A)αβ = (hαβ − hβα ). (4.4.41)
2

A nova notação usada aqui será a de parênteses nos índices:
1
h[αβ] = (hαβ − hβα ). (4.4.42)
2
Note que
1 1
hαβ = (hαβ + hβα ) + (hαβ − hβα )
2 2 (4.4.43)
= h(αβ) + h[αβ] .
Então qualquer tensor 02 pode ser dividido unicamente em suas partes simétricas e anti-

simétricas.
O tensor métrico η é simétrico como foi apontado mais cedo:
~ B)
η(A, ~ = η(B,
~ A).
~ (4.4.44)
4.5 Métrica como um Mapeamento de Vetores em Formas-1 e

Tensores M

N
Iremos introduzir agora o que veremos mais tarde como o papel fundamental da mé-
trica na geometria diferencial, que é atuar como um mapeamento entre vetores e formas-1.
~
Para ver como isto funciona, considere ηe um único vetor V. Visto que η requer dois
argumentos vetoriais, a expressão η V, ~ está incompleta: quando outro vetor for for-

necido, ela se tornará um número. Portanto, η V, ~ é considerada como uma função de
vetores (que devem preencher o espaço vazio na mesma), mais precisamente é uma função
linear de vetores produzindo números reais: uma forma-1. A chamaremos de Ṽ :

~
η V, = Ṽ ( ) , (4.5.1)
onde o espaço em branco dentro do parêntese é uma forma de indica que um argumento
~ para V
vetorial deve ser fornecido. Então Ṽ é a forma-1 que leva um vetor A ~ · A:
~
~ ≡ η(V,
Ṽ (A) ~ A)
~ =V
~ ·A
~ (4.5.2)
Observe que já que η é simétrico, podemos também escrever

η ~
, V = Ṽ ( ) .
Quais são as componentes de Ṽ ? Elas são
~ · êα = êα · V
Vα = Ṽ (êα ) = V ~
= êα · (V β êβ )
= (êα · êβ )V β

Vα = ηαβ V β . (4.5.3)
Assim, no caso da Relatividade Especial, se
~ = (a, b, c, d)
V
então,
Ṽ = (a, −b, −c, −d)
~ pela mudança de sinal nas componentes espaciais.
As componentes de Ṽ são obtidas de V
4.5.1 ~
O Inverso: Indo de Ã para A
Será que a métrica também fornece uma forma de encontrar um vetor A ~ que é relaci-
onado a uma forma-1 dada Ã? A resposta é sim. Considere a Eq.(4.5.3). Ela nos diz que
{Vα } é obtido multiplicando {V β } pela matriz (ηαβ ). Se esta matriz possuir uma inversa,
então poderíamos usa-la para obter {V β } de {Vα }. Esta inversa existe se e somente se
(ηαβ ) possui um determinante não nulo. Mas visto que (ηαβ ) é a matriz diagonal com
entradas (1, −1, −1, −1), seu determinante é simplesmente −1. Uma inversa deve existir,
e chamaremos suas componentes de η αβ . Então, dado {Aβ } podemos achar {Aα }:
Aα = η αβ Aβ . (4.5.4)
O uso da inversa garante que os dois conjuntos de componentes satisfazem a Eq.(4.5.3):
Aβ = ηβα Aα .
Então o mapeamento fornecido por η entre vetores e formas-1 é um a um e invertível.

Em particular, com dφ˜ podemos associar um vetor dφ,
~ no qual é usualmente associado
com o gradiente. Podemos ver que este vetor é ortogonal as superfícies de φ constantes
como se segue: O seu produto interno com um vetor em uma superfície de φ constante é,
por este mapeamento, idêntico ao valor da forma-1 dφ˜ naquele vetor. Isto, por sua vez,
˜ V)
deve ser zero já que dφ( ~ é a taxa de variação de φ ao longo de V,
~ no qual é zero neste
caso, dado que V~ é tomado em uma superfície de φ constante.
É importante conhecer {η αβ }. Podemos verificar que já que
ηµα η αβ = δ βµ (4.5.5)
então,
1 = δ 00 = η00 η 00 ⇒ η 00 = 1
|{z}
=1

e
δ iβ = ηβν η νi
= ηβ0 η 0i + ηβj η ji
tomemos β = 0,
δ i0 = η0ν η νi
= η00 η 0i + η0j η ji
|{z} |{z}
=1 =0
0i 0i
=η ⇒η =0
e por fim, tomemos β = k,
δ ik = ηkν η νi
= ηk0 η 0i + ηkj η ji
|{z} |{z}
=0 =−δkj
= −δkj η ji ⇒ η ji = −δ ji ,
onde na última linha usamos o fato de que δkj δ ji = δ ji . Concluímos que
η 00 = +1, η 0i = 0, η ij = −δ ij , (4.5.6)
então (η αβ ) é idêntico a (ηαβ ). Portanto, para ir de uma forma-1 para um vetor, simples-
mente mude o sinal das componentes espaciais.
4.5.2 Por que Distinguir Formas-1 de Vetores?
No espaço Euclidiano, em coordenadas Cartesianas a métrica é somente {δij }, então

as componentes das forma-1 e vetores são as mesmas. Portanto nenhuma distinção é
jamais feita na álgebra vetorial elementar. Mas na Relatividade Especial elas diferem
(pela mudança de sinais). Logo, ao passo que o gradiente possui as componentes

˜ = 1 ∂φ ∂φ
dφ , ,...
c ∂t ∂x
o vetor normal associado as superfícies de φ constante tem as componentes

~ = 1 ∂φ ∂φ
dφ ,− ,... . (4.5.7)
c ∂t ∂x
Se tivéssemos simplesmente tentado definir o ’vetor gradiente’ de uma função como o vetor
com essas componentes, sem primeiro discutir formas-1, a leitura teria sido justificada por
ser mais do que um pouco cética. A métrica não-Euclidiana da Relatividade Especial nos
força a ser cuidadoso com a distinção básica entre formas-1 e vetores: não pode ser varrida
para debaixo do tapete.

Como consideramos anteriormente, vetores e formas-1 são duais um em relação ao

outro. Tais espaços duais são importantes e são encontrados em todos os lugares da
física-matemática. O exemplo mais simples é o espaço dos vetores colunas na álgebra
matricial  
a
 
b ,
..
 
.

cujo espaço dual é o espaço dos vetores linhas a b . . . . Observe que o produto
 
p
a b ... q  = ap + bq + . . . (4.5.8)

..
.
é um número real, então o vetor linha pode ser considerado como a forma-1 dos vetores
colunas. A operação de encontrar um elemento de um espaço através de um do outro é
chamado de ’adjunto’ e é 1 − 1 e invertível. Um exemplo menos trivial surge na mecânica
quântica. Uma função de onda (a amplitude de probabilidade que é a solução da equação
de Schrodinger) é um campo escalar complexo φ(~x), e é desenhado através do espaço de
Hilbert para todas essas funções. Este espaço de Hilbert é um espaço vetorial, visto que
seus elementos (funções) satisfazem os axiomas de um espaço vetorial. Qual é o espaço
dual das formas-1? A dica crucial é que o produto interno de duas funções φ(~x) e ψ(~x) não
é φ(~x)ψ(~x)d3 x mas, em vez, é φ∗ (~x)ψ(~x)d3 x, o asterisco denota o complexo conjugado.
R R
A função φ∗ (~x) atua como uma forma-1 cujo valor em ψ(~x) é a sua integral com ele. A
operação do complexo conjugado atua como o nosso tensor métrico. transformando um
vetor φ(~x) (no espaço de Hilbert) em uma forma-1 φ∗ (~x). O fato de que φ∗ (~x) é também
uma função no espaço de Hilbert é, neste nível, uma distração (é equivalente a dizer que
os membros do conjunto (1, −1, 0, 0) podem ser as componentes de um vetor ou de uma
forma-1.) O ponto importante é que na integral φ∗ (~x)ψ(~x)d3 x, a função φ∗ (~x) está
R
atuando como uma forma-1, produzindo um numero complexo através do vetor ψ(~x).
4.5.3 Magnitude e Produto Escalar de Formas-1
Uma forma-1 p̃ é definida para ter a mesma magnitude associada ao vetor ~P. Portanto
escrevemos
p̃2 = ~P2 = ηαβ pα pβ . (4.5.9)
p̃2 = ηαβ (η αµ pµ )(η βν pν ). (4.5.10)

Mas visto que ηαβ e η βν são as matrizes inversas uma da outra, nossa soma em β colapsa,
e
p̃2 = η αµ pµ pα (4.5.11)
Portanto, o tensor métrico inverso pode ser usado diretamente para encontrar a magnitude
de p̃ a partir de suas componentes.
p̃2 = p20 − p21 − p22 − p23 . (4.5.12)
Esta é a mesma regra, de fato, utilizada para vetores. Por definição, isto é invariante.
Formas-1 são tipo-tempo, tipo-espaço, ou nulas, assim como são os seus vetores associados.
Assim como para vetores, podemos agora definir o produto interno para formas-1. Isto
é
1
(p̃ + q̃)2 − p̃2 − q̃ 2 .

p̃ · q̃ = (4.5.13)
2
Esta expressão em termos de suas componentes é, não surpreendentemente
p̃ · q̃ = p0 q0 − p1 q1 − p2 q2 − p3 q3 . (4.5.14)
4.5.4 Vetores Normais e Formas-1 Normais Unitárias
Um vetor é dito ser normal a uma superfície se a sua forma-1 associada é uma forma-1
normal. A Eq.(4.5.1) nos mostra que esta definição é equivalente a usual adotada para
vetores serem ortogonais a todos os vetores tangentes. Um vetor normal ou forma-1
normal é dito ser uma normal unitária se sua magnitude é ±1 (Não podemos demandar
que seja +1, já que vetores do tipo-espaço possuem magnitudes negativas. Tudo que
podemos fazer é multiplicar o vetor ou a forma-1 por um fator geral para transformar sua
magnitude para ±1.) Observe que normais nulas não podem ser normais unitárias.
Uma superfície tridimensional é dita ser tipo-tempo, tipo-espaço, ou nula de acordo
com qual tipo de classe a sua normal é.
4.5.5 Vetores como Funções de Formas-1
O dualismo discutido acima é de fato completo. Apesar de termos definidos formas-1

como funções de vetores, podemos agora ver que esses vetores podem perfeitamente bem
serem considerados como funções lineares que mapeiam formas-1 em números reais. Dado
~ uma vez suprido de uma forma-1 teremos um número real:
um vetor V,
D E
~
V(p̃) ~ ≡ pα V α ≡ p̃|V
≡ p̃(V) ~ (4.5.15)
Desta forma iremos retirar os vetores de sua posição especial, na qual eram tidos como
coisas ’atuadas’ por tensores, e iremos considerar os mesmos também como tensores,

especificamente como funções lineares de uma única forma-1 em números reais. A última
notação na Eq.(4.5.15) é nova, e enfatiza o estado igualitário dos dois objetos.
Generalizando isto, iremos definir:
Um tensor M0 é uma função linear de M formas-1 nos números reais.

Toda a nossa discussão anterior de N0 tensores se aplica aqui. Um tensor simples

2 ~ ⊗ W,
~ no qual, quando abastecido com dois argumentos p̃ e q̃, nos proporciona

0
é V
~ W(q̃)
o número V(p̃) ~ ~ W)
≡ p̃(V)q̃( ~ = V α pα W β qβ . Então V~ ⊗W ~ possui as componentes
V α W β . Uma base para os tensores 20 é êα ⊗ êβ . A componente de um tensor M0 são

os seus valores quando a base forma-1 ω̃ α é o seu argumento. Note que tensores M0

possuem componentes nas quais todos os tensores índices são sobrescritos.

A generalização final é
Um tensor M

N
é uma função linear de M formas-1 e N vetores nos números reais.
Por exemplo, se R é um tensor 11 , então ele requer uma forma-1 p̃ e um vetor A~ para

~ No qual tem as suas componentes dada por R(ω̃ α ; êβ ) = Rα .

resultar no número R(p̃; A). β
Em geral, as componentes de um tensor M

N
terá M índices sobrescritos e N índices
subscritos. Em um novo referencial,
Rᾱβ̄ = R(ω̃ ᾱ ; êβ̄ ) = R(Λᾱµ ω̃ µ ; Λν β̄ êν ) = Λᾱµ Λν β̄ Rµν . (4.5.16)
Então as transformações para as componentes é simples: cada índice se transforma tra-

zendo um Λ cujos índices são arranjados da única maneira a permitir a convenção de
soma. Alguns nomes antigos ainda estão em uso: índices sobrescritos são chamados de
’contravariantes’ (porque eles se transformam de forma contrária aos vetores de base)
e índices subscritos são chamados de ’covariantes’. Um tensor M

N
é dito ser M vezes
contravariante e N vezes covariante.
4.5.6 Raciocínio Circular?
Neste ponto, o aluno pode se preocupar que toda a álgebra tensorial se tornou circular:
formas-1 foram definidas em termos de vetores, contudo agora definimos vetores em termos
de formas-1. Esta ’dualidade’ é o coração da teoria, porém não é circular. O que significa
que podemos fazer o que físicos fazem, que é identificar vetores com deslocamentos ∆~x e
coisas parecidas (como p~ e ~v ) e então gerar todos os tensores M

N
pelas regras da álgebra
tensorial; estes tensores herdam um significado físico através do significado original dado
aos vetores. Entretanto, podemos igualmente bem associar formas-1 com objetos físicos
(gradientes, por exemplo) e recuperar a álgebra inteira deste ponto inicial. O poder da
matemática é que não é preciso (ou desejado) dizer o que os vetores ou formas-1 são.
Simplesmente damos regras para manipula-los. A associação de, digamos, p~ como um
vetor é a interface entre a física e a matemática: é como fazemos um modelo matemático
do mundo físico. A geometria faz o mesmo. Ele adiciona à noção desses abstratos espaços

tensoriais a ideia do que é um vetor em um espaço curvo. A ideia moderna da geometria

de um vetor é algo que iremos aprender sobre quando chegarmos a espaços curvos. Por
hora iremos obter alguma prática com tensores em situações físicas, onde ficamos com a
nossa noção (admitidamente imprecisa) de vetores como sendo ’parecidos’ com ∆~x.
4.5.7 Levantamento e Abaixamento de índices
Da mesma forma que a métrica mapeia um vetor V ~ em uma forma-1 Ṽ, ela mapeia
N N −1 N

um tensor M em um tensor M +1
. Similarmente, a inversa mapeia um tensor M
em
N +1

um tensor M −1 . Normalmente, eles recebem o mesmo nome, e são distinguidos somente
pela posição dos seus índices. Suponha que T αβγ são as componentes de um tensor 21 .

Então
T αβγ = ηβµ T αµγ (4.5.17)
são as componentes de um tensor 12 (obtida pelo mapeamento da segunda forma-1 do

argumento de T αβγ em um vetor), e
Tα βγ = ηαµ T µβγ (4.5.18)
são as componentes de outro (não equivalente) tensor 12 (mapeamento no primeiro ín-

dice), enquanto
T αβγ = η γµ T αβµ (4.5.19)
São as componentes de um tensor 30 . Estas operações são, naturalmente suficientes,

chamam-se levantamento e abaixamento de índices. Sempre que falarmos de levantamento

ou abaixamento de índices queremos dizer que este mapeamento é gerado pela métrica.
A regra na Relatividade Especial é simples: quando levantamos ou abaixamos algum
índice, o índice da componente temporal (isto é, o índice 0) não é alterado, enquanto os
da espacial sim (em geral é o índice i).
Os números {ηαβ } são as componentes da métrica, e {η αβ } a sua inversa. Suponha
que levantamos um índice de ηαβ utilizando a inversa. Então iremos obter as componentes
mixadas da métrica,
η αβ = η αµ ηµβ . (4.5.20)
Mas na direita nós temos apenas o produto matricial de duas matrizes que são a inversa
uma da outra, então tal produto se trata da matriz identidade. Visto que um índice está
levantado enquanto o outro está abaixado, só pode ser o delta de Kronecker, escrevemos
como
η αβ = δ αβ . (4.5.21)
Pelo levantamento de outro índice iremos meramente obter a identidade, η αβ = η αβ .

Então podemos considerar η αβ como as componentes de um tensor 20 , no qual é mapeado


através de um tensor, η, 02 por η −1 . Então, para η, suas componentes ’contravariantes’

são iguais aos elementos da matriz inversa da matriz das suas componentes ’covariantes’.
É o único tensor para o qual isto é verdade.
4.5.8 Diferenciação de Tensores
Uma função f é um tensor 00 , e seu gradiente df ˜ é um tensor 0 . Diferenciação de

1
uma função produz um tensor(covariante) de um rank mais alto. Iremos ver agora como
isso se aplica também para a diferenciação de um tensor de qualquer rank.
Considere um tensor, T, 11 cujas componentes {T αβ } são funções da posição. Pode-

mos escrever T como

T = T αβ ω̃ β ⊗ êα . (4.5.22)
Suponha, que como foi feito para funções, que nos movemos ao longo de uma linha de
mundo com parâmetro τ , tempo próprio. A taxa de variação de T,
dT T(τ + ∆τ ) − T(τ )
= lim , (4.5.23)
dτ ∆τ →0 ∆τ
não é muito difícil de se calcular. Visto que as bases formas-1 e vetores são as mesmas
em qualquer lugar (i.e. ω̃ α (τ + ∆τ ) = ω̃ α (τ )), segue que
dT αβ

dT
= ω̃ β ⊗ êα , (4.5.24)
dτ dτ
onde dT αβ /dτ é a derivada ordinária da função T αβ ao longo da linha de mundo:
dT αβ
= T αβ,γ U γ . (4.5.25)
dτ
Agora, o objeto dT/dτ é um tensor 11 , pois como foi visto na Eq.(4.5.23) o mesmo é

definido para a ser diferença entre dois tensores deste rank. Da Eq.(4.5.24) e (4.5.25)
temos, que para qualquer vetor U,
dT
= (T αβ,γ ω̃ β ⊗ êα )U γ , (4.5.26)
dτ
do qual pode ser deduzido
(T αβ,γ ω̃ β ⊗ êα )U γ = T αβ,γ ω̃ β ⊗ ω̃ γ ⊗ êα (U µ eµ )

= T αβ,γ U µ ω̃ β ⊗ ω̃ γ ⊗ êα ⊗ êµ
assim,
∇T = (T αβ,γ ω̃ β ⊗ ω̃ γ ⊗ êα ) (4.5.27)
1

é um tensor 2
. Este tensor é chamado de gradiente de T.

˜ porque a última notação é usualmente reservada

Usamos a notação ∇T ao invés de dT
por matemáticos para algo a mais. Também temos uma notação conveniente para a
Eq.(4.5.26)
dT
= ∇U~ T, (4.5.28)
dτ
∇U~ T → {T αβ,γ U γ }. (4.5.29)
Esta derivada faz uso do fato de que os vetores de base (e portanto as bases forma-1)
são constantes em todos os lugares. Iremos ver que não podemos assumir isto no espaço
curvo da relatividade geral, e levar isto em conta será o nosso ponto de entrada na teoria!
4.5.9 Produto Externo
O produto externo é mais um outro processo para produzir novos tensores a partir de
antigos. É meramente um produto de tensores anti-simetrizado: dado dois vetores U ~ e
V~ , o produto externo deles, o ’bivetor’ U
~ ∧ V~ , é definido por
~ ∧ V~ = U
U ~ ⊗ V~ − V~ ⊗ U
~; (4.5.30)
que claramente é igual a −V~ ∧ U~ = V~ ⊗ U ~ −U ~ ⊗ V~ , se tratando assim, de fato, de um

tensor anti-simétrico. Similarmente, a ’forma-2’ α̃∧ β̃ construída através de duas formas-1
é
α̃ ∧ β̃ = α̃ ⊗ β̃ − β̃ ⊗ α̃. (4.5.31)
Todas as regras familiares de adição e multiplicação permanecem, tais como
(aα̃ + bβ̃) ∧ γ̃ = aα̃ ∧ γ̃ + bβ̃ ∧ γ̃, (4.5.32)
além disso,
α̃ ∧ β̃ = (αj ω̃ j ) ∧ (βk ω̃ k ) = αj βk ω̃ j ∧ ω̃ k (4.5.33)
e
α̃ ∧ β̃ = −β̃ ∧ α̃ = −(βj ω̃ j ) ∧ (αk ω̃ k ) = −βj αk ω̃ j ∧ ω̃ k (4.5.34)
Somando (4.5.33) com (4.5.34):
1
α̃ ∧ β̃ = (αj βk − βj αk )ω̃ j ∧ ω̃ k . (4.5.35)
2

~ , V~ , W
De três vetores U ~ pode-se construir um tri-vetor
~ ∧ V~ ∧ W
U ~ = (U~ ∧ V~ ) ∧ W
~ =U ~ ∧ (V~ ∧ W
~)
=U ~ ⊗ V~ ⊗ W ~ + V~ ⊗ W
~ ⊗U ~ +W~ ⊗U ~ ⊗ V~ (4.5.36)
− V~ ⊗ U
~ ⊗W ~ −U~ ⊗W ~ ⊗ V~ − W~ ⊗ V~ ⊗ U~.
a motivação para tal é que (U ~ ∧ V~ ) ∧ W

~ = −W
~ ∧ (U~ ∧ V~ ). A partir de formas-1 α̃, β̃, γ̃,
pode-se similarmente construir a ’3-forma’ α̃ ∧ β̃ ∧ γ̃. O produto externo nos dá uma
forma simples de testar a coplanaridade (dependência linear) de vetores: se U ~ e V~ são
~ = αV~ , então
colineares, então U
~ ∧ V~ = αV~ ∧ V~ = 0
U
devido a anti-simetria de 0 ∧0 , pois V~ ∧ V~ = −V~ ∧ V~ ⇒ V~ ∧ V~ = 0. Se W

~ é coplanar com
~ e V~ , então W
U ~ = αU~ + β V~ , portanto
~ ∧U
W ~ ∧ V~ = αU
~ ∧U
~ ∧ V~ + bV~ ∧ U
~ ∧ V~ = 0 (4.5.37)
O símbolo 0 ∧0 é chamado de ’chapéu’ ou ’cunha’ ou ’sinal do produto externo’. Além

disso, pode-se provar que para uma forma-p α̃ e uma forma-q β̃, têm-se
α̃ ∧ β̃ = (−1)pq β̃ ∧ α̃ (4.5.38)
4.5.10 Tensor de Levi-Civita e Duais
O ’tensor de Levi-Civita’ no espaço-tempo é um tensor de rank quatro, sendo um

tensor completamente anti-simétrico:
~,U
(N ~ , V~ , W
~ ) muda de sinal quando dois vetores quaisquer são permutados. (4.5.39)
Escolha um referencial de Lorentz arbitrário, mas especifico, com ê0 apontando em direção
ao futuro e ê1 , ê2 , ê3 um conjunto de vetores de base destros. As componentes covariante
de neste referencial são
0123 = (ê0 , ê1 , ê2 , ê3 ) = +1 (4.5.40)
[Nota: Em um espaço n-dimensional, é um tensor anti-simétrico de rank n completa-

mente análogo, suas componentes são:
12...n = (ê0 , ê1 , . . . , ên ) = +1 (4.5.41)
quando calculado em uma base ortonormal ê1 , . . . , ên ’positivamente orientada’.]

Usaremos a anti-simetria do tensor de Levi-Civita para mostrar que
µνλρ = 0 ao menos que µ, ν, λ, ρ sejam todos diferentes. (4.5.42)
E (
+1 Se µνλρ é uma permutação par de 0, 1, 2, 3, e
µνλρ (4.5.43)
−1 Se µνλρ é uma permutação ímpar de 0, 1, 2, 3.
Para mostrar isto, lembremos que se um tensor é anti-simétrico, então ao permutarmos
dois índices quaisquer, o valor da componente do tensor muda de sinal, como o tensor de
Levi-Civita é anti-simétrico faremos µ = λ, assim µνµρ = −µνµρ , trocamos um índice µ
com o outro, ⇒ µνµρ = 0, como poderíamos ter permutado dois índices quaisquer, desde
que os mesmos fossem iguais, segue que isso é válido de forma geral e assim provamos
(4.5.42). Mostremos agora (4.5.43):
Sabemos que 0123 = +1, suponha que permutemos dois índices quaisquer desta com-
ponente, pela definição de anti-simetria, segue que esta nova componente do tensor deverá
mudar de sinal, isto é, ser igual a −1, se trocarmos novamente dois índices do mesmo,
então deveremos novamente mudar o sinal da componente, e o mesmo será igual a +1,
assim, por indução, se tivermos 2n permutações de índices, com n ∈ N, então a nova
componente terá sinal igual a +1, se efetuarmos 2n + 1 permutações de índices, então o
seu sinal será −1.
Agora, mostremos que
µνλρ = −µνλρ (4.5.44)
pela operação de abaixamento de índices podemos escrever que
µνλρ = ηµα ηνβ ηζλ ηξρ αβζξ (4.5.45)
os índices µ, ν, λ, ρ devem conter 0, 1, 2, 3, e tendo em mente que as componentes do tensor

métrico só são diferentes de zero nos elementos da diagonal, segue que α = µ, β = ν,
λ = ζ e ρ = ξ. Ademais, pelo menos umas dessas componentes do tensor métrico deve
ser igual a +1 e as outras três devem ser iguais a −1, segue então o resultado (4.5.44).
Podemos definir um tensor de permutação da seguinte maneira
δ αβγµνλ ≡ −αβγρ µνλρ (4.5.46)
Por (4.5.43) vemos que


+µνλρ se αβγ forem uma permutação par de µνλ

αβγρ = −µνλρ se αβγ é uma permutação ímpar de µνλ (4.5.47)

0 caso contrário.


onde o ’caso contrário’ ocorre se αβγ não é uma permutação par nem ímpar de µνλ,
então αβγρ deve conter um índice repetido e portanto αβγρ é igual a 0. Além disso, por
(4.5.44),
αβγρ = −αβγρ
então

−µνλρ se αβγ forem uma permutação par de µνλ

αβγρ = +µνλρ se αβγ é uma permutação ímpar de µνλ (4.5.48)

0 caso contrário.

Finalmente, por (4.5.46)


2
 (µνλρ ) = +1 se αβγ forem uma permutação par de µνλ

δ αβγµνλ = −(µνλρ )2 = −1 se αβγ é uma permutação ímpar de µνλ (4.5.49)

0 caso contrário.

Note que, embora haja uma soma implica sobre ρ na Eq.(4.5.46), existe somente um
termo nesta soma que não é nulo, dado que ρ deve ser diferente dos outros 3 índices.
Logo, temos uma justificativa para escrever αβγρ µνλρ = ±(µνλρ )2 . Em seguida, fazemos
uma contração em (4.5.46) no terceiro índice para obter
δ αβµν δ λλ = δ αβλµνλ = −αβλρ µνλρ
pelo último termo, vemos que λ e ρ devem ser diferentes dos demais índices, então para
α, β, µ, ν fixados, só resta dois valores possíveis para lambda, e portanto o termo do lado
esquerdo, δ λλ , é igual a 2, deste modo
2δ αβµν = δ αβλµνλ = −αβλρ µνλρ
ou,
1 1
δ αβµν = δ αβλµνλ = − αβλρ µνλρ (4.5.50)
2 2
analogamente, façamos uma contração na Eq.(4.5.50) de β com ν, por argumentos simi-
lares aos que utilizamos para chegar na Eq.(4.5.50), temos 3 opções para o β, e deste
modo
1 1
δ αµ δ ββ = δ αβµβ = δ αβλµβλ = − αβλρ µβλρ
|{z} 2 2
3
o que implica
1 1 1
δ αµ = δ αβµβ = δ αβλµβλ = − αβλρ µβλρ (4.5.51)
3 3! 3!
1 1
Vimos que δ αβµν = − αβλρ µνλρ = αβλρ µνλρ , segue que os índices λρ devem ser dife-
2 2

rentes de µν, porém sempre poderemos permutar λ com ρ, isto é, poderemos ter αβλρ e
αβρλ e o mesmo com µνλρ e µνρλ , observemos que tal permutação não irá mudar o sinal
da expressão dado que existe dois . Para uma permutação par de αβ de µν temos que
(sem soma para índices repetidos)
1
δ αβµν = (µνλρ µνλρ + µνρλ µνρλ )
2
1
= (1 + 1)
2
=1
já para uma permutação ímpar de αβ de µν temos que (sem soma para índices repetidos)
1
δ αβµν = (µνλρ µνλρ + µνρλ µνρλ )
2
1 (4.5.52)
= (−1 − 1)
2
= −1
Portanto, 
+1 se αβ forem uma permutação par de µν

δ αβµν = −1 se αβ é uma permutação ímpar de µν (4.5.53)

0 caso contrário.

Finalmente, o delta de Kronecker usual é definido neste caso como [olhe novamente para
a Eq.(4.5.51)]
1
δ αµ = δ αβµβ
3
se α = µ, então β pode assumir 3 outros valores distintos e visto que αβ = µβ temos que
αβ é uma permutação par de µβ, daí δ αβµβ = 1 para cada um dos valores de β, assim
(sem soma para índices repetidos)
1
δ αα = (1 + 1 + 1) = 1 (4.5.54)
3
e se α 6= µ, não irá existir outros termos na soma nos quais αβ é uma permutação par ou
ímpar de µβ, logo todos os termos são nulos. Concluímos então que
(
+1 se α = µ,
δ αµ = (4.5.55)
0 caso contrário.
Mostremos agora que

δ αβµν = δ αµ δ βν − δ αν δ βµ (4.5.56)
temos que se α = µ e β = ν, então δ αµ δ βν = 1 e será nulo caso α 6= µ e β 6= ν, porém

se α = ν. Similarmente, se α = ν e β = µ então δ αν δ βµ = 1 e nulo para α = 6 ν e

β 6= µ. Deste modo, se α = µ e β = ν ou seja, αβ é uma permutação par de µν, então

δ αβµν = δ αµ δ βν , já se α = ν e β = µ, isto é, αβ é uma permutação ímpar de µν, então
δ αβµν = −δ αν δ βµ , e por fim, se α é diferente de µ e de ν assim como β, então δ αβµν = 0.
Portanto, a Eq.(4.5.56) é válida por inspeção.
Ademais, é válida a seguinte relação
δ αβγµνλ = −αβγρ µνλρ = −ρµνλ ραβγ

= δ αµ δ βν δ γλ − δ αµ δ βλ δ γν − δ αλ δ βν δ γµ + δ αλ δ βµ δ γν + δ αν δ βλ δ γµ − δ αν δ βµ δ γλ
(4.5.57)
a prova desta relação é análoga a da Eq.(4.5.56).
4.5.11 Duals
Qualquer vetor J,~ qualquer tensor antissimétrico de rank dois F (Fαβ = F[αβ] ), e
qualquer tensor antissimétrico de rank três B (Bαβγ = B[αβγ] ) pode ser utilizado para se
construir novos tensores definidos por
∗
Jαβγ = J µ µαβγ
∗ 1
Fαβ = F µν µναβ
2
∗ 1 λµν
Bα = B λµνα (4.5.58)
3!
Chama-se ∗ J~ o ’dual’ de J,
~ ∗ F o dual de F, e ∗ B o dual de B. [Um uso anterior e
totalmente distinto da palavra ’dual’, chamado de conjunto de bases forma-1 {ω̃ α } , duais
a um conjunto de vetores de base {~eα }, caso hω̃ α , ~eβ i = δ αβ . Felizmente, não há motivos
para confusão entre os dois tipos de dualidade. Um relaciona conjuntos de vetores a
conjuntos de formas-1. O outro relaciona um tensor antissimétrico de rank p a um tensor
antissimétrico de rank 4 − p.] Mostremos que
∗∗ ~ ~ ∗∗ ∗∗
J = J, F = −F, B = B. (4.5.59)
Sabemos que ∗ Jαβγ = J µ µαβγ , daí
∗∗ 1∗
Jζ = Jαβγ αβγζ
3!
1
= J µ µαβγ αβγζ
3!
1
= − µαβγ ζαβγ J µ
3!
ζ
=J

1
Provemos agora a segunda relação, tendo em vista que ∗ Fαβ = F µν µναβ , temos
2
∗∗ 1∗
F ζξ = Fαβ αβζξ
2
1
= F µν µναβ αβζξ
4
1
= F µν αβζξ αβµν
2
1
= − F µν (δ ζµ δ ξν − δ ζν δ ξµ )
2
1 ζξ
= − (F − |{z} F ξζ )
2 ζξ
−F
= −F ξζ
1 λµν
Por fim, provemos a última relação, levando em conta que ∗ Bα = B λµνα
3!
∗∗
B ζξκ = ∗ Bα αζξκ
1
= B λµν λµνα αζξκ
3!
1
= − B λµν αλµν αζξκ
3!
utilizando a relação da Eq.(4.5.57), o produto de tensores de Levi-Civita podem ser escritos

como
αλµν αζξκ = −δ ζλ δ ξµ δ κν +δ ζλ δ ξν δ κµ +δ ζν δ ξµ δ κλ −δ ζν δ ξλ δ κµ −δ ζµ δ ξν δ κλ +δ ζµ δ ξλ δ κν (4.5.60)
daí,
1
∗∗
B ζξκ = − (−B λµν δ ζλ δ ξµ δ κν + B λµν δ ζλ δ ξν δ κµ + B λµν δ ζν δ ξµ δ κλ − B λµν δ ζν δ ξλ δ κµ
3!
− B λµν δ ζµ δ ξν δ κλ + B λµν δ ζµ δ ξλ δ κν )
1
⇒ ∗∗ B ζξκ = − (−B ζξκ + B ζκξ κξζ
|{z} − B
|{z} + B
ξκζ
|{z} − B
κζξ
|{z} + B
ξζκ
|{z} )
3!
−B ζξκ −B ζξκ B ζξκ B ζξκ −B ζξκ
= B ζξκ
conforme queríamos demonstrar.

CAPÍTULO 5 ELETROMAGNETISMO
5 Eletromagnetismo
5.1 Tensor Eletromagnético
5.1.1 Derivação do Tensor Eletromagnético Através da Formulação Covari-
ante
Sabemos que
~ = (U 0 , U i ) = γu (c, ~u)
U
e
d~P

dm d~p
= γu c ,
dτ dt dt
logo,
d~P ~

2 2 dm d~p
· U = γu c − · ~u
dτ dt dt
escolhendo o referencial de repouso da partícula (~u = 0 ⇒ dm/dt = 0)
d~P ~
·U=0
dτ
dP µ
⇒ Uµ = 0 (5.1.1)
dτ
ou,
dP 0 dP i
U0 + Ui = 0
dτ dτ
o que implica em
dP 0 dP i dpi

U0 = − Ui = −γu2 ui (5.1.2)
dτ dτ |{z} dt
|{z} γu ui
i
γu dp
dt
como U0 = γu c, obtemos que
dP 0 dpi

γu
=− ui (5.1.3)
dτ c dt
A força de Lorentz é dada por16
dpi e
= (cE i + ijk uj Bk ) (5.1.4)
dt c
16
Estamos utilizando o sistema de unidades Gaussiano, onde
1 4π
→ µ0 →
4π c2
1
B→ B E → E.
c

Inserindo (5.1.4) em (5.1.3) encontra-se que
dP 0 e
= −γu [E i ui + ijk ui uj Bk ]
dτ c (5.1.5)
e
= −γu (Ei ui )
c
deste modo, o quadrivetor força de Lorentz é
d~P
0
dpi

dP
= , γu
dτ dτ dt (5.1.6)
eγu
= (−Em um , cE i + ijk uj Bk )
c
~ é inserindo em um funcional
interpretando tal equação é possível ver que o Quadrivetor U
(aqui, um tensor do tipo 11 , chamado de tensor eletromagnético e representado por F) e

tem como resultado um outro Quadrivetor, isto pode ser expresso como:
d~P e ~
= F(U)
dτ c
ou,
dP µ e
= F µν U ν (5.1.7)
dτ c
então, para µ = 0
dP 0 e 0 0
F 0 U + F 0i U i

=
dτ c
e 0
cF 0 γu + F 0i (γu ui )

=
c
eγu 0
cF 0 + F 0i ui

=
c
dP 0 eγu
ora, mas por (5.1.5), = (−Em um ), consequentemente
dτ c
eγu eγu 0
(−Em um ) = cF 0 + F 0i ui

c c
⇒ −Em um = cF 00 + F 0i ui
como as componentes ui são linearmente independentes, segue que
F 0i = −Ei , F 00 = 0 (5.1.8)
aplicando µ = i = 1, 2, 3 em (5.1.7)

dP i e
= (F i0 U 0 + F ij U j )
dτ c
e i
cF 0 γu + F ij (γu uj )

=
c
eγu i
cF 0 + F ij uj

=
c
entretanto, por (5.1.6)
dP i eγu
= (cE i + ijk uj Bk )
dτ c
comparando as duas últimas equações:
cF i0 + F ij uj = cE i + ijk uj Bk
= cη ik Ek + ijk ηjm um Bk
= c(−δ ik )Ek + ijk (−δjm )um Bk
= −cEi − ijk uj Bk
devido a independência linear de c e uj
F i0 = −Ei , F ij = −ijk Bk (5.1.9)
Deste modo, o tensor eletromagnético é dado por (lembre-se de que estamos utilizando a
definição de que 123 = −1)
 
0 −E1 −E2 −E3
 
α −E1 0 B3 −B 2 
F β =   (5.1.10)
−E −B 0 B 
 2 3 1 
−E3 B2 −B1 0
frequentemente este tensor é visto na sua forma covariante obtida por um abaixamento
de índice com a métrica:
Fαβ = ηαγ F γβ ; (5.1.11)
 
0 −E1 −E2 −E3
 
E1 0 B3 −B 2 
kFαβ k = 
E −B
 (5.1.12)
 2 3 0 B1 
E3 B2 −B1 0
e a forma contravariante é obtida por um levantamento de índices do tipo
F αβ = η αµ η βν Fµν (5.1.13)

 
0 E1 E2 E3
 
αβ −E1 0 B3 −B 2 
F =   (5.1.14)
−E −B 0 B1 
 2 3 
−E3 B2 −B1 0
5.1.2 Derivação do Tensor Eletromagnético Através do Princípio Variacional
A ação de uma partícula que se move num campo eletromagnético dado é composta
de duas partes: a ação da partícula livre (??) e de um termo que descreve a interação
da partícula com o campo. Este último deve conter tanto as grandezas características da
partícula quanto as grandeza que caracterizam o campo.
Parece que as propriedades da partícula são definidas, no que concerne à sua interação,
por um único parâmetro, chamado carga e da partícula, podendo ser positivo, negativo
ou nulo. As propriedades do campo em si são caracterizadas por um 4-vetor Ai chamado
4−potencial, cujas componentes são funções das coordenadas e do tempo. Essas grandezas
são expressas na ação por meio do termo
Z b
e
Ai dxi (5.1.15)
c a
Para provar isto iremos calcular a energia potencial U do campo eletromagnético, supo-
nhamos uma partícula que esteja sobre a ação da força de Lorentz, dada por
d~p e ~ ~
= (cE + ~u × B)
dt c
além disso, lembremos da seguinte equação de Maxwell:
~
~ + 1 ∂B = 0
~ ×E
∇
c ∂t
e que o teorema de Helmholtz nos permite escrever:
~ =∇
B ~ ×A
~
~ da equação na anterior na equação de Maxwell:

substituindo B
!
~
~ ×
∇ ~ + 1 ∂A
E =0
c ∂t
~ ×M
do cálculo vetorial sabemos que ∇ ~ = 0, onde M ~ é um campo vetorial é um indicativo
~ =M
da possível existência de um campo escalar tal que ∇ϕ ~ , assumiremos que ϕ satisfaz

todas as condições necessárias para que o mesmo seja um potencial, deste modo
~
~ + 1 ∂ A = −∇φ
E ~
c ∂t
ou,
~
~ = − 1 ∂ A − ∇ϕ
E ~ (5.1.16)
c ∂t
~ =∇
substituindo (5.1.16) e B ~ ×A
~ na força de Lorentz, obtém-se:
!
d~p e ∂ ~
A
= ~ −
−c∇ϕ ~ ×A
+ ~u × ∇ ~ (5.1.17)
dt c ∂t
lembremos que
~
dA ~
~ A
= (~u · ∇) ~ + ∂A (5.1.18)
dt ∂t
e pela regra BAC − CAB:
~ ×A
~u × ∇ ~ = ∇(~
~ u · A)
~ − (~u · ∇)
~ A~ (5.1.19)
substituindo (5.1.18) no segundo termo do lado direito de (5.1.17) e (5.1.19) no terceiro:

!
d~p e d ~
A
= ~ −
−c∇ϕ ~ u · A)
+ ∇(~ ~ (5.1.20)
dt c dt
Contudo, se existe um potencial para a força de Lorentz, UL , então é válida a seguinte

equação para a força generalizada
d~p ~ L+ d ∇

~ u UL

= −∇U (5.1.21)
dt dt
~ u é o gradiente em relação as velocidades. Comparando (5.1.20) com (5.1.21)

onde ∇
~ eϕ − e ~u · A
~ + d −eA ~ = d~p = −∇U
~ L+ d ∇
h i
−∇ ~ u UL
c dt c dt dt
d h e ~i d h~ e i
~ , então
contudo − A = ∇u − ~u · A
dt c dt c
~ eϕ − e ~u · A
~ + d ∇
h e
~ = d~p = −∇U
~ L+ d ∇
i
−∇ ~ u − ~u · A ~ u UL
c dt c dt dt
ou seja,
e ~
UL = eϕ − ~u · A (5.1.22)
c

r
u2 2
Podemos escrever a Lagrangiana do sistema como L = K −UL , onde K = −m0 c 1 − 2
c
é a energia cinética e UL é a energia potencial, deste modo a ação para uma carga em um
campo eletromagnético se escreve
Z b
S= L dt
a
r
b b b
u2
Z Z Z
e~
= −m0 c c 1 − 2 dt − eϕ dt + A · ~u dt
a c a a c

r
b b b
u2
Z Z Z
2 e e ~ · d~x
S= −m0 c 1 − 2 dt − (ϕ)(c dt) + A
a c c a c a
em uma notação compacta

r
b b
u2
Z Z
e
S= −m0 c 2
1 − 2 dt − Aµ dxµ (5.1.23)
a c c a
r
u2
ou, lembrando que c 1 − dt = ds
c2
Z b Z b
e
S= −m0 c ds − Aµ dxµ (5.1.24)
a c a
Onde construímos um 4-vetor A , que possui componentes espaciais dadas pelo vetor
~ chamado potencial vetor do campo e uma componente temporal dada
tridimensional A,
por ϕ, chamada potencial escalar do campo. De modo que
A~ = (Ai , φ) (5.1.25)
consequentemente a integral de ação, Eq.(5.1.23), pode ser escrita como

r !
b
u2 e ~
Z
S= −m0 c2 1 − 2 + A · ~u − eϕ dt (5.1.26)
a c c
onde a função integrante é a Lagrangiana para uma carga num campo eletromagnético
r
u2 e ~
L = −m0 c2 1− + A · ~u − eϕ (5.1.27)
c2 c
e~
Esta expressão difere da Lagrangiana para uma partícula livre pelos termos A · ~u − eϕ,
c
∂L
que descrevem a interação da carga com o campo. A derivada é a quantidade de
∂~u

movimento da partícula; p~. Derivando, encontramos:
m0~ue~
p~ = r + A (5.1.28)
u2 c
1− 2
c
A partir da Lagrangiana, podemos encontrar a Hamiltoniana da partícula no campo,

lembrando da fórmula geral:
∂L
H = ~u · −L
∂~u
aplicando (5.1.28) nesta última, temos:
m0 c2
H=r + eϕ (5.1.29)
u2
1− 2
c
Entretanto, a Hamiltoniana deve ser expressa em função da quantidade de movimento,

Note que
e ~ 2 m20 u2
p~ − A =
c u2
1− 2
c
somando m20 c2 em ambos os lados
e ~ 2 m20 u2
m20 c2 + p~ − A = m20 c2 +
c u2
1− 2
c
2
c
= m20 (5.1.30)
u2
1− 2
c
(H − eϕ)2
=
c2
e finalmente r e ~ 2
H= m20 c2 + c2 p~ − A + eϕ (5.1.31)
c
que é a Hamiltoniana do sistema.
De acordo com o princípio da ação mínima,
Z b
e
δS = δ −m0 c ds − Aµ dxµ = 0 (5.1.32)
a c
dxµ dxµ
p
Assim, como ds =
Z bh p e i
δS = −m0 cδ( dxµ dxµ ) − δ(Aµ dxµ )
a c

Z bh p e i
⇒ δS = −m0 cδ( dxµ dxµ ) − δ(Aµ dxµ )
a c
Z b η
∂ p µ ∂ dx e e
⇒ δS = −m0 c η( dxµ dx ) dα − Aµ δ(dxµ ) − (δAµ ) dxµ
a ∂ dx ∂α c c
Z b µ
−m c ∂ dx µ ∂ dxµ
= p 0 µ dxµ η
η δ(dx ) + dx
η
η δ(dx )
a 2 dxµ dx ∂ dx ∂ dx
Z b Z b
e µ e
− Aµ δ(dx ) − (δAµ ) dxµ
a c a c
vemos que, por um abaixamento e levantamento de índice, dxµ ∂ dxµ = dxµ ∂ dxµ , segue
que Z b
−m0 c µ η e µ e µ
δS = dxµ δ η (δ dx ) − Aµ δ(dx ) − (δAµ ) dx
a ds c c
Z b
−m0 c µ e µ e µ
= dxµ (δ dx ) − Aµ δ(dx ) − (δAµ ) dx = 0
a ds c c
Lembremos da seguinte relação
∂ ∂xµ
δ(dxµ ) = (dxµ ) dα = d dα = d(δxµ )
∂α ∂α
Assim, Z b
dxµ µ e µ e µ
δS = m0 c d(δ x ) + Aµ d(δ x ) + (δAµ ) dx = 0
a ds c c
Integremos por partes os dois primeiros termos sob o sinal de soma, por exemplo
tomando dξ = d(δxµ ) e η = m0 c dxµ / ds na primeira integral. Ainda escrevamos no
primeiro termo dxµ / ds = Uµ , são as componentes da 4-velocidade. Então:
b Z b e b Z b e Z b
e
µ
δS = m0 cUµ δx − µ µ
m0 cδx dUµ + Aµ δx − µ
δx dAµ + (δAµ ) dxµ = 0
a a c a a c a c
(5.1.33)
o primeiro e o terceiro termo da igualdade acima são nulos, pois fazemos variar a integral
observando as condições: (δxµ )a = (δxµ )b = 0. Aliás,
∂Aν µ ∂Aµ ν
δAν = δx , dAµ = dx
∂xµ ∂xν
então Z b
e ∂Aµ ν µ e ν ∂Aν µ
µ
δS = −m0 c dUµ δx − dx δx + dx δx =0
a c ∂xν c ∂xµ
dUµ
Escrevamos no primeiro termo dUµ = ds, no segundo e no terceiro termo dxν =
ds
U ν ds. Então,
Z b
dUµ e ∂Aν ∂Aµ ν
δS = −m0 c + µ
− U δxµ ds = 0
a ds c ∂x ∂xν

Os δxµ sendo arbitrários, a expressão entre colchetes é nula, e temos

dUµ e ∂Aν ∂Aµ
m0 c = − Uν (5.1.34)
ds c ∂xµ ∂xν
Ponhamos
∂Aν ∂Aµ
Fµν = µ
− (5.1.35)
∂x ∂xν
O tensor Fµν é o já definido tensor do campo eletromagnético. As equações de movimento
(5.1.34) tomam a forma:
dUµ e
m0 c = Fµν U ν (5.1.36)
ds c
Essas quatro equações (para µ = 0, 1, 2, 3) são as do movimento de uma carga em um
campo eletromagnético sob a forma quadridimensional.
Resulta da definição do tensor Fµν que
Fµν = −Fνµ (5.1.37)
isto é, o tensor do campo eletromagnético é anti-simétrico. Isto acarreta Fµν = 0 para

µ = ν.
Substituindo em (5.1.35) Ai , as componentes do potencial vetor do campo e A0 = φ
achamos facilmente os valores das diversas componentes do tensor Fµν , desde que nos
lembremos das seguintes relações B ~ =∇ ~ ×A ~ ⇒ Bk = ijk ∂ i Aj = ijk ∂i Aj e E
~ = ∇φ
~ ⇒
Ei = ∂i φ, assim
∂Aj ∂Ai
Fij = i
− j = ∂i Aj − ∂j Ai
∂x ∂x
para i = 1, j = 2 temos F12 = ∂1 A2 − ∂2 A1 = 123 ∂1 A2 − 123 ∂2 A1 = B3 , e pela anti-
simetria F21 = −B3 , por processos análogos F31 = −F13 = B2 e F23 = −F32 = B1 , se
µ = 0 e ν = i,
∂A0 ∂Ai
F0i = − 0 = ∂i φ = E i
∂xi ∂x
assim Fi0 = −Ei , por fim se µ = ν, então Fµν = −Fνµ ⇒ Fµν = 0 para µ = ν. Podemos
agrupar essas componentes em uma matriz:
 
0 −E1 −E2 −E3
 
E1 0 B3 −B 2 
kFαβ k = 
E −B
 (5.1.38)
 2 3 0 B1


E3 B2 −B1 0
Assim, as componentes dos campos elétrico e magnético são as componentes do 4-tensor

do campo eletromagnético.

5.2 Transformações de Lorentz dos Campos Elétricos e Magnéti-

cos
O grande poder computacional e conceitual reside na visão geométrica de Einstein da
física. Ideias que parecem complexas quando vistas no cotidiano ’espaço-mais-tempo’ ou
na maneira ’3 + 1’ se tornam elegantes e simples quando observadas como relações entre
objetos geométricos no espaço-tempo quadridimensional. Derivações nas quais são difíceis
na linguagem 3 + 1 se simplificam na linguagem geométrica.
O campo eletromagnético é um bom exemplo. Na linguagem geométrica, ele é descrito
por um tensor F anti-simétrico de rank 2 (forma-2), no qual não requer coordenada alguma
para a sua definição. Este tensor produz uma 4-força em qualquer partícula carregada
dada por
d~P ~
= eF(U)
dτ
é tudo muito simples! Para obtermos as transformações de um referencial para outro,
basta lembrarmos que
Fµ̄ν̄ = Λαµ̄ Λβ ν̄ Fαβ (5.2.1)
Por exemplo, suponhamos que a transformação de Lorentz seja um boost na direção z,

como o tensor utiliza a matriz de transformação inversa, (note os coeficientes Λαµ̄ e Λβ ν̄ ):
 
γ 0 0 γβ
 
0 1 0 0
(Λζ ξ̄ ) = Λ(−~v ) = 
0

 0 1 0 
γβ 0 0 γ
obtemos que o campo elétrico se transforma da seguinte forma:
Ez̄ = F3̄0̄
= Λα3̄ Λβ 0̄ Fαβ
= Λ03̄ Λ00̄ F00 + Λ03̄ Λ30̄ F03 + Λ33̄ Λ00̄ F30 + Λ33̄ Λ30̄ F33
= γ 2 β F00 +γ 2 β 2 F03 +γ 2 F30 + γ 2 β F33 (5.2.2)
|{z} |{z} |{z}
0 −F30 0
= γ 2 (1 − β 2 )F30 = F30
= Ez

Enquanto que
Ex̄ = F1̄0̄ = Λα1̄ Λβ 0̄ Fαβ
= Λ11̄ Λ00̄ F10 + Λ11̄ Λ30̄ F13
(5.2.3)
= γF10 + γβF13
= γ(Ex − βBy )
de forma análoga,
Eȳ = F2̄0̄ = Λα2̄ Λβ 0̄ Fαβ
= Λ22̄ Λ00̄ F20 + Λ22̄ Λ30̄ F23
(5.2.4)
= γF20 + γβF23
= γ(Ey + βBx )
já o campo magnético,
Bz̄ = F1̄2̄ = Λα1̄ Λβ 2̄ Fαβ
(5.2.5)
= Λ11̄ Λ22̄ F12 = F12 = Bz ,
Bx̄ = F2̄3̄ = Λα2̄ Λβ 3̄ Fαβ

= Λ22̄ Λ03̄ F20 + Λ22̄ Λ33̄ F23
(5.2.6)
= γβF20 + γF23
= γ(Bx + βEy ),
Bȳ = F3̄1̄ = Λα3̄ Λβ 1̄ Fαβ

= Λ03̄ Λ11̄ F01 + Λ33̄ Λ11̄ F31
(5.2.7)
= γβF01 + γF31
= γ(By − βEx )
Portanto, podemos generalizar os resultados anteriores para
~ =E
Ē ~ k, ~ = γ(E
Ē ~ ⊥ + β~ × B
~ ⊥ ),
k ⊥
~ =B ~ = γ(B (5.2.8)
B̄ k
~ k, B̄ ⊥
~ ⊥ − β~ × E
~ ⊥ ).
Tal resultado resolve os problemas clássicos do eletromagnetismo na relatividade de Gali-

leu, um campo elétrico em um referencial é visto como dividido em um campo magnético
e elétrico em outro referencial, e o mesmo é válido para o campo magnético.
5.3 Equações de Maxwell

Falemos sobre a ação de uma carga no campo, ou, de maneira mais geral, falemos
sobre a dinâmica do campo eletromagnético, com ou sem carga. Comecemos com a
observação de que as equações de Maxwell continuam válidas, pois as transformações de
Lorentz foram construídas de forma que as mesmas fossem preservadas. O tensor do

campo eletromagnético, Faraday = F, é um tensor anti-simétrico de rank-2. Sabemos

que podemos escreve-lo como o produto tensorial de bases forma-1:
˜ α ⊗ dx
F = Fαβ dx ˜ β,
que pode ser reescrito como
1 ˜ β + 1 Fαβ dx
˜ α ⊗ dx ˜ α ⊗ dx
˜ β
F = Fαβ dx
2 2
como os índices são mudos, podemos trocar β por α no segundo termo do lado direito da
equação:
1 ˜ β + 1 Fβα dx
˜ α ⊗ dx ˜ β ⊗ dx
˜ α
F = Fαβ dx
2 2
assim utilizando-se do fato de que Fαβ = −Fβα , e
˜ α ∧ dx
dx ˜ β = dx
˜ α ⊗ dx
˜ β − dx
˜ β ⊗ dx
˜ α (5.3.1)
obtemos que
1 ˜ α ∧ dx
˜ β.
F = Fαβ dx (5.3.2)
2
Qualquer forma-2 pode ser expressa desta maneira. Deste modo, o tensor eletromagnético
é dado por
˜ 0 ∧ dx
2F =F01 dx ˜ 1 + F02 dx
˜ 0 ∧ dx
˜ 2 + F03 dx
˜ 0 ∧ dx
˜ 3 + F10 dx
˜ 1 ∧ dx
˜ 0 + F12 dx
˜ 1 ∧ dx
˜ 2
˜ 1 ∧ dx
+ F13 dx ˜ 3 + F20 dx
˜ 2 ∧ dx
˜ 0 + F21 dx
˜ 2 ∧ dx
˜ 1 + F23 dx
˜ 2 ∧ dx
˜ 3 + F30 dx
˜ 3 ∧ dx
˜ 0
˜ 3 ∧ dx
+ F31 dx ˜ 1 + F32 dx
˜ 3 ∧ dx
˜ 2
utilizando a propriedade anticomutatividade do produto externo, podemos reescrever a

expressão acima da seguinte forma:
˜ 0 ∧ dx
2F =(F01 − F10 )dx ˜ 1 + (F02 − F20 )dx
˜ 0 ∧ dx
˜ 2 + (F03 − F30 )dx
˜ 0 ∧ dx
˜ 3
˜ 1 ∧ dx
+ (F12 − F21 )dx ˜ 2 + (F13 − F31 )dx
˜ 1 ∧ dx
˜ 3 + (F23 − F32 )dx
˜ 2 ∧ dx
˜ 3
como o tensor eletromagnético é anti-simétrico, isto é, Fµν = −Fνµ , segue que
˜ 0 ∧ dx
F = F01 dx ˜ 1 + F02 dx
˜ 0 ∧ dx
˜ 2 + F03 dx
˜ 0 ∧ dx
˜ 3 + F12 dx
˜ 1 ∧ dx
˜ 2 + F13 dx
˜ 1 ∧ dx
˜ 3 + F23 dx
˜ 2 ∧ dx
˜ 3
(5.3.3)
⇒ F = −Ex dct˜ ∧ dx˜ + −Ey dct ˜ ∧ dy
˜ − Ez dct
˜ ∧ dz˜ + Bz dx˜ ∧ dy˜ − By dx˜ ∧ dz˜ + Bx dy
˜ ∧ dz˜
˜ ∧ dct
⇒ F = Ex dx ˜ + Ey dy
˜ ∧ dct
˜ + Ez dz
˜ ∧ dct
˜ + Bz dx
˜ ∧ dy
˜ + By dz
˜ ∧ dx
˜ + Bx dy
˜ ∧ dz
˜ (5.3.4)

Sabemos que o tensor gradiente é dado pela seguinte equação:

˜ = ∂ ˜ ∂ ˜ ∂ ˜ ∂ ˜
∇ dct + dx + dy + dz (5.3.5)
∂ct ∂x ∂y ∂z
Assim sendo, seu produto com o tensor eletromagnético produz

˜ = ∂Ex ˜ ∂Ex ˜ ∂Ex ˜ ∂Ex ˜ ˜ ∧ dct
˜
∇F dct + dx + dy + dz ∧ dx

∂Ey ˜ ∂Ey ˜ ∂Ey ˜ ∂Ey ˜ ˜ ∧ dct
˜
+ dct + dx + dy + dz ∧ dy

∂Ez ˜ ∂Ez ˜ ∂Ez ˜ ∂Ez ˜ ˜ ∧ dct
˜
+ dct + dx + dy + dz ∧ dz

∂Bz ˜ ∂Bz ˜ ∂Bz ˜ ∂Bz ˜ ˜ ∧ dy
˜
+ dct + dx + dy + dz ∧ dx

∂By ˜ ∂By ˜ ∂By ˜ ∂By ˜ ˜ ∧ dx
˜
+ dct + dx + dy + dz ∧ dz

∂Bx ˜ ∂Bx ˜ ∂Bx ˜ ∂Bx ˜ ˜ ∧ dz
˜
+ dct + dx + dy + dz ∧ dy
˜ = ∂Ex dy
⇒ ∇F ˜ ∧ dx ˜ + ∂Ex dz
˜ ∧ dct ˜ ∧ dx ˜ + ∂Ey dx
˜ ∧ dct ˜ ∧ dy ˜ + ∂Ey dz
˜ ∧ dct ˜ ∧ dy
˜ ∧ dct
˜
∂y ∂z ∂x ∂z
∂Ez ˜ ˜ + ∂Ez dy
˜ ∧ dct ˜ ∧ dz ˜ + ∂Bz dct
˜ ∧ dct ˜ ∧ dx
˜ ∧ dy˜ + ∂Bz dz
˜ ∧ dx
˜ ∧ dy
˜
+ dx ∧ dz
∂x ∂y ∂ct ∂z
∂By ˜ ˜ + ∂By dy
˜ ∧ dx ˜ ∧ dz
˜ ∧ dx˜ + ∂Bx dct
˜ ∧ dy
˜ ∧ dz˜ + ∂Bx dx
˜ ∧ dy
˜ ∧ dz
˜
+ dct ∧ dz
∂ct ∂y ∂ct ∂x
˜ ∧ (dz
observe que dy ˜ ∧ dx)
˜ = dy
˜ ∧ (−dx
˜ ∧ dz)
˜ = −(dy ˜ ∧ dx)
˜ ∧ dz
˜ = (dx
˜ ∧ dy)
˜ ∧ dz,
˜ efetuando
processos similares na equação acima, pode-se escrever a mesma como:

˜ = ∂B x ∂B y ∂B z ˜ ∧ dy
˜ ∧ dz˜ + 1 ∂B x ∂E z ∂E y ˜ ∧ dy˜ ∧ dz
˜
∇F + + dx + − dct
∂x ∂y ∂z c ∂t ∂y ∂z

1 ∂By ∂Ex ∂Ez ˜ ˜ ∧ dx
˜ + 1 ∂B z ∂E y ∂E x ˜ ∧ dx
˜ ∧ dy.
˜
+ + − dct ∧ dz + − dct
c ∂t ∂z ∂x c ∂t ∂x ∂y
(5.3.6)
Duas das quatro equações de Maxwell nos diz que
~
1 ∂B
~ = 0,
div B e ~ = 0.
+ rot E (5.3.7)
c ∂t
O primeiro termo no parêntese do lado direito da Eq.(5.3.6) se trata do divergente do

campo magnético, enquanto o segundo, terceiro e quarto termo em parêntese são as com-
~
ponentes x, y, z de (1/c)(∂ B/∂t) ~ respectivamente. Portanto, podemos resumir
+ rot E,

duas das quatro equações de Maxwell a:
˜ =0
∇F (5.3.8)

CAPÍTULO 6 INTRODUÇÃO AS FORMULAÇÕES LAGRANGIANAS E
HAMILTONIANA PARA SISTEMAS E CAMPOS CONTÍNUOS
6 Introdução as Formulações Lagrangianas e Hamilto-

niana para sistemas e campos contínuos
Todos os formalismos da mecânica discutidos até aqui foram desenvolvidos para o trata-
mento de sistemas com um número de graus de liberdade finito, ou ao menos enumera-
velmente infinito. Existem alguns problemas mecânicos, todavia, que envolvem sistemas
contínuos, como, por exemplo, o problema da vibração de um sólido elástico. Aqui, cada
ponto do sólido contínuo participa da oscilação, e o movimento completo pode somente
ser descrito através da especificação das coordenadas da posição de todos os pontos. Não
é muito difícil modificar as nossas formulações anteriores da mecânica para que lidem com
estes problemas. Os conceitos de teoria do campo podem ser desenvolvidos pela aproxi-
mação de sistemas contínuos através de um sistema discreto, solucionando o problema, e
tomando o limite para o contínuo.
6.1 A transição de um Sistema Discreto para um Sistema Contí-

nuo
Devemos aplicar este procedimento a uma corda elástica infinitamente longa na qual
suporta pequenas vibrações longitudinais, isto é, deslocamentos oscilatórios das partículas
da corda paralelos ao eixo da corda. Um sistema composto de partículas discretas que
aproxima-se de uma barra contínua é uma corrente infinita de pontos massivos igualmente
espaçados por uma distância a e conectados por molas uniforme sem massa com constante
de força k (veja a Fig.6.1.1). Será assumido que os pontos massivos só podem se mover
ao longo da corrente. Podemos portanto obter as equações que descrevem o movimento
pelas técnicas rotineiras para pequenas oscilações. Denotando o deslocamento da i-ésima
partícula em relação ao seu ponto de equilíbrio por ηi , a energia cinética é dada por:
Figura 6.1.1: Um sistema discreto de pontos de igual massa conectados por molas, é tido
como uma aproximação para uma corda elástica continua.
1X
T = mη̇i2 (6.1.1)
2 i

onde m é a massa de cada partícula. A energia potencial correspondente é a soma das

energias potenciais de cada mola como sendo o resultado de serem esticadas ou compri-
midas em relação ao seu comprimento de equilíbrio:
1X
V = k(ηi+1 − ηi )2 (6.1.2)
2 i
Combinando as Eqs.(6.1.1) e (6.1.2), a Lagrangiana para o sistema é
1 X 2
mη̇i − k(ηi+1 − ηi )2

L=T −V = (6.1.3)
2 i
na qual também pode ser escrita como

" 2 # X
1X m 2 ηi+1 − ηi
L= a η̇ − ka = aLi (6.1.4)
2 i a i a i
onde a é a distância de equilíbrio entre os pontos (veja a Fig.6.1.1). Assim,

( " 2 #)
1 ∂L ∂ 1P m 2 ηj+1 − ηj
= η̇ − ka
a ∂ηi ∂ηi 2 j a j a
" #
2
1 ∂ X ηj+1 − ηj
= − ka
2 ∂ηi j a
expandindo os termos i − 1 e i do somatório:

" i−2 :0
2 #
2
−

1 ∂L 1 ∂ X ηj+1 −ηj
1 ∂ η (i−1)+1 ηi−1
= − ka − ka

a ∂ηi 2 ∂ηi a 2 ∂ηi a
j=1
2 " n #: 0
2

1 ∂ ηi+1 − ηi 1 ∂ X ηj+1 − η j

− ka − ka
2 ∂ηi a 2 ∂ηi j=i+1
a

onde os termos no somatório se cancelam devido ao fato de que a derivada é em relação

a i−ésima coordenada, contudo não existe nenhum fator ηi nos dois somatórios, daí
2 2
1 ∂L 1 ∂ ηi − ηi−1 1 ∂ ηi+1 − ηi
= − ka − ka
a ∂ηi 2 ∂ηi a 2 ∂ηi a
aplicando a regra da cadeia,

1 ∂L ηi − ηi−1 ηi+1 − ηi
= −ka + ka
a ∂ηi a2 a2

d m ∂ η̇j2

1d ∂L
=
a dt ∂ η̇i
dt 2a ∂ η̇i
m dη̇j
= δji
a dt
m
= η̈i
a
As equações de movimento de Lagrange para as coordenadas ηi são

m ηi+1 − ηi ηi − ηi−1
η̈i − ka + ka =0 (6.1.5)
a a2 a2
A forma particular de L na Eq.(6.1.4), e as suas equações correspondentes do movimento,

foram escolhidas por conveniência para o limite da corda contínua quando a se aproxima
de zero. É evidente que m/a se reduz para µ, a massa por unidade de comprimento do
sistema contínuo, contudo o valor limite de ka pode não ser tão óbvio. Para uma corda
elástica que obedece a lei de Hooke, será lembrado que a extensão da corda por unidade
de comprimento é diretamente proporcional à força ou tensão exercida na haste, uma
relação que pode ser escrita como
F =Yξ
onde ξ é a alongamento por unidade de comprimento e Y é o módulo de Young. Agora,

a extensão de um comprimento a de um sistema discreto, por unidade de comprimento,
será ξ = (ηi+1 − ηi )/a. A força necessária para esticar a corda por esta quantidade é

ηi+1 − ηi
F = k(ηi+1 − ηi ) = ka
a
devido a isso ka deve corresponder ao módulo de Young de uma corda contínua. Na

ida do caso discreto para o contínuo, o índice inteiro i que identifica um ponto de massa
particular se torna a coordenada contínua da posição x; ao invés da variável discreta ηi
temos um campo contínuo variável ϕ(x, t). Além disso, a quantidade
ηi+1 − ηi ϕ(x + a, t) − ϕ(x, t)

lim →
i→x a a
que ocorre em Li evidentemente se aproxima do limite
ϕ(x + a, t) − ϕ(x, t) ∂ϕ
lim =
a→0 a ∂x
com a, fazendo o papel de dx, aproximando-se de zero. Aplicando os limites i → x, a → 0

e m → 0 na Lagrangiana da Eq.(6.1.4):

   
n
!
1 X m   1 X ηi+1 − ηi 
L =  lim a lim η̇ 2 lim  −  lim a lim ka lim lim
  
2  a→0 i=1 i→x i a,m→0 a  2 a→0 i a→0 | {z }
a→0 i→x a 
| {z }
µ Y
Finalmente, o somatório sob um número discretos de partículas se torna uma integral sob
x, o comprimento da corda, e a Lagrangiana (6.1.4) aparece como
Z " 2 2 #
1 ∂ϕ ∂ϕ
L= µ −Y dx (6.1.6)
2 ∂t ∂x
Aplicando os limites i → x, a → 0 e m → 0 na Eq.(6.1.5), encontra-se
m 1

ηi+1 − ηi
1

ηi − ηi−1

lim lim η̈i − lim ka lim lim + lim ka lim lim =0
a,m→0 a i→x a→0 a→0 a i→x a a→0 a→0 a i→x a
∂ 2ϕ

1 ϕ(x + a) − ϕ(x) 1 ϕ(x) − ϕ(x − a)
⇒ µ 2 − Y lim lim + Y lim lim =0
∂t a→0 a a→0 a a→0 a a→0 a

∂ϕ ∂ϕ
2
−
∂ ϕ ∂a x ∂a x−a
⇒ µ 2 − Y lim =0
∂t a→0 a
∂ 2ϕ ∂ 2ϕ
⇒µ 2 −Y 2 =0 (6.1.7)
∂x ∂x
a equação de onda unidimensional familiar, que possui uma velocidade de propagação
dada por s
Y
v= (6.1.8)
µ
A Equação (6.1.8) é a bastante conhecida relação da velocidade de ondas longitudinais.
Este exemplo simples é suficiente para ilustrar as características salientes da transpo-
sição de um sistema discreto para um contínuo. O fato mais importante a entender é o
papel desempenhado pela coordenada de posição x. Ela não é uma coordenada generali-
zada; mas sim serve meramente como um índice contínuo substituindo o índice discreto i.
Assim como cada valor de i corresponde a uma coordenada generalizada diferente, ηi , do
sistema, então aqui para cada valor de x existe uma coordenada generalizada ϕ(x, t). Se
o sistema contínuo for tridimensional, ao invés de unidimensional como antes, as coorde-
nadas generalizadas serão distinguidas pelos três índices contínuos x, y, z, e escreveremos
ϕ(x, y, z, t). Note que as quantidades x, y, z, e t são completamente independentes uma
da outra, e aparecem somente como variáveis explicitas em ϕ. A Equação (6.1.6) também
mostra que a Lagrangiana aparece como uma integral sob o índice contínuo x; no caso

tridimensional correspondente a Lagrangiana terá a forma

ZZZ
L= L dx dy dz (6.1.9)
onde L é a conhecida densidade Lagrangiana. Para vibrações longitudinais de uma corda

contínua, a densidade Lagrangiana é dada por
" 2 #
2
1 ∂ϕ ∂ϕ
L = µ −Y (6.1.10)
2 ∂t ∂x
correspondendo ao limite contínuo da quantidade Li , no qual aparece na Eq.(6.1.4). É a

densidade Lagrangiana, ao invés da própria Lagrangiana, que será utilizada para descrever
o movimento do sistema.
6.2 A Formulação Lagrangiana para Sistemas Contínuos

É observado a partir da Eq.(6.1.9) que L para uma corda elástica, além de ser uma
função de ϕ̇ = ∂ϕ/∂t, também envolver uma derivada espacial de ϕ, a saber, ϕ0 = ∂ϕ/∂x;
x e t portanto, desempenham papeis similares na densidade Lagrangiana. Se houvesse
forças locais presentes além das interações vizinhas próximas, então L seria uma função
de ϕ assim como é do gradiente espacial de ϕ. Evidentemente, no caso geral L também
poderia muito bem ser uma função explicita de x e t. Logo, a densidade Lagrangiana
para qualquer sistema unidimensional terá a aparência de uma função da quantidade de
campo ϕ na seguinte forma

∂ϕ ∂ϕ
L =L ϕ, , , x, t (6.2.1)
∂x ∂t
A Lagrangiana total, indo de acordo com a Eq.(6.1.10), é então a integral de L sob todo
o intervalo x que define o sistema, e o princípio de Hamilton no limite do sistema contínuo
aparece como Z Z 2
δI = δ L dx dt = 0 (6.2.2)
1
Se o princípio de Hamilton para o sistema contínuo possuir alguma utilidade, então

deve ser possível derivar o limite contínuo da equação do movimento, por exemplo a
Eq.(6.1.7), diretamente através da variação na integral dupla de L na Eq.(6.2.2). Pode-
mos realizar essa variação por métodos que diferem apenas ligeiramente daqueles usados
para um sistema discreto. A variação ocorre somente em ϕ e em suas derivadas; os
parâmetros x e t não são afetados pelas variações nem diretamente nem nos limites de
integração. Assim como a variação de ϕ é tomada como nula nos pontos extremos t1 e
t2 , também a variação de ϕ é nula nos limites x1 e x2 da integração em x. A variação de
caminho adequada no espaço ϕ pode ser obtida, por exemplo, escolhendo ϕ a partir de

uma família de funções ϕ com parâmetro único:
ϕ(x, t; α) = ϕ(x, t; 0) + αζ(x, t) (6.2.3)
Aqui ϕ(x, t; 0) representa a função correta na qual satisfará o princípio de Hamilton, e

ζ é qualquer função bem comportada que desaparece nos extremos em t e x. Se I é
considerado como uma função de α, para ser um extremo para ϕ(x, t; 0) a derivada de I
em relação a α desaparece em α = 0. Por diferenciação direta,
Z t2 Z x2
dI ∂ ∂ ∂
= L ϕ(x, t; α), ϕ(x, t; α), ϕ(x, t; α), x, t dx dt
dα ∂α t1 x1 ∂x ∂t
pela regra da cadeia,

" #
Z t2 Z x2
∂I ∂L ∂ϕ ∂L ∂ ∂ϕ ∂L ∂ ∂ϕ
= dx dt + + ∂ϕ (6.2.4)
∂α t1 x1 ∂ϕ ∂α ∂ ∂ϕ
∂t
∂α ∂t ∂ ∂x ∂α ∂x
Como foi exigido que ϕ fosse uma função bem comportada, segue que o teorema de
Schwarz deve ser válido, e podemos permutar as derivadas parciais, deste modo
" #
Z t2 Z x2
∂I ∂L ∂ϕ ∂L ∂ ∂ϕ ∂L ∂ ∂ϕ
= dx dt + + ∂ϕ (6.2.5)
∂α t1 x1 ∂ϕ ∂α ∂ ∂ϕ
∂t
∂t ∂α ∂ ∂x ∂x ∂α
Façamos uma integração por partes em relação a variável t no segundo termo da integral,
produzindo assim
" ! #t2 !
Z x2 Z t2 Z x2 Z x2 Z t2
∂L ∂ ∂ϕ d ∂L ∂ϕ d ∂L ∂ϕ
dt dx = dx − dt dx

x1 t1 ∂ ∂ϕ ∂t
∂t |
∂α x1 dt ∂ ∂ϕ
∂t
∂α
t1
x1 t1 dt ∂ ∂ϕ
∂t
∂α
|{z} {z }
u dv
Devido a variação de ϕ, isto é, αζ, desaparecer nos extremos, o primeiro termo no lado
direito da equação se anula, produzindo
!
Z x2 Z t2 Z x2 Z t2
∂L ∂ ∂ϕ d ∂L ∂ϕ
dt dx = − dt dx (6.2.6)
x1 t1 ∂ ∂ϕ
∂t
∂t ∂α x1 t1 dt ∂ ∂ϕ
∂t
∂α
de forma análoga, integremos por partes em relação a variável x o terceiro termo da

integral na Eq.(6.2.5)
" ! #x2 !
Z t2 Z x2 Z t2 Z t2 Z x2
∂L ∂ ∂ϕ d ∂L ∂ϕ d ∂L ∂ϕ
dx dt = dt − dx dt

t1 x1 ∂ ∂ϕ ∂x
∂x |
∂α t1 dx ∂ ∂ϕ
∂x
∂α
x1
t1 x1 dx ∂ ∂ϕ
∂x
∂α
|{z} {z }
u dv
Devido a variação de ϕ, isto é, αζ, desaparecer nos extremos, o primeiro termo no lado

direito da equação se anula, e obtemos assim

!
Z t2 Z x2 Z t2 Z x2
∂L ∂ ∂ϕ d ∂L ∂ϕ
dx dt = − dx dt (6.2.7)
t1 x1 ∂ ∂ϕ
∂x
∂x ∂α t1 x1 dx ∂ ∂ϕ
∂x
∂α
Substituindo as Eqs.(6.2.6) e (6.2.7) na Eq.(6.2.5)

" ! ! #
Z t2 Z x2
∂I ∂L ∂ϕ ∂ ∂L ∂ϕ d ∂L ∂ϕ
= dx dt − −
∂α t1 x1 ∂ϕ ∂α ∂t ∂ ∂ϕ
∂t
∂α dx ∂ ∂ϕ
∂x
∂α
∂ϕ
isolemos ∂α
, após isso multipliquemos por dα e apliquemos o limite de α → 0
Z t2 Z x2 " ! !#
∂I
∂L d ∂L d ∂L ∂ϕ
dα = dx dt − − dα
∂α α=0

t1 x1 ∂ϕ dt ∂ ∂ϕ
∂t
dx ∂ ∂ϕ
∂x
∂α α=0
mas o lado esquerdo é justamente δI, assim

" ! !#
Z t2 Z x2
∂L d ∂L d ∂L
δI = dx dt − − δϕ (6.2.8)
t1 x1 ∂ϕ dt ∂ ∂ϕ
∂t
dx ∂ ∂ϕ
∂x
ou de forma similar,
" ! !#
t2 x2
Z Z
∂L d ∂L d ∂L ∂ϕ
dx dt − − =0 (6.2.9)
t1 x1 ∂ϕ dt ∂ ∂ϕ
∂t
dx ∂ ∂ϕ
∂x
∂α α=0
a natureza arbitrária do caminho variado implica no anulamento da expressão em parên-

tese: ! !
d ∂L d ∂L ∂L
∂ϕ
+ ∂ϕ
− =0 (6.2.10)
dt ∂ ∂t dx ∂ ∂x ∂ϕ
As equações de Euler-Lagrange (6.2.10) é a forma apropriada da equação do movimento

derivada a partir do princípio de Hamilton, Eq.(6.2.2).
Um sistema de n graus de liberdade discreto terá n equações de Lagrange do movi-
mento; para um sistema contínuo com um número infinito de graus de liberdade, parece
que obtemos apenas uma equação de Lagrange! Deve ser lembrado, entretanto, que a
equação do movimento para ϕ é uma equação diferencial que envolve somente o tempo, e
nesse sentido a Eq.(6.2.9) fornece uma equação do movimento separada para cada valor de
x. A natureza contínua do índice x que aparece na Eq.(6.2.9) é uma equação diferencial
parcial em duas variáveis x e t, o que produz ϕ como ϕ(x, t).
Para o exemplo específico da vibração longitudinal em uma corda elástica, foi visto a
partir da forma da densidade Lagrangiana, Eq.(6.1.10), que

∂L ∂ϕ ∂L ∂ϕ ∂L
=µ , = −Y , =0
∂ϕ ∂t ∂ϕ ∂x ∂ϕ
∂ ∂
∂t ∂x
Logo, como desejado, a Eq.(6.2.10), se reduz apropriadamente para a equação do movi-
mento, (6.1.7).
A formulação Lagrangiana desenvolvida até aqui para sistemas contínuos unidimen-
sionais necessita obviamente ser estendida para os casos bi e tridimensional, como por
exemplo, um sólido elástico geral. Ademais, ao invés de uma quantidade de campo ϕ
poderá existir vários; como por exemplo, deslocamentos a partir da posição de equilíbrio
seriam descritos por um vetor espacial ϕ ~ com três componentes. Não é difícil realizar
os passos matemáticos para a situação mais geral por um paralelismo próximo ao caso
unidimensional de uma componente. Todavia, as fórmulas se tornam longas e incomodas
caso as escreva da mesma maneira, especialmente em virtude das derivadas. Um ganho
considerável na simplicidade da notação pode ser alcançado ao observar que o tempo t e
as coordenadas espaciais x, y, z efetuam o mesmo papel matemático no princípio de Ha-
milton. As quantidades de campo são funções tanto das coordenadas quanto do tempo,
nas quais são tratadas como variáveis independentes. Nenhuma variação das quantidades
de campo ocorrem nos limites de integração no princípio de Hamilton tanto sobre o tempo
quanto sobre o espaço.
É matematicamente conveniente pensar em termos do espaço quadridimensional com
coordenadas x0 = ct, x1 = x, x2 = y, x3 = z. Nenhum significado físico está implícito
para este espaço. A notação habitual será adotada, uma letra romana sobrescrita refere-
se apenas às três coordenadas do espaço físico, uma letra grega sobrescrita ou subscrita
refere-se a todas as quatro coordenadas. Além disso, utilizaremos a convenção da soma de
Einstein pelo resto do capítulo. As várias componentes das quantidades do campo serão
simbolizadas por um subscrito ρ, na qual pode abranger uma infinidade de formas. Às
vezes, ele representará um único índice com dois, três, quatro ou mais valores. Ou pode
representar vários índices. Assim, se a quantidade do campo for um tensor espacial de
segunda ordem, então ρ realmente se refere a dois índices subscritos. Por fim, a derivada
de uma quantidade de campo em relação a qualquer uma das quatro coordenadas xν será
denotada pelo subíndice ν separado de ρ por uma vírgula. Onde houver apenas uma
quantidade de campo, o índice não aparece. Exemplos são
∂ϕ ∂ϕ ∂ 2 ϕi
ϕρ,ν ≡ ; ϕ,j ≡ ; ϕi,µν = (6.2.11)
∂xν ∂xj ∂xµ ∂xν
Somente as derivadas de quantidades de campo serão simbolizadas desta forma.

Nesta notação, a forma mais geral da densidade Lagrangiana a ser considerada aqui é
escrita como
L = L (ϕρ , ϕρ,ν , xν ) (6.2.12)

A Lagrangiana total é então uma integral sob o tri-espaço

Z
L= (dxi )L (6.2.13)
em que (dxi ) = dx1 dx2 dx3 , todavia ela raramente ocorre explicitamente. O princípio de
Hamilton aparece como uma integral sob uma região o 4-espaço:
Z
δI = δ dV L = 0 (6.2.14)
onde a variação de ϕρ desaparece na fronteira da superfície S da região de integração, além

disso dV = dx0 dx1 dx2 dx3 é o quadrivolume. A derivação das equações do movimento
correspondentes de Euler-Lagrange procedem simbolicamente como antes. Consideremos
um conjunto de parâmetros únicos de funções variadas nas quais se reduzem para ϕρ (xν )
quando o parâmetro α tende a zero. Como anteriormente, um conjunto adequado possível
pode ser construído, por exemplo, somando ϕρ com o produto αζρ , em que ζρ (xν ) são fun-
ções arbitrárias convenientes que se anulam na fronteira da superfície. O desaparecimento
da variação de I é equivalente a tomar a derivada de I em relação a α como sendo igual
a zero: Z
I = dV L (ϕρ , ϕρ,ν , xν ) (6.2.15)
Z
∂I ∂L ∂ϕρ ∂L ∂ϕρ,ν
⇒ = dV +
∂α ∂ϕρ ∂α ∂ϕρ,ν ∂α
uma integração por partes no segundo termo da integral produz
Z Z
∂I ∂L d ∂L ∂ϕρ d ∂L ∂φρ
= dV − ν + dV ν (6.2.16)
∂α ∂ϕρ dx ∂ϕρ,ν ∂α dx ∂ϕρ,ν ∂α
A segunda integral some no limite quando α tende a zero, como pode ser visto de várias
maneiras. Podemos examiná-la termo por termo: realizando a integração para um xν
particular de cada termo da derivada, que então desaparece porque a derivada em relação
a α é zero nos extremos. Ou podemos transformar a integral pelo teorema da divergência
quadridimensional para uma integral sob a superfície limitada pela região de integração no
4-espaço. A integral de superfície novamente some já que a variação de ϕρ na vizinhança
das funções de campo correta é nula na superfície. A Eq.(6.2.16) no limite em que α tende
a zero portanto se reduz para
Z
∂I ∂L d ∂L ∂ϕρ
= dV − (6.2.17)
∂α α→0 ∂ϕρ dxν ∂ϕρ,ν ∂α α→0
Novamente, a natureza arbitrária da variação de cada ϕρ implica que a Eq.(6.2.17) só é

satisfeita somente quando cada colchete desaparece:

d ∂L ∂L
− =0 (6.2.18)
dxν ∂ϕρ,ν ∂ϕρ
As Equações (6.2.18) representam um conjunto de equações diferenciais parciais para as
quantidades do campo, com tantas equações quanto existem valores diferentes de ρ. Pode
valer a pena repetir que, uma vez que as coordenadas do espaço xi são índices para as
quantidades de campo, cada uma das Eqs.(6.2.18) de fato correspondem a um conjunto
inteiro de equações diferenciais de Lagrange para o movimento no caso discreto.
Para um sistema contínuo unidimensional, onde ν toma somente os valores 0 e 1, a
Eq.(6.2.18) assume a mesma forma da Eq.(6.2.10). A compactação da notação é evidente
mesmo em um exemplo tão simples. Embora tenhamos usado a notação covariante, o uso
do espaço quadridimensional por uma conveniência simbólica de forma alguma requer um
comportamento covariante (no sentido físico da palavra) de qualquer quantidade nesse
espaço.
Para sistemas discretos, a Lagrangiana é incerta por uma derivada temporal total de
uma função arbitrária das coordenadas generalizadas e do tempo. Com sistemas contínuos,
a afirmação correspondente é que L é incerto por qualquer ’4-divergência’, isto é, em
relação a um termo da forma
d
Fν (ϕρ , xµ ) (6.2.19)
dxν
onde Fν é qualquer quadrifunção (diferenciável) das quantidades de campo ϕρ e das coor-
denadas xµ . Que tal termo não realiza contribuição alguma para a variação da integral de
ação é evidente. A Aplicação do teorema da divergência no quadriespaço converte uma
integral de volume em uma integral sob a fronteira da superfície, onde a variação de Fν é
nula. Em símbolos, a variação relevante pode ser escrita como
Z Z
d
δ dV ν Fν (ϕρ , xµ ) = δ dσ ν Fν (ϕρ , xµ ) = 0, (6.2.20)
dx
em que dσ ν representa as componentes de um elemento da superfície (no espaço quadri-

dimensional) orientado ao longo da direção da normal externa.
A formulação Lagrangiana para um conjunto continuo das coordenadas generalizadas
foi desenvolvido a fim de se lidar com sistemas mecânicos contínuos como uma oscilação
longitudinal de um sólido elástico, ou um gás vibrando de tal forma que o mesmo cria
ondas acústicas. Como foi sugerido, a formulação pode ser usada, mesmo na ausência de
um sistema mecânico, para descrever as equações que governam um campo. Matematica-
mente, um campo não é nada mais que um conjunto de uma ou mais funções do espaço
e do tempo independentes, e as coordenadas generalizadas se encaixam nesta definição.
Não existe alguma exigência de que um campo deva ser relacionado com algum sistema
mecânico fundamental. Ao quebrar assim a conexão entre a descrição de campo Lagran-

gianos e o movimento puramente mecânico, estamos apenas recapitulando a história da

física. Por exemplo, o campo eletromagnético foi pensado por muito tempo em termos da
vibração elástica de um éter misterioso. Só recentemente se percebeu que o éter não tinha
outro papel senão ser o sujeito do verbo "ondular". Reconhecemos igualmente bem que
os procedimentos variacionais desenvolvidos aqui também são independentes da noção de
um sistema mecânico contínuo e que servem para fornecer as equações que descrevem
qualquer campo do espaço-tempo. O princípio de Hamilton torna-se então uma descrição
conveniente e compacta do campo, que por expansão leva às equações de campo.
Além de implicar nas equações de campo, a densidade Lagrangiana tem mais a nos
dizer sobre a natureza física do campo. Tal como acontece em um sistema com um número
discreto de graus de liberdade, a estrutura do Lagrangiano também contém informações
sobre as propriedades conservadas do sistema. Um desses teoremas de conservação é
discutido na próxima seção.
6.3 Tensor Energia-Momento e Teoremas de Conservação

Um análogo à conservação da integral de Jacobi da mecânica discreta pode ser derivado
aqui, e da mesma maneira. Tudo que temos que lembrar é que o tratamento dado ao tempo
deve ser estendido de forma paralela as coordenadas xi , já que todas elas são parâmetros
independentes em L . Logo, ao invés de uma derivada temporal de L, procuramos calcular
a derivada total de L em relação a xµ :
dL ∂L ∂L ∂L
µ
= ϕρ,µ + ϕρ,µν + µ (6.3.1)
dx ∂ϕρ ∂ϕρ,ν ∂x

∂L d ∂L
Devido as equações do movimento, Eq.(6.2.18), = ν , assim a Eq.(6.3.1)
∂ϕρ dx ∂ϕρ,ν
se torna
dL d ∂L ∂L ∂L
µ
= ν ϕρ,µ + ϕρ,µν + µ
dx dx ∂ϕρ,ν ∂ϕρ,ν ∂x
(6.3.2)
d ∂L ∂L
= ν ϕρ,µ + µ
dx ∂ϕρ,ν ∂x
Combinando as derivadas totais, isto pode ser escrito como

d ∂L ∂L
ν
ϕρ,µ − L δµν = − µ (6.3.3)
dx ∂ϕρ,ν ∂x
Vamos supor, agora, que L não dependa explicitamente de xµ . Isto usualmente

significa que L representa um campo livre, ou seja, um campo no qual não contém fontes
de direção externas ou sumidouros que interagem com o campo em pontos de espaço
explícitos e com determinada dependência de tempo. Sob esta condição, a Eq.(6.3.3)

toma a forma de um conjunto de condições divergente,
dT µν
= Tµ ν,ν = 0 (6.3.4)
dxν

6.4 Formulação Hamiltoniana

É possível obter a formulação Hamiltoniana para sistemas com um conjunto contínuo
de coordenadas de forma similar ao que foi feito para sistemas discretos. Para indicar
esse método de aproximação, retornemos brevemente para a corrente linear de pontos
massivos discutidos no inicio deste capítulo. Conjugado a cada componente do campo,
ηi , existe um momento canônico
∂L ∂Li
pi = =a (6.4.1)
∂ η̇i ∂ η̇i
pois,
∂L ∂ X ∂Li
=a Lk = a
∂ η̇i ∂ η̇i k ∂ η̇i
visto que como Lk é função de η̇k , teremos que somente a i-ésima componente Li irá
sobreviver a derivação. A Hamiltoniana para o sistema é portanto
X X ∂Li
H≡ pi η̈i − L = a η̇i − L
i i
∂ η̇i
ou,
X ∂Li
H= a η̇i − Li (6.4.2)
i
∂ η̇i
Lembremos que no limite da corda contínua, quando a tende a zero, Li → L e que a

soma na Eq.(6.4.2) se torna uma integral:(a explicação para tomarmos uma derivada total
para ϕ será explicada mais adiante)
Z
∂L
H= dx ϕ̇ − L (6.4.3)
∂ ϕ̇
O momenta canônico individual pi , como dado pela Eq.(6.4.1), tende a zero no limite
contínuo, todavia podemos definir uma densidade de momentum, π, que permanece finita:
pi ∂L
lim ≡π= (6.4.4)
a→0 a ∂ ϕ̇
A Equação (6.4.3) está na forma de uma integral espacial sob uma densidade Hamiltoni-
ana, H , definida por
H = π ϕ̇ − L (6.4.5)
Embora a formulação Hamiltoniana possa ser introduzida de uma forma bastante di-
reta para campos clássicos, observe que este procedimento escolhe a variável de tempo
para um tratamento especial. É, portanto, divergente ao desenvolvimento que demos
para a formulação Lagrangiana, onde as variáveis independentes de tempo e espaço eram
tratadas simetricamente. Por esta razão, a abordagem Hamiltoniana, pelo menos como

introduzida aqui, não é facilmente incorporada em uma descrição relativisticamente co-

variante de campos. A maneira Hamiltoniana de olhar para os campos, portanto, não
se mostrou tão útil quanto o método de Lagrange, e uma descrição bastante breve deve
bastar aqui.
A maneira mais óbvia de generalizarmos para um campo tridimensional descrito pelas
quantidade de campo ϕρ é definir, de forma análoga a Eq.(6.4.4), as densidades dos
momentum canônicos
∂L
π ρ (xµ ) = (6.4.6)
∂ ϕ̇ρ
As quantidades ϕρ (xi , t), π ρ (xi , t) juntas definem o espaço de fase de dimensão infinita no
qual descreve o campo clássico e seu desenvolvimento com o tempo, além disso assumimos
que podemos inverter ϕ̇ρ e escreve-lo como ϕ̇ρ = ϕ̇ρ (ϕρ , ϕρ,i , π ρ , xµ ), sendo este o motivo
de tomarmos uma derivada total. Um teorema de conservação pode ser desenvolvido
para πρ , que é mais ou menos semelhante ao do momento canônico em sistemas discretos.
Se uma dada quantidade de campo ϕρ é cíclica no sentido de queL não contenha ϕρ
explicitamente, então as equações de campo de Lagrange dxdν ∂ϕ ∂L
ρ,ν
∂L
− ∂ϕ ρ
= 0, parecem
∂L
uma declaração da existência para uma corrente conservada, já que como ∂ϕρ
= 0, temos:

d ∂L
= 0, (6.4.7)
dxν ∂ϕρ,ν
ou,
d ∂L d ∂L
+ i =0
dt ∂ ϕ̇ρ dx ∂ϕρ,i
aplicando (6.4.6):
∂π ρ

d ∂L
+ i =0 (6.4.8)
∂t dx ∂ϕρ,i
segue que se ϕρ for cíclico, existe uma quantidade integral conservada
Z
ρ
Π = dV π ρ (xi , t) (6.4.9)
A generalização mais evidente para a Eq.(6.4.5) para a densidade Hamiltoniana é
H (ϕρ , ϕρ,i , π ρ , π ρ,i , xi ) = π ρ ϕ̇λ − L (6.4.10)
onde foi assumido que a dependência funcional sobre ϕ̇ρ pode ser eliminada através da
inversão das equações de definição (6.4.6). Desta definição segue que
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ
ρ
= ϕ̇ρ + π λ ρ − (6.4.11)
∂π ∂π ∂ ϕ̇λ ∂π ρ
pela Eq.(6.4.3). A outra metade da equação do campo canônico é mais complicada.

Quando expressa em termos das variáveis canônicas, H é uma função de ϕρ através da

dependência explicita de L , e através de ϕ̇ρ . Consequentemente,
∂H ∂
= (π λ ϕ̇λ − L )
∂ϕρ ∂ϕρ
∂ ϕ̇λ ∂π λ ∂L
= πλ + ϕ̇λ −
∂ϕρ ∂ϕρ ∂ϕρ
logo,
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ ∂L ∂L
= πλ − − =− (6.4.12)
∂ϕρ ∂ϕρ ∂ ϕ̇λ ∂ϕρ ∂ϕρ ∂ϕρ
Utilizando as equações de Lagrange, isto pode ser escrito como

∂H ∂ ∂L ∂ ∂L ∂ ∂L
=− µ =− − i
∂ϕρ ∂x ∂ϕρ,µ ∂t ∂ ϕ̇ρ ∂x ∂ϕρ,i
ρ
(6.4.13)
∂π ∂ ∂L
= − i
∂t ∂x ∂ϕρ,i
Devido a aparência de L , continuamos a não possuir uma forma útil. Por uma derivação
exatamente paralela, todavia, encontramos que
∂H ∂ ϕ̇λ ∂L ∂ ϕ̇λ ∂L ∂L
= πλ − − =− (6.4.14)
∂ϕρ,i ∂ϕρ,i ∂ ϕ̇λ ∂ϕρ,i ∂ϕρ,i ∂ϕρ,i
Derivemos a equação anterior em relação a xi e apliquemos o resultado na Eq.(6.4.13),

poderemos então escrever a segunda metade das equações canônicas como:

∂H ∂ ∂H
− i = −π ρ,0 . (6.4.15)
∂ϕρ ∂x ∂ϕρ,i
A ação na forma hamiltoniana escreve-se

Z
S = d4 x π ρ ϕρ,0 − H (ϕρ , ϕρ,i , π ρ , π ρ,i , xi

(6.4.16)
e as equações de Hamilton decorrem do princípio variacional δS = 0. Variando inde-

pendentemente os campos e seus momentos canonicamente conjugados, o princípio de
Hamilton toma a forma
ρ ρ
∂H ∂ϕρ,i ∂H ∂π ρ ∂H ∂π ,i
Z
∂S 4 ∂π ρ ∂ϕρ,0 ∂H ∂ϕρ
= dx ϕρ,0 + π − − − − ρ
∂α ∂α ∂α ∂ϕρ ∂α ∂ϕρ,i ∂α ∂π ρ ∂α ∂π ,i ∂α
∂H ∂π ρ
Z Z Z
∂S 4 4 ∂ ∂ϕρ ∂H ∂ϕρ
⇒ = d x ϕρ,0 − ρ
+ dx π − d4 x
ρ
∂α ∂π ∂α ∂α ∂t ∂ϕρ ∂α
Z Z ρ (6.4.17)
∂H ∂ ∂ϕρ 4 ∂H ∂ ∂π
− dx4 − dx ρ
∂ϕρ,i ∂α ∂xi ∂π ,i ∂α ∂xi

lembrando que
∂π ρ ∂π ρ

∂ ∂ϕρ ∂ ∂ϕρ ∂ ∂
= , =
∂α ∂xµ ∂xµ ∂α ∂α ∂xµ ∂xµ ∂α
Podemos reescrever (6.4.17):
∂H ∂π ρ
Z Z Z Z
∂S 4 3 ∂ ∂ϕρ ρ 4 ∂H ∂ϕρ
⇒ = d x ϕρ,0 − + d x dt π − d x
∂α ∂π ρ ∂α ∂t ∂α ∂ϕρ ∂α
Z Z Z Z ρ
∂ ∂ϕρ ∂H ∂ ∂π ∂H
− dt dx3 i − dt dx3
∂x ∂α ∂ϕρ,i ∂α ∂x ∂π ρ,i
i
(6.4.18)
tendo em mente que
Z Z Z Z
∂ ∂ϕρ ∂ϕρ ∂ϕρ
dx 3
dt ρ
π = d 3
x π ρ,0 − d4 x π ρ,0
∂t ∂α ∂α ∂α
multiplicando ambos os lados por dα e fazendo α → 0:

Z Z Z Z
∂ ∂ϕρ
3
dx dt ρ
π dα = d 3
x π ρ,0 δϕρ − d4 x π ρ,0 δϕρ
∂t ∂α
Z (6.4.19)
=− d 4
x π ρ,0 δϕρ
Ademais, tendo em vista que
d d dAi
Ai f = (f Ai
) − f
dxi dxi dxi
∂H dϕρ ∂ϕρ
fazendo f = ∂ϕρ /∂α, Ai = e lembrando que i
= , pois ϕρ = ϕρ (xi , t),
∂ϕρ,i dx ∂xi
obtém-se
∂H ∂ ∂ϕρ d ∂ϕρ ∂H d ∂H ∂ϕρ
i
= i − i
∂ϕρ,i ∂x ∂α dx ∂α ∂ϕρ,i dx ∂ϕρ,i ∂α
o que implica
Z Z Z I Z
∂ 3 ∂ϕρ ∂H ∂H ∂ϕρ d
4 ∂H ∂ϕρ
− dt dx =− dt dai + dx
∂xi ∂α ∂ϕρ,i ∂ϕρ,i ∂α dxi ∂ϕρ,i ∂α

Z Z Z I Z
3 ∂ ∂H ∂ϕρ ∂H 4 d ∂H
− dt dx dα = − dt dai δϕρ + dx δϕρ
∂xi ∂ϕρ,i ∂α ∂ϕρ,i dxi ∂ϕρ,i
Z
4 d ∂H
= dx δϕρ
dxi ∂ϕρ,i
(6.4.20)
pois as variações δϕρ anulam-se na superfície que limite a região espacial de V . De forma
análoga,

∂π ρ ∂H ∂π ρ ∂π ρ
Z Z Z I Z
∂ 3 ∂H d
4 ∂H
− dt dx =− dt dai ρ,i + dx
∂xi ∂α ∂π ρ,i ∂π ∂α dxi ∂π ρ,i ∂α
∂π ρ
Z Z Z I Z
∂3 ∂H ∂H ρ 4 d ∂H
− dt dx dα = − dt dai ρ,i δπ + dx δπ ρ
∂xi ∂π ρ,i ∂α ∂π dxi ∂π ρ,i
Z
4 d ∂H
= dx δπ ρ
dxi ∂π ρ,i
(6.4.21)
ρ
pois as variações δπ se anulam na superfície que limita a região espacial de V . Daí
Z
4 ρ ∂H d ∂H ∂H d ∂H ρ
δS = d x −π ,0 − + i δϕρ + ϕρ,0 − + i ρ δπ = 0
∂ϕρ dx ∂ϕρ,i ∂π ρ dx ∂π ,i
(6.4.22)
ρ
Igualando a zero os coeficientes de δϕρ e δπ obtemos
∂H d ∂H
ϕρ,0 = ρ
− i ρ (6.4.23)
∂π dx ∂π ,i
∂H d ∂H
π ρ,0 = − + i (6.4.24)
∂ϕρ dx ∂ϕρ,i
que são as equações de campo na forma Hamiltoniana. As Eqs.(6.4.23) e (6.4.24) podem
ser postas em uma notação mais próxima a das equações de Hamilton para um sistema
discreto através da introdução da noção de derivada de um funcional, na qual é definida
como
δ ∂ d ∂
= − i (6.4.25)
δψ ∂ψ dx ∂ψ,i
assim as Eqs.(6.4.23) e (6.4.24) se tornam
δH δH
ϕρ,0 = π ρ,0 = − (6.4.26)
δπ ρ δϕρ
Note que neste mesmo formalismo as equações de Lagrange,

d ∂L ∂L d ∂L d ∂L ∂L
− =0⇒ + i −
dxν ∂ϕρ,ν ∂ϕρ dt ∂ϕρ,ν dx ∂ϕρ,ν ∂ϕρ
ou, seja
d ∂L δL
− =0 (6.4.27)
dt ∂ϕρ,ν δϕρ
Quase a única vantagem da derivada funcional, no entanto, é a similaridade final com
o sistema discreto. Ela suprime, por outro lado, o tratamento paralelo das variáveis de

tempo e espaço.
Existe uma forma de se lidar os campos clássicos na qual fornece quase toda a formu-
lação Hamiltoniana da mecânica discreta. A ideia principal por trás desse tratamento é
substituir a variável ou índice do espaço contínuo por um índice discreto não enumerável.
Pode-se ver como fazer isto nos referindo novamente as oscilações longitudinais de uma
corda elástica. Vamos supor que a corda possui comprimento finito L = x2 − x1 . A exi-
gência de que ϕ deve desaparecer nas extremidades é uma condição de contorno que pode
ser efetuada fisicamente colocando-se a corda entre duas paredes perfeitamente rígidas.
Daí a amplitude da oscilação pode ser representada por uma série de Fourier:
∞
X 2πn(x − x1 )
ϕ(x) = qn sin (6.4.28)
n=0
2L
Ao invés de um índice continuo x, temos um índice discreto n. Nos é permitido usar

esta representação para todo x somente quando ϕ(x) é uma função bem comportada, a
maioria das quantidades de campo físicos são.
Para simplificar a ilustração de como tal esquema pode ser realizado, será assumido
que apenas uma quantidade de campo real, ϕ, pode ser expandida em uma série de Fourier
tridimensional da forma
1 X ~
ϕ(~r, t) = 1/2 qk (t)eik·~r (6.4.29)
V k
Aqui ~k é um vetor de onda que só pode tomar magnitudes e direções discretas, de modo
que apenas números inteiros (ou às vezes meio-inteiros) de comprimentos de onda se
encaixam em uma determinada dimensão linear. Dizemos que ~k possui espectro discreto.
O índice escalar k representa alguma ordem do conjunto de índices inteiros usados para
denumerar os valores discretos de ~k, e V o volume do sistema, que aparecem em um fator
de normalização. Uma vez que ϕ é real, devemos ter q ∗ = q−k
A ortogonalidade da exponencial sob o volume pode afirmada pela relação
Z
1 ~ ~0
ei(k−k )·~r dV = δkk0 (6.4.30)
V
Em efeito, os valores permitidos de ~k são aqueles para os quais a condição (6.4.30) é

satisfeita (como pode ser visto na análise da série de Fourier unidimensional). Segue que
os coeficientes da expansão, qk (t), são dados por
Z
1 ~
qk (t) = 1/2
e−k·~r ϕ(~r, t) dV (6.4.31)
V

De forma similar, a densidade do momentum canônico pode ser expandida como
1 X ~
π(~r, t) = 1/2
pk (t)e−ik·~r (6.4.32)
V k
novamente com p∗k = p−k . Correspondentemente, os coeficientes de expansão, pk (t), são

encontrados a partir de Z
1 ~
pk (t) = 1/2 eik·~r π(~r, t) dV (6.4.33)
V
6.5 Teoria de Campos Relativísticos

6.6 Exemplos de Teorias de Campos Relativísticos

Devemos considerar três exemplos, de complexidade crescente
A. Campo escalar complexo.
Qualquer campo complexo será descrito por duas partes independentes, que podem ser
expressas como a parte real e imaginária do campo ou como o próprio campo complexo
e seu conjugado complexo. Devemos ir pela última alternativa. Assim, a densidade
Lagrangiana e a função associada serão aqui dadas em termos de duas variáveis de campo
independentes, φ e φ∗ , cada uma das quais são quadriescalares.17 Para este exemplo
particular, escolhemos a densidade Lagrangiana
L = c2 φ,λ φ∗,λ − µ20 c2 φφ∗ (6.6.1)
∂φ ∂φ
onde µ0 é uma constante, φ,λ = λ
, e φ,λ = g λν ν . Observe, que como exigido, L
∂x ∂x
é um escalar global. Expresso em termos das variáveis do espaço e tempo, L é escrito
como (em que φ,0 = ∂φ/∂t)
L = φ,0 φ∗,0 − c2 ∇φ
~ · ∇φ
~ ∗ − µ2 c2 φφ∗
0 (6.6.2)
Para obter as equações de campo, em que ϕρ = φ∗ , observe que
∂L ∂L
= c2 φ,ν , = −µ20 c2 φ (6.6.3)
∂φ∗,ν ∂φ∗
Consequentemente, a equação de campo de Euler-Lagrange é
φ,ν ν + µ20 φ = 0 (6.6.4)
ou, de forma equivalente,

X d2 φ
ν )2
+ µ20 φ = 0 (6.6.5)
ν
(dx
e
1 d2 φ
~ 2φ +
−∇ + µ20 φ = 0 (6.6.6)
c2 dt2
Em termos do D’Alembertiano, a equação de campo pode também ser escrita covariante-
mente como
(2 + µ20 )φ = 0 (6.6.7)
Similarmente, através da simetria de L , as equações de campo obtidas quando ϕρ = φ

são
(2 + µ20 )φ∗ = 0 (6.6.8)
17
Como será visto na próxima seção, campos complexos levam naturalmente a uma carga associada e
a uma densidade de corrente, e este é o motivo principal para a sua introdução na física teórica.

As equações de campo básicas satisfeitas tanto por φ quanto por φ∗ são conhecidas como a
equação de Klein-Gordon complexa e, como dada aqui, representada o análogo relativístico
da equação de Schrodinger para uma partícula carregada de spin zero e energia de massa
de repouso µ0 .
O tensor energia momento definido pela Eq.(colocar equação aqui) possui as seguintes
componentes
Tµν = c2 φ,µ φ∗,ν + c2 φ∗,µ φν + c2 (φ,λ φ∗,λ + µ20 φφ∗ )gµν (6.6.9)
e é claramente simétrico. Como a densidade Lagrangiana descreve um campo livre, sem

interações com o mundo externo, L não contém x explicitamente e o teorema de con-
servação (colocar equação aqui) é válido para Tµν , como pode ser verificado diretamente.
Para introduzirmos a formulação Hamiltoniana, devemos distinguir as coordenadas do
tempo e do espaço em algum referencial de Lorentz particular. O momento conjugado,
de acordo com a Eq.(6.4.6), são então (cf.Eq.(6.6.2))
∂L ∂L
π= = φ∗,0 π∗ = = φ,0 (6.6.10)
∂φ,0 ∂φ∗,0
Segue que a densidade Hamiltoniana (na qual possui a mesma magnitude que T00 ) toma
a forma
H ≡ πφ,0 + π ∗ φ∗,0 − L
(6.6.11)
~ · ∇φ
= ππ ∗ + c2 ∇φ ~ ∗ + µ0 c2 φφ∗
Por enquanto, tudo o que faremos aqui é ilustrar a transformação para a representação do
momento. As expansões (6.4.29) e (6.4.32) podem ser introduzidas na densidade Hamil-
toniana, já que a equação de Klein-Gordon tem por solução uma equação do tipo onda,
assumindo que as condições de fronteira se estendem ao infinito, pode-se usar o método
das transformadas de Fourier. Visto que o campo não é real, não temos que qk∗ = q−k . Na
verdade, qk e qk∗ agora representam dois conjuntos independentes discretos de coordenadas,
um representando φ e o outro φ∗ . O Hamiltoniano total é a soma das integrais de volume
sob os três termos na Eq.(6.6.11). Como um exemplo padrão, calculemos µ20 φφ∗ dV,
R
lembremos que pela Eq.(6.4.29)
1 X ~
φ(~r, t) = qk (t)eik·~r
V 1/2 k
e analogamente,
1 X ~0
φ∗ (~r, t) = 1/2
qk∗0 (t)e−ik ·~r
V k0
daí
µ20 X
Z Z
∗ ~ ~0
µ20 φφ dV = qk qk∗0 ei(k−k )·~r dV (6.6.12)
V k,k0

pela Eq.(6.4.30) Z
1 ~ ~0
ei(k−k )·~r dV = δkk0
V
o que reduz a Eq.(6.6.12) para
Z Z
∗
X 1 i(~k−~k0 )·~
µ20 φφ dV = µ20 qk qk∗0 e r
dV
k,k0
V
| {z } (6.6.13)
δkk0
= µ20 qk qk∗
O único termo que exige outra nota especial é aquele que envolve a divergência, para isto
note que " #
~ =∇ ~ 1 X ~
ik·~
r i~k X ~
∇φ 1/2
q k (t)e = 1/2
qk (t)eik·~r
V k
V k
e " #
~∗ ~ 1 X ~0 −i~k 0 X ∗ ~0
∇φ =∇ qk∗0 (t)e−ik ·~r = qk0 (t)e−ik ·~r
V 1/2 k
V 1/2
k
logo,
Z Z
~ dV = (i~k) · (−ik )
~ · ∇φ ∗ ~0
X 1 i(~k−~k0 )·~
∇φ qk (t)qk∗0 e r
dV
k,k0
V
| {z } (6.6.14)
δkk0
= k 2 qk (t)qk∗ (t)
além disso, pela Eq.(6.4.32)
1 X ~
π(~r, t) = 1/2
pk (t)e−ik·~r
V k
similarmente,
1 X ~0
π ∗ (~r, t) = 1/2
p∗k0 (t)eik ·~r
V k0
daí, Z
∗
X 1 ~ ~0
ππ = pk (t)p∗k0 e−i(k−k )·~r
V
k,k0 (6.6.15)
= pk p∗k
integrando a Eq.(6.6.11)
Z Z Z Z
H dV = ππ dV +c∗ 2 ~ · ∇φ
∇φ ~ ∗ dV +µ2 c2
0 φφ∗ dV

H dV:
R
substituindo as Eqs.(6.6.13), (6.6.14) e (6.6.15), e tendo em mente que H =
H = pk p∗k + c2 k 2 qk qk∗ + c2 µ20 qk qk∗

H = pk p∗k + ωk2 qk qk∗ (6.6.16)
onde ωk é relacionado com k através da relação de dispersão
ωk2 = c2 (k 2 + µ20 ) (6.6.17)
Cada termo do somatório na Eq.(6.6.16) está na forma de um oscilador harmônico de

massa unitária com frequência ωk . Isto pode ser visto explicitamente através do cálculo
das equações de Hamilton do movimento. Na representação dos momentum ou de ondas
planas, os campos φ e φ∗ são substituídos pelos sistemas discretos dos osciladores harmô-
nicos, da mesma maneira que o campo sonoro em um sólido é visto como uma coleção de
’fônons’. O espectro discreto de ’vibrações’ do nosso campo escalar carregado é dado pela
Eq.(6.6.17). A quantização do campo (isto é, a chamada segunda quantização) é feita de
forma mais simples pela representação dos momentum. De fato, o movimento de cada
oscilador harmônico é quantizado como seria feito para um oscilador harmônico real. Mas
este assunto certamente está fora de nosso campo.
B. Equação de Seno-Gordon e o campo associado
Se o campo escalar no exemplo anterior for tomado como real (isto é, φ∗ = φ) e existe em
apenas uma dimensão espacial, então a correspondente densidade Lagrangiana obvia ao
longo do modelo da Eq.(6.6.2) seria
" 2 #
c2 φ2,0 ∂φ
L = − − µ20 φ2 (6.6.18)
2 c2 ∂x
(O fator 1/2 é introduzido aqui por pura conveniência; e claramente não afeta a forma
das equações do movimento.) A equação de campo associada é então
∂ 2φ 1 ∂ 2φ
2
− 2 2 = µ20 φ (6.6.19)
∂x c ∂t
que é a equação de Klein-Gordon unidimensional. Observe que ela é linear no campo

φ(x, t).
Podemos ver a densidade Lagrangiana da Eq. (6.6.18) como uma aproximação para
um campo muito pequeno de uma densidade Lagrangiana da forma
" 2 #
c2 φ2,0 ∂φ
L = 2
− − µ20 c2 (1 − cos φ), (6.6.20)
2 c ∂x

cuja equação de campo correspondente é
∂ 2φ 1 ∂ 2φ
− = µ20 sin φ (6.6.21)
∂x2 c2 ∂t2
Inevitavelmente, talvez levianamente, a Eq. (6.6.21) passou a ser conhecida como a

equação seno-Gordon. Se a equação de Klein-Gordon, Eq. (6.6.7), é uma reminiscência do
oscilador harmônico, então o termo "potencial"na equação de Lagrange (6.6.20) lembra
o termo potencial do pêndulo linear. Na verdade, a Eq. (6.6.21) também foi chamada,
talvez mais apropriadamente, de equação do pêndulo.
Neste mundo unidimensional, o tensor de energia-momento possui somente quatro
componentes. Como x e t novamente não aparecem explicitamente em L , os elementos
do tensor satisfazem as equações de conservação, nas quais aqui são duas. Detalhes serão
deixados como exercícios, todavia é de interesse particular a densidade de energia T00 :
" 2 #
1 2 ∂φ
T00 = φ,0 + c2 + µ20 c2 (1 − cos φ) (6.6.22)
2 ∂x
na qual obviamente possui a mesma magnitude da densidade Hamiltoniana

" 2 #
1 2 ∂φ
H = π + c2 + µ20 c2 (1 − cos φ) (6.6.23)
2 ∂x
onde o momentum conjugado é

π(x, t) = φ,0 (6.6.24)
A representação dos momentum para o campo de Klein-Gordon como sendo uma

soma sobre o oscilador harmônico significa que no caso unidimensional o campo pode ser
construído uma sobreposição de ondas planas da forma
qk (t)eikr = A0 (k)ei(kr−ωk t) (6.6.25)
onde k e ωk são relacionados pela relação de dispersão, Eq.(6.6.17). Para o campo que
obedece a equação de seno-Gordon, é muito mais complicado de se aplicar a representação
dos momentum, devido a presença do termo cos φ em H . Mas ainda podemos resolver
a equação seno-Gordon por meio de algo semelhante a uma onda viajante. Uma solução
para φ na Eq.(6.6.21) na qual possui a forma de uma perturbação viajando com uma
velocidade v, todavia mantendo sua forma, deve ser uma função somente de τ = t − x/v.
Neste caso, a Eq.(6.6.21) se reduz para
d2 φ
− A sin φ = 0 (6.6.26)
dτ 2

em que
µ20 c2 v 2
A= (6.6.27)
c2 − v 2
já que
1 d2 φ

∂ ∂φ ∂τ d ∂τ dφ
= =
∂x ∂x ∂x dτ ∂x dτ v 2 dτ 2
e analogamente,
1 d2 φ

1 ∂ ∂φ 1 ∂τ d ∂τ dφ
= 2 =
c2 ∂t ∂t c ∂t dτ ∂t dτ c2 dτ 2
consequentemente,
∂ 2φ 1 ∂ 2φ 1 d2 φ

1
− = µ20 sin φ ⇒ − = µ20 sin φ
∂x2 c2 ∂t2 v 2 c2 dτ 2
c2 − v 2 d 2 φ
⇒ 2 2 2
= µ20 sin φ
c v dτ
d2 φ µ 2 c2 v 2
⇒ 2 = 20 2 sin φ
dτ c −v
o que prova a Eq.(6.6.26).

Em termos da variável τ , a equação do movimento é de fato aquela para um pêndulo
simples de amplitude finita. Para pequenas amplitudes, sabemos que φ é um movimento
harmônico simples em τ , com ω dado pela Eq.(6.6.17) para um número de onda k = ω/v,
independentemente da amplitude. Com amplitude finita, sabemos que, enquanto φ será
periódico, a frequência ω poderá também depender da amplitude. Ou seja, a relação
de dispersão será dependente da amplitude. Isto é uma característica evidentemente de
equações não lineares, na qual a equação de seno-Gordon é um exemplo. A equação
de Klein-Gordon é linear, entretanto a equação de dispersão, Eq.(6.6.17), é dita ser não
linear, isto é, ωk não é uma função linear de k. Ela se torna linear somente quando µ0 → 0,
reduzindo assim a equação de Klein-Gordon para a equação de onda linear usual.
Podemos, portanto, descrever a equação de seno-Gordon como sendo não linear, com
uma relação de dispersão não linear dependente da amplitude. Um estudo mais aprofun-
dado revela que a mesma possui soluções com propriedades compartilhadas por apenas
algumas outras equações não lineares. Essas soluções são perturbações de ondas viajan-
tes que interagem umas com as outras - passam umas pelas outras - e emergem com a
forma inalterada, exceto talvez por uma mudança de fase. Tais soluções são também
encontradas, por exemplo, para a equação não-linear de Korteweg-deVries,
∂φ ∂φ ∂ 3φ
+ αφ +ν 3 =0 (6.6.28)
∂t ∂x ∂x
onde α e ν são constantes. Essas ondas solitárias que preservam sua forma mesmo por
meio de interações foram chamadas de ’solitons’ e encontraram muitas aplicações em
toda a física, da física de partículas elementares até a física do estado sólido. A equação

pendular de seno-Gordon , por exemplo, foi utilizada para descrever familias de partículas
elementares, e também aparece em conexão com a teoria da junção Josephson.
C. O Campo Eletromagnético18
Devemos representar as equações de campo e o formalismo para o campo eletromag-
nético em termos do formalismo Lagrangiano. Se as componentes Aµ do potencial eletro-
magnético são tratadas como quantidades de campo, então uma densidade Lagrangiana
adequada para o campo eletromagnético é19
Fλρ F λρ 1 λ
L =− − j Aλ (6.6.29)
4 c
com
Fλρ = ∂λ Aρ − ∂ρ Aλ (6.6.30)
definamos
Aµ,ν ≡ ∂µ Aν (6.6.31)
assim,
∂F λρ

∂L 1 ∂Fλρ λρ
=− F + Fλρ
∂Aµ,ν 4 ∂Aµ,ν ∂Aµ,ν

1 ∂Fλρ λρ κξ ∂ λα ρβ
=− F + ηλκ ηρξ F η η Fαβ
4 ∂Aµ,ν ∂Aµ,ν

1 ∂Fλρ λρ αλ ρβ κξ ∂Fαβ
=− F + η ηλκ ηξρ η F

1 ∂Fλρ λρ ∂Fαβ
=− F + δ ακ δ βξ F κξ

1 ∂Fλρ λρ ∂Fαβ
=− F + F αβ

1 ∂Fλρ λρ λρ ∂Fλρ
=− F +F
Concluímos então que
∂L 1 ∂L F λρ ∂Fλρ
= − j µ; =− (6.6.32)
∂Aµ c ∂Aµ,ν 2 ∂Aµ,ν
18
Parte da dificuldade de se lidar com o campo eletromagnético decorre do fato de que as componentes
Aµ não são inteiramente independentes; para serem únicas, elas devem ser conectadas por meio de alguma
condição de calibre, tal como
µ
·A ~ = ∂A = ∇ ~ ·A~ + µ0 0 ∂φ = 0
∂xµ ∂t
Contudo, será suficiente para atingir os nossos objetivos se tratarmos as condições de calibre como vínculos
’fracos’.
19
A densidade Lagrangiana da Eq.(6.6.29) é adequada no sistema de unidades de Heaviside-Lorentz,
muito usado na teoria quântica de campos. No sistema gaussiano, o fator 1/4 deve ser substituído por
1/16π.

Por outro lado, de Fλρ = Aλ,ρ − Aρ,λ resulta imediatamente que
∂Fλρ
= δ µλ δ νρ − δ µρ δ νλ (6.6.33)
∂Aµ,ν
já que devido a independência linear dos Aλ,ρ :
∂Aλ,ρ ∂Aρ,λ
= δ µλ δ νρ , = δ µρ δ νλ
∂Aµ,ν ∂Aµ,ν
Consequentemente, aplicando a Eq.(6.6.33) na segunda equação em (6.6.32)
∂L F λρ µ ν
=− (δ λ δ ρ − δ µρ δ νλ )
∂Aµ,ν 2
1 (6.6.34)
= − (F µν − F νµ )
2
= −F µν
Assim, as equações de campo escrevem-se
dF µν 1
ν
− jµ = 0 (6.6.35)
dx c
Finalmente, já foi notado que L para um campo eletromagnético consiste de uma

densidade Lagrangiana livre adicionada de um termo que descreve a interação de uma
carga contínua e a densidade de corrente com o campo. É tentador ver até onde podemos ir
para introduzir interações campo-partícula, localizando a carga em um ponto. Isso é feito
mais facilmente considerando a situação física em algum referencial Lorentziano específico,
isto é, visto por um observador específico. A aparência covariante é assim abandonada,
mas o resultado ainda está de acordo com a relatividade especial, pois deriva de uma
teoria claramente relativística. A densidade de corrente é uma medida do movimento das
cargas, e em um dado sistema ~j é definida em termos da densidade de carga ρ pela relação
~j(~r, t) = ρ(~r, t)~u(~r, t)
Aqui ~u é a velocidade do ’campo’ da distribuição contínua de carga. A localização pode

ser realizada através do uso da conhecida função δ de Dirac. Na sua forma tridimensional,
a função δ possui a propriedade que se f (~r) é qualquer função do espaço, então
Z
dV f (~r)δ(~r − ~s(t)) = f (~s) (6.6.36)
onde ~s(t) é uma posição do espaço, digamos, de uma partícula em um tempo t (contanto
que ~s esteja dentro do volume de integração). Portanto, a carga espacial e a densidade

de corrente correspondente a uma partícula de carga e em um ponto s é
ρ = eδ(~r − ~s) (6.6.37)
e
~j = eδ(~r − ~s)~u(~r) (6.6.38)
Se escrevemos L da Eq.(6.6.29) como uma soma de um termo de campo livre L0 e um

termo de interação, o Lagrangiano como visto em um dado referencial de Lorentz é
Z Z Z
1 1
L= dV L0 − dV ρφ + dV Ai · j i
c c
Z (6.6.39)
= dV L0 − qφ + qAi u i

6.7 Teorema de Noether

CAPÍTULO 7 O PRINCÍPIO DA EQUIVALÊNCIA
7 O Princípio da Equivalência
O princípio da Equivalência da gravitação e inércia nos diz como um sistema físico
arbitrário se relaciona com um campo gravitacional externo. Devemos primeiramente ver
o que este princípio nos diz, e então no final deste capítulo devemos olhar algumas de suas
consequências. Entretanto, a técnica matemática apropriada para a aplicação do princípio
da Equivalência é a analise tensorial, e somente após completarmos nossa introdução para
a análise tensorial mais adiante é que seremos capazes de fazer uso de todo o conteúdo
deste princípio.
7.1 O Enunciado do Princípio

O princípio da Equivalência se baseia na igualdade da massa gravitacional com a iner-
cial, foi demonstrado por Galileo, Huygens, Newton, Bessel, e Eotvos. Einstein observou
que, como consequência, nenhum campo gravitacional estático homogêneo e externo seria
detectado em um elevador em queda livre, para os observadores, os corpos de teste, e o pró-
prio elevador responderiam ao campo com a mesma aceleração. Isto pode ser facilmente
provado para um sistema de N partículas, se movendo com velocidades não relativísticas
sob a influência de forças F~ (~xN − ~xM ) (isto é, forças eletrostáticas ou gravitacionais) e
um campo gravitacional externo ~g . As equações do movimento são
d2~xN X
mN = mN ~
g + F~ (~xN − ~xM ) (7.1.1)
dt2 M
Suponha que façamos uma transformação de coordenadas espaço-temporal não-Galileana
1
x~0 = ~x − ~g t2 , t0 = t (7.1.2)
2
Então ~g será cancelado pela ’força’ de inercia, tomando a derivada temporal em (7.1.2)
dx~0 d~x
0
= − ~g t
dt dt
multiplicando a equação acima por m e derivando novamente
d2 x~0 d2~x
m 02 = m 2 − m~g
dt dt
agora substituindo (7.1.1) no primeiro termo do lado direito da equação encontramos que
a equação do movimento se tornará
d2 x~0 N X
mN = F~ (x~0 N − x~0 M ) (7.1.3)
dt02 M

Consequentemente, o observador original O no qual utiliza coordenadas ~x, t e seu amigo

em queda livre O0 que faz uso de x~0 , t0 , não irão encontrar diferenças nas leis da mecânica,
exceto que O irá dizer que ele sente um campo gravitacional e O0 dirá que não. O princípio
da equivalência nos diz que este cancelamento da força gravitacional pela força de inercia
(e consequentemente sua equivalência) será obtida para todos os sistemas em queda livre,
sejam ou não descritos por equações simples como (7.1.1).
Não estamos ainda prontos para enunciar o Princípio da Equivalência na sua forma
final, porque as afirmações anteriores lidam somente com campos gravitacionais estáticos
e homogêneos. Tivesse ~g dependido de ~x ou t, e não seríamos capazes de elimina-lo das
equações do movimento pela aceleração (7.1.2). Por exemplo, a terra está em queda livre
ao redor do sol, e na maioria das situações não sentimos o campo gravitacional do Sol, mas
a pequena falta de homogeneidade neste campo (algo como 1 parte em 6000 do meio-dia
até a meia noite) é suficiente para criar marés impressionantes nos oceanos. Até mesmo
observados no elevador de Einstein em queda livre seriam capazes a princípio de detectar
o campo da terra, dado que objetos no elevador estariam caindo radialmente em direção
ao centro da terra, e, portanto, se aproximariam a medida que o elevador desce.
Apesar das forças inerciais não cancelarem exatamente as forças gravitacionais para
sistemas em queda livre em um campo gravitacional não-homogêneo ou dependente do
tempo, podemos esperar um cancelamento aproximado se restringimos nossa atenção
para uma região suficientemente pequena do espaço e do tempo, na qual o campo varia
vagarosamente. Deste modo, formulamos o princípio da equivalência como a afirmação
de que em
Postulado 7.1.1. Em todo ponto no espaço-tempo, em um campo gravitacional arbitrário,

é possível escolher um ’sistema de coordenadas locais inercial’ tal que, em uma região
suficientemente pequena do ponto em questão, as leis da natureza se apresentam da mesma
forma vista em um sistema de coordenadas cartesianas não acelerado sob a ausência da
gravidade.
Há uma certa imprecisão sobre o que queremos dizer por ’a mesma forma vista em
um sistema de coordenadas cartesianas não acelerado’, para evitar qualquer possível am-
biguidade podemos especificar que por isso queremos dizer a forma dada às leis da na-
tureza pela Relatividade Especial. Existe também uma dúvida sobre o quão pequeno
é ’suficientemente pequeno.’ Grosseiramente falando, queremos dizer que a região deve
ser pequena o suficiente para que o campo gravitacional seja sensivelmente constante ao
longo da mesma, entretanto só seremos mais precisos quando soubermos como representar
o campo gravitacional matematicamente.
O leitor mais atento pode ter percebido uma certa semelhança entre o princípio da
Equivalência e o axioma no qual Gauss tomou como a base da geometria não-Euclideana.
O princípio da Equivalência nos diz que em todo ponto do espaço-tempo podemos erguer

um sistema de coordenadas localmente inercial no qual a matéria satisfaz as leis da Re-

latividade Especial. Gauss assumiu que em todo ponto de uma superfície curva pode-se
levantar um sistema de coordenadas cartesianas local no qual as distâncias obedecem a
lei de Pitágoras. Devido a esta profunda analogia, deve-se esperar que a lei da gravitação
possua uma forte semelhança com as fórmulas da geometria Riemanniana. Em particular,
a suposição de Gauss implica que todas as propriedades internas de uma superfície curva
podem ser descritas em termos das derivadas ∂ξ α /∂xµ da função ξ α (x) que define a trans-
formação x → ξ de algum sistema de coordenadas gerais xµ cobrindo a superfície para
um sistema de coordenadas cartesiano local ξ α , enquanto que o Princípio da Equivalência
nos diz que todos os efeitos de um campo gravitacional podem ser descritos em termos
das derivadas ∂ξ α /∂xµ de uma função ξ α (x) que define a transformação das coordenadas
do ’laboratório’ xµ para um sistema de coordenadas localmente inercial ξ α .
Ocasionalmente pode-se encontrar referências a um ’Princípio da Equivalência fraco’ e
a um ’Princípio da Equivalência forte’. O Princípio da Equivalência forte é apenas o que já
afirmei, com ’leis da natureza’ significando todas as leis da natureza. O princípio fraco é o
mesmo, mas com ’leis da natureza’ sendo substituída por ’leis do movimento de partículas
em queda livre’. Resumindo, o princípio fraco não é mais nada que uma reafirmação da
igualdade entre a massa gravitacional e inercial observadas, ao passo que o princípio forte
é uma generalização destas observações que governam os efeitos da gravitação em todos
os sistemas físicos.
7.2 Forças Gravitacionais

Considere uma partícula se movendo livremente sob a influência de forças puramente
gravitacionais. De acordo com o Princípio da Equivalência existe um sistemas de coorde-
nadas em queda livre ξ α no qual as equações do movimento são dadas por uma linha reta
no espaço-tempo, isto é,
d2 ξ α
=0 (7.2.1)
dτ 2
com dτ sendo o tempo próprio
dτ = −ηαβ dξ α dξ β (7.2.2)
Agora suponha que utilizemos outro sistema de coordenadas xµ , no qual pode ser um
sistema de coordenadas Cartesiano em repouso no laboratório, mas também pode ser
curvilíneo, acelerado, rotacionado, ou o que quer que desejamos. O sistema de coordenadas
em queda livre ξ α são funções de xµ , lembremos que pela regra da cadeia
d α µ ∂ξ α dxµ
ξ [x (τ )] = (7.2.3)
dτ ∂xµ dτ

e a Eq.(7.2.1) se torna

d d α µ
0= ξ [x (τ )]
dτ dτ
d ∂ξ α dxµ

=
dτ ∂xµ dτ
α µ
d ∂ξ dx ∂ξ α d2 xµ
= + µ
dτ ∂xµ dτ ∂x dτ 2
α µ
∂ξ α d2 xµ

∂ dξ dx
= +
∂xµ dτ dτ ∂xµ dτ 2
α ν µ
∂ξ α d2 xµ

∂ ∂ξ dx dx
= +
∂xµ ∂xν dτ dτ ∂xµ dτ 2
∂ 2 ξ α dxµ dxν ∂ξ α ∂
ν µ
∂ξ α d2 xµ

dx dx
= + +
∂xµ ∂xν dτ dτ ∂xν ∂xµ dτ dτ ∂xµ dτ 2
como o segundo termo do lado direito se anula20 segue que
∂ 2 ξ α dxµ dxν ∂ξ α d2 xµ
0= +
∂xµ ∂xν dτ dτ ∂xµ dτ 2
∂xλ
multiplicando ambos os lados por , e utilizando a familiar regra do produto:
∂ξ α
∂ξ α ∂xλ
= δ λµ
∂xµ ∂ξ α
obtemos a equação do movimento
d2 xλ µ
λ dx dx
ν
0= + Γµν (7.2.4)
dτ 2 dτ dτ
onde Γλµν é a conexão afim, definida por
∂xλ ∂ 2 ξ α
Γλµν ≡ (7.2.5)
∂ξ α ∂xµ ∂xν
O tempo próprio (7.2.2) pode também ser expresso em um sistema de coordenadas

arbitrário,
∂ξ α ∂ξ β
dτ 2 = −ηαβ µ dxµ ν dxν (7.2.6)
∂x ∂x
ou
dτ 2 = −gµν dxµ dxν (7.2.7)
20
dxν ∂xν

∂ d d ν
= = δ =0
∂xµ dτ dτ ∂xµ dτ µ

onde gµν é o tensor métrico, definido por
∂ξ α ∂ξ β
gµν ≡ ηαβ (7.2.8)
∂xµ ∂xν
Para um fóton ou um neutrino, a equação do movimento em um sistema em queda

livre é igual a (7.2.1), exceto que a variável independente não pode ser tomada como sendo
o tempo próprio (7.2.2), uma vez que o lado direito de (7.2.2) desaparece para partículas
sem massa. Ao invés de τ , podemos utilizar σ ≡ ξ 0 , de tal forma que (7.2.1) e (7.2.2) se
tornam
d2 ξ α
=0
dσ 2
dξ α dξ β
0 = −ηαβ
dσ dσ
Seguindo o mesmo raciocínio de antes, encontramos que a equação do movimento em um
campo gravitacional arbitrário e em um sistema de coordenadas arbitrário é
d2 x µ ν
µ dx dx
µ
+ Γ νλ =0 (7.2.9)
dσ 2 dσ dσ
dxµ dxν
0 = −gµν (7.2.10)
dσ dσ
com Γµνλ e gµν dados por (7.2.5) e (7.2.8).
A propósito, tanto em (7.2.4) quanto em (7.2.9) não precisamos conhecer quem são τ e
σ para encontrar o movimento da nossa partícula, já que estas equações quando resolvidas
resultam em xµ (τ ) ou xµ (σ), e τ ou σ podem ser eliminados para darem ~x(t). O objetivo
de (7.2.7) é nos dizer como calcular o tempo próprio, assim como o objetivo de (7.2.10)
é impor as condições iniciais apropriadas para uma partícula sem massa. Em particular,
a Eq.(7.2.10) nos conta qual é o tempo dt para um fóton viajar uma distância d~x, sendo
determinado pela equação quadrática:21
0 = g00 dt2 +2gi0 dxi dt +gij dxi dxj
lembrando que i e j são somatórios de 1 até 3. A solução é dada pela conhecida fórmula
de Bhaskara:
21
Observe que o tensor métrico é simétrico, já que
∂ξ α ∂ξ β ∂ξ β ∂ξ α ∂ξ α ∂ξ β
gµν ≡ η αβ = η βα = ηαβ = gνµ
∂xµ ∂xν ∂xµ ∂xν ∂xν ∂xµ
onde usamos o fato dos índices serem mudos na passagem do segundo para o terceiro termo, e do fato do
tensor métrico de Minkowski ser simétrico, isto é, ηαβ = ηβα .

q
−2gi0 dxi ± (2gi0 dxi )(2gj0 dxj ) − 4g00 gij dxi dxj
dt =
2g00
resolvendo,
1
q
i i j
dt = −gi0 dx ± (gi0 gj0 − g00 gij ) dx dx (7.2.11)
g00
e o tempo requerido para a luz viajar ao longo de qualquer caminho pode ser calculado
ao integrar dt ao longo dessa curva.
Os valores do tensor métrico gµν e da conexão afim Γλµν em um ponto X de um
sistema de coordenadas arbitrárias xµ nos fornece informação suficiente para determinar
as coordenadas localmente inerciais ξ α (x) na vizinhança de X. Primeiro, multipliquemos
a Eq.(7.2.5) por ∂ξ β /∂xλ e utilizemos da regra do produto
∂ξ β ∂xλ
= δ βα
∂xλ ∂ξ α
assim,
∂xλ ∂ 2 ξ α λ ∂ξ β ∂xλ ∂ 2 ξ α ∂ξ β λ
= Γµν ⇒ = Γ
∂ξ α ∂xµ ∂xν ∂xλ ∂ξ α ∂xµ ∂xν ∂xλ µν
| {z }
δ βα
deste modo obtemos as equações diferenciais para ξ α :
∂ 2ξα λ ∂ξ
α
= Γµν (7.2.12)
∂xµ ∂xν ∂xλ
que tem por solução a seguinte série de Taylor
1 ∂ 2ξα

α α ∂ξ α µ µ
ξ (x) = ξ (X) + (x − X ) + (xµ − X µ )(xν − X ν ) + · · ·
∂xµ xµ =X µ 2! |∂xµ{z∂xν}
∂ξ α
Γλ
µν
∂xλ
α

α 1 ∂ξ λ µ
∂ξ
= ξ α (X) + (x µ
− X µ
) + Γ (x − X µ )(xν − X ν ) + · · ·
∂xµ xµ =X µ
2 ∂xλ µν
ou,
1
ξ α (x) = aα + bαµ (xµ − X µ ) + bαλ Γλµν (xµ − X µ )(xν − X ν ) + · · · (7.2.13)
2
onde,
∂ξ α (X)
aα = ξ α (X), bαλ = (7.2.14)
∂X λ
Graças a Eq.(7.2.8) também vemos que
ηαβ bαµ bβ ν = gµν (X) (7.2.15)

Deste modo, dados Γλµν e gµν em X, o sistema de coordenadas localmente inercial ξ α é

determinado até uma ordem de (x − X)2 , exceto pela ambigüidade nas constantes aα
e bαλ . Os bαλ são determinados pela Eq.(7.2.14) até em uma transformação de Lorentz
bαλ → Λαβ bβ µ , então a ambiguidade na solução para ξ α (x) apenas reflete o fato de que se ξ α
são coordenadas localmente inerciais, então também o são Λαβ bβ µ +cα . Consequentemente,
dado que Γλµν e gµν determinam as coordenadas localmente inerciais até uma transformação
de Lorentz inomogênea, e uma vez que o campo gravitacional não possui efeito algum em
um sistema de coordenadas localmente inercial, não deve ser surpresa alguma que todos
os efeitos da gravidade estão comprimidos em Γλµν e gµν . Observe, contudo, que (7.2.13)
satisfaz (7.2.12) somente no ponto x = X; para resolver (7.2.12) para todo x, é necessário
que as derivadas da conexão afim satisfaçam certas condições simétricas, nas quais serão
discutidas posteriormente.
7.3 Relação entre gµν e Γλµν

Nosso tratamento para partículas em queda livre demonstrou que o campo responsável
pela força gravitacional é a ’conexão afim’ Γλµν , assim como o intervalo do tempo próprio
entre dois eventos com coordenadas separadas infinitesimalmente é determinado pelo ’ten-
sor métrico’ gµν . Iremos mostrar agora que gµν é também o potencial gravitacional; isto
é, suas derivadas determinam o campo Γλµν .
Lembremos da fórmula para o tensor métrico, (7.2.8):
∂ξ α ∂ξ β
gµν = ηαβ
∂xµ ∂xν
A diferenciação em relação a xλ nos dá que
∂ξ α ∂ξ β

∂gµν ∂
λ
= ηαβ
∂x ∂xλ ∂xµ ∂xν
aplicando a regra do produto para derivadas e lembrando do fato de que ηαβ é constante,
obtemos que
∂gµν ∂ 2 ξ α ∂ξ β ∂ξ α ∂ 2 ξ β
= ηαβ + ηαβ
∂xλ ∂xλ ∂xµ ∂xν ∂xµ ∂xλ ∂xν
∂ 2ξα ρ ∂ξ
α
e relembremos da Eq.(7.2.12), = Γµν , logo
∂xµ ∂xν ∂xρ
α β α β
∂gµν ρ ∂ξ ∂ξ ρ ∂ξ ∂ξ
= Γλµ ρ ν ηαβ + Γλν µ ρ ηαβ
∂xλ ∂x ∂x ∂x ∂x
assim pela (7.2.8):

∂gµν
λ
= Γρλµ gρν + Γρλν gρµ (7.3.1)
∂x

analogamente,
∂gλν
= Γκµλ gκν + Γκµν gκλ (7.3.2)
∂xµ
e
∂gµλ
= Γκνµ gκλ + Γκνλ gκµ (7.3.3)
∂xν
Antes de resolvermos para Γ, é necessário apontar uma sutileza na derivação da
Eq.(7.3.1) que foi escondida na nossa notação bastante compacta. Quando erguemos
um sistema de coordenadas localmente inercia, ξ α (x), o fazemos em um ponto específico
X, e as coordenadas que são localmente inerciais em X devem ser demarcadas, como
α
ξX (x). Portanto, as Eqs.(7.2.8) e (7.2.12) devem ser apropriadamente escritas como
!
α β
∂ξX (x) ∂ξX (x)
gµν (X) = ηαβ (7.3.4)
∂xµ ∂xν
x=X
∂ 2 ξX
α α

(x) ∂ξX (x)
= Γλµν (X) (7.3.5)
∂x ∂xν
µ
x=X ∂xλ x=X
Quando diferenciamos a Eq.(7.3.4) em relação a X λ , obtemos dois tipos de termos. O

primeiro tipo surge devido a colocarmos x = X; este contém apenas as derivadas segundas
α
(7.3.5) e pode ser calculado como antes. O segundo tipo de termo surge devido a ξX (x)
carregar um rótulo X; estes termos possuem derivadas do tipo
∂ 2 ξX
α

(x)
(7.3.6)
∂X ∂xµ
λ
x=X
e não parecem ter nada a ver com a métrica ou a conexão afim. Para lidar com esse segundo
tipo de termo, é necessário aguçar um pouco nossa interpretação do que se entende por
’localmente inercial’ no Princípio de Equivalência. Veremos mais adiante que as primeiras
derivadas do tensor métrico devem ser medidas comparando as taxas de relógios idênticos
separados por uma distância espaço-temporal infinitesimal. Consequentemente, devemos
interpretar o Princípio da Equivalência como significando que o sistema de coordenadas
α
localmente inercial ξX que construímos em um dado ponto X pode ser escolhido tal que
as primeiras derivadas do tensor métrico somem em X. Em um sistema de coordenadas
α
ξX , o tensor métrico em um ponto X̄ é dado pela Eq.(7.3.4) como
β
!
α
X ∂ξX̄ (x) ∂ξX̄ (x)
gγδ (X̄) = γ δ
ηαβ
x=X̄
e nossa interpretação do Princípio da Equivalência nos diz que esta quantidade é esta-
cionária em X̄ quando X̄ = X. A fim de se utilizar esta informação, introduzimos um
sistema arbitrário de coordenadas xµ do ’laboratório’, e escrevemos

β
!
α
∂ξX̄ (x) ∂ξX̄ (x)
gµν (X̄) ≡ ηαβ
∂xµ ∂xν
x=X̄
β
!
α γ δ
∂ξX̄ (x) ∂ξX (x) ∂ξX̄ (x) ∂ξX (x)
= γ δ
ηαβ
∂ξX (x) ∂xµ ∂ξX (x) ∂xν
x=X̄
β
! β
!
α α
∂ξX̄ (x) ∂ξX̄ (x) ∂ξX̄ (x) ∂ξX̄ (x)
= γ δ
ηαβ γ δ
∂ξX (x) ∂ξX (x) ∂ξX (x) ∂ξX (x)
β
!x=X̄ x=X̄
α
X ∂ξX̄ (x) ∂ξX̄ (x)
gγδ (X̄) γ δ
x=X̄
λ
Diferenciando em relação a X̄ e tomando X̄ = X obtemos então (devido ao fato de que
X
gγδ (X̄) é estacionário)
γ
∂gµν (X) X ∂ δ
= gγδ (X)
∂X λ ∂xλ ∂xµ ∂xν x=X
2 γ δ γ 2 δ

∂ ξX (x) ∂ξX (x) ∂ξX (x) ∂ ξX (x)
= ηγδ +
∂xλ ∂xµ ∂xν ∂xµ ∂xλ ∂xν x=X
Nenhuma derivada do tipo (7.3.6) aparece agora, e podemos utilizar as Eqs.(7.3.4) e

(7.3.5) como antes para mostrar que
γ γ
∂ 2 ξX δ
(x) ∂ 2 ξX
δ

∂gµν (X) (x) ∂ξX (x) ∂ξX (x)
= ηγδ λ µ + ηγδ
∂X λ ∂x ∂x ∂xν ∂xµ ∂xλ ∂xν x=X
!
γ ζ γ ζ
∂ 2 ξX (x) ∂xρ ∂ξX δ
(x) ∂ξX (x) ∂ξX (x) ∂ξX (x) ∂xρ ∂ 2 ξX
δ
(x)
= λ µ γ ρ ν
η ζδ + ηγζ µ δ
∂x ∂x ∂ξX (x) ∂x ∂x ∂x ∂x ∂ξX (x) ∂x ∂xν
ρ λ
x=X
= Γρλµ (X)gρν (X) + Γρλν (X)gρµ (X)
na qual é precisamente a Eq.(7.3.1).

Agora vamos retornar para nossa notação compacta anterior, e resolvamos para a
conexão afim. Somando a Eq.(7.3.1) com a Eq.(7.3.2) e subtraindo a Eq.(7.3.3) obtemos
que
∂gµν ∂gλν ∂gµλ

λ
+ µ
− ν
= Γκλµ gκν + Γκλν gκµ + Γκµλ gκν + Γκµν gκλ − Γκνµ gκλ − Γκνλ gκµ
∂x ∂x ∂x
= Γκλµ gκν + Γκλν gκµ + Γκλµ gκν + Γκµν gκλ − Γκµν gκλ − Γκλν gκµ
onde utilizamos o fato de que a conexão afim é simétrica, dado que
∂xλ ∂ 2 ξ α ∂xλ ∂ 2 ξ α
Γλµν ≡ = = Γλνµ
∂ξ α ∂xµ ∂xν ∂ξ α ∂xν ∂xµ

Desta forma,
λ
+ µ
− = 2Γκλµ gκν (7.3.7)
∂x ∂x ∂xν
Definimos a matriz g νσ como sendo a inversa de gνσ , ou seja,
g νσ gκν = δ σκ (7.3.8)
e multiplicando (7.3.7) por g νσ ; isto nos dá finalmente

1 ∂gµν ∂gλν ∂gµλ
Γκλµ g νσ gκν = g νσ + −
2 ∂x λ ∂x µ ∂xν

1 ∂gµν ∂gλν ∂gµλ
⇒ Γσλµ = g νσ + − (7.3.9)
2 ∂x λ ∂x µ ∂xν
O inverso do tensor métrico é dado por
∂xν ∂xσ
g νσ ≡ g σν ≡ η αβ (7.3.10)
∂ξ α ∂ξ β
então, devido a familiar regra do produto
∂xν ∂ξ γ
α ν
= δ γα
∂ξ ∂x
encontra-se
∂xν ∂xσ ∂ξ γ ∂ξ δ ∂xν ∂ξ δ ∂xσ ∂ξ γ

νσ
g gκν = η αβ α ηγδ = η αβ η γδ
∂ξ ∂ξ β ∂xκ ∂xν ∂ξ α ∂xν ∂ξ β ∂xκ
| {z }
δ δσ
σ γ σ β
∂x ∂ξ ∂x ∂ξ
= (η αβ ηγα ) β κ = β κ = δ σκ
| {z } ∂ξ ∂x ∂ξ ∂x
δ βγ
como desejado. Ocasionalmente o lado direito de (7.3.9) é chamado de símbolo de Chris-

toffel e denotado por ( )
σ
λµ
Uma consequência importante da relação entre a conexão afim e o tensor métrico é que
a equação do movimento para uma partícula em queda livre automaticamente mantém
d2 xλ µ
λ dx dx
ν
a forma do intervalo do tempo próprio dτ . Utilizando (7.2.4), = −Γ µν ,
dτ 2 dτ dτ
podemos calcular que
∂gµν dxλ dxµ dxν d2 xµ dxν dxµ d2 xν

d dxµ dxν
gµν = + gµν + gµν
dτ dτ dτ ∂xλ dτ dτ dτ dτ 2 dτ dτ dτ 2

∂gµν dxλ dxµ dxν κ λ ν µ σ λ

d dxµ dxν µ dx dx dx ν dx dx dx
⇒ gµν = − gµν Γ κλ − gµν Γ σλ
dτ dτ dτ ∂xλ dτ dτ dτ dτ dτ dτ dτ dτ dτ
λ κ σ κ λ σ κ σ λ
∂gκσ dx dx dx µ dx dx dx ν dx dx dx
= − g µσ Γκλ − g κν Γσλ
∂xλ dτ dτ dτ dτ dτ dτ dτ dτ dτ
que se reduz para
κ σ λ
d dxµ dxν ∂gκσ µ ν dx dx dx
gµν = − g µσ Γκλ − gκν Γσλ (7.3.11)
dτ dτ dτ ∂xλ dτ dτ dτ

porém por (7.3.7), λ
+ µ
− = 2gκν Γκλµ , ou seja,
∂x ∂x ∂xν
∂gκσ µ ∂gλσ ∂gκλ

= 2g µσ Γ λκ − +
∂xλ ∂xκ ∂xσ
∂gλσ ∂gκλ
= gµσ Γµλκ + gνσ Γνλκ − +
∂xκ ∂xσ
aplicando isto em (7.3.11):

κ σ λ
d dxµ dxν ∂gλσ ∂gκλ dx dx dx
gµν = gνσ Γνλκ
− κ
+ σ
ν
− gκν Γσλ
dτ dτ dτ ∂x ∂x dτ dτ dτ
κ σ λ
dx dx dx dx dx dxλ
κ σ
= gνσ Γνλκ − gκν Γνσλ
dτ dτ dτ dτ dτ dτ
κ σ λ
∂gλσ dx dx dx ∂gκλ dx dxσ dxλ
κ
− +
∂xκ dτ dτ dτ ∂xσ dτ dτ dτ
como os índices σ e κ são mudos, segue que podemos permuta-los no primeiro e terceiro
termo do lado direito da igualdade acima:
dxκ dxσ dxλ dxκ dxσ dxλ

d dxµ dxν
gµν = gνκ Γνλσ − gκν Γνσλ
dτ dτ dτ dτ dτ dτ dτ dτ dτ
∂gλκ dxκ dxσ dxλ ∂gκλ dxκ dxσ dxλ
− +
∂xσ dτ dτ dτ ∂xσ dτ dτ dτ
utilizando-se do fato de que tanto o tensor métrico quanto a conexão afim são simétricos,
obtemos finalmente que
d dxµ dxν
gµν =0
dτ dτ dτ
isto é,
dxµ dxν
= −Cgµν (7.3.12)
dτ dτ
onde C é uma constante de movimento. Portanto, uma vez que escolhamos as condições
iniciais de tal forma que dτ 2 = −gµν dxµ dxν , temos que C = 1, e (7.3.12) irá afirmar
que dτ 2 = −gµν dxµ dxν continua válida ao longo do caminho percorrido pela partícula.
Similarmente, para uma partícula sem massa a condição inicial é dada por C = 0 (com
τ sendo substituído por um outro parâmetro σ) e as equações do movimento irão manter

gµν dxµ dxν = 0 ao longo do caminho.

Uma consequência adicional da relação (7.3.7) é que ela nos permite formular a lei do
movimento de corpos em queda livre como um princípio variacional. Vamos introduzir
algum parâmetro arbitrário ρ para descrever o caminho, e vamos escrever o tempo próprio
decorrido quando a partícula sofre uma queda de um ponto A para um ponto B como
1/2
B B
dxµ dxν
Z Z
dτ
TBA = dp = −gµν dp
A dp A dp dp
Agora varrendo o caminho de xµ (p) até xµ (p) + δxµ (p), mantendo fixos os extremos, isto
é, colocando δxµ = 0 em pA e pB . A variação em TBA é22 dada por (no nosso caso
1/2
dxµ dxν dxµ

f = −gµν , y = xµ ⇒ y 0 = , x = p.)
dp dp dp
1/2 1/2
B
dxµ dxν B
dxµ dxν dδxλ
Z Z
λ ∂ ∂
δTBA = δx −gµν dp − λ −gµν dp
A ∂xλ dp dp A dx dp dp dp
∂
dp
Deste modo, pela regra da cadeia

−1/2
B
dxµ dxν

∂gµν λ dxµ dxν ν λ
dxµ ν dδxλ
Z
1 µ dx dx
δTBA = −gµν − λ δx − gµν δ λ − gµν δ dp
2 A dp dp ∂x dp dp dp dp dp λ dp

−1/2
B
dxµ dxν ∂gµν λ dxµ dxν dδxµ dxν
Z
1
δTBA = −gµν − λ δx − 2gµν dp
2 A dp dp ∂x dp dp dp dp
(onde usamos o fato de que µ e ν são índices mudos). O primeiro fator no integrando é
dτ dxµ dxν
somente dp/dτ , já que = −gµν , então a integral é dada por
dp dp dp
B
1 ∂gµν λ dxµ dp dxν dδxµ dp dxν
Z
δTBA =− δx + gµν dp
A 2 ∂xλ dp dτ dp dp dτ dp
Z B
1 ∂gµν λ dxµ dp dxν dτ dδxµ dp dxν dτ

=− δx + gµν dp
A 2 ∂xλ dp dτ dτ dp dp dτ dτ dp
22
Lembremos da notação delta:
Z B Z B
0 ∂f ∂f 0
δS = δf (y, y ; x) dx = δy + 0 δy dx
A A ∂y ∂y
∂y
onde δy = dα, assim
∂α
Z B Z B
0 dy d ∂f ∂f dδy ∂f d ∂f
δy = δ = (δy) → δS = δy + 0 dx = − δy dx
dx dx A ∂y ∂y dx A ∂y dx ∂y 0

B
1 ∂gµν λ dxµ dxν dδxµ dxν
Z
⇒ δTBA = − δx + g µν dτ
A 2 ∂xλ dτ dτ dτ dτ

dp
note que dp = dτ . Podemos agora integrar por partes, negligenciando a contribui-
dτ
ção dos extremos dado que δxµ desaparece em A e B. Isto nos dá
B B
dxν dδxµ

1 ∂gµν λ dxµ dxν
Z Z
δTBA = − δx dτ − gµν dτ
A 2 ∂xλ dτ dτ A | {zdτ} | dτ{z }
u dv
Z B µ ν
Z B ν

1 ∂gµν λ dx dx d dx (7.3.13)
=− δx dτ + gµν δxµ dτ
A 2 ∂xλ dτ dτ A dτ dτ
ZB
µ ν

1 ∂gµν dx dx ∂gλν dx dxν d 2 xνσ
=− − − g λν δxλ dτ
A 2 ∂xλ dτ dτ ∂xσ dτ dτ dτ 2
Lembremos da Eq.(7.3.7)
∂gµλ ∂gνλ ∂gµν

ν
+ µ
− λ
= 2gκλ Γκνµ
∂x ∂x ∂x
dxµ dxν
a multiplicando por :
dτ dτ
∂gµλ dxµ dxν ∂gνλ dxµ dxν ∂gµν dxµ dxν µ

κ dx dx
ν
+ − = 2g κλ Γνµ
∂xν dτ dτ ∂xµ dτ dτ ∂xλ dτ dτ dτ dτ
inserindo este resultado em (7.3.13)
1 ∂gµλ dxµ dxν 1 ∂gνλ dxµ dxν dxµ dxν ∂gλν dxσ dxν 
 
κ
B
Z 

ν dτ dτ
+ µ dτ dτ
− gκλ Γνµ − σ dτ dτ

δTBA =− λ
δx dτ 2 ∂x 2 ∂x dτ dτ ∂x
d 2 xν
A −gλν 2

 

dτ
podemos utilizar do fato de que estamos trabalhando com índices mudos e escrever:
1 ∂gνλ dxσ dxν 1 ∂gνλ dxσ dxν dxµ dxσ ∂gλν dxσ dxν 
 
ν
B
Z 

σ dτ dτ
+ σ dτ dτ
− gλν Γσµ − σ dτ dτ

δTBA =− λ
δx dτ 2 ∂x 2 ∂x dτ dτ ∂x
d 2 xν
A −gλν 2

 

dτ
tendo em mente que o tensor métrico é simétrico gνλ = gλν vemos que a soma do primeiro
termo com o segundo termo do integrando se anula com o quarto termo, similarmente
Γνσµ = Γνµσ , encontramos que
Z B
µ σ

λ ν dx dx d 2 xν
δTBA = − δx dτ −gνλ Γσµ − gλν 2
A dτ dτ dτ

ou seja, Z B
dxµ dxσ d2 xν
δTBA = Γνσµ + gλν δxλ dτ (7.3.14)
A dτ dτ dτ 2
Consequentemente o caminho no espaço-tempo efetuado pela partícula que obedece as
equações (7.2.4) para uma queda livre será tal que o tempo próprio decorrido é um extremo
(e usualmente um mínimo), isto é,
δTBA = 0
Podemos portanto expressar a equação do movimento (7.2.4) geometricamente, dizendo

que uma partícula em queda livre através do espaço-tempo curvo chamado campo gravi-
tacional irá se mover no caminho mais curto (ou longo) possível entre dois pontos, com
o ’comprimento’ sendo medido pelo tempo próprio. Tais caminhos são chamados por
geodésicas. Por exemplo, podemos pensar que o sol distorce o espaço-tempo da mesma
forma que um objeto muito pesado distorce uma cama-elástica de borracha, e podemos
considerar o caminho de um cometa como sendo curvado em direção ao sol para assim
manter o caminho como sendo o mais ’curto’ possível. Entretanto, a analogia geométrica
é uma consequência posteriori das equações do movimento derivadas através do princípio
da equivalência, e desempenham um papel não necessário nas nossas considerações.
7.4 O Limite Newtoniano

Para obter uma relação com a teoria Newtoniana, vamos considerar o caso de uma
partícula se movendo lentamente em um campo gravitacional fraco e estacionário. Se a
partícula é suficientemente lenta, podemos negligenciar d~x/dτ com dt/dτ , pois ~v c,
voltemos para a Eq.(7.2.4) e a escrevamos explicitamente
2
d 2 xµ dt dxi dxi dxj dxi dt

dt
0= + Γµ00 + Γµ0i + Γµij + Γµi0
dτ 2 dτ dτ dτ dτ dτ dτ dτ
2 2
dxi dxj dt dt dxi dt
como e e visto que Γµij e Γµ0i são pequenos, podemos
dτ dτ dτ dτ dτ dτ
desprezar os três últimos termos em relação ao segundo e escrever
2
d 2 xµ

dt
+ Γµ00 =0
dτ 2 dτ
Voltemos para a Eq.(7.3.9)

1 νµ ∂g0ν ∂g0ν ∂g00
Γµ00 = g + −
2 ∂x0 ∂x0 ∂xν
dado que o campo é estacionário, todas as derivadas temporais de gµν desaparecem, e

temos que

1 ∂g00
Γµ00 = − g µν ν
2 ∂x
Finalmente, visto que o campo é fraco, podemos adotar um sistema de coordenadas
Cartesiano próximo no qual
gαβ = ηαβ + hαβ |hαβ | 1 (7.4.1)
então até primeira ordem em hαβ ,
1 ∂
Γα00 = − (η αβ + hαβ ) ν (η00 + h00 )
2 ∂x
1 αβ ∂ 1 αβ ∂ 1 0
=− η η + − η h00 − h > ∂ (η + h )

00 αβ 00 00
2 ∂xν |{z} 2 ∂xν 2 ∂xν
−1
1 ∂h00
= − η αβ β
2 ∂x
Utilizando esta conexão afim nas equações do movimento obtemos

2
d2 xµ 1 µν ∂h00

dt
− η =0
dτ 2 2 ∂xν dτ
para µ = i = 1, 2, 3, η iν = δ iν e então:
2
d2 xi 1 iν ∂h00 dt
= δ
dτ 2 2 ∂xν dτ
2
1 dt ∂h00
=
2 dτ ∂xi
ou, 2
d2~x

1 dt ~ 00
2
= ∇h
dτ 2 ∂τ
para µ = 0, tendo em mente que η 0ν = δ 0ν , encontramos
2
d2 t 1 0ν ∂h00 dt
= δ
dτ 2 2 ∂xν dτ
2
1 ∂h00 dt
=
2 ∂t dτ
como o campo é estacionário sua derivada temporal se anula, e daí
d2 t
=0
dτ 2

A solução para d2 t/dτ 2 = 0 é que dt/dτ é igual a uma constante, então dividindo a
equação d2 xi /dτ 2 por (dt/dτ )2 , encontramos
d2~x 1~
2
= ∇h00 (7.4.2)
dt 2
O resultante correspondente Newtoniano é
d2~x ~
= −∇φ (7.4.3)
dt2
onde φ é o potencial gravitacional, no qual em uma distância r em relação ao centro de

massa de um corpo esférico de massa M toma a forma
GM
φ=− (7.4.4)
r
Comparando (7.4.2) com (7.4.3) concluímos que
h00 = −2φ + constante
Além disso, o sistema de coordenadas deve ser tornar Minkowskiano a grandes distância,
então h00 some no infinito, e se definirmos φ para desaparecer no infinito [como em (7.4.4)],
achamos que o valor da constante é nulo, daí h00 = −2φ, e retornando para a métrica
(7.4.1)
g00 = −(1 + 2φ) (7.4.5)
O potencial gravitacional φ é da ordem de 10−39 na superfície de um próton, 10−9 na su-

perfície da terra, 10−6 na superfície do sol, e 10−4 na superfície de uma estrela anã branca,
então evidentemente as distorções em gµν produzida pela gravitacional é geralmente bas-
tante fraca. (no sistema de unidades c.g.s φ tem dimensões de velocidade quadrada; nas
nossas unidades φ esta no valor de c.g.s dividido pelo quadrado da velocidade da luz c.g.s)
7.5 Dilatação Temporal

Considere um relógio em um campo gravitacional arbitrário que se move com veloci-
dade arbitrária mas não necessariamente em queda livre. O princípio da Equivalência nos
diz que sua variação não é afetada pelo campo gravitacional caso observemos o relógio
através de um sistema de coordenadas localmente inercial ξ α , lembremos que o intervalo
de tempo próprio, ou seja o intervalo espaço-temporal dξ α entre os tiques é governado
nesse sistema por
dτ = ∆t = (−ηαβ dξ α dξ β )1/2

onde ∆t é o período entre os tiques quando o relógio está em repouso na ausência da

gravidade. Consequentemente em um sistema qualquer de coordenadas o intervalo espaço-
temporal entre os tiques será dado por
1/2
∂ξα µ ∂ξβ ν
∆t = −ηαβ µ dx dx
∂x ∂xν
ou, introduzindo o tensor métrico
∆t = (−gµν dxµ dxν )1/2
Se os relógios possuem velocidade dxµ /dt,

1/2
dxµ dxν

∆t = −gµν dt dt
dt dt
então o intervalo de tempo dt entre os tique será obtido como

−1/2
dxµ dxν

dt
= −gµν (7.5.1)
∆t dt dt
Em particular, se o relógio estiver em repouso, então dxi /dt = 0 e dx0 /dt = dt/dt = 1, e
isto se torna
dt
= (−g00 )−1/2 (7.5.2)
∆t
Não podemos observar os fatores de dilatação do tempo que aparecem nas Eqs.(7.5.1)
e (7.5.2) meramente medindo o intervalo de tempo dt entre os tiques e comparando com
o valor ∆t especificado pelo fabricante, porque os campos gravitacionais afetam nossos
padrões de tempo exatamente da mesma forma que afeta o relógio em estudo. Ou seja, se
nosso relógio padrão diz que um determinado processo físico leva 1 segundo em repouso
na ausência de gravitação, então ele também nos dirá que o mesmo leva 1 segundo na
presença de gravitação, já que tanto o relógio padrão quanto o processo são afetados pela
campo da mesma forma. Todavia, podemos comparar os fatores de dilatação temporal
em dois pontos diferentes em um campo. Por exemplo, suponha que em um ponto 1
observamos a luz proveniente de uma transição atômica particular em um ponto 2. Se os
pontos 1 e 2 estão em repouso em um campo gravitacional estacionário, então o tempo
que leva para uma crista de onda viajar de 2 para 1 será uma constante, e dado pela
integral da Eq.(7.2.11) sob o caminho, e portanto o tempo entre a chegada no ponto 1
de cristas sucessivas será igual ao tempo ∆t2 entre a sua partida no ponto 2, dado pela
Eq.(7.5.2) como
dt2 = ∆t [−g00 (x2 )]−1/2
Se a mesma transição atômica ocorre em um ponto 1, então o tempo entre as cristas das

ondas luminosas a ser observado no ponto 1 será
dt1 = ∆t[−g00 (x1 )]−1/2
Portanto, para uma dada transição atômica, a razão da frequência (observada no ponto
1) da luz do ponto 2 para aquela da luz do ponto 1 será
1/2
ν2 g00 (x2 )
= (7.5.3)
ν1 g00 (x1 )
ν2 ∆ν
No limite para campos fracos g00 ≈ −1 − 2φ e φ 1, daí =1+ , em que
ν1 ν
∆ν
= φ(x2 ) − φ(x1 ) (7.5.4)
ν
(Para um campo gravitacional uniforme, este resultado poderia ser derivado diretamente
do Princípio da Equivalência, sem a introdução da métrica ou da conexão afim.)
Vamos aplicar a Eq.(??) ao caso da luz da superfície do Sol observada da Terra. O
potencial gravitacional do Sol pode ser calculado como
GMS
φS = −
RS
onde MS e RS é a massa e o raio do Sol,
MS = 1, 97 × 1033 g
RS = 0, 695 × 106 km
e G é a constante gravitacional
G = 6, 67 × 10−8 erg cm / g m2 = 7, 41 × 10−29 cm / g m (7.5.5)
(Aqui usamos a nossa convenção de que c = 1 para colocar 1 s = 3 × 1010 cm; nas unidades
c.g.s. a quantidade 7, 41 × 10−29 cm / g m teria que ser chamada G/c2 .) Encontramos que
o potencial na superfície do sol é
φS = −2, 12 × 10−6

CAPÍTULO 8 ANÁLISE TENSORIAL
8 Análise Tensorial
Já observamos que o Princípio da Equivalência da Gravitação e Inércia estabelece
uma profunda analogia entre a geometria não-Euclideana e a teoria da gravitação. Este
capítulo é dedicado a linguagem comum a ambos, a da análise tensorial.
8.1 O Princípio de Covariância

No capítulo anterior demonstramos uma forma de se utilizar o Princípio da Equiva-
lência para se avaliar o efeito da gravidade em sistema físicos: nós escrevemos as equações
que permanecem válidas, para campos gravitacionais gerais, em um sistema de coordena-
das localmente inercial (i.e., as equações da relatividade especial, tal como d2 ξ α /dτ 2 = 0)
e então realizamos uma transformação de coordenadas para encontrar a equação corres-
pondente no sistema de coordenadas do laboratório. Poderíamos continuar a seguir esta
abordagem, mas seríamos levados a cálculos bastantes tediosos quando chegássemos as
equações de campo para o eletromagnetismo e para a gravitação. Ao invés disso, devemos
seguir um método diferente, no qual possui o mesmo conteúdo físico, porém é muito mais
elegante visualmente e bem mais conveniente para ser executado. Este método é baseado
em uma versão alternativa do Princípio da Equivalência, conhecido como Princípio da
Covariância Geral.
Postulado 8.1.1. - Princípio de Covariância : uma equação física continua válida

em um campo gravitacional geral se duas condições forem atendidas:
1. A equação é válida na ausência da gravidade: isto é, ela concorda com as leis da
relatividade especial quando o tensor métrico gαβ é igual ao tensor de Minkowski ηαβ e
quando a conexão afim Γαβγ desaparece.
2. A equação é covariante geral; isto é, preserva a sua forma sob uma transformação
geral de coordenadas x → x̄.
Para ver que o Princípio de Covariância descende do Princípio da Equivalência, vamos

supor que estamos em um campo gravitacional arbitrário, e consideremos qualquer equa-
ção que satisfaça as duas condições acima. De (2), vemos que uma equação será válida
em todos os sistemas de coordenadas caso seja verdadeira em um sistema de coordenadas
qualquer. Mas em qualquer ponto escolhido existe uma classe de sistemas de coordena-
das, os sistemas localmente inerciais, nos quais os efeitos gravitacionais estão ausentes. A
condição (1) então nos diz que nossa equação permanece válida nestes sistemas, e por sua
vez em todos os outros sistemas de coordenadas.
Deve ser enfatizado que a covariância geral sozinha é vazia de conteúdo físico. Qual-
quer equação pode ser feita geralmente covariante ao escreve-la em qualquer sistema de
coordenadas, e então calculando como ela se parece em outro sistema de coordenadas
arbitrário. De fato, desde a infância somos familiarizados com a aparência de equações

físicas em sistemas não-Cartesianos, tal como o sistema de coordenadas polares, e sistemas

não inerciais, como coordenadas em rotação. O significado do Princípio da Covariância
Geral encontra-se na afirmação sobre o efeito da gravitação, que uma equação física por
virtude da covariância geral será verdadeira em um campo gravitacional caso a mesma
seja válida na ausência da gravitação.
O significado da covariância geral pode ser esclarecido ao compara-la com a invariân-
cia de Lorentz. Assim como qualquer equação pode ser feita covariante geral, qualquer
equação também pode ser feita invariante de Lorentz, basta escreve-la em um sistema
de coordenadas e então calcular como ela se parece após uma transformação de Lorentz.
Contudo, caso façamos isto com uma equação não relativística, como a segunda lei de New-
ton, encontraremos após realizar uma invariância de Lorentz que uma nova quantidade
aparece na equação, na qual evidentemente é a velocidade do referencial de coordenadas
em relação ao referencial de coordenadas original. A exigência de que esta velocidade
não apareça na equação transformada é o que chamamos de Princípio da Relatividade
Especial, ou ’invariância de Lorentz’ para encurtar, e esta exigência insere uma restrição
bastante poderosa na equação original. Similarmente, quando tornamos uma equação
geralmente covariante, novos ingredientes irão entrar, isto é, o tensor métrico gµν e a
conexão afim Γλµν . A diferença é que não é exigido que estas quantidades desapareçam
no final, e portanto não obtemos quaisquer restrições na equação pela qual começamos;
além disso, exploramos a presença de gµν e Γλµν para representar campos gravitacionais.
Para resumir: O Princípio da Covariância Geral não é um princípio da invariância, como
o Princípio de Galileu ou da Relatividade Especial, mas ao vez disso é uma afirmação
sobre os efeitos da gravitação, e nada além disso. Em particular, a covariância geral não
implica na invariância de Lorentz - existem teorias geralmente covariante da gravitação
que permitem a construção de referenciais inerciais em qualquer ponto de um campo
gravitacional, contudo elas satisfazem a relatividade de Galileu ao invés da relatividade
especial nestes referenciais.
Qualquer princípio físico, como a covariância geral, que assume a forma de um princí-
pio de invariância, mas cujo conteúdo é realmente limitado a uma restrição na interação
de um campo particular, é chamado de uma simetria dinâmica. Existem outras simetrias
dinâmicas importantes na física, tal como a invariância de calibre (gauge), na qual go-
verna as interações dos campos eletromagnéticos, e a simetria quiral, na qual governa as
interações do campo méson-pi. Iremos retornar para analogias entre a relatividade geral
e a eletrodinâmica diversas vezes ao longo dos capítulos seguintes.
O Princípio da Covariância Geral pode ser aplicado somente em uma escala pequena
em comparação com as distâncias espaço-temporais típicas do campo gravitacional, dado
que somente nesta pequena escala que o Princípio de Equivalência garante a construção de
um sistema de coordenadas no qual os efeitos da gravitação estão ausentes. Por exemplo,
o raio da Lua não é muito menor que a distância da Terra até a Lua, logo não podemos

calcular com precisão o movimento da Lua encontrando equações geralmente covariante

que se reduzem para as equações corretas de um corpo em queda livre na Lua na ausência
da gravidade. Podemos, entretanto, considerar a Lua como uma bola de roque e calcular
seu movimento pela aplicação do Princípio da Covariância Geral determinando a força
gravitacional em cada elemento infinitesimal da massa lunar.
Existem em geral muitas equações geralmente covariante que se reduzem para uma
dada equação da relatividade especial na ausência da gravidade. Contudo, devido a so-
mente aplicarmos o Princípio da Covariância Geral em uma escala pequena comparada
com a escala do campo gravitacional, usualmente esperamos que somente gµν e suas pri-
meiras derivadas entrem em nossas equações geralmente covariantes. Com este conheci-
mento devemos ver que neste e no próximo capítulo que o Princípio da Covariância Geral
realiza afirmações não-ambíguas sobre os efeitos de campos gravitacionais em qualquer
sistema, ou em uma parte do sistema, que é suficientemente pequena.
8.2 Vetores e Tensores

Com o intuito de construir equações físicas que são invariantes sob uma transformação
geral de coordenadas, devemos saber como estas quantidades descritas pelas equações se
comportam sob tais transformações. Para algumas quantidades, aquelas definidas em
termos de diferenciais das coordenadas, as propriedades da transformação podem ser
calculadas de maneira direta. Para outras quantidades, como campos eletromagnéticos,
as propriedades da transformação são parcialmente uma questão de definição. Todavia,
existe uma tendência para todas as quantidades de interesse físico se transformarem de
uma maneira razoavelmente simples, pois de outra forma seria difícil colocá-las juntas
para formar equações invariantes. Nesta seção descreveremos uma classe de objetos nos
quais as suas propriedades de transformação são particularmente simples, dando exemplos
(até onde podemos) de quantidades definidas diretamente em termos das coordenadas do
sistema.
A regra mais simples de todas as transformações é a dos escalares, nos quais simples-
mente não mudam sob uma transformação geral de coordenadas. Um exemplo óbvio é
um número puro, como π ou 0. Outro exemplo é o tempo próprio dτ ; de fato, veremos
mais adiante que o tensor métrico gµν é definido para se transformar de tal modo que dτ 2
é mantido invariante.
A próxima regra de transformação simples é a que o vetor contravariante, V µ , realiza
sob uma transformação de coordenadas xµ → xµ̄ :
∂xµ̄
V µ̄ = V ν (8.2.1)
∂xν

Por exemplo, as regras da diferenciação parcial dão
∂xµ̄ ν
dxµ̄ = dx (8.2.2)
∂xν
então a diferencial da coordenada é um vetor contravariante. Uma regra de transforma-
ção bastante parecida é a do vetor covariante Uµ , na qual sob uma transformação de
coordenadas xµ → xµ̄ se transforma em
∂xν̄ µ
Uν̄ = dx (8.2.3)
∂xµ
Por exemplo, se φ é um campo escalar, então ∂φ/∂xµ é um vetor covariante, pois em um

sistema de coordenadas transformado o gradiente é
∂φ ∂xν ∂φ
= (8.2.4)
∂xµ̄ ∂xµ̄ ∂xν
∂φ ∂ φ̄
uma vez que φ̄ = φ já que trata-se de um escalar, isto é, µ̄
= . Tal equação está
∂x ∂xµ̄
em total acordo com (8.2.3).
Através dos vetores covariantes e contravariantes podemos imediatamente generalizar
para os tensores. Um tensor com índices levantados µ, ν, . . . e índices abaixados κ, λ, . . .
se transforma como o produto de vetores contravariantes U µ W ν · · · e vetores covariantes
Vκ Yλ · · · . Por exemplo, sob uma transformação de coordenadas xµ → xµ̄ um tensor T µν λ
irá se transformar em
∂xµ̄ ∂xρ ∂xλ̄ κ σ
T µ̄ν̄ λ̄ = T (8.2.5)
∂xκ ∂xν̄ ∂xσ ρ
Se todos os índices estiverem levantados o tensor é chamado de contravariante; se todos
os índices estiverem abaixados o tensor é chamado de contravariante; de outra forma ele
é chamado de tensor misto. O exemplo mais importante é o tensor métrico, definido na
Seção (7.2) para um sistema de coordenadas gerais xµ por
∂ξ α ∂ξ β
gµν = ηαβ µ ν (8.2.6)
∂x ∂x
onde ξ α é o sistema de coordenadas localmente inercial. Em um sistema de coordenadas

diferente xµ̄ o tensor métrico é
∂ξ α ∂ξ β
gµ̄ν̄ = ηαβ
∂xµ̄ ∂xν̄
∂ξ α ∂xρ ∂ξ β ∂xσ
= ηαβ ρ µ̄ σ ν̄
∂x ∂x ∂x ∂x
∂ξ ∂ξ β ∂xρ ∂xσ
α
= ηαβ ρ σ
∂x ∂x ∂xµ̄ ∂xν̄

e portanto
∂xρ ∂xσ
gµ̄ν̄ = gρσ (8.2.7)
∂xµ̄ ∂xν̄
Vemos que gµν é de fato um tensor covariante. Assumiremos que gµν possui um inverso,
tal hipótese é plausível pois podemos representar o mesmo como uma matriz, e a exi-
gência para que uma dada matriz possua inversa é que seu determinante seja diferente
de zero, o que é garantido pela relação (8.2.6). Portanto, sua inversa deve ser um tensor
contravariante, assumamos por hipótese que g λµ é o inverso de gµν , logo
g λµ gµν = δ λν
devemos ter
δ λ̄ν̄ = g λ̄µ̄ gµ̄ν̄
∂xρ ∂xσ
= g λ̄µ̄ µ̄ ν̄ gρσ
∂x ∂x
multiplicando ambos os lados por ∂xν̄ /∂xκ :
∂xν̄ λ̄ ρ
λ̄µ̄ ∂x ∂x ∂x
ν̄ σ
δ = g gρσ
∂xκ ν̄ ∂xµ̄ |∂xκ{z∂xν̄}
δ σκ
obtém-se
∂xλ̄ λ̄µ̄ ∂x
ρ
= g δ σ gρσ
∂xκ ∂xµ̄ κ
sabemos que δ σκ = 1 para σ = κ, portanto para esta componente:
∂xλ̄ λ̄µ̄ ∂x
ρ
= g gρκ
∂xκ ∂xµ̄
multiplicando ambos os lados por g κη
∂xλ̄ κη λ̄µ̄ ∂x
ρ
g = g gρκ g κη
∂xκ ∂xµ̄ | {z }
δ ηρ
∂xρ η
= g λ̄µ̄ δ
∂xµ̄ ρ
sabemos que δ ηρ = 1 se η = ρ então para esta componente:
∂xλ̄ κη λ̄µ̄ ∂x
η
g = g
∂xκ ∂xµ̄

multiplicando ambos os lados por ∂xτ̄ /∂xη
λ̄µ̄ ∂xη ∂xτ̄ ∂xλ̄ ∂xτ̄ κη

g µ̄ η
= κ η
g
|∂x {z∂x } ∂x ∂x
δ τ̄ µ̄
sabemos que δ τ̄ µ̄ = 1 para τ̄ = µ̄, logo para esta componente:
∂xλ̄ ∂xµ̄ κη
g λ̄µ̄ =
g (8.2.8)
∂xκ ∂xη
como exigido para um tensor contravariante. Finalmente, o delta de Kronecker δ µν é um
tensor misto, pois
∂xµ ∂xκ̄
δ µν =
∂xκ̄ ∂xν
∂xρ̄ ∂xν µ ∂xµ ∂xρ̄ ∂xκ̄ ∂xν
⇒ µ σ̄
δ ν = κ̄ µ ν σ̄
= δ ρ̄κ̄ δ κ̄σ̄
∂x ∂x ∂x ∂x ∂x ∂x
logo,
∂xρ̄ ∂xν µ
δ ρ̄σ̄ = δ (8.2.9)
∂xµ ∂xσ̄ ν
Tirando os escalares e o zero, δ µν (juntamente com os seus produtos diretos) é o único
tensor cujas componentes são as mesmas em todos os sistemas de coordenadas.
Um vetor é apenas um tensor com um único índice e um escalar é um tensor com
nenhum índice, então geralmente não será necessário dar aos vetores e aos escalares algum
tratamento especial. Todavia, o leitor deve ser advertido de que nem toda coisa é um
tensor; em particular, a conexão afim Γνµλ apesar de sua aparência, não é um tensor.
Agora podemos reconhecer uma classe diversa de equações invariantes: Qualquer equa-
ção será invariante sob transformações gerais de coordenadas, caso ela afirme a igualdade
de dois tensores com os mesmos índices levantados e abaixados. Por exemplo, se Aµν λ
e B µν λ são dois tensores com a regra de transformação (8.2.5), e se em um sistema de
coordenadas xµ̄ tivermos Aµ̄ν̄ λ̄ = B µ̄ν̄ λ̄ então obviamente em um sistema de coordenadas
xµ teremos Aµν λ = B µν λ , para provar isto é bastante simples, dado que
Aµ̄ν̄ λ̄ = B µ̄ν̄ λ̄
∂xµ̄ ∂xν ∂xλ̄ µ λ ∂xµ̄ ∂xν ∂xλ̄ µ λ

⇒ A = B
∂xµ ∂xν̄ ∂xλ ν ∂xµ ∂xν̄ ∂xλ ν
∂xµ̄ ∂xν ∂xλ̄ µ λ
⇒ (A ν − B µν λ ) = 0
∂xµ ∂xν̄ ∂xλ
ou seja, Aµν λ = B µν λ . Em particular, visto que o zero é qualquer tipo de tensor que dese-
jarmos, uma afirmação de que um dado tensor desaparece é invariante sob transformações
gerais de coordenadas. Em contraste, uma afirmação de não igualdade entre tensores do

mesmo tipo (por exemplo, T µν = 5 ou V µ = Uµ ) pode ser numericamente verdadeira em

uma classe limitada de sistemas de coordenadas, contudo não em todos os sistemas de
coordenadas.
8.3 Álgebra Tensorial

O próximo passo no nosso programa da construção de equações invariantes sob trans-
formações gerais de coordenadas é aprender como juntar tensores para formarem outros
tensores. Isto pode ser feito através de algumas operações algébricas simples:
(A) Combinações Lineares. Uma combinação linear de tensores com os mesmos
índices levantados e abaixados é um tensor com estes índices. Por exemplo, façamos com
que Aµν e B µν sejam tensores mistos, e tomemos
T µν ≡ aAµν + bB µν
onde a e b são escalares; então T µν é um tensor, uma vez que
T µ̄ν̄ ≡ aAµ̄ν̄ + bB µ̄ν̄

∂xµ̄ ∂xσ ρ ∂xµ̄ ∂xσ ρ
=a A + b B
∂xρ ∂xν̄ σ ∂xρ ∂xν̄ σ
∂xµ̄ ∂xσ
= (aAρσ + bB ρσ )
∂xρ ∂xν̄
∂xµ̄ ∂xσ ρ
= T
∂xρ ∂xν̄ σ
(B) Produto Direto. O produto das componentes de dois tensores produz um tensor
cujos índices levantados e abaixados consiste em todos os índices levantados e abaixados
dos dois tensores originais. Por exemplo, se Aµν e B ρ são tensores, e
T µν ρ ≡ Aµν B ρ
então T µν ρ é um tensor, isto é,
T µ̄ν̄ ρ̄ ≡ Aµ̄ν̄ B ρ̄
∂xµ̄ ∂xκ λ ∂xρ̄ σ
= A B
∂xλ ∂xν κ ∂xσ
∂xµ̄ ∂xκ ∂xρ̄ λ σ
= A B
∂xλ ∂xν ∂xσ κ
∂xµ̄ ∂xκ ∂xρ̄ λ σ
= T
∂xλ ∂xν ∂xσ κ
(C) Contração. Forçando um índice levantado a ser igual a um abaixado e os so-

mando sob seus quatro valores produzimos um novo tensor no qual estes dois índices estão

ausentes. Por exemplo, se T µν ρσ é um tensor e
T µρ = T µν ρσ
então T µρ é um tensor, isto é,
T µ̄ρ̄ = T µ̄ν̄ ρ̄ν̄

∂xµ̄ ∂xλ ∂xρ̄ ∂xν̄ κ ητ ∂xµ̄ ∂xρ̄ ∂xλ ∂xν̄ κ ητ
= T = T
∂xκ ∂xν̄ ∂xη ∂xτ λ ∂xκ ∂xη |∂xν̄{z∂xτ} λ
δ λτ
µ̄ ρ̄ µ̄ ρ̄
∂x ∂x λ κ ητ ∂x ∂x κ ηλ
= κ η
δ τT λ = T λ
∂x ∂x ∂xκ ∂xη | {z }
T κη
∂xµ̄ ∂xρ̄ κη
= T
∂xκ ∂xη
Estas três operações podem é claro serem combinadas de varias formas. Uma particu-
laridade importante da combinação de operações resulta no levantamento e abaixamento
de índices. Se tomarmos o produto direto de um tensor contravariante ou misto T com
o tensor métrico gµν , e contrairmos o índice µ com um dos índices contravariantes de T ,
obtemos um novo tensor no qual seu índice contravariante é substituído por um índice
covariante ν. Por exemplo, se T µρσ é um tensor, e caso definirmos
Sν ρσ ≡ gµν T µρσ
então pelas regras (B) e (C), Sν ρσ será um tensor. Similarmente, se tomarmos o produto
direto de um tensor covariante ou mixado T com o tensor métrico inverso g µν , e então
contrairmos o índice µ com um dos índices covariantes de T , iremos obter um novo tensor
no qual seu índice covariante é trocado por um índice contravariante ν. Por exemplo, se
Sµ ρσ é um tensor, caso definamos
Rνρσ ≡ g µν Sµ ρσ
segue que Rνρσ é também um tensor. Observe que abaixar um índice e então levanta-
lo novamente nos dá o tensor original de volta; por exemplo, nos casos citados acima,
abaixamos um índice em T para obter S e então o levantamos novamente para obter R,
logo R = T , pois
Rνρσ ≡ g µν Sµ ρσ ≡ g µν gµλ T λρσ
= δ νλ T λρσ = T νρσ
Pelo levantamento e abaixamento de índices podemos escrever um tensor com N índices
de 2N formas diferentes. Visto que todas elas são fisicamente equivalentes, comumente é
usado o mesmo símbolo para todos os 2N tensores, os distinguindo somente pelas locali-

zações dos seus índices.

Por uma questão de formalidade, deve ser mencionado que o tensor obtido pelo levan-
tamento de um índice no tensor métrico gµν ou pelo levantamento de um índice no tensor
métrico g µν , é precisamente o tensor delta de Kronecker, já que
g µλ gλν = δ µν
Também levantando ambos os índices de gµν obtemos o tensor inverso
g λµ g κν gµν = g κν g λµ gµν = g λµ δ κµ = g λκ
e abaixando ambos os índices em g λκ obtemos o tensor métrico gµν .

O leitor deve ter notado que esta discussão da álgebra tensorial é precisamente a
mesma discussão correspondente do capítulo de relatividade especial com uma exceção
importante: Eu ainda não mencionei a diferenciação. Isso foi porque a derivada de um
tensor não é, em geral, um tensor. Mais adiante iremos ver um tipo de diferenciação,
chamada derivada covariante, que fornece uma forma adicional de construir tensores a
partir de outros tensores.
8.4 Densidades Tensoriais

Apesar da onipresença dos tensores, não existe nada sagrado sobre a lei de transfor-
mação tensorial. Um importante exemplo de um não-tensor é o determinante do tensor
métrico
g ≡ − Det gµν (8.4.1)
A lei da transformação para o tensor métrico pode ser considerada como uma equação
matricial
∂xρ ∂xσ
gµ̄ν̄ = gρσ
∂xµ̄ ∂xν̄
e tomando o determinante, encontramos que
2
∂x
ḡ = g (8.4.2)
∂ x̄
onde |∂x/∂ x̄| é o Jacobiano da transformação x̄ → x; isto é, é o determinante da matriz

∂xρ /∂xµ̄ . Uma quantidade tal como g, na qual se transforma como um escalar exceto
por fatores extras do Jacobiano, é chamada de densidade escalar, e similarmente uma
quantidade que se transforma como um tensor exceto por fatores extras do determinante
do Jacobiano é chamada de densidade tensorial. O número de fatores do determinante
|∂ x̄/∂x| é chamado de comprimento da densidade; por exemplo, vemos por (8.4.2) que g

é uma densidade de comprimento −2, uma vez que

−1
∂x ∂ x̄
= (8.4.3)
∂ x̄ ∂x
como pode ser visto ao tomar o determinante da equação
∂xµ ∂xλ̄
= δ µν
∂xλ̄ ∂xν
Qualquer densidade tensorial de comprimento W pode ser expressa como um tensor or-
dinário vezes um fator g −W/2 . Por exemplo, se uma densidade tensorial F µν de rank W
possível a regra de transformação
W
∂ x̄ ∂xµ̄ ∂xκ λ
F µ̄ν̄ = F κ (8.4.4)
∂x ∂xλ ∂xν̄
e utilizando (8.4.2), vemos que ao eleva-la por um fator W/2 e então multiplica-la por
F µ̄ν̄ :
2 !W/2
∂x
ḡ W/2 = g W/2
∂ x̄
W W
∂x ∂ x̄ ∂xµ̄ ∂xκ W/2 λ
⇒ ḡ W/2
F µ̄ν̄ = g F κ
∂ x̄ ∂x ∂xλ ∂xν̄
| {z }
∂ x̄ −W

∂x
assim,
∂xµ̄ ∂xκ W/2 λ
g F κ
ḡ W/2 F µ̄ν̄ = (8.4.5)
∂xλ ∂xν̄
A importância da densidade tensorial surge do teorema fundamental do cálculo, que
sob uma transformação geral de coordenadas x → x̄, o elemento de volume d4 x se torna

4
∂ x̄ 4
∂x d x
d x̄ = (8.4.6)
Consequentemente o produto de d4 x com a densidade tensorial de comprimento −1 se

√
transforma como um tensor ordinário. Em particular, gd4 x é o elemento invariante de
volume.
Existe uma densidade tensorial cujas componentes são as mesmas em todos os sistemas
de coordenadas; é o tensor de densidade Levi-Civita µνλκ . Para definir esta quantidade
em um sistema de coordenadas gerais, devemos ordenar arbitrariamente os índices em
uma sequência de referência, por exemplo, x, y, z, t ou r, θ, φ, t e assim por diante. Então,

µνλκ é definido por


+1
 µνλκ é uma permutação par de uma sequência de referência
µνλκ
= −1 µνλκ é uma permutação ímpar de uma sequência de referência

0 algum índice igual

(8.4.7)
Para ver que esta quantidade é uma densidade tensorial, considere a quantidade
∂xρ̄ ∂xσ̄ ∂xη̄ ∂xξ̄ µνλκ

(8.4.8)
∂xµ ∂xν ∂xλ ∂xκ
Observe que isto é completamente antissimétrico nos índices ρ, σ, η, ξ e portanto propor-
cional a ρσηξ . Para determinar essa constante de proporcionalidade, façamos ρσηξ tomar
os valores da sequência referida; então (8.4.8) é apenas o determinante |∂ x̄/∂x|, e então
∂xρ̄ ∂xσ̄ ∂xη̄ ∂xξ̄ µνλκ ∂ x̄ ρσηξ

= (8.4.9)
∂xµ ∂xν ∂xλ ∂xκ ∂x
Deste modo µνλκ é uma densidade tensorial de comprimento −1. Podemos formar um
tensor ordinário contravariante ao multiplicar µνλκ por g −1/2 . Também podemos formar
uma densidade covariante ao baixar os índices na forma usual, ou seja,
ρσηξ = gρµ gσν gηλ gξκ µνλκ (8.4.10)
Isto é antissimétrico nos seus índices, e consequentemente é proporcional a ρσηξ . Definindo

ρσηξ para ser a sequência de referência, encontramos que a constante de proporcionalidade
deve ser −g, então
ρσηξ = −gρσηξ (8.4.11)
É facilmente verificável que ρσηξ é uma densidade tensorial covariante de comprimento

−1, pois
∂xρ̄ ∂xσ̄ ∂xη̄ ∂xξ̄

µνλκ
∂ x̄
µ ν λ κ
(−g ) = (−gρ̄σ̄η̄ξ̄ )
∂x ∂x ∂x ∂x ∂x
ρ̄ σ̄ η̄ ξ̄

∂x ∂x ∂x ∂x ∂ x̄ ρ̄σ̄η̄ξ̄

⇒ µνλκ =
∂xµ ∂xν ∂xλ ∂xκ ∂x
o que demonstra a afirmativa.

As regras da álgebra tensorial podem ser facilmente estendidas para incorporarem as
densidades tensoriais.
(A) A combinação linear de duas densidades tensoriais de mesmo comprimento W é
uma densidade tensorial de comprimento W .
(B) O produto direto de duas densidades de comprimento W1 e W2 produzem uma
densidade tensorial de comprimento W1 + W2 .
(C) A contração dos índices em uma densidade tensorial de comprimento W produz

uma densidade tensorial de comprimento W − 2. Por (B) e (C) segue que o levantamento
e abaixamento de índice não muda o comprimento da densidade tensorial.

8.5 Transformação da Conexão Afim

Além do exemplo bastante trivial das densidades tensoriais, aparece em todas as leis
da física um outro não-tensor muito importante, a conexão afim. Lembremos da sua
definição,
∂xλ ∂ 2 ξ α
Γλµν = α µ ν (8.5.1)
∂ξ ∂x ∂x
onde ξ α (x) é o sistema de coordenadas localmente inercial. Passando de xµ para um
sistema diferente xµ̄ , encontramos que
∂xλ̄ ∂ 2 ξ α
Γλ̄µ̄ν̄ ≡
∂ξ α ∂xµ̄ ∂xν̄
∂xλ̄ ∂xρ ∂
σ α
∂x ∂ξ
= ρ α µ̄
∂x ∂ξ ∂x ∂xν̄ ∂xσ
∂xλ̄ ∂xρ ∂ξ α ∂
σ
∂xλ̄ ∂xρ ∂xσ ∂
α
∂x ∂ξ
= ρ α σ µ̄ ν̄
+ ρ α ν̄ µ̄
∂x ∂ξ ∂x ∂x ∂x ∂x ∂ξ ∂x ∂x ∂xσ
∂xλ̄ ∂xρ ∂xσ ∂xτ ∂ 2 ξ α ∂ 2 xσ ∂ξ α

= +
∂xρ ∂ξ α ∂xν̄ ∂xµ̄ ∂xτ ∂xσ ∂xµ̄ ∂xν̄ ∂xσ
∂xλ̄ ∂xτ ∂xσ ∂xρ ∂ 2 ξ α ∂xλ̄ ∂xρ ∂ξ α ∂ 2 xσ
= +
∂xρ ∂xµ̄ ∂xν̄ ∂ξ α ∂xτ ∂xσ ∂xρ ∂ξ α ∂xσ ∂xµ̄ ∂xν̄
| {z } | {z }
Γρτ σ δ ρσ
como δ ρσ 6= 0 somente se ρ = σ e lembrando da Eq.(8.5.1):
∂xλ̄ ∂xτ ∂xσ ρ ∂xλ̄ ∂ 2 xρ

Γλ̄µ̄ν̄ = Γ + (8.5.2)
∂xρ ∂xµ̄ ∂xν̄ τ σ ∂xρ ∂xµ̄ ∂xν̄
o primeiro termo no lado direito é justamente o que seria esperado caso Γλµν fosse um
tensor, o segundo termo é não-homogêneo, e o torna um não tensor.
A análise tensorial nos fornece uma forma bastante simples de estabelecer uma relação
entre Γλµν e gµν . Note que
∂xρ ∂xσ

∂ ∂
gµ̄ν̄ = gρσ µ̄ ν̄
∂xκ̄ ∂xκ̄ ∂x ∂x
∂gρσ ∂x ∂xσ
ρ
∂ 2 xρ ∂xσ ∂xρ ∂ 2 xσ
= + g ρσ + g ρσ
∂xκ̄ ∂xµ̄ ∂xν̄ ∂xk̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
τ ρ σ 2 ρ σ
∂gρσ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
= + gρσ + gρσ
∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xk̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
daí

∂ ∂ ∂ ∂gρσ ∂xτ ∂xρ ∂xσ ∂ 2 xρ ∂xσ ∂xρ ∂ 2 xσ

gκ̄ν̄ + gκ̄µ̄ − g µ̄ν̄ = + g ρσ + g ρσ
∂xµ̄ ∂xν̄ ∂xκ̄ ∂xτ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xν̄
τ ρ σ 2 ρ σ
∂gρσ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
+ + g ρσ + g ρσ
∂xτ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xµ̄
τ ρ σ 2 ρ σ
∂gρσ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
− − g ρσ − g ρσ
∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
ρ τ σ 2 ρ σ
∂gτ σ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
= + g ρσ + g ρσ
∂xρ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xν̄
σ τ ρ 2 σ ρ
∂gτ ρ ∂x ∂x ∂x ∂ x ∂x ∂xρ ∂ 2 xσ
+ + gρσ + gρσ
∂xσ ∂xν̄ ∂xκ̄ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xµ̄ ∂xν̄
∂gρσ ∂xτ ∂xρ ∂xσ ∂ 2 xρ ∂xσ ∂xρ ∂ 2 xσ
− − g ρσ − g ρσ
∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄ ∂xµ̄ ∂xκ̄ ∂xν̄
onde usamos o fato de que os índices são mudos e a simetria do tensor métrico. Desta
forma
∂xτ ∂xρ ∂xσ ∂gστ ∂xρ ∂ 2 xσ

∂ ∂ ∂ ∂gρτ ∂gρσ
g κ̄ν̄ + gκ̄µ̄ − gµ̄ν̄ = + − + 2g ρσ
∂xµ̄ ∂xν̄ ∂xκ̄ ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xρ ∂xσ ∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄
(8.5.3)
Definamos ( )
λ 1 λκ ∂gκν ∂gκµ ∂gµν
= g + − (8.5.4)
µν 2 ∂xµ ∂xν ∂xκ
1 λ̄κ̄
Segue que multiplicando (8.5.3) por g
2
1 λ̄κ̄ ∂xτ ∂xρ ∂xσ ∂gστ ∂xρ ∂ 2 xσ

1 λ̄κ̄ ∂gκ̄ν̄ ∂gκ̄µ̄ ∂gµ̄ν̄ ∂gρτ ∂gρσ λ̄κ̄
g + − = g + − +g gρσ
2 ∂xµ̄ ∂xν̄ ∂xκ̄ 2 ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xρ ∂xσ ∂xτ ∂xκ̄ ∂xµ̄ ∂xν̄
(8.5.5)
sabemos que
∂xλ̄ ∂xκ̄ ξη
g λ̄κ̄ = g
∂xξ ∂xη
substituindo este resultado em (8.5.5)
1 ∂xλ̄ ∂xκ̄ ξη ∂xτ ∂xρ ∂xσ ∂gστ

1 λ̄κ̄ ∂gκ̄ν̄ ∂gκ̄µ̄ ∂gµ̄ν̄ ∂gρτ ∂gρσ
g + − = g + −
2 ∂xµ̄ ∂xν̄ ∂xκ̄ 2 ∂xξ ∂xη ∂xκ̄ ∂xµ̄ ∂xν̄ ∂xρ ∂xσ ∂xτ
∂xλ̄ ∂xκ̄ ξη ∂xρ ∂ 2 xσ
+ g gρσ κ̄ µ̄ ν̄
∂xξ ∂xη ∂x ∂x ∂x
1 ∂xτ ∂xκ̄ ∂xλ̄ ξη ∂xρ ∂xσ ∂gστ

1 λ̄κ̄ ∂gκ̄ν̄ ∂gκ̄µ̄ ∂gµ̄ν̄ ∂gρτ ∂gρσ
⇒ g + − = g + −
2 ∂xµ̄ ∂xν̄ ∂xκ̄ 2 |∂xκ̄{z∂xη} ∂xξ ∂xµ̄ ∂xν̄ ∂xρ ∂xσ ∂xτ
δτ η
∂xλ̄ ∂xρ ∂xκ̄ ξη ∂ 2 xσ

+ ξ g gρσ µ̄ ν̄
∂x |∂xκ̄{z∂xη} ∂x ∂x
δ ρη

1 ∂xλ̄ ξτ ∂xρ ∂xσ ∂gτ σ ∂gτ ρ ∂gρσ

1 λ̄κ̄ ∂gκ̄ν̄ ∂gκ̄µ̄ ∂gµ̄ν̄
g + − = g + −
2 ∂xµ̄ ∂xν̄ ∂xκ̄ 2 ∂xξ ∂xµ̄ ∂xν̄ ∂xρ ∂xσ ∂xτ
∂xλ̄ ξρ ∂ 2 xσ
+ ξ g gρσ µ̄ ν̄
∂x | {z } ∂x ∂x
δ ξσ
∂xλ̄ ∂xρ ∂xσ 1 ξτ

∂gτ σ ∂gτ ρ ∂gρσ
= g + −
∂xξ ∂xµ̄ ∂xν̄ 2 ∂xρ ∂xσ ∂xτ
∂xλ̄ ∂ 2 xσ
+
∂xσ ∂xµ̄ ∂xν̄
∂xλ̄ ∂xτ ∂xσ 1 ρξ ∂gξσ ∂gξτ

∂gτ σ
= g + −
∂xρ ∂xµ̄ ∂xν̄ 2 ∂xτ ∂xσ ∂xξ
∂xλ̄ ∂ 2 xσ
+
∂xσ ∂xµ̄ ∂xν̄
onde na última linha trocamos ξ por ρ e ξ por τ , logo devido a (8.5.4)
( ) ( )
λ̄ ∂xλ̄ ∂xτ ∂xσ ρ ∂xλ̄ ∂ 2 xσ
= + (8.5.6)
µ̄ν̄ ∂xρ ∂xµ̄ ∂xν̄ τσ ∂xσ ∂xµ̄ ∂xν̄
( )
λ
Subtraindo (8.5.6) de (8.5.2), vemos que Γλµν menos é um tensor,
µν
" ( )# " ( )#
λ̄ τ σ
λ̄ ∂x ∂x ∂x ρ
Γλ̄µ̄ν̄ − = ρ µ̄ ν̄
Γρτσ − (8.5.7)
µ̄ν̄ ∂x ∂x ∂x τσ
O Princípio da Equivalência nos diz que existe um sistema de coordenadas especial ξX

no qual, em um dado ponto X, os efeitos da gravitação estão ausentes. Neste sistema
não pode haver força gravitacional alguma atuando nas partículas livres, assim Γλµν desa-
parece, e não pode ocorrer desvio gravitacional para o vermelho entre pontos separados
( )
λ
infinitesimalmente, logo as primeiras derivadas de gµν somem. Assim Γλµν − se
µν
anulam em um sistema de coordenadas localmente inercial, e uma vez que o mesmo é um
tensor, segue que ele deve ser nulo em todos os sistemas de coordenadas, ou seja,
( )
λ
Γλµν = (8.5.8)
µν
É útil ter em mãos uma fórmula alternativa para o termo não-homogêneo na regra de
transformação de Γλµν . Diferenciando a identidade
∂xλ̄ ∂xρ
ρ ν̄
= δ λ̄ν̄
∂x ∂x
com respeito a xµ̄ ; encontramos imediatamente que

!
λ̄ ρ
∂
∂x ∂x ∂
= (δ λ̄ν̄ )
∂xµ̄
ρ
∂x ∂x ν̄ ∂x µ̄
!
∂xρ ∂ ∂xλ̄ ∂xλ̄ ∂ 2 xρ
⇒ + =0
∂xν̄ ∂xµ̄ ∂xρ ∂xρ ∂xµ̄ ∂xν̄
∂xτ ∂xρ ∂ 2 xλ̄ ∂xλ̄ ∂ 2 xρ

⇒ = − (8.5.9)
∂xµ̄ ∂xν̄ ∂xτ ∂xρ ∂xρ ∂xµ̄ ∂xν̄
Podemos portanto escrever (8.5.2) como
∂xλ̄ ∂xτ ∂xσ ρ ∂xτ ∂xρ ∂ 2 xλ̄

Γλ̄µ̄ν̄ = Γ − (8.5.10)
∂xρ ∂xµ̄ ∂xν̄ τ σ ∂xµ̄ ∂xν̄ ∂xτ ∂xρ
Isso é justamente o que teríamos encontrando, caso tivéssemos realizado primeiramente

uma transformação inversa x̄ → x, e então resolvido para Γλ̄µ̄ν̄ .
Estamos agora em posição de utilizar o Princípio da Covariância Geral para nos dar
uma prova alternativa a afirmação de que uma partícula em queda livre obedece a equação
do movimento
d2 xµ ν
µ dx dx
λ
+ Γ νλ =0 (8.5.11)
dτ 2 dτ dτ
onde
dτ 2 = −gµν dxµ dxν (8.5.12)
Primeiro, note que as Eqs.(8.5.11) e (8.5.12) são válidas na ausência de gravidade, porque
colocando Γµνλ igual a zero e gµν igual a ηµν obtemos
d2 xµ
=0 e dτ 2 = −ηµν dxµ dxν
dτ 2
e estas são as equações corretas para uma partícula livre na relatividade especial. Se-
gundo, observe que (8.5.11) e (8.5.12) são invariantes sob uma transformação geral de
coordenadas, para
d2 xµ̄ d ∂xµ̄ dxν

=
dτ 2 dτ ∂xν dτ
∂xµ̄ d2 xν dxν d ∂xµ̄

= +
∂xν dτ 2 dτ dτ ∂xν
∂xµ̄ d2 xν dxν ∂
µ̄
dx
= + (8.5.13)
ν
∂x dτ 2 dτ ∂x ν dτ
∂xµ̄ d2 xν dxν ∂
µ̄ λ
∂x dx
= +
∂xν dτ 2 dτ ∂xν ∂xλ dτ
∂xµ̄ d2 xν ∂ 2 xµ̄ dxλ dxν
= +
∂xν dτ 2 ∂xν ∂xλ dτ dτ
assim como (8.5.10) nos dá

∂xµ̄ ∂xξ ∂xη ν ∂xν ∂xη ∂ 2 xµ̄

Γµ̄σ̄τ̄ = Γ −
∂xν ∂xσ̄ ∂xτ̄ ξη ∂xτ̄ ∂xσ̄ ∂xν ∂xη
dxσ̄ dxτ̄ ∂xµ̄ ∂xξ ∂xη dxσ̄ dxτ̄ ν ∂xν ∂xη ∂ 2 xµ̄ dxσ̄ dxτ̄
⇒ Γµ̄σ̄τ̄ = Γξη −
dτ dτ ∂xν ∂xσ̄ ∂xτ̄ dτ dτ ∂xτ̄ ∂xσ̄ ∂xν ∂xη dτ dτ
dxσ̄ dxτ̄ ∂xµ̄ ∂xξ ∂xη ∂xσ̄ dxλ ∂xτ̄ dxρ ν ∂xν ∂xη ∂ 2 xµ̄ ∂xσ̄ dxλ ∂xτ̄ dxρ
⇒ Γµ̄σ̄τ̄ = Γ −
dτ dτ ∂xν ∂xσ̄ ∂xτ̄ ∂xλ dτ ∂xρ dτ ξη ∂xτ̄ ∂xσ̄ ∂xν ∂xη ∂xλ dτ ∂xρ dτ
dxσ̄ dxτ̄ ∂xξ ∂xσ̄ ∂xη ∂xτ̄ ∂xµ̄ dxλ dxρ ν ∂xν ∂xτ̄ ∂xη ∂xσ̄ ∂ 2 xµ̄ dxλ dxρ
⇒ Γµ̄σ̄τ̄ = σ̄ λ τ̄ ρ ν
Γξη − τ̄ ρ σ̄ λ ν η
dτ dτ |∂x {z∂x } |∂x {z∂x } ∂x dτ dτ |∂x {z∂x } |∂x {z∂x } ∂x ∂x dτ dτ
δ ξλ δ ηρ δ νρ δ ηλ
dxσ̄ dxτ̄ ∂xµ̄ dxλ dxρ ν ∂ 2 xµ̄ dxλ dxρ

⇒ Γµ̄σ̄τ̄= Γλρ − (8.5.14)
dτ dτ ∂xν dτ dτ ∂xν ∂xη dτ dτ
adicionando (8.5.13) com (8.5.14), encontramos que o lado esquerdo da Eq.(8.5.11) é um
vetor, isto é,
d2 xµ̄ ν̄ λ̄
∂xµ̄ d2 xκ σ ρ

µ̄ dx dx κ dx dx
+ Γν̄ λ̄ = + Γσρ (8.5.15)
dτ 2 dτ dτ ∂xκ dτ 2 dτ dτ
Assim sendo a Eq.(8.5.11), assim como (8.5.12) são notoriamente covariantes. O Princípio
da Covariância Geral então nos diz que (8.5.11) e (8.5.12) são verdadeiras em campos
gravitacionais gerais, pois elas são válidas em qualquer sistema de coordenadas caso sejam
verídicas em algum dos sistemas, o que de fato acontece já que as mesmas são verdadeiras
no sistema de coordenadas localmente inercial.
8.6 Diferenciação Covariante

Nós já comentamos que a diferenciação de um tensor não produz, em geral, outro
tensor. Por exemplo, considere um vetor contravariante V µ , cuja lei de transformação é
∂xµ̄ ν
V µ̄ = V
∂xν
Diferenciando em relação a xλ̄ obtém-se
∂V µ̄ ∂xµ̄ ∂V ν ∂xµ̄

∂
= ν
+ V ν λ̄
∂x λ̄ ∂x ∂x λ̄ ∂x ∂xν
∂V µ̄ ∂xµ̄ ∂xρ ∂V ν ν ∂x
ρ
∂ 2 xµ̄
⇒ = + V (8.6.1)
∂xλ̄ ∂xν ∂xλ̄ ∂xρ ∂xλ̄ ∂xρ ∂xν
O primeiro termo no lado direito é o que seria esperado caso ∂V µ /∂xλ fosse um tensor; o
segundo termo é o que destrói o comportamento tensorial.
Apesar de ∂V µ /∂xλ não ser um tensor, podemos utiliza-lo para construir um tensor.

Usando (8.5.10), vemos que
∂xµ̄ ∂xρ ∂xσ ν ∂ 2 xµ̄ ∂xρ ∂xσ ∂xκ̄ η

Γµ̄λ̄κ̄ V κ̄ = Γ − V
∂xν ∂xλ̄ ∂xκ̄ ρσ ∂xρ ∂xσ ∂xλ̄ ∂xκ̄ ∂xη
∂xµ̄ ∂xρ ∂xσ ∂xκ̄ ν η ∂ 2 xµ̄ ∂xρ ∂xσ ∂xκ̄ η (8.6.2)
= Γ V − V
∂xν ∂xλ̄ ∂xκ̄ ∂xη ρσ ∂xρ ∂xσ ∂xλ̄ ∂xκ̄ ∂xη
∂xµ̄ ∂xρ ν σ ∂ 2 xµ̄ ∂xρ σ
= Γ V − V
∂xν ∂xλ̄ ρσ ∂xρ ∂xσ ∂xλ̄
Adicionando (8.6.1) com (8.6.2), os termos não-homogêneos se cancelam, produzimos
∂V µ̄ ∂xµ̄ ∂xρ ∂V ν

µ̄ κ̄
+ Γ λ̄κ̄
V = + Γνρσ V σ (8.6.3)
∂xλ̄ ∂xν ∂xλ̄ ∂xρ
Deste modo somos levados a definir a derivada covariante como
∂V µ
V µ;λ ≡ λ
+ Γµλκ V κ (8.6.4)
∂x
e (8.6.3) nos diz que V µ;λ é um tensor
∂xµ̄ ∂xρ ν
V µ̄;λ̄ = V
∂xν ∂xλ̄ ;ρ
Também podemos definir uma derivada covariante para um vetor contravariante Vµ .

Lembremos da sua lei de transformação
∂xρ
Vµ̄ = Vρ
∂xµ̄
Diferenciando com respeito a xν̄
∂Vµ̄ ∂xρ ∂Vρ ∂ ∂xρ

= + Vρ ν̄ µ̄
∂xν̄ ∂xµ̄ ∂xν̄ ∂x ∂x
∂Vµ̄ ∂xρ ∂xσ ∂Vρ ∂ 2 xρ

⇒ = + Vρ (8.6.5)
∂xν̄ ∂xµ̄ ∂xν̄ ∂xσ ∂xν̄ ∂xµ̄
De (8.5.2) temos
" #
∂xλ̄ ∂xρ ∂xσ τ ∂xλ̄ ∂ 2 xτ ∂xκ
Γλ̄µ̄ν̄ Vλ̄ = Γρσ + Vκ
∂xτ ∂xµ̄ ∂xν̄ ∂xτ ∂xµ̄ ∂xν̄ ∂xλ̄
∂xλ̄ ∂xκ ∂xρ ∂xσ τ ∂xλ̄ ∂xκ ∂ 2 xτ (8.6.6)
= Γ V κ + Vκ
∂xτ ∂xλ̄ ∂xµ̄ ∂xν̄ ρσ ∂xτ ∂xλ̄ ∂xµ̄ ∂xν̄
∂xρ ∂xσ κ ∂ 2 xκ
= Γ ρσ Vκ + Vκ
∂xµ̄ ∂xν̄ ∂xµ̄ ∂xν̄

O termo não-homogêneo irá se cancelar caso subtraíamos (8.6.5) de (8.6.6)
∂xρ ∂xσ

∂Vµ̄ λ̄ ∂Vρ
− Γ V
µ̄ν̄ λ̄ = − Γκρσ Vκ (8.6.7)
∂xν̄ ∂xµ̄ ∂xν̄ ∂xσ
Portanto, definimos a derivada covariante de um vetor covariante como
∂Vµ
Vµ;ν = − Γλµν Vλ (8.6.8)
∂xν
e a Eq.(8.6.7) nos diz que Vµ;ν é um tensor:
∂xρ ∂xσ
Vµ̄;ν̄ = Vρ;σ (8.6.9)
∂xµ̄ ∂xν̄
É obvio como estas definições são estendidas para tensores gerais. A derivada covari-
ante com respeito a xρ de um tensor T é igual a ∂T /∂xρ , adicionado de um termo para
cada índice µ contravariante dado por Γµνρ vezes T com µ sendo substituído por ν, menos
um termo Γκλρ para cada índice covariante λ vezes T com λ sendo substituído por κ. Por
exemplo,
∂ µσ
T µσλ;ρ = T λ + Γµρν T νσλ + Γσρν T µνλ − Γκλρ T µσκ (8.6.10)
∂xρ
para ver isto, observe que
!
∂ τ̄ ξ̄ ∂ ∂xτ̄ ∂xξ̄ ∂xλ µσ
η̄
T ζ̄ = T λ
∂x ∂xη̄ ∂xµ ∂xσ ∂xζ̄
∂xρ ∂ 2 xτ̄ ∂xξ̄ ∂xλ µσ ∂xρ ∂xτ̄ ∂ 2 xξ̄ ∂xλ µσ ∂xτ̄ ∂xξ̄ ∂ 2 xλ µσ
= T λ + T λ + T λ
∂xη̄ ∂xρ ∂xµ ∂xσ ∂xζ̄ ∂xη̄ ∂xµ ∂xρ ∂xσ ∂xζ̄ ∂xµ ∂xσ ∂xη̄ ∂xζ̄
∂xρ ∂xτ̄ ∂xξ̄ ∂xλ ∂
+ η̄ µ σ ζ̄ ρ T µσλ
∂x ∂x ∂x ∂x ∂x
e
∂xτ̄ ∂xρ ∂xν µ ∂ 2 xτ̄ ∂xρ ∂xν ∂xγ̄ ∂xξ̄ ∂xλ χσ

Γτ̄η̄γ̄ T γ̄ ξ̄ζ̄ = Γ − T λ
∂xµ ∂xη̄ ∂xγ̄ ρν ∂xρ ∂xν ∂xη̄ ∂xγ̄ ∂xχ ∂xσ ∂xζ̄
∂xτ̄ ∂xρ ∂xν ∂xγ̄ µ ∂xξ̄ ∂xλ χσ ∂ 2 xτ̄ ∂xρ ∂xν ∂xγ̄ ∂xξ̄ ∂xλ χσ
= Γ T − T λ
∂xµ ∂xη̄ |∂xγ̄{z∂xχ} ρν ∂xσ ∂xζ̄ λ
∂xρ ∂xν ∂xη̄ |∂xγ̄{z∂xχ} ∂xσ ∂xζ̄
δ νχ δ νχ
∂xτ̄ ∂xρ ∂xξ̄ ∂xλ µ νσ ∂ 2 xτ̄ ∂xρ ∂xξ̄ ∂xλ νσ

= Γρν T λ − T λ
∂xµ ∂xη̄ ∂xσ ∂xζ̄ ∂xρ ∂xν ∂xη̄ ∂xσ ∂xζ̄

analogamente,
" #
∂xξ̄ ∂xρ ∂xν σ ∂ 2 xξ̄ ∂xρ ∂xν ∂xτ̄ ∂xγ̄ ∂xλ µχ
Γξ̄η̄γ̄ T τ̄ γ̄ζ̄ = Γ − T λ
∂xσ ∂xη̄ ∂xγ̄ ρν ∂xρ ∂xν ∂xη̄ ∂xγ̄ ∂xµ ∂xχ ∂xζ̄
∂xξ̄ ∂xρ ∂xτ̄ ∂xλ σ µν ∂ 2 xξ̄ ∂xρ ∂xτ̄ ∂xλ µν
= Γ T − T λ
∂xσ ∂xη̄ ∂xµ ∂xζ̄ ρν λ ∂xρ ∂xν ∂xη̄ ∂xµ ∂xζ̄
e
∂xᾱ ∂xλ ∂xρ κ ∂ 2 xᾱ ∂xλ ∂xρ ∂xτ̄ ∂xξ̄ ∂xχ µσ

Γᾱζ̄ η̄ T τ̄ ξ̄ᾱ = Γ − T χ
∂xκ ∂xζ̄ ∂xη̄ λρ ∂xλ ∂xρ ∂xζ̄ ∂xη̄ ∂xµ ∂xσ ∂xᾱ
∂xλ ∂xρ ∂xτ̄ ∂xξ̄ κ µσ ∂xχ ∂ 2 xᾱ ∂xλ ∂xρ ∂xτ̄ ∂xξ̄ µσ
= Γ λρ T κ − T χ
∂xζ̄ ∂xη̄ ∂xµ ∂xσ ∂xᾱ ∂xλ ∂xρ ∂xζ̄ ∂xη̄ ∂xµ ∂xσ
∂xλ ∂xρ ∂xτ̄ ∂xξ̄ κ µσ ∂xβ̄ ∂xᾱ ∂ 2 xχ ∂xλ ∂xρ ∂xτ̄ ∂xξ̄ µσ
= Γ λρ T κ + T χ
∂xζ̄ ∂xη̄ ∂xµ ∂xσ ∂xλ ∂xρ ∂xβ̄ ∂xᾱ ∂xζ̄ ∂xη̄ ∂xµ ∂xσ
onde na última linha utilizamos (8.5.9), consequentemente
∂xλ ∂xρ ∂xτ̄ ∂xξ̄ κ µσ ∂ 2 xχ ∂xτ̄ ∂xξ̄ µσ

Γᾱζ̄ η̄ T τ̄ ξ̄ᾱ = Γ T + T χ
∂xζ̄ ∂xη̄ ∂xµ ∂xσ λρ κ ∂xζ̄ ∂xη̄ ∂xµ ∂xσ
deste modo,
∂ τ̄ ξ̄ τ̄ γ̄ ξ̄ ξ̄ τ̄ γ̄ ᾱ τ̄ ξ̄ ∂xρ ∂ 2 xτ̄ ∂xξ̄ ∂xλ µσ ∂xρ ∂xτ̄ ∂ 2 xξ̄ ∂xλ µσ

T + Γ η̄γ̄ T + Γ η̄γ̄ T − Γ ζ̄ η̄ T ᾱ = T λ + T λ
∂xη̄ ζ̄ ζ̄ ζ̄ ∂xη̄ ∂xρ ∂xµ ∂xσ ∂xζ̄ ∂xη̄ ∂xµ ∂xρ ∂xσ ∂xζ̄
∂xτ̄ ∂xξ̄ ∂ 2 xλ ∂xρ ∂xτ̄ ∂xξ̄ ∂xλ ∂
+ µ σ η̄ ζ̄ T µσλ + η̄ µ σ ζ̄ ρ T µσλ
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x
τ̄ ρ ξ̄ λ
∂x ∂x ∂x ∂x ∂ 2 xτ̄ ∂xρ ∂xξ̄ ∂xλ
+ µ η̄ σ ζ̄ Γµρν T νσλ − ρ ν η̄ σ ζ̄ T νσλ
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x
ξ̄ ρ τ̄ λ
∂x ∂x ∂x ∂x ∂ 2 xξ̄ ∂xρ ∂xτ̄ ∂xλ
+ σ η̄ µ ζ̄ Γσρν T µνλ − ρ ν η̄ µ ζ̄ T µνλ
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x
λ ρ τ̄ ξ̄
∂x ∂x ∂x ∂x ∂ 2 xχ ∂xτ̄ ∂xξ̄
− ζ̄ η̄ µ σ Γκλρ T µσκ − ζ̄ η̄ µ σ T µσχ
∂x ∂x ∂x ∂x ∂x ∂x ∂x ∂x
assim, vemos que no lado direito da equação o primeiro termo se anula com o sexto termo,
o segundo termo se anula com o oitavo termo e o terceiro termo se anula com o último
termo. Portanto,
∂ τ̄ ξ̄ τ̄ γ̄ ξ̄ ξ̄ τ̄ γ̄ ᾱ τ̄ ξ̄ ∂xρ ∂xτ̄ ∂xξ̄ ∂xλ

T + Γ η̄γ̄ T + Γ η̄γ̄ T − Γζ̄ η̄ T ᾱ =
∂xη̄ ζ̄ ζ̄ ζ̄ η̄ µ
∂x ∂x ∂x ∂x
σ ζ̄

∂ µσ µ νσ σ µν κ µσ
T λ + Γρν T λ + Γρν T λ − Γλρ T κ
∂xρ
mostrando que de fato T µσλ;ρ , conforme definido em (8.6.10), é um tensor.

Também podemos estender a ideia da diferenciação covariante para densidades tenso-

riais. A maneira mais fácil de fazer isto é lembrarmos de que caso F seja uma densidade
tensorial de comprimento W , então g W/2 F é um tensor ordinário. Sua derivada covariante
também será um tensor, e o multiplicando por g −W/2 obtém-se de volta uma densidade
tensorial de comprimento W . Consequentemente, a derivada covariante de uma densidade
tensorial de comprimento W é definida como
F······;ρ ≡ g −W/2 g W/2 F······

;ρ
(8.6.11)
não sendo necessário checar se isto é ou não uma densidade de tensorial de comprimento
W . A consequência é que a derivada covariante em relação a xρ de uma densidade tensorial
F de comprimento W é construída como se a mesma fosse um tensor ordinário, exceto
que adicionamos um termo extra (W/2g(F······ (∂g/∂xρ ). Por exemplo,
∂ W ∂g µ
F µλ;ρ ≡ F µλ + Γµρν F νλ − Γκλρ F µκ + F (8.6.12)
∂x ρ 2g ∂xρ λ
A junção da diferenciação covariante com as operações algébricas descritas na subseção

3 nos dá resultados análogos a aqueles encontrados para a diferenciação ordinária. Em
particular:
(A) A derivada covariante de uma combinação linear de tensores (com coeficientes
constantes) é igual a combinação linear das derivadas covariantes. Por exemplo, se α e β
são constantes, então
∂
(αAµν + βB µν );λ = (αAµν + βB µν ) + Γµλτ (αAτ ν + βB τν ) − Γκνλ (αAµκ + βB µκ )
∂xλ
∂ ∂
= α λ Aµν + αΓµλτ Aτ ν − αΓκνλ Aµκ + β λ B µν + βΓµλτ B τν − βΓκνλ B µκ
∂x ∂x
µ µ
= αA ν;λ + βB ν;λ
(8.6.13)
(B) A derivada covariante de um produto direto de tensores obedece a fórmula de
Leibniz. Por exemplo,
∂
(Aµν B λ );ρ = (Aµν B λ ) + Γµρσ (Aσν B λ ) + Γλρσ (Aµν B σ ) − Γκνρ (Aµκ B λ )
∂xρ
∂ ∂ (8.6.14)
= B λ ρ Aµν + Aµν ρ B λ − B λ Γκνρ Aµκ + Aµν Γλρσ B σ
∂x ∂x
µ λ µ λ
= A ν;ρ B + A ν B ;ρ
(C) A derivada covariante de um tensor contraído é a contração da derivada covariante.

Por exemplo, fixar σ = λ na Eq.(8.6.10) nos dá
∂ µλ
T µλλ;ρ = T λ + Γµρν T νλλ + Γλρν T µνλ − Γκλρ T µλκ
∂xρ
∂ µλ
= T λ + Γµρν T νλλ + Γλρν T µνλ − Γλνρ T µνλ
∂xρ |{z} (8.6.15)
Γλ
ρν
∂ µλ
= T λ + Γµρν T νλλ
∂xρ
Também note que a derivada covariante do tensor métrico é nula, pois ele desaparece
nas coordenadas localmente inerciais, onde Γµνλ e ∂gµν /∂xλ somem, e um tensor que é nulo
em um sistema de coordenadas também o é em todos os sistemas. O mesmo resultado
pode ser obtido mais diretamente observando que
∂gµν
gµν;λ = λ
− Γρλµ gρν − Γρλν gρµ
∂x
a Eq.(7.3.1) nos diz que isso se anula:
gµν;λ = 0 (8.6.16)
(Este argumento pode ser invertido para fornecer outra forma de se derivar a relação entre
gµν e Γλµν .) Também podemos mostrar da mesma forma que a derivada covariante das
outras formas do tensor métrico também se anulam, isto é,
g µν;λ = 0 (8.6.17)
para ver isto, note que como
∂g µν
g µν;λ = + Γµσλ g σν + Γνλσ g µσ
∂xλ
como ∂g µν /∂xλ , Γµσλ e Γνλσ se anulam em um sistema de coordenadas localmente inercial,

segue que a relação acima se anula em um sistema de coordenadas localmente inercial, e
como a mesma se trata de um tensor, irá também ser nula em todos os sistemas, o que
demonstra (8.6.17).
δ µν;λ = 0 (8.6.18)
pois δ µν;λ = (g µτ gτ ν );λ = g µτ ;λ gτ ν + g µτ gτ ν;λ = 0, onde usamos as propriedades (B) e (C),

isto é, a lei de Leibniz, e que a derivada covariante de um tensor contraído é a contração
da derivada covariante.
Através das Eqs.(8.6.16) - (8.6.18) segue que as operações da diferenciação covariante

e levantamento e abaixamento de índices comutam; por exemplo,
(g µν Vν );λ = g µν Vν;λ (8.6.19)
A importância da diferenciação covariante surge de duas de suas propriedades: Ela

converte tensores em outros tensores, e se reduz a diferenciação ordinária na ausência
da gravidade, isto é, quando Γµνλ = 0. Estas propriedades sugerem o seguinte algoritmo
para avaliar os efeitos da gravitação em sistemas físicos: Escreva a equação da relativi-
dade especial apropriada que é válida na ausência da gravidade, substitua ηµν por gµν e
troque todas as derivadas por derivadas covariantes. As equações finais serão geralmente
covariantes e válidas na ausência da gravidade, e portanto, de acordo com o Princípio da
Covariância Geral, elas serão verídicas na presença de campos gravitacionais, contanto
que sempre trabalhemos em uma escala do espaço-tempo suficientemente pequena em
comparação com a escala do campo gravitacional.
8.7 Gradiente, Rotacional e Divergente

Existem alguns casos especiais onde a derivada covariante toma uma forma particu-
larmente simples. A mais simples de todas, é obviamente, a derivada covariante de um
escalar, na qual é apenas o gradiente ordinário
∂S
S;u = (8.7.1)
∂xµ
Outro caso simples é o rotacional covariante. Lembre-se de que
∂Vµ
Vµ;ν ≡ − Γλµν Vλ
∂xν
Uma vez que Γλµν é simétrico em µ e ν, o rotacional covariante é apenas o rotacional

ordinário
∂Vµ ∂Vν
Vµ;ν − Vν;µ = ν
− Γλµν Vλ − µ + Γλνµ Vλ
∂x ∂x | {z }
∂Vµ ∂Vν
= − µ − Γλµν Vλ + Γλµν Vλ
∂xν ∂x
daí
∂Vµ ∂Vν
Vµ;ν − Vν;µ = − µ (8.7.2)
∂xν ∂x
Outro caso especial que irá ser um pouco mais trabalhoso é a derivada covariante de
um vetor contravariante
∂V µ
V µ;µ ≡ + Γµµλ V λ (8.7.3)
∂xµ

Observemos que Γµµλ é dado por

1 µρ ∂gρµ ∂gρλ ∂gµλ
Γµµλ = g + −
2 ∂xλ ∂xµ ∂xρ
1 ∂gρµ 1 ∂gρλ 1 ∂gµλ
= g µρ λ + g µρ µ − g µρ ρ
2 ∂x 2 | {z ∂x } 2 ∂x
∂gµλ
g ρµ
∂xρ
∂gµλ µρ ∂gµλ
lembre-se de que devido a simetria do tensor métrico g ρµ = g , então
∂xρ ∂xρ
1 ∂gρµ
Γµµλ = g µρ λ (8.7.4)
2 ∂x
Podemos calcular isto facilmente se lembrarmos que para uma matriz arbitrária M ,

−1 ∂ ∂
Tr M (x) λ M (x) = ln Det M (x) (8.7.5)
∂x ∂xλ
onde Det denota o determinante e Tr denota o traço, ou seja, a soma dos elementos da
diagonal. Para provar (8.7.5), primeiramente, provemos o seguinte teorema
Teorema 8.7.1. Seja T = S −1 AS, onde T é uma matriz diagonal e S é a matriz dos
autovetores de A, então
det(eA ) = eTr(A) (8.7.6)
Demonstração:
Sabemos que por definição
A2
eA = I + A + + ···
2!
daí
(S −1 A)(AS)
S −1 eA S = S −1 IS + S −1 AS + + ···
2!
−1 (T S −1 )(ST )
= SS + T + + ···
2!
T2
=I +T + + ···
2!
= eT
ou eA = SeT S −1 logo,
det eA = det(SeT S −1 ) = det(S) det(eT ) det(S −1 ) = det(eT )
já que det(S −1 ) = det−1 (S). Lembre-se de que por T ser a matriz diagonal com elementos
dados pelos autovalores de A, segue que eT é a matriz triangular com eλ1 , eλ2 , . . . na
diagonal (a prova disto parte diretamente da definição de exponencial e do fato de que

o produto de uma matriz diagonal por ela mesma é igual a uma matriz diagonal com
os elementos da matriz diagonal original ao quadrado), portanto det(eT ) = eλ1 eλ2 · · · =
P
e λi = eTr T . Contudo,
Tr T = Tr(S −1 AS) = Tr(AS −1 S) = Tr(AI) = Tr A
logo, det eA = det(eT ) = eTr T = eTr A , o que demonstra o teorema.

Tomemos A = ln M , onde M é uma matriz arbitrária. Segue
det eln M = eTr ln M
⇒ det M = eTr ln M (8.7.7)
Agora, consideremos uma variação em ln det M devido a uma variação δxλ em xλ :
δ ln(Det M ) = ln Det(M + δM ) − ln Det M

Det(M + δM )
= ln
Det M
= ln Det M −1 (M + δM )
= ln Det(I + M −1 δM )
−1 δM )
por (8.7.7), Det(I + M −1 δM ) = eTr ln(I+M , assim
−1 δM )
δ ln(Det M ) = ln eTr ln(I+M
= Tr ln(I + M −1 δM )
por definição o logaritmo de uma matriz B é dado por
(B − I)2 (B − I)3 (B − I)4

ln B = (B − I) − + − + ···
2 3 4
deste modo,
(M −1 δM )2 (M −1 δM )3 (M −1 δM )4
ln(I + M −1 δM ) = M −1 δM − + − + ···
2 3 4
vamos então desprezar os termos de ordem 2 em diante, assim sendo
δ ln(Det M ) = Tr M −1 δM
∂
Tomando δ = , obtemos (8.7.5). Aplicando (8.7.5) para o caso onde M é a matriz
∂xλ

gρµ ,
∂g ρµ
∂
Tr g νρ λ ln Det gρµ=
∂xλ
∂x
P
lembremos que o traço de uma matriz Bij é i Bii , logo
∂g ρµ ∂
g µρ λ
= ln g
∂x ∂xλ
encontramos por (8.7.4) que
1 ∂ ∂
Γµµλ = λ
ln g = ln g 1/2
2 ∂x ∂xλ
pela regra da cadeia encontramos
1 ∂ √
⇒ Γµµλ = √ g (8.7.8)
g ∂xλ
√
d 1 dx 1 1 dx 1 d x
pois ln x(t) = e = √ . Com (8.7.3), encontramos que a divergência
dt x dt 2 x dt x dt
covariante é precisamente
1 √ ∂V µ

µ 1 ∂ √
V ;µ =√ g µ +√ g Vλ
g ∂x g ∂xλ
(8.7.9)
1 ∂ √ µ
=√ ( gV )
g ∂xµ
Uma consequência imediata é a forma covariante do teorema de Gauss: Se V µ some no
infinito, então
√
Z
d4 x gV µ;µ = 0 (8.7.10)
√ √
Note o aparecimento do fator g que torna d4 x g invariante.
Podemos também utilizar (8.7.8) para simplificar as fórmulas para a divergência co-
variante de um tensor. Por exemplo,
∂T µν
T µν;µ ≡ µ
+ Γµµλ T λν + Γνµλ T µλ
∂x
e, aplicando (8.7.8), encontramos que
1 √ ∂T µν

1 ∂ √
T µν;µ =√ g + √ g T λν + Γνµλ T µλ
g ∂xµ g ∂xλ
1 ∂ √ µν
⇒ T µν;µ = √ ( gT ) + Γνµλ T µλ (8.7.11)
g ∂xµ
Em especial, se T µλ = −T λµ , então o último termo desaparece, pois multiplicando T µλ =

−T λµ por Γνµλ temos

Γνµλ T µλ = − Γνµλ T λµ
|{z}
Γνλµ
= −Γνλµ T λµ
= −Γνµλ T µλ
somando Γνµλ T µλ em ambos os lados, obtém-se Γνµλ T µλ = 0, aplicando este resultado em

(8.7.11):
1 ∂ √ µν
Aµν ;µ = √ ( gA ), para Aµν antissimétrico. (8.7.12)
g ∂xµ
Existe um outro caso especial de bastante relevância. Para um tensor covariante Aµν
a derivada covariante é
∂Aµν
Aµν;λ = λ
− Γρµλ Aρν − Γρνλ Aµρ
∂x
Suponha que Aµν é antissimétrico; isto é,
Aµν = −Aνµ
Se adicionarmos duas vezes a Aµν;λ o mesmo tensor mas com índices permutados cicli-
camente, obtemos em virtude da simetria de Γρµλ e da anti simetria de Aρν que todos os
termos Γ se cancelam:
∂Aµν ∂Aλµ
Aµν;λ + Aλµ;ν + Aνλ;µ = λ
− Γρµλ Aρν − Γρνλ Aµρ + ν
− Γρλν Aρµ −Γρµν Aλρ
∂x ∂x | {z }
−Γρνλ Aµρ
∂Aνλ
+ µ
− Γρνµ Aρλ − Γρλµ Aνρ
∂x | {z } | {z }
−Γρµν Aλρ −Γρµλ Aρν
produzindo
∂Aµν ∂Aλµ ∂Aνλ

Aµν;λ + Aλµ;ν + Aνλ;µ = + + para A antissimétrico. (8.7.13)
∂xλ ∂xν ∂xµ
8.8 Análise Vetorial em Coordenadas Ortogonais

O leitor pode estar se perguntando o que o formalismo da análise tensorial delineado ao
longo deste capítulo tem a ver com as fórmulas familiares para o gradiente, rotacional e o
divergente nos sistemas de coordenadas curvilíneas clássicos. Vamos a algumas definições.
Sejam as coordenadas (ξ 1 , ξ 2 , ξ 3 ) de um ponto qualquer expressas em função de (x1 , x2 , x3 )
de modo que
ξ 1 = ξ 1 (x1 , x2 , x3 ), ξ 2 = ξ 2 (x1 , x2 , x3 ), ξ 3 = ξ 3 (x1 , x2 , x3 ), (8.8.1)

Suponhamos que (8.8.1) possam ser resolvidas, dando x1 , x2 e x3 em função de ξ 1 , ξ 2 e ξ 3 ,

isto é
x1 = x1 (ξ 1 , ξ 2 , ξ 3 ), x2 = x2 (ξ 1 .ξ 2 , ξ 3 ), x3 = x3 (ξ 1 , ξ 2 , ξ 3 ) (8.8.2)
As funções (8.8.1) e (8.8.2) são consideradas unívocas e com derivadas contínuas, de modo
que há uma única correspondência entre (ξ 1 , ξ 2 , ξ 3 ) e (x1 , x2 , x3 ).
Dado um ponto P de coordenadas retangulares (ξ 1 , ξ 2 , ξ 3 ) podemos, com as equações
(8.8.2), associá-lo a um conjunto único de coordenadas (x1 , x2 , x3 ) chamadas coordenadas
curvilíneas de P .
As superfícies x1 = c1 , x2 = c2 , x3 = c3 , onde c1 , c2 e c3 são constantes, chamam-
se superfícies coordenadas, e cortam-se aos pares em curvas chamadas curvas ou linhas
coordenadas. Se as superfícies se interceptam em ângulos retos o sistema de coordenadas
curvilíneas é dito ortogonal. As curvas coordenadas x1 , x2 e x3 de um sistema curvilíneo
são análogas aos eixos coordenados ξ 1 , ξ 2 , ξ 3 de um sistema retangular.
Seja ~r = 3i=1 ξ i ξˆi o vetor posição de um ponto P . Assim por (8.8.1) segue que o
P
mesmo pode ser escrito da seguinte forma ~r = ~r(x1 , x2 , x3 ),

∂~r
Um vetor tangente à curva x1 em P (para a qual x2 e x3 são constantes ) é . Logo,
∂x1
um vetor tangente unitário nessa direção é
∂~r
1
~e1 = ∂x
∂~r
∂x1
donde
∂~r
= h1~e1
∂x1
onde
∂~r
h1 = 1
∂x
De maneira geral,
∂~r
= hi~ei i = 1, 2, 3 (8.8.3)
∂xi
onde
∂~r
hi = i i = 1, 2, 3. (8.8.4)
∂x
De ~r = ~r(x1 , x2 , x3 ) temos
3 3
X ∂~r i
X
d~r = i
dx = hi dxi ~ei (8.8.5)
i=1
∂x i=1
Definimos a diferencial do comprimento de arco ou comprimento próprio invariante, sim-

bolizada por ds, como ds2 = d~r · d~r. De tal modo que
3
! 3
! 3
2
X ∂~r X ∂~r X
i j ∂~r ∂~r
ds = i
dxi · j
dxj = dx dx ·
i=1
∂x j=1
∂x i,j=1
∂xi ∂xj
definimos o tensor métrico como
∂~r ∂~r
gij = · (8.8.6)
∂xi ∂xj
note que gij = gji . Assim,

3
X
2
ds = gij dxi dxj (8.8.7)
i,j=1
Aplicando (8.8.3) em (8.8.6)
∂~r ∂~r
gij = · = hi hj (~ei · ~ej ) (8.8.8)
∂xi ∂xj
Para sistemas ortogonais, temos
~ei · ~ej = δij (8.8.9)
Substituindo (8.8.9) em (8.8.8) o comprimento próprio invariante se torna

X
ds2 = gij dxi dxj = h12 (dx1 )2 + h22 (dx2 )2 + h32 (dx3 )2 (8.8.10)
i,j
isto é, o tensor métrico em um sistema ortogonal é dado por
gij = hi hj δij (i, j = 1, 2, 3) (8.8.11)
Temos que
∂~r
dxi
d~ri = (8.8.12)
∂xi
onde d~ri é a variação do vetor posição ao longo da curva xi , mantendo as outras curvas
diferentes de i constantes. O volume elementar em um sistema de coordenadas curvilíneas
ortogonal é definido como o produto misto dos vetores d~r1 , d~r2 , d~r3 ,

∂~r 1 ∂~r 2 ∂~r 3

dV =

1
dx · 2
dx × 3
dx
∂x ∂x ∂x
e portanto dado por

∂~r ∂~r ∂~r
dV =
· × dx1 dx2 dx3 (8.8.13)
∂x1 ∂x2 ∂x3

o que por (8.8.3) se torna

dV = h1 h2 h3 dx1 dx2 dx3 (8.8.14)
já que ~e1 · ~e2 × ~e3 = 1.
Teorema 8.8.1. Em um sistema geral de coordenadas (x1 , x2 , x3 ),

g11 g12 g13 2
∂~r ∂~r ∂~r
g = g21 g22 g23 = · × (8.8.15)

∂x1 ∂x2 ∂x3
g31 g32 g33
e o elemento de volume em um sistema geral de coordenadas é
√
dV = g dx1 dx2 dx3 (8.8.16)
Demonstração:
Sabemos que
∂~r ∂~r ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3
gij = · = + i i+ i i
∂xi ∂xj ∂xi ∂xj ∂x ∂x ∂x ∂x
com i, j = 1, 2, 3. Logo, empregando o seguinte teorema da multiplicação de determinan-
tes, det M det N = det(M N )

a11 a12 a13 A11 A12 A13

a21 a22 a23 A21 A22 A23

a31 a32 a33 A31 A32 A33

a11 A11 + a12 A12 + a13 A13 a11 A21 + a12 A22 + a13 A23 a11 A31 + a12 A32 + a13 A33

= a21 A11 + a22 A12 + a23 A13 a21 A21 + a22 A22 + a23 A23 a21 A31 + a22 A32 + a23 A33

a31 A11 + a32 A12 + a33 A13 a31 A21 + a32 A22 + a33 A23 a31 A31 + a32 A32 + a33 A33
temos

1 2 1
∂ξ
∂ξ 2 ∂ξ 3 ∂ξ
∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3
∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1

2
∂~r ∂~r ∂~r ∂ξ 1 ∂ξ 2 3
∂ξ ∂ξ 1 ∂ξ 2 ∂ξ ∂ξ 1
3
∂ξ 2 3
∂ξ
· × = =
∂x1 ∂x2 ∂x3 ∂x2
∂x2 ∂x2 ∂x2
∂x2 ∂x2 ∂x2 ∂x2 ∂x2

∂ξ 1 ∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3 ∂ξ 1 ∂ξ 2 ∂ξ 3

3
∂x3 ∂x3
3
∂x ∂x ∂x3 ∂x3 ∂x3 ∂x3 ∂x3

1 1
∂ξ ∂ξ ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3
+ +
∂x1 ∂x1 ∂x1 ∂x1 ∂x1 ∂x1 + + + +
∂x1 ∂x2 ∂x1 ∂x2 ∂x1 ∂x2 ∂x1 ∂x3 ∂x1 ∂x3 ∂x1 ∂x3

∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 1
∂ξ ∂ξ 1 2
∂ξ ∂ξ 2 3
∂ξ ∂ξ 3
= + + + + + +
∂x2 ∂x1 ∂x2 ∂x1 ∂x1 ∂x1 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x2 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3

∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3 ∂ξ 1 ∂ξ 1 ∂ξ 2 ∂ξ 2 ∂ξ 3 ∂ξ 3

3 1 + + + + + +
∂x ∂x ∂x3 ∂x1 ∂x3 ∂x1 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3 ∂x2 ∂x3 ∂x3 ∂x3 ∂x3 ∂x3 ∂x3

g11 g12 g13

= g21 g22 g23 = g

g31 g32 g33
o que demonstra a primeira parte do teorema. Já para a segunda, note que o volume
elementar é dado por

∂~r 1 ∂~r 2 ∂~r 3

dV =
dx · dx × dx
∂x1 ∂x2 ∂x3

∂~r ∂~r ∂~r 1 2 3
= ∂x1 · ∂x2 × ∂x3 dx dx dx
√
= g dx1 dx2 dx3
demonstrando assim o teorema.
Comparando (8.8.16) com (8.8.14) vemos que
√
g = h1 h2 h3 (8.8.17)
O que usualmente chamamos de componentes de um vetor V~ em tratamentos elementares

não são as componentes covariantes Vi ou as componentes contravariantes V i , mas sim as
componentes ’ordinárias’ V̄i :
V̄i ≡ hi V i = h−1
i Vi (8.8.18)

onde por hipótese

∂~r −1

h−1
i =
∂xi
e assim o tensor métrico inverso é dado por
g ij = h−1 −1 ij
i hj δ (8.8.19)
O produto escalar de dois vetores é então bastante simples:

X
V~ · U
~ = gij V i U j = V̄1 Ū1 + V̄2 Ū2 + V̄3 Ū3 (8.8.20)
ij
[essa é a motivação para a definição (8.8.18).] Contudo, o gradiente de um escalar é um

pouco mais complicado:
∇~ i S ≡ S¯;i = h−1 ∂S (8.8.21)
i
∂xi
O rotacional de um vetor V é também definido tomando a componente ’ordinária’ de um
vetor X
~ × V~ )i ≡ hi
(∇ (Det g)−1/2 ijk Vj;k
jk
X ∂ (8.8.22)
= hi (h1 h2 h3 )−1 ijk hk V̄K
jk
∂xj
onde lembremos que o fator (Det g)−1/2 surge para transformar a densidade tensorial
ijk Vj;k em um tensor.Por exemplo, a primeira componente do rotacional é
~ × V~ )1 = h1
X 1 ∂
(∇ 1jk j hk V̄K
j,k
h1 h2 h3 ∂x
que se torna
~ × V~ )1 = 1 ∂ ∂
(∇ 2
h3 V̄3 − 3 h2 V̄2 (8.8.23)
h2 h3 ∂x ∂x
O divergente do vetor V não é mais nada do que a divergência covariante (8.7.9):
X X ∂
~ · V~ ≡
∇ V i;i = (Det g)−1/2 (Det g)1/2 V i
∂x i
i i

−1 ∂ ∂ ∂
= (h1 h2 h3 ) 1
h1 h2 h3 V 1 + 2 h1 h2 h3 V 2 + 3 h1 h2 h3 V 3 (8.8.24)
∂x ∂x ∂x

−1 ∂ ∂ ∂
= (h1 h2 h3 ) h2 h3 V̄1 + 2 h1 h3 V̄2 + 3 h1 h2 V̄3
∂x1 ∂x ∂x
O Laplaciano de um escalar S é o divergente do gradiente

X
~ 2S ≡
∇ (g ij S;i );j (8.8.25)
ij

∂S
ou combinando (8.8.24) com (8.8.21), isto é fazendo V̄i em (8.8.24) igual a h−1
i de
∂xi
(8.8.21), obtém-se:

~ 2 S ≡ (h1 h2 h3 )−1 ∂ h2 h3 ∂S ∂ h1 h3 ∂S ∂ h1 h2 ∂S
∇ + 2 + 3 (8.8.26)
∂x1 h1 ∂x1 ∂x h2 ∂x2 ∂x h3 ∂x3
O leitor pode facilmente checar que as fórmulas usuais para o gradiente, rotacional,
divergente e Laplaciano são obtidas, caso hi tome as formas apropriadas para as coorde-
nadas esféricas ou cilíndricas.
8.9 Diferenciação Covariante ao Longo de uma Curva

Este capítulo lidou até agora com campos tensoriais definidos em todo o espaço-tempo;
agora consideramos tensores definidos somente ao longo de uma curva xµ (τ ). Exemplos
óbvios vêm à mente, tais como o momentum P µ (τ ) ou o spin Sµ (τ ) de uma partícula.
Para tais tensores, é claro que não faria sentido falar sobre diferenciação covariante em
relação a xµ , todavia podemos definir a derivada covariante em relação ao invariante τ
que parametriza a curva.
Considere primeiramente um vetor contravariante Aµ (τ ), com a lei de transformação
µ̄ ∂xµ̄ ν
A (τ ) = A (τ ) (8.9.1)
∂xν
Deve ser observado que as derivadas parciais ∂xµ̄ /∂xν devem ser calculada em xν = xν (τ ),
devido a isso as mesmas dependem somente de τ . Portanto, diferenciando em relação a
τ , encontramos dois termos,
dAµ̄ (τ ) ∂xµ̄ dAν (τ ) ∂ 2 xµ̄ dxλ ν

= + A (τ ) (8.9.2)
dτ ∂xν dτ ∂xν ∂xλ dτ
A derivada segunda ∂ 2 xµ̄ /∂xν ∂xλ é a mesma responsável pelo termo inomogêneo na fór-
mula de transformação (8.5.10) para a conexão afim, pela Eq.(8.6.2)
∂xµ̄ ∂xν ζ λ ∂ 2 xµ̄ ∂xλ dxτ̄ ν

Γµ̄τ̄ κ̄ Aκ̄ = Γ A − A
∂xζ ∂xτ̄ νλ ∂xν ∂xλ ∂xτ̄ dτ
∂xν dxτ̄ dxν

multiplicando por dxτ̄ /dτ em ambos os lados, e reconhecendo = , assim como
∂xτ̄ dτ dτ
∂xλ dxτ̄ dxλ
=
∂xτ̄ dτ dτ
dxτ̄ µ̄ κ̄ ∂xµ̄ dxν ζ λ ∂ 2 xµ̄ dxλ ν
Γτ̄ κ̄ A = Γ A − A
dτ ∂xζ dτ νλ ∂xν ∂xλ dτ
somando a equação anterior com a Eq.(8.9.2), cancela-se os termos inomogêneos e produ-

zimos:
dAµ̄ (τ ) dxτ̄ µ̄ κ̄ ∂xµ̄ dAν (τ ) ∂xµ̄ dxλ ν ζ ∂xµ̄ dAν (τ ) dxλ ν ζ

+ Γ A = + ν Γ A = + Γ A
dτ dτ τ̄ κ̄ ∂xν dτ ∂x dτ λζ ∂xν dτ dτ ζλ
daí somos levados a definir a derivada covariante ao longo de uma curva xµ (τ ) por
DAµ dAµ dxλ ν

≡ + Γµνλ A (8.9.3)
Dτ dτ dτ
as Eqs.(8.5.10), (8.9.1), e (8.9.2) então mostram que isto é um vetor:
DAµ̄ ∂xµ̄ Dxν

= (8.9.4)
Dτ ∂xν Dτ
A similaridade entre (8.9.3) e a fórmula (8.6.4) para a derivada covariante de um campo

vetorial é evidente.
As mesmas considerações nos levam para a definição de derivada covariante ao longo
de uma curva xµ (τ ) de um vetor covariante Bµ (τ ) dada por
DBµ dBµ dxν

≡ − Γλµν Bλ (8.9.5)
Dτ dτ dτ
e com (8.5.2) podemos ver facilmente que isto é um vetor:
DBµ̄ ∂xν DBν

= (8.9.6)
Dτ ∂xµ̄ Dτ
Da mesma forma, a derivada covariante ao longo de uma curva xµ (τ ) de um tensor geral

T (τ ) é definida adicionando a dT /dτ um termo como em (8.9.3) para cada índice levantado
e subtraindo um termo como em (8.9.5) para cada índice abaixado. Por exemplo,
DT µν dT µν dxλ ρ dxλ µ
≡ + Γµλρ T ν − Γσλν T (8.9.7)
Dτ dτ dτ dτ σ
e
DT µ̄ν̄ ∂xµ̄ ∂xσ DT ρσ
= (8.9.8)
Dτ ∂xρ ∂xν̄ Dτ
As propriedades da diferenciação covariante descritas nas Seções 6 a 8 podem ser facil-
mente estendidas para derivadas covariantes ao longo de uma curva.
Deve ser mencionado que a derivada covariante de um campo tensorial ao longo de uma
curva pode ser determinada a partir da sua derivada covariante ordinária; por exemplo,
se T µν é um campo tensorial, então
DT µν dxλ
= T µν;λ (8.9.9)
Dτ dτ
tal relação pode ser derivada da seguinte forma: Sabemos que

∂T µν
T µν;λ = λ
+ Γµρλ T ρν − Γσνλ T µσ
∂x
multiplicando por dxλ /dτ em ambos os lados e utilizando o fato de Γ ser simétrico, obtém-
se
µ dxλ ∂T µν dxλ µ dx
λ
ρ σ dx
λ
T ν;λ = λ
+ Γλρ T ν − Γλν T µσ
dτ ∂x dτ dτ dτ
vemos que o lado direito da equação acima é justamente o lado direito da Eq.(8.9.7), o
que prova (8.9.9). Contudo veremos em capítulos posteriores que tensores definidos ao
longo de curvas nem sempre podem ser promovidos a campos tensoriais, e para estes, a
derivada D/Dτ é a única derivada covariante disponível.
É comum que um vetor Aµ (τ ) transportado ao longo de uma curva por uma partícula
não mude em τ quando visto de um referencial ξx(τ ) que é localmente inercial em x(τ ).
(Isto é verdadeiro para o momentum de uma partícula e para o spin caso esteja-se sujeito
a forças puramente gravitacionais, isto será mostrado posteriormente) Neste referencial a
conexão afim assim como dAµ /dτ somem, daí
DAµ
=0 (8.9.10)
Dτ
Sendo esta uma afirmação covariante, e verdadeira em x(τ ) no sistema localmente inercial
ξx(τ ) , deve portanto ser válida em todos os sistemas de coordenadas. O vetor Aµ é então
sujeito ás equações diferenciais de primeira ordem
dAµ dxλ ν
= −Γµνλ A (8.9.11)
dτ dτ
que define Aµ para todo τ , dado Aµ em algum τ inicial. Um vetor Aµ (τ ) definido desta
forma ao longo de uma curva xµ (τ ) é dito ser definido por um transporte paralelo. Qualquer
tensor pode ser definido ao longo de uma curva por um transporte paralelo ao ser exigido
que sua derivada covariante ao longo desta curva desapareça.
8.10 A Analogia Eletromagnética

Eu enfatizei na seção 1 deste capítulo que a covariância geral não é um princípio
ordinário de simetria como a invariância de Lorentz, mas sim um princípio dinâmico
que governa os efeitos de campos gravitacionais. Como tal, tem uma forte semelhança
com outra ’simetria dinâmica’, a invariância local de calibre, que governa os efeitos dos
campos eletromagnéticos. A invariância local de calibre afirma que as equações diferenciais
satisfeitas por um conjunto de campos carregados ψ(x) e o potencial eletromagnético
Aα (x) mantém a mesma forma, quando estes campos são sujeitos as transformações
ψ(x) → ψ(x)eieϕ(x) (8.10.1)

∂
Aα (x) → Aα (x) + ϕ(x) (8.10.2)
∂xα
onde e é a carga da partícula representada por ψ, e ϕ(x) é uma função arbitrária das
coordenadas do espaço-tempo xα . Como devemos construir equações invariantes de cali-
bre? Observe que a derivada de um campo carregado ψ não muda sob transformações de
calibre como ψ, mas sim
∂ ∂
α
ψ(x) → [ψ(x)eieϕ(x) ]
∂x ∂xα
ieϕ(x) ∂ψ(x) ∂ϕ(x)
=e + ieψ(x)
∂xα ∂xα
assim como a derivada de tensores não se comporta como um tensor sob transformações
gerais de coordenadas. Segue que equações tais como
∂ ∂
(2 − m2 )ψ(x) = 0 onde 2 ≡ η αβ
∂xα ∂xβ
não são invariante por calibre, assim como também não é geralmente covariante. Também
observe que o potencial eletromagnético Aµ (x) obedece a uma lei de transformação de ca-
libre inomogênea, assim como a conexão afim obedece a lei de transformação inomogênea
(8.5.2) para transformações gerais de coordenadas. Na análise tensorial juntamos deri-
vadas de tensores com a conexão afim para formar as ’derivadas covariantes’, nas quais
se transformam como tensores. Na eletrodinâmica, juntamos derivadas de campos e o
potencial vetor para criar as ’derivadas de calibre covariante’

∂
Dα ψ(x) ≡ − ieAα (x) ψ(x) (8.10.3)
∂xα
que se transforma como os próprios campos, pois
∂ψ ∂ψ(x) ∂ϕ(x)
α
→ eieϕ(x) α
+ eieϕ(x) ieψ(x)
∂x ∂x ∂xα
e
∂ϕ
−ieAα (x)ψ(x) → −ie Aα (x) + α ψ(x)eieϕ(x)
∂x
deste modo, somando as duas equações anteriores
∂ψ ieϕ(x) ∂ψ(x) ieϕ(x) ∂ϕ(x) ieϕ(x) ieϕ(x) ∂ϕ

−ieA α (x)ψ(x) → e +e ieψ(x) −ieA α (x)ψ(x)e −ieψ(x)e
∂xα ∂xα ∂xα ∂xα

o segundo termo se cancela com o último termo da equação acima, logo vemos que a
derivada de calibre covariante se transforma como os campos,
Dα ψ(x) → [Dα ψ(x)]eieϕ(x) (8.10.4)
Uma equação que é invariante sob transformações de calibre com ϕ constante (tal inva-
riância é simplesmente exigir a conservação de carga) será também invariante sob uma
transformação geral de calibre (8.10.1) - (8.10.2) desde que seja construída apenas a partir
de campos ψ(x) e suas derivadas covariantes de calibre Dα ψ(x), assim como uma equação
que é invariante sob a transformação de Lorentz será invariante sob transformações gerais
de coordenadas, desde que seja construída a partir de tensores e suas derivadas covarian-
tes. Por exemplo, podemos escrever uma equação invariante por calibre na qual poderia
representar o efeito do eletromagnetismo em um campo escalar carregado ψ(x) como
[η αβ Dα Dβ + m2 ]ψ(x) = 0 (8.10.5)
ou, de forma mais detalhada,

∂
0 = η Dα
αβ 2
− ieAβ (x) + m ψ(x)
∂xβ

αβ ∂ ∂ 2
= η − ieAα (x) − ieAβ (x) + m ψ(x)
∂xα ∂xβ

αβ ∂ ∂ αβ ∂ αβ ∂Aβ 2 2 αβ 2
= η − ieη Aα β − ieη + i e η Aα Aβ + m ψ
∂xα ∂xβ ∂x ∂xα
portanto,
∂Aα

2 α ∂ 2 α 2
− ieA − ie α − e A Aα + m ψ(x) = 0
∂xα ∂x
Uma propriedade importante de tal teoria é que ela admite a construção de uma corrente
conservada invariante por calibre; neste exemplo podemos definir
n o
Jα (x) ≡ −ie ψ † (x)Dα ψ(x) − ψ(x)[Dα ψ(x)]†
(A adaga denota conjugação complexa, ou na teoria quântica o adjunto Hermitiano.) Que

isto é um invariante por calibre é óbvio; pois
ψ † = [ψ(x)]† → [ψ(x)eieϕ ]† = ψ † (x)e−ieϕ
e
[Dα ψ(x)]† → [Dα ψ(x)]† e−ieϕ(x)
logo,

n o
Jα (x) → [ψ † (x)e−ieϕ ][eieϕ Dα ψ(x)] − [ψ(x)eieϕ ][e−ieϕ [Dα ψ(x)]† ] = Jα (x)
para ver que o mesmo é conservado, escrevemos

n
D α J α (x) = −ie D α ψ † (x)Dα ψ(x) − D α ψ(x)[Dα ψ(x)]† + ψ † D α Dα ψ(x)
o
−ψ(x)D α [Dα ψ(x)]†
∂ψ † (x)

∂ψ(x)
⇒ D J (x) = −ie
α α α †
− ieA (x)ψ (x) − ieAα (x)ψ(x)
∂xα ∂xα
†
∂ψ(x) α ∂ψ (x) †
− − ieA (x)ψ(x) − ieAα (x)ψ (x)
∂xα ∂xα
o
+ψ † D α Dα ψ(x) − ψ(x)D α [Dα ψ(x)]†
†
∂ψ(x) ∂ψ † (x)

∂ α ∂ψ (x) ∂ψ(x) α α †
J (x) = −ie − ieA (x)ψ(x) − + ieA (x)ψ (x)
∂xα ∂xα ∂xα ∂xα ∂xα
o
† α α α α †
+ψ (x)(D + ieA (x))Dα ψ(x) − ψ(x)[(D + ieA (x))Dα ψ(x)]
∂ α
J (x) = ψ † (x)D α Dα ψ(x) − ψ(x)[D α Dα ψ(x)]†
∂xα
e utilizando (8.10.5), ou seja D α Dα ψ(x) = −m2 ψ(x), isto resulta
∂ α
J (x) = 0
∂xα
Podemos utilizar esta corrente no lado direito das equações de Maxwell abaixo,
∂ αβ
F = −J β
∂xα
e estas equações também serão invariantes por calibre. Veremos nos próximos capítulos
que as equações de campo para a gravidade são construídas de maneira análoga.
A analogia entre a invariância de calibre da eletrodinâmica e a covariância geral da
relatividade geral podem ser estendidas para uma simetria dinâmica similar, chamada
quiralidade, que governa as interações mesons-pi. Uma explicação adequada deste assunto
daria para outro livro.
8.11 Formas-p e as Derivadas Exteriores

Tensores antissimétricos e suas derivadas antissimétricas possuem certas propriedades
consideravelmente simples e úteis, algumas das quais já encontramos na seção 7.2. Para
lidar com estas propriedades de uma forma unificada, matemáticos desenvolveram um

formalismo geral, conhecido como teoria das formas diferenciais. Infelizmente, a notação
bastante abstrata e compacta associada com este formalismo impediu seriamente nos
últimos anos a comunicação entre matemáticos puros e físicos. Esta seção apresenta
alguns dos resultados fundamentais da teoria das formas diferenciais, todavia na notação
tensorial na qual é familiar para os físicos, ao invés da notação recôndita preferida pelos
matemáticos.
Um tensor covariante de rank p, no qual é antissimétrico sob uma mudança de qualquer
par de índices, será chamado de forma-p. Em n dimensões, o número de componentes da
forma-p é apenas o coeficiente binomial

n n!
≡ (8.11.1)
p p!(n − p)!
Por exemplo, um campo escalar é uma forma-0, um campo vetorial covariante é uma
forma-1, e um tensor covariante antissimétrico com dois índices é uma forma-2.
Combinações lineares de formas-p são formas-p. Entretanto, o produto direto sµν··· tρσ···
de uma forma-p sµν··· e uma forma-q tρσ··· não é uma forma (p + q), pois a mesma não é
completamente antissimétrica. Podemos formar uma forma-(p + q), s ∧ t pela antissime-
trização do produto direto:
(s ∧ t)µ1 ···µp+q ≡ Antissim{sµ1 ···µp tµp+1 ···µp+q } (8.11.2)
onde, em geral, ’Antissim’ denota uma média sob todas as permutações II dos índices,
1 X
Antissim{uµ1 µ2 ···µm } ≡ δII uµII1 µII2 ···µIIm (8.11.3)
m! II
com o fator de sinal δII sendo +1 ou −1 de acordo com II consistir de uma permutação
par ou ímpar dos pares de índices individuais:
(
+1 II par
δII = (8.11.4)
−1 II ímpar
O produto direto antissimétrico (8.11.2) é conhecido como produto exterior. Por exemplo,
o produto exterior de uma forma-0 s e uma forma-1 tµ é simplesmente o produto ordinário
(s ∧ t)µ ≡ stµ
assim como o produto exterior de uma forma-1 sµ e uma forma-1 tν é uma forma-2
1
(s ∧ t)µν ≡ (sµ tν − sν tµ )
2

Facilmente se verifica que o produto exterior é associativo,
(s ∧ t) ∧ u = s ∧ (t ∧ u) (8.11.5)
e bilinear,
(α1 s1 + α2 s2 ) ∧ t = α1 (s1 ∧ t) + α2 (s2 ∧ t)
(8.11.6)
s ∧ (α1 t1 + α2 t2 ) = α1 (s ∧ t1 ) + α2 (s ∧ t2 )

8.12 Efeitos Gravitacionais

Relatividade Geral

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Relatividade Geral

Enviado por

Direitos autorais:

Formatos disponíveis

Sumário

4 Relatividade Especial na Linguagem Tensorial 38

6 Introdução as Formulações Lagrangianas e Hamiltoniana para sistemas

7 O Princípio da Equivalência 127

8 Análise Tensorial 145

O conjunto de números reais, denotados por R, desempenha um papel determinante

1.2 Espaços Topológicos: Definições

Notas para um Curso de Relatividade - Macêdo 4

seja um extremo. Na Eq.(2.1.1), y 0 (x) = dy/dx e o ponto-e-vírgula em f separa a variável

y(α, x) = y(0, x) + α η(x) (2.1.2)

Notas para um Curso de Relatividade - Macêdo 5

2.2 Equação de Euler

O segundo termo na integração pode ser integrado por partes:

O termo de integração desaparece porque η(x1 ) = η(x2 ) = 0. Portanto, a Eq.(2.2.2) se

Notas para um Curso de Relatividade - Macêdo 6

A integral na Eq.(2.2.6) agora parece ser independente de α. Mas as funções y e y 0

onde agora y e y 0 são as funções originais,independente de α. O resultado é conhecido

2.3 A ’Segunda Forma’ da Equação de Euler

o último termo desaparece devido à equação de Euler (Eq.(2.2.7). Portanto,

Podemos utilizá-la chamando-a de ’segunda forma’ da equação de Euler, nos casos em

Notas para um Curso de Relatividade - Macêdo 7

2.4 Funções com Diversas Variáveis Dependentes

f = f {y1 (x), y10 (x), y2 (x), y20 (x), . . . ; x} (2.4.1)

com i = 1, 2, . . . , n. Em analogia com a Eq.(2.1.2), formulamos

yi (α, x) = yi (0, x) + αηi (x) (2.4.3)

O desenvolvimento ocorre de modo análogo [cf. a Eq.(2.2.6)], que resulta em

Como as variações individuais −ηi (x)− são todas independentes, o desaparecimento da

2.5 As equações de Euler Quando Condições Auxiliares São Im-

f = f {yi , yi0 ; x} = f {y, y 0 , z, z 0 ; x} (2.5.1)

A equação correspondente à Eq.(2.2.6) para o caso de duas variáveis é

Notas para um Curso de Relatividade - Macêdo 8

Mas, agora, também existe uma equação de restrição da forma

g{yi ; x} = g{y, z; x} = 0 (2.5.3)

Onde nenhum termo em x aparece desde que ∂x/∂α = 0. Agora,

Portanto, ao determinar ∂y/∂α e ∂z/∂α a partir da Eq.(2.5.5) e inserir no termo entre

Ao fazer a fatoração η1 (x) fora dos colchetes e formular a Eq.(2.5.6) como

O lado esquerdo desta equação envolve somente derivadas de f e g em relação a y e y 0 , e o

Notas para um Curso de Relatividade - Macêdo 9

Se i = 1, 2, . . . , m, e j = 1, 2, . . . , n, a Eq.(2.5.12) representa m equações em m + n

com i = 1, 2, . . . , m e j = 1, 2, . . . , n. Em problemas de mecânica, as equações de restrição

possui um extremo, e a curva y(x) satisfaz condições de contorno y(a) = A e y(b) = B

Notas para um Curso de Relatividade - Macêdo 10

assim como o segundo funcional

A curva y(x) então satisfará a equação diferencial

sujeita às restrições y(a) = A,y(b) = B e K[y] = l.

Notas para um Curso de Relatividade - Macêdo 11

Usando o símbolo de variação δ dentro da integral (porque, por hipótese, os limites de

Como a variação δy é arbitrária, a condição do extremo δS = 0 requer que a integração

Figura 2.6.1: O caminho variado é um deslocamento virtual δy do caminho real consistente

Notas para um Curso de Relatividade - Macêdo 12

3.1 Mecânica de uma Partícula

Notas para um Curso de Relatividade - Macêdo 13

onde a é o vetor aceleração da partícula definido por

A equação do movimento é portanto uma equação diferencial de segunda ordem, presu-

A equação análoga a (3.1.3) para N é obtida formando o produto vetorial de r com a

Teorema 3.1.2. Teorema de Conservação para o Momento Angular de uma partícula:

Notas para um Curso de Relatividade - Macêdo 15

Através de um teorema bastante conhecido da analise vetorial, uma condição necessária

F = −∇V (r), (3.1.16)

onde V é chamado de potencial, ou energia potencial. A existência de V pode ser inferida

Combinando a Eq.(3.1.18) com a Eq.(3.1.14), obtemos como resultado

na qual afirma em símbolos que