Relatividade PDF

Relatividade Especial, Geral e
Geometria Lorentziana
1
Rodney Josue Biezuner
Departamento de Matematica
Instituto de Ciencias Exatas (ICEx)
Universidade Federal de Minas Gerais (UFMG)
2 de setembro de 2016
1
E-mail: biezunerufmg@gmail.com; homepage: http://www.mat.ufmg.br/~rodney.
Sumario
1 Teoria da Relatividade Especial 5

1.1 Breve Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Deducao da existencia de ondas eletromagneticas atraves das equacoes de Maxwell . . . . . . 6
1.2.1 O Eter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Referenciais Inerciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4 Princpio da Relatividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Invariancia do Intervalo Espacotemporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Relatividade da Simultaneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Relatividade de Intervalos Espaciais e de Intervalos Temporais . . . . . . . . . . . . . . . . . 14
1.7.1 Contracao do Espaco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7.2 Dilatacao do Tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7.3 Invariancia das Dimensoes Transversais . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 O Espacotempo de Minkowski 18
2.1 Produto Interno e Formas Quadraticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Operadores Ortogonais e Isometrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Metrica de Lorentz e Espacotempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Propriedades do Espacotempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Transformacao de Lorentz do tipo Boost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.1 Medida Quantitativa da Dilatacao do Tempo . . . . . . . . . . . . . . . . . . . . . . . 34
2.4.2 Matriz do Boost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.3 Medida Quantitativa da Contracao do Espaco . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.4 Resumo da Contracao do Espaco e Dilatacao do Tempo . . . . . . . . . . . . . . . . . 37
2.4.5 Lei de Adicao de Velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.6 Rotacoes Hiperbolicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3 Paradoxos 44
3.1 Diagramas de Espacotempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Impossibilidade de se viajar acima da velocidade da luz . . . . . . . . . . . . . . . . . . . . . 46
3.3 Geodesicas no Espaco de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4 Paradoxo dos Gemeos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4 Momento-Energia 54
4.1 4-Vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2 Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5 Aceleracao no Espacotempo de Minkowski 58
6 O Tensor do Campo Eletromagnetico 59
1
Rodney Josue Biezuner 2
7 O Princpio de Equivalencia Geodesicas no Espacotempo Curvo 60

7.1 O Pensamento Mais Feliz da Vida de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
7.1.1 Inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
8 Topologia Diferencial 62
8.1 Variedades Diferenciaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
8.2 Aplicacoes Diferenciaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
8.2.1 Particoes da Unidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.3 Vetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.3.1 Vetores Tangentes a Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.3.2 Vetores Tangentes como Derivacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8.3.3 Diferencial de uma Aplicacao Diferenciavel . . . . . . . . . . . . . . . . . . . . . . . . 69
8.4 Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.4.1 Diferencial em Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.5 Fibrado Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.6 Fibrados Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.7 Campos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.8 Colchete de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.9 Derivada de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.10 Campos Vetoriais que Comutam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.11 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
9 Tensores 86
9.1 Vetores Contravariantes e Covariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
9.1.1 Significado Real do Gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.2 Convencao da Soma de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
9.3 Vetores e Covetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
9.3.1 Mudanca de Coordenadas em Espacos Vetoriais . . . . . . . . . . . . . . . . . . . . . . 89
9.3.2 Covetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
9.3.3 O Espaco Bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
9.4 Vetores e Covetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.4.1 Mudanca de Coordenadas no Espaco Tangente Tp M . . . . . . . . . . . . . . . . . . . 93
9.4.2 Covetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
9.5 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.5.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.5.2 Produto Tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9.5.3 Mudanca de Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.5.4 Traco de Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
9.6 Fibrados Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
9.7 Campos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
9.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
10 Variedades Metricas 103

10.1 Definicao e Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10.2 Comprimentos e Volumes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
10.2.1 Comprimentos de Curvas Parametrizadas . . . . . . . . . . . . . . . . . . . . . . . . . 111
10.2.2 Volumes em Variedades Riemannianas Orientaveis . . . . . . . . . . . . . . . . . . . . 112
10.3 Grupos de Lie e Algebras de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
10.4 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
11 Conexoes 118
11.1 Conexoes e Derivada Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
11.2 Derivada Covariante ao longo de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
11.3 Transporte Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
11.4 Conexao Compatvel com a Metrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
11.5 O Tensor Torsao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.5.1 Conexao Simetrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.6 Conexoes Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
11.6.1 Smbolos de Christoffel da Conexao Metrica . . . . . . . . . . . . . . . . . . . . . . . . 129
11.6.2 Interpretacao Geometrica da Derivada Covariante . . . . . . . . . . . . . . . . . . . . 131
12 Geodesicas 133
12.1 Definicao A Equacao Geodesica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
12.2 Exemplos de Geodesicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
12.3 Fluxo Geodesico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
12.4 A Aplicacao Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
12.5 Lema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
12.6 Geodesicas em Variedades Riemannianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
12.6.1 Geodesicas em Variedades Riemannianas minimizam distancias localmente . . . . . . 147
12.6.2 Vizinhancas Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.7 Geodesicas em Variedades de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
12.8 Funcao Distancia em Variedades Riemannianas . . . . . . . . . . . . . . . . . . . . . . . . . . 155
12.9 Variedades Riemannianas Completas e Teorema de Hopf-Rinow para Variedades Riemannianas156
12.10Apendice: Geodesicas atraves do Metodo Variacional . . . . . . . . . . . . . . . . . . . . . . . 159
12.11Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
13 Curvatura 163
13.1 Mais sobre Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
13.2 O Tensor Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
13.2.1 O Endomorfismo Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
13.2.2 O Significado da Curvatura Nula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
13.2.3 Operacao de Subir ou Descer um Indice . . . . . . . . . . . . . . . . . . . . . . . . . . 169
13.2.4 O Tensor Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
13.3 Curvatura de Ricci e Curvatura Escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
13.4 Curvatura Seccional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
13.5 Variedades Riemannianas de Curvatura Seccional Constante . . . . . . . . . . . . . . . . . . . 188
13.6 Apendice: Motivacao para a definicao do tensor curvatura . . . . . . . . . . . . . . . . . . . . 190
13.6.1 Efeitos de Mare em Mecanica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . 190
13.6.2 Efeitos de Mare em Relatividade Geral: Curvatura como uma medida da aceleracao
relativa de trajetorias geodesicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
13.6.3 Curvatura como uma medida do transporte paralelo em trajetorias fechadas . . . . . . 194
13.7 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
14 Derivada Covariante de Campos Tensoriais 198

14.1 Conexao nos Fibrados Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
14.2 Derivada Covariante Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
14.2.1 Divergencia de Campos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
15 O Tensor Momento-Energia 215

15.1 4-Vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
15.2 Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
15.3 Fluxos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
15.3.1 Definicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
15.4 Tensor Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
15.4.1 Tensor Momento-Energia da Poeira . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
15.4.2 Simetria do Tensor Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
15.4.3 Conservacao do Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
15.4.4 Tensor Momento-Energia de um Fluido Perfeito . . . . . . . . . . . . . . . . . . . . . 222
15.5 Apendice: Divergente e Fluxo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
15.5.1 Significado Geometrico do Divergente Espacial . . . . . . . . . . . . . . . . . . . . . . 224
15.5.2 Significado Fsico do Divergente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
16 Equacao de Einstein 229

16.1 Equacao de Newton para o Potencial Gravitacional . . . . . . . . . . . . . . . . . . . . . . . . 229
16.2 Deducao da Equacao de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
16.2.1 O Tensor de Einstein tem Divergencia Nula . . . . . . . . . . . . . . . . . . . . . . . . 233
16.2.2 O Limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
16.3 Postulado Geodesico como Consequencia da Equacao de Einstein . . . . . . . . . . . . . . . . 236
16.4 A Constante Cosmologica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
17 A Solucao de Schwarzschild 239

17.1 Metrica Plana em Coordenadas Esfericas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
17.2 Produtos Dobrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
17.2.1 Espacotempos Estaticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
17.3 Metrica de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
17.4 Deducao da Solucao de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
17.5 Calculo da Deflexao da Luz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
17.6 Precessao do Perihelio de Mercurio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
17.7 Solucao de Schwarzschild para Buracos Negros . . . . . . . . . . . . . . . . . . . . . . . . . . 250
17.8 Warped Products . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
18 Campos de Jacobi 251

18.1 A Equacao de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
18.2 Campos de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
18.3 Campos de Jacobi em Variedades de Curvatura Seccional Constante . . . . . . . . . . . . . . 258
18.4 Velocidade de Afastamento das Geodesicas e Curvatura Seccional . . . . . . . . . . . . . . . . 260
18.5 Pontos Conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
19 Causalidade 266
19.1 Orientacao Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
19.2 Teoria de Causalidade para Espacotempos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
19.2.1 Cronologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
19.3 Apendice: O Recobrimento Duplo Temporalmente Orientavel . . . . . . . . . . . . . . . . . . 268
Captulo 1
Teoria da Relatividade Especial
Principais personagens e porque estao listados aqui:
Aristoteles (384 BCE322 BCE): primeira teoria sistematica do movimento.
Galileo Galilei (15641642): princpio da relatividade galileana e corpos caem com a mesma aceleracao
no vacuo.
Isaac Newton (16421726): primeira e segunda leis da dinamica, espaco e tempo absolutos, teoria da
gravitacao universal (com o conceito de acao a distancia associado, modelado nos fenomenos eletrico
e magneticos).
Michael Faraday (17911867): lei da inducao de Faraday (inspiracao direta para a teoria da relatividade
especial) e a ideia de campos (eliminando a necessidade da ideia de acao a distancia).
James Clerk Maxwell (18311879): equacoes de Maxwell para o eletromagnetismo; luz e uma onda
eletromagnetica.
Ernst Mach (18381916): princpio da inercia de Mach (inspiracao indireta para a teoria da relatividade
geral; depois refutado).
Albert Einstein (18791955): teoria da relatividade especial e teoria da relatividade geral.
Hermann Minkowski (18641909): conceito do espacotempo.
1.1 Breve Introducao

Aristoteles dividiu o movimento em dois tipos, forcado e natural. O melhor exemplo de um movimento
natural e o de um corpo que cai. De acordo com Aristoteles, este e um movimento natural, nao sendo
causado por nada. Embora esta divisao pareca bastante simplista, veremos que algumas das ideias de
Aristoteles em um certo sentido tiveram um renascimento na Teoria da Relatividade Geral (veja [Petkov],
p. 16 e pp. 2122).
O modelo para o Universo que Aristoteles adotou foi o geocentrico (a Terra no centro do Universo e tudo o
mais girando em torno dela). Galileo adotou o modelo heliocentrico de Copernico e para justifica-lo foi forcado
a abandonar a fsica de Aristoteles. Ele realizou uma serie de experimentos, reais e imaginarios (thought
experiments, uma expressao que ficou consagrada de Einstein em diante) para chegar a duas conclusoes
fundamentais: e impossvel determinar quando se esta em repouso ou em movimento e a aceleracao com que
um corpo cai no vacuo e constante, independentemente de seu peso. Para justificar o primeiro princpio,
conhecido como relatividade galileana, ele usou a experiencia de uma pessoa dentro da cabine fechada de um
5
navio: quer o navio encontre-se em movimento ou repouso, todos os objetos dentro do navio se comportarao
da mesma forma. Assim, se a agua cai de um balde, ela cai na vertical, mesmo quando o navio se move,
e se houver borboletas voando, elas nao vao se acumular na traseira da cabine (veja [Topper], Cap. 1, pp.
37 e [Petkov], Cap 2, pp. 2328). Quanto ao segundo princpio, e um debate historico se Galileo realmente
realizou um experimento de cima da Torre de Pisa, ja que ele nao ha nenhum documento dele afirmando
isso. O que se conhece e o seu celebre experimento imaginario, em que ele imaginou tres corpos com o mesmo
peso caindo portanto com a mesma aceleracao no vacuo; se dois deles sao colados por uma cola sem peso,
isso nao deve afetar a sua aceleracao, mas agora temos dois corpos, um com o dobro do peso do primeiro.
(Veja [Topper], Cap. 11, pp 8588.)
Newton aceitou os dois princpios de Galileo. O primeiro ele imortalizou na sua primeira lei do movimento,
definindo mais precisamente o movimento no princpio de relatividade de Galileo como sendo movimento
retilneo uniforme, enquanto que o segundo e consequencia da sua segunda lei do movimento, onde ele
introduziu o conceito de massa inercial (uma medida de resistencia ao movimento) e da Lei da Gravitacao
Universal, onde ele introduziu o conceito de massa gravitacional (uma medida da intensidade da forca
gravitacional); o fato da aceleracao dos corpos que caem ser constante era consequencia da equivalencia das
duas. Na Lei da Gravitacao Universal, Newton introduziu tambem o conceito de acao a distancia ou forca
oculta, algo que foi aceito com muita dificuldade na epoca (apesar de Newton invocar os fenomenos eletrico
e magnetico como exemplos de que isso ocorre na realidade). O conceito de acao a distancia so foi aceito
porque sua teoria funcionava. Eventualmente, quando Faraday introduziu os conceitos de campos eletrico
e magnetico, o conceito de campo gravitacional seguiu-se naturalmente. Tambem a questao de porque os
corpos se atraem, bastante debatida na epoca depois da sua introducao por Newton, foi de forma semelhante
ignorada por ele, como escreveu no final das ultimas edicoes do seu Principia Mathematica: E e suficiente
que a gravidade realmente existe e age de acordo com as leis que estabelecemos e e suficiente para explicar
todos os movimentos dos corpos celestes e do nosso mar [isto e, as mares].; ou seja, nao pergunte mais, ou
indague questoes fsicas, mais profundas, pois a matematica funciona e isto e suficiente (veja [Topper], Cap.
4, pp. 2528). Foi o primeiro exemplo em Fsica da atitude cale a boca e faca as contas (veja [Petkov],
Cap. 2, p. 2). A atitude de Newton foi aceita ate que Einstein formulou a Teoria da Relatividade Geral.
1.2 Deducao da existencia de ondas eletromagneticas atraves das

equacoes de Maxwell
Lembramos as equacoes de Maxwell no vacuo (1873):

div E = ,
0
B
rot E = ,
t
div B = 0,

E
rot B = 0 J + 0 ,
t
que tambem podem ser escritas na notacao

E= ,
0
B
E= ,
t
B = 0,

E
B = 0 J + 0 ,
t
onde E e o campo eletrico, B o campo magnetico, a densidade (volumetrica) de carga eletrica, 0 a

constante de permissividade eletrica do vacuo, 0 a constante de permeabilidade magnetica do vacuo e J a
densidade de corrente eletrica (veja [Fleisch1], para uma introducao curta mas muito boa sobre as equacoes
de Maxwell).
1.1 Lema. Seja V um campo vetorial. Entao
rot (rot V) = grad (div V) div (grad V)

= (div V) V.
Em outra notacao,
( V) = ( V) (V)
= ( V) 2 V.
Prova: Escrevendo V = (V1 , V2 , V3 ), temos
i j k

V3 V2 V1 V3 V2 V1
V = = , , ,

x y z y z z x x y
V1 V2 V3
donde

i j k

( V) =

V x y z
3 V2 V1 V3 V2 V1

y z z x x y

2
V2 2 V1 2 V1 2 V3
= 2
2
+ ,
yx y z zx
2 V2 2 V1 2 V3 2 V2
2
+ + ,
x xy zy z 2
2 V1 2 V3 2 V3 2 V2

+
xz x2 y 2 yz
2 2 2
V1 V2 V3 2 V1 2 V1 2 V1
= 2
+ + 2
2
,
x yx zx x y z 2
2 V1 2 V2 2 V3 2 V2 2 V2 2 V2
+ 2
+ 2
2
,
xy y zy x y z 2
2 V1 2 V2 2 V3 2 V3 2 V3 2 V3

+ +
xz yz z 2 x2 y 2 z 2

V1 V2 V3
= + + V1 ,
x x y z

V1 V2 V3
+ + V2 ,
y x y z

V1 V2 V3
+ + V3
z x y z
= (div V) V.

1.2 Teorema (Existencia de Ondas Eletromagneticas). Sejam E e B os campos eletrico e magnetico,

respectivamente. Entao, no vacuo, em um ambiente livre de cargas eletricas, os campos eletrico e magnetico
satisfazem a equacao da onda homogenea:
2E 1
= E,
t2 0 0
2B 1
= B.
t2 0 0
Prova. Do lema anterior temos que
rot (rot E) = (div E) E,

rot (rot B) = (div B) B.
No vacuo, em um ambiente livre de cargas eletricas, a primeira e terceira equacoes de Maxwell (leis de Gauss
para o campo eletrico e para o campo magnetico, respectivamente) se tornam
div E = 0,
div B = 0,
logo
rot (rot E) = E, (1.1)

rot (rot B) = B.
Por outro lado, no vacuo, em um ambiente livre de cargas eletricas, a segunda e quarta equacoes de Maxwell
(lei de inducao de Faraday e lei de Ampere com a correcao de Maxwell)
B
rot E = ,
t
E
rot B = 0 0 .
t
Portanto,
2E
rot (rot E) = (rot B) = 0 0 2 , (1.2)
t t
2B
rot (rot B) = 0 0 (rot E) = 0 0 2 .
t t
Reunindo (1.1) e (1.2), obtemos o resultado desejado.
As solucoes das equacoes da onda do Teorema 1.2 sao chamadas ondas eletromagneticas. Pode-se mostrar,
usando as equacoes de Maxwell, que as ondas eletromagneticas sao ondas transversais, ou seja, as vibracoes
dos campos eletrico e magnetico sao na direcao perpendicular a direcao de propagacao da onda (para uma
deducao simples e curta veja, por exemplo, [Woodhouse], Secoes 3.3 e 3.4, pp. 4244; as ondas de som sao
um exemplo de ondas longitudinais, em que as vibracoes sao na mesma direcao de propagacao da onda).
1.3 Corolario. A velocidade de uma onda eletromagnetica no vacuo e
1
c= = 2, 99792458 108 m/s.
0 0
Prova. Pois
2E
= c2 E,
t2
2B
= c2 B.
t2

Como este valor e igual ao da velocidade da luz, Maxwell concluiu que a luz e uma onda eletromagnetica.
Varios experimentos posteriores corroboraram esta ideia. As equacoes de Maxwell foram as primeiras leis
da Fsica a conterem uma velocidade como uma constante fundamental.
1.2.1 O Eter
Na teoria ondulatoria da luz de Fresnel (1821), a luz era uma onda mecanica que se propaga em um meio
chamado o eter luminfero. Ou seja, as vibracoes da luz correspondiam a vibracoes das moleculas eterias.
A velocidade de propagacao c da luz era uma propriedade do eter. Para conter ondas transversais, o eter
tinha que ser um meio material elastico, embora fosse estranho que nao existissem ondas longitudinais neste
meio. Alem disso, para produzir ondas com esta enorme velocidade de propagacao (em um segundo, a luz
da 7 voltas ao redor da Terra), o eter tinha que ser extremamente rgido. O eter tinha que preencher todo
o Universo, pois a luz se propaga em todo lugar. Era logico consider o eter como estando em repouso em
relacao ao espaco absoluto de Newton, funcionando como uma especie de materializacao deste.
No entanto, uma tal substancia onipresente deveria produzir outros efeitos mecanicos, alem dos fenomenos
luminosos. Como podem os planetas se moverem atraves do eter sem perder energia? O eter penetraria
atraves dos corpos moveis sem perturba-los ou seria arrastado por eles? O eter parecia ser uma substancia
intangvel sem qualquer outro efeito alem de ser o lugar onde os fenomenos luminososo ocorriam ([Springer],
Secao 1.3.3). Todo o conceito do eter soa bastante estranho para nos, ate que lembramos que hoje em dia
a teoria da materia escura, formada de misteriosas partculas que interagem apenas gravitacionalmente, e
bastante aceita.
Da mesma forma Maxwell viu suas ondas eletromagneticas como um fenomeno mecanico em um meio
propagador. Apos reconhecer que a luz era uma onda eletromagnetica, ele identificou este meio propagador
com o eter de Fresnel. Portanto ele acreditava que suas equacoes eram validas em um referencial fixado neste
meio.
De maneira semelhante, em um experimento imaginario (thought experiment) celebre, que Einstein afir-
mou em sua autobiografia ter tido na idade de 16 anos, ele imaginou o que aconteceria se viajassemos em um
raio de luz. Seguindo [Topper] (uma excelente historia cientfica sobre a descoberta de Einstein da Teoria
da Relatividade) vamos descrever o experimento imaginario de Einstein de uma forma diferente: imagine-se
estando na cabine do piloto de uma nave espacial, tendo atras da poltrona uma fonte de luz. A medida que
a nave fosse acelerando, haveria uma hora em que ela ultrapassaria a velocidade da luz e entao a cabine
repentinamente ficaria as escuras. Desta forma seria possivel determinar se a nave estava em repouso ou nao.
Mas isso significaria abandonar o princpio de relatividade de Galileu, tambem fundamental na Mecanica
Newtoniana, que afirmava que nao se podia distinguir quando se estava em repouso e quando se estava em
movimento retilneo uniforme. Para nao violar este princpio, a luz teria que se mover com uma velocidade
igual a soma da velocidade da nave e da velocidade da luz.
Varios experimentos no final do seculo XIX falharam em descobrir qualquer variacao na velocidade da
luz devido ao movimento da fonte, notavelmente o experimento de Michelson-Morley (1881; veja [Springer],
Secao 1.3, para uma descricao breve deste e de outros experimentos e [Ferraro], Captulo 2, para uma
discussao bem mais detalhada pelo mesmo autor).
1.3 Referenciais Inerciais

1.4 Definicao. Um referencial e um sistema de coordenadas no espaco e no tempo.
Desta forma, associamos R4 ao espaco e ao tempo. Em geral, denotaremos as coordenadas de um referencial

por (t, x, y, z). Outras notacoes para as coordenadas serao introduzidas mais tarde.
Observe que com esta associacao, por enquanto o espaco e o tempo formam juntos apenas um espaco
vetorial de dimensao 4, mas nao ha uma unidade entre eles. O espaco e medido de uma forma diferente da
forma em que o tempo e medido, as unidades de medida de espaco (metros) sao diferentes das unidades de
medida de tempo (segundos). Em outras palavras este espaco vetorial ainda nao tem uma metrica associada.
No que se segue, o termo partcula-teste se refere a uma partcula com massa suficientemente pequena
para nao ter influencias gravitacionais perceptveis dentro de uma precisao previamente fixada. Dizemos que
ela e livre se ela nao esta sujeita a nenhuma forca.
1.5 Definicao. Dizemos que um referencial para uma certa regiao de espaco e de tempo e um referencial
inercial se naquela regiao de espaco e tempo, de acordo com uma precisao previamente especificada, toda
partcula-teste livre inicialmente em repouso com relacao aquele referencial permanece em repouso, e toda
partcula-teste inicialmente em movimento com relacao aquele referencial continua seu movimento ao longo
de uma reta (isto e, sem mudanca de velocidade em modulo ou direcao).
Referenciais inerciais sao eminentemente locais. Um elevador suficientemente pequeno em queda livre sob a
acao de um campo gravitacional uniforme (por exemplo, o campo gravitacional de um planeta ou estrela, a
uma distancia razoavel da superfcie) durante um intervalo de tempo suficientemente pequeno e um referencial
inercial, dentro de uma precisao fixada, porque todas as partculas-teste caem com a mesma aceleracao.
A medida que o tempo passa, efeitos de mare passam a predominar e partculas-teste inicialmente em
repouso na direcao do campo gravitacional comecam a se distanciar (partculas-teste mais proximas da fonte
do campo gravitacional sofrem aceleracao maior), enquanto que partculas-teste inicialmente em repouso
situadas em uma direcao perpendicular a direcao do campo gravitacional comecam a se aproximar (ja que
cada partcula cai seguindo a sua linha do campo gravitacional). Outro referencial inercial e uma regiao
do espaco suficientemente longe da fonte de um campo gravitacional, durante algum intervalo de tempo
razoavel. Para uma discussao mais detalhada sobre referenciais inerciais, veja as secoes 2.1-2.5 do livro
Spacetime Physics [Taylor-Wheeler], pp. 2536.
1.6 Definicao. Um ponto no espaco e no tempo R4 e chamado um evento.

Uma observacao feita por um observador em um referencial inercial e simplesmente o ato de atribuir
a qualquer evento as suas coordenadas (t, x, y, z), ou seja, as coordenadas espaciais x, y, z da localizacao
espacial da sua ocorrencia e o instante de tempo t lido no relogio situado neste ponto em que o evento
ocorre.
1.4 Princpio da Relatividade

1.7 Axioma (Princpio da Relatividade de Einstein). Todas as leis da Fsica sao as mesmas em
qualquer referencial inercial.
O Princpio da Relatividade diz que uma vez que as leis da Fsica foram estabelecidas em um referencial
inercial, elas podem ser aplicadas sem modificacao em qualquer outro referencial inercial. A forma ma-
tematica das leis da Fsica e os valores numericos das constantes fsicas basicas que estas leis contem sao as
mesmas em qualquer referencial inercial. No que se refere as leis da Fsica, todos os referenciais inerciais sao
equivalentes. Consequentemente,
1.8 Corolario. Nenhum teste das leis da Fsica produz uma maneira de distinguir um referencial inercial
de outro referencial inercial.
1.9 Corolario. As equacoes de Maxwell no vacuo sao as mesmas em qualquer referencial inercial.
Da o ttulo do artigo original em que Einstein (1905) propos a Teoria da Relatividade Especial: On the
Electrodynamics of Moving Bodies.
1.10 Corolario. A velocidade da luz no vacuo e a mesma em qualquer referencial inercial.

Assim, quando se mede a velocidade da luz em um referencial inercial sempre se obtem o mesmo valor c, dado
no Corolario 1.3. No artigo original de Einstein, este resultado e enunciado como um segundo postulado.
O nome Teoria da Relatividade a rigor nao e apropriado. Na verdade o Princpio da Relatividade diz que
as leis da Fsica sao absolutas, no sentido de que nao dependem do referencial inercial em que sao testadas
(por exemplo, a velocidade da luz tem o mesmo valor absoluto, que nao e relativo ao referencial inercial em
que e medido). Um melhor nome para a Teoria da Relatividade seria a Teoria da Invariancia. No entanto,
uma consequencia do Princpio de Relatividade, como veremos, e a relatividade do espaco e do tempo, isto e,
medidas do deslocamento espacial (separacao entre dois pontos no espaco) e do intervalo temporal (separacao
entre dois momentos no tempo) dependem do referencial inercial em que elas sao realizadas. Dada que esta
consequencia nao intuitiva foi a maior surpresa da Teoria da Relatividade quando ela foi formulada e a maior
dificuldade em aceita-la, ela recebeu o nome deste fenomeno.
No que se segue, escolhemos unidades de espaco e tempo de tal forma que c = 1.
1.5 Invariancia do Intervalo Espacotemporal

1.11 Definicao. O intervalo entre dois eventos quaisquer do espacotempo separados por incrementos
t, x, y, z e definido por
2 2 2 2
s2 = (x) + (y) + (z) (t)

Observe que podemos ter
s2 > 0
ou
s2 < 0
ou
s2 = 0.
1.12 Lema. s2 = 0 se e somente se os dois eventos ocorrem um apos o outro na velocidade da luz.
Consequentemente, se O e O sao dois referenciais inerciais, entao
s2 = 0
se e somente se
s2 = 0.
Prova. Pois, pelo Princpio de Relatividade, a velocidade da luz e constante igual a 1 em qualquer referencial
inercial.
Eventos que ocorrem na velocidade da luz sao, por exemplo, os eventos emissao de um foton e absorcao do
mesmo.
No que se segue, usaremos a seguinte notacao:
t = x0 ,
x = x1 ,
y = x2 ,
z = x3 .
1.13 Teorema (Invariancia do Intervalo). Sejam O e O dois referenciais inerciais. Entao
s2 = s2 .
Prova. [Shutz]Observe que a relacao entre as coordenadas de O e O e linear, porque caso contrario,
existiria um objeto em movimento retilneo uniforme em um referencial (trajetoria reta) que nao estaria em
movimento retilneo uniforme no outro referencial (sua trajetoria nao seria uma reta), contrariando o princpio
de relatividade (ate mesmo galileano). Por simplicidade, assuma tambem que suas origens coincidem, isto
e, os eventos t = x = y = z = 0 e t = x = y = z = 0 sao os mesmos.
Da hipotese de linearidade, segue que t, x, y, z sao funcoes lineares de t, x, y, z, logo s2 e
uma funcao quadratica de t, x, y, z, digamos
3
X
s2 = Mij xi xj . (1.3)
i,j=0
Observe que em princpio podemos ter Mij = Mij (v), onde v e a velocidade relativa entre os dois referenciais
(independe dos eventos). Podemos assumir, sem perda de generalidade, que Mij = Mji (trocando, se
necessario, Mij por (Mij + Mji ) /2).
Para dois eventos em que
s2 = s2 = 0
temos !
3
X 3
X
2 i
Mij xi xj = 0.

M00 (t) + 2 M0i x t + (1.4)
i=1 i,j=1
Como s2 = s2 = 0 continua valendo se substituirmos todos os xi por xi , i = 1, 2, 3, obtemos

3
! 3
2
X X
i
Mij xi xj = 0.

M00 (t) 2 M0i x t +
i=1 i,j=1
Subtraindo uma equacao da outra, segue que

3
!
X
i
M0i x t = 0
i=1
Escolhendo
xi = t = 1,
xj = xk = 0, se j, k 6= i,
conclumos que
M0i = 0 para i = 1, 2, 3 (1.5)
e, portanto,
3
X
2
Mij xi xj = 0.

M00 (t) +
i,j=1
Da, com a mesma escolha acima, segue que
Mii = M00 para i = 1, 2, 3.
Se i 6= j, escolhendo agora

xi = 1, xj = 1, t = 2,
k
x = 0, se k 6= i, j,
e

xi = 1, xj = 1, t = 2,
k
x = 0, se k 6= i, j,
obtemos, respectivamente,
2M00 + 2M00 + 2Mij = 0,
2M00 + 2M00 2Mij = 0;
subtraindo estas duas equacoes, conclumos que
Mij = 0
se i 6= j.
Em outras palavras,
Mij = M00 ij para i, j = 1, 2, 3, (1.6)
e h i
2 2 2 2
s2 = M00 (t) (x) (y) (z) = M00 (v) s2 . (1.7)
Denote
(v) = M00 (v) . (1.8)
Afirmamos que (v) 1.
Em primeiro lugar, observamos que e radial, de modo que
(v) = (|v|) = (v) . (1.9)
De fato, escolhendo dois eventos que sao simultaneos no referencial O, isto e, t = 0 (por exemplo, o
comprimento de uma barra) conclumos que
distancia entre dois eventos simultaneos em O

= (v) (distancia entre dois eventos simultaneos em O) .

Como esta distancia nao pode depender da direcao de v (comprimentos nao dependem da direcao da velo-
cidade, ja que comprimentos perpendiculares a direcao da velocidade nao podem sofrer variacoes, conforme
argumentaremos na Secao 1.7.3; veja tambem em maiores detalhes [Shutz], pp. 1011), conclumos que
(v) = (|v|).
Agora considere tres referenciais O, O e O, sendo que O move-se com velocidade v com relacao a O,
enquanto que O move-se com velocidade v com relacao a O, ou seja, os referenciais O e O sao identicos.
Segue que
s2 = (v) s2 ,
2
s = (v) s2 ,
donde
2 2
s = [ (v)] s2 .
Mas os referenciais O e O sao identicos, logo obtemos de fato que
2
s2 = [ (v)] s2 ,
donde
1.
Como o quadrado de comprimentos (isto e, t = 0) deve ser positivo em qualquer referencial inercial, segue
que 1.
1.6 Relatividade da Simultaneidade

A maior parte dos paradoxos em Relatividade se originam de mal-entendidos com relacao ao conceito de
simultaneidade. A simultaneidade de dois eventos depende do referencial inercial em que eles sao medidos
(observados). Eventos que sao simultaneos em um referencial inercial, nao serao simultaneos em outro
referencial inercial que se desloca em relacao ao primeiro com velocidade v nao perpendicular ao vetor que
conecta as duas posicoes espaciais dos eventos, como veremos.
A relatividade da simultaneidade e ilustrada pelo paradoxo do trem de Einstein. Relampagos atingem
ambas as extremidades de um trem que se move, deixando marcas enegrecidas no trem e no trilho. O brilho
do impacto do relampago e emitido em todas as direcoes.
Um observador que se situa no chao fora do trem, no meio entre as duas marcas, conclui que os impactos
foram simultaneos, ja que os brilhos o atingem ao mesmo tempo.
Um observador que se situa no meio do trem conclui que os impactos nao foram simultaneos, ja que a
velocidade da luz e a mesma em todos os referenciais e o brilho do impacto na frente do trem o atinge antes
do brilho do impacto na parte traseira do trem.
1.7 Relatividade de Intervalos Espaciais e de Intervalos Temporais

1.7.1 Contracao do Espaco
No paradoxo do trem, o observador no chao O mede o comprimento do trem como sendo o valor da medida
entre as duas marcas enegrecidas no trilho, ja que elas ocorreram simultaneamente. Ja o observador dentro
do trem O0 nao concorda com esta medicao: dado que para ele a marca frontal foi feita antes da marca
traseira, e o trem se moveu enquanto isso, para ele a medicao feita pelo observador O deu uma medida
menor para o trem.
E facil entender isso usando a invariancia do intervalo. Os dois eventos sao: evento A, impacto do
relampago com a parte dianteira do trem, e evento B, impacto do relampago com a parte traseira do trem.
Digamos que estes dois eventos tem coordenadas (xA , tA ) e (xB , tB ) no referencial inercial do observador no
chao O, e coordenadas (x0A , t0A ) e (x0B , t0B ) no referencial inercial do observador dentro do trem O0 . Sejam
x = xB xA ,
t = tB tA ,
e
0
x = x0B x0A ,
0
t = t0B t0A ,
as separacoes espaciais e temporais destes dois eventos em cada um dos referenciais inerciais. Pela invariancia
do intervalo espacotemporal,
2 2 2 2
(x0 ) (t0 ) = (x) (t) .
Mas
t = 0,
ja que os eventos sao simultaneos no referencial inercial O, consequentemente
2 2 2
(x0 ) (t0 ) = (x)
e
x0 > x. (1.10)
Assim, o comprimento de uma barra medido em um referencial em que ela esta em repouso e sempre maior
que o comprimento dela medido em um referencial em que ela se move. Este efeito e a chamada contracao
de Lorenz. O comprimento da barra medido em um referencial em que ela esta em repouso e chamado o seu
comprimento proprio. Portanto, o comprimento proprio e sempre maior que o comprimento medido em
um referencial em que a barra esta se movendo. Na Secao 2.4.3 obteremos uma expressao que nos permitira
calcular exatamente o quanto o comprimento e diminudo no referencial que se move; o fator de contracao
dependera exclusivamente da velocidade deste.
1.7.2 Dilatacao do Tempo

Imagine uma nave espacial viajando em velocidade uniforme ao sistema estelar de Canopus, situado 99
anos-luz de distancia da Terra. Suponha que em relacao ao referencial inercial Terra a nave espacial viaja a
velocidade de 99/101 vezes a velocidade da luz, ou seja, 99 anos-luz de distancia em 101 anos de tempo. Em
outras palavras, no referencial Terra, a nave espacial leva 101 anos para chegar ate Canopus. As coordenadas
dos eventos A, sada da nave espacial da Terra, e B, chegada da nave a Canopus (ignorando o tempo gasto
para acelerar a nave ate a velocidade (99/101) c) no referencial inercial Terra sao
(xA , tA ) = (0, 0) ,
(xB , tB ) = (99, 101) .
As coordenadas destes eventos no referencial inercial Nave sao
(x0A , t0A ) = (0, 0) ,

(x0B , t0B ) = (0, T ) ,
pois no referencial inercial Nave os dois eventos, sada da Terra e chegada em Canopus, ocorrem na mesma
posicao, isto e, na propria nave. Para calcular o tempo T decorrido entre os dois eventos de acordo com o
referencial Nave, calculamos as separacoes espaciais e temporais nos dois referenciais inerciais e usamos a
invariancia do intervalo espacotemporal. Temos
x = xB xA = 99,
t = tB tA = 101,
e
0
x = x0B x0A = 0,
0
t = t0B t0A = T.
Como
2 2 2 2
(t0 ) (x0 ) = (t) (x) ,
e
x0 = 0
segue que
2 2 2 2
(t0 ) (x0 ) = (t) (x) ,
isto e,
2 2 2
(t0 ) = (t) (x) ,
e consequentemente,
t0 < t. (1.11)
No caso, mais especificamente temos
T 2 = 1012 992
= 10.201 9.801
= 400
e portanto
T = 20.
Enquanto na Terra se passaram 101 anos, dentro da nave espacial, decorreram apenas 20 anos. Assim, o
intervalo de tempo entre dois eventos medido em um referencial em que eles ocorrem na mesma posicao
e sempre menor que o intervalo de tempo entre os dois eventos medido em um referencial que se move
em relacao ao primeiro. Este efeito e a chamada dilatacao do tempo. O intervalo de tempo entre dois
eventos medido em um referencial em que eles ocorrem na mesma posicao e chamado o seu tempo proprio.
Portanto, o tempo proprio e sempre menor que o tempo medido em um referencial que esta se movendo em
relacao a este referencial. Na Secao 2.4.1 obteremos uma expressao que nos permitira calcular exatamente
o quanto o tempo e dilatado no referencial que se move; o fator de dilatacao dependera exclusivamente da
velocidade deste.
Observe que quanto mais proxima da velocidade da luz e a velocidade da nave, menor o tempo decorrido
na nave. No limite, se a nave se movesse a velocidade da luz (o que e impossvel para partculas materiais,
como veremos no final deste captulo), o intervalo de tempo seria zero, pois neste caso teramos
x = t = 99,
de modo que
2 2 2
(t0 ) = (t) (x) = 0.
1.7.3 Invariancia das Dimensoes Transversais

As dimensoes de objetos que se movem em direcoes transversais a direcao de movimento relativo de dois
referenciais inerciais tem a mesma medida nos dois referenciais.
Isso decorre de um argumento de simetria: nao ha nenhuma direcao privilegiada segundo a qual pode
haver uma contracao ou dilatacao (fisicamente, dizemos que o espaco e isotropico, isto e, e o mesmo em todas
as direcoes). Imagine dois cilindros ocos de mesmo raio e comprimento viajando em velocidade constante, um
na direcao do outro, ao longo do seu eixo comum de simetria. Imagine que um dos cilindros esta em repouso
(cilindro A) em relacao a um certo referencial inercial. Se o outro cilindro (cilindro B) for medido como
tendo o seu raio contraindo [dilatando] em relacao a este referencial, entao ele passara por dentro [por fora]
do cilindro A. Por outro lado, em relacao a um segundo referencial em repouso ao cilindro B exatamente o
contrario se verificara: o cilindro A passara por dentro [por fora] do cilindro B. Isto e intoleravel do ponto
de vista da logica. Uma objecao mais fundamental e esta escolha arbitraria do eixo de contracao [dilatacao].
Se os dois cilindros estao viajando paralelamente, qual seria o eixo ao longo do qual se verificaria a contracao
[dilatacao] em relacao a um referencial inercial externo aos cilindros, em relacao ao qual eles se movem? Os
cilindros se contrairiam [dilatariam] cada um em relacao ao seu eixo de movimento ou em relacao a reta
equidistante deles? Para o observador inercial externo, qualquer eixo paralelo ao movimento dos cilindros e
equivalente. Veja [Taylor-Wheeler], Secao 3.6, pags. 6567, para uma discussao detalhada.
Da mesma forma, dois eventos com separacoes espaciais transversais a direcao de movimento relativo de
dois referenciais inerciais sao simultaneos em um dos referenciais se e somente se eles sao simultaneos no
outro referencial.
Isso decorre tambem de um argumento de simetria. Se, em um cilindro viajando com velocidade uniforme
em relacao a um referencial inercial externo, dois eventos ocorrem simultaneamente na periferia do cilindro
de acordo com o referencial inercial do proprio cilindro, como decidir qual evento ocorreria antes ou depois
no referencial inercial externo? Tambem no referencial externo os dois eventos devem ser simultaneos.
Captulo 2
O Espacotempo de Minkowski
2.1 Produto Interno e Formas Quadraticas

2.1 Definicao. Seja V um espaco vetorial real de dimensao finita.
Uma forma bilinear em V e uma aplicacao f : V V R que e linear em cada variavel, isto e,
f (v + w, u) = f (v, u) + f (w, u) ,
f (u, v + w) = f (u, v) + f (u, w) ,
para todos u, v, w V e para todos , R. Uma forma bilinear f e simetrica se
f (v, w) = f (w, v)
para todos v, w V. Uma forma bilinear B e nao-degenerada se
f (v, u) = 0
para todo u V implicar v = 0 e se

f (u, w) = 0
para todo u V implicar w = 0.
Um produto interno (ou metrica) em V e uma forma bilinear simetrica nao-degenerada, que geralmente
denotaremos por g ou por h, i.
Um produto interno h, i e positivo definido se
hv, vi > 0,
para todo v V e negativo definido se

hv, vi < 0,
para todo v V.
Dizemos que dois vetores v, w sao ortogonais se hv, wi = 0.
2.2 Exemplo. Seja V um espaco vetorial real de dimensao finita e
B = {e1 , . . . , en }
uma base para V. Para 0 6 k 6 n e 1 , . . . , n R, i > 0 para todo i, definimos o produto interno
k
X n
X
hv, wi = i v i wi + i v i wi ,
i=1 i=k+1
18
onde v = v 1 , . . . , v n e w = w1 , . . . , wn sao as coordenadas de v e w em relacao a B.

De fato, esta e claramente uma forma bilinear simetrica. Se
hv, wi = 0
para todo w V, isso vale em particular para os vetores da base canonica e1 , . . . , en . Mas hv, ei i = i v i ,
logo v i = 0 para todo i e portanto ela e nao-degenerada. Se k = 0 este produto interno e positivo definido,
se k = n este produto interno e negativo definido e se 0 < k < n este produto interno nao e nem positivo
definido nem negativo definido, pois vetores da forma
v = v 1 , . . . , v k , 0, . . . , 0

satisfazem hv, vi < 0, enquanto que vetores v da forma
v = 0, . . . , 0, v k+1 , . . . , v n

satisfazem hv, vi > 0.

Em geral, fixada uma base em um espaco vetorial V, se os seus vetores sao expressos em coordenadas em
relacao a esta base, a formula acima define um produto interno em V.
2.3 Definicao. Seja V um espaco vetorial de dimensao finita com produto interno h, i.
A forma quadratica induzida por h, i (ou associada a h, i) e a aplicacao q : V R definida por
q (v) = hv, vi .
Dizemos que v e um vetor do tipo luz se q (v) = 0.

Dizemos que v e um vetor unitario se q (v) = 1.
Dado um espaco vetorial com produto interno V, dizemos que uma base B = {e1 , . . . , en } para V e
ortonormal se os seus vetores sao dois a dois ortogonais e unitarios.
2.4 Exemplo. Para a forma quadratica q induzida pelo produto interno g em V do Exemplo 2.2 com i = 1
para todo i, isto e,
Xk n
X
hv, wi = v i wi + v i wi ,
i=1 i=k+1
sao as coordenadas de v e w em relacao a uma base B =

1 n
1 n

onde v = v , . . . , v e w = w ,...,w
{e1 , . . . , en } fixada, de modo que
k n
X 2 X 2
q (v) = vi + vi ,
i=1 i=k+1
a propria base B e ortonormal, com

1 se i = 1, . . . , k,
q (ei ) =
1 se i = k + 1, . . . , n.

2.5 Exemplo. Se q e uma forma quadratica induzida por um produto interno positivo definido ou por um
produto interno negativo definido, entao v e um vetor do tipo luz se e somente se v = 0. Se q e induzida por
um produto interno que nao e definido, entao mesmo que v 6= 0 pode acontecer que v seja um vetor do tipo
luz. Por exemplo, para a forma quadratica do Exemplo 2.4, se k 6= 0 temos
q (ei + ej ) = 0
para todos 1 6 i 6 k e k + 1 6 j 6 n. De fato, e possvel obter uma base para V composta inteiramente de
vetores do tipo luz. No caso k = 1, basta tomar
B0 = {e1 + e2 , e1 e2 , e1 + e3 . . . , e1 + en } .
Para ver que B0 e uma base, basta verificar que os n vetores que a formam sao LI. Se
1 (e1 + e2 ) + 2 (e1 e2 ) + 3 (e1 + e3 ) + . . . + n (e1 + en ) = 0,
entao !
n
X n
X
i e1 + (1 2 ) e2 + i ei = 0.
i=1 i=3
Como B e uma base, segue que

n
X
i = 0,
i=1
1 2 = 0,
3 = . . . = n = 0,
donde i = 0 para todo i.
Note que
q (v) = q (v) ,
para todo v V, pois
q (v) = hv, vi = hv, vi = q (v) .
De modo geral,
q (v) = 2 q (v) .
2.6 Proposicao (Identidade Polar). Um produto interno e completamente determinado por sua forma
quadratica associada. Mais especificamente, se q e a forma quadratica induzida pelo produto interno h, i,
entao
1
hv, wi = [q (v + w) q (v) q (w)] .
2
e
1
hv, wi = [q (v + w) q (v w)]
4
Em particular, toda forma bilinear simetrica induz uma unica forma quadratica.
Prova. Pois,
q (v + w) q (v) q (w) = hv + w, v + wi hv, vi hw, wi

= hv, vi + 2 hv, wi + hw, wi hv, vi hw, wi
= 2 hv, wi ,
q (v + w) q (v w) = hv + w, v + wi hv w, v wi
= hv, vi + 2 hv, wi + hw, wi [hv, vi 2 hv, wi + hw, wi]
= 4 hv, wi .

2.7 Definicao. Seja V um espaco vetorial de dimensao finita com produto interno h, i e q sua forma
quadratica associada. A norma de um vetor v V e definida por
p p
kvk = |hv, vi| = |q (v)|.

Observe que a norma de um vetor e sempre um numero positivo ou zero. Vetores do tipo luz tem norma
zero.
2.8 Teorema (Teorema de Sylvester). Sejam V um espaco vetorial de dimensao finita com produto
interno h, i e q sua forma quadratica associada. Entao V possui uma base ortonormal.
Alem disso, o numero de vetores ei de qualquer base ortonormal B = {e1 , . . . , en } para V tais que
q (ei ) = 1
e o mesmo.
Prova. Para mostrar a existencia de uma base ortonormal faremos inducao sobre a dimensao de V. Seja
n = dim V e verifiquemos primeiro o caso n = 1. Afirmamos que existe u V tal que
q (u) 6= 0.
De fato, como g e nao-degenerada, existem vetores v, w V tais que
hv, wi =
6 0.
Se q (v) 6= 0 ou q (w) 6= 0, a afirmacao esta provada. Caso contrario, se q (v) = q (w) = 0, escolhemos
u = v + w, pois
q (v + w) = hv + w, v + wi
= hv, vi + 2 hv, wi + hw, wi
= q (u) + 2 hv, wi + q (w)
= 2 hv, wi
6= 0.
Basta entao tomar

u
e1 = .
kuk
Assuma agora n > 1. Como no passo anterior, seja u V tal que
q (u) 6= 0.
Seja U = hui o subespaco gerado por u e
U = {v V : hu, vi = 0}
o subespaco ortogonal a u. Afirmamos que
V = U U .
De fato, os subespacos U e U sao linearmente independentes, pois um vetor tpico de U e da forma u

para algum escalar R e se u U tambem entao
hu, ui = 0
por definicao, mas

hu, ui = hu, ui = q (u)
e como q (u) 6= 0, segue que = 0. Alem disso, V = U + U : dado v V, definindo
hu, vi
w=v u,
hu, ui
segue que w U , pois

hu, vi
hu, wi = g u, v u
hu, ui
hu, vi
= hu, vi hu, ui
hu, ui
= 0;
portanto
hu, vi
v= u+w
hu, ui
com o primeiro vetor da soma em U e o segundo em U . Agora, pela hipotese de inducao existe uma base
ortonormal
B0 = {e1 , . . . , en1 }
para U . Tomando en = u, obtemos uma base ortonormal
B = {e1 , . . . , en1 , en }
para V.
Para provar a ultima parte do teorema (seguindo [Lang]), sejam
B = {e1 , . . . , er , er+1 , . . . , en } ,
B0 = {f1 , . . . , fs , fs+1 , . . . , fn }
duas bases ortonormais para V ordenadas de tal forma que

1 se i = 1, . . . , r,
q (ei ) =
1 se i = r + 1, . . . , n,

1 se i = 1, . . . , s,
q (fi ) =
1 se i = s + 1, . . . , n.
Afirmamos que
e1 , . . . , er , fs+1 , . . . , fn
sao linearmente independentes. De fato, se
1 e1 + . . . + r er + s+1 fs+1 + . . . + n fn = 0,
escrevemos
1 e1 + . . . + r er = s+1 fs+1 . . . n fn ,
e tomamos o produto interno desta equacao consigo mesma, obtendo
12 . . . r2 = s+1
2
+ . . . + n2 ,
ja que g (ei , ei ) = q (ei ) = 1 para i = 1, . . . , r e g (fi , fi ) = q (fi ) = 1 para i = s + 1, . . . , n. Como o lado

esquerdo e nao positivo e o lado direito e nao negativo, segue que ambos devem ser do tipo luz e portanto
1 = . . . = r = s+1 = . . . = n = 0,
provando a afirmacao. Como dim V = n, temos que
r + (n s) 6 n,
donde
r 6 s.
Por simetria do argumento, segue tambem que s 6 r e portanto r = s.
Segue que dado um espaco vetorial V com produto interno g e forma quadratica associada q, V possui uma
base ortonormal B = {e1 , . . . , en } tal que em relacao a esta base o produto interno e a forma quadratica se
escrevem na forma
k
X n
X
hv, wi = v i wi v i wi ,
i=1 i=k+1
k n
X 2 X 2
q (v) = vi vi ,
i=1 i=k+1
para todos
v = v i ei , w = wi ei V.
E obvio que a mesma conclusao do Teorema de Sylvester vale para os vetores ej tais que q (ej ) = +1. A razao
do resultado ter sido enunciado em termos da contagem de vetores unitarios negativos decorre da seguinte
convencao:
2.9 Definicao. Dado um espaco vetorial V com produto interno g e sua forma quadratica associada q, o
ndice de g (e de q) e o numero de vetores de uma base ortonormal de V tais que q (ei ) = 1.
2.10 Notacao. Definimos
1 se i = j = 1, . . . , k,
k
ij = 1 se i = j = k + 1, . . . , n,
0 se i 6= j.

k
O smbolo ij e uma generalizacao do delta de Kronecker ij , isto e,
0
ij = ij .
Ele e as vezes chamado o eta de Kronecker. Quando k = 1, omitimos o ndice superescrito e escrevemos
simplesmente ij , isto e,
1
ij = ij
Na representacao matricial, temos
idk 0
k = ,
0 idnk
onde idm e a matriz identidade m m.
2.11 Exemplo. Em Rn , se e1 , . . . , en sao os vetores da base canonica, definimos uma metrica com ndice k
k k
por gij = hei , ej i = ij ,
2.2 Operadores Ortogonais e Isometrias

2.12 Definicao. Seja V um espaco vetorial de dimensao finita com produto interno h, i. Dizemos que um
operador linear L : V V e um operador ortogonal se ele preserva o produto interno, isto e, se
hLv, Lwi = hv, wi
para todos v, w V.
Uma matriz ortogonal e uma matriz que representa um operador ortogonal em relacao a qualquer base.

Lembramos que se A e uma matriz que representa o operador linear L em relacao a base B = {e1 , . . . , en }
de V, entao a matriz A tem a forma em colunas

A = Le1 . . . Len ,
onde cada coluna e

A1j

n
Aij ei = ... .
X
Lej =

i=1 Anj
Assim, A e ortogonal se
hAv, Awi = hv, wi .
Se g e uma metrica, denotaremos tambem por g a matriz
g = (gij ) .
2.13 Proposicao. Seja V um espaco vetorial de dimensao finita com produto interno h, i e forma quadratica
associada q de ndice k. Entao P e uma matriz ortogonal se e somente se
P T k P = k .
Prova. Seja
B = {e1 , . . . , en }
uma base ortonormal para V satisfazendo

1 se i = 1, . . . , k,
q (ei ) =
1 se i = k + 1, . . . , n.
Se
n
X
v= v i ei ,
i=1
denote
k
X n
X
v #k = v i ei + v i ei .
i=1 i=k+1
Note que em notacao matricial (vetores como colunas)
v #k = k v
e
hv, wi = v T w#k
Seja P uma matriz ortogonal representando o operador ortogonal L em relacao a B. Entao

k
hLei , Lej i = hei , ej i = ij
e

Le1
k idk 0
P P = ... Le1 . . . Len
0 idnk
Len

Le1 h i
= . . . (Le1 )#k . . . (Len )#k
Len
= [hLei , Lej i]
= k .
Reciprocamente, suponha que P T k P = k . Entao, se v, w V sao vetores arbitrarios, multiplicando

esta equacao a esquerda por v T e a direita por w, temos
v T P T k P w = v T k w.

(2.1)
Observando, como visto acima, que

v T k w = v T w#k = hv, wi ,
segue que o lado esquerdo de (2.1) e
T
v T P T k P w = (P v) k P w

= hP v, P wi ,
enquanto que o seu lado direito e hv, wi, donde
hP v, P wi = hv, wi .

2.14 Proposicao. O conjunto G dos operadores ortogonais e um grupo sob a operacao de composicao de
operadores.
Prova. Claramente, o operador identidade esta em G. Se L, M G, entao
h(L M ) v, (L M ) wi = hL (M v) , L (M w)i
= hM v, M wi
= hv, wi ,
logo o produto L M G. Finalmente, se L G, usaremos a nao-degeneracidade do produto interno para

mostrar que L e invertvel e que L1 G. Se v ker L, entao para todo w V temos
hv, wi = hLv, Lwi = h0, Lwi = 0,
e a nao-degeneracidade do produto interno implica que v = 0, e portanto L e invertvel. Da,
hv, wi = L L1 v , L L1 w = L1 v, L1 w ,

logo L1 G.
G e chamado o grupo ortogonal.
2.15 Definicao. Seja V um espaco vetorial de dimensao finita com produto interno e forma quadratica
associada q. Uma aplicacao F : V V tal que
q (F (v) F (w)) = q (v w)
para todos v, w V e chamada uma isometria de V.

2.16 Proposicao. O conjunto Isom(V) das isometrias de um espaco vetorial com produto interno V e um
grupo sob a operacao de composicao de operadores.
Prova. Claramente, o operador identidade e uma isometria. Se F, G Isom(V), entao
q [(F G) (v) (F G) (w)] = q [F (G (v)) F (G (w))]

= q (G (v) Gw)
= q (v w) ,
logo o produto F G Isom(V).

Se F Isom(V), para mostrar que F e invertvel, seja T uma translacao que leva F (0) em 0. Entao
T F e uma isometria tal que (T F ) (0) = 0 e, pela Proposicao 2.17 a seguir, e um operador ortogonal,
em particular bijetiva; logo F = T 1 (T F ) e uma composicao de bijecoes, logo e uma bijecao e portanto
invertvel. Como
q (v w) = q F F 1 (v) F F 1 (w) = q F 1 (v) F 1 (w) ,

segue que F 1 Isom(V).

Todo operador ortogonal e uma isometria, pois
q (L (v) L (w)) = q (L (v w))

= hL (v w) , L (v w)i
= hv w, v wi
= q (v w) ,
logo o grupo ortogonal e um subgrupo do grupo de isometrias.

2.17 Proposicao. Seja V um espaco vetorial de dimensao finita com produto interno. Isometrias F : V
V tais que F (0) = 0 sao operadores ortogonais.
Prova: Passo 1. q (F (v)) = q (v) para todo v V.

Pois
q (F (v)) = q (F (v) F (0)) = q (v 0) = q (v) .
Passo 2. F preserva o produto interno.
Pela identidade polar (Proposicao 2.6), para todos v, w V vale
1
hF (v) , F (w)i = [q (F (v) F (w)) q (F (v)) q (F (w))]
2
1
= (q (v w) q (v) q (w))
2
= hv, wi .
Passo 3. F e linear.
Seja
B = {e1 , . . . , en }
uma base ortonormal para V. Suponha que

F (ei ) = ei (2.2)
para todo i. Para todo v V temos
hv, ei i = hF (v) , F (ei )i = hF (v) , ei i .
Por linearidade do produto interno segue que
hv, wi = hF (v) , wi
para todo w V, de modo que pela nao-degeneracidade do produto interno temos
F (v) = v,
isto e,
F = id,
que e um operador ortogonal. Se (2.2) nao se cumpre, pelo Passo 2 F leva bases ortonormais em bases
ortonormais, de modo que se
F (ei ) = fi ,
entao
B0 = {f1 , . . . , fn }
e uma base ortonormal. Se L e o operador ortogonal que leva B0 em B, segue que G = L F e uma isometria
que satisfaz
G (ei ) = ei ,
logo pelo argumento anterior segue que
G = id
e portanto
F = L1
e um operador ortogonal.
2.18 Proposicao. Seja V um espaco vetorial de dimensao finita com produto interno. Se F : V V e
uma isometria, entao existe um unico operador ortogonal L e uma unica translacao T tais que
F = T L.
Prova: (Existencia) Seja T : V V a translacao
T (p) = p + F (0) .
Entao T 1 F : V V e uma isometria tal que
T 1 F (0) = T 1 (F (0)) = F (0) F (0) = 0,

de modo que pelo resultado anterior

L := T 1 F
e um operador ortogonal.
(Unicidade) Se L1 , L2 sao operadores ortogonais e T1 , T2 sao translacoes tais que
F = T1 L1 = T2 L2 ,
entao
L1 L1 1
2 = T1 T2 .
Em particular, T11 T2 e um operador linear e como operadores lineares deixam o vetor nulo fixo, segue
que T11 T2 e a translacao nula, isto e, a identidade. Logo,
T11 T2 = id = T1 = T2 ,
L1 L1
2 = id = L1 = L2 .
2.3 Metrica de Lorentz e Espacotempo de Minkowski

2.19 Definicao. Uma metrica de Lorentz em um espaco vetorial de dimensao 4 e um produto interno
de ndice 1.
Um espacotempo de Minkowski e R4 munido de uma metrica de Lorentz. Ele sera denotado por M.
Os pontos de M serao chamados eventos.
Em particular, segue da observacao logo apos o Teorema de Sylvester, Teorema 2.8, que todo espacotempo
de Minkowski M possui uma base B = {e0 , e1 , e2 , e3 } com a propriedade de que seu produto interno h, i e
sua forma quadratica associada q em relacao a esta base sao dados por
hv, wi = v 0 w0 + v 1 w1 + v 2 w2 + v 3 w3 ,
2 2 2 2
q (v) = v 0 + v 1 + v 2 + v 3
para todos v = v i ei , w = wi ei M. Usando notacao matricial, se

1 0 0 0
0 1 0 0
= 0
,
0 1 0
0 0 0 1
a metrica de Lorentz pode ser escrita na forma
hv, wi = ij v i wj .
Segue do Princpio da Relatividade (Teorema 1.13 da Invariancia do Intervalo) que o espacotempo fsico na
Teoria da Relatividade Especial e um espacotempo de Minkowski, com o intervalo entre dois eventos v, w
sendo exatamente q (v w). Mais tarde, quando estudarmos a Teoria da Relatividade Geral, veremos que
isso e verdade apenas localmente.
Vale a pena ressaltar que foi Minkowski quem traduziu a Teoria da Relatividade Especial para a linguagem
do espacotempo (em 1907), isto e, foi ele quem reconheceu que a consequencia principal da teoria foi a
unificacao do espaco e do tempo em uma so unidade. Em suas palavras: De agora em diante, espaco
por si so e tempo por si estao condenados a desaparecer em meras sombras, e somente uma uniao dos
dois preservara uma realidade independente. ([Taylor-Wheeler], Secao 1.5, p. 15.) Inicialmente, Einstein
nao aceitou bem a ideia de Minkowski. Em sua opiniao, estender o espaco para a quarta dimensao mais
mistificava do que esclarecia a teoria. Na verdade, em resposta a formulacao de Minkowski, Einstein e
quotado como tendo dito: Desde que os matematicos invadiram a teoria da relatividade, eu proprio nao a
compreendo mais. Pouco tempo depois, no entanto, Einstein mudou radicalmente de opiniao e reconheceu
a importancia do conceito de espacotempo, que foi fundamental para a elaboracao da Teoria da Relatividade
Geral; Minkowski foi a primeira entre as duas unicas pessoas que ele reconheceu no artigo de publicacao da
teoria como sendo instrumentais na sua formulacao (veja Secao 7.1).
Na realidade, o espacotempo e muito mais que uma linguagem ou uma formalizacao diferente da teoria.
Ele da sentido fsico a Teoria da Relatividade, como [Petkov] argumenta muito persuasivamente no Captulo 5
(especialmente pp. 7576). De fato, o proprio Minkowski (quotado la, p. 78) argumentou convincentemente
que o Postulado da Relatividade deveria ser trocado pelo Postulado do Mundo Absoluto. Ou seja, a principal
ideia da Teoria da Relatividade Especial, que resume tudo e de onde todas as consequencias seguem, e
trocar o espaco e o tempo absoluto de Newton pelo espacotempo absoluto com a metrica de Lorentz (o
espacotempo de Minkowski). [Petkov], Captulo 6, argumenta que a relutancia inicial de Einstein em aceitar
o espacotempo de Minkowski desempenhou um papel importante na relativa demora em desenvolver a Teoria
da Relatividade Geral, mesmo apos ele ter tido o insight do princpio da equivalencia (seu pensamento mais
feliz da vida; veja Secao 7.1).
2.20 Definicao. O grupo das isometrias do espacotempo de Minkowski Isom(M) e chamado o grupo de
Poincare.
Um operador ortogonal do espacotempo de Minkowski e chamado uma transformacao de Lorentz. O
grupo das transformacoes de Lorentz e chamado o grupo de Lorentz.
Assim, transformacoes de Lorentz sao operadores lineares no espacotempo de Minkowski que preservam a
metrica de Lorentz. Consequentemente, o grupo de Lorentz e um subgrupo do grupo de Poincare.
Pode-se provar que o grupo de Poincare e um grupo a 10 parametros. Um subgrupo particularmente fisi-
camente interessante e o subgrupo de Poincare ortocrono proprio, obtido quando se exclui as reflexoes
espaciais e temporais (estas ultimas sao chamadas reversoes temporais; elas se referem a transformacoes de
coordenadas entre dois referenciais inerciais em que o relogio de um esta andando na direcao contraria a do
relogio do outro), que ainda e um grupo a 10 parametros gerado pelas 4 translacoes (nas direcoes t, x, y, z) e
por 6 transformacoes de Lorentz, 3 das quais sao as rotacoes espaciais da geometria euclideana em relacao
aos eixos x, y, z e as outras 3 sao os boosts nas direcoes x, y, z, a serem explicados na proxima secao. Para
maiores detalhes sobre o subgrupo de Poincare ortocrono proprio, veja [Rowe], Secao 1.9, pp. 3134 e [Naber],
Secao 1.3, pp. 1542. Para maiores detalhes sobre o grupo de Poincare geral, veja [Tsamparlis], Secao 1.6,
pp. 1826, para uma deducao com insight geometrico, e Secao 1.7, pp. 2640, para uma deducao puramente
algebrica.
2.3.1 Propriedades do Espacotempo de Minkowski

2.21 Definicao. Vetores v M tais que
q (v) = 0 sao chamados do tipo luz,

q (v) > 0 sao chamados do tipo espaco,
q (v) < 0 sao chamados do tipo tempo.

Seja V um espaco vetorial de dimensao finita com produto interno. Dizemos que um subespaco W V e
nao degenerado se o produto interno de V restrito a W e nao degenerado; caso contrario, dizemos que W e
degenerado. Por exemplo, no espaco de Minkowski M, o subespaco gerado por e1 , e2 , e3 e nao degenerado,
enquanto que o subespaco gerado por e0 e degenerado.
2.22 Lema. Seja V um espaco vetorial com produto interno. Um subespaco W V e nao degenerado se e
somente se
V = W W .
Prova: Lembremos o seguinte resultado de Algebra Linear sobre dimensoes de subespacos:
dim W + W + dim W W = dim W + dim W .

(2.3)
Afirmamos que para qualquer subespaco W V vale
dim W + dim W = n. (2.4)
De fato, seja {e1 , . . . , em } uma base para W e complete esta base ate uma base {e1 , . . . , em , em+1 , . . . en }
para V. Um vetor v V pertence a W se e somente se hv, ei i = 0 para i = 1, . . . , m, ou seja, se e somente
se v = v j ej satisfaz o sistema
gij v j = 0 para i = 1, . . . , m.
Como a matriz (gij ) e invertvel, o subespaco solucao deste sistema tem dimensao exatamente igual a n m.
De (2.3) e (2.15) segue que V = W + W se e somente se W W = 0. Assim, qualquer uma destas
condicoes e equivalente a V = W W . Mas
W W = {w W : w W } ,
logo W W = 0 se e somente se W e nao degenerado.

2.23 Proposicao. Se v M e do tipo tempo e w 6= 0 e ortogonal a v, entao w e um vetor do tipo espaco.

Em particular, hvi e um subespaco vetorial formado apenas por vetores do tipo espaco, e portanto onde
o produto interno e positivo definido.
Prova: Pelo lema, podemos decompor

M = hvi hvi .

Como os ndices de M e hvi sao iguais a 1, pelo Teorema de Sylvester o ndice de hvi deve ser zero, caso
contrario obteramos uma base para M com mais de um vetor com valor q igual a 1. Portanto, todo vetor
ortogonal a v nao nulo e do tipo espaco.
2.24 Definicao. Denote por M o conjunto dos vetores do tipo tempo. Para v M , definimos o cone
temporal de v como sendo o conjunto
C (v) = w M : hv, wi < 0 .

Seu cone temporal oposto e o conjunto
C (v) = C (v) = w M : hv, wi > 0 .

2.25 Proposicao. Dois vetores v, w do tipo tempo estao no mesmo cone temporal se e somente se
hv, wi < 0.
Prova: Seja v C (u), para u M que podemos tomar unitario, de modo que hu, ui = 1. Mostraremos
que w M pertence tambem a C (u) se e somente se hv, wi < 0. Escreva
v = au + x,
w = bu + y,

para x, y hui . Temos
hv, wi = hau + x, bu + yi = ab + hx, yi . (2.5)
Como
2
0 > hv, vi = hau + x, au + xi = a2 + kxk ,
2
0 > hw, wi = hbu + y, bu + yi = b2 + kyk ,
segue que
|a| > kxk ,

|b| > kyk ,

e pela desigualdade de Cauchy-Schwartz, que pela Proposicao 2.23 e valida em hui , obtemos
|hx, yi| 6 kxk kyk < |ab| .
Segue de (2.5) que

sign hv, wi = sign (ab) .
Como v C (u),
0 > hu, vi = hu, au + xi = a,
isto e,
a > 0,
donde
sign hv, wi = sign b,
Mas w C (u) se e somente se b > 0, pois
hu, wi = hu, bu + yi = b,
logo segue o resultado.

Existem apenas dois cones temporais, pois pela Proposicao 2.23 o produto escalar de dois vetores do tipo
tempo nao pode ser nulo, logo ou e negativo e eles estao no mesmo cone temporal pela Proposicao 2.25, ou
e positivo e eles estao em cones temporais opostos. Portanto, temos a uniao disjunta
M = C (v) C (v)
para qualquer vetor do tipo tempo v.

Da mesma forma que o conjunto dos vetores do tipo tempo M , cones temporais nao sao subespacos
vetoriais de M. Mas cada cone temporal e um conjunto convexo: se a, b > 0 e v, w C, entao av + bw C.
2.26 Definicao. Fixada uma base ortonormal
B = {e0 , e1 , e2 , e3 }
para o espaco de Minkowski M com q (e0 ) = 1, o cone temporal futuro de M e o conjunto
C+ = C (e0 ) = v M : hv, e0 i < 0 ,

enquanto que o cone temporal passado de M e o conjunto
C = C (e0 ) = v M : hv, e0 i > 0 .

Assim,
M = C+ C .
A escolha de qual cone temporal e designado como o cone temporal futuro e qual cone temporal e designado
como o cone temporal passado depende portanto da escolha da base. Isso determina uma orientacao no
espaco de Minkowski.
Como observado na demonstracao da Proposicao 2.25, existem vetores do tipo espaco que satisfazem a
desigualdade de Cauchy-Schwartz. Isso nao e verdade para todos os vetores do tipo espaco. Por exemplo,
v = (1, 1, 1, 1) ,
w = (1, 1, 1, 1) ,
sao vetores do tipo espaco, pois

hv, vi = hw, wi = 2,
mas
hv, wi = 4,
enquanto que
kvk kwk = 2 2 = 2,
portanto
hv, wi > kvk kwk .
Por outro lado, vetores do tipo tempo sempre satisfazem a desigualdade de Cauchy-Schwartz reversa:
2.27 Proposicao (Desigualdade de Cauchy-Schwartz Reversa). Se v, w M sao do tipo tempo, entao
|hv, wi| > kvk kwk
com a igualdade valendo se e somente se v e w sao multiplos escalares um do outro.

Prova: Escreva
w = av + z

com z hvi . Entao
hw, wi = a2 hv, vi + hz, zi ,
e da
2 2
hv, wi = a2 hv, vi = a2 hv, vi hv, vi

= (hw, wi hz, zi) hv, vi

> hw, wi hv, vi
= kvk kwk ,
pois hz, zi > 0 pela Proposicao 2.23 e hw, wi , hv, vi < 0. A igualdade vale se e somente se z = 0.
2.28 Proposicao (Desigualdade Triangular Reversa). Se v, w M sao do tipo tempo pertencentes ao
mesmo cone temporal, entao
kvk + kwk 6 kv + wk
com a igualdade valendo se e somente se v e w sao multiplos escalares um do outro.
Prova: Como v, w estao no mesmo cone temporal e cones temporais sao convexos, segue que v + w tambem
esta no mesmo cone temporal e em particular tambem e um vetor do tipo tempo, ou seja,
hv + w, v + wi < 0.
Pela desigualdade de Cauchy-Schwartz reversa,
kvk kwk 6 hv, wi .

Logo,
2 2 2
(kvk + kwk) = kvk + 2 kvk kwk + kwk
2 2
6 kvk 2 hv, wi + kwk
= hv, vi 2 hv, wi hw, wi
= hv + w, v + wi
2
= kv + wk
A igualdade so valera se e somente se a igualdade valer na desigualdade de Cauchy-Schwartz reversa.

Assim, a reta que liga dois pontos no espaco de Minkowski nao e o caminho mais curto entre dois pontos;
na verdade, e o caminho mais longo.
2.29 Proposicao (Interpretacao Geometrica do Produto Interno). Se v, w M sao vetores do tipo
tempo pertencentes ao mesmo cone temporal, entao existe um unico real > 0 tal que
hv, wi = kvk kwk cosh .
e chamado o angulo hiperbolico entre v e w.

Prova: Pela desigualdade de Cauchy-Schwartz reversa,
|hv, wi|
> 1,
kvk kwk
logo existe um unico numero nao negativo tal que
|hv, wi|
cosh = .
kvk kwk
Pela Proposicao 2.25, hv, wi < 0, logo

|hv, wi| = hv, wi ,
donde
hv, wi
cosh = .
kvk kwk

2.30 Definicao. Qualquer vetor do tipo tempo ou do tipo luz e chamado um vetor do tipo causal.
O fecho de um cone temporal e chamado um cone causal.
Qualquer vetor que nao e do tipo espaco e um vetor do tipo causal. A fronteira de um cone temporal consiste
exatamente de vetores do tipo luz. A intersecao dos dois cones causais e exatamente o vetor nulo. O motivo
da terminologia causal sera vista no proximo captulo.
2.4 Transformacao de Lorentz do tipo Boost

Nesta secao vamos obter a transformacao de Lorentz entre dois sistemas de coordenadas para o espacotempo
de Minkowski cujas origens coincidem, e tais que, espacialmente, eles tem eixos paralelos e um se move em
relacao ao outro ao longo de um dos eixos x, y ou z. Este tipo de transformacao de Lorentz e chamada um
boost (impulso) na direcao x, y ou z.
Vamos obter o boost na direcao x. Considere dois referenciais inerciais em movimento relativo. Digamos
que temos um referencial inercial O, cujas coordenadas denotaremos por (t, x, y, z) , e um referencial inercial
O0 , cujas coordenadas denotaremos por (t0 , x0 , y 0 , z 0 ), que se move com velocidade v, |v| < 1, na direcao
positiva do eixo x do referencial inercial O, com os eixos y, z, y 0 , z 0 transversais a direcao do movimento

relativo e a origem dos dois referenciais coincidindo no tempo t = t0 = 0. Portanto,
y = y0 ,
z = z0.
2.4.1 Medida Quantitativa da Dilatacao do Tempo

Para fixar ideias, comecemos com dois eventos A e B, ambos consistindo na emissao de uma fasca, o
primeiro evento ocorrendo na origem comum dos dois sistemas de coordenadas, o segundo ocorrendo algum
tempo depois na origem espacial do sistema O0 . As coordenadas destes eventos (ignorando as coordenadas
y, z, y 0 , z 0 ) nestes dois referenciais inerciais sao portanto
(xA , tA ) = (0, 0) ,
(xB , tB ) = (x, t) .
e
(x0A , t0A ) = (0, 0) ,
(x0B , t0B ) = (0, t0 ) .
de modo que
x = x,
t = t,
x0 = 0,
t0 = t0 .
Temos
x = vt
e pela invariancia do intervalo espacotemporal
2
(t0 ) = t2 x2 = 1 v 2 t2 ,

de modo que
1
t= t0 .
1 v2
2.31 Definicao. O numero
1
= (2.6)
1 v2
e chamado o fator de dilatacao do tempo.
Observe que t0 e o tempo proprio no referencial O0 e como
> 1,
isso mostra o que ja vimos antes, que o tempo proprio e sempre menor que o tempo medido em um outro
referencial que esta se movendo em relacao ao referencial onde o tempo proprio e medido. Agora temos uma
expressao que nos da exatamente o quanto o tempo e dilatado.
Conclumos que para dois eventos cujas coordenadas x0 = 0 a transformacao de Lorentz e
t = t0 , (2.7)
0
x = vt . (2.8)
Observe que p
2 1
v= ,

pois a velocidade relativa entre os referenciais pode ser positiva ou negativa, dependendo da direcao em
que um se move em relacao ao outro, portanto opta-se por escrever v explicitamente, e nao em funcao do
parametro . Se v > 0 (isto e, o referencial O0 se move para a direita do referencial O), entao
t = t0 ,
p
x = 2 1t0 ,
enquanto que se v < 0 (isto e, o referencial O0 se move para a esquerda do referencial O), entao
t = t0 ,
p
x = 2 1t0 ,
2.4.2 Matriz do Boost

No caso geral, 0
t a11 a12 0 0 t
x a21 a22 0 0 x0
y = 0
,
1 0 y0

0
z 0 0 0 1 z0
ou seja,
t = a11 t0 + a12 x0 ,
x = a21 t0 + a22 x0 .
Fazendo x0 = 0, camos no caso anterior e obtemos
a11 = ,
a21 = v.
Portanto, simplificando a notacao,
t = t0 + ax0 ,
x = vt0 + bx0 .
Para obter as constantes a e b usamos novamente a invariancia do intervalo espacotemporal. Escolhendo
agora eventos mais gerais
(xA , tA ) = (0, 0) ,
(xB , tB ) = (x, t) .
e
(x0A , t0A ) = (0, 0) ,
(x0B , t0B ) = (x0 , t0 ) .
de modo que
x = x,
t = t,
x0 = x0 ,
t0 = t0 ,
segue que
2 2
(t0 ) (x0 ) = t2 x2 ,
Substituindo, temos
2 2 2 2
(t0 ) (x0 ) = (t0 + ax0 ) (vt0 + bx0 )
2
= 2 v 2 2 (t0 ) + (2a 2vb) t0 x0

2
+ a2 b2 (x0 )

2 2
= (t0 ) + 2 (a vb) t0 x0 + a2 b2 (x0 )

Como t0 , x0 sao arbitrarios, obtemos
a vb = 0,
a2 b2 = 1.
Da primeira equacao segue que

a = vb,
que substitumos na segunda equacao para obter
v 2 1 b2 = 1

donde
1
b= = .
1 v2
Logo,
a = v.
Assim,
t = t0 + vx0 , (2.9)
0 0
x = vt + x . (2.10)
e 0
t v 0 0 t
x v 0 0 x0
y = 0
. (2.11)
1 0 y0

0
z 0 0 0 1 z0
Observe que a matriz da transformacao de Lorentz boost e simetrica. Em termos apenas de v podemos
escrever
t0 + vx0
t= , (2.12)
1 v2
x0 + vt0
x= . (2.13)
1 v2
A inversa da transformacao de Lorentz e dada por
0
t v 0 0 t
x0 v 0 0 x
0 = . (2.14)
y 0 0 1 0 y
z0 0 0 0 1 z
Ela e facilmente obtida uma vez que notamos que o referencial O se move com velocidade v na direcao
positiva do eixo x do referencial inercial O0 , logo basta substituir v por v em (2.11).
As matrizes das transformacoes de Lorentz boosts nas direcoes y e z sao, respectivamente,

0 v 0 0 0 v
0 1 0 0 0 1 0 0
v 0 0 e 0 0 1 0 .

0 0 0 1 v 0 0
A composta de boosts em direcoes diferentes nao e um boost e portanto o conjuntos dos boosts nao forma um
subgrupo do grupo de Poincare (e uma rotacao, chamada rotacao de Thomas ou precessao de Thomas;
veja [Rowe], Secao 1.9.3, pp. 3334 e [Rahaman], Secao 3.4, p. 31). Este fato so foi descoberto nos anos
1920s e diz-se que surpreendeu Einstein. E claro que se considerarmos apenas boosts em uma unica direcao
eles formam um subgrupo a 1 parametro, isomorfo a R, como veremos na Secao 2.4.5.
2.4.3 Medida Quantitativa da Contracao do Espaco

Usando o fator de dilatacao do tempo podemos tambem encontrar o fator de contracao do espaco, isto e, a
contracao medida do comprimento de um objeto ao longo de sua direcao de movimento em relacao a medida
do comprimento deste objeto em relacao a um referencial em que ele se encontra em repouso.
Imagine que o referencial movel O0 e uma nave espacial viajando da Terra para um sistema estelar a uma
distancia L quando medida no referencial O, que e exatamente a Terra; em relacao ao referencial Terra, e
como se tivessemos uma barra enorme em repouso ligando a Terra ao sistema estelar de comprimento L. O
referencial Nave deve medir uma distancia menor L0 , conforme vimos. De acordo com o referencial Terra O,
a viagem leva o tempo
L
t= ,
v
0
enquanto que no referencial Nave Espacial O , o tempo proprio e

0 t L 1 v2
t = = = L.
v v
A medida da distancia L0 entre a Terra e o sistema estelar de acordo com o referencial inercial Nave O0 e
dada por
L0 = vt0 ,
pois v e a velocidade da nave quando ela deixou a primeira extremidade desta longussima barra (que e o
planeta Terra) e t0 e o tempo que ela levou para chegar a segunda extremidade da barra (o sistema estelar).
Portanto p
L0 = 1 v 2 L. (2.15)
2.4.4 Resumo da Contracao do Espaco e Dilatacao do Tempo

Seguindo [Ferraro], resumimos agora a contracao do espaco e dilatacao do tempo em uma unica situacao.
Considere uma partcula que se move ao longo de uma barra de comprimento L0 com velocidade v.
O evento A e a partcula passando pela extremidade esquerda da barra, enquanto que o evento B e a
partcula passando pela extremidade direita da barra. No referencial (t, x) da barra (isto e, no referencial
em que a barra encontra-se em repouso), os eventos A e B tem coordenadas
(tA , xA ) = (0, 0) ,
(tB , xB ) = (t, L0 ) ,
de modo que o comprimento proprio L0 da barra e
L0 = vt,
enquanto que no referencial (t0 , x0 ) da partcula (isto e, no referencial em que a partcula esta em repouso)
os eventos A e B tem coordenadas
(t0A , x0A ) = (0, 0) ,

(t0B , x0B ) = (, 0) ,
de modo que o comprimento L da barra medido neste referencial e
L = v.
Em particular,
t L0
= ,
L
o que mostra que nao e possvel que os comprimentos (distancias espaciais) sejam relativos, isto e, variem
com a velocidade do referencial, sem que os tempos (intervalos temporais) tambem sejam e vice-versa.
Pela invariancia do intervalo,
2 = t2 L20 .
Substituindo L0 = vt, obtemos p
= 1 v 2 t,
de modo que o tempo proprio, medido no referencial em que os eventos ocorrem na mesma posicao, e sempre
menor que o tempo medido em um referencial em que os eventos ocorrem em diferentes posicoes. Dividindo
ambos os lados por e substituindo t/ por L0 /L, obtemos
p
L = 1 v 2 L0 ,
de modo que o comprimento proprio, isto e, o comprimento de um objeto em um referencial em que ele esta
em repouso, e sempre maior que o comprimento do objeto medido em um referencial em relacao ao qual ele
se move (mover-se em relacao a um objeto causa a contracao do mesmo na dimensao ao longo da direcao
do movimento).
2.4.5 Lei de Adicao de Velocidades

Considere tres referenciais inerciais em movimento relativo. Temos como antes o referencial inercial O (t, x, y, z)
e o referencial inercial O0 (t0 , x0 , y 0 , z 0 ) que se move com velocidade v 0 na direcao positiva do eixo x do referen-
cial inercial O. Temos agora um terceiro referencial inercial O00 (t00 , x00 , y 00 , z 00 ) que se move com velocidade
v 00 na direcao positiva do eixo x0 do referencial inercial O0 . Assumimos os eixos y, z, y 0 , z 0 , y 00 , z 00 transversais
a direcao do movimento relativo e a origem dos tres referenciais coincidindo no tempo t = t0 = t00 = 0. Qual
e a velocidade v do referencial inercial O00 (t00 , x00 , y 00 , z 00 ) em relacao ao referencial inercial O?
Para obter a resposta, basta usar a propriedade de grupo das transformacoes de Lorentz. A trans-
formacao de Lorentz das coordenadas do referencial O00 para as coordenadas do referencial O e o produto
da transformacao de Lorentz das coordenadas do referencial O00 para as coordenadas do referencial O0 pela
transformacao de Lorentz das coordenadas do referencial O0 para as coordenadas do referencial O. Assim,
temos ao mesmo tempo 00
t v 0 0 t
x v 0 0 x00
y = 0 0 1 0 y 00

z 0 0 0 1 z 00
e 0
v0 0 0 0 00 v 00 00 0 0
00
t t
x v 0 0 0 0 0 v 00 00 00
0 0 x00
y = 0
,
1 0 y 00

0 1 0 0 0
z 0 0 0 1 0 0 0 1 z 00
isto e,
0
v0 0 0 00 v 00 00

v 0 0 0 0 0
0 0
v
0 0
= v
0 0 0 00 00
v 00 0 0
0 0 1 0 0 0 1 0 0 0 1 0
0 0 0 1 0 0 0 1 0 0 0 1
0 00 0 00
0 00 (v 0 + v 00 ) 0

(1 + v v ) 0
0 00 (v 0 + v 00 ) 0 00 (1 + v 0 v 00 ) 0 0
= .
0 0 1 0
0 0 0 1
Portanto,
= 0 00 (1 + v 0 v 00 ) ,
v = 0 00 (v 0 + v 00 ) .
Logo, a lei de adicao de velocidades na teoria da relatividade e

v 0 + v 00
v= ,
1 + v 0 v 00
o que e bastante diferente da lei de adicao de velocidades na mecanica Newtoniana (la, v = v 0 + v 00 ). Em

particular, se os referenciais viajam com velocidade menor ou igual a velocidade da luz, um em relacao ao
outro, a velocidade do terceiro referencial em relacao ao primeiro tambem e menor que a velocidade da luz,
como provamos a seguir.
2.32 Proposicao. Se
|v 0 | , |v 00 | 6 1
e
v 0 + v 00
v= ,
1 + v 0 v 00
entao
|v| 6 1.
Prova:
Demonstracao 1 (mais elementar). Se |a| < 1, a funcao f : R R definida por
x+a
f (x) =
1 + ax
e crescente, pois
1 a2
f 0 (x) = 2 > 0.
(1 + ax)
Como f (1) = 1 e f (1) = 1, segue que f ((1, 1)) = (1, 1), donde o resultado.
Demonstracao 2 (menos elementar, mas oferece um importante insight). A funcao tangente
hiperbolica, definida da maneira esperada por
senh x
tanh x = , (2.16)
cosh x
e uma funcao estritamente crescente, pois sua derivada e
d cosh x cosh x senh x senh x cosh2 x senh2 x

tanh x = =
dx cosh2 x cosh2 x
1
= > 0,
cosh2 x
mpar (pois e o produto de uma funcao par e uma funcao mpar) e satisfaz
|tanh x| < 1 para todo x R (2.17)
pois
|senh x| < cosh x
para todo x R, ja que sempre temos
|ex ex | ex + ex
<
2 2
e
tanh (R) = (1, 1) , (2.18)
porque, pela regra de LHopital,
senh x ex ex
lim tanh x = lim = lim x
x+ x+ cosh x x+ e + ex
2x
e 1 2e2x
= lim 2x = lim = 1.
x+ e + 1 x+ 2e2x
Vale a identidade
tanh a + tanh b
tanh (a + b) = . (2.19)
1 + tanh a tanh b
De fato, temos
senh (a + b) = senh a cosh b + cosh a senh b,

cosh (a + b) = cosh a cosh b + senh a senh b.
Isso e facilmente verificado:

ea ea eb + eb ea + ea eb eb
senh a cosh b + cosh a senh b = +
2 2 2 2
ea+b + eab ea+b eab ea+b eab + ea+b eab
= +
4 4
a+b ab
e e
=
2
= senh (a + b) ,
ea + ea eb + eb ea ea eb eb
cosh a cosh b + senh a senh b = +
2 2 2 2
ea+b + eab + ea+b + eab ea+b eab ea+b + eab
= +
4 4
ea+b + eab
=
2
= cosh (a + b) .
Da,
senh (a + b) senh a cosh b + cosh a senh b
tanh (a + b) = =
cosh (a + b) cosh a cosh b + senh a senh b
senh a cosh b + cosh a senh b
= cosh a cosh b
cosh a cosh b + senh a senh b
cosh a cosh b
senh a senh b
+
= cosh a cosh b
senh a senh b
1+
cosh a cosh b
tanh a + tanh b
= .
1 + tanh a tanh b
Segue de (2.18) e da injetividade da funcao tangente hiperbolica que se
|v 0 | , |v 00 | < 1,
entao existem unicos a, b R tais que
v 0 = tanh a,
v 00 = tanh b.
Portanto, segue de (2.19) que

tanh a + tanh b
v= = tanh (a + b) ,
1 + tanh a tanh b
donde
|v| < 1.
Se v 0 = 1, entao
1 + v 00
v= =1
1 + v 00
e se v 0 = 1, entao
1 + v 00
v= = 1.
1 v 00
As mesmas conclusoes valem para v 00 = 1.
2.4.6 Rotacoes Hiperbolicas

Considere a transformacao de Lorentz bidimensional

v 0 0
v 0 0
L= 0
,
0 1 0
0 0 0 1
com
1
= .
1 v2
Escrevendo
v = tanh ,
para um unico R, como vimos na demonstracao da Proposicao 2.32, como
1 1 cosh cosh
p =s =p = ,
1 tanh2 2 2
cosh senh 2 1
senh
1
cosh2
segue que
= cosh . (2.20)
Da
v = tanh cosh = senh .
Podemos portanto escrever
cosh senh 0 0
senh cosh 0 0
L= ,
0 0 1 0
0 0 0 1
Nas duas primeiras coordenadas, isso e simplesmente
t0

t cosh senh
= .
x senh cosh x0
2.33 Definicao. A transformacao

cosh senh
R = (2.21)
senh cosh
e chamada uma rotacao hiperbolica de rapidez .
Em termos da rapidez, se denotarmos por LOO0 a transformacao de Lorentz das coordenadas do referencial
O0 para o referencial O, a lei de adicao de velocidades da teoria da relatividade pode ser escrita na forma
(LOO00 ) = (LOO0 ) + (LO0 O00 ) . (2.22)
Portanto, o subgrupo dos boosts em relacao a uma direcao fixada e isomorfo ao grupo a um parametro de
adicoes R. Dado que boosts sao rotacoes hiperbolicas e que as rotacoes em R3 formam um grupo (ou seja, a
composta de duas rotacoes no espaco em relacao ao mesmo eixo ou em relacao a eixos diferentes e uma rotacao
no espaco em relacao ao mesmo eixo ou em relacao a um eixo diferente dos outros dois, respectivamente)
podemos entender a surpresa de Einstein ao ser informado que os boosts nao formam um grupo, ou seja,
que a composta de rotacoes hiperbolicas em R4 nao e uma rotacao hiperbolica (em R2 evidentemente e).
Captulo 3
Paradoxos
3.1 Diagramas de Espacotempo

Uma tecnica eficiente, e com a vantagem adicional de ser visual e portanto facil de entender, para resolver
problemas de relatividade especial e a analise de diagramas espacotempo. Nesta secao examinaremos
alguns exemplos.
Em primeiro lugar, vamos entender como representar as coordenadas espacotempo de dois referenciais
inerciais no mesmo diagrama espacotempo. Vamos nos restringir a uma dimensao temporal.
Escolha um dos referenciais inerciais. Escolhemos o referencial inercial Laboratorio. Os eixos t, x neste re-
ferencial inercial sao representados perpendicularmente, como usual. Em seguida representamos a trajetoria
no espacotempo do referencial inercial Nave nas coordenadas do referencial Laboratorio. Esta trajetoria
corresponde ao eixo t0 do referencial inercial Nave, pois, ao longo desta trajetoria, a posicao da nave nao
44
muda. Para obter o eixo x0 do referencial inercial Nave, precisamos obter as linhas de simultaneidade em
relacao a este referencial, pois o eixo x0 e exatamente o conjunto dos pontos que tem coordenada temporal
t0 = 0. Para obter as linhas de simultaneidade do referencial Nave, trace primeiro as duas trajetorias de
raios de luz no referencial Laboratorio; se os eixos tem a mesma escala (tempo e espaco medidos em metros),
estas trajetorias fazem um angulos de 45 com os eixos. As linhas de simultaneidade do referencial Nave
sao entao as linhas paralelas tais que os pontos das intersecoes destas linhas com as trajetorias da luz sao
equidistantes da trajetoria da nave (porque eles ocorrem ao mesmo tempo no referencial inercial Nave, ja
que a velocidade da luz e a mesma em todos os referenciais inerciais). Uma destas linhas de simultaneidade
sera o eixo x0 ; qual delas dependera da escolha da origem no referencial inercial Nave (na figura, as origens
dos dois referenciais foi escolhida como sendo a mesma).
Usando diagramas espacotempo podemos por exemplo entender melhor a contracao de Lorentz e a di-
latacao do tempo. No diagrama a seguir, a barra em repouso no referencial laboratorio (t, x) tem compri-
mento proprio L. No referencial nave (t0 , x0 ), o comprimento L0 da barra e medido quando os seus extremos
sao simultaneos, isto e, ao longo de uma linha de simultaneidade deste referencial. Portanto, o segmento
correspondente a L0 no diagrama e a hipotenusa de um triangulo retangulo cujo cateto correspondente a L e
paralelo ao eixo x; o outro cateto e a diferenca temporal t entre os extremos do segmento L0 (vistos como
eventos no espacotempo) quando eles sao medidos no referencial (t, x), onde eles nao sao simultaneos. Como
2 2
(L0 ) = L2 (t) ,
segue que
L0 < L.
No proximo diagrama, os eventos A e B ocorrem na mesma posicao x0 = 0 no referencial nave (t0 , x0 ). O

intervalo de tempo t0 decorrido entre eles e portanto o tempo proprio entre os dois eventos. Novamente, o
segmento correspondente que tem estes eventos como extremos e a hipotenusa de um triangulo retangulo cujo
cateto paralelo ao eixo t tem comprimento t, que e o intervalo de tempo entre os eventos A e B conforme
eles sao medidos no referencial laboratorio (t, x); o outro cateto tem comprimento x e e o intervalo de
espaco entre os eventos A e B conforme eles sao medidos no referencial laboratorio (t, x). Como
2 2 2
(t0 ) = (t) (x) ,
segue que
t > t0 .
3.2 Impossibilidade de se viajar acima da velocidade da luz

Nesta secao quotamos diretamente de [Taylor-Wheeler], Box L-1, pp. 108109, com pequenas modificacoes,
para um exemplo dramatico de como a possibilidade de um objeto material viajando a velocidade da luz
viola a ordem natural de causa e efeito.
O Tratado de Paz de Shalimar entre a Federacao Unida dos Planetas e o Imperio Klingon foi assinado 4
anos antes da Grande Traicao. Sendo um evento tao crucial na historia do Quadrante Alfa de nossa galaxia,
ele foi tomado como o zero nos sistemas de coordenadas do espacotempo.
Pelo Tratado de Shalimar, os Klingons concordaram em parar de atacar os postos avancados da Federacao
em retorno por acesso ao Banco de Dados Tecnico da Federacao. Os negociadores da Federacao deixaram o
planeta Shalimar imediatamente apos assinar o tratado, na nave estelar Enterprise viajando a 0, 6 da velo-
cidade da luz (por algum motivo ate hoje inexplicado, o warpdrive nao estava funcionando; os historiadores
debatem se houve ou nao sabotagem). Em 4 anos, os Klingons usaram o seu acesso garantido ao Banco
de Dados Tecnico da Federacao para desenvolver um torpedo fotonico superavancado, de elevado alcance e
poder de destruicao, e com a capacidade de viajar acima da velocidade da luz, que eles chamaram de Super.
Naquele dia negro da Grande Traicao (evento de referencia 0), os Klingons testaram o Super, disparando
ele a partir do planeta Shalimar exatamente na Enterprise contendo os negociadores, a 3 vezes a velocidade
da luz. O torpedo atingiu a nave destruindo-a completamente. Nao houve sobreviventes. Um perodo ainda
mais longo de guerras e batalhas estelares do que antes da assinatura do tratado teve sequencia.
Os eventos estao descritos no diagrama de espacotempo abaixo, do ponto de vista dos Klingons, isto e,
no referencial inercial do planeta Shalimar (coordenadas t, x).
Com obter uma visao equilibrada da Historia, vamos investigar os acontecimentos do ponto de vista da
Federacao, mais especificamente no referencial inercial da nave Enterprise (coordenadas t0 , x0 ). Especifica-
mente, quando ocorreram neste sistema de coordenadas a assinatura do Tratado de Shalimar (evento A) e o
impacto do Super com a nave, que causou a sua completa destruicao (evento B)?
Temos
(tA , xA ) = (4, 0) ,
(tB , xB ) = (1, 3) .
Como a velocidade da Enterprise em relacao ao planeta Shalimar e 0, 6, segue que o fator de dilatacao do
tempo e
1 1
= =p = 1, 25.
1v 2 1 0, 62
de modo que a transformacao de Lorentz do referencial inercial de Shalimar para o referencial inercial
Enterprise e
v 1, 25 0, 75
= .
v 0, 75 1, 25
Logo,
t0A

1, 25 0, 75 tA 1, 25 0, 75 4 5
= = =
x0A 0, 75 1, 25 xA 0, 75 1, 25 0 3
e
t0B

1, 25 0, 75 tB 1, 25 0, 75 1 1
= = =
x0B 0, 75 1, 25 xB 0, 75 1, 25 3 3
Portanto, no referencial inercial da Enterprise, sua explosao ocorre antes que os Klingons disparem o
torpedo. Na verdade, se formos interpretar os eventos ocorridos no diagrama de espacotempo da Enterprise,
ela misteriosamente explode ao mesmo tempo que dispara um novo torpedo fotonico em orientacao reversa
(propulsor superluz na frente da ogiva) na direcao do planeta Shalimar, torpedo este que miraculosamente
entra no lancador dos Klingons sem causar-lhes quaisquer danos. O Imperio Klingon usa esta interpretacao
dos dados para acusar a Federacao de duplicidade e de ela ter causado o reincio das hostilidades, disparando
um torpedo defeituoso a partir da nave dos negociadores que causou a destruicao da propria nave estelar
agressora, mas que por sorte foi capturado pelos Klingons antes de causar danos.
Em geral, se algum objeto material ou sinal puder exceder a velocidade da luz, a ordem cronologica de
eventos sera alterada em algum referencial inercial. De fato, se isso ocorre, a trajetoria no espacotempo
do objeto material ou sinal tera uma inclinacao menor que 45 em relacao ao eixo x. Logo, existira um
referencial inercial em que estes eventos ocorrem simultaneamente. E quando observados a partir de qualquer
referencial inercial movendo-se com uma velocidade maior que este segundo referencial, a ordem cronologica
dos eventos sera alterada. Por exemplo, no diagrama espacotempo abaixo, o evento A e a emissao de um
sinal ou lancamento de um objeto (projetil) acima da velocidade da luz e o evento B e a recepcao deste sinal
ou projetil. E facil ver no referencial inercial (t, x) que o sinal ou objeto viaja acima da velocidade da luz,
pois a sua trajetoria tem inclinacao menor que a inclinacao da trajetoria de um raio de luz neste referencial.
Obtemos entao um referencial inercial (t0 , x0 ) em que esta trajetoria e paralela as linhas de simultaneidade
neste referencial; isso significa que os eventos A e B ocorrem simultaneamente neste referencial. Ou seja, nos
deparamos com um sinal instantaneo (comunicacao instantanea) ou com o teletransporte instantaneo de um
objeto material. Ja no referencial inercial (t00 , x00 ), o evento B ocorre antes do evento A: o sinal ou objeto
foi primeiro recebido e depois foi enviado.
3.3 Geodesicas no Espaco de Minkowski

Considere os eventos A e B no espacotempo e as duas trajetorias possveis , de dois observadores de um
evento a outro de acordo com diagrama espacotempo abaixo, em relacao ao referencial inercial do observador
que segue a trajetoria .
O observador que segue a trajetoria permanece em repouso durante todo o tempo, isto e, os eventos A
e B ocorrem na mesma posicao em seu referencial inercial. Portanto, como ja vimos antes, o tempo proprio
medido no seu referencial e exatamente
tB tA .
O observador que segue a trajetoria curva no espacotempo claramente nao esta em um referencial inercial,
ja que o proprio fato da sua trajetoria ser curva em relacao a um referencial inercial mostra que ele sofre
aceleracao ao longo de sua trajetoria. Por outro lado, faz sentido comparar o tempo proprio que ele mede
(em seu referencial nao inercial), ou seja, quanto tempo se passa medido no seu relogio de pulso ou no seu
relogio biologico. Dividindo a sua trajetoria em segmentos infinitesimais e usando a metrica de Lorentz,
conclumos como na figura que em cada um destes segmentos da sua trajetoria vale
2 2 2 2
( ) = (t) (x) 6 (t) ,
ou seja,
6 t.
Somando (integrando) as contribuicoes destes segmentos infinitesimais ao longo da trajetoria toda, con-
clumos que o tempo proprio medido seguindo-se a trajetoria e menor que o tempo proprio medido ao
longo da trajetoria , onde o observador encontra-se em repouso. Mais precisamente, podemos escrever
" 2 #
2 2 2 x 2
( ) = (t) (x) = 1 (t) ,
t
de modo que p
= 1 v 2 t,
donde Z tB p
AB = 1 v 2 dt.
tA

Da, como 1 v 2 < 1, segue que Z tB
AB < dt = tAB .
tA
Assim, trajetorias curvas diminuem o tempo proprio, de modo que
retas tem tempo proprio maximo.
Embora acabamos de ver isso apenas no caso em que o observador encontra-se em repouso, isto e, eventos A
e B ocorrem no mesmo referencial, e facil obter a mesma conclusao no caso geral, fazendo-se uma mudanca
de coordenadas.
3.4 Paradoxo dos Gemeos

Esta secao e adaptada de [Takeuchi], Secao 6.6, pp. 148153 e [Taylor-Wheeler], Secoes 4.6 (pp. 125126) e
4.9 (pp. 128131) e, crucialmente, Exerccio 5-8 (p. 169).
Uma nave espacial viaja da Terra para a estrela Canopus, percorrendo uma distancia de 99 anos-luz a
uma velocidade 99/101 da luz. Isso significa que ela viaja os 99 anos-luz de distancia, medidos no referencial
inercial Terra em 101 anos de tempo. Como vimos na Secao 1.7.2, o tempo que os astronautas medem no
referencial Nave, isto e, o tempo proprio decorrido entre os eventos A (partida da espaconave da Terra)
e B (chegada da nave em Canopus) e 20 anos. Segue que se a nave retornar para a Terra com a mesma
velocidade, o tempo decorrido entre os eventos A e C (retorno da espaconave a Terra) e medido no referencial
inercial Terra como sendo de 202 anos, enquanto que o tempo medido no referencial Nave sera de apenas 40
anos. Para efeitos dramaticos, se um dos astronautas tivesse um irmao gemeo na epoca que partiu da Terra
e este tivesse permanecido la, quando ele retornar, o irmao gemeo terrestre tera envelhecido 202 anos (mas
talvez nao tenha morrido, pois se foi desenvolvida tecnologia para viajar a velocidades proximas da luz, e
possvel que tambem foi desenvolvida tecnologia para permitir as pessoas viverem consideravelmente mais
tempo) enquanto que o irmao gemeo astronauta tera envelhecido apenas 40 anos.
O paradoxo dos gemeos e o seguinte: como todos os referenciais inerciais sao equivalentes, na primeira
parte da viagem, da Terra a Canopus, o astronauta mede no referencial inercial Nave que a Terra viajou
para um ponto situado a 99 anos-luz de distancia de sua posicao a uma velocidade 99/101 da luz, levando
portanto 101 anos para atingir aquela posicao, enquanto que do ponto de vista do referencial Terra, so se
passaram 20 anos; na segunda parte da viagem, a Terra retornou a posicao que o espaconave ocupa, tendo
gastado novamente 101 anos de acordo com o referencial Nave e 20 anos de acordo com o referencial Terra.
Portanto, passaram-se 202 anos na espaconave e apenas 40 anos na Terra, exatamente o contrario do que
havamos concludo no paragrafo anterior.
A resolucao trivial deste paradoxo e que enquanto o referencial Terra e de fato um referencial inercial pois
permanece em repouso (relativamente) durante toda a viagem, o referencial Nave e um referencial inercial na
primeira parte da viagem, mas e um referencial inercial diferente na segunda parte da viagem. No momento
em que ele muda a direcao do seu movimento para retornar para a Terra, ele deixa de ser um referencial
inercial, ele passa de um referencial inercial para outro.
Mas ainda ha duas questoes interessantes a resolver:
1. Sera que os calculos que fizemos anteriormente ainda estao corretos, isto e, decorreram-se 202 anos
na Terra e apenas 40 anos na espaconave, ou a aceleracao que a espaconave sofreu quando mudou de
direcao para retornar a Terra afeta os calculos?
2. A questao anterior pode ser resolvida no ambito da Teoria da Relatividade Especial, que trata apenas
de referenciais inerciais em movimento retilneo uniforme um com relacao ao outro, ou, ja que existe
uma aceleracao envolvida na mudanca da direcao da espaconave, esta questao so pode ser resolvida no
ambito da Teoria da Relatividade Geral que, como veremos, trata tambem de referenciais acelerados?
Em [Taylor-Wheeler], Box 4-1, p. 132, os autores afirmam categoricamente que nao ha necessidade de se
usar a Teoria da Relatividade Geral. Ja em [Stephani], Secao 3.4, pp. 2021, o autor afirma que para uma
resposta confiavel, e necessario recorrer a Teoria da Relatividade Geral. Ambos estao corretos.
A Teoria da Relatividade Especial se aplica apenas a observacoes (medicoes) feitas em referenciais iner-
ciais, de modo que nao podemos realmente dizer o que aconteceu com o astronauta durante o processo de
aceleracao. Mas, supondo que podemos tornar o processo de aceleracao tao curto quanto quisermos, po-
demos considerar um salto instantaneo de um referencial para o outro. Acompanhe a nossa discussao no
diagrama espacotempo a seguir. O referencial inercial da Terra tem coordenadas (t, x), o referencial inercial
da nave na ida tem coordenadas (t0 , x0 ) e o referencial inercial da nave na volta tem coordenadas (t00 , x00 ). O
salto entre referenciais inerciais ocorre no evento B (chegada da nave a Canopus e, simultaneamente, partida
de volta para a Terra). Imediatamente na chegada a Canopus, o evento B e simultaneo ao evento D na
Terra. Com a mudanca instantanea de referenciais (mudanca instantanea da direcao da trajetoria da nave),
o tempo medido na Terra da um salto de D para E (observe as linhas de simultaneidade; a linha inferior
e a linha de simultaneidade no referencial inercial da nave na ida, isto e, os eventos C e D sao simultaneos
neste referencial, e a linha de simultaneidade superior e a linha de simultaneidade do referencial inercial da
nave na volta, isto e, os eventos C e E sao simultaneos neste outro referencial; os eventos D e E nao estao
em escala no eixo t, pois, como veremos a seguir, eles estao relativamente muito proximos dos eventos A e
C, respectivamente). Por causa deste efeito, o astronauta sera mais jovem que o seu irmao gemeo quando
retornar a Terra.
Vamos determinar a localizacao no espacotempo dos eventos D, E nas coordenadas do referencial inercial
Terra para calcular o tempo decorrido la entre a partida da nave e o seu retorno. Para isso vamos encontrar
as equacoes para as linhas de simultaneidade nas coordenadas (t, x). O fator de dilatacao do tempo e
1 1 101
= =s 2 = 20 .
1 v2
99
1
101
Como
t0

v t
= ,
x0 v x
obtemos a equacao para a linha de simultaneidade inferior
101 99
t0 = t vx = t x,
20 20
isto e, como t0D = 20,
101 99
20 = t x.
20 20
Como xD = 0, segue que que
400
tD = = 3, 96,
101
ou seja, quando a nave chega em Canopus depois de 20 anos, como medido no seu referencial, ela mede
que transcorreram 3, 96 anos na Terra. Quando a nave salta de referencial, apos mudar de direcao, a linha
de simultaneidade superior tem inclinacao igual e com sinal oposto ao da linha de simultaneidade inferior.
Como a posicao do evento C no referencial Terra e (tC , xC ) = (202, 0), pois o ponto medio da trajetoria
da Terra no espacotempo tem posicao (101, 0), simultaneo ao evento B no referencial inercial Terra, como
vimos, segue por simetria que
tE = 202 3, 96 = 198, 04,
ou seja, nesta mudanca instantanea de referenciais ha um salto na medida do tempo transcorrido na Terra
conforme a nave mede: o tempo na Terra conforme medido no novo referencial inercial da nave na volta e
que transcorreram na Terra 198, 04 anos. Assim, quando a nave retorna a Terra, transcorreram na Terra
202 anos, enquanto que na nave transcorreram apenas 40 anos.
E claro que este salto na contagem de tempo e fisicamente impossvel, assim como e fisicamente impossvel
uma mudanca instantanea na direcao da nave. Numa situacao fsica real, a nave levaria algum tempo para
mudar de direcao, de modo que a sua trajetoria no espacotempo seria uma curva diferenciavel, com as linhas
de simultaneidade mudando de forma contnua a medida que a nave desacelera e acelera para mudar de
direcao. Teramos entao uma trajetoria curva que, como vimos na Secao 3.3, tem um tempo proprio menor
que o tempo medido na trajetoria reta entre os eventos A e C; uma analise detalhada do paradoxo dos
gemeos ao longo deste argumento pode ser vista em [Ferraro], Secao 4.5, pp. 103107.
A historia do paradoxo dos gemeos comeca no ano 1911 e foi um dos fenomenos mais discutidos e
incompreendidos da teoria, mas a ocorrencia do fenomeno foi confirmada experimentalmente um numero
enorme de vezes, de forma direta depois da invencao dos relogios atomicos em 1949 (relogios atomicos em
avioes marcaram um tempo menor do que o decorrido no chao entre decolagem e aterrisagem). Veja [Topper],
pp. 77-78, 127129 (a resolucao de Einstein usando a Teoria da Relatividade Geral; aceleracao, assim como
a gravidade, faz com que o tempo ande mais devagar), pp. 145146 (uma comprovacao atraves dos inumeros
experimentos realizados em aceleradores de partculas em circuito fechado).
Captulo 4
Momento-Energia
4.1 4-Vetores
Tanto na Teoria da Relatividade Especial quanto na Geral, e conveniente descrever o movimento de um
objeto em um referencial inercial (em Relatividade Especial) ou em um sistema de coordenadas geral (em
Relatividade Geral) em coordenadas do espacotempo dependendo do seu tempo proprio , isto e, de acordo
com o tempo medido em seu proprio referencial, e portanto independente de referencial. Assim, em um
referencial inercial a trajetoria de uma partcula livre e uma curva parametrizada pelo tempo proprio
( ) = (t ( ) , x ( ) , y ( ) , z ( )) ,
e a geodesica que uma partcula livre segue no espacotempo curvo seria parametrizada pelo tempo proprio
( ).
Vetores no espacotempo tem 4 coordenadas e para distingui-los dos vetores espaciais (projecoes espaciais),
sao frequentemente chamados de quadrivetores ou 4-vetores. Assim, temos o quadrivetor deslocamento,
ou seja deslocamento no espacotempo
s = (t, x, y, z)
e o quadrivetor velocidade
ds dt dx dy dz
u= = , , , , (4.1)
d d d d d
ou 0 ( ) para uma trajetoria curva ( ) no espacotempo. O quadrivetor velocidade e por definicao tangente
a trajetoria da partcula no espacotempo.
Observe que se a trajetoria do objeto no espacotempo e uma curva, o seu referencial proprio obviamente
nao e um referencial inercial. Entretanto, em cada instante de tempo existe um referencial inercial que tem
a mesma velocidade que o objeto; este referencial inercial que comove com o objeto e temporario, pois no
proximo instante de tempo ele nao esta mais se comovendo com o objeto. Ele e chamado o seu referencial
comovente temporario (em ingles: momentarily comoving reference frame (MCRF)). O quadrivetor veloci-
dade em um determinado instante de tempo (tangente a trajetoria da partcula naquele instante de tempo)
e justamente o vetor base e0 do seu referencial comovente temporario naquele momento.
Como o tempo proprio do objeto e o tempo t de um referencial inercial arbitrario estao relacionados
atraves da equacao p
= 1 v 2 t, (4.2)
onde v e a velocidade espacial do objeto em relacao a este referencial inercial (v = kvk), isto e,

dx dy dz
v= , , ,
dt dt dt
54
segue que p
d = 1 v 2 dt,
e portanto as coordenadas do quadrivetor velocidade no referencial inercial tambem podem ser escritas na
forma
1 dx dy dz 1
u= 1, , , = (1, v)
1 v2 dt dt dt 1 v2
ou
1 1
u= (1, v x , v y , v z ) = (1, v) . (4.3)
1v 2 1 v2
Observe que quando v << 1 temos t e
u (1, v x , v y , v z ) = (1, v) ,
e o quadrivetor velocidade de um objeto em repouso em relacao ao referencial inercial (trajetoria vertical no

espacotempo) tem neste referencial coordenadas
u = (1, 0, 0, 0) .
Em particular, segue tambem que se v 6= 1 o quadrivetor velocidade e um vetor unitario, isto e,

2
kuk = 1 (4.4)
pois

1 1
hu, ui = (1, v x , v y , v z ) , (1, v x , v y , v z )
1 v2 1 v2
1 h x 2 y 2 z 2
i
= 1 + (v ) + (v ) + (v )
1 v2
1
1 + v 2

= 2
1v
= 1.
4.2 Momento-Energia
4.1 Definicao. Se m e a massa de um objeto, definimos o quadrivetor momento-energia
P = mu. (4.5)
Em um referencial inercial arbitrario, segue que o quadrivetor momento-energia tem coordenadas

m m
P= (1, v x , v y , v z ) = (1, v) .
1v 2 1 v2
Observe que como velocidade e adimensional em relatividade (tempo e espaco sao medidos com a mesma
unidade), o quadrivetor momento-energia tem unidades de massa. De fato, se v 6= 1
hP, Pi = hmu, mui = m2 hu, ui = m2 ,
de modo que
2
kPk = m2 . (4.6)
Note que a massa m de um objeto, sendo a norma do quadrivetor momento-energia (um vetor do espacotempo
de Minkowski), tem o mesmo valor em qualquer referencial inercial. Em outras palavras, ela nao depende
da velocidade do referencial: massa nao aumenta com a velocidade e na teoria da relatividade nao se define
massa relativstica (veja [Okun1] para uma exposicao clara, incluindo a origem historica deste termo e
ate seu uso inicial por Einstein para inferir a atracao da luz por uma massa gravitacional (ele raciocinou
que fotons teriam massa m = E/c2 ), antes de formular a Teoria da Relatividade Geral, quando abandonou
essa ideia inconsistente, e uma coletanea de artigos criticando os conceitos de massa de repouso e massa
relativstica em [Okun2]). Por outro lado, massa e mais facilmente medida em um referencial em que o
objeto esta em repouso.
Se m = 0, entao P e um vetor do tipo luz, e consequentemente u tambem e, donde v = 1. Portanto,
fotons nao possuem massa.
4.2 Definicao. A componente temporal do quadrivetor momento-energia e chamada a energia rela-
tivstica E do objeto e sua projecao espacial o seu momento relativstico p.
Assim,
m
E= ,
1 v2
mv x mv y mv z

m
p= v= , , ,
1 v2 1 v2 1 v2 1 v2
de modo que
m2 = E 2 p2 . (4.7)
Note que tanto a energia relativstica quanto o momento relativstico dependem do referencial, ja que sao
componentes (coordenadas) de um quadrivetor. Observe tambem que massa nao e a mesma coisa que energia:
energia e a componente temporal do quadrivetor momento-energia, enquanto que massa e a magnitude deste
vetor. Apenas que, em relatividade, elas sao medidas com as mesmas unidades de medida (quilogramas), da
mesma forma que tempo e espaco em relatividade sao medidos com as mesmas unidades de medida (metros),
apesar de nao serem a mesma coisa.
Em unidades do espacotempo (ct, x, y, z) em que a velocidade da luz e c e nao normalizada para 1, a
relacao entre o tempo proprio e o tempo em um referencial inercial arbitrario e
r v 2
= 1 t
c
e o quadrivetor velocidade tem coordenadas
1 x y z 1
u= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1 1
c c
de modo que o momento-energia e
m x y z m
P= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1 1
c c
mas a energia relativstica e
mc2
E=r v 2
1
c
(para que as unidades de medida de energia fiquem corretas) e o momento relativstico e

mv
p= r v 2 ,
1
c
ou seja,
E
P= ,v .
c
Quando v = 0, temos
E0 = m
ou, quando a velocidade da luz nao e normalizada, a celebre equacao
E0 = mc2
para a energia de repouso; ou seja, a energia de um objeto nao desaparece quando ele esta em repouso, como
na mecanica de Newton, mas ao contrario e enorme (por causa do fator c2 ).
Captulo 5
Aceleracao no Espacotempo de
Minkowski
58
Captulo 6
O Tensor do Campo Eletromagnetico
59
Captulo 7
O Princpio de Equivalencia
Geodesicas no Espacotempo Curvo
7.1 O Pensamento Mais Feliz da Vida de Einstein

A Teoria da Gravitacao Universal de Newton, baseada na acao a distancia instantanea de uma forca gravi-
tacional oculta e completamente incompatvel com a Teoria da Relatividade, onde nada pode viajar a uma
velocidade superior a da luz. Einstein precisava, portanto, inventar uma nova teoria de gravitacao (alem
da necessidade obvia de estender a teoria da relatividade para referenciais acelerados). O mais importante
insight que Einstein teve na sua busca pela Teoria da Relatividade Geral foi em 1907, conforme relatado
pelo mesmo em suas proprias palavras (quotado da traducao do original alemao para o ingles em [Topper],
Cap. 12, p. 89):
Quando eu estava ocupado [em 1907] escrevendo um resumo do meu trabalho na teoria da relativida
especial ..., eu tambem tinha que tentar modificar a teoria da gravitacao de Newton para adaptar as suas leis
na teoria. Por mais que tentativas nesta direcao mostraram a praticalidade do empreendimento, elas nao me
satisfaziam porque elas tinham que ser baseadas em hipoteses sem fundamento fsico. Naquele momento,
eu tive o pensamento mais feliz da minha vida [der Glucklichste Gedanke meines Lebens, que pode
ser alternativamente traduzido tambem como o mais sortudo, ou o mais afortunado ou o mais bem sucedido
pensamento da minha vida.], na seguinte forma:
Em um exemplo que vale a pena considerar, o campo gravitacional tem uma existencia relativa similar ao
campo eletrico gerado por inducao eletromagnetica. Porque, para um observador em queda livre do telhado
de uma casa, durante a sua queda nao existe nenhum campo gravitacional, pelo menos em sua vizinhanca
imediata. Especificamente, se o observador soltar quaisquer corpos, eles permanecem em um estado de
repouso ou movimento uniforme, relativamente a ele, independentemente de sua natureza qumica ou fsica
especial [ignorando a resistencia do ar, e claro]. O observador, portanto, esta justificado em interpretar seu
estado como sendo em repouso.
Em uma palestra em Kyoto, ele caracterizou este pensamento da seguinte maneira: Repentinamente, uma
ideia me ocorreu: Se uma pessoa cair livremente, ela nao deve sentir o seu proprio peso. Imediatamente
eu me surpreendi. Este pensamento simples me deixou com uma impressao profunda, com efeito.
Ou seja, localmente nao existe gravidade, o espacotempo e o espacotempo de Minkowski, isto e, a metrica
e a metrica de Lorentz, da Relatividade Especial. Como vimos na Secao 1.3, localmente no espaco e no tempo
um pequeno elevador em queda livre e um referencial inercial. Localmente quer dizer eventualmente em um
ponto no espacotempo, ja que em uma regiao finita do espacotempo sempre aparecem os efeitos de mare, se
a resolucao e suficientemente boa.
A gravidade surge como um fenomeno global, considerando como os varios referenciais inerciais variam
na vizinhanca de um ponto, isto e, a gravidade surge quando se cola os espacotempos de Lorentz em cada
60
ponto para obter uma estrutura global.

Assim, para se obter uma Teoria da Gravitacao, e necessario primeiro saber como colar estes varios
espacotempos de Minkowski. Por sorte, o maquinario matematico para fazer isso foi desenvolvido no incio
da segunda metade do seculo XIX por Riemann. Por azar, quando Einstein era estudante de Fsica no
Instituto Politecnico de Zurich na Suca, ele matava as aulas de Matematica e preferia passar o tempo
nos laboratorios, observando os experimentos que eram realizados. Por sorte, ele tinha um bom amigo,
Marcel Grossmann, especialista em geometria nao euclideana. A partir de 1912, eles trabalharam juntos,
publicando uma serie de artigos a partir de 1912 que tiveram um papel importante na jornada ate a Teoria
da Relatividade Geral. Mas os esforcos nao foram realmente bem sucedidos ate que Einstein reintroduziu
a regra da covariancia que havia na Teoria da Relatividade Especial, isto e, que as equacoes deveriam
ter a mesma forma em todos os referenciais inerciais (ate entao, os dois tinham trabalhado sem assumir
que as equacoes eram covariantes). A Teoria da Relatividade Geral foi anunciada por Einstein sozinho em
novembro de 1915 em uma serie de 4 palestras na Academia de Ciencias da Prussia e publicada em marco
de 1916. Este artigo, A Fundacao da Teoria da Relatividade Geral comeca com um reconhecimento do
trabalho de Minkowski (recorde o final da Secao 2.3), que foi o primeiro a reconhecer a equivalencia formal
das coordenadas espaciais e as coordenadas temporais, e usou isso na construcao da teoria. Alem disso,
Einstein em reconhecimento agradeceu meu amigo, o matematico Grossmann, cuja ajuda nao apenas
me salvou o esforco de estudar a literatura matematica pertinente, como tambem me ajudou na busca das
equacoes de campo da gravitacao. ([Topper], Cap. 15, p. 113.)
Assim, o pensamento mais feliz da vida de Einstein, que deu origem a Teoria da Relatividade Geral, e
que em cada ponto, o espacotempo e de Minkowski. A maneira como colar estes espacos de Minkowski em
cada ponto para obter a geometria global do espacotempo, isto e, a curvatura do espacotempo e ditada pela
Geometria Riemanniana. Neste momento temos que fazer uma pausa na Fsica e um grande desvio para
aprender esta geometria, que requer uma serie de prerequisitos para ser bem compreendida. E o que faremos
nos proximos captulos.
7.1.1 Inercia
Antes, porem, e necessario considerar o conceito de inercia e as trajetorias que as partculas livres per-
correm no espacotempo. Isso nos guiara na motivacao dos conceitos necessarios para o desenvolvimento do
espacotempo curvo (variedade de Lorentz) fsico alem da simples colagem de espacos tangentes de Minkowski.
Newton aceitou o Princpio da Relatividade Galileana: nao existe repouso e movimento uniforme absoluto.
Mas existe a aceleracao absoluta e ela e a justificativa para a existencia do espaco absoluto. A aceleracao
absoluta e em relacao a este espaco. Alem disso, a inercia e uma medida da resistencia de um corpo a sofrer
uma aceleracao, e esta e dada pela massa do corpo.
No espacotempo plano de Minkowski as geodesicas sao retas. Quaisquer trajetorias curvas implicam na
existencia de uma aceleracao e portanto de uma forca agindo. A aceleracao e absoluta, mas nao e necessario
postular um espaco absoluto para entende-la. Ela existe no espacotempo absoluto de Minkowski.
No espacotempo curvo da Relatidade Geral, partculas que se movem apenas por inercia, sem sofrer
a acao de forcas, tambem se movem ao longo de geodesicas. Na geometria de Lorentz elas nao sofrem
qualquer alteracao de direcao, isto e, as partculas que seguem trajetorias geodesicas no espacotempo nao
sofrem aceleracao (nao estao sujeitas a acao de forcas). Elas se movem por inercia, seguindo as trajetorias
geodesicas do espacotempo. Apenas as geodesicas do espacotempo curvado da relatividade geral sao curvas,
logo na projecao tridimensional existe uma aceleracao. Alem disso, devido a curvatura do espacotempo, as
trajetorias geodesicas se aproximam, o que era interpretado como os corpos se atraindo sujeitos a forca da
gravidade. Isso nao existe no espacotempo curvo. Portanto, nao existe uma forca de gravidade: a gravidade
e apenas uma manifestacao da curvatura do espacotempo.
Forcas so existem quando as partculas sao impedidas de percorrer sua trajetoria geodesica no espacotempo.
Por exemplo, quando um corpo esta apoiado sobre o chao, impedido de cair, impedido de seguir a sua tra-
jetoria geodesica natural no espacotempo curvado.
Captulo 8
Topologia Diferencial
8.1 Variedades Diferenciaveis

8.1 Definicao. Seja M um espaco topologico de Hausdorff com base enumeravel. Um atlas de dimensao n
(ou sistema de coordenadas) para M e uma famlia
= { }A
de homeomorfismos : U V de um aberto U Rn sobre um aberto V de M para cada A,

satisfazendo as seguintes condicoes:
(i) Os abertos V cobrem M , isto e, [
V = M.
A
(ii) Para todos ndices , A tais que V = V V 6= , as funcoes de transicao
= 1 1 1
: (V ) (V ) ,
1
= 1 1
: (V ) (V ) ,
sao diferenciaveis de classe C .

Cada aplicacao e chamada uma carta (ou uma parametrizacao ou um sistema de coordena-
das locais) para uma vizinhanca de M , denotada ( , U ), e V = (U ) e chamada uma vizinhanca
coordenada.
Se p = (x1 , . . . , xn ), entao x1 , . . . , xn sao chamadas as coordenadas locais de p na carta .
Uma estrutura diferenciavel para M e um atlas maximal.
Uma variedade diferenciavel de dimensao n e um espaco topologico de Hausdorff com base enumeravel
munido de uma estrutura diferenciavel.
Em outras palavras, uma variedade diferenciavel e uma variedade topologica em que as mudancas de coorde-
nadas de um sistema de coordenadas local para outro sao diferenciaveis. Observe que o que definimos como
variedade diferenciavel e chamado variedade suave em outros lugares. Em Geometria Riemanniana, varios
conceitos importantes necessitam derivadas de varias ordens, portanto costuma-se trabalhar com variedades
suaves desde o incio e nao com variedades diferenciaveis de classe C k , para nao ter que especificar a todo
momento o valor de k necessario para que certo conceito possa ser definido ou para que certo teorema faca
sentido. Requerer que o atlas seja maximal e incluir no atlas todas as cartas locais que sao compatveis
com o atlas, isto e, um atlas = { }A e maximal se sempre que : U V e um homeomorfismo de
um aberto U Rn sobre um aberto V de M tal que 1 e 1 sao diferenciaveis para todo A,
entao ; por definicao, o atlas maximal e unico. Esta e uma maneira mais simples de definir o conceito
62
de estrutura diferenciavel, do que definir estruturas diferenciaveis como classes de equivalencia de atlas com-
patveis, ou seja, de atlas tais que as cartas de sao todas compatveis com as cartas do outro; uma funcao
definida em uma variedade diferenciavel e diferenciavel (veremos a definicao logo a seguir) com relacao a dois
atlas diferentes se e somente se eles sao compatveis, portanto atlas compatveis definem a mesma estrutura
diferenciavel neste sentido. Se uma variedade topologica possui uma estrutura diferenciavel (toda variedade
topologica de dimensao n 6 3 possui, mas para toda dimensao n > 4 existem variedades topologicas compac-
tas que nao possuem) ela possui uma quantidade nao enumeravel de estruturas diferenciaveis (veja [Lee 1],
p. 30, Problem 1.6). Por outro lado, a estrutura diferenciavel de uma variedade diferenciavel e unica, no
sentido que todo atlas diferenciavel esta contido em um unico atlas maximal (para uma demonstracao, veja
[Lee 1], p. 13, Proposition 1.17).
Surpreendentemente, a condicao de ser de Hausdorff (que assegura, entre outras coisas, que conjuntos
finitos de pontos sao fechados e que limites de sequencias convergentes sao unicos) nao e implicada pela
definicao (veja Exerccio 8.44). A condicao de possuir uma base enumeravel garante a existencia de particoes
da unidade. Por outro lado, dado um conjunto X, uma estrutura diferenciavel sobre X determina uma
topologia para X (veja Exerccio 8.45). Observe que toda variedade diferenciavel e localmente conexa por
caminhos e que uma variedade diferenciavel e conexa se e somente se ela e conexa por caminhos (Exerccio
8.46). Alem disso, toda variedade diferenciavel e paracompacta, isto e, toda cobertura de uma variedade
diferenciavel por abertos admite uma subcobertura localmente finita; mais que isso, esta subcobertura pode
ser tomada enumeravel (veja [Lee 1] para demonstracoes destas afirmacoes).
Quando nos referirmos a uma variedade diferenciavel, assumimos que ela esta munida de uma estrutura
diferenciavel. Denotaremos as vezes uma variedade diferenciavel M de dimensao n por M n quando for
necessario especificar a dimensao da variedade. Tambem denotaremos uma carta do atlas por (, U ) quando
a sua imagem nao for importante nas consideracoes.
8.2 Aplicacoes Diferenciaveis

8.2 Definicao. Seja M n uma variedade diferenciavel. Dizemos que uma funcao f : M Rk e uma funcao
diferenciavel se para todo p M existe uma carta (, U ) de uma vizinhanca de p tal que
f : U Rn Rk
e uma funcao diferenciavel de classe C .

Observe que se f e diferenciavel para uma carta (, U ) de uma vizinhanca de p, entao para qualquer
carta (, V ) de uma vizinhanca de p temos que f e diferenciavel, pois
f = f 1

e 1 e um difeomorfismo. A funcao f e chamada uma representacao de f em coordena-

das. Frequentemente omitimos a carta quando trabalhamos com a representacao de f em coordenadas e
escrevemos
f (x1 , . . . , xn )
ao inves de
(f ) (x1 , . . . , xn ) .
8.3 Definicao. Se M e uma variedade diferenciavel, definimos o espaco vetorial
C (M ) = {f : M R : f e diferenciavel} .

C (M ) e um espaco vetorial porque a combinacao linear de funcoes diferenciaveis e uma funcao diferenciavel.
8.4 Definicao. Sejam M m e N n variedades diferenciaveis. Dizemos que uma aplicacao F : M N e

uma aplicacao diferenciavel se para todo p M existem cartas (, U ) de uma vizinhanca de p e (, V )
de uma vizinhanca de F (p) com F ( (U )) (V ) tais que
1 F : U Rm Rn
e uma aplicacao diferenciavel de classe C .

Novamente
observamos
que se 1 F e diferenciavel
para as cartas (, U ) , (, V ), entao
para quaisquer

cartas ,
e U
e de uma vizinhanca de p e , Ve de uma vizinhanca de F (p) tais que F (U
e e ) Ve
temos que e1 F
e e diferenciavel, pois
e1 F
e = (e1 ) 1 F 1

e
e 1 ,
e e1 sao difeomorfismos. A aplicacao 1 F e uma representacao de F em coordenadas.
Ressaltamos de novo que o que definimos como funcao diferenciavel e aplicacao diferenciavel sao chamadas
funcao suave e aplicacao suave em outros lugares.
8.5 Definicao. Dizemos que uma aplicacao diferenciavel F : M N e um difeomorfismo se F e um
homeomorfismo e F 1 tambem e diferenciavel.
Se existir um difeomorfismo entre duas variedades diferenciaveis M e N , dizemos que elas sao difeomor-
fas.
Se duas variedades diferenciaveis sao difeomorfas, em particular elas possuem a mesma dimensao.
O conceito de difeomorfismo leva naturalmente a perguntar se, dada uma variedade diferenciavel, estru-
turas diferenciaveis diferentes sobre ela definem sempre duas variedades diferenciaveis difeomorfas ou nao.
A resposta e que para variedades diferenciaveis de dimensao n 6 3 existe apenas uma estrutura diferenciavel
a menos de difeomorfismo, enquanto que mesmo R4 tem um numero nao enumeravel de estruturas dife-
renciaveis nao difeomorfas; sabe-se que esferas de dimensao ate n = 20, n 6= 4, possuem um numero finito de
estruturas diferenciaveis a menos de difeomorfismo e este numero e conhecido (veja referencias em Wikipedia
e [Lee 1], p. 40). Quantas estruturas diferenciaveis difeomorfas S4 possui (ou mesmo se este numero e maior
que 1 ou finito) e uma questao em aberto, a conjectura de Poincare generalizada.
Uma das aplicacoes diferenciaveis mais importantes entre variedades sao as curvas diferenciaveis:
8.6 Definicao. Uma curva diferenciavel em uma variedade diferenciavel M e uma aplicacao diferenciavel
: I M onde I R e um intervalo.
8.2.1 Particoes da Unidade

8.7 Definicao. Seja V = {V }A uma cobertura por abertos de uma variedade diferenciavel M . Uma
particao da unidade subordinada a V e uma colecao { }A de funcoes diferenciaveis : M R
tais que
(i) 0 6 6 1.
(ii) supp V .
(iii) {supp }A e localmente finita (todo ponto em M possui uma vizinhanca que intersecta apenas
um numero P finito destes suportes).
(iv) = 1.
A
8.8 Teorema (Existencia de Particoes da Unidade). Toda cobertura por abertos de uma variedade
diferenciavel possui uma particao da unidade subordinada.
Prova: Veja [Lee 2], p. 43, Theorem 2.23.

8.9 Corolario (Existencia de Funcoes Bump). Dados um fechado A e um aberto V A em uma

variedade diferenciavel M , existe uma funcao diferenciavel f : M R tal que
(i) 0 6 f 6 1.
(ii) f 1 em A.
(iii) supp f V.
8.10 Corolario (Lema de Extensao). Dados um fechado A, um aberto V A em uma variedade dife-
renciavel M e uma funcao diferenciavel f : A Rk existe uma extensao diferenciavel fe : M Rk de f
tal que supp fe V .
Em particular, se (, U ) e uma carta local e V (U ), qualquer funcao diferenciavel f : V Rk
pode ser estendida a uma funcao diferenciavel fe : M Rk com supp fe (U ).
Prova: Para a primeira parte veja [Lee 2], p. 45, Lemma 2.26. A segunda parte segue imediatamente da
primeira, ja que V U e fechado.
8.3 Vetores Tangentes

Consideremos agora a questao de como definir a nocao de vetor tangente a um ponto em uma variedade
diferenciavel. Esta nocao nao e obvia, ja que uma variedade e um espaco abstrato que nao se encontra em
princpio imerso em um espaco ambiente, ou seja, em um espaco euclidiano, onde operacoes diferenciais e
vetoriais sao naturais. Portanto, precisamos procurar uma caracterstica de vetores tangentes em espacos
euclidianos que independa do espaco ambiente. Faremos isso em duas etapas, aumentando em abstracao ate
chegar a uma definicao que provara ser extremamente conveniente de trabalhar.
8.3.1 Vetores Tangentes a Curvas

No que se segue, denotaremos as derivadas parciais de funcoes reais f de varias variaveis reais por
f
ou i f
xi
conforme for mais conveniente.
Quando : I Rn e uma curva diferenciavel em um espaco euclidiano, com (t0 ) = p e 0 (t0 ) = v,
escrevendo em coordenadas
(t) = x1 (t) , . . . , xn (t) ,

temos que
dx1 dxn

0
(t) = (t) , . . . , (t) ,
dt dt
e em particular
dx1 dxn

v = 0 (t0 ) = (t0 ) , . . . , (t0 ) .
dt dt
Se f : Rn R e uma funcao diferenciavel em p, entao a derivada direcional de f em p na direcao de v e
dada pela regra da cadeia por
n
" n #
i X dxi
0
X f dx
(f ) (t0 ) = df(t0 ) 0 (t0 ) = (p) (t0 ) = (t0 ) i f (p) ,
i=1
xi dt i=1
dt x
o que significa que a derivada direcional na direcao de v pode ser vista como um operador linear sobre funcoes
diferenciaveis que depende apenas do vetor v.
8.11 Definicao (Preliminar). Seja : I M uma curva diferenciavel com (t0 ) = p. O vetor
tangente a curva em p e uma funcao vp : C (M ) R definida por
0
vp (f ) = (f ) (t0 ) .
Um vetor tangente a variedade M em p e qualquer vetor tangente a uma curva diferenciavel passando
por p.
Ou seja, cada curva diferenciavel em M passando por p da origem a um vetor tangente em p. E claro que
curvas diferenciaveis diferentes , : I M com (t0 ) = (s0 ) = p podem dar origem ao mesmo vetor
tangente: basta que
0 0
(f ) (t0 ) = (f ) (s0 )
para todo f .
8.12 Proposicao. Um vetor tangente vp : C (M ) R e um funcional linear e o conjunto dos vetores

tangentes a uma variedade em um ponto formam um espaco vetorial real n-dimensional.
Prova: Seja (, U ) uma carta de uma vizinhanca de p com (x0 ) = p. Sejam : I M uma curva
diferenciavel com (t0 ) = p e vp o vetor tangente a em p. Dado f C (M ), temos
0
vp (f ) = (f ) (t0 )
0
= f 1 (t0 )
0
= d (f )x0 1 (t0 )
n
X (f ) dxi
= i
(x0 ) (t0 ) ,
i=1
x dt
onde denotamos 1 (t) = x1 (t) , . . . , xn (t) em coordenadas locais. Segue que para todos f, g

C (M ) e para todos a, b R temos

n
X ([af + bg] ) dxi
vp (af + bg) = (x 0 ) (t0 )
i=1
xi dt
n n
X (f ) dxi X (g ) dxi
=a (x 0 ) (t 0 ) + b (x 0 ) (t0 )
i=1
xi dt i=1
xi dt
= avp (f ) + bvp (g) ,
de modo que vp : C (M ) R e um funcional linear.

Para mostrar que o conjunto dos vetores tangentes a M em p formam um espaco vetorial e que este tem
dimensao n, mostraremos que todo vetor tangente e a combinacao linear de n vetores tangentes linearmente
independentes 1 |p , . . . , n |p a serem definidos e que, alem disso, qualquer combinacao linear dos vetores
tangentes 1 |p , . . . , n |p e um vetor tangente (embora combinacoes lineares de funcionais lineares sejam
sempre funcionais lineares, nada garante em princpio que um tal funcional linear e um vetor tangente; de
fato, depois que provarmos que o espaco vetorial dos vetores tangentes tem dimensao n, segue que ele e um
subespaco vetorial proprio do espaco vetorial dos funcionais lineares de C (M ), pois este tem dimensao
infinita).
De fato, reescreva a expressao obtida acima para vp (f ) na forma
n
X dxi (f )
vp (f ) = (t0 ) (x0 ) .
i=1
dt xi
Denotando por B = {e1 , . . . , en } a base canonica de Rn , seja i a curva diferenciavel i : Ii M definida

por
i (t) = (x0 + tei ) ,
onde Ii e um intervalo aberto em torno de t0 tal que x0 + tei U para todo t Ii e denote por i |p o vetor
tangente a curva i em p. Como
(f ) (f ) (x0 + tei ) (f ) (x0 )

(x0 ) = lim
xi t0 t
0
= (f i ) (t0 )
= i |p (f ) ,
segue que
n
X dxi
vp = (t0 ) i |p .
i=1
dt
Reciprocamente, se v e o funcional linear
n
X
vp = ci i |p ,
i=1
entao v e o vetor tangente a curva em p definida por

n
!!
X
(t) = x0 + t ci ei ,
i=1
pois, pela regra da cadeia como vimos no incio da demonstracao,

n n
0
X dxi (f ) X
(f ) (0) = (0) i
(x0 ) = ci i |p (f ) = v (f ) .
i=1
dt x i=1
Finalmente, se
n
X
ci i |p = 0,
i=1
entao
n
X (f )
ci (x0 ) = 0
i=1
xi

para todo f C (M ). Definindo para cada j
fj x1 , . . . , xn = xj

em um aberto U0 U , segue que fj e diferenciavel em U0 e pelo Corolario 8.10 podemos estender fj a

uma funcao diferenciavel fej C (M ). Como

fej (fj )
(x0 ) = (x0 ) = ij ,
xi xi
escolhendo f = fj obtemos cj = 0 para todo j.
8.13 Proposicao (Regra do Produto). O vetor tangente vp : C (M ) R satisfaz a propriedade
vp (f g) = vp (f ) g (p) + f (p) vp (g) .

Prova: Seja vp o vetor tangente a curva em p. Entao

0 0
vp (f g) = ((f g) ) (t0 ) = [(f ) (g )] (t0 )
0 0
= (f ) (t0 ) (g ) (t0 ) + (f ) (t0 ) (g ) (t0 )
= vp (f ) g (p) + f (p) vp (g) .
8.3.2 Vetores Tangentes como Derivacoes

8.14 Definicao. Seja M uma variedade diferenciavel. Um vetor tangente a M em p e um funcional linear
vp : C (M ) R que tambem e uma derivacao em p, isto e, ele satisfaz a regra do produto
vp (f g) = vp (f ) g (p) + f (p) vp (g) .

Note que nesta definicao o conjunto dos vetores tangentes a um ponto p M forma naturalmente um espaco
vetorial real, pois e um subespaco do espaco vetorial dos funcionais lineares em C (M ):
(vp + wp ) (f g) = vp (f g) + wp (f g)
= vp (f ) g (p) + f (p) vp (g) + wp (f ) g (p) + f (p) wp (g)
= [(vp + wp ) (f )] g (p) + f (p) [(vp + wp ) (g)] .
Mas a dimensao deste espaco nao e imediatamente obvia. Alem disso, nao e claro que todo vetor tangente
segundo esta definicao e um vetor tangente segundo a definicao anterior. Embora seja consequencia das
Proposicoes 8.12 e 8.13 que vetores tangentes a curvas sao funcionais lineares em C (M ) que sao derivacoes,
logo o espaco vetorial dos vetores tangentes segundo a definicao anterior e um subespaco vetorial do espaco
vetorial dos vetores tangentes segundo a nova definicao, ainda nao sabemos que todo todo funcional linear
em C (M ) que e uma derivacao e o vetor tangente a alguma curva. Isso provara ser verdade quando
provarmos que o espaco vetorial dos funcionais lineares em C (M ) que sao derivacoes tambem tem dimensao
n (Proposicao 8.22). Em outras palavras, as duas definicoes nao sao apenas equivalentes, mas de fato definem
o mesmo conceito de vetor tangente. De agora em diante, utilizaremos a Definicao 8.14 para vetor tangente.
8.15 Proposicao. Qualquer vetor tangente vp : C (M ) R satisfaz as seguintes propriedades:

(i) Se f e uma funcao constante, entao vp (f ) = 0.
(ii) Se f (p) = g (p) = 0, entao vp (f g) = 0.
Prova: Ambas as propriedades seguem imediatamente da regra do produto. (i) Como vp e linear, basta
provar para a funcao constante f 1. Pela regra do produto,
vp (f ) = vp (f ) f (p) + f (p) vp (f ) = 2vp (f ) ,
logo vp (f ) = 0. (ii) Pela regra do produto, temos
vp (f g) = vp (f ) g (p) + f (p) vp (g) = vp (f ) 0 + 0vp (g) = 0 + 0 = 0.

Apesar dos vetores tangentes (derivacoes) estarem definidas no espaco global C (M ), o proximo resul-
tado mostra que a sua atuacao e local.
8.16 Proposicao. Seja vp : C (M ) R um vetor tangente. Se f, g C (M ) coincidem em uma
vizinhanca de p, entao vp (f ) = vp (g).
Prova: Seja h = f g, de modo que h C (M ) e h = 0 em uma vizinhanca de p. Seja C (M ) uma

funcao cujo suporte esta contida em M \ {p} e que e igual a 1 no suporte de h. Em particular, como = 1
onde h e nao nula, segue que h = h. Da, vp (h) = vp (h) = 0 pela propriedade (ii) da Proposicao 8.15; o
resultado segue agora por linearidade.
8.17 Definicao. Seja M uma variedade diferenciavel. O espaco vetorial dos vetores tangentes a um ponto
p M e chamado o espaco tangente a M em p e denotado Tp M .
8.3.3 Diferencial de uma Aplicacao Diferenciavel

Para definir a diferencial (derivada) de uma aplicacao diferenciavel, usaremos a definicao de vetores tangentes
como derivacoes:
8.18 Definicao. Sejam M e N variedades diferenciaveis e F : M N uma aplicacao diferenciavel em
p M . A diferencial de F em p e aplicacao linear
dFp : Tp M TF (p) N
definida por
[dFp (vp )] (f ) = vp (f F )

para todo f C (N ).
Note que como f C (N ) e F e de classe C , f F C (M ). dFp (v) e uma derivacao em F (p) porque
dFp (vp ) (f g) = vp ((f g) F ) = vp ((f F ) (g F ))

= vp (f F ) g (F (p)) + f (F (p)) vp (g F )
= [dFp (vp ) (f )] g (F (p)) + f (F (p)) [dFp (vp ) (g)] .
Alem disso, dFp e uma aplicacao linear porque vp e um funcional linear.

8.19 Proposicao (Regra da Cadeia). Sejam M, N, P variedades diferenciaveis e F : M N, G : N
P aplicacoes diferenciaveis. Entao G F : M P e uma aplicacao diferenciavel e
d (G F )p = dGF (p) dFp .
Prova: Provaremos a segunda parte; a primeira parte e deixada como exerccio. Por definicao, para todo
f C (P )
h i
d (G F )p (vp ) (f ) = vp (f (G F )) = vp ((f G) F ) = dFp (vp ) (f G)

= dGF (p) (dFp (vp )) (f ) .

8.20 Corolario. Se F : M N e um difeomorfismo, entao dFp e um isomorfismo para cada p M e
1
d F 1 F (p) = (dFp ) .

8.21 Lema. Seja M uma variedade diferenciavel. Se V e um aberto de M e i : V M e a inclusao,

entao dip e um isomorfismo para todo p M .
Prova: Para provar que dip : Tp V Tp M e injetivo, suponha que dip (vp ) = 0 para vp Tp V . Seja
W V uma vizinhanca de p. Se f C (V ) e uma funcao diferenciavel arbitraria, considere uma
extensao fe C (M ) tal que fe = f em W . Como f e fe coincidem na vizinhanca W de p, segue da
Proposicao 8.16 que
vp (f ) = vp fe|V = vp fe i = dip (vp ) fe = 0.
Como f C (V ) e arbitraria, isso prova que vp = 0, logo dip e injetiva.

Para provar que dip e sobrejetiva, seja wp Tp M um vetor tangente qualquer. Defina uma funcao
v : C (V ) R por
v (f ) = wp fe

onde fe e uma extensao definida como no incio da demonstracao. Pela Proposicao 8.16, o valor de w fe
independe da escolha de fe, logo v esta bem definida. E facil ver que v e uma derivacao. Para todo g C (M )
temos
dip (v) (g) = v (g i) = wp gg i = wp (g)
i e g coincidem em W . Portanto, dip (v) = wp .

onde a ultima igualdade segue do fato que gg
8.22 Proposicao. Se M e uma variedade diferenciavel de dimensao n, entao Tp M e um espaco vetorial de

dimensao n para todo p M .
Prova: Seja : U V uma carta para uma vizinhanca V = (U ) M de p = (x). Como e um
difeomorfismo, segue que dx : Rn Tp V e um isomorfismo. Como Tp V e Tp M sao isomorfos pelo lema,
segue o resultado.
Conforme a discussao que se segue a Definicao 8.14, conclumos que para todo vetor tangente vp Tp M
existe uma curva diferenciavel : I M com (t0 ) = p tal que
0
vp (f ) = (f ) (t0 ) .
8.23 Definicao. Seja M uma variedade diferenciavel e : U M uma carta de uma vizinhanca de um
ponto p M . A base obtida na demonstracao da Proposicao 8.12 sera chamada a base coordenada do
espaco tangente Tp M associada a carta e denotada por
1 |p , . . . , n |p
ou por

,...,
x1 p xn p
quando for conveniente ou necessario explicitar as coordenadas da carta.
8.4 Coordenadas
8.4.1 Diferencial em Coordenadas
Seja B = {e1 , . . . , en } a base canonica de Rn . Se : U Rn V e uma carta para uma vizinhanca
coordenada V de p = (x) M , a base coordenada associada a e tambem dada por

= dx (ei ) .
xi p
De fato, se f C (M ), entao

(f )
i
(f ) = (x) = ei (f ) = dx (ei ) (f ) .
x p xi
Assim, podemos definir

8.24 Definicao.
f (f )
(p) = (f ) = (x) .
xi xi p xi
Vamos ver agora como e a diferencial de uma aplicacao diferenciavel em coordenadas.
Primeiro recordaremos o caso em que as variedades sao espacos euclideanos. Denote por Bm = {e1 , . . . , em }
e Bn = {f1 , . . . , fn } as bases canonicas de Rm e Rn , respectivamente. Observe que se F : U Rm Rn
e uma aplicacao diferenciavel, entao dFx : Rm Rn e a derivada usual para cada x U e pela regra da
cadeia
m m
(f F ) X f F j X F j
dFx (ei ) (f ) = ei (f F ) = (x) = (F (x)) (x) = (x) fj (f ) ,
xi j=1
xj xi j=1
xi
ou seja,
n
X F j
dFx (ei ) = (x) fj .
j=1
xi
Assim, a matriz da diferencial dFx em relacao as bases Bm , Bn e o jacobiano
F 1 F 1

x1 . . .
. xm
J = .. ..
. =: [dFx ]Bm ,Bn .

F n F n
1
...
x xm
m
v i ei , entao
P
Ou seja, se v =
i=1
m n
"m #
j
i F
X X X
i
dFx (v) = v dFx (ei ) = v (x) fj ,
i=1 j=1 i=1
xi
isto e,
F 1 F 1

. . .
1
x1 xm v
. . ..
[dFx (v)]Bn = .
. .
. . = J [v]Bm .

F n F n v m
...
x1 xm
No caso geral, se F : M N e uma aplicacao diferenciavel, sejam : U Rm (U ) , : V
m n
n
R (V ) cartas de vizinhancas de p = (x) em M e de F (p) = (y) em N , respectivamente, de modo
que
Fe = 1 F : U Rm Rn .
Escrevendo
F = Fe
temos

! n j n
h i X F
e X Fej
dFp i
= dFp [dx (e i )] = dy d F
ex (e i ) = dy

i
(x) f j
= (x) dy (fj )
x
p x xi
j=1 j=1
n
!
Fej

X
= (x) .
j=1
xi y j F (p)
Portanto, se
( )

Bp = ,..., .
x1 p xm p
( )

BF (p) = ,..., ,
y 1 F (p) y n F (p)
sao as bases coordenadas de Tp M e TF (p) N , respectivamente, entao a matriz que representa a diferencial
dFp em relacao a estas bases e

Fe1 Fe1
...
x1 xm

[dFp ]Bp ,BF (p) = ... ..
.

.
Fen Fen
...
x1 xm
8.5 Fibrado Tangente

8.25 Definicao. Seja M uma variedade diferenciavel de dimensao n com um atlas = { : U M }A
de classe C k . O fibrado tangente de M e a variedade diferenciavel de dimensao 2n e classe C k1
T M = {(p, v) : p M e v Tp M }
com um atlas
= { : U Rn T M }A
definido por !
n
X
(x, v1 , . . . , vn ) = (x) , vi i (x) .
i=1

Na definicao acima, o proprio atlas define a topologia necessaria em T M (Exerccio 8.45).
8.6 Fibrados Vetoriais

8.26 Definicao. Um fibrado vetorial de ordem k sobre uma variedade diferenciavel M e uma variedade
diferenciavel E juntamente com uma aplicacao sobrejetiva diferenciavel : E M tal que
(i) cada fibra Ep = 1 (p) de E sobre p e um espaco vetorial de dimensao k;
(ii) para cada p M existe uma vizinhanca U de p e um difeomorfismo : 1 (U ) U Rk , chamado
uma trivializacao local de E, tal que o diagrama seguinte e comutativo:

1 (U ) U Rk
. 1
(1 : U Rk U e a projecao na primeira variavel) e tal que |Ep : Ep {p} Rk e um isomorfismo

de espacos vetoriais.
A variedade E e chamada o espaco total do fibrado, M a base do fibrado e a sua projecao.
Frequentemente identificamos o espaco total com o fibrado e dizemos simplesmente que E e o fibrado vetorial
sobre M . Fibrados tangentes sao exemplos de fibrados vetoriais.
8.27 Definicao. Seja E um fibrado vetorial de dimensao k sobre M . Uma secao de E e uma aplicacao
s : M E tal que s = Id|M .
Em outras palavras, s : M E e uma secao se e somente se s (p) Ep para todo p M .
8.7 Campos Vetoriais

Considere : T M M a projecao canonica do fibrado tangente de M sobre M , isto e, (p, v) = p para
todo v Tp M .
8.28 Definicao. Seja M uma variedade diferenciavel. Um campo vetorial diferenciavel em M e uma
aplicacao diferenciavel X : M T M tal que se X = idM .
Podemos pensar em campos vetoriais como aplicacoes que associam a cada ponto p M um vetor tangente
X (p) Tp M ; frequentemente,
( denotaremos o vetor tangente X (p) simplesmente por Xp . Em termos de
)

coordenadas locais, se B =

,..., e a base do espaco tangente Tp M associada a uma carta
x1 p xm p
: U M para pontos p (U ), entao
n
X
i
Xp = X (p)
i=1
xi p
e o campo vetorial X e diferenciavel em (U ) se e somente se as funcoes coordenadas X 1 , . . . , X n sao

diferenciaveis.
Outra forma de ver um campo vetorial diferenciavel em M e como uma aplicacao que associa a cada
funcao f C (M ) uma funcao Xf C (M ) atraves da expressao
(Xf ) (p) = Xp f
onde Xp : C (M ) R e um vetor tangente.

8.29 Definicao. Seja M uma variedade diferenciavel. Um campo vetorial diferenciavel em M e uma
aplicacao X : C (M ) C (M ) que satisfaz as seguintes propriedades
(i) X e linear:
X (f + g) = Xf + Xg
para todos , R e f, g C (M ).
(ii) X satisfaz a regra do produto:
X (f g) = (Xf ) g + f (Xg)
para todos f, g C (M ).
As duas definicoes sao equivalentes. Usando a ultima definicao, podemos definir combinacoes lineares de
campos vetoriais de forma natural.
8.30 Notacao. Seja M uma variedade diferenciavel. O espaco vetorial dos campos vetoriais diferenciaveis
em M e denotado por T (M ).
8.31 Proposicao. Sejam M e N variedades diferenciaveis e F : M N uma aplicacao diferenciavel. Se

X T (M ) e Y T (N ) sao campos vetoriais tais que
YF (p) = dFp (Xp )
para todo p M , entao

X (f F ) = (Y f ) F
para todo f C (N ).
Prova: Pela definicao de diferencial,
[dFp (Xp )] (f ) = Xp (f F ) ,
logo,
[X (f F )] (p) = Xp (f F ) = [dFp (Xp )] (f ) = YF (p) f = (Y f ) (F (p)) .
8.32 Definicao. Sejam M e N variedades diferenciaveis e F : M N um difeomorfismo. Definimos a

aplicacao pushforward
F : T (M ) T (N )
por
(F X)q = dFp (Xp )
onde q = F (p).
Equivalentemente,
(F X)q = dFF 1 (q) XF 1 (q) .
8.33 Proposicao. Sejam M e N variedades diferenciaveis e F : M N um difeomorfismo. Consi-
dere T (M ) e T (N ) como modulos sobre os aneis C (M ) e C (N ), respectivamente. Entao o operador
pushforward F e linear no seguinte sentido:
F (f X + gY ) = f F 1 F X + g F 1 F Y

para todos X, Y T (M ) e para todas f, g C (M ). Alem disso, para toda f C (N ) vale
[(F X) f ] F = X (f F )
ou, equivalentemente,
(F X) f = X (f F ) F 1 .
Prova:
F
M N
1
f .f F
R
Primeiro provamos a linearidade de F . No que se segue, q = F (p). Temos
[F (X + Y )]q = dFp (Xp + Yp )

= dFp (Xp ) + dFp (Yp )
= (F X)q + (F Y )q
e

[F (f X)]q = dFp (f X)p
= dFp (f (p) Xp )
= f (p) dFp (Xp )
= f F 1 (q) (F X)q .

A ultima afirmativa segue imediatamente da Proposicao 8.31, ja que F X e exatamente o campo Y do

enunciado daquela proposicao.
8.34 Teorema. Seja X T (M ) um campo diferenciavel. Dado p M , existe uma vizinhanca V de p em
M , > 0 e uma aplicacao diferenciavel
: (, ) V M
tais que q (t) = (t, q) e a unica curva diferenciavel em M que satisfaz

d
(
(t, q) = X(t,q) para todos t (, ) , q V,
dt
(0, q) = q.
Alem disso, para cada t fixado, t = (t, ) e um difeomorfismo e o fluxo e um grupo aditivo a um parametro,
isto e,
0 = id,
t+s = t s .
Prova: Veja [Lee 1], Chapter 9, p. 209.

e chamado o fluxo local do campo vetorial X. Note que por causa das propriedades de grupo temos
1
(t ) = t .
8.8 Colchete de Lie

Embora a Definicao 8.29 de campos vetoriais permite tambem em princpio definir a composta de campos
vetoriais e, ja que Xf e interpretada como a derivada de f na direcao de X, gostaramos de interpretar
naturalmente a expressao
X (Y f )
como a derivada segunda de f primeiro na direcao de Y e em seguida na direcao de X, em geral esta composta
nao e um campo vetorial porque nao satisfaz a regra do produto:
(X Y ) (f g) = X [Y (f g)] = X [(Y f ) g + f (Y g)] = X [(Y f ) g] + X [f (Y g)]

= [X (Y f )] g + (Y f ) (Xg) + (Xf ) (Y g) + f [X (Y g)]
= [(X Y ) f ] g + f [(X Y ) g] + (Xf ) (Y g) + (Y f ) (Xg) ;
em coordenadas locais (veja Proposicao 8.37 a seguir), a composta realmente envolve derivadas parciais de
segunda ordem, as quais nao sao vetores tangentes por nao satisfazerem a regra do produto. Para definir
calculo diferencial de ordem superior, e necessario o conceito de derivada covariante, que veremos no Captulo
11.
Por outro lado, a operacao
X Y Y X
define um campo vetorial.
8.35 Definicao. Sejam X, Y T (M ). O colchete de Lie de X e Y e o campo vetorial
[X, Y ] = XY Y X.
Esta expressao deve ser entendida no sentido de
[X, Y ] = X Y Y X,
ou seja,
[X, Y ]p f = Xp (Y f ) Yp (Xf ) .
O colchete de Lie e de fato um campo vetorial, pois
[X, Y ] (f + g) = X [Y (f + g)] Y [X (f + g)]

= X [Y f + Y g] Y [Xf + Xg]
= X (Y f ) + X (Y g) Y (Xf ) Y (Xg)
= [X (Y f ) Y (Xf )] + [X (Y g) Y (Xg)]
= [X, Y ] f + [X, Y ] g
[X, Y ] (f g) = X [Y (f g)] Y [X (f g)]

= X [f Y g + gY f ] Y [f Xg + gXf ]
= X [f Y g] + X [gY f ] Y [f Xg] Y [gXf ]
= f X (Y g) + Y gXf + gX (Y f ) + Y f Xg f Y (Xg) XgY f gY (Xf ) Xf Y g
= f [X (Y g) Y (Xg)] + g [X (Y f ) Y (Xf )]
= f [X, Y ] (g) + g [X, Y ] (f ) .
8.36 Proposicao. O colchete de Lie satisfaz as seguintes propriedades:

(i) (Anticomutatividade)
[X, Y ] = [Y, X] .
Consequentemente,
[X, X] = 0.
(ii) (Bilinearidade)
[X + Y, Z] = [X, Z] + [Y, Z] ,
[Z, X + Y ] = [Z, X] + [Z, Y ] .
(iii) (Identidade de Jacobi)

[[X, Y ] , Z] + [[Y, Z] , X] + [[Z, X] , Y ] = 0.
(iv)
[f X, gY ] = f g [X, Y ] + f (Xg) Y g (Y f ) X.
(v) Se F : M N e um difeomorfismo, entao
F [X, Y ] = [F X, F Y ] .
Prova: (i) e (ii) sao imediatas. Para provar (iii), usando (ii) obtemos
[[X, Y ] , Z] = [XY Y X, Z] = [XY, Z] [Y X, Z]

= XY Z ZXY Y XZ + ZY X.
Logo, usando (i) e novamente (ii), segue que
[[Y, Z] , X] + [[Z, X] , Y ] = [X, [Y, Z]] [Y, [Z, X]]

= [X, Y Z ZY ] [Y, ZX XZ]
= [X, Y Z] + [X, ZY ] [Y, ZX] + [Y, XZ]
= XY Z + Y ZX + XZY ZY X Y ZX + ZXY + Y XZ XZY
= XY Z + ZXY + Y XZ ZY X
= [[X, Y ] , Z] .
A propriedade (iv) segue da regra do produto: se h C (M ),
[f X, gY ] h = f [X (g (Y h))] g [Y (f (Xh))]
= f [(Xg) (Y h)] + f [gX (Y h)] g [(Y f ) (Xh)] g [f Y (Xh)]
= f gX (Y h) gf Y (Xh) + f [(Xg) (Y h)] g [(Y f ) (Xh)]
= f g (XY Y X) h + [f (Xg) Y ] h [g (Y f ) X] h
= [f g [X, Y ] + f (Xg) Y g (Y f ) X] h.
(v) segue da Proposicao 8.33: para todo f C (N ) temos
(XY ) (f F ) = X [Y (f F )] = X [(F Y ) f F ] = (F X) (F Y ) f F
e, analogamente,
(Y X) (f F ) = (F Y ) (F X) f F.
Logo,
(F [X, Y ]) f = [X, Y ] (f F ) F 1
= (XY Y X) (f F ) F 1
= [(F X) (F Y ) (F Y ) (F X)] f F F 1
= [F X, F Y ] f.

Uma algebra de Lie e um espaco vetorial em que se define um produto (ou seja, uma aplicacao bilinear)
anticomutativo que satisfaz a identidade de Jacobi (veja o Captulo 10). Portanto, esta proposicao mostra
que T (M ) com a operacao colchete e uma algebra de Lie.
8.37 Proposicao (Colchete de Lie em coordenadas locais). Se X, Y T (M ) sao campos vetoriais
que se expressam em coordenadas locais por
n n
X X
X= Xi e Y = Yi ,
i=1
xi i=1
xi
entao
n
Y j X j

X
[X, Y ] = Xi i Y i i
,
i,j=1
x x xj
ou, em notacao mais sucinta,

n
X
X Y j Y Xj

[X, Y ] = .
j=1
xj
Em particular,

, =0
xi xj
para todos i, j.
Prova: Temos
n
! n X n X n
X
i f X
i f i f f
X Yi

X (Y f ) = X Y i
= X Y i
= Y X i
+ i
i=1
x i=1
x i=1
x i=1
x

n n 2 n n i
X X f X f X Y
= Yi Xj j i + i
Xj j
i=1 j=1
x x i=1
x j=1
x
n n
X 2f X i
j Y f
= XjY i + X
i,j=1
xj xi i,j=1 xj xi
e, por simetria,
n n n n
X 2f X i
j X f
X 2
j i f
X X i f
Y (Xf ) = Y jXi j i
+ Y j i
= X Y i j
+ Yj j .
i,j=1
x x i,j=1
x x i,j=1
x x i,j=1
x xi
Como
2f 2f
= ,
xi xj xj xi
os termos envolvendo as derivadas parciais de segunda ordem se cancelam ao calcularmos [X, Y ] f = X (Y f )
Y (Xf ) e a expressao do enunciado e obtida trocando os ndices i, j.
8.9 Derivada de Lie

Em princpio, e um problema diferenciar campos vetoriais em variedades, ja que nao podemos tomar a
diferenca de vetores que moram em espacos tangentes diferentes (nao ha uma maneira de identificar os
espacos tangentes com Rn de uma maneira que seja invariante por mudanca de coordenadas). Uma solucao
e a seguinte. Dado um campo Y em uma variedade que queremos diferenciar na direcao de um vetor tangente
Xp no ponto p, primeiro estendemos Xp a um campo vetorial X definido em toda a variedade. O campo
vetorial X tem um fluxo local t definido. Usamos o fluxo para levar o vetor Yt (p) ao longo da trajetoria
reversa t do campo X para o espaco tangente Tp M e fazer a diferenca la com o vetor Yp , tomando em
seguida o limite quanto t 0. No Captulo 11 veremos o conceito de derivada covariante, que e uma solucao
diferente para este problema, mais semelhante ao conceito de derivada direcional, porque dependera apenas
do valor do vetor tangente Xp e nao do valor de X ao longo de uma curva; no caso desta derivada de Lie,
ela depende do valor de X ao longo de uma trajetoria do campo.
8.38 Definicao. Sejam X, Y T (M ) campos vetoriais, p M e t o fluxo local do campo X em uma

vizinhanca V de p em M . A derivada de Lie do campo Y na direcao do campo X em p e definida por

[dt ]t (p) Yt (p) Yp

d
(LX Y )p = lim = [dt ]t (p) Yt (p) .
t0 t dt t=0
Na linguagem de pushforwards,
[(t ) Y ]p Yp
(LX Y )p = lim .
t0 t
A definicao de derivada de Lie nao e operacionalmente util, ja que em geral e muito difcil e mesmo
impossvel obter o fluxo explicitamente. Felizmente, como veremos agora, a derivada de Lie coincide com o
colchete de Lie e este e muito facil de calcular.
8.39 Teorema (Interpretacao Geometrica do Colchete de Lie). Se X, Y T (M ) sao campos veto-
riais, p M e t e o fluxo local do campo X em uma vizinhanca V de p em M entao
[X, Y ] = LX Y.
Prova: Primeiro observe que se g : (, ) V R e uma funcao diferenciavel tal que
g (0, q) = 0 para todo q V,
entao existe uma aplicacao diferenciavel h : (, ) V R tal que
g (t, q) = th (t, q) .
De fato, basta definir Z 1
g
h (t, q) = (ts, q) ds
0 s
e notar que, pelo Teorema Fundamental do Calculo,
Z 1 Z 1
g
th (t, q) = t (ts, q) ds = [g (ts, q)] ds
0 s 0 s
s=1
= [g (ts, q)]s=0 = g (t, q) g (0, q)
= g (t, q) .
Em particular, segue que
g
(t, q) = h (0, q) .
t t=0
Seja agora f C (M ). Defina g : (, ) V R por
g (t, q) = f (q) f (t (q)) ,
ou, em notacao funcional,
g (t, ) = f f t .
Entao g (0, q) = f (q) f (0 (q)) = f (q) f (q) = 0, de modo que a observacao que fizemos no incio da
demonstracao se aplica e existe uma aplicacao diferenciavel h : (, ) V R tal que
f (t (q)) = f (q) th (t, q)
isto e,
f t = f th (t, )
e, alem disso (por definicao de vetor tangente, lembrando que t e uma curva diferenciavel, trajetoria do
fluxo do campo X na direcao reversa),

g (f t )
h (0, q) = (t, q) =
t t=0 t
t=0

t (q)
= f = X(0,q) f
t t=0
= Xq f.
Da (na primeira equacao na demonstracao da Proposicao 8.31 substitua F por t e p por t (p)),
h i
[dt ]t (p) Yt (p) f = Yt (p) (f t ) = Yt (p) f tYt (p) (h (t, )) .
Portanto,
h i
[dt ]t (p) Yt (p) f Yp f
(LX Y )p f = lim
t0 t
Yt (p) f tYt (p) (h (t, )) Yp f
= lim
t0 t
Yt (p) f Yp f
= lim lim Yt (p) (h (t, ))
t0 t t0
(Y f ) (t (p)) (Y f ) (p)
= lim Yp (h (0, ))
t0
t
t (p)
= (Y f ) Yp (h (0, ))
t t=0
= Xp (Y f ) Yp (Xf )
= [X, Y ]p f.

Portanto, o colchete de Lie de dois campos vetoriais e a derivade de Lie. E a derivada de Lie e a derivada
direcional do segundo campo vetorial ao longo do fluxo do primeiro; ela nao e uma derivada direcional no
senso exato do termo, porque ela nao depende apenas da direcao do primeiro campo, ou seja, nao podemos
usar qualquer curva tangente ao primeiro campo para calcula-la, mas apenas uma trajetoria do campo. A
principal diferenca entre a derivada de Lie e a derivada covariante (que e uma derivada direcional na correta
assumpcao da palavra) esta entao resumida nas Proposicoes 8.37 e 11.2: enquanto que a derivada covariante
(X Y )p depende apenas do valor de X em p e do valor de Y ao longo de uma curva tangente a Xp , a
derivada de Lie (LX Y )p depende dos valores de X ao longo de uma curva tangente a Yp e do valor de Y ao
longo de uma curva tangente a Xp : de fato,
n
X
Xp Y i Yp X i

(LX Y )p = [X, Y ]p = ,
i=1
xi

e por definicao de vetor tangente, os coeficientes Xp Y 1 , . . . , Xp (Y n ) dependem dos
valores de Y ao longo
1 n
de uma curva passando por p cujo vetor tangente em p e Xp e os coeficientes Yp X , . . . , Yp (X ) dependem
dos valores de X ao longo de uma curva passando por p cujo vetor tangente em p e Yp ).
Outra diferenca importante entre a derivada de Lie e a derivada covariante e que em variedades rieman-
nianas esta e mais natural no seguinte sentido. Denotando q = t (p), na derivada de Lie o vetor Yq e trazido
ao longo da trajetoria do campo X para o espaco tangente Tp M , onde ele e subtrado do vetor Xp atraves
do operador linear (t ) . Em uma interpretacao geometrica que veremos na Proposicao 11.27, o vetor
Yq tambem e trazido ao longo da trajetoria do campo X para o espaco tangente Tp M , mas atraves de um
operador linear chamado transporte paralelo, que e interpretado, como o nome indica, como um operador
que nao muda a direcao do vetor original em um sentido que veremos em maiores detalhes no Captulo 11.
Assim, o conceito de derivada covariante esta mais proximo ao conceito de derivada direcional em Rn , onde
identificamos Tp Rn atraves de translacoes, que preservam as direcoes de vetores.
Mas e importante ressaltar que nenhuma das derivadas, tanto a derivada de Lie quanto a derivada
covariante, dependem apenas de Xp e Yp , ou seja, nenhum deles e um tensor, um conceito que veremos
no proximo captulo. Apesar disso, ambos aparecerao na definicao do segundo tensor mais importante em
Geometria Riemanniana, o tensor curvatura (o tensor mais importante e obviamente o tensor metrica).
8.10 Campos Vetoriais que Comutam

8.40 Lema. Sejam M, N variedades diferenciaveis e F : M N um difeomorfismo. Se X e um campo
vetorial em M com fluxo local t em uma vizinhanca V , entao o campo vetorial F X em N tem fluxo local
F t F 1 em F (V ).
Prova: Em outras palavras, se : (, )V M e o fluxo local de X em V , entao : (, )F (V )
N dado por
(t, q) = F t F 1 (q)

e o fluxo local do campo F X. Para provar este resultado, note primeiro que se f C (M ), entao por
definicao de vetor tangente

d f (t (p)) f (p)
Xp (f ) = f t (p) = lim
dt t=0
t0 t
porque a trajetoria t (p) e uma curva diferenciavel que tem Xp como vetor tangente em t = 0. Por definicao,
se q = F (p), temos
(F X)q (f ) = [dFp (Xp )] f

= Xp (f F )
(f F ) (t (p)) (f F ) (p)
= lim
t0 t
f F t F 1 (q) (f F ) F 1 (q)

= lim
t
t0
f F t F 1 (q) f (q)
= lim ,
t0 t
o que significa que a curva diferenciavel F t F 1 tem (F X)q como vetor tangente em q, logo e o fluxo
local do campo F X.
8.41 Corolario. Se M e uma variedade diferenciavel e F : M M e um difeomorfismo, entao
F X = X
se e somente se
F t = t F.
8.42 Teorema. Se X, Y T (M ) sao campos vetoriais e t , s sao os fluxos locais respectivos de X, Y em
uma vizinhanca V de M , entao
t s = s t
se e somente se
[X, Y ] = 0
em V .
Prova: Se t s = s t , como t e um difeomorfismo, segue do Corolario 8.41 que (t ) Y = Y , de
modo que
[(t ) Y ]p Yp Yp Yp
[X, Y ]p = (LX Y )p = lim = lim =0
t0 t t0 t
para todo p V .
Reciprocamente, se [X, Y ] = 0 em V , considere a curva : (, ) Tp M definida por
(t) = [(t ) Y ]p .
Temos, observando que o pushforward satisfaz (F G) = F G

(t + h) (t)
0 (t) = lim
h0 h
[(th ) Y ]p [(t ) Y ]p
= lim
h0 h
[(t ) (h ) Y ]p [(t ) Y ]p
= lim
h0 h
(dt )t (p) [(h ) Y ]t (p) (dt )t (p) Yt (p)
= lim
h0 h
[(h ) Y ]t (p) Yt (p)
= (dt )t (p) lim
h0 h

= (dt )t (p) [X, Y ]t (p)
= (dt )t (p) (0)
= 0.
Portanto, (t) = (0), o que implica (t ) Y = Y , e o resultado segue do Corolario 8.41.
Em particular,
t s t s = id .
Isso significa o seguinte, em outras palavras: quando [X, Y ] = 0 em uma vizinhanca V de p M , se a partir
de p percorrermos a trajetoria do campo X durante um intervalo de tempo t atingindo um certo ponto p1 ,
e depois percorrermos a partir de p1 a trajetoria do campo Y durante um intervalo de tempo s atingindo
um segundo ponto p2 , voltarmos a partir de p2 ao longo da trajetorio do campo X durante um intervalo de
tempo t atingindo um certo ponto p3 e finalmente voltarmos tambem de p3 ao longo da trajetoria do campo
Y durante um intervalo de tempo s, chegaremos ao ponto original p (obviamente estamos assumindo que
em nenhum momento samos da vizinhanca V , o que sera verdade para deslocamentos s, t pequenos para os
quais os fluxos locais de X e Y estao definidos em V ). Se [X, Y ] 6= 0, isso nao e verdade e terminamos em
um ponto q diferente de p. O colchete de Lie portanto mede infinitesimalmente este defeito.
8.43 Teorema. Se E1 , . . . , Ek T (M ) sao campos vetoriais linearmente independentes suaves em uma
vizinhanca de p M tais que
[Ei , Ej ] = 0

para todos i, j = 1, . . . , k, entao existe uma vizinhanca coordenada x1 , . . . , xn de p tal que

Ei =
xi
para i = 1, . . . , k.
Prova: Sem perda de generalidade, podemos assumir atraves de uma carta adequada que M = U Rn ,
p=0e
Ei (0) = ei
para i = 1, . . . , k, onde {e1 , . . . , en } e a base canonica de Rn . Seja it o fluxo gerado pelo campo Ei . Defina
x1 , . . . , xn = 1x1 2x2 . . . kxk 0, . . . 0, xk+1 , . . . , xn

= 1x1 2x2 . . . kxk 0, . . . 0, xk+1 , . . . , xn . . . .

[Note que no caso especial em que k = n, a aplicacao e

(x) = x1 , . . . , xn = 1x1 . . . nxn (0)

= 1x1 2x2 (. . . (nxn (0)) . . .) .


Em outras palavras, para calcular x1 , . . . , xn , percorremos sucessivamente as trajetorias dos campos
En , . . . , E1 a partir da origem durante os intervalos de tempo xn , . . . , x1 : primeiro, saindo da origem, per-
corremos a trajetoria do campo En durante o intervalo de tempo xn , chegando em um certo ponto nxn (0);
partindo deste ponto percorremos a trajetoria do campo En1 durante o intervalo de tempo xn1 , che-
gando em um certo ponto n1 n
xn1 (xn (0)); continuamos desta forma sucessivamente ate chegar no ponto
1x1 2x2 (. . . (nxn (0)) . . .) que definimos como sendo o ponto (x).]
Afirmamos que d0 = I. De fato, dada f C (M ), se i = 1, . . . , k
(f )
d0 (ei ) (f ) = (0)
xi
16i6k

(f ) 0, . . . 0, h , 0, . . . , 0 f ( (0))
= lim
h0 h
f 10 . . . i1
0 i i+1
h 0 . . . k0 (0) f (0)
= lim
h0 h

f ih (0) f (0)
= lim
h0 h
= Ei (0) (f )
= ei (f ) ,
enquanto que se i = k + 1, . . . , n, temos
(f )
d0 (ei ) (f ) = (0)
xi
k+16i6n

(f ) 0, . . . 0, h , 0, . . . , 0 f ( (0))
= lim
h0 h
k+16i6n

f 10 20 . . . k0 . . . k0 0, . . . 0, h , 0, . . . , 0 f (0)
= lim
h0 h
k+16i6n

f 0, . . . 0, h , 0, . . . , 0 f (0)
= lim
h0 h
f
= (0)
xi
= ei (f ) ,
portanto
d0 (ei ) = ei

para i = 1, . . . , n. Segue que (x) = x1 , . . . , xn e um difeomorfismo local e portanto uma carta para uma
vizinhanca de p = 0.
Observe que podemos calcular explicitamente dx (e1 ) para todo x e nao somente na origem, obtendo
(f )
dx (e1 ) (f ) = (x)
x1
(f ) x1 + h, x2 . . . , xn f ( (x))
= lim
h0 h

f 1x1 +h 2x2 . . . kxk 0, . . . 0, xk+1 , . . . , xn f ( (x))
= lim
h0 h

f 1x1 +h 2x2 (. . . (nxn (0)) . . .) f (0)
= lim
h0 h
= E1 (x) (f ) ,
ou seja,

E1 (x) = dx (e1 ) =
x1 x
para todo x onde a carta esta definida. Isso prova o resultado para i = 1.
Mas, pelo teorema anterior, como [Ei , Ej ] = 0, temos que os fluxos dos campos E1 , . . . , Ek comutam, isto
e,
it jt = it jt
para todos i, j = 1, . . . , k. Logo, para i = 2, . . . , k podemos escrever
x1 , . . . , xn = ixi 1x1 2x2 . . . i . . . k k+1

, . . . , xn .

xk 0, . . . 0, x
d
xi
Pelo mesmo argumento anterior no caso i = 1, conclumos que

Ei (x) =
xi x
para i = 2, . . . , k, para todo x onde a carta esta definida, terminando a demonstracao do resultado.
Assim, o colchete de Lie mede em algum sentido o quanto as trajetorias de campos linearmente independentes
E1 , . . . , En podem ser usadas para formar as retas coordenadas de um sistema de coordenadas (veja
[Spivak], Vol. I, pp. 220-221, para uma afirmacao mais precisa deste resultado).
8.11 Exerccios

8.44 Exerccio. Considere o subconjunto X = (R {0}) R+ {1} de R2 com a seguinte base para a
sua topologia:
(a) intervalos do tipo (a, b) {0}, a < b;
(b) intervalos do tipo (a, b) {1}, 0 6 a < b;
(c) unioes de intervalos do tipo [(a, 0) {0}] [(0, b) {1}], a < 0 < b.
Verifique que X possui uma base enumeravel, que conjuntos finitos de pontos sao fechados em X e que
todo ponto de X possui uma vizinhanca difeomorfa a um conjunto aberto de R. Observe que X nao e, no
entanto, um espaco de Hausdorff, porque os pontos (0, 0) e (0, 1) nao possuem vizinhancas abertas disjuntas.
8.45 Exerccio. Seja X um conjunto. Suponha que exista uma famlia
= { }A
de aplicacoes injetivas : U V de um aberto U Rn sobre um subconjunto V de X para cada

A, satisfazendo as seguintes condicoes:
(1) Os abertos V cobrem X, isto e, [

V = X.
A
1
(2) Para todos ndices , A tais que V = V V 6= , os conjuntos 1
(V ) , (V ) sao abertos
n
em R e as aplicacoes
= 1 1 1
: (V ) (V ) ,
1
= 1 1
: (V ) (V ) ,
sao diferenciaveis de classe C .

Entao existe uma unica topologia T em X relativa a qual e um atlas diferenciavel de dimensao n para
X.
T nao e necessariamente de Hausdorff nem precisa possuir base enumeravel (ela e apenas localmente de
Hausdorff, pois se p, q V , p 6= q, eles possuem vizinhancas disjuntas porque V e homeomorfo a um aberto
de Rn ). Para isso, sao necessarias condicoes adicionais:
A topologia T e de Hausdorff se e somente se
3) Para todos ndices , A tais que V = V V 6= , nao existe nenhuma sequencia {xk }kN
1
(V ) tal que
xk x U \1
(V ) ,
1 1
(xk ) y U \ (V ) .
Ela possui uma base enumeravel se e somente se

(4) A cobertura {V }A possui uma cobertura enumeravel.
8.46 Exerccio. Mostre que uma variedade diferenciavel M e conexa se e somente se ela e conexa por
caminhos.
Alem disso, verifique que as componentes conexas de M sao as suas componentes conexas por caminhos.
Finalmente, prove que M possui no maximo um numero enumeravel de componentes conexas.
Captulo 9
Tensores
9.1 Vetores Contravariantes e Covariantes

Considere o conceito de vetor em Rn , por exemplo o vetor velocidade de uma curva descrita no sistema de
coordenadas x1 , . . . , xn por
x (t) = x1 (t) , . . . , xn (t) .

Temos
dx1 dxn

dx
= ,..., .
dt dt dt

Em um outro sistema de coordenadas y 1 , . . . , y n a curva e descrita por:
y (t) = y 1 (t) , . . . , y n (t) ,

de modo que seu vetor velocidade neste sistema de coordenadas e dado por
1
dy n

dy dy
= ,..., .
dt dt dt
A regra da cadeia nos da como as coordenadas do vetor velocidade mudam de um sistema de coordenadas
para o outro:
n
dy i X y i dxj
= (9.1)
dt j=1
xj dt
para i = 1, . . . , n.
Considere agora o conceito do gradiente de uma funcao, usualmente identificado com um vetor. No
sistema de coordenadas x1 , . . . , xn , o gradiente e definido por

f f
x f (x) = (x) , . . . , (x)
x1 xn

enquanto que no sistema de coordenadas y 1 , . . . , y n o gradiente e dado por

f f
y f (x) = (x) , . . . , n (x)
y 1 y
Novamente, a regra da cadeia nos da como as coordenadas do gradiente mudam de um sistema de coordenadas
para o outro:
n
f X xj f
= (9.2)
y i j=1
y i xj
86
para i = 1, . . . , n.
Comparando as expressoes (9.1) e (9.2), vemos que elas sao bem diferentes. Isso fica ainda mais claro se
considerarmos o Jacobiano da mudanca de coordenadas y = y (x),
i
y
J= (9.3)
xj
ou seja,
y 1 y 1

...
x1 xn

J = .. ..
.
. .
y n y n
...
x1 xn
Temos
dy dx
=J (9.4)
dt dt
enquanto que
T
y f = J 1 x f, (9.5)
pois
x1 x1

...
y 1 y n
dxi

J 1
=

= .. ..
.
dy j . .
xn xn
...
y 1 y n
Note que as leis de transformacao nao sao exatamente uma a inversa da outra no sentido matricial, ja que e
necessario transpor a matriz de mudanca de coordenadas. Observe tambem que para as formulas concidirem,
teramos que ter
T
J = J 1 ,
isto e, J precisaria ser uma transformacao ortogonal, o que equivale a requerer que os dois sistemas de
coordenadas x1 , . . . , xn e y 1 , . . . , y n sejam ortonormais, o que raramente ocorre.
O fato de que o gradiente de uma funcao sob uma mudanca de coordenadas transformar-se de uma maneira
diferente da de um vetor mostra que ele e um tipo diferente de vetor. Como veremos os motivos na proxima
secao, vetores que se transformam de acordo com a expressao (9.1) sao chamados vetores contravariantes,
enquanto que vetores que se transforma de acordo com a expressao (9.2) sao chamados vetores covariantes
(ou simplesmente covetores).
As coordenadas de um vetor contravariante sao convencionalmente denotadas por superescritos:
v = v1 , . . . , vn ,

(9.6)
porque, como nos casos dos vetores deslocamento, velocidade, aceleracao, etc., ou seja, vetores cujas di-
mensoes estao diretamente relacionadas as dimensoes das coordenadas, o deslocamento aparece no numera-
dor (acima da barra da fracao), enquanto que as coordenadas de um vetor covariante sao convencionalmente
denotadas por subescritos:
v = (v1 , . . . , vn ) , (9.7)
porque, como no caso do covetor gradiente, o deslocamento aparece no denominador (abaixo da barra da
fracao), ou seja, vetores tais como o gradiente tem dimensoes que sao inversas as dimensoes das coordenadas.
9.1.1 Significado Real do Gradiente

A derivada de uma funcao real f : Rn R em um ponto x Rn e um funcional linear dfx : Rn R.
O gradiente realmente nao e um vetor, mas sim um funcional linear ou uma 1-forma (estes termos sao
sinonimos). Como veremos daqui a pouco, funcionais lineares sao vetores (no espaco dual) que se comportam
com relacao a mudanca de coordenadas como covetores.
Assim, embora diferenciemos entre a diferencial dfx de uma funcao real f : Rn R, que e um funcional
linear, e a funcao gradiente, que associa a cada ponto x um vetor f (x) ou grad f (x), com a propriedade
especial que
dfx (v) = hf (x) , vi
para todo v Rn , onde h, i denota o produto interno canonico de Rn , de qualquer forma, devido a sua
definicao o vetor gradiente e um covetor e se comporta como tal.
Este fato nao e apenas um acidente restrito a forma especial com que ele se comporta com relacao a uma
mudanca de coordenadas, mas tambem e uma consequencia do significado geometrico de funcionais lineares
e do gradiente. Atraves do produto interno, qualquer funcional linear : Rn R e identificado com um
unico vetor v de Rn : v e o unico vetor tal que
(w) = hv, wi
n
para todo w R . Este vetor v e portanto perpendicular ao hiperplano ker , o nucleo do funcional . A
acao do funcional linear sobre um vetor arbitrario w pode ser entao vista da seguinte forma: determina
uma famlia de hiperplanos, os hiperplanos paralelos a ker ; (w) e entao o numero de hiperplanos que
a seta do vetor w perfura por unidade de distancia (esta e medida exatamente pelo produto interno).
Para vetores com o mesmo comprimento de v, o vetor v e o que perfura o maior numero de hiperplanos, ja
que e perpendicular a todos estes hiperplanos (a mesma consideracao evidentemente vale para v). Outros
vetores diferentes de v e v formarao um angulo nao reto com estes hiperplanos e, se tiverem o mesmo
comprimento que o vetor v, eles perfurarao consequentemente menos hiperplanos. Ou seja, se kwk = kvk
mas w 6= v, entao
(w) < (v) ;
de fato,
2
(w) = hv, wi = kvk kwk cos < kvk kwk = kvk = (v) .
Se w e ortogonal a v, entao w esta no nucleo de e nao perfura nenhum hiperplano da famlia; assim,
(w) = 0.
O vetor gradiente f (x) tambem se comporta geometricamente desta forma. Exceto que no caso do
gradiente substitumos a famlia de hiperplanos paralelos ao nucleo do funcional pela famlia das hiperfcies
de nvel da funcao f . O vetor gradiente e perpendicular as hiperfcies de nvel de f . Isto funciona porque
segue da definicao que o gradiente e perpendicular ao espaco tangente a hiperfcie de nvel: se : I Rn
e uma curva contida em uma hiperfcie de nvel, entao
f ( (t)) c
para todo t I algum valor real c; derivando esta equacao em relacao a t, obtemos
df(t) (0 (t)) = 0,
ou seja,
hf ( (t)) , 0 (t)i = 0.
Como isso vale para todas tais curvas, conclumos que f (x) e perpendicular a Tx f 1 (c) . Portanto, o

gradiente perfura as hiperfcies de nvel. Como no caso linear, a direcao do vetor gradiente e a direcao em
que mais hiperfcies de nvel sao perfuradas por unidade de distancia. Isso e quase equivalente a dizer que
o gradiente aponta na direcao em que a funcao cresce com maior rapidez (como se demonstra em Calculo),
pois perfurar as hiperfcies de nvel equivale a subir ou descer a montanha de contornos do grafico de f ,
dependendo do sentido escolhido.
9.2 Convencao da Soma de Einstein

As escolhas que faremos para a notacao neste captulo e no futuro
P sao necessarias para que a convencao da
soma de Einstein funcione: ao inves de usar o sinal de somatorio para denotar uma soma, convencionamos
que sempre que uma expressao contem um ndice como um superescrito e o mesmo ndice como subescrito,
uma soma e implcita sobre todos os valores que este ndice pode tomar. Alguns exemplos:
Convencao da Soma de Einstein Notacao de Somatorio

n
v i ei v i ei
P
i=1
n
Aji fj Aji fj
P
ei = ei =
j=1
n
i
i ei
P
i e
i=1
k n k
ek = A1 fl ek = A1 fl
P
l l
i=1
y j y j
Pn
= =
xi xi y j xi i
i=1 x y
j
n
T = Tij11...i
...jl i1
e . . . eik ej1 . . . ejl Tij11...i
...jl i1
e . . . eik ej1 . . . ejl ,
P
k
T = k
i1 ,...,ik =1
j1 ,...,jl =1
9.3 Vetores e Covetores

9.3.1 Mudanca de Coordenadas em Espacos Vetoriais
Dado um espaco vetorial real de dimensao finita V munido de uma base
B = {e1 , . . . , en } ,
denotaremos por [v]B o vetor coluna cujos elementos sao as coordenadas do vetor v em relacao a base B, ou
seja, se
v = v i ei ,
entao
v1

[v]B = ... .

vn

Tambem abusaremos esta notacao as vezes, escrevendo [v]B = v 1 , . . . , v n .
9.1 Definicao. Sejam V um espaco vetorial real e
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn } ,
duas bases para V . A matriz de mudanca de coordenadas da base B1 para a base B2 e a matriz A tal
que
[v]B2 = A [v]B1 . (9.8)
Quando necessario, ela sera denotada por AB1 B2 .
9.2 Notacao. Denotaremos o elemento que ocupa a i-esima linha e a j-esima coluna de A por Aij .
9.3 Proposicao. Sejam
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn } ,
duas bases para um espaco vetorial real V . Se A = Aij e a matriz de mudanca de coordenadas da base B1

para a base B2 , entao os elementos desta matriz sao definidos por
ei = Aji fj . (9.9)
Ou seja, as colunas de A sao as coordenadas dos vetores da base B1 em relacao a base B2 .

Prova: De fato, se vale (9.9), entao

v = v i ei = v i Aji fj = Aji v i fj ,
que e exatamente (9.8):

A11 A1n v1

...
.. .. .. = A [v] .
[v]B2 = . . . B1
An1 ... Ann vn

Observe agora que enquanto a lei de transformacao dos vetores da base B2 para a base B1 e
ei = Aji fj , (9.10)
a lei de transformacao das coordenadas de vetores na base B2 para a base B1 e contraria: como
[v]B1 = A1 [v]B2 ,
segue que se
[v]B1 = v 1 , . . . , v n ,

[v]B2 = w1 , . . . , wn ,

entao i
v i = A1 j
wj . (9.11)
A lei de transformacao (9.10) e considerada a lei de transformacao fundamental. Portanto, a observacao
acima motiva a seguinte definicao:
9.4 Definicao. Vetores que se transformam de maneira contraria a lei (9.10) sao chamados vetores con-
travariantes.
Assim, os vetores do proprio espaco vetorial V sao vetores contravariantes.
9.3.2 Covetores
9.5 Definicao. Seja V um espaco vetorial real de dimensao finita. Um covetor de V e qualquer funcional
linear : V R.
O espaco vetorial dos covetores de V , com as definicoes naturais de soma de covetores e multiplicacao de
covetores por escalares reais e chamado o espaco dual de V e denotado por V .
Portanto, covetor de V nada mais e que um sinonimo para funcional linear sobre V .
9.6 Definicao. Seja B = {e1 , . . . , en } uma base para o espaco vetorial V . Definimos a base dual
B = e1 , . . . , en

de V por
ei (ej ) = ij , i, j = 1, . . . , n. (9.12)

Um covetor arbitrario V expressa-se em coordenadas com relacao a base dual B na forma
= i ei .
Observe que se
v = v i ei ,
entao
ei (v) = v i . (9.13)
9.7 Definicao. Sejam V, W espacos vetoriais. Dada uma aplicacao linear A : V W , definimos a
aplicacao linear dual ou transposta A : W V de A por
(A ) v = (Av)
para todo W e para todo v V .

9.8 Proposicao. Sejam
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn }
duas bases para o espaco vetorial V e
B1 = e1 , . . . , en ,

B2 = f 1 , . . . , f n

as respectivas bases duais para V . Se A e a matriz de mudanca de coordenadas da base B1 para a base B2 ,
entao i
ei = A1 j f j . (9.14)
T
Consequentemente, A1 e a matriz de mudanca de coordenadas da base dual B1 para a base dual B2 ,

isto e,
T
[]B = A1 []B . (9.15)
2 1
Prova. Pela Proposicao (9.3),

ei = Aji fj .
Seja B = Blk a matriz de transformacao da base B1 para a base B2 , isto e,

ek = Blk f l .
Entao

ik = ek (ei ) = ek Aji fj = Aji ek (fj ) = Aji Blk f l (fj )
= Aji Blk jl = Aji Bjk = Bjk Aji ,
de modo que BA = I, donde B = A1 e portanto

k
ek = A1 l
f l.
(9.15) segue da aplicacao da Proposicao (9.3) a (9.14), substituindo V por V e B1 , B2 por B1 , B2 .
Portanto, assim como a lei de transformacao dos vetores da base B2 para a base B1 (lei de transformacao
fundamental) e
ei = Aji fj ,
a lei de transformacao das coordenadas de vetores na base B2 para a base B1 e a mesma: como
[]B = AT []B ,
1 2
segue que se
[]B = (1 , . . . , n ) ,
1
[]B = (1 , . . . , n ) ,
2
entao
i = Aji j . (9.16)
Ou seja, covetores variam (se transformam) da mesma forma como variam (se transformam) os vetores da
base do espaco vetorial, que convencionamos ser a lei de transformacao fundamental. Esta observacao motiva
a seguinte definicao:
9.9 Definicao. Vetores que se transformam da mesma forma que a lei (9.10) sao chamados vetores cova-
riantes.
Assim, os covetores do espaco dual V sao vetores covariantes.
9.3.3 O Espaco Bidual

9.10 Definicao. Seja V um espaco vetorial real de dimensao finita. O espaco dual (V ) do espaco dual de
V e chamado o espaco bidual de V e denotado V .
Uma importante identificacao natural (isto e, um isomorfismo definido independentemente de bases e
baseado apenas na estrutura linear) existe entre um espaco vetorial e seu espaco bidual:
9.11 Proposicao. A aplicacao : V V definida por
(v) () = (v)
e um isomorfismo natural entre V e V .
Prova. Como dim V = dim V , para verificar que e um isomorfismo basta mostrar que ele e injetivo, isto
e, que seu nucleo e o subespaco nulo. Seja e1 V um vetor nao nulo qualquer. Estenda este vetor a uma
base B = {e1 , . . . , en } para V . Seja B = e1 , . . . , en a correspondente base dual de V . Entao (e1 ) 6= 0
porque
(e1 ) e1 = e1 (e1 ) = 1.

Em vista desta identificacao, um vetor v V pode ser visto como um funcional linear sobre V cuja acao
em covetores de V e dada por
v () = (v) . (9.17)
Em particular,
ei ej = ij

(9.18)
e se
= i ei ,
entao
ei () = i . (9.19)
9.4 Vetores e Covetores Tangentes

9.4.1 Mudanca de Coordenadas no Espaco Tangente Tp M
Se : U (U ) e : V (V ) sao duas cartas para vizinhancas coordenadas de p = (x) =
x1 , . . . , xn = (y) = y 1 , . . . , y n em M , abusando a notacao frequentemente escrevemos
1 (x) = 1 x1 , . . . , xn = y 1 x1 , . . . , xn , . . . , y n x1 , . . . , xn ,

j
isto e, denotamos as funcao coordenadas 1 (x) por y j (x).
9.12 Proposicao. Seja M uma variedade diferenciavel n-dimensional e
: U (U ) ,
: V (V ) ,
duas cartas para vizinhancas coordenadas de p = (x) = (y) em M . Sejam

( )

Bx = ,..., ,
x1 p xn p
( )

By = ,..., ,
y 1 p y n p
as bases coordenadas de Tp M induzidas pelas cartas e , respectivamente. Denote

j
y j 1
(x) := (x)
xi xi
Entao a matriz de mudanca de coordenadas da base Bx para a base By e definida por
y j

= . (9.20)
xi p xi y j p
Prova: Por definicao e pela regra da cadeia,

" j # j
1 1

1

= dx (ei ) = dy d x (ei ) = dy (x) fj = dy (fj )
xi p xi xi
y j

= .
xi y j p

Portanto, se um vetor v Tp M se escreve em coordenadas em relacao as bases Bx e By nas formas

i

v = vx ,
xi p

v = vyj ,
y j p
entao, pelas Proposicoes 9.3 e 9.12, a lei de transformacao de coordenadas e dada por
xi j
vxi = v . (9.21)
y j y
9.4.2 Covetores Tangentes

Enquanto que o conceito de vetores tangentes em variedades permite uma interpretacao livre de coordenadas
de derivadas de curvas, diferenciais de funcoes reais em variedades (ou seja, o analogo do gradiente em Rn ) sao
interpretadas de maneira mais natural como covetores tangentes (compare a Proposicao 9.8 com a discussao
na introducao deste captulo).
9.13 Definicao. Seja M uma variedade diferenciael. Para cada p M definimos o espaco cotangente
Tp M a M em p por

Tp M = (Tp M ) .
Elementos de Tp M sao chamados covetores tangentes a M em p.
Assim, o espaco cotangente a M em p e o dual do espaco tangente a M em p.
9.14 Definicao. Seja M uma variedade diferenciavel e : U (U ) uma carta de uma vizinhanca
coordenada de um ponto p M . A base coordenada
( )

Bp = ,...,
x1 p xn p
do espaco tangente Tp M associada a carta da origem a uma base dual coordenada para o espaco
cotangente Tp M associada a carta que denotaremos por
n o
Bp = dx1 p , . . . , dxn |p .

(9.22)

Portanto, qualquer covetor Tp M pode ser escrito de maneira unica como
= i dxi p ,

(9.23)
onde !

i = . (9.24)
xi p
Vamos investigar agora como as coordenadas de um covetor tangente se transformam quando ha uma mu-
danca de bases coordenadas, de uma carta para outra.
9.15 Proposicao. Seja M uma variedade diferenciavel n-dimensional e : U (U ) , : V (V )
duas cartas para vizinhancas coordenadas de p = (x) = (y) em M . Sejam
( )

Bx = ,..., ,
x1 p xn p
( )

By = ,...,
y 1 p y n p
as bases coordenadas de Tp M induzidas pelas cartas e , respectivamente. Denote por

n o
Bx = dx1 p , . . . , dxn |p ,

n o
By = dy 1 p , . . . , dy n |p

as respectivas bases duais. Entao a matriz de mudanca de coordenadas da base Bx para a base By e dada
por
xi
dxi p = dy j p .

j
(9.25)
y
Prova: Pela Proposicao 9.12, a mudanca de coordenadas da base Bx para a base By e dada por
y j

= .
xi p xi y j p
O resultado segue entao da Proposicao 9.8.

Obtemos tambem da discussao que se segue a Proposicao 9.8 que se
[]B = (1x , . . . , nx ) ,
x
[]B = (1y , . . . , ny ) ,
y
entao
y j y
xi =
.
xi j
Podemos agora entender a terminologia antiga em que vetores tangentes eram chamados vetores contrava-
riantes, enquanto que covetores tangentes eram chamados vetores covariantes. E importante ressaltar que
esta terminologia nada tem a ver com functores covariantes e contravariantes da teoria de categorias.
9.5 Tensores
9.5.1 Definicao
9.16 Definicao. Seja V um espaco vetorial real de dimensao finita e V seu espaco dual.
Um k-tensor covariante em V (ou tensor covariante de ordem k) e uma funcao real k-linear
T : V . . . V R.
| {z }
k vezes
Um l-tensor contravariante em V (ou tensor contravariante de ordem l) e uma funcao real l-linear
T : V . . . V R.
| {z }
l vezes
Um tensor do tipo (k, l) e um tensor k-covariante e l-contravariante, isto e, uma funcao real multilinear
T : V . . . V V . . . V R.
| {z } | {z }
k vezes l vezes
O espaco vetorial real dos k-tensores covariantes sobre V sera denotado por T k (V ); o espaco vetorial dos
l-tensores contravariantes sobre V sera denotado por Tl (V ) e o espaco vetorial dos (k, l) tensores sobre V
sera denotado por Tlk (V ). Estes espacos vetoriais sao chamados espacos tensoriais.
9.17 Exemplo. Um 1-tensor covariante e simplesmente um covetor. Formas bilineares, entre elas o produto
interno, sao 2-tensores covariantes. Determinantes sao n-tensores covariantes em Rn .
Algumas identificacoes naturais (isto e, independente de especificacao de bases):
0-tensores sao numeros reais:

T 0 (V ) = R;
tensores do tipo (k, 0) sao k-tensores covariantes:
T0k (V ) = T k (V ) ;
tensores do tipo (0, l) sao l-tensores contravariantes:
Tl0 (V ) = Tl (V ) ;
1-tensores covariantes sao covetores:

T 1 (V ) = V
1-tensores contravariantes sao vetores:
T1 (V ) = V = V.
9.18 Proposicao. Seja End (V ) o espaco vetorial dos operadores lineares sobre V . Entao existe um iso-
morfismo natural
T11 (V )
= End (V ) .
Prova. Um isomorfismo natural : End (V ) T11 (V ) pode ser definido por
(A) (v, ) = (Av) .

l
9.19 Proposicao. Considere o espaco vetorial L V k (V ) ; V das aplicacoes multilineares
T : V . . . V V . . . V V.
| {z } | {z }
k vezes l vezes
Entao existe um isomorfismo natural

(V )
l
k
Tl+1 = L V k (V ) ; V .
Prova. Este pode ser definido por
(T ) v1 , . . . , vk , 1 , . . . , l , l+1 = l+1 T v1 , . . . , vk , 1 , . . . , l .

9.5.2 Produto Tensorial

9.20 Definicao. Sejam T e S tensores de tipos (k, l) e (p, q), respectivamente. Seu produto tensorial e
o tensor T S do tipo (k + p, l + q) definido por
(T S) v1 , . . . , vk+p , 1 , . . . , l+q = T v1 , . . . , vk , 1 , . . . , l S vk+1 , . . . , vk+p , l+1 , . . . , l+q .

9.21 Exemplo. Sejam 1 , 2 dois covetores (1-tensores covariantes). Entao
1 2 (v1 , v2 ) = 1 (v1 ) 2 (v2 )
e um 2-tensor covariante (uma forma bilinear).
Usando produtors tensoriais, podemos obter uma base para o espaco tensorial Tlk (V ):
9.22 Proposicao. Se
B = {e1 , . . . , en }
e uma base para o espaco vetorial V e
B = e1 , . . . , en

e a correspondente base dual para V , entao
Bkl = ei1 . . . eik ej1 . . . ejl 16i1 ,...,ik 6n

(9.26)
16j1 ,...,jl 6n
e uma base para o espaco tensorial Tlk (V ). Alem disso, qualquer tensor T Tlk (V ) se escreve na forma
T = Tij11...i
...jl i1
k
e . . . eik ej1 . . . ejl , (9.27)
onde
Tij11...i
...jl
= T ei1 , . . . , eik , ej1 , . . . , ejl .

k
(9.28)
Em particular, dim Tlk (V ) = nk+l .
Prova. Primeiro mostraremos que Bkl gera o espaco tensorial Tlk (V ). Seja T Tlk (V ) um tensor qualquer
e defina
Tij11...i
...jl
= T ei1 , . . . , eik , ej1 , . . . , ejl .

k
Se v1 , . . . , vk V , 1 , . . . , l V sao vetores e covetores arbitrarios, expressos em coordenadas por
vr = vrir eir e s = jss ejs
para r = 1, . . . , k e s = 1, . . . , l, segue da multilinearidade que
T v1 , . . . , v k , 1 , . . . , l

= T v1i1 ei1 , . . . , vkik eik , j11 ej1 , . . . , jl l ejl

= v1i1 . . . vkik j11 . . . jl l T ei1 , . . . , eik , ej1 , . . . , ejl

= Tij11...i
...jl i1
v . . . vkik j11 . . . jl l
k 1
= Tij11...i
...jl i1
e (v1 ) . . . eik (vk ) ej1 1 . . . ejl l

k
= Tij11...i
...jl i1
e . . . eik ej1 . . . ejl v1 , . . . vk , 1 , . . . , l .

k
Para mostrar que Bkl e linearmente independente, suponha que exista uma combinacao linear nula
T = Cij11...i
...jl i1
k
e . . . eik ej1 . . . ejl = 0
para algumas constantes Cij11...i

...jl
k
R. Como
ei1 . . . eik ej1 . . . ejl (er1 , . . . , erk , es1 , . . . , esl )

= ei1 (er1 ) . . . eik (erk ) ej1 (es1 ) . . . ejl (esl )
= ir11 . . . irkk sj11 . . . sjll ,
segue que
0 = T (er1 , . . . , erk , es1 , . . . , esl ) = Crs11...r
...sl
k
para todos os ndices r1 , . . . , rk , s1 , . . . , sl = 1, . . . , n.

Este resultado mostra que um tensor e completamente determinado pela sua acao em todas as sequencias
possveis de covetores e vetores das bases de V e V .
k+p
Observe que, se F Tlk (V ), G Tqp (V ) e T = F G Tl+q (V ), entao
j ...j jl+1 ...jl+q j1 jl jl+1
, . . . , ejl+q

Ti11...iklik+1 ...ik+p = T ei1 , . . . , eik , eik+1 , . . . , eik+p , e , . . . , e , e
= F ei1 , . . . , eik , ej1 , . . . , ejl G eik+1 , . . . , eik+p , ejl+1 , . . . , ejl+q

de modo que
j ...j j ...j j1 ...jl j ...j
Ti11...iklik+1
l+1 l+q l+1 l+q
...ik+p = Fi1 ...ik Gik+1 ...ik+p . (9.29)
9.5.3 Mudanca de Base

9.23 Proposicao. Sejam B1 = {e1 , . . . , en } , B2 = {f1 , . . . , fn } duas bases para o espaco vetorial V e
B1 = e1 , . . . , en , B2 = f 1 , . . . , f n as respectivas bases duais para V . Sejam A a matriz de mudanca

T
de coordenadas da base B1 para a base B2 , e A1 a matriz de mudanca de coordenadas da base dual B1
para a base dual B2 , isto e,
k
ei = Aji fj e ek = A1 l f l .
Sejam
T = Eij11...i
...jl i1
k
e . . . eik ej1 . . . ejl
= Fij11...i
...jl i1
k
f . . . f ik fj1 . . . fjl
as expressoes em coordenadas para um tensor T Tlk (V ) em relacao a estas bases. Entao

j1 jl
Eij11...i
...jl
k
= Ari11 . . . Arikk A1 s1 . . . A1 s Frs11...r
...sl
k
. (9.30)
l
Prova. Segue da ultima proposicao e por multilinearidade que

Eij11...i
...jl
k
= T ei1 , . . . , eik , ej1 , . . . , ejl

j1 jl
= T Ari11 fr1 , . . . , Arikk frk , A1 s1 f s1 , . . . , A1 s f sl
l
r1 rk 1 j1 1 jl
T (fr1 , . . . , frk , f s1 , . . . , f sl )

= Ai1 . . . Aik A s1
... A sl
j1 jl
= Ari11 . . . Arikk A1 s1 . . . A1 s Frs11...r ...sl
k
.
l

9.24 Definicao. Seja M uma variedade diferenciavel. Para cada p M definimos o espaco tensorial
tangente Tlk (Tp M ) a M em p. Seja : U (U ) uma carta de uma vizinhanca de um ponto p M . A
base coordenada ( )

Bp = ,...,
x1 p xn p
do espaco tangente Tp M associada a carta e sua respectiva base dual
n o
Bp = dx1 p , . . . , dxn |p

dao origem a base coordenada associada a carta para o espaco tensorial tangente Tlk (Tp M )
( )

Bkl p = dxi1 p . . . dxik p

... (9.31)
xj1 p xjl p 16i1 ,...,ik 6n
16j1 ,...,jl 6n

9.25 Corolario. Seja M uma variedade diferenciavel n-dimensional e : U (U ) , : V (V )

duas cartas para vizinhancas de p = (x) = (y) em M . Sejam
( )

Bx = ,..., ,
x1 p xn p
( )

By = ,...,
y 1 p y n p
as bases coordenadas de Tp M induzidas pelas cartas e , respectivamente, e

n o
Bx = dx1 p , . . . , dxn |p ,

n o
By = dy 1 p , . . . , dy n |p

suas respectivas bases duais. Sejam

Tp = Eij11...i
...jl
(p) dxi1 p . . . dxik p

. . .
k
xj1 p xjl p

j1 ...jl i1
ik

= Fi1 ...ik (p) dy p . . . dy p ...
y j1 p y jl p
as expressoes em coordenadas para um tensor Tp Tlk (Tp M ) em relacao a estas bases. Entao
y r1 y rk xj1 xjl s1 ...sl
Eij11...i
...jl
(p) = . . . . . . F (p) . (9.32)
k i
x 1 i s
x k y 1 y sl r1 ...rk
Prova: Segue das Proposicoes 9.12, 9.15 e 9.23.
9.5.4 Traco de Tensores

O traco de uma matriz A = Aij nn
e definido por
tr A = Aii .
A partir disso pode-se definir o traco de um operador linear sobre um espaco vetorial real de dimensao finita
como sendo o traco de qualquer uma de suas representacoes matriciais com respeito a uma base fixada pois
pode-se provar que o traco independe da base escolhida, ou seja, que o traco e uma nocao independente de
coordenadas. Usando o isomorfismo natural entre o espaco vetorial End (V ) dos operadores lineares sobre V
e T11 (V ), podemos definir logo de incio o traco para operadores lineares independemente de coordenadas.
Alem da vantagem obvia de se ter uma definicao que nao se refere a coordenadas, a maior vantagem e que
ela sera naturalmente generalizada para definir o traco de tensores.
Observe que e uma consequencia da Proposicao 9.22 que os produtos tensoriais da forma v, V ,
v V , geram T11 (V ); em outras palavras, todo (1, 1)-tensor e uma combinacao linear de tais produtos
tensoriais.
9.26 Definicao. O traco de (1, 1)-tensores e o funcional linear tr : T11 (V ) R definido por
tr ( v) = (v)
em produtos tensoriais e estendido linearmente a todo T11 (V ).
Se : End (V ) T11 (V ) e o endomorfimo natural, entao o traco de um operador linear A End (V )
e definido por
tr A = tr ( (A)) .

9.27 Proposicao. Se T T11 (V ) se escreve em coordenadas na forma
T = Tij ei ej ,
entao
tr T = Tii . (9.33)
Se A End (V ), entao
tr A = Aii . (9.34)
Prova: Por definicao,
tr T = Tij tr ei ej = Tij ei (ej ) = Tij ji = Tii .

Da, como
i
tr A = [ (A)]i ,
e, pela Proposicao 9.18,
j
[ (A)]i = (A) ei , ej = ej (Aei ) = ej Aki ek

= Aki ej (ek ) = Aki jk = Aji ,
segue a segunda expressao.

O conceito de traco pode ser generalizado para tensores de qualquer tipo, produzindo uma operacao que
diminui a ordem total do tensor em 2, 1 para a parte covariante e 1 para a parte contravariante. Antes
observe que, dado um tensor T do tipo (k, l) e ndices p, q, cada (k 1, l 1)-upla fixada
l1
v1 , . . . , vp1 , vp+1 , . . . , vk , 1 , . . . , q1 , q+1 , . . . , l V k1 (V )

define um tensor S T11 (V ), que depende da (k 1, l 1)-upla escolhida, atraves da expressao
S (v, ) = T v1 , . . . , vp1 , v, vp+1 , . . . , vk , 1 , . . . , q1 , , q+1 , . . . , l .

Em outras palavras, fixados v1 , . . . , vp1 , vp+1 , . . . , vk , 1 , . . . , q1 , q+1 , . . . , l ,
T v1 , . . . , vp1 , , vp+1 , . . . , vk , 1 , . . . , q1 , , q+1 , . . . , l

e um (1, 1)-tensor.
9.28 Definicao. Dado um tensor T do tipo (k, l) e ndices p, q, o traco de T com respeito aos ndices p, q
(ndice covariante p e ndice contravariante q) e o tensor tr T do tipo (k 1, l 1) definido por
(tr T ) v1 , . . . , vp1 , vp , . . . , vk1 , 1 , . . . , q1 , q , . . . , l1

= tr T v1 , . . . , vp1 , , vp , . . . , vk1 , 1 , . . . , q1 , , q , . . . , l1 .

Se for necessario explicitar os ndices em relacao aos quais foi tomado o traco, denotaremos trpq T .
9.29 Proposicao. Se T Tlk (V ) se escreve em coordenadas na forma
T = Tij11...i
...jl i1
k
e . . . eik ej1 . . . ejl .
entao as coordenadas de
j ...j
tr T = (tr T )i11...ik1
l1
ei1 . . . eik1 ej1 . . . ejl1
sao dadas por

j ...j j ...j ij ...j
(tr T )i11...ik1
l1
= Ti11...ip1
q1 q k1
iip ...il1 . (9.35)

Prova: Por definicao, se S e o tensor T ei1 , . . . , eip1 , , eip , . . . , eik1 , ej1 , . . . , ejq1 , , ejq , . . . , ejl1 , entao
j ...j
= (tr T ) ei1 , . . . , eip1 , eip , . . . , eik1 , ej1 , . . . , ejq1 , ejq , . . . , ejl1

(tr T )i11...ik1
l1
= tr S
= Sii
= T ei1 , . . . , eip1 , ei , eip , . . . , eik1 , ej1 , . . . , ejq1 , ei , ejq , . . . , ejl1

j ...j ij ...j
= Ti11...ip1
q1 q l1
iip ...ik1 .
9.6 Fibrados Tensoriais

9.30 Definicao. Seja M uma variedade diferenciavel de dimensao n com um atlas = { : U M }A .
O fibrado (k, l)-tensorial de M e a variedade diferenciavel de dimensao n + nk+l
Tlk M = (p, T ) : p M e T Tlk (Tp M )

com um atlas n k+l

o
= : U Rn Tlk T M
A
definido por
!

x, Tij11...i
...jl
k i1 ,...,ik =1,...,n
j1 ,...,jl =1...,n
!

(x) , Tij11...i
...jl i1 ik

= dx . . . dx ... .
k p p xj1 p xjl p

Fibrados tensoriais sao fibrados vetoriais (veja o Exerccio 1.3). Note que
T 0 M = C (M ) ,
T1 M = T M,
T 1 M = T M,
T0k M = T k M,
Tl0 M = Tl M.
O fibrado T 1 M e chamado o fibrado cotangente.
9.7 Campos Tensoriais

9.31 Definicao. Um campo tensorial e uma secao do fibrado tensorial. Um campo tensorial dife-
renciavel e uma secao diferenciavel do fibrado tensorial.
O espaco vetorial dos campos (k, l)-tensoriais diferenciaveis e denotado por Tlk (M ).
A menos que seja dito o contrario, lidaremos apenas com campos tensoriais diferenciaveis. Note que
T 0 (M ) = C (M ) ,
T1 (M ) = T (M ) ,
T0k (M ) = T k (M ) ,
Tl0 (M ) = Tl (M ) .
e T 1 M e o espaco vetorial dos campos covetoriais.

9.32 Proposicao. Seja T : M Tlk M um campo tensorial. Para cada carta : U V uma vizinhanca
V de M , denote a base coordenada associada para o espaco tensorial Tlk (Tp M ) por
( )

Bl p = dx p . . . dx p
k i1 ik

...
xj1 p xjl p 16i1 ,...,ik 6n
16j1 ,...,jl 6n
para todo p V , de modo que nesta base coordenada o campo tensorial T se escreve na forma

j1 ...jl i1
ik

Tp = Ti1 ...ik (p) dx p . . . dx p ... . (9.36)
xj1 p xjl p
Entao T e um campo tensorial diferenciavel se e somente se para toda carta as funcoes Tij11...i
...jl
k
: V R
sao diferenciaveis para todos os ndices i1 , . . . , ik , j1 , . . . , jl = 1 . . . , n.
9.8 Exerccios
9.33 Exerccio. Defina explicitamente o fibrado cotangente e mostre que ele e um fibrado vetorial. Defina
explicitamente o conceito de campos covetoriais.
9.34 Exerccio. Mostre que o fibrado tensorial definido pela Definicao 9.30 e de fato uma variedade dife-
renciavel.
9.35 Exerccio. Mostre que um fibrado tensorial e um fibrado vetorial.
9.36 Exerccio. Demonstre a Proposicao 9.32.
9.37 Exerccio. Seja T : M Tlk M uma secao do fibrado tensorial. Mostre que T e diferenciavel (e,
portanto, um campo tensorial diferenciavel) se e somente se para toda vizinhanca V M e para todos os cam-
pos vetoriais X1 , . . . , Xk e para todas os campos covetoriais 1 , . . . , l a funcao T X1 , . . . , Xk , 1 , . . . , l :
V R definida por
T X1 , . . . , Xk , 1 , . . . , l (p) = Tp X1 (p) , . . . , Xk (p) , 1 (p) , . . . , l (p)

e diferenciavel.
Captulo 10
Variedades Metricas
10.1 Definicao e Exemplos

10.1 Definicao. Seja M uma variedade diferenciavel de dimensao n. Uma metrica (ou tensor metrica)
de ndice k em M e um campo diferenciavel tensorial 2-covariante g tal que gp e um produto interno com o
mesmo ndice k para todo p M . Uma variedade diferenciavel munida de uma metrica g e chamada uma
variedade metrica.
Uma variedade diferenciavel M com uma metrica g dada e chamada uma variedade metrica.
Se g e um produto interno positivo definido (ou seja, se o seu ndice e 0), dizemos que g e uma metrica
riemanniana e M e uma variedade riemanniana.
Se o ndice de g e diferente de zero, dizemos que g e uma metrica semi-riemanniana e M e uma
variedade semi-riemanniana.
Se g e um produto interno de Lorentz (ou seja, se o ndice e 1), dizemos que g e uma metrica de Lorentz
e M e uma variedade de Lorentz.
Em outras palavras, uma metrica em M e uma aplicacao que associa a cada ponto p M um produto
interno
gp = h, ip
no espaco tangente Tp M que varia diferenciavelmente ( com p no sentido de que se : U V e uma
)

carta para uma vizinhanca coordenada V de M e Bp = ,..., e a base coordenada de Tp M
x1 p xn p
associada a esta carta para cada p V , entao as funcoes gij : V R
* +

gij (p) = , (10.1)
xi p xj p
p
sao diferenciaveis. De fato, escrevendo o tensor metrica em coordenadas, temos
gp = gij (p) dxi p dxj p ,

(10.2)
e as funcoes componentes gij do tensor metrica g sao diferenciaveis para toda parametrizacao se e somente
se g e diferenciavel.
Omitindo o smbolo do ponto de atuacao p, como frequentemente faremos, escrevemos simplesmente

gij = , (10.3)
xi xj
103
e notamos que a simetria do tensor metrica implica que
gij = gji . (10.4)
Em particular, quando consideramos a matriz
G = (gij ) (10.5)
segue que G e uma matriz simetrica. Observe que devido a simetria existem apenas
n (n + 1)
2
componentes potencialmente distintos do tensor metrica, ao inves dos n2 componentes distintos para um
tensor 2-covariante geral.
Usando o produto simetrico de tensores (veja [Lee 1], Cap. 12, p. 315), que no caso de covetores e
simplesmente
1
:= ( + ) (10.6)
2
e a simetria do tensor metrica, podemos escrever a expressao
g = gij dxi dxj
na forma mais familiar

g = gij dxi dxj , (10.7)
ja que
1
g = gij dxi dxj = (gij + gji ) dxi dxj
2
1 1
= gij dxi dxj + gji dxi dxj
2 2
1 1
= gij dxi dxj + gij dxj dxi (permutando os ndices i, j)
2 2
1
= gij dxi dxj + dxj dxi

2
= gij dxi dxj .
Estritamente falando, uma variedade metrica e um par (M, g), onde M e uma variedade diferenciavel
e g a metrica riemanniana, ja que uma mesma variedade diferenciavel pode admitir diferentes metricas
riemannianas, como veremos no decorrer deste texto. Contudo, quando nao houver perigo de confusao, nos
vamos nos referir a variedade riemanniana simplesmente por M .
10.2 Exemplo (Metrica Euclidiana). A variedade riemanniana mais simples e o espaco euclidiano Rn
com a metrica euclidiana gij = ij , que denotaremos En .
10.3 Exemplo (Metrica Semieuclidiana). A variedade semi-riemanniana mais simples de ndice k e o
espaco semi-euclidiano Rn com a metrica semieuclidiana gij = ij
k
, que denotaremos Mnk .
10.4 Exemplo (Metrica de Lorentz). A variedade de Lorentz mais simples de ndice 1 e o espaco de
Minkowski n-dimensional Rn , n > 2, com a metrica de Lorentz gij = ij . Denotaremos este espaco
por Mn , enquanto que o espacotempo de Minkowski da relatividade especial M4 continuara a ser denotado
geralmente apenas por M.
10.5 Proposicao. Toda variedade diferenciavel possui uma metrica riemanniana.
Prova: Seja { : U V } um atlas para M e {f } uma particao da unidade de M subordinada a

cobertura {V } .
Em cada V podemos definir uma metrica riemanniana, aquela induzida M e vetores
(pela carta: dado p )

v, w Tp M , eles se escrevem em coordenadas com relacao a base Bp =

,..., associada a
x1 p xn p
carta por
i j

v=v e w=w
xi p xj p
e definimos o produto interno

hv, wip = vi wi .

Esta e uma metrica riemanniana na subvariedade V com gij = ij . Para obter uma metrica riemanniana
global em M , usamos a particao da unidade, definindo
X
hv, wip = f (p) hv, wip .

De fato, esta soma e finita em uma vizinhanca de p, portanto define um tensor diferenciavel em M ; alem
disso, como uma combinacao linear finita positiva de produtos internos e um produto interno, ela define um
produto interno em Tp M .
Observe que a demonstracao acima nao funciona para metricas semi-riemannianas. De fato, uma com-
binacao linear finita de metricas semi-riemannianas, mesmo positiva, nao e necessariamente uma metrica
semi-riemanniana. Por exemplo, a soma das metricas semi-riemannianas em R4
hv, wi1 = v1 w1 + v2 w2 v3 w3 v4 w4 ,
hv, wi2 = v1 w1 v2 w2 + v3 w3 + v4 w4 ,
e o tensor nulo. Mais ainda, a soma das metricas de Lorentz em R4
hv, wi1 = v1 w1 + v2 w2 + v3 w3 + v4 w4 ,
hv, wi2 = v1 w1 v2 w2 + v3 w3 + v4 w4 ,
e o tensor
T (v, w) = 2 (v3 w3 + v4 w4 ) ,
que e degenerado, pois se v0 = (1, 1, 0, 0), entao
T (v0 , w) = 0
para todo w R4 . A realidade e que existem variedades diferenciaveis que nao admitem metricas semi-
riemannianas. Por exemplo, e possvel provar, usando tecnicas de Topologia Diferencial, que esferas de
dimensao par nao admitem metricas de Lorentz (em particular S4 nao pode ser uma variedade de Lorentz; o
espacotempo nao pode ser uma esfera 4-dimensional); mais geralmente, e possvel provar que toda variedade
diferenciavel compacta de dimensao mpar possui uma metrica de Lorentz e que uma variedade diferenciavel
compacta de dimensao par admite uma metrica de Lorentz se e somente se ela tem caracterstica de Euler nula
(veja [Steenrod], Theorem 40.13, p. 207). Por outro lado, todas as variedades diferenciaveis nao compactas
admitem metricas de Lorentz (veja [BEE], p. 50).
10.6 Exemplo (Metrica Produto). Se (M1 , g1 ) e (M2 , g2 ) sao duas variedades metricas, entao definimos
a metrica produto g = g1 g2 na variedade produto M1 M2 por
h(v1 , v2 ) , (w1 , w2 )i(p1 ,p2 ) = hv1 , w1 ip1 + hv2 , w2 ip2 (10.8)

para todos (v1 , v2 ) , (w1 , w2 ) Tp1 M1 Tp2 M2

= T(p1 ,p2 ) (M1 M2 ). E facil ver que g e simetrica. Para
verificar a sua nao-degenericidade, suponha que
h(v1 , v2 ) , (w1 , w2 )i(p1 ,p2 ) = 0
para todo (w1 , w2 ) Tp1 M1 Tp2 M2 . Entao em particular
h(v1 , v2 ) , (0, w2 )i(p1 ,p2 ) = 0,

h(v1 , v2 ) , (w1 , 0)i(p1 ,p2 ) = 0.
para todos w1 Tp1 M1 e para todo w2 Tp2 M2 . Como
h(v1 , v2 ) , (0, w2 )i(p1 ,p2 ) = hv1 , 0ip1 + hv2 , w2 ip2 = hv2 , w2 ip2 ,
h(v1 , v2 ) , (w1 , 0)i(p1 ,p2 ) = hv1 , w1 ip1 + hv2 , 0ip2 = hv1 , w1 ip1 ,
segue que
hv1 , w1 ip1 = 0
para todo w1 Tp1 M1 e
hv2 , w2 ip2 = 0
para todo w2 Tp2 M2 , e a nao-degenericidade de g1 , g2 implica que
v1 = v2 = 0.
Observe que a matriz associada a metrica G e a matriz diagonal em blocos

G1 0 (g1 )ij 0
G= = .
0 G2 0 (g2 )ij

10.7 Definicao. Sejam M, N variedades metricas. Um difeomorfismo F : M N e uma isometria se
hv, wip = hdFp v, dFp wiF (p) (10.9)
para todo p M e para todos v, w Tp M . Se existir uma isometria entre M e N , dizemos que M e N sao
isometricas.
Dizemos que M e N sao localmente isometricas se para todo p M existe uma vizinhanca Vp de p
em M e uma isometria F : Vp F (Vp ) N e reciprocamente para todo q N existe uma vizinhanca Wq
de q em N e uma isometria G : Wp G (Wp ) M .
Dizemos que uma variedade metrica (M, g) e plana, se ela e localmente isometrica ao espaco euclidiano
ou ao espaco semi-euclidiano.
Observe que o conjunto das isometrias em uma variedade metrica possui uma estrutura natural de grupo
em que o produto de isometrias e definido como a composicao das aplicacoes. Este grupo e denotado por
Isom (M ) .
Observe que o pullback de um difeomorfismo F : M N em que N e uma variedade semi-riemanniana

nao define necessariamente uma metrica semi-riemanniana em M , pois poderamos ate mesmo ter (na pior
hipotese) que Tp M seja um subespaco de vetores nulos para o 2-tensor g = F h. Por exemplo, isso e
exatamente o que acontece na imersao F : R Mn definida por F (t) = (t, t, x3 , . . . , xn ). Alem disso, se
isso fosse verdade, pelo Teorema do Mergulho de Whitney, que afirma que toda variedade diferenciavel de
dimensao n pode ser mergulhada em R2n (um mergulho e uma imersao injetiva), toda variedade diferenciavel
teria uma metrica semi-riemanniana. g = F h sera uma metrica semi-riemanniana em M se e somente se
g|Tp M e nao-degenerado e tem o mesmo ndice para todo p M .
10.8 Exemplo. O grupo de isometrias de En consiste das composicoes de operadores ortogonais e translacoes.
O grupo de isometrias de M e o grupo de Poincare.
E facil ver que isometria e uma relacao de equivalencia na classe das variedades metricas. Geometria
Riemanniana e principalmente o estudo das propriedades que sao invariantes por isometrias. Uma excelente
referencia para o estudo de grupos de isometrias de variedades riemannianas e [Kobayashi].
Dizemos que uma aplicacao diferenciavel F : M N entre variedades diferenciaveis e uma imersao se
dFp e injetiva para todo p M .
10.9 Definicao. Sejam M uma variedade diferenciavel, (N, h) uma variedade riemanniana e F : M N
uma imersao. A metrica induzida por F em M (tambem chamada a metrica do pullback), denotada
por
g = F h,
e definida por
hv, wip := hdFp v, dFp wiF (p) (10.10)
para todo p M e para todos v, w Tp M .
Com esta metrica definida em M , a imersao F torna-se uma imersao isometrica. Na linguagem do
pullback, um difeomorfismo F entre duas variedades metricas (M, g) e (N, h) e uma isometria se
g = F h.
10.10 Exemplo (Superfcies n-dimensionais em RN ). Seja M Rn+k uma variedade diferenciavel de

dimensao n, isto e, uma superfcie n-dimensional. A aplicacao inclusao i : M Rn+k e uma imersao, de
modo que, se assumirmos a metrica euclidiana em Rn+k , ela induz em M uma metrica riemanniana. Neste
caso, a inclusao passa a ser uma imersao isometrica. Da, como a diferencial dip da inclusao e a inclusao
natural de Tp M em Rn+k , segue que
hv, wip = hv, wiRn+k (10.11)
onde h, iRn+k e o produto interno canonico de Rn+k . Uma demonstracao alternativa de que toda variedade
diferenciavel possui uma metrica riemanniana segue entao do Teorema do Mergulho de Whitney: a metrica
induzida pela metrica euclidiana em Rn . Diferentes cartas podem ser usadas para a mesma superfcie n-
dimensional, cada uma dando origem a componentes gij mais ou menos simples.
Um exemplo de superfcie n-dimensional e o grafico de uma funcao real. Se U Rn e um aberto e
f : U R e uma funcao, entao o grafico de f
graf (f ) = {(x, f (x)) : x U }
e uma variedade diferenciavel com a topologia induzida de Rn+1 de dimensao n. Uma carta global para o
grafico de f e : Rn graf(f ) definida por
x1 , . . . , x n = x1 , . . . , x n , f x1 , . . . , x n .

Como
se k 6= n + 1,
(
k kj
= f
xj se k = n + 1,
xj
ou seja,
f
(x) = 0, . . . , 0, 1, 0, . . . 0, j (x)
xj j x
segue que

f f
gij (x) = (x) , (x) = (x) , (x) = ij + . (10.12)
xi xj (x,f (x)) xi xj
Rn+1 xi xj
Outro exemplo de superfcie 2-dimensional e uma superfcie de revolucao gerada por uma curva. Espe-
cificamente seja : I R2 , (t) = ( (t) , (t)) uma curva parametrizada regular tal que (t) 6= 0 para
todo t I; podemos imaginar contida no plano yz definindo
(t) = (0, (t) , (t)) .
Se girarmos esta curva ao redor do eixo z obteremos uma superfcie parametrizada regular S. A imagem de
S e a imagem da aplicacao : I R R3 dada por
(t, ) = ( (t) cos , (t) sen , (t)) ;
a partir de podemos obter cartas locais restringindo o parametro a um intervalo aberto de comprimento
2. Da,

(t, ) = (0 (t) cos , 0 (t) sen , 0 (t)) ,
t

(t, ) = ( (t) sen , (t) cos , 0) ,

donde

2 2
g11 (t, ) = (t, ) , (t, ) = , = [0 (t)] + [ 0 (t)] ,
t t (t,) t t R3

g12 (t, ) = (t, ) , (t, ) = , = 0,
t (t,) t R3

2
g22 (t, ) = (t, ) , (t, ) = , = [ (t)] .
(t,) R 3
Portanto
2 2
[0 (t)] + [ 0 (t)]

0
G (t, ) = 2 .
0 [ (t)]

10.11 Exemplo (Esfera). A metrica euclidiana induz uma metrica na esfera de raio r
n 2 2 o
2
Snr = x Rn+1 : kxk = x1 + . . . + xn+1 = r2
que chamaremos a metrica canonica de Snr . Denotaremos a esfera unitaria por Sn , simplesmente. Vamos ver
os coeficientes gij para diferentes cartas da esfera.
a) Como grafico de funcao:
O hemisferio superior da esfera e o grafico da funcao f : Br Rn R dada por f x1 , . . . , xn =
q
2 2
r2 (x1 ) . . . (xn ) . Como
f xi
(x) = q ,
xi 2
r2 kxk
segue que
xi xj
gij (x) = ij + 2. (10.13)
r2 kxk
Similarmente para o hemisferio inferior. Estas cartas nao cobrem o equador da esfera.
b) Como superfcie de revolucao:
A parametrizacao da esfera de raio r como superfcie de revolucao e
(x, y, z) (, ) = (r sen cos , r sen sen , r cos ).

Segue que
r2

0
G (, ) = .
0 r2 sen2
c) Atraves da projecao estereografica:
Na projecao estereografica a partir do polo norte N = (0, . . . , 0, r), a reta a partir de N que intercepta o
plano xn+1 = 0 em um ponto x e = x1 , . . . , xn , 0 , intercepta a esfera em um ponto (x). Portanto, a carta
projecao estereografica a partir do polo norte : Rn Snr \ {N } e definida por
x N ) = tx1 , . . . , txn , (1 t) r

(x) = N + t (e
onde t > 0 e tal que k (x)k = r. Ou seja, t e tal que
2 2
t2 kxk + (1 t) r2 = r2 ,
donde
2r2
t= 2.
r2 + kxk
Logo, !
2
2r2 x1 2r2 xn kxk r2
x1 , . . . , x n

= 2,..., 2,r 2 2 , (10.14)
r2 + kxk r2 + kxk r + kxk
donde
2r2 kj 4r2 xj xk

se k 6= n + 1,

2 2
r2 + kxk

2

k r2 + kxk

(x) =
xj 4r3 xj
se k = n + 1.

2
r2 + kxk2

Segue que as componentes do tensor metrica nas coordenadas dadas pela carta sao
*n+1 n+1
+

X k X l
gij (x) = (x) , j (x) = (x) ek , (x) el
xi x (x) xi xj
k=1 n+1 l=1 R
n+1 k l n+1 k l n+1 k k
X
X X
= i j
hek , el iRn+1 = i j
kl =
x x x x xi xj
k=1 l=1 k=1

n 2 2 i k 2 2 j k
X 2r ki 4r x x 2r kj 4r x x 16r6 xi xj
= +

2 2 2 2 2 4
r + kxk r2 + kxk

2 2 2
k=1 r2 + kxk r2 + kxk r2 + kxk

n k 2
4 j k i k
4 i j

4
X 4r ki kj 8r ki x x + kj x x 16r x x x 16r6 xi xj
= 2 + 4 +

3 4
2 2 2 2
k=1 r2 + kxk r2 + kxk r2 + kxk r2 + kxk
2
4r4 ij 16r4 xi xj 16r4 xi xj kxk 16r6 xi xj
= 2 3 + 4 + 4
2 2 2 2
r2 + kxk r2 + kxk r2 + kxk r2 + kxk
4r4 ij 16r4 xi xj 16r4 xi xj
= 2 3 + 3
2 2 2
r2 + kxk r2 + kxk r2 + kxk
4r4 ij
= 2 .
2
r2 + kxk
Vamos anotar este resultado para futura referencia:

4r4
gij (x) = 2 ij . (10.15)
2
r2 + kxk
Observe que
4r4

2
r2 + kxk2

4r4

G (x) = ..
=
. 2 I.
2 + kxk2

4r4

r
2
2
r2 + kxk
Usando a projecao estereografica a partir do polo sul obtemos duas cartas que cobrem toda a esfera.
10.12 Exemplo (Espaco Hiperbolico). Considere o semiespaco superior de Rn
H n = x 1 , . . . , x n Rn : x n > 0 .

Com a topologia induzida como aberto de Rn , Hn e uma superfcie diferenciavel de dimensao n. Se definirmos
diretamente em Hn a metrica
ij
gij x1 , . . . , xn =

2, (10.16)
(xn )
entao Hn e uma variedade riemanniana chamada o espaco hiperbolico n-dimensional. Observe que
1

(xn )2

.
1
G=
.. =

I.
(xn )2
1
2
(xn )

10.13 Exemplo (Toros). O toro mergulhado em R3 e uma superfcie de revolucao gerada pelo crculo.
Tomando o crculo com centro em (R, 0) e raio r < R com parametrizacao (t) = (R + r cos t, r sen t)
obtemos a parametrizacao para o toro bidimensional como superfcie de revolucao
(t, ) = ((R + r cos t) cos , (R + r cos t) sen , r sen t)
cuja respectiva metrica e dada por

r2

0
G (t, ) = 2 .
0 (R + r cos t)
Outra metrica induzida de RN importante para o toro, nao localmente isometrica a metrica dada acima
(como veremos depois) e a metrica plana do toro: considerando o toro como a superfcie n-dimensional
Tn = S1 . . . S1 R2n , a metrica euclidiana de R2n induz uma metrica no toro da seguinte forma.
Escrevendo
n 2 2 2 2 2 2 o
Tn = S1 . . . S1 = x R2n : x1 + x2 = x3 + x4 = . . . = x2n1 + x2n = 1 ,
vemos que uma parametrizacao : Rn Tn para este toro e dada por
() = 1 , . . . , n = cos 1 , sen 1 , . . . , cos n , sen n .

Temos, portanto,
k sen j se k = 2j 1,
() = cos j se k = 2j,
j
0 se k 6= 2j 1, 2j.

ou seja,
j j
= 0, . . . , 0, sen , cos , 0, . . . 0
j 2j1 2j
Da

gij () = () , j () = () , j () = ij , (10.17)
i () i R2n
que sao os mesmos componentes da metrica euclidiana. Portanto, o toro plano e localmente isometrico ao
plano Rn . Observe que considerando T2 como uma superfcie de R3 ou como uma superfcie de R4 define
duas metricas completamente diferentes para a mesma superfcie.
10.2 Comprimentos e Volumes

10.2.1 Comprimentos de Curvas Parametrizadas
Em variedades metricas podemos definir e calcular o comprimento de curvas parametrizadas, isto e, curvas
diferenciaveis por partes : I M , onde I R e um intervalo real; curvas parametrizadas podem possuir
autointersecoes e ate mesmo cuspides ou quinas. Um segmento de uma curva parametrizada e uma
restricao de a um intervalo fechado [a, b] I. Se M e uma variedade metrica, a norma ou comprimento
de um vetor v Tp M e a norma induzida pelo produto interno:
r
kvkp = hv, vip . (10.18)

10.14 Definicao. Seja M uma variedade riemanniana e : I M uma curva parametrizada. O com-
primento do segmento de definido no intervalo [a, b] I e definido por
Z b
` () = k 0 (t)k(t) dt. (10.19)
a

10.15 Exemplo. Considere a curva parametrizada (t) = (0, t) no semiespaco positivo R2+ ; temos 0 (t) =
(0, 1) = e2 . Se R2+ e considerado uma subvariedade riemanniana do plano euclidiano, entao
Z b Z b
` () = ke2 k(0,t) dt = dt = b a.
a a
Se R2+ e o plano hiperbolico H2 , entao (para a, b > 0)

Z b Z b
1
` () = ke2 k(0,t) dt = dt = log b log a.
a a t
Em particular, fixando b = 1 temos ` () + quando a 0.

10.2.2 Volumes em Variedades Riemannianas Orientaveis

A metrica riemanniana tambem permite definir uma nocao de volume em variedades orientadas que permite
integrar funcoes, nao apenas formas diferenciais. Seja M uma variedade riemanniana orientada. Dado
p M , seja Bp = {e1 , . . . , en } uma base ortonormal positiva para Tp M . Seja : U (U ) uma
parametrizacao positiva (isto e, na mesma orientacao de M ; para detalhes, veja por exemplo [Carmo], p.
18) de uma vizinhanca (U ) de p em M e escreva os vetores da base coordenada de Tp M associada a carta
em coordenadas em relacao a base ortonormal positiva Bp na seguinte forma:

= Aki ek
xi p
para i = 1, . . . , n. Entao
* +

= Aki ek , Alj el p = Aki Alj hek , el ip = kl Aki Alj = Aki Akj .

gij (p) = i
, j
x p x p

p

Ou seja, definindo as matrizes G = (gij ) e A = Aij , temos
G (p) = AT A
donde
2
det G = (det A) .
Denotando por vol [v1 , . . . , vn ] o volume do paraleleppedo formado pelos vetores v1 , . . . , vn , sabemos que
" #

vol 1
,..., n
= det A vol [e1 , . . . , en ] = det A = det G (p) ,
x p x p
ja que vol [e1 , . . . , en ] = 1. Seja : V (V ) outra carta positiva de uma vizinhanca (V ) de p em M

e escreva os vetores da base coordenada associada a carta em termos dos vetores da base coordenada de
Tp M associada a parametrizacao
j

= Ji (10.20)
xi p y j p
com Jij j i
= y /x . Denote * +

hij (p) = ,
y i p y j p
p
e
H = (hij ) .
Segue que
" # " #

det G (p) = vol ,..., = det J vol ,..., (10.21)
x1 p xn p y 1 p y n p

= det J det H (p) .
Podemos agora definir o volume.
10.16 Definicao. Seja M n uma variedade riemanniana e M um conjunto aberto, conexo e com fecho
compacto, tal que esta contida em uma vizinhanca coordenada (U ) de uma parametrizacao : U
(U ) e a fronteira de 1 () tem medida nula em Rn . O volume de e definido por
Z
vol = det G dx1 . . . dxn . (10.22)
1 ()
Se M e um compacto, tome qualquer cobertura finita {Vi }i=1,...,n de por vizinhancas parametrizadas
de M e considere uma particao da unidade {i }i=1,...,n subordinada a esta cobertura; se i : Ui Vi ,
i = 1, . . . , n, sao parametrizacoes destas vizinhancas, definimos
n Z
X
vol = i det G dx1 . . . dxn . (10.23)
i=1 1
i ()
Se f : M R e uma funcao contnua com suporte compacto , definimos

n Z

Z X
f dVg = f 1
i (x) det G dx1 . . . dxn . (10.24)
M i=1 1
i ()

Segue da formula de mudanca de variaveis para integrais multiplas e de (10.21) que o volume esta bem
definido, isto e, nao depende da carta. Na linguagem de formas, o elemento de volume riemanniano

dVg = det G dx1 . . . dxn = det G dx1 . . . dxn (10.25)
e uma n-forma (para um tratamento usando formas, veja [Lee 2] e especialmente [Lee 1], Cap. 16, p. 422
em diante, que traz o teorema de Stokes e suas varias versoes para variedades riemannianas).
10.3 Grupos de Lie e Algebras de Lie

O grupo de isometrias de uma variedade Riemanniana e um grupo de Lie, como pode ser visto em [Kobayashi].
10.17 Definicao. Um grupo de Lie G e uma variedade diferenciavel que possui uma estrutura algebrica
de grupo tal que a aplicacao
G G G
(g, h) 7 gh1
e diferenciavel.
10.18 Proposicao. Seja G um grupo que e uma variedade diferenciavel. Entao G e um grupo de Lie se e
somente se as aplicacoes
G G
g 7 g 1
G G G
(g, h) 7 gh
sao diferenciaveis.
Prova: Suponha que G e um grupo de Lie. Entao a primeira aplicacao e diferenciavel porque e a composta
das aplicacoes diferenciaveis
G G G G
x 7 (e, g) 7 eg 1 = g 1
(lembre-se que a inclusao na variedade produto sempre e uma aplicacao diferenciavel). A segunda e dife-
renciavel porque e a composta das aplicacoes diferenciaveis
G G GG G
1
g, h1 g h1

(g, h) 7 7 = gh
(lembre-se que uma aplicacao de G G em G G e uma aplicacao diferenciavel se e somente se cada

aplicacao coordenada G G G e, e as projecoes da variedade produto sobre suas componentes sempre
sao aplicacoes diferenciaveis). A recproca e obvia.
10.19 Exemplo. As seguintes variedades diferenciaveis sao grupos de Lie sob as operacoes indicadas.
a) Rn , adicao vetorial.
b) C\ {0}, multiplicacao.
c) S1 , multiplicacao induzida de C.
d) G H, variedade produto de dois grupos de Lie G, H, com estrutura de grupo do produto direto dos
grupos (g1 , h1 ) (g2 , h2 ) = (g1 g2 , h1 h2 ).
e) Tn = S1 . . . S1 , variedade produto e produto direto n vezes do grupo de Lie S1 .
2
f) GL(Rn ) (o grupo linear geral das matrizes reais invertveis n n, subvariedade de Rn ), multiplicacao
matricial.

10.20 Proposicao. Seja G um grupo de Lie. Dado g G, entao as aplicacoes translacao a esquerda por g
Lg : G G
(10.26)
g 7 gh
e translacao a direita por g

Rx : G G
(10.27)
h 7 yg
sao difeomorfismos.
Observando que
1
(Lg ) = Lg1 ,
1
(Rg ) = Rg1 ,
temos pela regra da cadeia

1
= dL1

(dLg )h g L
= dLg1 gh
(10.28)
gh
e similarmente 1
(dRg )h = dRg1 gh . (10.29)
10.21 Definicao. Uma algebra de Lie (sobre R) e um espaco vetorial G munido de uma aplicacao bilinear,
chamada o colchete de Lie,
[, ] : V V R
que satisfaz
(i) (anticomutatividade)
[X, Y ] = [Y, X] ; (10.30)
(ii) (identidade de Jacobi)
[[X, Y ] , Z] + [[Y, Z] , X] + [[Z, X] , Y ] = 0 (10.31)
para todos X, Y, Z G.
10.22 Exemplo. Seja M uma variedade diferenciavel. O espaco vetorial T (M ), equipado com o colchete
de Lie e uma algebra de Lie.
10.23 Exemplo. O espaco vetorial das matrizes reais n n com a operacao colchete definida por
[A, B] = AB BA (10.32)
e uma algebra de Lie. De fato, bilinearidade e anticomutatividade claramente valem e
[[A, B] , C] + [[B, C] , A] + [[C, A] , B]

= (AB BA) C C (AB BA) + (BC CB) A A (BC CB)
+ (CA AC) B B (CA AC)
= ABC BAC CAB + CBA + BCA CBA ABC + ACB
+ CAB ACB BCA + BAC
= 0.
Esta algebra de Lie e denotada por gl (Rn ).
10.24 Exemplo. R3 com o produto vetorial e uma algebra de Lie.

Veremos agora a relacao entre grupos de Lie e algebras de Lie. Primeiro algumas preliminares. Pela
Proposicao 10.20, toda translacao a esquerda Lx em um grupo de Lie e um difeomorfismo.
10.25 Definicao. Seja G um grupo de Lie. Dizemos que um campo vetorial X T (G) e invariante a
esquerda se
dLg X = X Lg (10.33)
para todo g G.
Explicitando a definicao acima, temos que para todo g G vale
(dLg )h Xh = XLg h = Xgh . (10.34)
para todo h G. Em particular, um campo invariante a esquerda fica completamente determinado pelo seu
valor em algum ponto qualquer de G. Por exemplo, se conhecemos o valor de Xe entao, tomando h = e,
segue que
Xg = (dLg )e Xe . (10.35)
O proximo resultado garante a existencia de um numero infinito de campos invariantes a esquerda em um
grupo de Lie.
10.26 Proposicao. Seja G um grupo de Lie. Todo vetor tangente Xe no espaco tangente Te G possui uma
extensao a um campo invariante a esquerda X T (G).
Prova: Basta definir

Xg = (dLg )e Xe .
Como Lg e um difeomorfismo C , claramente X T (G). Para ver que X e um campo invariante a esquerda,

seja h G qualquer. Como

Lh Lg = Lhg
segue que
(dLh )g Xg = (dLh )g (dLg )e Xg = [d (Lh Lg )]e Xg = (dLhg )e Xg = Xhg .

10.27 Proposicao. Seja G um grupo de Lie. Entao o colchete de Lie de campos invariantes a esquerda e
invariante a esquerda.
Em particular, o subespaco dos campos invariantes a esquerda e uma algebra de Lie.
Prova: Sejam X, Y T (G) campos invariantes a esquerda. Temos, para toda f C (G),
(dLg )h [X, Y ]h f = [X, Y ]h (f Lg )

= XYh (f Lg ) Y Xh (f Lg )
= X (dLg )h Yh (f ) Y (dLg )h Xh (f )
= XYgh (f ) Y Xgh (f )
= [X, Y ]gh f.
Como o subconjunto dos campos invariantes a esquerda e um subespaco vetorial de T (G), segue que ele
e uma (sub)algebra de Lie.
Podemos agora definir uma operacao colchete de Lie no espaco tangente (espaco vetorial) Te G que o
transforma em uma algebra de Lie:
10.28 Definicao. Seja G um grupo de Lie. A algebra de Lie G de G e o espaco tangente Te G munido do
colchete de Lie
[Xe , Ye ] := [X, Y ]e . (10.36)
onde X, Y T (G) sao quaisquer extensoes invariantes a esquerda dos vetores tangentes Xe , Ye .
Pode-se mostrar que a algebra de Lie dos campos invariantes a esquerda e isomorfa ao espaco tangente Te G,
em particular como espaco vetorial ela tem dimensao finita, igual a dimensao de G (veja [Lee 1], Teorema
8.37, e [Warner], p.86, Definicao 3.1).
Podemos agora introduzir uma metrica em G com certas propriedades algebricas.
10.29 Definicao. Seja G um grupo de Lie. Dizemos que uma metrica h, ig em G e invariante a esquerda
se

hv, wih = (dLg )h v, (dLg )h w Lg h (10.37)
para todos g, h G e para todos v, w Te G. Analogamente, definimos uma metrica invariante a direita.
Uma metrica que e ao mesmo tempo invariante a esquerda e a direita e chamada uma metrica bi-
invariante.
Em outras palavras, em uma metrica invariante a esquerda, toda translacao a esquerda Lg e uma isometria,
enquanto que em uma metrica invariante a direita, toda translacao a direita Rg e uma isometria. Em uma
metrica bi-invariante todas as translacoes sao isometrias. A existencia de metricas bi-invariantes para grupos
de Lie compactos e estabelecida no Exerccio 7 de [Carmo]. A existencia de metrica invariantes a esquerda
ou a direita em qualquer grupo de Lie e estabelecida atraves da seguinte definicao.
10.30 Proposicao. Seja G um grupo de Lie. Suponha que h, i e algum produto interno em Te G. Entao a
metrica em G definida por D E
hv, wig = dLg1 g v, dLg1 g w (10.38)
e
para todo g G e para todos v, w Te G, e invariante a esquerda.
Analogamente, a metrica em G definida por
D E
hv, wig = dRg1 g v, dRg1 g w
e
para todo g G e para todos v, w Te G, e invariante a direita.

Prova: Temos, por definicao,

(dLg )h v, (dLg )h w Lg h
= dL(Lg h)1 (dLg )h v, dL(Lg h)1
(dLg )h w
Lg h Lg h e
D E
= dLh1 g1 gh (dLg )h v, dLh1 g1 gh (dLg )h w
e
= h(dLh1 )h v, (dLh1 )h wie
= hv, wih
lembrando que Lh1 g1 Lg = Lh1 g1 g = Lh1 . Analogamente prova-se a invariancia a direita da segunda
metrica.
Ha uma relacao entre o produto interno e o colchete de Lie em G = Te G que caracteriza as metricas
bi-invariantes de G que enunciaremos sem prova.
10.31 Teorema. Seja G um grupo de Lie com algebra de Lie G. A metrica invariante a esquerda definida
na proposicao anterior e bi-invariante se e somente se o produto escalar h, i em G = Te G usado para definir
a metrica satisfaz
h[V, X] , W i = hV, [W, X]i
para todos V, W, X G.
10.4 Exerccios
10.32 Exerccio. Mostre que a metrica produto e de fato uma metrica. Porque
g(p1 ,p2 ) ((v1 , w1 ) , (v2 , w2 )) = gp1 (v1 , v2 ) gp2 (w1 , w2 )
nao define uma metrica na variedade produto M1 M2 ?

Captulo 11
Conexoes
E possvel definir geodesicas e estudar suas propriedades sem falar de curvatura. Na verdade e ate possvel
falar em geodesicas sem falar de metrica. Geodesicas sao generalizacoes das retas da geometria euclideana.
Embora seja possvel definir geodesicas como curvas que minimizam distancias em variedades riemannianas
e curvas que maximizam o tempo proprio em variedades de Lorentz, pelo menos localmente (e neste caso
a nocao de geodesica estaria tambem fundamentalmente ligada a nocao de metrica) esta propriedade e
tecnicamente difcil de trabalhar como definicao. Ao inves, escolheremos uma propriedade diferente das
retas para generalizar: retas sao caracterizadas como curvas com aceleracao nula. Esta propriedade nao faz
nenhuma referencia a metrica e pode ser utilizada mesmo em variedades diferenciaveis que nao tenham uma
estrutura metrica. E em relatividade geral ela faz mais sentido, ja que partculas livres seguem trajetorias
geodesicas no espacotempo curvo, ja que nao estao sujeitas a forcas externas e portanto nao sofrem aceleracao,
assim como partculas livres na mecanica newtoniana seguem trajetorias retas com velocidade uniforme. Para
usar esta propriedade, precisaremos primeiro definir o conceito de derivadas de campos tangentes a curvas
segundo uma direcao. Como em geral nao existe um espaco ambiente Rn onde a variedade esta mergulhada,
nao e imediatamente obvio como defini-lo. Se : I M e uma curva diferenciavel em uma variedade M
nao podemos simplesmente definir
0 (t) 0 (t0 )
00 (t0 ) = lim
tt0 t t0
porque 0 (t) T(t) M e 0 (t0 ) T(t0 ) M vivem em diferentes espacos vetoriais, logo sua diferenca nao
faz sentido. Ja vimos que a derivada de Lie nao e uma boa solucao para este problema, ja que ela nao e
uma derivada direcional. A definicao do conceito de conexao atende esta necessidade de definir uma nocao
de derivacao intrnseca para campos vetoriais e se comporta exatamente como uma derivada direcional. O
nome conexao se refere exatamente a ideia de conectar localmente os espacos tangentes de uma variedade.
11.1 Conexoes e Derivada Covariante

Consideremos o conjunto T (M ) dos campos vetoriais diferenciaveis em uma variedade diferenciavel M como
um modulo sobre o anel C (M ) das funcoes suaves definidas em M .
11.1 Definicao. Seja M uma variedade diferenciavel de dimensao n. Uma conexao em M e uma
aplicacao
: T (M ) T (M ) T (M ) ,
denotada por (X, Y ) 7 X Y que satisfaz as seguintes propriedades:
(i) f X+gY Z = f X Z + gY Z,
(ii) X (Y + Z) = X Y + X Z,
(iii) X (f Y ) = f X Y + (Xf ) Y.
118
para todos os campos X, Y, Z T (M ) e para todas as funcoes f, g C (M ).

Dizemos que X Y e a derivada covariante do campo Y na direcao de X.
Uma explicacao para o nome derivada covariante sera dada no Captulo 14. O smbolo X Y deve ser
interpretado como a derivada direcional do campo Y na direcao X. O resultado a seguir reforca esta
interpretacao:
11.2 Proposicao (Conexao em Coordenadas). Seja uma conexao em uma variedade diferenciavel
M . Se X, Y T (M ) sao campos vetoriais que se expressam em coordenadas locais por
X = X i i e Y = Y j j ,
entao
X Y = X Y j j + X i Y j i j .

(11.1)
Em particular, (X Y )p depende apenas do valor de X em p e do valor de Y ao longo de uma curva tangente
a Xp .
Prova: Usando as propriedades de uma conexao, obtemos
X Y = X Y j j

= Y j X j + X Y j j

= Y j X i i j + X Y j j

= X i Y j i j + X Y j j .

Em particular,
(X Y )p = X i (p) Y j (p) (i j )p + Xp Y j (p) j |p .

Os coeficientes X 1 (p) , . . . , X n (p) dependem apenas do valor de X em p; os coeficientes Xp Y 1 , . . . , Xp (Y n ),
por definicao de vetor tangente, dependem apenas dos valores de Y ao longo de uma curva passando por p
cujo vetor tangente em p e Xp .
Da expressao (11.1), escrevendo os campos vetoriais i j em termos dos campos base k na forma
i j = kij k , (11.2)
obtemos a seguinte expressao local para o campo X Y :
X Y = X Y k + X i Y j kij k .

(11.3)
11.3 Definicao. As funcoes suaves kij definidas pela expressao (11.3) sao chamadas os smbolos de
Christoffel associados a carta particular utilizada.
Observe que em princpio precisamos obter n3 smbolos de Christoffel para determinar uma conexao. No
caso de conexoes riemannianas, como veremos, a sua simetria diminuira o numero de smbolos diferentes.
11.4 Proposicao. Toda variedade diferenciavel possui uma conexao.
Prova: Se V e uma vizinhanca coordenada de M , dadas n3 funcoes arbitrarias kij C (V ), a formula
(11.3) define uma conexao em V , vista como subvariedade de M . Se {V } e uma cobertura de M por
vizinhancas coordenadas, cada uma com uma conexao definida, entao podemos definir uma conexao
global em M , usando uma particao da unidade { } subordinada a esta cobertura, por
X
X Y =
X Y.

As propriedades de uma conexao sao facilmente verificadas; apenas a regra do produto merece atencao
especial, ja que combinacoes lineares de conexoes nao sao conexoes em geral, exatamente por deixarem de
satisfazer a regra do produto. Mas combinacoes lineares convexas de conexoes sao conexoes e no nosso caso
temos
X X
X (f Y ) =
X (f Y ) = [(Xf ) Y + f
XY ]

X X
= (Xf ) Y + f
XY

= (Xf ) Y + f X Y.

11.5 Exemplo (Conexao Euclidiana). Identificando espacos tangentes em Rn com o proprio Rn , vetores
tangentes com vetores em Rn e campos vetoriais em Rn com aplicacoes suaves Rn Rn , nos definimos a
conexao euclidiana : T (Rn ) T (Rn ) T (Rn ) por
(X Y )p = dYp (Xp ) , (11.4)
ou seja, a derivada direcional do campo Y em p na direcao de Xp . Em coordenadas, usando a definicao de

diferencial em Rn ,
Y j
dYp (Xp ) = X i i ej ,
x
ou seja,
Y j
X Y = X i i . (11.5)
x xj
Outra maneira de obter a mesma expressao em coordenadas, usando a regra da cadeia,
(f Y ) f Y j Y j
dYp (Xp ) (f ) = Xp (f Y ) = X i i
= Xi j i
= Xi i (f ) .
x x x x xj
Em notacao mais sucinta, a expressao em coordenadas da conexao euclidiana que obtemos a partir de (11.5)
e

X Y = X Y j . (11.6)
xj
Segue de (11.3) e da observacao no incio da demonstracao da Proposicao 11.4 que a conexao euclidiana e
de fato uma conexao com smbolos de Christoffel kij = 0.
Esta e uma conexao tanto para o espaco euclidiano, para o espaco semieuclidiano e para o espaco de
Minkowski, ja que apenas a estrutura diferencial esta envolvida.
11.2 Derivada Covariante ao longo de Curvas

A existencia de uma conexao em uma variedade diferenciavel M permite derivar campos vetoriais ao longo
de curvas na variedade. Em particular, e possvel falar em aceleracao de uma curva e portanto de geodesicas
e, eventualmente, curvatura. Na proxima secao veremos que uma metrica define uma conexao unica em uma
variedade metrica. Conexoes diferentes da conexao induzida pela metrica permitem a definicao de estruturas
geometricas em variedades diferenciaveis mais gerais que a dada pela metrica; em particular, e possvel falar
de geodesicas sem uma nocao de metrica.
Veremos agora como a conexao permite definir uma nocao intrnseca de derivada de um campo vetorial
ao longo de uma curva na variedade.
11.6 Definicao. Seja : I M uma curva diferenciavel em uma variedade diferenciavel M . Um campo
vetorial ao longo da curva e um campo vetorial diferenciavel V : I T M tal que V (t) T(t) M
para todo t I.
O espaco vetorial dos campos vetoriais ao longo de uma curva e denotado T ().
11.7 Proposicao. Seja M uma variedade diferenciavel com uma conexao . Existe uma unica corres-
pondencia que associa a cada campo vetorial diferenciavel V ao longo de uma curva diferenciavel : I M
um outro campo diferenciavel
DV
dt
ao longo de tal que
D DV DW
(V + W ) = + ,
dt dt dt
D df DV
(f V ) = V + f
dt dt dt
para todos os campos diferenciaveis V, W ao longo de e para toda funcao diferenciavel f : I R, e tal
que, se V e induzido por um campo de vetores X T (M ), ou seja, V = X , entao
DV
= 0 (t) X.
dt
Localmente,
dV k di k j

DV
= + V k , (11.7)
dt dt dt ij
Prova: Observe que para a expressao 0 (t) X fazer sentido, devemos entender o subescrito 0 (t) neste
smbolo como qualquer extensao local do campo 0 (t) a um campo em M , ja que pela Proposicao 11.2 so
importa o valor da extensao em (t), isto e, o vetor tangente 0 (t), e o valor de X em uma curva tangente
a 0 (t) em (t), que pode ser tomada como sendo a propria curva .
DV DV
Vamos provar primeiro a unicidade de . Suponha que exista um tal campo satisfazendo todas
dt dt
as propriedades do enunciado. Seja
V (t) = V j (t) j |t
a expressao local do campo V . Pelas primeiras duas propriedades do enunciado, temos
dV j

DV j Dj
= (t) j |t + V (t) .
dt t dt dt t
Pela terceira propriedade,
di

Dj
= 0 (t) j
t
= d i j = (t) i j |t .
dt t dt (t)i t dt
DV
Portanto, localmente o campo se escreve na forma
dt
k
di

DV dV k j
= (t) + (t) ij (t) V (t) k |t ,
dt t dt dt
DV
o que mostra que o campo e unicamente determinado.
dt
DV
Para determinar a existencia de , dada uma carta (, U ) para uma vizinhanca de (t), defina o
dt
DV
campo em (U ) pela expressao (11.7); e imediato verificar que um campo definido desta forma satisfaz
dt
todas as propriedades do enunciado.
DV
11.8 Definicao. O campo diferenciavel e chamado a derivada covariante de V ao longo da curva
dt
.
11.3 Transporte Paralelo

11.9 Definicao. Seja M uma variedade diferenciavel com uma conexao . Um campo vetorial diferenciavel
V ao longo de uma curva diferenciavel : I M e chamado um campo paralelo ao longo de se
DV
0.
dt
Um campo vetorial X T (M ) e chamado um campo paralelo se ele e paralelo ao longo de qualquer curva.

E facil ver que um campo vetorial X T (M ) e paralelo se e somente se
Y X = 0
para todo campo Y T (M ).

11.10 Proposicao. Seja M uma variedade diferenciavel com uma conexao . Seja : I M uma curva
diferenciavel e V0 um vetor tangente em (t0 ), t0 I. Entao existe um unico campo paralelo V definido ao
longo de tal que Vt0 = V0 .
DV
Prova: Usando a expressao (11.7) obtida na Proposicao 11.7, o campo derivada covariante em coorde-
dt
nadas locais se escreve na forma
k
di

DV dV k j
= (t) + (t) ij (t) V (t) k |t , (11.8)
dt t dt dt
DV
Logo, a existencia local do campo V (t) satisfazendo = 0 para todo t e V (t0 ) = V0 corresponde a uma
dt
solucao do sistema linear de n equacoes diferenciais

dV 1 di
(t) 1ij (t) V j (t) = 0

(t) +

dt dt

..
.
n i
dV d

n j
dt (t) + dt (t) ij (t) V (t) = 0

com condicao inicial

V 1 (t0 ) = V01 , . . . , V n (t0 ) = V0n .
Se (I) esta inteiramente contida em uma vizinhanca coordenada, entao o teorema de existencia e unicidade
para equacoes diferenciais lineares garante a existencia de um unico campo V definido em todo o intervalo
I. Caso contrario, como (I) e um conjunto compacto, ela pode ser coberta por um numero finito de
vizinhancas coordenadas, em cada uma das quais V pode ser definido de maneira unica usando o raciocnio
acima e esta unicidade garante que o campo e o mesmo nas intersecoes das vizinhancas.
11.11 Definicao. O campo V obtido na Proposicao 11.10 e chamado o transporte paralelo de V0 ao

longo de .
A aplicacao transporte paralelo e a aplicacao linear
t : T(t0 ) M T(t) M
definida em cada vetor V0 T(t0 ) M por

t (V0 ) = Vt ,
isto e, t (V0 ) e o transporte paralelo do vetor V0 ao longo da curva .
Quando necessario, para s, t I denotaremos a aplicacao transporte paralelo de vetores em T(s) M para
vetores em T(t) M por
st : T(s) M T(t) M.
A aplicacao transporte paralelo e linear porque o transporte paralelo e dado pela solucao de um sistema de
equacoes diferenciais lineares. Por unicidade, ela e um isomorfismo com
1
st = ts ,
e da unicidade de solucao para um sistema de EDOs segue tambem que
00 = id,
rt sr = st .
Em geral, o transporte paralelo de um vetor V em Tp M para um vetor em Tq M dependera da curva

ligando p e q usada; isto e, se 1 , 2 : I M sao duas curvas diferenciaveis tais que
1 (s) = 2 (s) = p,
1 (t) = 2 (t) = q,
entao em geral
1 2
st (V ) 6= st (V )
para todo V Tp M . Como veremos depois, o transporte paralelo sera o mesmo, independente do caminho
utilizado para ir de p ate q, se e somente se a curvatura riemanniana for nula.
11.4 Conexao Compatvel com a Metrica

Como metricas e conexoes definem cada uma uma estrutura geometrica particular, o caso mais relevante de
variedade metrica dotada de uma conexao e quando as estruturas geometricas definidas por elas coincidem.
Para isso a conexao deve satisfaz duas condicoes.A primeira delas e a chamada compatibilidade da conexao
com a metrica, que pode ser definida de qualquer um dos tres modos equivalentes a seguir.
11.12 Proposicao. Seja M uma variedade metrica com uma conexao . Entao as seguintes afirmacoes
sao equivalentes:
(i) Para todos os campos paralelos V e W ao longo de qualquer curva diferenciavel em M vale
hV, W i constante. (11.9)
(ii) Para todos os campos vetoriais V e W ao longo de qualquer curva diferenciavel em M vale

d DV DW
hV, W i = , W + V, . (11.10)
dt dt dt
(iii) Para todos os campos X, Y, Z T (M ) vale
X hY, Zi = hX Y, Zi + hY, X Zi . (11.11)

Prova: (ii) (i) Se V e W sao campos paralelos, entao

d
hV, W i = h0, W i + hV, 0i = 0
dt
e portanto hV, W i e constante.
(i) (ii) Seja : I M uma curva diferenciavel qualquer e para um ponto fixado t0 I escolha uma
base ortonormal
B0 = E1 |t0 , . . . , En |t0

para T(t0 ) M . Usando a Proposicao 11.10, estenda cada um dos vetores E1 |t0 , . . . , En |t0 paralelamente a
campos E1 , . . . , En ao longo de . Segue da definicao de compatibilidade que
Bt = { E1 |t , . . . , En |t }
e uma base ortonormal para T(t) M para cada t I. Dados campos diferenciaveis V e W ao longo de ,
podemos entao escrever
V = V i (t) Ei |t e W = W j (t) Ej |t
com as funcoes V i , W j diferenciaveis, pois
V i (t) = hV, Ei i e W j (t) = hW, Ej i .
Como os campos E1 (t) , . . . , En (t) sao paralelos ao longo de , temos
DE1 DEn
= ... = = 0,
dt dt
logo
dV i dV i

DV i DEi
= (t) Ei | t + V (t) = (t) Ei |t ,
dt t dt dt t dt
e, similarmente,
dW j

DW
= (t) Ej |t .
dt t
dt
Da,
dV i dW j

DV DW j i
,W + V, = Ei , W Ej + V Ei , Ej
dt dt dt dt
dV i j dW j
= W hEi , Ej i + V i hEi , Ej i
dt i dt
dW j

dV
= Wj + V i ij
dt dt
n n
dV i i i

i dW d X i i
X
= W +V = V W
i=1
dt dt dt i=1
d
= hV, W i .
dt
(ii) (iii) Seja p M e : I M uma curva diferenciavel com (t0 ) = p e 0 (t0 ) = Xp . Entao, por
definicao de vetor tangente,
* + * +
d
DY DZ
Xp hY, Zi = Y(t) , Z(t) = , Zt + Yt ,
0 0

dt t=t0 dt t0
dt t0

= 0 (t0 ) Y , Zt0 + Yt0 , 0 (t0 ) Z
(t0 ) (t0 )
D E D E
= (X Y )p , Zp + Yp , (X Z)p .
(iii) (ii) Se V, W sao campos ao longo de uma curva diferenciavel em M com (t0 ) = p e 0 (t0 ) = Xp ,
entao

d
hVt , Wt i = Xp hVt , Wt i
dt t=t0
D E D E
= (X V )p , Wt + Vt , (X W )p

= 0 (t0 ) V , Wt0 + Vt0 , 0 (t0 ) W
(t0 ) (t0 )
* + * +
DV DW
= , Wt0 + Vt0 , .
dt
t0 dt
t0

A condicao hV, W i constante justifica o nome campos paralelos.
11.13 Definicao. Seja M uma variedade metrica com uma conexao . Dizemos que a conexao e com-
patvel com a metrica, quando ela satisfaz qualquer uma das condicoes da proposicao anterior.
11.5 O Tensor Torsao

11.5.1 Conexao Simetrica
A segunda condicao para que a estrutura geometrica definida pela conexao seja a mesma definida pela metrica
e que a conexao seja simetrica:
11.14 Definicao. Seja M uma variedade diferenciavel com uma conexao . O tensor torcao da conexao
e a aplicacao
T : T (M ) T (M ) T (M )
definida por
T (X, Y ) = X Y Y X [X, Y ] .
Dizemos que a conexao e simetrica se T 0, isto e, se para todos os campos X, Y T (M ) vale
X Y Y X = [X, Y ] . (11.12)

Apesar da conexao nao ser um tensor, sua torcao e de fato um (2, 1)-tensor, pois ela so depende do valor no
ponto. Em coordenadas, como
X Y = X Y k + X i Y j kij k ,

Y X = Y X k + Y i X j kij k ,

[X, Y ] = X Y k Y X k k ,

o tensor torcao e dado por

T (X, Y ) = X i Y j Y i X j kij k ,

(11.13)
de onde vemos que T (X, Y ) e linear em relacao a X e a Y , separadamente, e depende apenas de Xp e Yp .
11.15 Proposicao. Seja M uma variedade com uma conexao simetrica . Entao
i j = j i (11.14)
e
kij = kji . (11.15)
Prova: Como
[i , j ] = i j j i = kij kji k

e [i , j ] = 0, seguem os resultados.
Em particular, para conexoes simetricas o numero de smbolos de Christoffel potencialmente diferentes cai
para
n2 (n + 1)
.
2
Seja M uma variedade diferenciavel com duas conexoes e . Defina o tensor diferenca
D (X, Y ) = Y X Y X.
Definindo os tensores S (simetrico) e A (alternado)

1
S (X, Y ) = [D (X, Y ) + D (Y, X)] ,
2
1
A (X, Y ) = [D (X, Y ) D (Y, X)] ,
2
segue que D = S + A.
a) Mostre que as conexoes e tem a mesma torsao se e somente se A = 0.
b) Mostre que as conexoes e tem as mesmas geodesicas (com as mesmas parametrizacoes) se e somente
se D (X, X) = 0 para todo X X (M ).
c) Mostre que as conexoes e tem as mesmas geodesicas (com as mesmas parametrizacoes) se e somente
se S = 0.
d) Conclua que se as conexoes e tem as mesmas geodesicas (com as mesmas parametrizacoes) e a
mesma torcao, entao = .
e) Mostre que para toda conexao , existe uma unica conexao com as mesmas geodesicas e torcao nula.
11.6 Conexoes Metricas

11.16 Lema. Seja M uma variedade metrica com uma conexao simetrica , compatvel com a metrica de
M . Entao, para todos campos X, Y, Z T (M ), vale
1
hX Y, Zi = (X hY, Zi + Y hX, Zi Z hX, Y i hX, [Y, Z]i hY, [X, Z]i + hZ, [X, Y ]i) . (11.16)
2
Em particular, uma conexao simetrica compatvel com a metrica e unicamente determinada pela metrica.
Prova: Pela Proposicao 11.12,
X hY, Zi = hX Y, Zi + hY, X Zi ,
Y hX, Zi = hY X, Zi + hX, Y Zi ,
Z hX, Y i = hZ X, Y i + hX, Z Y i .
Logo, por simetria,
X hY, Zi + Y hX, Zi Z hX, Y i = hX Y, Zi + hY, X Zi + hY X, Zi + hX, Y Zi

hZ X, Y i hX, Z Y i
= hX, Y Z Z Y i + hY, X Z Z Xi + hX Y, Zi + hY X, Zi
= hX, [Y, Z]i + hY, [X, Z]i hX Y Y X, Zi + 2 hX Y, Zi
= hX, [Y, Z]i + hY, [X, Z]i h[X, Y ] , Zi + 2 hX Y, Zi ,
donde segue o resultado.

11.17 Teorema. Seja M uma variedade metrica. Entao existe uma unica conexao simetrica compatvel
com a metrica de M .
Prova: O lema anterior mostra como definir uma conexao simetrica compatvel com a metrica atraves da
expressao (11.16). Alem disso, pelo lema, qualquer conexao simetrica compatvel com a metrica satisfara a
identidade (11.5), o que estabelece a unicidade.
11.18 Definicao. Seja M uma variedade metrica. A unica conexao simetrica compatvel com a metrica
de M e chamada a conexao metrica (ou conexao de Levi-Civita) de M .
Se M e uma variedade riemanniana, esta conexao e chamada conexao riemanniana, se M e uma
variedade semi-riemanniana, ela e chamada conexao semi-riemanniana e se M e uma variedade de
Lorentz, ela e chamada conexao de Lorentz.
Isometrias preservam conexoes riemannianas, como esperado:
11.19 Proposicao. Sejam (M, g) e (M f, ge) variedades metricas isometricas com conexoes metricas e ,
e
respectivamente. Se F : M M f e uma isometria, entao
F (X Y ) =
e F X (F Y )

Em particular, se : I M e uma curva diferenciavel e V e um campo vetorial ao longo de , entao

DV De (F V )
F = .
dt dt
Prova: Defina uma aplicacao
: T (M ) T (M ) T (M )
por h i
X Y = F1 e F X (F Y ) .

Mostraremos que e uma conexao metrica em M . A unicidade da conexao metrica garantira entao que
= ,
o que provara o resultado. De fato, temos
h i
f X+gY Z = F1 e F (f X+gY ) (F Z)

h i
= F1 e F (f X+gY ) (F Z)

h i
= F1 e (f F 1 )F X+(gF 1 )F Y (F Z)

h i
= F1 f F 1 e F X (F Z) + g F 1

e F Y (F Z)

h i h i
= F1 f F 1 e F X (F Z) + F1 g F 1

e F Y (F Z)

h i h i
= f F1 e F X (F Z) + gF1

e F Y (F Z)

= f X Z + gY Z,
h i
X (Y + Z) = F1 e F X F (Y + Z)

h i
= F1 e F X F Y +

e F X F Z

h i h i
= F 1 e F X F Y + F 1

e F X F Z

= X Y + X Z
e
h i
X (f Y ) = F1 e F X F (f Y )

h i
= F1 e F X (f F Y )

h i
= F1 f F 1 e F X F Y + (F X) f F 1 F Y

h i
= F1 f F 1 e F X F Y + F 1 (F X) f F 1 F Y

h i
= F1 f F 1 e F X F Y + (F X) f F 1 F 1 (F Y )

h i
= f F1 e F X F Y + X f F 1 F F 1 (F Y )

= f X Y + (Xf ) Y,
o que prova que e uma conexao.

Agora verificaremos que e simetrica:
h i h i
X Y Y X = F1 e F X (F Y ) F1

e F Y (F X)

h i
= F1 e F X (F Y )

e F Y (F X)

= F1 [F X, F Y ]
= F1 F [X, Y ]
= [X, Y ] .
Observe que para provar que e uma conexao simetrica, foi suficiente usar o fato que F e um difeomorfismo.
Para estabelecer a compatibilidade de com a metrica de M e necessario usar o fato que F e uma
isometria. Com efeito, dados X, Y, Z T (M ), sejam V = F Y e W = F Z. Entao temos
hX Y, Zi + hY, X Zi
D h i E D h iE
= F1 e F X (F Y ) , F1 W + F1 V, F1

e F X (F Z)

D E D E
= e F X (F Y ) , W + V,

e F X (F Z)

D E D E
= e F X (F Y ) , F Z + F Y,

e F X (F Z)

= F X hF Y, F Zi
= X hY, Zi .
A ultima passagem merece ser mais detalhada: definindo f : N R por

D E
f (q) = (F Y )q , (F Z)q ,
q
por isometria segue que se p = F 1 (q) entao

f (q) = hYp , Zp ip = YF 1 (q) , ZF 1 (q) F 1 (q) ,
isto e,
f = hY, Zi F 1 ;
assim, usando a propriedade
(F X) f = X (f F ) F 1 ,
temos
F X hF Y, F Zi = X (f F ) F 1 = X hY, Zi F 1 ,
ou seja,
[hX Y, Zi + hY, X Zi] (p) = [X hY, Zi] (p) .

11.20 Exemplo (Conexao Metrica em Rn ). A conexao euclidiana definida no Exemplo 11.4 e a conexao
riemanniana de En , e a conexao semi-riemanniana de Mnk e e a conexao de Lorentz do espaco de Minkowski
Mn . De fato, a conexao e compatvel com a metrica, pois se : I Rn e uma curva diferenciavel e V, W
sao campos ao longo de induzidos pelos campos vetoriais X, Y , respectivamente, entao segue da regra da
cadeia que

d
d d
V(t) , W(t) = V(t) , W(t) + V(t) , W(t)
dt dt dt
= dX(t) ( (t)) , W(t) + V(t) , dY(t) (0 (t))
0

D E D E
= 0 (t) X (t) , W(t) + V(t) , 0 (t) Y (t)
* + * +
DV DW
= , W(t) + V(t) , .
dt (t) dt (t)
e ela e simetrica porque, conforme (11.5),

h i Y j f X j f
(X Y )p (Y X)p (f ) = X i i Yi
x xj xi xj
Y j X j f

= Xi i Y i
x xi xj
= [X, Y ]p (f ) .
ou tambem, de forma mais sucinta, conforme (11.6),

X Y Y X = X Y j Y Xj
xj xj

= X Y j Y Xj

xj
= [X, Y ] .
11.6.1 Smbolos de Christoffel da Conexao Metrica

Vamos agora ver como os smbolos de Christoffel de uma conexao metrica podem ser calculados atraves
dos componentes gij da metrica. Antes introduzimos a seguinte notacao: a matriz G = (gij ) e uma matriz
positiva definida, logo admite uma inversa, que denotaremos por
G1 = g ij .

(11.17)
A justificativa para isso sera vista no Exemplo 13.11.

11.21 Lema. Seja M uma variedade metrica com uma conexao . Entao
hi j , k i = m
ij gmk . (11.18)
Prova: Segue imediatamente da definicao dos smbolos de Christoffel:
i j = m
ij m .
11.22 Lema. Seja M uma variedade metrica com uma conexao metrica . Entao
1
hi j , k i = (i gjk + j gik k gij ) . (11.19)
2
Prova: Por (11.16) temos que
1
hi j , k i =(i hj , k i + j hi , k i k hi , j i hi , [j , k ]i hj , [i , k ]i + hk , [i , j ]i)
2
1
= (j gik + i gjk k gij ) ,
2
ja que [m , l ] = 0.
11.23 Proposicao. Seja M uma variedade metrica com uma conexao metrica . Entao
1
kij = (i gjm + j gim m gij ) g mk . (11.20)
2
Prova: Pelos lemas temos
1
glm lij = (i gjm + j gim m gij ) .
2
Logo
n
1 X
g mk glm lij = (i gjm + j gim m gij ) g mk .
2 m=1
O lado esquerdo desta equacao e
g km gml lij = lk lij = kij .

11.24 Corolario. Se e a conexao metrica de En , Mnk e Mn , entao
kij = 0. (11.21)
Consequentemente,
n
X
X Y k k

X Y = (11.22)
k=1
e
i j = 0. (11.23)
Prova: Pois, como
k
gij = ij constante,
segue que
k gij = 0
para todos os ndices i, j, k.
11.25 Corolario. Seja M uma variedade metrica com uma conexao metrica . Entao
k gij = gip pjk + gpj pik (11.24)
e
k g ij = g ip jpk g pj ipk . (11.25)
Prova: Para provar a primeira identidade, usando a compatibilidade da metrica temos

k gij = hi , j i = hk i , j i + hi , k j i
xk
D E
= hpki p , j i + i , pkj p
= pki hp , j i + pkj hi , p i
= pki gpj + pkj gip .
Para provar a segunda identidade, primeiro diferenciamos a identidade
glp g pj = lj ,
obtendo
glp k g pj = (k glp ) g pj .
Como
g il glp k g pj = g il glp k g pj
= pi k g pj
= k g ij ,
segue da primeira identidade que
k g ij = g il (k glp ) g pj = g il g pj k glp
= g il g pj glm m m

pk + gmp lk
= g pj g il glm m il pj m
pk g g gmp lk
il j p
= g pj m
i
m
pk g m lk
= g pj ipk g il jlk .
11.6.2 Interpretacao Geometrica da Derivada Covariante

Usando a conexao metrica, podemos dar uma interpretacao geometrica da derivada covariante em termos
do transporte paralelo.
11.26 Lema. Se M e uma variedade metrica com uma conexao metrica , entao a aplicacao transporte
paralelo e uma isometria que preserva orientacao.
Prova: Seja : I M uma curva diferenciavel passando por um ponto p M . Dados V, W Tp M ,

considere a funcao real f : I R definida por
f (t) = ht (V ) , t (W )i .
Pela compatibilidade da metrica, segue que

0 D D
f (t) = t (V ) , t (W ) + t (V ) , t (W ) = 0,
dt dt
ja que os campos t (V ) , t (W ) sao paralelos ao longo de por definicao. Portanto, f (t) = f (0) para todo
t I, ou seja
ht (V ) , t (W )i = hV, W i
o que prova que t e uma isometria.
Para provar que t preserva orientacao, seja
B = {E1 , . . . , En }
uma base ortonormal positivamente orientada para Tp M . Como t e uma isometria,
Bt = {t (E1 ) , . . . , t (En )}
e uma base ortonormal de T(t) M para todo t I. A orientacao positiva de Bt segue por continuidade da
funcao determinante.
11.27 Proposicao (Interpretacao Geometrica da Derivada Covariante). Seja M uma variedade
metrica com uma conexao metrica . Dado um campo X T (M ), seja : I M uma curva integral do
campo X passando por p, ou seja,
(0) = p,
0 (t) = X ( (t)) para todo t I.
Se Y T (M ), entao
t1 Y(t) Yp

d 1
(X Y )p = lim = Y(t) .
t0 t dt t t=0
Prova: Seja B = {E1 , . . . , En } uma base ortonormal para Tp M . Pelo lema, Bt = {t (E1 ) , . . . , t (En )} e
uma base ortonormal de T(t) M para todo t I. Como a aplicacao transporte paralelo e linear, se
Y(t) = Y i (t) t (Ei ) ,
segue que
t1 Y(t) = Y i (t) Ei .

Logo,
dY i

d 1
t Y(t) = (0) Ei .
dt t=0 dt
Por outro lado, pela Proposicao 11.7, temos tambem

D i

(X Y )p = Y (t) t (Ei )
dt t=0
dY i

D
(0) 0 (Ei ) + Y i (t)

= (t (Ei ))
dt dt t=0
dY i
= (0) Ei ,
dt
ja que os campos t (E1 ) , . . . , t (En ) sao paralelos ao longo de por definicao.
Este resultado tambem vale para conexoes gerais em variedades diferenciaveis, mas o resultado requer um
pouco mais de conhecimento de fibrados (veja [Dodson-Poston], Theorem 4.05, pp. 226227).
Captulo 12
Geodesicas
De agora em diante, sempre que nos referirmos a uma variedade metrica, estaremos supondo que ela esta
munida da sua conexao metrica.
12.1 Definicao A Equacao Geodesica

12.1 Definicao. Seja M uma variedade metrica. Dizemos que uma curva diferenciavel : I M e uma
geodesica se
D 0
(t) = 0
dt
para todo t I.
Em outras palavras, uma geodesica e uma curva cujo campo velocidade e paralelo ao longo da curva (uma
curva que transporta paralelamente o seu proprio vetor tangente). Ou seja, uma geodesica e uma curva que
nao muda de direcao. As vezes, por abuso de linguagem, a imagem (I) de uma geodesica tambem e
chamada geodesica.
Note que o conceito de geodesica pode ser definido para qualquer variedade diferenciavel dotada de uma
conexao. O resultado seguinte, no entanto, depende da compatibilidade da metrica com a conexao, ou seja,
requer uma conexao metrica.
12.2 Proposicao. Se : I M e uma geodesica, entao
k 0 (t)k constante. (12.1)
Consequentemente, uma reparametrizacao h de uma geodesica e uma geodesica se e somente se
h (t) = at + b
para algumas constantes a, b R.

Prova: Pois, como a conexao e compatvel com a metrica e o campo velocidade 0 e paralelo ao longo de
2
k 0 (t)k = h 0 (t) , 0 (t)i constante.
Como
0
( h) (t) = h0 (t) 0 (h (t)) ,
k 0 (t)k constante,
133
e, como acabamos de provar, uma condicao necessaria para que h seja uma geodesica e
( h)0 (t) constante,

conclumos que uma condicao necessaria para que a reparametrizacao h seja uma geodesica e que
h0 (t) constante,
ou seja,
h (t) = at + b
para algumas constantes a, b R. Alem disso, escrevendo (t) = h (t) = (at + b), segue que
D 0 D 0
(t) = a2 (at + b) = 0,
dt dt
logo h e uma geodesica.
12.3 Definicao. Uma geodesica : I M e normalizada (ou unitaria) se
k 0 (t)k 1.

Toda geodesica que nao e um ponto (ou seja, k 0 (t)k 6= 0) pode ser normalizada atraves de uma parame-
trizacao por comprimento de arco: se : I M e uma parametrizacao qualquer para uma geodesica,
ela pode ser reparametrizada para se tornar uma geodesica normalizada escolhendo-se um ponto t0 I e
definindo o parametro comprimento de arco
Z t
s (t) = k 0 (t)k dt. (12.2)
t0
De fato, pela regra da cadeia

1 1
k 0 (s)k = k 0 (t)k |t0 (s)| = k 0 (t)k = k 0 (t)k 0 = 1.
|s0 (t)| k (t)k
12.4 Teorema (Teorema de Existencia e Unicidade de Geodesicas). Seja M uma variedade metrica.
Entao para todos p M e v Tp M , e para cada t0 R, existe um intervalo aberto I R contendo t0 e
uma unica geodesica : I M tal que (t0 ) = p e 0 (t0 ) = v.

Prova: Seja V uma vizinhanca coordenada de p, com x1 , . . . , xn suas coordenadas. Pela expressao em
coordenadas locais da derivada covariante de um campo ao longo de uma curva obtida no captulo anterior,
uma curva (t) = x (t) = x1 (t) , . . . , xn (t) e uma geodesica se e somente se as suas componentes satisfazem
o sistema de equacoes diferenciais ordinarias de segunda ordem nao linear (quasilinear), chamado a equacao
geodesica,
d2 xk i
k dx dx
j
+ ij = 0, k = 1, . . . , n. (12.3)
dt2 dt dt
Este sistema de segunda ordem pode ser transformado num sistema de primeira ordem introduzindo as n
equacoes de primeira ordem
dxk
vk = , k = 1, . . . , n,
dt
de modo que estas equacoes juntamente com
dv k
+ kij v i v j = 0, k = 1, . . . , n,
dt
formam um sistema de primeira ordem equivalente ao primeiro. O resultado segue entao do teorema de
existencia e unicidade para solucoes de sistemas de equacoes diferenciais ordinarias de primeira ordem.
Note que este teorema permanece valido para geodesicas definidas em variedades diferenciaveis dotadas de
uma conexao nao necessariamente metrica.
Isometrias preservam geodesicas:
12.5 Proposicao. Sejam M, N variedades metricas isometricas e seja F : M N uma isometria. Se
: I M e uma geodesica de M tal que
(0) = p,
0 (0) = v,
entao = F : I N e uma geodesica de N tal que
(0) = F (p) ,
0 (0) = dFp (v) .
Prova: Segue imediatamente do fato de isometrias preservarem conexoes metricas (Proposicao 11.19) e da
regra da cadeia.
12.2 Exemplos de Geodesicas

Vamos calcular as geodesicas para algumas variedades riemannianas. Lembramos que os smbolos de Chris-
toffel da conexao riemanniana sao dados por
1
kij = (i gjm + j gim m gij ) g km .
2
12.6 Exemplo (Geodesicas de Rn ). Como o tensor metrica de Rn e gij = ij , temos
kij 0,
donde a equacao geodesica e simplesmente

d2 xk
= 0, k = 1, . . . , n.
dt2
As solucoes para esta equacao diferencial sao
x (t) = tv + x0
onde v, x0 Rn sao vetores fixados. Em outras palavras, as geodesicas de Rn sao retas.

12.7 Exemplo (Geodesicas de S2r ). Enxergando a esfera S2r de centro na origem e raio r como uma
superfcie de revolucao com carta
(x, y, z) (, ) = (r sen cos , r sen sen , r cos ),
segue do Exemplo 10.11 que

r2

0
G (, ) = ,
0 r2 sen2
1

r2 0
1
G (, ) = .

1
0
r sen2
2
Para variedades de dimensao 2 temos

1
kij = (i gj1 + j gi1 1 gij ) g k1 + (i gj2 + j gi2 2 gij ) g k2 .

2
Nesta carta,
g11 constante,
g12 = g21 = g 12 = g 21 = 0,
2 gij = 0.
Portanto,
1
1ij = (i gj1 + j gi1 1 gij ) g 11 ,
2
1 1
2ij = (i gj2 + j gi2 2 gij ) g 22 = (i gj2 + j gi2 ) g 22 .
2 2
Logo,
1
111 = (1 g11 + 1 g11 1 g11 ) g 11 = 0,
2
1
112 = 121 = (1 g21 + 2 g11 1 g12 ) g 11 = 0,
2
1 1 1 1
122 = (2 g21 + 2 g21 1 g22 ) g 11 = (1 g22 ) g 11 = 2r2 sen cos 2 = sen cos ,
2 2 2 r
e
1
211 = (1 g12 + 1 g12 ) g 22 = 0,
2
1 1 1 1 cos
212 = 221 = (1 g22 + 2 g12 ) g 22 = (1 g22 ) g 22 = 2r2 sen cos 2

= ,
2 2 2 r sen2 sen
1
222 = (2 g22 + 2 g22 ) g 22 = 0.
2
Apenas os smbolos 212 = 221 e 122 sao nao nulos. Portanto a equacao geodesica para a esfera e
2 1 2 2
d x + 122 dx dx = 0,

dt2

dt dt
2 2 1 2
d x + 22 dx dx = 0,

12
dt2 dt dt
ou seja, 2
d2 d

sen cos = 0,
dt2
dt
d2 cos d d

+2 = 0.
dt2 sen dt dt
Resolver este sistema de equacoes diferenciais nao lineares acopladas nao e facil. Por outro lado, e facil
verificar por substituicao direta que o equador
= /2,
= t,
ou qualquer meridiano da forma
= t,
= 0 ,
e uma solucao para este sistema. Observe agora que rotacoes sao isometrias da esfera: rotacoes do espaco
euclideano R3 sao transformacoes ortogonais e portanto isometrias de R3 ; como a restricao de uma rotacao
de R3 a esfera e uma rotacao da esfera e esta tem a metrica induzida de R3 , ela e uma isometria da esfera.
Uma vez que geodesicas sao preservadas por isometrias, conclumos que os grandes crculos da esfera (isto
e, crculos cujos centros sao o centro da esfera, que podem tambem ser obtidos intersectando a esfera com
planos passando pela origem) sao suas geodesicas, ja que dado um ponto p da esfera e um vetor tangente v
a esfera neste ponto existe um grande crculo passando por p com a direcao de v.
12.8 Exemplo (Geodesicas de Sn ). Um argumento envolvendo isometrias pode ser usado para obter
diretamente que as geodesicas de Sn Rn+1 sao os grandes crculos, sem passar pela equacao geodesica.

Primeiramente, provamos que a geodesica (t) = x1 (t) , . . . , xn (t) , xn+1 (t) que passa pelo polo norte
(0) = en+1 com velocidade 0 (0) = e1 e o meridiano x2 = . . . = xn = 0. De fato, suponha por absurdo que
xi (t0 ) 6= 0 para algum t0 e para algum ndice 2 6 i 6 n. Considere a isometria : Sn Sn definida por
x1 , . . . , xi1 , xi , xi+1 , . . . , xn+1 = x1 , . . . , xi1 , xi , xi+1 , . . . , xn+1

( e a restricao da transformacao ortogonal correspondente de Rn+1 , logo e uma simetria da esfera, como
observado no final do exemplo anterior). Como isometrias preservam geodesicas e
( (0)) = (en+1 ) = en+1 ,

d(0) 0 (0) = (e1 ) = e1 ,
segue que leva em . Mas ( (t0 )) 6= (t0 ), uma contradicao.

Como rotacoes da esfera que deixam o eixo xn+1 fixado transformam este meridiano em qualquer outro
meridiano passando pelo polo norte, abrangendo todas as direcoes tangentes possveis, obtemos que as
geodesicas passando pelo polo norte sao os meridianos. Como qualquer grande crculo da esfera pode ser
transformado em um meridiano passando pelo polo norte atraves de uma rotacao da esfera, conclumos o
resultado.
12.9 Exemplo (Geodesicas de H2 ). Como vimos no Exemplo 10.12, temos
1

0
2
G (x, y) = y 1 ,

0
y2
2
1 y 0
G (x, y) = .
0 y2
Para variedades de dimensao 2 temos

1
kij = (i gj1 + j gi1 1 gij ) g k1 + (i gj2 + j gi2 2 gij ) g k2 .

2
Nesta carta,
g12 = g21 = g 12 = g 21 = 0,
1 gij = 0.
Portanto,
1 1
1ij = (i gj1 + j gi1 1 gij ) g 11 = (i gj1 + j gi1 ) g 11 ,
2 2
1
2ij = (i gj2 + j gi2 2 gij ) g 22 .
2
Logo,
1
111 = (1 g11 + 1 g11 ) g 11 = 0,
2
1 1 1 2 1
112 = 121 = (1 g21 + 2 g11 ) g 11 = (2 g11 ) g 11 = 3 y2 = ,
2 2 2 y y
1
122 = (2 g21 + 2 g21 ) g 11 = 0,
2
e

1 1 1 2 1
211 = (1 g12 + 1 g12 2 g11 ) g 22 = (2 g11 ) g 22 = y2 = ,
2 2 2 y3 y
1
212 = 221 = (1 g22 + 2 g12 2 g12 ) g 22 = 0,
2
1 1 1 2 1
222 = (2 g22 + 2 g22 2 g22 ) g 22 = (2 g22 ) g 22 = 3 y2 = .
2 2 2 y y
A equacao geodesica para o plano hiperbolico e
2

x00 x0 y 0 = 0,

y
1 1
y 00 + (x0 )2 (y 0 )2 = 0,

y y
Para resolver este sistema, consideraremos dois casos.
(i) Caso x0 = 0.
Neste caso, x (t) x0 , enquanto que y (t) satisfaz a equacao
1 0 2
y 00 (y ) = 0
y
que escrevemos na forma
2
yy 00 (y 0 ) = 0
que e equivalente a 0
y0

= 0,
y
ou seja,
y 0 = ky
para alguma constante k R. A solucao desta equacao e
y (t) = y0 ekt

para alguma constante y0 > 0. Portanto, neste caso as geodesicas sao (t) = x0 , y0 ekt , as semi-retas
superiores do plano hiperbolico.
(ii) Caso x0 6= 0.
Neste caso podemos calcular

0 0 2
yy x0 yy 00 + x0 (y 0 ) x00 yy 0
= 2
x0 (x0 )
2 2 2 2
x0 yy 00 + x0 (x0 ) x0 (y 0 ) x00 yy 0 + 2x0 (y 0 ) x0 (x0 )
= 2
(x0 )
h i
2 2 3
x0 yy 00 + (x0 ) (y 0 ) y 0 [x00 y 2x0 y 0 ] (x0 )
= 2
(x0 )
3
x0 0 y 0 0 (x0 )
= 2
(x0 )
= x0 .
Isso implica que 0

yy 0

+x =0
x0
ou seja,
yy 0
+x=a
x0
para alguma constante a R. A solucao implcita desta equacao, equivalente a
xx0 + yy 0 = ax0
pode ser obtida integrando-se em relacao a t:

x2 y2
+ = ax + b,
2 2
ou
2
(x a) + y 2 = R2
onde R > 0. Portanto, neste caso as geodesicas sao semicrculos superiores centrados em pontos (a, 0) do
eixo x.
12.3 Fluxo Geodesico

O resultado obtido pode ser melhorado, no sentido de que em uma vizinhanca de qualquer ponto da vari-
edade podemos garantir que os intervalos de definicao das geodesicas passando por pontos na vizinhanca,
independentemente da velocidade inicial, possuem um comprimento comum mnimo. Isto segue do seguinte
resultado para o fluxo induzido por um campo vetorial:
12.10 Teorema (Fluxo de um Campo Vetorial). Sejam M uma variedade diferenciavel, V uma vizi-
nhanca de um ponto p M e X T (V ) um campo vetorial Entao existem um aberto V0 V contendo p,
> 0 e uma aplicacao diferenciavel
: (, ) V0 V
tais que q (t) = (t, q) : (, ) V e a unica trajetoria de X tal que (0, q) = q para todo q V0 .
Este resultado permite definir:
12.11 Definicao. O campo geodesico no fibrado tangente T M e o unico campo cujas trajetorias sao da
forma t 7 ( (t) , 0 (t)) onde e uma geodesica em M .
Seu fluxo e chamado o fluxo geodesico de T M .
12.12 Corolario. Seja M uma variedade riemanniana. Entao, para cada p M existem uma vizinhanca
V de (p, 0) em T M tal que (V) = U e uma vizinhanca coordenada de p em M , > 0 e uma aplicacao
diferenciavel
: (, ) V T U
tais que
(q,v) (t) = (t, q, v) : (, ) T U
e a unica trajetoria do campo geodesico que satisfaz a condicao inicial (0, q, v) = (q, v) para todo (q, v) V.
Prova: Basta aplicar o Teorema 12.10 ao campo geodesico, elemento de T (T M ), e ao ponto P = (p, 0)
TM.
Uma reinterpretacao do resultado acima que vai ser mais util e facil de usar na sequencia:
12.13 Proposicao. Seja M uma variedade riemanniana. Entao, para cada p M existem uma vizinhanca
V de p em M , , > 0 e uma aplicacao diferenciavel
: (, ) V M
onde
V = {(q, v) : q V e v Tq M, kvk < }
tais que
(q,v) (t) = (t, q, v) : (, ) M
e a unica geodesica de M que satisfaz as condicoes iniciais (0) = q, 0 (0) = v para todo q V e para todo
v Tq M tal que kvk < .
Este resultado afirma que se kvk < , a geodesica (t, q, v) existe no intervalo (, ). Podemos de fato
aumentar a velocidade da geodesica, mas ao preco de diminuir o seu intervalo de definicao (e vice-versa).
Para isso basta reparametrizar a geodesica:
12.14 Proposicao. Seja : (, ) M uma geodesica tal que (0) = p e 0 (0) = v. Para qualquer
a > 0 a curva
(t) = (at)

e uma geodesica tal que (0) = p e 0 (0) = av definida no intervalo , . Consequentemente,
a a
(t, q, av) = (at, q, v) . (12.4)
Prova: O resultado segue da Proposicao 12.2 e do fato que 0 (t) = a 0 (at).

12.15 Corolario. Seja M uma variedade riemanniana. Entao, para cada p M existem uma vizinhanca
V de p em M , > 0 e uma aplicacao diferenciavel
: (2, 2) V M
onde
V = {(q, v) : q V e v Tq M, kvk < }
tais que
(q,v) (t) = (t, q, v) : (2, 2) M
e a unica geodesica de M que satisfaz as condicoes iniciais (0) = q, 0 (0) = v para todo q V e para todo
v Tq M tal que kvk < .
12.4 A Aplicacao Exponencial

12.16 Definicao. Se v Tp M e tal que existe uma geodesica : [0, 1] M satisfazendo (0) = p e
0 (0) = v, definimos a exponencial de v por
expp (v) = (1) .

Assim,
v
expp (v) = (1, p, v) = ||v|| , p,
||v||
e geometricamente expp (v) e o ponto de M obtido percorrendo a partir de p a geodesica com velocidade
inicial v durante um intervalo de tempo unitario ou, equivalentemente, percorrendo a geodesica que parte de p
com velocidade unitaria igual a v/ ||v|| um comprimento igual a kvk. Em particular, se : (2, 2) V M
e a aplicacao diferenciavel dada pelo Corolario 12.15, a aplicacao exponencial exp esta definida em todo V e
para todo q V a aplicacao exponencial
expq : B (0) Tq M M
esta definida em uma bola B (0) Tq M .

12.17 Proposicao. Para cada p M existe > 0 tal que expp e um difeomorfismo de B (0) sobre um
aberto de M .
Alem disso,
d expp 0 = id .
Prova: Temos

expp d d d
d expp 0
v= (0) = expp (tv) = (1, p, tv) = (t, p, v) = v,
v dt t=0 dt t=0 dt t=0

o que mostra que d expp 0 : Tp M Tp M e a aplicacao identidade, onde identificamos o espaco tangente
a Tp M na origem com o proprio Tp M , isto e, T0 (Tp M ) = Tp M . Pelo teorema da funcao inversa, expp e um
difeomorfismo local em uma vizinhanca de 0.
A aplicacao exponencial recebe este nome porque no caso de variedades riemannianas que sao grupos de
Lie compactos ela e a aplicacao exponencial entre grupos de Lie, a qual recebe este nome la porque ela e a
exponencial de matrizes no caso de grupos de Lie de matrizes.
12.18 Definicao. Se expp e um difeomorfismo de uma vizinhanca U da origem em Tp M sobre uma vizi-
nhanca V de p em M , dizemos que V e uma vizinhanca normal de p.
Nestas condicoes, se B (0) e tal que B (0) V , entao nos chamamos
B (p) := expp (B (0)) (12.5)
a bola geodesica de centro em p e raio .

Em uma vizinhanca normal, podemos definir um sistema de coordenadas com propriedades especiais.
12.19 Definicao. Seja V = expp (U ) uma vizinhanca normal de p em M . Seja {E1 , . . . , En } uma base
ortonormal para Tp M e E : Rn Tp M o isomorfismo Ex = xi Ei . Considere a parametrizacao :
E 1 (U ) V definida por
(x) = expp E (x) = expp xi Ei .

As coordenadas desta parametrizacao sao chamadas coordenadas normais em p.

Devido as propriedades especiais de coordenadas normais enumeradas na proposicao a seguir, elas constituem
uma ferramenta vital em geometria riemanniana, como veremos em varios resultados nestas notas.
12.20 Proposicao. Seja V uma vizinhanca normal de p e x1 , . . . , xn coordenadas normais em p. Nestas
coordenadas vale
gij (p) = ij ,
gij
(p) = 0
xk
e
kij (p) = 0
Alem disso, para cada v Tp M , a geodesica v (t) = (t, p, v) partindo de p com velocidade inicial v e
representada em coordenadas normais por um segmento radial, isto e,
v (t) = expp (tv)
enquanto ela estiver dentro de V .

Prova: A condicao
gij (p) = ij
e consequencia imediata da definicao de coordenadas normais, pois (usando a notacao da Definicao 12.19)

i
= dx (ei ) = d expp E x (ei ) = d expp Ex dEx (ei ) = d expp Ex E (ei )
x q

= d expp Ex Ei ,
de modo que

= d expp 0 Ei = Ei ,
xi p
logo * +

gij (p) = , = hEi , Ej i = ij .
xi p xj p
O resultado sobre a geodesica segue do fato de que por definicao
expp (tv) = (1, p, tv) = (t, p, v) .
Isso implica por sua vez que

kij (p) = 0,
pois as geodesicas que passam por p sao todas dadas por equacoes lineares. Mais especificamente, a equacao
geodesica para e
d2 xk i
k dx dx
j
+ ij =0
dt2 dt dt
e como a solucao e
xk (t) = tv k ,
a equacao geodesica se reduz a
kij (v (t)) v i v j = 0
Em t = 0, temos v (0) = p, de modo que a equacao
kij (p) v i v j = 0
vale para todo v Tp M . Isso so e possvel se kij (p) = 0.

Para provar a condicao sobre as derivadas das componentes da metrica lembramos do Corolario 11.25 a
formula
gij
= gip pjk + gpj pik .
xk
Logo
gij
(p) = gip (p) pjk (p) + gpj (p) pik (p) = 0.
xk

Por causa deste resultado, as geodesicas dentro de uma vizinhanca normal que partem de p sao chamadas
raios geodesicos ou geodesicas radiais. Observe que em coordenadas normais em p a derivada covariante
em p e simplesmente
Y i

i
j
(X Y )p = Xp Y = X (p) (p) ,
xi
p xj p xi
e a derivada covariante ao longo de uma curva : I M com (t0 ) = p e dada em t0 por
dV i

DV
= (t0 ) .
dt t0 dt xi p
Como coordenadas normais em p simplificam bastante as expressoes locais de varios objetos diferenciais e
geometricos no ponto p, elas sao muito usadas para obter resultados em geometria riemanniana que dependem
apenas da situacao em p, facilitando os calculos necessarios.
Vamos agora mostrar que uma isometria e definida pela diferencial em um unico ponto:
12.21 Proposicao. Sejam M, N variedades riemannianas, com M conexa. Se F, G : M N sao isome-
trias tais que
F (p) = G (p) ,
dFp = dGp ,
entao F = G.
Prova: Seja
A = {q M : F (q) = G (q)} .
Entao A 6= , pois p A, e por continuidade A e fechado. Como M e conexa, para provar o resultado basta
mostrar que A e aberto. Para isso, provaremos que se q0 A entao qualquer vizinhanca normal V de q0 esta
contida em A. De fato, se q V , seja v Tq0 M tal que
v (1) = expq0 (v) = q.
Da Proposicao 12.5 segue que
F (q) = F (v (1)) = dFp (v) (1) = dGp (v) (1) = G (v (1)) = G (q) .
12.5 Lema de Gauss

Para estudar as propriedades minimizantes das geodesicas, precisamos considerar o conceito de variacao de
uma curva, que tem sua origem no calculo de variacoes.
12.22 Definicao. Uma curva diferenciavel por partes em M e uma aplicacao contnua : [a, b] M
tal que existe uma particao do intervalo [a, b]
a = t0 < t1 < . . . < tk < tk+1 = b
tal que as restricoes |[ti, ti+1 ] sao curvas diferenciaveis para i = 0, . . . , k.

Cada ponto (ti ) e chamado um vertice da curva e o angulo da curva no vertice (ti ) e definido
como sendo o angulo entre os vetores
lim 0 (t) e lim 0 (t)

tt
i tt+
i

12.23 Definicao. Seja : [a, b] M uma curva diferenciavel por partes. Uma variacao de e uma
aplicacao
F : (, ) [a, b] M
tal que
(i) F (0, t) = (t) ;
(ii) existe uma particao de [a, b] por pontos
a = t0 < t1 < . . . < tk < tk+1 = b
tal que F |(,)[ti ,ti+1 ] e diferenciavel para i = 0, . . . , k.

Para cada s fixado, a curva Fs (t) = F (s, t) : [a, b] M e chamada uma curva principal da variacao.
Para cada t fixado, a curva Ft (s) = F (s, t) : (, ) M e chamada uma curva transversal da variacao.
Um campo vetorial ao longo de F e uma aplicacao V : (, ) [a, b] T M tal que V (s, t)
TF (s,t) M para cada (s, t) e V |(,)[ti ,ti+1 ] e diferenciavel para i = 0, . . . , k. Se F e uma variacao de , entao
o campo variacional de F e o campo vetorial ao longo de
F
V (t) = (0, t) .
s

Dada uma variacao F : (, ) [a, b] M de uma curva diferenciavel por partes , consideraremos as
derivadas covariantes de um campo vetorial qualquer, definido ao longo de F , ao longo das curvas principais
e ao longo das curvas transversais da variacao, onde estas derivadas estiverem definidas:
12.24 Notacao. Denotaremos as derivadas covariantes de um campo vetorial V ao longo de uma variacao
F ao longo das curvas principais e transversais de F (onde estiverem definidas) respectivamente por
DV DV
e .
dt ds

12.25 Lema (Lema de Simetria). Seja F : (, ) [a, b] M uma variacao. Entao
D F D F
= .
ds t dt s
Prova: Escrevendo F localmente em coordenadas na forma
F (s, t) = x1 (s, t) , . . . , xn (s, t) ,

segue da regra da cadeia que

F xi
= i ,
t t
F xj
= i .
s s
Usando a comutatividade das derivadas parciais e a simetria da conexao, temos
D xi

D F
= i
ds t ds t
2 xi xi D
= i + i
ts t ds
2 xi xi
= i + xj i
ts t s j
2 xi xi xj
= i + i j
ts t s
2 xi xj xi
= i + j i
st i t s
D x
= i
dt s
D F
= .
dt s

No que se segue, identificaremos o espaco tangente a Tp M no vetor v com o proprio Tp M , isto e,
Tv (Tp M ) = Tp M . A fronteira B (p) de uma bola geodesica e chamada uma esfera geodesica e denotada
S (p).
12.26 Lema (Lema de Gauss). Seja M uma variedade metrica, p M e v Tp M tal que expp (v) esta
definido. Entao D E
d expp v v, d expp v w = hv, wi
para todo w Tp M .
Em particular, as geodesicas radiais que partem de p sao ortogonais as esferas geodesicas centradas em
p.

Prova: Decompondo Tp M = hvi + hvi , se w hvi entao w = av para algum escalar a 6= 0. Temos

expp d d
d expp v v = (v) = expp ((t + 1) v) = (1, p, (t + 1) v)
v dt t=0 dt t=0

d 0
= (t + 1, p, v) = (p,v) (1) ,
dt t=0
e como a norma do vetor tangente a uma geodesica e constante, segue que

D E D E
d expp v v, d expp v w = a d expp v v, d expp v v
2
0
= a (p,v) (1)

2
0
= a (p,v) (0)

= a hv, vi
= hv, wi .

Se w hvi , entao hv, wi = 0 e para terminar a demonstracao do lema temos que provar que
D E
d expp v v, d expp v w = 0.
Considere o raio geodesico : [0, 1] M
(t) = expp (tv) .
Para algum > 0, considere a curva : (, ) Tp M com (0) = v, 0 (0) = w e k (s)k constante
= kwk, ou seja, e um pequeno arco de crculo centrado na origem de Tp M e raio kvk, comecando em v e
com velocidade inicial w. Definimos uma variacao F : (, ) [0, 1] M de por
F (s, t) = expp (t (s)) .
Em particular, as curvas principais da variacao Fs (t) sao geodesicas, mais especificamente as geodesicas
radiais (1, p, t (s)) = (t, p, (s)) que passam por p com velocidade (s). Uma variacao F cujas curvas
principais sao geodesicas e chamada uma variacao geodesica.
Como
F
(s, t) = d expp t(s) ( (s)) ,
t
F
(s, t) = d expp t(s) (t0 (s)) ,

s
segue que
F
(0, 1) = d expp v v,
t
F
(0, 1) = d expp v w,
s
de modo que
D E F F
d expp v v, d expp v w = (0, 1) , (0, 1) .
p t s p
Mostraremos que
F F
(0, 1) , (0, 1) =0
t s p
analizando o produto interno

F F
, (s, t) .
t s
Afirmamos que ele independe de t. De fato, pela compatibilidade da conexao riemanniana com a metrica,
temos para todo (s, t),

F F D F F F D F
, = , + ,
t t s dt t s t dt s

F D F
= , ,
t dt s
pois
D F
=0
dt t
F
ja que Fs (t) sao geodesicas e e seu campo velocidade. Pelo Lema de Simetria,
t

F D F F D F 1 F F
, = , = , .
t dt s t ds t 2 s t t
Mas
F F

t (s, t) =
t (s, 0) = k (s)k constante,
= d expp ( (s))
0
e assim
F F
, = 0.
t t s
Em particular, como
F
(0, 0) = 0,
s
conclumos que
F F F F
, (0, 1) = , (0, 0) = 0.
t s t s
12.6 Geodesicas em Variedades Riemannianas

12.6.1 Geodesicas em Variedades Riemannianas minimizam distancias local-
mente
Veremos agora que as geodesicas minimizam distancias, localmente. A distancia entre dois pontos de uma
variedade riemanniana e definida como sendo o nfimo dos comprimentos das curvas que ligam estes pontos,
como veremos em detalhes na Secao 12.8.
12.27 Definicao. Se : I M e uma geodesica e [a, b] I, a restricao |[a,b] e chamada o segmento

de geodesica ligando (a) a (b).
Denote o comprimento de uma curva em M ligando os pontos p e q por ` (). Dizemos que o segmento
de geodesica : [a, b] M e minimizante se ` () 6 ` () para toda curva ligando (a) a (b).
12.28 Proposicao (Geodesicas minimizam distancias localmente). Sejam M uma variedade rieman-
niana, p M e B (p) uma bola normal centrada em p. Seja : [0, 1] B (p) um segmento de geodesica
com (0) = p e denote q = (1).
Se : [0, 1] M e qualquer curva diferenciavel por partes ligando p a q, entao
` () 6 ` () .
Se ` () = ` (), entao necessariamente ([0, 1]) = ([0, 1]).

Prova: Suponha em primeiro lugar que ([0, 1]) B (p). Como expp e um difeomorfismo em B (p), podemos
escrever (t) de forma unica em coordenadas polares na forma
(t) = expp (r (t) c (t)) (12.6)
para t (0, 1], onde c e uma curva diferenciavel por partes em Tp M com kc (t)k = 1 para todo t e r :
(0, 1] R e uma funcao diferenciavel por partes; de fato, basta considerar (t) = exp1
p ( (t)) e definir
(t)
c (t) = e r (t) = k (t)k .
k (t)k
Se retorna ao ponto p, de modo que (t1 ) = 0 para algum t1 > 0, redefinimos c eliminando todo o
segmento ([0, t1 ]), o que nao prejudicara o resultado, pois mostraremos que a curva resultante ainda assim
possui comprimento maior que a geodesica. Denote
F (r, t) = expp (rc (t)) , (12.7)
de modo que, exceto possivelmente para um numero finito de pontos,

F 0 F
0 (t) = r (t) + .
r t
Como
F
= d expp (t) c (t) ,
r
F
= d expp (t) (rc0 (t)) ,

t
segue do lema de Gauss que

F F
, = hc (t) , rc0 (t)i = r hc (t) , c0 (t)i = 0, (12.8)
r t
e
F 2

= F , F = hc (t) , c (t)i = kc (t)k2 = 1. (12.9)
r r r
Logo,
F 2 0 F 2 F 2

0 2 2 0 2 > |r0 (t)|2 .
k (t)k =
|r (t)| +
= |r (t)| +

r t t
Da, Z 1 Z 1 Z 1
` () > k0 (t)k dt > |r0 (t)| dt > r0 (t) dt = r (1) r () = ` () r () .

Fazendo 0, como r () 0, segue o primeiro resultado.
Para que tenhamos ` () = ` () e necessario que
F
= 0,
t
ou seja,
c0 (t) = 0
e portanto c constante. Como r0 (t) > 0, e entao uma reparametrizacao monotona de , donde ([0, 1]) =
([0, 1]).
Se ([0, 1]) 6 B (p) = B (p), consideramos o primeiro instante t1 (0, 1] tal que (t1 ) B (p). Entao,

` () > ` |[0,t1 ] > > ` () .

O resultado vale apenas localmente: um segmento de geodesica suficientemente grande pode nao ser mini-
mizante. Por exemplo, as geodesicas de uma esfera (crculos maximais) que partem de um ponto p deixam
de ser minimizantes depois que passam pelo antpoda de p.
Vale a recproca da Proposicao 12.28 e ela e ate mais forte. Antes uma definicao e um resultado preliminar.
12.29 Definicao. Seja M uma variedade riemanniana.
Se V e uma vizinhanca em M que e uma vizinhanca normal para todos os seus pontos, dizemos que V e
uma vizinhanca totalmente normal.
Dizemos que uma vizinhanca V em M e uma vizinhanca uniformemente normal se existe > 0 tal
que para todo q V a bola geodesica B (q) = expq (B (0)) contem V .
Observe que em uma vizinhanca uniformemente normal, dois pontos quaisquer da vizinhanca sao ligados por
uma geodesica radial. Toda vizinhanca uniformemente normal e em particular totalmente normal.
12.30 Lema. Seja M uma variedade riemanniana. Para cada p M existe uma vizinhanca W de p que e
uma vizinhanca uniformemente normal.
Prova: Sejam > 0, V e V como na Proposicao 12.13. Defina F : V M M por

F (q, v) = q, expq v .
Temos F (p, 0) = (p, p) e
I
dF (p, 0) =
0 I

pois d expp 0 = I. Portanto, F e um difeomorfismo local em uma vizinhanca de (p, 0), logo existe uma
vizinhanca V0 V de (p, 0) em T M tal que F aplica V0 difeomorficamente sobre uma vizinhanca W 0 de (p, p)
em M M . Para algum > 0, escolha V0 da forma
V0 = {(q, v) : q V 0 e v B (0) Tq M }
onde V 0 e uma vizinhanca de p em M . Escolha a vizinhanca W de p em M de tal forma que W W W 0 .
Entao, para todo q W e B (0) Tq M temos
F ({q} B (0)) {q} W
o que implica, pela definicao de F ,
B (q) = expq (B (0)) W.

12.31 Corolario (Curvas que minimizam distancias sao geodesicas). Seja M uma variedade rieman-
niana. Se : [a, b] M e uma curva diferenciavel por partes com parametro proporcional ao comprimento
de arco que tem comprimento menor ou igual a qualquer outra curva diferenciavel por partes ligando (a)
a (b), entao e uma geodesica.
Em particular, e diferenciavel em todo o intervalo [a, b].
Prova: Sejam t0 [a, b] e V uma vizinhanca uniformemente normal de (t0 ). Seja I = [t0 , t0 + ] [a, b]
um intervalo fechado tal que (I) V . Entao a restricao |I e uma curva diferenciavel por partes ligando
dois pontos de uma bola normal. Pela Proposicao 12.28, ` (|I ) e igual ao comprimento da geodesica
radial ligando (t0 ) a (t0 + ) (caso contrario obteramos outra curva diferenciavel por partes com
comprimento menor que ligando (a) a (b), contrariando a hipotese). Segue da mesma proposicao que
a imagem de |I e a imagem desta geodesica. Como |I esta parametrizada por um parametro proporcional
ao comprimento de arco, segue que |I e ela propria uma geodesica.
Observe que este resultado e global, nao apenas local: dados dois pontos quaisquer de uma variedade
riemanniana, se existir uma curva ligando eles que minimiza distancias, entao ela e uma geodesica. Por outro
lado, dados dois pontos arbitrarios em uma variedade riemanniana pode nao existir nenhuma geodesica que
os ligue: considere Rn com a bola centrada em zero e raio 1 removida; para > 0 suficientemente pequeno,
nao existe nenhuma geodesica que une os pontos
(1 , 0, . . . , 0) e (1 + , 0, . . . , 0) ,
por exemplo, e esta afirmacao vale para quaisquer dois pontos antpodas muito proximos ao bordo da bola
removida.
12.32 Exemplo (Geodesicas de H 2 usando isometrias). Como no Exemplo 12.8, para determinar as
geodesicas do plano hiperbolico usaremos isometrias.
Primeiramente, usando o Corolario 12.31 mostraremos que o semieixo y superior e uma geodesica. De
fato, seja (t) = (0, t), t > 0, uma parametrizacao por comprimento de arco deste semieixo e considere um
segmento |[a,b] . Temos
Z b Z b
1
` () = k 0 (t)k(t) dt = dt = log b log a.
a a t
Se c : [a, b] H2 , c (t) = (x (t) , y (t)) , e qualquer curva diferenciavel por partes com c (a) = (a) = (0, a)
e c (b) = (b) = (0, b), entao
q q
Z b Z b [x0 (t)]2 + [y 0 (t)]2 Z b [y 0 (t)]2 Z b 0
y (t)
` (c) = kc0 (t)kc(t) dt = dt > dt = dt = ` () .
a a y (t) a y (t) a y (t)
Observe que, diferentemente da esfera, variedade compacta, esta geodesica de H2 tem comprimento infinito,
como as retas do plano R2 .
As isometrias do plano hiperbolico sao dadas pelas transformacoes de Mobius
az + b
T (z) = , ad bc = 1,
cz + d
onde z = x + iy C. Estas isometrias transformam o semieixo y em semicrculos superiores ou em semi-retas
superiores x = x0 , y > 0. Estas sao as geodesicas de H2 , pois por todo ponto p H2 passa um tal semicrculo
ou uma tal semi-reta, em todas as direcoes possveis. A demonstracao de todos estes detalhes e deixada ao
leitor (Exerccio 12.54).
12.6.2 Vizinhancas Convexas

Em uma vizinhanca uniformemente normal, como a considerada no Lema 12.30, dados dois pontos q1 , q2 W
existe uma unica geodesica minimizante de comprimento menor que 2 ligando q1 a q2 . Por outro lado, nada
garante que esta geodesica esteja contida em W (as duas geodesicas radiais, uma partindo de q1 e outra
partindo de q2 podem se ligar atraves de um ponto p fora de W B (q1 ) B (q2 ).
12.33 Definicao. Seja M uma variedade riemanniana. Dizemos que uma vizinhanca V em M e uma
vizinhanca convexa se para todos os pontos p, q V existe uma unica geodesica minimizante ligando p a
q cuja imagem esta inteiramente contida em V .
O raio de uma bola geodesica pode ser escolhido de tal forma que ela se torne convexa.
12.34 Lema. Seja M uma variedade riemanniana. Para todo p M existe R > 0 tal que qualquer geodesica
de M que e tangente a esfera geodesica Sr (p) de raio r < R em q M esta fora da bola geodesica Br (p)
numa vizinhanca de q.
Prova: Seja V uma vizinhanca totalmente normal de p. Restringindo convenientemente o intervalo de
definicao, podemos assumir que todas as geodesicas de V tem velocidade 1. Podemos portanto nos restringir
ao fibrado tangente unitario
T1 V = {(q, v) T M : q V , v Tq M e kvk = 1} .
Seja : (, ) T1 V M a aplicacao diferenciavel tal que (t, q, v) e a geodesica que no instante t = 0
passa por q com velocidade v, kvk = 1. Definimos
u (t, q, v) = exp1
p ( (t, q, v))
e F : (, ) T1 V R por
2
F (t, q, v) = ku (t, q, v)k ,
ou seja, F mede o quadrado da distancia (medida em Tp M , nao na variedade M ) a origem de um ponto que
se desloca sobre a geodesica . Temos

F u
= 2 u, ,
t t
2
2F 2u

u
2
= 2 u, 2 + 2 t .

t t
Seja agora r > 0 tal que Br (p) = expp Br (0) V e uma geodesica tangente a esfera geodesica no ponto
q = (0, q, v). Pelo lema de Gauss,

u
u (0, q, v) , (0, q, v) = 0
t
ja que (t, q, v) e uma geodesica radial que parte de q. Em particular,
F
(0, q, v) = 0.
t
Se mostrarmos que para r suficientemente pequeno o ponto crtico (0, q, v) de F e um mnimo estrito, de
modo que os pontos de estao a uma distancia de p maior que r, a demonstracao estara concluda.
Para provar isso, basta observar que para q = p temos u (t, p, v) = tv e portanto
2F 2
(0, p, v) = 2 kvk = 2,
t2
logo existe uma vizinhanca W V de p tal que
2F
(0, q, v) > 0
t2
para todo q W . Escolha R > 0 tal que Br (p) = expp BR (0) W . Entao, se r < R, F tem um mnimo
estrito em (0, q, v).
12.35 Proposicao. Seja M uma variedade riemanniana. Para todo p M existe > 0 tal que a bola
geodesica B (p) e convexa.
Prova: Seja R > 0 como no lema. Escolha W e < 0 como no Lema 12.30 com < R/2. Tome < tal
que B (p) W . Afirmamos que B (p) e convexa.
De fato, sejam q1 , q2 B (p) e a unica geodesica minimizante de comprimento menor que 2 < 2 < R
ligando q1 a q2 ; em particular, esta contida na bola BR (p). Suponha por absurdo que o interior de nao
esta contido em B (p). Entao existe um ponto q no interior de onde a distancia maxima r < R de p a
e atingida. Logo e tangente a esfera geodesica Sr (p) em q, mas os pontos de numa vizinhanca de q
estarao no fecho de Br (p), contradizendo o lema.
12.7 Geodesicas em Variedades de Lorentz

12.36 Definicao. Seja M uma variedade de Lorentz.
Uma curva diferenciavel : I M e do tipo tempo se 0 (t) e do tipo tempo em T(t) M para todo
t I. Ela e do tipo luz se 0 (t) e do tipo luz em T(t) M para todo t I. Ela e do tipo espaco se 0 (t) e
do tipo espaco em T(t) M para todo t I.
Uma curva diferenciavel por partes : I M e do tipo tempo se nos pontos t onde ela for diferenciavel
0 (t) e do tipo tempo e se nos pontos ti onde ela nao for diferenciavel valer

0 0 +
ti , ti < 0.
Ela e do tipo luz se nos pontos t onde ela for diferenciavel 0 (t) e do tipo luz e se nos pontos ti onde ela
nao for diferenciavel valer
0 0 +
ti , ti = 0.
Ela e do tipo espaco se nos pontos t onde ela for diferenciavel 0 (t) e do tipo espaco e se nos pontos ti onde
ela nao for diferenciavel valer
0 0 +
ti , ti > 0.

Em geral, uma curva arbitraria em uma variedade de Lorentz nao tem nenhuma destas caractersticas
causais. Por outro lado, a trajetoria de uma partcula material no espacotempo de Minkowski e sempre uma
curva do tipo tempo, como vimos no Captulo 3 (em Relatividade Especial, a velocidade da luz nao pode
ser ultrapassada). Para uma partcula material que segue uma trajetoria : I M do tipo tempo no
espacotempo de Minkowski, com velocidade unitaria, isto e,
h0 ( ) , 0 ( )i = 1
para todo I, entao o parametro e o precisamente o tempo proprio da partcula. Da segue que
Z 0
` () = k0 ( )k d = 0 ,
0
ou seja, o seu comprimento e o seu tempo proprio. O mesmo vale para curvas em variedades de Lorentz,
isto e, curvas no espacotempo curvo.
Da Proposicao 12.2 segue no entanto que geodesicas sempre sao ou do tipo luz, ou do tipo espaco ou do
tipo tempo.
12.37 Lema. Sejam M uma variedade de Lorentz e p M . Seja : [0, T ] M uma curva diferenciavel
por partes do tipo tempo com (0) = p, tal que
= exp1
p : I Tp M
esta definida. Entao e uma curva do tipo tempo que esta contida em um unico cone temporal de Tp M .
Em particular, nao tem autointersecoes.
Prova: Provaremos o resultado apenas no caso em que e diferenciavel, o caso mais geral ficando como
exerccio (ou veja [ONeill], Lema 5.33, p. 146). Note que (0) = 0.
O Lema de Gauss garante que e uma curva do tipo tempo em Tp M : de fato, como
0
0 (t) = expp (t) = d expp (t) 0 (t) ,

segue do Lema de Gauss que

D E
h0 (t) , 0 (t)i = d expp (t) 0 (t) , d expp (t) 0 (t) = h 0 (t) , 0 (t)i ,

e portanto e uma curva do tipo tempo em Tp M se e somente se e uma curva do tipo tempo em M .
Seja C o cone temporal de Tp M tal que 0 (0) C. Como a funcao
f (t) = h 0 (0) , 0 (t)i
e contnua e f (0) < 0, segue que f (t) < 0 para todo t [0, ) se > 0 e suficientemente pequeno, de modo
que 0 ([0, )) C pela Proposicao 2.25. Alem disso, pela formula de Taylor,
(t) = 0 (0) t + O t2 ,

de modo que
h (t) , (t)i = h 0 (0) , 0 (0)i t2 + O t3 ,

donde (t) e um vetor do tipo tempo para todo t [0, ) (diminuindo , se necessario); analogamente, temos
h (t) , 0 (0)i = h 0 (0) , 0 (0)i t + O t2 ,

de modo que
h (t) , 0 (0)i < 0
para todo t [0, ) (diminuindo , se necessario) e portanto ([0, )) C. Portanto, (t) e 0 (t) estao no
mesmo cone temporal para todo t [0, ), isto e,
h (t) , 0 (t)i < 0 (12.10)
para todo t [0, ), pela Proposicao 2.25. Logo, a funcao
g (t) = h (t) , (t)i
e negativa e estritamente decrescente para t (0, ), pois g 0 (t) < 0. Mas o mesmo argumento acima permite
concluir que enquanto a curva permanecer no cone C, (t) sera do tipo tempo, (t) e 0 (t) estarao no
mesmo cone temporal e portanto (12.10) valera. Segue que nunca teremos g (t) = 0, isto e, a curva nunca
cruzara a fronteira do cone temporal C.
Observe que o resultado acima nao impede uma curva do tipo tempo em uma variedade de Lorentz de possuir
autointersecoes, pois se a imagem de uma tal curva nao esta inteiramente contida na imagem da aplicacao
exponencial expp para algum ponto p, ela pode ter autointersecoes fora de expp (Tp M ). Fisicamente, uma
partcula que percorresse tal trajetoria estaria viajando no tempo para o passado. Existem variedades,
mesmo riemannianas que nao sao cobertas por expp (Tp M ) para nenhum p M ; tais variedades sao cha-
madas variedades nao completas (veja a Secao 12.9 para mais detalhes). E existem exemplos de modelos
de espacotempos para o universo que admitem curvas do tipo tempo com autointersecoes (os primeiros tais
modelos foram obtidos por Godel).
12.38 Proposicao (Geodesicas do tipo tempo em Variedades de Lorentz maximizam distancias
localmente). Sejam M uma variedade de Lorentz, p M , V uma vizinhanca normal de p e q V . Se
existir uma curva do tipo tempo em V ligando p a q, entao existe uma geodesica radial do tipo tempo em V
ligando p a q e alem disso ela e a unica curva do tipo tempo com comprimento maximal ligando p a q.
Prova: Seja uma curva do tipo tempo ligando p a q. Pelo lema, = exp1 p esta contida em um unico
cone temporal de Tp M . Portanto, o segmento radial L (t) = tx0 , t [0, 1], que liga 0 a v = exp1 p q esta
neste mesmo cone temporal. Segue que a geodesica radial (t) = expp (L (t)) que liga p a q e do tipo tempo
pelo Lema de Gauss.
O argumento para provar o restante do teorema e uma modificacao da demonstracao da Proposicao 12.28,
a seguir.
Como na demonstracao daquela proposicao, escrevemos (t) de forma unica em coordenadas polares na
forma
(t) = expp (r (t) c (t))
para t (0, 1], onde c e uma curva diferenciavel por partes em Tp M com hc (t) , c (t)i = 1 para todo t, ja
que e do tipo tempo, e r : (0, 1] R e uma funcao diferenciavel por partes, e definimos
F (r, t) = expp (rc (t)) .
Exceto possivelmente para um numero finito de pontos vale

F 0 F
0 (t) = r (t) + .
r t
Como
F
= d expp (t) c (t) ,
r
F
= d expp (t) (rc0 (t)) ,

t
segue do lema de Gauss que

F F
, = hc (t) , rc0 (t)i = r hc (t) , c0 (t)i = 0.
r t
F F
Em particular, como e do tipo tempo, e do tipo espaco, isto e,
r t

F F
, > 0.
t t
Tambem pelo lema de Gauss temos
D
F F E
, = d expp (t) c (t) , d expp (t) c (t) = hc (t) , c (t)i = 1.
r r
Logo,

F F 2 F F
h0 (t) , 0 (t)i = , |r0 (t)| + ,
r r t t

2 F F
= |r0 (t)| + ,
t t
2
> |r0 (t)| .
Como
2
|r0 (t)| 6 h0 (t) , 0 (t)i < 0,
segue que
k0 (t)k = |h0 (t) , 0 (t)i| 6 |r0 (t)| .
Pelo lema, esta contida em um unico cone temporal, logo
r0 (t) > 0;
de fato, se a curva voltasse sobre si mesma, seu vetor velocidade seria do tipo luz em algum momento. Da,
Z 1 Z 1 Z 1
` () = lim k0 (t)k dt 6 lim |r0 (t)| dt = lim r0 (t) dt = ` () .
0 0 0

Como em variedades riemannianas, todo ponto de uma variedade de Lorentz possui uma vizinhanca
convexa (de fato, este resultado e verdadeiro para qualquer variedade metrica). A demonstracao deste
resultado e exatamente igual a do Lema 12.34 e Proposicao 12.35. Note que na demonstracao daquele lema,
a funcao distancia pode ser tomada como a funcao distancia euclideana nas coordenadas normais de Tp M ,
nao a funcao distancia da variedade riemanniana (isto e, nao consideramos a metrica de Lorentz de Tp M ; se
desejar, veja a demonstracao detalhada em [ONeill], Cap. 5, Proposicao 7, p. 103). Enunciamos o resultado
explicitamente para futura referencia:
12.39 Proposicao. Seja M uma variedade de Lorentz. Para todo p M existe > 0 tal que a bola geodesica
B (p) e convexa.
12.8 Funcao Distancia em Variedades Riemannianas

12.40 Definicao. Seja M uma variedade riemanniana conexa. Dados p, q M , a distancia entre p e q e
definida por
dist (p, q) = inf {` (c) : c e uma curva diferenciavel por partes ligando p e q} .

12.41 Proposicao. Se existe uma geodesica minimizante ligando p e q, entao dist (p, q) = ` ().
Prova: Segue do Corolario 12.31.
12.42 Proposicao. Seja M uma variedade riemanniana conexa. Com a funcao distancia definida acima,
M e um espaco metrico.
Alem disso, a topologia de M como espaco metrico coincide com a topologia inicial de M como variedade
diferenciavel.
Prova: De fato, a funcao distancia satisfaz as tres propriedades da funcao distancia de um espaco metrico:
(i) Simetria:
dist (p, q) = dist (q, p) .
(ii) Desigualdade triangular:
dist (p, q) 6 dist (p, r) + dist (r, q) .
(iii) Positividade:
dist (p, q) > 0
e
dist (p, q) = 0 se e somente se p = q.
Todas as propriedades seguem imediatamente da definicao (a desigualdade triangular segue da definicao de
nfimo) exceto a afirmacao que dist (p, q) = 0 implica p = q. Suponha o contrario e considere uma bola
normal B (p) que nao contem q. Como dist (p, q) = 0, existe uma curva c ligando p a q com comprimento
menor que , contradizendo a Proposicao 12.28.
Pela Proposicao 12.41, se existir uma geodesica minimizante ligando p e q entao dist (p, q) = ` (). Em
particular, dado p M , se > 0 e suficientemente pequeno, a bola geodesica B (p) de raio coincide com
a bola metrica de centro em p e raio definida pela funcao distancia:
B (p; ) = {q M : dist (p, q) < } .
Logo, bolas geodesicas contem bolas metricas e vice-versa, portanto as topologias sao as mesmas.
De agora em diante, consideraremos variedades riemannianas tambem como espacos metricos com a nocao
de distancia definida acima.
12.9 Variedades Riemannianas Completas e Teorema de Hopf-

Rinow para Variedades Riemannianas
12.43 Definicao. Seja M uma variedade riemanniana. Dizemos que M e geodesicamente completa se
para todo p M as geodesicas radiais (t) partindo de p estao definidas para todo t R.
Equivalentemente, M e geodesicamente completa se para todo p M a aplicacao exponencial esta definida
em todo Tp M (Exerccio 12.55).
Lembramos que um espaco metrico e completo se toda sequencia de Cauchy e convergente.
12.44 Lema. Seja M uma variedade riemanniana conexa. Se expp esta definida em todo Tp M , entao
qualquer ponto q M pode ser ligado a p por um segmento geodesico tal que
` () = dist (p, q) .
Prova: Seja r = dist (p, q). Tome uma bola geodesica fechada B (p). Se q B (p), entao existe uma
geodesica radial minimizante ligando p a q e nao ha nada a provar. Se q / B (p), lembrando que a funcao
distancia e contnua e esferas geodesicas sao conjuntos compactos, seja x0 S (p) = B (p) onde a funcao
f (x) = dist (x, q)
atinge um mnimo em S (p). Seja (s) = expp (sV ) a geodesica radial unitaria ligando p a x0 . Por hipotese,
esta definida para todo t R. Para provar o lema, basta mostrar que
(r) = q.
Para provar isso, considere o conjunto nao vazio (pois 0 A)
A = {s [0, r] : dist ( (s) , q) = r s} .
A e fechado em [0, r] pela continuidade da funcao distancia e de . Se provarmos que para todo s0 A vale
s0 + A para todo > 0 suficientemente pequeno, isso implicara que A tambem e aberto no conjunto
conexo [0, r] e portanto A = [0, r]; em particular, r A, o que implica dist ( (r) , q) = r r = 0, o que e
equivalente a (r) = q.
Seja entao s0 A e considere uma bola geodesica fechada B ( (s0 )). Temos
r s0 = dist ( (s0 ) , q) = + min dist (y, q) = + dist (y0 , q)

yB ((s0 ))
onde y0 S ( (s0 )) = B ( (s0 )) e o ponto onde a funcao
g (y) = dist (y, q)
atinge um mnimo em S ( (s0 )). Para provar a afirmacao, basta entao mostrar que y0 = (s0 + ), pois
neste caso
r s0 = + dist ( (s0 + ) , q) ,
donde
dist ( (s0 + ) , q) = r (s0 + ) .
De fato, temos
dist (p, y0 ) > dist (p, q) dist (q, y0 ) = r [r (s0 + )] = s0 + .
Por outro lado, a curva quebrada que liga p a y0 constituida do segmento geodesico que vai de p a (s0 )
e do raio geodesico que vai de (s0 ) a y0 tem comprimento s0 + . Portanto,
dist (p, y0 ) = s0 +
e esta curva quebrada e uma geodesica (logo, nao e quebrada), donde y0 = (s0 + ), o que termina a
demonstracao.
12.45 Teorema (Teorema de Hopf-Rinow). Uma variedade riemanniana conexa e geodesicamente com-
pleta se e somente se ela e completa como um espaco metrico.
Prova:
1. M variedade riemanniana completa como espaco metrico = M variedade riemanniana geodesicamente
completa.
Suponha por absurdo que exista uma geodesica unitaria : [0, a) M que nao se estende a um
intervalo [0, a + ) para nenhum > 0. Seja {ti } uma sequencia crescente tal que ti a; em particular, {ti }
e uma sequencia de Cauchy. Seja qi = (ti ). Como e parametrizada por comprimento de arco, segue que
dist (qi , qj ) 6 |ti tj |
e (qi ) e uma sequencia de Cauchy em M . Logo qi q M . Seja V uma vizinhanca uniformemente normal
de q e > 0 tal que V esta contido em qualquer bola geodesica de raio centrada em um ponto de V .
Para j suficientemente grande temos qj V e tj > a . O fato que B (qj ) e uma bola geodesica implica
que toda geodesica partindo de qj existe por um intervalo de tempo pelo menos igual a . Em particular
isso vale para a geodesica satisfazendo (0) = qj e 0 (0) = 0 (tj ). Por unicidade de geodesica, esta e
e (t) = (t tj ) e uma extensao de alem de a,
uma reparametrizacao de , isto e, (t) = (t + tj ), logo
contradizendo a hipotese inicial.
2. M variedade riemanniana geodesicamente completa = M espaco metrico completo.
Para provar a recproca, demonstraremos um resultado mais forte:
Se existe p M tal que expp esta definida em todo Tp M , entao M e um espaco metrico completo.
Seja {qi } M uma sequencia de Cauchy. Para cada i, seja i (s) = expp (sVi ) a geodesica radial unitaria
que liga p a qi , e seja
di = dist (p, qi ) ,
de modo que pelo lema
qi = expp (di Vi ) .
Alem disso, {di } e uma sequencia de Cauchy em R, pois
|di dj | = |dist (p, qi ) dist (p, qj )| 6 dist (qi , qj ) .
Como sequencias de Cauchy sao limitadas, {di } e limitada; alem disso kVi k = 1 para todo i, logo {di Vi }
e limitada em Tp M . Portanto, uma subsequencia {dik Vik } converge para V Tp M . Por continuidade da
aplicacao exponencial,
qik = expp (dik Vik ) expp (V ) .
Como a sequencia original {qi } e de Cauchy, ela converge para o mesmo ponto para o qual sua subsequencia
converge.
Em particular, o conceito de variedade riemanniana geodesicamente completa e equivalente ao conceito de
variedade riemanniana completa como espaco metrico para variedades conexas e para estas podemos nos
referir simplesmente a uma variedade riemanniana completa, implicando ambos os conceitos.
12.46 Corolario. Toda variedade riemanniana compacta e geodesicamente completa.
Prova: Pois todo espaco metrico compacto e completo.

12.47 Corolario. Uma subvariedade fechada de uma variedade riemanniana completa e geodesicamente
completa na metrica induzida.
Prova: Pois todo subconjunto fechado de um espaco metrico e completo.
12.48 Corolario. Os conjuntos fechados e limitados de uma variedade riemanniana conexa sao compactos
se e somente se ela e geodesicamente completa.
Prova: Seja A M fechado e limitado. Como A e limitado, A esta contido em uma bola metrica B (p; r).
Pelo Lema 12.44, existe uma bola BR (0) Tp M tal que

B (p; r) expp BR (0) = BR (p).
A bola geodesica fechada BR (p) e compacta, pois e a imagem de um compacto pela aplicacao contnua expp .
Logo, A e um subconjunto fechado de um compacto, portanto e compacto.
Reciprocamente, a condicao de conjuntos fechados limitados serem compactos em um espaco metrico
implica que o espaco metrico e completo: sequencias de Cauchy sao limitadas, logo seu fecho e compacto e
portanto possuem uma subsequencia convergente, o que implica para sequencias de Cauchy que a sequencia
toda e convergente.
12.49 Corolario. Se M e uma variedade riemanniana conexa e existe p M tal que expp esta definida em
todo Tp M entao M e geodesicamente completa.
Prova: Segue da demonstracao do teorema de Hopf-Rinow.
12.50 Corolario. Se M e uma variedade riemanniana conexa completa, entao quaisquer dois pontos p, q
M podem ser ligados por um segmento geodesico tal que
` () = dist (p, q) .
Prova: Segue do teorema de Hopf-Rinow e do Lema 12.44.

A recproca nao e valida: todos os pontos de um aberto convexo U de Rn (uma variedade riemanniana na
metrica euclideana) podem ser ligados por segmentos de retas, mas se U e um subconjunto proprio de Rn
ele nao e uma variedade completa.
12.10 Apendice: Geodesicas atraves do Metodo Variacional

Excepcionalmente denotaremos a derivada de uma curva 0 (t) nesta secao por (t), para adotar uma notacao
consistente com a do Calculo de Variacoes.
12.51 Definicao. Seja M uma variedade diferenciavel. Considere o espaco C das curvas diferenciaveis em
M que satisfazem a condicao de fronteira (a) = p e (b) = q:
C = { : [a, b] M : e diferenciavel, (a) = p e (b) = q} .
O lagrangiano L de um problema variacional para C e uma funcao diferenciavel
L : T M R.
Associado ao lagrangiano L e o funcional acao S : C R definido por

Z b
S () = L ( (t) , (t)) dt.
a

No Calculo de Variacoes, procura-se encontrar um metodo para determinar curvas que minimizam o
funcional acao; isto e chamado o princpio da acao mnima.
12.52 Proposicao (Equacoes de Euler-Lagrange). Se uma curva C e um valor extremo do funcional

acao, entao a equacao de Euler-Lagrange

d L L
=
dt v i xi

i = 1, . . . , n, sao satisfeitas ao longo de em coordenadas locais x1 , . . . , xn , v 1 , . . . , v n para T M .
Prova: Vamos considerar primeiro o caso M = Rn para compreender melhor a ideia da demonstracao. Seja
: [a, b] Rn uma curva diferenciavel arbitraria satisfazendo (a) = (b) = 0 e considere a seguinte
variacao de
F (s, t) = (t) + s (t) .
Denotando
s (t) = F (s, t)
considere a funcao diferenciavel real f : (, ) R definida por
Z b
f (s) = S (s ) = L (s (t) , s (t)) dt.
a
Como e um extremo para S, segue que 0 e um extremo para f , de modo que
f 0 (0) = 0.
Temos, derivando sob o sinal de integracao e pela regra da cadeia,

Z b
dsi dsi

0 L L
f (s) = (s , s ) + i (s , s ) dt.
a xi ds v ds
Ja que
ds
= (t) ,
ds
ds
= (t) ,
ds
segue que
Z b
L L
f 0 (s) = (s , s ) i
+ (s , s ) i
dt.
a xi v i
Por outro lado, integrando por partes, temos
Z b b Z b Z b
L i L i d L i d L
(s , s ) dt = (s , s ) dt = (s , s ) i dt,
a v i v i a a dt v i a dt v i
de modo que
Z b
L d L
f 0 (s) = (s , s ) (s , s ) i dt.
a xi dt v i
Agora, f 0 (0) = 0 implica
Z b
L d L
(, ) (, ) i dt = 0
a xi dt v i
Como e arbitraria, segue que
L d L
(, ) (, ) =0
xi dt v i
para todo i.
Em uma variedade riemanniana (M, g) existem dois lagrangianos associados de forma natural:
L (p, v) = kvkp ,
2
E (p, v) = kvkp .
As acoes destes lagrangianos sao respectivamente o funcional comprimento e o funcional energia:

Z b
L () = k0 (t)kp dt,
a
Z b
2
E () = k0 (t)kp dt.
a
E mais facil trabalhar com o funcional energia, ja que o lagrangiano da energia nao apresenta problemas de
diferenciabilidade na origem. Alem disso, um mnimo para o funcional energia e um mnimo para o funcional
comprimento, pois a desigualdade de Cauchy-Schwartz implica que
!1/2 !1/2
b b b
Z Z Z
2 1/2
L () = 0
k (t)kp dt 6 k 0
(t)kp dt 1 dt = b aE () .
a a a
12.53 Proposicao. Geodesicas sao extremos do funcional energia.

Prova: Em coordenadas locais o lagrangiano da energia e
E x1 , . . . , xn , v 1 , . . . , v n = gij x1 , . . . , xn v i v j ,

e ao longo de uma curva (t) = x1 (t) , . . . , xn (t) ele e dado por
1
dxn dxi dxj

1 n dx
E x ,...,x , ,..., = gij x1 , . . . , xn .
dt dt dt dt
Logo,
E gij dxi dxj
= ,
xk xk dt dt
enquanto que
E dxi
k
= 2gik .
v dt
de modo que, pela regra da cadeia, segue que
gik dxj dxi d2 xi

d E
= 2 + gik
dt v k xj dt dt dt2
gik dxj dxi gik dxj dxi d2 xi
= + + 2gik
xj dt dt xj dt dt dt2
gik dxj dxi gjk dxi dxj d2 xi
= + + 2gik 2
xj dt dt xi dt dt dt
trocando i, j no segundo termo. Portanto, a equacao de Euler-Lagrange do funcional energia

d E E
=
dt v k xk
transforma-se na equacao
d2 xi gik dxj dxi gjk dxi dxj gij dxi dxj

2gik 2
+ j
+ i
= 0,
dt x dt dt x dt dt xk dt dt
ou seja,
d2 xi dxi dxj

gik gik gij
gik 2 + j
+ j
= 0.
dt x x xk dt dt
Multiplicando por g mk e somando em k, obtemos
d2 xi dxi dxj

gik gik gij
im 2 + j
+ j
k
g mk = 0,
dt x x x dt dt
que e exatamente a equacao geodesica
d2 xm dxi dxj
2
+ m
ij = 0.
dt dt dt
12.11 Exerccios
12.54 Exerccio. Mostre que as transformacoes de Mobius introduzidas no Exemplo 12.32 sao isometrias
do plano hiperbolico e complete os outros detalhes.
12.55 Exerccio. Mostre que M e geodesicamente completa se e somente se para todo p M a aplicacao
exponencial esta definida em todo Tp M.
Captulo 13
Curvatura
13.1 Mais sobre Tensores

Observe que o espaco vetorial real T (M ) = T1 (M ) = T10 (M ) dos campos diferenciaveis de uma variedade
diferenciavel M tambem pode ser considerado como um modulo sobre o anel C (M ). Pensando desta
forma, estamos considerando a estrutura linear de T (M ) quando tomamos as funcoes reais diferenciaveis em
M como escalares. Da mesma forma, o espaco vetorial real T 1 (M ) = T01 (M ) dos campos covetoriais e um
modulo sobre C (M ).
Um campo tensorial T Tlk (M ) entao induz naturalmente uma aplicacao multilinear sobre C (M )
T : T1 (M ) . . . T1 (M ) T 1 (M ) . . . T 1 (M ) C (M ) (13.1)
definindo
T X1 , . . . , Xk , 1 , . . . , l (p) = Tp X1 |p , . . . , Xk |p , 1 p , . . . , l p .

(13.2)
De fato, a funcao T (X1 , . . . , Xk , 1 , . . . , l ) C (M ) e T e claramente multilinear. Alem disso, pode-

se provar que toda aplicacao multilinear (13.1) sobre C (M ) e induzida por um campo tensorial em
Tlk (M ) (Exerccio 13.38). Em particular, observe que se a base coordenada associada para o espaco tensorial
Tlk (Tp M ) e n o
Bkl = dxi1 . . . dxik j1 | . . . j |

p p p p l p 16i1 ,...,ik 6n
16j1 ,...,jl 6n
para todo p V , de modo que nesta base coordenada o campo tensorial T se escreve na forma
Tp = Tij11,...,i
,...,jl
(p) dxi1 p . . . dxik p j1 |p . . . jl |p ,

k
entao se os campos vetoriais e covetoriais se escrevem localmente na forma
Xr |p = X ir (p) ir |p , r = 1, . . . , k,
s |p = js (p) dxjs p , s = 1, . . . , l,

temos
T X1 , . . . , Xk , 1 , . . . , l (p) = X i1 . . . X ik j1 . . . jl Tij11,...,i
,...,jl

k
(p) . (13.3)

Ou seja, o valor de T X1 , . . . , Xk , 1 , . . . , l em p depende apenas das componentes do campo tensorial
T em p e dos valores dos campos vetoriais e de 1-formas em p. Neste sentido, dizemos que tensores sao
puntuais. Contraste isso com uma conexao, que nao e um tensor porque ao inves da linearidade satisfaz a
regra do produto.
163
13.2 O Tensor Curvatura

Quando Riemann introduziu a nocao de metrica em variedades, ele precisava mostrar que elas nao eram
localmente isometricas ao espaco euclidiano. Para provar isso, ele introduziu a nocao de curvatura.
13.2.1 O Endomorfismo Curvatura

Para motivar a definicao de curvatura, considere Rn com a metrica ij
k
, k = 0, . . . , n, e campos vetoriais
X, Y, Z T (Rn ). Observe que
j j
X Y Z Y X Z = X (Y Z) Y (X Z)
xj xj

= X Y Zj Y X Zj

xj xj

= X Y Zj Y X Zj

xj

= (XY Y X) Z j
xj
= [X,Y ] Z.
Esta relacao e valida para qualquer variedade metrica localmente isometrica a Rn (Exerccio 13.39).
13.1 Definicao. Seja M uma variedade metrica. O endomorfismo curvatura de M e o campo tensorial
de ordem (3, 1)
R : T (M ) T (M ) T (M ) T (M )
definido por
R (X, Y ) Z = X Y Z Y X Z [X,Y ] Z. (13.4)

Observamos que alguns autores, tais como [Carmo], definem a curvatura com o sinal oposto, mas a maioria
define como acima. O fato de termos identificado R com um tensor do tipo (3, 1) segue da Proposicao 9.19
e pelo fato de R ser multilinear sobre C (M ), conforme e demonstrado na proposicao a seguir. Em outras
palavras, R e identificado com o campo tensorial
R : T1 (M ) T1 (M ) T1 (M ) T 1 (M ) R
definido por
R (X, Y, Z, ) = (R (X, Y ) Z) .
Uma motivacao extra para a definicao do tensor curvatura pode ser vista no apendice no final deste captulo.
13.2 Proposicao. R e multilinear sobre C (M ).

Prova: Temos, em relacao a segunda variavel,
R (X, Y1 + Y2 ) Z = X Y1 +Y2 Z Y1 +Y2 X Z [X,Y1 +Y2 ] Z

= X Y1 Z + X Y2 Z Y1 X Z Y 2 X Z
[X,Y1 ] Z [X,Y2 ] Z
= R (X, Y1 ) Z + R (X, Y2 ) Z
R (X, f Y ) Z = X f Y Z f Y X Z [X,f Y ] Z
= X (f Y Z) f Y X Z f [X,Y ]+(Xf )Y Z
= f X Y Z + (Xf ) Y Z f Y X Z f [X,Y ] Z (Xf ) Y Z

= f X Y Z Y X Z [X,Y ] Z
= f R (X, Y ) Z.
A linearidade em relacao a primeira variavel e imediatamente estabelecida uma vez que se observa que
R (X, Y ) Z = R (Y, X) Z. (13.5)
De fato,
R (Y, X) Z = Y X Z X Y Z [Y,X] Z
= X Y Z + Y X Z [X,Y ] Z
= X Y Z + Y X Z + [X,Y ] Z
= R (X, Y ) Z.
Para estabelecer a linearidade em relacao a terceira variavel, temos
R (X, Y ) (Z1 + Z2 ) = X Y (Z1 + Z2 ) Y X (Z1 + Z2 ) [X,Y ] (Z1 + Z2 )

= X Y Z1 Y X Z1 [X,Y ] Z1
+ X Y Z2 Y X Z2 [X,Y ] Z2
= R (X, Y ) Z1 + R (X, Y ) Z2
R (X, Y ) (f Z) = X Y (f Z) Y X (f Z) [X,Y ] (f Z)
= X (f Y Z) + X ((Y f ) Z) Y (f X Z) Y ((Xf ) Z)
f [X,Y ] Z [X, Y ] (f ) Z
= f X Y Z + (Xf ) Y Z + (Y f ) X (Z) + X (Y f ) Z
f Y X Z (Y f ) X Z (Xf ) Y Z Y (Xf ) Z
f [X,Y ] Z [X, Y ] (f ) Z
= f X Y Z f Y X Z + [X (Y f ) Y (Xf )] Z f [X,Y ] Z [X, Y ] (f ) Z
= f X Y Z f Y X Z f [X,Y ] Z + [Y, X] (f ) Z [X, Y ] (f ) Z

= f X Y Z Y X Z [X,Y ] Z
= f R (X, Y ) Z.
13.2.2 O Significado da Curvatura Nula

13.3 Proposicao. Em Rn ,
R = 0. (13.6)
Em particular, a derivada covariante comuta
i j = j i . (13.7)
Prova: Na introducao a esta secao vimos que R 0 para Rn (de fato, foi o que nos levou a definir R em
primeiro lugar; este resultado e trazido aqui apenas para referencia e enfase). Como [i , j ] = 0, segue que
i j Z = j i Z
para todo campo vetorial Z T (Rn ).

Assim, a curvatura mede tambem o quanto a derivada covariante deixa de comutar. De fato, o principal
papel do termo [i ,j ] e fazer com que a curvatura seja um tensor (veja o apendice deste captulo para mais
detalhes).
13.4 Teorema. Uma variedade metrica M n e localmente isometrica a Rn se e somente se R = 0.
Prova: Vamos mostrar que se R = 0 entao M e localmente isometrica a Rn , ja que a recproca e obvia (a
curvatura e um invariante isometrico local; Exerccio 13.39).
Dado p M , escolha uma base ortonormal
n o
E1 |p , . . . , En |p

para Tp M . Seja x1 , . . . , xn um sistema de coordenadas para uma vizinhanca de p tal que i |p = Ei |p para
todo i (por exemplo, um sistema de coordenadas normal).
Diminuindo a vizinhanca se necessario, podemos assumir que o domnio da parametrizacao e um pequeno
cubo
C = x Rn : xi < , i = 1, . . . , n .

Para cada i faca um transporte paralelo do vetor Ei |p ao longo de todas as imagens parametrizadas
dos eixos do cubo, cobrindo todos os pontos da vizinhanca parametrizada pelo cubo: por exemplo, co-
mece transportando paralelamente o vetor Ei |p ao longo da imagem parametrizada do eixo x1 ; entao, a
partir de cada ponto da imagem parametrizada do eixo x1 , transporte paralelamente ao longo da imagem
parametrizada do segmento paralelo ao eixo x2 ; entao, sucessivamente, transporte paralelamente ao longo
das imagens parametrizadas dos segmentos paralelos aos eixos x3 , . . . , xn . Deste modo, obtemos n campos
vetoriais ortonormais
E1 , . . . , En
definidos na vizinhanca parametrizada pelo cubo C . Estes campos vetoriais sao suaves pela aplicacao
sucessiva do teorema da dependencia suave das solucoes de EDOs nas condicoes iniciais, pois os campos Ei
sao as solucoes do sistema de EDOs
DEi
= 0.
dt
Afirmamos que os campos E1 , . . . , En sao paralelos em C . Para provar isso, basta provar que
i Ej = 0
para todos i, j.
Fixe j. Seja
M k = x C : xk+1 = . . . = xn = 0

a fatia k-dimensional do cubo correspondente a intersecao do plano k-dimensional x1 , . . . , xk , . . . , 0 com o
cubo C . Por construcao, 1 Ej = 0 em M 1 , 2 Ej = 0 em M 2 e, em geral, k Ej = 0 em M k .
Provaremos por inducao que
1 Ej = . . . = k Ej = 0 (13.8)
em M k para todo k; em particular, para k = n, obtemos a afirmacao.
Ja vimos que o caso k = 1 e valido. Assuma a validade de (13.8) para k. Em M k+1 temos k+1 Ej = 0
por construcao e
1 Ej = . . . = k Ej = 0
em M k por hipotese de inducao. Resta apenas mostrar que i Ej = 0 para i = 1, . . . , k no resto de M k+1 .
Para isso, como ja temos i Ej = 0 na fatia k-dimensional M k (a fatia que ocupa o centro de M k+1 ), basta
provar que
k+1 (i Ej ) = 0,
pois isso implicara que o campo i Ej continuara sendo nulo ao ser paralelamente transportado para o resto
de M k+1 . Mas, como R = 0, temos

i k+1 Ej k+1 (i Ej ) [i ,k+1 ] Ej = 0
ou seja, usando o fato que [i , k+1 ] = 0 e a hipotese de inducao,

k+1 (i Ej ) = i k+1 Ej = 0.
Isso conclui a demonstracao da afirmacao que os campos E1 , . . . , En sao paralelos em C .

Agora, pela simetria da conexao riemanniana temos
[Ei , Ej ] = Ei Ej Ej Ei .
Como os campos E1 , . . . , En sao paralelos em C , como acabamos de provar, segue que
Ei Ej = Ej Ei = 0,
donde
[Ei , Ej ] = 0

para todos i, j em C . Portanto, pelo Teorema 8.43, existem coordenadas y 1 , . . . , y n para uma vizinhanca
possivelmente menor de p, tais que

Ei = .
y i
Nestas coordenadas,
k
gij = i
, j = hEi , Ej i = ij ,
y y
logo a parametrizacao das coordenadas y i define uma isometria entre esta vizinhanca parametrizada de p e
um aberto de Rn .
Para a demonstracao original deste resultado para variedades riemannianas por Riemann, comentada e em
notacao moderna, veja [Spivak], Vol. II, pp. 179-204. Observe que a demonstracao acima mostra que se
pudermos encontrar campos E1 , . . . , En ortonormais e paralelos na variedade M , entao ela e localmente
isometrica a Rn . Consequentemente, tais campos em geral nao existem. Isso significa que o transporte
paralelo de vetores ao longo de curvas com extremidades coincidentes em geral da resultados diferentes
(como exemplo, considere o transporte paralelo de um vetor na esfera do polo norte ao polo sul, ao longo
de dois meridianos fazendo um angulo reto). Assim, o tensor curvatura mede a independencia de caminhos
do transporte paralelo (veja Teorema 13.37 no apendice a este captulo). Outra coisa importante que a
curvatura mede e o assim chamado desvio geodesico (veja Proposicao 13.35 no apendice a este captulo).
Este e a influencia da curvatura no transporte paralelo sao discutidos detalhadamente no apendice deste
captulo.
13.5 Proposicao. Vale
R (i , j ) k = i j j i k . (13.9)
Em particular, os componentes do tensor endomorfismo curvatura sao
l
ljk lik
Rijk = m l m l
jk im ik jm + . (13.10)
xi xj
Prova: A primeira afirmacao segue de [i , j ] = 0.
A segunda afirmacao segue da primeira por calculo direto, observando primeiramente que os componentes
do tensor R sao definidos da forma usual, usando a multilinearidade do tensor, por
l
R (X, Y ) Z = Rijk X iY j Z k , (13.11)
xl
de modo que
l
R (i , j ) k = Rijk . (13.12)
xl
Logo, lembrando que
i j = m
ij m ,
segue que
R (i , j ) k

= i j k j (i k )
= i m m

jk m j (ik m )
= i m m

jk m j (ik m )
mjk m
= m
jk i m + m m
ik j
m ik
m
xi xj
ljk lik
= m l
jk im l + l m l
ik jm l
j l
xi x
!
ljk lik
= m l m l
jk im ik jm + l .
xi xj

13.6 Proposicao (Simetrias do Tensor Endomorfismo Curvatura). O tensor endomorfismo curvatura
satisfaz as seguintes propriedades:
(a) R (X, Y ) Z = R (Y, X) Z.
(b) (identidade de Bianchi) R (X, Y ) Z + R (Y, Z) X + R (Z, X) Y = 0.
Em termos dos componentes do tensor endomorfismo curvatura, estas identidades sao respectivamente
equivalentes a
l l
(a) Rijk = Rjik .
l l l
(b) Rijk + Rjki + Rkij = 0.
Consequentemente,
l
Riik = 0.
Prova: A primeira propriedade segue diretamente da definicao, como ja vimos. A segunda propriedade
segue da simetria da conexao, aplicada duas vezes, e da identidade de Jacobi para o colchete de Lie:
R (X, Y ) Z + R (Y, Z) X + R (Z, X) Y

= X Y Z Y X Z [X,Y ] Z
+ Y Z X Z Y X [Y,Z] X
+ Z X Y X Z Y [Z,X] Y
= Y (Z X X Z) + Z (X Y Y X) + X (Y Z Z Y )
[X,Y ] Z [Y,Z] X [Z,X] Y
= Y [Z, X] + Z [X, Y ] + X [Y, Z] [X,Y ] Z [Y,Z] X [Z,X] Y

= Y [Z, X] [Z,X] Y + Z [X, Y ] [X,Y ] Z + X [Y, Z] [Y,Z] X
= [Y, [Z, X]] + [Z, [X, Y ]] + [X, [Y, Z]]
= 0,
A ultima propriedade e consequencia de (a).
13.2.3 Operacao de Subir ou Descer um Indice

Uma propriedade importante do produto interno e que ele permite converter vetores em covetores e vice-
versa. De fato, ela permite definir um isomorfismo entre os espacos T1 (M ) de campos vetoriais de M e
T 1 (M ) de campos covetoriais de M , chamado o isomorfismo musical. A escolha deste nome se refere aos
smbolos escolhidos para denotar o isomorfismo e seu inverso, conforme veremos na definicao a seguir.
13.7 Definicao. Seja M uma variedade metrica. Definimos o isomorfismo bemol

[
: T1 (M ) T 1 (M )
X 7 X[
que leva X no covetor X [ definido por
X [ (Y ) = g (X, Y ) = hX, Y i (13.13)
para todo Y . Seu inverso e o isomorfismo sustenido

]
: T 1 (M ) T1 (M )
7 ]
que leva o covetor no vetor ] definido por
g ] , Y = ] , Y = (Y )

(13.14)
para todo Y .
Em coordenadas,
X [ (Y ) = X i i , Y j j = gij X i Y j = gij X i dxj (Y ) ,

ou seja,
X [ = gij X i dxj . (13.15)
Escrevendo os componentes do covetor X [ em coordenadas na forma
X [ = Xj dxj , (13.16)
segue que
Xj = gij X i . (13.17)
Diz-se que o covetor X [ e obtido a partir do vetor X descendo um ndice. Por este motivo esta operacao e
denotada pelo smbolo bemol, porque em partituras musicais o smbolo bemol e usado para abaixar a altura
da nota musical que lhe segue. Ja no caso do isomorfismo inverso, escrevendo em coordenadas o vetor ] na
forma
] = i i , (13.18)
segue que
k k , j = (j ) ,

donde
j = gkj k .
Multiplicando pela matriz inversa g ij , como
g ij gjk k = g ij gjk k = ki k = i ,
segue que
n
X
i = g ij j . (13.19)
j=1
Diz-se que o vetor ] e obtido a partir do covetor subindo um ndice. Por este motivo esta operacao
e denotada pelo smbolo sustenido, porque em partituras musicais o smbolo sustenido e usado para subir a
altura da nota musical que lhe segue.
O vetor gradiente e definido a partir da operacao de subir um ndice:
13.8 Definicao. Seja M uma variedade metrica. Dada uma funcao f C (M ), definimos o campo
gradiente de f por
grad f = df ] .
Em outras palavras, o vetor gradiente e definido por
hgrad f, Y i = df (Y )
para todo Y .
Em coordenadas, como
f i
df = dx ,
xi
temos
f
grad f = g ij
j . (13.20)
xi
A operacao de subir ou descer um ndice pode ser aplicada a qualquer tensor:
13.9 Definicao. Seja M uma variedade metrica. Se T Tlk (M ), entao T [ Tl1 k+1
(M ) e o tensor definido
por

T [ X1 , . . . , Xk , Xk+1 , 1 , . . . , q1 , q+1 , . . . , l = T X1 , . . . , Xp , . . . , Xk , 1 , . . . , q1 , Xk+1
[
, q+1 , . . . , l

e T ] Tl+1
k1
(M ) e o tensor definido por
]
T ] X1 , . . . , Xp1 , Xp+1 , . . . , Xk , 1 , . . . , l , l+1 = T X1 , . . . , Xp1 , l+1 , Xp+1 , . . . , Xk , 1 , . . . , l .

Note que ao aplicar a operacao de subir ou descer um ndice de um tensor teremos que explicitar qual ndice
estamos subindo ou descendo. Em geral isto e feito em palavras, sem o uso de um smbolo especial. Em
coordenadas, descendo o ultimo ndice, as componentes do tensor resultante sao dadas por
j ...j [
i1 , . . . , ik , ik+1 , dxj1 , . . . , dxjl1

Ti11...ikl1
ik+1 = T
[
= T i1 , . . . , ik , dxj1 , . . . , dxjl1 , ik+1
= T i1 , . . . , ik , dxj1 , . . . , dxjl1 , gik+1 p dxp

= gik+1 p T i1 , . . . , ik , dxj1 , . . . , dxjl1 , dxp

j ...j p
= gik+1 p Ti11...ikl1 ,
que escrevemos para futura referencia

j ...j j ...j p
Ti11...ikl1 1
ik+1 = gik+1 p Ti1 ...ik
l1
. (13.21)
Subindo o ultimo ndice, as componentes do tensor resultante sao dadas por

j ...jl jl+1
= T ] i1 , . . . , ik1 , dxj1 , . . . , dxjl , dxjl+1

Ti11...ik1
]
= T i1 , . . . , ik1 , dxjl+1 , dxj1 , . . . , dxjl
= T i1 , . . . , ik1 , g jl+1 q q , dx1 , . . . , dxl

= g jl+1 q T i1 , . . . , ik1 , q , dx1 , . . . , dxl

= g jl+1 q Tij11...i
...jl
k1 q
,
que escrevemos para futura referencia

j ...j j
Ti11...ik1
l l+1
= g jl+1 q Tij11...i
...jl
k1 q
. (13.22)
Outra aplicacao importante do isomorfismo musical e estender a operacao de tomar o traco de tensores.
Enquanto que o traco de tensores elimina um ndice covariante e um ndice contravariante, o traco em relacao
a metrica definido a seguir elimina dois ndices covariantes.
13.10 Definicao. Seja M uma variedade metrica. Se T Tlk (M ), entao o traco de T em relacao a
metrica g e o tensor trg T Tlk2 (M ) definido por
trg T = tr T ] .

Em coordenadas, o traco de T em relacao a metrica g em relacao aos dois ultimos ndices, subindo o ultimo
ndice antes de tomar o traco, e dado por
j ...jl j1 ...jl i
(trg T )i11...ik2 = T ] i1 ...i i = g ij Tij11...i
...jl
k2 ij
.
k2
Por exemplo, se T T 2 (M ) e um tensor simetrico, de forma que nao importa qual ndice escolhemos subir,
entao trg T T 0 (M ) = C (M ) e a funcao definida por
i
trg T = T ] i
= g ij Tij .
13.11 Exemplo (Contracao do Tensor Metrica). Estamos agora em condicao de entender porque
denotamos a inversa da matriz metrica G = (gij ) por G1 = g ij , ou seja, porque
g ik gkj = ji .
De fato, como vimos acima,

g ik gkj = gji
e ]
gji = g ] ei , ej = g ei , ej = ej (ei ) = ji .

13.2.4 O Tensor Curvatura

13.12 Definicao. Seja M uma variedade metrica. O tensor curvatura de M e o campo tensorial covariante
de ordem 4
R : T (M ) T (M ) T (M ) T (M ) C (M )
definido por
R (X, Y, Z, W ) = hR (X, Y ) Z, W i .

Em outras palavras, o tensor curvatura e obtido atraves de descer o ndice do tensor endomorfismo curvatura.
Usaremos a mesma letra R para denotar os dois tensores; ficara claro dentro do contexto a qual tensor estamos
nos referindo. Enquanto que o tensor endomorfismo curvatura e dado localmente por
l
R = Rijk dxi dxj dxk l , (13.23)
o tensor curvatura e dado localmente por
R = Rijkl dxi dxj dxk dxl . (13.24)

13.13 Proposicao. As componentes do tensor curvatura sao

m
Rijkl = gml Rijk . (13.25)
Em particular,
l
Rijk = g ml Rijkm . (13.26)
Prova: Pois o tensor curvatura e obtido atraves do tensor endomorfismo curvatura pela operacao de descer
o seu unico ndice contravariante, enquanto que o tensor endomorfismo curvatura e obtido atraves do tensor
curvatura pela operacao inversa, isto e, subir o seu ultimo ndice. Tambem podemos provar diretamente: a
primeira identidade segue de
Rijkl = R (i , j , k , l ) = hR (i , j ) k , l i

m m
= Rijk m , l = Rijk hm , l i
m
= gml Rijk ,
enquanto que a segunda identidade segue de

p p p
g ml Rijkm = g ml gpm Rijk = gpm g ml Rijk = pl Rijk l
= Rijk .

Potencialmente, o tensor curvatura tem n4 componentes. A presenca de simetrias reduz bastante o
numero de componentes nao nulas e de componentes independentes:
13.14 Proposicao (Simetrias do Tensor Curvatura). O tensor curvatura satisfaz as seguintes propri-
edades:
(a) R (X, Y, Z, W ) = R (Y, X, Z, W ) .
(b) R (X, Y, Z, W ) = R (X, Y, W, Z) .
(c) R (X, Y, Z, W ) = R (Z, W, X, Y ) .
(d) (identidade de Bianchi) R (X, Y, Z, W ) + R (Y, Z, X, W ) + R (Z, X, Y, W ) = 0.
Em termos dos componentes do tensor curvatura, estas identidades sao respectivamente equivalentes a
(a) Rijkl = Rjikl .
(b) Rijkl = Rijlk .
(c) Rijkl = Rklij .
(d) Rijkl + Rjkil + Rkijl = 0.
Prova: (a) Segue imediatamente de
R (X, Y ) Z = R (Y, X) Z.
(b) Como
R (X, Y, Z + W, Z + W ) = R (X, Y, Z, Z) + R (X, Y, Z, W ) + R (X, Y, W, Z) + R (X, Y, W, W ) ,
a identidade segue se provarmos que

R (X, Y, Z, Z) = 0. (13.27)
A identidade (13.27) segue da compatibilidade da conexao com a metrica. De fato, temos
R (X, Y, Z, Z) = hR (X, Y ) Z, Zi

= hX Y Z, Zi hY X Z, Zi [X,Y ] Z, Z .
Da, pela compatibilidade da metrica,
hX Y Z, Zi = X hY Z, Zi hY Z, X Zi ,
hY X Z, Zi = Y hX Z, Zi hX Z, Y Zi ,

1
[X,Y ] Z, Z = [X, Y ] hZ.Zi .
2
Logo, novamente pela compatibilidade da metrica,
1
R (X, Y, Z, Z) = X hY Z, Zi Y hX Z, Zi [X, Y ] hZ.Zi
2
1 1 1
= X (Y hZ, Zi) Y (X hZ, Zi) [X, Y ] hZ.Zi
2 2 2
1
= [(XY Y X) hZ, Zi [X, Y ] hZ.Zi]
2
1
= [[X, Y ] hZ, Zi [X, Y ] hZ.Zi]
2
= 0.
(d) A identidade de Bianchi para o tensor curvatura segue da identidade de Bianchi para o tensor endomor-
fismo curvatura.
(c) Segue da identidade de Bianchi aplicadas as quatro permutacoes cclicas dos quatro vetores:
R (X, Y, Z, W ) + R (Y, Z, X, W ) + R (Z, X, Y, W ) = 0,

R (Y, Z, W, X) + R (Z, W, Y, X) + R (W, Y, Z, X) = 0,
R (Z, W, X, Y ) + R (W, X, Z, Y ) + R (X, Z, W, Y ) = 0,
R (W, X, Y, Z) + R (X, Y, W, Z) + R (Y, W, X, Z) = 0.
Somamos estas 4 identidades. Aplicando (a) cancelamos todos os termos das primeiras duas colunas ((1, 1)
cancela com (4, 2), (2, 1) cancela com (1, 2), (3, 1) cancela com (2, 2) e (4, 1) cancela com (3, 2)). Quanto aos
termos da ultima coluna, segue de (a) e (b) que
R (Z, X, Y, W ) = R (X, Z, W, Y ) ,
R (W, Y, Z, X) = R (Y, W, X, Z) ,
logo a soma das 4 identidades e
2R (Z, X, Y, W ) + 2R (W, Y, Z, X) = 0.
Da,
R (Z, X, Y, W ) = R (W, Y, Z, X) = R (Y, W, Z, X) .

13.15 Corolario. Vale
R (X, X, Z, W ) = R (X, Y, Z, Z) = 0.
Em termos dos componentes do tensor curvatura,
Riikl = Rijkk = 0. (13.28)
Alem disso, qualquer soma de tres componentes do tensor curvatura obtidos atraves da permutacao cclica
de tres ndices e igual a zero.
Prova: A validade das duas primeiras identidades foram vistas na demonstracao da proposicao; de qualquer
modo, Riikl = 0 segue da propriedade (a) e Rijkk = 0 segue da propriedade (b). A prova da ultima afirmacao
e deixada como exerccio (Exerccio 13.40).
13.16 Corolario. Se M e uma variedade metrica de dimensao 2, entao das 24 = 16 componentes do tensor
curvatura, existem 12 componentes nulas e apenas uma componente independente.
Prova: Pelo corolario temos
R1111 = R1112 = R1121 = R1122 = 0,

R2211 = R2212 = R2221 = R2222 = 0,
R1211 = R2111 = 0,
R1222 = R2122 = 0.
As componentes potencialmente nao nulas sao apenas R1212 , R1221 , R2112 , R2121 . E possvel escolher uma
dentre estas quatro e escrever as tres outras em funcao dela usando as relacoes de simetria. Por exemplo,
escolhendo R1212 , temos
R1221 = R1212 ,
R2112 = R1212 ,
R2121 = R2112 = R1212 .
Observe que a simetria da identidade de Bianchi nao desempenha nenhum papel, porque no caso n = 2,
como tambem no caso n = 3, ela e consequencia de (a)-(c). De fato, como no maximo 3 ndices sao diferentes
nestes casos, pelo menos um dos coeficientes na soma cclica (d) sera da forma Rijkk e portanto nulo, logo
ela se reduzira a uma ou duas das propriedades (a)-(c). Basta ver isso no caso k = l:
Rijkk + Rjkik + Rkijk = 0
e equivalente a (Rijkk = 0)
Rjkik + Rkijk = 0
ou seja,
Rjkik = Rkijk ,
que corresponde a aplicar (c) e depois (a).
As propriedades de simetria do endomorfismo curvatura reduzem um pouco o numero de componentes a
calcular, mas nao tanto quanto o tensor curvatura, ja que nao tem tantas simetrias. Pela Proposicao 13.6
temos imediatamente 8 componentes nulas
1 2 1 2
R111 = R111 = R112 = R112 = 0,
1 2 1 2
R221 = R221 = R222 = R222 = 0,
e da propriedade (a) apenas 4 componentes independentes:

l l
Rkii = Riki .
1 1 2 2
Basta entao calcular R121 , R212 , R121 , R212 , ja que
1 1
R211 = R121 ,
1 1
R122 = R212 ,
2 2
R211 = R121 ,
2 2
R122 = R212 .
13.17 Exemplo (Curvatura da Esfera). Considerando a esfera como uma superfcie de revolucao com
parametrizacao
(x, y, z) (, ) = (r sen cos , r sen sen , r cos ),
vimos no Exemplo 12.7 que
g11 = r2 ,
g12 = g21 = 0,
g22 = r2 sen2 ,
111 = 211 = 112 = 121 = 222 = 0,

cos
212 = 221 = ,
sen
122 = sen cos .
Primeiro calcularemos as componentes do tensor endomorfismo curvatura. Como observado antes, basta
1 1 2 2
calcular as 4 componentes independentes R121 , R212 , R121 , R212 . Para isso usamos a formula
l
ljk lik
Rijk = m l m l
jk im ik jm +
xi xj
ljk lik
= 1jk li1 1ik lj1 + 2jk li2 2ik lj2 + .
xi xj
Fazendo k = i, segue que
l
lji lii
Riji = 1ji li1 1ii lj1 + 2ji li2 2ii lj2 + .
xi xj
Veremos que ha apenas 2 componentes independentes nao nulas.
1 1
No caso l = 1, temos que calcular R121 e R212 . O unico smbolo de Christoffel 1ij nao nulo e 122 e
2ii = 0 para todo i, logo para i 6= j temos
1
1ji 1ii
Riji = 1ji 1i1 1ii 1j1 + 2ji 1i2 2ii 1j2 +
xi xj
1ii
= 2ji 1i2 .
xj
Da,
1 111
R121 = 221 112 =0

e
1 122
R212 = 212 122

cos ( sen cos )
= ( sen cos )
sen
2 2 2
= cos + cos sen
= sen2 .
2 2
No caso l = 2, temos que calcular R121 e R212 . Para i 6= j temos
l
2ji 2ii
Riji = 1ji 2i1 1ii 2j1 + 2ji 2i2 2ii 2j2 +
xi xj
2ji
= 2ji 2i2 1ii 2j1 + .
xi
Da,
2 221
R121 = 221 212 111 221 +

cos cos cos
= 0+
sen sen sen
2
cos sen cos2
2
= +
sen2 sen2
= 1
e
2 212
R212 = 212 222 122 211 + = 0.

Portanto,
1 1
R212 = R122 = sen2 ,
2 2
R121 = R211 = 1,
enquanto que as demais 12 componentes sao todas nulas.
Para calcular as 24 = 16 componentes do tensor curvatura da esfera, pelo Corolario 13.16 basta calcular
uma componente nao nula. Como
m 1 2
Rijkl = gml Rijk = g1l Rijk + g2l Rijk
segue que
1 2
R1212 = g12 R121 + g22 R121 = r2 sen2 .
Portanto, as 4 componentes nao nulas do tensor curvatura da esfera sao
R1212 = r2 sen2 ,
R1221 = R1212 = r2 sen2 ,
R2112 = R1212 = r2 sen2 ,
R2121 = R1212 = r2 sen2 .

13.18 Exemplo (Curvatura do Plano Hiperbolico). Como vimos no Exemplo 12.9, temos
1
g11 = g22 = ,
y2
g12 = g21 = 0,
e
111 = 122 = 212 = 221 = 0,
1
211 = ,
y
1
112 = 121 = 222 = .
y
Primeiro calcularemos as componentes do tensor endomorfismo curvatura:
l
lji lii
Riji = 1ji li1 1ii lj1 + 2ji li2 2ii lj2 + .
xi xj
No caso l = 1, para i 6= j,
1
1ji 1ii
Riji = 1ji 1i1 1ii 1j1 + 2ji 1i2 2ii 1j2 + i

x xj
1ji
= 1ji 1i1 2ii 1j2 + .
xi
Da
1 121
R121 = 121 111 211 122 + =0
x
e
1 112
R212 = 112 121 222 112 +
y
1 1 1 1
= 2 + 2 = 2.
y2 y y y
No caso l = 2, para i 6= j,
1
2ji 2ii
Riji = 1ji 2i1 1ii 2j1 + 2ji 2i2 2ii 2j2 + i

x xj
2
ii
= 1ji 2i1 1ii 2j1 + 2ji 2i2 2ii 2j2 .
xj
Da,
2 211
R121 = 121 211 111 221 + 221 212 211 222
y
1 1 1
= +00+ 2 + 2
y2 y y
1
=
y2
e
2 222
R212 = 112 221 122 211 + 212 222 222 212 = 0.
x
Portanto,
1 1 2 2 1
R122 = R212 = R121 = R211 =
y2
e as demais 12 componentes sao todas nulas.
Para calcular as componentes do tensor curvatura do plano hiperbolico, basta calcular a componente nao
nula
1 2 1
R1212 = g12 R121 + g22 R121 = 4.
y
Portanto, as 4 componentes nao nulas do tensor curvatura do plano hiperbolico sao

1
R1212 = ,
y4
1
R1221 = R1212 = ,
y4
1
R2112 = R1212 = 4 ,
y
1
R2121 = R1212 = 4 .
y

13.19 Corolario. Se M e uma variedade metrica de dimensao n, entao das n4 componentes do tensor
curvatura, existem
n2 n2 1
(13.29)
12
componentes independentes.
Prova: Pela Proposicao 13.14 (c), temos
Rijkl = Rklij .
Portanto, denotando
p = ij, q = kl,
podemos considerar R como uma matriz simetrica
Rpq = Rqp ,
cada ndice p, q compreendendo uma matriz antisimetrica, pois pela Proposicao 13.14 (a), (b), temos
Rjikl = Rijkl ,
Rijlk = Rijkl .
A dimensao do subespaco das matrizes simetricas n n, ou seja, o numero de componentes independentes
de uma matriz simetrica n n, e
n (n + 1)
,
2
enquanto que a dimensao do subespaco das matrizes antisimetricas n n, isto e, o numero de componentes
independentes de uma matriz antisimetrica n n, e
n (n 1)
.
2
Portanto, Rpq vista como uma matriz simetrica tem m (m + 1) /2 componentes independentes com m =
n (n 1) /2 componentes independentes. Logo, sem levar em conta a simetria da identidade de Bianchi
temos
n (n 1) n (n 1)
+1 2
2 2 n2 (n 1) + 2n (n 1) n4 2n3 + 3n2 2n
= = .
2 8 8
componentes independentes. A identidade de Bianchi nao desempenha um papel para n = 2 e n = 3, como
vimos no fim da demonstracao do Corolario 13.16, e note que

n4 2n3 + 3n2 2n n2 n2 1

= = 1,
8 12

n=2

n=2

n4 2n3 + 3n2 2n n2 n2 1

= = 6.
8 12

n=3

n=3
A partir de n > 4, identidade de Bianchi reduz o numero de componentes independentes. Para ver isso de
forma concreta no caso n = 4, primeiro observe que seguindo o raciocnio acima restam apenas

n2 n2 1
= 21
12

n=3
componentes independentes, que sao exatamente as componentes da parte triangular superior ou inferior da
matriz
kl
12 13 14 23 24 34
ij
12 R1212 R1213 R1214 R1223 R1224 R1234
13 R1312 R1313 R1314 R1323 R1324 R1334
14 R1412 R1413 R1414 R1423 R1424 R1434
23 R2312 R2313 R2314 R2323 R2324 R2334
24 R2412 R2413 R2414 R2423 R2424 R2434
34 R3412 R3413 R3414 R3423 R3424 R3434
No caso n = 4 a identidade de Bianchi desempenha um papel, reduzindo de 21 para 20 o numero de
componentes independentes. De fato, como visto no final da demonstracao do Corolario 13.16, qualquer nova
condicao deve envolver 4 ndices distintos. As componentes com 4 ndices diferentes ocupam a antidiagonal
da matriz acima, logo so ha 3 componentes independentes com 4 ndices diferentes; por exemplo, na parte
triangular superior da matriz acima estas componentes sao: R1234 , R1423 = R2314 e R1324 = R3124 . A
identidade de Bianchi
R1234 + R2314 + R3124 = 0
permite escrever
R1234 = R2314 R3124 ,
o que elimina R1234 como componente independente.
No caso geral, a identidade de Bianchi elimina n4 componentes independentes, ja que este e o numero
de modos que podemos escolher 4 ndices diferentes dentre n ndices e a identidade de Bianchi elimina um
destes (no caso n = 5, a identidade de Bianchi eliminara R1234 , R1345 , R1245 , R1235 , R2345 como componentes
independentes). Portanto, o numero total final de componentes independentes e
n4 2n3 + 3n2 2n n4 2n3 + 3n2 2n

n n!
=
8 4 8 (n 4)!4!
n4 2n3 + 3n2 2n n (n 1) (n 2) (n 3)
=
8 24
3n 6n + 9n 6n n4 6n3 + 11n2 6n
4 3 2
=
24
2n4 2n2
=
24
n2 n2 1
= .
12

Assim, existem 6 componentes independentes para o tensor curvatura de variedades de dimensao 3 dentre
34 = 81 componentes, e 20 componentes independentes para o tensor curvatura de variedades de dimensao
4 dentre 44 = 256 componentes, como as que sao estudadas em relatividade geral.
13.3 Curvatura de Ricci e Curvatura Escalar

Porque 4-tensores sao tao complexos, como vimos na secao anterior, e frequentemente util construir tensores
mais simples que resumem alguma informacao contida no tensor curvatura. Obviamente, ao simplificar o
tensor curvatura estamos perdendo informacao: os tensores mais simples contem menos informacao que o
tensor original. O mais importante dentre estes tensores e o tensor de Ricci.
13.20 Definicao. Seja M uma variedade metrica. O tensor curvatura de Ricci de M (ou simplesmente
tensor de Ricci) denotado Ric, e o campo tensorial covariante de ordem 2 definido como o traco do tensor
endomorfismo curvatura em relacao ao seu primeiro ndice covariante e seu unico ndice contravariante ou,
equivalentemente, como o traco em relacao a metrica do tensor curvatura no seu primeiro e ultimo ndices.
Portanto, os componentes da curvatura de Ricci sao dados por
k
Rij = Rkij = g km Rkijm . (13.30)

Pelas simetrias do tensor endomorfismo curvatura, usar tracos diferentes nao faria diferenca ou apenas
implicaria em uma troca de sinal:
n
X n
X n
X
k k k
Rij = Rkij = Rikj = Rijk .
k=1 k=1 k=1
13.21 Proposicao. A curvatura de Ricci e um campo tensorial simetrico, isto e,
Rij = Rji . (13.31)
Prova: Temos
Rij = g km Rkijm = g km Rjmki = g mk Rmjik = Rji .

O segundo tensor e a curvatura escalar, que e uma funcao real.
13.22 Definicao. Seja M uma variedade metrica. A curvatura escalar de M , denotada S, e a funcao
real S : M R definida como o traco em relacao a metrica do tensor de Ricci:
S = trg Ric = g ij Rij . (13.32)

13.23 Exemplo (Curvatura de Ricci e Curvatura Escalar da Esfera). Para variedades metricas de
dimensao 2 a curvatura de Ricci e
k 1 2
Rij = Rkij = R1ij + R2ij .
Referindo aos calculos efetuados no Exemplo 13.17, segue que a curvatura de Ricci da esfera e
1 2
R11 = R111 + R211 = 1,
1 2
R12 = R21 = R112 + R212 = 0,
1 2
R22 = R122 + R222 = sen2 .
Para variedades riemannianas de dimensao 2 a curvatura escalar e
S = g ij Rij = g 11 R11 + 2g 12 R12 + g 22 R22 .
Logo, a curvatura escalar da esfera de raio r e
1 sen2 2
S= + = 2.
r2 r2 sen2 r
Ou seja, a curvatura escalar da esfera tende a 0 (curvatura escalar do plano euclideano) quando r .
13.24 Exemplo (Curvatura de Ricci e Curvatura Escalar do Plano Hiperbolico). Referindo aos
calculos efetuados no Exemplo 13.18, segue que
1 2 1
R11 = R111 + R211 = ,
y2
1 2
R12 = R21 = R112 + R212 = 0,
1 2 1
R22 = R122 + R222 = 2.
y
Logo, a curvatura escalar do plano hiperbolico e

2 1 2 1
S = y 2 + y 2 = 2.
y y

Como o tensor metrica e a curvatura de Ricci sao ambos tensores 2-covariantes simetricos, e natural se
perguntar se existe uma relacao mais direta entre eles.
13.25 Definicao. Uma variedade metrica M e chamada uma variedade de Einstein se existe uma funcao
f : M R tal que
Ric = f g. (13.33)
Neste caso, dizemos tambem que g e uma metrica de Einstein.
Pela Proposicao 13.32, variedades de curvatura seccional constante (esta nocao de curvatura sera definida
na proxima secao) sao variedades de Einstein. Observe que como
S = trg Ric = f trg g = nf,
pois
trg g = g jk gjk = g jk gkj = jj = n,
segue que
S
f= .
n
Logo,
13.26 Proposicao. M e uma variedade de Einstein se e somente se
S
Ric = g. (13.34)
n
O nome variedades de Einstein vem da equacao de Einstein (em unidades geometrizadas G = c = 1) que
como deduziremos mais tarde e
1
Ric Sg + g = 8T,
2
onde T e um 2-tensor simetrico (o tensor de momento-energia) que descreve a densidade e fluxo do momento
e energia presentes em cada ponto do espaco-tempo e e a constante cosmologica. No vacuo, T = 0 e a
equacao de Einstein se torna
1
Ric Sg + g = 0
2
(e assim, a constante cosmologica mede a densidade de energia do vacuo). Tomando o traco desta equacao
com respeito a metrica, como trg Ric = S e trg g = n = 4 para o espaco-tempo 4-dimensional, segue que
S 2S + 4 = 0
ou seja,
S = 4
(curvatura escalar do vacuo). Segue que a equacao de Einstein para o vacuo e
Ric = g,
ou seja, a metrica do vacuo e uma metrica de Einstein no sentido da Definicao 13.33. Vale a pena observar
que Einstein considerou como o seu maior erro a introducao da constante cosmologica na sua equacao da
relatividade geral. Ele a introduziu para poder produzir um universo estatico; quando Hubble observou a
expansao do universo atraves do afastamento mutuo das galaxias, Einstein removeu a constante cosmologica
da sua equacao (o que equivale efetivamente a considerar = 0). Quando no final da decada de 90 foi
observada a aceleracao da expansao do universo, ela foi reintroduzida, com valor positivo a ser determinado
atraves de experimentos (correntemente, o valor e bem proximo de zero).
Matematicamente, o interesse em metricas de Einstein provem de um resultado provado por Hilbert:
metricas de Einstein sao pontos crticos para o funcional curvatura escalar
Z
S (g) = S dV
M
no espaco de todas as metricas de M com volume constante.
13.4 Curvatura Seccional

13.27 Definicao. Dado um espaco vetorial real V com produto interno h, i e vetores v, w V linearmente
independentes, a area do paralelogramo determinado por v, w e
q
2 2 2
|v w| = kvk kwk hv, wi . (13.35)

13.28 Proposicao. v, w V sao linearmente independentes se e somente se
|v w| =
6 0.
Prova: Mostraremos que |v w| = 0 se e somente se v e w sao linearmente dependentes. Se w = v, entao

q q
2 2 2 4 2
|v w| = kvk kvk hv, vi = kvk hv, vi = 0.
Reciprocamente, se |v w| = 0 implica que vale a igualdade na desigualdade de Cauchy-Shwarz:
hv, wi = kvk kwk .
Assuma w 6= 0, caso contrario v e w sao automaticamente linearmente dependentes e nao ha nada que precise
ser provado. Considere o vetor
hv, wi
z=v 2 w.
kwk
Temos
* +
2 hv, wi hv, wi
kzk = hz, zi = v 2 w, v 2 w
kwk kwk
* + * + * +
hv, wi hv, wi hv, wi hv, wi
= hv, vi v, 2 w 2 w, v + 2 w, 2 w
kwk kwk kwk kwk
2 2 2 2
2 hv, wi hv, wi hv, wi kwk
= kvk 2 2 + 4
kwk kwk kwk
2 2 2 2
= kvk kvk kvk + kvk
= 0.
logo
hv, wi
v= 2 w.
kwk

13.29 Definicao. Seja M uma variedade metrica e um plano de Tp M . A curvatura seccional de M
associada a e definida por
R (X, Y, Y, X) R (X, Y, Y, X)
K (X, Y ) = 2 = 2 2 2. (13.36)
|X Y | kXk kY k hX, Y i
onde X, Y Tp M sao quaisquer vetores que formam uma base para .

A curvatura seccional esta bem definida, isto e, independe da base escolhida para o plano . De fato, sejam
{X, Y } e {Z, W } duas bases para , de modo que existe uma matriz invertvel A = (aij )22 tal que
X = a11 Z + a21 W,
Y = a12 Z + a22 W.
Temos, usando as simetrias do tensor curvatura (em primeiro lugar, o fato que R (Z, Z, , ) = R (W, W, , ) =
R (, , Z, Z) = R (, , W, W ) = 0),
R (X, Y, Y, X) = R (a11 Z + a21 W, a12 Z + a22 W, a12 Z + a22 W, a11 Z + a21 W )

= R (a11 Z, a22 W, a22 W, a11 Z)
+ R (a11 Z, a22 W, a12 Z, a21 W )
+ R (a21 W, a12 Z, a12 Z, a21 W )
+ R (a21 W, a12 Z, a22 W, a11 Z)
= a211 a212 R (Z, W, W, Z) + a11 a21 a12 a22 R (Z, W, Z, W )
+ a221 a222 R (W, Z, Z, W ) + a11 a21 a12 a22 R (W, Z, W, Z)
= a211 a222 2a11 a12 a21 a22 + a212 a221 R (Z, W, W, Z)

2
= (det A) R (Z, W, W, Z) ,
|X Y |
2 2 2
= kXk kY k hX, Y i
2 2 2
= ka11 Z + a21 W k ka12 Z + a22 W k ha11 Z + a21 W, a12 Z + a22 W i

2 2 2 2
= a211 kZk + 2a11 a21 hZ, W i + a221 kW k a212 kZk + 2a12 a22 hZ, W i + a222 kW k
h i2
2 2
a11 a12 kZk + (a11 a22 + a21 a12 ) hZ, W i + a21 a22 kW k
4 2 4 2 2
= a211 a212 kZk + 4 (a11 a21 a12 a22 ) hZ, W i + a221 a222 kW k + a211 a222 + a221 a212 kZk kW k

2 2
+ 2 a211 a12 a22 + a212 a11 a21 kZk hZ, W i + 2 a221 a12 a22 + a222 a11 a21 kW k hZ, W i

4 2 4 2 2
a211 a212 kZk a211 a222 + 2a11 a12 a21 a22 + a212 a221 hZ, W i a221 a222 kW k 2 (a11 a12 a21 a22 ) kZk kW k

2 2
2 a211 a12 a22 + a212 a11 a21 kZk hZ, W i 2 a221 a12 a22 + a222 a11 a21 kW k hZ, W i

h i
2 2 2
= a211 a222 2a11 a12 a21 a22 + a212 a221 kZk kW k hZ, W i

2
= (det A) |Z W | .
Logo,
R (X, Y, Y, X) R (Z, W, W, Z)
= .
|X Y | |Z W |
O conhecimento da curvatura seccional para todos os planos determina o tensor curvatura:
13.30 Proposicao. Se R1 e R2 sao dois tensores covariantes de ordem 4 em um espaco vetorial V que
satisfazem as propriedades de simetria listadas na Proposicao 13.14 tais que
K1 (X, Y ) = K2 (X, Y )
para todos vetores linearmente independentes X, Y V , entao
R1 = R2 .
Prova: Por hipotese, para quaisquer vetores X, Y V ,
R1 (X, Y, Y, X) = R2 (X, Y, Y, X) (13.37)
(segue diretamente da definicao no caso em que X, Y sao linearmente independentes; se X, Y sao linearmente
dependentes, um e multiplo escalar do outro e a identidade e trivial, ja que cada lado e igual a zero pelas
propriedades de simetria). Da,
R1 (X + Z, Y, Y, X + Z) = R2 (X + Z, Y, Y, X + Z) . (13.38)
Como
R1 (X + W, Y, Y, X + W ) = R1 (X, Y, Y, X) + R1 (X, Y, Y, W )
+ R1 (W, Y, Y, X) + R1 (W, Y, Y, W )
= R1 (X, Y, Y, X) + 2R1 (X, Y, Y, W ) + R1 (W, Y, Y, W )
e analogamente para R2 (X + W, Y, Y, X + W ), conclumos que
R1 (X, Y, Y, W ) = R2 (X, Y, Y, W ) . (13.39)

Desta identidade segue que
R1 (X, Y + Z, Y + Z, W ) = R2 (X, Y + Z, Y + Z, W ) . (13.40)
Como
R1 (X, Y + Z, Y + Z, W ) = R1 (X, Y, Y, W ) + R1 (X, Y, Z, W )

+ R1 (X, Z, Y, W ) + R1 (X, Z, Z, W )
e analogamente para R2 (X, Y + Z, Y + Z, W ), segue que
R1 (X, Y, Z, W ) + R1 (X, Z, Y, W ) = R2 (X, Y, Z, W ) + R2 (X, Z, Y, W ) . (13.41)
Defina agora
R = R1 R2 . (13.42)
Entao R e um 4-tensor covariante que satisfaz as mesmas propriedades que R1 , R2 satisfazem. A identidade
(13.41) implica que
R (X, Y, Z, W ) + R (X, Z, Y, W ) = 0.
Portanto, R e antisimetrico com relacao a qualquer par adjacente de ndices: a relacao acima prova a
antisimetricidade de R para o par adjacente interno e das regras de simetria da Proposicao 13.14 obtemos a
antisimetricidade em relacao aos pares adjacentes esquerdo e direito. Da
R (Y, Z, X, W ) = R (Y, X, Z, W ) = R (X, Y, Z, W ) ,

R (Z, X, Y, W ) = R (X, Z, Y, W ) = R (X, Y, Z, W ) .
Da identidade de Bianchi
R (X, Y, Z, W ) + R (Y, Z, X, W ) + R (Z, X, Y, W ) = 0
conclumos entao que

3R (X, Y, Z, W ) = 0
para todos os vetores X, Z, Y, W , o que implica que R e o tensor nulo e portanto R1 = R2 .
Usando a curvatura seccional, pode-se dar interpretacoes geometricas para as curvaturas de Ricci e
escalar. Seja X um vetor unitario em Tp M e complete ele ate uma base ortonormal {X, E2 , . . . , En } de
Tp M . Entao
n
X n
X
Ric (X, X) = R11 = g km Rk11m = km R (X, Ek , Em , X) = R (X, Ek , Ek , X) = R (X, Ek , Ek , X)
k=1 k=2
n
X R (X, Ek , Ek , X)
= ,
|X Ek |
k=2
ou seja,
n
X
Ric (X, X) = K (X, Ek ) . (13.43)
k=2
Em outras palavras, para cada vetor unitario X Tp M , Ric (X, X) e a soma das curvaturas seccionais de
planos gerados por X e os outros vetores de uma base ortonormal. Por outro lado, como Ric e bilinear e
simetrico, ele e completamente determinado pelos seus valores Ric (X, X) em vetores unitarios X: se X, Y
sao vetores tais que X + Y, X Y 6= 0,
1
Ric (X, Y ) = (Ric (X + Y, X + Y ) Ric (X Y, X Y ))
4
1 2 X +Y X +Y 2 X Y X Y
= kX + Y k Ric , kX Y k Ric ,
4 kX + Y k kX + Y k kX Y k kX Y k
" n n
#
1 2
X 2
X
= kX + Y k K (X + Y, Ek ) kX Y k K (X Y, Fk ) ,
4
k=2 k=2
onde {X, E2 , . . . , En } , {X, F2 , . . . , Fn } sao bases ortonormais de Tp M ; se X + Y = 0 ou X Y = 0, o

resultado continua valendo, ja que o termo correspondente e nulo.

X Y
Ric (X, Y ) = kXk kY k Ric , .
kXk kY k
Similarmente, se {E1 , . . . , En } e uma base ortonormal para Tp M , entao a curvatura escalar e dada por
n
X
S = g ij Rij = ij Rij = Rii = Ric (Ei , Ei ) ,
i=1
ou seja, X
S= K (Ei , Ej ) . (13.44)
i6=j
Em outras palavras, a curvatura escalar e a soma de todas as curvaturas seccionais de planos gerados por
pares de vetores de uma base ortonormal.
13.31 Exemplo (Curvaturas de Variedades de Dimensao 2). No caso de variedades de dimensao 2
existe apenas um plano em Tp M : o proprio. Para estas variedades, a curvatura seccional pode ser considerada
uma funcao K : M R. Alem disso, se {E1 , E2 } e uma base ortonormal para Tp M , segue da discussao
anterior que
S (p) = 2K (E1 , E2 ) = 2K (p) ,
ou seja, para variedades riemannianas de dimensao 2 a curvatura seccional e essencialmente a curvatura
escalar:
S = 2K. (13.45)
Alem disso, temos
R (X, Y, Z, W ) = K (p) [hX, W i hY, Zi hX, Zi hY, W i] (13.46)
De fato, o unico componente independente de R e
R1221 = R (E1 , E2 , E2 , E1 ) = K (E1 , E2 ) = K (p) ,
enquanto que os componentes nao nulos sao dados por
R1212 = R1221 = K (p) ,

R2112 = R1212 = R1221 = K (p) ,
R2121 = R1221 = K (p) .
Como a equacao acima define um tensor 4-covariante de ordem 4 que tem as mesmas componentes que R,
ele e R. Segue que
Ric (X, Y ) = K (p) g (X, Y ) , (13.47)
pois
" n n
#
1 2
X 2
X
Ric (X, Y ) = kX + Y k K (X + Y, Ek ) kX Y k K (X Y, Fk )
4
k=2 k=2
1h 2 2
i
= kX + Y k K (X + Y, E2 ) kX Y k K (X Y, F2 )
4
1h 2 2
i
= K (p) kX + Y k kX Y k
4
= K (p) g (X, Y ) .
Em particular, toda variedade de dimensao 2 e uma variedade de Einstein:
S
Ric = g. (13.48)
2
13.5 Variedades Riemannianas de Curvatura Seccional Constante

Variedades riemannianas que possuem curvatura seccional constante desempenham papel fundamental em
Geometria Riemanniana. Algumas das mais importantes sao os espacos modelo.
13.32 Proposicao. Seja M uma variedade riemanniana com curvatura seccional constante K0 R. Entao
as curvaturas de M sao dadas pelas formulas
R (X, Y ) Z = K0 [hY, Zi X hX, Zi Y ] . (13.49)
R (X, Y, Z, W ) = K0 [hX, W i hY, Zi hX, Zi hY, W i] . (13.50)
Ric = (n 1) K0 g. (13.51)
S = n (n 1) K0 . (13.52)
Reciprocamente, se (13.49) ou (13.50) valem, entao a curvatura seccional e constante.
Em particular, variedades com curvatura seccional constante sao variedades de Einstein.
Prova: Para provar (13.50) defina um 4-tensor covariante R
e em M por
e (X, Y, Z, W ) = K0 [hX, W i hY, Zi hX, Zi hY, W i] .

R (13.53)
Entao R
e satisfaz todas as propriedades de simetria da Proposicao 13.14. De fato,
e (Y, X, Z, W ) = K0 [hY, W i hX, Zi hY, Zi hX, W i]
R
= K0 [hX, W i hY, Zi hX, Zi hY, W i]
=Re (X, Y, Z, W ) ,
e (X, Y, W, Z) = K0 [hX, Zi hY, W i hX, W i hY, Zi]

R
=Re (X, Y, Z, W ) ,
e (Z, W, X, Y ) = K0 [hZ, Y i hW, Xi hZ, Xi hW, Y i]

R
=Re (X, Y, Z, W )
R
e (X, Y, Z, W ) + R
e (Y, Z, X, W ) + R
e (Z, X, Y, W )
= K0 [hX, W i hY, Zi hX, Zi hY, W i + hY, W i hZ, Xi hY, Xi hZ, W i + hZ, W i hX, Y i hZ, Y i hX, W i]
= 0.
Como
R
e (X, Y, Y, X) K0 [hX, Xi hY, Y i hX, Y i hX, Y i]
K
e (X, Y ) =
2 2 2 = 2 2 2 = K0 , (13.54)
kXk kY k hX, Y i kXk kY k hX, Y i
segue da Proposicao 13.30 que R = R e e a recproca segue entao de (13.54).
(13.49) e equivalente a (13.50): claramente (13.50) segue de (13.49) pela definicao da curvatura a partir
do endomorfismo curvatura; reciprocamente, se (13.50) vale, entao
hR (X, Y ) Z, W i = R (X, Y, Z, W ) = K0 [hX, W i hY, Zi hX, Zi hY, W i] ,
para todo vetor W e como tambem
hK0 [hY, Zi X hX, Zi Y ] , W i = K0 [hX, W i hY, Zi hX, Zi hY, W i]
para todo vetor W , segue que
R (X, Y ) Z = K0 [hY, Zi X hX, Zi Y ] .
Se X, Y sao vetores nao nulos, como vimos na discussao no final da secao anterior, temos
" n n
#
1 2
X 2
X
Ric (X, Y ) = kX + Y k K (X + Y, Ek ) kX Y k K (X Y, Fk )
4
k=2 k=2
1h 2 2
i
= kX + Y k (n 1) K0 kX Y k (n 1) K0
4
1h 2 2
i
= (n 1) K0 kX + Y k kX Y k
4
= (n 1) K0 hX, Y i ;
se um dos vetores e nulo, o resultado vale trivialmente. Alem disso,

X
K (Ei , Ej ) = n2 n K0 = n (n 1) K0 .

S=
i6=j

13.33 Corolario. Seja M uma variedade riemanniana. Para cada ponto p M escolha uma base ortonor-
mal {E1 , E2 , . . . , En } de Tp M e defina
Rijkl = R (Ei , Ej , Ek , El ) .
Entao M possui curvatura seccional constante K0 se e somente se
Rijji = Rijij = K0 para todo i 6= j e

Rijkl = 0 nos outros casos,
para todo p M .
Prova: Pela proposicao, M possui curvatura seccional constante K0 se e somente se
R (X, Y, Z, W ) = K0 [hX, W i hY, Zi hX, Zi hY, W i] .
Como um tensor e determinado pelos seu valores em uma base, esta equacao e valida se e somente se
R (Ei , Ej , Ek , El ) = K0 [hEi , El i hEj , Ek i hEi , Ek i hEj , El i]

= K0 (il jk ik jl )

1 se i = l e j = k e i 6= j
= 1 se i = k e j = l e i 6= j .
0 caso contrario.

Vemos que em uma variedade riemanniana de curvatura seccional constante o tensor curvatura pode ser
expresso diretamente em funcao da metrica.
13.6 Apendice: Motivacao para a definicao do tensor curvatura

13.6.1 Efeitos de Mare em Mecanica Newtoniana
Primeiro, analizaremos os efeitos de mare do ponto de vista Newtoniano. Considere uma famlia de trajetorias
de partculas-teste
F (s, t) = x1 (s, t) , . . . , xn (s, t) .

Aqui, n = 3. Pela segunda lei de Newton, a equacao de movimento para cada trajetoria (para cada s fixado)
e dada por
2F
(s, t) + U (s, t) = 0
t2
onde U e o potencial gravitacional Newtoniano. Para calcular a aceleracao relativa entre as trajetorias
produzidas por forcas de mare, calculamos
2F

(s, t) + U (s, t) = 0.
s t2
Escrevendo em coordenadas
2F
(s, t) = x1 (s, t) , . . . , xn (s, t)

t 2
e
U U
(s, t) = (s, t) , . . . , n (s, t) .
x1 x
Segue que, comutando derivadas,
2 xi 2 xi
2
= 2
s t t s
enquanto que, pela regra da cadeia,
n
X 2 U xj
U
i
= .
s x j=1
xi xj s
Assim, em coordenadas, obtemos

n
2 xi X 2 U xj
+ =0
t2 s j=1
xi xj s
O termo
2 2 x1 xn

F
= ,...,
t2 s t2 s s
e a aceleracao relativa das trajetorias, enquanto que o termo
n
X 2 U xj
i,j=1
xi xj s
corresponde as forcas de gravidade que produzem as mares.
13.6.2 Efeitos de Mare em Relatividade Geral: Curvatura como uma medida

da aceleracao relativa de trajetorias geodesicas
Agora analizaremos os efeitos de mare do ponto de vista de Relatividade Geral. Considere uma variacao
geodesica
F (s, t) : (, ) [0, 1] M,
ou seja, para cada s fixado, a curva Fs (t) = F (s, t) e uma geodesica de M ; um exemplo e a variacao
considerada na demonstracao do Lema de Gauss (Lema 12.26). O vetor
F
t
e o vetor tangente em cada geodesica Fs (t), que pode ser visto como a velocidade temporal de uma partcula
hipotetica ao longo desta trajetoria geodesica. Como a trajetoria e uma geodesica, temos
D F
= 0,
dt t
isto e, a aceleracao em cada trajetoria Fs (t) da variacao e nula. Ja o vetor
F
s
mede a velocidade de afastamento, ou taxa de variacao do espaco entre as trajetorias geodesicas (a magnitude
deste vetor sera efetivamente medida na Secao ??). Ou seja, enquanto enxergamos a variavel t como uma
variavel temporal, isto e, Fs (t) e a posicao de uma partcula hipotetica na trajetoria geodesica Fs no instante
de tempo t, a variavel s e vista como uma variavel espacial, medindo a separacao entre duas trajetorias
geodesicas. Queremos obter a aceleracao relativa das trajetorias no tempo
D2 F

D D F
= ,
dt2 s dt dt s
ou seja, a aceleracao temporal da taxa de variacao espacial (afastamento) das trajetorias geodesicas. Em
Relatividade Geral medir isso e importante, pois corresponde a medir os efeitos gravitacionais de mare. Em
Rn , como as derivadas parciais comutam, temos para uma variacao geral, nao necessariamente geodesica,
que
2 F 2F

= ,
t2 s s t2
de modo que medir a taxa de variacao espacial das aceleracoes temporais das partculas nas diferentes
trajetorias e equivalente a medir a aceleracao temporal da taxa de variacao espacial das trajetorias; se, em
particular, a variacao e geodesica, ou seja, uma famlia de retas, temos
2 F 2F

= = 0,
t2 s s t2
ou seja, partculas seguindo ao longo de retas paralelas nao sofrem aceleracao uma em direcao a outra, porque
no final das contas as retas paralelas se mantem a mesma distancia uma da outra e F/s = 0. Mas em
variedades riemannianas (nao localmente isometricas a Rn , como veremos mais tarde) isso nao e verdade
D D
porque as derivadas covariantes e nao comutam, de modo que, enquanto que
dt ds

D D F
= 0,
ds dt t
em geral temos
D2

F
6= 0
dt2 s
e existe uma aceleracao temporal mensuravel entre as trajetorias geodesicas na variedade. De fato, a nao
comutatividade das derivadas covariantes pode ser medida pelo tensor curvatura:
13.34 Lema (Curvatura como medida da nao comutividade da Derivada Covariante). Seja F :
(, ) [a, b] M uma variacao e V um campo vetorial ao longo de F . Entao,

D DV D DV F F
=R , V.
dt ds ds dt t s
Prova: Escreva
F (s, t) = x1 (s, t) , . . . , xn (s, t)

e
V = V i (s, t) i
em uma vizinhanca coordenada. Entao
DV D V i D
= V i i = i + V i i ,
ds ds s ds
donde
D DV 2V i V i D V i D DD
= i + i + i + V i i .
dt ds st s dt t ds dt ds
Trocando a letra t pela letra s, tambem obtemos
D DV 2V i V i D V i D DD
= i + i + i + V i i .
ds dt st t ds s dt ds dt
Logo,
D DV D DV DD DD
=Vi i . (13.55)
dt ds ds dt dt ds ds dt
Como
F xj
= j ,
t t
F xk
= k ,
s s
temos
D xk
i = xk i = k i .
ds s k s
Da,
xk

DD D
i = k i
dt ds dt s
2 xk xk D
= i + (k i )
st k s dt
2 xk xk
= i + xj (k i )
st k s t j
2 xk k
x x j
= i + j k i .
st k s t
Da mesma forma, trocando t por s e depois j por k,
DD 2 xk xk xj
i = i + j k i
ds dt ts k t s
2 xk xj xk
= i + k j i .
st k t s
Portanto,
D DV D DV xj xk
=Vi

j k i k j i
dt ds ds dt t s
j
x xk
=Vi R (j , k ) i
t s
pois
[j ,k ] i = 0
ja que [j , k ] = 0. O fato de que R e um tensor permite agora escrever
xj xk

D DV D DV
=R j , k V i i
dt ds ds dt t s

F F
=R , V.
t s

Observe que definir a curvatura simplesmente por
R (X, Y ) Z = X Y Z Y X Z,
de modo que a curvatura mediria apenas e diretamente o grau de nao comutatividade da derivada covariante,
nao e satisfatorio, porque esta expressao nao define um tensor. De fato, ela nao e linear na terceira variavel:
X Y (f Z) Y X (f Z) = X (f Y Z) X ((Y f ) Z) Y (f X Z) + Y ((Xf ) Z)
= f X Y Z + (Xf ) Y Z + (Y f ) X (Z) + X (Y f ) Z
f Y X Z (Y f ) X Z (Xf ) Y Z Y (Xf ) Z
= f X Y Z f Y X Z + [X (Y f ) Y (Xf )] Z
= f (X Y Z Y X Z) + [X, Y ] (f ) Z.
Para obter um tensor, precisamos definir a curvatura como
R (X, Y ) Z = X Y Z Y X Z [X,Y ] Z.
pois
[X,Y ] (f Z) = f [X,Y ] Z + [X, Y ] (f ) Z
e o termo [X, Y ] (f ) Z que restou acima e eliminado, deixando f [X,Y ] Z. A demonstracao do Lema 13.34
nao funciona se R nao e um tensor.
Podemos agora calcular a aceleracao temporal entre as geodesicas da variedade.
13.35 Proposicao (Equacao do Desvio Geodesico). Seja F : (, ) [a, b] M uma variacao
geodesica. Entao,
D2 F

F F F
+R , =0
dt2 s s t t
Prova: Como cada trajetoria de F e uma geodesica, temos
D F
= 0,
dt t
donde
D D F
= 0.
ds dt t
Invocando o Lema de Simetria 12.25 (cuja validade depende de que o tensor torcao seja nulo), obtemos

D D F D D F F F F
0= = R ,
ds dt t dt ds t t s t

D D F F F F
= +R ,
dt dt s s t t
2

D F F F F
= +R , .
dt2 s s t t

A equacao do desvio geodesico da Relatividade Geral e chamada equacao de Jacobi em Geometria Rie-
manniana. Em Relatividade Geral, o termo da curvatura

F F F
R ,
t s t
e interpretado como sendo o responsavel pelas forcas que produzem efeitos de mare, isto e, a curvatura
do espacotempo e que causa os efeitos de mare, fazendo com que partculas-teste que seguem trajetoria
geodesicas no espacotempo acelerem uma na direcao da outra.
13.6.3 Curvatura como uma medida do transporte paralelo em trajetorias fe-

chadas
Outro modo importante de entender o tensor curvatura e como uma medida (infinitesimal) de quanto o
transporte paralelo em trajetorias fechadas deixa de retornar o mesmo vetor ou, equivalentemente, o quanto
o transporte paralelo de um vetor de um ponto para outro proximo depende da trajetoria que liga estes dois
pontos. O enunciado e demonstracao dados a seguir e de [Rossmann], Theorem 2.3.5, pp. 106-107 (veja
tambem [MTW], Section 11.4, [Shutz], Section 6.5, pp. 157161, [Benn-Tucker], Section 6.4, pp. 208212 e
[Dodson-Poston], pp. 309310).
13.36 Definicao. Uma superfcie parametrizada e uma aplicacao diferenciavel
F : [a, b] [c, d] M.
Um campo vetorial ao longo de F e um campo diferenciavel V : [a, b] [c, d] T M tal que V (s, t)
TF (s,t) M para cada (s, t).
Uma superfcie parametrizada difere em poucos detalhes de uma variacao. Em particular, o Lema 13.34 vale
para uma superfcie parametrizada.
13.37 Teorema (Efeito da Curvatura no Transporte Paralelo em uma Trajetoria Fechada). Seja
F : [s0 , S] [t0 , T ] M uma superfcie parametrizada e denote
p = F (s0 , t0 ) ,

F
U= ,
s (s0 ,t0 )

F
V = .
t (s0 ,t0 )
Seja
: Tp M Tp M
o transporte paralelo ao longo das curvas da fronteira desta superfcie parametrizada, isto e,
= ts00+tt0 st00+ss
+t
0
ts00t
+s
0 +t
st00s0 +s
onde
st00s0 +s e o transporte paralelo ao longo da curva F (s, t0 ) de s0 ate s0 + s,

ts00t
+s
0 +t
e o transporte paralelo ao longo da curva F (s0 + s, t) de t0 ate t0 + t,
st00+ss
+t
0
e o transporte paralelo ao longo da curva F (s, t0 + t) de s0 + s ate s0 ,
ts00+tt0 e o transporte paralelo ao longo da curva F (s0 , t) de t0 + t ate t0 .
Se W Tp M , entao
1
R (U, V ) W = lim (W (W )) .
s,t0 st
Prova: Como
st00+ss
+t
0
st00s
+t
0 +s
= id,
ts00+tt0 ts00t0 +t = id,
podemos escrever
h i
W (W ) = ts00+tt0 st00+ss
+t
0
s
t0 +t
0 s0 +s t
s0
0 t 0 +t (W ) t
s0 +s
0 t0 +t s
t0
0 s0 +s (W ) .
Ja que
lim ts00+tt0 st00+ss
+t
0
= id,
s,t0
basta entao provar que

1 h t0 +t i
R (U, V ) W = lim s0 s0 +s ts00t0 +t (W ) ts00t
+s
0 +t
st00s0 +s (W ) . (13.56)
s,t0 st
Isso e equivalente a calcular a diferenca entre os transportes paralelos do vetor W de Tp M ate Tq M , onde
q = F (t0 + t, s0 + s) e o vertice oposto do retangulo ao longo dos dois caminhos possveis da fronteira
do retangulo.
Pelo Lema 11.27 (substituindo a derivada covariante pela derivada covariante ao longo de uma curva e
invertendo a aplicacao do transporte paralelo), temos para s, t quaisquer
Y(s,t0 +t) t0 t0 +t Y(s,t0 )

DY
= lim ,
dt (s,t0 ) t0
t
Y(s0 +s,t) s0 s0 +s Y(s0 ,t)

DY
= lim
ds (s0 ,t) t0 s
onde Y e um campo ao longo da superfcie tal que Y(s0 ,t0 ) = W . Com esta expressao em mente, reescrevemos
o lado direito de (13.56) adicionando e subtraindo termos, de modo a decompor os dois caminhos do retangulo
nos quatro lados do mesmo:
st00s
+t
0 +s
ts00t0 +t (W ) ts00t
+s
0 +t
st00s0 +s (W )
= st00s
+t
ts00t0 +t Y(s0 ,t0 ) ts00t
+s
st00s0 +s Y(s0 ,t0 )

0 +s 0 +t
= st00s
+t
s0
0 +s
t0 t0 +t Y(s0 ,t0 ) Y(s0 ,t0 +t)
+ st00s
+t

0 +s
Y(s0 ,t0 +t) Y(s0 +s,t0 +t)
ts00t
+s
t0
0 +t
s0 s0 +s Y(s0 ,t0 ) Y(s0 +s,t0 )
ts00t
+s

0 +t
Y(s0 +s,t0 ) + Y(s0 +s,t0 +t) .
Portanto, segue do Lema 13.34 que

1 h t0 +t i
lim s0 s0 +s ts00t0 +t (W ) ts00t +s
0 +t
t0
s0 s0 +s (W )
s,t0 st
" #
1 t0 +t Y(s0 ,t0 +t) ts00t0 +t Y(s0 ,t0 )
= lim s s0 +s lim
s0 s 0 t0 t
Y(s0 +s,t0 +t) st00s +t

1 0 +s
Y(s0 ,t0 +t)
lim lim
t0 t s0 s
" t0
#
1 s0 +s Y (s0 +s,t0 ) s0 s0 +s Y(s0 ,t0 )
+ lim t t0 +t lim
t0 t 0 s0 s
Y(s0 +s,t0 +t) ts00t +s

1 0 +t
Y(s0 +s,t0 )
+ lim lim
s0 s t0 t
!
1 t0 +t DY
= lim s s0 +s
s0 s 0 dt (s0 ,t0 )

1 DY
lim
t0 t ds
(s0 ,t0 +t)
!
1 s0 +s DY
+ lim t t0 +t
t0 t 0 ds (s0 ,t0 )

1 DY
+ lim
s0 s dt
(s0 +s,t0 )

DY t0 +t DY
s0 s0 +s
dt (s0 +s,t0 ) dt (s0 ,t0 )
= lim
s0 s !

DY s0 +s DY
t0 t0 +t
ds (s0 ,t0 +t) ds (s0 ,t0 )
lim
t
t0

D DY D DY
=
ds dt (s0 ,t0 ) dt ds (s0 ,t0 )
= R (U, V ) W.

13.7 Exerccios
13.38 Exerccio. Mostre que toda aplicacao
T : T 1 (M ) . . . T 1 (M ) T1 (M ) . . . T1 (M ) C (M )
multilinear sobre C (M ) e induzida por um campo tensorial em Tlk (M ).
13.39 Exerccio. Mostre que a curvatura e um invariante isometrico local. Conclua que
R (X, Y ) Z = 0
para qualquer variedade metrica localmente isometrica a Rn .
13.40 Exerccio. Usando (a)-(d) da Proposicao 13.14, prove o Corolario 13.15.
Captulo 14
Derivada Covariante de Campos

Tensoriais
Gostaramos de definir uma nocao completa de calculo diferencial em variedades diferenciaveis, isto e, deriva-
das segundas e todas as derivadas de ordem superior. A derivada de uma funcao real f (sua diferencial) e um
funcional linear df , isto e, um tensor 1-covariante. Para podermos derivar mais uma vez, precisamos definir
a nocao da derivada de um tensor 1-covariante. Para definirmos derivadas de ordem superior, precisamos
definir as derivadas de tensores de todos os tipos (k, l). Assim como a derivada de uma funcao aumenta a
ordem covariante de 0 para 1, a derivada de (k, l)-tensores aumentara a ordem covariante de k para k + 1:
ela sera um tensor do tipo (k + 1, l). Por este motivo, ela sera chamada derivada covariante. Na verdade,
ela sera construda a partir da derivada covariante de campos vetoriais (a qual recebe este nome em funcao
do seu uso na definicao da derivada covariante de tensores) e isso sera feito em duas etapas: primeiro gene-
ralizaremos a definicao de derivada covariante de campos vetoriais (conexoes), que e uma nocao de derivada
direcional, para definir derivadas covariantes de campos tensoriais, ou seja, derivadas direcionais de campos
tensoriais (que sera chamada uma conexao em Tlk (M )); esta sera usada em seguida para definir a nocao
propriamente dita de derivada covariante de campos tensoriais, a chamada derivada covariante total.
14.1 Conexao nos Fibrados Tensoriais

Por definicao, uma conexao em uma variedade diferenciavel M e uma maneira de calcular derivadas covari-
antes de campos vetoriais. Esta conexao permite tambem definir derivadas covariantes para todos os campos
tensoriais de M .
14.1 Lema. Seja M uma variedade diferenciavel dotada de uma conexao . Entao existe uma unica conexao
: T (M ) Tlk (M ) Tlk (M )
em cada Tlk (M ) tal que

(i) Em T1 (M ) = T (M ), coincide com a conexao dada.
(ii) Em T0 (M ) = C (M ),
X f = Xf.
(iii) satisfaz a regra do produto com relacao a produtos tensoriais:
X (F G) = (X F ) G + F (X G) .
(iv) comuta com todos os tracos: se tr denota o traco com relacao a qualquer par de ndices, entao
X (tr F ) = tr (X F ) .
198
Alem disso, esta conexao satisfaz tambem as propriedades adicionais:

(a) Para todos Y T (M ) e T 1 (M ) vale
X [ (Y )] = (X ) (Y ) + (X Y ) .
(b) Para todos T Tlk (M ), Xi T (M ) e j T 1 (M ) vale
(X T ) X1 , . . . , Xk , 1 , . . . , l = X T X1 , . . . , Xk , 1 , . . . , l

k
X
T X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1
l
X
T X1 , . . . , Xk , 1 , . . . , X j , . . . , l

j=1
Prova: Dividiremos a demonstracao deste resultado em passos.

Passo 1. Se existe uma conexao que satisfaz as propriedades (i)-(iv), entao ela necessariamente satisfaz
(a)-(b).
De fato, (a) segue de (iii) e (iv):
X [ (Y )] = X tr ( Y )
= tr X ( Y )
= tr (X Y ) + tr ( X Y )
= X (Y ) + (X Y ) .
Para provar (b), procedemos por inducao separadamente sobre k e l. O caso (k, l) = (0, 1) segue de (a)
e (ii):
(X ) (Y ) = X [ (Y )] (X Y )
= X ( (Y )) (X Y ) .
Da mesma forma, o caso (k, l) = (1, 0) segue de (a) e de (ii) (usando a definicao da aplicacao de um vetor a
um covetor via a dualidade entre V e o bidual V ):
(X Y ) () = (X Y )
= X [ (Y )] (X ) (Y )
= X [ (Y )] Y (X ) .
Agora assuma que (b) vale para todos os inteiros p < k, q < l. Mostraremos que isso implica que (b) vale
para k, l. Como todo T Tlk (M ) se escreve na forma
n
X
T = Fi Gj
i,j=1
para alguns Fi Tqp (M ) e Gj T11 (M ), onde p = k 1 e q = l 1, pela linearidade da conexao e suficiente

provar o resultado para
T =F G
com F Tqp (M ) e G T11 (M ). Por (iii),
X T = (X F ) G + F (X G) ,
donde
(X T ) X1 , . . . , Xk , 1 , . . . , l

= [(X F ) G] X1 , . . . , Xk , 1 , . . . , l

+ [F (X G)] X1 , . . . , Xk , 1 , . . . , l

= (X F ) X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , l

+ F X1 , . . . , Xk1 , 1 , . . . , l1 (X G) Xk , l .

Mas
(X F ) X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , l

= X F X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , l

k1
X
F X1 , . . . , X Xi , . . . , Xk1 , 1 , . . . , l1 G Xk , l

i=1
l1
X
F X1 , . . . , Xk1 , 1 , . . . , X j , . . . , l1 G Xk , l

j=1
F X1 , . . . , Xk1 , 1 , . . . , l1 (X G) Xk , l

= F X1 , . . . , Xk1 , 1 , . . . , l1 X G Xk , l

F X1 , . . . , Xk1 , 1 , . . . , l1 G X Xk , l

F X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , X l .

Portanto,
(X T ) X1 , . . . , Xk , 1 , . . . , l

= X F X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , l + F X1 , . . . , Xk1 , 1 , . . . , l1 X G Xk , l

k1
X
F X1 , . . . , X Xi , . . . , Xk1 , 1 , . . . , l1 G Xk , l

i=1
F X1 , . . . , Xk1 , 1 , . . . , l1 G X Xk , l

l1
X
F X1 , . . . , Xk1 , 1 , . . . , X j , . . . , l1 G Xk , l

j=1
F X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , X l

= X F X1 , . . . , Xk1 , 1 , . . . , l1 G Xk , l

k1
X
(F G) X1 , . . . , X Xi , . . . , Xk1 , Xk , 1 , . . . , l1 , l

i=1
(F G) X1 , . . . , Xk1 , X Xk , 1 , . . . , l1 , l

l1
X
(F G) X1 , . . . , Xk1 , Xk , 1 , . . . , X j , . . . , l1 , l

j=1
(F G) X1 , . . . , Xk1 , Xk , 1 , . . . , l1 , X l

= X (F G) X1 , . . . , Xk , 1 , . . . , l

k
X
(F G) X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1
l1
X
(F G) X1 , . . . , Xk , 1 , . . . , X j , . . . , l

j=1
= X T X1 , . . . , Xk , 1 , . . . , l

k
X
T X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1
l1
X
T X1 , . . . , Xk , 1 , . . . , X j , . . . , l .

j=1
Passo 2. Existencia.
Defina : T (M ) Tlk (M ) Tlk (M ) por (b) (o que inclui (a), como visto acima). Mostraremos que
e uma conexao e satisfaz todas as propriedades (i)-(iv).
Inicialmente, as propriedades de uma conexao:
(1) f X+gY T = f X T + gY T.
Primeiro, para campos covetoriais: para todo Z vale
(f X+gY ) (Z) = (f X + gY ) ( (Z)) (f X+gY Z)

= f X ( (Z)) + gY ( (Z)) (f X Z + gY Z)
= f X ( (Z)) + gY ( (Z)) f (X Z) g (Y Z)
= f [X ( (Z)) (X Z)] + g [Y ( (Z)) (Y Z)]
= f X (Z) + gY (Z) ,
logo
f X+gY = f X + gY .
Para T Tlk (M ) temos
(f X+gY T ) X1 , . . . , Xk , 1 , . . . , l

= (f X + gY ) T X1 , . . . , Xk , 1 , . . . , l

k
X
T X1 , . . . , f X+gY Xi , . . . , Xk , 1 , . . . , l

i=1
l
X
T X1 , . . . , Xk , 1 , . . . , f X+gY j , . . . , l .

j=1
Como
(f X + gY ) T X1 , . . . , Xk , 1 , . . . , l

= f X T X1 , . . . , Xk , 1 , . . . , l + gY T X1 , . . . , Xk , 1 , . . . , l ,

T X1 , . . . , f X+gY Xi , . . . , Xk , 1 , . . . , l

= T X1 , . . . , f X Xi + gY Xi , . . . , Xk , 1 , . . . , l

= f T X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l + gT X1 , . . . , Y Xi , . . . , Xk , 1 , . . . , l

T X1 , . . . , Xk , 1 , . . . , f X+gY j , . . . , l

= T X1 , . . . , Xk , 1 , . . . , f X j + gY j , . . . , l

= f T X1 , . . . , Xk , 1 , . . . , X j , . . . , l + gT X1 , . . . , Xk , 1 , . . . , Y j , . . . , l ,

segue o resultado.
(2) X (T + S) = X T + X S.
E obvio da definicao.
(3) X (f T ) = f X T + (Xf ) T.
Note que esta regra do produto e um caso especial de (iii). Primeiro, para campos covetoriais: para todo
Z vale
[X (f )] (Z) = X [(f ) (Z)] (f ) (X Z)

= X [f (Z)] f (X Z)
= (Xf ) (Z) + f X ( (Z)) f (X Z)
= (Xf ) (Z) + f [X ] (Z) ,
logo
X (f ) = f X + (Xf ) .
Para T Tlk (M ) temos
(X f T ) X1 , . . . , Xk , 1 , . . . , l

= X f T X1 , . . . , Xk , 1 , . . . , l

k
X
(f T ) X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1
l
X
(f T ) X1 , . . . , Xk , 1 , . . . , X j , . . . , l

j=1
= (Xf ) T X1 , . . . , Xk , 1 , . . . , l + f X T X1 , . . . , Xk , 1 , . . . , l

k
X
(f T ) X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1
l
X
(f T ) X1 , . . . , Xk , 1 , . . . , X j , . . . , l

j=1
donde segue o resultado.

Agora provemos as propriedades (i)-(iv).
(i) Por definicao, assumindo (ii) (provada logo a seguir) e por (a)
(X Y ) () = X [ (Y )] Y (X )
= X [ (Y )] (X ) (Y )
= (X Y )
de modo que X Y coincide com a conexao dada.

(ii) Por definicao,
X f = Xf.
(iii) Por definicao, se F Tlk (M ) e G Tqp (M ),
[X (F G)] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

= X (F G) X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

k+p
X
(F G) X1 , . . . , X Xi , . . . , Xk+p , 1 , . . . , l+q

i=1
l+q
X
(F G) X1 , . . . , Xk+p , 1 , . . . , X j , . . . , l+q .

j=1
Pela regra do produto para campos vetoriais,
X (F G) X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

= X F X1 , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

= X F X1 , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

+ F X1 , . . . , Xk , 1 , . . . , l X G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q .

Temos tambem
k+p
X
(F G) X1 , . . . , X Xi , . . . , Xk+p , 1 , . . . , l+q

i=1
k
X
F X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

=
i=1
k+p
X
F X1 , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , X Xi , . . . , Xk+p , l+1 , . . . , l+q

+
i=k+1
e
l+q
X
(F G) X1 , . . . , Xk+p , 1 , . . . , X j , . . . , l+q

j=1
l
X
F X1 , . . . , Xk , 1 , . . . , X j , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

=
j=1
l+q
X
F X1 , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , X j , . . . , l+q .

+
j=l+1
Portanto,
[X (F G)] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

( k
X
= X F X1 , . . . , Xk , 1 , . . . , l F X1 , . . . , X Xi , . . . , Xk , 1 , . . . , l

i=1

l
X
F X1 , . . . , Xk , 1 , . . . , X j , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

j=1
+ F X1 , . . . , Xk , 1 , . . . , l X G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

k+p
X
G Xk+1 , . . . , X Xi , . . . , Xk+p , l+1 , . . . , l+q

i=k+1

l+q
X
G Xk+1 , . . . , Xk+p , l+1 , . . . , X j , . . . , l+q

j=l+1
= (X F ) X1 , . . . , Xk , 1 , . . . , l G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

+ F X1 , . . . , Xk , 1 , . . . , l X G Xk+1 , . . . , Xk+p , l+1 , . . . , l+q

= [(X F ) G] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

+ [F (X G)] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q

= [(X F ) G + F (X G)] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , 1 , . . . , l , l+1 , . . . , l+q .

(iv) Para provar esta propriedade, estabeleceremos primeiro uma formula para X T em coordenadas. Se
T = Tij11...i
...jl
k
dxi1 . . . dxik j1 . . . jj
e
X = X m m ,
entao
X T i1 , . . . , ik , dxj1 , . . . , dxjl

= X m m T i1 , . . . , ik , dxj1 , . . . , dxjl

= X m (m T ) i1 , . . . , ik , dxj1 , . . . , dxjl

j ...j
= X m (m T )i11...ikl
e a expressao em coordenadas para a derivada covariante de um campo tensorial, como veremos na Proposicao
14.9, e
k l
j ...j pj ...j
j ...j
X X
(m T )i11...ikl = m Tij11...i
...jl
k
T j1 ...jl
p
i1 ...ir1 pir+1 ...ik mir + Ti11...iks1 s+1 l jmp
s
. (14.1)
r=1 s=1
Seja F Tlk (M ), de modo que tr F Tl1

k1
(M ). Por linearidade e suficiente provar que
[m (tr F )] i1 , . . . , ik1 , dxj1 , . . . , dxjl1 = [tr (m F )] i1 , . . . , ik1 , dxj1 , . . . , dxjl1 ,

isto e, que
j ...j j ...j
[m (tr F )]i11...ik1
l1
= [tr (m F )]i11...ik1
l1
.
Escrevendo
n
X
F = Fij11...i
...jl
k
dxi1 . . . dxik j1 . . . jl ,
i1 ,...,ik =1
j1 ,...,jl =1
temos, assumindo que o traco e tomado em relacao aos ndices p, q,

j ...j j ...j uj ...j
(tr F )i11...ik1
l1
= Fi11...ip1
q1 q k1
uip ...il1 .
Logo,
j ...j
[m (tr F )]i11...ik1
l1
j ...j k l
(tr F )i11...ik1
l1
X j ...j p
X j ...j pjs+1 ...jl
= (tr F )i11...ir1
l
pir+1 ...ik mir + (tr F )i11...iks1 jmp
s
xm r=1 s=1
j1 ...jq1 ujq ...jk1 k l
Fi1 ...ip1 uip ...il1 X j ...j uj ...j p
X j ...j uj ...j pjs+1 ...jk1
= Fi11...ip1
q1 q k1
uip ...ir1 pir+1 ...il1 mir + Fi11...ip1
q1 q s1
uip ...il1 jmp
s
xm r=1 s=1
e
j ...j
[tr (m F )]i11...ik1
l1
j ...j uj ...j
= (m F )i11...ip1
q1 q k1
uip ...il1
j ...j uj ...j k l
Fi11...ip1
q1 q k1
uip ...il1
X j ...j uj ...j p
X j ...j uj ...j pjs+1 ...jk1
= Fi11...ip1
q1 q k1
uip ...ir1 pir+1 ...il1 mir + Fi11...ip1
q1 q s1
uip ...il1 jmp
s
.
xm r=1 s=1
Comparando as expressoes, vemos que elas sao identicas.

Passo 3. Unicidade.
Se existir uma conexao : T (M ) Tlk (M ) Tlk (M ) que satisfaz (i)-(iv), entao ela tambem satisfazera
(a)-(b), logo sera igual a conexao definida no Passo 2.
De agora em diante, quando nos referirmos a uma conexao em uma variedade diferenciavel M , estaremos
nos referindo a conexao do lema, definida em todas os fibrados tensoriais da variedade.
14.2 Proposicao. Seja M uma variedade diferenciavel e um campo covetorial em M . Entao

k
X = X i i X i j jik dxk . (14.2)
x
Em particular,
i dxj = jik dxk . (14.3)
Prova: De fato,
(X ) (Y ) = X [ (Y )] (X Y )
= X Y k k X Y k + X i Y j kij k

= X Y k (k ) X Y k + X i Y j kij (k )

= X Y k k X Y k + X i Y j kij k

= X Y k k + Y k X (k ) X Y k k + X i Y j k kij

k
= Y k X i i X i Y j k kij
x
i k i j k
= X X j ik Y

xi

k
= X i i X i j jik dxk (Y ) .
x

14.2 Derivada Covariante Total

14.3 Definicao. Seja M uma variedade diferenciavel dotada de uma conexao . Dado um campo (k, l)-
tensorial T Tlk (M ), a derivada covariante total de T e o campo (k + 1, l)-tensorial
T : T1 (M ) . . . T1 (M ) T 1 (M ) . . . T 1 (M ) C (M )
definido por
T Y1 , . . . , Yk , X, 1 , . . . , l = X T Y1 , . . . , Yk , 1 , . . . , l .

(14.4)

O nome derivada covariante pode ser agora compreendido: a derivada covariante total de um tensor aumenta
em um a sua ordem covariante.
A derivada covariante total do tensor metrica g e o tensor identicamente nulo:
14.4 Proposicao (Derivada Covariante Total do Tensor Metrica). Se (M, g) e uma variedade metrica,
entao
g = 0.
Prova: Pela definicao e pela compatibilidade da conexao com a metrica, temos
g (X, Y, Z) = Z g (X, Y )
= Z [g (X, Y )] g (Z X, Y ) g (X, Z Y )
= Z hX, Y i hZ X, Y i hX, Z Y i
= 0.

Da demonstracao vemos que a conexao riemanniana pode ser equivalentemente caracterizada como a unica
conexao simetrica tal que g = 0. O fato que g = 0 foi um serio empecilho para Einstein no seu caminho
em direcao a descoberta da Teoria da Relatividade Geral, como veremos no Captulo 16.
14.5 Proposicao (Significado da Derivada Covariante Total Nula). Se (M, g) e uma variedade
metrica e X T (M ), entao
X = 0
se e somente se X e um campo paralelo.
Prova: Veja a observacao que se segue a Definicao 14.10 e observe que se X T (M ), entao por definicao
X (Y ) = Y X.
14.6 Definicao. Dizemos que um tensor T Tlk (M ) e paralelo se T = 0.
Assim, a compatibilidade da metrica e equivalente ao paralelismo do tensor metrica.

14.7 Exemplo (Hessiana e Laplaciano). Se f C (M ), entao a derivada covariante total f de f e
simplesmente o covetor (1-forma) df , isto e, a diferencial de f . De fato, ambos os tensores tem o mesmo
efeito sobre campos vetoriais:
df (X) = Xf = X f = (f ) (X) .
O 2-tensor
2 f = (f )
e chamado a hessiana (covariante) de f . Por definicao,
2 f (X, Y ) = Y (f ) (X) = Y ((f ) (X)) f (Y X) ,

ou seja,
2 f (X, Y ) = Y (Xf ) (Y X) f. (14.5)
O laplaciano de f e definido por
f = trg 2 f. (14.6)

14.8 Notacao. Seja

T = Tij11...i
...jl
dxi1 . . . dxik
...
k
xj1 xjl
um campo (k, l)-tensorial. Entao temos duas notacoes bastante difundidas para escrever a expressao em
coordenadas da derivada covariante total de T :

T = m Tij11...i
...jl
dxi1 . . . dxik dxm j
... (14.7)
k
x 1 xjl
e

T = Tij11...i
...jl
k ;m
dxi1 . . . dxik dxm
j
... (14.8)
x 1 xjl
Isto e, cada componente do campo (k + 1, l)-tensorial derivada covariante total e denotado por
m Tij11...i
...jl
k
= Tij11...i
...jl
k ;m
. (14.9)
Por exemplo, se

X = Xi ,
xi
entao

X = j X i dxj = X;ji dxj . (14.10)
xi xi

14.9 Proposicao. Seja M uma variedade diferenciavel dotada de uma conexao . Entao as componentes
da derivada covariante total em um sistema de coordenadas sao dadas por
l k
j ...j pjs+1 ...jl
X X
m Tij11...i
...jl
k
= Tij11...i
...jl
k ;m
= m Tij11...i
...jl
k
+ Ti11...iks1 jmp
s
Tij11...i
...jl
p .
r1 pir+1 ...ik mir
(14.11)
s=1 r=1
Em particular, em coordenadas normais,
m Tij11...i
...jl
k
(p) = m Tij11...i
...jl
k
(p) .
Tij11...i
...jl
k ;m
= T i1 , . . . , ik , m , dxj1 , . . . , dxjl

= (m T ) i1 , . . . , ik , dxj1 , . . . , dxjl

k
X
= m T i1 , . . . , ik , dxj1 , . . . , dxjl T i1 , . . . , m ir , . . . , ik , dxj1 , . . . , dxjl

r=1
l
X
T i1 , . . . , ik , dxj1 , . . . , m dxjs , . . . , dxjl

s=1
k
X
= m Tij11...i
...jl
T i1 , . . . , pmir p , . . . , ik , dxj1 , . . . , dxjl

k

r=1
l
X
T i1 , . . . , ik , dxj1 , . . . , jmp dxp , . . . , dxjl

s
s=1
k l
j ...j pjs+1 ...jl
X X
= m Tij11...i
...jl
k
Tij11...i
...jl
p +
r1 pir+1 ...ik mir
Ti11...iks1 jmp
s
.
r=1 s=1
Em coordenadas normais, os coeficientes de Christoffel em p se anulam.

Por exemplo, para uma funcao real:
f
i f = f;i = ;
xi
para um campo vetorial (campo 1-tensorial contravariante)
j X i = X;ji = j X i + X p ijp ;
para um campo covetorial (campo 1-tensorial covariante)
j i = i;j = j i p pij ;
para um campo 2-tensorial covariante:
k Tij = Tij;k = k Tij Tpj pik Tip pjk ;
para um campo (3, 1)-tensorial:

p
l
m Rijk l
= Rijk;m l
= m Rijk + Rijk lpm Rpjk
l
pim Ripk
l
pjm Rijp
l
pkm ;
e para um campo 4-tensorial covariante:
m Rijkl = Rijkl;m = m Rijkl Rpjkl pim Ripkl pjm Rijpl pkm Rijkp plm .
14.10 Proposicao (Regra do Produto). Seja M uma variedade diferenciavel dotada de uma conexao .
Entao
...jl jl+1 ...jl+q jl+1 ...jl+q jl+1 ...jl+q
m Fij11...i k
Gik+1 ...ik+p = m Fij11...i
...jl
k
Gik+1 j1 ...jl
...ik+p + Fi1 ...ik m Gik+1 ...ik+p .
Prova: Seja T = F G, de modo que

j ...j j ...j j1 ...jl j ...j
Ti11...iklik+1
l+1 l+q l+1 l+q
...ik+p = Fi1 ...ik Gik+1 ...ik+p .
Da,
j ...j j ...j
m Ti11...iklik+1
l+1 l+q
...ik+p
= T i1 , . . . , ik , ik+1 , . . . , ik+p , m , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

= m T i1 , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

= m T i1 , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

k+p
X
T i1 , . . . , im ir , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

r=1
l+q
X
T i1 , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , im dxjs , . . . , dxjl , dxjl+1 , . . . , dxjl+q .

s=1
Como
m T i1 , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

...jl jl+1 ...jl+q
= m Fij11...i k
G ik+1 ...ik+p

j1 ...jl jl+1 ...jl+q j1 ...jl jl+1 ...jl+q
= m Fi1 ...ik Gik+1 ...ik+p + Fi1 ...ik m Gik+1 ...ik+p ,
k+p
X
T i1 , . . . , im ir , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q

r=1
k
X
F i1 , . . . , im ir , . . . , ik , dxj1 , . . . , dxjl G ik+1 , . . . , ik+p , dxjl+1 , . . . , dxjl+q

=
r=1
k+p
X
F i1 , . . . , ik , dxj1 , . . . , dxjl G ik+1 , . . . , im ir , . . . , ik+p , dxjl+1 , . . . , dxjl+q

r=k+1
k
X jl+1 ...jl+q
= F i1 , . . . , im ir , . . . , ik , dxj1 , . . . , dxjl Gik+1 ...ik+p
r=1
k+p
X
Fij11...i
...jl
G ik+1 , . . . , im ir , . . . , ik+p , dxjl+1 , . . . , dxjl+q

k
r=k+1
e
l+q
X
T i1 , . . . , ik , ik+1 , . . . , ik+p , dxj1 , . . . , im dxjs , . . . , dxjl , dxjl+1 , . . . , dxjl+q

s=1
l
X
F i1 , . . . , ik , dxj1 , . . . , im dxjs , . . . , dxjl G ik+1 , . . . , ik+p , dxjl+1 , . . . , dxjl+q

=
s=1
l+q
X
F i1 , . . . , ik , dxj1 , . . . , dxjl G ik+1 , . . . , ik+p , dxjl+1 , . . . , im dxjs , . . . , dxjl+q

s=l+1
l
X jl+1 ...jl+q
= F i1 , . . . , ik , dxj1 , . . . , im dxjs , . . . , dxjl Gik+1 ...ik+p
s=1
l+q
X
Fij11...i
...jl
G ik+1 , . . . , ik+p , dxjl+1 , . . . , im dxjs , . . . , dxjl+q ,

k
s=l+1
segue que
j ...j j ...j
m Ti11...iklik+1
l+1 l+q
...ik+p
" k
X
= m Fij11...i...jl
F i1 , . . . , im ir , . . . , ik , dxj1 , . . . , dxjl

k

r=1
l
#
j ...j
X
F i1 , . . . , ik , dxj1 , . . . , im dxjs , . . . , dxjl
l+1 l+q
Gik+1 ...ik+p
s=1
k+p
"
jl+1 ...jl+q
X
Fij11...i
...jl
G ik+1 , . . . , im ir , . . . , ik+p , dxjl+1 , . . . , dxjl+q

+ k
m Gik+1 ...ik+p
r=k+1
l+q
#
X
G ik+1 , . . . , ik+p , dxjl+1 , . . . , im dxjs , . . . , dxjl+q

s=l+1

jl+1 ...jl+q jl+1 ...jl+q
= m Fij11...i
...jl
k
Gik+1 ...ik+p + F j1 ...jl
i1 ...ik m Gik+1 ...ik+p .

Este resultado justifica a notacao m .
14.11 Lema. Seja M uma variedade metrica. Entao
k gij = gij;k = 0
e
ij
k g ij = g;k =0
Prova: Embora ja tenhamos demonstrado a primeira afirmacao na Proposicao 14.4, forneceremos outra
demonstracao que a derivada covariante total do tensor metrica g e o tensor identicamente nulo usando a
formula para as componentes da derivada covariante. De fato, pelo Corolario 11.25,
k gij = gip pjk + gpj pik .
Logo,
k gij = gij;k = k gij gip pjk gpj pik = 0.
Para calcular k g ij , primeiro observamos que
k ij = i;k
j
= k ij + ip jpk pj pik
= ii jik jj jik
= 0.
Portanto,
k gip g pj = k ij = 0.

Mas, pela regra do produto,
k gip g pj = g pj k gip + gip k g pj = gip k g pj

pela primeira afirmacao. Conclumos que

gip k g pj = 0.
Contraindo esta expressao atraves da inversa da metrica,
g li gip k g pj = 0,
segue que
0 = pl k g pj = k g lj .

Em vista dos resultados acima, a derivada covariante se comporta bem com a operacao de subir ou descer
um ndice:
14.12 Proposicao. Seja M uma variedade metrica. Entao

j ...j j1 ...jl1 p j ...j p
m Ti11...ikl1
ik+1 = m gi k+1 p Ti1 ...ik = gik+1 p m Ti11...ikl1 , (14.12)
e
j ...jl jl+1
m Ti11...ik1 = m g jl+1 p Tij11...i
...jl
k1 p
= g jl+1 p m Tij11...i
...jl
k1 p
. (14.13)
Prova: Segue das Proposicoes 14.10 e 14.11.

No caso de um (1, 1)-tensor, as formulas sao
m Tij = m gik T kj = gik m T kj ,

m Tij = m g kj Tik = g kj (m Tik ) .

Na notacao de ponto e virgula:

j kj
Ti;m = gik T;m ,
j
m Ti;m = g kj Tik;m .
14.13 Exemplo (Hessiana e Laplaciano em coordenadas). As componentes de f sao
f = i f dxi .
E comum denotar
fi = i f, (14.14)
de modo que
2 f = j fi dxi dxj = fi;j dxi dxj .
Temos
j fi = fi;j = j fi fp pij = ij
2
f kij k f. (14.15)
Ou seja,
2 f = ij
2
f kij k f dxi dxj .

(14.16)
Tambem e comum escrever
2
fij = ij f, (14.17)
de modo que
2 f = fij fk kij dxi dxj .

(14.18)
Da obtemos a formula do laplaciano em coordenadas:
f = trg 2 f = g ij 2 f

ij
= g ij ij
2
f g ij
kij k f.

14.14 Proposicao (Identidade de Bianchi Diferencial). Seja M uma variedade metrica. A derivada cova-
riante total do tensor curvatura satisfaz a seguinte propriedade:
R (X, Y, Z, V, W ) + R (X, Y, V, W, Z) + R (X, Y, W, Z, V ) = 0. (14.19)
Em termos de componentes,
Rijkl;m + Rijlm;k + Rijmk;l = m Rijkl + k Rijlm + l Rijmk = 0. (14.20)
Prova: Em primeiro lugar, devido a propriedade de simetria 14.14 (c) do tensor curvatura, a identidade do
enunciado e equivalente a identidade
R (Z, V, X, Y, W ) + R (V, W, X, Y, Z) + R (W, Z, X, Y, V ) = 0. (14.21)
A vantagem desta identidade e que o campo na quarta posicao e o mesmo (isto e, Y ) em todos os termos.
Por multilinearidade, basta provar que
R (i , j , k , l , m ) + R (j , m , k , l , i ) + R (m , i , k , l , j ) = 0
para todos os campos vetoriais i , j , k , l , m . Por definicao e compatibilidade da metrica,
R (i , j , k , l , m ) = m R (i , j , k , l )
= m hR (i , j ) k , l i
= hm R (i , j ) k , l i + hR (i , j ) k , m l i .
Para facilitar os calculos consideravelmente, consideramos coordenadas normais em p. Em coordenadas

normais em p,
m l (p) = qlm (p) q = 0.
Logo, em p,
R (i , j , k , l , m ) = hm R (i , j ) k , l i .
Escrevendo
R (i , j ) k = i j k j i k [i ,j ] k
= i j k j i k ,
porque [i , j ] = 0, segue que

R (i , j , k , l , m ) = m i j k m j i k , l .
Da, em p,
R (i , j , k , l , m ) + R (j , m , k , l , i ) + R (m , i , k , l , j )

= m i j k m j i k + i j m k i m j k

+j m i k j i m k , l

= j m i k m j i k + m i j k i m j k

+i j m k j i m k , l

= R (j , m ) i k + R (m , i ) j k + R (i , j ) m k , l
= hR (j , m ) 0 + R (m , i ) 0 + R (i , j ) 0, l i
= 0,
ja que i k = j k = m k = 0 em p.
14.2.1 Divergencia de Campos Tensoriais

Dado um campo vetorial X em Rn , sua divergencia e a funcao
div X = i X i = i X i .
Isto e,
div X = tr X.
Dado um campo vetorial X T (M ), de maneira analoga definimos sua divergencia por
div X = tr X.
Em coordenadas,
div X = i X i = X;ii .
Para definir a divergencia de um campo covetorial T1 (M ), observe que ao descermos ndices no ultimo
termo obtemos
X;ii = g ij Xj;i = g ij X [ = trg X [ ,
j;i
de modo que faz sentido definir

div = trg .
Em coordenadas,
div = g ij i j = g ij j;i .
Usando estas ideias, definimos a divergencia de tensores contravariantes e covariantes da seguinte forma:
14.15 Definicao. Dado um campo l-tensorial contravariante, a divergencia de T e o campo (l 1)-tensorial
contravariante
div T = tr T.
Dado um campo k-tensorial covariante T , a divergencia de T e o campo (k 1)-tensorial covariante
div T = trg T.

Observe que
f = trg 2 f = div f.
Em coordenadas, se T e um 2-tensor contravariante,
(div T )i = j T ij = T;jij .
se T e um 2-tensor covariante,
(div T )i = g jk k Tij .
14.16 Proposicao. Seja M uma variedade metrica. Entao
S = 2 div Ric . (14.22)

(div Ric)i = g jk k Rij .
Pela identidade de Bianchi diferencial, temos
m Rijkl + k Rijlm + l Rijmk = 0.

Da,
g jl (m Rijkl + k Rijlm + l Rijmk ) = 0,
donde, pela regra do produto e pelo fato que p g rs = 0,
m g jl Rijkl + k g jl Rijlm + g jl l Rijmk = 0.

(14.23)
Como
Rpq = g rs Rrpqs ,
Rijkl = Rjikl ,
Rijlm = Rjiml ,
o primeiro termo desta soma e
m Rik ,
enquanto que o segundo termo e
k Rim .
Logo a identidade (14.23) e equivalente a
m Rik = k Rim + g jl l Rijmk .
Da,
g ik m Rik = g ik k Rim + g ik g jl l Rijmk
= (div Ric)m + g jl l g ik Rijmk

= (div Ric)m + g jl l Rjm

= (div Ric)m + (div Ric)m
= 2 (div Ric)m .
Portanto,
m S = m g ik Rik = g ik m Rik = 2 (div Ric)m .

14.17 Proposicao. Se M n e uma variedade de Einstein conexa e n > 3, entao M tem curvatura escalar
constante.
Prova: Temos
S
Ric = g,
n
donde
S
Rij = gij
n
e, portanto,
1
k Rij = gij k S.
n
Logo,
1 kj 1 1
(div Ric)i = g jk k Rij = g gij k S = ik k S = i S.
n n n
Segue da proposicao anterior que
S S
= .
2 n
Se n 6= 2, esta identidade implica que
S = 0
e portanto S constante, se M e conexa.
Como toda variedade riemanniana de dimensao 2 e uma variedade de Einstein e existem variedades de
dimensao 2 que nao possuem curvatura escalar constante, este resultado nao vale se n = 2.
Captulo 15
O Tensor Momento-Energia
Na Teoria da Relatividade Geral, o tensor momento-energia (tambem chamado tensor tensao-energia) des-
creve a densidade e fluxo de energia e momento no espacotempo e e responsavel por criar a curvatura no
espacotempo. Nas palavras de Wheeler, o espacotempo age na materia dizendo a ela como se mover [isto
e, na ausencia de forcas atuando, apenas sob o efeito de sua propria inercia, ao longo das geodesicas do
espacotempo]; por sua vez, a materia age sobre o espacotempo, dizendo a ele como se curvar ([MTW], Secao
1.2, p. 5). Exceto que materia na Teoria da Relatividade possui um significado mais geral, nao restrito
apenas a massa.
15.1 4-Vetores
Tanto na Teoria da Relatividade Especial quanto na Geral, e conveniente descrever o movimento de um
objeto em um referencial inercial (em Relatividade Especial) ou em um sistema de coordenadas geral (em
Relatividade Geral) em coordenadas do espacotempo dependendo do seu tempo proprio , isto e, de acordo
com o tempo medido em seu proprio referencial, e portanto independente de referencial. Assim, em um
referencial inercial a trajetoria de uma partcula livre e uma curva parametrizada pelo tempo proprio
( ) = (t ( ) , x ( ) , y ( ) , z ( )) ,
e a geodesica que uma partcula livre segue no espacotempo curvo seria parametrizada pelo tempo proprio
( ).
Vetores no espacotempo tem 4 coordenadas e para distingui-los dos vetores espaciais (projecoes espaciais),
sao frequentemente chamados de quadrivetores ou 4-vetores. Assim, temos o quadrivetor deslocamento,
ou seja deslocamento no espacotempo
s = (t, x, y, z)
e o quadrivetor velocidade
ds dt dx dy dz
u= = , , , , (15.1)
d d d d d
ou 0 ( ) para uma trajetoria curva ( ) no espacotempo. O quadrivetor velocidade e por definicao tangente
a trajetoria da partcula no espacotempo.
Observe que se a trajetoria do objeto no espacotempo e uma curva, o seu referencial proprio obviamente
nao e um referencial inercial. Entretanto, em cada instante de tempo existe um referencial inercial que tem
a mesma velocidade que o objeto; este referencial inercial que comove com o objeto e temporario, pois no
proximo instante de tempo ele nao esta mais se comovendo com o objeto. Ele e chamado o seu referencial
comovel temporario (em ingles: momentarily comoving reference frame (MCRF)). O quadrivetor velocidade
215
em um determinado instante de tempo (tangente a trajetoria da partcula naquele instante de tempo) e

justamente o vetor base e0 do seu referencial comovel temporario naquele momento.
Como o tempo proprio do objeto e o tempo t de um referencial inercial arbitrario estao relacionados
atraves da equacao p
= 1 v 2 t, (15.2)
onde v e a velocidade espacial do objeto em relacao a este referencial inercial (v = kvk), isto e,

dx dy dz
v= , , ,
dt dt dt
segue que p
d = 1 v 2 dt,
e portanto as coordenadas do quadrivetor velocidade no referencial inercial tambem podem ser escritas na
forma
1 dx dy dz 1
u= 1, , , = (1, v)
1v 2 dt dt dt 1 v2
ou
1 1
u= (1, v x , v y , v z ) = (1, v) . (15.3)
1v 2 1 v2
Observe que quando v 1 temos t e
u (1, v x , v y , v z ) = (1, v) ,
e o quadrivetor velocidade de um objeto em repouso em relacao ao referencial inercial (trajetoria vertical no

espacotempo) tem neste referencial coordenadas
u = (1, 0, 0, 0) .
Em particular, segue tambem que se v 6= 1 o quadrivetor velocidade e um vetor unitario, isto e,
kuk = 1 (15.4)
pois

1 1
hu, ui = (1, v x , v y , v z ) , (1, v x , v y , v z )
1 v2 1 v2
1 h x 2 y 2 z 2
i
= 1 + (v ) + (v ) + (v )
1 v2
1
1 + v 2

= 2
1v
= 1.
15.2 Momento-Energia
15.1 Definicao. Se m e a massa de um objeto, definimos o quadrivetor momento-energia
P = mu. (15.5)

Em um referencial inercial arbitrario, segue que o quadrivetor momento-energia tem coordenadas

m m
P= (1, v x , v y , v z ) = (1, v) .
1 v2 1 v2
Observe que como velocidade e adimensional em relatividade (tempo e espaco sao medidos com a mesma
unidade), o quadrivetor momento-energia tem unidades de massa. De fato, se v 6= 1
hP, Pi = hmu, mui = m2 hu, ui = m2 , (15.6)
de modo que
kPk = m. (15.7)
Note que a massa m de um objeto, sendo a norma do quadrivetor momento-energia (um vetor do espacotempo
de Minkowski), tem o mesmo valor em qualquer referencial inercial. Em outras palavras, ela nao depende
da velocidade do referencial: massa nao aumenta com a velocidade e na teoria da relatividade nao se define
massa relativstica (veja [Okun1] para uma exposicao clara, incluindo a origem historica deste termo e
ate seu uso inicial por Einstein para inferir a atracao da luz por uma massa gravitacional (ele raciocinou
que fotons teriam massa m = E/c2 ), antes de formular a Teoria da Relatividade Geral, quando abandonou
essa ideia inconsistente, e uma coletanea de artigos criticando os conceitos de massa de repouso e massa
relativstica em [Okun2]). Por outro lado, massa e mais facilmente medida em um referencial em que o
objeto esta em repouso.
Observe que m = 0 se e somente se P e um vetor do tipo luz, e consequentemente u tambem e, donde
v = 1. Portanto, fotons nao possuem massa.
15.2 Definicao. A componente temporal do quadrivetor momento-energia e chamada a energia rela-
tivstica E do objeto e sua projecao espacial o seu momento relativstico p.
Assim,
m
E= ,
1 v2
mv x mv y mv z

m
p= v= , , ,
1 v2 1 v2 1 v2 1 v2
de modo que
m2 = E 2 p2 . (15.8)
Note que tanto a energia relativstica quanto o momento relativstico dependem do referencial, ja que sao
componentes (coordenadas) de um quadrivetor. Observe tambem que massa nao e a mesma coisa que energia:
energia e a componente temporal do quadrivetor momento-energia, enquanto que massa e a magnitude deste
vetor. Apenas que, em relatividade, elas sao medidas com as mesmas unidades de medida (quilogramas), da
mesma forma que tempo e espaco em relatividade sao medidos com as mesmas unidades de medida (metros),
apesar de nao serem a mesma coisa.
Em unidades do espacotempo (ct, x, y, z) em que a velocidade da luz e c e nao normalizada para 1, a
relacao entre o tempo proprio e o tempo em um referencial inercial arbitrario e
r v 2
= 1 t
c
e o quadrivetor velocidade tem coordenadas
1 x y z 1
u= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1 1
c c
de modo que o momento-energia e

m x y z m
P= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1 1
c c
mas a energia relativstica e
mc2
E=r v 2
1
c
(para que as unidades de medida de energia fiquem corretas) e o momento relativstico e
mv
p= r v 2 ,
1
c
ou seja,
E
P= ,v .
c
Quando v = 0, temos
E0 = m
ou, quando a velocidade da luz nao e normalizada, a celebre equacao
E0 = mc2
para a energia de repouso; ou seja, a energia de um objeto nao desaparece quando ele esta em repouso, como
na mecanica de Newton, mas ao contrario e enorme (por causa do fator c2 ).
15.3 Fluxos
15.3.1 Definicao
Fluxo (flux ) e a taxa de transferencia de um material (uma grandeza concreta tal como, por exemplo, massa,
carga eletrica, numero de partculas) ou propriedade (uma grandeza abstrata tal como, por exemplo, energia
ou momento) ao longo de uma direcao, por unidade de area, por unidade de tempo. Ele e portanto uma
grandeza vetorial, cuja unidade e quantidade de material ou propriedade por unidade de area por unidade
de tempo. Por exemplo, o material pode estar sendo transferido da esquerda para a direita no eixo x, ou
na direcao normal a uma certa superfcie de referencia. [As vezes, fluxo por unidade de tempo e chamado
simplesmente de fluxo, enquanto que fluxo por unidade de area por unidade de tempo e chamado de densidade
de fluxo.]
15.3 Exemplo. No fluxo de massa o material transferido comumente se refere a um fluido (taxa de
transferencia de fluido, ou seja, taxa de escoamento) ou a uma certa substancia dissolvida em um fluido. A
taxa de transferencia de massa pode ser medida, por exemplo, em kg/m2 s ou, o que e equivalente no caso
de um fluido de densidade constante, em litros/m2 s.
Um exemplo simples de fluxo de energia e a taxa de transferencia de calor, que e energia termica,
medida em joules/m2 s.
No fluxo de momento, a taxa de transferencia dada por unidades de momento por unidade de area
por unidade de tempo, tem as mesmas unidades de forca por area ((kgm/s)/m2 s = (kgm/s2 )/m2 ), ou seja,
pressao. Assim, a forca aplicada a um objeto pode ser vista como a taxa de transferencia de momento para
o objeto. O fluxo de momento tambem chamado estresse.
No que se segue, convencionaremos que o fluxo sera positivo quando a transferencia de material ou proprie-
dade e no sentido orientado positivo do eixo xi . Se o fluxo tem sinal negativo, isso significa que a transferencia
de material esta-se realizando no sentido orientado negativo do eixo xi .
15.4 Tensor Momento-Energia

Em cada evento do espacotempo existe um tensor de momento-energia T , que contem um conhecimento
da densidade de energia, densidade de momento e tensao, associadas a todas as formas de materia e todos os
campos nao-gravitacionais (como, por exemplo, o campo eletromagnetico) medida por qualquer e todos os
observadores naquele evento (ja que e um tensor, logo sua definicao e significado transcende todos os sistemas
de coordenadas e referencias inerciais). Mas qualquer observador, limitado pelo seu referencial inercial de
Lorentz, presta mais atencao as componentes de T do que ao proprio T , atribuindo a cada componente um
significado fsico especial.
O tensor momento-energia e um 2-tensor contravariante (embora tambem possa ser visto como um 2-
tensor covariante ou mesmo como um (1, 1)-tensor covariante e contravariante, atraves de contracao de
ndices). O componente T ij e o fluxo da i-esima componente do momento-energia passando atraves da
superfcie xj constante. Logo, T 00 e a densidade de energia (t = constante), enquanto que T 0j para
i = 1, 2, 3 e o fluxo da energia atraves de uma superfcie no espaco. T i0 para i = 1, 2, 3 e a densidade do
momento (t = constante). T ij para i, j = 1, 2, 3 e o fluxo de momento atraves de uma superfcie espacial,
tambem chamado tensao (stress): T ii e a tensao normal (pressao normal a superfcie) e T ij , i 6= j, e a
tensao de cisalhamento (pressao tangente a superfcie). Assim, o tensor momento-energia representado
em forma matricial e 00
T 01 T 02 T 03

T

10 T 11 T 12 T 13
T = T ,
T 20 T 21 T 22 T 23
T 30 T 31 T 32 T 33
onde
T 00 densidade de energia T 01 T 02 T 03 fluxo de energia

T = 10 11 12 13 .
T T T T
T 20 densidade de momento T 21 T 22 T 23 fluxo de momento
T 30 T 31 T 32 T 33
15.4.1 Tensor Momento-Energia da Poeira

O tensor momento-energia mais simples e o tensor momento-energia da poeira (dust). Poeira e simples-
mente uma colecao de partculas em repouso em algum referencial (portanto elas se movem com a mesma
velocidade em qualquer outro referencial), o seu referencial proprio. E um exemplo de um fluido perfeito (a
ser definido no proximo paragrafo) com pressao nula.
A densidade do numero de partculas (fluxo atraves das superfcies t = constante) e definida por
n = numero de partculas por unidade de volume no referencial proprio.
Em um referencial inercial em que as partculas nao estao em repouso, digamos em que as partculas tem
velocidade v, o volume e alterado devido a contracao
de Lorentz: por exemplo, um paraleleppedo solido
de volume xyz tera um volume xyz 1 v 2 medido em um referencial em que as partculas tem
velocidade v em uma das direcoes x, y, z. A densidade do numero de partculas sera entao
n
.
1 v2
O fluxo de partculas e o numero de partculas que atravessam uma superfcie por unidade de area, por
unidade de tempo. Alem da orientacao da superfcie, em Relatividade area e tempo dependem do referencial.
Obviamente, no referencial em que as partculas estao em repouso o fluxo e zero. Em um referencial em que
as partculas movem-se com todas com a velocidade v em uma mesma direcao, digamos na direcao x0 , se
considerarmos a superfcie normal a x0 a area sera a mesma (ja que nao ha contracao nas direcoes transversais
ao movimento do referencial) A = yz = y 0 z 0 . Mas o volume que contem as partculas durante um

intervalo t0 sera
V = x0 A = vt0 A,

e como a densidade de partculas por unidade de volume neste referencial e n/ 1 v 2 segue que o fluxo
atraves de superfcies x = constante por unidade de area por unidade de tempo sera
nv
= .
1 v2
Mesmo que as partculas tenham componentes de velocidade nas direcoes y, z, como a componente do fluxo
na direcao x (atraves das superfcies x = constante) so depende da componente da velocidade ortogonal a
superfcie, isto e, v x , segue que a componente do fluxo na direcao x e dada por
nv x
x = .
1 v2
15.4 Definicao. O quadrivetor fluxo de partculas e definido por
N = nu

Logo,
n n
N= (1, v x , v y , v z ) = (1, v) .
1v 2 1 v2
Note que a densidade do numero de partculas no referencial proprio e a norma do quadrivetor fluxo e
portanto independente do referencial inercial (o que tambem e obvio da definicao dela):
hN, Ni = hnu, nui = n2 hu, ui = n2 ,
de modo que
kNk = n. (15.9)
Para obter o tensor momento-energia da poeira, vamos assumir por simplicidade que as partculas tem a
mesma massa m. No referencial comovel temporario das particulas, em que elas se encontram em repouso,
a energia de cada partcula e a energia de repouso m. Portanto, a energia por unidade de volume, ou seja,
a densidade de energia, e
= nm.
Em fluidos mais gerais, existe um movimento aleatorio das partculas, logo energia cinetica de movimento
(mesmo em um referencial media dos referenciais) e a densidade de energia do fluido tera uma expressao
bem diferente. Em um referencial em que as partculas se movem com a mesma velocidade v, a densidade
de energia ainda e o numero de partculas por unidade de volume vezes a energia de cada partcula, que e
dada por
n m nm
= = .
1v 2 1v 2 1 v2
Para obter o tensor momento-energia da poeira, basta determinar os seus componentes em algum refe-
rencial. No caso da poeira, a determinacao dos seus componentes no seu referencial comovel temporario e
particularmente simples. Nao ha movimento das partculas, logo os momentos sao todos nulos. Assim, no
referencial comovel temporario, o tensor momento-energia tem componentes

0 0 0
0 0 0 0
T = 0 0 0 0 .

0 0 0 0
Estas sao exatamente as componentes do tensor

P N = (mu) (nu) = nm (u u) = (u u) ,
ij
pois u = (1, 0, 0, 0) no referencial comovel temporario e (F G) = F i Gj para quaisquer quadrivetores
(1-tensores contravariantes) F, G. Portanto, este e o tensor momento-energia da poeira:
T = (u u) .
Podemos agora calcular seus componentes em um referencial em que as partculas se movem com velocidade
v. Como
1
u0 = ,
1 v2
vi
ui = ,
1 v2
e
T ij = ui uj ,
segue que

T 00 = u0 u0 = ,
1 v2
v i
T 0j = u0 uj = ,
1 v2
v i
T i0 = ui u0 = ,
1 v2
v i v j
T ij = ui uj = , para i, j 6= 0,
1 v2
e
1 vx vy vz

x 2
v (v x ) x y
v v vx vz
T = y x y y 2
.
1 v2 v v v (v ) vy vz
z 2
v vx vz v y v z (v z )
Note que o tensor momento-energia da poeira e simetrico. Veremos que isso sempre acontece.
15.4.2 Simetria do Tensor Momento-Energia

Para provar que o tensor momento-energia e simetrico, isto e, que
T ij = T ji
para todos os ndices i, j, basta provar isso em um referencial, pois isso implica
T (, ) = T (, )
para todos os covetores , , o que sera valido em todo referencial. O referencial mais simples de trabalhar
e o referencial comovel temporario.
Para ver que
T i0 = T 0i ,
ou seja, que a densidade de energia e igual ao fluxo de energia, observe que o fluxo de energia e igual a
densidade de energia vezes a velocidade com que ela escoa. Mas como massa e energia sao a mesma coisa,
isto e a densidade de massa vezes a velocidade com que ela se move, ou seja a densidade de momento.
A simetria
T ij = T ji ,
para i, j = 1, 2, 3 e deduzida como em Mecanica Newtoniana (veja, por exemplo, [Shutz], pp. 97-98).
15.4.3 Conservacao do Momento-Energia

Pela lei de conservacao do momento-energia segue que
div T = 0,
ja que o divergente mede infinitesimalmente o fluxo total por unidade de volume (veja o apendice a este
captulo).
15.4.4 Tensor Momento-Energia de um Fluido Perfeito

Um fluido perfeito e um fluido em que nao ha conducao de calor ou viscosidade. A primeira condicao
implica que o fluxo da energia atraves de uma superfcie no espaco e zero, logo T 0j no referencial comovel
temporario e segunda condicao implica que nao ha tensao de cisalhamento, ou seja, T ij = 0 para i 6= j,
i, j = 1, 2, 3 neste referencial. Em outras palavras, um fluido perfeito e caracterizado apenas por densidade
e pressao; o exemplo mais familiar de fluido perfeito e um gas perfeito. Usando simetria, conclumos que no
referencial comovel temporario o tensor momento-energia de um fluido perfeito tem a forma

0 0 0
0 P 0 0
T = 0 0 P 0 ,

0 0 0 P
onde P e a pressao. E facil ver que

T = ( + P ) (u u) + P ,
onde e o tensor metrica de Lorentz do espaco de Minkowski. Portanto, em um referencial em que o fluido
se move com velocidade v temos
1 vx vy vz

e00 e01 e02 e03
x x 2
+P v (v ) vx vy x z
v v e10 e11 e12 e13
T = 2 +P ,
1 v 2 v y v x v y (v y ) vy vz e20 e21 e22 e23
2 e30 e31 e32 e33
vz vx vz vy vz (v z )
onde eij sao os componentes da metrica de Lorentz no referencial.

Para qualquer metrica de Lorentz g em um espacotempo curvo teremos
T = ( + P ) (u u) + P g.
15.5 Apendice: Divergente e Fluxo

E bastante esclarecedor estudar o escoamento de um fluido para entender a matematica do fluxo. Para um
fluido movendo-se no espaco, denote por V = (V x , V y , V z ) o seu campo de velocidades. Para cada ponto
(x, y, z) no espaco e para cada instante de tempo t, V (t, x, y, z) denota a velocidade do fluido ao passar
por aquele ponto naquele instante de tempo. De fato, fixado um ponto no espaco, a velocidade do fluido ao
passar por aquele ponto pode ser variavel no tempo. Quando isso nao ocorre, isto e, se a velocidade nao
depende do tempo, V = V (x, y, z), dizemos que o campo e estacionario (ou que o fluido esta em regime
permanente). Mais geralmente
V x = V x (t, x, y, z) ,
V y = V y (t, x, y, z) ,
V z = V z (t, x, y, z) ,
e V : I R3 e uma funcao vetorial definida no produto cartesiano I, onde R3 e uma

regiao aberta do espaco e I e um intervalo contendo 0 (que pode ser simplesmente o extremo esquerdo deste
intervalo).
Denote por F(x, t) o campo de escoamento (flow field ) de um campo de velocidades V de um fluido.
Por definicao, isso significa que
dF
(
(t, x) = V(t, F (t, x)),
dt
F(0, x) = x.
Em outras palavras, fixado x , F (t, x) e a trajetoria do campo de escoamento que passa por x no
instante t = 0: se uma partcula e posicionada dentro do fluido na posicao x, a sua posicao apos haver
decorrido um intervalo de tempo t e dada por F (t, x).
Para um campo de velocidades estacionario, as trajetorias do campo de escoamento sao fixas no espaco,
nao se modificando com o tempo. Assim, se uma partcula for posicionada na posicao x no instante de tempo
t1 e, logo em seguida, no instante de tempo t2 uma segunda partcula e posicionada na mesma posicao x, as
duas partculas seguirao a mesma trajetoria, ou seja, decorrido um intervalo de tempo t apos o instante de
tempo de posicionamento inicial de cada partcula, elas ocuparao a mesma posicao F (t, x) no espaco. Para
um campo de velocidades nao-estacionario, as trajetorias do campo nao tem uma forma fixa, variando com
o tempo: em cada instante de tempo t, o campo de escoamento tem uma forma diferente. Desta vez, se uma
partcula for posicionada na posicao x no instante de tempo t1 , a velocidade do fluido naquele instante e
V(t1 , x) e a partcula seguira uma certa trajetoria que tem esta velocidade inicial, enquanto que, se logo em
seguida no instante de tempo t2 uma segunda partcula e posicionada na mesma posicao x, a velocidade do
campo naquele momento sera V(t2 , x), possivelmente diferente da velocidade inicial da primeira partcula,
e muito provavelmente as duas partculas seguirao trajetorias completamente diferentes.
E importante nao confundir o conceito de trajetorias do campo de escoamento com o conceito de linhas
de corrente do escoamento. As linhas de corrente (streamlines) de um escoamento sao as curvas tangentes
ao campo de velocidades do escoamento. E claro que no caso de um campo estacionario as linhas de corrente
sao exatamente as trajetorias do campo. No caso de um campo nao-estacionario, entretanto, como o vetor
velocidade varia com o tempo, a trajetoria que uma partcula seguira apos ser posicionada em um ponto
dentro do fluido em um determinado instante de tempo em geral nao coincidira com a linha de corrente do
escoamento que passa por aquele ponto naquele momento. Para um campo de velocidades nao-estacionario,
as linhas de corrente variam em forma com o passar do tempo.
Outra maneira de enxergar o campo de escoamento e fixar t e considerar a funcao Ft : t , onde
t = Ft (). Ft (x) da a posicao da partcula que ocupava a posicao x no instante inicial apos decorrido
um intervalo de tempo t. A funcao Ft pode ser vista como a funcao que nos permite ver como regioes do
fluido sao deformadas atraves do escoamento: uma regiao 0 do fluido e deformada pelo escoamento, de
modo que apos decorrido um intervalo de tempo t ela e transformada na regiao Ft (0 ). Sob condicoes muito
gerais, esta transformacao e um difeomorfismo (a inversa e diferenciavel porque basta seguir as trajetorias
no sentido reverso para de Ft (0 ) voltar em 0 ).
As trajetorias de um campo de escoamento sao encontradas resolvendo-se a equacao diferencial ordinaria
com condicao inicial acima (e claro que, sendo F e V grandezas vetorias no espaco, esta equacao diferencial
ordinaria e na verdade um sistema de 3 equacoes diferenciais com 3 condicoes iniciais). Desde que V satisfaca
certas condicoes razoaveis de regularidade (por exemplo, se V for continuamente diferenciavel), a equacao
diferencial ordinaria acima sempre tem uma unica solucao, pelo menos localmente. Portanto, dado V,
podemos encontrar F. Em geral, nao e possvel encontrar F explicitamente (a funcao V pode ser muito
complicada), mas podemos obte-lo aproximadamente atraves de metodos numericos.
Reciprocamente, conhecendo-se o campo de escoamento F, e possvel encontrar o campo de velocidades
V. Essencialmente, basta derivar F em relacao ao tempo:
dF
V (t, x) = (t, F1
t (x)).
dt
Mais especificamente, V (t, x) e a derivada temporal da trajetoria do campo que passa pelo ponto F1
t (x)
no instante inicial t = 0, esta derivada sendo calculada no instante de tempo t. Se o campo de escoamento e
dado atraves de uma expressao fechada (e nao por uma expressao aproximada), entao podemos conhecer o
campo de velocidades com exatidao. Obviamente, e mais difcil encontrar F, dado V, do que encontrar V,
dado F.
15.5.1 Significado Geometrico do Divergente Espacial

Nossos campos vetoriais em geral serao funcoes dependendo de tres coordenadas espaciais e uma temporal:
V = V (t, x, y, z). Considere o divergente espacial de um campo vetorial, isto e, o divergente em relacao
as tres coordenadas espaciais, sem envolver a coordenada temporal,
V x V y V z
divx V = + + .
x y z
Defina
V (t, x) = det dFt (x),
isto e,
Ft1 (x) Ft1 (x) Ft1 (x)

x y z

Ft2 (x) Ft2 (x) Ft2 (x)
dFt (x) = ,
x y z
Ft3 (x) Ft3 (x) Ft3 (x)

x y z
onde escrevemos Ft (x) = (Ft1 (x), Ft2 (x), Ft3 (x)). Intuitivamente, V (t, x) mede o volume de um elemento
infinitesimal do fluido em diferentes pontos do escoamento (produto misto de tres vetores no espaco). Este
volume varia a medida que o elemento move-se ao longo de uma trajetoria do escoamento.
Para um campo de velocidades estacionario V = V(x), esta variacao infinitesimal por unidade de volume
e dada precisamente pelo divergente espacial divx V que neste caso de um campo estacionario e simplesmente
o divergente div V: o divergente do campo de velocidades estacionario de um fluido e a taxa de variacao do
volume de um elemento do fluido que se move ao longo de uma trajetoria do campo, por unidade de volume.
15.5 Teorema. Se V = V(x) e um campo vetorial estacionario, entao

1 dV(t)
div V(x) = .
V(0) dt t=0
Mais geralmente,
1 d
div V(Ft (x)) = det d (Ft )x .
det d (Ft )x dt
Prova 1: Consideraremos primeiro uma demonstracao elementar e bastante intuitiva da primeira equacao.
Fixe um ponto x no espaco. Considere > 0 pequeno e sejam v1 = i, v2 = j, v3 = k, onde i, j, k
sao os vetores da base canonica de R3 . O ponto x e os tres vetores v1 , v2 , v3 definem um paraleleppedo
P (0) no espaco com um de seus vertices localizado no ponto x e os outros vertices localizados nos pontos
x + v1 , x + v2 e x + v3 . Para cada t fixado, o escoamento Ft e uma funcao de R3 em R3 , ou seja, uma
funcao que leva pontos do espaco em outros pontos do espaco ao longo das trajetorias do escoamento; o
efeito visual de Ft e que cada ponto se move ao longo de sua trajetoria enquanto decorre o intervalo de
tempo t, apos o que ele para. Em particular, cada ponto do paraleleppedo move-se ao longo da trajetoria
a qual ele pertence, distorcendo o paraleleppedo no processo, de modo que Ft (P (0)) nao e mais, em geral,
um paraleleppedo. Por outro lado, se e pequeno (ou seja, vendo o paraleleppedo P (0) como um elemento
infinitesimal de volume aproximado), a imagem de P (0) sob Ft pode ser aproximada pela sua imagem sob
a derivada dFt de Ft : de fato, se v = (x + x) x = x e um pequeno vetor baseado em x, temos
Ft (x + x) Ft (x) dFt (x) x = dFt (x) v,
pois, por definicao de derivada direcional,
Ft Ft (x + sx) Ft (x)
d (Ft )x v = = lim .
v s0 s
Portanto, se e pequeno, o paraleleppedo P (0) e levado pelo escoamento do campo depois de decorrido um
intervalo de tempo t no paraleleppedo P (t) com um vertice em Ft (x) e os outros vertices localizados nos
pontos Ft (x) + v1 (t), Ft (x) + v2 (t) e Ft (x) + v3 (t), onde
v1 (t) = d (Ft )x v1 ,
v2 (t) = d (Ft )x v2 ,
v3 (t) = d (Ft )x v3 .
O volume do paraleleppedo P (t) e dado pelo produto misto:
V(t) = v1 (t) [v2 (t) v3 (t)] .
Logo, pela regra da derivada do produto e a propriedade de comutatividade do produto escalar com o produto
vetorial, segue que

dV dv1 dv2 dv3
= (v2 v3 ) + v1 v3 + v1 v2
dt dt dt dt
dv1 dv2 dv3
= (v2 v3 ) + (v3 v1 ) + (v1 v2 ) .
dt dt dt
Em t = 0, temos
v2 v3 = 2 i,
v3 v1 = 2 j,
v1 v2 = 2 k.
dvi (t)
Para calcular , lembramos a definicao do campo de escoamento F(t, x) do campo de velocidades V(x):
dt
dFt
(x) = V(Ft (x)).
dt
Derivando com relacao a x, temos
dFt
d (x) = d [V(Ft )]x .
dt
Invertendo a ordem de derivacao na derivada parcial mista do lado esquerdo e aplicando a regra da cadeia
no lado direito, temos
d
[d (Ft )x )] = dVFt (x) d (Ft )x . (15.10)
dt
Aplicando ambos os lados desta equacao ao vetor vi = vi (0) obtemos no lado esquerdo (pois vi e um vetor
constante)
d d dvi
[d (Ft )x ] vi = [d (Ft )x vi ] = (t),
dt dt dt
enquanto que no lado direito obtemos
dVFt (x) d (Ft )x vi = dVFt (x) vi (t).

Segue que
dvi
(t) = dVFt (x) vi (t). (15.11)
dt
Em particular, em t = 0 temos F0 (x) = x, donde

dvi
= dVx vi ,
dt t=0
Estamos agora em condicoes de concluir a demonstracao do teorema:

dV(t)
= 2 [(dV(x) (i)) i + (dV(x) (j)) j + (dV(x) (k)) k]
dt t=0
= 3 [(dV(x) i) i + (dV(x) j) j + (dV(x) k) k]
x
V y V z

3 V
= + +
x y z
= V(0) div V(x).
Prova 2: Mostraremos que

d
det d (Ft )x = div V(Ft (x)) det d (Ft )x .
dt
Pela regra da cadeia,
d d
det d (Ft )x = d (det)d(Ft ) [d (Ft )x ] .
dt x dt
Lembremos a derivada da funcao determinante det : R3 R3 R3 R. Escrevendo det X = det(X1 , X2 , X3 ),

onde X1 , X2 , X3 sao as linhas da matrix X, a derivada do determinante em X e o funcional linear
d (det)X : R3 R3 R3 R
cujo valor na matriz A = (A1 , A2 , A3 ) e
d (det)X A = det(A1 , X2 , X3 ) + det(X1 , A2 , X3 ) + det(X1 , X2 , A3 ).
Segue que
d (det)d(Ft ) A = det([d (Ft )x ]1 , X2 , X3 ) + det(X1 , [d (Ft )x ]2 , X3 ) + det(X1 , X2 , [d (Ft )x ]3 )

x
onde [d (Ft )x ]i denota a i-esima linha da matriz d (Ft )x . Por outro lado, pela comutatividade dos operadores
d
diferenciais d e e pela regra da cadeia, temos
dt

d dFt
[d (Ft )x ] = d (x) = d [V(Ft (x))] = dVFt (x) d (Ft )x .
dt dt
Logo,
d
d (det)d(Ft ) [d (Ft )x ]
x dt

= det dVFt (x) d (Ft )x 1 , [d (Ft )x ]2 , [d (Ft )x ]3

+ det [d (Ft )x ]1 , dVFt (x) d (Ft )x 2 , [d (Ft )x ]3

+ det [d (Ft )x ]1 , [d (Ft )x ]2 , dVFt (x) d (Ft )x 3 .

onde dVFt (x) d (Ft )x i denota a i-esima linha da matriz dVFt (x) d (Ft )x . Da, usando a linearidade da funcao
determinante com relacao a uma linha fixada, temos

det dVFt (x) d (Ft )x 1 , [d (Ft )x ]2 , [d (Ft )x ]3
P V x Ftj P 3 V x F j 3 V x F j
3
t P t
j j j
j=1 x x j=1 x y j=1 x z

2 2 2

= det Ft Ft Ft

x y z

3 3 3
Ft Ft Ft
x y z
x 1 x 1 x 1

V Ft V Ft V Ft V x Ft2 V x Ft2 V x Ft2
x x x y x z y x y y y z
2 2 2
2 2

Ft Ft Ft Ft Ft Ft2
= det + det
x y z x y z
3 3 3 3 3 3

Ft Ft Ft Ft Ft Ft
x y z x y z
x 3 x 3 x 3

V Ft V Ft V Ft
xz x z y z z
2 2

Ft Ft Ft2
+ det

x y z
Ft3 Ft3 Ft3

x y z
1

Ft Ft1 Ft1 Ft2 Ft2 Ft2 Ft3 Ft3 Ft3
x y z x y z x y z
V x V x V x

Ft2 Ft2 Ft2 Ft2 Ft2 Ft2 Ft2 Ft2 Ft2
= det
+ det +
xz det

x x3 y z y x y z x y z
Ft3 Ft3 Ft3 Ft3 Ft3 Ft3 Ft3 Ft3

Ft
x y z x y z x y z
V x
= det d (Ft )x .
x
Similarmente,
V y
det [d (Ft )x ]1 , dVFt (x) d (Ft )x 2 , [d (Ft )x ]3 = det d (Ft )x ,
y
V z
det [d (Ft )x ]1 , [d (Ft )x ]2 , dVFt (x) d (Ft )x 3 = det d (Ft )x .
z
Portanto,
V x V y V z

d
d (det)d(Ft ) [d (Ft )x ] = Ft (x) + Ft (x) + Ft (x) det d (Ft )x
x dt x y z
= div V(Ft (x)) det d (Ft )x .
15.5.2 Significado Fsico do Divergente

Pelo Teorema de Gauss, Z Z
div V = V ,

onde, por definicao, o lado direito e o fluxo total do campo V atraves da superfcie . Em particular,
se div V = 0 em um aberto de Rn , o fluxo total e nulo atraves de qualquer superfcie fechada contida no
aberto. Pelo Teorema do Valor Medio para Integrais,
Z
1
div V = div V (x)
vol
para algum x . Portanto, Z

1
div V (x) = lim div V.
0 vol B (x) B (x)
Consequentemente, Z
1
div V (x) = lim V .
0 vol B (x) S (x)
Assim, o divergente mede infinitesimalmente o fluxo total por unidade de volume.

Captulo 16
Equacao de Einstein
16.1 Equacao de Newton para o Potencial Gravitacional

O analogo Newtoniano da equacao de Einstein e a equacao de Poisson para o potencial gravitacional
= 4G, (16.1)
onde e a densidade de massa e G denota a constante gravitacional de Newton. Em Mecanica Newtoniana,

a gravidade e gerada apenas por massa.
Vamos ver como esta equacao e deduzida. No caso de uma unica fonte puntual de massa M localizada na
origem 0, e comprovado experimentalmente que a forca gravitacional atraindo uma partcula teste de massa
m e
GM m
F = mg = r,
r2
b
onde g e a aceleracao da gravidade, r e o vetor posicao radial partindo da fonte e b

r denota o seu vetor unitario.
O campo gravitacional G, isto e, a forca gravitacional agindo em um certo ponto do espaco localizado em r
por unidade de massa, e portanto dado por
GM
G= r.
r2
b
[Note que G e G denotam conceitos completamente diferentes, nao relacionados.] Assim, pela segunda lei
de Newton, o campo gravitacional G por definicao nada mais e que a aceleracao da gravidade g:
F
G= = g.
m
Considerando um aberto contendo a fonte 0 tal que sua fronteira e uma superfcie regular fechada ,
segue que Z Z
1
G n ds = GM 2
rn ds.
b
r
16.1 Lema. Se R3 e um aberto tal que sua fronteira e uma superfcie regular fechada e 0
/ ,
vale Z
1 4 se 0 ,
rn ds =
2 0 se 0
/ .
b
r
Prova: Primeiro observamos que
r
b
div = 0.
r2
229
De fato,
r
b x x1 , x2 , x3
= 3 = hP i3/2 ,
r2 kxk 3 2
(xi ) i=1
de modo que
hP
3 2 i3/2 2 hP3 2 i1/2
xi 3 xi xi
" i # i
r
b x i=1 i=1
i = i h i3/2 =

r2 P3 2
hP
3 2
i5/2
i=1 (xi ) i=1 (xi )
2
1 3 xi
= 2 4 ,
kxk kxk
logo
3 i P3 2
xi

r X r 3 i=1
3
b b
div 2 = i = 2 4 = 0.
r i=1
r2 kxk kxk
1
Considere primeiro o caso 0
/ , de modo que o campo vetorial 2 b r e um campo suave em . Podemos
r
entao aplicar o Teorema da Divergencia para obter
Z Z
1 r
n
b
2
r
b ds = div 2 dv = 0.
r r
1
Se 0 , o campo vetorial r tem uma singularidade em 0 e o Teorema da Divergencia nao se aplica
r2
b
a regiao . Considere entao uma esfera de raio R centrada em 0 e contida em . Entao o aberto \BR (0)
cuja fronteira e SR (0) nao contem a singularidade 0, logo segue do resultado anterior que
Z
1
2
rn ds = 0.
b
SR (0) r
Como Z Z Z
1 1 1
rn ds = rn ds + rn ds,
r2 r2 r2
b b b
SR (0) SR (0)
temos que Z Z
1 1
rn ds = rn ds.
r2 r2
b b
SR (0)
Nesta ultima integral, para manter a convencao de n ser o vetor normal apontando para fora da superfcie
em relacao ao aberto que ela engloba, o vetor n aponta para dentro da esfera, isto e,
n = b
r,
de modo que Z Z
1 1 1
2
rn ds = 2 ds = 4R2 = 4.
R2
b
r R

Segue do Lema 16.1 que Z
G n ds = 4GM.

Tambem segue dela que se e um aberto tal que nao contem a fonte, teremos
Z
G n ds = 0.

Isso significa que cada partcula de massa M dentro da regiao contribui para a integral de superfcie o
valor 4GM , enquanto que partculas fora da regiao nao contribuem nada. Portanto, o valor da integral
e 4G vezes a massa total dentro da regiao . Para uma distribuicao contnua de massa com densidade
de massa (x), a massa total dentro da regiao e dada por
Z
dv.

Consequentemente, Z Z
G n ds = 4G dv

Mas, pelo Teorema da Divergencia, tambem temos que
Z Z
G n ds = div G dv,

logo, Z
[div G + 4G] dv = 0.

Como isso e valido para qualquer domnio com fronteira regular arbitrario, segue que
div G = 4G.
Mas o potencial gravitacional e definido por

G =
(como o campo gravitacional e conservativo, isto e, satisfaz rot G = 0, a existencia de esta assegurada),
donde
div () = 4G,
e da
= 4G. (16.2)
16.2 Deducao da Equacao de Einstein

A primeira tentativa de Einstein em obter uma equacao equivalente para a sua nova teoria de gravitacao
foi simplesmente substituir o potencial gravitacional por gij . O problema e que g = 0, logo g = 0
tambem. Este motivo levou Einstein a abandonar a busca por uma equacao covariante, contentando-se em
uma equacao invariante apenas por transformacoes de coordenadas especiais (veja mais detalhes em [Pais],
p. 221; para a trajetoria completa de Einstein ate chegar na equacao correta, veja na mesma referencia
citada os Captulos 12-14). Ele levou alguns anos ate chegar na equacao (16.4) que veremos a seguir.
Na Teoria da Relatividade Geral de Einstein, gravidade e simplesmente a curvatura do espacotempo
e esta e gerada pelo tensor de momento-energia T . Como vimos no captulo anterior, ele e um 2-tensor
simetrico e pela lei de convervacao da energia satisfaz
div T = 0.
Na equacao de Einstein, a fonte da curvatura T do espacotempo e colocada no lado direito da equacao,

enquanto que no lado esquerdo teremos um objeto que caracteriza a curvatura do espacotempo, logo este
deve ser tambem um 2-tensor simetrico com divergencia nula. Chamamos este tensor de tensor de Einstein
e o denotamos por G. Desta forma, a equacao para a geracao da gravidade (isto e, para o efeito da massa-
energia sobre a curvatura do espacotempo) e
G = T,
onde e uma constante de proporcionalidade a ser determinada mais tarde (o fato que ira determina-la e
simplesmente a exigencia que no limite para campos gravitacionais estaticos, relativamente fracos, ela devera
corresponder a lei da gravitacao universal de Newton). Portanto, o 2-tensor simetrico G deve ser construdo
apenas a partir do tensor da curvatura de Riemann e da metrica, deve satisfazer div G = 0 e deve ser em
princpio uma funcao linear da curvatura (se vamos medir a curvatura, nao ha motivo para medi-la de uma
forma complicada, nao linear). Estas exigencias naturais determinam o tensor G:
1
G = Ric Sg. (16.3)
2
Em termos de componentes, a equacao de Einstein se escreve na forma covariante
1
Rij Sgij = Tij , (16.4)
2
e na forma contravariante
1
Rij Sg ij = T ij . (16.5)
2
A equacao de Einstein e portanto um sistema de 10 equacoes independentes, ja que os tensores envolvidos sao
simetricos. Cada uma destas equacoes e uma equacao parcial diferencial nao linear de segunda ordem, isto
2
e, envolvendo gij , k gij e kl gij , as componentes da metrica e suas derivadas parciais de primeira e segunda
ordem. Por outro lado, gij sao as componentes da metrica em algum sistema de coordenadas particular,
e como ha 4 coordenadas, temos 4 graus de liberdade, o que em princpio deveria tornar impossvel obter
uma solucao unica a partir de dados iniciais e de fronteira, como em problemas bem determinados tpicos de
EDPs. No entanto, a condicao G = 0, que corresponde a 4 equacoes, faz com que o sistema efetivamente
possua apenas 6 equacoes independentes para as 6 componentes gij que permitem caracterizar a geometria
independentemente das coordenadas.
Podemos obter a curvatura escalar exclusivamente em termos do tensor momento-energia, o que ajuda
muito em certos calculos. De fato, fazendo a contracao em relacao a metrica da equacao de Einstein, como
trg Ric = S,
trg g = 4,
obtemos
S = trg T. (16.6)
Em termos de componentes,
S = g ij Tij = Tii = gij T ij .
Assim, a equacao de Einstein pode reescrita na forma

1
Ric = T (trg T ) g . (16.7)
2
Em particular, a equacao de Einstein no vacuo (T = 0) e
Ric = 0.
Isso nao significa que a curvatura do espacotempo no vacuo e nula, pois o tensor de Ricci nao contem toda
a informacao da curvatura: podemos ter Ric = 0 mas R 6= 0 (isso acontece com a metrica de Schwarzschild,
como veremos mais tarde).
16.2.1 O Tensor de Einstein tem Divergencia Nula

16.2 Proposicao. Vale
div G = 0.
Prova: Temos
1
div G = div Ric div (Sg)
2
Pela Proposicao 14.16,
S
div Ric = .
2
Pela Definicao 14.15,
[div (Sg)]i = g jk k (Sgij ) = g jk (k S) gij + Sg jk k gij .
Como (Proposicao 14.4 ou 14.11)
g = 0,
segue que
[div (Sg)]i = gij g jk (k S) = ik k S = i S,
donde
div (Sg) = S.
Da,
S S
div G = = 0.
2 2
16.2.2 O Limite Newtoniano

Consideraremos agora um campo gravitacional estatico, fraco.
O movimento de uma partcula livre no espacotempo segue uma geodesica. Parametrizando pelo tempo
proprio , a equacao da geodesica e dada por
d2 xk dxi dxj
2
+ kij = 0,
d d d
para k = 0, 1, 2, 3, x0 = ct.
Primeiro vamos usar o princpio de equivalencia para obter uma expressao para a aceleracao da gravidade.
Considere uma partcula livre no seu referencial comovente temporario em que ela esta em repouso, de modo
que
dxj
= 0, i = 1, 2, 3,
d
dx0 dt
=c .
d d
Para k = 1, 2, 3, temos entao que
2
d2 xk

dt
= c2 k00 .
d 2 d
Escolhendo t = , segue que
d2 xk
= c2 k00 ,
d 2
isto e, a aceleracao da partcula e
a = c2 100 , 200 , 300 .

(16.8)
Esta e, pelo princpio de equivalencia, a aceleracao da gravidade g. Suas componentes sao os smbolos
de Christoffel 100 , 200 , 300 . Vamos calcular estes smbolos em um campo gravitacional fraco.
A hipotese de um campo gravitacional fraco permite escrever a metrica do espacotempo na forma
gij = ij + hij ,
onde ij e a metrica de Minkowski e hij e uma pequena perturbacao, isto e,
|hij | 1.
Assumindo que o tensor metrica g e h sao diagonais (o que e razoavel, ja que o tensor momento-energia
e, conforme veremos mais abaixo), temos
gij = 0, se i 6= j,
donde
1
g ii = ,
gii
g ij = 0, se i 6= j,
e o smbolo de Christoffel k00 , k = 1, 2, 3, e entao dado por

1
k00 = (0 g0k + 0 g0k k g00 ) g mk
2
1 k g00
=
2 gkk
1 k (00 + h00 )
=
2 kk + hkk
1 k h00
= .
2 1 + hkk
Como |hkk | 1, podemos escrever
1
k00 = k h00 .
2
Portanto,
c2
g= (1 h00 , 2 h00 , 3 h00 ) .
2
Mas
g = ,
logo
c2
k = k h00 ,
2
donde
c2
= h00 . (16.9)
2
Isso mostra que apenas a componente h00 do tensor h contribui para a aceleracao da gravidade no limite
Newtoniano. E razoavel assumir
|hij | |h0j | |h00 |
isto e, todas as componentes hij = 0 exceto h00 , porque o tensor momento-energia satisfaz esta condicao,
como veremos mais abaixo (veja [Shutz], p. 194, para maiores detalhes), obtendo a metrica g na forma
ds2 = (1 h00 ) c2 dt2 + dx2 + dy 2 + dz 2 ,

ou seja
2
ds = 1 + 2 c2 dt2 + dx2 + dy 2 + dz 2 .
2
(16.10)
c
Queremos apenas determinar . Usando as equacoes de Einstein na forma (16.7), escolhemos trabalhar
com a equacao
1
R00 = T00 g00 trg T .
2
Vamos calcular primeiro R00 . Como
k
Rij = Rkij ,
segue que
k
R00 = Rk00 ,
0
ja que R000 = 0, pelas simetrias do tensor endomorfismo curvatura. Temos
l
ljk lik
Rijk = m l
jk im m l
ik jm +
i
.
x xj
Mas, como |h00 | 1, a metrica e aproximadamente de Minkowski e podemos assumir que os smbolos de
Christoffel se anulam, pois
1
kij = (i gjm + j gim m gij ) g mk
2
e as componentes da metrica gij sao aproximadamente constantes, logo suas derivadas se anulam. Portanto,
l
ljk lik
Rijk = i
.
x xj
Da,
k k00 kk0
Rk00 = k
.
x x0
Como estamos supondo um campo estatico, que nao depende da variavel temporal x0 , qualquer derivada em
relacao a esta variavel e nula, logo
k k00
Rk00 =
xk
e
1
k00 = (i gjm + j gim m gij ) g mk
2
1
= (0 g0m + 0 g0m m g00 ) g mk
2
1
= (m g00 ) g mk
2
1
= (k g00 ) g kk .
2
Assim, para k = 1, 2, 3,
k 1 2 1
kk g00 g kk = 2 kk
2

Rk00 = .
2 c
Consequentemente,
1
R00 = . (16.11)
c2
O tensor momento-energia para fluidos perfeitos velocidades baixas (v/c 0) e dominado pelo compo-
nente T 00 = c2 e as outras componentes podem ser consideradas nulas. Portanto, usando g00 00 = 1,
obtemos
trg T = 00 T 00 = c2
e
1 1
T00 g00 trg T = T00 00 00 T 00

2 2
1
= T00
2
1
= c2 .
2
Conclumos que no limite Newtoniano a equacao

1
R00 = T00 + g00 trg T
2
e
1 2
= c . (16.12)
2
Comparando com a equacao da gravitacao universal de Newton (16.2)
= 4G,
conclumos que
8G
=
, (16.13)
c2
as vezes chamada a constante gravitacional de Einstein. Usando unidades geometrizadas G = c = 1, a
equacao de Einstein se escreve na forma
1
Ric Sg = 8T. (16.14)
2
16.3 Postulado Geodesico como Consequencia da Equacao de Eins-

tein
O princpio que partculas livres percorrem trajetoria geodesicas no espacotempo e as vezes conhecido como
o postulado geodesico. Na verdade ele e uma consequencia logica da equacao de Einstein, como veremos.
A equacao de Einstein na forma contravariante quando T = (u u) e o tensor poeira e
G = ui uj .
Como div G = 0, segue que

div [ (u u)] = 0.
Em coordenadas,
ui uj

;i
= 0.
Pela regra do produto,
ui uj + ui uj;i = 0

;i
ou
ui uj + ui uj;i = 0.

;i
(16.15)
Derivando
2
kuk = gij ui uj = ui uj = 1, (16.16)
obtemos
uj uj

;i
= 0,
donde, novamente pela regra do produto,
uj;i uj + uj uj;i = 0.
Descendo e subindo ndices no primeiro termo desta equacao
uj;i uj = uj uj;i = g kj uk uj;i

= uk g kj uj;i = uk uk;i
= uj uj;i ,
vemos que ela e igual ao segundo termo, donde
uj;i uj = 0. (16.17)
Voltando a (16.15), multiplicamos ela por uj , obtendo
uj uj ui + ui uj uj;i = 0

;i
que se reduz por (16.16) e (16.17) a

ui

;i
= 0.
Este e o primeiro termo em (16.15), logo conclumos que
ui uj;i = 0.
Como 6= 0, segue que

ui uj;i = 0. (16.18)
Lembrando que
uj
uj;i = + uk jki
xi
e
xj
uj = ,

temos que
2 xj xk j
uj;i = + .
xi ik
Notando que
2 xj 0 se i 6= 0,
= 2 xj
xi se i = 0,
2
vemos que (16.18) e a equacao geodesica:
2 xj xi xk j
+ = 0.
2 ik
16.4 A Constante Cosmologica

Quando o espacotempo e plano, isto e, R = 0, segue que Ric = 0 e S = 0. Portanto, em um espacotempo
plano, o tensor de Einstein se anula:
G = 0.
Assim, G e uma medida da metrica e tambem da curvatura. Alem disso, no vacuo onde T = 0, pelas
equacoes (16.2) e (16.7) temos
G = 0,
assim como
S = 8 trg T = 0
e
1
Ric = 8 T (trg T ) g = 0.
2
Isso nao implica necessariamente que R = 0, ja que o tensor de Ricci nao contem toda a informacao do
tensor curvatura de Riemann, mas e um resultado esperado.
Por outro lado, a equacao de Einstein aplicada ao universo todo prediz um universo dinamico, nao estatico
(veja [MTW], Cap. 27). Quando Einstein percebeu isso em 1917, ele modificou sua equacao, introduzindo
uma constante cosmologica para que o universo permanecesse estatico:
G + g = 8T.
Observe que o tensor G + g continua sendo livre de divergencia. Esta equacao modificada admite uma
solucao estatica para o universo (veja [MTW], Cap. 27, Box 27.5). Por outro lado, no vacuo onde T = 0, a
equacao modificada de Einstein se torna
1
Ric Sg + g = 0,
2
ou seja,
G = g
e nao mais G = 0, de modo que podemos dizer que a constante cosmologica mede a densidade de energia
do vacuo (o que e consistente com a nocao de que o vacuo nao e realmente vazio de acordo com a teoria
quantica). Tomando o traco desta equacao com respeito a metrica, como trg Ric = S e trg g = 4, segue que
S 2S + 4 = 0
ou seja,
S = 4.
Segue que a equacao de Einstein para o vacuo e
Ric = g.
Portanto, a curvatura do vacuo nao e a mais a curvatura nula do espacotempo de Minkowski.

Imediatamente depois que os resultados de Hubble sobre a expansao do universo (desvio para o vermelho
da luz das galaxias, indicando o afastamento mutuo delas) se tornaram conhecidos em 1930, Einstein consi-
derou como o seu maior erro a introducao da constante cosmologica na sua equacao da relatividade geral (se
nao a tivesse removido, ele poderia reinvindicar a expansao do universo como uma das predicoes da teoria) e
novamente a removeu, o que equivale efetivamente a considerar = 0. Quando no final da decada de 90 foi
observada a aceleracao da expansao do universo, ela foi reintroduzida, com valor positivo a ser determinado
atraves de experimentos. Mas as observacoes recentes indicam que o seu valor e bem proximo de zero (da
ordem de 10122 em unidades naturais adimensionais), de modo que no vacuo o espacotempo e realmente
bem proximo ao espacotempo de Minkowski.
Captulo 17
A Solucao de Schwarzschild
A primeira solucao para a equacao de Einstein

1
Ric Sg = 8T
2
foi obtida em dezembro de 1915 por Schwarzschild, para a surpresa de Einstein, que achava que dificilmente
seriam obtidas solucoes exatas para a sua equacao.
O espacotempo de Schwarzschild e o modelo relativstico mais simples de um universo contendo uma
unica estrela. A estrela e assumida ser estatica, isto e, sem rotacao (ou com velocidade de rotacao fisicamente
desprezvel), e esfericamente simetrica. O modelo resultante pode ser aplicado a regioes em torno de qualquer
objeto astronomico isolado que satisfaz estas condicoes aproximadamente, tais como planetas, estrelas e
buracos negros. No caso do sistema solar, ela prove um modelo mais preciso que o Newtoniano.
17.1 Metrica Plana em Coordenadas Esfericas

O espaco tridimensional menos a origem R3 \ {0} e difeomorfo ao produto cartesiano R+ S2 , onde R+ =
(0, +). Isso permite definir coordenadas esfericas para R3 \ {0}. Desta forma, podemos definir um di-
feomorfismo de R R+ S2 para o espacotempo de Minkowski M ou um atlas para M de sistemas de
coordenadas esfericas por
(t, r, , ) = (t, r sen cos , r sen sen , r cos ) .
Por exemplo, uma carta deste atlas seria (, R (0, +) (0, ) (0, 2)); variando o domnio de e ,
cobrimos todo M com excecao da origem. Note que aqui = constante denota paralelos e = constante
denota meridianos (o exemplo de carta dado deixa de cobrir um semiplano fechado de R3 ). Neste tipo de
carta temos
0 = t = (1, 0, 0, 0) ,
1 = r = (0, sen cos , sen sen , cos ) ,
2 = = (0, r cos cos , r cos sen , r sen ) ,
3 = = (0, r sen sen , r sen cos , 0) ,
239
e os coeficientes gij da metrica de Lorentz sao dados por
g00 = h0 , 0 i = 1,
g01 = g10 = h0 , 1 i = 0,
g02 = g20 = h0 , 1 i = 0,
g03 = g30 = h0 , 1 i = 0,
g11 = h1 , 1 i = 1,
g12 = g21 = h1 , 2 i = 0,
g13 = g31 = h1 , 3 i = 0,
g22 = h2 , 2 i = r2 ,
g23 = g32 = h2 , 3 i = 0,
g33 = h3 , 3 i = r2 sen2 .
Portanto, em coordenadas esfericas, a metrica de Lorentz para o espacotempo de Minkowski se escreve na

forma
ds2 = dt2 + dr2 + r2 d2 + r2 sen2 d2 .
Denotando o elemento de area da esfera por
d 2 = d2 + sen2 d2 ,
podemos tambem escrever de forma mais sucinta
ds2 = dt2 + dr2 + r2 d 2 . (17.1)
No caso de uma estrela esfericamente simetrica, o espacotempo resultante deve ser esfericamente simetrico.
Como a estrela tambem e suposta estatica, a metrica nao deve depender da variavel temporal t. Assim, a
metrica de Schwarzschild deve ser do tipo
ds2 = A (r) dt2 + B (r) dr2 + C (r) d 2 .
Fazendo uma mudanca de variavel em R+ , podemos considerar C (r) = r2 , logo podemos escrever a metrica
de Schwarzschild na forma
ds2 = T (r) dt2 + D (r) dr2 + r2 d 2 .
Nesta normalizacao, em cada espaco de repouso t = constante, a superfcie r = constante e a esfera padrao
S2r de raio r, com curvatura gaussiana 1/r2 e area 4r2 .
A unica fonte de gravitacao no universo de Schwarzschild e a propria estrela, que nao modelamos. Logo
o espacotempo e um vacuo e a equacao de Einstein implica que
Ric = 0,
isto e, a metrica de Schwarzschild tem curvatura de Ricci nula.

Finalmente, longe da fonte de gravitacao, a influencia deve ser arbitrariamente pequena, de modo que a
metrica de Schwarzschild deve aproximar a metrica plana do espaco de Minkowski (17.1) e portanto
lim T (r) 1,
r+
lim D (r) 1.
r+
Veremos que estas condicoes determinam as funcoes T (r) e D (r).

17.2 Produtos Dobrados

O espacotempo de Scharzschild e um exemplo particular de uma variedade metrica do tipo produto dobrado.
17.2.1 Espacotempos Estaticos

17.1 Definicao. Sejam M 3 uma variedade riemanniana de dimensao 3 e f C (M ) uma funcao positiva.
Se I e um intervalo aberto, definimos o espacotempo estatico padrao como sendo a variedade de Lorentz
I M com a metrica
f dt2 + ds2 .
17.3 Metrica de Schwarzschild

17.2 Resumo.
17.3 Proposicao. Seja
ds2 = T (r) dt2 + D (r) dr2 + r2 d 2
uma metrica de Lorentz em R R+ S2 que satisfaz Ric = 0 e
lim T (r) 1,
r+
lim D (r) 1.
r+
Entao
T (r) = f (r) ,
1
D (r) = ,
f (r)
com
2M
f (r) = 1 .
r
17.4 Definicao. Considere a variedade diferenciavel M = R (2M, +) S2 . M torna-se uma variedade
de Lorentz quando definimos nela a metrica de Schwarzschild

2M 1
ds2 = 1 dt2 + dr2 + r2 d2 + r2 sen2 d2 . (17.2)
r 2M
1
r

Para as coordenadas de Schwarzschild (t, r, , ) temos

2M r 2M
g00 = 1 = ,
r r
1 r
g11 = = ,
2M r 2M
1
r
g22 = r2 , (17.3)
2 2
g33 = r sen ,
gij = 0 se i 6= j.
A metrica de Schwarzschild e ortogonal e, portanto, e facil trabalhar com ela. Em particular,

r
g 00 = ,
r 2M
r 2M
g 11 = ,
r
1
g 22 = 2, (17.4)
r
1
g 33 = 2 ,
r sen2
g ij = 0 se i 6= j.
Verificaremos agora que a metrica de Schwarzschild tem curvatura de Ricci nula, mas o seu tensor curvatura
nao e nulo, logo M nao e localmente isometrica a metrica plana.
17.5 Lema. Os 40 smbolos de Christoffel para a metrica de Schwarzschild sao
M
0 0 0
r (r 2M )
M
0ij = 0 0 0 ,

r (r 2M )
0 0 0 0
0 0 0 0
M (r 2M )

0 0 0
r3
M
1ij =
0 0 0 ,

(17.5)
r (r 2M )
0 0 (r 2M ) 0
0 0 0 (r 2M ) sen2
0 0 0 0 0 0 0 0

1 1
0 0 0 0 0 0

2ij = r 3 r .

, ij =
1 0 0 0 cot
0 0 0
1

r
0 0 0 sen cos 0 cot 0
r
Prova: Os smbolos de Christoffel sao dados por
1
kij = (i gjm + j gim m gij ) g mk .
2
Como g mk = 0 se m 6= k, segue que
1
kij = (i gjk + j gik k gij ) g kk . (17.6)
2
Temos
2M
1 g00 = ,
r2
2M
1 g11 = 2,
(r 2M )
1 g22 = 2r, (17.7)
2
1 g33 = 2r sen ,
2 g33 = 2r2 sen cos ,
e, caso contrario,
k gij = 0. (17.8)
Logo, de (17.3), (17.4), (17.6) e (17.7) segue que, para k = 0,
1 1
2 2
000 = (0 g00 ) g 00 = 0,
1 1
001 = 010 = (0 g10 + 1 g00 ) g 00 = (1 g00 ) g 00
2 2
M
= ,
r (r 2M )
1
002 = 020 = (0 g20 + 2 g00 ) g 00 = 0,
2
1
003 = 030 = (0 g30 + 3 g00 ) g 00 = 0,
2
011 = (1 g10 ) g 00 = 0,
1
012 = 021 = (1 g20 + 2 g10 ) g 00 = 0,
2
1
013 = 031 = (1 g30 + 3 g10 ) g 00 = 0,
2
022 = (2 g20 ) g 00 = 0,
1
023 = 032 = (2 g30 + 3 g20 ) g 00 = 0,
2
033 = (3 g30 ) g 00 = 0;
para k = 1,
1
1ij = (i gj1 + j gi1 1 gij ) g 11 ,
2
1 1
100 = (20 g01 1 g00 ) g 11 = (1 g00 ) g 11
2 2
M 2M 2 M (r 2M )
= 2 3 = ,
r r r3
1
101 = 110 = (0 g11 + 1 g01 1 g01 ) g 11 = 0,
2
1
102 = 120 = (0 g21 + 2 g01 1 g02 ) g 11 = 0,
2
1
103 = 130 = (0 g31 + 3 g01 1 g03 ) g 11 = 0,
2
1 M
111 = (1 g11 ) g 11 = ,
2 r (r 2M )
1
112 = 121 = (1 g21 + 2 g11 2 g12 ) g 11 = 0,
2
1
113 = 31 = (1 g31 + 3 g11 1 g13 ) g 11 = 0,
1
2
1 1
122 = (22 g21 1 g22 ) g 11 = (1 g22 ) g 11 = 2M r,
2 2
1
123 1
= 32 = (2 g31 + 3 g21 1 g23 ) g 11 = 0,
2
1 1
133 = (23 g31 1 g33 ) g 11 = (1 g33 ) g 11 = (2M r) sen2 ;
2 2
para k = 2,
1
2ij = (i gj2 + j gi2 2 gij ) g 22 ,
2
1
200 = (0 g02 + 0 g02 2 g00 ) g 22 = 0,
2
1
201 = 210 = (0 g12 + 1 g02 2 g01 ) g 22 = 0,
2
1
202 = 20 = (0 g22 + 2 g02 2 g02 ) g 22 = 0,
2
2
1
203 = 30 = (0 g32 + 3 g02 2 g03 ) g 22 = 0,
2
2
1
211 = (1 g12 + 1 g12 2 g11 ) g 22 = 0,
2
1 1 1
212 = 221 = (1 g22 + 2 g12 2 g12 ) g 22 = (1 g22 ) g 22 = ,
2 2 r
1
213 = 231 = (1 g32 + 3 g12 2 g13 ) g 22 = 0,
2
1
222 = (2 g22 ) g 22 = 0,
2
1
223 = 232 = (2 g32 + 3 g22 2 g23 ) g 22 = 0,
2
1 1
233 = (3 g32 + 3 g32 2 g33 ) g 22 = (2 g33 ) g 22 = sen cos ;
2 2
e, finalmente, para k = 3,
1 1
2 2
1
300 = (0 g03 + 0 g03 ) g 33 = 0,
2
1
301 = 310 = (0 g13 + 1 g03 ) g 33 = 0,
2
1
302 = 20 = (0 g23 + 2 g03 ) g 33
3
= 0,
2
1
303 = 30 = (0 g33 + 3 g03 ) g 33
3
= 0,
2
311 = (1 g13 ) g 33 = 0,
1
312 = 321 = (1 g23 + 2 g13 ) g 33 = 0,
2
1 1 1
313 = 31 = (1 g33 + 3 g13 ) g 33
3
= (1 g33 ) g 33 = ,
2 2 r
322 = (2 g23 ) g 33 = 0,
1 1 cos
323 = 332 = (2 g33 + 3 g23 ) g 33 = (2 g33 ) g 33 = ,
2 2 sen
333 = (3 g33 ) g 33 = 0.
17.6 Proposicao. A metrica de Schwarzschild satisfaz
Ric = S = 0. (17.9)
Ela nao e uma metrica plana, pois o seu tensor curvatura nao e nulo, mas e uma metrica assintoticamente
plana, isto e,
l
Rijk 0 quando r 0.
Prova: As componentes do tensor endomorfismo curvatura sao dadas por
l
Rijk = m l m l l l
jk im ik jm + i jk j ik
A curvatura de Ricci e dada por

k
Rij = Rkij ,
portanto vamos calcular apenas
k
Rkij = m k m k k k
ij km kj im + k ij i kj .
k
Lembramos que Rkkj = 0. Usando (17.5), para ij = 00 temos
k
Rk00 = m k m k k k
00 km k0 0m + k 00 0 k0
= 100 kk1 0k0 k00 1k0 k01 + k k00 ,

donde
0
R000 = 0,
1
R100 = 100 111 010 100 110 101 + 1 100 = 100 111 010 100 + 1 100
6M 2

M (r 2M ) M M M (r 2M ) 2M
= + 3 + 4
r3 r (r 2M ) r (r 2M ) r3 r r
2M 2 2M 6M 2 4M 2 2M
= 4 3 + 4 = 4 3 ,
r r r r r
2
R200 = 100 221 020 200 120 201 + 2 200 = 100 221
M (r 2M ) 1 M 2M 2
= = ,
r3 r r3 r4
3
R300 = 00 31 30 00 30 01 + 3 300 = 100 331
1 3 0 3 1 3
M (r 2M ) 1 M 2M 2
= = ,
r3 r r3 r4
logo
R00 = 0; (17.10)
para ij = 01 temos
k
Rk01 = m k m k k k
01 km k1 0m + k 01 0 k1
= 101 kk1 0k1 k00 1k1 k01 + k k01 ,

donde
0
R001 = 0,
1
R101 = 101 111 011 100 111 101 + 1 101 = 0,
2
R201 = 101 221 021 200 121 201 + 2 201 = 0,
3
R301 = 101 331 031 300 131 301 + 3 301 = 0,
logo
R01 = R10 = 0; (17.11)
para ij = 02 temos
k
Rk02 = m k m k k k
02 km k2 0m + k 02 0 k2
= 1k2 k01 ,
donde
0
R002 = 0,
1
R102 = 112 101 = 0,
2
R202 = 122 201 = 0,
3
R302 = 132 301 = 0,
logo
R02 = R20 = 0; (17.12)
para ij = 03 temos
k
Rk03 = m k m k k k
03 km k3 0m + k 03 0 k3
= 1k3 k01 ,
donde
0
R003 = 0,
1
R103 = 113 101 = 0,
2
R203 = 123 201 = 0,
3
R303 = 133 301 = 0,
logo
R03 = R30 = 0; (17.13)
para ij = 11 temos
k
Rk11 = m k m k k k
11 km k1 1m + k 11 1 k1
= 111 kk1 0k1 k10 1k1 k11 2k1 k12 3k1 k13 + k k11 1 kk1 ,
donde
0
R011 = 111 001 001 010 101 011 211 112 311 113 + 0 011 1 001
= 111 001 001 010 1 001
M2 M2 2M (r M )
= 2 2 + 2
r2 (r 2M ) r2 (r 2M ) r2 (r 2M )
2M
= 2 ,
r (r 2M )
1
R111 = 0,
2
R211 = 111 221 021 210 121 211 221 212 321 213 + 2 211 1 221
= 111 221 221 212 1 221
M 1 1
= 2 + 2
r (r 2M ) r2 r
M
= 2 ,
r (r 2M )
3
R311 = 111 331 031 310 131 311 231 312 331 313 + 3 311 1 331
= 111 331 331 313 1 331
M 1 1
= 2 + 2
r (r 2M ) r2 r
M
= 2 ,
r (r 2M )
logo
R11 = 0; (17.14)
para ij = 12 temos
k
Rk12 = m k m k k k
12 km k2 1m + k 12 1 k2
= 212 kk2 1k2 k11 2k2 k12 3k2 k13 + k k12 1 kk2 ,
donde
0
R012 = 212 002 102 011 202 012 302 013 + 0 012 1 002 = 0,
1
R112 = 0,
2
R212 = 212 222 122 211 222 212 322 213 + 2 212 1 222 = 2 212
1
= 2,
r
3
R312 = 212 332 132 311 232 312 332 313 + 3 312 1 332
= 212 332 332 313 1 332
1 1 1
= cot cot + 2
r r r
1
= 2,
r
logo
R12 = R21 = 0; (17.15)
para ij = 13 temos
k
Rk13 = m k m k k k
13 km k3 1m + k 13 1 k3
= 313 kk3 1k3 k11 2k3 k12 3k3 k13 + k k13 1 kk3 ,
donde
0
R013 = 313 003 103 011 203 012 303 013 + 0 013 1 003 = 0,
1
R113 = 0,
2
R213 = 313 223 123 211 223 212 323 213 + 2 213 1 223 = 0,
3
R313 = 313 333 133 311 233 312 333 313 + 3 313 1 333 = 0,
logo
R13 = R31 = 0; (17.16)
para ij = 22 temos
k
Rk22 = m k m k k k
22 km k2 2m + k 22 2 k2
= 122 kk1 1k2 k21 2k2 k22 3k2 k23 + k k22 2 kk2 ,
donde
0
R022 = 122 001 102 021 202 022 302 023 + 0 022 2 002 = 122 001
M
= ,
r
1
R122 = 122 111 112 121 212 122 312 123 + 1 122 2 112
= 122 111 212 122 + 1 122
M r 2M
= + 1
r r
M
= ,
r
2
R222 = 0,
3
R322 = 122 331 132 321 232 322 332 323 + 3 322 2 332
= 122 331 332 323 2 332
r 2M 1 r 2M cos2 1
= cot2 + 2
= +
r sen r sen sen2
2
2 2
2M 1 cos 2M sen
= 1 + + = 1 + +
r sen2 r sen2
2M
= ,
r
logo
R22 = 0; (17.17)
para ij = 23 temos
k
Rk23 = m k m k k k
23 km k3 2m + k 23 2 k3
= 323 kk3 1k3 k21 2k3 k22 3k3 k23 + k k23 2 kk3 ,
donde
0
R023 = 323 003 103 021 203 022 303 023 + 0 023 2 003 = 0,
1
R123 = 323 113 113 121 213 122 313 123 + 1 123 2 113 = 0,
2
R223 = 0,
3
R323 = 323 223 123 221 223 222 323 223 + 2 223 2 223 = 0,
logo
R23 = R32 = 0; (17.18)
e, finalmente, para ij = 33 temos
k
Rk33 = m k m k k k
33 km k3 3m + k 33 3 k3
= 133 kk1 + 233 kk2 1k3 k31 2k3 k32 3k3 k33 + k k33
donde
0
R033 = 133 001 + 233 002 103 031 203 032 303 033 + 0 033 = 133 001
M
= sen2 ,
r
1
R133 = 133 111 + 233 112 113 131 213 132 313 133 + 1 133
= 133 111 313 133 + 1 133
M r 2M
= sen2 + sen2 sen2
r r
M
= sen2 ,
r
2
R233 = 133 221 + 233 222 123 231 223 232 323 233 + 2 233
= 133 221 323 233 + 2 233
r 2M cos
= sen2 + sen cos cos2 + sen2
r sen
2M
= sen2 ,
r
3
R333 = 0,
logo
R33 = 0. (17.19)
Para mostrar que a metrica de Schwarzschild e uma metrica assintoticamente plana, precisamos calcular
as demais componentes do tensor curvatura.
17.7 Proposicao. Se a massa esferica estatica, isolada, tem raio R = 2M , o espacotempo para r > R com
a metrica de Schwarzschild satisfaz a equacao de Einstein.
Prova: Pois a metrica de Schwarzschild satisfaz Ric = 0, S = 0 e o tensor momento-energia satisfaz T = 0

para r > R.
17.4 Deducao da Solucao de Schwarzschild

17.5 Calculo da Deflexao da Luz
17.6 Precessao do Perihelio de Mercurio
17.7 Solucao de Schwarzschild para Buracos Negros
17.8 Warped Products
Captulo 18
Campos de Jacobi
Neste captulo estudaremos como a curvatura afeta as geodesicas. Em um ponto p, as geodesicas radiais
partem deste ponto e se irradiam. Veremos que em uma regiao de curvatura seccional positiva as geodesicas
se separam menos, em comparacao com as geodesicas (retas) no espaco euclidiano (ou seja, os raios em
Tp M ), enquanto que em uma regiao de curvatura seccional negativa as geodesicas se separam mais.
18.1 A Equacao de Jacobi

Dados p M e v Tp M tais que expp (v) esta definido, considere a variacao geodesica F : (, ) [0, 1]
M da geodesica radial
(t) = expp (tv)
vista na demonstracao do Lema de Gauss, ou seja
F (s, t) = expp (tv (s))
onde v (s) e uma curva de Tp M partindo de v (0) = v com velocidade v 0 (0) =: w. Para cada s fixado,
Fs (t) = F (s, t) e a geodesica radial que parte de p com velocidade v (s). A velocidade de afastamento destas
geodesicas radiais no ponto (t) e exatamente o vetor
F
(0, t) = d expp tv tw, (18.1)
s
que e o vetor velocidade da curva transversal partindo de (t). Neste captulo estudaremos este campo
em detalhes. Veremos em primeiro lugar nesta secao que ele satisfaz uma equacao diferencial, chamada a
equacao de Jacobi (tambem conhecida como equacao do desvio geodesico em Relatividade Geral). [Para
conveniencia do leitor, repetimos o Lema 13.34 que foi visto no apendice do Captulo 13, juntamente com a
sua demonstracao.]
18.1 Lema. Seja F : (, ) [a, b] M uma variacao e V um campo vetorial ao longo de F . Entao

D DV D DV F F
=R , V.
dt ds ds dt t s
Prova: Escolha um sistema de coordenadas para uma vizinhanca de p M e escreva

n
X
V = V i (s, t) i .
i=1
251
Entao !
n n n
DV D X
i
X V i X D
= V i = i + Vi i ,
ds ds i=1 i=1
s i=1
ds
donde
n n n n
D DV X 2V i X V i D X V i D X DD
= i + i + i + Vi i .
dt ds i=1
st i=1
s dt i=1
t ds i=1
dt ds
Trocando t por s,
n n n n
D DV X 2V i X V i D X V i D X DD
= i + i + i + Vi i .
ds dt i=1
st i=1
t ds i=1
s dt i=1
ds dt
Logo,
n
D DV D DV X DD DD
= Vi i . (18.2)
dt ds ds dt i=1
dt ds ds dt
Escrevendo
F (s, t) = x1 (s, t) , . . . , xn (s, t) ,

de modo que
X xj n
F
= j ,
t j=1
t
X xk n
F
= k ,
s s
k=1
temos
X xk n
D
i = P xk i = k i .
ds s k s
k=1
Da,
n
!
DD D X xk
i = k i
dt ds dt s
k=1
n n
X 2 xk X xk D
= k i + (k i )
st s dt
k=1 k=1
n n
X 2 xk X xk
= k i + P xj (k i )
st s t j
k=1 k=1
n 2 k n
X x X xk xj
= i + j k i .
st k s t
k=1 k,j=1
Da mesma forma, trocando t por s e depois j por k,

n n
DD X 2 xk X xk xj
i = k i + j k i
ds dt ts t s
k=1 k,j=1
n 2 k n
X x X xj xk
= i + k j i .
st k t s
k=1 k,j=1
Portanto,
n n
D DV D DV X X xj xk
Vi

= j k i k j i
dt ds ds dt i=1
t s
j,k=1
n n
X xj xk
X
= Vi R (j , k ) i
i=1
t s
j,k=1

n n j n k
X X x X x
= V iR j , k i
i=1 j=1
t s
k=1
n
X
F F
=R , V i i
t s i=1

F F
=R , V.
t s

18.2 Proposicao (Equacao de Jacobi). Seja F : (, ) [0, 1] M uma variacao geodesica e denote
F
J (t) = (0, t) .
s
Entao J satisfaz a equacao diferencial linear
D2 J
+ R (J, 0 ) 0 = 0. (18.3)
dt2
Prova: Como as curvas principais t 7 F (s, t) da variacao sao geodesicas, temos
D F
= 0.
dt t
Segue do lema anterior e do Lema de Simetria 12.25 que

D D F D D F F F F
0= = R ,
ds dt t dt ds t t s t

D D F F F F
= +R ,
dt dt s s t t
2

D F F F F
= 2 +R , .
dt s s t t
18.2 Campos de Jacobi

18.3 Definicao. Seja : I M uma geodesica. Qualquer campo vetorial ao longo de que satisfaz a
equacao de Jacobi e chamado um campo de Jacobi ao longo de .
Segue da Proposicao 18.2 que o campo variacional de uma variacao geodesica e um campo de Jacobi.
Um campo de Jacobi e determinado por suas condicoes iniciais:
18.4 Proposicao (Existencia e Unicidade de Campos de Jacobi). Seja : I M uma geodesica. Dado
t0 I e V, W T(t0 ) M , existe um unico campo de Jacobi ao longo de tal que
J (t0 ) = V ,
DJ
(t0 ) = W.
dt
Em particular, os campos de Jacobi ao longo de uma geodesica formam um espaco vetorial de dimensao 2n.
Prova: Seja {E1 (t) , . . . , En (t)} campos ortonormais paralelos ao longo de . Escrevendo
n
X
J= J i Ei ,
i=1
temos
n
D2 J X d2 J i
(t) = Ei ,
dt2 i=1
dt2
e

n n n
0 0
X
k
X d j X d l
R (J, ) = R J Ek , Ej El
j=1
dt dt
k=1 l=1
n
X d j d l k
= J R (Ek , Ej ) El
dt dt
j,k,l=1
n
X
i d j d l k
= Rkjl J Ei ,
dt dt
j,k,l=1
de modo que a equacao de Jacobi e equivalente ao sistema de equacoes diferenciais lineares de segunda
ordem:
n
d2 J i X j
i d d
l
+ Rkjl Jk = 0
dt2 dt dt
j,k,l=1
para i = 1, . . . , n. Como o sistema e linear, a existencia e unicidade de solucoes esta garantida em todo o
intervalo I, dadas condicoes iniciais.
Um campo vetorial ao longo de uma curva que nao seja do tipo luz sempre pode ser decomposto nas suas
componentes tangencial e normal:
V = V > V .
No caso de campos de Jacobi, ambas as componentes sao tambem campos de Jacobi:
18.5 Proposicao. Seja : I M uma geodesica que nao e do tipo luz e J um campo vetorial ao longo
de . Decomponha
J = J> J
nas suas componentes tangencial e normal, respectivamente. Entao J e um campo de Jacobi se e somente
se J > e J sao campos de Jacobi.
Prova: Pela linearidade da equacao de Jacobi, se J > , J sao campos de Jacobi entao J e um campo de
Jacobi.
Reciprocamente, seja J um campo de Jacobi. Como J > e um multiplo escalar de 0 , temos
R J > , 0 = 0,

donde
R (J, 0 ) = R J , 0 .

Alem disso, como

hR (J, 0 ) 0 , 0 i = R (J, 0 0 , 0 ) = 0,
temos que R (J, 0 ) 0 e normal a .
Porque e uma geodesica, temos
>
DV >

DV
= ,
dt dt

DV

DV
= ,
dt dt
para qualquer campo V . De fato, para qualquer campo W temos
D 0

D DW 0 DW 0
hW, 0 i = , + W, = , ,
dt dt dt dt

DW 0
de modo que hW, 0 i = 0 implica , = 0, isto e, se W e normal a geodesica , entao sua derivada
dt
DW
covariante tambem e normal a ; da mesma forma, se W e um campo tangente a , entao sua derivada
dt
DW
covariante tambem e tangente a , pois se W = f 0 , entao
dt
DW df D 0 df
= 0 + f = 0.
dt dt dt dt
Logo,
>
D2 J D2 J >

= ,
dt2 dt2

D2 J D2 J

= .
dt2 dt2
Portanto, a equacao de Jacobi
D2 J
+ R (J, 0 ) 0 = 0
dt2
da origem as duas equacoes de Jacobi
D2 J >
+ R J > , 0 0 = 0,

dt2
D2 J
+ R J , 0 0 = 0.

dt2

18.6 Exemplo. Existem sempre dois campos de Jacobi tangenciais triviais ao longo de uma geodesica :
J0 (t) = 0 (t) (18.4)
que satisfaz as condicoes iniciais

DJ0
J0 (0) = 0 (0) e (0) = 0
dt
e
J1 (t) = t 0 (t) (18.5)
que satisfaz as condicoes iniciais
DJ1
J1 (0) = 0 e (0) = 0 (0) .
dt
O primeiro e um campo de Jacobi porque
D2 J0 D D 0 D
2
= = 0 = 0,
dt dt dt dt
R (J0 , 0 ) 0 = R ( 0 , 0 ) = 0.
O segundo e um campo de Jacobi porque
D2 J1 D 0 D 0

D DJ1 D
2
= = 0 + t = = 0,
dt dt dt dt dt dt
R (J1 , 0 ) 0 = R (t 0 , 0 ) 0 = tR ( 0 , 0 ) 0 = 0.
De fato, J0 e o campo variacional da variacao F (s, t) = (t + s), enquanto que J1 e o campo variacional
da variacao F (s, t) = (tes ). Como estas variacoes sao apenas reparametrizacoes das geodesicas , elas nao
podem dizer mais nada do que a propria .
Devido ao visto no exemplo anterior, apenas campos de Jacobi normais ao longo de sao interessantes,
capazes de fornecer informacao geometrica nova.
18.7 Proposicao. Seja : I M uma geodesica, t0 I e J um campo de Jacobi ao longo de . Entao
hJ (t) , 0 (t)i = At + B,
onde

DJ 0
A= (t0 ) , (t0 ) ,
dt

0 DJ 0
B = hJ (t0 ) , (t0 )i (t0 ) , (t0 ) t0 .
dt
Em particular, um campo de Jacobi ao longo de e normal a 0 se e somente se
DJ
J (t0 ) , (t0 ) 0 (t0 ) .
dt
Alem disso, qualquer campo de Jacobi ortogonal a 0 em dois pontos e um campo normal.
18.8 Lema. Em particular, o subespaco dos campos de Jacobi tangenciais tem dimensao 2, enquanto que o
subespaco dos campos de Jacobi normais tem dimensao 2n 2.
Prova: Pela compatibilidade da metrica,
d2 D 0

0 d DJ 0
hJ, i = , + J,
dt2 dt dt dt
DJ D 0
2
d DJ 0 D J 0
= , = , + ,
dt dt dt2 dt dt
2
D J 0
= ,
dt2
= hR (J, 0 ) 0 , 0 i
= R (J, 0 , 0 , 0 )
= 0.
Logo,
f (t) = hJ (t) , 0 (t)i = At + B
para alguns A, B R. Como
f (t0 ) = hJ (t0 ) , 0 (t0 )i ,

0 DJ 0
f (t0 ) = (t0 ) , (t0 ) ,
dt
DJ
segue a identidade enunciada. Consequentemente, f 0 se e somente se J (t0 ) , (t0 ) 0 (t0 ). Da mesma
dt
forma, se J se anula em dois pontos, entao f e a funcao linear nula.
18.9 Proposicao. Dados p M , v Tp M tal que expp (v) esta definido e w Tv Tp M = Tp M , considere
a variacao geodesica
F (s, t) = expp (tv (s)) ,
onde v (s) e uma curva em Tp M com v (0) = v e v 0 (0) = w. Entao o campo de Jacobi
F
J (t) = (0, t) = d expp tv tw
s
ao longo da geodesica radial : [0, 1] M dada por (t) = expp (tv) satisfaz
J (0) = 0,
DJ
(0) = w.
dt
Prova: E obvio que J (0) = 0. Para mostrar que
DJ
(0) = w,
dt
calculamos
DJ Dh i Dh i
(t) = d expp tv tw = td expp tv w
dt dt dt
Dh i
= d expp tv w + t d expp tv w .
dt
Logo,
DJ
(0) = d expp 0 w = w.
dt

Em coordenadas normais, e facil calcular campos de Jacobi:

18.10 Proposicao. Sejam p M , x1 , . . . , xn coordenadas normais centradas em p e : I M uma
geodesica radial partindo de p. Entao, para cada vetor V Tp M , o campo de Jacobi ao longo de tal que
J (0) = 0,
DJ
(0) = V,
dt
e dado por
n
X
i
J (t) = tV .
i=1
xi (t)
Prova: Se J (t) e um campo ao longo de definido pela formula acima, temos

J (0) = 0
e (usando a formula da derivada covariante em coordenadas normais)

n k n i
DJ X dJ X d
(0) = (0) + (0) kij (0) J j (0) k (0)
dt dt i,j=1
dt x
k=1
n
X dJ k
= (0) (0)
dt xk
k=1
n
X
= Vk (0)
xk
k=1
= V.
Pelo teorema de existencia e unicidade, basta provar que J e um campo de Jacobi; mostraremos que J e o
campo variacional de uma variacao geodesica. De fato, se W = 0 (0), como e uma geodesica radial, ela e
dada por
(t) = expp (tW ) ;
em coordenadas, podemos escrever simplesmente (t) = tW . Defina a variacao geodesica
F (s, t) = expp (t (W + sV )) ;
em coordenadas, podemos escrever simplesmente F (s, t) = t (W + sV ). Observe que v (s) = W +sV satisfaz
v (0) = W e v 0 (0) = V . Como por definicao

i
= d expp tW ei ,
x (t)

segue que o campo variacional de F e

n
F X
tV i

(0, t) = d expp tW (tV ) = = J (t) .
s i=1
xi (t)
18.3 Campos de Jacobi em Variedades de Curvatura Seccional

Constante
Para metricas com curvatura seccional constante, temos uma formula explcita para campos de Jacobi de
um tipo diferente, expressando um campo de Jacobi como o multiplo escalar de um campo vetorial paralelo.
18.11 Proposicao. Seja M uma variedade riemanniana com curvatura seccional constante K e : I M
uma geodesica unitaria. Os campos de Jacobi normais ao longo de que se anulam em t = 0 sao dados por
J (t) = (t) E (t) ,
onde E e um campo paralelo normal ao longo de e

t se K = 0,
t 1

R sen se K = 2 > 0,

(t) = R R

R senh t 1

se K = 2 < 0.

R R
Prova: Como M tem curvatura seccional constante K, seu endomorfismo curvatura e dado por
R (X, Y ) Z = K [hY, Zi X hX, Zi Y ] ,
conforme vimos no captulo anterior. Logo, como k 0 k = 1, se J e um campo de Jacobi normal temos que
R (J, 0 ) 0 = K [h 0 , 0 i J hJ, 0 i 0 ] = KJ.
Portanto, a equacao de Jacobi para um campo normal de Jacobi ao longo de uma geodesica unitaria em uma
variedade com curvatura seccional constante K e
D2 J
+ KJ = 0.
dt2
Escolhendo um campo vetorial paralelo normal E (t) ao longo de e substituindo J (t) = (t) E (t) na
equacao de Jacobi podemos obter uma solucao para esta equacao para quaisquer condicoes iniciais; pelo
teorema de existencia e unicidade ela e a unica solucao para a equacao. De fato, temos
D2 (E)

D D (E) D d DE D d
= = E + = E
dt2 dt dt dt dt dt dt dt
d2 d DE
= 2E+
dt dt dt
d2
= 2 E,
dt
logo, substituindo J (t) = (t) E (t) na equacao de Jacobi produz
2
d
+ K E = 0
dt2
e a equacao linear de segunda ordem

d2
+ K = 0
dt2
tem as solucoes dadas no enunciado para as condicoes iniciais (0) = 0 e 0 (0) = 1.
Combinando as formulas destes dois lemas, obteremos nossa primeira aplicacao geometrica dos campos de
Jacobi: uma formula explcita para metricas de curvatura constante em coordenadas normais; desta formula
seguira que variedades de curvatura seccional constante sao localmente isometricas.
18.12 Proposicao. Seja (M, g) uma variedade riemanniana com curvatura seccional constante K. Sejam
p M , x1 , . . . , xn coordenadas normais centradas em p e r a funcao distancia radial. Denote por kkg
a norma de um vetor tangente na metrica g e por kke a norma euclidiana de um vetor tangente nestas
coordenadas. Para cada q nesta vizinhanca normal de p e para cada V Tq M escreva
V = Vr + VS ,
onde Vr esta na direcao de /r e VS e tangente a esfera Sr (p) que passa por q. Entao a metrica g pode
ser escrita
2 2

kVr ke + kVS ke

se K = 0,
R2 2 r 1

2 2
kV k kVS ke

kV kg = r e + 2
sen se K = 2 > 0,
r R R
2

kVr k2 + R senh2 r kVS k2 1

se K = < 0.

e e
r2 R R2
Prova: Pelo lema de Gauss, a decomposicao V = Vr + VS e ortogonal, logo

2 2 2
kV kg = kVr kg + kVS kg .
Como a distancia radial e a distancia euclideana (tambem consequencia do lema de Gauss) temos que
kVr kg = kVr ke .
Falta apenas calcular kVS kg .

Considere a geodesica radial unitaria de p a q. Pela Proposicao 18.10, o campo
n
X t i
J (t) = V
i=1
r S xi (t)
e um campo de Jacobi J (t) que se anula em p e tal que J (r) = VS . Em particular, J e normal a 0 em
p e q e portanto J e normal ao longo de pela Proposicao 18.7. Logo, J possui a representacao dada na
Proposicao 18.11. Segue que
2
2 2 2 2 2 2 2 DJ
kVS kg = kJ (r)k = | (r)| kE (r)k = | (r)| kE (0)k = | (r)|

,
(0)
dt
ja que 0 (0) = 1. Mas

n
DJ X 1 i
(0) = V .
dt i=1
r S xi p
Como g = e em p, segue o resultado.

18.13 Proposicao (Unicidade Local de Metricas de Curvatura Constante). Sejam (M, g) e M f, ge varieda-

des riemannianas com curvatura seccional constante K. Entao (M, g) e M f, ge sao localmente isometricas.
Prova: Sejam p M e pe Mf pontos quaisquer e B (p) , B (e

p) bolas geodesicas, em particular vizinhancas
normais parametrizadas por
= expp : B (0) B (p) ,

e = exppe : B (0) B (e
p) .
Como as metricas na bola B (0) Rn , onde identificamos Rn com ambos os espacos tangentes Tp M e TpeM
f
1
e e uma isometria.
sao identicas pela Proposicao 18.12, segue que
18.4 Velocidade de Afastamento das Geodesicas e Curvatura Sec-

cional
Se r (t) e tal que
r (t)
lim = 0,
t0 tk
denotaremos este fato por
r (t) = o tk .

18.14 Lema. Sejam p M e : I M a geodesica radial partindo de p com velocidade inicial 0 (0) = V .
Seja W Tp M com kW k = 1 e considere o campo de Jacobi J tal que
J (0) = 0,
DJ
(0) = W.
dt
Entao
2 1
kJ (t)k = t2 R (V, W, W, V ) t4 + o t4 .

3
Em particular, se e uma geodesica unitaria,
2 1
kJ (t)k = t2 K (V, W ) t4 + o t4

3
e
1
kJ (t)k = t K (V, W ) t3 + o t3 .

6
Prova: Para simplificar a notacao, denotaremos
DJ
J 0 (t) = (t) ,
dt
D2 J
J 00 (t) = (t)
dt2
e, em geral,
Dk J
J (k) (t) =
(t) .
dtk
Para provar o resultado, aplicaremos a formula de Taylor a funcao real f : I R definida por
2
f (t) = kJ (t)k = hJ (t) , J (t)i .
Temos
f 0 = 2 hJ, J 0 i ,
f 00 = 2 hJ 0 , J 0 i + 2 hJ, J 00 i
2
= 2 kJ 0 k + 2 hJ, J 00 i ,
e
2
f (0) = kJ (0)k = 0,
f (0) = 2 hJ (0) , J 0 (0)i = 0,
0
2 2
f 00 (0) = 2 kJ 0 (0)k + 2 hJ (0) , J 00 (0)i = 2 kJ 0 (0)k = 2.
Como
f 000 = 2 hJ 00 , J 0 i + 2 hJ 0 , J 00 i + 2 hJ 0 , J 00 i + 2 hJ, J 000 i

= 6 hJ 0 , J 00 i + 2 hJ, J 000 i
e
J 00 (0) = R (J (0) , 0 (0)) 0 (0) = R (0, V ) V = 0,
segue que
f 000 (0) = 6 hJ 0 (0) , J 00 (0)i + 2 hJ (0) , J 000 (0)i = 0.
Falta apenas calcular a ultima derivada. Temos

D E
f (4) = 6 hJ 00 , J 00 i + 6 hJ 0 , J 000 i + 2 hJ 0 , J 000 i + 2 J, J (4)
D E
2
= 6 kJ 00 k + 8 hJ 0 , J 000 i + 2 J, J (4) ,
de modo que
f (4) (0) = 8 hJ 0 (0) , J 000 (0)i = 8 hW, J 000 (0)i .
Mas

000 D 00
hJ (0) , W i = J (t) ,W
dt t=0

D 0 0

= R (J (t) , (t)) (t) ,W .
dt t=0
Afirmamos que
D
R (J (t) , 0 (t)) 0 (t)

, W = R (V, W, W, V ) .
dt t=0
De fato, como
hR (J, 0 ) 0 , J 0 i = R (J, 0 , 0 , J 0 )
= R ( 0 , J 0 , J, 0 )
= hR (J 0 , 0 ) 0 , Ji ,
segue que
d d
hR (J, 0 ) 0 , J 0 i = hR (J 0 , 0 ) 0 , Ji ,
dt dt
donde
D D
R (J, 0 ) 0 , J 0 0 0
+ hR (J, ) , J i = 00
R (J 0 , 0 ) 0 , J + hR (J 0 , 0 ) 0 , J 0 i .
dt dt
Calculando em t = 0, como J (0) = J 00 (0) = 0 e J 0 (0) = W , temos que

D 0 0

R ( (t) , J (t)) (t)
, W = hR (W, V ) V, W i = R (W, V, V, W ) .
dt t=0
Consequentemente,
f (4) (0) = 8R (V, W, W, V ) .
Segue portanto da formula de Taylor que
1
f (t) = t2 R (V, W, W, V ) t4 + o t4 .

3
Quando, kV k = kW k = 1, temos R (V, W, W, V ) = K (V, W ) e portanto
1
f (t) = t2 K (V, W ) t4 + o t4 .

3
Para provar a ultima expressao do enunciado, seja
p
g (t) = kJ (t)k = f (t).
2
Entao f (t) = [g (t)] e
f 0 (t) = 2g (t) g 0 (t) ,

2
f 00 (t) = 2 [g 0 (t)] + 2g (t) g 00 (t) ,
f 000 (t) = 6g 0 (t) g 00 (t) + 2g (t) g 000 (t) ,
2
f (4) (t) = 6 [g 00 (t)] + 8g 0 (t) g 000 (t) + 2g (t) g (4) (t) .
Da
g (0) = 0,
2 2
f 00 (0) = 2 [g 0 (0)] + 2g (0) g 00 (0) = 2 = 2 [g 0 (0)] + 0
= g 0 (0) = 1,
f 000 (0) = 6g 0 (0) g 00 (0) + 2g (0) g 000 (0) = 0 = 6g 00 (0) + 0
= g 00 (0) = 0,
2
f (4) (0) = 6 [g 00 (0)] + 8g 0 (0) g 000 (0) + 2g (0) g (4) (0) = 8K (V, W ) = 0 + 8g 000 (0) + 0
= g 000 (0) = K (V, W ) .
Segue da formula de Taylor que

1
g (t) = t K (V, W ) t3 + o t3 .

6

Este resultado produz a relacao entre a aproximacao ou espalhamento das geodesica em um ponto de acordo
com a curvatura seccional neste ponto. De fato, considere
F (s, t) = expp (tv (s)) ,
onde v (s) e uma curva de Tp M com v (0) = v, v 0 (0) = w e kv (s)k = kwk = 1. Considere os raios partindo
da origem, eles se afastam do raio tv com velocidade absoluta

tv (s) = ktv 0 (0)k = t kwk = t.

s
s=0
Agora considere as geodesicas radiais Fs (t) partindo de p. Como

F
J (t) = d expp tv
tw = (0, t)
s
e um campo de Jacobi que satisfaz
J (0) = 0,
DJ
(0) = w,
dt
ele satisfaz as hipoteses do enunciado do Lema 18.14 e portanto

F
= t 1 K (V, W ) t3 + o t3 .

s (0, t) 6
Isso significa que as geodesicas radiais Fs (t) se afastam da geodesica radial F0 (t) = expp (tv) com velocidade
que difere de t por uma termo de terceira ordem cujo sinal e o oposto do sinal da curvatura seccional da
variedade em p associada ao plano gerado por v e w. Isso significa que se Kp () > 0 as geodesicas se
afastam menos que os raios do espaco tangente Tp M , enquanto que se Kp () < 0 as geodesicas se afastam
mais que os raios do espaco tangente Tp M .
18.5 Pontos Conjugados

Agora vamos estudar as singularidades da aplicacao exponencial atraves dos campos de Jacobi. A existencia
de uma tal relacao e sugerida pela Proposicao 18.9 e pode ser vista de maneira concreta na esfera SnR . Todas
as geodesicas que saem de um ponto p se encontram no seu ponto antipodal p, que esta a uma distancia
R de p ao longo de qualquer uma destas geodesicas. A aplicacao exponencial e um difeomorfismo sobre a
bola geodesica BR (0) Tp M mas deixa de ser um difeomorfismo na fronteira da bola. E pela Proposicao
18.11, os campos de Jacobi normais ao longo destas geodesicas que se anulam em p tem o seu proximo zero
exatamente em p. Por outro lado, a Proposicao 18.10 mostra que em uma vizinhanca normal (ou seja uma
vizinhanca que e a imagem de um conjunto onde expp e um difeomorfismo) nenhum campo de Jacobi que
se anula em p pode se anular em qualquer ponto da vizinhanca. Assim deve se esperar existir uma relacao
entre as singularidades da aplicacao exponencial e os zeros de um campo de Jacobi.
18.15 Definicao. Seja : [a, b] M uma geodesica. Dizemos que o ponto q = (b) e conjugado ao
ponto p = (a) ao longo de se existe um campo de Jacobi J ao longo de nao identicamente nulo que se
anula em p e q, isto e, tal que
J (a) = J (b) = 0.
A multiplicidade do ponto conjugado q e a dimensao do subespaco dos campos de Jacobi que se anulam
em p e q.
Pelo teorema de existencia e unicidade, a dimensao do espaco dos campos de Jacobi que se anulam em p e
n; como o campo de Jacobi tangencial J (t) = t 0 (t) so se anula em p (de fato, qualquer campo de Jacobi
tangencial que se anula em dois pontos e necessariamente nulo pela Proposicao 18.7), a multiplicidade de
um ponto conjugado e no maximo n 1. Em particular, na definicao de pontos conjugados, o ponto q e
conjugado a p se e somente se existir um campo de Jacobi normal ao longo de nao identicamente nulo que
se anula em p e q. O numero n 1 e atingido na esfera pela Proposicao 18.11, ja que para pontos antipodais
existe um campo de Jacobi que anula neles para cada campo paralelo normal.
18.16 Proposicao. Sejam p M , v Tp M e q = expp (v). Entao expp e um difeomorfismo local em uma
vizinhanca de v se e somente se q nao e conjugado a p ao longo da geodesica (t) = expp (tv).

Alem disso, a multiplicidade de q e igual a dim ker d expp v .
Prova: Como vimos na Proposicao 18.9, todo campo de Jacobi ao longo de tal que J (0) = 0 e da forma

J (t) = d expp tv tw.
para algum vetor w Tp M e J 0 (0) = w. Portanto, q e conjugado a p se e somente se

J (1) = d expp v w = 0,
isto e, se e somente se v e ponto crtico de expp . Como os campos de Jacobi J1 , . . . , Jk que se anulam em p
sao linearmente independentes se e somente se os vetores
J10 (0) = w1 , . . . , Jk0 (0) = wk
sao linearmente independentes em Tp M , isso conclui a demonstracao.

18.17 Proposicao. Seja : [a, b] M uma geodesica tal que (b) nao e conjugado a (a).
Dados V T(a) M e W T(b) M , existe um unico campo de Jacobi J ao longo de tal que
J (a) = V,
J (b) = W.
Prova: Seja J o espaco vetorial dos campos de Jacobi ao longo de tais que J (a) = 0. Este espaco tem
DJ
dimensao n, correspondente as n escolhas linearmente independentes de (a). Defina uma aplicacao linear
dt
: J T(b) M por
(J) = J (b) .
Como (b) nao e conjugado a (a), e injetiva. Ja que dim J = n = dim T(b) M , segue que e um
isomorfismo. Logo existe J1 J tal que
J1 (b) = W,
ou seja, existe um unico campo de Jacobi J1 ao longo de tal que
J1 (a) = 0,
J1 (b) = W.
Considerando o espaco vetorial Je dos campos de Jacobi ao longo de tais que J (b) = 0 e a aplicacao linear
: Je T(a) M por
(J) = J (a) ,
conclumos de maneira analoga que existe um unico campo de Jacobi J2 ao longo de tal que
J2 (a) = V,
J2 (b) = 0.
O campo J = J1 + J2 e o campo de Jacobi que satisfaz as condicoes do enunciado. A unicidade segue

imediatamente do fato de (b) nao ser conjugado a (a), pois a diferenca de dois campos de Jacobi diferentes
que satisfazem as condicoes do enunciado seria um campo de Jacobi nao trivial se anulando em (a) e (b).

Captulo 19
Causalidade
19.1 Orientacao Temporal

Em uma variedade de Lorentz arbitraria, em cada espaco tangente Tp M , como em todo espaco de Minkowski,
existem dois cones temporais. Escolher um deste cones temporais equivale a orientar o espaco tangente Tp M .
A questao e se e possvel orientar todos os espacos tangentes de M de uma maneira contnua. Lembre-se
que escolher um cone temporal equivale na pratica a escolher um vetor to tipo tempo v0 em Tp M ; entao,
um vetor causal (isto e, um vetor que nao e do tipo espaco) v esta dirigido para o futuro se hv0 , vi < 0 e
para o passado se hv0 , vi > 0.
19.1 Definicao. Seja M uma variedade de Lorentz. Dizemos que um campo vetorial X T (M ) e do tipo
tempo se Xp e do tipo tempo para todo p M .
Em geral, uma variedade de Lorentz nao possui campos vetoriais do tipo tempo globalmente definidos.
19.2 Definicao. Dizemos que uma variedade de Lorentz M e temporalmente orientavel se existe uma
funcao que atribui a cada ponto p um cone temporal p em Tp M e um campo vetorial do tipo tempo tais
que Xp p para todo p M .
Neste caso, dizemos que e uma orientacao temporal para M .
Se v Tp M e um vetor do tipo causal, dizemos que v e dirigido para o futuro se v p e para o passado
se v p .
Em outras palavras, v e dirigido para o futuro se
hv, Xp i < 0
e para o passado se
hv, Xp i > 0.
Veja a demonstracao do Teorema 19.12 para uma definicao alternativa usando transporte paralelo.
19.3 Definicao. Uma variedade de Lorentz conexa, temporalmente orientada, e chamada um espacotempo.

Em Relatividade Geral se trabalha com espacotempos, ja que e altamente improvavel que dois observadores,
mesmo nao inerciais, se encontrem em um ponto do espacotempo e o tempo para um segue o seu ritmo
natural em direcao ao futuro, enquanto que para o outro observador o tempo corre em direcao ao passado.
266
19.2 Teoria de Causalidade para Espacotempos

De agora em diante, M denotara sempre um espacotempo. Em um espacotempo, uma curva diferenciavel
causal e sempre orientada para o futuro ou orientada para o passado, ja que uma curva nao pode mudar
continuamente sua orientacao temporal do futuro para o passado ou vice-versa.
19.2.1 Cronologia
19.4 Definicao. Dados pontos p, q M , dizemos que p precede q cronologicamente e escrevemos
pq
se existe uma curva diferenciavel do tipo tempo orientada para o futuro ligando p a q.
Dizemos que p precede q causalmente e escrevemos
p6q
se p = q ou se existe uma curva diferenciavel causal orientada para o futuro ligando p a q.

Dizemos que p precede q causalmente estritamente e escrevemos
p<q
se p 6 q e p 6= q.
As relacoes e 6 sao claramente transitivas.
19.5 Proposicao. Se p q e q 6 r ou se p 6 q e q r, entao p r.

Prova: D.
Estendemos a nocao de orientacao temporal para curvas contnuas:
19.6 Definicao. Uma curva contnua : (a, b) M e uma curva causal orientada para o futuro se
para cada t0 (a, b) existe > 0 e uma vizinhanca normal convexa V de (t0 ) contendo (t0 , t0 + )
tal que para todos t1 , t2 com t0 < t1 < t2 < t0 + existe uma curva causal orientada para o futuro em
V de (t1 ) a (t2 ).
A necessidade de considerar vizinhancas normais convexas na Definicao 18.6 se justifica pelo fato de existirem
espacotempos em que p q para todos os pontos p, q M , logo nestes espacotempos qualquer curva contnua
satisfazera (t1 ) (t2 ) e (t2 ) (t1 ) para todos t1 , t2 no domnio de , portanto apenas a condicao
(t1 ) (t2 ) para todos t1 < t2 implicaria que toda curva contnua e uma curva causal orientada para o
futuro.
19.7 Definicao. Dado p M , definimos:
futuro cronologico de p : I + (p) = {q M : p q} ,

passado cronologico de p : I (p) = {q M : q p} ,
futuro causal de p : J + (p) = {q M : p 6 q} ,
passado causal de p : J (p) = {q M : q 6 p} .

19.3 Apendice: O Recobrimento Duplo Temporalmente Orientavel

Toda variedade riemanniana nao orientavel possui um recobrimento duplo orientavel (veja, por exemplo,
[Carmo], ultimo exerccio do Captulo 0). Um resultado analogo vale para variedades de Lorentz, como
veremos. A construcao do recobrimento duplo temporalmente orientavel de uma variedade de Lorentz dada
abaixo segue [BEE], pp. 5152. E uma construcao bem mais abstrata que a contida, por exemplo, em
[ONeill], p. 194. E ha alguns aspectos que este autor nao conseguiu compreender (especificamente, Lema
19.10, que parece ser o resultado usado no Lema 19.11, que e o Lema 3.2 de [BEE]).
19.8 Definicao. Seja M uma variedade de Lorentz, fixe um ponto p0 M e escolha uma orientacao
temporal v0 Tp0 M . Para qualquer p M , definimos uma relacao de equivalencia no conjunto das curvas
diferenciaveis por partes ligando p0 a p
p0 ,p = { [0, 1] M : e diferenciavel por partes, (0) = p0 e (1) = p}
da seguinte forma: duas curvas , p0 ,p sao equivalentes se os campos paralelos V , V ao longo de
respectivamente , definidos por V (0) = V (0) = v0 satisfazem
hV (1) , V (1)i < 0.

Esta relacao de equivalencia divide p0 ,p em duas classes: como os campos V e V sao paralelos, segue que
V1 (1) e V (1) sao vetores do tipo tempo em Tp M , pois
hV (1) , V (1)i = hV (0) , V (0)i = hv0 , v0 i < 0,
hV (1) , V (1)i = hV (0) , V (0)i = hv0 , v0 i < 0,
logo ou eles estao no mesmo cone temporal ou estao em cones temporais opostos. Note que duas cur-
vas diferenciavelmente homotopicas pertencem a mesma classe de equivalencia (pois podemos definir um
campo paralelo ao longo da imagem da homotopia, ja que a equacao diferencial do transporte paralelo e
linear e a imagem da homotopia e compacta), embora curvas equivalentes nao precisem ser necessariamente
homotopicas.
Dada uma curva diferenciavel : [0, 1] M com (0) = p0 , denotaremos por [] a classe de equivalencia
de e
f = {[] : : [0, 1] M com (0) = p0 } .
M
19.9 Proposicao. M f M definida por
f e uma variedade de Lorentz e : M
([]) = (1)
e um recobrimento duplo.
Prova: Dotamos M f da topologia quociente atraves desta relacao de equivalencia, o que torna Mf um espaco
de recobrimento topologico com : M f M a aplicacao de recobrimento. Lembramos entao que o
espaco de recobrimento topologico de uma variedade diferenciavel possui uma unica estrutura de variedade
diferenciavel que torna a aplicacao de recobrimento diferenciavel (veja [Lee 1], Proposicao 4.40, p. 92, para
uma demonstracao). Finalmente, definimos uma metrica de Lorentz em M f atraves do pullback da projecao,
isto e,
ge = g,
ou seja,
ge[] (e
v , w)
e = g(1) d[] ve, d[] w
e .
Em particular, e uma isometria local.
Note que se M e temporalmente orientavel, entao M
f = M . Caso contrario, mostraremos que M
f e. Para
isso, precisaremos dos lemas a seguir.
19.10 Lema. Sejam pe0 1 (p0 ) e

e : [0, 1] M
f e uma curva diferenciavel por partes tal que

e (0) = pe0 .
Se =
e, entao

e (1) = [] .
Prova: Este resultado parece ser incorreto pelo seguinte argumento. Suponha que
1 (p0 ) = pe+ e

0 ,p0 .
Como ambos M e M f sao variedades de Lorentz e toda variedade diferenciavel e localmente contratil, podemos

assumir vizinhancas contrateis Ve de pe
0 tais que V
e = V , V sendo uma vizinhanca contratil de p0 .
Dentro das vizinhancas Ve podemos tomar lacos e com pontos inicial e final em pe 0 . Se o enunciado e

correto, entao se = e , segue que
pe e (1) = .

0 =
Em particular, +
6= ,
ja que pe+ e
0 6= p
+
0 . Mas e , sendo lacos com pontos inicial e final em p0 , dentro da vizinhanca contratil
V , sao (diferenciavelmente) homotopicos e portanto
+
= ,
uma contradicao.
Se o resultado for correto, um possvel argumento seria o seguinte. Para fixar ideias, assuma que pe0 e a
classe de equivalencia da curva constante 0 (t) p0 . Neste caso, o campo paralelo a curva constante 0
com vetor inicial v0 e simplesmente V (t) v0 .
Defina et : [0, 1] M
f por

et (s) =
e (st) ,
de modo que et e simplesmente o segmento da curva e que liga pe0 a e (t), seu domnio reparametrizado para
[0, 1]. Observe que e (s) pe0 e que
e0 e a curva constante e1 = e. Seja t = et . Mostraremos que o
conjunto
A = {t [0, 1] :
et (1) = [t ]}
e aberto e fechado em [0, 1], provando o resultado. Por escolha, 0 A. (. . .)
19.11 Lema. Sejam pe0 1 (p0 ) e ve0 Tpe0 M

f o unico vetor do tipo tempo tal que dpe ve0 = v0 .
0
Sejam pe M e
f e, : [0, 1] M curvas diferenciaveis por parte tais que
e f

e (0) = e (0) = pe0 ,

e (1) = e (1) = pe.
Se Ve , Ve sao os campos paralelos ao longo de respectivamente e, e definidos por Ve (0) = Ve (0) = ve0 , entao
D E
Ve (1) , Ve (1) < 0.
Prova: A unicidade de ve0 segue do fato de toda aplicacao de recobrimento diferenciavel ser um difeomorfismo
local. Sejam
= e,
= .
e
f M e uma isometria local, os campos

Como : M

V = Ve ,

V = Ve ,
sao paralelos ao longo de 1 , 2 , respectivamente, com
V (0) = V (0) = (e
v0 ) = v0
e D E D E
hV (1) , V (1)i = Ve (1) , Ve (1) = Ve (1) , Ve (1) .
Suponha por absurdo que D E

Ve (1) , Ve (1) 0.
D E
Como Ve (1) , Ve (1) sao vetores do tipo tempo, necessariamente Ve (1) , Ve (1) > 0. Logo hV (1) , V (1)i >
0 em p e por definicao [1 ] 6= [2 ]. Por outro lado, pelo Lema 19.10, temos tambem que

e (1) = [] ,
e (1) = [] ,
contradizendo
e1 (1) =
e2 (1) = pe.
19.12 Teorema. Toda variedade de Lorentz nao temporalmente orientavel possui um recobrimento duplo
temporalmente orientavel.
Prova: Veja Teorema 3.3 em [BEE], p. 52. Implcita na demonstracao deste teorema e uma definicao
alternativa para a orientabilidade temporal de uma variedade de Lorentz M : M e temporalmente orientavel
se, fixados um ponto base qualquer p0 M e um vetor do tipo tempo qualquer v0 Tp0 M , para todo
p M e para todas as curvas diferenciaveis , ligando p0 a p, os campos paralelos V , V ao longo de
respectivamente , definidos por V (0) = V (0) = v0 satisfazem
hV (1) , V (1)i < 0.
Esta condicao implica que o transporte paralelo do cone futuro determinado por v0 em p0 para qualquer
ponto p e independente do caminho escolhido de p0 para p. Logo, uma escolha consistente de vetores do tipo
tempo futuros pode ser feita por transporte paralelo a partir de p0 .
Referencias Bibliograficas
[BEE] John K. BEEM, Paul E. EHRLICH e Kevin L. EASLEY, Global Lorentzian Geometry,
2nd. Ed., Marcel Dekker, 1996.
[Benn-Tucker] Ian M. BENN e Robin W. TUCKER, An Introduction to Spinors and Geometry with
Applications in Physics, Adam Hilger, 1987.
[Berger] Marcel BERGER, A Panoramic View of Riemannian Geometry, Springer, 2002.
[Carmo] Manfredo Perdigao do CARMO, Geometria Riemanniana, 2a. Edicao, 1988.

[Carmo2] Manfredo Perdigao do CARMO, Differential Geometry of Curves and Surfaces, Pren-
tice Hall, 1976.
[Dodson-Poston] C. T. J. DODSON e T. POSTON, Tensor Geometry: the geometric viewpoint and its
uses, 2nd Edition, Graduate Texts in Mathematics 130, Springer, 1991.
[Ferraro] Rafael FERRARO, Einsteins Space-Time: An Introduction to Special and General

relativity, Springer, 2007.
[Fleisch1] Daniel FLEISCH, A Students Guide to Maxwells Equations, Cambridge, 2008.
[Fleisch2] Daniel FLEISCH, A Students Guide to Vectors and Tensors, Cambridge University
Press, 2012.
[Gron-Naess] Oyvind GRON e Arne NAESS, Einsteins Theory: A Rigorous Introduction for the
Mathematically Untrained, Springer, 2011.
[Hoffman-Kunze] Kenneth HOFFMAN e Ray KUNZE, Linear Algebra, 2nd. Edition, Prentice-Hall, 1971.
[Kobayashi] Shoshichi KOBAYASHI, Transformation Groups in Differential Geometry, Classics in

Mathematics 70 (Reprint of the 1972 Edition), Springer, 1995.
[Lang] Serge LANG, Linear Algebra, 3rd. Edition, Springer, 1987.
[Lee 1] John M. LEE, Introduction to Smooth Manifolds, 2nd Edition, Graduate Texts in
Mathematics 218, Springer, 2012.
[Lee 2] John M. LEE, Riemannian Manifolds: an Introduction to Curvature, Graduate Texts
in Mathematics 176, Springer, 1997.
[Lima 1] Elon Lages de LIMA, Curso de Analise vol. 2, IMPA, 1981.
[Lima 2] Elon Lages de LIMA, Variedades Diferenciaveis, IMPA, 2011.

[McMahon] David McMAHON, Relativity demystified, McGraw-Hill, 2006.
271
[MTW] Charles W. MISNER, Kip S. THORNE e John Archibald WHEELER, Gravitation,

Freeman, 1973.
[Naber] Gregory L. NABER, The Geometry of Minkowski Spacetime: an introduction to the
mathematics of the Special Theory of Relativity, 2nd. Edition, Springer, 2012.
[Okun1] Lev B. OKUN, The concept of mass, Physics Today, 42 (6), 3136, 1989.
[Okun2] Lev B. OKUN, Energy and Mass in Relativity Theory, World Scientific, 2009.
[ONeill] Barrett ONEILL, Semi-Riemannian Geometry, with applications to Relativity, Aca-
demic Press, 1983.
[Pais] Abraham PAIS, Subtle is the Lord: The Science and Life of Albert Einstein, Oxford
University Press, 1982.
[Penrose] Roger PENROSE, Techniques of Differential Topology in Relativity, SIAM, 1972.
[Petkov] Vesselin PETKOV, Inertia and Gravitation: From Aristotles Natural Motion to Geo-
desics Worldlines in Curved Spacetime, Minkowski Institute Press, 2012.
[Rahaman] Farook RAHAMAN, The Special Theory of Relativity: a mathematical approach, Sprin-
ger, 2014.
[Rossmann] Wulf ROSSMANN, Lectures on Differential Geometry, homepage do autor, 2003.
[Rowe] E. G. Peter ROWE, Geometrical Physics in Minkowski Spacetime, Springer, 2000.
[Shutz] Bernard SHUTZ, A First Course in General Relativity, 2nd. Edition, Cambridge Uni-
versity Press, 2009.
[Spivak] Michael SPIVAK, A Comprehensive Introduction to Differential Geometry, Vol. I, 2nd
Edition, Publish or Perish, 1979.
[Springer] Springer Handbook of Spacetime, Abhay Ashtekar e Vesselin Petkov, Editores, Sprin-
ger, 2014.
[Steenrod] Norman STEENROD, The Topology of Fibre Bundles, Princeton University Press,
1951.
[Stephani] Hans STEPHANI, Relativity, an Introduction to Special and General Relativity, 3rd.
Edition, Cambridge University Press, 2004.
[Takeuchi] Tatsu TAKEUCHI, An Illustrated Guide to Relativity, Cambridge University Press,
2010.
[Taylor-Wheeler] Edwin TAYLOR e John Archibald WHEELER, Spacetime Physics: Introduction to
Special Relativity, 2nd. Edition, Freeman, 1992.
[Topper] David R. TOPPER, How Einstein Created Relativity out of Physics and Astronomy,
Springer, 2013.
[Tsamparlis] Michael TSAMPARLIS, Special Relativity: An Introduction with 200 Problems and
Solutions, Springer, 2010.
[Warner] Frank W. WARNER, Foundations of Differentiable Manifolds and Lie Groups, Gra-
duate Texts in Mathematics 94, Springer, 1983.
[Woodhouse] Nicholas M. J. WOODHOUSE, Special Relativity, Springer, 2002.

Relatividade PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Relatividade PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Relatividade Especial, Geral e

1 Teoria da Relatividade Especial 5

5 Aceleracao no Espacotempo de Minkowski 58

6 O Tensor do Campo Eletromagnetico 59

7 O Princpio de Equivalencia Geodesicas no Espacotempo Curvo 60

10 Variedades Metricas 103

14 Derivada Covariante de Campos Tensoriais 198

15 O Tensor Momento-Energia 215

16 Equacao de Einstein 229

17 A Solucao de Schwarzschild 239

18 Campos de Jacobi 251

Teoria da Relatividade Especial

Principais personagens e porque estao listados aqui:

Aristoteles (384 BCE322 BCE): primeira teoria sistematica do movimento.

1.1 Breve Introducao

1.2 Deducao da existencia de ondas eletromagneticas atraves das

que tambem podem ser escritas na notacao

onde E e o campo eletrico, B o campo magnetico, a densidade (volumetrica) de carga eletrica, 0 a

rot (rot V) = grad (div V) div (grad V)

Prova: Escrevendo V = (V1 , V2 , V3 ), temos

1.2 Teorema (Existencia de Ondas Eletromagneticas). Sejam E e B os campos eletrico e magnetico,

rot (rot E) = (div E) E,

rot (rot E) = E, (1.1)

1.3 Referenciais Inerciais

Desta forma, associamos R4 ao espaco e ao tempo. Em geral, denotaremos as coordenadas de um referencial

1.6 Definicao. Um ponto no espaco e no tempo R4 e chamado um evento.

1.4 Princpio da Relatividade

1.10 Corolario. A velocidade da luz no vacuo e a mesma em qualquer referencial inercial.

1.5 Invariancia do Intervalo Espacotemporal

1.13 Teorema (Invariancia do Intervalo). Sejam O e O dois referenciais inerciais. Entao

Como s2 = s2 = 0 continua valendo se substituirmos todos os xi por xi , i = 1, 2, 3, obtemos

Subtraindo uma equacao da outra, segue que

Da, com a mesma escolha acima, segue que

Mii = M00 para i = 1, 2, 3.

= (v) (distancia entre dois eventos simultaneos em O) .

1.6 Relatividade da Simultaneidade

1.7 Relatividade de Intervalos Espaciais e de Intervalos Temporais

1.7.2 Dilatacao do Tempo

As coordenadas destes eventos no referencial inercial Nave sao

(x0A , t0A ) = (0, 0) ,

1.7.3 Invariancia das Dimensoes Transversais

2.1 Produto Interno e Formas Quadraticas

para todos u, v, w V e para todos , R. Uma forma bilinear f e simetrica se

para todos v, w V. Uma forma bilinear B e nao-degenerada se

para todo u V implicar v = 0 e se

para todo v V e negativo definido se

onde v = v 1 , . . . , v n e w = w1 , . . . , wn sao as coordenadas de v e w em relacao a B.

De fato, esta e claramente uma forma bilinear simetrica. Se

satisfazem hv, vi < 0, enquanto que vetores v da forma

satisfazem hv, vi > 0.

Dizemos que v e um vetor do tipo luz se q (v) = 0.

sao as coordenadas de v e w em relacao a uma base B =

a propria base B e ortonormal, com

1 (e1 + e2 ) + 2 (e1 e2 ) + 3 (e1 + e3 ) + . . . + n (e1 + en ) = 0,

Como B e uma base, segue que

q (v + w) q (v) q (w) = hv + w, v + wi hv, vi hw, wi

De fato, como g e nao-degenerada, existem vetores v, w V tais que

Basta entao tomar

Seja U = hui o subespaco gerado por u e

o subespaco ortogonal a u. Afirmamos que

De fato, os subespacos U e U sao linearmente independentes, pois um vetor tpico de U e da forma u

por definicao, mas

segue que w U , pois