Escolar Documentos
Profissional Documentos
Cultura Documentos
Geometria Lorentziana
1
Rodney Josué Biezuner
Departamento de Matemática
Instituto de Ciências Exatas (ICEx)
Universidade Federal de Minas Gerais (UFMG)
31 de agosto de 2017
1
E-mail: biezunerufmg@gmail.com; homepage: http://www.mat.ufmg.br/~rodney.
Sumário
2 O Espaçotempo de Minkowski 18
2.1 Produto Interno e Formas Quadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Operadores Ortogonais e Isometrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3 Métrica de Lorentz e Espaçotempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1 Propriedades do Espaçotempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Transformação de Lorentz do tipo Boost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.1 Medida Quantitativa da Dilatação do Tempo . . . . . . . . . . . . . . . . . . . . . . . 34
2.4.2 Matriz do Boost . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.3 Medida Quantitativa da Contração do Espaço . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.4 Resumo da Contração do Espaço e Dilatação do Tempo . . . . . . . . . . . . . . . . . 37
2.4.5 Lei de Adição de Velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4.6 Rotações Hiperbólicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3 Paradoxos 44
3.1 Diagramas de Espaçotempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Impossibilidade de se viajar acima da velocidade da luz . . . . . . . . . . . . . . . . . . . . . 46
3.3 Geodésicas no Espaço de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4 Paradoxo dos Gêmeos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4 Momento-Energia 54
4.1 4-Vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2 Momento-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
1
Rodney Josué Biezuner 2
8 Topologia Diferencial 62
8.1 Variedades Diferenciáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
8.2 Aplicações Diferenciáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
8.2.1 Partições da Unidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8.3 Vetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.3.1 Vetores Tangentes a Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.3.2 Vetores Tangentes como Derivações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8.3.3 Diferencial de uma Aplicação Diferenciável . . . . . . . . . . . . . . . . . . . . . . . . 69
8.4 Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.4.1 Diferencial em Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
8.5 Fibrado Tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.6 Fibrados Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
8.7 Campos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.8 Colchete de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.9 Derivada de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.10 Campos Vetoriais que Comutam . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.11 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
9 Tensores 86
9.1 Vetores Contravariantes e Covariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
9.1.1 Significado Real do Gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
9.2 Convenção da Soma de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
9.3 Vetores e Covetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
9.3.1 Mudança de Coordenadas em Espaços Vetoriais . . . . . . . . . . . . . . . . . . . . . . 89
9.3.2 Covetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
9.3.3 O Espaço Bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
9.4 Vetores e Covetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
9.4.1 Mudança de Coordenadas no Espaço Tangente Tp M . . . . . . . . . . . . . . . . . . . 93
9.4.2 Covetores Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
9.5 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.5.1 Definição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
9.5.2 Produto Tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
9.5.3 Mudança de Base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
9.5.4 Traço de Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
9.6 Fibrados Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
9.7 Campos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
9.8 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
11 Conexões 118
11.1 Conexões e Derivada Covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
11.2 Derivada Covariante ao longo de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
11.3 Transporte Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
11.4 Conexão Compatı́vel com a Métrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
11.5 O Tensor Torsão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.5.1 Conexão Simétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
11.6 Conexões Métricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
11.6.1 Sı́mbolos de Christoffel da Conexão Métrica . . . . . . . . . . . . . . . . . . . . . . . . 129
11.6.2 Interpretação Geométrica da Derivada Covariante . . . . . . . . . . . . . . . . . . . . 131
12 Geodésicas 133
12.1 Definição – A Equação Geodésica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
12.2 Exemplos de Geodésicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
12.3 Fluxo Geodésico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
12.4 A Aplicação Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
12.5 Lema de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
12.6 Geodésicas em Variedades Riemannianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
12.6.1 Geodésicas em Variedades Riemannianas minimizam distâncias localmente . . . . . . 147
12.6.2 Vizinhanças Convexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
12.7 Geodésicas em Variedades de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
12.8 Função Distância em Variedades Riemannianas . . . . . . . . . . . . . . . . . . . . . . . . . . 155
12.9 Variedades Riemannianas Completas e Teorema de Hopf-Rinow para Variedades Riemannianas156
12.10Apêndice: Geodésicas através do Método Variacional . . . . . . . . . . . . . . . . . . . . . . . 159
12.11Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
13 Curvatura 163
13.1 Mais sobre Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
13.2 O Tensor Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
13.2.1 O Endomorfismo Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
13.2.2 O Significado da Curvatura Nula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
13.2.3 Operação de Subir ou Descer um Índice . . . . . . . . . . . . . . . . . . . . . . . . . . 169
13.2.4 O Tensor Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
13.3 Curvatura de Ricci e Curvatura Escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
13.4 Curvatura Seccional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
13.5 Variedades Riemannianas de Curvatura Seccional Constante . . . . . . . . . . . . . . . . . . . 188
13.6 Apêndice: Motivação para a definição do tensor curvatura . . . . . . . . . . . . . . . . . . . . 190
13.6.1 Efeitos de Maré em Mecânica Newtoniana . . . . . . . . . . . . . . . . . . . . . . . . . 190
13.6.2 Efeitos de Maré em Relatividade Geral: Curvatura como uma medida da aceleração
relativa de trajetórias geodésicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
13.6.3 Curvatura como uma medida do transporte paralelo em trajetórias fechadas . . . . . . 194
13.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
19 Causalidade 269
19.1 Orientação Temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
19.2 Teoria de Causalidade para Espaçotempos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
19.2.1 Cronologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
19.3 Apêndice: O Recobrimento Duplo Temporalmente Orientável . . . . . . . . . . . . . . . . . . 271
Capı́tulo 1
• Galileo Galilei (1564–1642): princı́pio da relatividade galileana e corpos caem com a mesma aceleração
no vácuo.
• Isaac Newton (1642–1726): primeira e segunda leis da dinâmica, espaço e tempo absolutos, teoria da
gravitação universal (com o conceito de ação à distância associado, modelado nos fenômenos elétrico
e magnéticos).
• Michael Faraday (1791–1867): lei da indução de Faraday (inspiração direta para a teoria da relatividade
especial) e a idéia de campos (eliminando a necessidade da idéia de ação à distância).
• James Clerk Maxwell (1831–1879): equações de Maxwell para o eletromagnetismo; luz é uma onda
eletromagnética.
• Ernst Mach (1838–1916): princı́pio da inércia de Mach (inspiração indireta para a teoria da relatividade
geral; depois refutado).
• Albert Einstein (1879–1955): teoria da relatividade especial e teoria da relatividade geral.
• Hermann Minkowski (1864–1909): conceito do espaçotempo.
5
Rodney Josué Biezuner 6
navio: quer o navio encontre-se em movimento ou repouso, todos os objetos dentro do navio se comportarão
da mesma forma. Assim, se a água cai de um balde, ela cai na vertical, mesmo quando o navio se move,
e se houver borboletas voando, elas não vão se acumular na traseira da cabine (veja [Topper], Cap. 1, pp.
3–7 e [Petkov], Cap 2, pp. 23–28). Quanto ao segundo princı́pio, é um debate histórico se Galileo realmente
realizou um experimento de cima da Torre de Pisa, já que ele não há nenhum documento dele afirmando
isso. O que se conhece é o seu célebre experimento imaginário, em que ele imaginou três corpos com o mesmo
peso caindo portanto com a mesma aceleração no vácuo; se dois deles são colados por uma cola sem peso,
isso não deve afetar a sua aceleração, mas agora temos dois corpos, um com o dobro do peso do primeiro.
(Veja [Topper], Cap. 11, pp 85–88.)
Newton aceitou os dois princı́pios de Galileo. O primeiro ele imortalizou na sua primeira lei do movimento,
definindo mais precisamente o movimento no princı́pio de relatividade de Galileo como sendo movimento
retilı́neo uniforme, enquanto que o segundo é consequência da sua segunda lei do movimento, onde ele
introduziu o conceito de massa inercial (uma medida de resistência ao movimento) e da Lei da Gravitação
Universal, onde ele introduziu o conceito de massa gravitacional (uma medida da intensidade da força
gravitacional); o fato da aceleração dos corpos que caem ser constante era consequência da equivalência das
duas. Na Lei da Gravitação Universal, Newton introduziu também o conceito de ação à distância ou força
oculta, algo que foi aceito com muita dificuldade na época (apesar de Newton invocar os fenômenos elétrico
e magnético como exemplos de que isso ocorre na realidade). O conceito de ação à distância só foi aceito
porque sua teoria funcionava. Eventualmente, quando Faraday introduziu os conceitos de campos elétrico
e magnético, o conceito de campo gravitacional seguiu-se naturalmente. Também a questão de porque os
corpos se atraem, bastante debatida na época depois da sua introdução por Newton, foi de forma semelhante
ignorada por ele, como escreveu no final das últimas edições do seu Principia Mathematica: “E é suficiente
que a gravidade realmente existe e age de acordo com as leis que estabelecemos e é suficiente para explicar
todos os movimentos dos corpos celestes e do nosso mar [isto é, as marés].”; ou seja, não pergunte mais, ou
indague questões fı́sicas, mais profundas, pois a matemática funciona e isto é suficiente (veja [Topper], Cap.
4, pp. 25–28). Foi o primeiro exemplo em Fı́sica da atitude “cale a boca e faça as contas” (veja [Petkov],
Cap. 2, p. 2). A atitude de Newton foi aceita até que Einstein formulou a Teoria da Relatividade Geral.
Em outra notação,
∇ × (∇ × V) = ∇ (∇ · V) − ∇ · (∇V)
= ∇ (∇ · V) − ∇2 V.
i j k
∂ ∂ ∂ ∂V3 ∂V2 ∂V1 ∂V3 ∂V2 ∂V1
∇×V = = − , − , − ,
∂x ∂y ∂z ∂y ∂z ∂z ∂x ∂x ∂y
V1 V2 V3
donde
i j k
∂ ∂ ∂
∇ × (∇ × V) =
∂V ∂x ∂y ∂z
3 ∂V2 ∂V1 ∂V3 ∂V2 ∂V1
− − −
∂y ∂z ∂z ∂x ∂x ∂y
2
∂ V2 ∂ 2 V1 ∂ 2 V1 ∂ 2 V3
= − 2
− 2
+ ,
∂y∂x ∂y ∂z ∂z∂x
∂ 2 V2 ∂ 2 V1 ∂ 2 V3 ∂ 2 V2
− 2
+ + − ,
∂x ∂x∂y ∂z∂y ∂z 2
∂ 2 V1 ∂ 2 V3 ∂ 2 V3 ∂ 2 V2
− − +
∂x∂z ∂x2 ∂y 2 ∂y∂z
2 2 2
∂ V1 ∂ V2 ∂ V3 ∂ 2 V1 ∂ 2 V1 ∂ 2 V1
= 2
+ + − 2
− 2
− ,
∂x ∂y∂x ∂z∂x ∂x ∂y ∂z 2
∂ 2 V1 ∂ 2 V2 ∂ 2 V3 ∂ 2 V2 ∂ 2 V2 ∂ 2 V2
+ 2
+ − 2
− 2
− ,
∂x∂y ∂y ∂z∂y ∂x ∂y ∂z 2
∂ 2 V1 ∂ 2 V2 ∂ 2 V3 ∂ 2 V3 ∂ 2 V3 ∂ 2 V3
+ + − − −
∂x∂z ∂y∂z ∂z 2 ∂x2 ∂y 2 ∂z 2
∂ ∂V1 ∂V2 ∂V3
= + + − ∆V1 ,
∂x ∂x ∂y ∂z
∂ ∂V1 ∂V2 ∂V3
+ + − ∆V2 ,
∂y ∂x ∂y ∂z
∂ ∂V1 ∂V2 ∂V3
+ + − ∆V3
∂z ∂x ∂y ∂z
= ∇ (div V) − ∆V.
Rodney Josué Biezuner 8
∂2E 1
= ∆E,
∂t2 µ0 ε0
∂2B 1
= ∆B.
∂t2 µ0 ε0
Prova. Do lema anterior temos que
No vácuo, em um ambiente livre de cargas elétricas, a primeira e terceira equações de Maxwell (leis de Gauss
para o campo elétrico e para o campo magnético, respectivamente) se tornam
div E = 0,
div B = 0,
logo
Por outro lado, no vácuo, em um ambiente livre de cargas elétricas, a segunda e quarta equações de Maxwell
(lei de indução de Faraday e lei de Ampère com a correção de Maxwell)
∂B
rot E = − ,
∂t
∂E
rot B = µ0 ε0 .
∂t
Portanto,
∂ ∂2E
rot (rot E) = − (rot B) = −µ0 ε0 2 , (1.2)
∂t ∂t
∂ ∂2B
rot (rot B) = µ0 ε0 (rot E) = −µ0 ε0 2 .
∂t ∂t
Reunindo (1.1) e (1.2), obtemos o resultado desejado.
As soluções das equações da onda do Teorema 1.2 são chamadas ondas eletromagnéticas. Pode-se mostrar,
usando as equações de Maxwell, que as ondas eletromagnéticas são ondas transversais, ou seja, as vibrações
dos campos elétrico e magnético são na direção perpendicular à direção de propagação da onda (para uma
dedução simples e curta veja, por exemplo, [Woodhouse], Seções 3.3 e 3.4, pp. 42–44; as ondas de som são
um exemplo de ondas longitudinais, em que as vibrações são na mesma direção de propagação da onda).
1.3 Corolário. A velocidade de uma onda eletromagnética no vácuo é
1
c= √ = 2, 99792458 × 108 m/s.
µ0 ε0
Rodney Josué Biezuner 9
Prova. Pois
∂2E
= c2 ∆E,
∂t2
∂2B
= c2 ∆B.
∂t2
Como este valor é igual ao da velocidade da luz, Maxwell concluiu que a luz é uma onda eletromagnética.
Vários experimentos posteriores corroboraram esta idéia. As equações de Maxwell foram as primeiras leis
da Fı́sica a conterem uma velocidade como uma constante fundamental.
1.2.1 O Éter
Na teoria ondulatória da luz de Fresnel (1821), a luz era uma onda mecânica que se propaga em um meio
chamado o éter luminı́fero. Ou seja, as vibrações da luz correspondiam a vibrações das moléculas etérias.
A velocidade de propagação c da luz era uma propriedade do éter. Para conter ondas transversais, o éter
tinha que ser um meio material elástico, embora fosse estranho que não existissem ondas longitudinais neste
meio. Além disso, para produzir ondas com esta enorme velocidade de propagação (em um segundo, a luz
dá 7 voltas ao redor da Terra), o éter tinha que ser extremamente rı́gido. O éter tinha que preencher todo
o Universo, pois a luz se propaga em todo lugar. Era lógico consider o éter como estando em repouso em
relação ao espaço absoluto de Newton, funcionando como uma espécie de materialização deste.
No entanto, uma tal substância onipresente deveria produzir outros efeitos mecânicos, além dos fenômenos
luminosos. Como podem os planetas se moverem através do éter sem perder energia? O éter penetraria
através dos corpos móveis sem perturbá-los ou seria arrastado por eles? O éter parecia ser uma substância
intangı́vel sem qualquer outro efeito além de ser o lugar onde os fenômenos luminososo ocorriam ([Springer],
Seção 1.3.3). Todo o conceito do éter soa bastante estranho para nós, até que lembramos que hoje em dia
a teoria da matéria escura, formada de misteriosas partı́culas que interagem apenas gravitacionalmente, é
bastante aceita.
Da mesma forma Maxwell viu suas ondas eletromagnéticas como um fenômeno mecânico em um meio
propagador. Após reconhecer que a luz era uma onda eletromagnética, ele identificou este meio propagador
com o éter de Fresnel. Portanto ele acreditava que suas equações eram válidas em um referencial fixado neste
meio.
De maneira semelhante, em um experimento imaginário (thought experiment) célebre, que Einstein afir-
mou em sua autobiografia ter tido na idade de 16 anos, ele imaginou o que aconteceria se viajássemos em um
raio de luz. Seguindo [Topper] (uma excelente história cientı́fica sobre a descoberta de Einstein da Teoria
da Relatividade) vamos descrever o experimento imaginário de Einstein de uma forma diferente: imagine-se
estando na cabine do piloto de uma nave espacial, tendo atrás da poltrona uma fonte de luz. À medida que
a nave fosse acelerando, haveria uma hora em que ela ultrapassaria a velocidade da luz e então a cabine
repentinamente ficaria às escuras. Desta forma seria possivel determinar se a nave estava em repouso ou não.
Mas isso significaria abandonar o princı́pio de relatividade de Galileu, também fundamental na Mecânica
Newtoniana, que afirmava que não se podia distinguir quando se estava em repouso e quando se estava em
movimento retilı́neo uniforme. Para não violar este princı́pio, a luz teria que se mover com uma velocidade
igual à soma da velocidade da nave e da velocidade da luz.
Vários experimentos no final do século XIX falharam em descobrir qualquer variação na velocidade da
luz devido ao movimento da fonte, notavelmente o experimento de Michelson-Morley (1881; veja [Springer],
Seção 1.3, para uma descrição breve deste e de outros experimentos e [Ferraro], Capı́tulo 2, para uma
discussão bem mais detalhada pelo mesmo autor).
O Princı́pio da Relatividade diz que uma vez que as leis da Fı́sica foram estabelecidas em um referencial
inercial, elas podem ser aplicadas sem modificação em qualquer outro referencial inercial. A forma ma-
temática das leis da Fı́sica e os valores numéricos das constantes fı́sicas básicas que estas leis contêm são as
mesmas em qualquer referencial inercial. No que se refere às leis da Fı́sica, todos os referenciais inerciais são
equivalentes. Consequentemente,
1.8 Corolário. Nenhum teste das leis da Fı́sica produz uma maneira de distinguir um referencial inercial
de outro referencial inercial.
1.9 Corolário. As equações de Maxwell no vácuo são as mesmas em qualquer referencial inercial.
Daı́ o tı́tulo do artigo original em que Einstein (1905) propôs a Teoria da Relatividade Especial: On the
Electrodynamics of Moving Bodies.
Rodney Josué Biezuner 11
∆s2 = 0
se e somente se
∆s2 = 0.
Prova. Pois, pelo Princı́pio de Relatividade, a velocidade da luz é constante igual a 1 em qualquer referencial
inercial.
Eventos que ocorrem na velocidade da luz são, por exemplo, os eventos emissão de um fóton e absorção do
mesmo.
No que se segue, usaremos a seguinte notação:
∆t = ∆x0 ,
∆x = ∆x1 ,
∆y = ∆x2 ,
∆z = ∆x3 .
∆s2 = ∆s2 .
Rodney Josué Biezuner 12
Prova. [Shutz]Observe que a relação entre as coordenadas de O e O é linear, porque caso contrário,
existiria um objeto em movimento retilı́neo uniforme em um referencial (trajetória reta) que não estaria em
movimento retilı́neo uniforme no outro referencial (sua trajétória não seria uma reta), contrariando o princı́pio
de relatividade (até mesmo galileano). Por simplicidade, assuma também que suas origens coincidem, isto
é, os eventos t = x = y = z = 0 e t = x = y = z = 0 são os mesmos.
Da hipótese de linearidade, segue que ∆t, ∆x, ∆y, ∆z são funções lineares de ∆t, ∆x, ∆y, ∆z, logo ∆s2 é
uma função quadrática de ∆t, ∆x, ∆y, ∆z, digamos
3
X
∆s2 = Mij ∆xi ∆xj . (1.3)
i,j=0
Observe que em princı́pio podemos ter Mij = Mij (v), onde v é a velocidade relativa entre os dois referenciais
(independe dos eventos). Podemos assumir, sem perda de generalidade, que Mij = Mji (trocando, se
necessário, Mij por (Mij + Mji ) /2).
Para dois eventos em que
∆s2 = ∆s2 = 0
temos !
3
X 3
X
2 i
Mij ∆xi ∆xj = 0.
M00 (∆t) + 2 M0i ∆x ∆t + (1.4)
i=1 i,j=1
Como ∆s2 = ∆s2 = 0 continua valendo se substituirmos todos os ∆xi por −∆xi , i = 1, 2, 3, obtemos
3
! 3
2
X X
i
Mij ∆xi ∆xj = 0.
M00 (∆t) − 2 M0i ∆x ∆t +
i=1 i,j=1
Escolhendo
∆xi = ∆t = 1,
∆xj = ∆xk = 0, se j, k 6= i,
concluı́mos que
M0i = 0 para i = 1, 2, 3 (1.5)
e, portanto,
3
X
2
Mij ∆xi ∆xj = 0.
M00 (∆t) +
i,j=1
Se i 6= j, escolhendo agora
√
∆xi = 1, ∆xj = 1, ∆t = 2,
k
∆x = 0, se k 6= i, j,
Rodney Josué Biezuner 13
e
√
∆xi = 1, ∆xj = −1, ∆t = 2,
k
∆x = 0, se k 6= i, j,
obtemos, respectivamente,
2M00 + 2M00 + 2Mij = 0,
2M00 + 2M00 − 2Mij = 0;
subtraindo estas duas equações, concluı́mos que
Mij = 0
se i 6= j.
Em outras palavras,
Mij = −M00 δij para i, j = 1, 2, 3, (1.6)
e h i
2 2 2 2
∆s2 = M00 (∆t) − (∆x) − (∆y) − (∆z) = −M00 (v) ∆s2 . (1.7)
Denote
φ (v) = −M00 (v) . (1.8)
Afirmamos que φ (v) ≡ 1.
Em primeiro lugar, observamos que φ é radial, de modo que
φ (v) = φ (|v|) = φ (v) . (1.9)
De fato, escolhendo dois eventos que são simultâneos no referencial O, isto é, ∆t = 0 (por exemplo, o
comprimento de uma barra) concluı́mos que
distância entre dois eventos simultâneos em O
É fácil entender isso usando a invariância do intervalo. Os dois eventos são: evento A, impacto do
relâmpago com a parte dianteira do trem, e evento B, impacto do relâmpago com a parte traseira do trem.
Digamos que estes dois eventos tem coordenadas (xA , tA ) e (xB , tB ) no referencial inercial do observador no
chão O, e coordenadas (x0A , t0A ) e (x0B , t0B ) no referencial inercial do observador dentro do trem O0 . Sejam
∆x = xB − xA ,
∆t = tB − tA ,
e
0
∆x = x0B − x0A ,
0
∆t = t0B − t0A ,
as separações espaciais e temporais destes dois eventos em cada um dos referenciais inerciais. Pela invariância
do intervalo espaçotemporal,
2 2 2 2
(∆x0 ) − (∆t0 ) = (∆x) − (∆t) .
Mas
∆t = 0,
já que os eventos são simultâneos no referencial inercial O, consequentemente
2 2 2
(∆x0 ) − (∆t0 ) = (∆x)
e
∆x0 > ∆x. (1.10)
Assim, o comprimento de uma barra medido em um referencial em que ela está em repouso é sempre maior
que o comprimento dela medido em um referencial em que ela se move. Este efeito é a chamada contração
de Lorenz. O comprimento da barra medido em um referencial em que ela está em repouso é chamado o seu
comprimento próprio. Portanto, o comprimento próprio é sempre maior que o comprimento medido em
um referencial em que a barra está se movendo. Na Seção 2.4.3 obteremos uma expressão que nos permitirá
calcular exatamente o quanto o comprimento é diminuı́do no referencial que se move; o fator de contração
dependerá exclusivamente da velocidade deste.
(xA , tA ) = (0, 0) ,
(xB , tB ) = (99, 101) .
pois no referencial inercial Nave os dois eventos, saı́da da Terra e chegada em Canopus, ocorrem na mesma
posição, isto é, na própria nave. Para calcular o tempo T decorrido entre os dois eventos de acordo com o
Rodney Josué Biezuner 16
referencial Nave, calculamos as separações espaciais e temporais nos dois referenciais inerciais e usamos a
invariância do intervalo espaçotemporal. Temos
∆x = xB − xA = 99,
∆t = tB − tA = 101,
e
0
∆x = x0B − x0A = 0,
0
∆t = t0B − t0A = T.
Como
2 2 2 2
(∆t0 ) − (∆x0 ) = (∆t) − (∆x) ,
e
∆x0 = 0
segue que
2 2 2 2
(∆t0 ) − (∆x0 ) = (∆t) − (∆x) ,
isto é,
2 2 2
(∆t0 ) = (∆t) − (∆x) ,
e consequentemente,
∆t0 < ∆t. (1.11)
No caso, mais especificamente temos
T 2 = 1012 − 992
= 10.201 − 9.801
= 400
e portanto
T = 20.
Enquanto na Terra se passaram 101 anos, dentro da nave espacial, decorreram apenas 20 anos. Assim, o
intervalo de tempo entre dois eventos medido em um referencial em que eles ocorrem na mesma posição
é sempre menor que o intervalo de tempo entre os dois eventos medido em um referencial que se move
em relação ao primeiro. Este efeito é a chamada dilatação do tempo. O intervalo de tempo entre dois
eventos medido em um referencial em que eles ocorrem na mesma posição é chamado o seu tempo próprio.
Portanto, o tempo próprio é sempre menor que o tempo medido em um referencial que está se movendo em
relação a este referencial. Na Seção 2.4.1 obteremos uma expressão que nos permitirá calcular exatamente
o quanto o tempo é dilatado no referencial que se move; o fator de dilatação dependerá exclusivamente da
velocidade deste.
Observe que quanto mais próxima da velocidade da luz é a velocidade da nave, menor o tempo decorrido
na nave. No limite, se a nave se movesse à velocidade da luz (o que é impossı́vel para partı́culas materiais,
como veremos no final deste capı́tulo), o intervalo de tempo seria zero, pois neste caso terı́amos
∆x = ∆t = 99,
de modo que
2 2 2
(∆t0 ) = (∆t) − (∆x) = 0.
Rodney Josué Biezuner 17
O Espaçotempo de Minkowski
f (v, w) = f (w, v)
f (v, u) = 0
hv, vi > 0,
B = {e1 , . . . , en }
uma base para V. Para 0 6 k 6 n e α1 , . . . , αn ∈ R, αi > 0 para todo i, definimos o produto interno
k
X n
X
hv, wi = − αi v i wi + αi v i wi ,
i=1 i=k+1
18
Rodney Josué Biezuner 19
hv, wi = 0
para todo w ∈ V, isso vale em particular para os vetores da base canônica e1 , . . . , en . Mas hv, ei i = ±αi v i ,
logo v i = 0 para todo i e portanto ela é não-degenerada. Se k = 0 este produto interno é positivo definido,
se k = n este produto interno é negativo definido e se 0 < k < n este produto interno não é nem positivo
definido nem negativo definido, pois vetores da forma
v = v 1 , . . . , v k , 0, . . . , 0
v = 0, . . . , 0, v k+1 , . . . , v n
q (v) = hv, vi .
2.5 Exemplo. Se q é uma forma quadrática induzida por um produto interno positivo definido ou por um
produto interno negativo definido, então v é um vetor do tipo luz se e somente se v = 0. Se q é induzida por
um produto interno que não é definido, então mesmo que v 6= 0 pode acontecer que v seja um vetor do tipo
luz. Por exemplo, para a forma quadrática do Exemplo 2.4, se k 6= 0 temos
q (ei + ej ) = 0
Rodney Josué Biezuner 20
para todos 1 6 i 6 k e k + 1 6 j 6 n. De fato, é possı́vel obter uma base para V composta inteiramente de
vetores do tipo luz. No caso k = 1, basta tomar
B0 = {e1 + e2 , e1 − e2 , e1 + e3 . . . , e1 + en } .
Para ver que B0 é uma base, basta verificar que os n vetores que a formam são LI. Se
então !
n
X n
X
αi e1 + (α1 − α2 ) e2 + αi ei = 0.
i=1 i=3
α1 − α2 = 0,
α3 = . . . = αn = 0,
donde αi = 0 para todo i.
Note que
q (v) = q (−v) ,
para todo v ∈ V, pois
q (−v) = h−v, −vi = hv, vi = q (v) .
De modo geral,
q (αv) = α2 q (v) .
2.6 Proposição (Identidade Polar). Um produto interno é completamente determinado por sua forma
quadrática associada. Mais especificamente, se q é a forma quadrática induzida pelo produto interno h·, ·i,
então
1
hv, wi = [q (v + w) − q (v) − q (w)] .
2
e
1
hv, wi = [q (v + w) − q (v − w)]
4
Em particular, toda forma bilinear simétrica induz uma única forma quadrática.
Prova. Pois,
q (v + w) − q (v − w) = hv + w, v + wi − hv − w, v − wi
= hv, vi + 2 hv, wi + hw, wi − [hv, vi − 2 hv, wi + hw, wi]
= 4 hv, wi .
Rodney Josué Biezuner 21
2.7 Definição. Seja V um espaço vetorial de dimensão finita com produto interno h·, ·i e q sua forma
quadrática associada. A norma de um vetor v ∈ V é definida por
p p
kvk = |hv, vi| = |q (v)|.
Observe que a norma de um vetor é sempre um número positivo ou zero. Vetores do tipo luz tem norma
zero.
2.8 Teorema (Teorema de Sylvester). Sejam V um espaço vetorial de dimensão finita com produto
interno h·, ·i e q sua forma quadrática associada. Então V possui uma base ortonormal.
Além disso, o número de vetores ei de qualquer base ortonormal B = {e1 , . . . , en } para V tais que
q (ei ) = −1
é o mesmo.
Prova. Para mostrar a existência de uma base ortonormal faremos indução sobre a dimensão de V. Seja
n = dim V e verifiquemos primeiro o caso n = 1. Afirmamos que existe u ∈ V tal que
q (u) 6= 0.
hv, wi =
6 0.
Se q (v) 6= 0 ou q (w) 6= 0, a afirmação está provada. Caso contrário, se q (v) = q (w) = 0, escolhemos
u = v + w, pois
q (v + w) = hv + w, v + wi
= hv, vi + 2 hv, wi + hw, wi
= q (u) + 2 hv, wi + q (w)
= 2 hv, wi
6= 0.
q (u) 6= 0.
U ⊥ = {v ∈ V : hu, vi = 0}
V = U ⊕ U ⊥.
hu, αui = 0
Rodney Josué Biezuner 22
hu, vi
w=v− u,
hu, ui
portanto
hu, vi
v= u+w
hu, ui
com o primeiro vetor da soma em U e o segundo em U ⊥ . Agora, pela hipótese de indução existe uma base
ortonormal
B0 = {e1 , . . . , en−1 }
para U ⊥ . Tomando en = u, obtemos uma base ortonormal
B = {e1 , . . . , en−1 , en }
para V.
Para provar a última parte do teorema (seguindo [Lang]), sejam
B = {e1 , . . . , er , er+1 , . . . , en } ,
B0 = {f1 , . . . , fs , fs+1 , . . . , fn }
α1 e1 + . . . + αr er + βs+1 fs+1 + . . . + βn fn = 0,
escrevemos
α1 e1 + . . . + αr er = −βs+1 fs+1 − . . . − βn fn ,
e tomamos o produto interno desta equação consigo mesma, obtendo
já que g (ei , ei ) = q (ei ) = −1 para i = 1, . . . , r e g (fi , fi ) = q (fi ) = 1 para i = s + 1, . . . , n. Como o lado
esquerdo é não positivo e o lado direito é não negativo, segue que ambos devem ser do tipo luz e portanto
α1 = . . . = αr = βs+1 = . . . = βn = 0,
r + (n − s) 6 n,
donde
r 6 s.
Por simetria do argumento, segue também que s 6 r e portanto r = s.
Segue que dado um espaço vetorial V com produto interno g e forma quadrática associada q, V possui uma
base ortonormal B = {e1 , . . . , en } tal que em relação a esta base o produto interno e a forma quadrática se
escrevem na forma
k
X n
X
hv, wi = v i wi − v i wi ,
i=1 i=k+1
k n
X 2 X 2
q (v) = vi − vi ,
i=1 i=k+1
para todos
v = v i ei , w = wi ei ∈ V.
É óbvio que a mesma conclusão do Teorema de Sylvester vale para os vetores ej tais que q (ej ) = +1. A razão
do resultado ter sido enunciado em termos da contagem de vetores unitários negativos decorre da seguinte
convenção:
2.9 Definição. Dado um espaço vetorial V com produto interno g e sua forma quadrática associada q, o
ı́ndice de g (e de q) é o número de vetores de uma base ortonormal de V tais que q (ei ) = −1.
2.10 Notação. Definimos
−1 se i = j = 1, . . . , k,
k
ηij = 1 se i = j = k + 1, . . . , n,
0 se i 6= j.
k
O sı́mbolo ηij é uma generalização do delta de Kronecker δij , isto é,
0
ηij = δij .
Ele é às vezes chamado o eta de Kronecker. Quando k = 1, omitimos o ı́ndice superescrito e escrevemos
simplesmente ηij , isto é,
1
ηij = ηij
Na representação matricial, temos
− idk 0
ηk = ,
0 idn−k
onde idm é a matriz identidade m × m.
2.11 Exemplo. Em Rn , se e1 , . . . , en são os vetores da base canônica, definimos uma métrica com ı́ndice k
k k
por gij = hei , ej i = ηij ,
Rodney Josué Biezuner 24
para todos v, w ∈ V.
Uma matriz ortogonal é uma matriz que representa um operador ortogonal em relação a qualquer base.
Lembramos que se A é uma matriz que representa o operador linear L em relação à base B = {e1 , . . . , en }
de V, então a matriz A tem a forma em colunas
A = Le1 . . . Len ,
g = (gij ) .
2.13 Proposição. Seja V um espaço vetorial de dimensão finita com produto interno h·, ·i e forma quadrática
associada q de ı́ndice k. Então P é uma matriz ortogonal se e somente se
P T ηk P = ηk .
Prova. Seja
B = {e1 , . . . , en }
uma base ortonormal para V satisfazendo
−1 se i = 1, . . . , k,
q (ei ) =
1 se i = k + 1, . . . , n.
Se
n
X
v= v i ei ,
i=1
denote
k
X n
X
v #k = − v i ei + v i ei .
i=1 i=k+1
v #k = η k v
e
hv, wi = v T w#k
Rodney Josué Biezuner 25
e
Le1
k − idk 0
Pη P = ... Le1 . . . Len
0 idn−k
Len
Le1 h i
= . . . (Le1 )#k . . . (Len )#k
Len
= [hLei , Lej i]
= ηk .
v T P T η k P w = v T η k w.
(2.1)
= hP v, P wi ,
hP v, P wi = hv, wi .
2.14 Proposição. O conjunto G dos operadores ortogonais é um grupo sob a operação de composição de
operadores.
Prova. Claramente, o operador identidade está em G. Se L, M ∈ G, então
h(L ◦ M ) v, (L ◦ M ) wi = hL (M v) , L (M w)i
= hM v, M wi
= hv, wi ,
logo L−1 ∈ G.
G é chamado o grupo ortogonal.
Rodney Josué Biezuner 26
2.15 Definição. Seja V um espaço vetorial de dimensão finita com produto interno e forma quadrática
associada q. Uma aplicação F : V −→ V tal que
q (F (v) − F (w)) = q (v − w)
Passo 3. F é linear.
Seja
B = {e1 , . . . , en }
Rodney Josué Biezuner 27
hv, wi = hF (v) , wi
F (v) = v,
isto é,
F = id,
que é um operador ortogonal. Se (2.2) não se cumpre, pelo Passo 2 F leva bases ortonormais em bases
ortonormais, de modo que se
F (ei ) = fi ,
então
B0 = {f1 , . . . , fn }
é uma base ortonormal. Se L é o operador ortogonal que leva B0 em B, segue que G = L ◦ F é uma isometria
que satisfaz
G (ei ) = ei ,
logo pelo argumento anterior segue que
G = id
e portanto
F = L−1
é um operador ortogonal.
2.18 Proposição. Seja V um espaço vetorial de dimensão finita com produto interno. Se F : V −→ V é
uma isometria, então existe um único operador ortogonal L e uma única translação T tais que
F = T ◦ L.
T (p) = p + F (0) .
F = T1 ◦ L1 = T2 ◦ L2 ,
Rodney Josué Biezuner 28
então
L1 ◦ L−1 −1
2 = T1 ◦ T2 .
Em particular, T1−1 ◦ T2 é um operador linear e como operadores lineares deixam o vetor nulo fixo, segue
que T1−1 ◦ T2 é a translação nula, isto é, a identidade. Logo,
T1−1 ◦ T2 = id =⇒ T1 = T2 ,
L1 ◦ L−1
2 = id =⇒ L1 = L2 .
hv, wi = −v 0 w0 + v 1 w1 + v 2 w2 + v 3 w3 ,
2 2 2 2
q (v) = − v 0 + v 1 + v 2 + v 3
hv, wi = ηij v i wj .
Segue do Princı́pio da Relatividade (Teorema 1.13 da Invariância do Intervalo) que o espaçotempo fı́sico na
Teoria da Relatividade Especial é um espaçotempo de Minkowski, com o intervalo entre dois eventos v, w
sendo exatamente q (v − w). Mais tarde, quando estudarmos a Teoria da Relatividade Geral, veremos que
isso é verdade apenas localmente.
Vale a pena ressaltar que foi Minkowski quem traduziu a Teoria da Relatividade Especial para a linguagem
do espaçotempo (em 1907), isto é, foi ele quem reconheceu que a consequência principal da teoria foi a
unificação do espaço e do tempo em uma só unidade. Em suas palavras: “De agora em diante, espaço
por si só e tempo por si estão condenados a desaparecer em meras sombras, e somente uma união dos
dois preservará uma realidade independente.” ([Taylor-Wheeler], Seção 1.5, p. 15.) Inicialmente, Einstein
não aceitou bem a idéia de Minkowski. Em sua opinião, estender o espaço para a quarta dimensão mais
mistificava do que esclarecia a teoria. Na verdade, em resposta a formulação de Minkowski, Einstein é
quotado como tendo dito: “Desde que os matemáticos invadiram a teoria da relatividade, eu próprio não a
compreendo mais.” Pouco tempo depois, no entanto, Einstein mudou radicalmente de opinião e reconheceu
a importância do conceito de espaçotempo, que foi fundamental para a elaboração da Teoria da Relatividade
Geral; Minkowski foi a primeira entre as duas únicas pessoas que ele reconheceu no artigo de publicação da
teoria como sendo instrumentais na sua formulação (veja Seção 7.1).
Rodney Josué Biezuner 29
Na realidade, o espaçotempo é muito mais que uma linguagem ou uma formalização diferente da teoria.
Ele dá sentido fı́sico à Teoria da Relatividade, como [Petkov] argumenta muito persuasivamente no Capı́tulo 5
(especialmente pp. 75–76). De fato, o próprio Minkowski (quotado lá, p. 78) argumentou convincentemente
que o Postulado da Relatividade deveria ser trocado pelo Postulado do Mundo Absoluto. Ou seja, a principal
idéia da Teoria da Relatividade Especial, que resume tudo e de onde todas as consequências seguem, é
trocar o espaço e o tempo absoluto de Newton pelo espaçotempo absoluto com a métrica de Lorentz (o
espaçotempo de Minkowski). [Petkov], Capı́tulo 6, argumenta que a relutância inicial de Einstein em aceitar
o espaçotempo de Minkowski desempenhou um papel importante na relativa demora em desenvolver a Teoria
da Relatividade Geral, mesmo após ele ter tido o insight do princı́pio da equivalência (seu pensamento mais
feliz da vida; veja Seção 7.1).
2.20 Definição. O grupo das isometrias do espaçotempo de Minkowski Isom(M) é chamado o grupo de
Poincaré.
Um operador ortogonal do espaçotempo de Minkowski é chamado uma transformação de Lorentz. O
grupo das transformações de Lorentz é chamado o grupo de Lorentz.
Assim, transformações de Lorentz são operadores lineares no espaçotempo de Minkowski que preservam a
métrica de Lorentz. Consequentemente, o grupo de Lorentz é um subgrupo do grupo de Poincaré.
Pode-se provar que o grupo de Poincaré é um grupo a 10 parâmetros. Um subgrupo particularmente fisi-
camente interessante é o subgrupo de Poincaré ortócrono próprio, obtido quando se exclui as reflexões
espaciais e temporais (estas últimas são chamadas reversões temporais; elas se referem a transformações de
coordenadas entre dois referenciais inerciais em que o relógio de um está andando na direção contrária à do
relógio do outro), que ainda é um grupo a 10 parâmetros gerado pelas 4 translações (nas direções t, x, y, z) e
por 6 transformações de Lorentz, 3 das quais são as rotações espaciais da geometria euclideana em relação
aos eixos x, y, z e as outras 3 são os boosts nas direções x, y, z, a serem explicados na próxima seção. Para
maiores detalhes sobre o subgrupo de Poincaré ortócrono próprio, veja [Rowe], Seção 1.9, pp. 31–34 e [Naber],
Seção 1.3, pp. 15–42. Para maiores detalhes sobre o grupo de Poincaré geral, veja [Tsamparlis], Seção 1.6,
pp. 18–26, para uma dedução com insight geométrico, e Seção 1.7, pp. 26–40, para uma dedução puramente
algébrica.
Seja V um espaço vetorial de dimensão finita com produto interno. Dizemos que um subespaço W ⊂ V é
não degenerado se o produto interno de V restrito a W é não degenerado; caso contrário, dizemos que W é
degenerado. Por exemplo, no espaço de Minkowski M, o subespaço gerado por e1 , e2 , e3 é não degenerado,
enquanto que o subespaço gerado por e0 é degenerado.
2.22 Lema. Seja V um espaço vetorial com produto interno. Um subespaço W ⊂ V é não degenerado se e
somente se
V = W ⊕ W ⊥.
De fato, seja {e1 , . . . , em } uma base para W e complete esta base até uma base {e1 , . . . , em , em+1 , . . . en }
para V. Um vetor v ∈ V pertence a W ⊥ se e somente se hv, ei i = 0 para i = 1, . . . , m, ou seja, se e somente
se v = v j ej satisfaz o sistema
gij v j = 0 para i = 1, . . . , m.
Como a matriz (gij ) é invertı́vel, o subespaço solução deste sistema tem dimensão exatamente igual a n − m.
De (2.3) e (2.15) segue que V = W + W ⊥ se e somente se W ∩ W ⊥ = 0. Assim, qualquer uma destas
condições é equivalente a V = W ⊕ W ⊥ . Mas
W ∩ W ⊥ = {w ∈ W : w ⊥ W } ,
2.25 Proposição. Dois vetores v, w do tipo tempo estão no mesmo cone temporal se e somente se
hv, wi < 0.
Prova: Seja v ∈ C (u), para u ∈ M− que podemos tomar unitário, de modo que hu, ui = −1. Mostraremos
que w ∈ M− pertence também a C (u) se e somente se hv, wi < 0. Escreva
v = au + x,
w = bu + y,
⊥
para x, y ∈ hui . Temos
hv, wi = hau + x, bu + yi = −ab + hx, yi . (2.5)
Como
2
0 > hv, vi = hau + x, au + xi = −a2 + kxk ,
2
0 > hw, wi = hbu + y, bu + yi = −b2 + kyk ,
Rodney Josué Biezuner 31
segue que
M− = C (v) ∪ C (−v)
B = {e0 , e1 , e2 , e3 }
para o espaço de Minkowski M com q (e0 ) = −1, o cone temporal futuro de M é o conjunto
Assim,
M− = C+ ∪ C− .
A escolha de qual cone temporal é designado como o cone temporal futuro e qual cone temporal é designado
como o cone temporal passado depende portanto da escolha da base. Isso determina uma orientação no
espaço de Minkowski.
Rodney Josué Biezuner 32
Como observado na demonstração da Proposição 2.25, existem vetores do tipo espaço que satisfazem a
desigualdade de Cauchy-Schwartz. Isso não é verdade para todos os vetores do tipo espaço. Por exemplo,
v = (−1, 1, 1, 1) ,
w = (1, 1, 1, 1) ,
pois hz, zi > 0 pela Proposição 2.23 e hw, wi , hv, vi < 0. A igualdade vale se e somente se z = 0.
2.28 Proposição (Desigualdade Triangular Reversa). Se v, w ∈ M são do tipo tempo pertencentes ao
mesmo cone temporal, então
kvk + kwk 6 kv + wk
com a igualdade valendo se e somente se v e w são múltiplos escalares um do outro.
Prova: Como v, w estão no mesmo cone temporal e cones temporais são convexos, segue que v + w também
estã no mesmo cone temporal e em particular também é um vetor do tipo tempo, ou seja,
hv + w, v + wi < 0.
Logo,
2 2 2
(kvk + kwk) = kvk + 2 kvk kwk + kwk
2 2
6 kvk − 2 hv, wi + kwk
= − hv, vi − 2 hv, wi − hw, wi
= − hv + w, v + wi
2
= kv + wk
|hv, wi|
> 1,
kvk kwk
|hv, wi|
cosh θ = .
kvk kwk
de modo que
1
t= √ t0 .
1 − v2
2.31 Definição. O número
1
γ=√ (2.6)
1 − v2
é chamado o fator de dilatação do tempo.
Observe que t0 é o tempo próprio no referencial O0 e como
γ > 1,
isso mostra o que já vimos antes, que o tempo próprio é sempre menor que o tempo medido em um outro
referencial que está se movendo em relação ao referencial onde o tempo próprio é medido. Agora temos uma
expressão que nos dá exatamente o quanto o tempo é dilatado.
Concluı́mos que para dois eventos cujas coordenadas x0 = 0 a transformação de Lorentz é
t = γt0 , (2.7)
0
x = vγt . (2.8)
Rodney Josué Biezuner 35
Observe que p
γ2 − 1
v=± ,
γ
pois a velocidade relativa entre os referenciais pode ser positiva ou negativa, dependendo da direção em
que um se move em relação ao outro, portanto opta-se por escrever v explicitamente, e não em função do
parâmetro γ. Se v > 0 (isto é, o referencial O0 se move para a direita do referencial O), então
t = γt0 ,
p
x = γ 2 − 1t0 ,
enquanto que se v < 0 (isto é, o referencial O0 se move para a esquerda do referencial O), então
t = γt0 ,
p
x = − γ 2 − 1t0 ,
segue que
2 2
(t0 ) − (x0 ) = t2 − x2 ,
Substituindo, temos
2 2 2 2
(t0 ) − (x0 ) = (γt0 + ax0 ) − (vγt0 + bx0 )
2
= γ 2 − v 2 γ 2 (t0 ) + (2γa − 2vγb) t0 x0
2
+ a2 − b2 (x0 )
2 2
= (t0 ) + 2γ (a − vb) t0 x0 + a2 − b2 (x0 )
a − vb = 0,
a2 − b2 = −1.
v 2 − 1 b2 = −1
donde
1
b= √ = γ.
1 − v2
Logo,
a = vγ.
Assim,
e 0
t γ vγ 0 0 t
x vγ γ 0 0 x0
y = 0
. (2.11)
1 0 y0
0
z 0 0 0 1 z0
Observe que a matriz da transformação de Lorentz boost é simétrica. Em termos apenas de v podemos
escrever
t0 + vx0
t= √ , (2.12)
1 − v2
x0 + vt0
x= √ . (2.13)
1 − v2
A inversa da transformação de Lorentz é dada por
0
t γ −vγ 0 0 t
x0 −vγ γ 0 0 x
0 = . (2.14)
y 0 0 1 0 y
z0 0 0 0 1 z
Rodney Josué Biezuner 37
Ela é facilmente obtida uma vez que notamos que o referencial O se move com velocidade −v na direção
positiva do eixo x do referencial inercial O0 , logo basta substituir v por −v em (2.11).
As matrizes das transformações de Lorentz boosts nas direções y e z são, respectivamente,
γ 0 vγ 0 γ 0 0 vγ
0 1 0 0 0 1 0 0
vγ 0 γ 0 e 0 0 1 0 .
0 0 0 1 vγ 0 0 γ
A composta de boosts em direções diferentes não é um boost e portanto o conjuntos dos boosts não forma um
subgrupo do grupo de Poincaré (é uma rotação, chamada rotação de Thomas ou precessão de Thomas;
veja [Rowe], Seção 1.9.3, pp. 33–34 e [Rahaman], Seção 3.4, p. 31). Este fato só foi descoberto nos anos
1920s e diz-se que surpreendeu Einstein. É claro que se considerarmos apenas boosts em uma única direção
eles formam um subgrupo a 1 parâmetro, isomorfo a R, como veremos na Seção 2.4.5.
A medida da distância L0 entre a Terra e o sistema estelar de acordo com o referencial inercial Nave O0 é
dada por
L0 = vt0 ,
pois v é a velocidade da nave quando ela deixou a primeira extremidade desta longuı́ssima barra (que é o
planeta Terra) e t0 é o tempo que ela levou para chegar à segunda extremidade da barra (o sistema estelar).
Portanto p
L0 = 1 − v 2 L. (2.15)
O evento A é a partı́cula passando pela extremidade esquerda da barra, enquanto que o evento B é a
partı́cula passando pela extremidade direita da barra. No referencial (t, x) da barra (isto é, no referencial
em que a barra encontra-se em repouso), os eventos A e B tem coordenadas
(tA , xA ) = (0, 0) ,
(tB , xB ) = (t, L0 ) ,
L0 = vt,
enquanto que no referencial (t0 , x0 ) da partı́cula (isto é, no referencial em que a partı́cula está em repouso)
os eventos A e B tem coordenadas
L = vτ.
Em particular,
t L0
= ,
τ L
o que mostra que não é possı́vel que os comprimentos (distâncias espaciais) sejam relativos, isto é, variem
com a velocidade do referencial, sem que os tempos (intervalos temporais) também sejam e vice-versa.
Pela invariância do intervalo,
τ 2 = t2 − L20 .
Substituindo L0 = vt, obtemos p
τ= 1 − v 2 t,
Rodney Josué Biezuner 39
de modo que o tempo próprio, medido no referencial em que os eventos ocorrem na mesma posição, é sempre
menor que o tempo medido em um referencial em que os eventos ocorrem em diferentes posições. Dividindo
ambos os lados por τ e substituindo t/τ por L0 /L, obtemos
p
L = 1 − v 2 L0 ,
de modo que o comprimento próprio, isto é, o comprimento de um objeto em um referencial em que ele está
em repouso, é sempre maior que o comprimento do objeto medido em um referencial em relação ao qual ele
se move (mover-se em relação a um objeto “causa” a contração do mesmo na dimensão ao longo da direção
do movimento).
z 0 0 0 1 z 00
e 0
v0 γ 0 0 0 γ 00 v 00 γ 00 0 0
00
t γ t
x v 0 γ 0 γ 0 0 0 v 00 γ 00 γ 00
0 0 x00
y = 0
,
1 0 y 00
0 1 0 0 0
z 0 0 0 1 0 0 0 1 z 00
isto é,
0
v0 γ 0 0 γ 00 v 00 γ 00
γ vγ 0 0 γ 0 0 0
0 0
vγ
γ 0 0
= vγ
γ0 0 0 00 00
v γ γ 00 0 0
0 0 1 0 0 0 1 0 0 0 1 0
0 0 0 1 0 0 0 1 0 0 0 1
0 00 0 00
γ 0 γ 00 (v 0 + v 00 ) 0
γ γ (1 + v v ) 0
γ 0 γ 00 (v 0 + v 00 ) γ 0 γ 00 (1 + v 0 v 00 ) 0 0
= .
0 0 1 0
0 0 0 1
Portanto,
γ = γ 0 γ 00 (1 + v 0 v 00 ) ,
vγ = γ 0 γ 00 (v 0 + v 00 ) .
pois
|senh x| < cosh x
para todo x ∈ R, já que sempre temos
|ex − e−x | ex + e−x
<
2 2
e
tanh (R) = (−1, 1) , (2.18)
porque, pela regra de L’Hôpital,
senh x ex − e−x
lim tanh x = lim = lim x
x→+∞ x→+∞ cosh x x→+∞ e + e−x
2x
e −1 2e2x
= lim 2x = lim = 1.
x→+∞ e + 1 x→+∞ 2e2x
Rodney Josué Biezuner 41
Vale a identidade
tanh a + tanh b
tanh (a + b) = . (2.19)
1 + tanh a tanh b
De fato, temos
Daı́,
senh (a + b) senh a cosh b + cosh a senh b
tanh (a + b) = =
cosh (a + b) cosh a cosh b + senh a senh b
senh a cosh b + cosh a senh b
= cosh a cosh b
cosh a cosh b + senh a senh b
cosh a cosh b
senh a senh b
+
= cosh a cosh b
senh a senh b
1+
cosh a cosh b
tanh a + tanh b
= .
1 + tanh a tanh b
Segue de (2.18) e da injetividade da função tangente hiperbólica que se
|v 0 | , |v 00 | < 1,
v 0 = tanh a,
v 00 = tanh b.
donde
|v| < 1.
Se v 0 = 1, então
1 + v 00
v= =1
1 + v 00
e se v 0 = −1, então
−1 + v 00
v= = −1.
1 − v 00
As mesmas conclusões valem para v 00 = ±1.
t0
t cosh θ senh θ
= .
x senh θ cosh θ x0
Em termos da rapidez, se denotarmos por LO−→O0 a transformação de Lorentz das coordenadas do referencial
O0 para o referencial O, a lei de adição de velocidades da teoria da relatividade pode ser escrita na forma
Portanto, o subgrupo dos boosts em relação a uma direção fixada é isomorfo ao grupo a um parâmetro de
adições R. Dado que boosts são rotações hiperbólicas e que as rotações em R3 formam um grupo (ou seja, a
composta de duas rotações no espaço em relação ao mesmo eixo ou em relação a eixos diferentes é uma rotação
no espaço em relação ao mesmo eixo ou em relação a um eixo diferente dos outros dois, respectivamente)
podemos entender a surpresa de Einstein ao ser informado que os boosts não formam um grupo, ou seja,
que a composta de rotações hiperbólicas em R4 não é uma rotação hiperbólica (em R2 evidentemente é).
Capı́tulo 3
Paradoxos
Escolha um dos referenciais inerciais. Escolhemos o referencial inercial Laboratório. Os eixos t, x neste re-
ferencial inercial são representados perpendicularmente, como usual. Em seguida representamos a trajetória
no espaçotempo do referencial inercial Nave nas coordenadas do referencial Laboratório. Esta trajetória
corresponde ao eixo t0 do referencial inercial Nave, pois, ao longo desta trajetória, a posição da nave não
44
Rodney Josué Biezuner 45
muda. Para obter o eixo x0 do referencial inercial Nave, precisamos obter as linhas de simultaneidade em
relação a este referencial, pois o eixo x0 é exatamente o conjunto dos pontos que tem coordenada temporal
t0 = 0. Para obter as linhas de simultaneidade do referencial Nave, trace primeiro as duas trajetórias de
raios de luz no referencial Laboratório; se os eixos tem a mesma escala (tempo e espaço medidos em metros),
estas trajetórias fazem um ângulos de 45◦ com os eixos. As linhas de simultaneidade do referencial Nave
são então as linhas paralelas tais que os pontos das interseções destas linhas com as trajetórias da luz são
equidistantes da trajetória da nave (porque eles ocorrem ao mesmo tempo no referencial inercial Nave, já
que a velocidade da luz é a mesma em todos os referenciais inerciais). Uma destas linhas de simultaneidade
será o eixo x0 ; qual delas dependerá da escolha da origem no referencial inercial Nave (na figura, as origens
dos dois referenciais foi escolhida como sendo a mesma).
Usando diagramas espaçotempo podemos por exemplo entender melhor a contração de Lorentz e a di-
latação do tempo. No diagrama a seguir, a barra em repouso no referencial laboratório (t, x) tem compri-
mento próprio L. No referencial nave (t0 , x0 ), o comprimento L0 da barra é medido quando os seus extremos
são simultâneos, isto é, ao longo de uma linha de simultaneidade deste referencial. Portanto, o segmento
correspondente a L0 no diagrama é a hipotenusa de um triângulo retângulo cujo cateto correspondente a L é
paralelo ao eixo x; o outro cateto é a diferença temporal ∆t entre os extremos do segmento L0 (vistos como
eventos no espaçotempo) quando eles são medidos no referencial (t, x), onde eles não são simultâneos. Como
2 2
(L0 ) = L2 − (∆t) ,
segue que
L0 < L.
segue que
∆t > ∆t0 .
Rodney Josué Biezuner 46
Com obter uma visão equilibrada da História, vamos investigar os acontecimentos do ponto de vista da
Federação, mais especificamente no referencial inercial da nave Enterprise (coordenadas t0 , x0 ). Especifica-
mente, quando ocorreram neste sistema de coordenadas a assinatura do Tratado de Shalimar (evento A) e o
impacto do Super com a nave, que causou a sua completa destruição (evento B)?
Temos
(tA , xA ) = (−4, 0) ,
(tB , xB ) = (1, 3) .
Como a velocidade da Enterprise em relação ao planeta Shalimar é 0, 6, segue que o fator de dilatação do
tempo é
1 1
γ=√ =p = 1, 25.
1−v 2 1 − 0, 62
de modo que a transformação de Lorentz do referencial inercial de Shalimar para o referencial inercial
Enterprise é
γ −vγ 1, 25 −0, 75
= .
−vγ γ −0, 75 1, 25
Logo,
t0A
1, 25 −0, 75 tA 1, 25 −0, 75 −4 −5
= = =
x0A −0, 75 1, 25 xA −0, 75 1, 25 0 3
e
t0B
1, 25 −0, 75 tB 1, 25 −0, 75 1 −1
= = =
x0B −0, 75 1, 25 xB −0, 75 1, 25 3 3
Rodney Josué Biezuner 48
Portanto, no referencial inercial da Enterprise, sua explosão ocorre antes que os Klingons disparem o
torpedo. Na verdade, se formos interpretar os eventos ocorridos no diagrama de espaçotempo da Enterprise,
ela misteriosamente explode ao mesmo tempo que dispara um novo torpedo fotônico em orientação reversa
(propulsor superluz na frente da ogiva) na direção do planeta Shalimar, torpedo este que miraculosamente
entra no lançador dos Klingons sem causar-lhes quaisquer danos. O Império Klingon usa esta interpretação
dos dados para acusar a Federação de duplicidade e de ela ter causado o reinı́cio das hostilidades, disparando
um torpedo defeituoso a partir da nave dos negociadores que causou a destruição da própria nave estelar
agressora, mas que por sorte foi capturado pelos Klingons antes de causar danos.
Em geral, se algum objeto material ou sinal puder exceder a velocidade da luz, a ordem cronológica de
eventos será alterada em algum referencial inercial. De fato, se isso ocorre, a trajetória no espaçotempo
do objeto material ou sinal terá uma inclinação menor que 45◦ em relação ao eixo x. Logo, existirá um
referencial inercial em que estes eventos ocorrem simultaneamente. E quando observados a partir de qualquer
referencial inercial movendo-se com uma velocidade maior que este segundo referencial, a ordem cronológica
dos eventos será alterada. Por exemplo, no diagrama espaçotempo abaixo, o evento A é a emissão de um
sinal ou lançamento de um objeto (projétil) acima da velocidade da luz e o evento B é a recepção deste sinal
ou projétil. É fácil ver no referencial inercial (t, x) que o sinal ou objeto viaja acima da velocidade da luz,
pois a sua trajetória tem inclinação menor que a inclinação da trajetória de um raio de luz neste referencial.
Obtemos então um referencial inercial (t0 , x0 ) em que esta trajetória é paralela às linhas de simultaneidade
neste referencial; isso significa que os eventos A e B ocorrem simultaneamente neste referencial. Ou seja, nos
deparamos com um sinal instantâneo (comunicação instantânea) ou com o teletransporte instantâneo de um
objeto material. Já no referencial inercial (t00 , x00 ), o evento B ocorre antes do evento A: o sinal ou objeto
foi primeiro recebido e depois foi enviado.
Rodney Josué Biezuner 49
O observador que segue a trajetória α permanece em repouso durante todo o tempo, isto é, os eventos A
e B ocorrem na mesma posição em seu referencial inercial. Portanto, como já vimos antes, o tempo próprio
medido no seu referencial é exatamente
tB − tA .
O observador que segue a trajetória curva β no espaçotempo claramente não está em um referencial inercial,
já que o próprio fato da sua trajetória ser curva em relação a um referencial inercial mostra que ele sofre
aceleração ao longo de sua trajetória. Por outro lado, faz sentido comparar o tempo próprio que ele mede
(em seu referencial não inercial), ou seja, quanto tempo se passa medido no seu relógio de pulso ou no seu
relógio biológico. Dividindo a sua trajetória em segmentos infinitesimais e usando a métrica de Lorentz,
concluı́mos como na figura que em cada um destes segmentos da sua trajetória vale
2 2 2 2
(∆τ ) = (∆t) − (∆x) 6 (∆t) ,
ou seja,
∆τ 6 ∆t.
Somando (integrando) as contribuições destes segmentos infinitesimais ao longo da trajetória toda, con-
cluı́mos que o tempo próprio medido seguindo-se a trajetória β é menor que o tempo próprio medido ao
longo da trajétória α, onde o observador encontra-se em repouso. Mais precisamente, podemos escrever
" 2 #
2 2 2 ∆x 2
(∆τ ) = (∆t) − (∆x) = 1 − (∆t) ,
∆t
de modo que p
∆τ = 1 − v 2 ∆t,
donde Z tB p
∆τAB = 1 − v 2 dt.
tA
√
Daı́, como 1 − v 2 < 1, segue que Z tB
∆τAB < dt = ∆tAB .
tA
Embora acabamos de ver isso apenas no caso em que o observador encontra-se em repouso, isto é, eventos A
e B ocorrem no mesmo referencial, é fácil obter a mesma conclusão no caso geral, fazendo-se uma mudança
de coordenadas.
anos. Para efeitos dramáticos, se um dos astronautas tivesse um irmão gêmeo na época que partiu da Terra
e este tivesse permanecido lá, quando ele retornar, o irmão gêmeo terrestre terá envelhecido 202 anos (mas
talvez não tenha morrido, pois se foi desenvolvida tecnologia para viajar a velocidades próximas da luz, é
possı́vel que também foi desenvolvida tecnologia para permitir às pessoas viverem consideravelmente mais
tempo) enquanto que o irmão gêmeo astronauta terá envelhecido apenas 40 anos.
O paradoxo dos gêmeos é o seguinte: como todos os referenciais inerciais são equivalentes, na primeira
parte da viagem, da Terra a Canopus, o astronauta mede no referencial inercial Nave que a Terra viajou
para um ponto situado a 99 anos-luz de distância de sua posição a uma velocidade 99/101 da luz, levando
portanto 101 anos para atingir aquela posição, enquanto que do ponto de vista do referencial Terra, só se
passaram 20 anos; na segunda parte da viagem, a Terra retornou à posição que o espaçonave ocupa, tendo
gastado novamente 101 anos de acordo com o referencial Nave e 20 anos de acordo com o referencial Terra.
Portanto, passaram-se 202 anos na espaçonave e apenas 40 anos na Terra, exatamente o contrário do que
havı́amos concluı́do no parágrafo anterior.
A resolução trivial deste paradoxo é que enquanto o referencial Terra é de fato um referencial inercial pois
permanece em repouso (relativamente) durante toda a viagem, o referencial Nave é um referencial inercial na
primeira parte da viagem, mas é um referencial inercial diferente na segunda parte da viagem. No momento
em que ele muda a direção do seu movimento para retornar para a Terra, ele deixa de ser um referencial
inercial, ele passa de um referencial inercial para outro.
Mas ainda há duas questões interessantes a resolver:
1. Será que os cálculos que fizemos anteriormente ainda estão corretos, isto é, decorreram-se 202 anos
na Terra e apenas 40 anos na espaçonave, ou a aceleração que a espaçonave sofreu quando mudou de
direção para retornar à Terra afeta os cálculos?
2. A questão anterior pode ser resolvida no âmbito da Teoria da Relatividade Especial, que trata apenas
de referenciais inerciais em movimento retilı́neo uniforme um com relação ao outro, ou, já que existe
uma aceleração envolvida na mudança da direção da espaçonave, esta questão só pode ser resolvida no
âmbito da Teoria da Relatividade Geral que, como veremos, trata também de referenciais acelerados?
Em [Taylor-Wheeler], Box 4-1, p. 132, os autores afirmam categoricamente que não há necessidade de se
usar a Teoria da Relatividade Geral. Já em [Stephani], Seção 3.4, pp. 20–21, o autor afirma que para uma
resposta confiável, é necessário recorrer à Teoria da Relatividade Geral. Ambos estão corretos.
A Teoria da Relatividade Especial se aplica apenas a observações (medições) feitas em referenciais iner-
ciais, de modo que não podemos realmente dizer o que aconteceu com o astronauta durante o processo de
aceleração. Mas, supondo que podemos tornar o processo de aceleração tão curto quanto quisermos, po-
demos considerar um salto instantâneo de um referencial para o outro. Acompanhe a nossa discussão no
diagrama espaçotempo a seguir. O referencial inercial da Terra tem coordenadas (t, x), o referencial inercial
da nave na ida tem coordenadas (t0 , x0 ) e o referencial inercial da nave na volta tem coordenadas (t00 , x00 ). O
salto entre referenciais inerciais ocorre no evento B (chegada da nave a Canopus e, simultaneamente, partida
de volta para a Terra). Imediatamente na chegada a Canopus, o evento B é simultâneo ao evento D na
Terra. Com a mudança instantânea de referenciais (mudança instantânea da direção da trajetória da nave),
o tempo medido na Terra dá um salto de D para E (observe as linhas de simultaneidade; a linha inferior
é a linha de simultaneidade no referencial inercial da nave na ida, isto é, os eventos C e D são simultâneos
neste referencial, e a linha de simultaneidade superior é a linha de simultaneidade do referencial inercial da
nave na volta, isto é, os eventos C e E são simultâneos neste outro referencial; os eventos D e E não estão
em escala no eixo t, pois, como veremos a seguir, eles estão relativamente muito próximos dos eventos A e
C, respectivamente). Por causa deste efeito, o astronauta será mais jovem que o seu irmão gêmeo quando
retornar à Terra.
Rodney Josué Biezuner 52
Vamos determinar a localização no espaçotempo dos eventos D, E nas coordenadas do referencial inercial
Terra para calcular o tempo decorrido lá entre a partida da nave e o seu retorno. Para isso vamos encontrar
as equações para as linhas de simultaneidade nas coordenadas (t, x). O fator de dilatação do tempo é
1 1 101
γ=√ =s 2 = 20 .
1 − v2
99
1−
101
Como
t0
γ −vγ t
= ,
x0 −vγ γ x
obtemos a equação para a linha de simultaneidade inferior
101 99
t0 = γt − vγx = t − x,
20 20
isto é, como t0D = 20,
101 99
20 = t − x.
20 20
Como xD = 0, segue que que
400
tD = = 3, 96,
101
ou seja, quando a nave chega em Canopus depois de 20 anos, como medido no seu referencial, ela mede
que transcorreram 3, 96 anos na Terra. Quando a nave salta de referencial, após mudar de direção, a linha
de simultaneidade superior tem inclinação igual e com sinal oposto ao da linha de simultaneidade inferior.
Como a posição do evento C no referencial Terra é (tC , xC ) = (202, 0), pois o ponto médio da trajetória
da Terra no espaçotempo tem posição (101, 0), simultâneo ao evento B no referencial inercial Terra, como
vimos, segue por simetria que
tE = 202 − 3, 96 = 198, 04,
Rodney Josué Biezuner 53
ou seja, nesta mudança instantânea de referenciais há um salto na medida do tempo transcorrido na Terra
conforme a nave mede: o tempo na Terra conforme medido no novo referencial inercial da nave na volta é
que transcorreram na Terra 198, 04 anos. Assim, quando a nave retorna à Terra, transcorreram na Terra
202 anos, enquanto que na nave transcorreram apenas 40 anos.
É claro que este salto na contagem de tempo é fisicamente impossı́vel, assim como é fisicamente impossı́vel
uma mudança instantânea na direção da nave. Numa situação fı́sica real, a nave levaria algum tempo para
mudar de direção, de modo que a sua trajetória no espaçotempo seria uma curva diferenciável, com as linhas
de simultaneidade mudando de forma contı́nua à medida que a nave desacelera e acelera para mudar de
direção. Terı́amos então uma trajétória curva que, como vimos na Seção 3.3, tem um tempo próprio menor
que o tempo medido na trajetória reta entre os eventos A e C; uma análise detalhada do paradoxo dos
gêmeos ao longo deste argumento pode ser vista em [Ferraro], Seção 4.5, pp. 103–107.
A história do paradoxo dos gêmeos começa no ano 1911 e foi um dos fenômenos mais discutidos e
incompreendidos da teoria, mas a ocorrência do fenômeno foi confirmada experimentalmente um número
enorme de vezes, de forma direta depois da invenção dos relógios atômicos em 1949 (relógios atômicos em
aviões marcaram um tempo menor do que o decorrido no chão entre decolagem e aterrisagem). Veja [Topper],
pp. 77-78, 127–129 (a resolução de Einstein usando a Teoria da Relatividade Geral; aceleração, assim como
a gravidade, faz com que o tempo ande mais devagar), pp. 145–146 (uma comprovação através dos inúmeros
experimentos realizados em aceleradores de partı́culas em circuito fechado).
Capı́tulo 4
Momento-Energia
4.1 4-Vetores
Tanto na Teoria da Relatividade Especial quanto na Geral, é conveniente descrever o movimento de um
objeto em um referencial inercial (em Relatividade Especial) ou em um sistema de coordenadas geral (em
Relatividade Geral) em coordenadas do espaçotempo dependendo do seu tempo próprio τ , isto é, de acordo
com o tempo medido em seu próprio referencial, e portanto independente de referencial. Assim, em um
referencial inercial a trajetória de uma partı́cula livre é uma curva parametrizada pelo tempo próprio
α (τ ) = (t (τ ) , x (τ ) , y (τ ) , z (τ )) ,
e a geodésica γ que uma partı́cula livre segue no espaçotempo curvo seria parametrizada pelo tempo próprio
γ (τ ).
Vetores no espaçotempo tem 4 coordenadas e para distingui-los dos vetores espaciais (projeções espaciais),
são frequentemente chamados de quadrivetores ou 4-vetores. Assim, temos o quadrivetor deslocamento,
ou seja deslocamento no espaçotempo
e o quadrivetor velocidade
ds dt dx dy dz
u= = , , , , (4.1)
dτ dτ dτ dτ dτ
ou α0 (τ ) para uma trajetória curva α (τ ) no espaçotempo. O quadrivetor velocidade é por definição tangente
à trajetória da partı́cula no espaçotempo.
Observe que se a trajetória do objeto no espaçotempo é uma curva, o seu referencial próprio obviamente
não é um referencial inercial. Entretanto, em cada instante de tempo existe um referencial inercial que tem
a mesma velocidade que o objeto; este referencial inercial que comove com o objeto é temporário, pois no
próximo instante de tempo ele não está mais se comovendo com o objeto. Ele é chamado o seu referencial
comovente temporário (em inglês: momentarily comoving reference frame (MCRF)). O quadrivetor veloci-
dade em um determinado instante de tempo (tangente à trajetória da partı́cula naquele instante de tempo)
é justamente o vetor base e0 do seu referencial comovente temporário naquele momento.
Como o tempo próprio τ do objeto e o tempo t de um referencial inercial arbitrário estão relacionados
através da equação p
τ = 1 − v 2 t, (4.2)
onde v é a velocidade espacial do objeto em relação a este referencial inercial (v = kvk), isto é,
dx dy dz
v= , , ,
dt dt dt
54
Rodney Josué Biezuner 55
segue que p
dτ = 1 − v 2 dt,
e portanto as coordenadas do quadrivetor velocidade no referencial inercial também podem ser escritas na
forma
1 dx dy dz 1
u= √ 1, , , =√ (1, v)
1 − v2 dt dt dt 1 − v2
ou
1 1
u= √ (1, v x , v y , v z ) = √ (1, v) . (4.3)
1−v 2 1 − v2
Observe que quando v << 1 temos τ ≈ t e
u ≈ (1, v x , v y , v z ) = (1, v) ,
u = (1, 0, 0, 0) .
Em particular, segue também que se v 6= 1 o quadrivetor velocidade é um vetor unitário, isto é,
2
kuk = −1 (4.4)
pois
1 1
hu, ui = √ (1, v x , v y , v z ) , √ (1, v x , v y , v z )
1 − v2 1 − v2
1 h x 2 y 2 z 2
i
= −1 + (v ) + (v ) + (v )
1 − v2
1
−1 + v 2
= 2
1−v
= −1.
4.2 Momento-Energia
4.1 Definição. Se m é a massa de um objeto, definimos o quadrivetor momento-energia
P = mu. (4.5)
de modo que
2
kPk = −m2 . (4.6)
Rodney Josué Biezuner 56
Note que a massa m de um objeto, sendo a norma do quadrivetor momento-energia (um vetor do espaçotempo
de Minkowski), tem o mesmo valor em qualquer referencial inercial. Em outras palavras, ela não depende
da velocidade do referencial: massa não aumenta com a velocidade e na teoria da relatividade não se define
“massa relativı́stica” (veja [Okun1] para uma exposição clara, incluindo a origem histórica deste termo e
até seu uso inicial por Einstein para inferir a atração da luz por uma massa gravitacional (ele raciocinou
que fótons teriam massa m = E/c2 ), antes de formular a Teoria da Relatividade Geral, quando abandonou
essa idéia inconsistente, e uma coletânea de artigos criticando os conceitos de “massa de repouso” e “massa
relativı́stica” em [Okun2]). Por outro lado, massa é mais facilmente medida em um referencial em que o
objeto está em repouso.
Se m = 0, então P é um vetor do tipo luz, e consequentemente u também é, donde v = 1. Portanto,
fótons não possuem massa.
4.2 Definição. A componente temporal do quadrivetor momento-energia é chamada a energia rela-
tivı́stica E do objeto e sua projeção espacial o seu momento relativı́stico p.
Assim,
m
E=√ ,
1 − v2
mv x mv y mv z
m
p= √ v= √ ,√ ,√ ,
1 − v2 1 − v2 1 − v2 1 − v2
de modo que
m2 = E 2 − p2 . (4.7)
Note que tanto a energia relativı́stica quanto o momento relativı́stico dependem do referencial, já que são
componentes (coordenadas) de um quadrivetor. Observe também que massa não é a mesma coisa que energia:
energia é a componente temporal do quadrivetor momento-energia, enquanto que massa é a magnitude deste
vetor. Apenas que, em relatividade, elas são medidas com as mesmas unidades de medida (quilogramas), da
mesma forma que tempo e espaço em relatividade são medidos com as mesmas unidades de medida (metros),
apesar de não serem a mesma coisa.
Em unidades do espaçotempo (ct, x, y, z) em que a velocidade da luz é c e não normalizada para 1, a
relação entre o tempo próprio e o tempo em um referencial inercial arbitrário é
r v 2
τ = 1− t
c
e o quadrivetor velocidade tem coordenadas
1 x y z 1
u= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1− 1−
c c
de modo que o momento-energia é
m x y z m
P= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1− 1−
c c
mas a energia relativı́stica é
mc2
E=r v 2
1−
c
Rodney Josué Biezuner 57
E0 = mc2
para a energia de repouso; ou seja, a energia de um objeto não desaparece quando ele está em repouso, como
na mecânica de Newton, mas ao contrário é enorme (por causa do fator c2 ).
Capı́tulo 5
Aceleração no Espaçotempo de
Minkowski
58
Capı́tulo 6
59
Capı́tulo 7
O Princı́pio de Equivalência –
Geodésicas no Espaçotempo Curvo
60
Rodney Josué Biezuner 61
7.1.1 Inércia
Antes, porém, é necessário considerar o conceito de inércia e as trajetórias que as partı́culas livres per-
correm no espaçotempo. Isso nos guiará na motivação dos conceitos necessários para o desenvolvimento do
espaçotempo curvo (variedade de Lorentz) fı́sico além da simples colagem de espaços tangentes de Minkowski.
Newton aceitou o Princı́pio da Relatividade Galileana: não existe repouso e movimento uniforme absoluto.
Mas existe a aceleração absoluta e ela é a justificativa para a existência do espaço absoluto. A aceleração
absoluta é em relação a este espaço. Além disso, a inércia é uma medida da resistência de um corpo a sofrer
uma aceleração, e esta é dada pela massa do corpo.
No espaçotempo plano de Minkowski as geodésicas são retas. Quaisquer trajétórias curvas implicam na
existência de uma aceleração e portanto de uma força agindo. A aceleração é absoluta, mas não é necessário
postular um espaço absoluto para entendê-la. Ela existe no espaçotempo absoluto de Minkowski.
No espaçotempo curvo da Relatidade Geral, partı́culas que se movem apenas por inércia, sem sofrer
a ação de forças, também se movem ao longo de geodésicas. Na geometria de Lorentz elas não sofrem
qualquer alteração de direção, isto é, as partı́culas que seguem trajetórias geodésicas no espaçotempo não
sofrem aceleração (não estão sujeitas a ação de forças). Elas se movem por inércia, seguindo as trajetórias
geodésicas do espaçotempo. Apenas as geodésicas do espaçotempo curvado da relatividade geral são curvas,
logo na projeção tridimensional existe uma aceleração. Além disso, devido á curvatura do espaçotempo, as
trajetórias geodésicas se aproximam, o que era interpretado como os corpos se atraindo sujeitos à força da
gravidade. Isso não existe no espaçotempo curvo. Portanto, não existe uma força de gravidade: a gravidade
é apenas uma manifestação da curvatura do espaçotempo.
Forças só existem quando as partı́culas são impedidas de percorrer sua trajetória geodésica no espaçotempo.
Por exemplo, quando um corpo está apoiado sobre o chão, impedido de cair, impedido de seguir a sua tra-
jetória geodésica natural no espaçotempo curvado.
Capı́tulo 8
Topologia Diferencial
Φ = {ϕα }α∈A
ϕαβ = ϕ−1 −1 −1
β ◦ ϕα : ϕα (Vαβ ) −→ ϕβ (Vαβ ) ,
−1
ϕβα = ϕ−1 −1
α ◦ ϕβ : ϕβ (Vαβ ) −→ ϕα (Vαβ ) ,
62
Rodney Josué Biezuner 63
de estrutura diferenciável, do que definir estruturas diferenciáveis como classes de equivalência de atlas com-
patı́veis, ou seja, de atlas tais que as cartas de são todas compatı́veis com as cartas do outro; uma função
definida em uma variedade diferenciável é diferenciável (veremos a definição logo a seguir) com relação a dois
atlas diferentes se e somente se eles são compatı́veis, portanto atlas compatı́veis definem a mesma estrutura
diferenciável neste sentido. Se uma variedade topológica possui uma estrutura diferenciável (toda variedade
topológica de dimensão n 6 3 possui, mas para toda dimensão n > 4 existem variedades topológicas compac-
tas que não possuem) ela possui uma quantidade não enumerável de estruturas diferenciáveis (veja [Lee 1],
p. 30, Problem 1.6). Por outro lado, a estrutura diferenciável de uma variedade diferenciável é única, no
sentido que todo atlas diferenciável está contido em um único atlas maximal (para uma demonstração, veja
[Lee 1], p. 13, Proposition 1.17).
Surpreendentemente, a condição de ser de Hausdorff (que assegura, entre outras coisas, que conjuntos
finitos de pontos são fechados e que limites de sequências convergentes são únicos) não é implicada pela
definição (veja Exercı́cio 8.44). A condição de possuir uma base enumerável garante a existência de partições
da unidade. Por outro lado, dado um conjunto X, uma estrutura diferenciável sobre X determina uma
topologia para X (veja Exercı́cio 8.45). Observe que toda variedade diferenciável é localmente conexa por
caminhos e que uma variedade diferenciável é conexa se e somente se ela é conexa por caminhos (Exercı́cio
8.46). Além disso, toda variedade diferenciável é paracompacta, isto é, toda cobertura de uma variedade
diferenciável por abertos admite uma subcobertura localmente finita; mais que isso, esta subcobertura pode
ser tomada enumerável (veja [Lee 1] para demonstrações destas afirmações).
Quando nos referirmos a uma variedade diferenciável, assumimos que ela está munida de uma estrutura
diferenciável. Denotaremos às vezes uma variedade diferenciável M de dimensão n por M n quando for
necessário especificar a dimensão da variedade. Também denotaremos uma carta do atlas por (ϕ, U ) quando
a sua imagem não for importante nas considerações.
f ◦ ϕ : U ⊂ Rn −→ Rk
f ◦ ψ = f ◦ ϕ ◦ ϕ−1 ◦ ψ
C ∞ (M ) = {f : M −→ R : f é diferenciável} .
C ∞ (M ) é um espaço vetorial porque a combinação linear de funções diferenciáveis é uma função diferenciável.
Rodney Josué Biezuner 64
ψ −1 ◦ F ◦ ϕ : U ⊂ Rm −→ Rn
ψe−1 ◦ F ◦ ϕ
e = (ψe−1 ◦ ψ) ◦ ψ −1 ◦ F ◦ ϕ ◦ ϕ−1 ◦ ϕ
e
e ϕ−1 ◦ ϕ,
e ψe−1 ◦ψ são difeomorfismos. A aplicação ψ −1 ◦F ◦ϕ é uma representação de F em coordenadas.
Ressaltamos de novo que o que definimos como função diferenciável e aplicação diferenciável são chamadas
função suave e aplicação suave em outros lugares.
8.5 Definição. Dizemos que uma aplicação diferenciável F : M −→ N é um difeomorfismo se F é um
homeomorfismo e F −1 também é diferenciável.
Se existir um difeomorfismo entre duas variedades diferenciáveis M e N , dizemos que elas são difeomor-
fas.
Se duas variedades diferenciáveis são difeomorfas, em particular elas possuem a mesma dimensão.
O conceito de difeomorfismo leva naturalmente a perguntar se, dada uma variedade diferenciável, estru-
turas diferenciáveis diferentes sobre ela definem sempre duas variedades diferenciáveis difeomorfas ou não.
A resposta é que para variedades diferenciáveis de dimensão n 6 3 existe apenas uma estrutura diferenciável
a menos de difeomorfismo, enquanto que mesmo R4 tem um número não enumerável de estruturas dife-
renciáveis não difeomorfas; sabe-se que esferas de dimensão até n = 20, n 6= 4, possuem um número finito de
estruturas diferenciáveis a menos de difeomorfismo e este número é conhecido (veja referências em Wikipedia
e [Lee 1], p. 40). Quantas estruturas diferenciáveis difeomorfas S4 possui (ou mesmo se este número é maior
que 1 ou finito) é uma questão em aberto, a conjectura de Poincaré generalizada.
Uma das aplicações diferenciáveis mais importantes entre variedades são as curvas diferenciáveis:
8.6 Definição. Uma curva diferenciável em uma variedade diferenciável M é uma aplicação diferenciável
α : I −→ M onde I ⊂ R é um intervalo.
8.8 Teorema (Existência de Partições da Unidade). Toda cobertura por abertos de uma variedade
diferenciável possui uma partição da unidade subordinada.
8.10 Corolário (Lema de Extensão). Dados um fechado A, um aberto V ⊃ A em uma variedade dife-
renciável M e uma função diferenciável f : A −→ Rk existe uma extensão diferenciável fe : M −→ Rk de f
tal que supp fe ⊂ V .
Em particular, se (ϕ, U ) é uma carta local e V ⊂⊂ ϕ (U ), qualquer função diferenciável f : V −→ Rk
pode ser estendida a uma função diferenciável fe : M −→ Rk com supp fe ⊂ ϕ (U ).
Prova: Para a primeira parte veja [Lee 2], p. 45, Lemma 2.26. A segunda parte segue imediatamente da
primeira, já que V ⊂ U é fechado.
temos que
dx1 dxn
0
α (t) = (t) , . . . , (t) ,
dt dt
e em particular
dx1 dxn
v = α0 (t0 ) = (t0 ) , . . . , (t0 ) .
dt dt
Se f : Rn −→ R é uma função diferenciável em p, então a derivada direcional de f em p na direção de v é
dada pela regra da cadeia por
n
" n #
i X dxi
0
X ∂f dx ∂
(f ◦ α) (t0 ) = dfα(t0 ) α0 (t0 ) = (p) (t0 ) = (t0 ) i f (p) ,
i=1
∂xi dt i=1
dt ∂x
o que significa que a derivada direcional na direção de v pode ser vista como um operador linear sobre funções
diferenciáveis que depende apenas do vetor v.
Rodney Josué Biezuner 66
8.11 Definição (Preliminar). Seja α : I −→ M uma curva diferenciável com α (t0 ) = p. O vetor
tangente à curva α em p é uma função vp : C ∞ (M ) −→ R definida por
0
vp (f ) = (f ◦ α) (t0 ) .
Um vetor tangente à variedade M em p é qualquer vetor tangente à uma curva diferenciável passando
por p.
Ou seja, cada curva diferenciável em M passando por p dá origem a um vetor tangente em p. É claro que
curvas diferenciáveis diferentes α, β : I −→ M com α (t0 ) = β (s0 ) = p podem dar origem ao mesmo vetor
tangente: basta que
0 0
(f ◦ α) (t0 ) = (f ◦ β) (s0 )
para todo f .
onde denotamos ϕ−1 ◦ α (t) = x1 (t) , . . . , xn (t) em coordenadas locais. Segue que para todos f, g ∈
segue que
n
X dxi
vp = (t0 ) ∂i |p .
i=1
dt
Reciprocamente, se v é o funcional linear
n
X
vp = ci ∂i |p ,
i=1
Finalmente, se
n
X
ci ∂i |p = 0,
i=1
então
n
X ∂ (f ◦ ϕ)
ci (x0 ) = 0
i=1
∂xi
∞
para todo f ∈ C (M ). Definindo para cada j
fj x1 , . . . , xn = xj
Note que nesta definição o conjunto dos vetores tangentes a um ponto p ∈ M forma naturalmente um espaço
vetorial real, pois é um subespaço do espaço vetorial dos funcionais lineares em C ∞ (M ):
Mas a dimensão deste espaço não é imediatamente óbvia. Além disso, não é claro que todo vetor tangente
segundo esta definição é um vetor tangente segundo a definição anterior. Embora seja consequência das
Proposições 8.12 e 8.13 que vetores tangentes a curvas são funcionais lineares em C ∞ (M ) que são derivações,
logo o espaço vetorial dos vetores tangentes segundo a definição anterior é um subespaço vetorial do espaço
vetorial dos vetores tangentes segundo a nova definição, ainda não sabemos que todo todo funcional linear
em C ∞ (M ) que é uma derivação é o vetor tangente a alguma curva. Isso provará ser verdade quando
provarmos que o espaço vetorial dos funcionais lineares em C ∞ (M ) que são derivações também tem dimensão
n (Proposição 8.22). Em outras palavras, as duas definições não são apenas equivalentes, mas de fato definem
o mesmo conceito de vetor tangente. De agora em diante, utilizaremos a Definição 8.14 para vetor tangente.
Apesar dos vetores tangentes (derivações) estarem definidas no espaço global C ∞ (M ), o próximo resul-
tado mostra que a sua atuação é local.
8.16 Proposição. Seja vp : C ∞ (M ) −→ R um vetor tangente. Se f, g ∈ C ∞ (M ) coincidem em uma
vizinhança de p, então vp (f ) = vp (g).
Rodney Josué Biezuner 69
dFp : Tp M −→ TF (p) N
definida por
[dFp (vp )] (f ) = vp (f ◦ F )
∞
para todo f ∈ C (N ).
Note que como f ∈ C ∞ (N ) e F é de classe C ∞ , f ◦ F ∈ C ∞ (M ). dFp (v) é uma derivação em F (p) porque
Prova: Provaremos a segunda parte; a primeira parte é deixada como exercı́cio. Por definição, para todo
f ∈ C ∞ (P )
h i
d (G ◦ F )p (vp ) (f ) = vp (f ◦ (G ◦ F )) = vp ((f ◦ G) ◦ F ) = dFp (vp ) (f ◦ G)
= dGF (p) (dFp (vp )) (f ) .
8.20 Corolário. Se F : M −→ N é um difeomorfismo, então dFp é um isomorfismo para cada p ∈ M e
−1
d F −1 F (p) = (dFp ) .
8.23 Definição. Seja M uma variedade diferenciável e ϕ : U −→ M uma carta de uma vizinhança de um
ponto p ∈ M . A base obtida na demonstração da Proposição 8.12 será chamada a base coordenada do
espaço tangente Tp M associada à carta ϕ e denotada por
∂1 |p , . . . , ∂n |p
ou por
∂ ∂
,...,
∂x1 p ∂xn p
quando for conveniente ou necessário explicitar as coordenadas da carta.
8.4 Coordenadas
8.4.1 Diferencial em Coordenadas
Seja B = {e1 , . . . , en } a base canônica de Rn . Se ϕ : U ⊂ Rn −→ V é uma carta para uma vizinhança
coordenada V de p = ϕ (x) ∈ M , a base coordenada associada à ϕ é também dada por
∂
= dϕx (ei ) .
∂xi p
De fato, se f ∈ C ∞ (M ), então
∂ ∂ (f ◦ ϕ)
i
(f ) = (x) = ei (f ◦ ϕ) = dϕx (ei ) (f ) .
∂x p ∂xi
8.24 Definição.
∂f ∂ ∂ (f ◦ ϕ)
(p) = (f ) = (x) .
∂xi ∂xi p ∂xi
Vamos ver agora como é a diferencial de uma aplicação diferenciável em coordenadas.
Primeiro recordaremos o caso em que as variedades são espaços euclideanos. Denote por Bm = {e1 , . . . , em }
e Bn = {f1 , . . . , fn } as bases canônicas de Rm e Rn , respectivamente. Observe que se F : U ⊂ Rm −→ Rn
é uma aplicação diferenciável, então dFx : Rm −→ Rn é a derivada usual para cada x ∈ U e pela regra da
cadeia
m m
∂ (f ◦ F ) X ∂f ∂F j X ∂F j
dFx (ei ) (f ) = ei (f ◦ F ) = (x) = (F (x)) (x) = (x) fj (f ) ,
∂xi j=1
∂xj ∂xi j=1
∂xi
ou seja,
n
X ∂F j
dFx (ei ) = (x) fj .
j=1
∂xi
∂F 1 ∂F 1
∂x1 . . .
. ∂xm
J = .. ..
. =: [dFx ]Bm ,Bn .
∂F n ∂F n
1
...
∂x ∂xm
m
v i ei , então
P
Ou seja, se v =
i=1
m n
"m #
j
i ∂F
X X X
i
dFx (v) = v dFx (ei ) = v (x) fj ,
i=1 j=1 i=1
∂xi
isto é,
∂F 1 ∂F 1
. . .
1
∂x1 ∂xm v
. . ..
[dFx (v)]Bn = .
. .
. . = J [v]Bm .
∂F n ∂F n v m
...
∂x1 ∂xm
No caso geral, se F : M −→ N é uma aplicação diferenciável, sejam ϕ : U ⊂ Rm −→ ϕ (U ) , ψ : V ⊂
m n
n
R −→ ψ (V ) cartas de vizinhanças de p = ϕ (x) em M e de F (p) = ψ (y) em N , respectivamente, de modo
que
Fe = ψ −1 ◦ F ◦ ϕ : U ⊂ Rm −→ Rn .
Escrevendo
F ◦ ϕ = ψ ◦ Fe
temos
! n j n
∂ h i X ∂F
e X ∂ Fej
dFp i
= dFp [dϕx (e i )] = dψy d F
ex (e i ) = dψy
i
(x) f j
= (x) dψy (fj )
∂x
p ∂x ∂xi
j=1 j=1
n
!
∂ Fej
X ∂
= (x) .
j=1
∂xi ∂y j F (p)
Rodney Josué Biezuner 72
Portanto, se
( )
∂ ∂
Bp = ,..., .
∂x1 p ∂xm p
( )
∂ ∂
BF (p) = ,..., ,
∂y 1 F (p) ∂y n F (p)
são as bases coordenadas de Tp M e TF (p) N , respectivamente, então a matriz que representa a diferencial
dFp em relação a estas bases é
∂ Fe1 ∂ Fe1
...
∂x1 ∂xm
[dFp ]Bp ,BF (p) = ... ..
.
.
∂ Fen ∂ Fen
...
∂x1 ∂xm
T M = {(p, v) : p ∈ M e v ∈ Tp M }
com um atlas
Ψ = {ψα : Uα × Rn −→ T M }α∈A
definido por !
n
X
ψα (x, v1 , . . . , vn ) = ϕα (x) , vi ∂i (x) .
i=1
Na definição acima, o próprio atlas Ψ define a topologia necessária em T M (Exercı́cio 8.45).
π↓ . π1
Frequentemente identificamos o espaço total com o fibrado e dizemos simplesmente que E é o fibrado vetorial
sobre M . Fibrados tangentes são exemplos de fibrados vetoriais.
8.27 Definição. Seja E um fibrado vetorial de dimensão k sobre M . Uma seção de E é uma aplicação
s : M −→ E tal que π ◦ s = Id|M .
(Xf ) (p) = Xp f
X (f g) = (Xf ) g + f (Xg)
para todos f, g ∈ C ∞ (M ).
As duas definições são equivalentes. Usando a última definição, podemos definir combinações lineares de
campos vetoriais de forma natural.
8.30 Notação. Seja M uma variedade diferenciável. O espaço vetorial dos campos vetoriais diferenciáveis
em M é denotado por T (M ).
Rodney Josué Biezuner 74
[dFp (Xp )] (f ) = Xp (f ◦ F ) ,
logo,
[X (f ◦ F )] (p) = Xp (f ◦ F ) = [dFp (Xp )] (f ) = YF (p) f = (Y f ) (F (p)) .
F∗ (f X + gY ) = f ◦ F −1 F∗ X + g ◦ F −1 F∗ Y
[(F∗ X) f ] ◦ F = X (f ◦ F )
ou, equivalentemente,
(F∗ X) f = X (f ◦ F ) ◦ F −1 .
Prova:
F
M −→ N
−1
↓f .f ◦F
R
Primeiro provamos a linearidade de F∗ . No que se segue, q = F (p). Temos
e
[F∗ (f X)]q = dFp (f X)p
= dFp (f (p) Xp )
= f (p) dFp (Xp )
= f ◦ F −1 (q) (F∗ X)q .
A última afirmativa segue imediatamente da Proposição 8.31, já que F∗ X é exatamente o campo Y do
enunciado daquela proposição.
8.34 Teorema. Seja X ∈ T (M ) um campo diferenciável. Dado p ∈ M , existe uma vizinhança V de p em
M , δ > 0 e uma aplicação diferenciável
ϕ : (−δ, δ) × V −→ M
Além disso, para cada t fixado, ϕt = ϕ (t, ·) é um difeomorfismo e o fluxo é um grupo aditivo a um parâmetro,
isto é,
ϕ0 = id,
ϕt+s = ϕt ϕs .
em coordenadas locais (veja Proposição 8.37 a seguir), a composta realmente envolve derivadas parciais de
segunda ordem, as quais não são vetores tangentes por não satisfazerem a regra do produto. Para definir
cálculo diferencial de ordem superior, é necessário o conceito de derivada covariante, que veremos no Capı́tulo
11.
Por outro lado, a operação
X ◦Y −Y ◦X
define um campo vetorial.
Rodney Josué Biezuner 76
[X, Y ] = XY − Y X.
[X, Y ] = X ◦ Y − Y ◦ X,
ou seja,
[X, Y ]p f = Xp (Y f ) − Yp (Xf ) .
O colchete de Lie é de fato um campo vetorial, pois
F∗ [X, Y ] = [F∗ X, F∗ Y ] .
Rodney Josué Biezuner 77
Prova: (i) e (ii) são imediatas. Para provar (iii), usando (ii) obtemos
[f X, gY ] h = f [X (g (Y h))] − g [Y (f (Xh))]
= f [(Xg) (Y h)] + f [gX (Y h)] − g [(Y f ) (Xh)] − g [f Y (Xh)]
= f gX (Y h) − gf Y (Xh) + f [(Xg) (Y h)] − g [(Y f ) (Xh)]
= f g (XY − Y X) h + [f (Xg) Y ] h − [g (Y f ) X] h
= [f g [X, Y ] + f (Xg) Y − g (Y f ) X] h.
e, analogamente,
(Y X) (f ◦ F ) = (F∗ Y ) (F∗ X) f ◦ F.
Logo,
Uma álgebra de Lie é um espaço vetorial em que se define um produto (ou seja, uma aplicação bilinear)
anticomutativo que satisfaz a identidade de Jacobi (veja o Capı́tulo 10). Portanto, esta proposição mostra
que T (M ) com a operação colchete é uma álgebra de Lie.
8.37 Proposição (Colchete de Lie em coordenadas locais). Se X, Y ∈ T (M ) são campos vetoriais
que se expressam em coordenadas locais por
n n
X ∂ X ∂
X= Xi e Y = Yi ,
i=1
∂xi i=1
∂xi
então
n
∂Y j ∂X j
X ∂
[X, Y ] = Xi i − Y i i
,
i,j=1
∂x ∂x ∂xj
Rodney Josué Biezuner 78
Em particular,
∂ ∂
, =0
∂xi ∂xj
para todos i, j.
Prova: Temos
n
! n X n X n
X
i ∂f X
i ∂f i ∂f ∂f
X Yi
X (Y f ) = X Y i
= X Y i
= Y X i
+ i
i=1
∂x i=1
∂x i=1
∂x i=1
∂x
n n 2 n n i
X X ∂ f X ∂f X ∂Y
= Yi Xj j i + i
Xj j
i=1 j=1
∂x ∂x i=1
∂x j=1
∂x
n n
X ∂2f X i
j ∂Y ∂f
= XjY i + X
i,j=1
∂xj ∂xi i,j=1 ∂xj ∂xi
e, por simetria,
n n n n
X ∂2f X i
j ∂X ∂f
X 2
j i ∂ f
X ∂X i ∂f
Y (Xf ) = Y jXi j i
+ Y j i
= X Y i j
+ Yj j .
i,j=1
∂x ∂x i,j=1
∂x ∂x i,j=1
∂x ∂x i,j=1
∂x ∂xi
Como
∂2f ∂2f
= ,
∂xi ∂xj ∂xj ∂xi
os termos envolvendo as derivadas parciais de segunda ordem se cancelam ao calcularmos [X, Y ] f = X (Y f )−
Y (Xf ) e a expressão do enunciado é obtida trocando os ı́ndices i, j.
Na linguagem de pushforwards,
[(ϕ−t )∗ Y ]p − Yp
(LX Y )p = lim .
t→0 t
A definição de derivada de Lie não é operacionalmente útil, já que em geral é muito difı́cil e mesmo
impossı́vel obter o fluxo explicitamente. Felizmente, como veremos agora, a derivada de Lie coincide com o
colchete de Lie e este é muito fácil de calcular.
8.39 Teorema (Interpretação Geométrica do Colchete de Lie). Se X, Y ∈ T (M ) são campos veto-
riais, p ∈ M e ϕt é o fluxo local do campo X em uma vizinhança V de p em M então
[X, Y ] = LX Y.
Prova: Primeiro observe que se g : (−δ, δ) × V −→ R é uma função diferenciável tal que
g (0, q) = 0 para todo q ∈ V,
então existe uma aplicação diferenciável h : (−δ, δ) × V −→ R tal que
g (t, q) = th (t, q) .
De fato, basta definir Z 1
∂g
h (t, q) = (ts, q) ds
0 ∂s
e notar que, pelo Teorema Fundamental do Cálculo,
Z 1 Z 1
∂g ∂
th (t, q) = t (ts, q) ds = [g (ts, q)] ds
0 ∂s 0 ∂s
s=1
= [g (ts, q)]s=0 = g (t, q) − g (0, q)
= g (t, q) .
Em particular, segue que
∂g
(t, q) = h (0, q) .
∂t t=0
Seja agora f ∈ C ∞ (M ). Defina g : (−δ, δ) × V −→ R por
g (t, q) = f (q) − f (ϕ−t (q)) ,
ou, em notação funcional,
g (t, ·) = f − f ◦ ϕ−t .
Então g (0, q) = f (q) − f (ϕ0 (q)) = f (q) − f (q) = 0, de modo que a observação que fizemos no inı́cio da
demonstração se aplica e existe uma aplicação diferenciável h : (−δ, δ) × V −→ R tal que
f (ϕ−t (q)) = f (q) − th (t, q)
isto é,
f ◦ ϕ−t = f − th (t, ·)
e, além disso (por definição de vetor tangente, lembrando que ϕ−t é uma curva diferenciável, trajetória do
fluxo do campo X na direção reversa),
∂g ∂ (f ◦ ϕ−t )
h (0, q) = (t, q) =−
∂t t=0 ∂t
t=0
∂ϕ−t (q)
=− f = Xϕ(0,q) f
∂t t=0
= Xq f.
Rodney Josué Biezuner 80
Daı́ (na primeira equação na demonstração da Proposição 8.31 substitua F por ϕ−t e p por ϕt (p)),
h i
[dϕ−t ]ϕt (p) Yϕt (p) f = Yϕt (p) (f ◦ ϕ−t ) = Yϕt (p) f − tYϕt (p) (h (t, ·)) .
Portanto,
h i
[dϕ−t ]ϕt (p) Yϕt (p) f − Yp f
(LX Y )p f = lim
t→0 t
Yϕt (p) f − tYϕt (p) (h (t, ·)) − Yp f
= lim
t→0 t
Yϕt (p) f − Yp f
= lim − lim Yϕt (p) (h (t, ·))
t→0 t t→0
(Y f ) (ϕt (p)) − (Y f ) (p)
= lim − Yp (h (0, ·))
t→0
t
∂ϕt (p)
= (Y f ) − Yp (h (0, ·))
∂t t=0
= Xp (Y f ) − Yp (Xf )
= [X, Y ]p f.
Portanto, o colchete de Lie de dois campos vetoriais é a derivade de Lie. E a derivada de Lie é a “derivada
direcional” do segundo campo vetorial ao longo do fluxo do primeiro; ela não é uma derivada direcional no
senso exato do termo, porque ela não depende apenas da direção do primeiro campo, ou seja, não podemos
usar qualquer curva tangente ao primeiro campo para calculá-la, mas apenas uma trajetória do campo. A
principal diferença entre a derivada de Lie e a derivada covariante (que é uma derivada direcional na correta
assumpção da palavra) está então resumida nas Proposições 8.37 e 11.2: enquanto que a derivada covariante
(∇X Y )p depende apenas do valor de X em p e do valor de Y ao longo de uma curva tangente a Xp , a
derivada de Lie (LX Y )p depende dos valores de X ao longo de uma curva tangente a Yp e do valor de Y ao
longo de uma curva tangente a Xp : de fato,
n
X ∂
Xp Y i − Yp X i
(LX Y )p = [X, Y ]p = ,
i=1
∂xi
e por definição de vetor tangente, os coeficientes Xp Y 1 , . . . , Xp (Y n ) dependem dos
valores de Y ao longo
1 n
de uma curva passando por p cujo vetor tangente em p é Xp e os coeficientes Yp X , . . . , Yp (X ) dependem
dos valores de X ao longo de uma curva passando por p cujo vetor tangente em p é Yp ).
Outra diferença importante entre a derivada de Lie e a derivada covariante é que em variedades rieman-
nianas esta é mais natural no seguinte sentido. Denotando q = ϕt (p), na derivada de Lie o vetor Yq é trazido
ao longo da trajetória do campo X para o espaço tangente Tp M , onde ele é subtraı́do do vetor Xp através
do operador linear (ϕ−t )∗ . Em uma interpretação geométrica que veremos na Proposição 11.27, o vetor
Yq também é trazido ao longo da trajetória do campo X para o espaço tangente Tp M , mas através de um
operador linear chamado transporte paralelo, que é interpretado, como o nome indica, como um operador
que não muda a direção do vetor original em um sentido que veremos em maiores detalhes no Capı́tulo 11.
Assim, o conceito de derivada covariante está mais próximo ao conceito de derivada direcional em Rn , onde
identificamos Tp Rn através de translações, que preservam as direções de vetores.
Mas é importante ressaltar que nenhuma das derivadas, tanto a derivada de Lie quanto a derivada
covariante, dependem apenas de Xp e Yp , ou seja, nenhum deles é um tensor, um conceito que veremos
no próximo capı́tulo. Apesar disso, ambos aparecerão na definição do segundo tensor mais importante em
Geometria Riemanniana, o tensor curvatura (o tensor mais importante é obviamente o tensor métrica).
Rodney Josué Biezuner 81
é o fluxo local do campo F∗ X. Para provar este resultado, note primeiro que se f ∈ C ∞ (M ), então por
definição de vetor tangente
d f (ϕt (p)) − f (p)
Xp (f ) = f ◦ ϕt (p) = lim
dt t=0
t→0 t
porque a trajetória ϕt (p) é uma curva diferenciável que tem Xp como vetor tangente em t = 0. Por definição,
se q = F (p), temos
F∗ X = X
se e somente se
F ◦ ϕt = ϕt ◦ F.
8.42 Teorema. Se X, Y ∈ T (M ) são campos vetoriais e ϕt , ψs são os fluxos locais respectivos de X, Y em
uma vizinhança V de M , então
ϕt ◦ ψs = ψs ◦ ϕt
se e somente se
[X, Y ] = 0
em V .
Prova: Se ϕt ◦ ψs = ψs ◦ ϕt , como ϕt é um difeomorfismo, segue do Corolário 8.41 que (ϕt )∗ Y = Y , de
modo que
[(ϕ−t )∗ Y ]p − Yp Yp − Yp
[X, Y ]p = (LX Y )p = lim = lim =0
t→0 t t→0 t
para todo p ∈ V .
Reciprocamente, se [X, Y ] = 0 em V , considere a curva α : (−ε, ε) −→ Tp M definida por
α (t) = [(ϕ−t )∗ Y ]p .
Rodney Josué Biezuner 82
∂ (f ◦ ψ)
dψ0 (ei ) (f ) = (0)
∂xi
16i6k
(f ◦ ψ) 0, . . . 0, h , 0, . . . , 0 − f (ψ (0))
= lim
h→0 h
f ◦ ϕ10 ◦ . . . ◦ ϕi−1
0 ◦ ϕi i+1
h ◦ ϕ0 ◦ . . . ◦ ϕk0 (0) − f (0)
= lim
h→0 h
f ϕih (0) − f (0)
= lim
h→0 h
= Ei (0) (f )
= ei (f ) ,
∂ (f ◦ ψ)
dψ0 (ei ) (f ) = (0)
∂xi
k+16i6n
(f ◦ ψ) 0, . . . 0, h , 0, . . . , 0 − f (ψ (0))
= lim
h→0 h
k+16i6n
f ◦ ϕ10 ◦ ϕ20 ◦ . . . ◦ ϕk0 ◦ . . . ◦ ϕk0 0, . . . 0, h , 0, . . . , 0 − f (0)
= lim
h→0 h
k+16i6n
f 0, . . . 0, h , 0, . . . , 0 − f (0)
= lim
h→0 h
∂f
= (0)
∂xi
= ei (f ) ,
portanto
dψ0 (ei ) = ei
para i = 1, . . . , n. Segue que ψ (x) = x1 , . . . , xn é um difeomorfismo local e portanto uma carta para uma
vizinhança de p = 0.
Rodney Josué Biezuner 84
Observe que podemos calcular explicitamente dψx (e1 ) para todo x e não somente na origem, obtendo
∂ (f ◦ ψ)
dψx (e1 ) (f ) = (x)
∂x1
(f ◦ ψ) x1 + h, x2 . . . , xn − f (ψ (x))
= lim
h→0 h
f ◦ ϕ1x1 +h ◦ ϕ2x2 ◦ . . . ◦ ϕkxk 0, . . . 0, xk+1 , . . . , xn − f (ψ (x))
= lim
h→0 h
f ϕ1x1 +h ϕ2x2 (. . . (ϕnxn (0)) . . .) − f (0)
= lim
h→0 h
= E1 (x) (f ) ,
ou seja,
∂
E1 (x) = dψx (e1 ) =
∂x1 x
para todo x onde a carta está definida. Isso prova o resultado para i = 1.
Mas, pelo teorema anterior, como [Ei , Ej ] = 0, temos que os fluxos dos campos E1 , . . . , Ek comutam, isto
é,
ϕit ◦ ϕjt = ϕit ◦ ϕjt
para todos i, j = 1, . . . , k. Logo, para i = 2, . . . , k podemos escrever
para i = 2, . . . , k, para todo x onde a carta ψ está definida, terminando a demonstração do resultado.
Assim, o colchete de Lie mede em algum sentido o quanto as trajetórias de campos linearmente independentes
E1 , . . . , En podem ser usadas para formar as “retas coordenadas” de um sistema de coordenadas (veja
[Spivak], Vol. I, pp. 220-221, para uma afirmação mais precisa deste resultado).
8.11 Exercı́cios
8.44 Exercı́cio. Considere o subconjunto X = (R × {0}) ∪ R+ × {1} de R2 com a seguinte base para a
sua topologia:
(a) intervalos do tipo (a, b) × {0}, a < b;
(b) intervalos do tipo (a, b) × {1}, 0 6 a < b;
(c) uniões de intervalos do tipo [(a, 0) × {0}] ∪ [(0, b) × {1}], a < 0 < b.
Verifique que X possui uma base enumerável, que conjuntos finitos de pontos são fechados em X e que
todo ponto de X possui uma vizinhança difeomorfa a um conjunto aberto de R. Observe que X não é, no
entanto, um espaço de Hausdorff, porque os pontos (0, 0) e (0, 1) não possuem vizinhanças abertas disjuntas.
Φ = {ϕα }α∈A
ϕαβ = ϕ−1 −1 −1
β ◦ ϕα : ϕα (Vαβ ) −→ ϕβ (Vαβ ) ,
−1
ϕβα = ϕ−1 −1
α ◦ ϕβ : ϕβ (Vαβ ) −→ ϕα (Vαβ ) ,
xk −→ x ∈ Uα \ϕ−1
α (Vαβ ) ,
ϕ−1 −1
β ◦ ϕα (xk ) −→ y ∈ Uβ \ϕβ (Vαβ ) .
Tensores
Temos
dx1 dxn
dx
= ,..., .
dt dt dt
Em um outro sistema de coordenadas y 1 , . . . , y n a curva é descrita por:
de modo que seu vetor velocidade neste sistema de coordenadas é dado por
1
dy n
dy dy
= ,..., .
dt dt dt
A regra da cadeia nos dá como as coordenadas do vetor velocidade mudam de um sistema de coordenadas
para o outro:
n
dy i X ∂y i dxj
= (9.1)
dt j=1
∂xj dt
para i = 1, . . . , n.
Considere agora o conceito do gradiente de uma função, usualmente identificado com um vetor. No
sistema de coordenadas x1 , . . . , xn , o gradiente é definido por
∂f ∂f
∇x f (x) = (x) , . . . , (x)
∂x1 ∂xn
enquanto que no sistema de coordenadas y 1 , . . . , y n o gradiente é dado por
∂f ∂f
∇y f (x) = (x) , . . . , n (x)
∂y 1 ∂y
Novamente, a regra da cadeia nos dá como as coordenadas do gradiente mudam de um sistema de coordenadas
para o outro:
n
∂f X ∂xj ∂f
= (9.2)
∂y i j=1
∂y i ∂xj
86
Rodney Josué Biezuner 87
para i = 1, . . . , n.
Comparando as expressões (9.1) e (9.2), vemos que elas são bem diferentes. Isso fica ainda mais claro se
considerarmos o Jacobiano da mudança de coordenadas y = y (x),
i
∂y
J= (9.3)
∂xj
ou seja,
∂y 1 ∂y 1
...
∂x1 ∂xn
J = .. ..
.
. .
∂y n ∂y n
...
∂x1 ∂xn
Temos
dy dx
=J (9.4)
dt dt
enquanto que
T
∇y f = J −1 ∇x f, (9.5)
pois
∂x1 ∂x1
...
∂y 1 ∂y n
dxi
J −1
=
= .. ..
.
dy j . .
∂xn ∂xn
...
∂y 1 ∂y n
Note que as leis de transformação não são exatamente uma a inversa da outra no sentido matricial, já que é
necessário transpor a matriz de mudança de coordenadas. Observe também que para as fórmulas concidirem,
terı́amos que ter
T
J = J −1 ,
isto é, J precisaria ser uma transformação ortogonal, o que equivale a requerer que os dois sistemas de
coordenadas x1 , . . . , xn e y 1 , . . . , y n sejam ortonormais, o que raramente ocorre.
O fato de que o gradiente de uma função sob uma mudança de coordenadas transformar-se de uma maneira
diferente da de um vetor mostra que ele é um tipo diferente de vetor. Como veremos os motivos na próxima
seção, vetores que se transformam de acordo com a expressão (9.1) são chamados vetores contravariantes,
enquanto que vetores que se transforma de acordo com a expressão (9.2) são chamados vetores covariantes
(ou simplesmente covetores).
As coordenadas de um vetor contravariante são convencionalmente denotadas por superescritos:
v = v1 , . . . , vn ,
(9.6)
porque, como nos casos dos vetores deslocamento, velocidade, aceleração, etc., ou seja, vetores cujas di-
mensões estão diretamente relacionadas às dimensões das coordenadas, o deslocamento aparece no numera-
dor (acima da barra da fração), enquanto que as coordenadas de um vetor covariante são convencionalmente
denotadas por subescritos:
v = (v1 , . . . , vn ) , (9.7)
porque, como no caso do covetor gradiente, o deslocamento aparece no denominador (abaixo da barra da
fração), ou seja, vetores tais como o gradiente tem dimensões que são inversas às dimensões das coordenadas.
Rodney Josué Biezuner 88
gradiente “perfura” as hiperfı́cies de nı́vel. Como no caso linear, a direção do vetor gradiente é a direção em
que mais hiperfı́cies de nı́vel são perfuradas por unidade de distância. Isso é quase equivalente a dizer que
o gradiente aponta na direção em que a função cresce com maior rapidez (como se demonstra em Cálculo),
pois perfurar as hiperfı́cies de nı́vel equivale a subir ou descer a montanha de contornos do gráfico de f ,
dependendo do sentido escolhido.
Rodney Josué Biezuner 89
B = {e1 , . . . , en } ,
denotaremos por [v]B o vetor coluna cujos elementos são as coordenadas do vetor v em relação à base B, ou
seja, se
v = v i ei ,
então
v1
[v]B = ... .
vn
Também abusaremos esta notação às vezes, escrevendo [v]B = v 1 , . . . , v n .
9.1 Definição. Sejam V um espaço vetorial real e
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn } ,
duas bases para V . A matriz de mudança de coordenadas da base B1 para a base B2 é a matriz A tal
que
[v]B2 = A [v]B1 . (9.8)
Quando necessário, ela será denotada por AB1 →B2 .
9.2 Notação. Denotaremos o elemento que ocupa a i-ésima linha e a j-ésima coluna de A por Aij .
Rodney Josué Biezuner 90
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn } ,
duas bases para um espaço vetorial real V . Se A = Aij é a matriz de mudança de coordenadas da base B1
ei = Aji fj . (9.9)
ei = Aji fj , (9.10)
a lei de transformação das coordenadas de vetores na base B2 para a base B1 é contrária: como
segue que se
[v]B1 = v 1 , . . . , v n ,
[v]B2 = w1 , . . . , wn ,
então i
v i = A−1 j
wj . (9.11)
A lei de transformação (9.10) é considerada a lei de transformação fundamental. Portanto, a observação
acima motiva a seguinte definição:
9.4 Definição. Vetores cujas coordenadas se transformam de maneira contrária à lei (9.10) são chamados
vetores contravariantes.
Assim, os vetores do próprio espaço vetorial V são vetores contravariantes.
9.3.2 Covetores
9.5 Definição. Seja V um espaço vetorial real de dimensão finita. Um covetor de V é qualquer funcional
linear ω : V −→ R.
O espaço vetorial dos covetores de V , com as definições naturais de soma de covetores e multiplicação de
covetores por escalares reais é chamado o espaço dual de V e denotado por V ∗ .
Portanto, covetor de V nada mais é que um sinônimo para funcional linear sobre V .
Rodney Josué Biezuner 91
9.6 Definição. Seja B = {e1 , . . . , en } uma base para o espaço vetorial V . Definimos a base dual
B∗ = e1 , . . . , en
de V ∗ por
ei (ej ) = δij , i, j = 1, . . . , n. (9.12)
Um covetor arbitrário ω ∈ V ∗ expressa-se em coordenadas com relação à base dual B∗ na forma
ω = ωi ei .
Observe que se
v = v i ei ,
então
ei (v) = v i . (9.13)
9.7 Definição. Sejam V, W espaços vetoriais. Dada uma aplicação linear A : V −→ W , definimos a
aplicação linear dual ou transposta A∗ : W ∗ −→ V ∗ de A por
(A∗ ω) v = ω (Av)
B1 = {e1 , . . . , en } ,
B2 = {f1 , . . . , fn }
B∗1 = e1 , . . . , en ,
B∗2 = f 1 , . . . , f n
as respectivas bases duais para V ∗ . Se A é a matriz de mudança de coordenadas da base B1 para a base B2 ,
então i
ei = A−1 j f j . (9.14)
T
Consequentemente, A−1 é a matriz de mudança de coordenadas da base dual B∗1 para a base dual B∗2 ,
isto é,
T
[ω]B∗ = A−1 [ω]B∗ . (9.15)
2 1
ek = Blk f l .
Então
δik = ek (ei ) = ek Aji fj = Aji ek (fj ) = Aji Blk f l (fj )
= Aji Blk δjl = Aji Bjk = Bjk Aji ,
Rodney Josué Biezuner 92
segue que se
[ω]B∗ = (ω1 , . . . , ωn ) ,
1
[ω]B∗ = (σ1 , . . . , σn ) ,
2
então
ωi = Aji σj . (9.16)
Ou seja, covetores variam (se transformam) da mesma forma como variam (se transformam) os vetores da
base do espaço vetorial, que convencionamos ser a lei de transformação fundamental. Esta observação motiva
a seguinte definição:
9.9 Definição. Vetores cujas coordenadas se transformam da mesma forma que a lei (9.10) são chamados
vetores covariantes.
Assim, os covetores do espaço dual V ∗ são vetores covariantes.
Em vista desta identificação, um vetor v ∈ V pode ser visto como um funcional linear sobre V ∗ cuja ação
em covetores de V ∗ é dada por
v (ω) = ω (v) . (9.17)
Em particular,
ei ej = δij
(9.18)
e se
ω = ωi ei ,
então
ei (ω) = ωi . (9.19)
Rodney Josué Biezuner 93
ψ −1 ◦ ϕ (x) = ψ −1 ◦ ϕ x1 , . . . , xn = y 1 x1 , . . . , xn , . . . , y n x1 , . . . , xn ,
j
isto é, denotamos as função coordenadas ψ −1 ◦ ϕ (x) por y j (x).
9.12 Proposição. Seja M uma variedade diferenciável n-dimensional e
ϕ : U −→ ϕ (U ) ,
ψ : V −→ ψ (V ) ,
∂y j ∂
∂
= . (9.20)
∂xi p ∂xi ∂y j p
Portanto, se um vetor v ∈ Tp M se escreve em coordenadas em relação às bases Bx e By nas formas
i ∂
v = vx ,
∂xi p
∂
v = vyj ,
∂y j p
então, pelas Proposições 9.3 e 9.12, a lei de transformação de coordenadas é dada por
∂xi j
vxi = v . (9.21)
∂y j y
Rodney Josué Biezuner 94
do espaço tangente Tp M associada à carta ϕ dá origem a uma base dual coordenada para o espaço
cotangente Tp∗ M associada à carta ϕ que denotaremos por
n o
B∗p = dx1 p , . . . , dxn |p .
(9.22)
Portanto, qualquer covetor ω ∈ Tp∗ M pode ser escrito de maneira única como
ω = ωi dxi p ,
(9.23)
onde !
∂
ωi = ω . (9.24)
∂xi p
Vamos investigar agora como as coordenadas de um covetor tangente se transformam quando há uma mu-
dança de bases coordenadas, de uma carta para outra.
9.15 Proposição. Seja M uma variedade diferenciável n-dimensional e ϕ : U −→ ϕ (U ) , ψ : V −→ ψ (V )
duas cartas para vizinhanças coordenadas de p = ϕ (x) = ψ (y) em M . Sejam
( )
∂ ∂
Bx = ,..., ,
∂x1 p ∂xn p
( )
∂ ∂
By = ,...,
∂y 1 p ∂y n p
as respectivas bases duais. Então a matriz de mudança de coordenadas da base B∗x para a base B∗y é dada
por
∂xi
dxi p = dy j p .
j
(9.25)
∂y
Rodney Josué Biezuner 95
Prova: Pela Proposição 9.12, a mudança de coordenadas da base Bx para a base By é dada por
∂y j ∂
∂
= .
∂xi p ∂xi ∂y j p
então
∂y j y
ωix =
ω .
∂xi j
Podemos agora entender a terminologia antiga em que vetores tangentes eram chamados vetores contrava-
riantes, enquanto que covetores tangentes eram chamados vetores covariantes. É importante ressaltar que
esta terminologia nada tem a ver com functores covariantes e contravariantes da teoria de categorias.
9.5 Tensores
9.5.1 Definição
9.16 Definição. Seja V um espaço vetorial real de dimensão finita e V ∗ seu espaço dual.
Um k-tensor covariante em V (ou tensor covariante de ordem k) é uma função real k-linear
T : V × . . . × V −→ R.
| {z }
k vezes
Um l-tensor contravariante em V (ou tensor contravariante de ordem l) é uma função real l-linear
T : V ∗ × . . . × V ∗ −→ R.
| {z }
l vezes
Um tensor do tipo (k, l) é um tensor k-covariante e l-contravariante, isto é, uma função real multilinear
T : V × . . . × V × V ∗ × . . . × V ∗ −→ R.
| {z } | {z }
k vezes l vezes
O espaço vetorial real dos k-tensores covariantes sobre V será denotado por T k (V ); o espaço vetorial dos
l-tensores contravariantes sobre V será denotado por Tl (V ) e o espaço vetorial dos (k, l) tensores sobre V
será denotado por Tlk (V ). Estes espaços vetoriais são chamados espaços tensoriais.
9.17 Exemplo. Um 1-tensor covariante é simplesmente um covetor. Formas bilineares, entre elas o produto
interno, são 2-tensores covariantes. Determinantes são n-tensores covariantes em Rn .
Algumas identificações naturais (isto é, independente de especificação de bases):
T0k (V ) = T k (V ) ;
Rodney Josué Biezuner 96
Tl0 (V ) = Tl (V ) ;
T1 (V ) = V ∗∗ = V.
9.18 Proposição. Seja End (V ) o espaço vetorial dos operadores lineares sobre V . Então existe um iso-
morfismo natural
T11 (V ) ∼
= End (V ) .
Prova. Um isomorfismo natural Φ : End (V ) −→ T11 (V ) pode ser definido por
l
9.19 Proposição. Considere o espaço vetorial L V k × (V ∗ ) ; V das aplicações multilineares
T : V × . . . × V × V ∗ × . . . × V ∗ −→ V.
| {z } | {z }
k vezes l vezes
9.21 Exemplo. Sejam ω, η dois covetores (1-tensores covariantes). Então
Usando produtors tensoriais, podemos obter uma base para o espaço tensorial Tlk (V ):
Rodney Josué Biezuner 97
9.22 Proposição. Se
B = {e1 , . . . , en }
é uma base para o espaço vetorial V e
B∗ = e1 , . . . , en
é uma base para o espaço tensorial Tlk (V ). Além disso, qualquer tensor T ∈ Tlk (V ) se escreve na forma
T = Tij11...i
...jl i1
k
e ⊗ . . . ⊗ eik ⊗ ej1 ⊗ . . . ⊗ ejl , (9.27)
onde
Tij11...i
...jl
= T ei1 , . . . , eik , ej1 , . . . , ejl .
k
(9.28)
Em particular, dim Tlk (V ) = nk+l .
Prova. Primeiro mostraremos que Bkl gera o espaço tensorial Tlk (V ). Seja T ∈ Tlk (V ) um tensor qualquer
e defina
Tij11...i
...jl
= T ei1 , . . . , eik , ej1 , . . . , ejl .
k
T v1 , . . . , v k , ω 1 , . . . , ω l
= Tij11...i
...jl i1
v . . . vkik ωj11 . . . ωjl l
k 1
= Tij11...i
...jl i1
e (v1 ) . . . eik (vk ) ej1 ω 1 . . . ejl ω l
k
= Tij11...i
...jl i1
e ⊗ . . . ⊗ eik ⊗ ej1 ⊗ . . . ⊗ ejl v1 , . . . vk , ω 1 , . . . , ω l .
k
Para mostrar que Bkl é linearmente independente, suponha que exista uma combinação linear nula
T = Cij11...i
...jl i1
k
e ⊗ . . . ⊗ eik ⊗ ej1 ⊗ . . . ⊗ ejl = 0
(o delta de Kronecker para multi-ı́ndices é definido de maneira análoga ao delta de Kronecker usual) segue
que
0 = T (er1 , . . . , erk , es1 , . . . , esl ) = Cij11...i
...jl i1 ...ik s1 ...sl
δ
k r1 ...rk j1 ...jl
= Crs11...r
...sl
k
Este resultado mostra que um tensor é completamente determinado pela sua ação em todas as sequências
possı́veis de covetores e vetores das bases de V ∗ e V .
k+p
Observe que, se F ∈ Tlk (V ), G ∈ Tqp (V ) e T = F ⊗ G ∈ Tl+q (V ), então
j ...j jl+1 ...jl+q j1 jl jl+1
, . . . , ejl+q
Ti11...iklik+1 ...ik+p = T ei1 , . . . , eik , eik+1 , . . . , eik+p , e , . . . , e , e
de modo que
j ...j j ...j j1 ...jl j ...j
Ti11...iklik+1
l+1 l+q l+1 l+q
...ik+p = Fi1 ...ik Gik+1 ...ik+p . (9.29)
r1 rk −1 j1 −1 jl
T (fr1 , . . . , frk , f s1 , . . . , f sl )
= Ai1 . . . Aik A s1
... A sl
j1 jl
= Ari11 . . . Arikk A−1 s1 . . . A−1 s Frs11...r ...sl
k
.
l
9.24 Definição. Seja M uma variedade diferenciável. Para cada p ∈ M definimos o espaço tensorial
tangente Tlk (Tp M ) a M em p. Seja ϕ : U −→ ϕ (U ) uma carta de uma vizinhança de um ponto p ∈ M . A
base coordenada ( )
∂ ∂
Bp = ,...,
∂x1 p ∂xn p
do espaço tangente Tp M associada à carta ϕ e sua respectiva base dual
n o
B∗p = dx1 p , . . . , dxn |p
dão origem à base coordenada associada à carta ϕ para o espaço tensorial tangente Tlk (Tp M )
( )
∂ ∂
Bl p = dx p ⊗ . . . ⊗ dx p ⊗
k i1 ik
⊗ ... ⊗ (9.31)
∂xj1 p ∂xjl p 16i1 ,...,ik 6n
16j1 ,...,jl 6n
Rodney Josué Biezuner 99
as expressões em coordenadas para um tensor Tp ∈ Tlk (Tp M ) em relação a estas bases. Então
∂y r1 ∂y rk ∂xj1 ∂xjl s1 ...sl
Eij11...i
...jl
(p) = . . . . . . F (p) . (9.32)
k i
∂x 1 i s
∂x k ∂y 1 ∂y sl r1 ...rk
Prova: Segue das Proposições 9.12, 9.15 e 9.23.
tr A = Aii .
A partir disso pode-se definir o traço de um operador linear sobre um espaço vetorial real de dimensão finita
como sendo o traço de qualquer uma de suas representações matriciais com respeito a uma base fixada pois
pode-se provar que o traço independe da base escolhida, ou seja, que o traço é uma noção independente de
coordenadas. Usando o isomorfismo natural entre o espaço vetorial End (V ) dos operadores lineares sobre V
e T11 (V ), podemos definir logo de inı́cio o traço para operadores lineares independemente de coordenadas.
Além da vantagem óbvia de se ter uma definição que não se refere a coordenadas, a maior vantagem é que
ela será naturalmente generalizada para definir o traço de tensores.
Observe que é uma consequência da Proposição 9.22 que os produtos tensoriais da forma ω ⊗ v, ω ∈ V ∗ ,
v ∈ V , geram T11 (V ); em outras palavras, todo (1, 1)-tensor é uma combinação linear de tais produtos
tensoriais.
9.26 Definição. O traço de (1, 1)-tensores é o funcional linear tr : T11 (V ) −→ R definido por
tr (ω ⊗ v) = ω (v)
em produtos tensoriais e estendido linearmente a todo T11 (V ).
Se Φ : End (V ) −→ T11 (V ) é o endomorfimo natural, então o traço de um operador linear A ∈ End (V )
é definido por
tr A = tr (Φ (A)) .
Rodney Josué Biezuner 100
T = Tij ei ⊗ ej ,
então
tr T = Tii . (9.33)
Se A ∈ End (V ), então
tr A = Aii . (9.34)
Prova: Por definição,
tr T = Tij tr ei ⊗ ej = Tij ei (ej ) = Tij δji = Tii .
Daı́, como
i
tr A = [Φ (A)]i ,
e, pela Proposição 9.18,
j
[Φ (A)]i = Φ (A) ei , ej = ej (Aei ) = ej Aki ek
é um (1, 1)-tensor.
9.28 Definição. Dado um tensor T do tipo (k, l) e ı́ndices p, q, o traço de T com respeito aos ı́ndices p, q
(ı́ndice covariante p e ı́ndice contravariante q) é o tensor tr T do tipo (k − 1, l − 1) definido por
Se for necessário explicitar os ı́ndices em relação aos quais foi tomado o traço, denotaremos trpq T .
T = Tij11...i
...jl i1
k
e ⊗ . . . ⊗ eik ⊗ ej1 ⊗ . . . ⊗ ejl .
então as coordenadas de
j ...j
tr T = (tr T )i11...ik−1
l−1
ei1 ⊗ . . . ⊗ eik−1 ⊗ ej1 ⊗ . . . ⊗ ejl−1
= tr S
= Sii
= T ei1 , . . . , eip−1 , ei , eip , . . . , eik−1 , ej1 , . . . , ejq−1 , ei , ejq , . . . , ejl−1
j ...j ij ...j
= Ti11...ip−1
q−1 q l−1
iip ...ik−1 .
definido por
!
ψα x, Tij11...i
...jl
k i1 ,...,ik =1,...,n
j1 ,...,jl =1...,n
!
∂ ∂
ϕα (x) , Tij11...i
...jl i1 ik
= dx ⊗ . . . ⊗ dx ⊗ ⊗ ... ⊗ .
k p p ∂xj1 p ∂xjl p
Fibrados tensoriais são fibrados vetoriais (veja o Exercı́cio 1.3). Note que
T 0 M = C ∞ (M ) ,
T1 M = T M,
T 1 M = T ∗ M,
T0k M = T k M,
Tl0 M = Tl M.
A menos que seja dito o contrário, lidaremos apenas com campos tensoriais diferenciáveis. Note que
T 0 (M ) = C ∞ (M ) ,
T1 (M ) = T (M ) ,
T0k (M ) = T k (M ) ,
Tl0 (M ) = Tl (M ) .
para todo p ∈ V , de modo que nesta base coordenada o campo tensorial T se escreve na forma
j1 ...jl i1
ik
∂ ∂
Tp = Ti1 ...ik (p) dx p ⊗ . . . ⊗ dx p ⊗ ⊗ ... ⊗ . (9.36)
∂xj1 p ∂xjl p
Então T é um campo tensorial diferenciável se e somente se para toda carta ϕ as funções Tij11...i
...jl
k
: V −→ R
são diferenciáveis para todos os ı́ndices i1 , . . . , ik , j1 , . . . , jl = 1 . . . , n.
9.8 Exercı́cios
9.33 Exercı́cio. Defina explicitamente o fibrado cotangente e mostre que ele é um fibrado vetorial. Defina
explicitamente o conceito de campos covetoriais.
9.34 Exercı́cio. Mostre que o fibrado tensorial definido pela Definição 9.30 é de fato uma variedade dife-
renciável.
9.35 Exercı́cio. Mostre que um fibrado tensorial é um fibrado vetorial.
9.36 Exercı́cio. Demonstre a Proposição 9.32.
9.37 Exercı́cio. Seja T : M −→ Tlk M uma seção do fibrado tensorial. Mostre que T é diferenciável (e,
portanto, um campo tensorial diferenciável) se e somente se para toda vizinhança V ⊂ M e para todos os cam-
pos vetoriais X1 , . . . , Xk e para todas os campos covetoriais ω 1 , . . . , ω l a função T X1 , . . . , Xk , ω 1 , . . . , ω l :
V −→ R definida por
é diferenciável.
Capı́tulo 10
Variedades Métricas
e as funções componentes gij do tensor métrica g são diferenciáveis para toda parametrização ϕ se e somente
se g é diferenciável.
Omitindo o sı́mbolo do ponto de atuação p, como frequentemente faremos, escrevemos simplesmente
∂ ∂
gij = , (10.3)
∂xi ∂xj
103
Rodney Josué Biezuner 104
G = (gij ) (10.5)
segue que G é uma matriz simétrica. Observe que devido à simetria existem apenas
n (n + 1)
2
componentes potencialmente distintos do tensor métrica, ao invés dos n2 componentes distintos para um
tensor 2-covariante geral.
Usando o produto simétrico de tensores (veja [Lee 1], Cap. 12, p. 315), que no caso de covetores é
simplesmente
1
ωη := (ω ⊗ η + η ⊗ ω) (10.6)
2
e a simetria do tensor métrica, podemos escrever a expressão
Estritamente falando, uma variedade métrica é um par (M, g), onde M é uma variedade diferenciável
e g a métrica riemanniana, já que uma mesma variedade diferenciável pode admitir diferentes métricas
riemannianas, como veremos no decorrer deste texto. Contudo, quando não houver perigo de confusão, nós
vamos nos referir à variedade riemanniana simplesmente por M .
10.2 Exemplo (Métrica Euclidiana). A variedade riemanniana mais simples é o espaço euclidiano Rn
com a métrica euclidiana gij = δij , que denotaremos En .
10.3 Exemplo (Métrica Semieuclidiana). A variedade semi-riemanniana mais simples de ı́ndice k é o
espaço semi-euclidiano Rn com a métrica semieuclidiana gij = ηij
k
, que denotaremos Mnk .
10.4 Exemplo (Métrica de Lorentz). A variedade de Lorentz mais simples de ı́ndice 1 é o espaço de
Minkowski n-dimensional Rn , n > 2, com a métrica de Lorentz gij = ηij . Denotaremos este espaço
por Mn , enquanto que o espaçotempo de Minkowski da relatividade especial M4 continuará a ser denotado
geralmente apenas por M.
10.5 Proposição. Toda variedade diferenciável possui uma métrica riemanniana.
Rodney Josué Biezuner 105
Prova: Seja {ϕα : Uα −→ Vα }α um atlas para M e {fα }α uma partição da unidade de M subordinada à
cobertura {Vα }α .
Em cada Vα podemos definir uma métrica riemanniana, aquela induzida ∈ M e vetores
(pela carta: dado p )
∂ ∂
v, w ∈ Tp M , eles se escrevem em coordenadas com relação à base Bp =
,..., associada à
∂x1 p ∂xn p
carta ϕα por
i ∂ j ∂
v=v e w=w
∂xi p ∂xj p
De fato, esta soma é finita em uma vizinhança de p, portanto define um tensor diferenciável em M ; além
disso, como uma combinação linear finita positiva de produtos internos é um produto interno, ela define um
produto interno em Tp M .
Observe que a demonstração acima não funciona para métricas semi-riemannianas. De fato, uma com-
binação linear finita de métricas semi-riemannianas, mesmo positiva, não é necessariamente uma métrica
semi-riemanniana. Por exemplo, a soma das métricas semi-riemannianas em R4
hv, wi1 = v1 w1 + v2 w2 − v3 w3 − v4 w4 ,
hv, wi2 = −v1 w1 − v2 w2 + v3 w3 + v4 w4 ,
é o tensor
T (v, w) = 2 (v3 w3 + v4 w4 ) ,
que é degenerado, pois se v0 = (1, 1, 0, 0), então
T (v0 , w) = 0
para todo w ∈ R4 . A realidade é que existem variedades diferenciáveis que não admitem métricas semi-
riemannianas. Por exemplo, é possı́vel provar, usando técnicas de Topologia Diferencial, que esferas de
dimensão par não admitem métricas de Lorentz (em particular S4 não pode ser uma variedade de Lorentz; o
espaçotempo não pode ser uma esfera 4-dimensional); mais geralmente, é possı́vel provar que toda variedade
diferenciável compacta de dimensão ı́mpar possui uma métrica de Lorentz e que uma variedade diferenciável
compacta de dimensão par admite uma métrica de Lorentz se e somente se ela tem caracterı́stica de Euler nula
(veja [Steenrod], Theorem 40.13, p. 207). Por outro lado, todas as variedades diferenciáveis não compactas
admitem métricas de Lorentz (veja [BEE], p. 50).
10.6 Exemplo (Métrica Produto). Se (M1 , g1 ) e (M2 , g2 ) são duas variedades métricas, então definimos
a métrica produto g = g1 ⊕ g2 na variedade produto M1 × M2 por
h(v1 , v2 ) , (0, w2 )i(p1 ,p2 ) = hv1 , 0ip1 + hv2 , w2 ip2 = hv2 , w2 ip2 ,
h(v1 , v2 ) , (w1 , 0)i(p1 ,p2 ) = hv1 , w1 ip1 + hv2 , 0ip2 = hv1 , w1 ip1 ,
segue que
hv1 , w1 ip1 = 0
para todo w1 ∈ Tp1 M1 e
hv2 , w2 ip2 = 0
para todo w2 ∈ Tp2 M2 , e a não-degenericidade de g1 , g2 implica que
v1 = v2 = 0.
10.7 Definição. Sejam M, N variedades métricas. Um difeomorfismo F : M −→ N é uma isometria se
para todo p ∈ M e para todos v, w ∈ Tp M . Se existir uma isometria entre M e N , dizemos que M e N são
isométricas.
Dizemos que M e N são localmente isométricas se para todo p ∈ M existe uma vizinhança Vp de p
em M e uma isometria F : Vp −→ F (Vp ) ⊂ N e reciprocamente para todo q ∈ N existe uma vizinhança Wq
de q em N e uma isometria G : Wp −→ G (Wp ) ⊂ M .
Dizemos que uma variedade métrica (M, g) é plana, se ela é localmente isométrica ao espaço euclidiano
ou ao espaço semi-euclidiano.
Observe que o conjunto das isometrias em uma variedade métrica possui uma estrutura natural de grupo
em que o produto de isometrias é definido como a composição das aplicações. Este grupo é denotado por
Isom (M ) .
10.8 Exemplo. O grupo de isometrias de En consiste das composições de operadores ortogonais e translações.
O grupo de isometrias de M é o grupo de Poincaré.
É fácil ver que isometria é uma relação de equivalência na classe das variedades métricas. Geometria
Riemanniana é principalmente o estudo das propriedades que são invariantes por isometrias. Uma excelente
referência para o estudo de grupos de isometrias de variedades riemannianas é [Kobayashi].
Dizemos que uma aplicação diferenciável F : M −→ N entre variedades diferenciáveis é uma imersão se
dFp é injetiva para todo p ∈ M .
10.9 Definição. Sejam M uma variedade diferenciável, (N, h) uma variedade riemanniana e F : M −→ N
uma imersão. A métrica induzida por F em M (também chamada a métrica do pullback), denotada
por
g = F ∗ h,
é definida por
hv, wip := hdFp v, dFp wiF (p) (10.10)
para todo p ∈ M e para todos v, w ∈ Tp M .
Com esta métrica definida em M , a imersão F torna-se uma imersão isométrica. Na linguagem do
pullback, um difeomorfismo F entre duas variedades métricas (M, g) e (N, h) é uma isometria se
g = F ∗ h.
é uma variedade diferenciável com a topologia induzida de Rn+1 de dimensão n. Uma carta global para o
gráfico de f é ϕ : Rn −→ graf(f ) definida por
ϕ x1 , . . . , x n = x1 , . . . , x n , f x1 , . . . , x n .
Como
se k 6= n + 1,
(
∂ϕk δkj
= ∂f
∂xj se k = n + 1,
∂xj
ou seja,
∂ϕ ∂f
(x) = 0, . . . , 0, 1, 0, . . . 0, j (x)
∂xj j ∂x
segue que
∂ϕ ∂ϕ ∂ϕ ∂ϕ ∂f ∂f
gij (x) = (x) , (x) = (x) , (x) = δij + . (10.12)
∂xi ∂xj (x,f (x)) ∂xi ∂xj
Rn+1 ∂xi ∂xj
Rodney Josué Biezuner 108
Outro exemplo de superfı́cie 2-dimensional é uma superfı́cie de revolução gerada por uma curva. Espe-
cificamente seja γ : I −→ R2 , γ (t) = (α (t) , β (t)) uma curva parametrizada regular tal que β (t) 6= 0 para
todo t ∈ I; podemos imaginar γ contida no plano yz definindo
Se girarmos esta curva ao redor do eixo z obteremos uma superfı́cie parametrizada regular S. A imagem de
S é a imagem da aplicação ϕ : I × R −→ R3 dada por
a partir de ϕ podemos obter cartas locais restringindo o parâmetro θ a um intervalo aberto de comprimento
2π. Daı́,
∂ϕ
(t, θ) = (α0 (t) cos θ, α0 (t) sen θ, β 0 (t)) ,
∂t
∂ϕ
(t, θ) = (−α (t) sen θ, α (t) cos θ, 0) ,
∂θ
donde
∂ϕ ∂ϕ ∂ϕ ∂ϕ 2 2
g11 (t, θ) = (t, θ) , (t, θ) = , = [α0 (t)] + [β 0 (t)] ,
∂t ∂t ϕ(t,θ) ∂t ∂t R3
∂ϕ ∂ϕ ∂ϕ ∂ϕ
g12 (t, θ) = (t, θ) , (t, θ) = , = 0,
∂t ∂θ ϕ(t,θ) ∂t ∂θ R3
∂ϕ ∂ϕ ∂ϕ ∂ϕ 2
g22 (t, θ) = (t, θ) , (t, θ) = , = [α (t)] .
∂θ ∂θ ϕ(t,θ) ∂θ ∂θ R 3
Portanto
2 2
[α0 (t)] + [β 0 (t)]
0
G (t, θ) = 2 .
0 [α (t)]
10.11 Exemplo (Esfera). A métrica euclidiana induz uma métrica na esfera de raio r
n 2 2 o
2
Snr = x ∈ Rn+1 : kxk = x1 + . . . + xn+1 = r2
que chamaremos a métrica canônica de Snr . Denotaremos a esfera unitária por Sn , simplesmente. Vamos ver
os coeficientes gij para diferentes cartas da esfera.
a) Como gráfico de função:
O hemisfério superior da esfera é o gráfico da função f : Br ⊂ Rn −→ R dada por f x1 , . . . , xn =
q
2 2
r2 − (x1 ) − . . . − (xn ) . Como
∂f −xi
(x) = q ,
∂xi 2
r2 − kxk
segue que
xi xj
gij (x) = δij + 2. (10.13)
r2 − kxk
Similarmente para o hemisfério inferior. Estas cartas não cobrem o equador da esfera.
b) Como superfı́cie de revolução:
A parametrização da esfera de raio r como superfı́cie de revolução é
Segue que
r2
0
G (φ, θ) = .
0 r2 sen2 φ
c) Através da projeção estereográfica:
Na projeção estereográfica a partir do polo norte N = (0, . . . , 0, r), a reta a partir de N que intercepta o
plano xn+1 = 0 em um ponto x e = x1 , . . . , xn , 0 , intercepta a esfera em um ponto ϕ (x). Portanto, a carta
projeção estereográfica a partir do polo norte ϕ : Rn −→ Snr \ {N } é definida por
x − N ) = tx1 , . . . , txn , (1 − t) r
ϕ (x) = N + t (e
onde t > 0 é tal que kϕ (x)k = r. Ou seja, t é tal que
2 2
t2 kxk + (1 − t) r2 = r2 ,
donde
2r2
t= 2.
r2 + kxk
Logo, !
2
2r2 x1 2r2 xn kxk − r2
ϕ x1 , . . . , x n
= 2,..., 2,r 2 2 , (10.14)
r2 + kxk r2 + kxk r + kxk
donde
2r2 δkj 4r2 xj xk
− se k 6= n + 1,
2 2
r2 + kxk
2
∂ϕk r2 + kxk
(x) =
∂xj 4r3 xj
se k = n + 1.
2
r2 + kxk2
Segue que as componentes do tensor métrica nas coordenadas dadas pela carta ϕ são
*n+1 n+1
+
∂ϕ ∂ϕ
X ∂ϕk X ∂ϕl
gij (x) = (x) , j (x) = (x) ek , (x) el
∂xi ∂x ϕ(x) ∂xi ∂xj
k=1 n+1 l=1 R
n+1 k l n+1 k l n+1 k k
X ∂ϕ ∂ϕ ∂ϕ ∂ϕ
X ∂ϕ ∂ϕ X
= i j
hek , el iRn+1 = i j
δkl =
∂x ∂x ∂x ∂x ∂xi ∂xj
k=1 l=1 k=1
n 2 2 i k 2 2 j k
X 2r δki 4r x x 2r δkj 4r x x 16r6 xi xj
= − − +
2 2 2 2 2 4
r + kxk r2 + kxk
2 2 2
k=1 r2 + kxk r2 + kxk r2 + kxk
n k 2
4 j k i k
4 i j
4
X 4r δki δkj 8r δki x x + δkj x x 16r x x x 16r6 xi xj
= 2 − + 4 +
3 4
2 2 2 2
k=1 r2 + kxk r2 + kxk r2 + kxk r2 + kxk
2
4r4 δij 16r4 xi xj 16r4 xi xj kxk 16r6 xi xj
= 2 − 3 + 4 + 4
2 2 2 2
r2 + kxk r2 + kxk r2 + kxk r2 + kxk
4r4 δij 16r4 xi xj 16r4 xi xj
= 2 − 3 + 3
2 2 2
r2 + kxk r2 + kxk r2 + kxk
4r4 δij
= 2 .
2
r2 + kxk
Rodney Josué Biezuner 110
Observe que
4r4
2
r2 + kxk2
4r4
G (x) = ..
=
. 2 I.
2 + kxk2
4r4
r
2
2
r2 + kxk
Usando a projeção estereográfica a partir do polo sul obtemos duas cartas que cobrem toda a esfera.
10.12 Exemplo (Espaço Hiperbólico). Considere o semiespaço superior de Rn
H n = x 1 , . . . , x n ∈ Rn : x n > 0 .
Com a topologia induzida como aberto de Rn , Hn é uma superfı́cie diferenciável de dimensão n. Se definirmos
diretamente em Hn a métrica
δij
gij x1 , . . . , xn =
2, (10.16)
(xn )
então Hn é uma variedade riemanniana chamada o espaço hiperbólico n-dimensional. Observe que
1
(xn )2
.
1
G=
.. =
I.
(xn )2
1
2
(xn )
10.13 Exemplo (Toros). O toro mergulhado em R3 é uma superfı́cie de revolução gerada pelo cı́rculo.
Tomando o cı́rculo com centro em (R, 0) e raio r < R com parametrização γ (t) = (R + r cos t, r sen t)
obtemos a parametrização para o toro bidimensional como superfı́cie de revolução
Outra métrica induzida de RN importante para o toro, não localmente isométrica à métrica dada acima
(como veremos depois) é a métrica plana do toro: considerando o toro como a superfı́cie n-dimensional
Tn = S1 × . . . × S1 ⊂ R2n , a métrica euclidiana de R2n induz uma métrica no toro da seguinte forma.
Escrevendo
n 2 2 2 2 2 2 o
Tn = S1 × . . . × S1 = x ∈ R2n : x1 + x2 = x3 + x4 = . . . = x2n−1 + x2n = 1 ,
Temos, portanto,
∂ϕ k − sen θj se k = 2j − 1,
(θ) = cos θj se k = 2j,
∂θj
0 se k 6= 2j − 1, 2j.
ou seja,
∂ϕ j j
= 0, . . . , 0, − sen θ , cos θ , 0, . . . 0
∂θj 2j−1 2j
Daı́
∂ϕ ∂ϕ ∂ϕ ∂ϕ
gij (θ) = (θ) , j (θ) = (θ) , j (θ) = δij , (10.17)
∂θi ∂θ ϕ(θ) ∂θi ∂θ R2n
que são os mesmos componentes da métrica euclidiana. Portanto, o toro plano é localmente isométrico ao
plano Rn . Observe que considerando T2 como uma superfı́cie de R3 ou como uma superfı́cie de R4 define
duas métricas completamente diferentes para a mesma superfı́cie.
10.14 Definição. Seja M uma variedade riemanniana e γ : I −→ M uma curva parametrizada. O com-
primento do segmento de γ definido no intervalo [a, b] ⊂ I é definido por
Z b
` (γ) = kγ 0 (t)kγ(t) dt. (10.19)
a
10.15 Exemplo. Considere a curva parametrizada γ (t) = (0, t) no semiespaço positivo R2+ ; temos γ 0 (t) =
(0, 1) = e2 . Se R2+ é considerado uma subvariedade riemanniana do plano euclidiano, então
Z b Z b
` (γ) = ke2 k(0,t) dt = dt = b − a.
a a
G (p) = AT A
donde
2
det G = (det A) .
Denotando por vol [v1 , . . . , vn ] o volume do paralelepı́pedo formado pelos vetores v1 , . . . , vn , sabemos que
" #
√
∂ ∂
vol 1
,..., n
= det A vol [e1 , . . . , en ] = det A = det G (p) ,
∂x p ∂x p
já que vol [e1 , . . . , en ] = 1. Seja ψ : V −→ ψ (V ) outra carta positiva de uma vizinhança ψ (V ) de p em M
e escreva os vetores da base coordenada associada à carta ϕ em termos dos vetores da base coordenada de
Tp M associada à parametrização ψ
∂ j ∂
= Ji (10.20)
∂xi p ∂y j p
com Jij j i
= ∂y /∂x . Denote * +
∂ ∂
hij (p) = ,
∂y i p ∂y j p
p
e
H = (hij ) .
Segue que
" # " #
√
∂ ∂ ∂ ∂
det G (p) = vol ,..., = det J vol ,..., (10.21)
∂x1 p ∂xn p ∂y 1 p ∂y n p
√
= det J det H (p) .
Podemos agora definir o volume.
10.16 Definição. Seja M n uma variedade riemanniana e Ω ⊂ M um conjunto aberto, conexo e com fecho
compacto, tal que Ω está contida em uma vizinhança coordenada ϕ (U ) de uma parametrização ϕ : U −→
ϕ (U ) e a fronteira de ϕ−1 (Ω) tem medida nula em Rn . O volume de Ω é definido por
Z √
vol Ω = det G dx1 . . . dxn . (10.22)
ϕ−1 (Ω)
Rodney Josué Biezuner 113
Se Ω ⊂ M é um compacto, tome qualquer cobertura finita {Vi }i=1,...,n de Ω por vizinhanças parametrizadas
de M e considere uma partição da unidade {ρi }i=1,...,n subordinada a esta cobertura; se ϕi : Ui −→ Vi ,
i = 1, . . . , n, são parametrizações destas vizinhanças, definimos
n Z
X √
vol Ω = ρi det G dx1 . . . dxn . (10.23)
i=1 ϕ−1
i (Ω)
Segue da fórmula de mudança de variáveis para integrais múltiplas e de (10.21) que o volume está bem
definido, isto é, não depende da carta. Na linguagem de formas, o elemento de volume riemanniano
√ √
dVg = det G dx1 . . . dxn = det G dx1 ∧ . . . ∧ dxn (10.25)
é uma n-forma (para um tratamento usando formas, veja [Lee 2] e especialmente [Lee 1], Cap. 16, p. 422
em diante, que traz o teorema de Stokes e suas várias versões para variedades riemannianas).
G × G −→ G
(g, h) 7→ gh−1
é diferenciável.
10.18 Proposição. Seja G um grupo que é uma variedade diferenciável. Então G é um grupo de Lie se e
somente se as aplicações
G −→ G
g 7→ g −1
G × G −→ G
(g, h) 7→ gh
são diferenciáveis.
Prova: Suponha que G é um grupo de Lie. Então a primeira aplicação é diferenciável porque é a composta
das aplicações diferenciáveis
G −→ G × G −→ G
x 7→ (e, g) 7→ eg −1 = g −1
Rodney Josué Biezuner 114
(lembre-se que a inclusão na variedade produto sempre é uma aplicação diferenciável). A segunda é dife-
renciável porque é a composta das aplicações diferenciáveis
G × G −→ G×G −→ G
−1
g, h−1 g h−1
(g, h) 7→ 7→ = gh
10.20 Proposição. Seja G um grupo de Lie. Dado g ∈ G, então as aplicações translação à esquerda por g
Lg : G −→ G
(10.26)
g 7→ gh
e similarmente −1
(dRg )h = dRg−1 gh . (10.29)
10.21 Definição. Uma álgebra de Lie (sobre R) é um espaço vetorial G munido de uma aplicação bilinear,
chamada o colchete de Lie,
[·, ·] : V × V −→ R
que satisfaz
(i) (anticomutatividade)
[X, Y ] = − [Y, X] ; (10.30)
(ii) (identidade de Jacobi)
[[X, Y ] , Z] + [[Y, Z] , X] + [[Z, X] , Y ] = 0 (10.31)
para todos X, Y, Z ∈ G.
Rodney Josué Biezuner 115
10.22 Exemplo. Seja M uma variedade diferenciável. O espaço vetorial T (M ), equipado com o colchete
de Lie é uma álgebra de Lie.
10.23 Exemplo. O espaço vetorial das matrizes reais n × n com a operação colchete definida por
[A, B] = AB − BA (10.32)
para todo h ∈ G. Em particular, um campo invariante à esquerda fica completamente determinado pelo seu
valor em algum ponto qualquer de G. Por exemplo, se conhecemos o valor de Xe então, tomando h = e,
segue que
Xg = (dLg )e Xe . (10.35)
O próximo resultado garante a existência de um número infinito de campos invariantes à esquerda em um
grupo de Lie.
10.26 Proposição. Seja G um grupo de Lie. Todo vetor tangente Xe no espaço tangente Te G possui uma
extensão a um campo invariante à esquerda X ∈ T (G).
10.27 Proposição. Seja G um grupo de Lie. Então o colchete de Lie de campos invariantes à esquerda é
invariante à esquerda.
Em particular, o subespaço dos campos invariantes à esquerda é uma álgebra de Lie.
Prova: Sejam X, Y ∈ T (G) campos invariantes à esquerda. Temos, para toda f ∈ C ∞ (G),
Como o subconjunto dos campos invariantes à esquerda é um subespaço vetorial de T (G), segue que ele
é uma (sub)álgebra de Lie.
Podemos agora definir uma operação colchete de Lie no espaço tangente (espaço vetorial) Te G que o
transforma em uma álgebra de Lie:
10.28 Definição. Seja G um grupo de Lie. A álgebra de Lie G de G é o espaço tangente Te G munido do
colchete de Lie
[Xe , Ye ] := [X, Y ]e . (10.36)
onde X, Y ∈ T (G) são quaisquer extensões invariantes à esquerda dos vetores tangentes Xe , Ye .
Pode-se mostrar que a álgebra de Lie dos campos invariantes à esquerda é isomorfa ao espaço tangente Te G,
em particular como espaço vetorial ela tem dimensão finita, igual à dimensão de G (veja [Lee 1], Teorema
8.37, e [Warner], p.86, Definição 3.1).
Podemos agora introduzir uma métrica em G com certas propriedades algébricas.
10.29 Definição. Seja G um grupo de Lie. Dizemos que uma métrica h·, ·ig em G é invariante à esquerda
se
hv, wih = (dLg )h v, (dLg )h w Lg h (10.37)
para todos g, h ∈ G e para todos v, w ∈ Te G. Analogamente, definimos uma métrica invariante à direita.
Uma métrica que é ao mesmo tempo invariante à esquerda e à direita é chamada uma métrica bi-
invariante.
Em outras palavras, em uma métrica invariante à esquerda, toda translação à esquerda Lg é uma isometria,
enquanto que em uma métrica invariante à direita, toda translação à direita Rg é uma isometria. Em uma
métrica bi-invariante todas as translações são isometrias. A existência de métricas bi-invariantes para grupos
de Lie compactos é estabelecida no Exercı́cio 7 de [Carmo]. A existência de métrica invariantes à esquerda
ou à direita em qualquer grupo de Lie é estabelecida através da seguinte definição.
10.30 Proposição. Seja G um grupo de Lie. Suponha que h, i é algum produto interno em Te G. Então a
métrica em G definida por D E
hv, wig = dLg−1 g v, dLg−1 g w (10.38)
e
para todo g ∈ G e para todos v, w ∈ Te G, é invariante à esquerda.
Analogamente, a métrica em G definida por
D E
hv, wig = dRg−1 g v, dRg−1 g w
e
lembrando que Lh−1 g−1 ◦ Lg = Lh−1 g−1 g = Lh−1 . Analogamente prova-se a invariância à direita da segunda
métrica.
Há uma relação entre o produto interno e o colchete de Lie em G = Te G que caracteriza as métricas
bi-invariantes de G que enunciaremos sem prova.
10.31 Teorema. Seja G um grupo de Lie com álgebra de Lie G. A métrica invariante à esquerda definida
na proposição anterior é bi-invariante se e somente se o produto escalar h, i em G = Te G usado para definir
a métrica satisfaz
h[V, X] , W i = − hV, [W, X]i
para todos V, W, X ∈ G.
10.4 Exercı́cios
10.32 Exercı́cio. Mostre que a métrica produto é de fato uma métrica. Porque
Conexões
É possı́vel definir geodésicas e estudar suas propriedades sem falar de curvatura. Na verdade é até possı́vel
falar em geodésicas sem falar de métrica. Geodésicas são generalizações das retas da geometria euclideana.
Embora seja possı́vel definir geodésicas como curvas que minimizam distâncias em variedades riemannianas
e curvas que maximizam o tempo próprio em variedades de Lorentz, pelo menos localmente (e neste caso
a noção de geodésica estaria também fundamentalmente ligada à noção de métrica) esta propriedade é
tecnicamente difı́cil de trabalhar como definição. Ao invés, escolheremos uma propriedade diferente das
retas para generalizar: retas são caracterizadas como curvas com aceleração nula. Esta propriedade não faz
nenhuma referência à métrica e pode ser utilizada mesmo em variedades diferenciáveis que não tenham uma
estrutura métrica. E em relatividade geral ela faz mais sentido, já que partı́culas livres seguem trajetórias
geodésicas no espaçotempo curvo, já que não estão sujeitas a forças externas e portanto não sofrem aceleração,
assim como partı́culas livres na mecânica newtoniana seguem trajetórias retas com velocidade uniforme. Para
usar esta propriedade, precisaremos primeiro definir o conceito de derivadas de campos tangentes à curvas
segundo uma direção. Como em geral não existe um espaço ambiente Rn onde a variedade está mergulhada,
não é imediatamente óbvio como defini-lo. Se α : I −→ M é uma curva diferenciável em uma variedade M
não podemos simplesmente definir
α0 (t) − α0 (t0 )
α00 (t0 ) = lim
t→t0 t − t0
porque α0 (t) ∈ Tα(t) M e α0 (t0 ) ∈ Tα(t0 ) M vivem em diferentes espaços vetoriais, logo sua diferença não
faz sentido. Já vimos que a derivada de Lie não é uma boa solução para este problema, já que ela não é
uma derivada direcional. A definição do conceito de conexão atende esta necessidade de definir uma noção
de derivação intrı́nseca para campos vetoriais e se comporta exatamente como uma derivada direcional. O
nome conexão se refere exatamente à idéia de conectar localmente os espaços tangentes de uma variedade.
11.1 Definição. Seja M uma variedade diferenciável de dimensão n. Uma conexão ∇ em M é uma
aplicação
∇ : T (M ) × T (M ) −→ T (M ) ,
denotada por (X, Y ) 7→ ∇X Y que satisfaz as seguintes propriedades:
(i) ∇f X+gY Z = f ∇X Z + g∇Y Z,
(ii) ∇X (Y + Z) = ∇X Y + ∇X Z,
(iii) ∇X (f Y ) = f ∇X Y + (Xf ) Y.
118
Rodney Josué Biezuner 119
X = X i ∂i e Y = Y j ∂j ,
então
∇X Y = X Y j ∂j + X i Y j ∇∂i ∂j .
(11.1)
Em particular, (∇X Y )p depende apenas do valor de X em p e do valor de Y ao longo de uma curva tangente
a Xp .
Prova: Usando as propriedades de uma conexão, obtemos
∇X Y = ∇X Y j ∂j
= Y j ∇X ∂j + X Y j ∂j
= Y j ∇X i ∂i ∂j + X Y j ∂j
= X i Y j ∇∂i ∂j + X Y j ∂j .
Em particular,
(∇X Y )p = X i (p) Y j (p) (∇∂i ∂j )p + Xp Y j (p) ∂j |p .
Os coeficientes X 1 (p) , . . . , X n (p) dependem apenas do valor de X em p; os coeficientes Xp Y 1 , . . . , Xp (Y n ),
por definição de vetor tangente, dependem apenas dos valores de Y ao longo de uma curva passando por p
cujo vetor tangente em p é Xp .
Da expressão (11.1), escrevendo os campos vetoriais ∇∂i ∂j em termos dos campos base ∂k na forma
∇X Y = X Y k + X i Y j Γkij ∂k .
(11.3)
11.3 Definição. As funções suaves Γkij definidas pela expressão (11.3) são chamadas os sı́mbolos de
Christoffel associados à carta particular utilizada.
Observe que em princı́pio precisamos obter n3 sı́mbolos de Christoffel para determinar uma conexão. No
caso de conexões riemannianas, como veremos, a sua simetria diminuirá o número de sı́mbolos diferentes.
11.4 Proposição. Toda variedade diferenciável possui uma conexão.
Prova: Se V é uma vizinhança coordenada de M , dadas n3 funções arbitrárias Γkij ∈ C ∞ (V ), a fórmula
(11.3) define uma conexão em V , vista como subvariedade de M . Se {Vα } é uma cobertura de M por
vizinhanças coordenadas, cada uma com uma conexão ∇α definida, então podemos definir uma conexão
global em M , usando uma partição da unidade {ρα } subordinada a esta cobertura, por
X
∇X Y = ρα ∇α
X Y.
α
Rodney Josué Biezuner 120
As propriedades de uma conexão são facilmente verificadas; apenas a regra do produto merece atenção
especial, já que combinações lineares de conexões não são conexões em geral, exatamente por deixarem de
satisfazer a regra do produto. Mas combinações lineares convexas de conexões são conexões e no nosso caso
temos
X X
∇X (f Y ) = ρ α ∇α
X (f Y ) = ρα [(Xf ) Y + f ∇α
XY ]
α α
X X
= (Xf ) Y ρα + f ρα ∇α
XY
α α
= (Xf ) Y + f ∇X Y.
11.5 Exemplo (Conexão Euclidiana). Identificando espaços tangentes em Rn com o próprio Rn , vetores
tangentes com vetores em Rn e campos vetoriais em Rn com aplicações suaves Rn −→ Rn , nós definimos a
conexão euclidiana ∇ : T (Rn ) × T (Rn ) −→ T (Rn ) por
∂ (f ◦ Y ) ∂f ∂Y j ∂Y j ∂
dYp (Xp ) (f ) = Xp (f ◦ Y ) = X i i
= Xi j i
= Xi i (f ) .
∂x ∂x ∂x ∂x ∂xj
Em notação mais sucinta, a expressão em coordenadas da conexão euclidiana que obtemos a partir de (11.5)
é
∂
∇X Y = X Y j . (11.6)
∂xj
Segue de (11.3) e da observação no inı́cio da demonstração da Proposição 11.4 que a conexão euclidiana é
de fato uma conexão com sı́mbolos de Christoffel Γkij = 0.
Esta é uma conexão tanto para o espaço euclidiano, para o espaço semieuclidiano e para o espaço de
Minkowski, já que apenas a estrutura diferencial está envolvida.
11.6 Definição. Seja α : I −→ M uma curva diferenciável em uma variedade diferenciável M . Um campo
vetorial ao longo da curva α é um campo vetorial diferenciável V : I −→ T M tal que V (t) ∈ Tα(t) M
para todo t ∈ I.
O espaço vetorial dos campos vetoriais ao longo de uma curva α é denotado T (α).
11.7 Proposição. Seja M uma variedade diferenciável com uma conexão ∇. Existe uma única corres-
pondência que associa a cada campo vetorial diferenciável V ao longo de uma curva diferenciável α : I −→ M
um outro campo diferenciável
DV
dt
ao longo de α tal que
D DV DW
(V + W ) = + ,
dt dt dt
D df DV
(f V ) = V + f
dt dt dt
para todos os campos diferenciáveis V, W ao longo de α e para toda função diferenciável f : I −→ R, e tal
que, se V é induzido por um campo de vetores X ∈ T (M ), ou seja, V = X ◦ α, então
DV
= ∇α0 (t) X.
dt
Localmente,
dV k dαi k j
DV
= + Γ V ∂k , (11.7)
dt dt dt ij
Prova: Observe que para a expressão ∇α0 (t) X fazer sentido, devemos entender o subescrito α0 (t) neste
sı́mbolo como qualquer extensão local do campo α0 (t) a um campo em M , já que pela Proposição 11.2 só
importa o valor da extensão em α (t), isto é, o vetor tangente α0 (t), e o valor de X em uma curva tangente
a α0 (t) em α (t), que pode ser tomada como sendo a própria curva α.
DV DV
Vamos provar primeiro a unicidade de . Suponha que exista um tal campo satisfazendo todas
dt dt
as propriedades do enunciado. Seja
V (t) = V j (t) ∂j |t
a expressão local do campo V . Pelas primeiras duas propriedades do enunciado, temos
dV j
DV j D∂j
= (t) ∂j |t + V (t) .
dt t dt dt t
Pela terceira propriedade,
dαi
D∂j
= ∇ α 0 (t) ∂j
t
= ∇ dα i ∂j = (t) ∇∂i ∂j |t .
dt t dt (t)∂i t dt
DV
Portanto, localmente o campo se escreve na forma
dt
k
dαi
DV dV k j
= (t) + (t) Γij (t) V (t) ∂k |t ,
dt t dt dt
DV
o que mostra que o campo é unicamente determinado.
dt
DV
Para determinar a existência de , dada uma carta (ϕ, U ) para uma vizinhança de α (t), defina o
dt
DV
campo em ϕ (U ) pela expressão (11.7); é imediato verificar que um campo definido desta forma satisfaz
dt
todas as propriedades do enunciado.
Rodney Josué Biezuner 122
DV
11.8 Definição. O campo diferenciável é chamado a derivada covariante de V ao longo da curva
dt
α.
∇Y X = 0
DV
Logo, a existência local do campo V (t) satisfazendo = 0 para todo t e V (t0 ) = V0 corresponde a uma
dt
solução do sistema linear de n equações diferenciais
dV 1 dαi
(t) Γ1ij (t) V j (t) = 0
(t) +
dt dt
..
.
n i
dV dα
n j
dt (t) + dt (t) Γij (t) V (t) = 0
τt : Tα(t0 ) M −→ Tα(t) M
τ0→0 = id,
τr→t ◦ τs→r = τs→t .
α1 (s) = α2 (s) = p,
α1 (t) = α2 (t) = q,
então em geral
α1 α2
τs→t (V ) 6= τs→t (V )
para todo V ∈ Tp M . Como veremos depois, o transporte paralelo será o mesmo, independente do caminho
utilizado para ir de p até q, se e somente se a curvatura riemanniana for nula.
(ii) Para todos os campos vetoriais V e W ao longo de qualquer curva diferenciável α em M vale
d DV DW
hV, W i = , W + V, . (11.10)
dt dt dt
(iii) Para todos os campos X, Y, Z ∈ T (M ) vale
para Tα(t0 ) M . Usando a Proposição 11.10, estenda cada um dos vetores E1 |t0 , . . . , En |t0 paralelamente a
campos E1 , . . . , En ao longo de α. Segue da definição de compatibilidade que
Bt = { E1 |t , . . . , En |t }
é uma base ortonormal para Tα(t) M para cada t ∈ I. Dados campos diferenciáveis V e W ao longo de α,
podemos então escrever
V = V i (t) Ei |t e W = W j (t) Ej |t
com as funções V i , W j diferenciáveis, pois
V i (t) = hV, Ei i e W j (t) = hW, Ej i .
Como os campos E1 (t) , . . . , En (t) são paralelos ao longo de α, temos
DE1 DEn
= ... = = 0,
dt dt
logo
dV i dV i
DV i DEi
= (t) Ei | t + V (t) = (t) Ei |t ,
dt t dt dt t dt
e, similarmente,
dW j
DW
= (t) Ej |t .
dt t
dt
Daı́,
dV i dW j
DV DW j i
,W + V, = Ei , W Ej + V Ei , Ej
dt dt dt dt
dV i j dW j
= W hEi , Ej i + V i hEi , Ej i
dt i dt
dW j
dV
= Wj + V i δij
dt dt
n n
dV i i i
i dW d X i i
X
= W +V = V W
i=1
dt dt dt i=1
d
= hV, W i .
dt
(ii) ⇒ (iii) Seja p ∈ M e α : I −→ M uma curva diferenciável com α (t0 ) = p e α0 (t0 ) = Xp . Então, por
definição de vetor tangente,
* + * +
d
DY DZ
Xp hY, Zi = Yα(t) , Zα(t) = , Zt + Yt ,
0 0
dt t=t0 dt t0
dt t0
= ∇α0 (t0 ) Y , Zt0 + Yt0 , ∇α0 (t0 ) Z
α(t0 ) α(t0 )
D E D E
= (∇X Y )p , Zp + Yp , (∇X Z)p .
Rodney Josué Biezuner 125
(iii) ⇒ (ii) Se V, W são campos ao longo de uma curva diferenciável α em M com α (t0 ) = p e α0 (t0 ) = Xp ,
então
d
hVt , Wt i = Xp hVt , Wt i
dt t=t0
D E D E
= (∇X V )p , Wt + Vt , (∇X W )p
= ∇α0 (t0 ) V , Wt0 + Vt0 , ∇α0 (t0 ) W
α(t0 ) α(t0 )
* + * +
DV DW
= , Wt0 + Vt0 , .
dt
t0 dt
t0
A condição hV, W i ≡ constante justifica o nome campos paralelos.
11.13 Definição. Seja M uma variedade métrica com uma conexão ∇. Dizemos que a conexão é com-
patı́vel com a métrica, quando ela satisfaz qualquer uma das condições da proposição anterior.
∇Y X = Y X k + Y i X j Γkij ∂k ,
[X, Y ] = X Y k − Y X k ∂k ,
Prova: Como
[∂i , ∂j ] = ∇∂i ∂j − ∇∂j ∂i = Γkij − Γkji ∂k
D (X, Y ) = ∇Y X − ∇Y X.
11.17 Teorema. Seja M uma variedade métrica. Então existe uma única conexão simétrica ∇ compatı́vel
com a métrica de M .
Prova: O lema anterior mostra como definir uma conexão simétrica compatı́vel com a métrica através da
expressão (11.16). Além disso, pelo lema, qualquer conexão simétrica compatı́vel com a métrica satisfará a
identidade (11.5), o que estabelece a unicidade.
11.18 Definição. Seja M uma variedade métrica. A única conexão simétrica ∇ compatı́vel com a métrica
de M é chamada a conexão métrica (ou conexão de Levi-Civita) de M .
Se M é uma variedade riemanniana, esta conexão é chamada conexão riemanniana, se M é uma
variedade semi-riemanniana, ela é chamada conexão semi-riemanniana e se M é uma variedade de
Lorentz, ela é chamada conexão de Lorentz.
Isometrias preservam conexões riemannianas, como esperado:
11.19 Proposição. Sejam (M, g) e (M f, ge) variedades métricas isométricas com conexões métricas ∇ e ∇,
e
respectivamente. Se F : M −→ M f é uma isometria, então
F∗ (∇X Y ) = ∇
e F X (F∗ Y )
∗
Mostraremos que ∇ é uma conexão métrica em M . A unicidade da conexão métrica garantirá então que
∇ = ∇,
o que provará o resultado. De fato, temos
h i
∇f X+gY Z = F∗−1 ∇ e F (f X+gY ) (F∗ Z)
∗
h i
= F∗−1 ∇ e F (f X+gY ) (F∗ Z)
∗
h i
= F∗−1 ∇ e (f ◦F −1 )F X+(g◦F −1 )F Y (F∗ Z)
∗ ∗
h i
= F∗−1 f ◦ F −1 ∇ e F X (F∗ Z) + g ◦ F −1 ∇
e F Y (F∗ Z)
∗ ∗
h i h i
= F∗−1 f ◦ F −1 ∇ e F X (F∗ Z) + F∗−1 g ◦ F −1 ∇
e F Y (F∗ Z)
∗ ∗
h i h i
= f F∗−1 ∇ e F X (F∗ Z) + gF∗−1 ∇
∗
e F Y (F∗ Z)
∗
= f ∇X Z + g∇Y Z,
h i
∇X (Y + Z) = F∗−1 ∇e F X F∗ (Y + Z)
∗
h i
= F∗−1 ∇e F X F∗ Y + ∇
∗
e F X F∗ Z
∗
h i h i
= F −1 ∇e F X F∗ Y + F −1 ∇
∗ ∗
e F X F∗ Z
∗ ∗
= ∇X Y + ∇ X Z
Rodney Josué Biezuner 128
e
h i
∇X (f Y ) = F∗−1 ∇ e F X F∗ (f Y )
∗
h i
= F∗−1 ∇ e F X (f F∗ Y )
∗
h i
= F∗−1 f ◦ F −1 ∇ e F X F∗ Y + (F∗ X) f ◦ F −1 F∗ Y
∗
h i
= F∗−1 f ◦ F −1 ∇ e F X F∗ Y + F −1 (F∗ X) f ◦ F −1 F∗ Y
∗ ∗
h i
= F∗−1 f ◦ F −1 ∇ e F X F∗ Y + (F∗ X) f ◦ F −1 F −1 (F∗ Y )
∗ ∗
h i
= f F∗−1 ∇ e F X F∗ Y + X f ◦ F −1 ◦ F F −1 (F∗ Y )
∗ ∗
= f ∇X Y + (Xf ) Y,
= F∗−1 [F∗ X, F∗ Y ]
= F∗−1 F∗ [X, Y ]
= [X, Y ] .
Observe que para provar que ∇ é uma conexão simétrica, foi suficiente usar o fato que F é um difeomorfismo.
Para estabelecer a compatibilidade de ∇ com a métrica de M é necessário usar o fato que F é uma
isometria. Com efeito, dados X, Y, Z ∈ T (M ), sejam V = F∗ Y e W = F∗ Z. Então temos
h∇X Y, Zi + hY, ∇X Zi
D h i E D h iE
= F∗−1 ∇ e F X (F∗ Y ) , F∗−1 W + F∗−1 V, F∗−1 ∇
∗
e F X (F∗ Z)
∗
D E D E
= ∇ e F X (F∗ Y ) , W + V, ∇
∗
e F X (F∗ Z)
∗
D E D E
= ∇ e F X (F∗ Y ) , F∗ Z + F∗ Y, ∇
∗
e F X (F∗ Z)
∗
= F∗ X hF∗ Y, F∗ Zi
= X hY, Zi .
isto é,
f = hY, Zi ◦ F −1 ;
assim, usando a propriedade
(F∗ X) f = X (f ◦ F ) ◦ F −1 ,
Rodney Josué Biezuner 129
temos
F∗ X hF∗ Y, F∗ Zi = X (f ◦ F ) ◦ F −1 = X hY, Zi ◦ F −1 ,
ou seja,
[h∇X Y, Zi + hY, ∇X Zi] (p) = [X hY, Zi] (p) .
11.20 Exemplo (Conexão Métrica em Rn ). A conexão euclidiana definida no Exemplo 11.4 é a conexão
riemanniana de En , é a conexão semi-riemanniana de Mnk e é a conexão de Lorentz do espaço de Minkowski
Mn . De fato, a conexão é compatı́vel com a métrica, pois se α : I −→ Rn é uma curva diferenciável e V, W
são campos ao longo de α induzidos pelos campos vetoriais X, Y , respectivamente, então segue da regra da
cadeia que
d
d d
Vα(t) , Wα(t) = Vα(t) , Wα(t) + Vα(t) , Wα(t)
dt dt dt
= dXα(t) (α (t)) , Wα(t) + Vα(t) , dYα(t) (α0 (t))
0
D E D E
= ∇α0 (t) X α(t) , Wα(t) + Vα(t) , ∇α0 (t) Y α(t)
* + * +
DV DW
= , Wα(t) + Vα(t) , .
dt α(t) dt α(t)
G−1 = g ij .
(11.17)
h∇∂i ∂j , ∂k i = Γm
ij gmk . (11.18)
Rodney Josué Biezuner 130
∇∂i ∂j = Γm
ij ∂m .
11.22 Lema. Seja M uma variedade métrica com uma conexão métrica ∇. Então
1
h∇∂i ∂j , ∂k i = (∂i gjk + ∂j gik − ∂k gij ) . (11.19)
2
Prova: Por (11.16) temos que
1
h∇∂i ∂j , ∂k i =(∂i h∂j , ∂k i + ∂j h∂i , ∂k i − ∂k h∂i , ∂j i − h∂i , [∂j , ∂k ]i − h∂j , [∂i , ∂k ]i + h∂k , [∂i , ∂j ]i)
2
1
= (∂j gik + ∂i gjk − ∂k gij ) ,
2
já que [∂m , ∂l ] = 0.
11.23 Proposição. Seja M uma variedade métrica com uma conexão métrica ∇. Então
1
Γkij = (∂i gjm + ∂j gim − ∂m gij ) g mk . (11.20)
2
Prova: Pelos lemas temos
1
glm Γlij = (∂i gjm + ∂j gim − ∂m gij ) .
2
Logo
n
1 X
g mk glm Γlij = (∂i gjm + ∂j gim − ∂m gij ) g mk .
2 m=1
O lado esquerdo desta equação é
g km gml Γlij = δlk Γlij = Γkij .
11.24 Corolário. Se ∇ é a conexão métrica de En , Mnk e Mn , então
Γkij = 0. (11.21)
Consequentemente,
n
X
X Y k ∂k
∇X Y = (11.22)
k=1
e
∇∂i ∂j = 0. (11.23)
Prova: Pois, como
k
gij = ηij ≡ constante,
segue que
∂k gij = 0
para todos os ı́ndices i, j, k.
Rodney Josué Biezuner 131
11.25 Corolário. Seja M uma variedade métrica com uma conexão métrica ∇. Então
e
∂k g ij = −g ip Γjpk − g pj Γipk . (11.25)
Prova: Para provar a primeira identidade, usando a compatibilidade da métrica temos
∂
∂k gij = h∂i , ∂j i = h∇∂k ∂i , ∂j i + h∂i , ∇∂k ∂j i
∂xk
D E
= hΓpki ∂p , ∂j i + ∂i , Γpkj ∂p
= Γpki h∂p , ∂j i + Γpkj h∂i , ∂p i
= Γpki gpj + Γpkj gip .
glp g pj = δlj ,
obtendo
glp ∂k g pj = − (∂k glp ) g pj .
Como
g il glp ∂k g pj = g il glp ∂k g pj
= δpi ∂k g pj
= ∂k g ij ,
= −g pj g il glm Γm il pj m
pk − g g gmp Γlk
il j p
= −g pj δm
i
Γm
pk − g δm Γlk
= −g pj Γipk − g il Γjlk .
f (t) = hτt (V ) , τt (W )i .
Rodney Josué Biezuner 132
B = {E1 , . . . , En }
é uma base ortonormal de Tα(t) M para todo t ∈ I. A orientação positiva de Bt segue por continuidade da
função determinante.
11.27 Proposição (Interpretação Geométrica da Derivada Covariante). Seja M uma variedade
métrica com uma conexão métrica ∇. Dado um campo X ∈ T (M ), seja α : I −→ M uma curva integral do
campo X passando por p, ou seja,
α (0) = p,
α0 (t) = X (α (t)) para todo t ∈ I.
Se Y ∈ T (M ), então
τt−1 Yα(t) − Yp
d −1
(∇X Y )p = lim = τ Yα(t) .
t→0 t dt t t=0
Prova: Seja B = {E1 , . . . , En } uma base ortonormal para Tp M . Pelo lema, Bt = {τt (E1 ) , . . . , τt (En )} é
uma base ortonormal de Tα(t) M para todo t ∈ I. Como a aplicação transporte paralelo é linear, se
segue que
τt−1 Yα(t) = Y i (t) Ei .
Logo,
dY i
d −1
τt Yα(t) = (0) Ei .
dt t=0 dt
Por outro lado, pela Proposição 11.7, temos também
D i
(∇X Y )p = Y (t) τt (Ei )
dt t=0
dY i
D
(0) τ0 (Ei ) + Y i (t)
= (τt (Ei ))
dt dt t=0
dY i
= (0) Ei ,
dt
já que os campos τt (E1 ) , . . . , τt (En ) são paralelos ao longo de α por definição.
Este resultado também vale para conexões gerais em variedades diferenciáveis, mas o resultado requer um
pouco mais de conhecimento de fibrados (veja [Dodson-Poston], Theorem 4.05, pp. 226–227).
Capı́tulo 12
Geodésicas
De agora em diante, sempre que nos referirmos a uma variedade métrica, estaremos supondo que ela está
munida da sua conexão métrica.
h (t) = at + b
Como
0
(γ ◦ h) (t) = h0 (t) γ 0 (h (t)) ,
kγ 0 (t)k ≡ constante,
133
Rodney Josué Biezuner 134
e, como acabamos de provar, uma condição necessária para que γ ◦ h seja uma geodésica é
(γ ◦ h)0 (t)
≡ constante,
concluı́mos que uma condição necessária para que a reparametrização γ ◦ h seja uma geodésica é que
h0 (t) ≡ constante,
ou seja,
h (t) = at + b
para algumas constantes a, b ∈ R. Além disso, escrevendo β (t) = γ ◦ h (t) = γ (at + b), segue que
Dβ 0 Dγ 0
(t) = a2 (at + b) = 0,
dt dt
logo γ ◦ h é uma geodésica.
12.3 Definição. Uma geodésica γ : I −→ M é normalizada (ou unitária) se
kγ 0 (t)k ≡ 1.
Toda geodésica que não é um ponto (ou seja, kγ 0 (t)k 6= 0) pode ser normalizada através de uma parame-
trização por comprimento de arco: se γ : I −→ M é uma parametrização qualquer para uma geodésica,
ela pode ser reparametrizada para se tornar uma geodésica normalizada escolhendo-se um ponto t0 ∈ I e
definindo o parâmetro comprimento de arco
Z t
s (t) = kγ 0 (t)k dt. (12.2)
t0
12.4 Teorema (Teorema de Existência e Unicidade de Geodésicas). Seja M uma variedade métrica.
Então para todos p ∈ M e v ∈ Tp M , e para cada t0 ∈ R, existe um intervalo aberto I ⊂ R contendo t0 e
uma única geodésica γ : I −→ M tal que γ (t0 ) = p e γ 0 (t0 ) = v.
Prova: Seja V uma vizinhança coordenada de p, com x1 , . . . , xn suas coordenadas. Pela expressão em
coordenadas locais da derivada covariante de um campo ao longo de uma curva obtida no capı́tulo anterior,
uma curva γ (t) = x (t) = x1 (t) , . . . , xn (t) é uma geodésica se e somente se as suas componentes satisfazem
o sistema de equações diferenciais ordinárias de segunda ordem não linear (quasilinear), chamado a equação
geodésica,
d2 xk i
k dx dx
j
+ Γ ij = 0, k = 1, . . . , n. (12.3)
dt2 dt dt
Este sistema de segunda ordem pode ser transformado num sistema de primeira ordem introduzindo as n
equações de primeira ordem
dxk
vk = , k = 1, . . . , n,
dt
de modo que estas equações juntamente com
dv k
+ Γkij v i v j = 0, k = 1, . . . , n,
dt
Rodney Josué Biezuner 135
formam um sistema de primeira ordem equivalente ao primeiro. O resultado segue então do teorema de
existência e unicidade para soluções de sistemas de equações diferenciais ordinárias de primeira ordem.
Note que este teorema permanece válido para geodésicas definidas em variedades diferenciáveis dotadas de
uma conexão não necessariamente métrica.
Isometrias preservam geodésicas:
12.5 Proposição. Sejam M, N variedades métricas isométricas e seja F : M −→ N uma isometria. Se
γ : I −→ M é uma geodésica de M tal que
γ (0) = p,
γ 0 (0) = v,
β (0) = F (p) ,
β 0 (0) = dFp (v) .
Prova: Segue imediatamente do fato de isometrias preservarem conexões métricas (Proposição 11.19) e da
regra da cadeia.
Γkij ≡ 0,
x (t) = tv + x0
g11 ≡ constante,
g12 = g21 = g 12 = g 21 = 0,
∂2 gij = 0.
Portanto,
1
Γ1ij = (∂i gj1 + ∂j gi1 − ∂1 gij ) g 11 ,
2
1 1
Γ2ij = (∂i gj2 + ∂j gi2 − ∂2 gij ) g 22 = (∂i gj2 + ∂j gi2 ) g 22 .
2 2
Logo,
1
Γ111 = (∂1 g11 + ∂1 g11 − ∂1 g11 ) g 11 = 0,
2
1
Γ112 = Γ121 = (∂1 g21 + ∂2 g11 − ∂1 g12 ) g 11 = 0,
2
1 1 1 1
Γ122 = (∂2 g21 + ∂2 g21 − ∂1 g22 ) g 11 = (−∂1 g22 ) g 11 = −2r2 sen φ cos φ 2 = − sen φ cos φ,
2 2 2 r
e
1
Γ211 = (∂1 g12 + ∂1 g12 ) g 22 = 0,
2
1 1 1 1 cos φ
Γ212 = Γ221 = (∂1 g22 + ∂2 g12 ) g 22 = (∂1 g22 ) g 22 = 2r2 sen φ cos φ 2
= ,
2 2 2 r sen2 φ sen φ
1
Γ222 = (∂2 g22 + ∂2 g22 ) g 22 = 0.
2
Apenas os sı́mbolos Γ212 = Γ221 e Γ122 são não nulos. Portanto a equação geodésica para a esfera é
2 1 2 2
d x + Γ122 dx dx = 0,
dt2
dt dt
2 2 1 2
d x + 2Γ2 dx dx = 0,
12
dt2 dt dt
ou seja, 2
d2 φ dθ
−
sen φ cos φ = 0,
dt2
dt
d2 θ cos φ dφ dθ
+2 = 0.
dt2 sen φ dt dt
Resolver este sistema de equações diferenciais não lineares acopladas não é fácil. Por outro lado, é fácil
verificar por substituição direta que o equador
φ = π/2,
θ = t,
Rodney Josué Biezuner 137
φ = t,
θ = θ0 ,
é uma solução para este sistema. Observe agora que rotações são isometrias da esfera: rotações do espaço
euclideano R3 são transformações ortogonais e portanto isometrias de R3 ; como a restrição de uma rotação
de R3 à esfera é uma rotação da esfera e esta tem a métrica induzida de R3 , ela é uma isometria da esfera.
Uma vez que geodésicas são preservadas por isometrias, concluı́mos que os grandes cı́rculos da esfera (isto
é, cı́rculos cujos centros são o centro da esfera, que podem também ser obtidos intersectando a esfera com
planos passando pela origem) são suas geodésicas, já que dado um ponto p da esfera e um vetor tangente v
à esfera neste ponto existe um grande cı́rculo passando por p com a direção de v.
12.8 Exemplo (Geodésicas de Sn ). Um argumento envolvendo isometrias pode ser usado para obter
diretamente que as geodésicas de Sn ⊂ Rn+1 são os grandes cı́rculos, sem passar pela equação geodésica.
Primeiramente, provamos que a geodésica γ (t) = x1 (t) , . . . , xn (t) , xn+1 (t) que passa pelo polo norte
γ (0) = en+1 com velocidade γ 0 (0) = e1 é o meridiano x2 = . . . = xn = 0. De fato, suponha por absurdo que
xi (t0 ) 6= 0 para algum t0 e para algum ı́ndice 2 6 i 6 n. Considere a isometria φ : Sn −→ Sn definida por
(φ é a restrição da transformação ortogonal correspondente de Rn+1 , logo é uma simetria da esfera, como
observado no final do exemplo anterior). Como isometrias preservam geodésicas e
g12 = g21 = g 12 = g 21 = 0,
∂1 gij = 0.
Rodney Josué Biezuner 138
Portanto,
1 1
Γ1ij = (∂i gj1 + ∂j gi1 − ∂1 gij ) g 11 = (∂i gj1 + ∂j gi1 ) g 11 ,
2 2
1
Γ2ij = (∂i gj2 + ∂j gi2 − ∂2 gij ) g 22 .
2
Logo,
1
Γ111 = (∂1 g11 + ∂1 g11 ) g 11 = 0,
2
1 1 1 2 1
Γ112 = Γ121 = (∂1 g21 + ∂2 g11 ) g 11 = (∂2 g11 ) g 11 = − 3 y2 = − ,
2 2 2 y y
1
Γ122 = (∂2 g21 + ∂2 g21 ) g 11 = 0,
2
e
1 1 1 2 1
Γ211 = (∂1 g12 + ∂1 g12 − ∂2 g11 ) g 22 = (−∂2 g11 ) g 22 = y2 = ,
2 2 2 y3 y
1
Γ212 = Γ221 = (∂1 g22 + ∂2 g12 − ∂2 g12 ) g 22 = 0,
2
1 1 1 2 1
Γ222 = (∂2 g22 + ∂2 g22 − ∂2 g22 ) g 22 = (∂2 g22 ) g 22 = − 3 y2 = − .
2 2 2 y y
A equação geodésica para o plano hiperbólico é
2
x00 − x0 y 0 = 0,
y
1 1
y 00 + (x0 )2 − (y 0 )2 = 0,
y y
Para resolver este sistema, consideraremos dois casos.
(i) Caso x0 = 0.
Neste caso, x (t) ≡ x0 , enquanto que y (t) satisfaz a equação
1 0 2
y 00 − (y ) = 0
y
que escrevemos na forma
2
yy 00 − (y 0 ) = 0
que é equivalente a 0
y0
= 0,
y
ou seja,
y 0 = ky
para alguma constante k ∈ R. A solução desta equação é
y (t) = y0 ekt
para alguma constante y0 > 0. Portanto, neste caso as geodésicas são γ (t) = x0 , y0 ekt , as semi-retas
superiores do plano hiperbólico.
(ii) Caso x0 6= 0.
Rodney Josué Biezuner 139
xx0 + yy 0 = ax0
12.12 Corolário. Seja M uma variedade riemanniana. Então, para cada p ∈ M existem uma vizinhança
V de (p, 0) em T M tal que π (V) = U é uma vizinhança coordenada de p em M , δ > 0 e uma aplicação
diferenciável
ϕ : (−δ, δ) × V −→ T U
tais que
ϕ(q,v) (t) = ϕ (t, q, v) : (−δ, δ) −→ T U
é a única trajetória do campo geodésico que satisfaz a condição inicial ϕ (0, q, v) = (q, v) para todo (q, v) ∈ V.
Prova: Basta aplicar o Teorema 12.10 ao campo geodésico, elemento de T (T M ), e ao ponto P = (p, 0) ∈
TM.
Uma reinterpretação do resultado acima que vai ser mais útil e fácil de usar na sequência:
12.13 Proposição. Seja M uma variedade riemanniana. Então, para cada p ∈ M existem uma vizinhança
V de p em M , δ, ε > 0 e uma aplicação diferenciável
γ : (−δ, δ) × V −→ M
onde
V = {(q, v) : q ∈ V e v ∈ Tq M, kvk < ε}
tais que
γ(q,v) (t) = γ (t, q, v) : (−δ, δ) −→ M
é a única geodésica de M que satisfaz as condições iniciais γ (0) = q, γ 0 (0) = v para todo q ∈ V e para todo
v ∈ Tq M tal que kvk < ε.
Este resultado afirma que se kvk < ε, a geodésica γ (t, q, v) existe no intervalo (−δ, δ). Podemos de fato
aumentar a velocidade da geodésica, mas ao preço de diminuir o seu intervalo de definição (e vice-versa).
Para isso basta reparametrizar a geodésica:
12.14 Proposição. Seja γ : (−δ, δ) −→ M uma geodésica tal que γ (0) = p e γ 0 (0) = v. Para qualquer
a > 0 a curva
β (t) = γ (at)
δ δ
é uma geodésica tal que β (0) = p e β 0 (0) = av definida no intervalo − , . Consequentemente,
a a
γ : (−2, 2) × V −→ M
onde
V = {(q, v) : q ∈ V e v ∈ Tq M, kvk < ε}
tais que
γ(q,v) (t) = γ (t, q, v) : (−2, 2) −→ M
é a única geodésica de M que satisfaz as condições iniciais γ (0) = q, γ 0 (0) = v para todo q ∈ V e para todo
v ∈ Tq M tal que kvk < ε.
Rodney Josué Biezuner 141
Assim,
v
expp (v) = γ (1, p, v) = γ ||v|| , p,
||v||
e geometricamente expp (v) é o ponto de M obtido percorrendo a partir de p a geodésica com velocidade
inicial v durante um intervalo de tempo unitário ou, equivalentemente, percorrendo a geodésica que parte de p
com velocidade unitária igual a v/ ||v|| um comprimento igual a kvk. Em particular, se γ : (−2, 2) × V −→ M
é a aplicação diferenciável dada pelo Corolário 12.15, a aplicação exponencial exp está definida em todo V e
para todo q ∈ V a aplicação exponencial
expq : Bε (0) ⊂ Tq M −→ M
Devido às propriedades especiais de coordenadas normais enumeradas na proposição a seguir, elas constituem
uma ferramenta vital em geometria riemanniana, como veremos em vários resultados nestas notas.
12.20 Proposição. Seja V uma vizinhança normal de p e x1 , . . . , xn coordenadas normais em p. Nestas
coordenadas vale
gij (p) = δij ,
∂gij
(p) = 0
∂xk
e
Γkij (p) = 0
para todos os ı́ndices i, j, k.
Além disso, para cada v ∈ Tp M , a geodésica γv (t) = γ (t, p, v) partindo de p com velocidade inicial v é
representada em coordenadas normais por um segmento radial, isto é,
de modo que
∂
= d expp 0 Ei = Ei ,
∂xi p
logo * +
∂ ∂
gij (p) = , = hEi , Ej i = δij .
∂xi p ∂xj p
O resultado sobre a geodésica γ segue do fato de que por definição
Γkij (p) v i v j = 0
Rodney Josué Biezuner 143
dV i
DV ∂
= (t0 ) .
dt t0 dt ∂xi p
Como coordenadas normais em p simplificam bastante as expressões locais de vários objetos diferenciais e
geométricos no ponto p, elas são muito usadas para obter resultados em geometria riemanniana que dependem
apenas da situação em p, facilitando os cálculos necessários.
Vamos agora mostrar que uma isometria é definida pela diferencial em um único ponto:
12.21 Proposição. Sejam M, N variedades riemannianas, com M conexa. Se F, G : M −→ N são isome-
trias tais que
F (p) = G (p) ,
dFp = dGp ,
então F = G.
Prova: Seja
A = {q ∈ M : F (q) = G (q)} .
Então A 6= ∅, pois p ∈ A, e por continuidade A é fechado. Como M é conexa, para provar o resultado basta
mostrar que A é aberto. Para isso, provaremos que se q0 ∈ A então qualquer vizinhança normal V de q0 está
contida em A. De fato, se q ∈ V , seja v ∈ Tq0 M tal que
F (q) = F (γv (1)) = γdFp (v) (1) = γdGp (v) (1) = G (γv (1)) = G (q) .
12.22 Definição. Uma curva diferenciável por partes em M é uma aplicação contı́nua γ : [a, b] −→ M
tal que existe uma partição do intervalo [a, b]
12.23 Definição. Seja γ : [a, b] −→ M uma curva diferenciável por partes. Uma variação de γ é uma
aplicação
F : (−ε, ε) × [a, b] −→ M
tal que
(i) F (0, t) = γ (t) ;
(ii) existe uma partição de [a, b] por pontos
DV DV
e .
dt ds
12.25 Lema (Lema de Simetria). Seja F : (−ε, ε) × [a, b] −→ M uma variação. Então
D ∂F D ∂F
= .
ds ∂t dt ∂s
Prova: Escrevendo F localmente em coordenadas na forma
∂ 2 xi ∂xi ∂xj
= ∂i + ∇∂i ∂j
∂t∂s ∂t ∂s
∂ 2 xi ∂xj ∂xi
= ∂i + ∇∂j ∂i
∂s∂t i ∂t ∂s
D ∂x
= ∂i
dt ∂s
D ∂F
= .
dt ∂s
No que se segue, identificaremos o espaço tangente a Tp M no vetor v com o próprio Tp M , isto é,
Tv (Tp M ) = Tp M . A fronteira ∂Bε (p) de uma bola geodésica é chamada uma esfera geodésica e denotada
Sε (p).
12.26 Lema (Lema de Gauss). Seja M uma variedade métrica, p ∈ M e v ∈ Tp M tal que expp (v) está
definido. Então D E
d expp v v, d expp v w = hv, wi
para todo w ∈ Tp M .
Em particular, as geodésicas radiais que partem de p são ortogonais às esferas geodésicas centradas em
p.
⊥
Prova: Decompondo Tp M = hvi + hvi , se w ∈ hvi então w = av para algum escalar a 6= 0. Temos
∂ expp d d
d expp v v = (v) = expp ((t + 1) v) = γ (1, p, (t + 1) v)
∂v dt t=0 dt t=0
d 0
= γ (t + 1, p, v) = γ(p,v) (1) ,
dt t=0
= a hv, vi
= hv, wi .
Rodney Josué Biezuner 146
⊥
Se w ∈ hvi , então hv, wi = 0 e para terminar a demonstração do lema temos que provar que
D E
d expp v v, d expp v w = 0.
Para algum ε > 0, considere a curva α : (−ε, ε) −→ Tp M com α (0) = v, α0 (0) = w e kα (s)k ≡ constante
= kwk, ou seja, α é um pequeno arco de cı́rculo centrado na origem de Tp M e raio kvk, começando em v e
com velocidade inicial w. Definimos uma variação F : (−ε, ε) × [0, 1] −→ M de γ por
Em particular, as curvas principais da variação Fs (t) são geodésicas, mais especificamente as geodésicas
radiais γ (1, p, tα (s)) = γ (t, p, α (s)) que passam por p com velocidade α (s). Uma variação F cujas curvas
principais são geodésicas é chamada uma variação geodésica.
Como
∂F
(s, t) = d expp tα(s) (α (s)) ,
∂t
∂F
(s, t) = d expp tα(s) (tα0 (s)) ,
∂s
segue que
∂F
(0, 1) = d expp v v,
∂t
∂F
(0, 1) = d expp v w,
∂s
Rodney Josué Biezuner 147
de modo que
D E ∂F ∂F
d expp v v, d expp v w = (0, 1) , (0, 1) .
p ∂t ∂s p
Mostraremos que
∂F ∂F
(0, 1) , (0, 1) =0
∂t ∂s p
pois
D ∂F
=0
dt ∂t
∂F
já que Fs (t) são geodésicas e é seu campo velocidade. Pelo Lema de Simetria,
∂t
∂F D ∂F ∂F D ∂F 1 ∂ ∂F ∂F
, = , = , .
∂t dt ∂s ∂t ds ∂t 2 ∂s ∂t ∂t
Mas
∂F
∂F
∂t (s, t)
=
∂t (s, 0)
= kα (s)k ≡ constante,
=
d expp (α (s))
0
e assim
∂ ∂F ∂F
, = 0.
∂t ∂t ∂s
Em particular, como
∂F
(0, 0) = 0,
∂s
concluı́mos que
∂F ∂F ∂F ∂F
, (0, 1) = , (0, 0) = 0.
∂t ∂s ∂t ∂s
12.28 Proposição (Geodésicas minimizam distâncias localmente). Sejam M uma variedade rieman-
niana, p ∈ M e B (p) uma bola normal centrada em p. Seja γ : [0, 1] −→ B (p) um segmento de geodésica
com γ (0) = p e denote q = γ (1).
Se α : [0, 1] −→ M é qualquer curva diferenciável por partes ligando p a q, então
` (γ) 6 ` (α) .
para t ∈ (0, 1], onde c é uma curva diferenciável por partes em Tp M com kc (t)k = 1 para todo t e r :
(0, 1] −→ R é uma função diferenciável por partes; de fato, basta considerar β (t) = exp−1
p (α (t)) e definir
β (t)
c (t) = e r (t) = kβ (t)k .
kβ (t)k
Se α retorna ao ponto p, de modo que β (t1 ) = 0 para algum t1 > 0, redefinimos c eliminando todo o
segmento α ([0, t1 ]), o que não prejudicará o resultado, pois mostraremos que a curva resultante ainda assim
possui comprimento maior que a geodésica. Denote
Daı́, Z 1 Z 1 Z 1
` (α) > kα0 (t)k dt > |r0 (t)| dt > r0 (t) dt = r (1) − r (ε) = ` (γ) − r (ε) .
ε ε ε
Fazendo ε → 0, como r (ε) −→ 0, segue o primeiro resultado.
Para que tenhamos ` (γ) = ` (α) é necessário que
∂F
= 0,
∂t
ou seja,
c0 (t) = 0
e portanto c ≡ constante. Como r0 (t) > 0, α é então uma reparametrização monótona de γ, donde α ([0, 1]) =
γ ([0, 1]).
Se α ([0, 1]) 6⊂ B (p) = Bρ (p), consideramos o primeiro instante t1 ∈ (0, 1] tal que α (t1 ) ∈ ∂B (p). Então,
` (α) > ` α|[0,t1 ] > ρ > ` (γ) .
O resultado vale apenas localmente: um segmento de geodésica suficientemente grande pode não ser mini-
mizante. Por exemplo, as geodésicas de uma esfera (cı́rculos maximais) que partem de um ponto p deixam
de ser minimizantes depois que passam pelo antı́poda de p.
Vale a recı́proca da Proposição 12.28 e ela é até mais forte. Antes uma definição e um resultado preliminar.
12.29 Definição. Seja M uma variedade riemanniana.
Se V é uma vizinhança em M que é uma vizinhança normal para todos os seus pontos, dizemos que V é
uma vizinhança totalmente normal.
Dizemos que uma vizinhança V em M é uma vizinhança uniformemente normal se existe δ > 0 tal
que para todo q ∈ V a bola geodésica Bδ (q) = expq (Bδ (0)) contém V .
Observe que em uma vizinhança uniformemente normal, dois pontos quaisquer da vizinhança são ligados por
uma geodésica radial. Toda vizinhança uniformemente normal é em particular totalmente normal.
12.30 Lema. Seja M uma variedade riemanniana. Para cada p ∈ M existe uma vizinhança W de p que é
uma vizinhança uniformemente normal.
Prova: Sejam ε > 0, V e V como na Proposição 12.13. Defina F : V −→ M × M por
F (q, v) = q, expq v .
Temos F (p, 0) = (p, p) e
I ∗
dF (p, 0) =
0 I
pois d expp 0 = I. Portanto, F é um difeomorfismo local em uma vizinhança de (p, 0), logo existe uma
vizinhança V0 ⊂ V de (p, 0) em T M tal que F aplica V0 difeomorficamente sobre uma vizinhança W 0 de (p, p)
em M × M . Para algum δ > 0, escolha V0 da forma
V0 = {(q, v) : q ∈ V 0 e v ∈ Bδ (0) ⊂ Tq M }
onde V 0 é uma vizinhança de p em M . Escolha a vizinhança W de p em M de tal forma que W × W ⊂ W 0 .
Então, para todo q ∈ W e Bδ (0) ⊂ Tq M temos
F ({q} × Bδ (0)) ⊃ {q} × W
o que implica, pela definição de F ,
Bδ (q) = expq (Bδ (0)) ⊃ W.
Rodney Josué Biezuner 150
12.31 Corolário (Curvas que minimizam distâncias são geodésicas). Seja M uma variedade rieman-
niana. Se α : [a, b] −→ M é uma curva diferenciável por partes com parâmetro proporcional ao comprimento
de arco que tem comprimento menor ou igual a qualquer outra curva diferenciável por partes ligando α (a)
a α (b), então α é uma geodésica.
Em particular, α é diferenciável em todo o intervalo [a, b].
Prova: Sejam t0 ∈ [a, b] e V uma vizinhança uniformemente normal de α (t0 ). Seja I = [t0 − δ, t0 + δ] ⊂ [a, b]
um intervalo fechado tal que α (I) ⊂ V . Então a restrição α|I é uma curva diferenciável por partes ligando
dois pontos de uma bola normal. Pela Proposição 12.28, ` (α|I ) é igual ao comprimento da geodésica
radial ligando α (t0 − δ) a α (t0 + δ) (caso contrário obterı́amos outra curva diferenciável por partes com
comprimento menor que α ligando α (a) a α (b), contrariando a hipótese). Segue da mesma proposição que
a imagem de α|I é a imagem desta geodésica. Como α|I está parametrizada por um parâmetro proporcional
ao comprimento de arco, segue que α|I é ela própria uma geodésica.
Observe que este resultado é global, não apenas local: dados dois pontos quaisquer de uma variedade
riemanniana, se existir uma curva ligando eles que minimiza distâncias, então ela é uma geodésica. Por outro
lado, dados dois pontos arbitrários em uma variedade riemanniana pode não existir nenhuma geodésica que
os ligue: considere Rn com a bola centrada em zero e raio 1 removida; para δ > 0 suficientemente pequeno,
não existe nenhuma geodésica que une os pontos
(−1 − δ, 0, . . . , 0) e (1 + δ, 0, . . . , 0) ,
por exemplo, e esta afirmação vale para quaisquer dois pontos antı́podas muito próximos ao bordo da bola
removida.
12.32 Exemplo (Geodésicas de H 2 usando isometrias). Como no Exemplo 12.8, para determinar as
geodésicas do plano hiperbólico usaremos isometrias.
Primeiramente, usando o Corolário 12.31 mostraremos que o semieixo y superior é uma geodésica. De
fato, seja γ (t) = (0, t), t > 0, uma parametrização por comprimento de arco deste semieixo e considere um
segmento γ|[a,b] . Temos
Z b Z b
1
` (γ) = kγ 0 (t)kγ(t) dt = dt = log b − log a.
a a t
Se c : [a, b] −→ H2 , c (t) = (x (t) , y (t)) , é qualquer curva diferenciável por partes com c (a) = γ (a) = (0, a)
e c (b) = γ (b) = (0, b), então
q q
Z b Z b [x0 (t)]2 + [y 0 (t)]2 Z b [y 0 (t)]2 Z b 0
y (t)
` (c) = kc0 (t)kc(t) dt = dt > dt = dt = ` (γ) .
a a y (t) a y (t) a y (t)
Observe que, diferentemente da esfera, variedade compacta, esta geodésica de H2 tem comprimento infinito,
como as retas do plano R2 .
As isometrias do plano hiperbólico são dadas pelas transformações de Möbius
az + b
T (z) = , ad − bc = 1,
cz + d
onde z = x + iy ∈ C. Estas isometrias transformam o semieixo y em semicı́rculos superiores ou em semi-retas
superiores x = x0 , y > 0. Estas são as geodésicas de H2 , pois por todo ponto p ∈ H2 passa um tal semicı́rculo
ou uma tal semi-reta, em todas as direções possı́veis. A demonstração de todos estes detalhes é deixada ao
leitor (Exercı́cio 12.54).
garante que esta geodésica esteja contida em W (as duas geodésicas radiais, uma partindo de q1 e outra
partindo de q2 podem se ligar através de um ponto p fora de W ⊂ Bδ (q1 ) ∪ Bδ (q2 ).
12.33 Definição. Seja M uma variedade riemanniana. Dizemos que uma vizinhança V em M é uma
vizinhança convexa se para todos os pontos p, q ∈ V existe uma única geodésica minimizante ligando p a
q cuja imagem está inteiramente contida em V .
O raio de uma bola geodésica pode ser escolhido de tal forma que ela se torne convexa.
12.34 Lema. Seja M uma variedade riemanniana. Para todo p ∈ M existe R > 0 tal que qualquer geodésica
de M que é tangente à esfera geodésica Sr (p) de raio r < R em q ∈ M está fora da bola geodésica Br (p)
numa vizinhança de q.
Prova: Seja V uma vizinhança totalmente normal de p. Restringindo convenientemente o intervalo de
definição, podemos assumir que todas as geodésicas de V tem velocidade 1. Podemos portanto nos restringir
ao fibrado tangente unitário
T1 V = {(q, v) ∈ T M : q ∈ V , v ∈ Tq M e kvk = 1} .
Seja γ : (−ε, ε) × T1 V −→ M a aplicação diferenciável tal que γ (t, q, v) é a geodésica que no instante t = 0
passa por q com velocidade v, kvk = 1. Definimos
u (t, q, v) = exp−1
p (γ (t, q, v))
e F : (−ε, ε) × T1 V −→ R por
2
F (t, q, v) = ku (t, q, v)k ,
ou seja, F mede o quadrado da distância (medida em Tp M , não na variedade M ) à origem de um ponto que
se desloca sobre a geodésica γ. Temos
∂F ∂u
= 2 u, ,
∂t ∂t
2
∂2F ∂2u
∂u
2
= 2 u, 2 + 2
∂t
.
∂t ∂t
Seja agora r > 0 tal que Br (p) = expp Br (0) ⊂ V e γ uma geodésica tangente à esfera geodésica no ponto
q = γ (0, q, v). Pelo lema de Gauss,
∂u
u (0, q, v) , (0, q, v) = 0
∂t
já que γ (t, q, v) é uma geodésica radial que parte de q. Em particular,
∂F
(0, q, v) = 0.
∂t
Se mostrarmos que para r suficientemente pequeno o ponto crı́tico (0, q, v) de F é um mı́nimo estrito, de
modo que os pontos de γ estão a uma distância de p maior que r, a demonstração estará concluı́da.
Para provar isso, basta observar que para q = p temos u (t, p, v) = tv e portanto
∂2F 2
(0, p, v) = 2 kvk = 2,
∂t2
logo existe uma vizinhança W ⊂ V de p tal que
∂2F
(0, q, v) > 0
∂t2
para todo q ∈ W . Escolha R > 0 tal que Br (p) = expp BR (0) ⊂ W . Então, se r < R, F tem um mı́nimo
estrito em (0, q, v).
Rodney Josué Biezuner 152
12.35 Proposição. Seja M uma variedade riemanniana. Para todo p ∈ M existe ε > 0 tal que a bola
geodésica Bε (p) é convexa.
Prova: Seja R > 0 como no lema. Escolha W e δ < 0 como no Lema 12.30 com δ < R/2. Tome ε < δ tal
que Bε (p) ⊂ W . Afirmamos que Bε (p) é convexa.
De fato, sejam q1 , q2 ∈ B ε (p) e γ a única geodésica minimizante de comprimento menor que 2ε < 2δ < R
ligando q1 a q2 ; em particular, γ está contida na bola BR (p). Suponha por absurdo que o interior de γ não
está contido em Bε (p). Então existe um ponto q no interior de γ onde a distância máxima r < R de p a
γ é atingida. Logo γ é tangente à esfera geodésica Sr (p) em q, mas os pontos de γ numa vizinhança de q
estarão no fecho de Br (p), contradizendo o lema.
ou seja, o seu comprimento é o seu tempo próprio. O mesmo vale para curvas em variedades de Lorentz,
isto é, curvas no espaçotempo curvo.
Da Proposição 12.2 segue no entanto que geodésicas sempre são ou do tipo luz, ou do tipo espaço ou do
tipo tempo.
12.37 Lema. Sejam M uma variedade de Lorentz e p ∈ M . Seja α : [0, T ] −→ M uma curva diferenciável
por partes do tipo tempo com α (0) = p, tal que
β = exp−1
p ◦α : I −→ Tp M
está definida. Então β é uma curva do tipo tempo que está contida em um único cone temporal de Tp M .
Em particular, β não tem autointerseções.
Rodney Josué Biezuner 153
Prova: Provaremos o resultado apenas no caso em que β é diferenciável, o caso mais geral ficando como
exercı́cio (ou veja [ONeill], Lema 5.33, p. 146). Note que β (0) = 0.
O Lema de Gauss garante que β é uma curva do tipo tempo em Tp M : de fato, como
0
α0 (t) = expp ◦β (t) = d expp β(t) β 0 (t) ,
e portanto β é uma curva do tipo tempo em Tp M se e somente se α é uma curva do tipo tempo em M .
Seja C o cone temporal de Tp M tal que β 0 (0) ∈ C. Como a função
é contı́nua e f (0) < 0, segue que f (t) < 0 para todo t ∈ [0, ε) se ε > 0 é suficientemente pequeno, de modo
que β 0 ([0, ε)) ⊂ C pela Proposição 2.25. Além disso, pela fórmula de Taylor,
β (t) = β 0 (0) t + O t2 ,
de modo que
hβ (t) , β (t)i = hβ 0 (0) , β 0 (0)i t2 + O t3 ,
donde β (t) é um vetor do tipo tempo para todo t ∈ [0, ε) (diminuindo ε, se necessário); analogamente, temos
de modo que
hβ (t) , β 0 (0)i < 0
para todo t ∈ [0, ε) (diminuindo ε, se necessário) e portanto β ([0, ε)) ⊂ C. Portanto, β (t) e β 0 (t) estão no
mesmo cone temporal para todo t ∈ [0, ε), isto é,
é negativa e estritamente decrescente para t ∈ (0, ε), pois g 0 (t) < 0. Mas o mesmo argumento acima permite
concluir que enquanto a curva β permanecer no cone C, β (t) será do tipo tempo, β (t) e β 0 (t) estarão no
mesmo cone temporal e portanto (12.10) valerá. Segue que nunca teremos g (t) = 0, isto é, a curva β nunca
cruzará a fronteira do cone temporal C.
Observe que o resultado acima não impede uma curva do tipo tempo em uma variedade de Lorentz de possuir
autointerseções, pois se a imagem de uma tal curva não está inteiramente contida na imagem da aplicação
exponencial expp para algum ponto p, ela pode ter autointerseções fora de expp (Tp M ). Fisicamente, uma
partı́cula que percorresse tal trajetória estaria viajando no tempo para o passado. Existem variedades,
mesmo riemannianas que não são cobertas por expp (Tp M ) para nenhum p ∈ M ; tais variedades são cha-
madas variedades não completas (veja a Seção 12.9 para mais detalhes). E existem exemplos de modelos
de espaçotempos para o universo que admitem curvas do tipo tempo com autointerseções (os primeiros tais
modelos foram obtidos por Gödel).
12.38 Proposição (Geodésicas do tipo tempo em Variedades de Lorentz maximizam distâncias
localmente). Sejam M uma variedade de Lorentz, p ∈ M , V uma vizinhança normal de p e q ∈ V . Se
existir uma curva do tipo tempo em V ligando p a q, então existe uma geodésica radial do tipo tempo em V
ligando p a q e além disso ela é a única curva do tipo tempo com comprimento maximal ligando p a q.
Rodney Josué Biezuner 154
Prova: Seja α uma curva do tipo tempo ligando p a q. Pelo lema, β = exp−1 p ◦α está contida em um único
cone temporal de Tp M . Portanto, o segmento radial L (t) = tx0 , t ∈ [0, 1], que liga 0 a v = exp−1 p q está
neste mesmo cone temporal. Segue que a geodésica radial γ (t) = expp (L (t)) que liga p a q é do tipo tempo
pelo Lema de Gauss.
O argumento para provar o restante do teorema é uma modificação da demonstração da Proposição 12.28,
a seguir.
Como na demonstração daquela proposição, escrevemos α (t) de forma única em coordenadas polares na
forma
α (t) = expp (r (t) c (t))
para t ∈ (0, 1], onde c é uma curva diferenciável por partes em Tp M com hc (t) , c (t)i = −1 para todo t, já
que β é do tipo tempo, e r : (0, 1] −→ R é uma função diferenciável por partes, e definimos
Como
2
− |r0 (t)| 6 hα0 (t) , α0 (t)i < 0,
segue que
kα0 (t)k = |hα0 (t) , α0 (t)i| 6 |r0 (t)| .
Rodney Josué Biezuner 155
r0 (t) > 0;
de fato, se a curva voltasse sobre si mesma, seu vetor velocidade seria do tipo luz em algum momento. Daı́,
Z 1 Z 1 Z 1
` (α) = lim kα0 (t)k dt 6 lim |r0 (t)| dt = lim r0 (t) dt = ` (γ) .
ε→0 ε ε→0 ε ε→0 ε
Como em variedades riemannianas, todo ponto de uma variedade de Lorentz possui uma vizinhança
convexa (de fato, este resultado é verdadeiro para qualquer variedade métrica). A demonstração deste
resultado é exatamente igual à do Lema 12.34 e Proposição 12.35. Note que na demonstração daquele lema,
a função distância pode ser tomada como a função distância euclideana nas coordenadas normais de Tp M ,
não a função distância da variedade riemanniana (isto é, não consideramos a métrica de Lorentz de Tp M ; se
desejar, veja a demonstração detalhada em [ONeill], Cap. 5, Proposição 7, p. 103). Enunciamos o resultado
explicitamente para futura referência:
12.39 Proposição. Seja M uma variedade de Lorentz. Para todo p ∈ M existe ε > 0 tal que a bola geodésica
Bε (p) é convexa.
dist (p, q) = inf {` (c) : c é uma curva diferenciável por partes ligando p e q} .
12.41 Proposição. Se existe uma geodésica minimizante ligando p e q, então dist (p, q) = ` (γ).
Prova: Segue do Corolário 12.31.
12.42 Proposição. Seja M uma variedade riemanniana conexa. Com a função distância definida acima,
M é um espaço métrico.
Além disso, a topologia de M como espaço métrico coincide com a topologia inicial de M como variedade
diferenciável.
Prova: De fato, a função distância satisfaz as três propriedades da função distância de um espaço métrico:
(i) Simetria:
dist (p, q) = dist (q, p) .
(ii) Desigualdade triangular:
dist (p, q) 6 dist (p, r) + dist (r, q) .
(iii) Positividade:
dist (p, q) > 0
e
dist (p, q) = 0 se e somente se p = q.
Todas as propriedades seguem imediatamente da definição (a desigualdade triangular segue da definição de
ı́nfimo) exceto a afirmação que dist (p, q) = 0 implica p = q. Suponha o contrário e considere uma bola
normal Bε (p) que não contém q. Como dist (p, q) = 0, existe uma curva c ligando p a q com comprimento
menor que ε, contradizendo a Proposição 12.28.
Rodney Josué Biezuner 156
Pela Proposição 12.41, se existir uma geodésica minimizante γ ligando p e q então dist (p, q) = ` (γ). Em
particular, dado p ∈ M , se ε > 0 é suficientemente pequeno, a bola geodésica Bε (p) de raio ε coincide com
a bola métrica de centro em p e raio ε definida pela função distância:
Logo, bolas geodésicas contem bolas métricas e vice-versa, portanto as topologias são as mesmas.
De agora em diante, consideraremos variedades riemannianas também como espaços métricos com a noção
de distância definida acima.
12.44 Lema. Seja M uma variedade riemanniana conexa. Se expp está definida em todo Tp M , então
qualquer ponto q ∈ M pode ser ligado a p por um segmento geodésico γ tal que
Prova: Seja r = dist (p, q). Tome uma bola geodésica fechada B δ (p). Se q ∈ B δ (p), então existe uma
geodésica radial minimizante ligando p a q e não há nada a provar. Se q ∈ / B δ (p), lembrando que a função
distância é contı́nua e esferas geodésicas são conjuntos compactos, seja x0 ∈ Sδ (p) = ∂B δ (p) onde a função
atinge um mı́nimo em Sδ (p). Seja γ (s) = expp (sV ) a geodésica radial unitária ligando p a x0 . Por hipótese,
γ está definida para todo t ∈ R. Para provar o lema, basta mostrar que
γ (r) = q.
A é fechado em [0, r] pela continuidade da função distância e de γ. Se provarmos que para todo s0 ∈ A vale
s0 + ε ∈ A para todo ε > 0 suficientemente pequeno, isso implicará que A também é aberto no conjunto
conexo [0, r] e portanto A = [0, r]; em particular, r ∈ A, o que implica dist (γ (r) , q) = r − r = 0, o que é
equivalente a γ (r) = q.
Rodney Josué Biezuner 157
Seja então s0 ∈ A e considere uma bola geodésica fechada B ε (γ (s0 )). Temos
atinge um mı́nimo em Sε (γ (s0 )). Para provar a afirmação, basta então mostrar que y0 = γ (s0 + ε), pois
neste caso
r − s0 = ε + dist (γ (s0 + ε) , q) ,
donde
dist (γ (s0 + ε) , q) = r − (s0 + ε) .
De fato, temos
dist (p, y0 ) > dist (p, q) − dist (q, y0 ) = r − [r − (s0 + ε)] = s0 + ε.
Por outro lado, a curva quebrada que liga p a y0 constituida do segmento geodésico γ que vai de p a γ (s0 )
e do raio geodésico que vai de γ (s0 ) a y0 tem comprimento s0 + ε. Portanto,
dist (p, y0 ) = s0 + ε
e esta curva quebrada é uma geodésica (logo, não é quebrada), donde y0 = γ (s0 + ε), o que termina a
demonstração.
12.45 Teorema (Teorema de Hopf-Rinow). Uma variedade riemanniana conexa é geodesicamente com-
pleta se e somente se ela é completa como um espaço métrico.
Prova:
1. M variedade riemanniana completa como espaço métrico =⇒ M variedade riemanniana geodesicamente
completa.
Rodney Josué Biezuner 158
Suponha por absurdo que exista uma geodésica unitária γ : [0, a) −→ M que não se estende a um
intervalo [0, a + ε) para nenhum ε > 0. Seja {ti } uma sequência crescente tal que ti → a; em particular, {ti }
é uma sequência de Cauchy. Seja qi = γ (ti ). Como γ é parametrizada por comprimento de arco, segue que
e (qi ) é uma sequência de Cauchy em M . Logo qi → q ∈ M . Seja V uma vizinhança uniformemente normal
de q e δ > 0 tal que V está contido em qualquer bola geodésica de raio δ centrada em um ponto de V .
Para j suficientemente grande temos qj ∈ V e tj > a − δ. O fato que Bδ (qj ) é uma bola geodésica implica
que toda geodésica partindo de qj existe por um intervalo de tempo pelo menos igual a δ. Em particular
isso vale para a geodésica σ satisfazendo σ (0) = qj e σ 0 (0) = γ 0 (tj ). Por unicidade de geodésica, esta é
e (t) = σ (t − tj ) é uma extensão de γ além de a,
uma reparametrização de γ, isto é, σ (t) = γ (t + tj ), logo γ
contradizendo a hipótese inicial.
2. M variedade riemanniana geodesicamente completa =⇒ M espaço métrico completo.
Para provar a recı́proca, demonstraremos um resultado mais forte:
Se existe p ∈ M tal que expp está definida em todo Tp M , então M é um espaço métrico completo.
Seja {qi } ⊂ M uma sequência de Cauchy. Para cada i, seja γi (s) = expp (sVi ) a geodésica radial unitária
que liga p a qi , e seja
di = dist (p, qi ) ,
de modo que pelo lema
qi = expp (di Vi ) .
Além disso, {di } é uma sequência de Cauchy em R, pois
Como sequências de Cauchy são limitadas, {di } é limitada; além disso kVi k = 1 para todo i, logo {di Vi }
é limitada em Tp M . Portanto, uma subsequência {dik Vik } converge para V ∈ Tp M . Por continuidade da
aplicação exponencial,
qik = expp (dik Vik ) → expp (V ) .
Como a sequência original {qi } é de Cauchy, ela converge para o mesmo ponto para o qual sua subsequência
converge.
Em particular, o conceito de variedade riemanniana geodesicamente completa é equivalente ao conceito de
variedade riemanniana completa como espaço métrico para variedades conexas e para estas podemos nos
referir simplesmente a uma variedade riemanniana completa, implicando ambos os conceitos.
12.46 Corolário. Toda variedade riemanniana compacta é geodesicamente completa.
12.48 Corolário. Os conjuntos fechados e limitados de uma variedade riemanniana conexa são compactos
se e somente se ela é geodesicamente completa.
Prova: Seja A ⊂ M fechado e limitado. Como A é limitado, A está contido em uma bola métrica B (p; r).
Pelo Lema 12.44, existe uma bola BR (0) ⊂ Tp M tal que
B (p; r) ⊂ expp BR (0) = BR (p).
Rodney Josué Biezuner 159
A bola geodésica fechada BR (p) é compacta, pois é a imagem de um compacto pela aplicação contı́nua expp .
Logo, A é um subconjunto fechado de um compacto, portanto é compacto.
Reciprocamente, a condição de conjuntos fechados limitados serem compactos em um espaço métrico
implica que o espaço métrico é completo: sequências de Cauchy são limitadas, logo seu fecho é compacto e
portanto possuem uma subsequência convergente, o que implica para sequências de Cauchy que a sequência
toda é convergente.
12.49 Corolário. Se M é uma variedade riemanniana conexa e existe p ∈ M tal que expp está definida em
todo Tp M então M é geodesicamente completa.
Prova: Segue da demonstração do teorema de Hopf-Rinow.
12.50 Corolário. Se M é uma variedade riemanniana conexa completa, então quaisquer dois pontos p, q ∈
M podem ser ligados por um segmento geodésico γ tal que
L : T M −→ R.
No Cálculo de Variações, procura-se encontrar um método para determinar curvas α que minimizam o
funcional ação; isto é chamado o princı́pio da ação mı́nima.
Prova: Vamos considerar primeiro o caso M = Rn para compreender melhor a idéia da demonstração. Seja
β : [a, b] −→ Rn uma curva diferenciável arbitrária satisfazendo β (a) = β (b) = 0 e considere a seguinte
variação de γ
F (s, t) = γ (t) + sβ (t) .
Denotando
αs (t) = F (s, t)
considere a função diferenciável real f : (−ε, ε) −→ R definida por
Z b
f (s) = S (αs ) = L (αs (t) , α̇s (t)) dt.
a
f 0 (0) = 0.
Já que
dαs
= β (t) ,
ds
dα̇s
= β̇ (t) ,
ds
segue que
Z b
∂L ∂L
f 0 (s) = (αs , α̇s ) β i
+ (αs , α̇s ) β̇ i
dt.
a ∂xi ∂v i
Por outro lado, integrando por partes, temos
Z b b Z b Z b
∂L i ∂L i d ∂L i d ∂L
(αs , α̇s ) β̇ dt = β − (αs , α̇s ) β dt = − (αs , α̇s ) β i dt,
a ∂v i ∂v i a a dt ∂v i a dt ∂v i
de modo que
Z b
∂L d ∂L
f 0 (s) = (αs , α̇s ) − (αs , α̇s ) β i dt.
a ∂xi dt ∂v i
Agora, f 0 (0) = 0 implica
Z b
∂L d ∂L
(γ, γ̇) − (γ, γ̇) β i dt = 0
a ∂xi dt ∂v i
Como β é arbitrária, segue que
∂L d ∂L
(γ, γ̇) − (γ, γ̇) =0
∂xi dt ∂v i
para todo i.
Em uma variedade riemanniana (M, g) existem dois lagrangianos associados de forma natural:
L (p, v) = kvkp ,
2
E (p, v) = kvkp .
Rodney Josué Biezuner 161
É mais fácil trabalhar com o funcional energia, já que o lagrangiano da energia não apresenta problemas de
diferenciabilidade na origem. Além disso, um mı́nimo para o funcional energia é um mı́nimo para o funcional
comprimento, pois a desigualdade de Cauchy-Schwartz implica que
!1/2 !1/2
b b b √
Z Z Z
2 1/2
L (α) = 0
kα (t)kp dt 6 kα 0
(t)kp dt 1 dt = b − aE (α) .
a a a
E x1 , . . . , xn , v 1 , . . . , v n = gij x1 , . . . , xn v i v j ,
e ao longo de uma curva α (t) = x1 (t) , . . . , xn (t) ele é dado por
1
dxn dxi dxj
1 n dx
E x ,...,x , ,..., = gij x1 , . . . , xn .
dt dt dt dt
Logo,
∂E ∂gij dxi dxj
= ,
∂xk ∂xk dt dt
enquanto que
∂E dxi
k
= 2gik .
∂v dt
de modo que, pela regra da cadeia, segue que
transforma-se na equação
d2 xi dxi dxj
∂gik ∂gik ∂gij
δim 2 + j
+ j
− k
g mk = 0,
dt ∂x ∂x ∂x dt dt
d2 xm dxi dxj
2
+ Γm
ij = 0.
dt dt dt
12.11 Exercı́cios
12.54 Exercı́cio. Mostre que as transformações de Möbius introduzidas no Exemplo 12.32 são isometrias
do plano hiperbólico e complete os outros detalhes.
12.55 Exercı́cio. Mostre que M é geodesicamente completa se e somente se para todo p ∈ M a aplicação
exponencial está definida em todo Tp M.
Capı́tulo 13
Curvatura
T : T1 (M ) × . . . × T1 (M ) × T 1 (M ) × . . . × T 1 (M ) −→ C ∞ (M ) (13.1)
definindo
T X1 , . . . , Xk , ω 1 , . . . , ω l (p) = Tp X1 |p , . . . , Xk |p , ω 1 p , . . . , ω l p .
(13.2)
para todo p ∈ V , de modo que nesta base coordenada o campo tensorial T se escreve na forma
Tp = Tij11,...,i
,...,jl
(p) dxi1 p ⊗ . . . ⊗ dxik p ⊗ ∂j1 |p ⊗ . . . ⊗ ∂jl |p ,
k
Xr |p = X ir (p) ∂ir |p , r = 1, . . . , k,
ω s |p = ωjs (p) dxjs p , s = 1, . . . , l,
temos
T X1 , . . . , Xk , ω 1 , . . . , ω l (p) = X i1 . . . X ik ωj1 . . . ωjl Tij11,...,i
,...,jl
k
(p) . (13.3)
Ou seja, o valor de T X1 , . . . , Xk , ω 1 , . . . , ω l em p depende apenas das componentes do campo tensorial
T em p e dos valores dos campos vetoriais e de 1-formas em p. Neste sentido, dizemos que tensores são
puntuais. Contraste isso com uma conexão, que não é um tensor porque ao invés da linearidade satisfaz a
regra do produto.
163
Rodney Josué Biezuner 164
j ∂ j ∂
∇X ∇Y Z − ∇Y ∇X Z = X (∇Y Z) − Y (∇X Z)
∂xj ∂xj
∂ ∂
= X Y Zj − Y X Zj
∂xj ∂xj
∂
= X Y Zj − Y X Zj
∂xj
∂
= (XY − Y X) Z j
∂xj
= ∇[X,Y ] Z.
Esta relação é válida para qualquer variedade métrica localmente isométrica a Rn (Exercı́cio 13.39).
13.1 Definição. Seja M uma variedade métrica. O endomorfismo curvatura de M é o campo tensorial
de ordem (3, 1)
R : T (M ) × T (M ) × T (M ) −→ T (M )
definido por
R (X, Y ) Z = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z. (13.4)
Observamos que alguns autores, tais como [Carmo], definem a curvatura com o sinal oposto, mas a maioria
define como acima. O fato de termos identificado R com um tensor do tipo (3, 1) segue da Proposição 9.19
e pelo fato de R ser multilinear sobre C ∞ (M ), conforme é demonstrado na proposição a seguir. Em outras
palavras, R é identificado com o campo tensorial
R : T1 (M ) × T1 (M ) × T1 (M ) × T 1 (M ) −→ R
definido por
R (X, Y, Z, ω) = ω (R (X, Y ) Z) .
Uma motivação extra para a definição do tensor curvatura pode ser vista no apêndice no final deste capı́tulo.
R (X, f Y ) Z = ∇X ∇f Y Z − ∇f Y ∇X Z − ∇[X,f Y ] Z
= ∇X (f ∇Y Z) − f ∇Y ∇X Z − ∇f [X,Y ]+(Xf )Y Z
= f ∇X ∇Y Z + (Xf ) ∇Y Z − f ∇Y ∇X Z − f ∇[X,Y ] Z − (Xf ) ∇Y Z
= f ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z
= f R (X, Y ) Z.
A linearidade em relação à primeira variável é imediatamente estabelecida uma vez que se observa que
De fato,
R (Y, X) Z = ∇Y ∇X Z − ∇X ∇Y Z − ∇[Y,X] Z
= −∇X ∇Y Z + ∇Y ∇X Z − ∇−[X,Y ] Z
= −∇X ∇Y Z + ∇Y ∇X Z + ∇[X,Y ] Z
= −R (X, Y ) Z.
R (X, Y ) (f Z) = ∇X ∇Y (f Z) − ∇Y ∇X (f Z) − ∇[X,Y ] (f Z)
= ∇X (f ∇Y Z) + ∇X ((Y f ) Z) − ∇Y (f ∇X Z) − ∇Y ((Xf ) Z)
− f ∇[X,Y ] Z − [X, Y ] (f ) Z
= f ∇X ∇Y Z + (Xf ) ∇Y Z + (Y f ) ∇X (Z) + X (Y f ) Z
− f ∇Y ∇X Z − (Y f ) ∇X Z − (Xf ) ∇Y Z − Y (Xf ) Z
− f ∇[X,Y ] Z − [X, Y ] (f ) Z
= f ∇X ∇Y Z − f ∇Y ∇X Z + [X (Y f ) − Y (Xf )] Z − f ∇[X,Y ] Z − [X, Y ] (f ) Z
= f ∇X ∇Y Z − f ∇Y ∇X Z − f ∇[X,Y ] Z + [Y, X] (f ) Z − [X, Y ] (f ) Z
= f ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z
= f R (X, Y ) Z.
∇∂ i ∇∂ j = ∇∂ j ∇∂ i . (13.7)
Rodney Josué Biezuner 166
Prova: Na introdução a esta seção vimos que R ≡ 0 para Rn (de fato, foi o que nos levou a definir R em
primeiro lugar; este resultado é trazido aqui apenas para referência e ênfase). Como [∂i , ∂j ] = 0, segue que
Prova: Vamos mostrar que se R = 0 então M é localmente isométrica a Rn , já que a recı́proca é óbvia (a
curvatura é um invariante isométrico local; Exercı́cio 13.39).
Dado p ∈ M , escolha uma base ortonormal
n o
E1 |p , . . . , En |p
para Tp M . Seja x1 , . . . , xn um sistema de coordenadas para uma vizinhança de p tal que ∂i |p = Ei |p para
todo i (por exemplo, um sistema de coordenadas normal).
Diminuindo a vizinhança se necessário, podemos assumir que o domı́nio da parametrização é um pequeno
cubo
Cδ = x ∈ Rn : xi < δ, i = 1, . . . , n .
Para cada i faça um transporte paralelo do vetor Ei |p ao longo de todas as imagens parametrizadas
dos eixos do cubo, cobrindo todos os pontos da vizinhança parametrizada pelo cubo: por exemplo, co-
mece transportando paralelamente o vetor Ei |p ao longo da imagem parametrizada do eixo x1 ; então, a
partir de cada ponto da imagem parametrizada do eixo x1 , transporte paralelamente ao longo da imagem
parametrizada do segmento paralelo ao eixo x2 ; então, sucessivamente, transporte paralelamente ao longo
das imagens parametrizadas dos segmentos paralelos aos eixos x3 , . . . , xn . Deste modo, obtemos n campos
vetoriais ortonormais
E1 , . . . , En
definidos na vizinhança parametrizada pelo cubo Cδ . Estes campos vetoriais são suaves pela aplicação
sucessiva do teorema da dependência suave das soluções de EDOs nas condições iniciais, pois os campos Ei
são as soluções do sistema de EDOs
DEi
= 0.
dt
Rodney Josué Biezuner 167
Afirmamos que os campos E1 , . . . , En são paralelos em Cδ . Para provar isso, basta provar que
∇∂i Ej = 0
para todos i, j.
Fixe j. Seja
M k = x ∈ Cδ : xk+1 = . . . = xn = 0
a fatia k-dimensional do cubo correspondente à interseção do plano k-dimensional x1 , . . . , xk , . . . , 0 com o
cubo Cδ . Por construção, ∇∂1 Ej = 0 em M 1 , ∇∂2 Ej = 0 em M 2 e, em geral, ∇∂k Ej = 0 em M k .
Provaremos por indução que
∇∂1 Ej = . . . = ∇∂k Ej = 0 (13.8)
em M k para todo k; em particular, para k = n, obtemos a afirmação.
Já vimos que o caso k = 1 é válido. Assuma a validade de (13.8) para k. Em M k+1 temos ∇∂k+1 Ej = 0
por construção e
∇∂1 Ej = . . . = ∇∂k Ej = 0
em M k por hipótese de indução. Resta apenas mostrar que ∇∂i Ej = 0 para i = 1, . . . , k no resto de M k+1 .
Para isso, como já temos ∇∂i Ej = 0 na fatia k-dimensional M k (a fatia que ocupa o centro de M k+1 ), basta
provar que
∇∂k+1 (∇∂i Ej ) = 0,
pois isso implicará que o campo ∇∂i Ej continuará sendo nulo ao ser paralelamente transportado para o resto
de M k+1 . Mas, como R = 0, temos
∇∂i ∇∂k+1 Ej − ∇∂k+1 (∇∂i Ej ) − ∇[∂i ,∂k+1 ] Ej = 0
∇Ei Ej = ∇Ej Ei = 0,
donde
[Ei , Ej ] = 0
para todos i, j em Cδ . Portanto, pelo Teorema 8.43, existem coordenadas y 1 , . . . , y n para uma vizinhança
possivelmente menor de p, tais que
∂
Ei = .
∂y i
Nestas coordenadas,
∂ ∂ k
gij = i
, j = hEi , Ej i = ηij ,
∂y ∂y
logo a parametrização das coordenadas y i define uma isometria entre esta vizinhança parametrizada de p e
um aberto de Rn .
Para a demonstração original deste resultado para variedades riemannianas por Riemann, comentada e em
notação moderna, veja [Spivak], Vol. II, pp. 179-204. Observe que a demonstração acima mostra que se
pudermos encontrar campos E1 , . . . , En ortonormais e paralelos na variedade M , então ela é localmente
isométrica a Rn . Consequentemente, tais campos em geral não existem. Isso significa que o transporte
paralelo de vetores ao longo de curvas com extremidades coincidentes em geral dá resultados diferentes
(como exemplo, considere o transporte paralelo de um vetor na esfera do polo norte ao polo sul, ao longo
de dois meridianos fazendo um ângulo reto). Assim, o tensor curvatura mede a independência de caminhos
do transporte paralelo (veja Teorema 13.37 no apêndice a este capı́tulo). Outra coisa importante que a
curvatura mede é o assim chamado desvio geodésico (veja Proposição 13.35 no apêndice a este capı́tulo).
Este e a influência da curvatura no transporte paralelo são discutidos detalhadamente no apêndice deste
capı́tulo.
13.5 Proposição. Vale
R (∂i , ∂j ) ∂k = ∇∂i ∇∂j − ∇∂j ∇∂i ∂k . (13.9)
Em particular, os componentes do tensor endomorfismo curvatura são
l
∂Γljk ∂Γlik
Rijk = Γm l m l
jk Γim − Γik Γjm + − . (13.10)
∂xi ∂xj
Prova: A primeira afirmação segue de [∂i , ∂j ] = 0.
A segunda afirmação segue da primeira por cálculo direto, observando primeiramente que os componentes
do tensor R são definidos da forma usual, usando a multilinearidade do tensor, por
l ∂
R (X, Y ) Z = Rijk X iY j Z k , (13.11)
∂xl
de modo que
l ∂
R (∂i , ∂j ) ∂k = Rijk . (13.12)
∂xl
Logo, lembrando que
∇∂i ∂j = Γm
ij ∂m ,
Rodney Josué Biezuner 169
segue que
R (∂i , ∂j ) ∂k
= ∇∂i ∇∂j ∂k − ∇∂j (∇∂i ∂k )
= ∇∂i Γm m
jk ∂m − ∇∂j (Γik ∂m )
= ∇∂i Γm m
jk ∂m − ∇∂j (Γik ∂m )
∂Γmjk ∂Γm
= Γm
jk ∇∂i ∂m + ∂ m − Γ m
ik ∇ ∂ j
∂m − ik
∂m
∂xi ∂xj
∂Γljk ∂Γlik
= Γm l
jk Γim ∂l + ∂l − Γm l
ik Γ jm ∂ l − ∂
j l
∂xi ∂x
!
∂Γljk ∂Γlik
= Γm l m l
jk Γim − Γik Γjm + − ∂l .
∂xi ∂xj
13.6 Proposição (Simetrias do Tensor Endomorfismo Curvatura). O tensor endomorfismo curvatura
satisfaz as seguintes propriedades:
(a) R (X, Y ) Z = −R (Y, X) Z.
(b) (identidade de Bianchi) R (X, Y ) Z + R (Y, Z) X + R (Z, X) Y = 0.
Em termos dos componentes do tensor endomorfismo curvatura, estas identidades são respectivamente
equivalentes a
l l
(a) Rijk = −Rjik .
l l l
(b) Rijk + Rjki + Rkij = 0.
Consequentemente,
l
Riik = 0.
Prova: A primeira propriedade segue diretamente da definição, como já vimos. A segunda propriedade
segue da simetria da conexão, aplicada duas vezes, e da identidade de Jacobi para o colchete de Lie:
g ω ] , Y = ω ] , Y = ω (Y )
(13.14)
para todo Y .
Em coordenadas,
X [ (Y ) = X i ∂i , Y j ∂j = gij X i Y j = gij X i dxj (Y ) ,
ou seja,
X [ = gij X i dxj . (13.15)
Escrevendo os componentes do covetor X [ em coordenadas na forma
X [ = Xj dxj , (13.16)
segue que
Xj = gij X i . (13.17)
Diz-se que o covetor X [ é obtido a partir do vetor X descendo um ı́ndice. Por este motivo esta operação é
denotada pelo sı́mbolo bemol, porque em partituras musicais o sı́mbolo bemol é usado para abaixar a altura
da nota musical que lhe segue. Já no caso do isomorfismo inverso, escrevendo em coordenadas o vetor ω ] na
forma
ω ] = ω i ∂i , (13.18)
segue que
ω k ∂k , ∂j = ω (∂j ) ,
donde
ωj = gkj ω k .
Multiplicando pela matriz inversa g ij , como
segue que
n
X
ωi = g ij ωj . (13.19)
j=1
Diz-se que o vetor ω ] é obtido a partir do covetor ω subindo um ı́ndice. Por este motivo esta operação
é denotada pelo sı́mbolo sustenido, porque em partituras musicais o sı́mbolo sustenido é usado para subir a
altura da nota musical que lhe segue.
O vetor gradiente é definido a partir da operação de subir um ı́ndice:
Rodney Josué Biezuner 171
13.8 Definição. Seja M uma variedade métrica. Dada uma função f ∈ C ∞ (M ), definimos o campo
gradiente de f por
grad f = df ] .
Em outras palavras, o vetor gradiente é definido por
hgrad f, Y i = df (Y )
para todo Y .
Em coordenadas, como
∂f i
df = dx ,
∂xi
temos
∂f
grad f = g ij
∂j . (13.20)
∂xi
A operação de subir ou descer um ı́ndice pode ser aplicada a qualquer tensor:
13.9 Definição. Seja M uma variedade métrica. Se T ∈ Tlk (M ), então T [ ∈ Tl−1 k+1
(M ) é o tensor definido
por
T [ X1 , . . . , Xk , Xk+1 , ω 1 , . . . , ω q−1 , ω q+1 , . . . , ω l = T X1 , . . . , Xp , . . . , Xk , ω 1 , . . . , ω q−1 , Xk+1
[
, ω q+1 , . . . , ω l
e T ] ∈ Tl+1
k−1
(M ) é o tensor definido por
]
T ] X1 , . . . , Xp−1 , Xp+1 , . . . , Xk , ω 1 , . . . , ω l , ω l+1 = T X1 , . . . , Xp−1 , ω l+1 , Xp+1 , . . . , Xk , ω 1 , . . . , ω l .
Note que ao aplicar a operação de subir ou descer um ı́ndice de um tensor teremos que explicitar qual ı́ndice
estamos subindo ou descendo. Em geral isto é feito em palavras, sem o uso de um sı́mbolo especial. Em
coordenadas, descendo o último ı́ndice, as componentes do tensor resultante são dadas por
j ...j [
∂i1 , . . . , ∂ik , ∂ik+1 , dxj1 , . . . , dxjl−1
Ti11...ikl−1
ik+1 = T
[
= T ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl−1 , ∂ik+1
= T ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl−1 , gik+1 p dxp
j ...j p
= gik+1 p Ti11...ikl−1 ,
= g jl+1 q Tij11...i
...jl
k−1 q
,
Rodney Josué Biezuner 172
Outra aplicação importante do isomorfismo musical é estender a operação de tomar o traço de tensores.
Enquanto que o traço de tensores elimina um ı́ndice covariante e um ı́ndice contravariante, o traço em relação
à métrica definido a seguir elimina dois ı́ndices covariantes.
13.10 Definição. Seja M uma variedade métrica. Se T ∈ Tlk (M ), então o traço de T em relação à
métrica g é o tensor trg T ∈ Tlk−2 (M ) definido por
trg T = tr T ] .
Em coordenadas, o traço de T em relação à métrica g em relação aos dois últimos ı́ndices, subindo o último
ı́ndice antes de tomar o traço, é dado por
j ...jl j1 ...jl i
(trg T )i11...ik−2 = T ] i1 ...i i = g ij Tij11...i
...jl
k−2 ij
.
k−2
Por exemplo, se T ∈ T 2 (M ) é um tensor simétrico, de forma que não importa qual ı́ndice escolhemos subir,
então trg T ∈ T 0 (M ) = C ∞ (M ) é a função definida por
i
trg T = T ] i
= g ij Tij .
13.11 Exemplo (Contração do Tensor Métrica). Estamos agora em condição de entender porque
denotamos a inversa da matriz métrica G = (gij ) por G−1 = g ij , ou seja, porque
g ik gkj = δji .
Em particular,
l
Rijk = g ml Rijkm . (13.26)
Prova: Pois o tensor curvatura é obtido através do tensor endomorfismo curvatura pela operação de descer
o seu único ı́ndice contravariante, enquanto que o tensor endomorfismo curvatura é obtido através do tensor
curvatura pela operação inversa, isto é, subir o seu último ı́ndice. Também podemos provar diretamente: a
primeira identidade segue de
Potencialmente, o tensor curvatura tem n4 componentes. A presença de simetrias reduz bastante o
número de componentes não nulas e de componentes independentes:
13.14 Proposição (Simetrias do Tensor Curvatura). O tensor curvatura satisfaz as seguintes propri-
edades:
(a) R (X, Y, Z, W ) = −R (Y, X, Z, W ) .
(b) R (X, Y, Z, W ) = −R (X, Y, W, Z) .
(c) R (X, Y, Z, W ) = R (Z, W, X, Y ) .
(d) (identidade de Bianchi) R (X, Y, Z, W ) + R (Y, Z, X, W ) + R (Z, X, Y, W ) = 0.
Em termos dos componentes do tensor curvatura, estas identidades são respectivamente equivalentes a
(a) Rijkl = −Rjikl .
(b) Rijkl = −Rijlk .
(c) Rijkl = Rklij .
(d) Rijkl + Rjkil + Rkijl = 0.
Prova: (a) Segue imediatamente de
R (X, Y ) Z = −R (Y, X) Z.
(b) Como
R (X, Y, Z, Z) = hR (X, Y ) Z, Zi
= h∇X ∇Y Z, Zi − h∇Y ∇X Z, Zi − ∇[X,Y ] Z, Z .
Rodney Josué Biezuner 174
(d) A identidade de Bianchi para o tensor curvatura segue da identidade de Bianchi para o tensor endomor-
fismo curvatura.
(c) Segue da identidade de Bianchi aplicadas às quatro permutações cı́clicas dos quatro vetores:
Somamos estas 4 identidades. Aplicando (a) cancelamos todos os termos das primeiras duas colunas ((1, 1)
cancela com (4, 2), (2, 1) cancela com (1, 2), (3, 1) cancela com (2, 2) e (4, 1) cancela com (3, 2)). Quanto aos
termos da última coluna, segue de (a) e (b) que
R (Z, X, Y, W ) = R (X, Z, W, Y ) ,
R (W, Y, Z, X) = R (Y, W, X, Z) ,
2R (Z, X, Y, W ) + 2R (W, Y, Z, X) = 0.
Daı́,
R (Z, X, Y, W ) = −R (W, Y, Z, X) = R (Y, W, Z, X) .
13.15 Corolário. Vale
R (X, X, Z, W ) = R (X, Y, Z, Z) = 0.
Em termos dos componentes do tensor curvatura,
Além disso, qualquer soma de três componentes do tensor curvatura obtidos através da permutação cı́clica
de três ı́ndices é igual a zero.
Rodney Josué Biezuner 175
Prova: A validade das duas primeiras identidades foram vistas na demonstração da proposição; de qualquer
modo, Riikl = 0 segue da propriedade (a) e Rijkk = 0 segue da propriedade (b). A prova da última afirmação
é deixada como exercı́cio (Exercı́cio 13.40).
13.16 Corolário. Se M é uma variedade métrica de dimensão 2, então das 24 = 16 componentes do tensor
curvatura, existem 12 componentes nulas e apenas uma componente independente.
Prova: Pelo corolário temos
As componentes potencialmente não nulas são apenas R1212 , R1221 , R2112 , R2121 . É possı́vel escolher uma
dentre estas quatro e escrever as três outras em função dela usando as relações de simetria. Por exemplo,
escolhendo R1212 , temos
R1221 = −R1212 ,
R2112 = −R1212 ,
R2121 = −R2112 = R1212 .
Observe que a simetria da identidade de Bianchi não desempenha nenhum papel, porque no caso n = 2,
como também no caso n = 3, ela é consequência de (a)-(c). De fato, como no máximo 3 ı́ndices são diferentes
nestes casos, pelo menos um dos coeficientes na soma cı́clica (d) será da forma Rijkk e portanto nulo, logo
ela se reduzirá a uma ou duas das propriedades (a)-(c). Basta ver isso no caso k = l:
é equivalente a (Rijkk = 0)
Rjkik + Rkijk = 0
ou seja,
Rjkik = −Rkijk ,
que corresponde a aplicar (c) e depois (a).
As propriedades de simetria do endomorfismo curvatura reduzem um pouco o número de componentes a
calcular, mas não tanto quanto o tensor curvatura, já que não tem tantas simetrias. Pela Proposição 13.6
temos imediatamente 8 componentes nulas
1 2 1 2
R111 = R111 = R112 = R112 = 0,
1 2 1 2
R221 = R221 = R222 = R222 = 0,
13.17 Exemplo (Curvatura da Esfera). Considerando a esfera como uma superfı́cie de revolução com
parametrização
(x, y, z) (φ, θ) = (r sen φ cos θ, r sen φ sen θ, r cos φ),
vimos no Exemplo 12.7 que
g11 = r2 ,
g12 = g21 = 0,
g22 = r2 sen2 φ,
Primeiro calcularemos as componentes do tensor endomorfismo curvatura. Como observado antes, basta
1 1 2 2
calcular as 4 componentes independentes R121 , R212 , R121 , R212 . Para isso usamos a fórmula
l
∂Γljk ∂Γlik
Rijk = Γm l m l
jk Γim − Γik Γjm + −
∂xi ∂xj
∂Γljk ∂Γlik
= Γ1jk Γli1 − Γ1ik Γlj1 + Γ2jk Γli2 − Γ2ik Γlj2 + − .
∂xi ∂xj
Fazendo k = i, segue que
l
∂Γlji ∂Γlii
Riji = Γ1ji Γli1 − Γ1ii Γlj1 + Γ2ji Γli2 − Γ2ii Γlj2 + − .
∂xi ∂xj
Veremos que há apenas 2 componentes independentes não nulas.
1 1
No caso l = 1, temos que calcular R121 e R212 . O único sı́mbolo de Christoffel Γ1ij não nulo é Γ122 e
Γ2ii = 0 para todo i, logo para i 6= j temos
1
∂Γ1ji ∂Γ1ii
Riji = Γ1ji Γ1i1 − Γ1ii Γ1j1 + Γ2ji Γ1i2 − Γ2ii Γ1j2 + −
∂xi ∂xj
∂Γ1ii
= Γ2ji Γ1i2 − .
∂xj
Daı́,
1 ∂Γ111
R121 = Γ221 Γ112 − =0
∂θ
e
1 ∂Γ122
R212 = Γ212 Γ122 −
∂φ
cos φ ∂ (− sen φ cos φ)
= (− sen φ cos φ) −
sen φ ∂φ
2 2 2
= − cos φ + cos φ − sen φ
= − sen2 φ.
Rodney Josué Biezuner 177
2 2
No caso l = 2, temos que calcular R121 e R212 . Para i 6= j temos
l
∂Γ2ji ∂Γ2ii
Riji = Γ1ji Γ2i1 − Γ1ii Γ2j1 + Γ2ji Γ2i2 − Γ2ii Γ2j2 + −
∂xi ∂xj
∂Γ2ji
= Γ2ji Γ2i2 − Γ1ii Γ2j1 + .
∂xi
Daı́,
2 ∂Γ221
R121 = Γ221 Γ212 − Γ111 Γ221 +
∂φ
cos φ cos φ ∂ cos φ
= −0+
sen φ sen φ ∂φ sen φ
2
cos φ − sen φ − cos2 φ
2
= +
sen2 φ sen2 φ
= −1
e
2 ∂Γ212
R212 = Γ212 Γ222 − Γ122 Γ211 + = 0.
∂θ
Portanto,
1 1
R212 = −R122 = − sen2 φ,
2 2
R121 = −R211 = −1,
enquanto que as demais 12 componentes são todas nulas.
Para calcular as 24 = 16 componentes do tensor curvatura da esfera, pelo Corolário 13.16 basta calcular
uma componente não nula. Como
m 1 2
Rijkl = gml Rijk = g1l Rijk + g2l Rijk
segue que
1 2
R1212 = g12 R121 + g22 R121 = −r2 sen2 φ.
Portanto, as 4 componentes não nulas do tensor curvatura da esfera são
R1212 = −r2 sen2 φ,
R1221 = −R1212 = r2 sen2 φ,
R2112 = −R1212 = r2 sen2 φ,
R2121 = R1212 = −r2 sen2 φ.
13.18 Exemplo (Curvatura do Plano Hiperbólico). Como vimos no Exemplo 12.9, temos
1
g11 = g22 = ,
y2
g12 = g21 = 0,
e
Γ111 = Γ122 = Γ212 = Γ221 = 0,
1
Γ211 = ,
y
1
Γ112 = Γ121 = Γ222 = − .
y
Rodney Josué Biezuner 178
l
∂Γlji ∂Γlii
Riji = Γ1ji Γli1 − Γ1ii Γlj1 + Γ2ji Γli2 − Γ2ii Γlj2 + − .
∂xi ∂xj
No caso l = 1, para i 6= j,
1
∂Γ1ji ∂Γ1ii
Riji = Γ1ji Γ1i1 − Γ1ii Γ1j1 + Γ2ji Γ1i2 − Γ2ii Γ1j2 + i
−
∂x ∂xj
∂Γ1ji
= Γ1ji Γ1i1 − Γ2ii Γ1j2 + .
∂xi
Daı́
1 ∂Γ121
R121 = Γ121 Γ111 − Γ211 Γ122 + =0
∂x
e
1 ∂Γ112
R212 = Γ112 Γ121 − Γ222 Γ112 +
∂y
1 1 1 1
= − 2 + 2 = 2.
y2 y y y
No caso l = 2, para i 6= j,
1
∂Γ2ji ∂Γ2ii
Riji = Γ1ji Γ2i1 − Γ1ii Γ2j1 + Γ2ji Γ2i2 − Γ2ii Γ2j2 + i
−
∂x ∂xj
2
∂Γii
= Γ1ji Γ2i1 − Γ1ii Γ2j1 + Γ2ji Γ2i2 − Γ2ii Γ2j2 − .
∂xj
Daı́,
2 ∂Γ211
R121 = Γ121 Γ211 − Γ111 Γ221 + Γ221 Γ212 − Γ211 Γ222 −
∂y
1 1 1
=− +0−0+ 2 + 2
y2 y y
1
=
y2
e
2 ∂Γ222
R212 = Γ112 Γ221 − Γ122 Γ211 + Γ212 Γ222 − Γ222 Γ212 − = 0.
∂x
Portanto,
1 1 2 2 1
R122 = −R212 = −R121 = R211 =−
y2
e as demais 12 componentes são todas nulas.
Para calcular as componentes do tensor curvatura do plano hiperbólico, basta calcular a componente não
nula
1 2 1
R1212 = g12 R121 + g22 R121 = 4.
y
Rodney Josué Biezuner 179
A partir de n > 4, identidade de Bianchi reduz o número de componentes independentes. Para ver isso de
forma concreta no caso n = 4, primeiro observe que seguindo o raciocı́nio acima restam apenas
n2 n2 − 1
= 21
12
n=3
componentes independentes, que são exatamente as componentes da parte triangular superior ou inferior da
matriz
kl →
12 13 14 23 24 34
ij ↓
12 R1212 R1213 R1214 R1223 R1224 R1234
13 R1312 R1313 R1314 R1323 R1324 R1334
14 R1412 R1413 R1414 R1423 R1424 R1434
23 R2312 R2313 R2314 R2323 R2324 R2334
24 R2412 R2413 R2414 R2423 R2424 R2434
34 R3412 R3413 R3414 R3423 R3424 R3434
No caso n = 4 a identidade de Bianchi desempenha um papel, reduzindo de 21 para 20 o número de
componentes independentes. De fato, como visto no final da demonstração do Corolário 13.16, qualquer nova
condição deve envolver 4 ı́ndices distintos. As componentes com 4 ı́ndices diferentes ocupam a antidiagonal
da matriz acima, logo só há 3 componentes independentes com 4 ı́ndices diferentes; por exemplo, na parte
triangular superior da matriz acima estas componentes são: R1234 , R1423 = R2314 e R1324 = −R3124 . A
identidade de Bianchi
R1234 + R2314 + R3124 = 0
permite escrever
R1234 = −R2314 − R3124 ,
o que elimina R1234 como componente independente.
No caso geral, a identidade de Bianchi elimina n4 componentes independentes, já que este é o número
de modos que podemos escolher 4 ı́ndices diferentes dentre n ı́ndices e a identidade de Bianchi elimina um
destes (no caso n = 5, a identidade de Bianchi eliminará R1234 , R1345 , R1245 , R1235 , R2345 como componentes
independentes). Portanto, o número total final de componentes independentes é
n4 − 2n3 + 3n2 − 2n n4 − 2n3 + 3n2 − 2n
n n!
− = −
8 4 8 (n − 4)!4!
n4 − 2n3 + 3n2 − 2n n (n − 1) (n − 2) (n − 3)
= −
8 24
3n − 6n + 9n − 6n − n4 − 6n3 + 11n2 − 6n
4 3 2
=
24
2n4 − 2n2
=
24
n2 n2 − 1
= .
12
Assim, existem 6 componentes independentes para o tensor curvatura de variedades de dimensão 3 dentre
34 = 81 componentes, e 20 componentes independentes para o tensor curvatura de variedades de dimensão
4 dentre 44 = 256 componentes, como as que são estudadas em relatividade geral.
tensor curvatura estamos perdendo informação: os tensores mais simples contêm menos informação que o
tensor original. O mais importante dentre estes tensores é o tensor de Ricci.
13.20 Definição. Seja M uma variedade métrica. O tensor curvatura de Ricci de M (ou simplesmente
tensor de Ricci) denotado Ric, é o campo tensorial covariante de ordem 2 definido como o traço do tensor
endomorfismo curvatura em relação ao seu primeiro ı́ndice covariante e seu único ı́ndice contravariante ou,
equivalentemente, como o traço em relação à métrica do tensor curvatura no seu primeiro e último ı́ndices.
Portanto, os componentes da curvatura de Ricci são dados por
k
Rij = Rkij = g km Rkijm . (13.30)
Pelas simetrias do tensor endomorfismo curvatura, usar traços diferentes não faria diferença ou apenas
implicaria em uma troca de sinal:
n
X n
X n
X
k k k
Rij = Rkij =− Rikj = Rijk .
k=1 k=1 k=1
Prova: Temos
Rij = g km Rkijm = g km Rjmki = g mk Rmjik = Rji .
O segundo tensor é a curvatura escalar, que é uma função real.
13.22 Definição. Seja M uma variedade métrica. A curvatura escalar de M , denotada S, é a função
real S : M −→ R definida como o traço em relação à métrica do tensor de Ricci:
13.23 Exemplo (Curvatura de Ricci e Curvatura Escalar da Esfera). Para variedades métricas de
dimensão 2 a curvatura de Ricci é
k 1 2
Rij = Rkij = R1ij + R2ij .
Referindo aos cálculos efetuados no Exemplo 13.17, segue que a curvatura de Ricci da esfera é
1 2
R11 = R111 + R211 = 1,
1 2
R12 = R21 = R112 + R212 = 0,
1 2
R22 = R122 + R222 = sen2 φ.
1 sen2 φ 2
S= + = 2.
r2 r2 sen2 φ r
Ou seja, a curvatura escalar da esfera tende a 0 (curvatura escalar do plano euclideano) quando r → ∞.
Rodney Josué Biezuner 182
13.24 Exemplo (Curvatura de Ricci e Curvatura Escalar do Plano Hiperbólico). Referindo aos
cálculos efetuados no Exemplo 13.18, segue que
1 2 1
R11 = R111 + R211 =− ,
y2
1 2
R12 = R21 = R112 + R212 = 0,
1 2 1
R22 = R122 + R222 = − 2.
y
Logo, a curvatura escalar do plano hiperbólico é
2 1 2 1
S = y − 2 + y − 2 = −2.
y y
Como o tensor métrica e a curvatura de Ricci são ambos tensores 2-covariantes simétricos, é natural se
perguntar se existe uma relação mais direta entre eles.
13.25 Definição. Uma variedade métrica M é chamada uma variedade de Einstein se existe uma função
f : M −→ R tal que
Ric = f g. (13.33)
Neste caso, dizemos também que g é uma métrica de Einstein.
Pela Proposição 13.32, variedades de curvatura seccional constante (esta noção de curvatura será definida
na próxima seção) são variedades de Einstein. Observe que como
pois
trg g = g jk gjk = g jk gkj = δjj = n,
segue que
S
f= .
n
Logo,
13.26 Proposição. M é uma variedade de Einstein se e somente se
S
Ric = g. (13.34)
n
O nome variedades de Einstein vem da equação de Einstein (em unidades geometrizadas G = c = 1) que
como deduziremos mais tarde é
1
Ric − Sg + Λg = 8πT,
2
onde T é um 2-tensor simétrico (o tensor de momento-energia) que descreve a densidade e fluxo do momento
e energia presentes em cada ponto do espaço-tempo e Λ é a constante cosmológica. No vácuo, T = 0 e a
equação de Einstein se torna
1
Ric − Sg + Λg = 0
2
(e assim, a constante cosmológica mede a densidade de energia do vácuo). Tomando o traço desta equação
com respeito à métrica, como trg Ric = S e trg g = n = 4 para o espaço-tempo 4-dimensional, segue que
S − 2S + 4Λ = 0
Rodney Josué Biezuner 183
ou seja,
S = 4Λ
(curvatura escalar do vácuo). Segue que a equação de Einstein para o vácuo é
Ric = Λg,
ou seja, a métrica do vácuo é uma métrica de Einstein no sentido da Definição 13.33. Vale a pena observar
que Einstein considerou como o seu maior erro a introdução da constante cosmológica na sua equação da
relatividade geral. Ele a introduziu para poder produzir um universo estático; quando Hubble observou a
expansão do universo através do afastamento mútuo das galáxias, Einstein removeu a constante cosmológica
da sua equação (o que equivale efetivamente a considerar Λ = 0). Quando no final da década de 90 foi
observada a aceleração da expansão do universo, ela foi reintroduzida, com valor positivo a ser determinado
através de experimentos (correntemente, o valor é bem próximo de zero).
Matematicamente, o interesse em métricas de Einstein provém de um resultado provado por Hilbert:
métricas de Einstein são pontos crı́ticos para o funcional curvatura escalar
Z
S (g) = S dV
M
13.28 Proposição. v, w ∈ V são linearmente independentes se e somente se
|v ∧ w| =
6 0.
Assuma w 6= 0, caso contrário v e w são automaticamente linearmente dependentes e não há nada que precise
ser provado. Considere o vetor
hv, wi
z=v− 2 w.
kwk
Rodney Josué Biezuner 184
Temos
* +
2 hv, wi hv, wi
kzk = hz, zi = v− 2 w, v − 2 w
kwk kwk
* + * + * +
hv, wi hv, wi hv, wi hv, wi
= hv, vi − v, 2 w − 2 w, v + 2 w, 2 w
kwk kwk kwk kwk
2 2 2 2
2 hv, wi hv, wi hv, wi kwk
= kvk − 2 − 2 + 4
kwk kwk kwk
2 2 2 2
= kvk − kvk − kvk + kvk
= 0.
logo
hv, wi
v= 2 w.
kwk
13.29 Definição. Seja M uma variedade métrica e σ um plano de Tp M . A curvatura seccional de M
associada a σ é definida por
R (X, Y, Y, X) R (X, Y, Y, X)
K (X, Y ) = 2 = 2 2 2. (13.36)
|X ∧ Y | kXk kY k − hX, Y i
X = a11 Z + a21 W,
Y = a12 Z + a22 W.
Temos, usando as simetrias do tensor curvatura (em primeiro lugar, o fato que R (Z, Z, ·, ·) = R (W, W, ·, ·) =
R (·, ·, Z, Z) = R (·, ·, W, W ) = 0),
2
= (det A) R (Z, W, W, Z) ,
Rodney Josué Biezuner 185
|X ∧ Y |
2 2 2
= kXk kY k − hX, Y i
2 2 2
= ka11 Z + a21 W k ka12 Z + a22 W k − ha11 Z + a21 W, a12 Z + a22 W i
2 2 2 2
= a211 kZk + 2a11 a21 hZ, W i + a221 kW k a212 kZk + 2a12 a22 hZ, W i + a222 kW k
h i2
2 2
− a11 a12 kZk + (a11 a22 + a21 a12 ) hZ, W i + a21 a22 kW k
4 2 4 2 2
= a211 a212 kZk + 4 (a11 a21 a12 a22 ) hZ, W i + a221 a222 kW k + a211 a222 + a221 a212 kZk kW k
2 2
+ 2 a211 a12 a22 + a212 a11 a21 kZk hZ, W i + 2 a221 a12 a22 + a222 a11 a21 kW k hZ, W i
4 2 4 2 2
− a211 a212 kZk − a211 a222 + 2a11 a12 a21 a22 + a212 a221 hZ, W i − a221 a222 kW k − 2 (a11 a12 a21 a22 ) kZk kW k
2 2
− 2 a211 a12 a22 + a212 a11 a21 kZk hZ, W i − 2 a221 a12 a22 + a222 a11 a21 kW k hZ, W i
h i
2 2 2
= a211 a222 − 2a11 a12 a21 a22 + a212 a221 kZk kW k − hZ, W i
2
= (det A) |Z ∧ W | .
Logo,
R (X, Y, Y, X) R (Z, W, W, Z)
= .
|X ∧ Y | |Z ∧ W |
O conhecimento da curvatura seccional para todos os planos σ determina o tensor curvatura:
13.30 Proposição. Se R1 e R2 são dois tensores covariantes de ordem 4 em um espaço vetorial V que
satisfazem as propriedades de simetria listadas na Proposição 13.14 tais que
K1 (X, Y ) = K2 (X, Y )
R1 = R2 .
(segue diretamente da definição no caso em que X, Y são linearmente independentes; se X, Y são linearmente
dependentes, um é múltiplo escalar do outro e a identidade é trivial, já que cada lado é igual a zero pelas
propriedades de simetria). Daı́,
R1 (X + Z, Y, Y, X + Z) = R2 (X + Z, Y, Y, X + Z) . (13.38)
Como
R1 (X + W, Y, Y, X + W ) = R1 (X, Y, Y, X) + R1 (X, Y, Y, W )
+ R1 (W, Y, Y, X) + R1 (W, Y, Y, W )
= R1 (X, Y, Y, X) + 2R1 (X, Y, Y, W ) + R1 (W, Y, Y, W )
Como
Defina agora
R = R1 − R2 . (13.42)
Então R é um 4-tensor covariante que satisfaz as mesmas propriedades que R1 , R2 satisfazem. A identidade
(13.41) implica que
R (X, Y, Z, W ) + R (X, Z, Y, W ) = 0.
Portanto, R é antisimétrico com relação a qualquer par adjacente de ı́ndices: a relação acima prova a
antisimetricidade de R para o par adjacente interno e das regras de simetria da Proposição 13.14 obtemos a
antisimetricidade em relação aos pares adjacentes esquerdo e direito. Daı́
Da identidade de Bianchi
ou seja,
n
X
Ric (X, X) = K (X, Ek ) . (13.43)
k=2
Em outras palavras, para cada vetor unitário X ∈ Tp M , Ric (X, X) é a soma das curvaturas seccionais de
planos gerados por X e os outros vetores de uma base ortonormal. Por outro lado, como Ric é bilinear e
Rodney Josué Biezuner 187
simétrico, ele é completamente determinado pelos seus valores Ric (X, X) em vetores unitários X: se X, Y
são vetores tais que X + Y, X − Y 6= 0,
1
Ric (X, Y ) = (Ric (X + Y, X + Y ) − Ric (X − Y, X − Y ))
4
1 2 X +Y X +Y 2 X −Y X −Y
= kX + Y k Ric , − kX − Y k Ric ,
4 kX + Y k kX + Y k kX − Y k kX − Y k
" n n
#
1 2
X 2
X
= kX + Y k K (X + Y, Ek ) − kX − Y k K (X − Y, Fk ) ,
4
k=2 k=2
Similarmente, se {E1 , . . . , En } é uma base ortonormal para Tp M , então a curvatura escalar é dada por
n
X
S = g ij Rij = δ ij Rij = Rii = Ric (Ei , Ei ) ,
i=1
ou seja, X
S= K (Ei , Ej ) . (13.44)
i6=j
Em outras palavras, a curvatura escalar é a soma de todas as curvaturas seccionais de planos gerados por
pares de vetores de uma base ortonormal.
13.31 Exemplo (Curvaturas de Variedades de Dimensão 2). No caso de variedades de dimensão 2
existe apenas um plano em Tp M : o próprio. Para estas variedades, a curvatura seccional pode ser considerada
uma função K : M −→ R. Além disso, se {E1 , E2 } é uma base ortonormal para Tp M , segue da discussão
anterior que
S (p) = 2K (E1 , E2 ) = 2K (p) ,
ou seja, para variedades riemannianas de dimensão 2 a curvatura seccional é essencialmente a curvatura
escalar:
S = 2K. (13.45)
Além disso, temos
R (X, Y, Z, W ) = K (p) [hX, W i hY, Zi − hX, Zi hY, W i] (13.46)
De fato, o único componente independente de R é
Como a equação acima define um tensor 4-covariante de ordem 4 que tem as mesmas componentes que R,
ele é R. Segue que
Ric (X, Y ) = K (p) g (X, Y ) , (13.47)
Rodney Josué Biezuner 188
pois
" n n
#
1 2
X 2
X
Ric (X, Y ) = kX + Y k K (X + Y, Ek ) − kX − Y k K (X − Y, Fk )
4
k=2 k=2
1h 2 2
i
= kX + Y k K (X + Y, E2 ) − kX − Y k K (X − Y, F2 )
4
1h 2 2
i
= K (p) kX + Y k − kX − Y k
4
= K (p) g (X, Y ) .
Em particular, toda variedade de dimensão 2 é uma variedade de Einstein:
S
Ric = g. (13.48)
2
Então R
e satisfaz todas as propriedades de simetria da Proposição 13.14. De fato,
e (Y, X, Z, W ) = K0 [hY, W i hX, Zi − hY, Zi hX, W i]
R
= −K0 [hX, W i hY, Zi − hX, Zi hY, W i]
=Re (X, Y, Z, W ) ,
R
e (X, Y, Z, W ) + R
e (Y, Z, X, W ) + R
e (Z, X, Y, W )
= K0 [hX, W i hY, Zi − hX, Zi hY, W i + hY, W i hZ, Xi − hY, Xi hZ, W i + hZ, W i hX, Y i − hZ, Y i hX, W i]
= 0.
Como
R
e (X, Y, Y, X) K0 [hX, Xi hY, Y i − hX, Y i hX, Y i]
K
e (X, Y ) =
2 2 2 = 2 2 2 = K0 , (13.54)
kXk kY k − hX, Y i kXk kY k − hX, Y i
segue da Proposição 13.30 que R = R e e a recı́proca segue então de (13.54).
(13.49) é equivalente a (13.50): claramente (13.50) segue de (13.49) pela definição da curvatura a partir
do endomorfismo curvatura; reciprocamente, se (13.50) vale, então
Se X, Y são vetores não nulos, como vimos na discussão no final da seção anterior, temos
" n n
#
1 2
X 2
X
Ric (X, Y ) = kX + Y k K (X + Y, Ek ) − kX − Y k K (X − Y, Fk )
4
k=2 k=2
1h 2 2
i
= kX + Y k (n − 1) K0 − kX − Y k (n − 1) K0
4
1h 2 2
i
= (n − 1) K0 kX + Y k − kX − Y k
4
= (n − 1) K0 hX, Y i ;
13.33 Corolário. Seja M uma variedade riemanniana. Para cada ponto p ∈ M escolha uma base ortonor-
mal {E1 , E2 , . . . , En } de Tp M e defina
Rijkl = R (Ei , Ej , Ek , El ) .
para todo p ∈ M .
Rodney Josué Biezuner 190
Como um tensor é determinado pelos seu valores em uma base, esta equação é válida se e somente se
Vemos que em uma variedade riemanniana de curvatura seccional constante o tensor curvatura pode ser
expresso diretamente em função da métrica.
Aqui, n = 3. Pela segunda lei de Newton, a equação de movimento para cada trajetória (para cada s fixado)
é dada por
∂2F
(s, t) + ∇U (s, t) = 0
∂t2
onde U é o potencial gravitacional Newtoniano. Para calcular a aceleração relativa entre as trajetórias
produzidas por forças de maré, calculamos
∂ ∂2F
(s, t) + ∇U (s, t) = 0.
∂s ∂t2
Escrevendo em coordenadas
∂2F
(s, t) = x1 (s, t) , . . . , xn (s, t)
∂t 2
e
∂U ∂U
∇φ (s, t) = (s, t) , . . . , n (s, t) .
∂x1 ∂x
Segue que, comutando derivadas,
∂ ∂ 2 xi ∂ 2 ∂xi
2
= 2
∂s ∂t ∂t ∂s
enquanto que, pela regra da cadeia,
n
X ∂ 2 U ∂xj
∂ ∂U
i
= .
∂s ∂x j=1
∂xi ∂xj ∂s
O termo
∂2 ∂2 ∂x1 ∂xn
∂F
= ,...,
∂t2 ∂s ∂t2 ∂s ∂s
é a aceleração relativa das trajetórias, enquanto que o termo
n
X ∂ 2 U ∂xj
i,j=1
∂xi ∂xj ∂s
ou seja, partı́culas seguindo ao longo de retas paralelas não sofrem aceleração uma em direção a outra, porque
no final das contas as retas paralelas se mantêm à mesma distância uma da outra e ∂F/∂s = 0. Mas em
variedades riemannianas (não localmente isométricas a Rn , como veremos mais tarde) isso não é verdade
D D
porque as derivadas covariantes e não comutam, de modo que, enquanto que
dt ds
D D ∂F
= 0,
ds dt ∂t
em geral temos
D2
∂F
6= 0
dt2 ∂s
e existe uma aceleração temporal mensurável entre as trajetórias geodésicas na variedade. De fato, a não
comutatividade das derivadas covariantes pode ser medida pelo tensor curvatura:
13.34 Lema (Curvatura como medida da não comutividade da Derivada Covariante). Seja F :
(−ε, ε) × [a, b] −→ M uma variação e V um campo vetorial ao longo de F . Então,
D DV D DV ∂F ∂F
− =R , V.
dt ds ds dt ∂t ∂s
Prova: Escreva
F (s, t) = x1 (s, t) , . . . , xn (s, t)
e
V = V i (s, t) ∂i
em uma vizinhança coordenada. Então
DV D ∂V i D
= V i ∂i = ∂i + V i ∂i ,
ds ds ∂s ds
donde
D DV ∂2V i ∂V i D ∂V i D DD
= ∂i + ∂i + ∂i + V i ∂i .
dt ds ∂s∂t ∂s dt ∂t ds dt ds
Trocando a letra t pela letra s, também obtemos
D DV ∂2V i ∂V i D ∂V i D DD
= ∂i + ∂i + ∂i + V i ∂i .
ds dt ∂s∂t ∂t ds ∂s dt ds dt
Logo,
D DV D DV DD DD
− =Vi − ∂i . (13.55)
dt ds ds dt dt ds ds dt
Como
∂F ∂xj
= ∂j ,
∂t ∂t
∂F ∂xk
= ∂k ,
∂s ∂s
temos
D ∂xk
∂i = ∇ ∂xk ∂ ∂i = ∇∂k ∂i .
ds ∂s k ∂s
Rodney Josué Biezuner 193
Daı́,
∂xk
DD D
∂i = ∇∂k ∂i
dt ds dt ∂s
∂ 2 xk ∂xk D
= ∇∂ ∂i + (∇∂k ∂i )
∂s∂t k ∂s dt
∂ 2 xk ∂xk
= ∇∂ ∂i + ∇ ∂xj ∂ (∇∂k ∂i )
∂s∂t k ∂s ∂t j
∂ 2 xk k
∂x ∂x j
= ∇∂ ∂i + ∇∂j ∇∂k ∂i .
∂s∂t k ∂s ∂t
Da mesma forma, trocando t por s e depois j por k,
DD ∂ 2 xk ∂xk ∂xj
∂i = ∇∂ ∂i + ∇∂j ∇∂k ∂i
ds dt ∂t∂s k ∂t ∂s
∂ 2 xk ∂xj ∂xk
= ∇∂ ∂i + ∇∂k ∇∂j ∂i .
∂s∂t k ∂t ∂s
Portanto,
D DV D DV ∂xj ∂xk
=Vi
− ∇∂j ∇∂k ∂i − ∇∂k ∇∂j ∂i
dt ds ds dt ∂t ∂s
j
∂x ∂xk
=Vi R (∂j , ∂k ) ∂i
∂t ∂s
pois
∇[∂j ,∂k ] ∂i = 0
já que [∂j , ∂k ] = 0. O fato de que R é um tensor permite agora escrever
∂xj ∂xk
D DV D DV
− =R ∂j , ∂k V i ∂i
dt ds ds dt ∂t ∂s
∂F ∂F
=R , V.
∂t ∂s
Observe que definir a curvatura simplesmente por
R (X, Y ) Z = ∇X ∇Y Z − ∇Y ∇X Z,
de modo que a curvatura mediria apenas e diretamente o grau de não comutatividade da derivada covariante,
não é satisfatório, porque esta expressão não define um tensor. De fato, ela não é linear na terceira variável:
∇X ∇Y (f Z) − ∇Y ∇X (f Z) = ∇X (f ∇Y Z) − ∇X ((Y f ) Z) − ∇Y (f ∇X Z) + ∇Y ((Xf ) Z)
= f ∇X ∇Y Z + (Xf ) ∇Y Z + (Y f ) ∇X (Z) + X (Y f ) Z
− f ∇Y ∇X Z − (Y f ) ∇X Z − (Xf ) ∇Y Z − Y (Xf ) Z
= f ∇X ∇Y Z − f ∇Y ∇X Z + [X (Y f ) − Y (Xf )] Z
= f (∇X ∇Y Z − ∇Y ∇X Z) + [X, Y ] (f ) Z.
R (X, Y ) Z = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z.
Rodney Josué Biezuner 194
pois
∇[X,Y ] (f Z) = f ∇[X,Y ] Z + [X, Y ] (f ) Z
e o termo [X, Y ] (f ) Z que restou acima é eliminado, deixando −f ∇[X,Y ] Z. A demonstração do Lema 13.34
não funciona se R não é um tensor.
Podemos agora calcular a aceleração temporal entre as geodésicas da variedade.
13.35 Proposição (Equação do Desvio Geodésico). Seja F : (−ε, ε) × [a, b] −→ M uma variação
geodésica. Então,
D2 ∂F
∂F ∂F ∂F
+R , =0
dt2 ∂s ∂s ∂t ∂t
Prova: Como cada trajetória de F é uma geodésica, temos
D ∂F
= 0,
dt ∂t
donde
D D ∂F
= 0.
ds dt ∂t
Invocando o Lema de Simetria 12.25 (cuja validade depende de que o tensor torção seja nulo), obtemos
D D ∂F D D ∂F ∂F ∂F ∂F
0= = −R ,
ds dt ∂t dt ds ∂t ∂t ∂s ∂t
D D ∂F ∂F ∂F ∂F
= +R ,
dt dt ∂s ∂s ∂t ∂t
2
D ∂F ∂F ∂F ∂F
= +R , .
dt2 ∂s ∂s ∂t ∂t
A equação do desvio geodésico da Relatividade Geral é chamada equação de Jacobi em Geometria Rie-
manniana. Em Relatividade Geral, o termo da curvatura
∂F ∂F ∂F
R ,
∂t ∂s ∂t
é interpretado como sendo o responsável pelas forças que produzem efeitos de maré, isto é, a curvatura
do espaçotempo é que causa os efeitos de maré, fazendo com que partı́culas-teste que seguem trajetória
geodésicas no espaçotempo acelerem uma na direção da outra.
F : [a, b] × [c, d] −→ M.
Um campo vetorial ao longo de F é um campo diferenciável V : [a, b] × [c, d] −→ T M tal que V (s, t) ∈
TF (s,t) M para cada (s, t).
Rodney Josué Biezuner 195
Uma superfı́cie parametrizada difere em poucos detalhes de uma variação. Em particular, o Lema 13.34 vale
para uma superfı́cie parametrizada.
13.37 Teorema (Efeito da Curvatura no Transporte Paralelo em uma Trajetória Fechada). Seja
F : [s0 , S] × [t0 , T ] −→ M uma superfı́cie parametrizada e denote
p = F (s0 , t0 ) ,
∂F
U= ,
∂s (s0 ,t0 )
∂F
V = .
∂t (s0 ,t0 )
Seja
τ : Tp M −→ Tp M
o transporte paralelo ao longo das curvas da fronteira desta superfı́cie parametrizada, isto é,
τ = τts00+∆t→t0 ◦ τst00+∆s→s
+∆t
0
◦ τts00→t
+∆s
0 +∆t
◦ τst00→s0 +∆s
onde
Se W ∈ Tp M , então
1
R (U, V ) W = lim (W − τ (W )) .
∆s,∆t→0 ∆s∆t
Rodney Josué Biezuner 196
Prova: Como
τst00+∆s→s
+∆t
0
◦ τst00→s
+∆t
0 +∆s
= id,
τts00+∆t→t0 ◦ τts00→t0 +∆t = id,
podemos escrever
h i
W − τ (W ) = τts00+∆t→t0 ◦ τst00+∆s→s
+∆t
0
◦ τs
t0 +∆t
0 →s0 +∆s ◦ τt
s0
0 →t 0 +∆t (W ) − τt
s0 +∆s
0 →t0 +∆t ◦ τs
t0
0 →s0 +∆s (W ) .
Já que
lim τts00+∆t→t0 ◦ τst00+∆s→s
+∆t
0
= id,
∆s,∆t→0
Isso é equivalente a calcular a diferença entre os transportes paralelos do vetor W de Tp M até Tq M , onde
q = F (t0 + ∆t, s0 + ∆s) é o vértice oposto do retângulo ao longo dos dois caminhos possı́veis da fronteira
do retângulo.
Pelo Lema 11.27 (substituindo a derivada covariante pela derivada covariante ao longo de uma curva e
invertendo a aplicação do transporte paralelo), temos para s, t quaisquer
onde Y é um campo ao longo da superfı́cie tal que Y(s0 ,t0 ) = W . Com esta expressão em mente, reescrevemos
o lado direito de (13.56) adicionando e subtraindo termos, de modo a decompor os dois caminhos do retângulo
nos quatro lados do mesmo:
τst00→s
+∆t
0 +∆s
◦ τts00→t0 +∆t (W ) − τts00→t
+∆s
0 +∆t
◦ τst00→s0 +∆s (W )
= τst00→s
+∆t
◦ τts00→t0 +∆t Y(s0 ,t0 ) − τts00→t
+∆s
◦ τst00→s0 +∆s Y(s0 ,t0 )
0 +∆s 0 +∆t
= τst00→s
+∆t
s0
0 +∆s
τt0 →t0 +∆t Y(s0 ,t0 ) − Y(s0 ,t0 +∆t)
+ τst00→s
+∆t
0 +∆s
Y(s0 ,t0 +∆t) − Y(s0 +∆s,t0 +∆t)
− τts00→t
+∆s
t0
0 +∆t
τs0 →s0 +∆s Y(s0 ,t0 ) − Y(s0 +∆s,t0 )
− τts00→t
+∆s
0 +∆t
Y(s0 +∆s,t0 ) + Y(s0 +∆s,t0 +∆t) .
Rodney Josué Biezuner 197
13.7 Exercı́cios
13.38 Exercı́cio. Mostre que toda aplicação
T : T 1 (M ) × . . . × T 1 (M ) × T1 (M ) × . . . × T1 (M ) −→ C ∞ (M )
multilinear sobre C ∞ (M ) é induzida por um campo tensorial em Tlk (M ).
13.39 Exercı́cio. Mostre que a curvatura é um invariante isométrico local. Conclua que
R (X, Y ) Z = 0
para qualquer variedade métrica localmente isométrica a Rn .
13.40 Exercı́cio. Usando (a)-(d) da Proposição 13.14, prove o Corolário 13.15.
Capı́tulo 14
Gostarı́amos de definir uma noção completa de cálculo diferencial em variedades diferenciáveis, isto é, deriva-
das segundas e todas as derivadas de ordem superior. A derivada de uma função real f (sua diferencial) é um
funcional linear df , isto é, um tensor 1-covariante. Para podermos derivar mais uma vez, precisamos definir
a noção da derivada de um tensor 1-covariante. Para definirmos derivadas de ordem superior, precisamos
definir as derivadas de tensores de todos os tipos (k, l). Assim como a derivada de uma função aumenta a
ordem covariante de 0 para 1, a derivada de (k, l)-tensores aumentará a ordem covariante de k para k + 1:
ela será um tensor do tipo (k + 1, l). Por este motivo, ela será chamada derivada covariante. Na verdade,
ela será construı́da a partir da derivada covariante de campos vetoriais (a qual recebe este nome em função
do seu uso na definição da derivada covariante de tensores) e isso será feito em duas etapas: primeiro gene-
ralizaremos a definição de derivada covariante de campos vetoriais (conexões), que é uma noção de derivada
direcional, para definir derivadas covariantes de campos tensoriais, ou seja, derivadas direcionais de campos
tensoriais (que será chamada uma conexão em ⊕Tlk (M )); esta será usada em seguida para definir a noção
propriamente dita de derivada covariante de campos tensoriais, a chamada derivada covariante total.
∇ : T (M ) × Tlk (M ) −→ Tlk (M )
∇X (F ⊗ G) = (∇X F ) ⊗ G + F ⊗ (∇X G) .
(iv) ∇ comuta com todos os traços: se tr denota o traço com relação a qualquer par de ı́ndices, então
∇X (tr F ) = tr (∇X F ) .
198
Rodney Josué Biezuner 199
∇X [ω (Y )] = (∇X ω) (Y ) + ω (∇X Y ) .
(∇X T ) X1 , . . . , Xk , ω 1 , . . . , ω l = X T X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
T X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l
X
T X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l
−
j=1
∇X [ω (Y )] = ∇X tr (ω ⊗ Y )
= tr ∇X (ω ⊗ Y )
= tr (∇X ω ⊗ Y ) + tr (ω ⊗ ∇X Y )
= ∇X ω (Y ) + ω (∇X Y ) .
Para provar (b), procedemos por indução separadamente sobre k e l. O caso (k, l) = (0, 1) segue de (a)
e (ii):
(∇X ω) (Y ) = ∇X [ω (Y )] − ω (∇X Y )
= X (ω (Y )) − ω (∇X Y ) .
Da mesma forma, o caso (k, l) = (1, 0) segue de (a) e de (ii) (usando a definição da aplicação de um vetor a
um covetor via a dualidade entre V e o bidual V ∗∗ ):
Agora assuma que (b) vale para todos os inteiros p < k, q < l. Mostraremos que isso implica que (b) vale
para k, l. Como todo T ∈ Tlk (M ) se escreve na forma
n
X
T = Fi ⊗ Gj
i,j=1
∇X T = (∇X F ) ⊗ G + F ⊗ (∇X G) ,
Rodney Josué Biezuner 200
donde
(∇X T ) X1 , . . . , Xk , ω 1 , . . . , ω l
= [(∇X F ) ⊗ G] X1 , . . . , Xk , ω 1 , . . . , ω l
+ [F ⊗ (∇X G)] X1 , . . . , Xk , ω 1 , . . . , ω l
Mas
= X F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ω l
k−1
X
F X1 , . . . , ∇X Xi , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ω l
−
i=1
l−1
X
F X1 , . . . , Xk−1 , ω 1 , . . . , ∇X ω j , . . . , ω l−1 G Xk , ω l
−
j=1
= F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 X G Xk , ω l
− F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G ∇X Xk , ω l
− F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ∇X ω l .
Portanto,
(∇X T ) X1 , . . . , Xk , ω 1 , . . . , ω l
k−1
X
F X1 , . . . , ∇X Xi , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ω l
−
i=1
− F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G ∇X Xk , ω l
l−1
X
F X1 , . . . , Xk−1 , ω 1 , . . . , ∇X ω j , . . . , ω l−1 G Xk , ω l
−
j=1
− F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ∇X ω l
= X F X1 , . . . , Xk−1 , ω 1 , . . . , ω l−1 G Xk , ω l
k−1
X
(F ⊗ G) X1 , . . . , ∇X Xi , . . . , Xk−1 , Xk , ω 1 , . . . , ω l−1 , ω l
−
i=1
− (F ⊗ G) X1 , . . . , Xk−1 , ∇X Xk , ω 1 , . . . , ω l−1 , ω l
l−1
X
(F ⊗ G) X1 , . . . , Xk−1 , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l−1 , ω l
−
j=1
− (F ⊗ G) X1 , . . . , Xk−1 , Xk , ω 1 , . . . , ω l−1 , ∇X ω l
Rodney Josué Biezuner 201
= X (F ⊗ G) X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
(F ⊗ G) X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l−1
X
(F ⊗ G) X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l
−
j=1
= X T X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
T X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l−1
X
T X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l .
−
j=1
Passo 2. Existência.
Defina ∇ : T (M ) × Tlk (M ) −→ Tlk (M ) por (b) (o que inclui (a), como visto acima). Mostraremos que
∇ é uma conexão e satisfaz todas as propriedades (i)-(iv).
Inicialmente, as propriedades de uma conexão:
(1) ∇f X+gY T = f ∇X T + g∇Y T.
Primeiro, para campos covetoriais: para todo Z vale
logo
∇f X+gY ω = f ∇X ω + g∇Y ω.
Para T ∈ Tlk (M ) temos
(∇f X+gY T ) X1 , . . . , Xk , ω 1 , . . . , ω l
= (f X + gY ) T X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
T X1 , . . . , ∇f X+gY Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l
X
T X1 , . . . , Xk , ω 1 , . . . , ∇f X+gY ω j , . . . , ω l .
−
j=1
Como
(f X + gY ) T X1 , . . . , Xk , ω 1 , . . . , ω l
= f X T X1 , . . . , Xk , ω 1 , . . . , ω l + gY T X1 , . . . , Xk , ω 1 , . . . , ω l ,
T X1 , . . . , ∇f X+gY Xi , . . . , Xk , ω 1 , . . . , ω l
= T X1 , . . . , f ∇X Xi + g∇Y Xi , . . . , Xk , ω 1 , . . . , ω l
= f T X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l + gT X1 , . . . , ∇Y Xi , . . . , Xk , ω 1 , . . . , ω l
Rodney Josué Biezuner 202
T X1 , . . . , Xk , ω 1 , . . . , ∇f X+gY ω j , . . . , ω l
= T X1 , . . . , Xk , ω 1 , . . . , f ∇X ω j + g∇Y ω j , . . . , ω l
= f T X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l + gT X1 , . . . , Xk , ω 1 , . . . , ∇Y ω j , . . . , ω l ,
segue o resultado.
(2) ∇X (T + S) = ∇X T + ∇X S.
É óbvio da definição.
(3) ∇X (f T ) = f ∇X T + (Xf ) T.
Note que esta regra do produto é um caso especial de (iii). Primeiro, para campos covetoriais: para todo
Z vale
logo
∇X (f ω) = f ∇X ω + (Xf ) ω.
Para T ∈ Tlk (M ) temos
(∇X f T ) X1 , . . . , Xk , ω 1 , . . . , ω l
= X f T X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
(f T ) X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l
X
(f T ) X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l
−
j=1
= (Xf ) T X1 , . . . , Xk , ω 1 , . . . , ω l + f X T X1 , . . . , Xk , ω 1 , . . . , ω l
k
X
(f T ) X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
−
i=1
l
X
(f T ) X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l
−
j=1
k+p
X
(F ⊗ G) X1 , . . . , ∇X Xi , . . . , Xk+p , ω 1 , . . . , ω l+q
−
i=1
l+q
X
(F ⊗ G) X1 , . . . , Xk+p , ω 1 , . . . , ∇X ω j , . . . , ω l+q .
−
j=1
Temos também
k+p
X
(F ⊗ G) X1 , . . . , ∇X Xi , . . . , Xk+p , ω 1 , . . . , ω l+q
i=1
k
X
F X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l G Xk+1 , . . . , Xk+p , ω l+1 , . . . , ω l+q
=
i=1
k+p
X
F X1 , . . . , Xk , ω 1 , . . . , ω l G Xk+1 , . . . , ∇X Xi , . . . , Xk+p , ω l+1 , . . . , ω l+q
+
i=k+1
e
l+q
X
(F ⊗ G) X1 , . . . , Xk+p , ω 1 , . . . , ∇X ω j , . . . , ω l+q
j=1
l
X
F X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l G Xk+1 , . . . , Xk+p , ω l+1 , . . . , ω l+q
=
j=1
l+q
X
F X1 , . . . , Xk , ω 1 , . . . , ω l G Xk+1 , . . . , Xk+p , ω l+1 , . . . , ∇X ω j , . . . , ω l+q .
+
j=l+1
Rodney Josué Biezuner 204
Portanto,
[∇X (F ⊗ G)] X1 , . . . , Xk , Xk+1 , . . . , Xk+p , ω 1 , . . . , ω l , ω l+1 , . . . , ω l+q
( k
X
= X F X1 , . . . , Xk , ω 1 , . . . , ω l − F X1 , . . . , ∇X Xi , . . . , Xk , ω 1 , . . . , ω l
i=1
l
X
F X1 , . . . , Xk , ω 1 , . . . , ∇X ω j , . . . , ω l × G Xk+1 , . . . , Xk+p , ω l+1 , . . . , ω l+q
−
j=1
k+p
X
G Xk+1 , . . . , ∇X Xi , . . . , Xk+p , ω l+1 , . . . , ω l+q
−
i=k+1
l+q
X
G Xk+1 , . . . , Xk+p , ω l+1 , . . . , ∇X ω j , . . . , ω l+q
−
j=l+1
(iv) Para provar esta propriedade, estabeleceremos primeiro uma fórmula para ∇X T em coordenadas. Se
T = Tij11...i
...jl
k
dxi1 ⊗ . . . ⊗ dxik ⊗ ∂j1 ⊗ . . . ⊗ ∂jj
e
X = X m ∂m ,
então
∇X T ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl
j ...j
= X m (∇∂m T )i11...ikl
e a expressão em coordenadas para a derivada covariante de um campo tensorial, como veremos na Proposição
14.9, é
k l
j ...j pj ...j
j ...j
X X
(∇∂m T )i11...ikl = ∂m Tij11...i
...jl
k
− T j1 ...jl
Γ p
i1 ...ir−1 pir+1 ...ik mir + Ti11...iks−1 s+1 l Γjmp
s
. (14.1)
r=1 s=1
[∇∂m (tr F )] ∂i1 , . . . , ∂ik−1 , dxj1 , . . . , dxjl−1 = [tr (∇∂m F )] ∂i1 , . . . , ∂ik−1 , dxj1 , . . . , dxjl−1 ,
Logo,
j ...j
[∇∂m (tr F )]i11...ik−1
l−1
j ...j k l
∂ (tr F )i11...ik−1
l−1
X j ...j p
X j ...j pjs+1 ...jl
= − (tr F )i11...ir−1
l
pir+1 ...ik Γmir + (tr F )i11...iks−1 Γjmp
s
∂xm r=1 s=1
j1 ...jq−1 ujq ...jk−1 k l
∂Fi1 ...ip−1 uip ...il−1 X j ...j uj ...j p
X j ...j uj ...j pjs+1 ...jk−1
= − Fi11...ip−1
q−1 q k−1
uip ...ir−1 pir+1 ...il−1 Γmir + Fi11...ip−1
q−1 q s−1
uip ...il−1 Γjmp
s
∂xm r=1 s=1
e
j ...j
[tr (∇∂m F )]i11...ik−1
l−1
j ...j uj ...j
= (∇∂m F )i11...ip−1
q−1 q k−1
uip ...il−1
j ...j uj ...j k l
∂Fi11...ip−1
q−1 q k−1
uip ...il−1
X j ...j uj ...j p
X j ...j uj ...j pjs+1 ...jk−1
= − Fi11...ip−1
q−1 q k−1
uip ...ir−1 pir+1 ...il−1 Γmir + Fi11...ip−1
q−1 q s−1
uip ...il−1 Γjmp
s
.
∂xm r=1 s=1
(∇X ω) (Y ) = ∇X [ω (Y )] − ω (∇X Y )
= ∇X ω Y k ∂k − ω X Y k + X i Y j Γkij ∂k
= X Y k ωk − X Y k + X i Y j Γkij ωk
= X Y k ωk + Y k X (ωk ) − X Y k ωk + X i Y j ωk Γkij
∂ωk
= Y k X i i − X i Y j ωk Γkij
∂x
i ∂ωk i j k
= X − X ωj ik Y
Γ
∂xi
∂ωk
= X i i − X i ωj Γjik dxk (Y ) .
∂x
Rodney Josué Biezuner 206
∇T : T1 (M ) × . . . × T1 (M ) × T 1 (M ) × . . . × T 1 (M ) −→ C ∞ (M )
definido por
∇T Y1 , . . . , Yk , X, ω 1 , . . . , ω l = ∇X T Y1 , . . . , Yk , ω 1 , . . . , ω l .
(14.4)
O nome derivada covariante pode ser agora compreendido: a derivada covariante total de um tensor aumenta
em um a sua ordem covariante.
A derivada covariante total do tensor métrica g é o tensor identicamente nulo:
14.4 Proposição (Derivada Covariante Total do Tensor Métrica). Se (M, g) é uma variedade métrica,
então
∇g = 0.
Prova: Pela definição e pela compatibilidade da conexão com a métrica, temos
∇g (X, Y, Z) = ∇Z g (X, Y )
= Z [g (X, Y )] − g (∇Z X, Y ) − g (X, ∇Z Y )
= Z hX, Y i − h∇Z X, Y i − hX, ∇Z Y i
= 0.
Da demonstração vemos que a conexão riemanniana pode ser equivalentemente caracterizada como a única
conexão simétrica tal que ∇g = 0. O fato que ∇g = 0 foi um sério empecilho para Einstein no seu caminho
em direção à descoberta da Teoria da Relatividade Geral, como veremos no Capı́tulo 16.
14.5 Proposição (Significado da Derivada Covariante Total Nula). Se (M, g) é uma variedade
métrica e X ∈ T (M ), então
∇X = 0
se e somente se X é um campo paralelo.
Prova: Veja a observação que se segue à Definição 14.10 e observe que se X ∈ T (M ), então por definição
∇X (Y ) = ∇Y X.
14.6 Definição. Dizemos que um tensor T ∈ Tlk (M ) é paralelo se ∇T = 0.
ou seja,
∇2 f (X, Y ) = Y (Xf ) − (∇Y X) f. (14.5)
O laplaciano de f é definido por
∆f = trg ∇2 f. (14.6)
14.8 Notação. Seja
∂ ∂
T = Tij11...i
...jl
dxi1 ⊗ . . . ⊗ dxik ⊗
⊗ ... ⊗
k
∂xj1 ∂xjl
um campo (k, l)-tensorial. Então temos duas notações bastante difundidas para escrever a expressão em
coordenadas da derivada covariante total de T :
∂ ∂
∇T = ∇m Tij11...i
...jl
dxi1 ⊗ . . . ⊗ dxik ⊗ dxm ⊗ j
⊗ ... ⊗ (14.7)
k
∂x 1 ∂xjl
e
∂ ∂
∇T = Tij11...i
...jl
k ;m
dxi1 ⊗ . . . ⊗ dxik ⊗ dxm ⊗
j
⊗ ... ⊗ (14.8)
∂x 1 ∂xjl
Isto é, cada componente do campo (k + 1, l)-tensorial derivada covariante total é denotado por
∇m Tij11...i
...jl
k
= Tij11...i
...jl
k ;m
. (14.9)
Por exemplo, se
∂
X = Xi ,
∂xi
então
∂ ∂
∇X = ∇j X i dxj ⊗ = X;ji dxj ⊗ . (14.10)
∂xi ∂xi
14.9 Proposição. Seja M uma variedade diferenciável dotada de uma conexão ∇. Então as componentes
da derivada covariante total em um sistema de coordenadas são dadas por
l k
j ...j pjs+1 ...jl
X X
∇m Tij11...i
...jl
k
= Tij11...i
...jl
k ;m
= ∂m Tij11...i
...jl
k
+ Ti11...iks−1 Γjmp
s
− Tij11...i
...jl
Γp .
r−1 pir+1 ...ik mir
(14.11)
s=1 r=1
∇m Tij11...i
...jl
k
(p) = ∂m Tij11...i
...jl
k
(p) .
Rodney Josué Biezuner 208
Tij11...i
...jl
k ;m
k
X
= ∂m T ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl − T ∂i1 , . . . , ∇∂m ∂ir , . . . , ∂ik , dxj1 , . . . , dxjl
r=1
l
X
T ∂i1 , . . . , ∂ik , dxj1 , . . . , ∇∂m dxjs , . . . , dxjl
−
s=1
k
X
= ∂m Tij11...i
...jl
T ∂i1 , . . . , Γpmir ∂p , . . . , ∂ik , dxj1 , . . . , dxjl
k
−
r=1
l
X
T ∂i1 , . . . , ∂ik , dxj1 , . . . , −Γjmp dxp , . . . , dxjl
− s
s=1
k l
j ...j pjs+1 ...jl
X X
= ∂m Tij11...i
...jl
k
− Tij11...i
...jl
Γp +
r−1 pir+1 ...ik mir
Ti11...iks−1 Γjmp
s
.
r=1 s=1
∇j X i = X;ji = ∂j X i + X p Γijp ;
∇j ωi = ωi;j = ∂j ωi − ωp Γpij ;
∇m Rijkl = Rijkl;m = ∂m Rijkl − Rpjkl Γpim − Ripkl Γpjm − Rijpl Γpkm − Rijkp Γplm .
14.10 Proposição (Regra do Produto). Seja M uma variedade diferenciável dotada de uma conexão ∇.
Então
...jl jl+1 ...jl+q jl+1 ...jl+q jl+1 ...jl+q
∇m Fij11...i k
Gik+1 ...ik+p = ∇m Fij11...i
...jl
k
Gik+1 j1 ...jl
...ik+p + Fi1 ...ik ∇m Gik+1 ...ik+p .
Daı́,
j ...j j ...j
∇m Ti11...iklik+1
l+1 l+q
...ik+p
k+p
X
T ∂i1 , . . . , ∇∂im ∂ir , . . . , ∂ik , ∂ik+1 , . . . , ∂ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q
−
r=1
l+q
X
T ∂i1 , . . . , ∂ik , ∂ik+1 , . . . , ∂ik+p , dxj1 , . . . , ∇∂im dxjs , . . . , dxjl , dxjl+1 , . . . , dxjl+q .
−
s=1
Como
∂m T ∂i1 , . . . , ∂ik , ∂ik+1 , . . . , ∂ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q
...jl jl+1 ...jl+q
= ∂m Fij11...i k
G ik+1 ...ik+p
j1 ...jl jl+1 ...jl+q j1 ...jl jl+1 ...jl+q
= ∂m Fi1 ...ik Gik+1 ...ik+p + Fi1 ...ik ∂m Gik+1 ...ik+p ,
k+p
X
T ∂i1 , . . . , ∇∂im ∂ir , . . . , ∂ik , ∂ik+1 , . . . , ∂ik+p , dxj1 , . . . , dxjl , dxjl+1 , . . . , dxjl+q
r=1
k
X
F ∂i1 , . . . , ∇∂im ∂ir , . . . , ∂ik , dxj1 , . . . , dxjl G ∂ik+1 , . . . , ∂ik+p , dxjl+1 , . . . , dxjl+q
=−
r=1
k+p
X
F ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl G ∂ik+1 , . . . , ∇∂im ∂ir , . . . , ∂ik+p , dxjl+1 , . . . , dxjl+q
−
r=k+1
k
X jl+1 ...jl+q
=− F ∂i1 , . . . , ∇∂im ∂ir , . . . , ∂ik , dxj1 , . . . , dxjl Gik+1 ...ik+p
r=1
k+p
X
Fij11...i
...jl
G ∂ik+1 , . . . , ∇∂im ∂ir , . . . , ∂ik+p , dxjl+1 , . . . , dxjl+q
− k
r=k+1
e
l+q
X
T ∂i1 , . . . , ∂ik , ∂ik+1 , . . . , ∂ik+p , dxj1 , . . . , ∇∂im dxjs , . . . , dxjl , dxjl+1 , . . . , dxjl+q
s=1
l
X
F ∂i1 , . . . , ∂ik , dxj1 , . . . , ∇∂im dxjs , . . . , dxjl G ∂ik+1 , . . . , ∂ik+p , dxjl+1 , . . . , dxjl+q
=−
s=1
l+q
X
F ∂i1 , . . . , ∂ik , dxj1 , . . . , dxjl G ∂ik+1 , . . . , ∂ik+p , dxjl+1 , . . . , ∇∂im dxjs , . . . , dxjl+q
−
s=l+1
l
X jl+1 ...jl+q
=− F ∂i1 , . . . , ∂ik , dxj1 , . . . , ∇∂im dxjs , . . . , dxjl Gik+1 ...ik+p
s=1
l+q
X
Fij11...i
...jl
G ∂ik+1 , . . . , ∂ik+p , dxjl+1 , . . . , ∇∂im dxjs , . . . , dxjl+q ,
− k
s=l+1
Rodney Josué Biezuner 210
segue que
j ...j j ...j
∇m Ti11...iklik+1
l+1 l+q
...ik+p
" k
X
= ∂m Fij11...i...jl
F ∂i1 , . . . , ∇∂im ∂ir , . . . , ∂ik , dxj1 , . . . , dxjl
k
−
r=1
l
#
j ...j
X
F ∂i1 , . . . , ∂ik , dxj1 , . . . , ∇∂im dxjs , . . . , dxjl
l+1 l+q
− Gik+1 ...ik+p
s=1
k+p
"
jl+1 ...jl+q
X
Fij11...i
...jl
G ∂ik+1 , . . . , ∇∂im ∂ir , . . . , ∂ik+p , dxjl+1 , . . . , dxjl+q
+ k
∂m Gik+1 ...ik+p −
r=k+1
l+q
#
X
G ∂ik+1 , . . . , ∂ik+p , dxjl+1 , . . . , ∇∂im dxjs , . . . , dxjl+q
−
s=l+1
jl+1 ...jl+q jl+1 ...jl+q
= ∇m Fij11...i
...jl
k
Gik+1 ...ik+p + F j1 ...jl
i1 ...ik ∇ m Gik+1 ...ik+p .
Este resultado justifica a notação ∇m .
14.11 Lema. Seja M uma variedade métrica. Então
∇k gij = gij;k = 0
e
ij
∇k g ij = g;k =0
para todos os ı́ndices i, j, k.
Prova: Embora já tenhamos demonstrado a primeira afirmação na Proposição 14.4, forneceremos outra
demonstração que a derivada covariante total do tensor métrica g é o tensor identicamente nulo usando a
fórmula para as componentes da derivada covariante. De fato, pelo Corolário 11.25,
Logo,
∇k gij = gij;k = ∂k gij − gip Γpjk − gpj Γpik = 0.
Para calcular ∇k g ij , primeiro observamos que
∇k δij = δi;k
j
= ∂k δij + δip Γjpk − δpj Γpik
= δii Γjik − δjj Γjik
= 0.
Portanto,
∇k gip g pj = ∇k δij = 0.
g li gip ∇k g pj = 0,
segue que
0 = δpl ∇k g pj = ∇k g lj .
Em vista dos resultados acima, a derivada covariante se comporta bem com a operação de subir ou descer
um ı́ndice:
14.12 Proposição. Seja M uma variedade métrica. Então
j ...j j1 ...jl−1 p j ...j p
∇m Ti11...ikl−1
ik+1 = ∇ m gi k+1 p Ti1 ...ik = gik+1 p ∇m Ti11...ikl−1 , (14.12)
e
j ...jl jl+1
∇m Ti11...ik−1 = ∇m g jl+1 p Tij11...i
...jl
k−1 p
= g jl+1 p ∇m Tij11...i
...jl
k−1 p
. (14.13)
∇f = ∂i f dxi .
É comum denotar
fi = ∂i f, (14.14)
de modo que
∇2 f = ∇j fi dxi ⊗ dxj = fi;j dxi ⊗ dxj .
Temos
∇j fi = fi;j = ∂j fi − fp Γpij = ∂ij
2
f − Γkij ∂k f. (14.15)
Ou seja,
∇2 f = ∂ij
2
f − Γkij ∂k f dxi ⊗ dxj .
(14.16)
Também é comum escrever
2
fij = ∂ij f, (14.17)
de modo que
∇2 f = fij − fk Γkij dxi ⊗ dxj .
(14.18)
Daı́ obtemos a fórmula do laplaciano em coordenadas:
∆f = trg ∇2 f = g ij ∇2 f
ij
= g ij ∂ij
2
f −g ij
Γkij ∂k f.
Rodney Josué Biezuner 212
14.14 Proposição (Identidade de Bianchi Diferencial). Seja M uma variedade métrica. A derivada cova-
riante total do tensor curvatura satisfaz a seguinte propriedade:
Em termos de componentes,
Prova: Em primeiro lugar, devido à propriedade de simetria 14.14 (c) do tensor curvatura, a identidade do
enunciado é equivalente à identidade
A vantagem desta identidade é que o campo na quarta posição é o mesmo (isto é, Y ) em todos os termos.
Por multilinearidade, basta provar que
Daı́, em p,
= ∇∂m ∇∂i ∇∂j ∂k − ∇∂m ∇∂j ∇∂i ∂k + ∇∂i ∇∂j ∇∂m ∂k − ∇∂i ∇∂m ∇∂j ∂k
+∇∂j ∇∂m ∇∂i ∂k − ∇∂j ∇∂i ∇∂m ∂k , ∂l
= ∇∂j ∇∂m ∇∂i ∂k − ∇∂m ∇∂j ∇∂i ∂k + ∇∂m ∇∂i ∇∂j ∂k − ∇∂i ∇∂m ∇∂j ∂k
+∇∂i ∇∂j ∇∂m ∂k − ∇∂j ∇∂i ∇∂m ∂k , ∂l
= R (∂j , ∂m ) ∇∂i ∂k + R (∂m , ∂i ) ∇∂j ∂k + R (∂i , ∂j ) ∇∂m ∂k , ∂l
= hR (∂j , ∂m ) 0 + R (∂m , ∂i ) 0 + R (∂i , ∂j ) 0, ∂l i
= 0,
div X = ∂i X i = ∇i X i .
Isto é,
div X = tr ∇X.
Dado um campo vetorial X ∈ T (M ), de maneira análoga definimos sua divergência por
div X = tr ∇X.
Em coordenadas,
div X = ∇i X i = X;ii .
Para definir a divergência de um campo covetorial ω ∈ T1 (M ), observe que ao descermos ı́ndices no último
termo obtemos
X;ii = g ij Xj;i = g ij X [ = trg ∇ X [ ,
j;i
Observe que
∆f = trg ∇2 f = div ∇f.
Em coordenadas, se T é um 2-tensor contravariante,
(div T )i = ∇j T ij = T;jij .
se T é um 2-tensor covariante,
(div T )i = g jk ∇k Tij .
14.16 Proposição. Seja M uma variedade métrica. Então
Daı́,
g jl (∇m Rijkl + ∇k Rijlm + ∇l Rijmk ) = 0,
donde, pela regra do produto e pelo fato que ∇p g rs = 0,
∇m g jl Rijkl + ∇k g jl Rijlm + g jl ∇l Rijmk = 0.
(14.23)
Como
Rpq = g rs Rrpqs ,
Rijkl = −Rjikl ,
Rijlm = Rjiml ,
o primeiro termo desta soma é
−∇m Rik ,
enquanto que o segundo termo é
∇k Rim .
Logo a identidade (14.23) é equivalente a
∇m Rik = ∇k Rim + g jl ∇l Rijmk .
Daı́,
g ik ∇m Rik = g ik ∇k Rim + g ik g jl ∇l Rijmk
= (div Ric)m + g jl ∇l g ik Rijmk
14.17 Proposição. Se M n é uma variedade de Einstein conexa e n > 3, então M tem curvatura escalar
constante.
Prova: Temos
S
Ric = g,
n
donde
S
Rij = gij
n
e, portanto,
1
∇k Rij = gij ∇k S.
n
Logo,
1 kj 1 1
(div Ric)i = g jk ∇k Rij = g gij ∇k S = δik ∇k S = ∇i S.
n n n
Segue da proposição anterior que
∇S ∇S
= .
2 n
Se n 6= 2, esta identidade implica que
∇S = 0
e portanto S ≡ constante, se M é conexa.
Como toda variedade riemanniana de dimensão 2 é uma variedade de Einstein e existem variedades de
dimensão 2 que não possuem curvatura escalar constante, este resultado não vale se n = 2.
Capı́tulo 15
O Tensor Momento-Energia
Na Teoria da Relatividade Geral, o tensor momento-energia (também chamado tensor tensão-energia) des-
creve a densidade e fluxo de energia e momento no espaçotempo e é responsável por criar a curvatura no
espaçotempo. Nas palavras de Wheeler, o espaçotempo age na matéria dizendo a ela como se mover [isto
é, na ausência de forças atuando, apenas sob o efeito de sua própria inércia, ao longo das geodésicas do
espaçotempo]; por sua vez, a matéria age sobre o espaçotempo, dizendo a ele como se curvar ([MTW], Seção
1.2, p. 5). Exceto que matéria na Teoria da Relatividade possui um significado mais geral, não restrito
apenas à massa.
15.1 4-Vetores
Tanto na Teoria da Relatividade Especial quanto na Geral, é conveniente descrever o movimento de um
objeto em um referencial inercial (em Relatividade Especial) ou em um sistema de coordenadas geral (em
Relatividade Geral) em coordenadas do espaçotempo dependendo do seu tempo próprio τ , isto é, de acordo
com o tempo medido em seu próprio referencial, e portanto independente de referencial. Assim, em um
referencial inercial a trajetória de uma partı́cula livre é uma curva parametrizada pelo tempo próprio
α (τ ) = (t (τ ) , x (τ ) , y (τ ) , z (τ )) ,
e a geodésica γ que uma partı́cula livre segue no espaçotempo curvo seria parametrizada pelo tempo próprio
γ (τ ).
Vetores no espaçotempo tem 4 coordenadas e para distingui-los dos vetores espaciais (projeções espaciais),
são frequentemente chamados de quadrivetores ou 4-vetores. Assim, temos o quadrivetor deslocamento,
ou seja deslocamento no espaçotempo
e o quadrivetor velocidade
ds dt dx dy dz
u= = , , , , (15.1)
dτ dτ dτ dτ dτ
ou α0 (τ ) para uma trajetória curva α (τ ) no espaçotempo. O quadrivetor velocidade é por definição tangente
à trajetória da partı́cula no espaçotempo.
Observe que se a trajetória do objeto no espaçotempo é uma curva, o seu referencial próprio obviamente
não é um referencial inercial. Entretanto, em cada instante de tempo existe um referencial inercial que tem
a mesma velocidade que o objeto; este referencial inercial que comove com o objeto é temporário, pois no
próximo instante de tempo ele não está mais se comovendo com o objeto. Ele é chamado o seu referencial
comóvel temporário (em inglês: momentarily comoving reference frame (MCRF)). O quadrivetor velocidade
215
Rodney Josué Biezuner 216
u ≈ (1, v x , v y , v z ) = (1, v) ,
u = (1, 0, 0, 0) .
Em particular, segue também que se v 6= 1 o quadrivetor velocidade é um vetor unitário, isto é,
kuk = 1 (15.4)
pois
1 1
hu, ui = √ (1, v x , v y , v z ) , √ (1, v x , v y , v z )
1 − v2 1 − v2
1 h x 2 y 2 z 2
i
= −1 + (v ) + (v ) + (v )
1 − v2
1
−1 + v 2
= 2
1−v
= −1.
15.2 Momento-Energia
15.1 Definição. Se m é a massa de um objeto, definimos o quadrivetor momento-energia
P = mu. (15.5)
Rodney Josué Biezuner 217
de modo que
kPk = m. (15.7)
Note que a massa m de um objeto, sendo a norma do quadrivetor momento-energia (um vetor do espaçotempo
de Minkowski), tem o mesmo valor em qualquer referencial inercial. Em outras palavras, ela não depende
da velocidade do referencial: massa não aumenta com a velocidade e na teoria da relatividade não se define
“massa relativı́stica” (veja [Okun1] para uma exposição clara, incluindo a origem histórica deste termo e
até seu uso inicial por Einstein para inferir a atração da luz por uma massa gravitacional (ele raciocinou
que fótons teriam massa m = E/c2 ), antes de formular a Teoria da Relatividade Geral, quando abandonou
essa idéia inconsistente, e uma coletânea de artigos criticando os conceitos de “massa de repouso” e “massa
relativı́stica” em [Okun2]). Por outro lado, massa é mais facilmente medida em um referencial em que o
objeto está em repouso.
Observe que m = 0 se e somente se P é um vetor do tipo luz, e consequentemente u também é, donde
v = 1. Portanto, fótons não possuem massa.
15.2 Definição. A componente temporal do quadrivetor momento-energia é chamada a energia rela-
tivı́stica E do objeto e sua projeção espacial o seu momento relativı́stico p.
Assim,
m
E=√ ,
1 − v2
mv x mv y mv z
m
p= √ v= √ , √ , √ ,
1 − v2 1 − v2 1 − v2 1 − v2
de modo que
m2 = E 2 − p2 . (15.8)
Note que tanto a energia relativı́stica quanto o momento relativı́stico dependem do referencial, já que são
componentes (coordenadas) de um quadrivetor. Observe também que massa não é a mesma coisa que energia:
energia é a componente temporal do quadrivetor momento-energia, enquanto que massa é a magnitude deste
vetor. Apenas que, em relatividade, elas são medidas com as mesmas unidades de medida (quilogramas), da
mesma forma que tempo e espaço em relatividade são medidos com as mesmas unidades de medida (metros),
apesar de não serem a mesma coisa.
Em unidades do espaçotempo (ct, x, y, z) em que a velocidade da luz é c e não normalizada para 1, a
relação entre o tempo próprio e o tempo em um referencial inercial arbitrário é
r v 2
τ = 1− t
c
e o quadrivetor velocidade tem coordenadas
1 x y z 1
u= r v 2 (c, v , v , v ) = r v 2 (c, v) ,
1− 1−
c c
Rodney Josué Biezuner 218
15.3 Fluxos
15.3.1 Definição
Fluxo (flux ) é a taxa de transferência de um material (uma grandeza concreta tal como, por exemplo, massa,
carga elétrica, número de partı́culas) ou propriedade (uma grandeza abstrata tal como, por exemplo, energia
ou momento) ao longo de uma direção, por unidade de área, por unidade de tempo. Ele é portanto uma
grandeza vetorial, cuja unidade é quantidade de material ou propriedade por unidade de área por unidade
de tempo. Por exemplo, o material pode estar sendo transferido da esquerda para a direita no eixo x, ou
na direção normal a uma certa superfı́cie de referência. [Às vezes, fluxo por unidade de tempo é chamado
simplesmente de fluxo, enquanto que fluxo por unidade de área por unidade de tempo é chamado de densidade
de fluxo.]
15.3 Exemplo. No fluxo de massa o material transferido comumente se refere a um fluido (taxa de
transferência de fluido, ou seja, taxa de escoamento) ou a uma certa substância dissolvida em um fluido. A
taxa de transferência de massa pode ser medida, por exemplo, em kg/m2 s ou, o que é equivalente no caso
de um fluido de densidade constante, em litros/m2 s.
Um exemplo simples de fluxo de energia é a taxa de transferência de calor, que é energia térmica,
medida em joules/m2 s.
No fluxo de momento, a taxa de transferência dada por unidades de momento por unidade de área
por unidade de tempo, tem as mesmas unidades de força por área ((kg·m/s)/m2 s = (kg·m/s2 )/m2 ), ou seja,
pressão. Assim, a força aplicada a um objeto pode ser vista como a taxa de transferência de momento para
o objeto. O fluxo de momento também chamado estresse.
No que se segue, convencionaremos que o fluxo será positivo quando a transferência de material ou proprie-
dade é no sentido orientado positivo do eixo xi . Se o fluxo tem sinal negativo, isso significa que a transferência
de material está-se realizando no sentido orientado negativo do eixo xi .
Rodney Josué Biezuner 219
Em um referencial inercial em que as partı́culas não estão em repouso, digamos em que as partı́culas tem
velocidade v, o volume é alterado devido à contração
√ de Lorentz: por exemplo, um paralelepı́pedo sólido
de volume ∆x∆y∆z terá um volume ∆x∆y∆z 1 − v 2 medido em um referencial em que as partı́culas tem
velocidade v em uma das direções x, y, z. A densidade do número de partı́culas será então
n
√ .
1 − v2
O fluxo de partı́culas é o número de partı́culas que atravessam uma superfı́cie por unidade de área, por
unidade de tempo. Além da orientação da superfı́cie, em Relatividade área e tempo dependem do referencial.
Obviamente, no referencial em que as partı́culas estão em repouso o fluxo é zero. Em um referencial em que
as partı́culas movem-se com todas com a velocidade v em uma mesma direção, digamos na direção x0 , se
considerarmos a superfı́cie normal a x0 a área será a mesma (já que não há contração nas direções transversais
Rodney Josué Biezuner 220
N = nu
Logo,
n n
N= √ (1, v x , v y , v z ) = √ (1, v) .
1−v 2 1 − v2
Note que a densidade do número de partı́culas no referencial próprio é a norma do quadrivetor fluxo e
portanto independente do referencial inercial (o que também é óbvio da definição dela):
de modo que
kNk = n. (15.9)
Para obter o tensor momento-energia da poeira, vamos assumir por simplicidade que as partı́culas tem a
mesma massa m. No referencial comóvel temporário das particulas, em que elas se encontram em repouso,
a energia de cada partı́cula é a energia de repouso m. Portanto, a energia por unidade de volume, ou seja,
a densidade de energia, é
ρ = nm.
Em fluidos mais gerais, existe um movimento aleatório das partı́culas, logo energia cinética de movimento
(mesmo em um referencial média dos referenciais) e a densidade de energia do fluido terá uma expressão
bem diferente. Em um referencial em que as partı́culas se movem com a mesma velocidade v, a densidade
de energia ainda é o número de partı́culas por unidade de volume vezes a energia de cada partı́cula, que é
dada por
n m nm
ρ= √ √ = .
1−v 2 1−v 2 1 − v2
Para obter o tensor momento-energia da poeira, basta determinar os seus componentes em algum refe-
rencial. No caso da poeira, a determinação dos seus componentes no seu referencial comóvel temporário é
particularmente simples. Não há movimento das partı́culas, logo os momentos são todos nulos. Assim, no
referencial comóvel temporário, o tensor momento-energia tem componentes
ρ 0 0 0
0 0 0 0
T = 0 0 0 0 .
0 0 0 0
Rodney Josué Biezuner 221
div T = 0,
já que o divergente mede infinitesimalmente o fluxo total por unidade de volume (veja o apêndice a este
capı́tulo).
0 0 0 P
T = (ρ + P ) (u ⊗ u) + P g.
V x = V x (t, x, y, z) ,
V y = V y (t, x, y, z) ,
V z = V z (t, x, y, z) ,
Rodney Josué Biezuner 223
no instante inicial t = 0, esta derivada sendo calculada no instante de tempo t. Se o campo de escoamento é
dado através de uma expressão fechada (e não por uma expressão aproximada), então podemos conhecer o
campo de velocidades com exatidão. Obviamente, é mais difı́cil encontrar F, dado V, do que encontrar V,
dado F.
v1 (t) = d (Ft )x v1 ,
v2 (t) = d (Ft )x v2 ,
v3 (t) = d (Ft )x v3 .
Logo, pela regra da derivada do produto e a propriedade de comutatividade do produto escalar com o produto
vetorial, segue que
dV dv1 dv2 dv3
= · (v2 × v3 ) + v1 · × v3 + v1 · v2 ×
dt dt dt dt
dv1 dv2 dv3
= · (v2 × v3 ) + · (v3 × v1 ) + · (v1 × v2 ) .
dt dt dt
Em t = 0, temos
v2 × v3 = ε2 i,
v3 × v1 = ε2 j,
v1 × v2 = ε2 k.
dvi (t)
Para calcular , lembramos a definição do campo de escoamento F(t, x) do campo de velocidades V(x):
dt
dFt
(x) = V(Ft (x)).
dt
Derivando com relação a x, temos
dFt
d (x) = d [V(Ft )]x .
dt
Invertendo a ordem de derivação na derivada parcial mista do lado esquerdo e aplicando a regra da cadeia
no lado direito, temos
d
[d (Ft )x )] = dVFt (x) d (Ft )x . (15.10)
dt
Aplicando ambos os lados desta equação ao vetor vi = vi (0) obtemos no lado esquerdo (pois vi é um vetor
constante)
d d dvi
[d (Ft )x ] vi = [d (Ft )x vi ] = (t),
dt dt dt
enquanto que no lado direito obtemos
Segue que
dvi
(t) = dVFt (x) vi (t). (15.11)
dt
Em particular, em t = 0 temos F0 (x) = x, donde
dvi
= dVx vi ,
dt t=0
Lembremos a derivada da função determinante det : R3 ×R3 ×R3 −→ R. Escrevendo det X = det(X1 , X2 , X3 ),
onde X1 , X2 , X3 são as linhas da matrix X, a derivada do determinante em X é o funcional linear
d (det)X : R3 × R3 × R3 −→ R
Segue que
onde [d (Ft )x ]i denota a i-ésima linha da matriz d (Ft )x . Por outro lado, pela comutatividade dos operadores
d
diferenciais d e e pela regra da cadeia, temos
dt
d dFt
[d (Ft )x ] = d (x) = d [V(Ft (x))] = dVFt (x) d (Ft )x .
dt dt
Logo,
d
d (det)d(Ft ) [d (Ft )x ]
x dt
= det dVFt (x) d (Ft )x 1 , [d (Ft )x ]2 , [d (Ft )x ]3
+ det [d (Ft )x ]1 , dVFt (x) d (Ft )x 2 , [d (Ft )x ]3
+ det [d (Ft )x ]1 , [d (Ft )x ]2 , dVFt (x) d (Ft )x 3 .
Rodney Josué Biezuner 227
onde dVFt (x) d (Ft )x i denota a i-ésima linha da matriz dVFt (x) d (Ft )x . Daı́, usando a linearidade da função
determinante com relação a uma linha fixada, temos
det dVFt (x) d (Ft )x 1 , [d (Ft )x ]2 , [d (Ft )x ]3
P ∂V x ∂Ftj P 3 ∂V x ∂F j 3 ∂V x ∂F j
3
t P t
j j j
j=1 ∂x ∂x j=1 ∂x ∂y j=1 ∂x ∂z
2 2 2
= det ∂Ft ∂Ft ∂Ft
∂x ∂y ∂z
3 3 3
∂Ft ∂Ft ∂Ft
∂x ∂y ∂z
x 1 x 1 x 1
∂V ∂Ft ∂V ∂Ft ∂V ∂Ft ∂V x ∂Ft2 ∂V x ∂Ft2 ∂V x ∂Ft2
∂x ∂x ∂x ∂y ∂x ∂z ∂y ∂x ∂y ∂y ∂y ∂z
2 2 2
2 2
∂Ft ∂Ft ∂Ft ∂Ft ∂Ft ∂Ft2
= det + det
∂x ∂y ∂z ∂x ∂y ∂z
3 3 3 3 3 3
∂Ft ∂Ft ∂Ft ∂Ft ∂Ft ∂Ft
∂x ∂y ∂z ∂x ∂y ∂z
x 3 x 3 x 3
∂V ∂Ft ∂V ∂Ft ∂V ∂Ft
∂xz ∂x ∂z ∂y ∂z ∂z
2 2
∂Ft ∂Ft ∂Ft2
+ det
∂x ∂y ∂z
∂Ft3 ∂Ft3 ∂Ft3
∂x ∂y ∂z
1
∂Ft ∂Ft1 ∂Ft1 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft3 ∂Ft3 ∂Ft3
∂x ∂y ∂z ∂x ∂y ∂z ∂x ∂y ∂z
∂V x ∂V x ∂V x
∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2 ∂Ft2
= det
+ det +
∂xz det
∂x ∂x3 ∂y ∂z ∂y ∂x ∂y ∂z ∂x ∂y ∂z
∂Ft3 ∂Ft3 ∂Ft3 ∂Ft3 ∂Ft3 ∂Ft3 ∂Ft3 ∂Ft3
∂Ft
∂x ∂y ∂z ∂x ∂y ∂z ∂x ∂y ∂z
∂V x
= det d (Ft )x .
∂x
Similarmente,
∂V y
det [d (Ft )x ]1 , dVFt (x) d (Ft )x 2 , [d (Ft )x ]3 = det d (Ft )x ,
∂y
∂V z
det [d (Ft )x ]1 , [d (Ft )x ]2 , dVFt (x) d (Ft )x 3 = det d (Ft )x .
∂z
Portanto,
∂V x ∂V y ∂V z
d
d (det)d(Ft ) [d (Ft )x ] = Ft (x) + Ft (x) + Ft (x) det d (Ft )x
x dt ∂x ∂y ∂z
= div V(Ft (x)) det d (Ft )x .
onde, por definição, o lado direito é o fluxo total do campo V através da superfı́cie ∂Ω. Em particular,
se div V = 0 em um aberto de Rn , o fluxo total é nulo através de qualquer superfı́cie fechada contida no
aberto. Pelo Teorema do Valor Médio para Integrais,
Z
1
div V = div V (x)
vol Ω Ω
Consequentemente, Z
1
div V (x) = lim V · η.
ε→0 vol Bε (x) Sε (x)
Equação de Einstein
∆φ = 4πGρ, (16.1)
[Note que G e G denotam conceitos completamente diferentes, não relacionados.] Assim, pela segunda lei
de Newton, o campo gravitacional G por definição nada mais é que a aceleração da gravidade g:
F
G= = g.
m
Considerando um aberto Ω contendo a fonte 0 tal que sua fronteira é uma superfı́cie regular fechada ∂Ω,
segue que Z Z
1
G · n ds = −GM 2
r·n ds.
b
∂Ω ∂Ω r
16.1 Lema. Se Ω ⊂ R3 é um aberto tal que sua fronteira ∂Ω é uma superfı́cie regular fechada e 0 ∈
/ ∂Ω,
vale Z
1 4π se 0 ∈ Ω,
r·n ds =
2 0 se 0 ∈
/ Ω.
b
∂Ω r
Prova: Primeiro observamos que
r
b
div = 0.
r2
229
Rodney Josué Biezuner 230
De fato,
r
b x x1 , x2 , x3
= 3 = hP i3/2 ,
r2 kxk 3 2
(xi ) i=1
de modo que
hP
3 2 i3/2 2 hP3 2 i1/2
xi − 3 xi xi
" i # i
r
b x i=1 i=1
∂i = ∂i h i3/2 =
r2 P3 2
hP
3 2
i5/2
i=1 (xi ) i=1 (xi )
2
1 3 xi
= 2 − 4 ,
kxk kxk
logo
3 i P3 2
xi
r X r 3 i=1
−3
b b
div 2 = ∂i = 2 4 = 0.
r i=1
r2 kxk kxk
1
Considere primeiro o caso 0 ∈
/ Ω, de modo que o campo vetorial 2 b r é um campo suave em Ω. Podemos
r
então aplicar o Teorema da Divergência para obter
Z Z
1 r
·n
b
2
r
b ds = div 2 dv = 0.
∂Ω r Ω r
1
Se 0 ∈ Ω, o campo vetorial r tem uma singularidade em 0 e o Teorema da Divergência não se aplica
r2
b
à região Ω. Considere então uma esfera de raio R centrada em 0 e contida em Ω. Então o aberto Ω\BR (0)
cuja fronteira é ∂Ω ∪ SR (0) não contém a singularidade 0, logo segue do resultado anterior que
Z
1
2
r·n ds = 0.
b
∂Ω∪SR (0) r
Como Z Z Z
1 1 1
r·n ds = r·n ds + r·n ds,
r2 r2 r2
b b b
∂Ω∪SR (0) ∂Ω SR (0)
temos que Z Z
1 1
r·n ds = − r·n ds.
r2 r2
b b
∂Ω SR (0)
Nesta última integral, para manter a convenção de n ser o vetor normal apontando para fora da superfı́cie
em relação ao aberto que ela engloba, o vetor n aponta para dentro da esfera, isto é,
n = −b
r,
de modo que Z Z
1 1 1
2
r·n ds = 2 ds = 4πR2 = 4π.
R2
b
∂Ω r R ∂Ω
Segue do Lema 16.1 que Z
G · n ds = −4πGM.
∂Ω
Rodney Josué Biezuner 231
Também segue dela que se Ω é um aberto tal que Ω não contém a fonte, teremos
Z
G · n ds = 0.
∂Ω
Isso significa que cada partı́cula de massa M dentro da região Ω contribui para a integral de superfı́cie o
valor −4πGM , enquanto que partı́culas fora da região Ω não contribuem nada. Portanto, o valor da integral
é −4πG vezes a massa total dentro da região Ω. Para uma distribuição contı́nua de massa com densidade
de massa ρ (x), a massa total dentro da região Ω é dada por
Z
ρ dv.
Ω
Consequentemente, Z Z
G · n ds = −4πG ρ dv
∂Ω Ω
Mas, pelo Teorema da Divergência, também temos que
Z Z
G · n ds = div G dv,
∂Ω Ω
logo, Z
[div G + 4πGρ] dv = 0.
Ω
Como isso é válido para qualquer domı́nio Ω com fronteira regular arbitrário, segue que
div G = −4πGρ.
div T = 0.
deve ser também um 2-tensor simétrico com divergência nula. Chamamos este tensor de tensor de Einstein
e o denotamos por G. Desta forma, a equação para a geração da gravidade (isto é, para o efeito da massa-
energia sobre a curvatura do espaçotempo) é
G = κT,
onde κ é uma constante de proporcionalidade a ser determinada mais tarde (o fato que irá determiná-la é
simplesmente a exigência que no limite para campos gravitacionais estáticos, relativamente fracos, ela deverá
corresponder à lei da gravitação universal de Newton). Portanto, o 2-tensor simétrico G deve ser construı́do
apenas a partir do tensor da curvatura de Riemann e da métrica, deve satisfazer div G = 0 e deve ser em
princı́pio uma função linear da curvatura (se vamos medir a curvatura, não há motivo para medi-la de uma
forma complicada, não linear). Estas exigências naturais determinam o tensor G:
1
G = Ric − Sg. (16.3)
2
Em termos de componentes, a equação de Einstein se escreve na forma covariante
1
Rij − Sgij = κTij , (16.4)
2
e na forma contravariante
1
Rij − Sg ij = κT ij . (16.5)
2
A equação de Einstein é portanto um sistema de 10 equações independentes, já que os tensores envolvidos são
simétricos. Cada uma destas equações é uma equação parcial diferencial não linear de segunda ordem, isto
2
é, envolvendo gij , ∂k gij e ∂kl gij , as componentes da métrica e suas derivadas parciais de primeira e segunda
ordem. Por outro lado, gij são as componentes da métrica em algum sistema de coordenadas particular,
e como há 4 coordenadas, temos 4 graus de liberdade, o que em princı́pio deveria tornar impossı́vel obter
uma solução única a partir de dados iniciais e de fronteira, como em problemas bem determinados tı́picos de
EDPs. No entanto, a condição ∇G = 0, que corresponde a 4 equações, faz com que o sistema efetivamente
possua apenas 6 equações independentes para as 6 componentes gij que permitem caracterizar a geometria
independentemente das coordenadas.
Podemos obter a curvatura escalar exclusivamente em termos do tensor momento-energia, o que ajuda
muito em certos cálculos. De fato, fazendo a contração em relação à métrica da equação de Einstein, como
trg Ric = S,
trg g = 4,
obtemos
S = −κ trg T. (16.6)
Em termos de componentes,
S = −κg ij Tij = −κTii = −κgij T ij .
Assim, a equação de Einstein pode reescrita na forma
1
Ric = κ T − (trg T ) g . (16.7)
2
Ric = 0.
Isso não significa que a curvatura do espaçotempo no vácuo é nula, pois o tensor de Ricci não contém toda
a informação da curvatura: podemos ter Ric = 0 mas R 6= 0 (isso acontece com a métrica de Schwarzschild,
como veremos mais tarde).
Rodney Josué Biezuner 233
d2 xk dxi dxj
2
+ Γkij = 0,
dτ dτ dτ
para k = 0, 1, 2, 3, x0 = ct.
Primeiro vamos usar o princı́pio de equivalência para obter uma expressão para a aceleração da gravidade.
Considere uma partı́cula livre no seu referencial comovente temporário em que ela está em repouso, de modo
que
dxj
= 0, i = 1, 2, 3,
dτ
dx0 dt
=c .
dτ dτ
Para k = 1, 2, 3, temos então que
2
d2 xk
dt
= −c2 Γk00 .
dτ 2 dτ
Escolhendo t = τ , segue que
d2 xk
= −c2 Γk00 ,
dτ 2
isto é, a aceleração da partı́cula é
a = −c2 Γ100 , Γ200 , Γ300 .
(16.8)
Rodney Josué Biezuner 234
Esta é, pelo princı́pio de equivalência, a aceleração da gravidade g. Suas componentes são os sı́mbolos
de Christoffel Γ100 , Γ200 , Γ300 . Vamos calcular estes sı́mbolos em um campo gravitacional fraco.
A hipótese de um campo gravitacional fraco permite escrever a métrica do espaçotempo na forma
onde ηij é a métrica de Minkowski e hij é uma pequena perturbação, isto é,
|hij | 1.
Assumindo que o tensor métrica g e h são diagonais (o que é razoável, já que o tensor momento-energia
é, conforme veremos mais abaixo), temos
gij = 0, se i 6= j,
donde
1
g ii = ,
gii
g ij = 0, se i 6= j,
ou seja
2
ds = − 1 + 2 φ c2 dt2 + dx2 + dy 2 + dz 2 .
2
(16.10)
c
Queremos apenas determinar κ. Usando as equações de Einstein na forma (16.7), escolhemos trabalhar
com a equação
1
R00 = κ T00 − g00 trg T .
2
Vamos calcular primeiro R00 . Como
k
Rij = Rkij ,
segue que
k
R00 = Rk00 ,
0
já que R000 = 0, pelas simetrias do tensor endomorfismo curvatura. Temos
l
∂Γljk ∂Γlik
Rijk = Γm Γ l
jk im − Γm l
ik jm +
Γ i
− .
∂x ∂xj
Mas, como |h00 | 1, a métrica é aproximadamente de Minkowski e podemos assumir que os sı́mbolos de
Christoffel se anulam, pois
1
Γkij = (∂i gjm + ∂j gim − ∂m gij ) g mk
2
e as componentes da métrica gij são aproximadamente constantes, logo suas derivadas se anulam. Portanto,
l
∂Γljk ∂Γlik
Rijk = i
− .
∂x ∂xj
Daı́,
k ∂Γk00 ∂Γkk0
Rk00 = k
− .
∂x ∂x0
Como estamos supondo um campo estático, que não depende da variável temporal x0 , qualquer derivada em
relação a esta variável é nula, logo
k ∂Γk00
Rk00 =
∂xk
e
1
Γk00 = (∂i gjm + ∂j gim − ∂m gij ) g mk
2
1
= (∂0 g0m + ∂0 g0m − ∂m g00 ) g mk
2
1
= − (∂m g00 ) g mk
2
1
= − (∂k g00 ) g kk .
2
Assim, para k = 1, 2, 3,
k 1 2 1
∂kk g00 g kk = 2 ∂kk
2
Rk00 = φ .
2 c
Consequentemente,
1
R00 = ∆φ. (16.11)
c2
Rodney Josué Biezuner 236
O tensor momento-energia para fluidos perfeitos velocidades baixas (v/c ≈ 0) é dominado pelo compo-
nente T 00 = ρc2 e as outras componentes podem ser consideradas nulas. Portanto, usando g00 ≈ η00 = −1,
obtemos
trg T = η00 T 00 = −ρc2
e
1 1
T00 − g00 trg T = T00 − η00 η00 T 00
2 2
1
= T00
2
1
= ρc2 .
2
Concluı́mos que no limite Newtoniano a equação
1
R00 = κ T00 + g00 trg T
2
é
1 2
∆φ = κc ρ. (16.12)
2
Comparando com a equação da gravitação universal de Newton (16.2)
∆φ = 4πGρ,
concluı́mos que
8πG
κ=
, (16.13)
c2
às vezes chamada a constante gravitacional de Einstein. Usando unidades geometrizadas G = c = 1, a
equação de Einstein se escreve na forma
1
Ric − Sg = 8πT. (16.14)
2
G = κρui uj .
Derivando
2
kuk = gij ui uj = ui uj = −1, (16.16)
obtemos
uj uj
;i
= 0,
donde, novamente pela regra do produto,
uj;i uj + uj uj;i = 0.
uj;i uj = 0. (16.17)
ρui uj;i = 0.
∂ 2 xj ∂xi ∂xk j
+ Γ = 0.
∂τ 2 ∂τ ∂τ ik
Rodney Josué Biezuner 238
G + Λg = 8πT.
Observe que o tensor G + Λg continua sendo livre de divergência. Esta equação modificada admite uma
solução estática para o universo (veja [MTW], Cap. 27, Box 27.5). Por outro lado, no vácuo onde T = 0, a
equação modificada de Einstein se torna
1
Ric − Sg + Λg = 0,
2
ou seja,
G = −Λg
e não mais G = 0, de modo que podemos dizer que a constante cosmológica mede a densidade de energia
do vácuo (o que é consistente com a noção de que o vácuo não é realmente vazio de acordo com a teoria
quântica). Tomando o traço desta equação com respeito à métrica, como trg Ric = S e trg g = 4, segue que
S − 2S + 4Λ = 0
ou seja,
S = 4Λ.
Segue que a equação de Einstein para o vácuo é
Ric = Λg.
A Solução de Schwarzschild
Por exemplo, uma carta deste atlas seria (ϕ, R × (0, +∞) × (0, π) × (0, 2π)); variando o domı́nio de θ e φ,
cobrimos todo M com exceção da origem. Note que aqui θ = constante denota paralelos e φ = constante
denota meridianos (o exemplo de carta dado deixa de cobrir um semiplano fechado de R3 ). Neste tipo de
carta temos
∂0 ϕ = ∂t ϕ = (1, 0, 0, 0) ,
∂1 ϕ = ∂r ϕ = (0, sen φ cos θ, sen φ sen θ, cos φ) ,
∂2 ϕ = ∂θ ϕ = (0, r cos θ cos φ, r cos θ sen φ, −r sen θ) ,
∂3 ϕ = ∂φ ϕ = (0, −r sen θ sen φ, r sen θ cos φ, 0) ,
239
Rodney Josué Biezuner 240
Fazendo uma mudança de variável em R+ , podemos considerar C (r) = r2 , logo podemos escrever a métrica
de Schwarzschild na forma
ds2 = −T (r) dt2 + D (r) dr2 + r2 dσ 2 .
Nesta normalização, em cada espaço de repouso t = constante, a superfı́cie r = constante é a esfera padrão
S2r de raio r, com curvatura gaussiana 1/r2 e área 4πr2 .
A única fonte de gravitação no universo de Schwarzschild é a própria estrela, que não modelamos. Logo
o espaçotempo é um vácuo e a equação de Einstein implica que
Ric = 0,
lim D (r) → 1.
r→+∞
em R × R+ × S2 satisfaz Ric = 0 e
lim D (r) → 1.
r→+∞
se e somente se
T (r) = −f (r) ,
1
D (r) = ,
f (r)
com
2M
f (r) = 1 − .
r
Prova: Veja [ONeill], Lemma 13.1, p. 366.
17.2 Definição. Considere a variedade diferenciável M = R × (2M, +∞) × S2 . M torna-se uma variedade
de Lorentz quando definimos nela a métrica de Schwarzschild
2M 1
ds2 = − 1 − dt2 + dr2 + r2 dθ2 + r2 sen2 θdφ2 . (17.2)
r 2M
1−
r
Para as coordenadas de Schwarzschild (t, r, θ, φ) temos
2M r − 2M
g00 = − 1 − =− ,
r r
1 r
g11 = = ,
2M r − 2M
1−
r
g22 = r2 , (17.3)
2 2
g33 = r sen θ,
gij = 0 se i 6= j.
Verificaremos agora que a métrica de Schwarzschild tem curvatura de Ricci nula, mas o seu tensor curvatura
não é nulo, logo M não é localmente isométrica à métrica plana.
Rodney Josué Biezuner 242
e, caso contrário,
∂k gij = 0. (17.8)
Logo, de (17.3), (17.4), (17.6) e (17.7) segue que, para k = 0,
1 1
Γ0ij = (∂i gj0 + ∂j gi0 − ∂0 gij ) g 00 = (∂i gj0 + ∂j gi0 ) g 00 ,
2 2
Rodney Josué Biezuner 243
para k = 1,
1
Γ1ij = (∂i gj1 + ∂j gi1 − ∂1 gij ) g 11 ,
2
1 1
Γ100 = (2∂0 g01 − ∂1 g00 ) g 11 = − (∂1 g00 ) g 11
2 2
M 2M 2 M (r − 2M )
= 2 − 3 = ,
r r r3
1
Γ101 = Γ110 = (∂0 g11 + ∂1 g01 − ∂1 g01 ) g 11 = 0,
2
1
Γ102 1
= Γ20 = (∂0 g21 + ∂2 g01 − ∂1 g02 ) g 11 = 0,
2
1
Γ103 = Γ130 = (∂0 g31 + ∂3 g01 − ∂1 g03 ) g 11 = 0,
2
1 M
Γ111 = (∂1 g11 ) g 11 = − ,
2 r (r − 2M )
1
Γ112 = Γ121 = (∂1 g21 + ∂2 g11 − ∂2 g12 ) g 11 = 0,
2
1
Γ113 = Γ31 = (∂1 g31 + ∂3 g11 − ∂1 g13 ) g 11 = 0,
1
2
1 1
Γ122 = (2∂2 g21 − ∂1 g22 ) g 11 = − (∂1 g22 ) g 11 = 2M − r,
2 2
1
Γ123 = Γ32 = (∂2 g31 + ∂3 g21 − ∂1 g23 ) g 11 = 0,
1
2
1 1
Γ133 = (2∂3 g31 − ∂1 g33 ) g 11 = − (∂1 g33 ) g 11 = (2M − r) sen2 θ;
2 2
para k = 2,
1
Γ2ij = (∂i gj2 + ∂j gi2 − ∂2 gij ) g 22 ,
2
Rodney Josué Biezuner 244
1
Γ200 = (∂0 g02 + ∂0 g02 − ∂2 g00 ) g 22 = 0,
2
1
Γ201 = Γ210 = (∂0 g12 + ∂1 g02 − ∂2 g01 ) g 22 = 0,
2
1
Γ202 = Γ20 = (∂0 g22 + ∂2 g02 − ∂2 g02 ) g 22 = 0,
2
2
1
Γ203 = Γ230 = (∂0 g32 + ∂3 g02 − ∂2 g03 ) g 22 = 0,
2
1
Γ211 = (∂1 g12 + ∂1 g12 − ∂2 g11 ) g 22 = 0,
2
1 1 1
Γ212 = Γ221 = (∂1 g22 + ∂2 g12 − ∂2 g12 ) g 22 = (∂1 g22 ) g 22 = ,
2 2 r
1
Γ213 2 22
= Γ31 = (∂1 g32 + ∂3 g12 − ∂2 g13 ) g = 0,
2
1
Γ222 = (∂2 g22 ) g 22 = 0,
2
1
Γ223 = Γ232 = (∂2 g32 + ∂3 g22 − ∂2 g23 ) g 22 = 0,
2
1 1
Γ233 = (∂3 g32 + ∂3 g32 − ∂2 g33 ) g 22 = − (∂2 g33 ) g 22 = − sen θ cos θ;
2 2
e, finalmente, para k = 3,
1 1
Γ3ij = (∂i gj3 + ∂j gi3 − ∂3 gij ) g 33 = (∂i gj3 + ∂j gi3 ) g 33 ,
2 2
1
Γ300 = (∂0 g03 + ∂0 g03 ) g 33 = 0,
2
1
Γ301 = Γ310 = (∂0 g13 + ∂1 g03 ) g 33 = 0,
2
1
Γ302 = Γ20 = (∂0 g23 + ∂2 g03 ) g 33
3
= 0,
2
1
Γ303 3
= Γ30 = (∂0 g33 + ∂3 g03 ) g 33 = 0,
2
Γ311 = (∂1 g13 ) g 33 = 0,
1
Γ312 = Γ321 = (∂1 g23 + ∂2 g13 ) g 33 = 0,
2
1 1 1
Γ313 = Γ31 = (∂1 g33 + ∂3 g13 ) g 33
3
= (∂1 g33 ) g 33 = ,
2 2 r
Γ322 = (∂2 g23 ) g 33 = 0,
1 1 cos θ
Γ323 = Γ332 = (∂2 g33 + ∂3 g23 ) g 33 = (∂2 g33 ) g 33 = ,
2 2 sen θ
Γ333 = (∂3 g33 ) g 33 = 0.
17.4 Proposição. A métrica de Schwarzschild satisfaz
Ric = S = 0. (17.9)
Ela não é uma métrica plana, pois o seu tensor curvatura não é nulo, mas é uma métrica assintoticamente
plana, isto é,
l
Rijk → 0 quando r → ∞.
Rodney Josué Biezuner 245
k
Lembramos que Rkkj = 0. Usando (17.5), para ij = 00 temos
k
Rk00 = Γm k m k k k
00 Γkm − Γk0 Γ0m + ∂k Γ00 − ∂0 Γk0
= −Γ1k2 Γk01 ,
Rodney Josué Biezuner 246
donde
0
R002 = 0,
1
R102 = −Γ112 Γ101 = 0,
2
R202 = −Γ122 Γ201 = 0,
3
R302 = −Γ132 Γ301 = 0,
logo
R02 = R20 = 0; (17.12)
para ij = 03 temos
k
Rk03 = Γm k m k k k
03 Γkm − Γk3 Γ0m + ∂k Γ03 − ∂0 Γk3
= −Γ1k3 Γk01 ,
donde
0
R003 = 0,
1
R103 = −Γ113 Γ101 = 0,
2
R203 = −Γ123 Γ201 = 0,
3
R303 = −Γ133 Γ301 = 0,
logo
R03 = R30 = 0; (17.13)
para ij = 11 temos
k
Rk11 = Γm k m k k k
11 Γkm − Γk1 Γ1m + ∂k Γ11 − ∂1 Γk1
= Γ111 Γkk1 − Γ0k1 Γk10 − Γ1k1 Γk11 − Γ2k1 Γk12 − Γ3k1 Γk13 + ∂k Γk11 − ∂1 Γkk1 ,
donde
0
R011 = Γ111 Γ001 − Γ001 Γ010 − Γ101 Γ011 − Γ211 Γ112 − Γ311 Γ113 + ∂0 Γ011 − ∂1 Γ001
= Γ111 Γ001 − Γ001 Γ010 − ∂1 Γ001
M2 M2 2M (r − M )
=− 2 − 2 + 2
r2
(r − 2M ) r2 (r − 2M ) r2 (r − 2M )
2M
= 2 ,
r (r − 2M )
1
R111 = 0,
2
R211 = Γ111 Γ221 − Γ021 Γ210 − Γ121 Γ211 − Γ221 Γ212 − Γ321 Γ213 + ∂2 Γ211 − ∂1 Γ221
= Γ111 Γ221 − Γ221 Γ212 − ∂1 Γ221
M 1 1
=− 2 − + 2
r (r − 2M ) r2 r
M
=− 2 ,
r (r − 2M )
3
R311 = Γ111 Γ331 − Γ031 Γ310 − Γ131 Γ311 − Γ231 Γ312 − Γ331 Γ313 + ∂3 Γ311 − ∂1 Γ331
= Γ111 Γ331 − Γ331 Γ313 − ∂1 Γ331
M 1 1
=− 2 − 2+ 2
r (r − 2M ) r r
M
=− 2 ,
r (r − 2M )
Rodney Josué Biezuner 247
logo
R11 = 0; (17.14)
para ij = 12 temos
k
Rk12 = Γm k m k k k
12 Γkm − Γk2 Γ1m + ∂k Γ12 − ∂1 Γk2
= Γ212 Γkk2 − Γ1k2 Γk11 − Γ2k2 Γk12 − Γ3k2 Γk13 + ∂k Γk12 − ∂1 Γkk2 ,
donde
0
R012 = Γ212 Γ002 − Γ102 Γ011 − Γ202 Γ012 − Γ302 Γ013 + ∂0 Γ012 − ∂1 Γ002 = 0,
1
R112 = 0,
2
R212 = Γ212 Γ222 − Γ122 Γ211 − Γ222 Γ212 − Γ322 Γ213 + ∂2 Γ212 − ∂1 Γ222 = ∂2 Γ212
1
= − 2,
r
3
R312 = Γ212 Γ332 − Γ132 Γ311 − Γ232 Γ312 − Γ332 Γ313 + ∂3 Γ312 − ∂1 Γ332
= Γ212 Γ332 − Γ332 Γ313 − ∂1 Γ332
1 1 1
= cot θ − cot θ + 2
r r r
1
= 2,
r
logo
R12 = R21 = 0; (17.15)
para ij = 13 temos
k
Rk13 = Γm k m k k k
13 Γkm − Γk3 Γ1m + ∂k Γ13 − ∂1 Γk3
= Γ313 Γkk3 − Γ1k3 Γk11 − Γ2k3 Γk12 − Γ3k3 Γk13 + ∂k Γk13 − ∂1 Γkk3 ,
donde
0
R013 = Γ313 Γ003 − Γ103 Γ011 − Γ203 Γ012 − Γ303 Γ013 + ∂0 Γ013 − ∂1 Γ003 = 0,
1
R113 = 0,
2
R213 = Γ313 Γ223 − Γ123 Γ211 − Γ223 Γ212 − Γ323 Γ213 + ∂2 Γ213 − ∂1 Γ223 = 0,
3
R313 = Γ313 Γ333 − Γ133 Γ311 − Γ233 Γ312 − Γ333 Γ313 + ∂3 Γ313 − ∂1 Γ333 = 0,
logo
R13 = R31 = 0; (17.16)
para ij = 22 temos
k
Rk22 = Γm k m k k k
22 Γkm − Γk2 Γ2m + ∂k Γ22 − ∂2 Γk2
= Γ122 Γkk1 − Γ1k2 Γk21 − Γ2k2 Γk22 − Γ3k2 Γk23 + ∂k Γk22 − ∂2 Γkk2 ,
Rodney Josué Biezuner 248
donde
0
R022 = Γ122 Γ001 − Γ102 Γ021 − Γ202 Γ022 − Γ302 Γ023 + ∂0 Γ022 − ∂2 Γ002 = Γ122 Γ001
M
=− ,
r
1
R122 = Γ122 Γ111 − Γ112 Γ121 − Γ212 Γ122 − Γ312 Γ123 + ∂1 Γ122 − ∂2 Γ112
= Γ122 Γ111 − Γ212 Γ122 + ∂1 Γ122
M r − 2M
= + −1
r r
M
=− ,
r
2
R222 = 0,
3
R322 = Γ122 Γ331 − Γ132 Γ321 − Γ232 Γ322 − Γ332 Γ323 + ∂3 Γ322 − ∂2 Γ332
= Γ122 Γ331 − Γ332 Γ323 − ∂2 Γ332
r − 2M 1 r − 2M cos2 θ 1
=− − cot2 θ + 2
= − − +
r sen θ r sen θ sen2 θ
2
2 2
2M 1 − cos θ 2M sen θ
= −1 + + = −1 + +
r sen2 θ r sen2 θ
2M
= ,
r
logo
R22 = 0; (17.17)
para ij = 23 temos
k
Rk23 = Γm k m k k k
23 Γkm − Γk3 Γ2m + ∂k Γ23 − ∂2 Γk3
= Γ323 Γkk3 − Γ1k3 Γk21 − Γ2k3 Γk22 − Γ3k3 Γk23 + ∂k Γk23 − ∂2 Γkk3 ,
donde
0
R023 = Γ323 Γ003 − Γ103 Γ021 − Γ203 Γ022 − Γ303 Γ023 + ∂0 Γ023 − ∂2 Γ003 = 0,
1
R123 = Γ323 Γ113 − Γ113 Γ121 − Γ213 Γ122 − Γ313 Γ123 + ∂1 Γ123 − ∂2 Γ113 = 0,
2
R223 = 0,
3
R323 = Γ323 Γ223 − Γ123 Γ221 − Γ223 Γ222 − Γ323 Γ223 + ∂2 Γ223 − ∂2 Γ223 = 0,
logo
R23 = R32 = 0; (17.18)
e, finalmente, para ij = 33 temos
k
Rk33 = Γm k m k k k
33 Γkm − Γk3 Γ3m + ∂k Γ33 − ∂3 Γk3
= Γ133 Γkk1 + Γ233 Γkk2 − Γ1k3 Γk31 − Γ2k3 Γk32 − Γ3k3 Γk33 + ∂k Γk33
Rodney Josué Biezuner 249
donde
0
R033 = Γ133 Γ001 + Γ233 Γ002 − Γ103 Γ031 − Γ203 Γ032 − Γ303 Γ033 + ∂0 Γ033 = Γ133 Γ001
M
= − sen2 θ,
r
1
R133 = Γ133 Γ111 + Γ233 Γ112 − Γ113 Γ131 − Γ213 Γ132 − Γ313 Γ133 + ∂1 Γ133
= Γ133 Γ111 − Γ313 Γ133 + ∂1 Γ133
M r − 2M
= sen2 θ + sen2 θ − sen2 θ
r r
M
= − sen2 θ,
r
2
R233 = Γ133 Γ221 + Γ233 Γ222 − Γ123 Γ231 − Γ223 Γ232 − Γ323 Γ233 + ∂2 Γ233
= Γ133 Γ221 − Γ323 Γ233 + ∂2 Γ233
r − 2M cos θ
=− sen2 θ + sen θ cos θ − cos2 θ + sen2 θ
r sen θ
2M
= sen2 θ,
r
3
R333 = 0,
logo
R33 = 0. (17.19)
Para mostrar que a métrica de Schwarzschild é uma métrica assintoticamente plana, precisamos calcular
as demais componentes do tensor curvatura. Isso é deixado como exercı́cio.
17.5 Proposição. Se a massa esférica estática tem massa M em unidades geométricas e denotamos R =
2M , o espaçotempo para r > R e para 0 < r < R com a métrica de Schwarzschild satisfaz a equação de
Einstein.
Prova: Pois a métrica de Schwarzschild satisfaz Ric = 0, S = 0 e o tensor momento-energia satisfaz T = 0
para r > R.
Massa em unidades geométricas é definida por
G
M= Mkg ,
c2
17.6 Definição. O raio R = 2M é chamado o raio do horizonte de evento.
O espaçotempo com a métrica de Schwarzschild para r > R é chamado espaçotempo exterior de
Schwarzchild.
O espaçotempo com a métrica de Schwarzschild para 0 < r < R é chamado o buraco negro de
Schwarzchild.
Quando o chamado raio de Schwarzschild r é suficientemente grande, a métrica é aproximadamente de
Minkowski e pode-se pensar t como sendo o tempo e r a distância radial. Para r pequeno, no entanto, estas
interpretações passam a não valer. Quando r é menor que R = 2M , a função
2M
f (r) = 1 −
r
passa a ser negativa e ∂t torna-se um vetor do tipo espaço, enquanto que ∂r passa a ser um vetor do tipo
tempo. Neste caso, as analogias com a teoria de gravitação de Newton perdem o valor.
O raio do horizonte de evento é onde nada, nem a luz passa. Este é o valor predito também pela teoria
gravitacional de Newton. De fato,
Mkg mkg
V (r) = −G
r
Rodney Josué Biezuner 250
é a energia potencial gravitacional de uma partı́cula com massa mkg (escolhendo energia potencial zero no
infinito), de modo que sua energia mecânica total é dada por
1 2 Mkg mkg
E =K +V = mkg vm/s −G .
2 r
Portanto, sua velocidade de escape (isto é, a velocidade que ela deve ter para chegar pelo menos em repouso
no infinito, ou seja, com energia mecânica total nula) satisfaz
1 2 Mkg mkg
mkg vm/s =G ,
2 r
isto é, r
2GMkg
vm/s = .
r
Em unidades naturais do espaçotempo temos
r r
vm/s 2GMkg 2M
v= = = .
c c2 r r
Em particular, a velocidade de escape será a velocidade da luz, isto é, v = 1, quando
r = 2M.
Porém, como veremos mais tarde, enquanto que na teoria de Newton a partı́cula lançada do horizonte de
evento diretamente para cima com velocidade menor que a da luz sobe alguma distância antes de voltar
a cair (pois sobe desacelerando até que sua velocidade caia totalmente para zero para algum valor finito
de r), pela teoria da relatividade geral nem a luz pode avançar qualquer distância por menor que seja a
partir do horizonte de eventos (ou ultrapassá-lo, se lançada abaixo dele). Por outro lado, mesmo na teoria
da relatividade geral, é possı́vel que uma partı́cula atravesse o horizonte de eventos sem sentir nada, nem
mesmo as forças de maré; isso aconteceria por exemplo em um buraco negro muito massivo, com um raio do
horizonte de evento muito grande (como o hipotetizado buraco negro que reside no centro da Via Láctea).
A singularidade em r = 2M na métrica de Schwarzchild é uma singularidade matemática, proveniente
da escolha de coordenadas. Como veremos depois, em outros sistemas de coordenadas a singularidade
desaparece.
donde 2
n n
d2 xk X dxi dxk dxi
1X
gkk + ∂i gkk = ∂k gii .
dτ 2 i=0
dτ dτ 2 i=0 dτ
Como, pela regra do produto e pela regra da cadeia,
k
d2 xk dgkk dxk
d dx
gkk = gkk +
dτ dτ dτ 2 dτ dτ
2 k n
d x X ∂gkk dxi dxk
= gkk 2
+ ,
dτ i=0
∂xi dτ dτ
segue o resultado.
17.8 Proposição. A equação das geodésicas γ (τ ) = (t (τ ) , r (τ ) , θ (τ ) , φ (τ )) na métrica de Schwarzschild
é
d 2M dt
1− = 0,
dτ r dτ
2 2 2 2
d 1 dr M dt M dr dθ 2 dφ
= 2 − 2 + r + r sen θ ,
dτ
2M dτ
r dτ (r − 2M ) dτ dτ dτ
1−
r
2
d dθ dφ
r2 = r2 sen θ cos θ ,
dτ dτ dτ
d 2 2 dφ
r sen θ = 0.
dτ dτ
Rodney Josué Biezuner 252
I × M com a métrica
−f dt2 + ds2 .
Capı́tulo 18
Campos de Jacobi
Neste capı́tulo estudaremos como a curvatura afeta as geodésicas. Em um ponto p, as geodésicas radiais
partem deste ponto e se irradiam. Veremos que em uma região de curvatura seccional positiva as geodésicas
se separam menos, em comparação com as geodésicas (retas) no espaço euclidiano (ou seja, os raios em
Tp M ), enquanto que em uma região de curvatura seccional negativa as geodésicas se separam mais.
onde v (s) é uma curva de Tp M partindo de v (0) = v com velocidade v 0 (0) =: w. Para cada s fixado,
Fs (t) = F (s, t) é a geodésica radial que parte de p com velocidade v (s). A velocidade de afastamento destas
geodésicas radiais no ponto γ (t) é exatamente o vetor
∂F
(0, t) = d expp tv tw, (18.1)
∂s
que é o vetor velocidade da curva transversal partindo de γ (t). Neste capı́tulo estudaremos este campo
em detalhes. Veremos em primeiro lugar nesta seção que ele satisfaz uma equação diferencial, chamada a
equação de Jacobi (também conhecida como equação do desvio geodésico em Relatividade Geral). [Para
conveniência do leitor, repetimos o Lema 13.34 que foi visto no apêndice do Capı́tulo 13, juntamente com a
sua demonstração.]
18.1 Lema. Seja F : (−ε, ε) × [a, b] −→ M uma variação e V um campo vetorial ao longo de F . Então
D DV D DV ∂F ∂F
− =R , V.
dt ds ds dt ∂t ∂s
254
Rodney Josué Biezuner 255
Então !
n n n
DV D X
i
X ∂V i X D
= V ∂i = ∂i + Vi ∂i ,
ds ds i=1 i=1
∂s i=1
ds
donde
n n n n
D DV X ∂2V i X ∂V i D X ∂V i D X DD
= ∂i + ∂i + ∂i + Vi ∂i .
dt ds i=1
∂s∂t i=1
∂s dt i=1
∂t ds i=1
dt ds
Trocando t por s,
n n n n
D DV X ∂2V i X ∂V i D X ∂V i D X DD
= ∂i + ∂i + ∂i + Vi ∂i .
ds dt i=1
∂s∂t i=1
∂t ds i=1
∂s dt i=1
ds dt
Logo,
n
D DV D DV X DD DD
− = Vi − ∂i . (18.2)
dt ds ds dt i=1
dt ds ds dt
Escrevendo
F (s, t) = x1 (s, t) , . . . , xn (s, t) ,
de modo que
X ∂xj n
∂F
= ∂j ,
∂t j=1
∂t
X ∂xk n
∂F
= ∂k ,
∂s ∂s
k=1
temos
X ∂xk n
D
∂i = ∇P ∂xk ∂ ∂i = ∇∂k ∂i .
ds ∂s k ∂s
k=1
Daı́,
n
!
DD D X ∂xk
∂i = ∇∂k ∂i
dt ds dt ∂s
k=1
n n
X ∂ 2 xk X ∂xk D
= ∇∂k ∂i + (∇∂k ∂i )
∂s∂t ∂s dt
k=1 k=1
n n
X ∂ 2 xk X ∂xk
= ∇∂k ∂i + ∇P ∂xj ∂ (∇∂k ∂i )
∂s∂t ∂s ∂t j
k=1 k=1
n 2 k n
X ∂ x X ∂xk ∂xj
= ∇∂ ∂i + ∇∂j ∇∂k ∂i .
∂s∂t k ∂s ∂t
k=1 k,j=1
Portanto,
n n
D DV D DV X X ∂xj ∂xk
Vi
− = ∇∂j ∇∂k ∂i − ∇∂k ∇∂j ∂i
dt ds ds dt i=1
∂t ∂s
j,k=1
n n
X ∂xj ∂xk
X
= Vi R (∂j , ∂k ) ∂i
i=1
∂t ∂s
j,k=1
n n j n k
X X ∂x X ∂x
= V iR ∂j , ∂k ∂i
i=1 j=1
∂t ∂s
k=1
n
X
∂F ∂F
=R , V i ∂i
∂t ∂s i=1
∂F ∂F
=R , V.
∂t ∂s
18.2 Proposição (Equação de Jacobi). Seja F : (−ε, ε) × [0, 1] −→ M uma variação geodésica e denote
∂F
J (t) = (0, t) .
∂s
Então J satisfaz a equação diferencial linear
D2 J
+ R (J, γ 0 ) γ 0 = 0. (18.3)
dt2
Prova: Como as curvas principais t 7→ F (s, t) da variação são geodésicas, temos
D ∂F
= 0.
dt ∂t
Segue do lema anterior e do Lema de Simetria 12.25 que
D D ∂F D D ∂F ∂F ∂F ∂F
0= = −R ,
ds dt ∂t dt ds ∂t ∂t ∂s ∂t
D D ∂F ∂F ∂F ∂F
= +R ,
dt dt ∂s ∂s ∂t ∂t
2
D ∂F ∂F ∂F ∂F
= 2 +R , .
dt ∂s ∂s ∂t ∂t
18.4 Proposição (Existência e Unicidade de Campos de Jacobi). Seja γ : I −→ M uma geodésica. Dado
t0 ∈ I e V, W ∈ Tγ(t0 ) M , existe um único campo de Jacobi ao longo de γ tal que
J (t0 ) = V ,
DJ
(t0 ) = W.
dt
Em particular, os campos de Jacobi ao longo de uma geodésica formam um espaço vetorial de dimensão 2n.
Prova: Seja {E1 (t) , . . . , En (t)} campos ortonormais paralelos ao longo de γ. Escrevendo
n
X
J= J i Ei ,
i=1
temos
n
D2 J X d2 J i
(t) = Ei ,
dt2 i=1
dt2
e
n n n
0 0
X
k
X dγ j X dγ l
R (J, γ ) γ = R J Ek , Ej El
j=1
dt dt
k=1 l=1
n
X dγ j dγ l k
= J R (Ek , Ej ) El
dt dt
j,k,l=1
n
X
i dγ j dγ l k
= Rkjl J Ei ,
dt dt
j,k,l=1
de modo que a equação de Jacobi é equivalente ao sistema de equações diferenciais lineares de segunda
ordem:
n
d2 J i X j
i dγ dγ
l
+ Rkjl Jk = 0
dt2 dt dt
j,k,l=1
para i = 1, . . . , n. Como o sistema é linear, a existência e unicidade de soluções está garantida em todo o
intervalo I, dadas condições iniciais.
Um campo vetorial ao longo de uma curva que não seja do tipo luz sempre pode ser decomposto nas suas
componentes tangencial e normal:
V = V > ⊕ V ⊥.
No caso de campos de Jacobi, ambas as componentes são também campos de Jacobi:
18.5 Proposição. Seja γ : I −→ M uma geodésica que não é do tipo luz e J um campo vetorial ao longo
de γ. Decomponha
J = J> ⊕ J⊥
nas suas componentes tangencial e normal, respectivamente. Então J é um campo de Jacobi se e somente
se J > e J ⊥ são campos de Jacobi.
Prova: Pela linearidade da equação de Jacobi, se J > , J ⊥ são campos de Jacobi então J é um campo de
Jacobi.
Reciprocamente, seja J um campo de Jacobi. Como J > é um múltiplo escalar de γ 0 , temos
R J > , γ 0 = 0,
Rodney Josué Biezuner 258
donde
R (J, γ 0 ) = R J ⊥ , γ 0 .
Dγ 0
D DW 0 DW 0
hW, γ 0 i = , γ + W, = ,γ ,
dt dt dt dt
DW 0
de modo que hW, γ 0 i = 0 implica , γ = 0, isto é, se W é normal à geodésica γ, então sua derivada
dt
DW
covariante também é normal a γ; da mesma forma, se W é um campo tangente a γ, então sua derivada
dt
DW
covariante também é tangente a γ, pois se W = f γ 0 , então
dt
DW df Dγ 0 df
= γ0 + f = γ0.
dt dt dt dt
Logo,
>
D2 J D2 J >
= ,
dt2 dt2
⊥
D2 J D2 J ⊥
= .
dt2 dt2
Portanto, a equação de Jacobi
D2 J
+ R (J, γ 0 ) γ 0 = 0
dt2
dá origem às duas equações de Jacobi
D2 J >
+ R J > , γ 0 γ 0 = 0,
dt2
D2 J ⊥
+ R J ⊥ , γ 0 γ 0 = 0.
dt2
18.6 Exemplo. Existem sempre dois campos de Jacobi tangenciais triviais ao longo de uma geodésica γ:
e
J1 (t) = tγ 0 (t) (18.5)
que satisfaz as condições iniciais
DJ1
J1 (0) = 0 e (0) = γ 0 (0) .
dt
O primeiro é um campo de Jacobi porque
D2 J0 D Dγ 0 D
2
= = 0 = 0,
dt dt dt dt
R (J0 , γ 0 ) γ 0 = R (γ 0 , γ 0 ) γ = 0.
O segundo é um campo de Jacobi porque
D2 J1 Dγ 0 Dγ 0
D DJ1 D
2
= = γ0 + t = = 0,
dt dt dt dt dt dt
R (J1 , γ 0 ) γ 0 = R (tγ 0 , γ 0 ) γ 0 = tR (γ 0 , γ 0 ) γ 0 = 0.
De fato, J0 é o campo variacional da variação F (s, t) = γ (t + s), enquanto que J1 é o campo variacional
da variação F (s, t) = γ (tes ). Como estas variações são apenas reparametrizações das geodésicas γ, elas não
podem dizer mais nada do que a própria γ.
Devido ao visto no exemplo anterior, apenas campos de Jacobi normais ao longo de γ são interessantes,
capazes de fornecer informação geométrica nova.
18.7 Proposição. Seja γ : I −→ M uma geodésica, t0 ∈ I e J um campo de Jacobi ao longo de γ. Então
hJ (t) , γ 0 (t)i = At + B,
onde
DJ 0
A= (t0 ) , γ (t0 ) ,
dt
0 DJ 0
B = hJ (t0 ) , γ (t0 )i − (t0 ) , γ (t0 ) t0 .
dt
Em particular, um campo de Jacobi ao longo de γ é normal a γ 0 se e somente se
DJ
J (t0 ) , (t0 ) ⊥ γ 0 (t0 ) .
dt
Além disso, qualquer campo de Jacobi ortogonal a γ 0 em dois pontos é um campo normal.
18.8 Lema. Em particular, o subespaço dos campos de Jacobi tangenciais tem dimensão 2, enquanto que o
subespaço dos campos de Jacobi normais tem dimensão 2n − 2.
Prova: Pela compatibilidade da métrica,
d2 Dγ 0
0 d DJ 0
hJ, γ i = , γ + J,
dt2 dt dt dt
DJ Dγ 0
2
d DJ 0 D J 0
= ,γ = , γ + ,
dt dt dt2 dt dt
2
D J 0
= ,γ
dt2
= − hR (J, γ 0 ) γ 0 , γ 0 i
= −R (J, γ 0 , γ 0 , γ 0 )
= 0.
Rodney Josué Biezuner 260
Logo,
f (t) = hJ (t) , γ 0 (t)i = At + B
para alguns A, B ∈ R. Como
J (0) = 0,
DJ
(0) = w.
dt
Prova: É óbvio que J (0) = 0. Para mostrar que
DJ
(0) = w,
dt
calculamos
DJ Dh i Dh i
(t) = d expp tv tw = td expp tv w
dt dt dt
Dh i
= d expp tv w + t d expp tv w .
dt
Logo,
DJ
(0) = d expp 0 w = w.
dt
Em coordenadas normais, é fácil calcular campos de Jacobi:
18.10 Proposição. Sejam p ∈ M , x1 , . . . , xn coordenadas normais centradas em p e γ : I −→ M uma
geodésica radial partindo de p. Então, para cada vetor V ∈ Tp M , o campo de Jacobi ao longo de γ tal que
J (0) = 0,
DJ
(0) = V,
dt
é dado por
n
X ∂
i
J (t) = tV .
i=1
∂xi γ(t)
Rodney Josué Biezuner 261
Prova: Como M tem curvatura seccional constante K, seu endomorfismo curvatura é dado por
conforme vimos no capı́tulo anterior. Logo, como kγ 0 k = 1, se J é um campo de Jacobi normal temos que
Portanto, a equação de Jacobi para um campo normal de Jacobi ao longo de uma geodésica unitária em uma
variedade com curvatura seccional constante K é
D2 J
+ KJ = 0.
dt2
Escolhendo um campo vetorial paralelo normal E (t) ao longo de γ e substituindo J (t) = ρ (t) E (t) na
equação de Jacobi podemos obter uma solução para esta equação para quaisquer condições iniciais; pelo
teorema de existência e unicidade ela é a única solução para a equação. De fato, temos
D2 (ρE)
D D (ρE) D dρ DE D dρ
= = E + ρ = E
dt2 dt dt dt dt dt dt dt
d2 ρ dρ DE
= 2E+
dt dt dt
d2 ρ
= 2 E,
dt
logo, substituindo J (t) = ρ (t) E (t) na equação de Jacobi produz
2
d ρ
+ Kρ E = 0
dt2
V = Vr + VS ,
onde Vr está na direção de ∂/∂r e VS é tangente à esfera Sr (p) que passa por q. Então a métrica g pode
ser escrita
2 2
kVr ke + kVS ke
se K = 0,
R2 2 r 1
2 2
kV k kVS ke
kV kg = r e + 2
sen se K = 2 > 0,
r R R
2
kVr k2 + R senh2 r kVS k2 1
se K = − < 0.
e e
r2 R R2
Rodney Josué Biezuner 263
Como a distância radial é a distância euclideana (também consequência do lema de Gauss) temos que
kVr kg = kVr ke .
é um campo de Jacobi J (t) que se anula em p e tal que J (r) = VS . Em particular, J é normal a γ 0 em
p e q e portanto J é normal ao longo de γ pela Proposição 18.7. Logo, J possui a representação dada na
Proposição 18.11. Segue que
2
2 2 2 2 2 2 2
DJ
kVS kg = kJ (r)k = |ρ (r)| kE (r)k = |ρ (r)| kE (0)k = |ρ (r)|
,
(0)
dt
Como as métricas na bola Bε (0) ⊂ Rn , onde identificamos Rn com ambos os espaços tangentes Tp M e TpeM
f
−1
e ◦ ϕ é uma isometria.
são idênticas pela Proposição 18.12, segue que ϕ
18.14 Lema. Sejam p ∈ M e γ : I −→ M a geodésica radial partindo de p com velocidade inicial γ 0 (0) = V .
Seja W ∈ Tp M com kW k = 1 e considere o campo de Jacobi J tal que
J (0) = 0,
DJ
(0) = W.
dt
Então
2 1
kJ (t)k = t2 − R (V, W, W, V ) t4 + o t4 .
3
Em particular, se γ é uma geodésica unitária,
2 1
kJ (t)k = t2 − K (V, W ) t4 + o t4
3
e
1
kJ (t)k = t − K (V, W ) t3 + o t3 .
6
Prova: Para simplificar a notação, denotaremos
DJ
J 0 (t) = (t) ,
dt
D2 J
J 00 (t) = (t)
dt2
e, em geral,
Dk J
J (k) (t) =
(t) .
dtk
Para provar o resultado, aplicaremos a fórmula de Taylor à função real f : I −→ R definida por
2
f (t) = kJ (t)k = hJ (t) , J (t)i .
Temos
f 0 = 2 hJ, J 0 i ,
f 00 = 2 hJ 0 , J 0 i + 2 hJ, J 00 i
2
= 2 kJ 0 k + 2 hJ, J 00 i ,
e
2
f (0) = kJ (0)k = 0,
f (0) = 2 hJ (0) , J 0 (0)i = 0,
0
2 2
f 00 (0) = 2 kJ 0 (0)k + 2 hJ (0) , J 00 (0)i = 2 kJ 0 (0)k = 2.
Como
e
J 00 (0) = −R (J (0) , γ 0 (0)) γ 0 (0) = −R (0, V ) V = 0,
segue que
f 000 (0) = 6 hJ 0 (0) , J 00 (0)i + 2 hJ (0) , J 000 (0)i = 0.
Rodney Josué Biezuner 265
de modo que
f (4) (0) = 8 hJ 0 (0) , J 000 (0)i = 8 hW, J 000 (0)i .
Mas
000 D 00
hJ (0) , W i = J (t) ,W
dt t=0
D 0 0
=− R (J (t) , γ (t)) γ (t) ,W .
dt t=0
Afirmamos que
D
R (J (t) , γ 0 (t)) γ 0 (t)
, W = R (V, W, W, V ) .
dt t=0
De fato, como
hR (J, γ 0 ) γ 0 , J 0 i = R (J, γ 0 , γ 0 , J 0 )
= R (γ 0 , J 0 , J, γ 0 )
= hR (J 0 , γ 0 ) γ 0 , Ji ,
segue que
d d
hR (J, γ 0 ) γ 0 , J 0 i = hR (J 0 , γ 0 ) γ 0 , Ji ,
dt dt
donde
D D
R (J, γ 0 ) γ 0 , J 0 0 0
+ hR (J, γ ) γ , J i = 00
R (J 0 , γ 0 ) γ 0 , J + hR (J 0 , γ 0 ) γ 0 , J 0 i .
dt dt
Calculando em t = 0, como J (0) = J 00 (0) = 0 e J 0 (0) = W , temos que
D 0 0
R (γ (t) , J (t)) γ (t)
, W = hR (W, V ) V, W i = R (W, V, V, W ) .
dt t=0
Consequentemente,
f (4) (0) = −8R (V, W, W, V ) .
Segue portanto da fórmula de Taylor que
1
f (t) = t2 − R (V, W, W, V ) t4 + o t4 .
3
Quando, kV k = kW k = 1, temos R (V, W, W, V ) = K (V, W ) e portanto
1
f (t) = t2 − K (V, W ) t4 + o t4 .
3
Para provar a última expressão do enunciado, seja
p
g (t) = kJ (t)k = f (t).
Rodney Josué Biezuner 266
2
Então f (t) = [g (t)] e
Daı́
g (0) = 0,
2 2
f 00 (0) = 2 [g 0 (0)] + 2g (0) g 00 (0) =⇒ 2 = 2 [g 0 (0)] + 0
=⇒ g 0 (0) = 1,
f 000 (0) = 6g 0 (0) g 00 (0) + 2g (0) g 000 (0) =⇒ 0 = 6g 00 (0) + 0
=⇒ g 00 (0) = 0,
2
f (4) (0) = 6 [g 00 (0)] + 8g 0 (0) g 000 (0) + 2g (0) g (4) (0) =⇒ −8K (V, W ) = 0 + 8g 000 (0) + 0
=⇒ g 000 (0) = −K (V, W ) .
onde v (s) é uma curva de Tp M com v (0) = v, v 0 (0) = w e kv (s)k = kwk = 1. Considere os raios partindo
da origem, eles se afastam do raio tv com velocidade absoluta
∂
tv (s)
= ktv 0 (0)k = t kwk = t.
∂s
s=0
J (0) = 0,
DJ
(0) = w,
dt
ele satisfaz as hipóteses do enunciado do Lema 18.14 e portanto
∂F
= t − 1 K (V, W ) t3 + o t3 .
∂s (0, t)
6
Isso significa que as geodésicas radiais Fs (t) se afastam da geodésica radial F0 (t) = expp (tv) com velocidade
que difere de t por uma termo de terceira ordem cujo sinal é o oposto do sinal da curvatura seccional da
variedade em p associada ao plano σ gerado por v e w. Isso significa que se Kp (σ) > 0 as geodésicas se
afastam menos que os raios do espaço tangente Tp M , enquanto que se Kp (σ) < 0 as geodésicas se afastam
mais que os raios do espaço tangente Tp M .
Rodney Josué Biezuner 267
18.15 Definição. Seja γ : [a, b] −→ M uma geodésica. Dizemos que o ponto q = γ (b) é conjugado ao
ponto p = γ (a) ao longo de γ se existe um campo de Jacobi J ao longo de γ não identicamente nulo que se
anula em p e q, isto é, tal que
J (a) = J (b) = 0.
A multiplicidade do ponto conjugado q é a dimensão do subespaço dos campos de Jacobi que se anulam
em p e q.
Pelo teorema de existência e unicidade, a dimensão do espaço dos campos de Jacobi que se anulam em p é
n; como o campo de Jacobi tangencial J (t) = tγ 0 (t) só se anula em p (de fato, qualquer campo de Jacobi
tangencial que se anula em dois pontos é necessariamente nulo pela Proposição 18.7), a multiplicidade de
um ponto conjugado é no máximo n − 1. Em particular, na definição de pontos conjugados, o ponto q é
conjugado a p se e somente se existir um campo de Jacobi normal ao longo de γ não identicamente nulo que
se anula em p e q. O número n − 1 é atingido na esfera pela Proposição 18.11, já que para pontos antipodais
existe um campo de Jacobi que anula neles para cada campo paralelo normal.
18.16 Proposição. Sejam p ∈ M , v ∈ Tp M e q = expp (v). Então expp é um difeomorfismo local em uma
vizinhança de v se e somente se q não é conjugado a p ao longo da geodésica γ (t) = expp (tv).
Além disso, a multiplicidade de q é igual a dim ker d expp v .
Prova: Como vimos na Proposição 18.9, todo campo de Jacobi ao longo de γ tal que J (0) = 0 é da forma
J (t) = d expp tv tw.
isto é, se e somente se v é ponto crı́tico de expp . Como os campos de Jacobi J1 , . . . , Jk que se anulam em p
são linearmente independentes se e somente se os vetores
J (a) = V,
J (b) = W.
Rodney Josué Biezuner 268
Prova: Seja J o espaço vetorial dos campos de Jacobi ao longo de γ tais que J (a) = 0. Este espaço tem
DJ
dimensão n, correspondente às n escolhas linearmente independentes de (a). Defina uma aplicação linear
dt
Φ : J −→ Tγ(b) M por
Φ (J) = J (b) .
Como γ (b) não é conjugado a γ (a), Φ é injetiva. Já que dim J = n = dim Tγ(b) M , segue que Φ é um
isomorfismo. Logo existe J1 ∈ J tal que
J1 (b) = W,
ou seja, existe um único campo de Jacobi J1 ao longo de γ tal que
J1 (a) = 0,
J1 (b) = W.
Considerando o espaço vetorial Je dos campos de Jacobi ao longo de γ tais que J (b) = 0 e a aplicação linear
Ψ : Je −→ Tγ(a) M por
Ψ (J) = J (a) ,
concluı́mos de maneira análoga que existe um único campo de Jacobi J2 ao longo de γ tal que
J2 (a) = V,
J2 (b) = 0.
Causalidade
Em geral, uma variedade de Lorentz não possui campos vetoriais do tipo tempo globalmente definidos.
19.2 Definição. Dizemos que uma variedade de Lorentz M é temporalmente orientável se existe uma
função τ que atribui a cada ponto p um cone temporal τp em Tp M e um campo vetorial do tipo tempo tais
que Xp ∈ τp para todo p ∈ M .
Neste caso, dizemos que τ é uma orientação temporal para M .
Se v ∈ Tp M é um vetor do tipo causal, dizemos que v é dirigido para o futuro se v ∈ τ p e para o passado
se −v ∈ τ p .
Em outras palavras, v é dirigido para o futuro se
hv, Xp i < 0
e para o passado se
hv, Xp i > 0.
Veja a demonstração do Teorema 19.12 para uma definição alternativa usando transporte paralelo.
19.3 Definição. Uma variedade de Lorentz conexa, temporalmente orientada, é chamada um espaçotempo.
Em Relatividade Geral se trabalha com espaçotempos, já que é altamente improvável que dois observadores,
mesmo não inerciais, se encontrem em um ponto do espaçotempo e o tempo para um segue o seu ritmo
natural em direção ao futuro, enquanto que para o outro observador o tempo corre em direção ao passado.
269
Rodney Josué Biezuner 270
19.2.1 Cronologia
19.4 Definição. Dados pontos p, q ∈ M , dizemos que p precede q cronologicamente e escrevemos
pq
se existe uma curva diferenciável do tipo tempo orientada para o futuro ligando p a q.
Dizemos que p precede q causalmente e escrevemos
p6q
p<q
se p 6 q e p 6= q.
As relações e 6 são claramente transitivas.
Rodney Josué Biezuner 271
π ([α]) = α (1)
é um recobrimento duplo.
Prova: Dotamos M f da topologia quociente através desta relação de equivalência, o que torna Mf um espaço
de recobrimento topológico com π : M f −→ M a aplicação de recobrimento. Lembramos então que o
espaço de recobrimento topológico de uma variedade diferenciável possui uma única estrutura de variedade
diferenciável que torna a aplicação de recobrimento diferenciável (veja [Lee 1], Proposição 4.40, p. 92, para
uma demonstração). Finalmente, definimos uma métrica de Lorentz em M f através do pullback da projeção,
isto é,
ge = π ∗ g,
ou seja,
ge[α] (e
v , w)
e = gα(1) dπ[α] ve, dπ[α] w
e .
Em particular, π é uma isometria local.
Note que se M é temporalmente orientável, então M
f = M . Caso contrário, mostraremos que M
f é. Para
isso, precisaremos dos lemas a seguir.
Rodney Josué Biezuner 272
α
e (0) = pe0 .
Se α = π ◦ α
e, então
α
e (1) = [α] .
Prova: Este resultado parece ser incorreto pelo seguinte argumento. Suponha que
π −1 (p0 ) = pe+ e−
0 ,p0 .
Como ambos M e M f são variedades de Lorentz e toda variedade diferenciável é localmente contrátil, podemos
assumir vizinhanças contráteis Ve ± de pe±
0 tais que π V
e ± = V , V sendo uma vizinhança contrátil de p0 .
Dentro das vizinhanças Ve ± podemos tomar laços α e± com pontos inicial e final em pe± 0 . Se o enunciado é
± ±
correto, então se α = π ◦ α e , segue que
pe± e± (1) = α± .
0 =α
Em particular, + −
α 6= α ,
já que pe+ e−
0 6= p
+ −
0 . Mas α e α , sendo laços com pontos inicial e final em p0 , dentro da vizinhança contrátil
V , são (diferenciavelmente) homotópicos e portanto
+ −
α = α ,
uma contradição.
Se o resultado for correto, um possı́vel argumento seria o seguinte. Para fixar idéias, assuma que pe0 é a
classe de equivalência da curva constante α0 (t) ≡ p0 . Neste caso, o campo paralelo à curva constante α0
com vetor inicial v0 é simplesmente V (t) ≡ v0 .
Defina αet : [0, 1] −→ M
f por
α
et (s) = α
e (st) ,
de modo que α et é simplesmente o segmento da curva α e que liga pe0 a α e (t), seu domı́nio reparametrizado para
[0, 1]. Observe que α e (s) ≡ pe0 e que α
e0 é a curva constante α e1 = α e. Seja αt = π ◦ α et . Mostraremos que o
conjunto
A = {t ∈ [0, 1] : α
et (1) = [αt ]}
é aberto e fechado em [0, 1], provando o resultado. Por escolha, 0 ∈ A. (. . .)
Sejam pe ∈ M e α
f e, β : [0, 1] −→ M curvas diferenciáveis por parte tais que
e f
α
e (0) = βe (0) = pe0 ,
α
e (1) = βe (1) = pe.
Se Veα , Veβ são os campos paralelos ao longo de respectivamente α e, βe definidos por Veα (0) = Veβ (0) = ve0 , então
D E
Veα (1) , Veβ (1) < 0.
Rodney Josué Biezuner 273
Prova: A unicidade de ve0 segue do fato de toda aplicação de recobrimento diferenciável ser um difeomorfismo
local. Sejam
α=π◦α e,
β = π ◦ β.
e
Vα (0) = Vβ (0) = π∗ (e
v0 ) = v0
e D E D E
hVα (1) , Vβ (1)i = π∗ Veα (1) , π∗ Veβ (1) = Veα (1) , Veβ (1) .
α
e (1) = [α] ,
βe (1) = [β] ,
contradizendo α
e1 (1) = α
e2 (1) = pe.
19.12 Teorema. Toda variedade de Lorentz não temporalmente orientável possui um recobrimento duplo
temporalmente orientável.
Prova: Veja Teorema 3.3 em [BEE], p. 52. Implı́cita na demonstração deste teorema é uma definição
alternativa para a orientabilidade temporal de uma variedade de Lorentz M : M é temporalmente orientável
se, fixados um ponto base qualquer p0 ∈ M e um vetor do tipo tempo qualquer v0 ∈ Tp0 M , para todo
p ∈ M e para todas as curvas diferenciáveis α, β ligando p0 a p, os campos paralelos Vα , Vβ ao longo de
respectivamente α, β definidos por Vα (0) = Vβ (0) = v0 satisfazem
Esta condição implica que o transporte paralelo do cone futuro determinado por v0 em p0 para qualquer
ponto p é independente do caminho escolhido de p0 para p. Logo, uma escolha consistente de vetores do tipo
tempo futuros pode ser feita por transporte paralelo a partir de p0 .
Referências Bibliográficas
[BEE] John K. BEEM, Paul E. EHRLICH e Kevin L. EASLEY, Global Lorentzian Geometry,
2nd. Ed., Marcel Dekker, 1996.
[Benn-Tucker] Ian M. BENN e Robin W. TUCKER, An Introduction to Spinors and Geometry with
Applications in Physics, Adam Hilger, 1987.
[Berger] Marcel BERGER, A Panoramic View of Riemannian Geometry, Springer, 2002.
[Fleisch2] Daniel FLEISCH, A Student’s Guide to Vectors and Tensors, Cambridge University
Press, 2012.
[Gron-Naess] Oyvind GRON e Arne NAESS, Einstein’s Theory: A Rigorous Introduction for the
Mathematically Untrained, Springer, 2011.
[Hoffman-Kunze] Kenneth HOFFMAN e Ray KUNZE, Linear Algebra, 2nd. Edition, Prentice-Hall, 1971.
274
Rodney Josué Biezuner 275