Programa Mínimo de Cosmologia

Programa Mı́nimo de Cosmologia
Frontispı́cio
Este é o texto do frontispı́cio do livro.
ii
Índice
1 Teoria da Gravitação 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoria Newtoniana da gravitação . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 A lei da gravitação universal . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Multipolos gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 Massa inercial e massa gravitacional . . . . . . . . . . . . . . . . . 11
1.2.4 Forças de maré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 O tensor energia-momento . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Notação e definições . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.2 O tensor energia-momento de um fluido perfeito em movimento . . 17
1.4 Teoria Linear da Gravitação . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 Construindo as Equações de Campo . . . . . . . . . . . . . . . . . . 19
1.4.2 Equações de Campo como Consequência de um Princı́pio Variacional 22
1.4.3 Transformação de calibre . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.4 Problemas com a Lei de Conservação da Energia . . . . . . . . . . . 25
1.4.5 O tensor energia-momento do campo gravitacional — primeira aprox-
imação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.4.6 Balanço de momentum-energia entre a Matéria e o Campo Grav-
itacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.7 As Equações de Campo no Limite Newtoniano . . . . . . . . . . . . 31
1.5 Teoria da Relatividade Geral . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5.1 O princı́pio da equivalência . . . . . . . . . . . . . . . . . . . . . . 33
1.5.2 As equações de campo . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.5.3 O limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6 A solução de Schwarzschild e aplicações . . . . . . . . . . . . . . . . . . . . 41
1.6.1 Movimento de partı́culas teste na solução de Schwarzschild . . . . . 44
1.6.2 Testes de campo solar . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1.8 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2 Cosmologia I: Fenomenologia 58
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.2 O Universo Observado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2.1 Galáxias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2.2 Grupos e Aglomerados de Galáxias . . . . . . . . . . . . . . . . . . 66
2.2.3 O Cosmos Dinâmico: O Universo em Expansão . . . . . . . . . . . 74
2.2.4 Estrutura em Grande Escala . . . . . . . . . . . . . . . . . . . . . . 78
2.3 O Universo Homogêneo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.1 Dinâmica: A equação de Friedmann . . . . . . . . . . . . . . . . . 82
iii
2.4 O Universo Homogêneo II . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.4.1 Uma Breve História Térmica do Universo . . . . . . . . . . . . . . . 87
2.5 O Universo Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.5.1 O Crescimento Linear das Estruturas (Newtoniano) . . . . . . . . . 91
2.5.2 O Universo Muito Perturbado: Simulações Computacionais . . . . . 103
2.6 Sı́tios de Internet Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . 103
2.7 Livros sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.8 Artigos Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.9 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.10 Glossário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3 Introdução à Cosmologia 122

3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.2 Cosmologia Relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.3 Quantidades Cinemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.4 Fontes da Curvatura do Espaço-Tempo . . . . . . . . . . . . . . . . . . . . 132
3.5 Modelos Cosmológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.5.1 Modelo Cosmológico de Einstein . . . . . . . . . . . . . . . . . . . . 137
3.5.2 Modelos Cosmológicos de Lemaı̂tre . . . . . . . . . . . . . . . . . . 139
3.5.3 Modelo cosmológico de Friedman . . . . . . . . . . . . . . . . . . . 141
3.5.4 Análise geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
3.6 Modelos cosmológicos com menos simetria . . . . . . . . . . . . . . . . . . 143
3.7 Modelo Cosmológico de Kasner (1921) . . . . . . . . . . . . . . . . . . . . 143
3.8 Modelo de Gödel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
3.8.1 A Solução de Gödel . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
3.9 Campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.10 Universo Homogêneo Isotrópico não Singular . . . . . . . . . . . . . . . . . 160
3.10.1 Fótons Não-Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . 160
3.10.2 Solução Cósmica Homogênea e Isotrópica . . . . . . . . . . . . . . . 162
3.11 Modelo cosmológico padrão: sucessos e dificuldades . . . . . . . . . . . . . 163
3.11.1 Equação de evolução de σµν . . . . . . . . . . . . . . . . . . . . . . . 164
3.11.2 Equação de evolução de ωµν . . . . . . . . . . . . . . . . . . . . . . 165
3.11.3 Equações de vı́nculo . . . . . . . . . . . . . . . . . . . . . . . . . . 165
3.11.4 Decomposição de um tensor anti-simétrico . . . . . . . . . . . . . . 168
3.11.5 Tensor de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.11.6 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . 174
4 Termodinâmica em Relatividade Geral. 177

4.1 Termodinâmica de Processos Dissipativos . . . . . . . . . . . . . . . . . . . 180
4.2 Aplicação á Cosmologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
4.3 Exercı́cio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5 Fı́sica de Objetos Compactos 186

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.2 Anãs brancas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
5.2.1 O advento da degenerescência: mecânica quântica em ação . . . . . 190
5.3 Modelagem de anãs brancas tipo politropo . . . . . . . . . . . . . . . . . . 193
iv
5.3.1 Limite de baixa densidade (Γ = 5/3) . . . . . . . . . . . . . . . . . 193
5.3.2 Limite de alta densidade (Γ = 4/3) . . . . . . . . . . . . . . . . . . 195
5.4 O limite de massa de Chandrasekhar . . . . . . . . . . . . . . . . . . . . . 195
5.5 Anãs brancas: São verdadeiramente observadas no céu? . . . . . . . . . . . 197
5.6 Estabilidade de estrelas anãs brancas . . . . . . . . . . . . . . . . . . . . . 198
5.6.1 Estabilidade de ABs na relatividade geral . . . . . . . . . . . . . . 198
5.7 Estrelas de Nêutrons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.8 Equação de estado de gás perfeito no domı́nio nuclear . . . . . . . . . . . . 204
5.9 Modelos realı́sticos de estrelas de nêutrons . . . . . . . . . . . . . . . . . . 208
5.9.1 Massa máxima de ENs . . . . . . . . . . . . . . . . . . . . . . . . . 211
5.10 Estrelas de nêutrons: são realmente observadas no céu? Possuem as pro-
priedades preditas? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.10.1 Pulsares binários . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11 Apêndice A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
6 Buracos Negros 220

6.1 Um pouco de história . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.2 A solução de Schwarszchild . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
6.2.1 Singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
6.2.2 Diagrama do espaço-tempo na geometria de Schwarszchild . . . . . 225
6.2.3 Outros sistemas dee coordenadas? . . . . . . . . . . . . . . . . . . . 229
6.2.4 Horizonte de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 230
6.3 Colapso gravitacional e buracos negros . . . . . . . . . . . . . . . . . . . . 232
6.4 Mecânica celeste no campo gravitacional de um buraco negro de Schwarszchild234
6.5 Coordenadas de Kruskal-Szekeres . . . . . . . . . . . . . . . . . . . . . . . 239
6.6 Outros buracos negros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
6.6.1 O buraco negro de Kerr . . . . . . . . . . . . . . . . . . . . . . . . 242
6.6.2 Propriedades da solução de Kerr . . . . . . . . . . . . . . . . . . . . 243
6.6.3 Buracos negros carregados . . . . . . . . . . . . . . . . . . . . . . . 251
6.6.4 O buraco negro mais geral . . . . . . . . . . . . . . . . . . . . . . . 251
6.7 Buracos Negros Astrofı́sicos . . . . . . . . . . . . . . . . . . . . . . . . . . 252
6.8 Buracos negros e mecânica quântica . . . . . . . . . . . . . . . . . . . . . . 254
6.9 Termodinâmica de buracos negros . . . . . . . . . . . . . . . . . . . . . . . 256
6.10 Coda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
6.11 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
7 Astrofı́sica de Ondas Gravitacionais 263

7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
7.2 Geração de ondas gravitacionais na TGR . . . . . . . . . . . . . . . . . . . 264
7.3 Linearização da TGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.3.1 A transformação de calibre . . . . . . . . . . . . . . . . . . . . . . . 270
7.4 Mais um vı́nculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
7.4.1 O calibre transverso-sem-traço . . . . . . . . . . . . . . . . . . . . 273
7.5 Polarização de Ondas Gravitacionais . . . . . . . . . . . . . . . . . . . . . 276
7.6 Ondas gravitacionais emitidas por massas aceleradas: Pulsares . . . . . . . 277
7.6.1 OGs a partir de pulsares accelerados na Galáxia . . . . . . . . . . . 277
7.7 Ondas gravitacionais emitidas por sistemas binários . . . . . . . . . . . . . 280
v
7.8 Taylor & Hulse: Um prêmio Nobel pelas OGs do pulsar binário PSR 1913
+ 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.9 Astronomia de ondas gravitacionais . . . . . . . . . . . . . . . . . . . . . . 290
7.10 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
8 Astropartı́culas I 293
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
8.2 Modelo Padrão de Partı́culas Elementares . . . . . . . . . . . . . . . . . . 294
8.2.1 A força forte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
8.2.2 A força fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
8.2.3 A classificação padrão . . . . . . . . . . . . . . . . . . . . . . . . . 300
8.3 Elementos de Teoria de Grupos . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
8.3.3 Revisitando a classificação das partı́culas elementares . . . . . . . . 308
8.4 Elementos de Teoria de Campos . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.1 Campo Escalar Real . . . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.2 Campo Eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . 314
8.4.3 Mecanismo de Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . 315
8.5 Unificação das Forças Fundamentais e Transições de Fase . . . . . . . . . . 317
8.6 O Universo como um acelerador . . . . . . . . . . . . . . . . . . . . . . . . 321
8.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
9 Astropartı́culas II 325
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
9.2 Defeitos Topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.3 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.4 Paredes cósmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
9.5 Tensor de momento energia para um fluido de parede cósmica . . . . . . . 329
9.6 Cordas cósmicas e monopolos . . . . . . . . . . . . . . . . . . . . . . . . . 330
9.6.1 Defeitos topológicos e os raios cósmicos de alta energia . . . . . . . 334
9.7 O modelo de Inflação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.8 Os problemas do Modelo Cosmológico Padrão . . . . . . . . . . . . . . . . 336
9.8.1 O problema do horizonte . . . . . . . . . . . . . . . . . . . . . . . . 336
9.8.2 O problema da platitude . . . . . . . . . . . . . . . . . . . . . . . . 337
9.8.3 O problema das perturbações primordiais . . . . . . . . . . . . . . . 338
9.8.4 O problema dos monopolos magnéticos . . . . . . . . . . . . . . . . 339
9.9 Uma fase de expansão acelerada no Universo primordial . . . . . . . . . . . 340
9.10 Implementando um modelo inflacionário . . . . . . . . . . . . . . . . . . . 342
9.11 Matéria e energia escuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.12 A matéria escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.13 A energia escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
9.14 Constante cosmológica, quintessência ou... . . . . . . . . . . . . . . . . . . 353
vi
10 Gravitação e Cosmologia Quânticas 357
10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
10.1.1 Argumentos a favor da construção de uma Teoria Quântica da
Gravitação e da chamada Cosmologia Quântica . . . . . . . . . . . 358
10.2 Gravitação Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.1 Quantização Canônica . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.2 Quantização Covariante . . . . . . . . . . . . . . . . . . . . . . . . 369
10.2.3 Gravitação Quântica de Laços ou Supercordas? Ou ambas? . . . . . 371
10.3 Cosmologia Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.3.1 A interpretação de Bohm-de Broglie . . . . . . . . . . . . . . . . . . 374
10.3.2 A Cosmologia Quântica e a singularidade cosmológica . . . . . . . . 376
10.3.3 Condições iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
10.4 Comparação com a Observação . . . . . . . . . . . . . . . . . . . . . . . . 380
10.4.1 Verficação da natureza discreta do espaço-tempo . . . . . . . . . . . 380
10.4.2 Uma escala de Planck observável . . . . . . . . . . . . . . . . . . . 381
10.4.3 A radiação de fundo e a Cosmologia Quântica . . . . . . . . . . . . 382
10.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
10.6 Leituras Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
10.7 Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
11 Geometria Diferencial 386

11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
11.2 Objetos geométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.2.1 Curvas e vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.2.2 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.3 Derivada covariante de campos tensoriais . . . . . . . . . . . . . . . . . . . 388
11.4 O tensor de curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
11.5 O tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
11.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392
12 Teoria da Relatividade Especial 394

12.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
12.1.1 Sinopse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
12.2 Mecânica versus Eletromagnetismo . . . . . . . . . . . . . . . . . . . . . . 395
12.2.1 Mecânica de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . 396
12.2.2 Grupo de Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
12.2.3 Eletromagnetismo de Maxwell . . . . . . . . . . . . . . . . . . . . . 398
12.3 Fundamentos da Relatividade Especial . . . . . . . . . . . . . . . . . . . . 400
12.3.1 Princı́pio da Relatividade Especial . . . . . . . . . . . . . . . . . . 401
12.3.2 Sincronicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
12.4 Transformações de coordenadas de Lorentz . . . . . . . . . . . . . . . . . . 404
12.4.1 Coordenadas transversas . . . . . . . . . . . . . . . . . . . . . . . . 405
12.4.2 Dilatação do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
12.4.3 Contração do comprimento . . . . . . . . . . . . . . . . . . . . . . . 408
12.4.4 Simultaneidade relativa . . . . . . . . . . . . . . . . . . . . . . . . . 409
12.4.5 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 410
12.5 Cinemática relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
12.5.1 Sistemas mecânicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
12.5.2 Sistemas ondulatórios . . . . . . . . . . . . . . . . . . . . . . . . . . 416
12.6 Mecânica relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
vii
12.6.1 Momentum linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
12.6.2 Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
12.7 Espaço-tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
12.7.1 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . 426
12.7.2 Geometria do espaço-tempo de Minkowski . . . . . . . . . . . . . . 431
12.7.3 Diagramas de espaço-tempo . . . . . . . . . . . . . . . . . . . . . . 433
12.8 Cálculos simples em relatividade . . . . . . . . . . . . . . . . . . . . . . . . 437
12.8.1 Paradoxo dos gêmeos . . . . . . . . . . . . . . . . . . . . . . . . . . 438
12.8.2 Paradoxo da garagem . . . . . . . . . . . . . . . . . . . . . . . . . . 441
12.9 Formalismo tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.1 Rotações espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.2 Grupo de Lorentz-Poincaré . . . . . . . . . . . . . . . . . . . . . . . 446
12.10Contribuições da fı́sica experimental . . . . . . . . . . . . . . . . . . . . . . 451
12.11Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
12.12Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
13 Panorama Breve da Cosmologia Contemporânea 456

13.1 Introdução: A Cosmologia e seus Objetivos . . . . . . . . . . . . . . . . . . 456
13.2 Os Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
13.3 Os Fundamentos: As Teorias da Relatividade . . . . . . . . . . . . . . . . 478
13.4 A Cosmologia Relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . 482
13.5 Problemas da Cosmologia Relativı́stica . . . . . . . . . . . . . . . . . . . . 484
13.6 Questões Epistemológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 486
viii
Capı́tulo 1
Teoria da Gravitação
Vitorio de Lorenci1
1.1 Introdução
Desde o surgimento da teoria da gravitação universal, fundamentada por I. Newton
no ano de 1686 [1], os efeitos relacionados a este fenômeno vêm sendo testados experi-
mentalmente nas mais distintas situações , e com regularidade crescente. A interação
gravitacional é reconhecidamente muito fraca quando comparada às demais interações
da natureza e em consequência é muito difı́cil a realização de testes para tal fenômeno
em laboratórios terrestres. O cosmos, há muito tempo vem exercendo o papel de nosso
melhor campo de medições dos efeitos gravitacionais e de fato, a sua observação ao longo
de tantos anos foi fator preponderante no encaminhamento das formulações teóricas para
a descrição deste processo.
Já no inı́cio do século XX a comunidade cientı́fica estava ciente da não aplicabilidade
da teoria Newtoniana na previsão de alguns fenômenos naturais, como por exemplo a
precessão do periélio das órbitas planetárias, o que levou diversos pesquisadores a propor
novas teorias a fim de completar o quadro experimental até então determinado. A in-
trodução de outras teorias, na maior parte das vezes, levou à predição de novos efeitos,
que puderam ser submetidos à examinação a fim de se resolver pela consistência da teoria
em seus resultados. Neste sentido, a ciência teórica e experimental, no que diz respeito à
interação gravitacional, tem caminhado em contı́nua dependência.
Das teorias que surgiram no intervalo de tempo que vai de 1686 até os dias atuais,
uma única tem se mostrado, pela excelência de seus resultados postos à experimentação ,
como a boa teoria da gravitação . Esta, a bem conhecida teoria da relatividade geral,
desenvolvida por A. Einstein [2] na primeira metade do século XX, tem sido amplamente
testada e comprovada em todas as suas predições 2 .
1
Afiliação: Instituto de Ciências Exatas (ICE), Universidade Federal de Itajubá (UNIFEI), PO Box
50 37500-903 Itajuba, MG.
2
Existem certos efeitos relacionados à precessão do periélio das órbitas de sistemas estelares duplos,
onde a configuração de campo é extremamente forte, que ainda não se pode dizer que sejam adequada-
mente previstos pelas soluções da teoria da relatividade geral. Os mais famosos destes sistemas são o
DI Herculis e AS Camelopardalis. No entanto, existem muitos fatores extras, relacionados a estrutura
interior das estrelas e da vizinhança, que devem resultar em grandes perturbações em seu movimento.
1
Vamos fazer um breve histórico de algumas das possibilidades que são de particular
interesse ao nosso trabalho, no que diz respeito a teorias para o campo gravitacional, antes
de examinarmos alguns aspectos da relatividade geral.
Uma primeira condição fundamental que qualquer teoria da gravitação deve satisfazer
é o princı́pio de covariância de Lorentz. O que significa que, na situação em que o
campo gravitacional for nulo, a teoria da relatividade especial (veja o Capı́tulo 12 e [3])
deve emergir naturalmente do arcabouço da teoria gravitacional. Esta condição deve
ser imposta sobre a teoria para que a mesma seja compatı́vel com a experimentação ,
que já é largamente verificada para este princı́pio. Uma segunda condição consiste na
obtenção da formulação clássica Newtoniana como uma situação limite na aproximação
de campo gravitacional fraco em regime de baixas velocidades. Como é bem conhecido,
nesta situação limite, a teoria clássica se ajusta bem aos dados experimentais. Uma vez
obtida uma formulação que respeite a estas condições assimptóticas, deve-se passar aos
testes padrões da gravitação , quais sejam: (i) desvio espectral; (ii) a deflexão dos raios
luminosos em um dado campo gravitacional; (iii) o atraso temporal dos pulsos de radar
emitidos (e refletidos) ao encontro de uma região de campo gravitacional crescente, como
por exemplo na direção dos planetas interiores (mais próximos do Sol); e por fim, (iv)
a precessão do periélio das órbitas planetárias. Para uma revisão sobre os testes padrões
da gravitação , veja as referências [4, 5, 6, 7, 8, 9, 10]. Estes testes são conhecidos como
testes de campo solar, e foram os primeiros realizados no intuito de se testar a teoria
da relatividade geral. Estes requerimentos são, como ponto de partida, indispensáveis a
qualquer boa teoria da gravitação .
Ao passarmos à formulação da teoria, surge a questão da escolha dos objetos matemá-
ticos que devem ser usados na sua construção . Podemos escolher, de forma geral, entre
uma formulação escalar, vetorial ou tensorial, a qual está intimamente relacionada com o
spin da partı́cula que carregará a interação gravitacional. Para os casos acima citados o
spin será sempre inteiro3 . Uma boa maneira de se resolver qual quantidade matemática é
mais adequada à descrição da gravitação consiste em estabelecermos qual deve ser a fonte
material para este fenômeno. Para isto, devemos impor que exista uma lei de conservação
envolvida, que será manifestada pela divergência nula do objeto representando a fonte
para a interação em questão. De inı́cio, já podemos descartar a formulação vetorial,
uma vez que o único objeto vetorial que conhecemos que tem associado a ele uma lei de
conservação é o 4-vetor corrente, assim uma teoria construı́da com este objeto em nada
diferiria do eletromagnetismo. Além disto, uma teoria construı́da com campos de spin 1
— vetorial — leva a dois tipos de potencial, um atrativo e outro repulsivo. E, uma vez que
a gravitação somente se manifesta atrativamente, não podemos usar tais objetos na sua
descrição matemática. Um histórico sobre as possibilidades de se formular tais teorias foi
realizado por Gupta, especialmente na referência [12]. A menos do 4-vetor corrente, existe
o tensor momentum-energia da matéria, Tµν , que é um objeto Lorentz-covariante e tem
dimensão de densidade de energia, assim como esperarı́amos de um bom candidato à fonte
material da gravitação . Com este tensor, à primeira vista, podemos dar prosseguimento
tanto à formulação escalar, tomando o traço de Tµν para representar a fonte material,
quanto a formulação tensorial, assumindo o tensor momentum-energia completo como
fonte material da teoria. O primeiro caso é particularmente problemático, pois como é bem
conhecido, o traço do tensor momentum-energia associado ao campo de Maxwell (teoria do
Com a melhoria da tecnologia dos rádio-telescópios nos últimos anos, tais problemas poderão ser avaliados
com maior precisão brevemente e uma resposta mais conclusiva poderá ser aferida.
3
Spin semi inteiro leva a problemas com respeito a obtenção de configurações de campo gravitacional
estático, que está em contradição imediata com os resultados da teoria Newtoniana. Para um breve
estudo sobre este assunto, veja o prefácio da referência [11].
2
campo eletromagnético) é identicamente nulo, logo, não contribuiria como fonte material
da gravitação caso a teoria que a representasse fosse escalar. Fato este que está em contra-
ponto com o princı́pio de equivalência Newtoniano4 , que estabelece que a massa de repouso
total de um sistema interage com o campo gravitacional. Poderı́amos ainda, construir
objetos escalares com o tensor momentum-energia utilizando contrações com 4-vetores,
como por exemplo com o 4-vetor velocidade. No entanto, de forma geral teorias escalares
à gravitação não são compatı́veis com os resultados experimentais. Para fins de revisão,
umas das melhores tentativas de teorias escalares foi formulada por Otto Bergmann, em
1955, e prescreve um valor para a precessão do periélio das órbitas planetárias que é 1/6
do valor correto e em sentido de precessão contrário ao observado [13]. Resta-nos assim,
o caso tensorial. Nesta formulação , a fonte dos efeitos gravitacionais é representada
pelo tensor de momentum energia da matéria, e em princı́pio, não apresenta problemas,
contrariamente ao que acontece para as teorias escalar e vetorial. Ora, se admitirmos a
fonte material do campo gravitacional sendo um tensor de segunda ordem, é natural que
façamos a escolha de um objeto tensorial também de segunda ordem para representar o
próprio campo gravitacional.
Vamos começar examinando a situação mais simples possı́vel, em que as equações
resultem ser lineares. O único critério que temos para nos orientar na derivação das
equações de campo, consiste na imposição de uma lei de conservação associada ao
tensor momentum-energia da matéria. A teoria que emerge deste procedimento é a bem
conhecida teoria de Fierz-Pauli [14] para campos de spin-2. Uma vez obtida a equação
de movimento, a construção desta teoria através de um princı́pio variacional é elementar,
ou seja, pode-se facilmente obter a Lagrangeana que resulta nestas equações . Entretanto,
um grave problema ocorre quando procuramos ajustar tal teoria à descrição dos efeitos
gravitacionais, qual seja, o limite de campo fraco e baixas velocidades não resulta na teo-
ria clássica Newtoniana. Este problema tem origem na lei de conservação envolvida para
a teoria linear onde encontramos que o tensor momentum-energia se conserva separada-
mente. Este processo gera uma inconsistência fı́sica, pois o próprio campo gravitacional
tem uma energia associada, e como qualquer tipo de energia interage gravitacionalmente,
esta energia deve também ser fonte do próprio campo, logo, o tensor momentum-energia
da matéria não pode se conservar separadamente. Eis a razão da teoria estritamente lin-
ear não corresponder ao limite clássico. Uma maneira de se contornar este problema é
somando às equações de campo a energia do campo gravitacional. Podemos realizar isto
facilmente se observarmos que a Lagrangeana da teoria linear tem associado a ela um
tensor de momentum-energia (que é de ordem 2 do campo), assim, podemos derivá-lo e
acrescentá-lo às equações . Agora, as equações que resultam, possuem uma lei de con-
servação e o limite Newtoniano é recuperado. Entretanto, surge aqui uma interessante
questão: como somamos às equações de campo um novo termo, que chamamos de ten-
sor momentum-energia do campo gravitacional, as mesmas foram modificadas, assim, a
Lagrangeana que as resulta não é mais a da teoria linear. Então, se derivarmos a nova
Lagrangeana para esta teoria, associada a ela haverá um novo tensor momentum-energia,
agora em ordem maior de não linearidade no tensor que representa o campo gravitacional.
E, se somarmos este objeto nas equações de movimento, as modificaremos novamente,
gerando um processo que se repete a cada ordem de correção da energia, apontando final-
mente para uma inconsistência nesta formulação . A única forma de tornarmos esta teoria
completa é somando todos os infinitos termos de energia que surgem da Lagrangeana do
campo corrigida em cada ordem. Uma excelente abordagem deste procedimento é apre-
4
Consequentemente com a observação , onde se pode medir efeitos gravitacionais relacionados com a
energia do campo eletromagnético.
3
sentada na referência [11]. Alguns autores demonstraram que a teoria que emerge desta
série infinita é exatamente a relatividade geral de Einstein [15, 16].
Um procedimento alternativo de tornar consistente uma teoria a partir da formulação
linear que exploramos acima, foi proposto por S. Deser e B. E. Laurent [17] e também
por C. G. Bollini, J. J. Giambiagi e J. Tiomno [18]. Nesta proposta eles introduzem um
objeto com divergência indenticamente nula construı́do com as projeções não locais do
tensor momentum-energia da matéria para ser fonte do campo gravitacional, resultando
assim em uma teoria consistente para a gravitação . Este tipo de teoria é chamada de
“quase linear”. Podemos dizer que a não localidade faz o papel da não linearidade. Tal
construção é capaz de prescrever a estrutura de campo esférico, se ajustando perfeita-
mente bem aos dados observacionais. Entretanto, falha em algumas predições que estão
fundamentalmente relacionadas aos efeitos da não-localidade introduzida nas equações
de campo. Estes problemas foram apontados por C. M. Will, no trabalho [19]. Existem
ainda diversas teorias alternativas propostas ao longo dos últimos anos, mas a maioria
apresenta problemas que as tornam não viáveis.
O ponto fundamental que separa a teoria clássica Newtoniana da teoria da relativi-
dade geral tem origem na introdução do princı́pio da equivalência Einsteiniano5 . Uma
formulação deste princı́pio diz que todos os corpos caem, em um dado campo gravitacional
externo, com a mesma aceleração , implicando que para um observador em um laboratório
que cai livremente no mesmo campo gravitacional, os corpos deverão ser observados como
se estivessem livres de aceleração . Assim, a medida que seus movimentos mecânicos são
considerados, os corpos se comportam como se o campo gravitacional estivesse ausente.
Ainda mais, Einstein postulou que, não somente as leis da mecânica, mas todas as leis da
fı́sica, deveriam se comportar em tal laboratório como se a gravitação estivesse ausente.
De forma mais rigorosa, este princı́pio determina que uma teoria da gravitação é uma
teoria métrica, ou seja, deve satisfazer aos postulados de metricidade, que são: (i) o
espaço tempo é deformado pela presença de um dado campo gravitacional, podendo as-
sim ser representado por uma estrutura métrica efetiva, distinta da Minkowskiana; (ii)
as partı́culas teste tem seus movimentos determinados pelas geodésicas desta geometria;
e ainda, (iii) se escolhermos um referencial local de Lorentz6 , quaisquer leis naturais de
origem não gravitacional, devem ser aquelas da relatividade especial, isto é, que satisfazem
aos princı́pios da relatividade especial.
Como podemos perceber, este princı́pio da equivalência determina que a estrutura
de propagação das partı́tulas7 testes (não importando a sua constituição material) é
universal. Entretanto, em seu conteúdo, este princı́pio não estabelece que a estrutura de
propagação da própria interação gravitacional deva ser, necessariamente, a mesma das
partı́culas materiais. Assim, para estarmos consistentes com o princı́pio da equivalência
basta impormos que a geometria do espaço tempo, determinada pelo campo gravitacional,
é universalmente sentida pelas partı́culas materiais. Ainda não há um único experimento
realizado que determine que o princı́pio da equivalência deva ser estendido no que diz
respeito à interação gravitacional.
Existe uma grande expectativa com respeito a possibilidade de detectarmos ondas
gravitacionais nos próximos anos. Nunca se construiu tamanho número de aparelhos de
5
Uma boa revisão sobre o princı́pio de equivalência e suas consequências experimentais pode ser
encontrada no livro do C. M. Will [7].
6
A escolha de um referencial local de Lorentz quer dizer que podemos sempre anular localmente o
campo gravitacional.
7
Estamos denotando por partı́culas, àquelas que podem ser descritas pelo tensor de momentum energia
da matéria. Assim, partı́culas podem ser massivas, como planetas ou elétrons, ou não massivas, como
fótons.
4
medida para tal fim como a partir dos anos 70, quando descobriu-se que a perda de
energia em um sistema estelar duplo colapsante — pulsar binário — estava fortemente
relacionada com a emissão de ondas gravitacionais. Tal observação garantiu o prêmio
Nobel de Fı́sica ao pesquisador J. H. Taylor (veja as referências [20, 21, 22]). Com isto
a comunidade cientı́fica entendeu que a existência destas ondas gravitacionais estivesse
sendo indiretamente comprovada por tal efeito, como de fato acontece, uma vez que todas
as outras formas de interação puderam ser calculadas e desprezadas para tal situação .
No entanto, até os dias de hoje, nenhum detector de ondas gravitacionais obteve qualquer
resposta conclusiva a respeito da observação direta destas ondas. E ainda mais, a sua
existência comprovada indiretamente através deste experimento nos diz pouco a respeito
da sua forma de propagação , uma vez que o efeito que resultaria de um pequeno desvio na
velocidade destas ondas seria certamente não detectável e talvez, até mesmo, confundido
com perturbações da galáxia próxima. Por isso, uma pergunta natural a se fazer é a
seguinte: a velocidade de propagação das ondas gravitacionais é a mesma encontrada
para os raios luminosos? Ou seria melhor perguntar: O princı́pio da equivalência pode
ser estendido para abarcar a própria interação gravitacional?
Vamos abordar aqui alguns aspectos da teoria da gravitação. Revisaremos a teoria da
gravitação universal de Newton, construiremos uma teoria de campos para a gravitação
dentro de uma aproximação linear, e finalmente examinaremos brevemente a teoria da
relatividade geral de Einstein e exploraremos algumas de suas soluções.
Por fim, salientamos que estas notas correspondem a uma compilação (essencialmente,
dos livros citados ao longo da apresentação ), e não contém contribuições pessoais ao tema
tratado. Para alcançar um aprofundamento nos aspectos apresentados nestas notas, o
leitor deve se dirigir às referências listadas no final do capı́tulo.
1.2 Teoria Newtoniana da gravitação

1.2.1 A lei da gravitação universal
A lei da gravitação universal de Newton pode ser apresentada através do seguinte enun-
ciado:
a interação gravitacional entre dois corpos pode ser expressa por uma força central,
atrativa, diretamente proporcional às massas dos corpos e inversamente proporcional ao
quadrado da distância entre eles.
Isac Newton, Principia, Livro III, Proposiç~
ao VII e corolário.
Matematicamente teremos
m1 m2
F =G ,
r2
onde G é uma constante que deve ser obtida experimentalmente, conhecida por constante
de gravitação.
A partir de um referencial O, podemos escrever
(~r2 − ~r1 )
F~12 = Gm1 m2 ,
|~r2 − ~r1 |3
onde F~12 simboliza a força atuante em m1 devido a interação com o corpo m2 . Adicional-
mente, notamos que F~12 = −F~21 .
5
Figura 1.1: Interação gravitacional entre dois corpos de massas m1 e m2 . Note que
F~12 = −F~21 (terceira lei de Newton).
Diferentemente das outras constantes universais a constante de gravitação G não é

conhecida com muita precisão. Atualmente conhecemos o seu valor com apenas cinco
algarismos significativos. A dificuldade em medir o valor de G é devida ao fato de que a
força de origem gravitacional entre corpos em laboratórios é muito pequena. O melhor
valor medido para G até 2003 é 8
G = (6, 6742 ± 0, 0010) × 10−11 m3 kg −1 s−2 .
As quantidades m1 e m2 aparecendo nas equações acima são os termos de fonte da

gravitação e são chamadas de cargas gravitacionais, ou ainda, massas gravitacionais. A
massa gravitacional na teoria da gravitação desempenha o papel equivalente ao da carga
elétrica na teoria do eletromagnetismo.
Vamos considerar agora o problema de se obter uma expressão para a força gravita-
cional sobre uma partı́cula de massa gravitacional m, localizada em uma posição dada pelo
vetor posição ~r, devida a um aglomerado de N partı́culas com massas mi (i = 1, 2, · · · , N ).
A força F~i que atua sobre a partı́cula m devida a presença da partı́cula mi no aglomerado
S 0 (conforme está representado na figura 1.2) será tal que
(~r − ~ri )
F~i = −Gmmi .
|~r − ~ri |3
Assim, a força total exercida sobre a partı́cula m pode ser obtida somando a contribuição
de cada partı́cula presente no aglomerado:
N N N
X X (~r − ~ri ) X
F~ (~r) = F~i = −Gm mi 3
= Gm ~ r − ~ri |−1 .
mi ∇|~ (1.1)
i=1 i=1
|~r − ~ri | i=1
Como é bem conhecido, a energia potencial Ep é construı́da a partir do conhecimento de

F~ através da expressão
F~ (~r) = −∇E
~ p. (1.2)
Para a situação considerada em Eq. (1.1), inferimos que a energia potencial associada a
interação gravitacional entre o aglomerado S 0 e a partı́cula m é dada por
N
X mi
Ep (~r) = −Gm . (1.3)
i=1
|~r − ~ri |
Definimos o campo gravitacional ~g (~r) como a força por unidade de massa. Matematica-
mente esta definição é escrita na forma
N
F~ X (~r − ~ri )
~g (~r) = = −G mi . (1.4)
m i=1
|~r − ~ri |3
8
Atualizações deste valor podem ser obtidas no endereço http://physics.nist.gov/constants
6
Figura 1.2: Representação dos vetores posições no caso de um aglomerado de partı́culas
interagindo gravitacionalmente com uma massa externa m.
De maneira similar, definimos o potencial gravitacional como a energia potencial por

unidade de massa:
N
Ep (~r) X mi
Φ(~r) = = −G . (1.5)
m i=1
|~
r − ~
r i |
~ r). O campo gravitacional ~g (~r) é considerado como o agente da
Note que ~g (~r) = −∇Φ(~
interação e a sua determinação independe da existência de partı́culas teste, mas somente
das caracterı́sticas da fonte do campo (neste caso, do aglomerado). Para o caso de uma
distribuição contı́nua de massa M (veja figura 1.4), podemos escrever
dm0
Z
Φ(~r) = −G . (1.6)
r − ~r 0 |
M |~
Uma vez que dm0 = ρ(~r 0 )dV 0 , segue que

ρ(~r 0 )
Z
Φ(~r) = −G dV 0 , (1.7)
V |~r − ~r 0 |
onde ρ(~r 0 ) representa a densidade de massa do corpo. Como pode ser facilmente entendido
da Eq. (1.7), o potencial gravitacional obedece a equação de Poisson:
∇2 Φ(~r) = 4πGρ(~r). (1.8)
Assim, todo o conhecimento a respeito do potencial gravitacional (e do campo, por con-
seguinte) poder ser obtido a partir do conhecimento da distribuição de massa presente no
espaço.
• Obs:
O potencial gravitacional na região exterior a uma distribuição de massa com sime-
tria esférica pode ser determinado, a partir da Eq. (1.8), resultando em:
GM
Φ(r) = − . (1.9)
r
7
Figura 1.3: Potencial gravitacional devido a uma partı́cula localizada na origem r = 0. O
potencial negativo é caracterı́stica de uma interação atrativa.
Figura 1.4: Distribuição contı́nua de massa: representação a partir de um sistema de

coordenadas externo à distribuição .
8
Figura 1.5: Distribuição contı́nua de massa: situação na qual o ponto de medida do
campo esta situado a uma distância muito grande da distribuição .
Esta expressão corresponde exatamente ao potencial gravitacional gerado por uma

partı́cula de massa M localizada na origem do sistema de coordenadas (Fig. 1.3).
1.2.2 Multipolos gravitacionais

Como foi visto, o potencial gravitacional gerado por uma distribuição arbitrária de massa
em uma certa região do espaço é dado por Eq. (1.7). Para o caso de uma partı́cula, ou
de uma distribuição de massa com simetria esférica, a expressão para o potencial gravita-
cional se reduz à Eq. (1.9). A fim de examinar situações mais complexas será conveniente
considerar uma expansão do potencial [Eq. (1.7)] em termos de seus momentos de mul-
tipolos. Antes porém, para ganharmos em simplicidade, vamos escolher um sistema de
coordenadas de tal forma que a distribuição de massas esteja localizada nas vizinhanças
da origem deste sistema.
Ainda, vamos admitir que a distribuição de massas possa ser totalmente encerrada
por uma esfera de raio R que será sempre pequeno quando comparado ao ponto de ob-
servação. Nas condições especificadas anteriormente, podemos construir uma expansão
em multipolos para o potencial gravitacional. Assim considerando uma expansão em série
de Taylor do termo
1
|~r − ~r 0 |
em torno de ~r 0 = 0, encontraremos
0 3
1 1 ~r · ~r 0 (~r · ~r 0 )2 1 r02 r
= − 3 +3 − +O . (1.10)
|~r − ~r 0 | r r r5 2 r3 r
• Obs:
Vamos utilizar a seguinte notação:
x1 = x, x2 = y, x3 = z
Então xk , com k = 1, 2, 3, representa a k-ésima componente do vetor ~r. Nesta

notação X
r2 = x k xk .
k
9
Usando a notação de ı́ndices, a equação (1.10) pode ser apresentada na forma
1 1 X x k xk 1 X 0k 0l
k l
02 kl x x
≈ + + 3x x − r δ . (1.11)
|~r − ~r 0 | r k
r 3 2 k,l
r 5
Finalmente, o potencial gravitacional avaliado no ponto P (x, y, z), determinado pelo vetor
posição ~r, será dado por
GM G X k k G X kl xk xl
Φ(~r) = − − 3 x D − Q + ··· (1.12)
r r k 2 k,l r5
onde Z
M= dV 0 ρ (~r 0 ) (1.13)
V0
representa a massa total do aglomerado, e definimos os momentos de dipolo Dk e quadripolo
Qkl como:
Z
.
k
D = dV 0 x0k ρ (~r 0 ) (1.14)
V 0
Z
.
kl
Q = dV 0 (3x0k x0l − r02 δ kl )ρ (~r 0 ) . (1.15)
V0
• Obs:
1. Os momentos acima definidos são momentos de massa. Podemos continuar a
série (1.12) até quanto for necessário para descrever o potencial gravitacional
de uma certa distribuição de massa.
2. Nas expressões acima Dk representa as componentes do vetor de dipolo grav-
~ enquanto Qkl representa as componentes do tensor de quadripolo
itacional D,
↔
gravitacional Q.
3. Em geral, os planetas possuem formas que desviam da forma perfeitamente
esférica por pequenas diferenças. No caso do Sol, seu diâmetro equatorial difere
do diâmetro polar por uma quantidade da ordem de 10−5 . Esta diferença gera
um momento de quadripolo na expressão para o seu potencial gravitacional.
Um dos efeitos importantes gerados pela presença do termo de quadripolo é a
precessão do periélio das órbitas planetárias. No caso da precessão de Mercúrio,
o momento de quadripolo solar implica em uma precessão da ordem de uns
poucos segundos de arco por século. Este valor, no entanto, é pequeno quando
comparado à precessão devido à interação com outros planetas do sistema solar
(500 segundos de arco por século). Adicionalmente, a teoria da relatividade
geral (que será vista mais a frente) acrescenta mais ∼ 43 segundos de arco por
século para a precessão do periélio de Mercúrio.
4. Note que este mecanismo pode ser utilizado de maneira inversa; ou seja, a partir
da observação das perturbações da órbita elı́ptica (Kleperiana) de satélites or-
bitando um determinado planeta, podemos obter resultados precisos a respeito
da distribuição de massa deste planeta.
5. Para o caso de um sistema composto por uma Pdistribuição de partı́culas, o
momento de dipolo de massa é dado por Dk = mxk . Assim, uma vez que
..
o momentum linear total do sistema isolado se conserva, segue que Dk = 0.
Este resultado está diretamente relacionado com o fato de que não pode existir
radiação gravitacional de origem dipolar.
10
1.2.3 Massa inercial e massa gravitacional
Como é bem conhecido, corpos que se movimentam sob a ação exclusiva do campo grav-
itacional sofrem uma aceleração que não depende de suas propriedades fı́sicas. Esta lei
pode ser apresentada na seguinte construção. A equação de movimento de uma partı́cula
de massa m em um dado campo gravitacional (cujo potencial é Φ), é dada por:
d 2 xk ∂Φ
mi 2
= −mg k , (1.16)
dt ∂x
ou seja
mi a = mg g. (1.17)
Assim
mg
a= g. (1.18)
mi
Trocando em palavras

massa gravitacional
aceleração = × intensidade do campo gravitacional.
massa inercial
Uma vez que a aceleração experimentada pela partı́cula em um dado campo gravitacional
é sempre a mesma (independentemente do seu estado e de sua natureza), concluı́mos que
a massa gravitacional e a massa inercial devem manter a mesma relação para todos os
corpos, ou seja
mi ∝ mg . (1.19)
Por uma escolha adequada de unidades, podemos fazer com que
mi = mg . (1.20)
Esta igualdade é conhecida como princı́pio de equivalência Newtoniano.
• Obs:
Se o corpo em consideração for extenso, então, a acelaração do seu centro de massa
será dada por
d 2 xk
Z
∂
mi 2 = − dV 0 ρg (~r 0 ) 0k Φ(~r 0 ), (1.21)
dt V0 ∂x
onde ρg (~r 0 ) representa a densidade de massa gravitacional do corpo e a integral é
tomada por todo o seu volume. Assim, a equação (1.16) somente será recuperada
caso ∂Φ/∂xk possa ser considerado constante ao longo do volume do corpo.
Em resumo, o princı́pio de equivalência Newtoniano somente será válido em campos
gravitacionais homogêneos com corpos suficientemente pequenos.
1.2.4 Forças de maré

Vamos explorar um pouco as consequências do princı́pio da equivalência Newtoniano.
Consideremos um observador no interior de um ambiente fechado, um laboratório, que
esteja caindo livremente sob a ação do campo gravitacional terrestre. Este observador
experimenta uma sensação de flutuação (assim como todos os corpos no laboratório),
como se não houvesse qualquer campo gravitacional agindo sobre ele. Um referencial
ligado ao laboratório em queda livre equivale a um referencial inercial com respeito ao
observador: uma partı́cula em repouso dentro do laboratório permanece em repouso, e se
11
Figura 1.6: Forças de maré: Nesta representação , o sistema de coordenadas O0 está
adaptado a um corpo que cai livremente sob a ação do campo gravitacional terrestre.
posta em movimento permanece em movimento com velocidade constante. É importante

notar que este cenário não seria possı́vel caso o princı́pio de equivalência Newtoniano
não fosse verdadeiro (neste caso, corpos de naturezas distintas seriam espontaneamente
acelerados no interior do laboratório).
• Obs:
O princı́pio da equivalência Newtoniano implica que corpos suficientemente pe-
quenos localizados em uma região de campo gravitacional suficientemente homogêneo
experimentam a mesma aceleração. Note, entretanto, que uma região de campo
gravitacional “suficientemente” homogêneo não significa “exatamente” homogêneo.
Fazemos agora a seguinte pergunta: é possı́vel para o observador no laboratório em

queda livre realizar um experimento capaz de detectar a presença do campo gravitacional?
Ou ainda, serão os efeitos gravitacionais completamente eliminados pelo fenômeno da
queda livre?
Vamos a seguir mostrar que o observador pode, efetivamente, detectar a presença do
campo gravitacional através de uma medida da força da maré produzida por este campo.
O fundamental aqui é supor que o campo gravitacional não será exatamente homogêneo,
não importa o quão próximo da homogeneidade ele possa ser considerado. A fim de
demonstrar a afirmação acima, vamos considerar a seguinte construção: seja um ponto
de referência se movendo em queda livre, e consideremos este ponto como origem de um
sistema de coordenadas com eixo Z paralelo à direção radial (com respeito à Terra). Uma
partı́cula localizada em uma posição Pz (0, 0, z) neste sistema de referência (veja a figura
1.6) estará sujeita a um campo gravitacional dado por
~ z) = − GM GM
~g (OP 2 ẑ = − ẑ. (1.22)
|~ro + ~z| (ro + z)2
Similarmente, a origem O0 estará sujeita a uma aceleração gravitacional
~ 0 ) = ~g (~ro ) = − GM
~g (OO ẑ. (1.23)
ro 2
12
Assim, a aceleração da partı́cula em Pz relativa à origem O0 será
~ z ) − ~g (OO
~ 0) = − GM GM
~g (OP 2 ẑ + ẑ. (1.24)
(ro + z) ro 2
Mas, uma vez que z ro , podemos expandir o primeiro termo no lado direito de Eq.
(1.24) em série de Taylor, resultando em
" 2 #
~ z ) − ~g (OO
~ 0) = − GM 2z z GM
~g (OP 1 − + O ẑ + ẑ
ro 2 ro ro ro 2
2GM z
= ẑ. (1.25)
ro 3
Este resultado mostra que, relativo à origem O0 , a partı́cula em Pz experimenta uma força
repulsiva f~z dada por
2GM mz
f~z = ẑ. (1.26)
ro 3
Vejamos agora uma partı́cula localizada na posição Px (x, 0, 0). Esta partı́cula estará
sujeita a uma aceleração dada por:
~ x ) = − GM (~ro + ~x) .
~g (OP (1.27)
|~ro + ~x|3
Então, a componente na direção x desta aceleração será
~ x ) · ~x = − GM x
~g (OP , (1.28)
(ro 2 + x2 )3/2
que podemos apresentar na forma

−3/2
x2

~ x ) · ~x = − GM x
~g (OP 1+ 2 . (1.29)
ro 3 ro
Supondo que x ro , podemos efetuar a expressão

−3/2
x2 3x2

1+ 2 =1− + O(x4 /ro 4 ). (1.30)
ro 2ro 2
No entanto, somente o primeiro termo desta expressão será mantido, uma vez quel ele
será o termo de primeira ordem em Eq. (1.29). Assim
~ x ) · ~x = − GM x .
~g (OP (1.31)
ro 3
Resumindo, uma partı́cula de massa m situada na posição x estará, relativamente à origem
O0 , experimentando uma força
GM m
f~x = − xx̂. (1.32)
ro 3
Similarmente, concluı́mos que para uma partı́cula situada em Py , segue:
GM m
f~y = − y ŷ. (1.33)
ro 3
13
Figura 1.7: Corpo esférico coberto por uma camada lı́quida em um laboratório em repouso
longe da ação de campos gravitacionais externos.
As forças f~ são denotadas por forças de maré, e atuam sobre um dado corpo em queda
livre de tal maneira a provocar, ao longo da direção radial, um “esticamento”, e ao
longo do plano perpendicular, uma “compressão”. A figura 1.7 resume graficamente estes
resultados. Como vemos, as forças de maré podem ser utilizadas como um mecanismo
para a detecção de um campo gravitacional. Somente na situação teórica onde o campo
gravitacional seja homogêneo, as duas configurações acima seriam indistinguı́veis.
• Obs: Forças de maré em notação de componentes.
Para um referencial cuja origem se encontra em queda livre sob a ação de um
dado campo gravitacional, a força de maré pode ser representada na seguinte forma
(notação indicial):
X ∂F k
k
f = xi i
, (1.34)
i
∂x x i =0
onde F k representa a k-ésima componente da força gravitacional sobre uma dada

partı́cula. Vejamos como esta expressão se reduz às equações (1.26), (1.32) e (1.34).
Primeiramente, a componente k = 1 será tal que
3
1
X ∂Fx
f = fx = xi . (1.35)
i=1
∂xi
Mas
GM mx
Fx = F~ · ~x = − (1.36)
(ro 2 + x2 )3/2
conforme inferimos de Eq. (1.28). Assim,
∂Fx GM m ∂Fx ∂Fx
=− ; = =0 (1.37)
∂x x=0 ro 3 ∂y ∂z
e
GM m
fx = −
x. (1.38)
ro 3
Analogamente a expressão para fy , teremos, de Eq. (1.22)
GM m
Fz = F~ · ~z = − . (1.39)
(ro + z)2
Assim
∂Fz 2GM m ∂Fz ∂Fz
= 3
; = =0 (1.40)
∂z z=0 ro ∂x ∂y
e
2GM m
fz = z. (1.41)
ro 3
14
Figura 1.8: Corpo esférico coberto por uma camada lı́quida em uma laboratório em queda
livre em uma região de campo gravitacional.
A equação (1.34) pode ser reescrita em termos do potencial gravitacional Φ como segue
(das equações (1.2) e (1.5)):
X ∂ 2Φ
fk = − mxi i k . (1.42)
i
∂x ∂x
Vamos definir o objeto (tensor)
. 1 ∂F k 1 ∂ 2Φ
Rk oio = − 2 = (1.43)
mc ∂xi c2 ∂xk ∂xi
que chamaremos de tensor de forças de maré. Usando esta definição, encontramos que a
força de maré que atua sobre uma partı́cula localizada em um dado ponto xi , com respeito
ao referencial em queda livre, na aproximação xi ro , pode ser apresentada na forma
X
f k = −mc2 xi Rk oio . (1.44)
i
Para este caso analizado acima, Rk oio pode ser apresentado na forma matricial
 
1 0 0
GM
Rk oio = 3 2  0 1 0  . (1.45)
ro c
0 0 −2
A divergência de f k em uma região vazia do espaço é sempre nula. Este resultado pode
ser mostrado, para o caso geral, a partir da Eq. (1.42) e usando a equação de Poisson
(1.8) fazendo ρ = 0. Para o caso partı́cular examinado acima, temos que:
~ · f~ = ∂k f k
∇
X ∂xi
= −mc2 k
Rk oio
i
∂x
X
2
= −mc Ri oio = 0, (1.46)
i
onde a última igualdade segue diretamente de Eq. (1.45).

• Obs:
Limite de validade da teoria Newtoniana:
Gm0
|Ep | mc2 ⇒ r ,
c2
v c.
15
1.3 O tensor energia-momento
1.3.1 Notação e definições
O intervalo de espaço-tempo ds2 é dado por
3
X
2 2 2 2 2 2
ds = c dt − dx − dy − dz ≡ τµν dxµ dxν , (1.47)
µ,ν=0
onde denotamos
xµ ≡ (ct, x, y, z). (1.48)
Usaremos a convenção de Einstein para a soma, segundo a qual ı́ndices repetidos (super-
escritos e sub-escritos) indicam um somatório. Assim, a equação (1.47) poderá ser apre-
sentada na forma compacta
ds2 = τµν dxµ dxν , (1.49)
onde τµν é o tensor métrico do espaço-tempo de Minkowski. Em notação matricial teremos
 
1 0 0 0
 0 −1 0 0 
τµν =  0 0 −1 0  .
 (1.50)
0 0 0 −1
Da equação (1.47),
v2

2 2 2 2 2 2 2 2

ds = dt c − vx − vy − vz = c dt 1 − 2 . (1.51)
c
Definimos
v2

−2
γ = 1− 2 . (1.52)
c
Assim
γ 2 ds2 = c2 dt2 . (1.53)
Como pode ser facilmente entendido ds2 é invariante frente a transformações de Lorentz,
sendo, portanto, uma grandeza escalar. Vamos adotar
r
ds v2
= dτ = dt 1 − 2 . (1.54)
c c
Em um referencial ligado à partı́cula (referencial de repouso da partı́cula) teremos dτ = dt,
o que nos indica que τ deve ser sempre o tempo próprio da partı́cula. Mais especifica-
mente dτ é o intervalo de tempo medido por um relógio que se move com a partı́cula.
Denotaremos t como tempo coordenado.
Definiremos o quadri-vetor velocidade, ou simplesmente 4-velocidade, na forma
µ

µ . dx dt dx dy dz
u = = c , , , . (1.55)
dτ dτ dτ dτ dτ
dt
Uma vez que dτ
= γ, teremos
uµ = γ (c, vx , vy , vz ) = γ(c, v i ). (1.56)
16
Denotando por m a massa de repouso de uma partı́cula, definiremos o quadri-vetor mo-
mentum, ou simplesmente 4-momentum, como
.
pµ = muµ . (1.57)
Então, de (1.56) e (1.57), segue

µ
. i E i
p = γmc, γmv = ,p . (1.58)
c
Na última igualdade acima definimos (identificamos) a energia total relativı́stica
E = γmc2 , (1.59)
e o momentum relativı́stico (componentes)
pi = γmv i . (1.60)
Como vemos, a energia e o momentum aparecem como componentes de um mesmo objeto,

sendo a energia identificada como a componente temporal p0 e o momentum a componente
espacial pi .
• Obs:
Usaremos em todo o texto letras gregas como ı́ndices de espaço-tempo (ex.: µ =
0, 1, 2, 3) e letras latinas como ı́ndices somente espaciais (ex.: i = 1, 2, 3).
O nosso objetivo agora é construir (ou identificar) um objeto matemático que carregue
toda a informação a respeito do conteúdo de energia e momentum de uma partı́cula, ou
conjunto de partı́culas. A motivação para isto está no fato de que, em relatividade, massa
e energia são ambos fontes de campo gravitacional, e uma vez que a energia aparece como
a componente temporal do 4-vetor momentum, é esperado que este objeto apareça na
construção.
• Obs:
Note que a energia relativı́stica E não é um escalar!
1.3.2 O tensor energia-momento de um fluido perfeito em movi-

mento
Um fluido pode ser caracterizado por um campo de velocidades uµ e duas variáveis ter-
modinâmicas, que escolheremos como sendo a densidade própria ρ e a pressão p. A fim
de garantir que ρ seja um escalar, definiremos a densidade própria como sendo a massa
de repouso por unidade de volume de repouso (ou volume próprio).
O tensor energia-momento de um fluido perfeito é dado pelo tensor de ordem-2, T µν ,
simétrico:
.
p p
T µν = ρ + 2 uµ uν − 2 η µν . (1.61)
c c
• Obs:
A projeção de T µν na direção da 4-velocidade uµ é dada por
T µν uν = c2 ρuµ , (1.62)
17
que representa, a menos do fator c2 , a densidade de 4-momentum. Usamos acima
que, de Eq. (1.56),
2
uµ uµ = u0 u0 + ui ui = u0 + γ 2 v i vi
v2

= γ c − γ v = γ c 1 − 2 = c2 .
2 2 2 2 2 2
(1.63)
c
O tensor momentum energia de um sistema isolado é tal que possui divergência nula. Este
fato (que pode ser demonstrado facilmente) representa a lei de conservação do momentum
e energia, em sua forma diferencial.
Assim, para sistemas isolados,
∂T µν
= 0, (1.64)
∂xν
ou ainda, em notação mais compacta:
T µν ,ν = 0. (1.65)
Vamos, a seguir, explorar esta lei de conservação no contexto do modelo proposto em Eq.
(1.61) para um fluido em movimento.
Das equações (1.61) e (1.65),
h p i
ρ + 2 uµ uν − pτ µν = 0 (1.66)
c ,ν
ou
1 p 1
(ρuµ ),µ uν + ρuµ uν ,µ + 2
p,µ uµ uν + 2 uµ ,µ uν + 2 puµ uν ,µ − p,µ τ µν = 0. (1.67)
c c c
Podemos obter, a partir de Eq. (1.67), uma equação escalar projetando-a na direção de
uµ :
1
c2 (ρuµ ),µ + ρuµ uν uν ,µ + p,µ uµ + puµ ,µ + 2 puµ uν uν ,µ − p,µ uµ = 0 (1.68)
c
mas, uma vez que uµ uµ = c2 , segue que
uν uν ,µ = 0 (1.69)
e, de (1.68) resulta
1 µ
(ρuµ ),µ +
pu ,µ = 0. (1.70)
c2
Finalmente, introduzindo Eq. (1.70) em (1.67), obtemos

1 µ ν µν 1 µ ν
ρ + 2 p u u ,µ = τ − 2 u u p,µ . (1.71)
c c
As equações (1.70) e (1.71) correspondem, respectivamente à equação da continuidade e

à equação de movimento para fluidos perfeitos relativı́sticos. Este resultado, então nos
assegura a validade da lei proposta pela divergência nula do tensor momentum energia.
• Obs:
No limite não relativı́stico de baixa velocidade
vc (1.72)
18
e baixa pressão
p ρc2 , (1.73)
obtemos, de Eq. (1.70), a equação da continuidade clássica:
∂ρ ~
+ ∇ · (ρ~v ) = 0; (1.74)
∂t
e de Eq. (1.71), obtemos a conhecida equação de Euler:
∂~v ~ 1~
+ ~v · ∇ ~v = − ∇p. (1.75)
∂t ρ
A equação (1.71) pode ser apresentada em uma forma mais intuitiva se reescrevermos o
termo uµ uν ,µ na seguinte forma:
dxµ ∂
ν
µ ν dx
u u ,µ = µ
dτ ∂x dτ
ν
d dx d 2 xν
= = . (1.76)
dτ dτ dτ 2
Assim, de (1.71) e (1.76)

2 µ
1 dx µν 1 µ ν
ρ + 2p = τ − 2 u u p,µ . (1.77)
c dτ 2 c
Como vemos, quando p,µ = 0 as partı́culas de fluido seguem geodésicas. Em outras
palavras, as partı́culas de fluido seguem trajetórias que desviam das geodésicas sempre
que houver um gradiente de pressão.
Para qualquer configuração de fluidos (fluidos imperfeitos, fluidos carregados, etc.)
ou campos (campo eletromagnético por exemplo) o tensor momentum-energia poderá ser
constituı́do como um tensor simétrico com divergência nula.
• Obs:
Todo o tratamento utilizado foi realizado considerando um espaço-tempo plano
com métrica de Minkowski τ µν . A generalização para espaços-tempos curvos é
operacionalizável requerendo o critério de covariância das equações. Neste caso, as
derivadas simples são substituı́das por derivadas covariantes e a métrica plana τ µν
é substituı́da pela métrica curva gµν .
1.4 Teoria Linear da Gravitação

1.4.1 Construindo as Equações de Campo
Como ponto de partida para a construção de uma teoria da gravitação , devemos decidir a
respeito da fonte de tais efeitos. Sabemos que, do “princı́pio de equivalência” Newtoniano
[6, 23], a massa inercial total de um sistema sofre interação gravitacional, ou seja, toda
forma de energia contribui para este tipo de interação . Desta maneira, a fonte para a
gravitação deve ser a densidade de energia do sistema fı́sico em questão. Entretanto,
apenas com a densidade de energia do sistema, não podemos construir uma teoria que
seja Lorentz-covariante (invariante), desde que poderı́amos, por uma simples mudança de
sistema de referência, passar a observar uma densidade de energia e um fluxo de energia,
19
ou fluxo de momentum. Assim, devemos procurar por um objeto que possa representar
todas estas formas de “energia”, da mesma maneira, em todos os referenciais Lorentzianos.
Um bom objeto que é conforme a estas caracterı́sticas e pode ser usado como fonte da
gravitação é o tensor momentum-energia da matéria, que denotamos por Tµν [5, 4].
Este objeto encerra toda a informação a respeito de qualquer tipo de matéria e energia
de origem não gravitacional. Note que, quando falamos energia, entendemos energia de
interação . Neste caso, Tµν carrega a contribuição da energia de interação entre a matéria
com ela própria e com o campo gravitacional, mas não a do campo gravitacional consigo
próprio.
Poderı́amos ser levados a pensar na possibilidade de considerar como fonte da gra-
vitação , o traço do tensor momentum-energia, T α α , que certamente é uma quantidade
Lorentz-invariante e representa uma densidade de energia. No entanto, se analisarmos
o caso do campo eletromagnético, vê-se que o traço do tensor momentum-energia cor-
respondente é identicamente nulo, de onde resulta que uma teoria construı́da com este
objeto determinaria que energia de origem eletromagnética não atuaria como fonte de in-
teração gravitacional. Fato este que entra em direta contradição com a experimentação .
Este problema aparece aqui, em consequência da teoria eletromagnética de Maxwell ser
linear. Em verdade, é possı́vel pensar na viabilização de uma formulação não linear
para o eletromagnetismo que resulte em um tensor momentum-energia com traço não
nulo, contribuindo finalmente para uma teoria construı́da de tal maneira a admitir este
escalar, T α α , como fonte material do campo. Entretanto, tal construção nos levaria por
outros caminhos, contrariamente ao que estamos propondo discutir neste trabalho. Uma
completa revisão sobre este assunto pode ser encontrada no livro sobre eletrodinâmica
não linear, escrito por J. Plebanski (veja ref.: [24]). Uma vez que a teoria de Maxwell é
teoria do eletromagnetismo por excelência, somos levados a aceitar o tensor momentum-
energia, simétrico e de ordém 2, como um bom candidato para representar a fonte do
campo gravitacional.
Desde que o termo de fonte é um tensor de ordem 2, vamos escolher o tensor potencial
gravitacional que denotaremos por φµν , para representar esta interação . Acrescentamos
ainda que φµν seja simétrico,
φµν = φνµ ,
e impomos que este tensor seja adimensional, isto é,
[φµν ] = 1.
A maneira mais geral de escrever as equações de campo, de tal forma que: (i) respeitem
ao critério de linearidade; (ii) sejam construı́das com derivadas de no máximo ordem 2, e
ainda; (iii) que contenham Tµν como fonte material, resulta na combinação que segue:
∂α ∂ α φµν + a ∂α ∂ (µ φν)α + b ∂ µ ∂ ν φα α + c τ µν ∂α ∂ α φβ β + d τ µν ∂α ∂β φαβ = −κ T µν , (1.78)
onde a, b, c, d e κ são constantes que trataremos de fixá-las a seguir. Obviamente,

poderı́amos escrever a equação (1.78) acrescentando ainda os termos φµν e τ µν φα α , desde
que estamos chamando a expressão acima de a mais geral. No entanto, é notório que a
adição de tais termos implicaria em uma configuração de campo — no caso estático
— que decresce exponencialmente com a distância, e como admitimos que a interação
gravitacional seja de longo alcance, desprezamos de uma vez estes termos indesejados.
Poderı́amos também ter somado um termo de traço do tensor momentum-energia, porém,
esta feita corresponderia a uma simples redefinição das constantes já existentes, não
trazendo assim nada de novo.
20
Para procurar o valor das constantes envolvidas, vamos estabelecer o princı́pio de
conservação da energia, ou seja, imporemos que o tensor momentum-energia, escolhido
para atuar como fonte do campo, tenha divergência nula
T µν ,ν = 0. (1.79)
Assim, as equações de campo se reduzem à,
(1 + a) ∂ α ∂α ∂ν φµν + (a + d) ∂ µ ∂α ∂β φαβ + (b + c) ∂ µ ∂ α ∂α φβ β = 0, (1.80)
mostrando assim, que as constantes devem obedecer às seguintes condições :
a = −1, (1.81)
d = +1, (1.82)
b = −c. (1.83)
Os valores que podem tomar as constantes b e c (b ou c), conduzem a diferentes equações

de campo, embora consequentes de uma mesma construção teórica. Alguns valores são,
realmente, não permitidos [6]. Vamos fixar o valor da constante b como sendo
b = 1,
sem entrar em outros detalhes que esta escolha sugere [11]. Assim, temos as seguintes
equações de campo, lineares, para a descrição do campo gravitacional,
∂α ∂ α φµν − ∂α ∂ (µ φν)α + ∂ µ ∂ ν φα α − τ µν ∂α ∂ α φβ β − ∂α ∂β φαβ = −κ T µν .

(1.84)
Reconhecemos a constante que resta, κ, como uma constante de acoplamento, e seu valor
pode ser fixado facilmente quando procurarmos pelo limite assimptótico da teoria, qual
seja, confrontando-a com resultados experimentais verificados na teoria Newtoniana.
Apesar de termos escrito as equações acima utilizando um sistema de coordenadas
cartesiano, as mesmas podem, sempre que necessário, ou conveniente, passar para uma
forma mais geral, válida em um sistema arbitrário de coordenadas no espaço tempo plano.
A justificativa é fundamentada no fato de que as equações obedecem ao princı́pio de
covariância, portanto, são válidas em qualquer sistema de coordenadas. Logo, para pro-
cedermos a tal generalização , devemos substituir as derivadas simples por derivadas
covariantes, com respeito a métrica geral γαβ , e substituir a métrica constante ταβ por
γαβ . Desta forma, a equação tensorial (1.84) pode ser reescrita como:
φµν;α α − φα(µ;ν) α + φα α;µν − γµν φβ β ;α α − τ µν φαβ ;αβ = −κ T µν ,

(1.85)
onde (;) simboliza a derivada covariante com respeito a métrica geral para o espaço tempo
plano, γµν . Desde que nada perdemos em generalidade, usaremos sempre o sistema de
coordenadas que torna mais simples as operações matemáticas. Só escreveremos as
expressões de maneira geral em sua forma final, quando for conveniente.
As equações lineares para campos de spin-2, foram primeiramente apresentadas por
M. Fierz e W. Pauli no trabalho [14], onde derivaram as equações de onda para partı́culas
com spin arbitrário em um dado campo eletromagnético.
21
1.4.2 Equações de Campo como Consequência de um Princı́pio
Variacional
De maneira alternativa a que realizamos para chegar à equação (1.85), podemos pensar
em construir a teoria linear da gravitação a partir de um princı́pio variacional, escrevendo
primeiramente uma Lagrangeana para representar o campo de spin-2, o que denominamos
de campo gravitacional, e dela derivar as equações de movimento seguindo o procedimento
usual que o princı́pio da mı́nima ação estabelece. Na literatura existem vários trabalhos
usando o formalismo Lagrangeano na derivação das equações lineares para a gravitação .
Uma boa revisão deste assunto pode ser encontrada no trabalho de W. E. Thirring,
indicada na referência [25]. Vamos usar a mesma motivação da seção 1.4.1 e aceitar
que a fonte do campo seja completamente determinada pelo tensor energia-momento da
matéria, Tµν . Vamos, então, procurar pela expressão mais geral possı́vel que possa ser
escrita em termos do potencial tensor, φµν , e derivadas de, no máximo, ordem 2. Note
que para resultar em equações de campo lineares, diferenciais de segunda ordem em φµν ,
a Lagrangeana deve ser de ordem 2 nas primeiras derivadas do potencial tensor. Com
estas caracterı́sticas, a quantidade mais geral pode ser escrita da seguinte maneira:
1
C1 φαβ,γ φαβ,γ + C2 φαβ ,β φγ α,γ + C3 φαβ ,β φγ γ,α + C4 φα α,γ φβ β,γ .

Lφ = (1.86)
κ
Em verdade, Lφ é a densidade de Lagrangeana do campo gravitacional, como fixaremos
a seguir quando avaliarmos a dimensão da constante de acoplamento. Esta expressão é a
mais geral no sentido em que qualquer outro termo que possamos construir desta forma,
pode ser convertido em um dos quatro já presentes em (1.86), a menos de termos de
superfı́cie, que não contribuiriam para a derivação das equações de campo.
Antes de prosseguir com o cálculo das variações , vamos examinar as dimensões fı́sicas
das quantidades que introduzimos. Da forma como escrevemos, a expressão (1.86) é uma
densidade de Lagrangeana, e como a Lagrangeana de um sistema fı́sico deve ter dimensão
de energia, implica que Lφ deva ter dimensão de densidade de energia. Assim, como o
tensor potencial, φαβ , foi escolhido para ser adimensional, podemos escrever as dimensões
de (1.86) na forma:
1 1
[Lφ ] = , (1.87)
[κ] L2
onde utilizamos
1
[φαβ,µ ] = .
L
Mas, impondo que
M L2 1

energia
[Lφ ] = ≡ ,
T 2 L3 volume
encontramos, comparando as expressões acima,
M L2 1 1 1
2 3
= .
T L [κ] L2
De onde resulta que a dimensão da constante de acoplamento deve ser dada por
T2

1
[κ] = = . (1.88)
ML força
Vemos assim, que a constante κ que aparece em (1.86) e também em (1.84), tem dimensão
de inverso de força. Então, visto que κ é uma constante dimensional e, como as únicas
22
constantes naturais que dispomos são a constante de Newton (G) e a velocidade da luz (c),
podemos encontrar uma relação de proporcionalidade entre elas. Vejamos, as dimensões
de G e c são, respectivamente,
L3
[G] = (1.89)
MT 2
L
[c] = . (1.90)
T
Desta feita, as equações (1.88), (1.89) e (1.90) podem ser combinadas de tal forma que
encontramos a seguinte relação :
G
[κ] = 4 . (1.91)
c
Ou seja, a menos de um fator numérico, multiplicativo, a constante de acoplamento, κ,
pode ser escrita em termos das constantes naturais c e G, na forma:
G
κ∼ . (1.92)
c4
Só poderemos escrever a expressão exata realizando algum teste observacional com a
teoria, ou mais diretamente, exigindo que a mesma se reduza, no limite de campo fraco e
baixas velocidades, ao caso Newtoniano.
A ação do campo gravitacional, Sφ , é construı́da como,
Z
1
Sφ = − d4 xLφ . (1.93)
c
Do princı́pio da mı́nima ação 9 , se tomarmos a variação de Sφ igual a zero, estaremos

implicitamente derivando as equações de movimento do campo gravitacional para o vazio.
De modo a completar a teoria, além da ação para o campo, devemos somar a ação da
matéria, SM . Assim, a ação total será dada por
S = Sφ + SM , (1.94)
e as equações de campo resultam do princı́pio da mı́nima ação :
δS = 0. (1.95)
Por enquanto, deixaremos em aberto a descrição da matéria por meio de uma La-
grangeana especı́fica e escreveremos somente que
Z
1
SM = d4 xLM , (1.96)
c
onde LM obedece à variação
1
δLM = T αβ δφαβ , (1.97)
2
a fim de que a variação da ação com respeito ao campo φαβ resulte no tensor de momentum-
energia da matéria.
Vamos considerar, então, a variação da ação total definida pela equação (1.94),
δS = δSφ + δSM = 0.
9
Veja a Seção 8.4.1.
23
De posse das relações acima definidas, a variação efetuada10 fornece,
Z
1 4 1
2 C1 φαβ,γ γ + 2 C2 φαρ,β ρ + C3 φ,αβ + 2 C4 τ αβ φ,τ τ + C3 τ αβ φτ σ ,τ σ

dx
c κ

1 αβ
+ T δφαβ = 0,
2
(1.98)
de onde, usando a propriedade de simetria do tensor potencial, resulta as seguintes

equações de movimento:
4 C1 φαβ,γ γ + 2 C2 φρ(α,β) ρ + 2 C3 φ,αβ + 4 C4 τ αβ φ,τ τ + 2 C3 τ αβ φτ σ ,τ σ = −κ T αβ . (1.99)
Logo, em vista de se obter uma lei de conservação , ou mais diretamente, comparando

estas equações obtidas do princı́pio variacional com as equivalentes, derivadas em (1.84),
estabelecemos os seguintes valores para as constantes:
1
C1 = + (1.100)
4
1
C2 = − (1.101)
2
1
C3 = + (1.102)
2
1
C4 = − . (1.103)
4
Assim sendo, as equações de movimento tomam a forma já esperada, apresentada na
equação (1.84). Substituindo finalmente os valores das contantes na Lagrangeana (1.86),
resulta:
1
φαβ,γ φαβ,γ − 2 φαβ ,β φγ α,γ + 2 φαβ ,β φγ γ,α − φα α,γ φβ β,γ .

Lφ = (1.104)
4κ
Por conveniência de notação , vamos definir o tensor simétrico de ordem 2, G(L)

µν , como
(L)
Gµν uφµν − φα (µ,ν),α + φ,µν − τµν (u
=t tφα α − φαβ ,αβ ). (1.105)
A letra (L) indica que este objeto é linear na sua dependência no potencial tensor, φαβ .
Em termos deste objeto, as equações de campo podem ser apresentadas compactamente
como,
G(L)
µν = −κ Tµν , (1.106)
e a Lagrangeana Lφ pode ser convenientemente reescrita, a menos de termos de superfı́cie,
na seguinte forma:
1
Lφ = − G(L) φµν . (1.107)
4κ µν
Vemos então, que a teoria linear para campos de spin 2 pode ser facilmente derivada de
um formalismo Lagrangeano, como apresentamos nesta seção .
10
Devemos notar que abandonamos integrais de superfı́cie, admitindo que o tensor potencial gravita-
cional tenha suporte compacto.
24
1.4.3 Transformação de calibre
Como podemos notar, das equações de campo, uma dada solução de φµν continua a
ser solução se somarmos o objeto simétrico Λµ,ν . Em outras palavras, as equações de
campo, (1.106), são invariantes sob a seguinte transformação :
φαβ → φαβ + Λ(α,β) . (1.108)
Isto significa que estas equações não determinam as soluções univocamente, mas a menos
de uma transformação , indicada pela expressão (1.108), gerando assim uma ambiguidade
na determinação das mesmas. Uma maneira de se tentar eliminar esta ambiguidade seria
pela introdução de certas condições . Vamos definir a seguinte condição sobre o tensor
potencial (Gauge de Hilbert):
1
φαβ ,β − τ αβ φ,β = 0, (1.109)
2
ou ainda, se introduzirmos a mudança de variável,
1
hµν ≡ φµν − τµν φ, (1.110)
2
obteremos,
hαβ ,β = 0. (1.111)
Em termos desta nova variável e usando as condições acima, as equações de campo se
reduzem à
t
uhµν = −κTµν . (1.112)
Esta é uma forma simples e muito conveniente de expressar as equações que resultam
desta construção linear. Nos capı́tulos que seguem, as usaremos para derivar algumas das
soluções necessárias para a verificação do limite Newtoniano. Mais detalhes a respeito
de introdução de condições sobre equações de campo, podem ser encontrados em vários
livros textos de gravitação , como por exemplo nas referências [5, 26, 4] dentre outras.
1.4.4 Problemas com a Lei de Conservação da Energia

Na construção da teoria linear para a gravitação , tomamos o cuidado de escolher as
constantes multiplicativas de tal forma a resultar em uma lei de conservação da en-
ergia. Desta maneira, obtivemos um objeto, G(L) µν , com divergência identicamente nula,
implicando em
Gµν
(L) ,ν = 0 ⇒ T µν ,ν = 0. (1.113)
Entretanto, o tensor energia-momento da matéria carrega informação a respeito de qual-
quer tipo de energia e da sua interação com o campo gravitacional — quando considerado
o acoplamento com o mesmo —, exceto aquela energia que é proveniente do próprio campo
gravitacional. Assim sendo, não contém os termos de auto interação do campo, e, desde
que energia deve sofrer interação com a gravitação , não importando a sua origem, re-
sulta que a lei de conservação apresentada pela teoria linear, imposta pela divergência do
(L)
tensor Gµν , deve ser inconsistente — ou pelos menos incompleta —, uma vez que o tensor
energia-momento não pode se conservar separadamente, mas somente quando considerada
também a energia do campo gravitacional. Desta feita, devemos alterar as equações de
movimento e somar ao tensor energia-momento da matéria, o tensor energia-momento do
campo gravitacional, que chamaremos de tµν .
25
Então, as equações de movimento devem ser alteradas para a forma,
G(L)
µν = −κ (Tµν + tµν ) , (1.114)
e a identidade (1.113) leva à seguinte lei de conservação :
(T µν + tµν ) ,ν = 0, (1.115)
que representa uma lei de conservação adequada, deixando as equações de campo repre-
sentadas pela expressão (1.114), livre de inconsistências.
O próximo passo consiste, necessariamente, em encontrar a forma explı́cita do novo
objeto, tµν . Aqui surge um interessante problema. É bem conhecido que existe um pro-
cedimento canônico de se obter o tensor energia-momento, associado a um campo, a partir
da Lagrangeana deste dado campo. No entanto, a Lagrangeana que construı́mos é tal que
resulta, juntamente com a matéria, nas equações de movimento (1.106), que, como já
vimos, não são completas. Assim, o tensor energia-momento que poderemos encontrar
a partir desta Lagrangeana, não poderá ser o tensor energia-momento completo para a
gravitação , mas apenas uma primeira aproximação deste. Entretanto, quando escrever-
mos este objeto — primeira aproximação — deveremos somá-lo às equações (1.106)
no intuito de as aproximar para a forma fechada (1.114), e esta operação , modificando
as equações de campo, modifica como consequência a Lagrangeana que as resulta de
um princı́pio variacional. Então, a fim de corrigir esta Lagrangeana de modo a acertar a
teoria nesta ordem, devemos acrescentar a ela o complemento adequado. Ora, uma vez
que a Lagrangeana agora está modificada, um novo tensor de energia-momento do campo
poderá ser derivado, resultando ser este — segunda aproximação — mais completo. É
evidente que este procedimento se extende indefinidamente, e em cada estágio, estaremos
com a teoria mais completa para descrever o campo gravitacional. A teoria final surge
quando realizarmos infinitas interações deste tipo.
A teoria que emerge deste procedimento é identificada com a relatividade geral por
alguns autores. Os primeiros esforços nesta direção , foram realizados por R. H. Kraichnan
[27, 28] e, na mesma época, por S. N. Gupta [29]. No entanto, um excelente exame a
respeito destas questões foi feito, independentemente, por R. P. Feynman em um curso de
gravitação que ministrou durante os anos de 1962-63 na Califórnia-EUA, e cujas notas de
aula foram recentemente publicadas por dois de seus alunos (veja ref.: [11]). Veja também
a referência [15], onde o assunto é apresentado em sua versão mais completa.
1.4.5 O tensor energia-momento do campo gravitacional — primeira

aproximação
Associada a uma Lagrangeana qualquer, escrita na forma
L = L(ξ, ξ,µ ), (1.116)
o princı́pio da mı́nima ação fornece uma quantidade conservada, dada pela expressão,
∂L
Λµ ν = ξ,µ − δµ ν L, (1.117)
∂ξ,ν
11
que chamamos de tensor energia-momento do campo ξ.
11
Uma boa discussão deste objeto é apresentada no livro do L. D. Landau e E. M. Lifshitz, na referência
[30]. Veja também a Seção 8.4.1.
26
Assim, o tensor energia-momento associado ao campo gravitacional pode ser obtido
por meio da expressão:
∂Lφ
tµ ν = φαβ,µ − δµ ν Lφ , (1.118)
∂φαβ,ν
onde Lφ é a densidade de Lagrangeana do campo, dada em (1.104). Vamos introduzir a
seguinte relação de derivação das derivadas do tensor potencial,
∂φστ,ω 1
= δ µ (σ δ ν τ ) δ ρ ω . (1.119)
∂φµν,ρ 2
ν
Finalmente, usando esta relação , o tensor momentum-energia, t(1)
µ , pode ser encontrado,
e resulta na seguinte expressão:
ν 1
t(1)
µ = φαβ,µ φαβ,ν − 2 φβ ν ,µ φβρ ,ρ + φα ν ,µ φ,α + φ,µ φνρ ,ρ − φ,µ φ,ν
2κ
δµ ν

αβ,γ αβ γ αβ ,α

− φαβ,γ φ − 2 φ ,β φ α,γ + 2 φ ,β φ,α − φ φ,α . (1.120)
2
Como já comentamos anteriormente, este tensor consiste apenas na primeira aproximação
do tensor completo, por este motivo escrevemos o indice “(1) ” na expressão acima. Desta
feita, as equações de movimento são reescritas, nesta ordem, na forma:

G(L) (1)
µν = −κ Tµν + tµν . (1.121)
No caso de fixarmos condições sobre o tensor potencial, φαβ , definidas pela relação
(1.111),
1
φαβ ,β = φ,α , (1.122)
2
o tensor t(1)
µν se reduz à forma,
δµ ν

(1) ν
1 αβ,ν 1 ,ν αβ,γ 1 ,α
tµ = φαβ,µ φ − φ,µ φ − φαβ,γ φ − φ φ,α . (1.123)
2κ 2 2 2
Note que, para reescrevermos esta última expressão em termos da variável hαβ , é necessário,
simplesmente, substituir a letra φ pela letra h.
O tensor momentum-energia do campo gravitacional associado à Lagrangeana da teo-
ria linear, para uma escolha de coordenadas harmônicas, foi primeiramente apresentado
por S. N. Gupta, quando examinava um método de quantização da teoria da relatividade
geral, em aproximação linear — veja Refs.: [31, 32].
1.4.6 Balanço de momentum-energia entre a Matéria e o Campo

Gravitacional
Vamos seguir, procurando entender quais consequências traz a lei de conservação imposta
pela equação (1.115). Adotando as condições (1.111), as equações de campo se reduzem
em primeira aproximação no tensor momentum-energia do campo, à:

uhµν = −κ Tµν + t(1)
t µν (1.124)
e a lei de conservação que segue é dada por,
T µν ,ν + t(1)µν ,ν = 0. (1.125)
27
Mas, da equação (1.123), reescrita em termos da variável hαβ , e tomada a sua divergência,
encontramos:
(1)αβ
1 µν,α 1 ,α
t ,β = tuhµν h − tuhh . (1.126)
2κ 2
Entretanto, se introduzirmos aqui as equações de campo, (1.124), e desprezando quaisquer
contribuições de ordem superior a que estamos tratando12 , ou seja, desprezando termos
de ordem O(φ3 ), a expressão acima se reduz à interessante forma,
1
t(1)αβ ,β = − Tµν φµν,α , (1.127)
2
donde a lei de conservação expressa pela relação (1.125), pode ser reescrita mais conve-
nientemente como,
1
Tα β ,β − φµν,α T µν = 0. (1.128)
2
Esta é a equação que representa o balanço de momentum-energia entre a matéria e o
campo gravitacional. A partir desta relação , podemos derivar a equação que governa o
movimento das partı́culas materiais imersas em um dado campo gravitacional fraco. Para
isto, começamos por integrar a equação (1.128) num volume V , fornecendo a relação
integral: Z Z
3 β 1
d xTα ,β = d3 xφµν,α T µν . (1.129)
V 2 V
O termo do lado esquerdo pode se expandido na forma

Z Z Z
3 β 3 0
d xTα ,β = d xTα ,0 + d3 xTα k ,k . (1.130)
V V V
Mas, transformando a última integração de volume para superfı́cie — teorema de Gauss

— segue, Z Z
3 k
d xTα ,k = dSk Tα k (1.131)
V S
e, como podemos estender a superfı́cie de integração para fora da região onde existe
conteúdo material, esta integração se anula, resultando assim:
Z Z
3 β
d x Tα ,β = d3 xTα 0 ,0 . (1.132)
V V
Vamos definir o 4-vetor momentum13 , Pα , da partı́cula,

Z
1
Pα ≡ d3 xTα 0 . (1.133)
c V
12
A razão para desprezarmos termos de ordem superior a 2, no campo, é muita clara, uma vez que
se considerassemos estes termos, estarı́amos perdendo toda a ordem 3 que viria do próximo termo do
tensor momentum-energia do campo gravitacional, e assim por diante. De qualquer forma, o objetivo que
almejamos nesta seção é procurar pelo limite Newtoniano, que corresponde à estrutura de campo fraco,
donde a aproximação é plenamente justificada.
13
É conveniente chamar esta quantidade de momentum devido à sua dimensão fı́sica:
ML
[Pµ ] = = {momentum linear} .
T
28
Assim, de (1.129), Z
∂Pα 1
= d3 xφµν,α T µν . (1.134)
∂t 2 V
Para calcular a integração que aparece no lado direito da equação (1.134), vamos
usar dois argumentos. Primeiramente, façamos a hipótese de que o potencial tensor tenha
variação desprezı́vel sobre o volume da partı́cula, ou seja, pode ser considerado constante
nesta região. Desta forma, φαβ,µ pode sair da integração acima, restando,
Z
∂Pα 1
= φµν,α d3 xT µν . (1.135)
∂t 2 V
E por último, usaremos uma aproximação para a expressão do tensor momentum-energia

da matéria,
T µν = ρuµ uν + O(φ) (1.136)
com
m
ρ= (1.137)
V
α
e u o 4-vetor velocidade, ou mais simplesmente, a 4-velocidade:
∂xα
uα = = γ(c, v k ), (1.138)
∂τ
onde γ = (1 − v 2 /c2 )−1/2 . Na expressão (1.137), m representa a massa da partı́cula e V
o seu volume, enquanto na expressão (1.138), τ é o tempo próprio. A densidade própria
de energia da partı́cula ρ0 é escrita em termos de ρ através da expressão:
ρ
ρ0 = . (1.139)
1 − v 2 /c2
Consideraremos a aproximação (1.136) em (1.135). Esta aproximação é aceitável devido
a presença do potencial φµν,α multiplicativo. Desta maneira, o termo que desprezamos
contribuiria somente em ordem O(φ2 ) para as equações de movimento das partı́culas.
Obviamente, não conhecemos a forma explı́cita do tensor momentum energia da matéria,
e também, esta expansão não pode ser utilizada para o cálculo de Pα , em (1.135), uma vez
que os termos da ordem desprezada contribuiriam na ordem de aproximação considerada.
Então, introduzindo a expressão (1.136) em (1.135), resulta
Z
∂Pα 1
= φµν,α d3 x ρ0 uµ uν + O(φ2 ). (1.140)
∂t 2 V
Se explicitarmos os termos nesta equação de acordo com os resultados obtidos anterior-

mente, poderemos realizar a integração facilmente, resultando por fim,
∂Pα m
− φµν,α uµ uν = 0, (1.141)
∂τ 2
onde utilizamos adicionalmente, a relação :
r
v2
dτ = dt 1− . (1.142)
c2
A equação (1.141) é a equação de movimento de uma partı́cula de massa m imersa
em um campo gravitacional, em uma primeira aproximação . É bem verdade que ainda
devemos prosseguir e procurar escrever a expressão para o 4-momentum da partı́cula,
29
assim como o fizemos com o lado direito das equações (1.135). Até este ponto, podemos
apenas inferir que sua forma seja dada por termos do tipo
Pα ∼ {m uα ; m φαβ uβ },
desde que qualquer outro termo necessitaria de uma nova constante dimensional. De qual-
quer modo, uma maneira particularmente interessante de se obter a expressão procurada,
formalmente, é por meio de comparação com as equações de Euler-Lagrange, que são,
equivalentemente, as equações de movimento da partı́cula.
Para uma dada Lagrangeana, que seja função das coordenadas {xµ } e da 4-velocidade
uα , o princı́pio de Hamilton fornece as seguintes equações de movimento:
d ∂L ∂L
µ
− µ = 0. (1.143)
dτ ∂u ∂x
Se compararmos estas equações com (1.141), poderemos identificar os seguintes termos:
∂L
= Pµ (1.144)
∂uµ
e
∂L m
= φαβ,µ uα uβ . (1.145)
∂xµ 2
A equação (1.145) pode ser integrada imediatamente, fornecendo a expressão para a
Lagrangeana, L:
m
L = φαβ uα uβ + L0 (u), (1.146)
2
onde L0 (u) é a constante proveniente da integração com respeito a xµ , logo, uma função
arbitrária da 4-velocidade. Podemos encontrar a forma desta função L0 (u) impondo que
o limite assimptótico seja válido, i.e., para uma situação de campo nulo (φµν = 0), a
Lagrangeana deve se reduzir ao caso de uma partı́cula livre, para o qual,
m α
L0 = u uα . (1.147)
2
Assim, retornando à equação (1.146), escrevemos
m m
L= φαβ uα uβ + uα uα . (1.148)
2 2
Finalmente, de posse deste resultado, podemos derivar a expressão para o 4-momentum,
Pµ , através da relação apresentada em (1.144), fornecendo então:
Pµ = m uµ + m φαµ uα . (1.149)
e a equação diferencial que governa o movimento de uma partı́cula imersa em um campo

gravitacional, é reescrita na forma14 :
d 1
(uµ + φαµ uα ) − φαβ,µ uα uβ = 0. (1.150)
dτ 2
14
Note que esta equação é independente da massa da partı́cula, já mostrando ser válido o princı́pio
de Galileu, ou seja, o movimento de uma partı́cula teste submetida a um campo de forças de origem
gravitacional é tal que independe da massa da partı́cula. Com isso, partı́culas de massas diferentes
sentem a mesma aceleração proveniente da interação com este campo.
30
A derivada da 4-velocidade com respeito ao tempo próprio é chamada de 4-aceleração ,
e é da ordem do próprio campo, implicando que a derivação do segundo termo entre
parênteses pode ser simplificada, resultando assim em:
duµ 1
+ φµα,β uα uβ − φαβ,µ uα uβ = 0. (1.151)
dτ 2
Lembramos que a única aproximação que utilizamos para derivar esta equação de movi-
mento, foi a aproximação para campo fraco. No entanto, não impomos limite para baixas
velocidades. Assim, se quizermos verificar o limite Newtoniano, deveremos impor uma
condição adicional, uma vez que a teoria é relativista. É o que realizaremos na próxima
seção .
1.4.7 As Equações de Campo no Limite Newtoniano

Das equações de campo, utilizando o gauge de Hilbert, obtivemos a expressão (1.124).
Como já sabemos, estas equações possuem termos de ordem O(φ) e O(φ2 ). Naturalmente,
qualquer teoria que seja construı́da para descrever o campo gravitacional, deve ser capaz
de exibir os resultados da teoria Newtoniana em uma aproximação de campo fraco e
regime de baixa velocidade. Assim, para procurar por este limite, devemos impor as
seguintes condições sobre as equações de campo:
(i) estrutura de campo fraco:
φαβ 1; (1.152)
(ii) regime de baixas velocidades:
v c. (1.153)
Vamos, adicionalmente, procurar resolver a situação de campo estático. Neste limite, as
componentes espaciais da 4-velocidade serão condicionadas pela relação :
dxk
uk = ≈ v k c. (1.154)
dτ
Das condições (1.152) e (1.153), vemos que termos de ordem v 2 e v φ poderão ser de-
sprezados nas equações que seguem, uma vez que são de ordem O(2) na aproximação
considerada. As equações de movimento se reduzem, para este caso, à forma:
dv k c2
+ c2 φk 0,0 − φ00 ,k = 0. (1.155)
dt 2
Desde que estamos interessados em examinar o caso estático, o segundo termo em (1.155)
se anula, restando
dv k c2
= φ00 ,k . (1.156)
dt 2
No entanto a equação equivalente na teoria Newtoniana é dada por:
dv k
= Φ,k , (1.157)
dt
onde Φ representa o potencial Newtoniano. Assim, comparando estes resultados, encon-
tramos:
c2
Φ = φ00 . (1.158)
2
31
Agora que já identificamos o potencial gravitacional para esta situação assimptótica,
vamos operar diretamente com as equações de movimento (1.124). Primeiramente, vamos
analisar as componentes do tensor momentum-energia, T µν , cujas componentes se reduzem
à:
T 00 ≈ ρ0 c2 ≈ ρ c2 (1.159)
T kµ ≈ ρ uk uµ ≈ 0. (1.160)
O tensor momentum-energia do campo gravitacional, que aparece no segundo termo do

lado esquerdo nas equações (1.124), já é desprezado inteiramente por ser de ordem
superior — O(φ2 ). Assim, as componentes das equações de campo, se reduzem à:
52 h00 ≈ κ ρ c2 (1.161)
52 hkµ ≈ 0. (1.162)
Desta feita, das relações acima, concluı́mos que
52 h ≈ κ ρ c 2 , (1.163)
e podemos escrever finalmente a expressão para o Laplaciano do campo φ00 , que já rela-
cionamos previamente com o potencial Newtoniano. Assim operando, encontramos
1
52 φ00 = κ ρ c2 . (1.164)
2
Introduzindo nesta última, a relação (1.158), poderemos fixar o valor da constante κ.

Vejamos:

2 00 2 2Φ 1
5 φ =5 2
= κ ρ c2 , (1.165)
c 2
ou ainda,
κ ρ c4
52 Φ = . (1.166)
4
Porém, da teoria Newtoniana,
52 Φ = 4π G ρ. (1.167)
Logo, comparando estas expressões, encontramos que a constante de acoplamento tem o

valor de modo a ajustar a teoria ao limite Newtoniano, resultando:
16 π G
κ= . (1.168)
c4
As equações (1.156) e (1.164) mostram que a teoria construı́da é perfeitamente re-

dutı́vel a teoria de Newton da gravitação .
Note que a teoria que apresenta o limite Newtoniano não é a teoria linear desen-
volvida nas primeiras seções deste capı́tulo, mas a teoria corrigida pela adição do tensor
momentum-energia do campo em primeira aproximação , que é de segunda ordem no
tensor potencial gravitacional.
32
Nota
A densidade de Lagrangeana associada à teoria linear (aproximação linear) da gravitação
foi apresentada através da equação (1.148). Da mecânica Lagrangeana, pode ser demons-
trado que a expressão uα (∂L/∂uα )−L corresponde a uma constante de movimento. Assim,
usando este resultado na Lagrangeana encontrada em Eq. (1.148), teremos, após algumas
simplificações,
φαβ uα uβ + uα uα = c2 . (1.169)
Finalmente, usando a definição para a 4-velocidade, esta equação pode ser reapresentada
na forma
ds2 = (ταβ + φαβ )dxα dxβ . (1.170)
Esta expressão mostra claramente que na ausência de campo gravitacional (φ) o espaço-
tempo se reduz a forma plana Minkowskiana, e quanto φ 6= 0 (na presença de campo
gravitacional), ds2 corresponderá ao elemento de linha de um espaço-tempo curvo (em
geral).
1.5 Teoria da Relatividade Geral

1.5.1 O princı́pio da equivalência
Primeiramente, vamos definir dois termos que serão usados nesta seção :
(i) partı́cula teste: uma partı́cula eletricamente neutra, cuja auto-energia gravitacional
seja despresı́vel, e com dimensões suficientemente pequenas, a fim de não sentir as inomo-
geneidades do campo gravitacional externo.
(ii) experimento local não gravitacional: qualquer experimento realizado em laboratório
caindo livremente sob a ação de um dado campo gravitacional, sendo o laboratório blin-
dado (com paredes fechadas), suficientemente pequeno, a fim de não ser perturbado por
inomogeneidades de campos externos, e ainda, cujos efeitos de auto interação gravita-
cional possam ser desprezados.
Vamos separar o nosso estudo em termos da versão Newtoniana e Einsteiniana do
princı́pio da equivalência. Como vimos na seção 1.2, o princı́pio da equivalência New-
toniana estabelece que a massa inercial de qualquer corpo material é igual à sua massa
(carga) gravitacional:
mI = mG . (1.171)
Em outras palavras, podemos dizer que este princı́pio estabelece que todos os corpos
caem, em um dado campo gravitacional, com a mesma aceleração , independentemente de
suas massas ou composição material. De maneira mais rigorosa, definiremos o princı́pio
da equivalência Newtoniano da seguinte forma:
“Se uma partı́cula teste estiver situada em um dado ponto do espaço-tempo, e lhe for
inferida uma dada velocidade inicial, sua trajetória será independente de sua estrutura
material.”
A partir deste princı́pio Einstein foi capaz de desvendar os caminhos que o levaram
à teoria da relatividade geral. O novo ingrediente acrescentado ao princı́pio Newtoniano
foi observar que, se todos os corpos caem, em um dado campo gravitacional externo, com
a mesma aceleração , então, para um observador em um laboratório que cai livremente
no mesmo campo gravitacional, os corpos deverão ser observados como livres de acel-
eração . Assim, a medida que seus movimentos mecânicos são considerados, os corpos se
comportam como se o campo gravitacional estivesse ausente.
33
• Obs:
Obviamente, existem efeitos devido a não homogeneidade do campo gravitacional,
mas os mesmos podem ser considerados desprezı́veis a medida que utilizamos um lab-
oratório de dimensões muito pequenas. Para fins práticos a dimensão do laboratório
utilizado no experimento deve ser tal que influência devida a não homogeneidade do
campo recaia, no valor medido para a grandeza em consideração , sobre algarismos
não significativos do valor medido.
– Deve-se notar, entretanto, que a mecânica quântica impõe limites (princı́pio da

incerteza de Heizenberg) quanto à dimensão fı́sica do laboratório. Em verdade,
não podemos propor o experimento com laboratório arbitrariamente pequeno.
Einstein foi ainda além e estabeleceu que, não somente as leis da mecânica, mas todas
as leis da fı́sica deveriam se comportar em tal laboratório como se a gravitação estivesse
ausente. Similarmente ao caso Newtoniano, vamos definir o princı́pio da equivalência
Einsteiniano da seguinte forma:
i) “O princı́pio da equivalência Newtoniano é válido;
ii) O resultado de qualquer experimento local não gravitacional é independente da
velocidade de queda livre do aparatus, bem como independente de onde e quando no
universo ele for realizado”.
• Obs:
A verificação do princı́pio da equivalência para uma dada teoria, candidata à
gravitação , implica para a mesma na verificação dos postulados de uma teoria
métrica para este fenômeno. Estes postulados estabelecem que o espaço-tempo,
preenchido pelo campo gravitacional, deve ser deformado pelo mesmo, podendo, as-
sim, ser representado por uma estrutura métrica, que definiremos através do tensor
g µν . (1.172)
As partı́culas teste seguem geodésicas nesta geometria; e ainda, se escolhermos um

referencial local de Lorentz, quaisquer leis naturais de origem não gravitacional,
devem ser aquelas da relatividade especial (ou seja, que satisfazem ao princı́pio da
relatividade especial).
1.5.2 As equações de campo

Vimos na seção 1.4 que, na construção linear (aproximação linear) da teoria gravita-
cional, o elemento de linha ds2 associado ao espaço-tempo plano Minkowskiano
ds2 = τµν dxµ dxν (1.173)
sofre uma modificação quando o campo gravitacional está presente. Neste caso (o caso
linear) resulta que
ds2 = (τµν + φµν )dxµ dxν . (1.174)
Assim, podemos interpretar que uma partı́cula teste no espaço-tempo preenchido por um
campo gravitacional (que na aproximação linear foi denotado por φαβ ) “experimenta”
uma geometria efetiva, em geral curva, dada por
g̃µν = τµν + φµν . (1.175)
34
As equações de movimento desenvolvidas na seção 1.4 podem ser reapresentadas em
termos de gµν por simples substituição de φµν por gµν , uma vez que somente aparecem
termos contendo derivadas de φµν na expressão para o G(L) µν . Nesta representação , as
equações de campo ficam
ug̃µν − ∂ α ∂(ν g̃µ)α + ∂µ ∂ν g̃ αα − τµν t

ug̃ αα − ∂ α ∂ β g̃αβ = −κ Tµν .

t (1.176)
• Obs:
A métrica do espaço-tempo na aproximação linear é τµν .
As equações exatas, não lineares para a descrição dos fenômenos gravitacionais não
podem ser derivadas por critérios puramente lógicos, e constituem uma lei fı́sica. No
entanto, podemos propor alguns aspectos que esperamos serem verificados pelas equações
de campo, e, a partir desses aspectos procurar pela sua formulação (da teoria).
Exigiremos que as equações de campo respeitem aos seguintes critérios:
(i) As equações de campo devem ser invariantes frente a transformações gerais de co-
ordenadas: desde que uma teoria da gravitação que incorpore o princı́pio da equivalência
deve admitir sistemas de referências não inerciais gerais, as leis devem ser tensoriais, de
modo que dois quaisquer sistemas de coordenadas arbitrárias não possam ser distinguidas
pela lei fı́sica.
(ii) As equações de campo devem ser diferenciais de segunda ordem no tensor métrico
gµν (x): a fim de resultar no limite correto da teoria Newtoniana.
(iii) As equações de campo devem admitir uma métrica de Lorentz como solução
particular.
(iv) As equações de campo devem ser lineares nas derivadas segundas de gµν (x): com
isto garantimos a unicidade das soluções .
(v) As equações de campo devem ser dez equações diferenciais para os campos gµν (x):
uma vez que o campo gravitacional deve ser descrito pelas dez componentes do tensor
métrico. Assim, as equações para gµν devem ser expressas através de tensores construı́dos
com gµν e suas derivadas, e dadas numa forma covariante tensorial.
A escolha mais simples que contempla os critérios acima estabelecidos pode ser apre-
sentada através de contrações do tensor de curvatura e da métrica (explicitamente), para
o vazio (ausência de matéria), na forma
Rµν + aRgµν + Λgµν = 0 (1.177)
onde a e Λ são constantes a serem determinadas. Na presença de conteúdo material, as-

sumiremos o tensor momentum-energia como fonte do campo. Assim, devemos completar
as equações como
K
Rµν + aRgµν + Λgµν = − Tµν . (1.178)
2
Na equação acima, introduzimos uma nova constante K a fim de realizar o acopla-
mento do tensor momentum energia com as equações para geometria gµν . O fator 21 foi
introduzido apenas para posterior conveniência (mostraremos mais a frente que a con-
stante K será identificada com a constante de mesmo nome introduzida na aproximação
linear).
Da lei de conservação do tensor momentum energia
T µ νkµ = 0, (1.179)
implica que
(Rµ ν + aRg µ ν )kµ = 0. (1.180)
35
• Obs:
15
– Estamos usando o sı́mbolo k para representar a derivada covariante
– Já utilizamos na expressão acima que
gµνkα = 0. (1.181)
Agora, a fim de que a equação 1.180 seja satisfeita, escolheremos a constante
1
a=− , (1.182)
2
o que resulta em
µ 1 µ
R ν − R∂ ν = 0; (1.183)
2 kµ
que é a bem conhecida identidade de Bianchi.

Desta forma, concluı́mos que as equações de campo devem ser dadas por
1 K
Rµν − Rgµν = − Tµν . (1.184)
2 2
Note que restam ainda duas constantes a serem determinadas (Λ e K).
Para uma região livre de matéria as equações de campo são dadas por
1
Rµν − Rgµν + Λgµν = 0. (1.185)
2
Uma solução gµν (x) dada em um sistema de coordenadas (xµ ) está determinada a
menos de uma transformação de coordenadas
0
xα → x α (x), (1.186)
que introduz na solução quatro funções arbitrárias. A fim de nos livrarmos desta arbi-
trariedade devemos impor 4 condições de coordenadas envolvendo gµν . Estas condições
não são covariantes e são satisfeitas por qualquer métrica somente quando um sistema
de coordenadas for escolhido. Assim, teremos 10 equações de campo e 4 condições
de coordenadas. Ainda, devemos lembrar que a identidade de Bianchi implica em uma
dependência entre algumas equações . Em verdade, temos apenas 6 equações indepen-
dentes. Desta maneira, temos 6 equações de campo e 4 condições de coordenadas,
resultando em dez equações para dez incógnitas.
As constantes K e Λ podem ser fixadas quando impomos que as equações de campo
(equações de Einstein) devem, no limite de campo fraco e baixa velocidade, reduzir à
teoria Newtoniana. Neste caso, pode-se mostrar que
16πG
K= (1.187)
c4
e Λ deve ser zero, ou ter um valor muito pequeno a ponto de não interferir com os
resultados experimentais conhecidos dentro da faixa de algorismos significativos.
15
Ao longo do texto serão usadas outros sı́mbolos, tais como “;” e “∇”. Veja a definição de derivada
covariante no Capı́tulo ??
36
A constante Λ é conhecida na literatura como constante cosmológica e o termo cos-
mológico Λgµν é interpretado em algumas situações como a energia do vácuo. Para ver
isto, vamos reescrever convenientemente as equações de Einstein na forma
c4 Λ

1 8πG
Rµν − Rgµν = − 4 Tµν + gµν . (1.188)
2 c 8πG
Nesta forma o termo cosmológico aparece como uma contribuição extra ao tensor momentum-
energia.
• Obs:
Mesmo admitindo um pequeno valor para Λ (de tal forma a verificarmos os resul-
tados experimentais conhecidos nos testes de campo solar), a presença do termo
cosmológico pode trazer modificações profundas em um cenário cosmomógico de-
scrito pelas equações de Einstein.
A fim de explorar um pouco mais as consequências da presença do termo cosmológico nas

equações de Einstein, vamos considerar brevemente o limite Newtoniano. No limite de
campo fraco o tensor métrico, em primeira ordem, pode ser escrito como gµν = τµν + φµν
(com φµν ≈ 0). Então, as equações de Einstein se tornam
c4

1 8πG
uφµν − τµν t
t uφ = − 4 Tµν + Λτµν (1.189)
2 c 8πG
onde usamos também que Λ ≈ 0. Esta equação pode ser reescrita na forma

8πG 1
t
uφµν = − 4 Tµν − T τµν + Λτµν . (1.190)
c 2
Assim, na ausência de matéria, teremos
t
uφµν = λτµν (1.191)
Finalmente, considerando o limite de baixa velocidade v << c e usando que φ00 = 2 cΦ2 ,
onde Φ é identificado com o potencial Newtoniano, a equação (1.191) se reduz a
c2
52 Φ = − Λ. (1.192)
2
Se relembrarmos da equação de Poisson [Eq. (1.8)]:
52 Φ = 4πGρ, (1.193)
ganhamos a seguinte interpretação para a constante cosmológica Λ: a constante Λ nas

equações de Einstein equivale a uma densidade uniforme de massa distribuı́da por todo
o espaço, e de tal forma que
Λ
ρ̃ = − . (1.194)
4πG
Assim, se Λ > 0 o vácuo possuirá uma densidade efetiva de massa negativa (ρ̃ < 0); se
Λ < 0 o vácuo possuirá uma densidade efetiva de massa positiva (ρ̃ > 0).
A seguir estaremos interessados em examinar algumas situações onde o campo gravita-
cional poderá ser considerado fraco e o espaço-tempo assimptoticamente plano. A fim de
37
Figura 1.9: Pontos ao longo da trajetória da partı́cula são determinados pelas coordenadas
xµ (τ ), onde τ é um parâmetro afim.
não termos problemas com o limite assimptótico, deixaremos de lado o termo cosmológico
a partir deste ponto16 , e consideraremos as equações de Einstein na forma
κ
Gµ ν = − T µ ν , (1.195)
2
ou, antecipando o valor da constante de acoplamento κ,
8πG µ
Gµ ν = − T ν (1.196)
c4
onde introduzimos o tensor de Einstein
1
Gµ ν = Rµ ν − Rg µ ν . (1.197)
2
1.5.3 O limite Newtoniano

Vamos examinar o movimento de uma partı́cula teste na presença de um campo gravita-
cional. Como já vimos, o seu movimento se dará ao longo de uma geodésica do campo,
que pode ser representada na forma
Duµ
= 0, (1.198)
Dτ
onde τ representa um parâmetro afim ao longo da trajetória da partı́cula, conforme rep-
resenta a figura 1.9. De forma explı́cita, teremos
d 2 xµ α
µ dx dx
β
+ Γ αβ = 0, (1.199)
dτ 2 dτ dτ
onde Γµαβ são os sı́mbolos de Christoffel (veja o Capı́tulo 11). A equação da geodésica
corresponde à equação de uma partı́cula caindo livremente sob a ação do campo grav-
itacional. Ao longo de uma geodésica o observador pode, em cada ponto, anular os efeitos
gravitationais através da escolha conveniente do sistema de coordenadas. Este fato con-
stitui a base do princı́pio da equivalência.
Com o objetivo de testar o limite Newtoniano da teoria estabelecida pelas equações
de Einstein Eq. (1.195), deveremos considerar duas aproximações :
• o limite de campo fraco:
gµν = τµν + φµν ; φµν << 1. (1.200)

16
Testes com sistemas binários de estrelas indicam que se Λ existir o seu valor deve ser tal que |Λ| <
10−33 m−2 .
38
• o limite de baixas velocidades:
v << c. (1.201)
O elemento de linha (intervalo) será dado, usando Eq. (1.200), na forma
ds2 = gµν dxµ dxν = c2 dt2 − dl2 + φdxµ dxν . (1.202)
Assim, considerando a aproximação acima Eq. (1.201) resulta

2
ds
= c2 + c2 φ00 + ... (1.203)
dt
Vamos considerar estas aproximações na equação da geodésica (1.199). Primeiramente o

sı́mbolo de Christoffel se reduzirá à forma
1
Γµαβ = τ µλ (φλα,β + φλβ,α − φαβ,λ ) . (1.204)
2
Ainda, em (1.199),
2 2
dxα dxβ dxα dxβ dxβα

dt 2 dx dt
= =c (1.205)
dτ dτ dt dt dτ dt dt ds
e considerando a expressão (1.203) e o limite de campo fraco, obtemos
dxα dxβ dxα dxβ

= (1 − φ00 ) . (1.206)
dτ dτ dt dt
As componentes espaciais deste resultado podem ser negligenciadas por serem de ordem
superior em v. A componente mista (α = 0; β = k) é da ordem v. No entanto, quando
multiplicada pela conexão (1.204), teremos somente termos de ordem superior. Assim,
somente as componentes temporais sobriverão na aproximação requerida. Resulta então,
de Eq. (1.199):
d 2 xµ
+ c2 Γµ00 = 0. (1.207)
dτ 2
Finalmente, supondo ainda o regime de campo estático, teremos
d 2 xµ d2 xµ dt
≈ (1 − φ00 ). (1.208)
dτ 2 dt2 dτ
Assim, de Eq. (1.207), e dentro da ordem considerada, segue:
d 2 xµ
+ c2 Γµ00 = 0. (1.209)
dt2
Como estamos examinando a situação de campo estático, teremos que a componente
µ = 0 da equação (1.209) será identicamente nula, como esperado. A componente
espacial será tal que
d 2 xi c2
= − ∂i φ00 . (1.210)
dt2 2
Esta equação pode ser reapresentada na forma vetorial:
d2~x
2
~ c φ00
2
= −∇ , (1.211)
dt 2
39
e representa a equação de movimento de uma partı́cula teste. Comparando com os
resultados provenientes da mecânica Newtoniana, concluı́mos que o potencial Newtoniano
será identificado com φ00 na forma
c2 φ00
Φ= . (1.212)
2
Note que a derivação da equação (1.211) compreendeu apenas aspectos oriundos da

equação da geodésica.
Vamos agora considerar as aproximações de baixa velocidade e campo fraco nas
equações de Einstein. Com isto pretendemos mostrar que Φ satisfaz à equação de
Poisson, e poderemos assim determinar a constante κ que aparece em Eq. (1.195).
Na aproximação requerida, somente a componente T00 do tensor momento-energia
sobrevive, e será dado por
T00 ≈ ρc2 . (1.213)
Das equações de Einstein (1.195-1.197)
1 κ
Rµ ν − Rg µ ν = − T µ ν , (1.214)
2 2
Mas
κ κ
R= T ≈ ρc2 . (1.215)
2 2
Assim, retornando à eq. (1.214):
κ κ
Rµν = − Tµν + ρgµν c2 (1.216)
2 4
A componente R00 será então
κρc2
R00 = − . (1.217)
4
Mas
Rµν = Γαµα,ν − Γαµν,α + termos de ordem superior. (1.218)
Assim, no regime de campo estático encontramos
1 1
R00 = −Γk00,k = − φ00,kk = − ∇2 φ00 . (1.219)
2 2
Finalmente, das equações (1.217) e (1.219), usando a definição do campo Φ, obtemos
c4 κρ
∇2 Φ = . (1.220)
4
Comparando esta equação com a equação de Poisson, concluı́mos que
16πG
κ= .
c4
Desta maneira, mostramos que a teoria da relatividade geral contém a teoria Newtoniana
no seu limite de campo fraco e baixas velocidades.
40
1.6 A solução de Schwarzschild e aplicações
Encontrar soluções exatas para as equações de Einstein não é uma tarefa fácil, haja visto
o grau de não-linearidade que as mesmas apresentam. Ainda hoje, o estudo de técnicas
para obtenção de soluções exatas é um tema bastante pesquisado. Para uma revisão
sobre está questão, é aconselhável consultar a referência [33]. A primeira solução exata
das equações de Einstein foi obtida em 1916 por K. Schwarzschild, e constitui uma solução
para o tensor métrico gµν representando um campo gravitacional estático e esfericamente
simétrico, como é esperado que ocorra no caso de sistemas planetários como o sistema
solar. Ainda, a solução foi derivada para a região exterior a uma distribuição de massa
com simetria esférica. Vamos derivar esta solução a partir das equações de Einstein, e
para isto, seguiremos os mesmos passos realizados na derivação original de Schwarzschild
[34].
Vamos recorrer aos seguintes critérios:
1. O campo deve ser estático;
2. O campo deve ter simetria esférica;
3. O espaço-tempo exterior à distribuição de massa é vazio;
4. O espaço-tempo deve ser assimptoticamente plano.
• Obs:
Em verdade os critérios (2) e (3) implicam em (1). Este fato foi demonstrado por
Birkhoff e é conhecido como teorema de Birkhoff.
Vamos adotar um sistema de coordenadas xµ = {t, r, θ, ϕ} onde t é uma coordenada tipo

tempo, r é uma certa coordenada radial, e θ e ϕ são coordenadas angulares polares. Então
assumindo que
ds2 = A(r)dt2 − B(r)dr2 − r2 dθ2 − r2 sin2 θdϕ (1.221)
precisaremos determinar as duas funções arbitrárias A(r) e B(r).
Como vemos, as hipóteses (1) e (4) se realizam na forma sugerida para ds2 :
• gµν não depende do tempo ⇐⇒ (1)
• superfı́cies (r, t) = constante levam à geometria de 2-esferas:
ds2 = r2 (dθ2 + sin2 θdϕ2 ) ⇐⇒ (2)
• A hipótese (3) requer que A(r) e B(r) devem ser derivadas a partir das equações de
campo para o vazio:
Rµν = 0. (1.222)
• A hipótese (4) determina condições assimptóticas para as soluções de A(r) e B(r):
lim A(r) = c2 (1.223)

r→∞
lim B(r) = 1. (1.224)
r→∞
• Obs:
Note que o limite 1.224 não precisa necessariamente ser 1, uma vez que, até este
ponto, não podemos identificar a coordenada r com distância radial.
41
Resta-nos agora utilizar a métrica proposta em Eq. (1.221) como uma solução-tentativa
para o problema. Devemos procurar por soluções de Eq. (1.222). Como já foi definido,
Rµν = ∂ν Γαµα − ∂α Γαµν + Γµβα Γναβ − Γµνα Γαββ (1.225)
e
1
Γαµν = g αβ (gβµ,ν + gβν,µ − gµν,β ) . (1.226)
2
De Eq. (1.221) podemos escrever (na forma matricial):
 
A(r) 0 0 0
 0 −B(r) 0 0 
gµν =  2
 (1.227)
 0 0 −r 0 
2 2
0 0 0 −r sin θ
Assim, usando Eq. (1.227) em Eq. (1.226) teremos as seguintes componentes não nulas
da conexão:
A0
Γ010 = = Γ001
2A
A0
Γ001 =
2B
B0
Γ111 =
2B
B0
Γ111 =
2B
r
Γ122 =−
B
r sin2 θ
Γ133 =− (1.228)
B
1
Γ212 = = Γ221
r
Γ233 = − sin θ cos θ
1
Γ133 = = Γ331
r
Γ233 = cot θ = Γ332 .
.
Denotamos Z 0 = dZ/dr.
Introduzindo os resultados acima em Eq. (1.225), e usando Eq. (1.222), resultam
A00 A0 A0 B 0 A0

R00 = − + + − =0 (1.229)
2B 4B A B rB
A00 A0 A0 B 0 B0

R11 = − + − =0 (1.230)
2A 4A A B rB
0
B0

1 r A
R22 = − 1 + − =0 (1.231)
B 2B A B
R33 = R22 sin2 θ = 0. (1.232)
Com todas as outras componentes sendo identicamente nulas. Como vemos, das 4 equações,
apenas três precisam ser resolvidas.
42
Consideremos a seguinte operação: (A/B)R00 + R11 . Assim
1 A0 B 0

− + =0
r A B
de onde concluı́mos que:
A0 B0
=− . (1.233)
A B
Podemos integrar esta equação na forma
d
[ln (AB)] = 0, (1.234)
dr
O que resulta em
AB = const. (1.235)
Esta constante pode ser obtida a partir da hipótese (4) [veja Eqs. (1.223) e (1.224)]; e
resulta:
AB = c2 . (1.236)
Logo, resolvendo para B:
c2
B= (1.237)
A
e retornando este resultado em Eq. (1.231), resulta
rA A0 A0

A
−1+ 2 + =0 (1.238)
c2 2c A A
ou
rA0 + A = c2
d
(rA) = c2 (1.239)
dr
com solução:
2 λ
A=c 1+ (1.240)
r
e, de Eq. (1.237):
1
B= (1.241)
1 + λ/r
Se retornarmos estas soluções nas equações de campo verificaremos facilmente que as
mesmas constituem uma solução para as mesmas. Concluı́mos então que

2 2 λ 1
ds = c 1 + dt2 − dr2 − r2 dθ2 − r2 sin2 θdϕ2 . (1.242)
r 1 + λ/r
Vamos passar agora à determinação da constante λ (que seguramente deve estar rela-
cionada à massa do objeto que produz o campo gravitacional).
Se considerarmos o limite de campo fraco, correspondente à região onde r 1, o
intervalo acima fica escrito na forma

2 λ 2 2 λ
dr2 − r2 dθ2 + sin2 θdϕ2 ,

ds = 1 + c dt − 1 − (1.243)
r r
43
e poderemos comparar com a expressão
ds2 = (τµν + φµν ) dxµ dxν , (1.244)
conforme discutimos nas seções anteriores. Nesta situação identificamos [conforme Eq.
(46) nas notas da seção 1.5]:
2
φ00 = 2 Φ (1.245)
c
onde Φ representa o potencial Newtoniano. Finalmente, uma vez que
λ
φ00 = , (1.246)
r
e, do potencial Newtoniano associado a uma configuração esferica de massa
GM
Φ=− , (1.247)
r
resulta
2GM
λ=− . (1.248)
c2
Assim, a solução de Schwarzschild fica sendo
−1
2 2GM 2 2 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .

ds = 1 − 2 c dt − 1 − 2 (1.249)
cr cr
• Obs:
A presença do termo cosmológico altera a solução acima para
−1
Λr2 2 2 Λr2

2 2GM 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .

ds = 1 − 2 − c dt − 1 − 2 −
cr 3 cr 3
(1.250)
Note que neste caso a métrica não será assimptoticamente plana quando r → ∞.
1.6.1 Movimento de partı́culas teste na solução de Schwarzschild

Na seção anterior encontramos que o campo gravitacional exterior a uma distribuição de
massa com simetria esférica (ou de uma massa pontual) em torno da origem r = 0, é dado
por −1
2 2m 2 2 2m
dr2 − r2 dθ2 + sin2 θdϕ2 ,

ds = 1 − c dt − 1 − (1.251)
r r
onde definimos o parâmetro:
. GM
m= 2 . (1.252)
c
• Obs:
A expressão (1.251) está escrita em coordenadas esféricas, t é o tempo coordenado.
O sistema de coordenadas utilizado na expressão (1.251) não é adequado para descrever o

espaço-tempo na região r 2m, embora os invariantes construı́dos a partir da geometria
sejam regulares nesta região. O valor limite
2GM
rs = 2m = (1.253)
c2
44
é denominado por raio de Schwarzschild. Para qualquer corpo macroscópico conhecido
o raio rs está sempre no interior do corpo, onde as equações para o vazio (Eq. (1.222)
não mais são válidas e, portanto, a solução (1.251) não é adequada. Desta maneira, não
precisamos nos preocupar com esta região para o caso da descrição do movimento de
partı́culas (planetas, por exemplo) em sistemas planetários, como é o caso do sistema
solar.
• Obs: Raio de Schwarzschild para alguns objetos:
– Sol
MSol = 1, 98 × 1030 kg
rSol = 6, 96 × 105 km
rs = 2, 94 km
– Terra
MT erra = 5, 98 × 1024 kg
rT erra = 6, 37 × 103 km
rs = 8, 86 mm
– Próton
MP roton = 1, 67 × 10−27 kg
rs = 2, 48 × 10−54 k
Nesta seção estaremos interessados em examinar o movimento de partı́culas massivas e

não-massivas na solução determinada por Eq. (1.251).
A trajétoria de partı́culas com massa será derivada a partir das geodésicas tipo-tempo
(ds2 > 0) do espaço-tempo, enquanto que o movimento de partı́culas sem massa (como o
fóton) será derivada a partir das geodésicas tipo-tempo.
Escolhendo o tempo próprio τ como o parâmetro afim teremos as geodésicas do campo
dadas por
d 2 xµ α
µ dx dx
β
+ Γ αβ = 0. (1.254)
dτ 2 dτ dτ
Temos, adicionalmente que
dxµ dxν
2
c , massa 6= 0
gµν = (1.255)
dτ dτ 0, massa = 0.
Vamos escrever genericamente
gµν ẋµ ẋν = b, b = (0, c2 ) (1.256)
onde denotamos, por simplicidade de notação:
. dxα
ẋα = . (1.257)
dτ
Da Eq. (1.254), usando a notação acima e introduzindo a expressão para a conexão afim,
resulta
dẋµ 1 µρ
+ g (gρα,β + gρβ,α + gαβ,ρ )ẋα ẋβ (1.258)
dτ 2
que pode ser reescrita na forma mais simples:
d 1
(gλµ ẋµ ) = gαβ,λ ẋα ẋβ . (1.259)
dτ 2
45
Vamos expressar a métrica (1.251) como
ds2 = Ac2 dt2 − A−1 dr2 − r2 dθ2 + sin2 θdϕ2

(1.260)
ou, de Eq. (1.256)

b = Ac2 ṫ2 − A−1 ṙ2 − r2 θ̇2 − r2 sin2 θϕ̇2 . (1.261)
Vamos agora procurar integrar as equações (1.259) para ẋµ = (cṫ, ṙ, θ̇, ϕ̇).
De Eq. (1.259):
• λ = 0:
d 3
c Aṫ = 0 (1.262)
dτ
• λ = 1:
A0 2

d 1
− A−1 ṙ = 2 0 2 2 2
c A ṫ − 2 ṙ − 2rθ̇ − 2r sin θϕ̇2
(1.263)
dτ 2 A
• λ = 2:
d 2
r θ̇ = r2 sin θ cos θϕ̇2 (1.264)
dτ
• λ = 3:
d 2 2
r sin θϕ̇ = 0 (1.265)
dτ
Vamos considerar as seguintes condições iniciais de movimento:
π
θ= e θ̇ = 0. (1.266)
2
Assim, usando Eq. (1.266) em Eq. (1.264) vemos que θ̈ e qualquer outra derivada de
ordem maior em θ serão nulas. Isto determina que a órbita fica confinada ao plano
θ = π/2.
As equações Eq. (1.262) e Eq. (1.265) podem ser integradas diretamente resultando
em, respectivamente
Aṫ = const ≡ ε, (1.267)

r2 ϕ̇ = const ≡ `, (1.268)
onde ε e ` são constantes de integração. Estas equações correspodem, no limite Newtoni-

ano, às leis de conservação da energia e do momentum linear, respectivamente.
Resta-nos integrar a equação (1.263). No entanto, podemos trabalhar diretamente
com a equação (1.261) que corresponde a uma primeira integral do movimento. Então,
dos resultados (1.266) a (1.268) em (1.261), resulta:
`2

2 2 2
ṙ = c ε − + b A, (1.269)
r2
ou ainda
`2

2 2 2 2m
ṙ = c ε − +b 1− . (1.270)
r2 r
46
A fim de descrevermos a trajetória das partı́culas, necessitaremos procurar pela expressão
de como r varia com a coordenada angular ϕ (lembrando que θ está fixada). Desta forma,
podemos escrever
2 2 2 2
2 dr dr dϕ 2 dr `2 dr
ṙ = = = ϕ̇ = 4 . (1.271)
dτ dϕ dτ dϕ r dϕ
Então, de (1.270) e (1.271)

2
`2 dr `2 2m `2

2 2
=c ε −b− 2 + +b . (1.272)
r4 dϕ r r r2
Ainda é conveniente introduzirmos uma nova variável
1 du du dr 1 dr
u= ⇒ = =− 2 . (1.273)
r dϕ dr dϕ r dϕ
Logo, substituindo (1.273) em (1.272):
2
2 du
= c2 ε2 − b − `2 u2 + 2mu `2 u2 + b ,

` (1.274)
dϕ
ou, 2
c2 ε2 − b 2mb

du
+ u2 = + 2 u + 2mu3 . (1.275)
dϕ `2 `
Esta é a equação para partı́culas teste no espaço-tempo de Schwarzschild.
1.6.2 Testes de campo solar

Trajetórias de partı́culas teste com massa (b = c2 )
Neste caso, a equação para as órbitas possı́veis será
2
du c2 2mc2
+ u2 = 2 ε2 − 1 + 2 u + 2mu3 . (1.276)
dϕ ` `
Tomando a derivada desta equação com respeito a ϕ, resulta
du d2 u du mc2

2
2 +u =2 + 3mu (1.277)
dϕ dϕ2 dϕ `2
ou
d2 u mc2
+ u = + 3mu2 . (1.278)
dϕ2 `2
A menos do termo 3mu2 , esta equação corresponde à equação Newtoniana para a órbita
de uma partı́cula teste no campo gravitacional produzido por um corpo massivo pontual,
onde ` deve ser identificado como `N
dϕ
`N = r2 . (1.279)
dt
Na equação (1.278) o termo 3mu2 corresponde a uma perturbação quando comparado ao
termo mc2 /`2 , e portanto podemos considerar a solução da equação (1.278) por meio de
uma expansão perturbativa.
47
• Obs:
Para o planeta Mercúrio (que está sujeito ao campo mais forte) temos os seguintes
dados
hrorbital i = 5, 79 × 1010 m
perı́odo = 7, 60 × 106 s
Assim
∆ϕ
` ≈ r2 = 2, 78 × 1015 m2 /s
∆t
Comparando os dois últimos termos em Eq. (1.278):
3mu2 3`2
= ≈ 7, 68 × 10−8 ,
mc2 /`2 c2 r 2
O que mostra claramente que 3mu2 corresponde a uma correção do termo mc2 /`2 .
Assim, desprezando o termo 3mu2 em Eq. (1.278), resulta:
d2 u o mc2
+ u o = , (1.280)
dϕ2 `2
cuja solução é dada por

mc2
uo = (1 + e cos ϕ) . (1.281)
`2
Notoriamente Eq. (1.281) corresponde à equação de uma elipse cuja excentricidade é
dada pelo parâmetro e. Neste método perturbativo estamos considerando uma expansão
da solução na forma
u = uo + u1 , (1.282)
onde o termo 3muo 2 foi considerado como um termo de segunda ordem [O(u1 )]. De Eq.
(1.278):
d2 mc2
2
(u o + u1 ) + uo + u1 = 2
+ 3muo 2 . (1.283)
dϕ `
Mas, uma vez que d2 uo /dϕ + uo = mc2 /`2 , resulta
d2 u 1 3m3 c4
+ u 1 = 3muo
2
= (1 + e cos ϕ)2 . (1.284)
dϕ2 `4
ou
d2 u 1 3m3 c4 6m3 c4 e 3m3 c4 e2
+ u 1 = + cos ϕ + cos2 ϕ. (1.285)
dϕ2 `4 `4 `4
Uma vez que |cos ϕ| ≤ 1 e, para os planetas do sistema solar, a excentricidade é ≤ 0, 2,
podemos desprezar o último termo na equação (1.285). Ainda, o efeito do termo 3m3 c4 /`4
na equação (1.285) é somente de reavaliar as constantes que aparecem em (1.281). Uma
vez que estas constantes podem ser ajustadas aos valores observados, não precisamos nos
preocupar com este termo também. Então, só precisaremos determinar uma solução para
d2 u1 6m3 c4 e
+ u 1 = cos ϕ, (1.286)
dϕ2 `4
48
que pode ser encontrada na forma:
3m3 c4 e
u1 = ϕ sin ϕ. (1.287)
`4
Retornando à Eq. (1.282) conclı́mos que
mc2 3m3 c4 e
u= (1 + e cos ϕ) + ϕ sin ϕ. (1.288)
`2 `4
Vamos reescrever a Eq. (1.288) na forma mais conveniente
mc2
u= (1 + e cos ϕ + eδω sin ϕ) , (1.289)
`2
onde definimos
3m2 c2
δω = ϕ. (1.290)
`2
Note que (δω)2 δω 1. Então, podemos reapresentar a Eq. (1.289) como
mc2
u= [1 + e cos(ϕ − δω)] . (1.291)
`2
• Obs:
Vejamos a interpretação desta equação. A equação clássica de uma elipse com
excentricidade e e distância a partir da origem f (conforme mostra a figura 1.10), é
dada por
u = a(1 + e cos φ), (1.292)
onde
f
a= = semi-eixo maior
e
Figura 1.10: Curva representando uma elipse.
Então, em analogia com a construção apresentada para a equação (1.292), segue que Eq.
(1.291) representa a equação de uma elipse com excentricidade e e semi-eixo maior
mc2
a= . (1.293)
`2
49
Quando o argumento da função cosseno varia de 2π radianos, em Eq. (1.291), teremos a
coordenada angular ϕ variando de
ϕ = 2π + δω|ϕ=2π . (1.294)
Assim, a cada revolução o afélio (ou periélio) da órbita avança de uma quantidade δω,
dada por (retornando o valor de m):
6πG2 M 2
δω = . (1.295)
c2 `2
Usando os dados experimentais conhecidos para o planeta Mercúrio encontramos (usando
para ` o valor médio obtido anteriormente [imediatamente após Eq. (1.279)]),
δω = 4, 83 × 10−7 rad/revolução
ou
δω = 2, 77 × 10−5 o /revolução.
Desde que o perı́odo orbital de Mercúrio é τM = 7, 60 × 106 s e o da Terra é τT =
3, 16 × 107 s. Segue que
δω = 41, 43 arcsec/século.
• Obs:
– Um melhor ajuste para ` leva à
`2 = aGM (1 − e2 ) (1.296)
Assim, de (1.295):
6πGM
δω = , (1.297)
ac2 (1 − e2 )
resultando em
δω = 42, 99 arcsec/século.
– Valor observado para δω [35]:

δω = (43, 1 ± 0, 1) arcsec/século.
Trajetórias de partı́culas não massivas (b=0)

Neste caso, da equação de movimento (1.275), teremos
2
du c2 ε 2
+ u2 = 2 + 2mu3 . (1.298)
dϕ `
Da mesma forma como procedemos para derivar a expressão (1.278), obtemos
d2 u
+ u = 3mu2 . (1.299)
dϕ2
Uma vez que o termo 3mu2 é pequeno comparado aos outros, poderemos (como antes)
resolver esta equação apelando ao método perturbativo. Vamos denotar o coeficiente
.
3m = . Assim
d2 u
+ u = u2 . (1.300)
dϕ
50
Figura 1.11: Representação gráfica da equação da reta Eq. (1.306).
• Obs:
O tratamento perturbativo é válido neste caso pois estaremos interessados em testes
de campo solar. Neste caso, a menor distância possı́vel para uma partı́cula teste,
a partir da origem (que está fixada no centro do Sol), será o raio do Sol (situação
limite). Neste caso r = 105 GM/c2 . Assim, de (1.299):
3mu2 3m 3GM/c2
= = 5 ≈ 10−5 .
u r 10 GM/c2
Vamos considerar uma expansão da solução para u na forma
u = vo + v1 + O(2 ). (1.301)
Então, de (1.301) e (1.300):

d2 vo d2 v1
2
+ 2
+ vo + v1 = vo 2 + O(2 ), (1.302)
dϕ dϕ
que podemos separar em ordens de na forma:
d2 vo
+ vo = 0 (1.303)
dϕ2
e
d2 v1
2
+ v1 = vo 2 (1.304)
dϕ
De (1.303) encontramos a seguinte solução
1
vo = cos ϕ, (1.305)
Ro
ou ainda
cos ϕ
= Ro , (1.306)
vo
onde Ro = constante. Note que Eq. (1.306) consiste na equação de uma reta. Usando a
solução (1.305) em (1.304) resulta na seguinte equação:
d2 v1 1
2
+ v1 = cos2 ϕ (1.307)
dϕ Ro 2
com solução
1
1 + sin2 ϕ .

v1 = 2
(1.308)
3Ro
51
Desta forma, a solução aproximada para este problema será
1 m
cos ϕ + 2 1 + sin2 ϕ .

u= (1.309)
Ro Ro
• Obs:
A solução (1.305) pode ser escrita na forma mais geral vo = Ro−1 cos(ϕ − ϕo ). Por
uma escolha conveniente de eixos fazemos ϕo = 0, e resulta na Eq. (1.305).
Como vemos da equação (1.309), a trajetória de uma partı́cula sem massa nas vizinhanças
de um corpo de massa M localizado na origem, se afasta de uma trajetória retilı́nea pelo
termo
m
1 + sin2 ϕ ,

Ro 2
que é uma perturbação quando comparado ao primeiro termo no lado direito em Eq.
(1.309).
A fim de calcular o desvio da trajetória retilı́nea, vamos considerar a mudança de
coordenada angular
π
ϕ = − δ. (1.310)
2
Em termos de δ a equação (1.309) se escreve como:
1 m
sin δ + 2 1 + cos2 δ .

u= (1.311)
Ro Ro
Quando r → ∞, teremos δ → ∆ 1, e u → 0. Assim
1 m
∆ + 2 (1 + 1) + O ∆2 ,

0= (1.312)
Ro Ro
de onde
2m
∆=− . (1.313)
Ro
O sinal negativo indica que a trajetória da partı́cula sofre um desvio para dentro com
respeito a trajetória retilı́nea determinada por Eq. (1.305). Uma vez que ocorre um
desvio angular na aproximação e no afastamento da partı́cula, concluı́mos que o desvio
total sofrido pela partı́cula será
4m 4GM
D = |2∆| = = 2 . (1.314)
Ro c Ro
Na expressão acima Ro representa a distância de máxima aproximação da partı́cula com
respeito à origem. A figura 1.12 apresenta a trajetória da partı́cula de acordo com os
resultados acima.
No caso do Sol, um raio luminoso cuja trajetória tangencia o disco solar, sofrerá um
desvio
D = 1, 74 arcsec
• Obs:
Valor experimental medido em 1952:
D = (1, 70 ± 0, 10) arcsec.
52
Figura 1.12: Desvio da trajetória retilı́nea Newtoniana, conforme previsto pela equação
(1.309). Esta figura não está em escala. A fim de que as relações angulares ficassem
evidentes, as distâncias ao longo do eixo Y foram encolhidas e o desvio angular aumentado.
53
1.7 Exercı́cios
1. Verifique a última igualdade na Eq. (1.1).
2. Mostre que a divergência de f k (componentes do vetor força de maré) em uma região

vazia do espaço é sempre nula.
3. Obtenha o resultado apresentado na Eq. (1.10).
4. Mostre que as equações (1.15) e (1.16) se reduzem às equações clássicas (1.19) e
(1.20) no limite não relativı́stico.
5. Mostre que a Lagrangeana (1.108) pode ser reescrita na forma (1.112).
6. Obtenha Eq. (1.120).
7. Obtenha os resultados apresentados nas equações (1.229-1.232).
8. A partir da expressão para a métrica de Schwarzschild Eq. (1.249), obtenha as com-

ponentes Rk 0i0 do tensor de curvatura. Mostre que este objeto se reduz à expressão
Eq. (1.43) no limite Newtoniano.
9. Usando o valor máximo possı́vel para a constante cosmológica Λ, avalie o valor da

sua contribuição nos testes de campo solar realizados na seção 1.6.
10. O tensor energia-momentum de um fluido perfeito pode ser apresentado na forma
T µ ν = (ρ + p/c2 )uµ uν − pδ µ ν .
Mostre que a divergência nula deste tensor resulta em equações de conservação.

Comente sobre o
11. Seja λµ um campo vetorial covariante.
(a) Mostre que

λα;βγ − λα;γβ = Rµ αβγ λµ .
(b) Mostre que Rµ αβγ , definido no item anterior, satisfaz à identidade de Bianchi:
Rµ ναβ;γ + Rµ νβγ;α + Rµ νγα;β = 0.
(c) Mostre que o tensor de Einstein, definido por
. 1
Gµ ν = Rµ ν − Rδ µ ν ,
2
possui divergência identicamente nula.
12. As equações de Einstein com constante cosmológica podem ser apresentadas na

forma
Gµ ν + Λδ µ ν = κT µ ν .
(a) Suponha que Λ = 0 e mostre que a equação de Poisson pode ser obtida a partir
das equações de Einstein considerando-se a sua componente-00 na aproximação
de campo fraco e baixa velocidade.
54
(b) Suponha que Λ 6= 0 e reescreva a equação de Poisson apresentando o termo
contendo Λ.
(c) Suponha agora que Λ 6= 0 e T µ ν = 0. Neste caso, interprete o significado de Λ
a partir dos resultados obtidos anteriormente.
13. A solução de Schwarzschild corresponde à solução estática e esfericamente simétrica

das equações de Einstein para a região exterior a um corpo de massa M . Com base
no conhecimento desta solução, resolva os itens abaixo.
(a) Determine o intervalo de tempo coordenado ∆t associado a propagação de

um sinal luminoso desde a sua emissão, efetuada por um observador O fixo
em um ponto com coordenada radial Ro , até a sua chegada em um ponto com
coordenada radial R (R > Ro ). Suponha que a propagação ocorra radialmente.
(b) Para o mesmo experimento mencionado no item anterior, determine o intervalo
de tempo próprio ∆τ medido pelo observador O.
(c) Suponha que Ro = 2m+ε. De acordo com os resultados obtidos nos itens ante-
riores, o que você pode concluir a respeito dos intervalos de tempo coordenado
∆t e de tempo próprio ∆τ , na situação limite onde ε → 0.
1.8 Referências bibliográficas

[1] I. Newton, em Philosophiae Naturalis Principia Mathematica. (London, 1686);
[2] A. Einstein, Annalen der Physik 49, 769 (1916). Traduzido para o inglês em The
Principle of Relativity. (Methuen, 1923. Reimpresso pela ed. Dover Publications);
[3] A. Einstein, em Zur Elektrodynamik Bewegter Körper. Annalen der Physik 17, 891
(1905). Traduzido para o potuguês em Textos Fundamentais da Fı́sica Moderna: H.
A. Lorentz, A. Einstein and H. Minkowski. (Volume I, “O Principio da Relatividade”.
Fund. Calouste Gulbenkian, Lisboa, 1971);
[4] S. Weinberg, em Gravitation and Cosmology: Principles and Applications of the Gen-
eral Theory of Relativity. (John Wiley & Sons, New York, 1972);
[5] R. Adler, M. Bazin e M. Schiffer, em Introduction to General Relativity. (Mc. Graw-

Hill, Inc., New York, 1975);
[6] H. C. Ohanian, em Gravitation and Spacetime. (W. W. Norton & Company, New
York, 1976);
[7] C. M. Will, em Theory and Experiment in Gravitational Physics. (Cambridge Univer-

sity Press, Cambridge, 1993);
[8] C. W. Misner, D. S. Thorne e J. A. Wheeler, em Gravitation. (Freeman, San Francisco,

1973);
[9] R. C. Tolman, em Relativity, Thermodynamics and Cosmology. (Oxford University

Press, Oxford, 1987);
[10] Ivano Damião Soares, Notas do curso de Gravitação ministrado na Primeira Escola
de Cosmologia e Gravitação (CBPF, Rio de Janeiro, Julho de 1991);
55
[11] R. P. Feynman, F. B. Morinigo e W. G. Wagner, in Feynman Lectures On Gravitation.
(Addison-Wesley Pub. Company, Massachusetts, 1995);
[12] S. N. Gupta, Eintein’s and Other Theories of Gravitation. Phys. Rev. 96, 1683 (1954);
[13] O. Bergmann, Scalar Field Theory as a Theory of Gravitation. I (1955);
[14] M. Fierz e W. Pauli, On Relativistic Wave Equations for Particles of Arbitrary Spin
in an Electromagnetic Field. Proc. Roy. Soc. 173A, 211 (1939);
[15] S. Deser, Self-Interaction and Gauge Invariante. J. Gen. Rel. Grav. 1, 9, (1970);
[16] L. P. Grischuck, A. N. Petrov e A. D. Popova, Exact Theory of the (Einstein) Grav-

itational Field in an Arbitrary Background Space-Time. Commun. Math. Phys. 94,
379 (1984);
[17] S. Deser e B. E. Laurent, Gravitation Without Self-Interaction. Ann. Phys. 50, 76

(1968);
[18] C. G. Bollini, J. J. Giambiagi e J. Tiomno, A Linear Theory of Gravitation. Lett.

Nuovo Cimento III, 65 (1970);
[19] C. M. Will, em Relativistic Gravity in the Solar System III. Experimental Disproof
of a Class of Linear Theories of Gravitation. Astrophys. J. 185, 31 (1973);
[20] J. H. Taylor, Discover of a Pulsar in a Binary System. Ann. N. Y. Acad. Sci. 262,
490 (1975);
[21] J. H. Taylor, L. A. Fowler e M. McCulloch, Measurements of General Relativistic

Effects in the Binary PSR1913+16. Nature 277, 437 (1979);
[22] J. H. Taylor, Binary Pulsars and Relativistic Gravity. Rev. Mod. Phys. 66, 711
(1994);
[23] R. H. Dicke, Mach’s Principle and Equivalence. Em Evidence for Gravitational Theo-
ries. (Proceedings of Course 20 of the International School of Physics “Enrico Fermi,”
ed. C. Moller. Academic, New York, 1962);
[24] J. Plebanski, em Lectures on Non-Linear Electrodynamics. (Nordita, Danmark,

1970);
[25] W. E. Thirring, An Alternative Approach to the Theory of Gravitation. Ann. Phys.

16, 96 (1961);
[26] V. Fock, em The Theory of Space, Time and Gravitation. (Pergamon Press, Oxford,
1964);
[27] R. H. Kraichnan, em Quantum Theory of the Linear Gravitational Field. (Tese de

doutorado não publicada, Massachusetts Inst. Tech., Mass., 1947);
[28] R. H. Kraichnan, Special-Relativistic Derivation of Generally Covariant Gravitation

Theory. Phys. Rev. 98, 1118 (1955);
[29] S. N. Gupta, Gravitation and Electromagnetism. Phys. Rev. 96, 1683 (1954);
[30] L. D. Landau e E. M. Lifshitz, em Teoria do Campo. (Editora Mir, Moscou, 1980);
56
[31] S. N. Gupta, Quantization of Einstein’s Gravitational Field: Linear Approximation.
Proc. Phys. Soc. A 65, 162 (1952);
[32] S. N. Gupta, Quantization of Einstein’s Gravitational Field: General Treatment.

Proc. Phys. Soc. A 65, 608 (1952);
[33] H. Stephani, D. Kramer, M. MacCallum, C. Hoenselaers e E. Heret, em Exact Solu-

tions of Einstein’s Field Equations. (Cambridge University Press, Cambridge, 2003);
[34] J. Foster & Nightingale, em A Short Course in General Relativity. (Longman Scien-
tific & Technical, Hong Kong, 2003);
[35] Anderson, J. D.; et al, Acta Astronautica 5, 43 (1978).
57
Capı́tulo 2
Cosmologia I: Fenomenologia
Martin Makler1
2.1 Introdução
O leitor pode estar se perguntando o que significa a palavra fenomenologia no tı́tulo
deste capı́tulo. Por isso, vamos começar conceituando esse termo no contexto cos-
mológico. Como a palavra dá a entender, essa área possui uma conexão direta com
os fenômenos, ou seja, com o que é observado no Universo. Não se trata exatamente
da cosmologia observacional, que precisa lidar com um grande número de aspectos
relacionados à aquisição e tratamento dos dados (imagens, espectros, etc.), estratégias
observacionais, instrumentos utilizados, etc. Por outro lado, a cosmologia teórica en-
volve aspectos mais fundamentais relacionados a modelos e teorias de gravitação e
fı́sica de partı́culas. O foco principal da fenomenologia é exatamente a relação entre
as observações astronômicas e os modelos teóricos. Essa área tem tido um crescimento
vigoroso nos últimos anos graças ao vasto conjunto de dados observacionais voltados
para a cosmologia, coletados a partir de telescópios na Terra e no espaço, varrendo os
mais diversos comprimentos de onda da radiação eletromagnética, dos raios gama às
ondas de rádio.
Muitas pessoas se referem ao momento atual da cosmologia como “era de precisão”.
Embora esse termo possa ser discutido, não há dúvidas de que a cosmologia passou
por uma profunda transformação na última década. Há cerca de vinte anos, a dis-
persão nos valores da maioria das quantidades relevantes para a cosmologia chegava
facilmente a 100%. O parâmetro de Hubble (i.e., a taxa de expansão do Universo), por
exemplo, oscilava entre 50 e 100 Km/s/Mpc, dependendo do método de medida. As
medidas da densidade de matéria tinham incertezas comparáveis e não havia pratica-
mente nenhuma informação sobre a variação da taxa de expansão (i.e. a aceleração)
do Universo. Com as pesquisas detalhadas utilizando a radiação cósmica de fundo, os
levantamentos de posições de galáxias e as supernovas do tipo Ia, entre outros, esse
panorama mudou por completo. Para se ter uma idéia, a temperatura da radiação
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.
58
cósmica de fundo é conhecida com uma incerteza de 0,1% e a densidade de matéria
ordinária (prótons e nêutrons) é estimada com uma incerteza de cerca de 3%.
Essa mudança qualitativa na cosmologia observacional deveu-se à disponibilidade de
dados em abundância, graças aos desenvolvimentos tecnológicos e ao interesse nessa
área de pesquisa. Para se ter uma idéia do volume de dados disponı́vel, um mapea-
mento ótico do céu, conhecido como Sloan Digital Sky Survey (SDSS), disponibilizou
publicamente em 2006 seu quinto data release, contendo imagens de 215 milhões de
objetos e espectros de cerca de 670.000 galáxias, totalizando uma base de dados de
mais de 9 TB. Por outro lado, a sonda espacial WMAP realizou um mapa completo do
céu na faixa da radiação cósmica de fundo (microondas) com uma resolução de algu-
nas dezenas de segundo de arco. De um modo geral, podemos dizer que a cosmologia
contemporânea se caracteriza por uma grande abundância de dados observacionais, ao
menos no que se refere a um conjunto de observáveis que inclui os mencionados acima
(distribuição de galáxias e aglomerados, radiação cósmica de fundo e supernovas).
Essa situação implica na necessidade de utilizar métodos estatı́siticos apropriados para
lidar com esse conjunto de dados, permitindo extrair a maior quantidade de informação
fı́sica a partir destes. Outra implicação da abundância de dados é a necessidade de
uma modelagem realista dos sistemas observados e dos métodos utilizados. Lembrando
de uma distinção apreendida nos cursos de fı́sica experimental, existem os erros es-
tatı́sticos e os sistemáticos. Quando há muitos dados, os erros sistemáticos passam a
ser dominantes. Isso significa que é preciso levar em conta de forma detalhada como
as medidas e indicadores estatı́siticos se relacionam com os processos fı́sicos que se
quer investigar. Longe de ser uma tarefa enfadonha, a necessidade de levar em conta
essas questões abre una nova janela de possibilidades para pesquisas tanto de cunho
mais teórico, quanto mais aplicado, em um terrenho bastante recente no contexto
cosmológico.
Infelizmente, tanto pelas limitações espaço-temporais, quanto pelo caráter introdutório
deste livro, não será possı́vel explorar a vasta área da fenomenologia em cosmologia.
O objetivo muito mais modesto deste capı́tulo é apresentar um breve panorama do
Universo observado e introduzir alguns conceitos e equações que permitem descrever a
sua estrutura e evolução. Naturalmente, em vários momentos procuraremos enfatizar
a conexão entre os modelos e as observações.
Quase todos os resultados deste capı́tulo serão baseados na chamada “cosmologia new-
toniana”, onde poderemos nos centrar nos conceitos sem a neccessidade de utilizar o
ferramental da relatividade geral. Através dessa formulação newtoniana da cosmolo-
gia poderemos abordar um grande número de fenômenos cosmológicos, incluindo a
dinâmica global (média) do Universo e a formação de estruturas em grande escala.
Procuraremos deixar claro as limitações dessa abordagem, apontado o que muda e o
que fica igual quando consideramos a cosmologia relativista. No próximo capı́tulo será
discutida em detalhes a cosmologia relativista.
2.2 O Universo Observado

Nesta seção apresentamos uma panorama geral de alguns componentes do Universo tal
como o conhecemos e de algumas observações que fundamentam a nossa compreensão
atual do Cosmos. Vamos percorrer as escalas astronômicas desde as galáxias até a
estrutura em grande escala do Universo, mostrar como foi descoberta a expansão do
59
Universo, introduzir o conceito de matéria escura, e apresentar as supernovas do tipo
Ia e a sua utilizade em cosmologia.
2.2.1 Galáxias
Pode-se escolher como marco do nascimento da cosmologia observacional a descoberta
da expansão do Universo. Como veremos mais adiante, essa descoberta foi feita a partir
de medidas do afastamento das galáxias. Esses objetos proporcionaram, portanto, as
primeiras formas de sondar o nosso Cosmos e continuam até hoje a ser uma das
principais fontes de informação para cosmologia. Nada mais justo do que começar o
nosso passeio pelo Universo falando um pouco sobre a natureza desses objetos. Nesse
caminho também procuraremos que o leitor se familiarize com algumas ordems de
magnitude das escalas cosmológicas2 .
A Distância a Andrômeda e a Natureza das Galáxias
Quase tudo o que vemos a olho nú no céu está contido na Via Láctea, a nossa galáxia.
No entanto, há bilhões de galáxias no Universo osbervável. A natureza extra-galáctica
das “nebulosas espirais”, ou seja, o fato desses objetos serem externos à Via Láctea
(constituindo outros “universos-ilha”, como nossa galáxia), só foi estabelecida na
década de 1920. Essa descoberta está intimamente relacionada à medida da distância à
galáxia de Andrômeda (M31, veja a fig. 2.1), que havia sido assunto de intenso debate
durante a década anterior (para uma cronologia resumida, veja as refs. [1, 2, 3]).
A questão chave é justamente a dificuldade de se realizar medidas de distância em
escalas astronômicas, já que apenas para as estrelas mais próximas é possı́vel medir
as distâncias de forma direta, através de sua paralaxe3 . Quase todos os métodos para
medir distâncias cosmológicas se baseiam no conhecimento de alguma propriedade
intrı́nseca do objeto (ou conjunto de objetos) que se quer observar. Por exemplo, se
sabemos a luminosidade L de um objeto, ou seja, a energia total por unidade de tempo
que ele emite, é fácil obter a sua distância, já que o seu fluxo observado (energia por
unidade de tempo e área) cai com o inverso do quadrado da distância (e o fluxo é
uma quantidade diretamente observável, ligado ao brilho aparente do astro). Uma
boa parte da cosmologia observacional do século XX foi dedicada à busca por relações
que permitam obter a luminosidade intrı́sica a partir de propriedades observáveis de
algum objeto. Um exemplo desse tipo de relação foi a proposta por Ernst Öpik4 em
1921. Öpik desenvolveu um método de medida de distâncias baseado na velocidade
de rotação das galáxias. Ele pressupôs que a razão massa/luminosidade (M/L) das
galáxias (espirais) é aproximadamente constante e que o seu brilho superficial também
não sofre grandes variações entre galáxias distintas. Com isso ele chegou à relação
L ∝ Vc4 , onde Vc é a velocidade circular máxima de uma galáxia, medida através da
largura das linhas do seu espectro. A partir desse resultado, Öpik encontrou que M31
2
As unidades de distância mais utilizadas em astronomia, e portanto em cosmologia observacional, são
o parsec (abrevia-se pc) e seus derivados. Veja o glossário (seção 2.10) para a sua definição e a conversão
para outras unidades.
3
A paralaxe é a variação na posição de uma estrela próxima em relação a estrelas distantes causada
pelo movimento da Terra ao longo do Sol. Esse efeito geométrico pode ser utilizado para medir a distância
de algumas estrelas usando trigonometria elementar.
4
Para uma breve biografia de Öpik, com a discussão de suas contribuições para a astronomia, veja
http://www.aai.ee/muuseum/Reprints/HTML/index.html?ernstopikcentenary.htm.
60
Figura 2.1: Imagem da galáxia de Andrômeda (M31) e de duas galáxias satélites, M31
(abaxio) e M110 (mais alongada, no canto superior esquerdo da foto). Crédito: T.A.Rector
e B.A.Wolpa/NOAO/AURA/NSF.
está a 750 quiloparsecs (kpc, veja o glossário) da Terra, uma distância bem maior do
que o tamanho estimado de nossa galáxia. Embora o seu resultado não tenha recebido
muita atenção na época (realmente as hipóteses que levaram a essa relação são um
pouco grosseiras), as suas idéias são a base de um método de medida da distância a
galáxias espirais utilizado até hoje, conhecido como método de Tully-Fisher.
Uma forma de medir distâncias melhor fundamentada do ponto de vista empı́rico
foi desenvolvida a partir dos trabalhos da astrônoma Henrietta Leavitt em 1911-12.
Leavitt estudou um tipo de estrela variável conhecido como cefeida e verificou que
havia uma relação entre o perı́odo de variação e o brilho máximo dessas estrelas.
Ela chegou a essa conclusão ao estudar 25 cefeidas na pequena nuvem de magalhães
(fig. 2.3). Supondo que elas estavam aproximadamente à mesma distância da Terra, a
relação entre o brilho aparente e o perı́odo de variação deveria ser uma conseqüência de
uma relação intrı́nsica entre perı́odo e luminosidade. Com isso, seria possı́vel saber a
distância relativa entre duas cefeidas, mas ainda faltava obter o chamado “ponto zero”,
que daria a distância absoluta das cefeidas. Pouco tempo após a descoberta de Leavitt,
Ejnar Hertzsprung (1913) e Harlow Shapley (1918) obtiveram medidas de distância
para cefeidas em aglomerados globulares utilizando um método estatı́stico associado
à paralaxe. Agora era possı́vel medir distâncias astronômicas utilizando cefeidas.5
N~
ao há refer^
encia a esta figura no texto
Em 1917, George Willis Ritchey descobriu estrelas “novas” em “nebulosas”, o que mo-
tivou Edwin Hubble a estudar a variabilidades desses objetos. Assim, Hubble acabou
descobrindo várias estrelas do tipo cefeida em M31. A partir das cefeidas, Hubble
obteve, em 1923, o valor de 275 kpc para a distância de M31, o que, embora estando
abaixo do valor obtido por Öpik, confirmava a sua natureza extra-galáctica. Essa foi a
evidência considerada decisiva de que Andrômeda estava realmente fora da Via Láctea
5
Para uma discussão mais detalhada sobre a medida de distância com cefeidas e a sua história, veja
a ref. [3].
61
Figura 2.2: Curvas de luz (variação do brilho em função do tempo) de quatro cefeidas na
galáxia M33 obtidas por Hubble. Fonte: referência [5].
e era o que hoje conhecemos como galáxia, encerrando o chamado “grande debate”
sobre a natureza desses objetos. É oportuno salientar que Hubble só pôde utilizar a
relação descoberta por Leavitt pois ele tinha acesso ao recém inaugurado telescópio
Hooker – o maior de sua época, com um espelho de 100 polegadas de diâmetro – o que
permitiu identificar estrelas individuais em Andrômeda e medir a variação do brilho
das cefeidas ali descobertas.
Uma medida moderna da distância a M31 fornece o valor 784 ± 13 ± 17 kpc (in-
cluindo os erros estatı́sticos e sistemáticos) [4]. Essa diferença é devida à existência
de duas populações (classes) diferentes de cefeidas, obedecendo a relações perı́odo-
luminosidade distintas6 , fato desconhecido na época das medidas de Hubble. Esse erro
sistemático se propagou também na estimativa da taxa de expansão do universo, como
mencionaremos mais adiante. Cabe ressaltar que o valor encontrado por Öpik, emb-
ora seja surpeendentemente próximo do valor atual, também estava sujeito a muitas
incertezas. O próprio pesquisador chegou a obter valores próximos de 400 kpc para a
mesma distância.
O método baseado em estrelas cefeidas ainda é muito utilizado para medir distâncias
de galáxias relativamente próximas e para determinar a taxa de expansão do Universo,
como será discutido nas seções (2.2.3) e (2.2.4).
idem
Tipos de Galáxias
As dimensões tı́picas das galáxias são da ordem de dezenas de quiloparsecs. O disco

da Via Láctea, por exemplo, possui um diâmetro de aproximadamente 30 kpc.7 Na
verdade as galáxias não possuem fronteiras bem definidas, apenas uma densidade
6
Veja a ref. [3] para uma discussão histórica sobre a descoberta, durante a Segunda Guerra Mundial,
das duas populações de cefeidas.
7
A distância do Sol ao centro da Via Láctea é 8.2 ± 0.15 ± 0.15 kpc.
62
Figura 2.3: Relação perı́odo-luminosidade das Cefeidas obtida por Henrietta Leavitt.
Magnitudes aparentes de 25 cefeidas na Pequena Nuvem de Magalhães em função do
logaritmo do perı́odo em dias. Os pontos superiores (inferiores) correspondem aos máximos
(mı́nimos) da luminosidade de cada estrela. Fonte: referência [7].
continuamente decrescente de estrelas em sua periferia. Um “tamanho” bem definido

é dado pelo raio Rm que engloba a metade de sua luz. O tamanho ótico tı́pico de uma
galáxia em uma foto é da ordem de 3 Rm . Radio-telescópios detectam hidrogênio até
aproximadamente 10 Rm .
Na década de 1920, Edwin Hubble elaborou um critério de classificação das galáxias
a partir de sua morfologia. Na realidade existe um contı́nuo nas formas das galáxias
e nos seus tipos espectrais, mas podemos dividı́-las em três tipos básicos: espirais,
elı́pticas e irregulares. Exemplos de galáxias espirais brilhantes são dados pela Via
Láctea e a galáxia de Andrômeda. A componente luminosa das galáxias espirais é
formada por um bojo central esferoidal, o disco e o halo. O bojo é composto por
estrelas velhas com órbitas aleatórias. Já o disco, onde estão os braços espirais, é
composto predominantemente por estrelas jovens, algumas ainda em formação, gás
e poeira que efetuam órbitas circulares em torno do centro galáctico. As velocidades
de rotação são tipicamente de centenas de km/s. Há um halo esférico, que se estende
além o disco, e possui pouco gás, sendo formado por estrelas velhas em aglomerados
globulares.
Como o próprio nome diz, nas galáxias elı́pticas as estrelas estão distribuı́das na forma
de um elipsóide, cujas formas variam da esférica até um achatamento de 3:1. Essas
galáxias possuem um movimento de rotação muito lento comparado com as espirais,
já que as estrelas seguem órbitas aleatórias. Elas são geralmente formadas por estrelas
velhas, possuindo pouco gás e apresentando baixa taxa de formação estelar. Devido a
suas populações estelares, as galáxias elı́pticas são geralmente avermelhadas, enquanto
as espirais são azuladas.
As galáxias irregulares têm uma aparência amorfa e são constituı́das por estrelas de
idades variadas, possuindo muito gás e poeira e altas taxas de formação estelar Geral-
mente são menos luminosas do que a maioria das elı́pticas e espirais. De certa forma,
as galáxas irregulares se assemelham a um pedaço de braço espiral. Evidentemente as
estrelas e o gás seguem trajetórias irregulares.
63
Figura 2.4: Imagem da galáxia de Andrômeda obtida por Hubble com a anotação “var”
ao lado de uma estrela variável. Crédito: Observatories of the Carnegie Institution of
Washington, Mount Wilson Observatory Historical Archive.
Em resumo, à medida que passamos de galáxias elı́pticas para espirais e depois para
irregulares, seguimos uma seqüência de estrelas velhas para estrelas novas, ausência
de gás e poeira para abundância destes e baixa formação estelar para alta formação
estelar.
As luminosidades das galáxias variam de 10−3 vezes a da Via Láctea até 5 vezes esta,
que equivale a 15 × 109 vezes a luminosidade do Sol. Há muito mais galáxias tênues
do que luminosas, mas a maior parte das estrelas está em galáxias com luminosidade
comparável à da Via Láctea.
Curvas de Rotação e Matéria Escura
Graças ao efeito Doppler, podemos medir a velocidade de rotação das galáxias. Por
exemplo, a partir de um espectro cobrindo diferentes partes de uma galáxia espiral
vista de perfil pode-se determinar a velocidade de rotação em função da distância ao
centro galáctico. Esse resultado, obtido tipicamente através do estudo algumas linhas
de emissão do gás (por exemplo a linha de 21 cm do hidrogênio), é chamado curva
de rotação. Durante a década de 1970, Vera Rubin — que nos anos 1950 já havia
descoberto a rotação das galáxias e proposto a existência da estrutura em grande
escala — obteve curvas de rotação para diversas galáxias [8]. A partir desses dados
é possı́vel fazer uma estimativa da distribuição de massa nas galáxias. Por exemplo,
supondo que o gás e as estrelas estão em movimento estacionário circular e utilizando
a lei de Newton temos:
M (r) [V (r)]2
G 2 = , (2.1)
r r
64
Figura 2.5: Detalhe da galáxia M100, localizada no aglomerado de galáxias da Virgem. Nos
destaques é possı́vel ver a variação de uma estrela cefeida, descoberta através do telescópio
espacial Hubble. Créditos: Dr. Wendy L. Freedman, Observatories of the Carnegie Insti-
tution of Washington, STScI e NASA.
onde V é a velocidade tı́pica das estrelas situadas a uma distância r do centro galáctico
e M é a massa no interior de sua órbita8 . Para estrelas e gás na periferia da galáxia,
a massa contida em sua órbita seria aproximadamente igual à massa total: M (r) '
Mgaláxia = const. Dessa forma, a velocidade deveria cair com a raiz quadrada da
distância, nas partes mais externas das galáxias.
As curvas V (r) × r preditas pela luminosidade observada (estrelas + gás) não con-
seguem explicar as velocidades medidas a grandes distâncias do centro galáctico (veja
a figura 2.9). Em vez de decair, a velocidade permanece aproximadamente constante a
grandes distâncias. Se adicionamos uma componente de matéria com uma distribuição
do tipo ρ ∝ r−2 à distribuição de massa detectada, é possı́vel reproduzir as velocidades
observadas. No entanto, não há sinal da matéria visı́vel em nenhum comprimento de
onda seguindo essa distribuição. Por isso, chamamos esta matéria de matéria escura.
Na maioria das galáxias, há de 3 a 10 vezes mais matéria escura do que matéria visı́vel.
Os halos de matéria escura se extendem por distâncias bem maiores que o raio visual
(óptico) das galáxias. É possı́vel que o halo da Via Láctea, por exemplo, se extenda
por centenas de kpc.
É importante destacar que o resultado discutido acima se mantém mesmo quando

são utilizados modelos realistas e detalhados da distribuição de gás e estrelas, indo
muito além da estimativa grosseira obtida a partir da equação (2.1). Além disso, ele se
8
Naturalmente haveria correções devido à galáxia não ser esfericamente simétrica. No entanto, o termo
dominante da força gravitacional é o de monopolo e só queremos fazer uma estimativa do resultado.
65
Figura 2.6: A galáxia espiral M83. Crédito: Telescópio SOAR.
repete de forma bastante genérica para outras galáxias em que é possı́vel obter curvas
de rotação: não é possı́vel explicar essas curvas somente com a matéria luminosa.9
2.2.2 Grupos e Aglomerados de Galáxias

Uma fração das galáxias se econtra na forma de agrupações gravitacionalmente ligadas,
que podem ter de uma dezena até milhares de membros. Embora não haja uma divisão
clara entre elas, costuma-se chamar de grupos os conjuntos gravitacionalmente ligados
contendo menos de 50 galáxias e aglomerados aos objetos maiores. Por exemplo, a Via
Láctea, a galáxia de Andrômeda (M31), M33, as Nuvens de Magalhães e mais três
dezenas de pequenas galáxias (e um número equivalente de galáxias anãs), formam
o Grupo Local10 . O aglomerado mais próximo da nossa galáxia é o aglomerado de
Virgem, que inclui as galáxias M87 e M100, e é constituı́do de aproximadamente
2.000 membros. Ele ocupa uma grande área do céu, de uns 5◦ de abertura e está
a uma distância de aproximadamente 16 Mpc de nossa galáxia.11 Outro aglomerado
próximo, situado a cerca de 100 Mpc, é o aglomerado de Coma12 , que possui da ordem
de 3.000 galáxias.
O tamanho tı́pico de um grupo de galáxias é de 1-2 Mpc e as suas massas são da ordem
de 1013 massas solares. Já os aglomerados possuem diâmetros da ordem de 5 Mpc e
9
Vale lembrar que esse resultado vale no contexto da teoria da gravitação de Newton (ou no limite
newtoniano da teoria de relatividade geral, que é justificado nesse contexto). Teorias alternativas de
gravitação podem fornecer resultados distintos.
10
Para saber mais sobre o grupo local, veja o sı́tio
http://seds.org/messier/more/local.html.
11
Uma medida de distância utilizando estrelas cefeidas em M100 descobertas com o telescópio Hubble
fornece o valor 16.1 ± 1.3 Mpc [10].
12
Na verdade a denominação correta em portugês deveria ser “aglomerado da Cabeleira”, já que o seu
nome decorre dele estar na direção da constelação Coma Berenices, que significa Cabeleira de Berenice.
Por uma questão de estética, manteremos o nome Coma.
66
Figura 2.7: A galáxia elı́ptica gigante M87, situada no aglomerado de Virgem. Créditos:
David Malin e Anglo-Australian Observatory.
massas tipicamente entre 1014 e 1015 massas solares (M ). Denomina-se “riqueza”

ao número de galáxias de um grupo ou aglomerado. Os aglomerados chamados ricos
possuem de centenas a milhares de galáxias (tipicamente entre 200 e 1000). Embora
sejam muito massivos, a sua abundância é pequena, e apenas uma minoria das galáxias
(5-10%) está nesse tipo de aglomerado.
Em 1958, o astrônomo George Abell elaborou um catálogo de 2.712 aglomerados a
partir de placas fotográficas do Palomar Observatory Sky Survey. Esse catálogo foi
ampliado ao longo dos anos (eram 4500 em 1989) tendo sido uma das fontes mais
importantes de informações sobre aglomerados. Hoje há catálgos contendo cerca de
14.000 aglomerados de galáxias e centenas de milhares de grupos, identificados no
Sloan Digital Sky Survey (SDSS, ref. [11]). Estima-se que há cerca de 106 aglomerados
no universo observável.
Observa-se que a aglomeração das galáxias depende do seu tipo: as galáxias espirais
têm uma maior tendência a estarem isoladas (chamadas “galáxias de campo”) en-
quanto as elı́pticas são encontradas preponderantemente em aglomerados. Nos aglom-
erados ricos, por exemplo, 60-80% das galáxias são elı́pticas, enquanto fora dessas
estruturas 60% são espirais. Devido a suas populações estelares, as galáxias espirais
são mais “azuis” (por possuı́rem estrelas jovens), enquanto as elı́pticas são “vermel-
has”. O efeito de segregação por morfologia é facilmente visı́vel em catálogos onde as
galáxias são identificadas por sua cor (veja a próxima seção). Uma forma de detectar
aglomerados de forma automatizada utiliza esse efeito, procurando por agrupamentos
em torno de galáxias vermelhas brilhantes, que são geralmente os centros de massa
67
Figura 2.8: A Grande Nuvem de Magalhães é uma galáxia irregular, satélite da Via
Láctea. Créditos: Anglo-Australian Observatory/Royal Observatory, Edimburgh.
dessas agrupações [11].

Comparados com as galáxias, os aglomerados podem ser modelados teoricamente com
relativa facilidade. De fato, desde a década de 1970 existem modelos analı́ticos que
descrevem a formação desses objetos e predizem a sua abundância em função do mod-
elo cosmológico [12]. Desse modo, observáveis relacionados a aglomerados constituem
um importante teste para os modelos cosmológicos. Por exemplo, a sua abundância
em função da massa e a variação do número de aglomerados ao longo da história
cósmica permitem estabelecer limites sobre a composição do Universo. Nos útlimos
anos houve um grande progresso na modelagem desses objetos, tanto com abordagens
semi-analı́ticas, quanto do ponto de vista das simulações computacionais (veja a seção
2.5.2). Hoje um grande número de propriedades observadas dos aglomerados, tais como
como abundância, distribuição espacial e estrutura, é reproduzido nessas simulações,
proporcionando uma descrição desses objetos a partir de primeiros princı́pios (e não
de forma apenas empirica, como é o caso de muitas propriedades das galáxias).
Uma das propriedades que tornam esses objetos relativamente simples, além deles
serem as maiores estruturas gravitacionalmente ligadas do Universo, é o fato da
dinâmica dos aglomerados ser dominada pela matéria escura, como veremos a seguir.
De ponto de vista observacional, os aglomerados têm um interesse especial, pois po-
dem ser estudados em um amplo espectro de comprimentos de onda, como veremos
na seção (2.2.2). Além disso, eles podem ser estudados pelo desvio que o seu campo
gravitacional causa na trajetória da luz de galáxias distantes, produzindo o efeito de
lente gravitacional (seção 2.2.2).
Dispersão de Velocidades e Matéria Escura
Além de possuirem um movimento coletivo constituindo a velocidade global do aglom-

erado,13 as galáxias executam um movimento aleatório em relação ao seu centro de
massa. Através da medida dos desvios para o vermelho das galáxias em um mesmo
aglomerado, é possı́vel obter a dispersão das velocidades destas (veja a figura 2.11).
13
Como veremos na seção (2.2.3), a maior contribuição para a velocidade de afastamento dos aglomer-
ados com relação a nossa galáxia é devida à expansão do universo.
68
Figura 2.9: Curva de rotação da galáxia M33, segundo a referência [9]. A curva com
tracejado curto mostra a contribuição do disco da galáxia para as velocidades, enquanto a
com tracejado longo mostra a contribuição do gás. A curva contı́nua mostra o modelo que
melhor ajusta as velocidades obtidas observacionalmente. A curva com tracejado curto e
longo mostra a contribuição do halo de matéria escura inferida a partir da distribuição de
velocidades observada e do modelo utilizado para ajustar esses dados.
Supondo que o aglomerado está, aproximadamente, em um estado de equilı́brio

dinâmico, conhecido como “equilı́brio do virial”, é possı́vel utilizar a velocidade
quadrática média para obter a sua massa: M ' 2R hv 2 i /G, onde R é o raio do
aglomerado.
Em 193314 Fritz Zwicky e colaboradores mediram as velocidades relativas de galáxias

no aglomerado de Coma (que são da ordem de 103 km/s)15 e utilizaram essas ob-
servações para estimar a massa desses aglomerados. Comparando a razão massa-
luminosidade (M/L) desses aglomerados com a das estrelas, eles obtiveram valores
duas ordens de magnitude superiores. Portanto a maior parte da massa dos aglomera-
dos não podia estar sob a forma de estrelas. Em outras palavras, a matéria “luminosa”
era insuficiente para explicar os movimentos das galáxias no aglomerado: surgia pela
primeira vez uma evidência para a “matéria escura” (ou “matéria faltante”, como
também ficou conhecida). A análise de Zwicky16 foi repetida inúmeras vezes para out-
ros aglomerados e a conclusão é sempre a mesma, a maior parte da matéria não pode
estar sob a forma de estrelas.
Além de surpreendente, o resultado obtido por Zwicky foi muito controverso e não foi
bem aceito na época de sua descoberta. O conceito de matéria escura só ganhou força
após os trabalhos de Vera Rubin na década de 70 mencionados acima.
14
Apenas uma referência posterior, de 1937 é fácil de ser obtida [13].
15
A velocidade de dispersão das galáxias em grupos é da ordem de 150 km/s.
16
O teorema do virial nos permite ter uma estimativa da ordem de grandeza dos aglomerados. Natural-
mente, modelos muito mais detalhados para a distribuição de velocidades das galáxias foram estudados.
A conclusão é sempre a mesma: a matéria escura domina a dinâmica dos aglomerados.
69
Figura 2.10: Aglomerado de galáxias de Coma (Abell 1656). Composição de exposições
em três filtros feitas com o telescópio de 90cm do Kitt Peak National Observatory. Crédito:
O. Lopez-Cruz (INAOEP) et al., AURA, NOAO, NSF.
Aglomerados de Galáxias como Lentes Gravitacionais
Uma conseqüência natural da deflexão da luz por um corpo massivo, predita pela teoria
da relatividade geral, é a possibilidade da existência de lentes gravitacionais. Embora
seja um fato ainda pouco conhecido, Einstein obteve a equação de lente gravitacional,
a possibilidade de imagens duplas e a magnificação das imagens em anotações de
1912 [15]. Em 1924, Chwolson publicou o primeiro artigo sobre lentes gravitacionais
[16], mencionando a idéia de “estrelas duplas fictı́cias”. Ele também discutiu o caso
simétrico de duas estrelas exatamente alinhadas com a Terra, resultando em uma
imagem circular da estrela mais distante. Já em 1936, Einstein previu o aparecimento
de um “cı́rculo luminoso” para um alinhamento entre fonte e lente,17 e de duas imagens
magnificadas para dois objetos levemente desalinhados18 [17]. Em 1937 Zwicky notou
que seria muito mais provável observar o efeito de lente gravitacional em galáxias do
que em estrelas e que as lentes gravitacionais podem ser utilizadas como um “telescópio
natural” [13]. No mesmo ano ele propôs a utilização do efeito de lente gravitacional
para determinar a massa de aglomerados de galáxias.
A deflexão da luz, predita por Einstein em 1911 (com um erro de um fator dois) e com
a teoria de relatividade geral em 1915, foi confirmada experimentalmente durante o
eclipse solar de 1919 observado em Sobral, no Ceará (e também na na Ilha Prı́ncipe,
mas o resultado teve uma significância menor). Entretanto, apenas em 1979 foi de-
scoberta a primeira lente gravitacional: uma imagem dupla de um quasar, causada por
uma galáxia. A partir daı́ as lentes gravitacionais se tornaram uma área observacional
com inúmeras aplicações em astrofı́sica e cosmologia e que vem sendo explorada cada
vez mais. A primeira lente gravitacional formada por um aglomerado de galáxias foi
17
Hoje em dia essa configuração de lente é chamada de “anel de Einstein”, mas talvez devesse ser
chamada de “anel de Einstein-Chwolson”.
18
Para uma animação desse efeito, mostrando a distorção de uma radiofonte ao passar por trás de uma
galáxia, veja o link
http://www.usm.uni-muenchen.de/people/botzler/lecture/animated lens large.gif.
70
Figura 2.11: Velocidade de recessão das galáxias no aglomerado de Coma obtidas a partir
dos desvios para o vermelho. A velocidade de cada galáxia é mostrada em função de sua
distância angular ao centro do aglomerado. Também aparecem galáxias no mesmo campo
angular, mas que não pertencem ao aglomerado.
encontrada por acaso, por Roger Lynds e Vahe Petrosian e, independentemente, por
Soucail et al., em 1986 [19].
Além do efeito mais espectacular de gerar imagens múltiplas e arcos (conhecido como
efeito forte, veja a figura 2.12), as lentes gravitacionais podem produzir um efeito
fraco, para objetos mais distantes da linha de visada entre a Terra e a lente (ou
seja, o alomerado) ou para lentes em que não há suficiente concentração de matéria
no centro. Esse efeito consiste em uma deformação das imagens de galáxias situadas
atrás do aglomerado na direção tangencial (veja a figura 2.13). Tal distorção pode
ser extremamente sutı́l e detectável apenas estatisticamente para um grande número
de galáxias (ao contrário da fig. 2.13). Tanto o efeito forte, quanto o fraco, têm sido
utilizados para estimar massas de aglomerados. Os resultados são consistentes com os
obtidos a partir da dispersão de velocidades, ou seja, a maior parte de sua massa está
sob a forma de matéria escura.
Além do Ótico: Aglomerados em Outros Comprimentos de Onda
Os aglomerados não são formados apenas por suas galáxias membro e pela matéria
escura. Eles são permeados por um gás rarefeito (basicamente Hidrogênio e Hélio) em
equilı́brio hidrostático (pelo menos em primeira aproximação). Para não colapsar sob
a ação dos fortes campos gravitacionais dos aglomerados, esse gás intra-aglomerado
tem que estar a temperaturas altı́ssimas, da ordem de 107 ∼ 108 K, correspondendo
a energias da ordem dos quilo-elétron-volts (veja o glossário 2.10). O gás emite fótons
nessa faixa de energia, que corresponde aos “raios-x moles”. De fato, as primeiras
observações em raios-x, na década de 197019 detectaram a emissão de aglomerados
nessa faixa do espectro eletromagnético. A partir do espectro em raios-x é possı́vel
determinar a temperatura do gás e, utilizando da hipótese de equilı́brio, obtem-se
uma estimativa do potencial gravitacional que “segura” o gás, ou seja da massa do
19
As observações em raios-x precisam ser feitas do espaço, pois a atmosfera é praticamente opaca nessa
faixa do espectro.
71
Figura 2.12: Região central do aglomerado de galáxias 0024+1654, situado a aproxi-
madamente 1,5 Gpc. Fica claro o efeito forte de lente gravitacional causado por esse
aglomerado, exibindo imagens múltiplas da mesma galáxia azul, distando o dobro que o
aglomerado. Esses arcos foram descobertos em 1988 por David Koo, do observatório Lick.
Crédito desta foto: W.N. Colley e E. Turner (Princeton University), J.A. Tyson (Bell
Labs, Lucent Technologies) e NASA/STScI.
aglomerado. Os resultados obtidos com essa técnica são consistentes com as estimativas
feitas a partir da dispersão de velocidades (veja a seção 2.2.2) e do efeito de lente
gravitacional (seção 2.2.2). Para aglomerados relaxados (ou seja próximos do estado
de equilı́brio) as estimativas de massa com esses três métodos diferem em cerca de
20% entre si apenas (veja, por exemplo, a ref. [20]), mantendo o resultado de que a
matéria em galáxias corresponde a poucos centésimos da massa total do aglomerado.
A partir da luminosidade em raios-x dos aglomerados (LX ∼ 109 − 1011 L , onde
L á a luminosidade total do Sol) é possı́vel obter a densidade do gás, que corre-
sponde a 10−4 − 10−2 partı́culas por cm3 . Mesmo com uma densidade tão baixa, o
gás intergaláctico responde pela grande maioria da matéria “comum” (não escura)
nos aglomerados. A massa em gás pode chegar a 20 vezes a massa das estrelas em
galáxias (massa luminosa). Ainda assim, a maior parte da massa dos aglomerados é
proporcionada pela matéria escura. A composição de um aglomerado pode ser resum-
ida da seguinte forma: 2-5% da massa em galáxias, 10-15% no gás intra-aglomerado e
80-90% em matéria escura.20
Além do ótico e dos raios-x, os aglomerados também são estudados no infra-vermelho
(onde são mais facilmente identificados do que no ótico), em ondas de rádio (onde há
menos contaminação por outras fontes) e em microondas. Nesse último caso, os fótons
não são emitidos pelo aglomerado, mas são provenientes da radiação cósmica de fundo
(RCF).
Como veremos mais adiante, existe uma radiação, na faixa de microondas, que per-
meia todo o Cosmos e é o resquı́cio de uma fase quente e densa do Universo. Nós
detectamos esses fótons vindos de uma camada muito distante, conhecida como su-
perfı́cie de último espalhamento. Em seu trajeto em direção à Terra um fóton da RCF
20
Para uma contabilidade mais detalhada sobre a contribuição de cada componente (estrelas, galáxias,
gás ionizado, etc.) para o conteúdo total dos bárions no universo, veja as refs. [21].
72
Figura 2.13: O aglomerado de galáxias Abell 1689. É fácil ver o efeito de lente grav-
itacional sobre as imagens de galáxias situadas atrás do aglomerado, criando arcos para
galáxias próximas ao seu centro e provocando uma distorção tangencial nas galáxias mais
distantes Crédito: NASA/STScI, N. Benitez (JHU), T. Broadhurst (The Hebrew Univer-
sity), H. Ford (JHU), M. Clampin (STScI), G. Hartig (STScI), G. Illingworth (UCO/Lick
Observatory), ACS Science Team e ESA.
Figura 2.14: Galáxias e emissão de raios-x no aglomerado de Coma. Os pontos e as cruzes

mostram as posições das galáxias cujo desvio para o vermelho é conhecido (e os três pontos
maiores representam as galáxias dominantes do aglomerado). As curvas de nı́vel mostram
a intensidade da emissão em raios-x obtida pelo satélite ROSAT. Esta figura foi retirada
da ref. [14] (os cı́culos em pontilhado representam as regiões estudadas nessa referência).
73
Figura 2.15: Imagem da região central do aglomerado Abell 586 obtida pelo Gemini Multi-
Object Spectrograph (GMOS), no telescópio Gemini Norte. As curvas sólidas representam
regiões de igual intensidade (isofotas) da emissão em raios-x, medida pelo telescópio espa-
cial Chandra, espaçadas logaritmicamente. As curvas tracejadas representam a densidade
de massa reconstruı́da através do efeito fraco de lentes gravitacionais. Fonte: Cypriano,
et al. (ref. [20]), gentilmente cedida pelos autores.
pode interagir com os elétrons do gás intra-aglomerado (que é ionizado devido à alta
temperatura), ganhando energia. Esse processo é conhecido como efeito Compoton
inverso, pois são os elétrons que cedem energia aos fótons. Portanto, à raiz dessa in-
teração, a temperatura da RCF muda na direção dos aglomerados massivos, fenômeno
conhecido como efeito Sunyaev-Zel’dovich (SZ). Desse modo, olhando para a RCF en
alta resolução, é possı́vel detectar os aglomerados pelo efeito SZ. A grande vantagem
desse método é que o efeito SZ independe da distância do aglomerado a nossa galáxia.
A intensidade dos fótons emitidos pelo aglomerado, seja no ótico ou no raio-x, decresce
com o inverso do quadrado da distância, enquanto o efeito SZ permanece constante.
O efeito SZ é portanto um método promissor para detectar aglomerados distantes.
Há vários projetos sendo desenvolvidos para identificar aglomerados com esse método
e obter várias quantidades fı́sicas, como a sua massa. Entre os que estão operando,
podemos citar o Sunyaev-Zeldovich Array21 e o Arcminute Microkelvin Imager22 , que
cobrem áreas relativamente pequenas do céu. Está entrando em operação o South Pole
Telescope [22], que mapeará uma extensa área do céu e descobrirá da ordem de 40.000
aglomerados. Para maiores detalhes sobre as aplicações cosmológicas do efeito SZ, veja
a referência [23].
2.2.3 O Cosmos Dinâmico: O Universo em Expansão

A técnica de espectroscopia (veja o glossário), desenvolvida na segunda metade do
século XIX, causou um verdadeira revolução na astrofı́sica. A partir dos espectros
do Sol e das estrelas foi possı́vel identificar os elementos quı́micos que os compõem e
verificar que são os mesmos que existem na superfı́cie da Terra. Também a partir da
espectroscopia, foi possı́vel medir a velocidade de astros, mesmo se nenhum desloca-
mento pode ser perceptı́vel. Isso se deve ao efeito descoberto por Doppler em 1842.
21
http://astro.uchicago.edu/sza/overview.html
22
http://www.mrao.cam.ac.uk/telescopes/ami/
74
Quando um corpo emitindo ondas (por exemplo, eletromagnéticas, ou ondas sonoras)
está em movimento em relação a um observador, este detecta essas ondas com um
comprimento distinto do emitido. Em particular, se movimento é de aproximação em
relação ao observador, o comprimento de onda detectado é menor. Se o emissor se
afasta, o comprimento de onda aumenta. Como os elementos quı́micos emitem a ra-
diação em uma sequência bem definida de comprimentos de onda (linhas de emissão
ou absorção), é fácil medir o efeito Doppler através do espectro. Uma vez que uma
linha é identificada no espectro de um objeto celeste o comprimento de onda desta
(λr ) é comparado com o comprimento de onda de repouso associado a essa linha (λe ).
Assim, define-se o desvio para o vermelho (ou rubro desvio) pela relação
λr − λe
z := ,
λr
onde λr é o comprimento de onda detectado na Terra e λe é o comprimento de onda
emitido (ou seja, em repouso em relação à fonte). No caso não relativı́stico, o desvio
para o vermelho é dado por z = v/c, onde c é a velocidade da onda (no caso, a
velocidade da luz) e v é a velocidade relativa entre fonte e observador.
Figura 2.16: Ilustração esquemática da medida do desvio para o vermelho.
A primeira medida do desvio espectral de uma galáxia foi feita pelo astrônomo Vesto
Melvin Slipher em 1912. Utilizando o telescópio refrator de Lowel, ele obteve o espec-
tro de Andrômeda (M31) e mediu o seu rubro desvio. Ele precisou fazer uma exposição
de 40h em várias noites, para captar o espectro numa chapa fotográfica. Ele obteve
que M31 se aproxima de nossa galáxia a cerca de 300 Km/s. Depois ele mediu a veloci-
dade da galáxia de sombrero, que desta vez de afasta a uma velocidade de cerca de 100
Km/s. Em 1915, Slipher tinha medido os desvios para o vermelho de 15 galáxias (neb-
ulosas espirais, na época), dos quais 13 eram positivos, ou seja, as galáxias estavam se
afastando. Slipher continuou a observar mais galáxias e esse resultado se mantinha, ou
seja, a grande maioria tinha uma velocidade de recessão. Intrigado por esse resultado,
Hubble, com a ajuda de Milton Humason, repetiu as medidas de Slipher e obteve
os desvios para o vermelho de 46 galáxias, em 1929 (novamente, graças ao telescópio
Hooker de Monte Wilson, que era capaz de captar 17 vezes mais luz que o utilizado
por Slipher).
Como vimos na seção (2.2.1), Hubble mostrou que as nebulosas espirais eram extra-
galácticas, aplicando a relação perı́odo-luminosidade de estrelas cefeidas para obter
75
a distância de Andrômeda. Restava agora identificar variáveis cefeidas nas outras
galáxias para as quais eles dispunham do rubro desvio. O resultado foi apresentado
em 1929 e se tornou um mais conhecidos de toda a história da ciência. Hubble mostrou
um diagrama contendo as velocidades e distâncias de 24 galáxias individuais e de uma
combinação de galáxias separadas em 9 grupos (veja a fig. 2.17). O resultado evi-
denciava uma “relação aproximadamente linear entre as velocidades e as distâncias”,
precisamente o que era esperado de um Universo em expansão! No seu artigo, Hubble
conclui “The outstanding feature, however, is the possibility that the velocity-distance
relation may represent the de Sitter effect, and hence that numerical data may be
introduced into discussions of the general curvature of space” (ref. [24]), ou seja, ele
tinha noção das possı́veis implicações desse resultado no contexto da relatividade geral
(embora ele não tenha utilizado o termo expansão do Universo).
Figura 2.17: Diagrama original obtido por Hubble em 1929 (ref. [24]). A legenda original
diz: “Velocidades radiais, corrigidas pelo movimento do Sol, são graficadas em função das
distâncias estimadas pelas estrelas envolvidas e pelas luminosidades de nebulosas [galáxias]
em grupos. Os discos cheios e a linha contı́nua representam a solução para o movimento
solar [ou seja, em relação à Via-Lactea] usando nebulosas individuais. Os cı́rculos rep-
resentam a solução combinando as nebulosos em grupos. A cruz representa a velocidade
média de 22 nebulosas cujas distâncias não puderam ser estimadas individualmente. Nota:
aparentemente, naquela época era comum apresentar a velocidade em quilômetros (e não
em km/s!). Fonte: referência [24].
Voltaremos a falar em mais detalhes sobre a relação distância-rubro desvio nas

próximas seções.Por ora, é suficiente apontar para a interpretação intuitiva desse re-
sultado. Se o Universo está (na média) em expansão uniforme, significa que galáxias
eqüidistantes, estarı́am se separando a uma mesma velocidade, independentemente de
onde estejam. Imagine três galáxias A, B e C, dispostas em linha nessa ordem, sendo a
distância entre A e B igual àquela entre B e C. Assim, A se afastaria de B com veloci-
dade v, e do mesmo modo B se afastaria de C com velocidade v. Assim, A se afastaria
de C com velocidade 2v, mas a distância tamém é o dobro qua a distância a B. Dessa
forma, obtemos uma velocidade proporcional à distância. Mesmo com distâncias irreg-
ulares e em três dimensões, o mesmo resultado é esperado. É importante destacar que,
embora as galáxias pareçam se afastar de nossa, o mesmo efeito seria visto de qualquer
outra. Isso é uma conseqüência da homogeneidade da expansão. Portanto, apesar de
um aparente afastamento radial para um dado observador, a expansão não possui cen-
76
tro. Portanto, é conceitualmente errado associá-la a uma explosão. Explosões possuem
um centro, uma origem bem definida, a expansão cósmica não.
Também é importante enfatizar que o efeito linear é esperado apenas em distâncias
relativamente pequenas, menores que 1Gpc. O raciocı́nio que levou à linearidade não
leva em conta que: i) a taxa de expansão pode variar no tempo, ii) as observações são
feitas a tempos distintos, pela finitude da velocidade da luz (diz-se que as observações
são feitas no cone de luz ), iii) a curvatura do Universo pode afetar esse resultado.
Em 1931 Hubble conseguiu medir as distâncias e desvios para o vermelho de galáxias
vinte vezes mais distantes, o que confirmou o seu resultado de uma relação aproxi-
madamente linear [6]. Hubble já era famoso por ter resolvido o debate sobre a natureza
das nebulosas espirais. Agora ele virou estrela por ter descoberto experimentalmente
a expansão do Universo.
A relação de Hubble costuma se expressa na seguinte forma
v = H0 D,
onde v, é a velocidade de recessão e D é a distância a nossa galáxia. O parâmetro H0 é

conhecido como “constante” de Hubble (embora o seu valor possa variar com o tempo
e não esteja relacionado com as constantes da natureza) e costuma-se parametrizá-lo
na forma
H0 = 100 h Km/s/Mpc.
Os dados de Hubble mostravam que h ∼ 5. No entanto, como foi mencionado na seção

(2.2.1), ainda não se sabia da existência de dois tipos de cefeida. Para um mesmo
perı́odo, as cefeidas do tipo desconhecido eram intrinsicamente mais brilhantes que
as cefeidas estudadas na nossa galáxia e nas Nuvens de Magalhães. Por um efeito
de seleção, apenas essas cefeidas mais brilhantes eram vistas em outras galáxias. Isso
levou Hubble a super-estimar a taxa de expansão. Uma boa parte da cosmologia
observacional do século XX foi dedicada a melhorar as determinações de H0 . Como a
incerteza ainda era significativa até a última década desse século, costuma-se expressar
todas as distâncias cosmológicas (e uma série de quantidades a ela relacionadas) em
termos de h.
Um dos projetos chave to telescópio espacial Hubble foi a determinação de H0 através
da combinação de uma série de métodos de medida de distâncias. Eles utilizaram e
recalibraram a escala de distâncias baseada em cefeidas e aplicaram uma série de outros
métodos para medir a distâncias de galáxias mais distantes23 . Os resultados desse
projeto foram (veja a ref. [25]): h = 0.71±0.2±0.6 (sistemático), a partir de supernovas
do tipo Ia; h = 0.71± 0.3± 0.7, relação de Tully-Fisher; h = 0.70± 0.5± 0.6, flutuações
de brilho superficial; h = 0.72± 0.9± 0.7, supernovas do tipo II e h = 0.82± 0.6± 0.9,
plano fundamental (veja a figura 2.19). A combinação desses resultados, devidamente
pesados, resulta em h = 0.72 ± 0.8, que hoje é considerado praticamente um padrão.
Compare o alcance da figura (2.19), com os dados originais do Hubble (fig. 2.17), que
iam até 2Mpc apenas.
23
O ponto de partida para calibrar esses outros indicadores de distância são as cefeidas, que por sua
vez têm as suas distâncias calibradas utilizando outros métodos. Esse processo em que as escalas de
distância maiores são calibradas através de métodos obtidos para escalas menores é conhecido como
“escada cósmica”.
77
Figura 2.18: Velocidade versus distância de galáxias, obtidas a partir de estrelas cefeidas
com o projeto Hubble Space Telescope Key Project (ref. [25]). Um ajuste desses dados
por uma reta fornece H0 = 75 ± 10 (estatı́sico) km s−1 Mpc−1 , em acordo, dentro das
incertezas, com o valor de H0 obtido a partir de métodos que se extendem a distâncias
maiores.
2.2.4 Estrutura em Grande Escala
Para finalizar esta seção sobre o Universo osbervado, vamos falar das escalas que
vão além dos aglomerados. Embora a maior parte da matéria que se aglomera em
estruturas esteja formada por matéria escura, as galáxias podem ser consideradas
os “tijolos”, ou melhor, os marcadores da estrutura em grande escala no universo.
Portanto, para estudar as estruturas em grande escalas é preciso mapear as posições
das galáxias, preferencialmente em 3 dimensões. Medir a posição angular das galáxias
é bastante trivial, o difı́cil é obter estimativas de distâncias para um grande número
delas, sobretudo as mais distantes. Nesse caso não é possı́vel detectar estrelas cefeidas
e a probabilidade de observar uma supernova em cada uma delas é muito pequena. O
que se pode fazer é medir o desvio para o vermelho de uma fração das galáxias. Se todas
as galáxias seguissem a expansão homogênea do Universo, seria muito simples obter
a distância a partir do rubro desvio seguindo a relação de Hubble: D ' H0−1 cz. No
entanto, justamente devido às aglomerações locais de matéria, cada galáxia tem o seu
movimento próprio, além da expansão. É como se todas as velocidades pudessem ser
decompostas em vexp +vpec , onde vexp é a componente devida à expansão do Universo e
vpec é uma velocidade peculiar, de cada objeto. Podemos fazer uma analogia com uma
caixa contendo um gás. Se movemos a caixa a uma velocidade v, as moléculas desse gás
terı́am uma velocidade que á a combinação da velocidade relativa própria delas com o
movimento global, médio, que representa o movimento da caixa. No caso cosmológico,
a velocidade vexp aumenta com a distância. Já as velocidades peculiares não variam
com a distância (mas sim com a densidade local de matéria). Esse efeito é claramente
visı́vel na figura (2.11): as galáxias possuem um movimento próprio em relação a uma
média (nesse caso, da ordem de 7000 Km/s). Essa média é dada pelo afastamento
do aglomerado em relação a nós, devido à expansão do Universo. As velocidades
peculiares em aglomerados podem chegar a ser muito altas, justamente porque elas são
as maiores estruturas gravitacionalmente ligadas no Universo (veja a seção 2.2.2). Já
para as estruturas em escalas maiores, as velocidades são menores. A medida individual
do desvio para o vermelho de uma galáxia fornece cz = vexp + vpec = H0 D + vpec .
78
Figura 2.19: Velocidade versus distância de galáxias, obtidas com o projeto Hubble Space
Telescope Key Project (ref. [25]). Quadrados: supernovas do tipo Ia; cı́rculos cheios:
relação de Tully-Fisher; triângulos: plano fundamental; diamantes: flutuações de brilho
superficial; quadrados vazios: supernovas do tipo II. É mostrada uma inclinação de
H0 = 72 km s−1 Mpc−1 entre duas linas deslocadas de ±10%. Abaixo: valor de H0
em função da distância.
Claramente o primeiro termo aumenta com a distância. O segundo termo deve ficar
próximo de zero, num certo volume apreciável e fazendo uma média num grande
número de galáxias.
O resumo da discussão acima é que as velocidades peculiares impedem uma conexão
direta entre o rubro desvio e a distância. Num diagrama distância-rubro desvio isso
não é um problema, pois o que importa é a relação média. As velocidades peculiares
apenas causam uma dispersão e ainda assim, esta só é apreciável a distâncias menores.
Já para fazer um mapa da distância individual das galáxas a partir de z, isso poderia
ser um problema. No entanto, como foi dito, o efeito de vpec não é muito grande e não
influencia nas estruturas nas maiores escalas. Desse modo, um mapa de (z, θ φ) para
cada galáxia fornece uma excelente representação da estrutura em grande escala em
três dimensões (z é a coordenada radial e θ e φ são as coordenadas angulares). Um
mapa desse tipo é mostrado na figura (2.22).
Antes de que fossem feitos os primeiros levantamentos da distribuição de galáxias,
esperava-se que não houvesse estruturas em escalas maiores que aglomerados de
galáxias. Acreditavasse que, a partir dessas escalas, o universo deveria ser homogêneo.
Foi uma grande surpresa quando os primeiros resultados do CfA, na década de 1980
[47], mostraram a existência de complexas estruturas: super-aglomerados, filamentos,
paredes e vazios de matéria (voids). Os super-aglomerados são formados por grupos,
aglomerados e galáxias isoladas e têm dezenas de Mpc de extensão. Por exemplo, o
super-aglomerado local, onde está o nosso grupo de galáxias mede cerca de 30 Mpc.
Outro super-aglomerado próximo é o de Coma-Virgem. Os superaglomerados ficam
no cruzamento entre filamentos, que por sua vez aparecem na interseção de estruturas
achatadas, como o “grande muro” que tem dimensões da ordem de 80 Mpc por 220
Mpc. Portanto, a estrutura em grande escala do universo tem uma aparência ”espon-
josa” e que é predominantemente filamentar. Em escalas maiores, acima de centenas
79
de Mpc a alguns Gpc, o Universo tende à homogeneidade (veja, por exemplo a ref.
[51]).
Uma grande importância da estrutura em grande escala é o fato dela ter sido pouco
afetada pela dinâmica complexa que deu origem a estruturas menores, como os aglom-
erados. Nas maiores escalas, as flutuações de densidade são relativamente pequenas
ρEGE /ρuniverso . 1. Por isso, diz-se que elas são lineares. De fato, pode-se mostrar que
nesse caso, e num universo dominado por matéria escura, as flutuações mantêm a sua
forma original, aumentando apenas de amplitude (veja a seção 2.5.1). Ou seja, a forma
das perturbações de densidade na estrutura em grande escala guarda a memória de
heterogeneidades que estavam presentes em fases muito mais remotas da história do
Universo.
A distribuição de matéria em grandes escalas proporciona mais uma evidência para a
existência de matéria escura, já que num universo composto apenas por bárions, não
teria havido tempo suficiente para a formar as estruturas observadas (veja a seção
2.5.1, em particular o resultado 2.42).
Uma compreensão da distribuição atual de matéria em grandes escalas é crucial para
entender a origem das estruturas no universo e testar cenários detalhados de sua
formação. Por sua vez, a determinação desses cenários permite impor limites sobre os
parâmetros cosmológicos e as teorias do universo primordial que predizem as primeiras
flutuações.
Mapas cósmicos: passado, presente e futuro
Como mencionamos acima, para investigar a distribuição de matéria no universo

efetuam-se levantamentos sistemáticos da posição de galáxias (e também de quasares).
Os dois tipos mais utilizados são os levantamentos das posições angulares e catálogos
espectroscópicos. No primeiro, como as distâncias não são conhecidas, temos uma dis-
tribuição projetada numa esfera. A vantagem é o grande número de objetos que podem
ser levantados: no APM survey [44], por exemplo, temos a distribuição de 2 milhões
de galáxias (veja a fig. 2.21). No segundo, são obtidos os espectros dos objetos, per-
mitindo obter os desvios para o vermelho de forma precisa, fornecendo portanto um
panorama da distribuição tridimensional da matéria. Um exemplo é o Las Campanas
survey [45, 46], com 23.700 galáxias. Um dos primeiros levantamentos desse tipo foi
o CfA redshift survey, com 9.000 galáxias [47]. Em 2003 foram tornados públicos os
dados do Two Degree Field (2dF [48]), que obteve os desvios para a o vermelho de
mais de 220.000 galáxias distribuı́das em várias fatias do céu (fig. 2.22).
Até o momento, o levantamento de galáxias e quasares com maior número de desvios
para o vermelho é o Sloan Digital Sky Survey (SDSS [49]). Em 2006 foi disponibilizado
o data release 5 do SDSS correspondendo a uma cobertura angular de aproximada-
mente 10% do céu. Esse catálogo inclui dados fotométricos com a posição angular de
215 milhões de galáxias, quasares e estrelas e espectros (logo, o desvio para o vermelho)
de 674,749 galáxias, 90.611 quasares e 154,925 estrelas, totalizando 14,4 TB de dados.
Já está em andamento o SDSS II e planeja-se realizar o SDSS III, que ampliarão ainda
mais a cobertura angular e o número de especros.
No que se refere à fotometria, ou seja, imagnes, o Dark Energy Survey (DES)24 rep-
resentará a próxima geração de catálogos de galáxias, sendo bem mais profundo que
24
Veja em http://www.darkenergysurvey.org, http://www.des-brazil.org/.
80
o SDSS e cobrindo um volume quatro vezes maior. Apenar do projeto não ter espec-
troscopia, poderão ser feitas boas estimativas do rubro desvio, devido à informação
em cinco bandas do espectro (filtros). Depois de 2015, entrará em operação o Large
Synoptic Survey Telescope (LSST) que será capaz de cobrir todo o céu de sua área de
observação em poucos dias e atingirá magnitudes ainda mais profundas do que os pro-
jetos anteriores. No plano de espectroscopia, há projetos para construir espectrógrafos
capazes de captar cerca de 5000 espectros por exposição, proporcionando medidas
precisas do desvio para o vermelho para milhões de galáxias.
Uma nota sobre a interpretação da expansão do universo
Alguns autores afirmam que, como há objetos com z > 1, isso implicaria em veloci-
dades superluminais, o que violaria a relatividade, de modo que não se pode inter-
pretar a expansão do universo como um afastamento real das galáxias, e sim como
a “expansão do espaço-tempo”. Essa afirmação é totalmente falsa, pois baseia-se na
equação não relativı́stica v = cz. O resultado exato da relatividade restrita para o
efeito Doppler é s
∆λ 1 + vc
z= = − 1.
λ 1 − vc
Portanto, para velocidades de recessão relativı́sticas, z pode atingir valores arbitraria-
mente altos. Assim, não há nenhum problema em se interpretar a expansão do universo
como um real afastamento das galáxias. Ao contrário, não é possı́vel separar fisica-
mente as velocidades como sendo uma ”velocidade de expansão” e uma “velocidade
real”. A separação entre um “fluxo de Hubble” e velocidades peculiares resulta apenas
das propriedades do nosso universo, que é aproximadamente homogêneo em grandes
escalas, com heterogeneidades que aumentam à medida que as escalas diminuem. As-
sim, é conveniente separar a descrição dinâmica em quantidades médias e perturbações,
como é feito na seção (2.5.1). Por incrivel que pareça, a interpretação da expansão do
universo ainda é assunto de debates. Para uma discussão e alguma bibliografia veja,
por exemplo, a referência [74].
2.3 O Universo Homogêneo I

Agora que introduzimos um pouco da fenomenologia do Universo, incuindo alguns de
seus componentes e suas escalas fı́sicas, vamos passar a uma descrição mais quanti-
tativa. Como regra geral na fı́sica, partimos de um modelo o mais simples possı́vel e
verificamos se ele pode dar uma descrição aproximada dos fenômenos. Se a reposta
for positiva, passa-se ao detalhes para tentar descrever o maior número possı́vel de
aspectos envolvidos. A hipótese mais simples neste caso é supor que o Universo é ho-
mogêneo e isotrópico, ou seja, é igual quando observado de todos os pontos e em todas
as direções. Depois de toda a discussão acima sobre as estruturas do Universo, essa
hipótese pode parecer o famoso caso da “vaca esférica”. No entanto, a idéia é procu-
rar descrever o comportamento global, médio, do Universo. Se esse modelo conseguir
explicar os fenômenos associados a essa situação, passaremos a estudar perturbações
sobre o modelo. De fato hoje há uma grande abundância de informações astronômicas
mostrando que o Universo se torna cada vez mais homogêneo à medida que aumenta-
mos a escala e que de fato ele é estatisticamente homogêneo, ou seja, diferentes partes
81
do Universo, embora recheadas de estruturas, têm propriedades estatı́sticas semel-
hantes. Além disso, sabemos também que o Universo era muito mais homogêneo no
passado, com perturbações de uma parte em dez mil ((ρ − ρ̄)/ρ̄ ∼ 10−5 ).
Se bem hoje em dia temos muitas motivações para escolher um Universo homogêneo e
isotrópico como primeira aproximação, essa escolha não estava tão bem fundamentada
quando foram desenvolvidos os primeiros modelos cosmológicos com o advento da
teoria da relatividade geral. Naquela época, duas motivações devem ter norteado essa
escolha, a simplicidade e o “princı́pio de Copérnico”, segundo o qual não deveria haver
nem pontos nem direções privilegiadas no Universo.
De certa forma a história da cosmologia se confunde com a história da gravitação,
e é imprescindı́vel conhecer a teoria da gravitação (no caso, a teoria da relatividade
geral) para compreender a cosmologia. No entanto, neste capı́tulo, procuraremos uti-
lizar o mı́nimo possı́vel de resultados da relatividade geral, por questões pedagógicas,
de modo que ele seja accessı́vel às pessoas ainda não familiarizadas com a cosmolo-
gia relativı́sta. Grande parte dos resultados e conceitos aqui discutidos não requerirá
todo o arcabouço formal da gravitação. Ainda assim, eles incluirão os ingredientes
necessários para entender os modelos cosmológicos atuais. Portanto, partiremos agora
da mecânica newtoniana para construir um modelo para a dinâmica do Cosmos.
2.3.1 Dinâmica: A equação de Friedmann

Nesta seção vamos introduzir as equações da cosmologia newtoniana partindo da
própria mecânica de Newton. Como veremos a seguir, a teoria newtoniana não se
aplica diretamente à cosmologia: é preciso estabelecer um procedimento para eliminar
as inconsistências que surgem ao considerarmos uma distribuição infinita de matéria.
Em última instância, a justificativa para esse tratamento vem da aplicação da rela-
tividade geral, que fornece as mesmas equações a serem deduzidas nesta seção.
Para determinar as forças gravitacionais, devemos calcular o potencial gravitacional
Φ, que é obtido pela solução da equação de Poisson
∇2 Φ = 4πGρ(~r, t).
No entanto, essa equação apenas não é suficiente par determinar Φ: precisamos

fornecer condições de fronteira. Num universo ilimitado, não há um critério para definir
essas condições e portanto não temos como calcular Φ a priori. Assim, as equações
da mecânica, junto com a equação de Poisson, não são suficientes para determinar a
solução do problema cosmológico.
Essa ambigüidade na teoria newtoniana aparece somente no estudo de um espaço
infinito preenchido de matéria. Em problemas nos quais a densidade cai suficiente-
mente rápido no infinito, podemos utilizar a condição Φ → 0 para r → ∞. Essa
condição, juntamente com a equação de Poisson, permite determinar o potencial Φ
completamente:
ρ (~r0 , t) 3 0
Z
Φ(~r, t) = −G d r.
|~r − ~r0 |
Se insistirmos em utilizar essa expressão quando ρ não decai para r → ∞, então
Φ diverge. A impossibilidade de se obter uma cosmologia puramente newtoniana é
atribuı́da por muitos autores à divergência de Φ. No entanto, as quantidades ob-
serváveis são as derivadas segundas ∂Φ/∂ri ∂rj , que determinam a aceleração relativa
82
de partı́culas vizinhas. Elas ficam indefinidas devido à divergência do potencial, ou
melhor, pela falta de condições de fronteira apropriadas.
Qual seria o valor do campo gravitacional ~g num meio infinito e homogêneo? Se
consideramos primeiro o campo dentro de uma esfera finita de raio R temos, pelo
teorema de Gauss, ~g = −(4π/3)Gρ~r (para r < R). Esse resultado não muda para
R → ∞ e logo serı́amos tentados a concluir que o campo está bem definido em qualquer
r finito. Suponha agora que estejamos no interior de um esferóide de excentricidade
e > 0. Nesse caso o campo gravitacional não é radial. A única diferença está na casca
entre o esferóide e a esfera nele circunscrita, no entanto o campo muda em todos
os pontos (exceto em r = 0). Extendendo esse esferóide indefinidamente, temos um
exemplo explı́cito em que o campo gravitacional depende das condições de contorno no
infinito. Outro problema é que, mesmo num espaço homogêneo o campo dependeria
fortemente da posição e da origem do sistema de coordenadas.
Vamos ver agora um modo de evitar esses problemas que nos permite construir uma
cosmologia newtoniana. Dessa forma, as condições de contorno no infinito já estarão
“embutidas” nas equações de movimento.
Como discutido na seção 2.2.3, as observações de galáxias distantes mostram que o
universo está se expandindo (há outras evidências da expansão do universo que irão
aparecendo nas seções seguintes e muitas que nem serão mencionadas neste capı́tulo).
Se a expansão fosse perfeitamente uniforme, as separações entre objetos co-móveis
com a expansão cósmica mudariam com o mesmo fator a(t), denominado fator de
escala do Universo. Na verdade sabemos que ela não é uniforme, mas podemos fatorar
a expansão média, ou seja, separar a dinâmica em uma parte global e homogênea e
perturbação em relação a esse comportamento médio. É nesse processo que desapare-
cerá a indeterminação de ~g . Para isso, é necessário utilizar coordenadas co-móveis ~x,
definidas pela relação25
~r
~x:= . (2.2)
a(t)
Também é conveniente utilizar uma nova variável temporal, o tempo conforme η,
definido pela relação26
dt
dη := . (2.3)
a(t)
Para uma expansão perfeitamente uniforme os vetores posição co-móveis ~x per-

manecem fixos para todas as partı́culas. No caso de uma expansão perturbada, cada
partı́cula segue uma trajetória ~x (η). A velocidade em coordenadas co-móveis, con-
hecida como velocidade peculiar é definida por
d~x 1 d~r da/dη d~r

~v := = − ~
r = − H~r, (2.4)
dη a dη a2 dt
onde H é o parâmetro de Hubble, definido por
1 da 1 da
H(t) := 2
= .
a dη a dt
25
As coordenadas cartesianas usuais de uma partı́cula ou elemento de volume serão denotadas por ~r.
26
A variável t, conhecida como tempo cosmológico, é o tempo próprio medido por um observador
co-móvel com a expansão média.
83
Note que ~v é a velocidade medida por um observador cuja coordenada co-móvel é fixa
(para esse observador, ~r = a ~x e portanto a sua velocidade é dada por (da/dt) (1/a) ~r =
H~r ).
Como sempre podemos multiplicar o fator de escala a por uma constante, é melhor
trabalhar com quantidades que são invariantes com relação a essa mudança, estas
serão chamadas de quantidades próprias. Assim H e vi = dxi /dη = (adri ) / (adt) são
quantidades próprias, enquanto dxi /dt não é. Essa é uma razão para utilizarmos η em
vez de t como variável independente.
Para deduzir as leis que governam a expansão média, consideraremos uma distribuição
esfericamente simétrica e uniforme com densidade ρ̄. Para que a homogeneidade seja
mantida, é preciso que todas as escalas se alterem por igual. Dessa forma a trajetória
de um elemento de volume de massa m será dada por r(t) = a(t)x com x fixo (difer-
entes valores de x denotam elementos de diferentes cascas esféricas). A equação de
conservação da energia para esse elemento de volume é
2
1 dr GM m
m − = E,
2 dt r
onde M é a massa contida numa esfera de raio r. Logo27
2
da
dt
x 4π
3
ρ̄ (ax)3 E
−G = .
2 ax m
Assim, obtemos
8πG 2
(aH)2 = ρ̄a − K,
3
onde K = −2E/mx2 . Essa equação é conhecida como equação de Friedmann. Para ter-
mos uma expansão homogênea, a função a (η) deve ser a mesma para todos os elemen-
tos de volume, logo devemos ter K = const. A equação de Friedmann que acabamos
de deduzir é idêntica àquela obtida utilizando a relatividade geral (eq. [aqui, citar a
eq. de Friedmann como aparece no curso do Novello]).28 Na relatividade geral pode-se
mostrar que K está relacionado à curvatura do espaço (ou seja, das hipersuperfı́cies
com η constante)[colocar referências para a(s) seção(ões) de relatividade geral e/ou
cosmologia relativı́stica]. A equação de Friedmann geralmente é expressa na forma
2
da/dt 8πG K
= ρ̄ − 2 . (2.5)
a 3 a
Para resolver essa equação ainda é preciso obter uma relação do tipo ρ̄ = ρ̄ (a (η)).
Para tal, primeiramente consideraremos o caso de matéria não relativı́stica, ou seja,
um fluido composto por partı́culas cuja energia cinética é muito menor do que a sua
massa de repouso.
Atenção: de agora em diante, para aliviar a notação, eliminaremos a barra para deno-
tar a densidade média, ficando implı́cito que ρ se refere à densidade média. Apenas na
seção (2.5.1) voltaremos a utilizar essa notação, dado que estudaremos as perturbações
sobre um fundo homogêneo.
27
Note que cada casca pode ter uma energia total diferente E(x). Ela é fixada pelas condições iniciais.
28
No entanto, na dedução acima ρ denota a densidade de massa, enquanto na relatividade a quantidade
que aparece é a densidade de energia. Quando a pressão não é relativı́stica, que é a situação relevante
para a formação de estruturas, essas quantidades são equivalentes.
84
Matéria não relativı́stica
Consideremos um elemento de volume V formado por um dado conjunto de partı́culas

e cuja densidade é ρ. A conservação da massa implica em ρV = m = const. No caso da
expansão uniforme, uma esfera de raio r(t) = xa(t) terá sempre as mesmas partı́culas,
assim ρ (4π/3) (ax)3 = const. ou seja29
ρ ∝ a−3 . (2.6)
Substituindo essa expressão na eq. (2.5) obtemos uma equação diferencial de 1a ordem
no tempo para o fator de escala a(t) [ou a(η)]
2 2
8πGρi a3i 1

1 da da
= = − K, (2.7)
a dη dt 3 a
onde ρi e ai são os valores de ρ e a num tempo ti dado. Essa equação pode ser
integrada para vários valores de K. Os diversos valores dessa constante determinam o
comportamento assintótico do fator de escala.
O Universo de Einstein-de Sitter Um caso importante consiste em escolher K =

0. Juntamente com a equação (2.6), essa escolha corresponde ao chamado modelo de
Einstein-de Sitter, proposto por ambos em 1932. Nesse caso, a solução da equação de
Friedmann (2.7) fica muito simples:
2
η − η0
a(η) = , (2.8)
ηi
onde ηi2 = 3/ (2πGρi a3i ). De agora em diante escolheremos o instante η0 = 0, que

corresponde ao “Big-Bang”. Note que sempre é possı́vel redefinir ai , de modo que
a (η) é determinado a menos de uma constante multiplicativa. O importante é o com-
portamento temporal a ∝ η 2 . No universo
R de Einstein-de Sitter a conversão para o
tempo cosmológico t, fica fácil: t = a(η)dη o que leva a η ∝ t1/3 . Dessa forma, temos
a ∝ t2/3 .
A conservação da energia
Uma conseqüência fundamental da relatividade restrita é a equivalência entre massa

e energia. A energia total de um objeto é dada, aproximadamente, pela soma de suas
energias cinética e de repouso (mc2 ). No caso de um fluido, a densidade de energia total
é dada pela soma da densidade de energia de repouso %0 com a densidade de energia
interna ε (que pode corresponder à energia cinética do movimento microscópico das
partı́culas e também à energia potencial de ligação de seus componentes). Se o fluido
é composto por partı́culas de massa m, teremos
% = %0 + ε = nmc2 + ε, (2.9)
onde n é a densidade de partı́culas (número por unidade de volume).

29
Aqui estamos supondo implicitamente que a pressão não é relativı́stica, de modo que a densidade
de energia total é dada apenas pela densidade de massa de repouso. É possı́vel estender esse tratamento
considerando fluidos relativı́sticos, ou mesmo misturas de fluidos, como veremos nas próximas seções.
Nesse caso a (2.6) deixa de ser válida.
85
Nos cursos de termodinâmica vemos que, se não há produção de entropia, a con-
servação de energia leva a
dE = −pdV,
onde E é a energia (interna) contida num volume V (E = εV ) e p é a pressão. Um
volume que acompanha a expansão do Universo terá as suas dimensões proporcionais
ao fator de escala a (como no exemplo acima para matéria não-relativı́stica), ou seja,
ao longo da expansão, seu volume será proporcional a a3 . Nesse caso, a equação acima
leva a
a3 dε + 3εa2 da = −3pa2 da.
Se as partı́culas não são criadas nem destruı́das, o seu número total (nV ) não mudará
com a expansão, desse modo, temos a3 dn = −3a2 nda. Combinando essa expressão
com a equação acima e utilizando a (2.9), obtemos
da
d% + 3 (% + p) = 0. (2.10)
a
Essa é a equação da conservação da energia (veja a seção 3.49), quando levamos em
conta a contribuição da energia interna (através da pressão) para a densidade de
energia total. Podemos expressar a equação (2.10) em função da densidade de massa
(total, e não apenas de repouso) ρ = %c2 . Assim, teremos
p da
dρ + 3 ρ + 2 = 0. (2.11)
c a
Esse resultado é idêntico ao encontrado quando aplicamos a relatividade geral a um
Universo homogêneo e isotrópico, mesmo se há a criação de partı́culas.
Para processos adiabáticos e sem criação de partı́culas, a pressão é apenas uma função
da densidade30 , p = p (ρ). Nesse caso, podemos utilizar essa equação de estado na
equação (2.11) para obter ρ (a) . Substituido esse resultado na equação de Friedmann
(2.5), podemos obter a dinâmica do Universo.
Como estamos tratando o caso de um universo homogêneo, as variações na equação

(2.11) são em relação ao tempo, assim, é conveniente escrever
dρ ȧ p
+3 ρ+ 2 =0 (2.12)
dt a c
Soluções da equação de conservação da energia Vamos agora discutir alguns

casos simples em que a equação (2.11) possui uma solução analı́tica. O caso de um
fluido não relativı́stico (p/c2 ρ) foi discutido na seção 2.3.1. Podemos verificar, a
partir da equação (2.11) e desprezando p, que o resultado ρ ∝ a3 é reobtido (eq. 2.6).
Um caso muito importante do ponto de vista cosmológico é dado por um gás de fótons,
ou seja, radiação eletromagnética. Nesse caso, sabemos dos cursos de eletromagnetismo
que p = ρc2 /3. Desse modo, a solução da (2.11) fica
ρ ∝ a−4 .
Mais adiante, veremos que esse resultado possui uma interpretação fı́sica simples. O
resultado acima ainda é válido no caso de um gás relativı́stico de partı́culas com massa,
30
Esse tipo de equação de estado é conhecido como barotrópico.
86
para o qual p ' ρc2 /3. Assim, quando a temperatura é muito alta e a energia cinética
das partı́culas é muito maior do que a energia de repouso, o gás se comporta como
radiação. Isso ocorreu, por exemplo, em uma época primordial da história do Universo.
Outro exemplo de interesse cosmológico é a equação de estado do vácuo p = −ρ, para
a qual obtemos ρ = const. De modo geral, uma equação de estado do tipo p = wρc2
possui solução analı́tica simples (ρ ∝ a−3(1+w) ).
Outras equações de estado menos simples, como p ∝ ρα ainda admitem uma
solução analı́tica para a equação (2.11). Nos casos em que ela não pode ser resolvida
analı́ticamente, basta resolver a equação diferencial, ou converter a solução em uma
integral.
Aceleração cósmica Combinando as equações (2.5) e (2.11) é fácil obter a acel-

eração do universo
d2 a 4πG p
=− ρ+3 2 . (2.13)
dt2 3 c
Essa expressão será útil para compreender o conceito de energia escura e também para
obter as equações de perturbação para estudar a formação de estruturas (seção 2.5.1)
2.4 O Universo Homogêneo II

Se o universo está se expandindo, isto significa que ele foi mais denso, e portanto
quente, no passado. Pela teoria de Einstein da gravitação, e com um conteúdo de
matéria clássico, teria havido uma singularidade primordial, com a densidade e tem-
peratura tornando-se infinitas à medida que nos aproximamos desse “instante inicial”,
também chamado de Big-Bang. Com singularidade ou não, o fato é que o universo
passou por fases extremamente quentes e densas no passado. Nesse perı́odo ocorreu
uma série processos fı́sicos que deixaram rastros observáveis. O modelo do Big-Bang
quente foi introduzido por Gamow no final da década de 1940. Em seu artigo com
Alpher (e Bethe), Gamow previu a nucleossı́ntese primordial e a radiação cósmica de
fundo.
Vamos discutir agora alguns processos fı́sicos que ocorreram durante a história do
universo. Nos limitaremos àqueles cujos mecanismos são melhor conhecidos e cujos
rastros foram observados 31 .
2.4.1 Uma Breve História Térmica do Universo

Uma conseqüência importante das altas densidades do passado é que as taxas das
reações eram muito maiores no universo primitivo. Por exemplo, quando a temperatura
do universo era maior do que alguns32 MeV (∼ 1010 K), a taxa do processo e− +νe ←→
e− + νe era maior do que a taxa de expansão. Dessa forma, antes que o universo
pudesse duplicar de tamanho, um neutrino era espalhado muitas vezes pelos elétrons.
Essas colisões faziam com que os neutrinos estivessem em equilı́brio com o resto do
plasma cósmico. Esse é apenas um exemplo de um fenômeno que ocorre com todas as
espécies que compõem o universo: se uma partı́cula é espalhada com uma taxa maior
31
ALguns dos pontos discutidos aqui serão ampliados no Capı́tulo 8.
32
Veja o glossário (seção 2.10), para a definição das escalas de energia e temperatura.
87
que a expansão cósmica, então essa partı́cula fica em equilı́brio. Quando a densidade
diminui, a taxa de espalhamento é reduzida. Se ela for menor que a taxa de expansão,
a partı́cula perde contato com o resto do plasma cósmico. Muitas partı́culas passaram
por esse processo, conhecido por desacoplamento, no universo primitivo.
Hadronização
Quando a temperatura era por volta de 1GeV (∼ 1013 K), a matéria bariônica estava
sob a forma de um plasma de quarks e glúons. Quando ela baixou para uns 200 MeV
(∼ 2 × 1012 K), por volta de 10−4 s após o Big-Bang, houve a hadronização e foram
criados os bárions (e anti-bárions) e os mésons.
Aniquilação próton-anti-próton
Logo após a hadronização, bárions e anti-bárions começaram a se aniquilar. Como

havia uma assimetria de uma parte em dez bilhões de bárions sobre anti-bárions
((nb − nb̄ ) /nb ' 10−10 ), estes teriam se aniquilado totalmente, deixando uma fração de
10−10 dos bárions. Como a aniquilação produz fótons, isso elevou a razão fóton/próton
para 1010 .
Alquimia Cósmica: Nucleosı́ntese primordial
Quando a temperatura caiu para uns 10 MeV (∼ 1011 K) a taxa da reação p + e− ←→

n + νe tornou-se menor do que a taxa de expansão. A razão entre prótons e nêutrons
ficou constante depois que essa reação cessou. A maioria dos nêutrons acabou formando
átomos de hélio, alguns decaı́ram em prótons e uma pequena fração foi para outros
elementos leves. Dessa forma, a razão nêutron/próton naquela época determina a
razão hélio/hidrogênio hoje, assim como a abundância dos outros elementos leves. A
nucleossı́ntese primordial ocorreu de 0.01 a 100 segundos após o Big-Bang (de T ∼ 10
MeV a 0.1 MeV).
Desacoplamento dos neutrinos e aniquilação elétron-pósitron
Como foi mencionado anteriormente, quando a temperatura ficou abaixo de 1 MeV

(∼ 1010 K), os neutrinos perderam o contato com o resto do plasma.
Depois que os neutrinos se desacoplaram, os fótons continuaram acoplados aos elétrons
e pósitrons, que tinham todos a mesma abundância a temperaturas da ordem do
MeV. Quando a temperatura ficou abaixo da massa do elétron (0.511 MeV), elétrons
e pósitrons se aniquilaram em fótons. Do mesmo modo que ocorreu com os prótons,
sobrou apenas um elétron para cada dez bilhões de fótons.
Recombinação
A interação dos fótons com a matéria se dá principalmente através do espalhamento

Compton pelos elétrons. A taxa de espalhamento γ + e− ←→ γ + e− , ficou menor do
que a taxa de expansão quando a temperatura ficou próximo de 0.26 eV (uns 3.000
K), o que ocorreu em torno de 300.000 anos após o Big-Bang. Depois disso os fótons se
88
Evento T (Kelvin) t (segundos)
Tempo de Plack — inı́cio da era clássica (?) 1032 10−43
Transição de fase GUT — báriogênese (?) 1029 10−37
Hadronização — aniquilação p − p̄ 1012 10−4
Nucleossı́ntese — formação de He, D, Li 1011 − 109 10−2 − 102
Igualdade matéria–radiação 104 1012
Recombinação — desacoplamento dos γ 103 1013
Primeiras estrelas e galáxias — H2 é formado 102 1015
Aglomerados de galáxias, QSOs 10 1017
Agora 3 4 × 1017
Tabela 2.1: Algumas etapas importantes na evolução cósmica. As transições com ponto
de interrogação se referem a fases para as quais não há evidências observacionais ou cujos
mecanismos fı́sicos ainda são desconhecidos. A última coluna denota o tempo transcorrido
desde a extrapolação para um “instante inicial” até a referida etapa.
desacoplaram da matéria, mantendo o seu espectro térmico. Após o desacoplamento

a maioria desses fótons se propagou livremente sem interagir com outras partı́culas.
Por volta da mesma época do desacoplamento matéria-radiação, foram formados os

primeiros átomos, num processo chamado de recombinação. Dessa forma o universo
deixou de ser um plasma e passou a ser transparente à radiação.
Formação de estruturas
Como veremos mais a diante, o crescimento substancial das pequenas flutuações pri-
mordiais ocorreu quando o universo passou a ser dominado pela matéria. A matéria
escura começou a se aglomerar por causa da atração gravitacional. Regiões ligeira-
mente mais densas do que a média (tipicamente um milésimo mais densas, na época
do desacoplamento) acabaram gerando grandes concentrações de matéria criando uma
estrutura rica e variada.
O conteúdo do Universo em qualquer tempo é determinado pela sua temperatura e

densidade. Nos primórdios ele era dominado por espécies exóticas de partı́culas, mas
depois de alguns minutos após o Big-Bang, há uma mistura de bárions é fótons a
temperaturas de bilhões de graus. As temperaturas são tão elevadas que a matéria
bariónica é ionizada, até que, depois de uns 300.000 anos ocorre a “recombinação”33
depois da qual a matéria no universo é praticamente neutra.
Há ainda outras transições de fase que o universo pode ter sofrido, mas que ainda são
mais incertas: transição eletrofraca, transição da grande unificação, quebra da super
simetria, inflação, etc.
33
Esse nome não é muito apropriado no sentido que o Universo fica neutro pela primeira vez na sua
história. Pode-se falar alternativamente na “época do desacoplamento”, embora as duas coisas não sejam
exatamente a mesma...
89
2.5 O Universo Perturbado
As observações da radiação cósmica de fundo e da distribuição de galáxias mostram
que o Universo é homogêneo e isotrópico em grandes escalas (da ordem de Gpc). Entre-
tanto, ele se mostra heterogêneo em escalas menores, exibindo um padrão complexo
de grandes estruturas filamentares, regiões vazias e superaglomerados (veja a seção
2.2.4), com dimensões tı́picas da ordem de 10 - 100 Mpc. Nessas escalas, as flutuações
na densidade média de matéria são relativamente pequenas ((ρ − ρ̄)/ρ̄ ' 1). Diz-se
que elas estão no regime linear, pois podem ser tratadas como pequenas perturbações
sobre um fundo homogêneo. Em escalas ainda menores, correspondendo às galáxias
e aglomerados, as flutuações são não lineares ((ρ − ρ̄)/ρ̄ 1). Entender a complexa
distribuição de matéria no Universo nas diversas escalas é um dos grandes desafios da
cosmologia moderna.
O estudo do problema de formação de estruturas em cosmologia, utilizando uma teoria
relativista da gravitação, foi inaugurado em 1946, pelo artigo pioneiro de Lifshitz [75].
Neste trabalho foi mostrado como se comportam as perturbações na densidade em
um modelo cosmológico isotrópico e homogêneo, no regime linear (veja seção 2.5.1).
Desde aquela época, a área de formação de estruturas no universo tem sido uma das
mais ativas da cosmologia e da astrofı́sica, tanto em seus aspectos teóricos quanto
observacionais.
Os modelos atuais levam em conta o processo de geração das flutuações e a evolução dos
modos perturbados ao longo das diferentes fases da evolução do Universo. Processos
não lineares também têm sido abundantemente estudados, o que permite compreender
a formacão de estruturas até as dimensões dos aglomerados de galáxias. No que se ref-
ere à formação de galáxias, aglomerados e super-aglomerados, não é possı́vel limitar-se
a uma aproximação linear de modo que outra abordagem é necessária. O desenvolvi-
mento recente de simulações numéricas de N-corpos levou a uma verdadeira revolução
na área, permitindo modelar detalhadamente a evolução não linear das estruturas.
Tais simulações chegam a envolver sistemas com 1010 partı́culas que se movem sob a
ação de sua própria gravidade num Universo em expansão (veja a seção 2.5.2).
Como se não bastassem os avanços teóricos, computacionais e observacionais men-
cionados acima, o estudo das estruturas em grandes escalas tem tido um interesse
renovado como meio de estudar a energia escura, uma componente de matéria-energia
que responderia por cerca de 80% da densidade cosmológica. A compreensão da ener-
gia escura envolve necessariamente modificações na fı́sica fundamental, seja na teoria
da gravitação ou no domı́nio das partı́culas elementares e campos. Projetos como o
DES (veja a seção 2.2.4) visam estudar a estrutura em grande escala como meio de
aprender sobre o comportamento da energia escura.
Desse modo, a estrutura em grandes escalas no Universo é hoje um dos instrumentos
mais importantes para a cosmologia. A combinação entre teoria e observação permite
a discriminação de modelos fı́sicos (matéria e energia escuras, massa dos neutrinos,
flutuações primordiais, etc.) e a determinação dos parâmetros cosmológicos.
Na próxima seção, retomaremos formulação da cosmologia newtoniana em coorde-

nadas co-móveis desenvolvida na seção (2.3.1), obtendo as equações para a evolução
das perturbações no inverso. Em última instância, a justificativa para esse tratamento
vem do limite newtoniano da relatividade geral, que fornece as mesmas equações a
serem deduzidas nesta seção.
90
A cosmologia newtoniana é de fundamental importância para estudar a formação de
estruturas. No regime não-linear, apenas um tratamento newtoniano é factı́vel, por-
tanto quase todas as simulações computacionais (veja a seção 2.5.2) e aproximações
analı́ticas são feitas com base na cosmologia newtoniana. Além disso, o limite newto-
niano é uma ótima aproximação para a dinâmica das estruturas em grandes escalas
dentro do raio de Hubble, DH := c/H0 = h−1 3000 M pc. Para pequenas flutuações
é possı́vel fazer um tratamento relativı́stico, mas a análise newtoniana é muito mais
simples e ajudará a compreender fisicamente o inı́cio da formação das estruturas.
2.5.1 O Crescimento Linear das Estruturas (Newtoniano)

Nesta seção introduziremos as equações de fluido da cosmologia newtoniana e estu-
daremos o seu comportamento para pequenas flutuações de um universo homogêneo.
Mostraremos como funciona o mecanismo de crescimento das estruturas no regime
linear, introduziremos o comprimento de Jeans e veremos como surgem as oscilações
acústicas num fluido com colisões. Também discutiremos como aparecem os modos
adiabáticos crescentes e decrescentes e mostraremos a importância da matéria escura
para a formação de estruturas.
É importante destacar que as equações deste capı́tulo só serão válidas para flutuações
com dimensões menores que o raio de Hubble. Além disso, só poderemos estudar as
perturbações na componente não relativı́stica, na era dominada pela matéria. Com
essas restrições, os resultados newtonianos são idênticos aos da teoria de perturbação
relativı́stica34 .
Em um meio não uniforme, a distribuição de massa pode ser escrita como:35
ρ(~x, η) = ρ̄(η) + δρ(~x, η),

R
onde ρ̄ é a densidade média: ρ̄ = (1/V ) V ρ(~x, η)d3 x, se V é um volume “representa-
tivo” do universo.
Vamos partir da equação de Newton
d2~r ~r − ~r0 3 0
Z
= ~g = −G ρ d r,
dt2 |~r − ~r0 |3
e transformá-la para coordenadas co-móveis e tempo conforme. Utilizando as (2.2-2.4),

obtemos36
d2~r 1 d2~x

1 d ȧ ȧ d~x
2
= 2
+ ~x + 2 .
dt a dη a dη a a dη
Assim, a equação de movimento fica
34
Ainda é possı́vel estudar alguns aspectos das perturbações na componente relativı́stica com equações
muito semelhantes às newtonianas. Basta fazer uma pequena modificação nessas equações para incluir os
efeitos inerciais e gravitacionais da pressão (veja, por exemplo, as refs. [74, 76]).
35
Aqui é necessário fazer a hipótese de que o universo seja homogêneo – em média – a partir de uma
certa escala (senão a integral não converge e ρ̄ não é bem definido). Esse tratamento não seria válido num
universo com estrutura fractal ilimitada, mas é perfeitamente aplicável se a distribuição de matéria é
aproximadamente fractal até uma dada escala. A hipótese da existência de uma escala de homogeneidade
é corroborada do ponto de vista observacional e constitui uma das bases do modelo padrão da cosmologia.
36
Nesta seção utilizaremos a notação ˙ ≡ ∂/∂η.
91
d2~x ~x − ~x0 3 0
Z
d ȧ ȧ d~x 2
+ ~x + = −Ga (ρ̄(η) + δρ(~x, η)) d x.
dη 2 dη a a dη |~x − ~x0 |3
Agora podemos eliminar os termos que aparecem num universo homogêneo da seguinte
forma. O primeiro termo do lado direito é o campo gerado por uma distribuição
uniforme de matéria (multiplicado por a). Se supomos que o universo é (em média)
esfericamente simétrico a grandes distâncias, esse termo dá −(4π/3)Ga2 ρ̄ ~x. É aqui que
as condições de contorno no infinito são usadas explicitamente. Agora podemos utilizar
a equação (2.13), escrita em termos de η (o notando que estamos nos restringindo ao
caso não relativı́stico), para eliminar os termos proporcionais a ~x. Desse modo, a
equação de movimento fica37
d2~x ȧ d~x (~x − ~x0 ) 3 0

Z
−Ga 2 0 ~
+ = δρ(~
x , η) 3 d x = −∇x φ̃ , (2.14)
dη 2 a dη 0
|~x − ~x |
onde
δρ(~x0 , η) 3 0
Z
2
φ̃(~x, η) := −Ga d x. (2.15)
|~x − ~x0 |
Note que φ̃ é uma quantidade própria: a2 d3 x0 /|~x − ~x0 | ∼ d3 r/|~r − ~r0 |.
R
Como V δρ d3 x → 0 em grandes escalas, φ̃ é finito e bem definido (exceto sobre mas-
sas pontuais, que ignoramos ao tratar o campo de densidade como contı́nuo). Não há
mais ambigüidade na equação de movimento para ~x(η). O campo φ̃ não varia muito
com a origem do sistema de coordenadas, já que a contribuição da distribuição de
matéria distante é pequena; o que resolve mais um paradoxo da cosmologia newto-
niana. Concluı́mos que φ̃, chamado de potencial gravitacional peculiar, é o potencial
apropriado para a cosmologia newtoniana, desde que trabalhemos em coordenadas
co-móveis. Esse tratamento é válido mesmo em regiões altamente heterogêneas, já que
em nenhum momento foi preciso supor que δρ ρ̄. O procedimento efetuado nesta
seção serve apenas para eliminar o problema das condições de contorno no infinito.
Em resumo, as equações de movimento ficam:
d2~x ȧ d~x ~ x φ̃ ,
+ = −∇ ∇2x φ̃ = 4πGa2 δρ(xi , η) (2.16)
dη 2 a dη
As mesmas equações saem do limite de campos fracos (|φ| c2 ) e baixas velocidades
(v 2 c2 ) da relatividade geral para um espaço-tempo de Robertson-Walker per-
turbado. Localmente, a descrição da relatividade geral num universo de Friedmann-
Lemaı̂tre perturbado é equivalente à cosmologia newtoniana, com a condição de fron-
teira de que a distribuição de massa é homogênea e isotrópica no infinito. O trata-
mento da cosmologia newtoniana requer que o espaço seja euclidiano, o que é uma
ótima aproximação; exceto próximo a objetos compactos (como buracos negros), e
eventualmente, em escalas da ordem da distância de Hubble c/H0 .
Observação: Há vários modos de se eliminar a indeterminação em ∂φ2 /∂ri ∂rj , que
foi discutida no inı́cio desta seção. Um método consiste no exame preliminar de um
37
Se ρ̄ inclui matéria relativı́stica, tanto o campo gravitacional como o comportamento de a(η) mudam.
Os termos homogêneos também se cancelam nesse caso, mas a sua justificativa requer a relatividade geral.
92
corpo finito, seguido da transição para um corpo infinito. Foi esse o caminho aqui
adotado, aplicado a uma distribuição de matéria esférica. O mesmo procedimento
pode, por exemplo, ser extendido a um elipsóide homogêneo. Ao investigar o caso de
um elipsóide finito, vemos que é possı́vel acrescentar infinitas camadas sem alterar
a sua evolução temporal, nem o campo gravitacional em seu interior. Assim pode-
mos produzir um universo infinito com as propriedades das condições de fronteira
do elipsóide. O resultado seria portanto diferente do obtido nesta seção, que está em
acordo com os dados observacionais e com o limite newtoniano de um universo de
Friedmann-Lamaı̂tre perturbado. Dessa forma, vemos que não é possı́vel introduzir
uma cosmologia puramente newtoniana de forma unı́voca.
Uma outra forma de se obter a cosmologia newtoniana é estudar o desvio geodésico
num universo homogêneo, através da formulação da gravitação newtoniana na lin-
guagem do espaço curvo [64, 65]. No entanto, essa abordagem é muito mais compli-
cada, pois utiliza o aparato matemático da geometria diferencial. Além disso ela não
leva imediatamente às equações newtonianas para um universo heterogêneo.
Equações Cosmológicas de Fluidos
Um fluido é um conjunto de partı́culas tratado como um contı́nuo. Em cosmologia

lidamos com dois tipos de fluido: se as colisões entre as partı́culas são suficientemente
rápidas para estabelecer um equilı́brio térmico local (ou seja uma distribuição de
velocidades de Maxwell-Boltzmann), o fluido é um gás. Se não há colisões, temos um
gás de matéria escura. As equações de fluido discutidas nesta seção aplicam-se a gases
com colisões ou à matéria escura38 . Vamos lidar com um gás não relativı́stico e ignorar
forças elétricas e magnéticas.
As equações de fluido vêm das leis de conservação da massa e do momentum e das
equações de estado. A conservação da massa é representada pela equação de con-
tinuidade. Nas coordenadas (~r, t) ela é dada por
∂ρ ~ d~r
+ ∇ · (ρ~v) = 0 , ~v = . (2.17)
∂t dt
Como na seção anterior, reescrevemos a densidade e a velocidade fatorando o compor-
tamento médio:
ρ = ρ̄(1 + δ) , (2.18)
~v = d~
r
dt
= H~r + ~v (2.19)
onde δ = δρ/ρ̄ e ~v = d~x/dη é a velocidade peculiar. Transformando a equação de
continuidade (2.17) para coordenadas co-móveis e tempo conforme (eqs. 2.2 e 2.3)39 ,
obtemos
∂δ ~
+ ∇x · [(1 + δ)~v ] = 0 . (2.20)
∂η
A conservação do momentum é representada pela equação de Euler
d~v ~ − 1 ∇p
~ .
= −∇Φ (2.21)
dt ρ
38
A descrição de fluido é válida antes do cruzamento das trajetórias das partı́culas da matéria escura.
Quando as trajetórias se interceptam, a descrição de contı́nuo deixa de valer. Isso ocorre tipicamente na
formação de objetos gravitacionalmente ligados, onde as trajetórias seguem órbitas caóticas. No regime
linear, a matéria escura pode ser descrita como um fluido com p = 0.
x ~ ~ 1 ~
39
Note que ∂t ∂
= ∂η ∂ ∂~
∂t ∂η + ∂t · ∇x e ∇r = a2 ∇x .
93
Escrevendo essa equação em coordenadas co-móveis e notando que d/dt = (1/a)d/dη,
obtemos
d~v d ~x d ȧ ȧ 1 d~v
= (H~r + ~v ) = + ~v 2 + .
dt dt a dη a a a dη
Como vimos na seção 2.3.1, o campo gravitacional é
~ r Φ = − 4πG ρ̄ a~x − 1 ∇
~g = −∇ ~ x Φ̃. (2.22)
3 a
Ao substituirmos estes resultados na (2.21) notamos que os termos proporcionais a ~x
se cancelam (pela 2.13). Assim, obtemos finalmente:
d~v ȧ ~ − 1 ∇p
~ ,
+ ~v = −∇Φ (2.23)
dη a ρ
com as derivadas sendo calculadas no sistema co-móvel, e Φ representando o potencial
peculiar (a partir de agora não colocaremos mais o til, nem o sı́mbolo x na derivada).
Para fechar as equações de fluido ainda é necessária uma equação de evolução para
a pressão, ou para outra variável termodinâmica, como por exemplo a entropia. Para
um gás com colisões temos uma equação de estado p = p(ρ, S) onde S é a entropia
especı́fica (i.e. entropia por unidade de massa). Num um gás monoatômico ideal não-
relativı́stico, em processos reversı́veis temos,

3p 1
T dS = d + pd . (2.24)
2ρ ρ
Os principais efeitos da pressão do gás podem ser extraı́dos da teoria de perturbação

linear. Nela linearizamos as equações de fluido em torno da solução uniforme. Essa
técnica é útil para analisar a instabilidade gravitacional e outras instabilidades. As
equações de fluido linearizadas proporcionam uma descrição razoável das flutuações
na matéria (escura e luminosa) de pequena amplitude e grande escala, mesmo se as
estruturas não são lineares em escalas menores. Essa é uma suposição usual na teoria
das estruturas em grandes escalas. Ela é sustentada razoavelmente pelas simulações
numéricas.
Consideraremos que δ e ~v são pequenos (O(ε) ) e desprezaremos termos de segunda
ordem (O(ε2 ) ). Linearizando as equações de continuidade e de Euler temos
~ · ~v ≈ 0 , ∂~v ȧ ~ − 1 ∇p
~
δ̇ + ∇ + ~v ≈ −∇Φ (2.25)
∂η a ρ̄
A pressão pode ser obtida da equação de estado p = p(ρ, S). Para um gás monoatômico
ideal não-relativı́stico, utilizando a (2.24), obtemos
1~ ~ + 2 T ∇S
~ , ∂p 5p
∇p = c2s ∇δ c2s := = . (2.26)
ρ 3 ∂ρ 3ρ
Como estamos lidando com pequenas perturbações de um universo homogêneo,
podemos escrever a temperatura e a entropia como: T (~x, η) = T̄ (η) + δT (~x, η) e
S(~x, η) = S̄(η) + δS(~x, η). O lado direito da (2.26) fica, em 1a ordem: (2/3)T̄ ∇2 (δS).
De modo geral, é suficiente manter apenas termos de primeira ordem na equação
(2.26). Assim, podemos utilizar c2s = (5/3)(p̄/ρ̄) nessa equação e manter apenas a
desidade homogênea ρ̄ no lado esquerdo da equação.
94
Há cinco variáveis do fluido (ρ, S e três componentes de ~v ), e portanto há cinco modos
linearmente independentes40 . A perturbação linear geral é uma combinação desses mo-
dos. Do ponto de vista cosmológico, apenas o modo irrotacional e sem perturbação na
entropia tem interesse prático (veja, por exemplo, a ref. [74]). Portanto, discutiremos
em mais detalhes apenas esse modo, que no regime linear corresponde às flutuações
de densidade.
Flutuações Isentrópicas e o Critério de Jeans
Vamos estudar primeiramente o comportamento de flutuações isentrópicas, para as

quais não há gradientes de entropia entre elementos vizinhos. Esse tipo de perturbação
seria o produto natural das flutuações quânticas durante a inflação seguida pelo reaque-
cimento [56] (veja a Seção 9.7). As interações rápidas entre partı́culas em equilı́brio
térmico eliminariam os gradientes de entropia. Se ∇S ~ = 0, as equações linearizadas
do fluido e do campo gravitacional (2.25), (2.26) e (2.16) são
~ · ~v = 0 , ∂~v ȧ ~ − c2 ∇δ
~ ,
δ̇ + ∇ + ~v = −∇φ s ∇2 φ = 4πGρ̄a2 δ . (2.27)
∂η a
Aplicando o operador ∇~ na equação de Euler e combinando com as duas restantes,

obtemos uma equação de onda acústica forçada e amortecida para δ:
ȧ
δ̈ + δ̇ = 4πGρ̄a2 δ + c2s ∇2 δ . (2.28)
a
Exceto pelo amortecimento de Hubble (segundo termo) e pelo termo gravitacional,
essa equação é idêntica à que obterı́amos para ondas de som num meio estático.
Para eliminar o laplaciano aplicamos a transformada de Fourier na equação de onda.
A equação para o modo ~k fica:
ȧ
δ̈ + δ̇ = 4πGρ̄a2 − k 2 c2s δ ≡ kJ2 − k 2 c2s δ ,

(2.29)
a
onde definimos o numero de onda de Jeans co-móvel
1/2
4πGρ̄a2

kJ := . (2.30)
c2s
Note que a dependência de δ em ~k se dá apenas em termos de k = ~k , o que é uma

conseqüência de isotropia do espaço.
Desprezando o amortecimento de Hubble (colocando a = 1), a dependência temporal
da solução da equação (2.29) seria δ ∝ exp(±iωη), com
ω 2 = −ωJ2 + k 2 c2s , ωJ = kJ cs = (4πGρ̄)1/2 . (2.31)
onde ωJ é a freqüência de Jeans. Modos com k < kJ são instáveis (ω 2 < 0), como foi
observado por Jeans em 1902. Fisicamente, as forças de pressão não podem evitar o
colapso gravitacional quando o tempo para o som atravessar o corpo λ/cs é maior que
o tempo de queda livre (Gρ)−1/2 para uma perturbação de tamanho λ = 2πa/k.
40
De fato, temos cinco equações que governam a dinâmica desse sistema, as equações (2.25) e (2.26) e
mais uma relação termodinâmica.
95
O comprimento de Jeans (co-móvel) é definido por λJ := 2π/kJ . Para perturbações
muito maiores que esse comprimento (k kJ ) a evolução se comporta como num
fluido sem colisões, isto é, a pressão é desprezı́vel.
Incluindo o amortecimento, a instabilidade de Jeans passa a ter um comportamento
em lei de potência no tempo, em vez de exponencial, para k kJ . Em geral há uma
solução crescente e outra decrescente para δ(k, η); elas serão denotadas por δ± (k, η).
Modos crescentes e decrescentes Vamos agora considerar o efeito da expansão

do universo sobre a evolução das perturbações. Começaremos estudando o caso de
um fluido não relativı́stico sem colisões, como a matéria escura fria. Nessa situação, a
expressão (2.28) fica
ȧ
δ̈ + δ̇ = 4πGρ̄a2 δ. (2.32)
a
Essa equação também é válida num fluido com p 6= 0 para modos com k kJ .
Para resolver essa equação, precisamos conhecer ȧ/a, ou seja a evolução do “fundo”
(parte homogênea). Para uma boa parte da história da formação das estruturas, o
universo de Einstein-de Sitter (EdS) é uma boa aproximação. A partir da equação de
Friedmann (2.5), vemos que para pequenos valores do fator de escala a, o termo de
curvatura K/a2 deve ser desprezı́vel frente à densidade de energia da matéria e da
radiação (proporcionais, respectivamente, a a−3 e a−4 ). Além disso, os dados observa-
cionais mostram que esse termo não deve ser importante para a dinâmica do universo,
mesmo em tempos atuais. Dessa forma, quando as primeiras estruturas foram for-
madas o termo de curvatura era totalmente desprezı́vel. Assim que o universo passa
a ser dominado pela matéria, de modo que a (2.6) é válida, o fator de escala a é dado
pela solução de Einstein-de Sitter.
Desse modo, mesmo num universo em que Ω 6= 1 e K 6= 0, a solução de EdS (eq. 2.8),
fornece uma boa descrição da dinâmica do universo na fase em ele que é dominado pela
matéria, portanto desde antes do desacoplamento matéria-radiação (ver seção 2.4.1)
até próximo da era de expansão acelerada. Assim, o Universo de EdS é apropriado
para investigar as primeiras fases da formação de estruturas após o desacoplamento.
Num fundo EdS (Ω = 1, matéria não relativı́stica), a equação de Friedmann (2.5) fica
4πGρ̄a2 = (3/2)(ȧ2 /a2 ), cuja solução é dada por a(η) = (η/η0 )2 (eq. 2.8). Dessa forma
o termo 4πGρ̄a2 fica igual a 6/η 2 e a equação (2.32) pode ser escrita como
2 6
δ̈ + δ̇ = 2 δ .
η η
As soluções dessa equação são
δ+ ∝ η 2 ∝ a e δ− ∝ η −3 , (2.33)
que são chamados de modos crescente e decrescente, respectivamente

Para Ω 6= 1, a equação (2.32) também possui modos crescentes e decrescentes, que
podem ser calculados a partir do fator de escala a (η).
Critério de Jeans no universo em expansão Vamos ver agora o papel da pressão

na evolução das estruturas. Estudaremos um caso particular que permite obter uma
solução analı́tica simples e que ilustra o comportamento geral para c2s 6= 0.
96
Suporemos que depois de recombinação a temperatura dos bárions é da ordem da tem-
peratura dos fótons (Tγ ≈ Tgas ). Esta é uma aproximação razoável, já que a ionização
residual acopla termicamente os dois fluidos por um longo perı́odo, mesmo havendo
uma transferência de momentum desprezı́vel. Num gás de fótons ργ ∝ Tγ4 além disso
temos que ργ ∝ a−4 logo Tγ ∝ a−1 . Para um gás ideal p/ρ ∝ Tgas . Assim c2s = c20s a−1
onde c0s é constante. Num universo de Einstein-de Sitter a eq. (2.29) fica:
2 δ
δ̈ + δ̇ = 6 − k 2 c20s η02 2 .
η η
As soluções dessa equação são potências de η:

p
−1 ± 25 − 4(kc0s η0 )2
δ± (k, η) ∝ η n , n = . (2.34)
2
Note que, neste caso, c0s η0 = cs η. Em situações mais genéricas, as soluções√dependem
de η e cs η mesmo que este último não seja constante41 . Para kcs0 η0 < 6 ' 2.45,
há soluções crescentes e decrescentes. Para kcs0 η0 > 5/2 temos oscilações amortecidas
(pois n2 < 0 e Re(n) < 0). Note que o número de onda crı́tico kcr = (5/2)(1/cs0 η0 ) é
muito próximo do número de onda de Jeans kJ (2.30):
√ 1 ∼
kJ = 6 = 0.98 kcr .
cs0 η0
No limite k kJ a solução (2.34) fica igual ao resultado (2.33). As soluções

oscilatórias para k kJ são ondas sonoras. Nesse limite, a (2.34) fica δ± ∝
η −1/2 exp(±ikcs0 η0 ln(η)), o que leva, para uma onda plana, a δ± (x, η) ∝
η −1/2 exp(ik x ± ikcs0 η0 ln(η)). Para determinar a velocidade da onda, devemos cal-
cular dx/dη tal que a fase seja constante. Assim a velocidade instantânea da onda é
dada por d/dη(kcs0 η0 ln(η)/k) = cs , que coincide com a velocidade do som no meio.
Esse comportamento se repete em situações mais genéricas, obtendo-se oscilações
acústicas para k kJ . Essas oscilações suprimem o crescimento para pequenos com-
primentos de onda. No limite k kJ (grandes comprimentos de onda) o comporta-
mento fica igual ao da poeira, e δ± não depende de k (como podemos ver a partir das
eqs. 2.29 e 2.30).
Num universo estático a amplitude acústica para uma onda plana adiabática fica con-
stante. Já num universo em expansão, ela é geralmente amortecida (como no exemplo
acima). Uma exceção importante consiste nas oscilações no fluido de bárions e fótons
na era dominada pela radiação, na qual a amplitude dessas oscilações permanece con-
stante. Para mostrar isso é preciso generalizar as equações de fluido para um gás
relativı́stico, o que está fora do escopo deste livro.
Amplitude das flutuações Como a (2.29) é uma equação diferencial linear, as

duas soluções
δ+ (k, η) e δ− (k, η) são obtidas a menos de constantes multiplicativas
~
A± k . Essas constantes são determinadas pelas condições iniciais para cada k. A
determinação de δ (k, ηi ) em um dado tempo inicial ηi é um problema fundamental
41
Por exemplo, quando a velocidade do som é constante, num universo de Einstein-de Sitter, a solução
da (2.29) é [66]:δ+ (k, η) ∝ j2 (kcs η) , δ− (k, η) ∝ y2 (kcs η) , onde j2 e y2 são as funções esféricas de Bessel
(no entanto essa solução não é realista).
97
em cosmologia. Uma teoria completa da formação de estruturas deve especificar essa
função a partir de considerações fı́sicas. Por exemplo, o cenário inflacionário oferece
uma previsão para variação da amplitude com o número de onda k (ou seja, ela fornece
A(k) a menos de um valor multiplicativo global, veja a Seção 9.7). Modelos em que o
universo passa por um ricochete também podem fazer esse tipo de previsão (veja as
Seções 3.10 e 10.3.2).
Flutuações de densidade no espaço real A solução geral para δ (~x,η) é:

Z Z
~ ~
δ (~x, η) = A+ k δ+ (k, η) e d k + A− ~k δ− (k, η) eik·~x d3 k
~ i k·~
x 3
(2.35)
Se k kJ , δ− decai rapidamente, de forma que só os modos crescentes sobrevivem.

Para poeira, a evolução de δ não depende de k. Mantendo apenas os modos crescentes,
vemos que δ (~x,η) mantém a sua forma e é apenas multiplicado por δ+ (η) (que no caso
de EdS é o próprio fator de escala a(η)).
Evolução do potencial gravitacional É interessante escrever a equação de onda

linear em termos de Φ, em vez de δ. Para isso, usamos a transformada de Fourier na
equação de Poisson ∇2 Φ = 4πGa2 ρ̄δ, obtendo
4πG
Φ(~k, η) = − 2 a2 ρ̄δ(~k, η) ∝ a−1 δ . (2.36)
k
Note que, para modos crescentes num universo de Einstein-de Sitter, no regime linear,
temos Φ = const. Essa propriedade possui uma implicação muito interessante para a
energia escura. A variação do potencial gravitacional pode ser detectada na radiação
cósmica de fundo a partir do efeito Sachs-Wolfe integrado (veja a seção 2.5.1, eq. 2.43).
Portanto, se tal efeito é medido e levando em conta que Ωtot ' 1, isso é uma forte
evidência para a presença da energia escura, já que num universo composto apenas de
matéria escura ele estaria ausente, posto que φ = const.
Substituindo a expressão (2.36) na equação (2.29) e utilizando equação de Friedmann
(2.5), obtemos:
ä 1 ȧ2 3

ȧ
Φ̈ + 3 Φ̇ + − − K Φ + k 2 c2s Φ = 0. (2.37)
a a 2 a2 2
Utilizando novamente e equação de Friedmann, em conjunto com a (2.13) podemos
mostrar que ä/a − (1/2)ȧ2 /a2 = −(1/2)K. Assim a (2.37) fica
ȧ
Φ̈ + 3 Φ̇ + k 2 c2s − 2K Φ = 0 .

(2.38)
a
Quando escrita em termos do potencial gravitacional, em vez do contraste de densi-
dade, a equação de onda perde seu termo de fonte gravitacional.
As soluções da eq. (2.38) dependem do comportamento temporal da velocidade do
som, assim como da cosmologia de fundo. Para termos uma idéia, vamos considerar a
evolução do potencial num universo de Einstein-de Sitter composto de um gás ideal.
Usando a aproximação c2s = c20s a−1 a eq. (2.38) fica:
6 Φ
Φ̈ + Φ̇ + (kc0s η0 )2 2 = 0
η η
98
As soluções dessa equação são42 :
p
−5 ± 25 − 4(kc0s η0 )2
Φ± (k, η) ∝ η m , m = . (2.39)
2
Nessa solução, modos crescentes de grandes comprimentos de onda (kcs η 1) têm
potencial correspondente Φ+ = const., enquanto os modos decrescentes têm Φ− ∝
−5
R −3
η ∝ a dη. Esse comportamento se repete para qualquer equação de estado usual
num universo de Einstein-de Sitter. As perturbações na densidade e no potencial
diferem por um fator ρ̄a2 ∝ a−1 (2.36). Se K < 0 ou k 2 c2s > 0, então Φ+ decai com o
tempo, embora δ+ continue crescendo.
A importância da matéria escura A equação (2.29) pode ser generalizada para

várias componentes da matéria. Nesse caso, o termo gravitacional contém as con-
tribuições de todas as componentes e a equação fica
ȧ X
δ̈A + δ̇A + k 2 c2s δA = 4πGa2 ρ̄B δB ,
a B
onde43 δB := (ρB − ρ̄B ) /ρ̄B .

Um exemplo importante é o sistema bárions + matéria escura logo após o desacopla-
mento. Para k kJ a evolução será governada pelo sistema de equações
ȧ
δ̈M E + δ̇M E = 4πGa2 (ρ̄b δb + ρ̄M E δM E ) ' 4πGa2 ρ̄M E δM E , (2.40)
a
ȧ
δ̈b + δ̇b = 4πGa2 (ρ̄b δb + ρ̄M E δM E ) ' 4πGa2 ρ̄M E δM E . (2.41)
a
Antes do desacoplamento as flutuações na componente bariônica não evoluem, pois
ela está em forte interação com a radiação. Já as perturbações na matéria escura
podem evoluir livremente na era dominada pela matéria (η > ηeq ). Por isso, logo após
o desacoplamento, temos ρ̄M E δM E ρ̄b δb .
Como para a ∼ adesacoplamento 1, temos a ' aEdS ∝ η 2 , o modo crescente será dado
por δ+ (η) ' a (η) e a solução da equação (2.40) será
δM E = Ca,
onde c é uma constante. Substituindo essa relação na (2.41) e usando que, em EdS
4πGa2 ρ̄ = 6/η 2 , temos
ȧ
δ̈b + δ̇b = 6C.
a
A solução do modo crescente dessa equação é

b
δb = C (a (η) − b) = δM E 1 − , (2.42)
a (η)
onde b é uma constante. Essa solução mostra que δb → δM E para a (η) b, mesmo se
δb ' 0 para algum a (ηi ) = b, que pode ocorrer, digamos, para ηi = ηdesacoplamento .
42
Esse resultadoP
poderia ser P
obtido substituindo a (2.34) na (2.36).
43
De modo que B ρ̄B δB = B (ρB − ρ̄B ) = ρtot − ρ̄tot = ρ̄tot δtot .
99
Esse importante resultado mostra que as perturbações na matéria bariônica são in-
duzidas pelas flutuações da matéria escura após o desacoplamento. Isso mostra que a
matéria escura é a principal responsável pela formação das primeiras estruturas em
grande escala. Sem a matéria escura, as flutuações seriam muito menores e não teria
havido tempo de produzir as estruturas em grande escala que são observadas.
Flutuações na Radiação Cósmica de Fundo
Nas seções precedentes, estudamos o comportamento de pequenas perturbações de um

universo homogêneo. Há duas formas de observar essas flutuações: nas estruturas em
grandes escalas, onde as concentrações de matéria ainda são lineares e na radiação
cósmica de fundo. Nesse último caso, é preciso transformar as flutuações na densidade
nas anisotropias de temperatura que são observadas.
A distribuição dos fótons da radiação cósmica de fundo (RCF) é dada por uma dis-
tribuição de corpo negro com altı́ssimo grau de precisão44

E p
f (~x, p~, η) = fPlanck = fPlanck ,
kT kT0 (1 + ∆)
onde T0 = 2.725K é a temperatura média da RCF [52] e ∆ (~n, η) = δT /T0 é a flutuação

de temperatura para fótons vindos da direção ~n. A densidade no espaço de fase é dada
por um corpo negro, mas a temperatura depende da direção de chegada do fóton (ou
seja, da direção no céu), como resultado das variações intrı́nsecas da temperatura de
emissão e de processos gravitacionais e de espalhamento sofridos no caminho até o
detector.
O campo ∆ é definido em todos os pontos ~x, mas só podemos observá-lo aqui (~x0 ) e
agora (η0 ). A única coisa com que podemos trabalhar é a variação da temperatura em
função da direção ~n. Desse modo, toda a riqueza que observamos vem das mudanças
de temperatura em função de ~n.
A radiação cósmica de fundo parece vir de uma fina camada chamada fotosfera, como
ocorre com a radiação vinda da superfı́cie do Sol. A fotosfera pode ser aproximada
por uma camada infinitamente fina, supondo que a recombinação é instantânea. Nessa
aproximação a fração de elétrons livres, e portanto a opacidade, caem abruptamente
em ηrec , o tempo conforme na época da recombinação (z ≈ 1100):

∞ χ > χrec = η0 − ηrec ,
ηC =
0 0, χ < χrec .
Com essa aproximação, a flutuação de temperatura é dada por

Z χrec
1 ∂Φ
∆ (~n, η0 ) = δγ + Φ + vr +2 dχ , (2.43)
4 rec 0 ∂η
onde vr := ~ve · ~n é a componente radial da velocidade. Esse resultado foi obtido

primeiramente por Sachs e Wolfe [58].
A radiação cósmica de fundo é causada pelos desvios em relação ao equilı́brio
hidrostático. Pode-se mostrar que, se o gás de fótons estivesse em equilı́brio
44
De fato, a radiação cósmica de fundo oferece o melhor espectro de corpo negro já observado.
100
hidrostático, terı́amos δγ /4 + Φ = 0 (e obviamente ve = 0) de modo que não have-
ria anisotropias primárias na RCF. As flutuações seriam dadas apenas pela variação
ocorrida na trajetória da luz, que é o chamado efeito Sachs-Wolfe integrado e é dado
pelo último termo na expressão (2.43).
Sachs e Wolfe [58] mostraram que, para perturbações adiabáticas na era dominada
pela matéria, em escalas maiores que o horizonte acústico, as contribuições intrı́nseca
e gravitacional dominam. A soma desses fatores (os dois primeiros termos da expressão
2.43) é Φ/3. Dessa forma, em escalas maiores do que 1◦ (que equivale aproximadamente
o tamanho do horizonte acústico) as anisotropias na radiação cósmica de fundo são
uma medida direta do potencial gravitacional na fotosfera, na recombinação.
O fator Φ/3 pode ser compreendido com a combinação do desvio para o vermelho
causado pelo campo gravitacional e uma dilatação temporal. Para sair do poço de
potencial o fóton perde energia, de modo que
∆1 = Φ.
Além disso, como o potencial produz uma dilatação temporal, quando vemos o fóton
ele viajou um caminho maior e veio portanto de uma época mais quente. A variação
temporal é dada por δt/t = Φ. Utilizando que a ∝ t2/3 e que T ∝ a−1 obtemos
2
∆2 = − Φ.
3
A combinação desses dois efeitos dá
Φ δk
∆SW = ∝ 2,
3 k
que é o chamado efeito Sachs-Wolfe. Na última relação, utilizamos a equação (2.36).
Desse modo, as flutuações na temperatura se relacionam diretamente com as per-
turbações na densidade.
Em escalas angulares menores que 1o predomina o efeito Doppler. Nessas regiões
menores do que o horizonte acústico, ocorrem as oscilações acústicas discutidas na
seção 2.5.1. Essas oscilações dão origem aos picos no espectro da radiação cósmica
de fundo que foram detectados no ano 2000 por dois experimentos em balões es-
tratosféricos [36, 37] e medidos com grande precisão pela sonda WMAP em 2003.
O espectro da radiação cósmica de fundo
O espectro de potência angular fornece a amplitude quadrática média da radiação

cósmica de fundo por componente de esférico harmônico. Expande-se a anisotropia da
temperatura em esféricos harmônicos
X
∆ (~n) = alm Ylm (~n) .
l,m
Os dados observacionais proporcionam valores bem definidos de alm . No entanto, só é

possı́vel predizer teoricamente a distribuição de probabilidade de alm . Para flutuações
estatisticamente isotrópicas (que não possuem nenhuma direção privilegiada a priori),
os alm são variáveis estocásticas, cuja covariância é dada por
halm a∗l0 m0 i = Cl δll0 δmm0 , (2.44)
101
ou seja, eles não são correlacionados. A variância de cada harmônico é dada pelo es-
pectro de potência angular Cl . A simetria rotacional faz com que ele seja independente
de m.
O espectro de potência da RCF pode ser calculado a partir da estatı́stica das flutuações
primordiais e da evolução temporal dessas flutuações. Pode-se mostrar que [57]:
Z
Cl = 4π d3 kPΦ (k) Dl2 (k) , (2.45)
onde PΦ (k) é o espectro das flutuações primordiais no potencial gravitacional45 . A

função de transferência Dl está relacionada à evolução das perturbações até o de-
sacoplamento.
No limite de grandes escalas angulares a função de transferência é dada por Dl =

jl [k (η0 − ηrec )] /3 [57]. Nesse caso a (2.45) pode ser calculada analiticamente para
PΦ ∝ k n−4 . Quando n = 1 o resultado é l (l + 1) Cl = const. Os resultados obtidos
pelas sondas COBE (que varreu escalas angulares equivalentes a 2 ≤ l ≤ 34) e WMAP
(2 ≤ l ≤ 500 no primeiro ano de dados) são consistentes com n = 1, o que é predito pelo
modelo inflacionário para flutuações quânticas primordiais. Vemos que as variações na
temperatura da radiação cósmica de fundo permitem sondar o espectro primordial das
flutuações.
Para pequenas escalas angulares, o espectro l (l + 1) Cl , apresenta uma série de pi-

cos. Esses picos são devidos às oscilações acústicas, que modificam o potencial Φ e a
velocidade vr na recombinação.
O primeiro pico no espectro da RCF está associado ao comprimento de Jeans. A

posição angular desse primeiro pico depende do tamanho aparente de λJ . A curvatura
do universo afeta diretamente os tamanhos angulares, de modo que a determinação
de sua posição coloca limites muito fortes sobre K e portanto sobre Ωtot . Segundo
o modelo inflacionário, que prevê curvatura nula, esse pico estaria em l ≈ 200. O
experimento de Balão MAXIMA [37], explorou escalas angulares equivalentes a 36 ≤
l ≤ 785 e, juntamente com o BOOMERGANG [36], detectou o primeiro pico na
posição esperada para um universo chato. Como a instabilidade de Jeans só ocorre
na matéria bariônica, a determinação dos picos no espectro da RCF também permite
calcular a Ωb (na verdade Ωb H02 ). Esse parâmetro está associado à diferença de altura
entres os picos pares e ı́mpares. A sonda WMAP mediu a posição do primeiro pico
com grande precisão e os resultados de um ano de dados fornecem l1 = 220.1 ± 0.8
[55].
As medidas em grandes escalas angulares fornecem informações sobre o espectro

das flutuações primordiais na densidade, que incluem tanto a CDM como a matéria
bariônica. Já em pequenas escalas angulares, podemos ter informação sobre Ωb e ΩTot .
Na verdade, o espectro da radiação cósmica de fundo permite estabelecer limites sobre
todos os parâmetros cosmológicos. Por exemplo, os dados do WMAP limitaram vários
desses parâmetros com com grande precisão (veja, por exemplo, a tabela 3 da ref.
[53]).
45
O espectro Pφ (k) está associado ao espectro das flutuações primordiais na densidade, pela relação
Pφ (k) ∝ P (k) /k 2 (eq. 2.36).
102
2.5.2 O Universo Muito Perturbado: Simulações Computa-
cionais
A análise linear das perturbações ajuda a compreender a radiação cósmica de fundo, as
primeiras fases da formação de estruturas e a estrutura em grande escala do universo.
Nas maiores escalas observáveis, as flutuações na densidade são pequenas e a teoria
linear ainda pode ser aplicada. No entanto, em escalas menores, talvez já nos super-
aglomerados e certamente nos grupos e aglomerados de galáxias, a aglomeração de
matéria não é linear (δρ/ρ > 1). Nesses casos, as variações na densidade são da
ordem de 105 (ρgaláxias /ρuniverso ) ou 102 − 103 (ρaglomerados /ρuniverso ) [39]. Portanto, para
compreender as estrutura no universo, é preciso fazer simulações computacionais, ou
recorrer a aproximações para a evolução não-linear.
Nas simulações numéricas utilizam-se condições de contorno periódicas para repre-
sentar um universo infinito. Como o volume simulado é fixo nas coordenadas ~x, na
verdade temos uma fronteira que evolui acompanhando a expansão média. A equação
de Poisson (2.16) é resolvida numericamente, utilizando a transformada de Fourier,
ou algum método hierárquico. Em geral, para simular a matéria escura utilizam-se al-
goritmos de N -corpos. Cada partı́cula segue uma trajetória dada pela equação (2.16).
A matéria bariônica (gás) é simulada utilizando algoritmos de fluidos para resolver
as eqs. (2.20) e (2.23), como por exemplo SPH (Smoothed Particle Hydrodynamics
[59]). A referência [60] é um excelente artigo de revisão sobre simulações numéricas
em cosmologia.
As simulações com matéria escura e gás são feitas para determinar a temperatura
final do gás (e comparar com os resultados das observações de raios-X ou do efeito
Sunyaev-Zel’dovich), ou para acompanhar a formação de galáxias. Nas escalas maiores
a dinâmica é dominada pela matéria escura, e portanto o gás não teria muita influência.
Por isso muitas simulações da formação de estruturas utilizam apenas matéria com
p = 0 (N -corpos).
Um exemplo atual de uma simulação de N -corpos é dado pela millenium simullation
[63], que envolveu mais de 1010 partı́culas, distribuı́das em um cubo com 500h−1 M pc
(i.e., cerca de 109 anos luz) de lado. A resolução é de 5h−1 kpc, de modo que a sim-
ulação varre um intervalo dinâmico de 5 ordens de grandeza. Simulações que incluem
a hidrodinâmica são limitadas a um intervalo dinâmico menor (∼ 103 ).
As simulações computacionais têm sido um instrumento fundamental para o estudo
da formação e evolução de estruturas. Elas parecem convergir em suas predições até a
escala dos aglomerados de galáxias, mas ainda estão longe de reproduzirem a formação
de galáxias individuais, devido à complexa fı́sica envolvida e às limitações de resolução.
2.6 Sı́tios de Internet Sugeridos

Institutos de Cosmologia:
• Instituto de Cosmologia Relatividade e Astrofı́sica (ICRA-CBPF):

www.icra.cbpf.br
• Institute for Computational Cosmology (Reino Unido):
http://icc.dur.ac.uk/
103
• The Kavli Institute for Cosmological Physics (EUA):
http://cfcp.uchicago.edu/
• Dark Cosmology Center (Dinamarca): www.dark-cosmology.dk
• Laboratoire Astroparticule & Cosmologie: http://www.apc.univ-paris7.fr/
• Beecroft Institute for Particle Astrophysics and Cosmology
http://www.development.ox.ac.uk/mpsnewsbee.htm
Páginas introdutórias sobre cosmologia
• Páginas de cosmologia da Divisão de Astrofı́sica do INPE:

http://www.das.inpe.br/cosmo/saber mais.htm
• Tutorial de cosmologia do Ned Wright: http://www.astro.ucla.edu/~wright/cosmolo
[http://www.astro.ucla.edu/~wright/cosmo 01.htm]
• Seleção de temas cosmológicos do sı́tio “Pergunte a um astrônomo”:
http://curious.astro.cornell.edu/cosmology.php.
• Level 5, A Knowledgebase for Extragalactic Astronomy and Cosmology: banco
de dados com artigos de revisão e links para outras páginas
http://nedwww.ipac.caltech.edu/level5/
Revisão das escalas de distância, do Sistema Solar até as maiores estruturas do universo
(da ref. [35]):
http://www.astro.princeton.edu/~mjuric/universe/
Atualização do livro de John Peacock, com algumas discussões interessantes:
http://www.roe.ac.uk/~jap/book/additions.html
Páginas de cosmologia para o público não especialista
• Sloan Digital Sky Survey Skyserver: http://skyserver.fnal.gov/en/

• Introdução à cosmologia do projeto MAP (Microwave Anisotropy Probe):
http://map.gsfc.nasa.gov/m uni.html
• Lonely Planet Guide to the Cosmos: http://snap.lbl.gov/EPO/lonely-planet/
• Página de center for science education de Berkeley:
http://cse.ssl.berkeley.edu/
Levantamentos de grande área e busca de supernovas (do tipo Ia)
• High Redshift Supernova Search / Supernova Cosmology Project:

http://panisse.lbl.gov/
• ESSENCE, “Equation of State: SupErNovae trace Cosmic Expansion” aka
“the w project” http://www.ctio.noao.edu/~wsne/
• CFHLS: Canada France Hawaii Telescop Legacy Survey:
http://www.cfht.hawaii.edu/Science/CFHLS/
– SuperNova Legacy Survey: http://www.cfht.hawaii.edu/SNLS/
• Pan-STARRS – the Panoramic Survey Telescope & Rapid Response System:
http://pan-starrs.ifa.hawaii.edu/public/index.html
104
– Galaxies and cosmology:
http://pan-starrs.ifa.hawaii.edu/public/science/cosmology.html
– Supernoave, Gamma Ray Bursts, Active Galaxy Nuclei:
http://pan-starrs.ifa.hawaii.edu/public/science/active.html
Simulações Numéricas:
• Virgo Consortium: http://www.virgo.dur.ac.uk/

• Hubble Volume: http://www.physics.lsa.umich.edu/hubble-volume
• Millenium Project: http://www.mpa-garching.mpg.de/galform/millennium/
Levantamentos de galáxias (espectros e fotometria):
• Redshift Surveys and Cosmology (um resumo sobre catálogos de desvio para o
vermelho de gláxias):
http://www.atnf.csiro.au/pasa/17 3/colless/paper/node2.html
• APM: http://www-astro.physics.ox.ac.uk/~wjs/apm survey.html
• CfA redshift survey: http://cfa-www.harvard.edu/~huchra/zcat/
• Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html
• Southern Sky Redshift Survey: http://arxiv.org/abs/astro-ph/9804064
• Sloan Digital Sky Survey: http://www.sdss.org
• 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.aao.gov.au/2df/
• 6dF: http://www.aao.gov.au/local/www/6df/
• Dark Energy Survey: http://www.darkenergysurvey.org,
http://www.des-brazil.org/
• Links para vários levantamentos e outras informações sobre astronomia e as-
trofı́sica: http://www.sdss.org/links.html
Levantamentos in infra-vermelho:
• UKIDSS (UKIRT Infrared Deep Sky Survey): http://www.ukidss.org/

• Visible and Infrared Survey Telescope for Astronomy (VISTA):
http://www.roe.ac.uk/atc/projects/vista/
Radiação cósmica de fundo
• Lambda - Legacy Archive for Microwave Background Data (excelente fonte de

recursos para a RCF, incluindo links e disponibilização de dados e aplicativos):
http://lambda.gsfc.nasa.gov/
• Wayne Hu: http://background.uchicago.edu/~whu/ (discussão da fı́sica da
CMB, com animações e links)
• Max Tegmark: http://www.hep.upenn.edu/~max/ (principalmente radiação
cósmica de fundo e formação de estruturas, com ênfase na parte de dados)
• MAXIMA: http://efpa.berkeley.edu/group/cmb/index.html
105
• BOOMERANG: http://oberon.roma1.infn.it/boomerang/
• MAP: http://map.gsfc.nasa.gov
• Planck: http://planck.esa.int (lançamento previsto em 2007), [ver também
http://astro.estec.esa.nl/(SA-general/Projects/)Planck]
• CAMB (Code for Anisotropies in the Microwave Background):
http://camb.info/
• CMBEASY: an Object Oriented Code for the Cosmic Microwave Background :
www.cmbeasy.org
• CMBFAST: http://physics.nyu.edu/matiasz/CMBFAST/cmbfast.html
• COSMICS: Cosmological Initial Conditions and Microwave Anisotropy Codes,
http://arcturus.mit.edu/cosmics/
Efeito Sunyaev-Zel’dovich: http://astro.uchicago.edu/sza/primer.html
• Projetos de Supernovas:
High Redshift Supernova Search / Supernova Cosmology Project:

http://panisse.lbl.gov/
• Listas com mais links de astronomia, astrofı́sica e cosmologia:
http://webusers.astro.umn.edu/~hlee/astro.html
http://www.iafe.uba.ar/relatividad/gangui/cosmocurso/
http://cfcp.uchicago.edu/education/resources/index.html
• Astronomia e Astrofı́sica: http://astro.if.ufrgs.br/
Íntegra do livro de Kepler de Souza Oliveira Filho e Maria de Fátima Oliveira Saraiva
da UFRGS. É um texto bem geral de astronomia e astrofı́sica, não penas cosmolo-
gia. Leitura recomendada: capı́tulos introdutórios e aqueles depois do “A Escala do
Universo”.
Pacotes/aplicativos/códigos
• DarkSUSY Home Page [fortran package for supersymmetric dark matter cal-
culations.]: http://www.physto.se/~edsjo/darksusy/, P. Gondolo, J. Edsjö,
P. Ullio, L. Bergstöm, M. Schelke and E.A. Baltz, JCAP 0407 (2004) 008;
astro-ph/0406204
• RECFAST: www.astro.ubc.ca/people/scott/recfast.html (Seager, Sas-
selov, Scott, 2000)
106
2.7 Livros sugeridos
Os anais da Escola Brasileira de Cosmologia e Gravitação, proporcionam uma exce-
lente fonte bibliográfica em muitos ramos da cosmologia e gravitação. A maior parte
dos cusos está disponı́vel integralmente on-line no sı́tio: www.icra.cbpf.br. Segue
abaixo uma lista com outros livros sugeridos no contexto deste capı́tulo:
Kolb, E. W, Turner, M. S., The Early Universe (Addison - Wesley, Redwood City,
CA, 1990) [dados um pouco desatualizados, mas abordagem moderna sobre modelo
padrão da cosmologia]
Weinberg S., Gravitation and Cosmology, J.Wiley, New York (1972)
Padmanabhan T., Structure Formation in theUniverse, Cambridge University Press
(1993)
Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe (Rela-
tivistic Astrophysics, volume 2), The University of Chicago Press (1983)
Peebles, P. J. E., The large scale structure of the Universe, Cambridge University
Press (1980)
Peebles, P. J. E. Principles of Physical Cosmology. Princeton, NJ: Princeton Univer-
sity Press (1993) [Contém extensos comentários sobre o desenvolvimento histórico da
cosmologia, escritos por quem foi parte dessa história].
Hawking, S. W. and Ellis, G. F. R. The Large Scale Structure of Space-Time. Cam-
bridge University Press (1975)
Peacock, J. A. Cosmological Physics. Cambridge University Press (1999)
Dodelson, S., Modern Cosmology, Academic Press (Elsevier Science) (2003) [per-
turbações, focando/discussão detalhada de CMB, análise estatı́stica]
Rindler, W., Introduction to Special Relativity, Oxford University Press (2004)
[primeira edição de 1960]
2.8 Artigos Sugeridos

Mencionamos abaixo alguns artigos relevantes para os temas discutidos neste capı́tulo.
Grande parte deles pode ser acessada a partir da excelente base de dados arXiv
(www.arXiv.org). Basta colocar o código (por exemplo astro-ph/0209486) no canto
superior direito da página principal (Search or Article-id ) Essa base de dados é uma
ótima fonte para procurar bibliografia sobre temas de fı́sica, astronomia, matemática
e ciências afins. Cabe no entanto uma ressalva: não necessariamente os artigos alı́
armazenados passaram por um processo de revisão independente, como ocorre nas
revistas cientı́ficas. Portanto é preciso estar especialmente atento à qualidade do que
é postado (embora um espı́rito crı́tico seja fundamental, independentemente de um
artigo ser aceito um não para publicação em uma revista especializada). Outra base
de dados excelente é o Astrophysics Data System (ADS, busca na base de dados em:
http://adsabs.harvard.edu/abstract service.html). Há ainda uma base da da-
dos voltada para a fı́sica de altas energias que é bastante completa em cosmologia e
astrofı́sica. Trata-se do HEP-SPIRES (busca de artigos em
http://www.slac.stanford.edu/spires/hep/search/). Procure utilizar essas
bases de dados para localizar os artigos abaixo que não possuem um número de arXiv.
107
Artigo original do Hubble:
• Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3
(1929), reproduzido em
http://antwrp.gsfc.nasa.gov/diamond jubilee/1996/hub 1929.html
Um ótimo artigo sobre a história da descoberta (observacional) da expansão do uni-

verso e da medida da constante de Hubble:
• G. A. Tammann, B. Reindl, Cosmic Expansion and H0 : A Retro- and Pro-

spective Note.
disponı́vel em: http://moriond.in2p3.fr/J02/Talks2002/G.Tammann/tammann.ps
Artigos gerais sobre cosmologia (artigos de revisão, notas de escolas):
• Escola Brasileira de Cosmologia e Gravitação. Vários cursos accessı́veis em

www.icra.cbpf.br
• Mark Trodden, Sean M. Carroll, TASI Lectures: Introduction to Cosmology,
astro-ph/0401547
• Wendy L. Freedman, Michael S. Turner, Measuring and Understanding the Uni-
verse, Rev. Mod. Phys. 75, 1433-1447 (2003), astro-ph/0308418
• S. M. Carroll, TASI Lectures: Cosmology for String Theorists, hep-th/0011110
• A. Sandage, Observational Tests of World Models, Annu. Rev. Astron. Astro-
phys. 26, 561-630 (1988). Disponı́vel em
http://nedwww.ipac.caltech.edu/level5/Sept01/Sandage/Sand contents.html
• Thomas F. Jordan, Cosmology calculations almost without general relativity,
astro-ph/0309756
• Breve revisão da cosmologia padrão, incluindo possı́veis problemas do modelo
atual: veja a referência [32].
Lentes gravitacionais:
• J. Wambsganss, Gravitational Lensing in Astronomy, Living Rev. Relativity 1,

12 (1998); http://www.livingreviews.org/lrr-1998-12 [artigo de revisão, in-
cluindo uma breve introdução histórica]
Um ótimo artigo sobre as definições de distância em cosmologia:
• David W. Hogg, Distance measures in cosmology, astro-ph/9905116
Estrutura em grande escala do Universo e mapeamentos de posições de galáxias:
• Matthew Colless, Redshift Surveys and Cosmology: A Summary of the Dunk

Island Conference, Publ. Astron. Soc. Aust., 17, 215 (2000); pdf disponı́vel em
http://www.atnf.csiro.au/pasa/17 3/colless/paper/node2.html
108
Energia Escura:
• Da desaceleração à aceleração, Adam G. Riess e Michael S. Turner, Scientific

American Brasil, número 22, março de 2004
• Sean M. Carroll, Why is the Universe Accelerating?, astro-ph/0310342
• P.J.E. Peebles, B. Ratra, The Cosmological Constant and Dark Energy, Rev.
Mod. Phys. 75, 559 (2003); astro-ph/0207347.
• S.M. Carrol, The Cosmological Constant, Living Reviews in Relativity 4, 1
(2001),
http://relativity.livingreviews.org/Articles/lrr-2001-1/
• V. Sahni, A.A. Starobinsky, The Case for a Positive Cosmological Λ Term, Int.
J. Mod. Phys. D 9, 373 (2000); astro-ph/9904398
• M.S. Turner, Phys. Rep. 333, 619 (2000)
• I. Waga, Dark Energy and the Accelerated Expansion of the Universe, Braz. J.
Phys. 30, 2, 370 (2000)
http://www.sbfisica.org.br/bjp/download/v30/v30a40.pdf
• S. Weinberg, The cosmological constant problem, Rev. Mod. Phys. 61, 1-23
(1989).
• Andreas Albrecht, et al., Report of the Dark Energy Task Force,
astro-ph/0609591 (compara e padroniza diversos métodos e projetos para es-
tudar a energia escura)
Matéria Escura
• G. Bertone, D. Hooper, J. Silk, Particle Dark Matter: Evidence, Candidates and

Constraints, Phys.Rept. 405, 279 (2005), hep-ph/0404175;
• Hitoshi Murayama, Physics Beyond the Standard Model and Dark Matter, Les
Houches Summer School, Session 86, Particle Physics and Cosmology: the Fabric
of Spacetime, July 31- August 25, 2006, arXiv:0704.2276v1.
• K. Griest, M. Kamionkowski, Phys. Rep. 333, 167-182 (2000);
• M.S. Turner, Phys. Rep. 197, 67 (1990);
• G.G. Raffelt, Phys. Rep. 198, 1 (1990).
• Limite experimental em áxions: E. Zavattini, et al., Experimental observation
of optical rotation generated in vacuum by a magnetic field, Phys.Rev.Lett. 96
(2006) 110406; arXiv:hep-ex/0507107v3.
Artigos de divulgação sobre os resultados de supernovas do tipo Ia:
• Saul Perlmutter, Supernovae, Dark Energy, and the Accelerating Universe,

Physics Today, April 2003, pp. 53 (disponı́vel em:
http://www.lbl.gov/Science-Articles/Archive/
assets/images/2003/Sep-05-2003/PhysicsTodayArticle.pdf)
• James Glanz, Exploding Stars Point to a Universal Repulsive Force, Science, Vol
279, Number 5351, pp. 651-652, 30 Jan. 1998
109
• James Glanz, Astronomers See a Cosmic Antigravity Force at Work, Science, Vol
279, Number 5355, pp. 1298-1299, 27 Feb. 1998
Supernovas e cosmologia:
• S. Perlmutter, B. P. Schmidt, Measuring Cosmology with Supernovae, in Super-

novae & Gamma Ray Bursts, K. Weiler, Ed., Springer, Lecture Notes in Physics
(in press), astro-ph/0303428.
• Artigo do Supernova Cosmology Projetc: Knop, et al., New Constraints on ΩM ,
ΩΛ , and w from an Independent Set of Eleven High-Redshift Supernovae Observed
with HST,ApJ 598, 102 (2003), astro-ph/0309368.
Limites atuais sobre a idade do universo a partir de aglomerados globulares:
• L. M. Krauss, B. Chaboyer, Age Estimates of Globular Clusters in the Milky

Way: Constraints on Cosmology, Science, 299, 5603, pp. 65-70 (2003).
• L. M. Krauss, Dark Energy and the Hubble Age, ApJ, 604, 481 (2004),
astro-ph/0212369.
• N. Dauphas, The U/Th production ratio and the age of the Milky Way from
meteorites and Galactic halo stars, Nature 435, 1203 (2005).
Medidas da densidade de matéria escura através da emissão em raios-x de aglomerados:
• S. W. Allen, P. R. W. Schmidt, H. Ebeling, A. C. Fabian,.L.van Speybroeck, Con-

straints on dark energy from Chandra observations of the largest relaxed galaxy
clusters, astro-ph/0405340.
• S. W. Allen, P. R. W. Schmidt and A. C. Fabian, Cosmological constraints from
the X-ray gas mass fraction in relaxed lensing clusters observed with Chandra,
MNRAS, 334, L11 (2002).
• A. Vikhlinin, A. Kravtsov, W. Forman, C. Jones, M. Markevitch, S. S. Murray,
L. Van Speybroeck, Chandra sample of nearby relaxed galaxy clusters: mass, gas
fraction, and mass-temperature relation, astro-ph/0507092.
Radiação cósmica de fundo
• W. Hu, S. Dodelson, Cosmic Microwave Background Anisotropies, Annual Re-

view of Astronomy and Astrophysics, 40, 171-216 (2002), astro-ph/0110414
• D. Scott, G. Smoot, Cosmic Background Radiation Mini-Review,
astro-ph/0406567. [Uma mini-revisão sobre radiação cósmica de fundo]
• Hu, W., Sugiyama, N., Anisotropies in the cosmic microwave background: an
analytic approach, ApJ, 444, 489 (1995).
• Hu, W., Sugiyama, N., Small-Scale Cosmological Perturbations: an Analytic Ap-
proach, ApJ 471, 542 (1996).
• U. Seljak & M. Zaldarriaga, A line of sight approach to Cosmic Microwave Back-
ground anisotropies, ApJ 469, 437 (1996),
• Bertschinger, E., COSMICS: Cosmological Initial Conditions and Microwave
Anisotropy Codes, astro-ph/9506070
110
• A. Lewis, A. Challinor, A. Lasenby, Efficient Computation of CMB anisotropies
in closed FRW models, ApJ 538 (2000) 473-476, astro-ph/9911177
• Doran M., CMBEASY: an Object Oriented Code for the Cosmic Microwave Back-
ground, astro-ph/0302138
Efeito Sunyaev-Zel’dovich [ótimo review sobre o que promete ser um dos assuntos mais
quentes da cosmologia observacional nos próximos anos]
• J. E. Carlstrom, G. P. Holder, E. D. Reese, Cosmology with the

Sunyaev-Zel’dovich Effect, Ann. Rev.Astron.Astrophys. 40, 643 (2002),
astro-ph/0208192
WMAP (maps e cosmological implications):

Correlação entre a estrutura em grande escala e as anisotropias na radiação cósmica
de fundo:
• Fosalba, E. Gaztañaga, F. Castander, Astrophys. J. 597, L89 (2003)

• R. Scranton et al., Physical Evidence for Dark Energy, astro-ph/0307335
• M. R. Nolta et al., Astrophys. J. 608, 10 (2004)
• N. Afshordi, Y.-Sh. Loh, and M. A. Strauss, Phys. Rev. D 69, 083524 (2004)
• S. Boughn and R. Crittenden, Nature 427, 45 (2004)
• P. Fosalba and E. Gaztañaga, Mon. Not. Roy. Astron. Soc. 350, L37 (2004)
• E. Gaztanaga, M. Manera, and T. Multamaki, New light on Dark Cosmos,
Mon.Not.Roy.Astron.Soc. 365, 171 (2006); astro-ph/0407022.
Medidas de distância e do parâmetro de Hubble:
• W. Freedman, Final Results from the Hubble Space Telescope Key Project to
Measure the Hubble Constant, ApJ 553, 47 (2001), astro-ph/0012376.
Eevolução não linear e simulações de formação de estruturas:
• E. Bertschinger, Simulations of Structure Formation in the Universe, Annual

Review of Astronomy and Astrophysics, 36, 599 (1998)
• V. Springel, et al., Simulations of the formation, evolution and clustering of galax-
ies and quasars, Nature, 435, 629 (2005), astro-ph/0504097 [disponı́vel também
em http://www.mpa-garching.mpg.de/galform/millennium/, com imagens e
animações de alta resolução]
111
2.9 Exercı́cios
Exercicio: Unidades e ordens de grandeza
1) A temperatura da radiação cósmica de fundo (RCF) hoje é T0 = 2.725 ± 0.002 [67].

Lembrando da lei de Stephan-Boltzmann (ρ = σT 4 ) calcule a densidade (e densidade
de energia) dos fótons da RCF. Expresse seus resultados em g/cm3 . Note que, para
usar a lei de Stephan-Boltzmann, estamos supondo que os fótons da RCF obedecem
à distribuição de Planck, o que é verificado experimentalmente com uma excelente
precisão.
2) O parâmetro de Hubble é geralmente escrito na forma H0 = 100 h Mpc/Km/s. A

partir dessa quantidade, obtenha o tempo de Hubble tH = H0−1 , em segundos e em
anos. Também podemos definir uma distância de Hubble pela relação DH = c/H0 .
Obtenha DH em kilômetros e em megaparsecs (Mpc).
Alguns resultados atuais fornecem h ' 0.72 [25]. Calcule tH e DH para esse valor da
constante de Hubble.
3) Obtenha a densidade crı́tica ρcrit := 3H02 /8πG em g/cm3 em termos de h. Em

cosmologia, é muito conveniente introduzirmos os parâmetros cosmológicos de densi-
dade, definidos pela relação Ωi = ρi0 /ρcrit , onde o ı́ndice i denota cada componente
do conteúdo energético-material do universo. Calcule Ωγ (parâmetro de densidade dos
fótons) em termos de h e para h = 0.72.
Observações: Os cosmólogos e fı́sicos de partı́culas costumam utilizar convenções em

que c = 1, onde c é a velocidade da luz (no vácuo). Insira essa quantidade para obter
as dimensões corretas nos exercı́cios acima, quando for necessário.
O subscrito 0 costuma denotar quantidades calculadas “hoje”, ou seja, na presente
idade do universo.
Respostas
8π 5 k4
1) ργ0 = 4.642 × 10−34 g/cm3 (σ = 15c3 h3
= 7. 566 × 10−16 kgm−3 K−4 ).
2) H0−1 = h−1 3.08568025 × 1017 s ' h −1
9.8 × 109 anos, DH = c
H0
= h−1 3000 M pc
3H 2
3) ρcrit = 8πG
= h2 1.8788 × 10−29 g/cm3 .
Ω0γ = 2.471 × 10−5 h−2 . Para h = 0.72, temos Ω0γ = 4.766 × 10−5
Problema: Idade do Universo

Não se assuste! Este problema pode parecer um pouco longo, mas não é difı́cil. É um
tutorial passo a passo para obter a idade do universo (na cosmologia de Friedmann-
Lemaı̂tre-Robertson-Walker).
1) Equação de Friedmann e parâmetros de densidade.

Lembrando que o parâmetro de Hubble é dado por
ȧ
H (t) = (2.46)
a
112
(onde a é o fator de escala e o ponto denota a derivada temporal), utilize as definições
dos parâmetros de densidade, da densidade crı́tica, junto com a equação de Friedmann
2
ȧ 8πG X Λ K
= ρi + − 2 , (2.47)
a 3 i
3 a
para obter X
Ωi + ΩΛ + ΩK = 1,
i
onde ΩΛ = Λ/(3H02 ) e ΩK = −K/H02 . Incluindo a constante

P cosmológica e a curvatura
como “componentes de matéria”, temos simplesmente j Ωj = 1 onde o ı́ndice j
denota as componentes materiais (bárions, matéria escura, fótons, etc.), a curvatura
e a constante cosmológica.
2) Conservação da energia.
Reescreva a equação da conservação de energia
ρ̇ + 3H (ρ + p) = 0
utilizando a como variável. Mostre que para radiação (p = ρ/3), matéria (p = 0) e

“vácuo” (p = −ρ) as soluções são, respectivamente, ρr = ρr0 (a/a0 )4 , ρm = ρm0 (a/a0 )3
e ρv = ρv0 = const. Se quiser, é fácil encontrar a solução para uma equação de estado
um pouco mais geral, da forma p = wρ.
Utilize esses resultados na equação de Friedmann (2.47), junto com as definições dos
parâmetros cosmológicos (parâmetros de densidade e parâmetro de Hubble), para
obter (num universo composto por matéria, radiação, curvatura e constante cos-
mológica) s
4 3 2
a a a
H (a) = H0 Ωr + Ωm + ΩK + ΩΛ
a0 a0 a0
onde ΩΛ pode denotar tanto a constante cosmológica, quanto um termo do tipo energia
do vácuo, ou uma combinação dos dois.
3) Idade do Universo.
Utilizando a definição do parâmetro de Hubble (2.46) obtenha a expressão para a
idade do universo
Z t0 Z a0
−1 da
t0 = dt = H0 r . (2.48)
0 0 4 3 2
a a a
a Ωr a0 + Ωm a0 + ΩK a0 + ΩΛ
Calcule a idade do universo (em Ga = 109 anos) para Ωm = 0.3, ΩΛ = 0.7 e h = 0.72.
O valor de Ωr será dado pelo resultado do exercı́cio 3) (aqui, apenas com propósitos
didáticos, desprezaremos a contribuição dos neutrinos) [Como obter o valor de ΩK ?].
O que ocorre se desprezamos a contribuição da radiação? E da curvatura?
Como fica a idade do Universo se agora ΩΛ = 0 e ΩK = 0?
Supondo que o universo é plano (K = 0) e desprezando a radiação, faça um gráfico
de t0 em unidades de h−1 Ga em função de Ωm .
113
Faça o mesmo gráfico, mas agora para ΩΛ = 0 (e portanto K 6= 0).
Diversas estimativas atuais para a idade das estrelas mais velhas indicam um limite
inferior de 11 Ga (veja, por exemplo, a ref. [31]). Naturalmente esse valor fornece um
limite inferior para a idade do universo. A que conclusões você pode chegar, tendo em
vista os resultados que você obteve acima?
Como mencionado no curso, podemos definir um “inı́cio do universo” extrapolando

a curva a (t) para a → 0. Isso implica em supor que as componentes de matéria vão
continuar a se comportar como deduzido no ı́tem 2). No entanto, não sabemos como
é a equação de estado da matéria a temperaturas altı́ssimas, onde podem intervir
inúmeros efeitos ainda não estudados em laboratório. Que condições seria preciso
impor ao comportamento da matéria para o universo não ter tido um inı́cio, ou seja,
para a integral (2.48) divergir?
2.10 Glossário
Parsec (pc)
Unidade de distância amplamente utilizada em astronomia cujo nome deriva de “per
second arc”. Corresponde à distância na qual um segmento medindo uma unidade
astronômica (equivalente à distância média da Terra ao Sol) subtende um ângulo de um
segundo de arco. Sua origem decorre da utilização da paralaxe para medir distâncias
às estrelas mais próximas. Um pc equivale a 3.26 anos luz ou 3.086 × 1013 Km. As
distâncias cosmológicas são usualmente medidas em Megaparsec (Mpc = 106 pc) e
Gigaparsec (Gpc = 109 pc).
Elétron Volt (eV)

Unidade de energia muito utilizada em fı́sica de partı́culas. Ela corresponde à energia
ganha por um elétron ao atravessar um potencial de um Volt, ou seja 1 eV ' 1.6×10−19
J. A energia de ionização do hidrogênio no estado fundamental, por exemplo, é de 13.6
eV. Também são muito utilizados em fı́sica de altas energias os múltiplos do eV, como
keV, MeV, GeV, TeV, PeV, EeV, correspondendo, respectivamente, a 103 , 106 , 109 ,
1012 , 1015 e 1018 eV.
Seção de choque
A seção de choque é uma medida da probabilidade de ocorrência de uma dada reação.
Ela é definida como o número de reações por unidade de tempo dividido pelo número
de colisões (“encontros” entre partı́culas) por unidade de tempo por unidade de área,
ou seja, é o número de reações por unidade de tempo dividido pelo fluxo incidente. A
seção de choque depende da energia das partı́culas e da reação em questão. Pode-se
pensar na seção de choque como uma área efetiva para as colisões, daı́ o seu nome.
De fato, o número de reações pode ser calculado assumindo-se que o núcleo tem uma
área e que uma dada reação ocorre sempre que uma partı́cula atinge aquela área.
114
[1] G.A. Tammann, B. Reindl, Cosmic Expansion and H0 : A Retro- and Pro-Spective
Note, proceedings of the XXXVIIth Moriond Astrophysics Meeting “The Cosmo-
logical Model”, Les Arcs, France, March 16-23, 2002, astro-ph/0208176
[2] Hoskin, M. A., Ritchey, Curtis and the Discovery of Novae in Spiral Nebulae,
Journal for the History of Astronomy, 7, 47 (1976)
[3] Nick Allen, Msc thesis: The Cepheid Distance Scale: A History, 2001
(http://www.institute-of-brilliant-failures.com/).
[4] K. Z. Stanek, P. M. Garnavich, Distance to M31 With the HST and Hipparcos
Red Clump Stars, astro-ph/9802121
[5] Hubble, E. P., A spiral nebula as a stellar system: Messier 33, Astrophys. J., 63,
236-274 (1926)
[6] Hubble, Edwin; Humason, Milton L., The Velocity-Distance Relation among
Extra-Galactic Nebulae, Astrophysical Journal, vol. 74, p.43 (1931)
[7] Leavitt, Henrietta S.; Pickering, Edward C., Periods of 25 Variable Stars in the
Small Magellanic Cloud, Harvard College Observatory Circular, vol. 173, pp.1-3
(1912)
[8] V.C. Rubin & W.K. Ford, Astrophys. J. 159, 379 (1970)
[9] E. Corbelli, P. Salucci, The Extended Rotation Curve and the Dark Matter
Halo of M33, MNRAS, 311, 441 (2000), astro-ph/9909252 [veja também E.
Corbelli, Dark matter and visible baryons in M33, MNRAS 342, 199 (2003),
astro-ph/0302318]
[10] L. Ferrarese et.al., The Extragalactic Distance Scale Key Project. IV. The Discov-
ery of Cepheids and a New Distance to M100 Using the Hubble Space Telescope,
ApJ 464, 568 (1996).
[11] Koester, B.P. , et al., A MaxBCG Catalog of 13,823 Galaxy Clusters from the
Sloan Digital Sky Survey, astro-ph/0701265.
[12] Press W.H., Schechter, P.L., Astrophys. J. 187, 425 (1974)
[13] F., Zwicky, On the Masses of Nebulae and of Clusters of Nebulae, ApJ, 86, 217
(1937).
[14] M. Colless, A.M. Dunn, Structure and Dynamics of the Coma Cluster, ApJ, 458,
435 (1996), astro-ph/9508070.
[15] J. Renn, T. Sauer, & J. Stachel, The origin of gravitational lensing: A postscript
to Einstein’s 1936 Science paper, Science, 275, 184 (1997).
[16] Chwolson, O., Über eine mögliche Form fiktiver Doppelsterne [Sobre um Possı́vel
Tipo de Estrelas Duplas Fictı́cias], Astron. Nachr., 221, 329, (1924).
[17] A. Einstein, Lens-like action of a star by the deviation of light in the gravitational
field, Science, 84, 506, (1936).
[18] F., Zwicky, Nebulae as Gravitational Lenses, Phys. Rev. Lett., 51, 290 (1937);
F., Zwicky, On the Probability of Detecting Nebulae Which Act as Gravitational
Lenses, Phys. Rev. Lett., 51, 679, (1937).
[19] Lynds, R., Petrosian, V., BAAS, 18, 1014 (1986); Lynds, R., & Petrosian, V.,
Astropys. J, 336, 1 (1989); Soucail, G., Fort, B., Mellier, Y., & Picat, J. P.,
Astronomy & Astrophys., 172, L14 (1987).
115
[20] E.S. Cypriano, G.B. Lima Neto, L. Sodré, J.-P. Kneib, L.E. Campusano, Luis E.,
Gemini and Chandra observations of Abell 586, a relaxed strong-lensing cluster,
Astrophys.J. 630 (2005) 38, astro-ph/0504036
[21] M. Fukugita, C. J. Hogan, P. J. E. Peebles, The Cosmic Baryon Budget, ApJ.
503, 518 (1998), astro-ph/9712020; M. Fukugita, P. J. E. Peebles, The Cosmic
Energy Inventory, ApJ 616, 643 (2004), astro-ph/0406095.
[22] South Pole Telescope: http://spt.uchicago.edu/
[23] J. E. Carlstrom, G. P. Holder, E. D. Reese, Cosmology with the Sunyaev-
Zel’dovich Effect, Ann.Rev.Astron.Astrophys. 40, 643 (2002), astro-ph/0208192
[24] Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3,
163 (1929)
[25] W.L.Freedman, et al., Final Results from the Hubble Space Telescope Key Project
to Measure the Hubble Constant, ApJ, 553, 47 (2001), astro-ph/0012376.
[26] J. Huchra, M. Davis, D. Latham, J. Tonry, A survey of galaxy redshifts. IV - The
data, ApJS, 52, 89 (1983).
[27] V. de Lapparent, M.J. Geller, J.P. Huchra, A slice of the universe, ApJ, 302, L1
(1986).
[28] L. N. da Costa, et al., The Southern Sky Redshift Survey, ApJ, 327, 544 (1988).
[29] L. N. da Costa, et al., A complete southern sky redshift survey, ApJ, 424, L1
(1994); L. N. da Costa, et al., The Southern Sky Redshift Survey, Astron. J., 116,
1 (1998), astro-ph/9804064.
[30] S.A. Shectman, et al., The Las Campanas Redshift Survey, ApJ, 470, 172 (1996),
astro-ph/9604167.
[31] L. M. Krauss, B. Chaboyer, Science, 299, 5603, 65 (2003); L. M. Krauss, ApJ,
604, 481 (2004), astro-ph/0212369.
[32] J.R. Primack, Precision cosmology, New Astronomy Reviews, 49, 25 (1995),
astro-ph/0408359.
[33] R. A. Daly, ApJ, 426, 38 (1994); veja também: E. J. Guerra, R. A. Daly, L.
Wan, ApJ, 544, 659 (2000); R. A. Daly, E. J. Guerra, AJ, 124, 1831 (2002); S.
Podariu, R. A. Daly, M. P. Mory, B. Ratra, ApJ, 584, 577 (2003).
[34] M. Visser, Jerk, snap, and the cosmological equation of state, Class. Quant. Grav.
21, 2603 (2004), gr-qc/0309109; veja também R. R. Caldwell, M. Kamionkowski,
Expansion, Geometry, and Gravity, astro-ph/0403003 e T. Chiba, T. Nakamura,
The Luminosity Distance, the Equation of State, and the Geometry of the Uni-
verse, Prog. Theor. Phys. 100, 1077 (1998); astro-ph/9808022
[35] J.R. Gott, et al., A Map of the Universe, ApJ, 624, 463 (2005),
astro-ph/0310571.
[36] de Bernardis, P., et al. 2000, Nature, 404, 955 (2000); Lange, A. E., et al., 2000,
Phys. Rev. D., 63, 042001, astro-ph/0005004.
[37] S. Hanany et al., ApJ 545, L5 (2000); A. Balbi et al., ApJ 545, L1 (2000).
[38] Netterfield, C. B., et al., A Measurement by BOOMERANG of Multiple Peaks in
the Angular Power Spectrum of the Cosmic Microwave Background, ApJ, 571,
604 (2002).
116
[39] Kolb, E. W., Turner, M. S.,The Early Universe, Addison-Wesley (1994).
[40] P. J. E. Peebles, Large-scale background temperature and mass fluctuations due
to scale-invariant primeval perturbations, ApJ 263, L1 (1982).
[41] J. R. Bond & G. Efstathiou, Cosmic Background Radiation Anisotropies in Uni-
verses Dominated by Nonbaryonic Dark Matter, ApJ 285, L45 (1984)
[42] S. Burles, K. M. Nollett, M. S. Turner, Big-Bang Nucleosynthesis Predictions for
Precision Cosmology, ApJ 552, L1 (2001), astro-ph/
[43] D. Kirkman, D. Tytler, N. Suzuki, J. M. O’Meara, D. Lubin, The cosmological
baryon density from the deuterium to hydrogen ratio towards QSO absorption
systems: D/H towards Q1243+3047, Astrophys. J., Suppl. Ser. 149, 1 (2003),
astro-ph/0302006
[44] Maddox, S. J., Efstathiou, G., Sutherland, W. J. & Loveday, J., Galaxy corre-
lations an large scales, MNRAS, 242, 43 (1990); Maddox, S. J., Efstathiou, G.,
Sutherland, W. J. & Loveday, J., MNRAS, 243, 692 (1990)
[45] Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html.
[46] Shectman, S. A., et. al., The Las Campanas Redshift Survey, ApJ, 470, 172
(1996)
[47] Lapperent, V., Geller, M. J., Huchra J. P., A Slice of the Universe, ApJ, 302, L1
(1986)
[48] 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.roe.ac.uk/~jap/2df/
[49] Sloan Digital Sky Survey: http://www.sdss.org
[50] Dark Energy Survey: http://www. darkenergysurvey.org
[51] K. S. Wu, O. Lahav & M. J. Rees, The large-scale smoothness of the Universe,
Nature, 397 (1999)
[52] J. C. Mather, D. J Fixsen, R. A. Shafer, C. Mosier, D. T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), Astro-
phys. J., 512, 511 (1999).
[53] C. L. Bennett, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Preliminary Maps and Basic Results, astro-ph/0302207, submit-
ted to The Astrophysical Journal.
[54] D. N. Spergel, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Determination of Cosmological Parameters, astro-ph/0302209,
submitted to The Astrophysical Journal.
[55] G. Hinshaw, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: The Angular Power Spectrum, astro-ph/0302217, submitted to
The Astrophysical Journal,
L. Page, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP) Ob-
servations: Interpretation of the TT and TE Angular Power Spectrum Peaks,
astro-ph/0302220, submitted to The Astrophysical Journal.
[56] Bertschinger E., Cosmological Dynamics, in R. Schaeffer, J. Silk, M. Spiro and V.
Zinn-Justin eds., Cosmology and Large Scale Strucutre, XV Les Houches Summer
School (1993), Elsevier Science, Amsterdam (1996) 273, astro-ph/9503125
[57] Bertschinger, E., Cosmological Perturbation Theory and Structure Formation, in
M. C. Bento, O. Bertolami, L. Teodoro eds., COSMOLOGY 2000 Conference
Proceedings, astro-ph/0101009
117
[58] Sachs R. K., Wolfe A. M., Perturbations of a Cosmological Model and Angular
Variations of the Microwave Background, ApJ 147, 73 (1967)
[59] Monaghan J. J., Smoothed Particle Hydrodynamics, Annu. Rev. Astron. Astro-
phys., 30, 543 (1992)
[60] Bertschinger, E., Simulations of Structure Formation in the Universe, Annu. Rev.
Astron. Astrophys., 36, 599-654 (1998)
[61] Virgo Consortium: www.virgo.dur.ac.uk
[62] Hubble Volume: http://www.physics.lsa.umich.edu/hubble-volume
[63] Springel V., et al., Simulations of the formation, evolution and clustering of galax-
ies and quasars, Nature 435, 629 (2005); astro-ph/0504097
[64] Tipler, F. J., Rigurous Newtonian Cosmology, Am. J. Phys. 64, 10, 1311 (1996)
[65] Tipler, F. J., Newtonian Cosmology Revisited, MNRAS, 282, 206 (1996)
[66] Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe
(Relativistic Astrophysics, volume 2), The University of Chicago Press (1983)
[67] J.C. Mather, D. J. Fixsen, R.A. Shafer, C. Moser, D.T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), ApJ
512, 511 (1999), astro-ph/9810373. [T0 = 2.725 ± 0.002]
[68] M. Fukugita, P.J.E. Peebles, The Cosmic Energy Inventory, Astrophys. J. 616,
643 (2004), astro-ph/0406095.
[69] Biviano et al., A catalogue of velocities in the central regions of the Coma cluster,
Astron. Astrophys. Suppl. Ser. 111, 265 (1995).
[70] Novello, M., A Spinor Theory of Gravity and the Cosmological Framework,
arXiv:gr-qc/0701120
[71] Novello, M., Constructing Dirac linear fermions in terms of non-linear Heisenberg
spinors, arXiv:0705.2692
[72]
[73] Hawkins, E., et al., The 2dF Galaxy Redshift Survey: correlation functions, pe-
culiar velocities and the matter density of the Universe, MNRAS 346, 78 (2003);
astro-ph/0212375
[74] Makler, M., Dinâmica Gravitacional da Formação de Estruturas no Universo,
Tese de doutorado, CBPF (2001)
[75] Lifshitz, E. M., On the gravitational stability of the expanding universe. J. Phys.
USSR 10, 116 (1946)
[76] Reis, R. R., Domain of validity of the evolution of perturbations in Newtonian
cosmology with pressure, Phys. Rev. D 67 7301 (2003); Erratum ibid 68, 9901
(2003).
118
Figura 2.20: Diagrama ilustrando a hierarquia e ordens de grandeza das dimensões das
estruturas no Universo.
Figura 2.21: O catálogo de galáxias APM (do inglês automatic plate machine) contém
mais de 2 milhões de galáxias, cobrindo aproximadamente 1/10 da esfera celeste. As inten-
sidades em cada pı́xel são proporcionais ao número de galáxias, com as cores azul, verde
e vermelho representando galáxias brilhantes, de brilho médio e fracas, respectivamente.
As áreas escuras recortadas foram excluı́das por conter estrelas brilhantes e outros obje-
tos que impediram a identificação das galáxias de fundo. Créditos: Steve Maddox, Will
Sutherland, George Efstathiou, Jon Loveday, Gavin Dalton e Departamento de Astrofı́sica
da Universidade de Oxford. Veja referência [44].
119
Figura 2.22: Distribuição de galáxias em função do desvio para o vermelho obtida pelo
projeto 2dF [48] (http://magnum.anu.edu.au/∼TDFgg/).
Figura 2.23: Estrutura em grande escala segundo a millenium simulation. A figura mostra
a distribuição de matéria escura em uma “fatia” dessa simulação, nas maiores escalas (veja
a ref. [63]).
120
Figura 2.24: Distribuição de matéria em um aglomerado massivo segundo a millenium
simulation. Esta imagem representa um zoom na figura 2.23 (veja a ref. [63]).
121
Capı́tulo 3
Introdução à Cosmologia
Mário Novello1
3.1 Introdução
Neste capı́tulo descreveremos alguns aspectos teóricos da Cosmologia Relativista. De-
vido ao caráter universal e somente atrativo da gravitação é ela a força responsável
pela estrutura e evolução do universo. Assim, a cosmologia do século XX se inicia
quando em 1917 Einstein aplicou as suas equações da Teoria da Relatividade Geral
(TRG) ao universo2 .
3.2 Cosmologia Relativista

O princı́pio básico que orienta a Cosmologia Moderna é o chamado Princı́pio Cos-
mológico. Ele pode ser descrito em termos de duas afirmativas:
a) As leis da fı́sica tal como as determinamos em nossa vizinhança são
válidas em qualquer região e momento da história do Universo, em qual-
quer escala de distância e tempo.
b) O Universo é espacialmente homogêneo e isotrópico .
A primeira afirmação é indispensável para que se possa construir um modelo cos-
mológico. Sem ela, nada se poderia afirmar sobre o comportamento da matéria
em regiões longı́nquas do Universo e em diferentes épocas de sua história. Sendo
1
Afiliação:ICRA-BR/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
2
O leitor interessado na história da Cosmologia ao longo do século XX pode consultar o livro de
Merleau-Ponty. Para um estudo mais aprofundado do significado da Cosmologia e suas relações com a
Fisica pode consultar M. Novello
122
uma hipótese de trabalho, possivelmente tal afirmação não seja válida em algumas
situações, mas sem assumı́-la, jamais poderemos determinar as suas limitações .
Como consequência desta primeira afirmação, conclui-se, a partir de nossas ob-
servações astronômicas locais, que os objetos celestes devem ter carga total muito
próxima de zero. Sendo assim, das duas únicas interações de longo alcance conhecidas
na natureza, o eletromagnetismo e a gravitação, somente esta última tem relevância
para a Cosmologia.
Como discutido em Capı́tulo 1, em 1915, Einstein completou a formulação de uma
nova teoria da gravitação, a Teoria da Relatividade Geral. Nela, a gravitação não é
descrita como uma força provocada pela existência de grandes massas, mas como uma
modificação da geometria do espaço-tempo provocada pela energia sob qualquer forma,
nele contida. As partı́culas nesta região, se não sofrerem a influência de nenhuma
outra força, são ainda consideradas partı́culas livres, descrevendo trajetórias que são o
caminho extremal entre dois pontos do espaço-tempo isto é geodésicas do tipo tempo
e nula de geometria. As equações de Einstein da gravitação relacionam algebricamente
a curvatura do espaço-tempo com a distribuição de matéria e energia.
Uma vez construı́da uma nova teoria da gravitação, o passo lógico seguinte é aplicá-la
à Cosmologia. Entretanto, como estas equações são muito complexas, faz-se necessária
uma hipótese simplificadora, que é a segunda parte do Princı́pio Cosmológico.
Em uma geometria que possui estrutura espacial homogênea e isotrópica todos os pon-
tos do espaço, bem como todas as direções a partir de qualquer ponto são equivalentes.
Isto restringe bastante as possı́veis geometrias espaciais. Na verdade, é possı́vel mostrar
que só existem 3 geometrias que satisfazem este Princı́pio (veja Ref.[1], capı́tulo 13).
A primeira consiste no espaço plano. Outra possibilidade, em duas dimensões, é a
superfı́cie de uma esfera. Não há pontos ou direções preferenciais nesta superfı́cie.
Entretanto, a superfı́cie de uma esfera tem apenas 2 dimensões e vivemos em 3 di-
mensões. É possı́vel generalizar este conceito para 3 dimensões? Vejamos: uma esfera
bidimensional, denotada por S 2 , é definida num espaço tridimensional plano, no qual
os comprimentos infinitesimais são dados por
dl2 = dx2 + dy 2 + dz 2 , (3.1)
ou, em coordenadas esféricas,
dl2 = dr2 + r2 [dθ2 + sin2 θdφ2 ], (3.2)
com r2 = x2 + y 2 + z 2 , através do vı́nculo r = a, onde a é o raio da esfera. A

generalização de S 2 para a esfera tridimensional S 3 é facilmente obtida tomando-se
um espaço plano quadridimensional
dl2 = dw2 + dr2 + r2 [dθ2 + sin2 θdφ2 ], (3.3)
e impondo-se o vı́nculo w2 + x2 + y 2 + z 2 = w2 + r2 = a2 (a constante foi introduzida

por razões que veremos a seguir, mas no momento ela vale 1), sendo a, analogamente,
o raio da 3-esfera. Do vı́nculo obtemos que wdw + rdr = 0. Substituindo na Eq. (3.3),
usando o vı́nculo, redefinindo r̄ ≡ r/a e omitindo as barras, obtemos
n dr2 o
dl2 = a2 + r 2
[dθ 2
+ sin 2
(θ)dφ2
] . (3.4)
1 − r2
123
Examinemos a dependência em da Eq. (3.4). Para = 1 temos, como vimos, a 3-
esfera. Se fizermos = 0, reencontramos o espaço plano da Eq. (3.2), que é também
homogêneo e isotrópico, com um fator multiplicativo a2 . O caso = −1 é a terceira
possibilidade de espaço homogêneo e isotrópico, que pode também ser obtido através
de seções hiperbólicas do espaço-tempo de Minkowski
ds2 = dt2 − dr2 − r2 [dθ2 − sin2 (θ)dφ2 ], (3.5)
dadas por a2 = t2 − r2 (verifique). Note que a tem dimensão de comprimento e c é a

velocidade da luz no vácuo.
A Eq. (3.4) representa, portanto, as 3 possibilidades de geometrias espaciais ho-
mogêneas e isotrópicas impostas pelo Princı́pio Cosmológico. Para = ±1, estas
geometrias são curvas, a 3-esfera para = 1 e o 3-hiperbolóide para = −1.
Como seria a geometria do espaço-tempo cosmológico? Temos que acrescentar à Eq.
(3.4) a dimensão tempo. Poderı́amos ter um termo N 2 (t)dt2 (note que a função N
não pode depender das coordenadas espaciais senão perderı́amos a homogeneidade).
Entretanto, pode-se redefinir o tempo dt̄ ≡ N (t)dt de tal maneira a fazer N = 1.
Termos do tipo dtdxi (xi representa as 3 coordenadas espaciais) também não podem
existir pois senão a geometria não seria invariante por inversões xi → −xi , perdendo
sua propriedade de isotropia. Assim, a geometria mais geral possı́vel compatı́vel com
homogeneidade e isotropia é dada por
n dr2 o
ds2 = dt2 − a2 (t) + r 2
[dθ 2
+ sin 2
(θ)dφ2
] . (3.6)
1 − r2
Note que a única função arbitrária a ser determinada pelas equações de Einstein no
caso do universo isotrópico e homogêneo é o fator de escala a(t). Note que temos duas
possibilidades com relação às unidades. Podemos considerar as coordenadas espaciais
sem unidades e jogar as unidades de comprimento em a(t), ou conservar as unidades
nas coordenadas, e adimensionalizar o fator de escala fazendo a(t) → a(t)/a(t0 ), onde
t0 é um tempo de referência. Adotaremos aquı́ a segunda possibilidade.
Vamos tentar entender fisicamente o significado da geometria (3.6) e sua relação com
o Universo real. Em primeiro lugar, é fácil verificar da geometria (3.6), através da
equação da geodésica (11.10), que os objetos astronômicos sujeitos apenas ao campo
gravitacional cosmológico e livres de outras forças (seguindo, portanto, as geodésicas
da geometria (3.6)), têm coordenadas espaciais (r, θ, φ) constantes ao longo de sua
história. Por isso as chamamos de coordenadas co-moventes. Assim, a distância espa-
cial entre dois objetos astronômicos só varia de t = t1 =cte. a t = t2 =cte. através
do fator de escala a(t) (veja Eq.(3.6) com dt = 0). A situação é análoga a pontos na
superfı́cie da Terra determinados por suas latitudes e longitudes. Se a Terra inflasse
(através do aumento do raio da Terra a(t)), as latitudes e longitudes destes pontos
permaneceriam as mesmas mas suas distâncias reais aumentariam proporcionalmente
ao incremento em a(t). Sobre marcações de tempo, um mesmo objeto astronômico
teria seu tempo próprio dado, ao longo de sua história, pela coordenada t, chamado
tempo cósmico (veja Eq.(3.6) com dr = dθ = dφ = 0).
A geometria dada pela equação (3.6) é chamada geometria de Friedman, e a ob-
servação mostra que ela descreve bem o universo (ver Capitulo 2). Veremos a seguir
outras propriedades do elemento de linha dado pela Eq.(3.6). Para isso, é conveniente
124
introducir a coordenada χ usando r = σ(χ), onde a função σ vem definida por

 sin χ para = 1,
σ(χ) = χ para = 0,
sinh χ para = −1.

Em função da nova coordenada χ, a Eq.(3.6) se escreve
ds2 = dt2 − a2 (t) dχ2 + σ 2 (χ) dθ2 + sen2 θdφ2 .

(3.7)
Um cálculo direto permite obter as curvaturas contraidas Rµν :

ä
R00 = +3 ,
a
2
ä ȧ 2 σ 00
R11 = +2 − ,
a a a2 σ
2 " 0 2 #
00
ä ȧ 1 σ σ 1
R22 = +2 − 2
+ − ,
a a a σ σ σ
R33 = R22 . (3.8)
As demais componentes são identificamente nulas. O escalar R de curvatura é dado

por
R = R00 + R11 + R22 + R33

" 2
#
ä ȧ2 2 2σ 00 σ 0 1
= 6 +6 2 − 2 + 2 − 2 . (3.9)
a a a σ σ σ
(3)
Chamando R o escalar de curvatura do 3-espaço t=constante, temos
" #
00 02
(3) 2σ σ 1
R ≡ (−2) + 2 − 2 ,
σ σ σ
1 (3)
e pondo ≡ 6
R temos3
ä ȧ2

R=6 + + . (3.10)
a a2 a2
Podemos então obter as componentes
1
Gµν ≡ Rµν − Rδ µν .
2
As únicas não-nulas, são:
2
ȧ
G00 = −3 − 3 2, (3.11)
a a
2
ä ȧ
G11 = −2 − − 2, (3.12)
a a a
2
ä ȧ
G22 = G33 = −2 − − 2,
a a a
(3.13)
3 (3)
Um cálculo direto mostra que, partindo da definição de R, temos que = +1, 0, −1.
125
Desvio para o Vermelho
A propagação de um foton é dada pelo elemento de linha ds = 0. Para um raio

luminoso radial (dθ = dφ = 0) temos, na métrica de Friedman:
dt dr
= ±√ .
a(t) 1 − r2
O sinal depende do sentido da direção de propagação do fóton. Integrando esta ex-
pressão desde um tempo te (tempo de emissão) até um tempo t0 (tempo de observação),
temos: Z t0 Z re
dt dr
= √ = f (re ).
te a(t) 0 1 + r2
Consideremos um segundo raio luminoso que começa a sua trajetória um pequeno
intervalo de tempo após o primeiro (t02 = te + ∆te ). Este segundo raio chegará até nós
no tempo t0 + ∆t0 , onde
Z t0 +∆t0
dt
= f (re ),
te +∆te a(t)
onde a função f (re ) é a mesma nos dois casos, devido a que r é uma coordenada
comovente, e tanto a fonte quanto o observador se movem com o fluido cosmológico.
Subtraindo essas expressões, a considerando as aproximações ∆t0 << t0 e ∆te << te ,
temos
∆t0 ∆te
= .
a(t0 ) a(te )
Se νe é o comprimento de onda da radiação emitida e ν0 é o comprimento de onda
observado, temos
λe ∆te a(te )
= = .
λ0 ∆0 a(t0 )
Considerando o desvio espectral medido por z
λ0 − λe
z≡ ,
λ0
temos
a(t0 )
1+z = .
a(te )
Um desvio para o vermelho implica que a função a(t) é crescente: o Universo se
encontra em expansão. Este é precisamente o desvio medido por E. Hubble em 1929
(veja a Seção 2.2.3).
Horizontes
Dado que existe uma velocidade limite para a propagação de qualquer partı́cula,
devemos considerar o problema seguinte: quais pontos podem enviar sinais luminosas
tais que possam ser recebidas por qualquer observador até o tempo arbitrário t? Us-
ando novamente a função f (r), dada por
Z r
dr0
f (r) = √ ,
0 1 + r02
126
a distancia real entre a origem espacial e uma partı́cula situada em r1 , no tempo t, é
dada por Z r1
dr0
`(t) = a(t) √ ,
0 1 + r02
isto é,
`(t) = a(t)f (r1 ).
A partir da métrica de RW dada na eq.(3.6), o movimento de um fóton emitido
radialmente (dθ = dφ = 0) em direção à origem (isto é, em direção á posição do
observador) é descrito por
t r
dr0
Z Z
dt
=− √ ,
te a(t) re 1 + r02
onde te é o tempo de emissão de um fóton situado no ponto de coordenada re . Daı́,

t re r
dr0 dr0
Z Z Z
dt
= √ − √ .
te a(t) 0 1 + r02 0 1 + r02
Segue então que

Z t
dt
f (r) = f (re ) − .
te a(t)
Vamos supor que a integral no tempo é limitada, isto é,
Z ∞
dt
< ∞,
te a(t)
e converge para o valor finito f0 . Logo, para cada valor do tempo, digamos t0 , existe
uma distância r0 tal que
f (r0 ) = f0 ,
isto é, tal que o fóton emitido em r0 no instante t0 atinge a origem (o observador ali
colocado) em um tempo infinito. Com efeito,
Z ∞
dt
f (r) = f (r0 ) − = f (r0 ) − f0 = 0.
t0 a(t)
Fótons emitidos no instante t0 , e afastados da origem por uma distância f (r) > f (re )
nunca serão observados pelo observador situado na origem. Dessa maneira, f (r0 ) = f0
define uma região chamada horizonte de eventos, pois ela separa eventos observáveis
de eventos para sempre inobserváveis.
Um exemplo de Universo onde esse fenômeno ocorre é dado pela geometria de de
Sitter, cujo elemento de linha pode se escrever como:
ds2 = dt2 − eHt (dx2 + dy 2 + dz 2 ) .
Neste caso, com H = constante,

∞
e−Ht0
Z
dt eHt = = Σ0 .
t0 H
127
Voltemos agora nossa atenção para fenômenos já observados desde a origem dos tempos
(t = 0), ate um dado valor t0 . Um fenômeno arbitrário terá sido observado por um
observador se a distância f (r) se anulou. Temos agora
Z t0
dt
f (r) = f (re ) − .
0 a(t)
Rt
Em t = t0 , as partı́culas afastadas da origem por um valor f (re ) > 0 0 dt/a(t) ainda
não foram observadas (pelo observador na origem).
Rt
A região definida pelo valor f0 = 0 0 dt/a(t) caracteriza, como a expressão análoga
anterior, um horizonte, chamado horizonte de partı́culas. À medida que o tempo passa,
mais e mais partı́culas vão sendo observadas. Se todas serão observadas, isto é, se
Rconheceremos
∞
no futuro toda a região espacial para um dado t, depende do valor de
0
dt/a(t) ser convergente ou não.
3.3 Quantidades Cinemáticas

Até aqui estudamos somente as caracteristicas geometricas do universo FLRW. Para
estudar a fonte de matéria que gera esta geometria é preciso caracterizar de forma
precisa o campo de velocidades associado à matéria.
Tensor de Projeção
Seja v µ um campo vetorial do tipo tempo definido sobre uma variedade espaço-
tempo M4 . Em cada ponto P de M4 , ele determina um sub-espaço tri-dimensional
constituido de vetores ortogonais ao campo de velocidades normalizado v µ :
vµ vν g µν = 1 (3.14)
Se identificarmos este campo vetorial com uma classe de observadores movendo-se com
esta velocidade, o sub-espaço H, determinado pelo conjunto de vetores ortogonais a
v µ , constitui o que chamamos simplesmente ”espaço” - verdadeiramente o tri-espaço
associado ao observador correspondente. Construiremos o tensor hµν de projeção no
tri-espaço H, pela expressão
hµν ≡ gµν − vµ vν . (3.15)
Esse tensor projeta objetos geométricos, como tensores, por exemplo, definidos em M4 ,
no sub-espaço H perpendicular à v µ . É simples mostrar que hµν tem as caracterı́sticas
de um projetor. Com efeito, ele satisfaz as propriedades:
(i) h2 = h. Segue da própria definição
hαβ hβν = (gαβ − vα vβ )(g βν − v β vν ) = gαν − vα vν = hαν .
(ii) h é perpendicular a v µ :. Temos
hαβ v β = gαβ v β − vα vβ v β = 0.
128
Note ademais que hµν é simétrico:
hµν = hνµ .
Podemos então identificar o tensor hµν com a métrica induzida em H pela geome-
tria de M4 . Um observador de velocidade ~v , localizado em um dado ponto P de M4
de coordenadas xα (P ) mede a sua distância a um ponto Q vizinho, de coordenadas
xα (P ) + ∆xα pela forma:
ds2 (P Q) = gµν dxµ dxν = hµν dxµ dxν + (vµ dxµ )2 (3.16)
A distância de P a Q separa-se em uma parte puramente espacial d` =

(−hµν dxµ dxν )1/2 e um intervalo de tempo dt = vµ dxµ . Assim, hµν determina sobre
H uma afinidade métrica (3) Γαµν [6]
(3)
Definimos o operador ∇µ que atua em H segundo a expressão
(3)
∇µ Wλ ≡ hαµ hλ β ∇α Wβ .
Tal operação gera um tensor Bµλ ≡(3) ∇µ Wλ que pertence a H. Com efeito, v λ Bµλ = 0
e também v µ Bµλ = 0 .
Um cálculo simples permite mostrar que a conexão (3) Γαµν está associada à métrica hµν
no tri-espaço H, pois
(3)
∇µ hβν = 0.
Com efeito, temos
(3)
∇µ hβλ = hµα hβσ hλρ ∇α hσρ = −hµα hβσ hλρ ∇α (Vσ Vρ ) = 0.
Parâmetros Óticos
Para descrever a matéria contida no universo precisamos escolher um referencial.

Uma escolha conveniente é o referencial em movimento com o fluido cosmológico. Ver-
emos a seguir que a derivada covariante de v µ 4 pode ser decomposta em termos das
quantidades que caracterizam o fluido: a expansão, a vorticidade, e o shear (cisal-
hamento). Consideremos um conjunto de curvas Γ que interceptam H na vizinhança
de um ponto arbitrário P de H. Iremos calibrar os valores do parâmetro afim si sobre
cada curva de tal modo a que em H os valores desses parâmetros - que chamaremos de
tempo próprio - coincidam. Chamamos vetor conexão, e denotamos por ~η , o vetor que
liga duas curvas da congruência Γ com o mesmo valor de s. No caso acima, ~η consiste
em um vetor pertencente a H. Podemos estender esta definição e considerar o vetor
conexão como aquele que une duas curvas com o mesmo valor do parâmetro afim s,
sem impor necessariamente a condição de que tal vetor seja ortogonal às curvas. É
possı́vel mostrar que a velocidade de afastamento dos pontos P e P + dP em H é dada
por [7]
α
v(rel) = Qαµ η µ ,
onde o tensor Qαµ vem definido pela expressão
Qαµ = hαβ hµλ v β;λ .

4
Lembre que v µ é o vetor tangente à linha mundo das ”partı́culas de fluido”.
129
Usando o teorema de decomposição de tensores em partes irredutı́veis, podemos escr-
ever
θ
Qαβ = hαβ + σαβ + ωαβ , (3.17)
3
onde σαβ é tensor simétrico de traço nulo e ωαβ tensor anti-simétrico. Segue que
1 1
ωαβ = (Qαβ − Qβα ) = h[αµ hβ]λ vµ;λ , (3.18)
2 2
1 µ λ 1
σαβ = h h vα;λ − θhαβ , (3.19)
2 [α β] 3
θ = hαλ vα;λ = v α ;α . (3.20)
Vemos que os tensores σµν e ωµν pertencem a H. Com efeito, das definições acima
segue que σµν v µ = 0, e ωµν v µ = 0 Podemos então escrever
θ
hαβ hµλ vα;µ = hβλ + σβλ + ωβλ . (3.21)
3
Desenvolvendo o lado esquerdo temos
(δ αβ − v α vβ )(δ µλ − v µ vλ )vα;µ = δ αβ δ µλ − δ αβ v µ vλ − v α vβ δ µλ + v α v µ vβ vλ vα;µ

= vβ;λ − v̇β vλ − vα;λ v α vβ + v̇α v α vβ vλ .
Levando em conta que vα;λ v α = 0, temos que
hαβ hµλ vα;µ = vβ;λ − v̇β vλ , (3.22)
onde o ponto significa derivação na direção vα :
v̇β ≡ vβ;α v α .
O modelo descrito pela métrica (3.7)) é isotrópico, irrotacional, e apresenta expansão,

já que o fluido de matéria que lhe dá origem possui σµν = 0, ωµν = 0 e θ 6= 0. Estas
propriedades podem ser demonstradas do seguinte modo. Consideremos um observador
comovente com o fluido, isto é, tal que no sistema de coordenadas (t, χ, θ, φ) seu vetor
velocidade tenha componentes
v µ = δ µ0 (3.23)
Definimos anteriormente o projetor no tri-espaço ortogonal a v µ como
hµν = gµν − vµ vν .
Da expressão (3.19) temos

1 θ
σαβ = h(αµ hβ)λ Vµ;λ − hαβ ,
2 3
isto é,
1 θ
σαβ = − h(αµ hβ)λ Γεµλ Vε − hαβ ,
2 3
ou seja
σµν = 0. (3.24)
Isso significa que para o observador co-movente v µ = δ µ0 o Universo de Friedmann é
isotrópico.
130
Propagação das Quantidades Cinemáticas
Vamos examinar as equações de evolução dos parâmetros θ, σµν e ωµν ao longo da

congruência Γ. Da definição do tensor de curvatura, temos
vα;β;γ − vα;γ;β = Rαεβγ v ε .
Multiplicando por v γ temos:
(vα;β )· − vα;γ;β v γ = Rαεβγ vεv γ .
Mas,
vα;γ;β v γ = (vα;γ v γ );β − vα;γ v γ ;β =

= (v̇α );β − vα;γ v γ ;β ,
ou, definindo v̇α ≡ aα , escrevemos:
(vα;β )· − aα;β + vα;γ v γ ;β = Rαεβγ v ε v γ .
Projetando no espaço H, tem-se:
hαµ hβν (vµ;ν )· − hαµ hβν aµ;ν + hαµ hβν vµ;γ v γ ;ν = Rµενγ v ε v γ hµα hνβ , (3.25)
ou, usando (12) e a definição (8) de Qαµ :
hαµ hβν (Qµν +aµ vν )· −hαµ hβµ aµ;ν +hαµ hβν (Qµγ +aµ vγ )(Qγν +aγ aµ ) = Rαεβγ v ε v γ . (3.26)
Daı́,
hαµ hβν Q̇µν + aµ aν hαµ hβν − hαµ hβν aµ;ν + +hαµ hβν Qµγ Qγν + hαµ hβ aµ vγ Qγν = Rαεβγ v ε v γ .
(3.27)
µ
Lembrando que aµ Q ν = 0, obtemos finalmente,
hαµ hνβ Q̇µν + aα aβ − hαµ hνβ aµkν + Qαγ Qγβ = Rαεβγ v ε v γ . (3.28)
Essa expressão contém toda informação necessária para a obtenção da evolução

dos parâmetros cinemáticos. A seguir apresentaremos a equação de evolução de θ,
deixando as outras para o apêndice.
Equação de Evolução de θ
Contraindo a equação (3.28) nos ı́ndices α e β, tem-se
hµν Q̇µν + aα aα − hµν aµkν + Qαµ Qµα = Rµν V µ v ν .
Mas
hµν Q̇µν = (hµν Qµν )· − ḣµν Qµν

= (Qµµ )· + aµ v ν Qµν + aν v µ Qµν = (Qµµ )· .
Lembrando a expressão de Qµν , temos
Qαβ = hαµ hβν vµ;ν ,

Q = Qαβ g αβ = hµν vµ;ν = v µ ;µ − v µ v ν vµ;ν = v µ ;µ ,
131
isto é, Q = θ Daı́, temos
θ̇ + aµ aµ − aµkµ + aµ;ν v ν v µ + Qαµ Qµα = Rµν v µ v ν .
Mas

µα θ θ µα
Qαµ Q = hαµ + σαµ + ωαµ h + σ µα + ω µα =
3 3
θ2
= + σµα σ µα + ωαµ ω µα .
3
Definiremos as normas σ 2 , ω 2 :
1
σ2 ≡ σµν σ µν ,
2
1
ω2 ≡ ωµν ω µν .
2
Daı́,
θ2
Qαµ Qµα = + 2σ 2 − 2ω 2 .
3
Então
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ + ȧµ v µ + aµ aµ = Rµν v µ v ν .
3
Mas,
ȧµ v µ = (aµ v µ )· − aµ aµ = −aµ aµ .
Tem-se, finalmente:
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ = Rµν v µ v ν . (3.29)
3
A equação (3.29) determina a evolução do parâmetro θ ao longo da curva e é conhecida,
em Cosmologia, como equação de Raychaudhuri. Ela pode ser usada para demostrar
que o universo descrito pela solução de Friedman é singular, assumindo a validade de
algumas hipóteses, como por exemplo a chamada condição de energia forte, dada por
ρ+3p > 0. É importante notar que a inevitabilidade da existência de uma singularidade
inicial tem sido contestada em diversas ocasiões ao longo da história da cosmologı́a.
De fato, existem modelos que não apresentam singularidade (veja mais adiante).
3.4 Fontes da Curvatura do Espaço-Tempo

Uma das questões mais fundamentais em Cosmologia consiste em procurar estab-
elecer as propriedades do fluido cósmico responsável pela curvatura do espaço-tempo
global. A existência de processos dinâmicos e a própria dependência com o tempo
cósmico das propriedades globais do Cosmos sugerem a caracterização de distintas
épocas na história do Universo. Cada uma dessas épocas está associada a um partic-
ular tipo de conteúdo material que domina sobre os demais sendo assim o principal
responsável, naquele perı́odo, pela curvatura do espaço-tempo. Embora a caracter-
ização final dessas épocas não tenha sido estabelecida definitivamente, podemos com
boa aproximação distinguir algumas fases no Universo representadas por distribuições
especı́ficas da energia.
132
Nesta Seção apresentaremos a teoria geral do fluido cósmico, bem como estudaremos
a expressão da energia gerada por campos escalar, vetorial, etc., em um espaço de
Riemann arbitrário. Deixaremos a discussão da caracterização das diversas fases do
nosso Universo para outro lugar.
Decomposição do tensor energia-momento
Consideremos o vetor v µ do tipo-tempo normalizado
v µ v ν gµν = +1.
Utilizando essa velocidade, podemos separar o tensor de energia-momento (simétrico)

do fluido, Tµν em suas partes irredutı́veis:
Tµν = ρvµ vν − phµν + qµ( vν) + πµν , (3.30)
onde (ρ) é a densidade de energia total do fluido, (p) é a pressão isotrópica, (q µ )

representa a propagação de calor, e πµν é a pressão não isotrópica. Tal decomposição
de Tµν não se limita a um fluido especial mas pode ser realizada indistintamente
para qualquer configuração, mesmo se estivermos tratando com campos de radiação.
Adiante mostraremos como realizar essa decomposição para campo eletromagnético,
escalar, etc.
Os tensores qµ e πµν satisfazem os vı́nculos
qµ v µ = 0,
πµν v µ = 0,
πµν g µν = 0,
πµν = πνµ .
A partir destas propriedades obtemos da equação (3.30)

1
ρ = Tµν v µ v ν ; p = Tµ· ν hµν ;
3
qλ = Tαβ v β hαλ ; πµν = Tαβ hαµ hβν + phµν .
Conservação da Energia
A expressão co-variante da conservação local de energia, se escreve
T µν;ν = 0. (3.31)
Vamos projetar essa equação vetorial, paralela e ortogonalmente ao vetor v µ obtendo

dessa forma as equações da variação da densidade de energia com o tempo (medido
como parâmetro ao longo da trajetória do observador de velocidade v µ ), e a gen-
eralização para o espaço de Riemann da equação de Navier-Stokes. Multiplicando a
equação (3) por vµ e substituindo a forma geral (1), temos
(ρv µ v ν );ν vµ − (phµν );ν vν + (q µ v ν + q µ v ν );ν v µ + π µν;ν vµ = 0.
Desenvolvendo por partes, temos:
(ρv µ v ν );ν vµ = ρ̇ + ρθ,
133
onde
ρ̇ ≡ v µ ∂µ ρ ,
(phµν );ν vµ = −pθ,
(q µ v ν + q ν v µ )kν vµ = q̇ µ vµ + q νkν + q ν v µkν vµ = q̇ µ vµ + q µkµ ,
Pois, temos
v µ;µ vµ = 0.
E o quarto termo dará
π µν;ν vν = (π µν vµ );ν − π µν vµ;ν

= −π µν σµν . (3.32)
Colectando os diferentes termos, tem-se a equação de conservação de energia:
ρ̇ + (ρ + p)θ + q̇ µ vµ + q µ;µ − π µν θµν = 0. (3.33)
Vamos agora projetar a equação (3) no 3-espaço ortogonal a v µ (o espaço H, conforme

Seção 3.3).
T µν;ν hµα = 0.
Por partes, temos
(ρv µ v ν );ν hµα = ρv̇ µ hµα = ρv̇α ,

− (phµν );ν hµα = −p,ν hνα + pv̇α ,
(q µ v ν );ν hµα = θqα + q̇ µ hµα
(q µ v µ );ν hµα = q ν θνµ + q ν ωαν
π µν;ν hµα = πα;νν
+ π µν θµν vα . (3.34)
Coletando os termos teremos
(ρ + p)v̇α − p,µ hµα + q̇µ hµα + θqα + q ν θαν + q ν ωαν + πα;ν

ν
+ π µν σµν vα = 0. (3.35)
As equações (3.33) e (3.35) constituem a expressão da lei de conservação de energia e

momento e serão utilizadas amplamente a seguir. Particular ênfase será dado a fluidos
perfeitos, isto é, àqueles em que a pressão é isotrópica (πµν = 0), e não há fluxo de
calor (qα = 0), isto é, quando pudermos escrever:
Tµν = ρvµ vν − phµν . (3.36)
Neste caso, as leis de conservação (3.33) e (3.35) reduzem-se às formas simples:
ρ̇ + (ρ + p)θ = 0, (3.37)
p,µ hµα = 0. (3.38)
A primeira equação é conseqüência da aplicação da primeira lei da termodinâmica
T dS = dE + pdV,
ao caso do universo descrito pela métrica de Friedman, para o qual o volume é pro-
porcional à a(t)3 , e a expansão é adiabática (S =constante).
134
Na investigação de um modelo idealizado capaz de representar o fluido cósmico, somos
levados a considerar equações de estado que estabelecem dependência funcional da
pressão com a densidade de energia. Supondo uma equação de estado barotrópica,
p = p(ρ) em particular, consideraremos dependência linear de p com ρ:
p = λρ,
com o valor de λ limitado ao domı́nio 0 < λ < 1. O valor λ = 0 corresponde à matéria

incoerentemente distribuida (p = 0) e o limite λ = 1 é dado pela condição de que a
velocidade do som
∂p
Vs =
∂ρ S=constante
não pode exceder à velocidade de luz (c = 1).
Vamos agora fazer um exercı́cio para esclarecer o papel do observador na expressão
da equação de estado de um fluido. Consideremos um fluido perfeito caracterizado por
(ρ, p) para um dado observador v µ com p = λρ e por ρe, pe, com pe = λ
e ρe para um outro
µ
observador ve . Pergunta: em que circunstâncias o valor de λ não muda? Antes de
responder a esta questão consideremos o caso genérico de transformação. Temos para
o observador v µ a expressão
Tµν = (ρ + p) vµ vν − pgµν , (3.39)
onde
ρ = Tµν v µ v ν ,
e
1
Tµν (g µν − v µ v ν ).
p=
3
Um segundo observador, com velocidade veµ decompõe o mesmo tensor momento-
energia sob a forma
ρ + pe) veµ veν − pegµν ,
Tµν = (e (3.40)
onde
ρe = Tµν veµ veν ,
e
1
pe = Tµν (g µν − veµ veν ).
3
A questão que queremos responder envolve a relação entre λ e λ e onde p = λρ e pe = λe
eρ.
Temos a relação
(ρ + p) vµ vν − pgµν = (e
ρ + pe) veµ veν − pegµν (3.41)
Multiplicando por veµ veν e definindo β ≡ v µ veµ obtemos
ρe = β 2 − β 2 λ − λ ρ

(3.42)
isto é
1 2
β λ − β 2 + 1 − 2λ ,

pe = (3.43)
3
Finalmente
2 2
e = 1 β λ − β + 1 − 2λ .
λ (3.44)
3 β 2 − β 2λ − λ
135
Podemos agora responder à pergunta anterior sobre qual o valor de λ para o qual
qualquer observador atribui o mesmo valor. Segue desta expressão acima que isso
ocorre para λ = − 1. Um tal fluido com a equação de estado p = −ρ é chamado
de vácuo. Em 1917, Einstein modificou as equações da RG adicionando um termo
proporcional à métrica:
1
Rµν − gµν R + Λgµν = Tµν , (3.45)
2
onde Λ é a constante cosmológica.
O que dizer sobre a parte material? Qualquer fluido pode ser caracterizado por uma
densidade de energia, uma pressão isotrópica, pressões anisotrópicas e fluxo de calor.
Com a suposição de isotropia, pressões anisotrópicas e fluxo de calor (que indicaria
uma direção privilegiada) não devem existir. A hipótese de homogeneidade implica
que tanto a densidade de energia quanto a pressão isotrópica devam ser funções só do
tempo, denotadas a partir de agora por ρ(t) e p(t), respectivamente. Atualmente, as
partı́culas que formam esse fluido seriam aglomerados de galáxias com pouca interação
entre si, e portanto pressão praticamente nula. Na situação onde as escalas de distância
são bem menores, quando não existem gláxias mas partı́culas fundamentais e radiação
em equilı́brio térmico, a pressão seria relevante. Sendo ela dada, aproximadamente, por
p = ρ < v 2 > /3c, onde < v 2 > representa o valor médio do quadrado das velocidades
dos constituintes do fluido e c a velocidade da luz, terı́amos que, em situações de alta
temperatura onde tais partı́culas teriam velocidades próximas da velocidade da luz,
p ≈ ρ/3 (correções relativı́sticas não alteram este resultado), muito próximo de um
gás de fótons, onde p = ρ/3 exatamente.
Qual a relação entre a densidade de energia e o fator de escala para o caso de poeira
e radiação? Para a poeira, se há conservação de massa, então ρ x volume ∝ ρa3 =cte.
Para radiação, se há conservação do número de fótons com frequência ν, N (ν) =cte.
(hipótese bastante razoável na maior parte da história do Universo), teremos que
ρ(ν) = N (ν)hν/volume, onde hν é a energia de um fóton de frequência ν (h é a
constante de Planck). Mas o comprimento de onda de um fóton é diretamente propor-
cional ao fator de escala (como segue da Eq.2.2), e portanto a sua frequência e energia
inversamente proporcional a este. Assim, ρa4 = cte. Concluindo temos, para poeira
ρp = cp /a3 e para radiação ρr = cr /a4 , onde cr e cp são constantes. Estas relações
poderiam ter sido obtidas a partir da equação relativı́stica de conservação de energia
numa geometria dada pela Eq.(3.6)
ȧ
ρ̇ + 3 (ρ + p) = 0, (3.46)
a
substituindo-se na mesma as equações de estado p = 0 e p = ρ/3, correspondentes à
poeira e radiação, respectivamente. No caso de uma equação de estado geral, dada por
p = ωρ, com ω arbitrario, a equação (3.46) pode ser integrada, dando como resultado
ρa3(1+ω) = const. (3.47)
3.5 Modelos Cosmológicos

Vamos considerar a geometria de Friedman e estudar as diferentes possibildades de
evolução do fator de escala a(t) para diferentes formas do tensor de energia-impulso.
Das equações de Einstein,
Gµν = −Tµν ,
136
e das expressões (3.13) e (3.36) seguem as equações
2
ȧ 3ε
3 + 2 = 8πGρ + Λ, (3.48)
a a
ä 4πG Λ
=− (ρ + 3p) + , (3.49)
a 3 3
já exibidas no Capı́tulo 2. Junto com estas podemos considerar a conservação da
energia, dada na eq.(3.46). Da identidade de Bianchi
Gµν;ν ≡ 0,
segue que estas três equações não são independentes. Quando a constante cosmológica
Λ é nula, podemos caracterizar a seção espacial do modelo cosmológico, através de
uma medida da densidade de energia contida no Universo. Com efeito, temos (quando
Λ = 0)
8πGρ 2
= a − ȧ2 . (3.50)
3
Definindo uma densidade critica ρc pela relação
2
3 ȧ 3H 2
ρc = ≡ , (3.51)
8πG a 8πG
podemos escrever (3.50) sob a forma
a2
= (ρ − ρc ) . (3.52)
3
Vemos desta equação que o sinal de ρ − ρc implica em tres possibilidades:
ρ > ρc =⇒ > 0 =⇒ = 1,
ρ = ρc =⇒ = 0,
ρ > ρc =⇒ < 0 =⇒ = −1.
onde a normalização da constante é simplesmente uma questào de convenção. A

densidade crı́tica ρc caracteriza assim uma situação limite.
3.5.1 Modelo Cosmológico de Einstein

A proposta de descrição do universo por Einstein (1917) partiu da hipótese
apriorı́stica de que o universo é estático. A matéria, fonte principal da curvatura
do espaço-tempo quadri-dimensional é descrita por um fluido incoerente (isto é, sem
qualquer interação entre suas partes) de densidade ρ e velocidade v µ = δ µ0 em um
sistema de coordenadas comovente com o fluido. O universo de Einstein não pos-
sui nem rotação, nem expansão, nem deformação. Ele é estático. Não tem começo
nem fim, não evolui. Vamos descrevê-lo começando por mostrar que um universo com
tais caracterı́sticas é incompatı́vel com as equações originais (1915) de Einstein da
gravitação.
Com efeito, a equação de Raychaudhuri (3.29) para um fluido sem aceleração, sem
deformação, sem rotação e sem expansão se reduz a
Rµν v µ v ν = 0. (3.53)
137
A partir das equações de Einstein
1
Rµν = −Tµν + T gµν , (3.54)
2
temos que
1
Rµν V µ V ν = −Tµν V µ V ν +
T.
2
Para um fluido perfeito, sem pressão, o tensor momento-energia assume a forma
Tµν = ρVµ Vν = ρ δµ0 δν0 .
Dai
ρ
Rµν v µ v ν = − ,
2
que é incompatı́vel com a eq. (3.53), mostrando que as propriedades cinemáticas im-
postas a priori para o fluido cósmico no modelo de Einstein são incompatı́veis com
uma densidade de matéria diferente de zero. Para identificar tal modelo como rep-
resentativo do nosso cosmos, Einstein foi levado a alterar suas equações originais da
gravitação com a introdução de uma constante cósmica fundamental que foi repre-
sentada pela letra grega Λ. Assim, as equações que descrevem a gravitação a longas
distâncias deveriam ser distintas das equações gravitacionais em nossa vizinhança, isto
é, para distâncias não-cósmicas (por exemplo no Sistema Solar). O modo mais simples
de alteração das equações originais de Einstein conduziu à expressão:
1
Rµν − Rgµν + Λgµν = −Tµν , (3.55)
2
onde Λ tem dimensão de (comprimento)−2 . Equivalentemente, escrevemos:
1
Rµν = −Tµν + T gµν + Λgµν . (3.56)
2
Note que para que a energia se conserve (isto é, para que a divergência covariante de
Tµν se anule, T µν;ν = 0) é preciso que Λ seja uma constante. Com a nova expressão eq
(3.56) tem-se
1
Tµν − T gµν − Λgµν v µ v ν = 0,
2
isto é,
ρ = 2Λ , (3.57)
mostrando assim a possibilidade de compatibilização das novas de equações de
gravitação com um fluido estacionário. A metrica da geometria de Einstein é dada
por
ds2 = dt2 − a2 dχ2 + σ 2 (χ) dθ2 + sen2 θdφ2 ,

(3.58)
onde a é uma constante e σ(χ) uma função, a única a ser determinada para o conheci-
mento completo desta geometria. Usando as equações (3.8),(3.9), e seguintes obtemos,
da equação (3.55), Componente (0 − 0) :
3
= 8πGρ + Λ. (3.59)
a2
Componente (1 − 1) : 00
1 σ
2 + 3 = Λ. (3.60)
a2 σ
138
Componente (2 − 2) :
1 σ 00
= −Λ. (3.61)
a2 σ
Destas equações seguem os resultados
σ = senχ, (3.62)
1
Λ = 2. (3.63)
a
(3)
Usando esses valores na definição da curvatura espacial R,
(3) σ 00 2 σ02
R=4 − 2 + 2 2 = 6,
σ σ σ
encontramos
= 1,
e de (3.59) a relação encontrada anteriormente:
Λ
ρ= .
4πG
Assim, a positividade da energia implica que Λ deve ser uma quantidade positiva.
Finalmente, a métrica de Einstein se escreve:
1 2
ds2 = dt2 − dχ + sen2 χ dθ2 + sen2 θdφ2 .

(3.64)
Λ
O domı́nio das variáveis é dado por −∞ < t < +∞; 0 < χ < π; 0 < θ < π;
0 < φ < 2π. É fácil ver que o volume do universo de Einstein é independente do
tempo e dado por V = 2π 2 Λ−3/2 .
3.5.2 Modelos Cosmológicos de Lemaı̂tre

Por volta de 1920, o belga G. Lemaı́tre estudou modelos cósmicos homogêneos e
isotrópicos nos quais a constante cosmológica Λ é não nula. Vamos examinar aqui
algumas propriedades desses modelos.
Começamos por considerar o caso no qual a densidade de energia da matéria é de-
sprezı́vel, comparada com o valor de Λ. As equações de Einstein neste caso se escrevem
2
ȧ 3
3 + 2 = −Λ, (3.65)
a a
2
ä ȧ 1 σ 00
+ + 2 = −Λ. (3.66)
a a a σ
Analisemos separadamente os três possı́veis valores de ε.
Caso I: Seção Euclideana (ε = 0; σ = χ). Temos, neste caso:

2
ȧ
3 = −Λ, (3.67)
a
2
ä ȧ
3 + = −Λ. (3.68)
a a
139
De (3.67) vemos que o modelo sera compatı́vel se Λ < 0. As equações (3.67) e (3.68)
são facilmente integráveis. Obtemos
√ Λ
a(t) = a0 e − 3 t. (3.69)
Neste caso, a expansão θ = 3ȧ/a se reduz a uma constante:
√
θ = −2Λ.
Esta geometria foi descoberta por de Sitter em 1917, e constituiu durante bastante
tempo um modelo cosmológico competitivo com os modelos expansionistas de Fried-
man.
Caso II: Seção Aberta (ε = −1; σ = senχ). A solução do sistema de equações neste
caso, dado por
2
ȧ 3
3 − 2 = −Λ,
a a
2
ä ȧ 1
2 + − 2 = −Λ,
a a A
depende do sinal da constante cosmológica. Se Λ < 0, temos:
s r !
3 |Λ|
a(t) = sinh t ,
|Λ| 3
e, consequentemente "r #
p |Λ|
θ = 3|Λ| coth t .
3
Se Λ > 0, a solução para a(t) é dada por
r r !
3 Λ
a(t) = sen t ,
Λ 3
e para a expansão: "r #
√ Λ
θ= 3Λ cot g t .
3
Caso III: Seção Fechada (ε = 1; σ = senχ). Temos as equações:
2
ȧ 3
3 − 2 = −Λ,
a a
2
ä ȧ 1
2 + − 2 = −Λ.
a a a
A solução é dada par s r !
3 |Λ|
a(t) = sinh t .
|Λ| 3
Note que como consequência da equação
2
ȧ 3
3 − 2 = −Λ
a a
a constante cosmológica, neste caso, não pode ser positiva.
140
3.5.3 Modelo cosmológico de Friedman
Como vimos anteriormente, o conteúdo material do univeso pode ser modelado usando
um fluido perfeito. As equações de Einstein, dadas por Gµν = 8πGTµν para a métrica
de Friedman e tendo um fluido perfeito como fonte, incluindo a constante cosmologica,
são dadas por: 2
ȧ 8πG
+ 2 = ρ, (3.70)
a a 3
4 p
ä = − πG ρ + 3 2 a, (3.71)
3 c
onde ρ e p são a densidade de energia e a pressão totais (incluindo a constante cos-
mológica). Conforme discutido anteriormente, distingue-se três periodos distintos na
evoluç ao do universo, caracterizados por diferentes fontes da curvatura. Primeira-
mente, consideraremos uma fase de radiação na qual p = 1/3 ρ), em seguida uma
fase de poeira ou matéria incoerente onde p = 0, e finalmente uma fase de expansão
acelerada, causada pela “energia escura”. Nas considerações que seguem modelare-
mos a fase atual usando a constante cosmológica como energia escura. Somando estas
contribuições podemos escrever
2
8πG ρ0m ρ0r

ȧ Λ
+ 2 = + 4+ , (3.72)
a a 3 a3 a 8πG
onde ρ0m e ρ0r são a densidade de matéria e radiação em algum momento da evolução .
Definindo as quantidades
ρm
Ωm = ,
ρc
ρr
Ωr = ,
ρc
Λ
ΩΛ = , (3.73)
8πGρc
podemos escrever
8πGa2 ρc
= (Ωm + Ωr + ΩΛ − 1) . (3.74)
3
Assumindo uma equação de estado p = ωρ, podemos encontrar a forma genérica do
fator de escala. Como vimos em (3.47),
ρ ∝ a−3(1+ω) .
Note que para tempos pequenos, se ω > −1/3, podemos desprezar o termo /a2 frente
aos termos de matéria na equação (3.70) e ao termo da constante cosmológica. Assim,
podemos integrar a (3.70):
a(t) ∝ t2/3(1+ω) . (3.75)
No universo primitivo, podemos supor que as partı́culas são relativı́sticas, com ω =
1/3. Da (3.75),
ar (t) ∝ t1/2 .
Para tempos mais longos, é a matéria não relativı́stica quem domina o lado direito da
(3.70), com ω = 0. Supondo que = 0 obtemos
am (t) ∝ t2/3 .
141
3.5.4 Análise geral
A equação de Friedmann (3.72) com poeira, radiação e constante cosnológica, para
arbitrário pode ser escrita da seguinte forma:
8πG ρ0r ρ0m Λa2

ȧ(t)2 = + − + . (3.76)
3 a2 a 3
Da equação acima vê-se que a radiação domina para a muito pequeno, seguida, para
a crescente, da poeira, termo de curvatura e constante cosmológica. Vejamos como
essa equação pode ser entendida como uma equação de conservação de energia.
Lembremos que no caso de uma partı́cula em movimento unidimensional, m2 ẋ2 +V (x) =
E, ou
2
ẋ2 = (E − V (x)).
m
Comparando com a (3.76), vemos que trata-se do análogo de uma partı́cula de cuja
“posição ” vem dada por a, com massa m = 1, energia E = −/2, e potencial
4πG ρ0r ρ0m Λa2

V (a) = − + − . (3.77)
3 a2 a 6
Analizaremos qualitativamente a variação deste potencial com a para determinar os
possı́veis comportamentos do fator de escala. Consideraremos primeiramente Λ > 0.
Para a → 0, V (a) → −∞ e para a → ∞, V (a) → −∞. Portanto, este potencial tem
um máximo. Como veremos na próxima seção, a poeira rapidamente domina sobre a
radiação. Sendo assim, podemos desprezar o termo de radiação no cálculo do máximo
deste potencial, que acontece para um valor de a grande o suficiente para que ele seja
desconsiderado. Cálculos simples fornecem a3max = 4πGcp /(Λ) e V (amax ) = −Λa2max .
Podemos expressar ρ0m em função de Ω0p e Ω0Λ , obtendo:
1/3
Ω0Λ Ω0p 2/3
V (amax ) = − , (3.78)
|Ω0 − 1| 2
onde Ω0 ≡ Ω0Λ + Ω0p . Com os valores observados das quantidades Ω hoje, a saber,
Ω0 = 1.010+0.018
−0.017 , (3.79)
Ω0p = 0.27+0.03
−0.04 , (3.80)
e
Ω0Λ = 0.70+0.04
−0.03 , (3.81)
vemos que V (amax ) < −1. Assim, no cenário idealizado de Friedman o universo,
para qualquer que seja o valor de o Universo se expande desaceleradamente desde a
singularidade presente neste modelo a = 0 até amax , passando então, a partir daı́, a se
expandir aceleradamente. De fato, é este tipo de comportamento que as observações
vêm indicando. Para este modelo, a idade do Universo seria dada por (veja Exerı́cio)
1/2
2 −1 −1/2 h 1 + Ω0Λ i
t0 = H0 Ω0Λ ln 1/2
, (3.82)
3 1 − Ω0Λ
Segue então, para Ω0Λ = 0.69 e h = 0.66, um valor de t0 de 14.5 bilhões anos.
adicionar exercicio: análise geral do potnecial (do d’inverno)
142
3.6 Modelos cosmológicos com menos simetria
Na investigação das possı́veis estruturas métricas do Universo, encontramos dois
tipos caracterı́sticos de modelos. Chamamos modelo convencional àquele que admite
como fonte principal de curvatura um fluido perfeito (incluindo o vazio); e denotamos
modelo não-convencional os demais. Não deve causar espanto o fato de que modelos
convencionais, possuindo uma fonte tão simples, tenham sido historicamente descober-
tos numa primeira fase da investigação cosmológica, e que os não convencionais tenham
história mais recente. Nesta seção trataremos dos modelos descobertos por Gödel e
Kasner.
Como foi discutido, o tensor momento-energia do fluido cósmico é descrito por:
Tµν = (ρ + p)vµ vν − pgµν , (3.83)
onde ρ é a densidade total de energia, v µ é o quadri-vetor velocidade do fluido, e p

é a pressão isotrópica. Os modelos tratados na seção anterior e os que trataremos
nesta podem ser caracterizados de um modo bastante simples através do valor dos
parâmetros cinemáticos do fluido, segundo se mostra no tabela 1.
Modelo
Cosmológico Expansão Rotação Deformação
Einstein Não Não Não
Friedmann Sim Não Não
Kasner Sim Não Sim
Gödel Não Sim Não
Tabela 3.1: Quantidades cinemáticas associadas a modelos cosmológicos.
3.7 Modelo Cosmológico de Kasner (1921)

Embora o estágio atual do nosso Universo seja bastante isotrópico, um perı́odo não-
isotrópico pode ter ocorrido na história do Cosmos. Entre os argumentos que foram
examinados nesse sentido, podemos destacar o seguinte. Vimos na Sec.(3.2) que mod-
elos homogêneos isotrópicos possuem horizonte. Isso significa que para um dado t,
diferentes regiões espaciais não poderiam trocar informações e consequentemente não
poderiam ser homogeneizadas por mecanismos fı́sicos tipo interações entre partı́culas.
Uma possı́vel saı́da dessa dificuldade seria admitir uma fase anisotrópica inicial que
(devido a processos fı́sicos a serem determinados) evoluiria no sentido de eliminação
da dilatação ou shear. Um modelo anisotrópico tı́pico foi encontrado pelo matemático
Kasner, já em 1921. Ele representa um universo idealizado no qual a participação da
matéria na criação de curvatura é desprezı́vel: a curvatura se sustenta a si própria 5 .
A métrica de Kasner se escreve sob a forma:
ds2 = dt2 − a2 (t)dx2 − b2 (t)dy 2 − c2 (t)dz 2 . (3.84)

5
Note que esta é uma propriedade exclusiva das equações não lineares.
143
Escolhendo uma base de tetradas ortonormalizadas eA
µ tal que
e0µ = δµ0
e1µ = a(t)δµ1
e2µ = b(t)δµ2
e3µ = c(t)δµ3
obtemos as componentes não-nulas da curvatura na base de tetrada:
0 ȧ
R101 =
a
0 ḃ
R202 =
b
0 ċ
R303 =
c
0 ȧ ḃ
R212 = (3.85)
ab
0 ȧ ċ
R313 =
ac
0 ḃ ċ
R313 =
bc
onde definimos as componentes das tetradas para um tensor X AB pela relação
X AB = eA B µν
µ eν X .
Contraindo,
ä b̈ c̈
R00 = +
a bc !
ä ȧ ḃ ċ
R11 = + + (3.86)
a a b c

2 b̈ ḃ ȧ ċ
R2 = + +
b b a c
!
c̈ ċ ȧ ḃ
R33 = + +
c c a b
As equações de Einstein para o vazio se escrevem como
RAB = 0 (3.87)
144
Kasner propôs uma solução dessas equações sob a forma de potências de t. Ponhamos
a(t) = tp1
b(t) = tp2 (3.88)
c(t) = tp3
onde pl , p2 , p3 são constantes. As únicas relações entre elas, impostas por (3.87) dão
(faça como exercı́cio)
p1 + p2 + p3 = 1 (3.89)
(p1 )2 + (p2 )2 + (p3 )2 = 1 (3.90)
Podemos observar logo que um desses pk é negativo e os outros dois positivos. Ademais,
o domı́nio deles pode ser descrito facilmente analisando-se a eq. (11). Vamos denotar
os números pk em uma ordem tal que sempre teremos p1 < p2 < p3 . Então devemos
ter para o domı́nio dos pk os valores:
1
− ≤ p1 ≤ 0
3
2
0 ≤ p2 ≤ (3.91)
3
2
≤ p3 ≤ 1
3
Note que quando (p1 , p2 , p3 ) = (0, 0, 1) a geometria se reduz ao espaço plano de
Minkowskii (faça como exercı́cio ). Vamos agora calcular os parâmetros de congruência
da geodésica v α = δ0α . (Deixamos ao leitor a demonstração de que essa curva é real-
mente uma geodésica da geometria de Kasner.) Temos, da definição da expansão θ:
α α
θ = v;α = v,α + Γαεα v ε = Γα0α
ȧ ḃ ċ (abc)·
= + + = ,
a b c abc
ou θ = V̇ /V , e definimos o volume V = abc. Calculemos agora a dilatação σij . Temos
1 θ
σµν = (Vµ;ν + Vν;µ ) − hµν (3.92)
2 3
com h11 = g11 = −a2 . Dai
ȧ 1 V̇ 2
σ11 = − a,
a 3 V
e, analogamente
ḃ 1 V̇
σ22 = − ,
b 3 V
ċ 1 V̇
σ33 = − .
c 3 V
145
Note que σ11 + σ22 + σ33 = 0, como deveria ser. Da definição de rotação , temos imedi-
atamente que:
1
ωµν = V[µ;ν] = 0.
3
Assim, a geometria de Kasner representa um Universo sem matéria (o campo grav-
itacional se auto-alimenta) com expansão distinta segundo três eixos ortogonais, isto
é, possui anisotropia, mas não apresenta rotação. A análise do comportamento do
Universo nas vizinhanças da singularidade admite duas atitudes, a saber:
(i) Admite-se que o modelo de Friedmann do Universo atual pode ser extrapolado
pare o passado sem qualquer limite.
(ii) Admite-se que o modelo de Friedmann é um estágio ulterior de um processo
inicial (eventualmente caótico) no qual todos os possı́veis comportamentos pode-
riam co -existir.
A posição (i) tradicionalista choca-se com a evidente dificuldade de representação

do ponto singular - e a total ausência de continuidade de leis fı́sicas. Os números
qua caracterizam nosso Universo (como por exemplo, o número total de Baryons
existentes,) seriam condições iniciais e estariam para sempre fora de nosso controle.
Procurar suas ”causas” não seria então tarefa para os fı́sicos. A posição (ii), menos
convencional, requer a elaboraçao de um modelo eficiente de processos fı́sicos que
conduziriam (univocamente ? ) o universo a partir de um possı́vel estágio inicial
caótico a seu estágio bem-comportado atual. Esta geometria de Kasner foi usada para
este exame. O leitor interessado pode consultar as referências ao final do texto.
3.8 Modelo de Gödel

Em 1949, K. Gödel apresenta um modelo cosmológico que viria a desempenhar um
importante papel na história da Cosmologia Relativista. Neste modelo descreve-se
um Universo contendo matéria incoerentemente distribuı́da no espaço, cujo estado
de movimento, independente do tempo, possui a propriedade de ter rotação não-
nula. Como veremos adiante, o modelo de Gödel possui propriedades particularmente
interessantes que colocam uma série de questões profundas sobre a estrutura topológica
do espaço-tempo em larga escala.
O elemento de linha da métrica de Gödel em coordenadas (t, x, y, z) se escreve
1 2cx 2
ds2 = dt2 + 2ecx dy dt + e dy − dx2 − dz 2 . (3.1)
2
Assim, o tensor métrico tem a forma matricial seguinte:
 
1 0 ecx 0
 0 −1 0 0 
gµν =
 ecx 1 2cx
 (3.2)
0 2
e 0 
0 0 0 −1
A sua inversa é dada por:
146
2e−cx
 
−1 0 0
 0 −1 0 0 
gµν =
 2e−cx
 (3.3)
0 −2e−2cx 0 
0 0 0 −1
O determinante g tem o valor dado por

√ 1
−g = √ ecx . (3.4)
2
Vamos escolher um sistema de tétradas de tal modo a podermos escrever a métrica
(1) sob a forma Minkowskiiana.
ds2 = θA θB ηAB = (θ0 )2 − (θ1 )2 − (θ2 )2 − (θ3 )2 . (3.5)
As componentes não-nulas das tetradas eA

(α) são dadas por
e0(0) = 1,
e0(2) = ecx , (3.6)
e1(1) = 1,
1
e2(2) = √ ecx ,
2
3
e(3) = 1,
As tétradas inversas, definidas por eAα eAB = gαβ são:

(0)
e0 = 1,
(0)
√
e2 = − 2, (3.7)
(1)
e1 = 1,
(2)
√
e2 = 2 e−cx ,
(3)
e3 = 1.
As curvaturas de Riemann RABCD , valem
0 c2
R101 = , (3.8)
2
0 c2
R202 = , (3.9)
2
1 c2
R212 =− . (3.10)
2
A única componente não nula do tensor de curvatura contraı́do RAB é dado por
R00 = −c2 (3.11)
Assim, o escalar da curvatura R assume a expressão
R = R00 = −c2 (3.12)
147
3.8.1 A Solução de Gödel
No modelo de Gödel, a fonte de curvatura é um fluido de densidade de energia ρ sem
pressão. No sistema de tétradas que estamos utilizando podemos escrever o tensor
momento-energia sob a forma
TAB = ρ δA0 δB0 , (3.13)
onde a velocidade vA no sistema inercial local vale vA = δA0 . A equação de Einstein
com termo cosmológico se escreve:
κ
RAB = −κ TAB + T ηAB + Λ ηAB (3.14)
2
Da componente 0 − 0 obtemos
κρ
c2 = − Λ, (3.15)
2
e da componente 1 − 1,
0 = −κρ − 2Λ. (3.16)
As demais componentes diagonais repetem a expressão de 1 − 1. Temos então que
κρ = −2Λ = c2 . (3.17)
A positividade da energia está assegurada (c2 > 0) e temos então que Λ deve ser
negativa. Para entender o significado da constante c vamos estudar as congruências
de curvas comoventes com o fluido.
Quantidades Cinemáticas
Das relações acima podemos calcular os parâmetros cinemáticos do espaço-tempo de

Gödel.
(i) Expansão: Da definição da expansão obtemos
θ=0
(ii) Deformacão: Obtemos

σAB = 0.
(iii) Rotação: Da definição dada anteriormente o único termo não-nulo é dado por
√
2ω 12 = −γ 012 + γ 021 = − 2 c
isto é,
c
ω12 = − √ . (3.18)
2
A
Para o vetor de rotação ω encontramos, na base de tetradas

A c
ω = (0, 0, 0, ω12 ) = 0, 0, 0, − √ . (3.19)
2
148
Chamando de −Ω2 a norma de ω A (lembre que ω A é um vetor do tipo espaço), teremos
c2
Ω2 = −ω A ωA = . (3.20)
2
Assim, escrevemos
ω A = (0, 0, 0, −Ω)
Esse resultado permite escrever então que vale a relação
κρ = 2Ω2 , (3.21)
isto é, a densidade de energia do espaço-tempo de Gödel é proporcional à intensidade

de sua rotação.
Sistema de Coordenadas Cilı́ndrico
Algumas das propriedades da geometria de Gödel aparecem mais evidentes quando

estudadas em um sistema de coordenadas cilı́ndrico. Vamos assim considerar a métrica
(1) no sistema (t, r, φ, z) onde o elemento infinitesimal de linha assume a forma
ds2 = a2 [dt2 − dr2 − dz 2 + g(r)dφ2 + 2h(r)dφ dt] , (3.22)
onde a é uma constante. Escolhamos o seguinte sistema inercial local de tetradas

Explicitando eA
α temos:
e0(0) = a
e0(2) = ah
e1(1) = a (3.23)
e2(2) = a∆
e3(3) = a
p
onde definimos ∆ pela relação ∆ ≡ h2 − g. As inversas:
(0) 1
e0 =
a
(0) h1
e2 = −
∆a
(1) 1
e1 = (3.24)
a
(2) 11
e2 =
a∆
(3) 1
e3 =
a
A
Daı́, obtemos as curvaturas RBCD :
2
1 h0
R0101 = 2 ,
4a ∆
149
2
1 h00 h0 ∆0

R0112 =− 2 − 2 ,
2a ∆ ∆
2
1 h0
R0202 = 2 ,
4a ∆
" 0 2 #
00
1 ∆ 3 h
R1212 = 2 − ,
a ∆ 4 ∆
Para os tensores contraı́dos RAB , encontramos os valores:

2
1 h0
R00 = 2 ,
2a ∆
1 ∆00 1 h02

R11 = 2 − ,
a ∆ 2 ∆2
1 ∆00 1 h02

R22 = 2 − = R11 ,
a ∆ 2 ∆2
00
h0 ∆0

1 h
R02 = 2 − + 2 .
2a ∆ ∆
Os demais termos são nulos.
Consideraremos agora um fluido perfeito sem pressão, como examinado por Gödel.
A inexistência de fluxo de calor impõe
R02 = 0 ,
e de (3.25) obtemos
h0
= constante. (3.28)
∆
As demais equações de Einstein se escrevem:
κρ
R00 = − + Λ,
2
κρ
R11 = − − Λ,
2
κρ
R22 = − − Λ,
2
κρ
R33 = − − Λ.
2
De R33 = 0, segue
κρ = −2Λ , (3.29)
e consequentemente, 2
∆00 1 h0
− =0 (3.30)
∆ 2 ∆
Uma solução de (3.30), encontrada por Gödel, é dada por
√
h = 2 sinh2 r (3.31)
∆ = sinh r cosh r (3.32)
150
Assim, temos: 2
1 h0 κρ
− 2 = − + Λ = −κρ (3.33)
2a ∆ 2
Mas √ √
h0 = 2 2 sinh r cosh r = 2 2 ∆
e então,
4
κρ = (3.34)
a2
Lembrando que a rotação ω A vale
1 ABC
ωA = ε ωBC
2
1 h0
e que o tensor de rotação vale ω12 = − 2a ∆
, temos:
" √ #
1 h0

A 2
ω = 0, 0, 0, − = 0, 0, 0, − (3.35)
2a ∆ 2
De Ω2 = −ω A ωA , temos:
2
Ω2 = (3.36)
a2
κρ = 2Ω2 (3.37)
que foi o resultado obtido anteriormente (cf. eq. (3.21)).
Causalidade em Universos em Rotação
Uma propriedade particularmente intrigante da geometria de Gödel está associada à

existência nesta geometria de curvas do tipo tempo fechadas. De (32) e da definição
de ∆ temos que, na geometria de Gödel
g = h2 − ∆2 = 2 sinh4 r − sinh2 r cosh2 r

= sinh4 r − sinh2 r
Seja RC o raio crı́tico tal que sinh(RC ) = 1. Para os valores de rI tais que 0 < rI < RC
temos g < 0, e para rII < RC tem-se g > 0. Isto é, o cı́rculo nulo (g = 0) definido
por z = constante, t = constante, r = RC separa o espaço-tempo de Gödel em duas
regiões que chamaremos C e A (iniciais de causal e acausal, respectivamente). Na região
interna a RC , isto é, a região C, as curvas fechadas são do tipo espaço. No entanto, em
A, os cı́rculos definidos por t = constante, r = constante, z = constante, são do tipo
tempo. Isto é, um observador real poderia nesta região viajar ao seu passado. Como
a geometria de Gödel é homogênea, devemos concluir que por cada ponto passe uma
curva acausal. Considere , no entanto, o observador centrado em 0. Pelo que vimos
acima, as curvas fechadas só ocorrem para r > RC . Como conciliar esse resultado com
a homogeneidade da geometria de Gödel ? Seja P um ponto vizinho de 0. Existe,
pelo que vimos acima, uma curva de raio constante passando por P centrado em 00
tal que para o observador em 00 , a curva por P está além de seu raio crı́tico R0 c .
Ocorre que a curva por P que viola causalidade cruza duas vezes a fronteira RC de 0,
penetrando assim na região acausal de 0. Se limitarmos nossas observações em 0 ao
151
interior de seu raio crı́tico, não podemos verificar violação de causalidade pela curva
em P . Isto evidencia o caráter global, isto é, não local, da causalidade. Dificuldades
nessa geometria de Gödel ocorrem se o observador caminha além de seu raio crı́tico.
Aı́, a questão da violação da causalidade aparece inevitavelmente.
Um exemplo explı́cito de uma curva do tipo tempo fechadas em Gödel pode ser descrita
considerando a curva γ : xα = xα (s) tal que
z = cte
t = cte (3.38)
r = cte
0 < ϕ < 2π
ds2(γ) = a2 (h2 − ∆2 )dϕ2

= a2 sinh2 r 2 sinh2 r − cosh2 r dϕ2

= a2 sinh2 r cosh2 r − 2 dϕ2

Chamamos de raio critico ao ponto r = rc no qual
sinh rc = 1
Assim, para r > rc ⇒ ds2 > 0 e a curva é do tipo tempo e fechada; nós a deno-
taremos pela sigla inglesa CTC. É deixado como exercicio mostrar que esta curva
não é geodésica. A existencia de CTC implica que não é possivel dividir a variedade
espaço-tempo quadridimensional em termos de uma dimensão de tempo (global) e três
de espaço – a separação dita 3 + 1.
3.9 Campo escalar

Algumas partı́culas da natureza, tanto compostas quanto fundamentais, podem ser
descritas por um campo escala ϕ(xµ ) que pode, portanto, ser fonte de curvatura.
Em Cosmologia, campos escalares não necessariamente ligados a estas partı́culas con-
hecidas, são utilizados não só devido a sua simplicidade formal como também por se
acreditar que eles tenham exercido um papel fundamental na evolução do Universo
como veremos neste e em outros capı́tulos.
A equação fundamental de movimento de um campo escalar com potencial V (ϕ) no
espaço-tempo de Minkowski é dada por
∂V (ϕ)
2ϕ + =0 (3.39)
∂ϕ
onde o operador 2 em um sistema arbitrário de coordenadas é definido pela expressão:
1 √
2ϕ ≡ √ −g ϕ,α g αβ ,β .

−g
152
Note que nesta expressão gµν representa a métrica de Minkowski escrita em um sistema
arbitrário de coordenadas. A equação (3.39) pode ser obtida a partir da Lagrangiana:
1
Lϕ = ϕ,α ϕ,β g αβ − V (ϕ) (3.40)
2
Se o potencial se restringe à expressão
1 2 2
V (ϕ) = µϕ (3.41)
2
então o campo escalar é livre e massivo com massa igual a m = µ~/c (isto porque,
no espaço de momenta, cada modo do campo escalar com quadri-momentum k µ se
comporta como uma partı́cula livre massiva satisfazendo gµν k µ k ν = m2 ).
De posse desta Lagrangiana, podemos obter a expressão do tensor momento-energia
através da relação (veja a Eq.1.117)
√
2 δ −gLϕ
Tµν ≡ √
−g δg µν
Usando a expressão
√ 1√
δ −g = − −ggµν δg µν , (3.42)
2
é fácil mostrar que para Lϕ dada pela equação (3.40) obtem-se:
Tµν [ϕ] = ϕ,µ ϕ,ν − Lϕ gµν (3.43)
Vamos agora examinar o que ocorre quando o campo escalar interage com um campo
gravitacional. Em geral, quando qualquer campo da fı́sica está em interação gravita-
cional, dois tipos de acoplamento são possiveis:
• Acoplamento mı́nimo;
• Acoplamento direto com a curvatura ou não-mı́nimo.
No primeiro caso, a generalização da equação de qualquer campo não gravitacional no

espaço-tempo de Minkowski para espaços curvos se dá pela substituição da métrica
plana pela métrica curva e das derivadas simples por derivadas covariantes. Como sem-
pre é possı́vel encontrar um sistema de coordenadas onde, numa região suficientemente
pequena, a métrica pode ser colocada na forma de Minkowski e a conexão se torna
nula, então, nesta pequena região (o chamado elevador de Einstein em queda livre),
e apenas nela, todos os efeitos gravitacionais podem ser desconsiderados. Isto implica
na aceitação do Princı́pio de Equivalência de Einstein que afirma que ”localmente (no
elevador de Einstein) as leis da Relatividade Especial são válidas.
No segundo caso vemos que, como aparecem termos de curvatura explicitamente na
Lagrangiana, tal interação não desaparece localmente em nenhum sistema de coor-
denadas já que a curvatura é representada por um verdadeiro tensor e portanto não
pode ser anulada num ponto por uma mera transformção de coordenadas. Neste caso
não vale o Princı́pio de Equivalência de Einstein mas continua valendo o Princı́pio de
Equivalência Fraco, que atesta que toda partı́cula livre num dado campo gravitacional
segue a mesma trajetória, independentemente da sua natureza (é este princı́pio que
garante a geometrização do campo gravitacional).
153
No caso do campo escalar, claro está que qualquer termo do tipo f (R)ϕ2 , para uma
função f arbitrária, acrescido à Lagrangeana no espaço plano poderia ser admitida
como gerando um bom sistema de equações capaz de conduzir no limite de pequena
curvatura (como perto da Terra), Rαβρσ → 0, às equações do campo escalar no espaço
de Minkowski. Infelizmente, essa arbitrariedade não é possı́vel de ser removida sem
a introdução de um critério adicional como, por exemplo, com uma nova invariância
para o campo escalar.
Alguns autores, seguindo este caminho, propuseram alterar a Lagrangeana escalar
para a forma
1 R
Lcϕ = ϕ,α ϕ,β g αβ − ϕ − V (ϕ) (3.44)
2 6
A principal motivação para essa alteração está associada à invariância das equações
de movimento obtidas a partir de Lϕ , quando V (ϕ) = λϕ4 /4, mediante as chamadas
transformações conformes, a saber, a aplicação
geµν (x) = Ω2 (x) gµν (x), (3.45)

e
e (x) = Ω−1 (x) ϕ (x),
ϕ (3.46)
que preserva ângulos. Segue então de cálculo direto as formas de transformação cor-
respondentes:
geµν (x) = Ω− 2 (x) g µν (x).
eαβ = Ω− 2 Rαβ µν − 1 δ [ α [ µ Lβ ] ν ]
R µν
4
onde os colchetes significam antissimetrização e usamos que
Lα β ≡ 4 Ω− 1 (Ω− 1 ), β; λ g αλ − 2 (Ω− 1 ), µ (Ω− 1 ), ν g µν δβα .
Contraindo a expressão do tensor de curvatura, encontramos a variação do tensor de

Ricci e do escalar R:
eαµ = Ω− 2 Rα µ − 1 Lα µ − 1 Lδµα
R
2 4
e = Ω−2 R + 6 2 Ω

R (3.47)
Ω
Finalmente, coletando essas transformações, obtém-se para o tensor de Weyl a lei:
f αβ = Ω− 2 W αβ µν
W µν
e, então, segue a invariância do tensor
f α = W α βµν
W βµν
que é, por esta razão, também chamado de tensor de curvatura conforme.
154
Voltando à Lagrangiana (3.44), variando-se Lcϕ obtemos
R
2 ϕ+ ϕ + λϕ3 = 0 (3.48)
6
Da equação (3.47) e da relação
2
e ϕ̃ = −Ω−4 ϕ 2 Ω + Ω−3 2 ϕ,
obtem-se
R
e R
2
e ϕ̃ + ϕ̃ + λϕ 3
e =Ω−3
2 ϕ+ + ϕλϕ 3
6 6
Vemos assim que a introdução do fator proporcional ao escalar de curvature R na
Lagrangeana gera uma nova simetria: a invariância da equação do campo escalar por
transformação conforme.
Vamos a seguir detalhar um pouco mais os dois tipos de acoplamento.
Acoplamento Mı́nimo
Seja a Lagrangiana de um campo escalar intearagindo com a gravitação pelo acopla-

mento mı́nimo
L = LE + Lϕ
onde LE representa a Lagrangiana de Einstein-Hilbert e Lϕ a Lagrangiana do campo
escalar dada por:
1
L= ϕ,µ ϕ,ν g µν − V (ϕ) (3.49)
2
Da definição do tensor energia-momento (3.43) segue a expressão
Tµν = ϕ, µ ϕ, ν − L gµν (3.50)
cujo traço é
T = −ϕ,µ ϕ,µ + 4 V.
Uma situação bastante estudada consiste em identificar o termo de potencial V com um
polinômio de ordem n. Consideremos, como um exemplo particular, a forma quártica
1 1
V = µ2 ϕ2 + λ ϕ4 . (3.51)
2 4
A equação de movimento é dada por
∂V
2ϕ + = 0.
∂ϕ
Quando o potencial não é um monômio, existe a possibilidade de uma solução ho-
mogênea. Isso ocorre quando V possui um extremo6
∂ V
= 0.
∂ ϕ ϕ0 = const
No caso em que V é dado por (3.51) temos duas possibilidades
6
Nessa seção estamos considerando o campo ϕ como real.
155
• ϕ = 0.
• ϕ0 = − µ2 /λ.
p
Como o campo é real segue que para existir a solução não-trivial acima é preciso que
tenhamos λ < 0. Com a forma anterior para a distribuição de energia deste campo,
podemos calcular a sua expressão explı́cita no caso homogêneo não-trivial. Temos
Tµν = Λef gµν

onde
Λef ≡ V ( Φ0 ).
Segue então o resultado notável:
• A distribuição homogênea de energia de um campo escalar em seu estado funda-

mental é equivalente a uma constante cosmológica.
Acoplamento Não-Mı́nimo
Seja a Lagrangiana dada por:
1 1
Lc = ϕµ ϕν g µν − V (ϕ) + R ϕ2 + 2 Λ + R (3.52)
2 κ
Vamos examinar o caso especial do acoplamento conforme onde a constante = − 16 .
A equação do campo escalar é dada por
1 ∂V
2ϕ + Rϕ+ = 0. (3.53)
6 ∂ϕ
Escrevendo a equação para a geometria sob a forma da Relatividade Geral, isto é
Gµν = −T c µν − Λ gµν (3.54)

onde o tensor de energia-momento conforme T c µν é dado por
1 1 1 1
gµν (ϕ, λ ϕ, λ − V ) − ϕ2 Gµν + 2 ϕ2 gµν − ϕ2 , µ ; ν )
T c µν = ϕ, µ ϕ, ν − (3.55)
2 6 6 6
Tomando o traço deste tensor temos:
1 1
T c = −ϕ, λ ϕ, λ + 2 V + R ϕ2 + 2 ϕ2
6 2
e, usando a equação de movimento dá
1 ∂V
Tc = 2V − ϕ
2 ∂ϕ
Note que quando a massa for zero e o potencial V reduzir-se ao monômio de quarta
ordem, da equação acima segue o resultado que procurávamos, a saber
• O traço do tensor de momento-energia do campo escalar se anula no limite de

massa zero com acoplamento conforme.
156
Estrutura Riemanniana e a geometrização do campo escalar
A idéia de associar a força gravitacional à geometria do espaço-tempo foi tão sin-

gular, tão à parte dos caminhos convencionais empreendidos pelos fı́sicos no começo
do século XX, que ela provocou uma mudança no modo de apreender a realidade
fı́sica notável. Em particular, interessa-nos aqui, suas consequências referentes a mod-
ificações da geometria distintas da proposta na RG. Atraı́dos pela simplicidade for-
mal, mas de grandes consequências, dessa geometrização de uma importante parte da
Fı́sica, alguns cientistas começaram a se perguntar se um tal procedimento não pode-
ria ser estendido para outras formas de interação, outros processos. Em particular, eles
procuraram examinar a possibilidade de introduzir o outro campo de longo alcance
então conhecido, o campo eletromagnético, num esquema de geometrização7 .
Uma dessas propostas foi arquitetada pelo matemático H. Weyl através da geometria
de Weyl. Embora tenha sido possı́vel mostrar que sua idéia de modificação da estru-
tura geométrica do espaço-tempo não permitia identificá-la com as propriedades da
interação eletromagnética, a geometria que ele elaborou, e que carrega seu nome, tem
interêsse em outros aspectos da Fı́sica e, em particular, na Cosmologia.
A teoria da Relatividade Geral parte da hipótese de que os processos gravitacionais
podem ser interpretados como sendo modificações produzidas, por qualquer forma de
energia, inclusive gravitacional, sobre a geometria do espaço-tempo. A estrutura deste
espaço é admitida, a priori, como sendo Riemanniana. Isso significa que além de um
tensor métrico gµν existe uma conexão Γα µν que não são independentes mas estão
relacionados pela condição de metricidade definida por
gµν;α = 0. (3.56)
Esta condição implica que geodésicas são também curvas com elemento de linha
extremo (máximo se for uma geodésica tipo-tempo e mı́nimo se for tipo-espaço) e
que o transporte paralelo de vetores preserva o ângulo entre eles, ambas propriedades
também presentes no espaço-tempo plano.
Segue desta expressão que a conexão é métrica, isto é ela pode ser escrita em termos
de derivadas do tensor métrico (se a parte anti-simétrica da conexão, chamada torsão,
for nula), através da fórmula:
1
Γα µν = g αβ [gβµ, ν + gβν, µ − gµν, β ] (3.57)
2
Existe um método alternativo, atribuido a Palatini, capaz de associar tal estrutura a

uma dinâmica8 . Como se a própria natureza Riemanniana do espaço-tempo postulada
pela RG pudesse ser gerada através de interação. Vejamos como isso é possı́vel. O
ponto de partida é a ação de Hilbert:
√
Z
SH = −gRd4 x.
7
Chamaria a atenção do leitor para o fato de que, ainda hoje, passado quase 80 anos, estes são os únicos
campos de longo alcance conhecidos. Embora algumas propostas de existência de campos de longo alcance
tenham aparecido neste século, nenhuma delas conseguiu exibir alguma evidência de sua existência.
8
Nós o chamaremos de método EP.
157
Ao examinarmos as consequências do princı́pio variacional sobre esta ação, ao invés de
considerarmos como usualmente é feito, que a estrutura métrica é dada a priori, nós
deixaremos isso para ser decidido no próprio espectro das variações permitidas neste
Princı́pio. Isto é, consideraremos que as variações possı́veis são completamente ar-
bitrárias, sem impormos o vı́nculo Riemanniano que relaciona as variações da métrica
às variações da conexão, admitiremos que as variações δgµν e δΓµαβ são independentes.
Consideremos um sistema local quase-Euclideano de coordenadas onde as variações
do tensor contraı́do de Ricci possa ser escrito sob a forma:
δRµν = δΓα µα;ν − δΓα µν;α ,

onde a derivação covariante ; deve ser executada na geometria não-perturbada. Ob-
servemos que apesar de Γαµν se tranformar de forma não homogenea mediante uma
transformação geral de coordenadas, sua diferença δΓαµν é um verdadeiro tensor já que
o termo não homogêneo que o descaracterizaria como tal é cancelado na subtração.
Segue daı́ a relação:
1 √ √
δLEH = Rµν − Rgµν −gδg µν + −gg µν δRµν .
2
Usando a expressão acima para calcular a variação de Rµν temos, depois de fazer uma
integração por partes:
√ √ 1 √ 1 √
Z Z h
1 i
δSH = µν
−g Rµν − Rgµν δg + ( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ δΓα µ .
2 2 2
Segue então que
√ 1 √ 1 √
( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ = 0.
2 2
α
Multiplicando por δµ obtemos:
√
( −gg µ );α = 0.
Uma simples manipulação algébrica implica então que
gµ;α = 0 (3.58)
isto é, o espaço-tempo da Relatividade Geral é Riemanniano. A outra equação obtida
do princı́pio variacional é precisamente a equação de Einstein. Devemos reconhecer
que um tal resultado permite dar um passo além, retirando a análise da geometria do
mundo de considerações aprioristicas para colocá-la no território no qual se estrutura
a dinâmica.
Estrutura Riemanniana e matéria
A questão que queremos responder nesta seção decorre naturalmente do resultado

anterior e pode ser sintetizada assim:
• A construção acima da geometria Riemanniana, a partir da ação de Hilbert,

persiste ao se introduzir a interação da geometria com a matéria?
158
Nós iremos mostrar que a resposta a esta pergunta depende do modo pelo qual a
matéria se acopla com a gravitação. Esse é talvez um dos mais inesperados resulta-
dos da extensão do método introduzido por Palatini, na caracterização da estrutura
geométrica do espaço-tempo. O modo mais simples de demonstrar isso consiste em
considerar um exemplo especı́fico. Aprendemos, no que vimos no exame da interação
entre um campo escalar e a gravitação, que há dois tipos de acoplamento possı́vel, a
saber:
• Acoplamento mı́nimo
• Acoplamento direto ou não-mı́nimo.
No caso do campo escalar, o acopalmento mı́nimo mantem o resultado acima, mas

no caso do acoplamento não-mı́nimo obtem-se resultado diferente. Como um exemplo,
examinemos a teoria descrita pela Lagrangiana
√
Lϕ = −gRϕ2 . (3.59)
Usando o procedimento variacional anterior temos:
√ √ 1 √ 1 √
Z Z h
1
δSϕ = µν
−gϕ Rµν − Rgµν δg + ( −gϕ2 g µ );α − ( −gϕ2 g µν );ν δα − ( −gϕ2 g ν );ν δ
2
2 2 2
Segue daı́, por um cálculo semelhante ao caso anterior (deixado como exercicio:
√
( −gϕ2 g µν ); = 0,
isto é, não segue da variação que a estrutura do espaço-tempo é Riemanniana, pois
temos
gµν α = Qµνα ,
onde o tensor Qµνα é função do tensor métrico e do campo ϕ. Para calcular a forma
explı́cita deste tensor podemos proceder por analogia com a estrutura Riemanniana.
Temos:
gµν;α = gµν,α − Γ µα gν − Γ να gµ .

Considerando permutação cı́clica dessa expressão e somando, depois de uma pequena
manipulação algébrica:
1
Γλ µα = ∆λ µα − [Qµ λ α + Qλ αµ − Qαµ λ ].
2
Usando o resultado anterior:
ϕ2 ,λ
Qµνλ = − gµν ,
ϕ2
isto é,
ϕ,α
gµν;α = −2 gµν . (3.60)
ϕ
159
Este tipo de geometria é chamada de geometria de Weyl integrável. Chegamos assim à
estrutura de Weyl através da interação não mı́nima entre gravitação e campo escalar.
Ele foi utilizado na Cosmologia para examinar cenários cosmológicos não singular, isto
é, possuindo uma fase de colapso anterior à fase de expansão.
3.10 Universo Homogêneo Isotrópico não Singular

A comunidade dos cosmólogos acredita que a existência de singularidade nos modelos
expansionistas de Friedmann constitui uma grave dificuldade inerente a estes univer-
sos. A razão dessa dificuldade está associada ao fato de que a singularidade requer o
abandono da descrição contı́nua e completa do Universo ao longo de sua história. Emb-
ora o significado dessa questão não esteja totalmente compreendida, alguns cosmólogos
continuam por se questionar sobre a inevitabilidade daquela singularidade. Não ire-
mos aqui discutir essa questão. O leitor interessado pode consultar as referências ao
fim deste capitulo. Veremos somente em seguida, como é possı́vel gerar solução ex-
pansionista não-singular como consequência da existência de fótons não-lineares no
Universo.
3.10.1 Fótons Não-Lineares

A gravitação curva o espaço-tempo e afeta consequentemente a propagação de fótons
em sua trajetória. Como se manifesta a influência desta curvatura sobre o campo
eletromagnético? De um modo bastante geral, os fı́sicos tem se manifestado de co-
mum acordo em aceitar como hipótese de trabalho que a interação eletromagnética
com a gravitação obedece ao princı́pio do acoplamento mı́nimo. Tal princı́pio requer
que a alteração, devido à curvatura do espaço-tempo, na dinâmica de qualquer pro-
cesso fı́sico, seja feita somente pela substituição das derivadas simples por derivadas
covariantes, na função lagrangeana. Para o campo de Maxwell este princı́pio induz a
equação
F µν;ν = J µ (3.61)
proveniente da Lagrangeana
√

1 µν µ
L = −g − Fµν F + Jµ A , (3.62)
4
onde
Fµν = Aµ,ν − Aν,µ .
Entretanto, pode-se argumentar que na presença de campos gravitacionais intensos,
acoplamentos envolvendo funcionais da curvatura poderiam se tornar importantes e
alterar o sistema de equações do Eletromagnetisno. Essa idéia foi desenvolvida por
Novello e Salim. Eles argumentaram que, para campos fortes (isto é, quando a cur-
vatura do espaço-tempo é grande) a dinâmica do processo é descrita pela Lagrangeana
não-mı́nima:
√

1 µν µν µ ν
L = −g − Fµν F + λ R Aµ Aν g + β Rµν A A + LE + Lµ , (3.63)
4
160
onde
dim λ ≡ [λ] = [κ],

[β] = 0,
LE = R é a Lagrangiana de Einstein e Lµ é a Lagrangeana qua descreve os demais

campos. Vamos examinar aqui o caso em que a constante β é nula. O termo adicional
não-mı́nimo da Lagrangeana, isto é, RAµ Aµ pode ser interpretado
√ como um termo
de massa mγ para o fóton (gerada pela gravitação), com mγ ∼ R. As equações de
movimento induzidas pela Lagrangeana são:
1
(1 + λA2 ) (Rµν − R gµν ) − λ 2 A2 gµν +
2
+λA2,µ;ν + λRAµ Aν = − Eµν − k Mµν
µ
F µν;ν = −λ RW µ + Jext (3.64)
onde Eµν e o tensor momento-energia de Maxwell

1
Eµν ≡ Fµα F αν + gµν Fµβ F αβ ,
4
Mµν é o tensor momento-energia da matéria, e
A2 ≡ Aµ Aν gµν .
O tensor momento-energia para o campo vetorial se obtem de

√
2 δ( −gL)
Eµν ≡ √ , (3.65)
−g g µν
e como
√ √ √
Z Z Z
µν 4 µν 4
δ −gFµν F d x = δ −g Fµν F d x + −g δFµν Fαβ g µα g νβ , (3.66)
obtem-se o resultado esperado

1
Eµν = Fµα F αν + gµν Fαβ F αβ .
4
Segue então que o traço E ≡ Eµν g µν se anula identicamente.
µ
Jext representa a corrente não-gravitacional que gera o campo eletromagnético.
Tomando a divergência da última equação do sistema (3.64) temos
µ
Jext;µ = λ (RAµ );µ
Impondo a condição de Lorentz generalizada
(RAµ );µ = 0 (3.67)

µ
vemos que a corrente Jext é conservada. Tomando o traço da primeira equação do
sistema (3.64) temos:
R = M − 3λ2 A2 (3.68)
161
onde M = Mµν g µν . Substituindo esse valor de R na última equação do sistema (3.64)
temos:
3λ2 µ
F;νµν = −λ M Aµ + (2 A2 )Aµ + Jext (3.69)
k
A equação (3.69) exibe explicitamente o caráter não-linear da interação eletro-
magnética induzida pela curvatura do espaço-tempo. Vemos dessas equações que, para
campos fracos, o modelo de universo coincide com o obtido sem acoplamento direto,
isto é, para (λ = 0), que constitue uma primeira aproximação da interação entre os
campos eletromagnético e gravitacional.
3.10.2 Solução Cósmica Homogênea e Isotrópica

Vamos procurar uma solução do sistema de equações (3.64) tal que a geometria seja
descrita pelo elemento de linha homogêneo isotrópico dado por,
ds2 = dt2 − a2 (t)[dχ2 + σ 2 (χ) (dθ2 + sen2 θ dφ2 )], (3.70)
onde σ(χ) pode assumir as formas χ, senχ ou senhχ, correspondendo a seções espa-
ciais planas, de curvatura positiva ou curvatura negativa, respectivamente. Como não
existe direção privilegiada no espaço na qual os campos elétrico e magnético possam
estar direcionados, concluimos que estes se anulam. Consequentemente, na ausência
de matéria (e corrente externa), o escalar de curvatura se anula (veja a última equação
do sistema (3.64)):
R=0 (3.71)
A primeira equação do sistema (3.64) se reduz à expressão:
(1 + λA2 ) Rµν + λA2,µ;ν = 0. (3.72)
Vamos definir a variável Ω pela relação
Ω ≡ 1 + λA2 (3.73)
Segue então
Ω,µ;ν
Rµν = − (3.74)
Ω
e
2Ω = 0 (3.75)
Substituindo o elemento de linha (3.70) em (3.74) conduz às equações:
ä Ω̈
3 =− (3.76)
a Ω
ä 2ȧ2 2 ȧ Ω̇
+ 2 + = − (3.77)
a a a2 aΩ
ä 2ȧ2 2 ȧ Ω̇
+ 2 − =− , (3.78)
a a a2 aΩ
onde = R(3) /6 = 0 ± 1, dependendo se as seções espaciais são planas, de curvatura
positiva ou de curvatura negativa, e R(3) é o escalar de curvatura destas seções.. As
soluções para Ω e a são então dadas por:
√
a(t) = −t2 + bt + c (3.79)
−2t + b
Ω(t) = Ω0 .
a
162
Vemos de (3.79) que, por exemplo, quando
b2 + 4c < 0
a função a(t) não se anula. Consequentemente, o raio do Universo mantém-se finito,

assim como os invariantes do campo. Uma inspeção na função a(t) mostra que um
tal caso só pode existir se o modelo tiver seção espacial com curvatura negativa ( =
−1). Neste caso, no limite t → ∞, a geometria tende para o espaço de Minkowski
nas coordenadas de Milne. Este modelo mostra, portanto, um comportamento não-
singular, consequência direta do acoplamento não-mı́nimo do fóton com a gravitação.
Um tal exemplo sugere a necessidade de se desenvolver modelos menos simplistas da
interação gravitacional com a matéria.
3.11 Modelo cosmológico padrão: sucessos e difi-

culdades
.
O modelo cosmológico padrão (MCP) apresenta uma descrição razoavelmente boa
da evolução do universo desde o momento da produção dos elementos quimicos leves
(como Hidrogênio e Hélio), a chamada nucleosintese primordial. Simplificadamente, o
MCP se fundamenta nas seguintes hipóteses:
• A força gravitacional é descrita pela teoria da relatividade Geral;

• O universo é uma estrutura solidária e única que satisfaz o Princı́pio cosmológico.
isto é, é possivel definir um tempo cósmico global e todas as quantidades ob-
serváveis dependem somente deste tempo gaussiano;
• Em grandes escalas (da ordem de 100 Mpc) o conteúdo material/energético pode
ser descrito em termos de um fluido perfeito;
• A geometria do universo é descrita pelo modelo de Friedman-Robertson-Walker.
Embora este modelo apresenta um cenário coerente e capaz de prover uma descrição de
boa parte das observações cósmicas - isto é, não local - algumas dificuldades, tanto de
natureza formal quanto observacional, levaram a uma profunda crı́tica deste modelo.
Dentre estas podemos citar:
• Como conciliar o MCP com a inevitabilidade de uma singularidade tipica dos

modelos FRW com fluido perfeito? Como estabelecer uma superfı́cie de dados
iniciais (o problema de Cauchy) ”ao começo” da expansão ( posto que neste ponto
as quantidades fisicas assumem o valor infinito )?
• Se os modelos FRW possuem horizonte, isso significa que nem todas as diferentes
partes do universo poderiam ter trocado informação ao longo de sua história.
Como então entender a alta dose de isotropia presente na radiação cósmica de
fundo observada?
• Por que o tensor de Weyl é nulo?
• Como se formaram, em um universo espacialmente homogêneo e isotrópico, as
estruturas observadas tais como as galáxias, aglomerados, etc?
163
• Como conciliar as observações recentes de que o fator de escala do universo está
sendo acelerado com a positividade da energia e pressão, no cenário padrão?
Com o propósito de resolver alguns desses problemas, nos ultimos anos uma mudança
profunda vem sendo realizada na Cosmologia. Não iremos entrar nestes detalhes aqui,
mas comentaremos ao longo deste curso algumas dessas tentativas recentes de afasta-
mento do MCP. Alguns deles (como o chamado modelo inflacionário) são extensões
do MCP e são até mesmo entendidas como constituindo o novo modelo cosmológico
padrão (NMCP). Entretanto, a maior parte destas novas modificações ainda estão no
território da especulação.
Apêndice 1: Dedução das outras equações para os

parâmetros cinemáticos.
3.11.1 Equação de evolução de σµν .

Simetrizando a equação (18) podemos escrever:
θ̇ µ ν 1
hαµ hβν σ̇µν + hα hβ hµν + aα aβ − hαµ hβν (aµ;ν + aµ;µ ) +
3 2
1 µ 1
+ Qαµ Q β + Qβµ Qα = Rαεβν v ε v µ
µ
2 2
Mas

θ θ µ
Qαµ Qµβ = hαµ + σαµ + ωαµ µ µ
h +σ β +ω β =
3 3 β
θ2 2 2
= hαβ + θσαβ + θωαβ + σαµ σ µβ +
9 3 3
+σαµ ω µβ + ωαµ σ µβ + ωαµ ω µβ
Daı́
2 2 4
Qαµ Qµβ + Qβµ Qµα = θ hαβ + θσαβ + 2σαµ σ µβ + 2ωαµ ω µβ
9 3
Para simplificar esta expressão, usaremos a definição do vetor de rotação dado por
1 αβρτ
ωτ = η ωαβ vρ
2
cuja inversa é dada por
ωαβ = ηαβµν ω µ v ν
Tem-se, então:
ωαµ ω µβ = ηαµρσ ω ρ v σ η µβ ε τ
ετ ω v
βετ ρ
= δαρσ ω ωε v σ vτ
= ωµ ω µ hβα − ω β ωα
pois, ω µ é um vetor em H, isto é,
ω µ vµ = 0
164
Coletando esses cálculos, obtemos
1 1
hαµ hβν σ̇µν + hαβ θ̇ + aα aβ − hαµ hβν (aµ;ν + aν;µ ) +
3 2
θ2 2
+ hαβ + θσαβ + σαµ σ µβ + ωµ ω µ hαβ − ωβ ωα = Rαεβν V ε V ν
9 3
Usando a equação de evolução temos:
1
hαµ hβν σ̇µν + hαβ −ω 2 − 2σ 2 + aλ ;λ + aα aβ +

3
1 2
− hαµ hβν (aµ;ν + aν;µ ) + θσαβ + σαµ σ µβ − ωα ωβ =
2 3
ε ν 1 µ ν
= Rαεβν v v − Rµν v v hαβ (3.80)
3
que é a expressão da equação de evolução de σµν .
3.11.2 Equação de evolução de ωµν

Anti-simetrizando a equação fundamental tem-se:
2hαµ hβν ω̇µν − hαµ hβν (aµ;ν − aν;µ ) +
+Qαµ Qµβ − Qβµ Qµα = 0
Mas
4
Qαµ Qµβ − Qβµ Qµα = θωαβ + 2σαµ ω µβ − 2σβµ ω µα
3
Então
1
hαµ hβν ω̇µν − 2
hαµ hβν (aµ;ν − aν;µ )
+ 32 θωαβ + σαµ ω µβ − σβµ ω µα = 0 (3.81)
que é a expressão da equação de evolução de ωµν .
3.11.3 Equações de vı́nculo

Além das equações (19), (20), (21) que descrevem a evolução dos parâmetros
cinemáticos de uma congruência, existem certas relações entre estas quantidades que
devem ser satisfeitas independentemente do valor do parâmetro afim sobre a curva
χα = χα (S). Tais relações são, dessa forma, chamadas equações de vı́nculo. Passemos
agora, à tarefa de demonstrá-las. Da relação de definição do tensor de curvatura,
vα;β;γ − vα;γ;β = Rαεβγ v ε (3.82)
Contraindo α, β e projetando em H, temos
hγλ (v α ;α );γ − hγλ v α ;γ;α = Rεγ v ε hλγ (3.83)
Mas

θ α
hγλ v α ;γ;α = α
h + σ γ + +a vγ α
hγλ =
3 γ ;α
1
σ αγ + ω αγ ;α hγλ + θ,α hαλ + aα (σγα + ωγα )

=
3
165
Daı́, usando esse resultado na equação (23) teremos:
2
θ,µ hµλ − σ αγ + ω αγ ;α hγλ − aα (σλα + ωλα ) = Rµα v µ hαλ

(3.84)
3
que consiste na primeira equacão de vı́nculo.
Passemos agora à segunda relação. Temos, usando a equação (22) sucessivamente:
vα;β;γ − vα;γ;β = Rαµβγ v µ
vβ;γ;α − vβ;α;γ = Rβµγα v µ
vγ;α;β − vγ;β;α = Rγµαβ v µ
Somando,
(vα;β − vβ;α );γ + (vγ;α − vα;γ );β +
+ (vβ;γ − vγ;β );α = (Rµαγβ + Rµβαγ + Rµγβγ ) v µ
O lado direito dessa expressão é identicamente nulo, devido às propriedades do tensor
de Riemann Rαβµν . Usando a equação (12) temos
vα;β − vβ;α = ωαβ + aα vβ − ωβα − aβ vα
= 2ωαβ + aα vβ· − aβ vα
Então, temos
(2ωαβ + aα vβ − aβ vα );γ η αβγλ = 0 ,
ou ainda, devido ao fato do espaço ser Riemanniano (isto é, gµν;λ = 0)
ωαβ η αβγλ ;γ + (aα vβ );γ η αβγλ = 0

(3.85)
Multiplicando ainda por v λ temos

ωαβ η αβγλ vλ + aα vβ;γ vλ η αβλγ = 0

;γ
1 αβρτ
Lembrando a definição de ω τ = η ωαβ vρ , podemos escrever
2
ωαβ η αβγλ vλ − ωαβ η αβγλ vλ;γ + aα vλ vβ;γ η αβγλ = 0

;γ
isto é,
−2ω α ;α − ωαβ ωλγ η αβλγ − 2ω λ aλ − 2aα ω α = 0
ou ainda
ω α ;α + 2ω α aα = 0 (3.86)
Finalmente vamos procurar a terceira equação de vı́nculo. Multiplicando a equação

(22) pelo tensor ηργβε vε , temos:
1
vα;β;γ ηργβε vε = Rαµβγ v µ ηργβε vε (3.87)
2
Desenvolvendo o lado esquerdo obtemos

γβε θ
vα;β;γ ηρ vε = hαβ + σαβ + ωαβ + aα vβ ηργβε vε
3 ;γ
1 2
= (σαβ + ωαβ )kγ ηργβε vε + θ,γ ηργ αε v ε − θvα ωρ + 2aα ωρ
3 3
166
Usando esse resultado na expressão (27) temos:
1
(σαβ + ωαβ );γ ηργβε vε + 3
θ,γ ηργ αε vε −
− 23 θvα ωρ + 2aα ωρ = 1
2
Rαµβγ v µ vε ηργβε
Simetrizando em α, ρ:
σβ(α − ωβ(α ;γ ηρ) γβε vε − 23 θv(α ωρ) +

+2a(α ωρ) = − 21 Rβγµ(α ηρ)γβε v µ vε
Apêndice 2: Um pequeno compêndio de formulas

matemáticas.
Nesta seção iremos apresentar algumas formulas e expressões matemáticas que apare-
cerão com bastante frequência ao longo deste curso. A maior parte delas será apresen-
tada sem demonstração, deixando-se para o leitor realizá-las.
Definimos o objeto completamente antissimétrico αβµν de Levi-Civita que vimos an-
teriormente e que vale 1 quando os indices têm o valor (0123) ou qualquer permutação
par, −1 para permutações ı́mpares e vale zero quando dois de seus indices são iguais.
A partir dele construı́mos a quantidade
√
ηαβµν = −g αβµν (3.88)
onde g é o determinante da métrica gµν . Com este objeto é possı́vel definir para
qualquer par de ı́ndices antissimétricos um objeto dual. Assim, para um tensor anti-
simétrico arbitrário Fµν = − Fνµ construı́mos o seu dual pela relação:
∗ 1
Fµν ≡ ηµναβ F αβ (3.89)
2
Segue então que a operação repetida (dual do dual) tem o efeito de trocar o sinal do
tensor:
∗∗
Fµν = − Fµν .
Definimos o objeto associado gαβµν pela relação:
gαβµν ≡ gαµ gβν − gαν gβµ (3.90)
satisfazendo as simetrias
gαβµν = −gαβνµ = −gβαµν = gµναβ (3.91)
Podemos então mostrar que
∗
ηαβµν = − gαβµν (3.92)
e também:
ηαβµν η µνρσ = − 2 gαβρσ (3.93)
167
ρσλ
ηαβµν η αρσλ = − δβµν (3.94)
ρσλ
na qual a quantidade δβµν é o determinante da matriz 3x3
η αβµε η ενρσ = δνρσαβµ

= δνα δρβ δσµ − δνα δσβ σρµ
−δρε δνβ δσµ + δρα δσβ δµµ + δσα δρµ δνβ − δσα δρβ δνµ .
Segue então
ηασµν η βσµν = −6 δαβ (3.95)
3.11.4 Decomposição de um tensor anti-simétrico

Todo tensor de segunda ordem anti-simétrico , Fµν , como aquele que representa o
campo eletromagnético, pode ser decomposto em suas partes elétrica e magnética sob
a forma:
Fµν = −vµ Eν + vν Eµ + ηµνρσ vρ Bσ
onde os vetores elétrico (Eµ ) e magnético (Bµ ) são dados por
Eµ = Fµα v α
∗ α 1
Bµ = Fµα v = ηµαρσ Fρσ V α
2
Segue que estas quantidades estão definidas no tri-espaço do observador inercial de
velocidade v µ isto é,
Eµ v µ = 0
Bµ v µ = 0
3.11.5 Tensor de Weyl

É possivel decompor o tensor de curvatura de Riemann Rαβµν em suas partes irre-
dutı́veis. Para isso definimos o tensor conforme ou tensor de Weyl (que possui as
mesmas simetrias que o tensor de Riemann mas não possui traço). Temos assim:
1
Rαβµν = Wαβµν + Mαβµν − Rgαβµν (3.96)
6
onde
2Mαβµν = Rαµ gβν + Rβν gαµ − Rαν gβµ − Rβµ gαν . (3.97)
Desta definição segue que o tensor de Weyl tem somente 10 componentes indepen-
dentes. As outras 10 componentes que completam o tensor de Riemann estão contidas
no traço Rµν . As 10 componentes algebricamente independentes do tensor de Weyl po-
dem ser separadas em partes eletrica e magnética, para um observador de velocidade
v µ , como o fizemos para o campo de spin 1. Temos:
Eαβ = −Wαµβν v µ v ν (3.98)

∗
Hαβ = −Wαµβν vµvν . (3.99)
168
Das simetrias de Wαβµν segue que a operação dual é independente do par ao qual ela
é aplicada.
Destas expressões acima segue que os tensores elétrico e magnético são simétricos, sem
traço e pertencem ao 3-espaço ortogonal ao observador, isto é:
Eµν = Eνµ
Eµν v µ = 0 (3.100)
Eµν g µν = 0,
e
Hµν = Hνµ
Hµν v µ = 0 (3.101)
Hµν g µν = 0.
Invariantes de Debever
Existem certas quantidades escalares, obtidas multiplicando e contraindo componentes

do tensor de curvatura, chamadas de invariantes de Debever que têm grande interesse
na teoria da gravitação. Nesta seção iremos apresentá-los. Para isso, iremos definir
algums quantidades tensoriais, a saber:
1
Cµν = Rµν − R gµν
4
Dµν ≡ Wµανβ C αβ
∗
D̃µν ≡ Wµανβ C αβ
Os quatorze invariantes algebricamente independentes construidos por Debever a par-

tir do tensor de curvatura. Considerando que estamos usando a convenção segundo a
qual tensor metrico é adimensional, eles podem ser classificados por sua dimensional-
idade como segue:
Dimensionalidade Invariantes
L−2 I5
−4
L I1 , I3 , I6
−6
L I2 , I4 , I7 , I9 , I12
L−8 I8 , I10 , I13
−10
L I11 , I14
169
A expressão destes invariantes é dada por:
I1 = Wαβµν W αβµν
I2 = Wαβ ρσ Wρσ µν Wµν αβ
∗
I3 = W αβµν Wαβµν
I4 = W αβρσ Wρσ µν Wµναβ

∗
I5 = R
I6 = Cµν C µν
I7 = Cαβ C βµ Cµ α
I8 = Cαβ C βµ Cµλ C αλ
I9 = Cµν Dµν
I10 = Dµν Dµν
I11 = Cαβ Dβµ Dµ α
I12 = D̃µν C µν
I13 = D̃µν Dµν
I14 = D̃µν D̃να C µ α
onde usamos as definições:

Cµν ≡ Rµν − 41 Rgµν
Dµν ≡ Wµανβ C αβ (3.102)
∗
D̃µν ≡ Wµανβ C αβ .
Apêndice 3: Tetradas
Um sistema de quatro vetores - um do tipo tempo e tres do tipo espaco - pode ser um
sistema de referências com os quais um dado observador descreve suas medidas. Nós
chamaremos a este conjunto de vetores um sistema de tetradas e denotaremos como
eAµ
onde o ı́ndice latino (variando de 1 a 4) representa cada um dos vetores e o ı́ndice grego
representa sua componente vetorial. Escolheremos o vetor e0µ como o campo de veloci-
dades de um observador e os demais ei µ como vetores do tipo espaço ortonormalizados.
Isto é:
170
e0µ e0ν g µν = 1
e1µ e1ν g µν = −1
e2µ e2ν g µν = −1
e3µ e3ν g µν = −1 (3.103)
Esta expressão pode ser escrita de forma compacta pela expressão
eAµ eB
νg
µν
= η AB (3.104)
na qual η AB representa o tensor métrico de Minkowski. Podemos definir as tetradas

inversas utilizando este tensor para subir e descer indices. Com efeito, temos para as
inversas eAµ por definição
eAµ eB A
µ = δ B (3.105)
O conjunto de tetradas pode ser usado para transformar indices de coordenadas
α, β, γ, etc. em indices de tetrada. Por exemplo, consideremos um vetor Zα . Obtemos
sua componente em tetradas pela contração
ZA = Zα eAα (3.106)
e, em geral, para qualquer tensor Tαβ :
TAB = Tαβ eAα eBβ (3.107)
Assim definido, podemos considerar transformações dos vetores-base das tetradas.

Pondo
eAµ −→ eeAµ = SAB eBµ . (3.108)
Para preservar as propriedades das tetradas (ortonormalidade) impomos que o tensor
métrico das tetradas η AB não se altera por esta transformação, isto é,
SAC ηCD SBD = ηAB (3.109)
Reconhecemos assim, que as transformações das tetradas constituem uma rotação de

Lorentz. Dessa forma, temos dois tipos de transformações possiveis:
i) Rotação local de Lorentz que atua nos indices de tetradas (A, B, C, ..);
ii)Transformações arbitrárias de coordenadas que atuam nos indices de coordenadas
(α, β, µ, ...).
equaç~
ao do desvio geodesico!!
Apêndice: Campo eletromagnético

A equação do campo vetorial (sem massa) e na ausência de carga é dada por
F µν;ν = 0 (3.110)
∗
F µν;ν = 0 (3.111)
171
A equação (3.111) pode ser posta sob a forma
Fµν;λ + Fνλ;µ + Fλµ;ν = 0
Ela permite definir um potencial Aµ pela relação
Fµν = Aµ;ν − Aν;µ = Aµ,ν − Aν,µ
onde a segunda igualdade provém da simetria da conexão do espaço de Riemann.

A equação de movimento pode ser obtida, via princı́pio variacional, a partir da La-
grangeana
1
L = − Fµν F µν (3.112)
4
O tensor momento-energia para o campo vetorial se escreve
√
2 δ( −gL) 1
Tµν ≡ √ µν
= Fµα F αν + gµν Fαβ F αβ (3.113)
−g g 4
Com efeito, temos
√ √ √
Z Z Z
µν 4 µν 4
δ −gFµν F d x = δ −g Fµν F d x + −g δFµν Fαβ g µα g νβ (3.114)
Daı́
1
Tµν = Fµα F αν + gµν Fαβ F αβ
4
Segue então que o traço T ≡ Tµν g µν se anula identicamente.
A equação para F µν é dada por
λ
F µν;ν = − RAµ + J µ
κ
onde J ν é uma corrente externa. A lei de conservação de carga assume a forma
λ
J µ;µ − (RA);µ = 0
κ
Usando a decomposição do tensor Fµν em suas partes elétricas (Eσ ) e magnéticas
(Bα ) (para um dado observador V µ ) podemos escrever o tensor Tµν em função de
Eα , Bα . Vamos assim identificar suas componentes ρ, πµν e qµ (conforme notação
anterior). Seja o observador caracterizado pelo vetor tangente à sua linha de Universo
v µ , normalizado, isto é v µ v ν gµν = 1., Temos
Fµν = −Vµ Eν + Vν Eµ + ηµνρν Vρ Bσ
onde os vetores elétrico (Eµ ) e magnético (Bµ ) são dados por
Eµ = Fµα V α
1
Bµ = Fµ∗ α V α = ηµαρσ Fρσ V α
2
Alguns cálculos preliminares são necessários. Temos para o invariante Fαβ F αβ em
termos dos vetores eletrico (Em ) e magnético (Hµ ).
Fαβ F αβ = −vα vβ + vβ Eα + ηαβµν vµ Bµ −v α E β + v β E α + η αβρσ vρ Bσ

= −2E 2 + (−2) δ µρ δ νσ − δ µσ δ νρ Vµ V ρ Bν B σ = −2E 2 + 2B 2

172
com E 2 ≡ −Eα E α e B 2 ≡ −Bα B α (obs.: note que E α e B α são vetores do tipo espaço
e assim temos Eα E α < 0 e B α Bα < 0). Daı́
1
gµν (E 2 − B 2 ) .
2Tµν = Fµα F αν −
2
Usando estes resultados obtemos as expressões procuradas:
Densidade de energia:
1
ρ = Tµν v µ v ν = (E 2 + B 2 ) (3.115)
2
Pressão isotrópica:
1 1
p = −Tµν hµν = ρ
3 3
pois Tµν g µν = T = 0. Fluxo de calor (vetor de Poynting)
1 E2
qλ = Tαβ v β hαλ = Fλµ E µ − vλ (3.116)
2 2
Mas
Fλµ E µ = −vλ Eµ + vµ Eλ + ηλµρσ vρ Bσ E µ = E 2 vλ + ηλµρσ vρ Bσ Eµ

Daı́
1 µρσ
qλ = η Eµ vρ Bσ
2 λ
Finalmente, a pressão anisotrópica se escreverá:
πµν = Tαβ hαµ hβν + phµν =

1 1
= Fαε F β − gαβ (E − B ) hαµ hβν + phνν
ε 2 2
(3.117)
2 2
Calculando por partes:
Fµε E ε = −vµ Eε + vε Eµ + ηµερε vρ Bσ E ε =

= E 2 vµ + ηµερσ Eε vρ Bσ = E 2 vµ + 2qµ
Fµε F εµ = −vµ Eε + vε Eµ + ηµεαβ vα Hβ (−v ε Eν + vν E ε +

+ η ενρσ v ρ B σ =

= E 2 vµ vν − Eµ Eν + ηνερ E ε v ρ B σ vµ +
+ηµερσ E ε v ρ B σ vν + η αβ ε ρ σ
µ ηενρσ vα v Bβ B .
Mas
η αβµε η ενρσ = δνρσαβµ
= δνα δρβ δσµ − δνα δσβ σρµ
−δρε δνβ δσµ + δρα δσβ δµµ + δσα δρµ δνβ − δσα δρβ δνµ
Daı́
η αβµ ε ηενρσ Vα V ρ Hβ H σ = Vν Vµ H 2 − Hµ Hν − H 2 gµν
então
Fµε F εν = E 2 vµ vν − Eµ Eν + 2qν vν + 2qµ vν − B 2 gµν +
+ vµ vν B 2 − Bµ Bν
Colectando os termos, obtemos:
1 2 1
πµν = −Eµ Eν − E hµν − Bµ Bν − B 2 hµν .
3 3
173
3.11.6 Equações de Maxwell
Na presença de fontes, representada pela corrente vetorial J µ , as equações de Maxwell
se escrevem:
F µν ; ν = J µ (3.118)
F µν ; ν = 0 (3.119)
Vamos escrevê-las usando a decomposição acima.
Primeira Projeção
Multiplicando a expressão (3.118) por vµ temos
F µν ; ν vµ = −( v α E β ); β vα + ( v β E α );β vα + (η αβµν vµ Bν ); β vα .
Expandindo a derivada covariante do campo de velocidade em função de suas quanti-

dades invariantes, podemos escrever:
F µν ; ν vµ = −E;αα − E β v α vα; β + θ E α vα + Eα; β v α v β + η αβµν vµ; ν Bα vβ
isto é,
F µν ; ν vµ = −E;αα − E α v̇α + η αβµν (ωαβ ) Bµ vν

ou, usando a definição do vetor de vorticidade:
F µν ; ν vµ = −E;αα − E α v̇ α − 2ω µ Bµ (3.120)
Finalmente podemos escrever
E;αα + E α v̇α + 2ω µ Bµ = − ρ (3.121)
onde pusemos
ρ ≡ J µ vµ
Para um observador geodésico e irrotacional, encontramos o resultado convencional
~ = −ρ
div E
Segunda Projeção
Multiplicando a expressão (3.118) por hµν temos
Fµ ν ; ν hµλ = Jµ hµλ
Desenvolvendo o lado esquerdo (LE) dessa expressão temos
µν
LE = −(vα E β );β hαλ + (v β E α );β hαλ + ηαβ vµ Bν ; β hαλ

1 λβ
− λβ
σ + θh +ω λβ
Eβ + θ E λ + Ėβ hλβ + η αβµν vµ Bν ; β hα λ
3
+ η αβµν
ωµβ Bν hα λ + η αβµν vβ v̇µ Bν hα λ .
174
Mas
η αβµν ωµβ Bν = − 2ω λ Bλ v α .
Segue então

λβ λβ 2 λβ λβ
Ėβ h − σ − θ h + ω Eβ + η λβµν vµ Bν ; β + η λβµν vβ v̇µ Bν = Jµ hµλ (3.122)
3
De um modo equivalente obtemos o outro par de equações:
B;αα + B α v̇α − 2ω µ Eµ = 0. (3.123)

λβ λβ 2 λβ λβ
Ḃβ h + σ − θ h + ω Bβ − η λβµν vµ Eν ; β − η λβµν vβ v̇µ Eν = 0. (3.124)
3
Exercı́cios
1. Mostre que a o volume da seção espacial da métrica (3.6) no caso = 1 é
V (t) = 2π 2 a(t)3 .
2. Mostre que a métrica de RW é conformemente plana.
3. Mostre que equação da conservação da energia (3.46) é conseqüência da
aplicação da primeira lei da termodinâmica
T dS = dE + pdV,
ao caso do universo descrito pela métrica RW, para o qual o volume é proporcional
à a(t)3 , e a expansão é adiabática (S =constante).
4. Mostre que v µ = δ µ0 é uma geodésica para a métrica de Friedmann. Mostre
também que a congruência gerada por essa geodésica não possue rotação.
5. Calcule os vetores de Killing (10) da geometria de Sitter. Calcule em seguida
as álgebras associadas. Compare com a álgebra das isometrias do espaço de
Minkowski.
6. Nos modelos de Friedmann (com Λ = 0) vemos que aparece uma singularidade
para um dado valor de t (identificado com a origem t = 0). Este singularidade,
aparece tanto na geometria (o raio do Universo A(t) se anula para t = 0, os
invariantes geométricos divergem) quanto na matéria (a densidade ρ de energia
diverge para t = 0). Mostre que a presença da constante cosmológica, no modelo
de Lemaı́tre, evita o aparecimento da singularidade.
7. Mostre que o volume do universo de Einstein é dado por V = 2π 2 a3 .
8. Calcule a idade do universo num modelo com constante cosmológica positiva e
poeira (resultado dado pela eq.(3.82).
9. Mostre que a equação (19) é invariante por transformação conforme, no limite
µ = 0.
Sugestão: faça a transformação
ϕ → ϕ̃ = Ω−1 ϕ
gµν → g̃µν = Ω2 gµν
1
Γ̃αµν = Γαµν + Ω,µ δ αν + Ω,ν δ αµ − Ω,λ g αλ gµν

(3.125)
Ω
175
10. Mostre que as equações de Maxwell são invariantes por transformação conforme.
11. Considere um campo vetorial acoplado não-minimalmente com a gravitação e
cuja equação provém da Lagrangeana
1 √ 1 √
L= −g (1 + λWµ W µ ) R − −g Fµν F µν + Lm (3.126)
κ 2
onde Lm é a Lagrangeana que descreve os demais campos materiais.
Obtenha a equação de movimento a partir da variação dessa Lagrangeana.
Solução:
(1 + λW 2 ) Rµν − 21 Rgµν − λ2W 2 gµν + λW,µ,ν

2
+
+λRWµ Wν = −κEµν − κMµν (3.127)
onde Mµν é o tensor de energia-momento da matéria e Eµν é o tensor de Maxwell,

dado anteriormente pela expressão (22).
12. Calcule a equação de evolução de ω µ para uma congruência geodésica.
Solução:
2
ω̇ µ + θω µ = σ µα ω α .
3
13. Em que condições o dual do tensor de Riemann independe do par onde ele está
operando? Ou seja, qual a condição para que o dual tomado no primeiro par de
ı́ndices seja igual ao tomado no segundo par de ı́ndices, isto é:
∗
Rαβµν = Rαβ ∗µν
Solução:
1
Rµν = Rgµν .
4
COMPLETAR REFERENCIAS!!

[1] Livro de Weinberg.
[2] M. Novello - Cosmologia Relativista (livro da II Escola de Cosmologia e
Gravitação do CBPF (1982).
[3] M. Novello, J. Salim - Equações Quase-Maxwellianas de Gravitação (I Escola de
Cosmologia do CBPF, 1978).
[4] M. Novello - O que é Cosmologia? Editora Jorge Zahar, 2006.
[5] S. Hawking, G.F.R. Ellis - The Large Scale Structure of Space Time - (1976).
[6] General Relativity, R. Wald, U. Chicago.
[7] Cosmologia Relativista, M. Novello, II Escola de Cosmologia e Gravitação (1980).
176
Capı́tulo 4
Termodinâmica em Relatividade
Geral.
J. M. Salim1
Introdução.
Iniciaremos o nosso estudo pelo sistema fı́sico denominado Fluido Perfeito. O leitor
interessado podera consultar as referê cias [1], [2], [3] Um fluido em geral é modelado
como um contimuun caracterizado primeiramente por um campo de velocidade media
v α normalizado v α vα = 1. No caso de um fluido perfeito a velocidade é univocamente
definida como a velocidade relativa a qual não há corrente de particulas nem fluxo
de calor. Claro está que esse modelo é uma aproximação e a validade da mesma
pressupõe que o livre caminho médio das particulas constituintes do fluido deve ser
muito menor que qualquer comprimento macroscópico caracteristico do sistema. O
campo vetorial que define localmente a velocidade do fluido, também chamado de
campo de observadores comoventes com o fluido, define uma separação covariante do
espaço-tempo em espaço e tempo. Essa separação é operada pelo tensor de projeção
definido como:
hαβ = gαβ − vα vβ (4.1)
Esse operador projeta os tensores definidos em cada ponto do espaço-tempo no espaço
de repouso instantaneo do observador comovente e a métrica desse tri-espaço é de-
terminada pelo tensor hαβ . As operações de derivação covariante no tri-espaço são
definidas como:
∇ˆ α φ = hβ φ|β (4.2)
α
ˆ α Aˆβ = hµα hνβ ∇µ hλµ Aλ

∇ (4.3)
e a generalização imediata que dai decorre para tensores de ordem mais alta. No
referencial comovente instantâneo (RCI) , usando coordenadas adaptadas temos que:
1
177
v α = δ0α (4.4)
Um vetor arbitrário Aα projetado no RCI e utilizando-se coordenadas adaptadas tem

por compontes:
Aˆα ≡ hαβ Aβ =(0,

˙ ~
A) (4.5)
O ponto sobre o sinal de igual indica que a igualdade só vale nesse sistema de coorde-
nadas e o chapeu sobre o vetor Aα indica que se trata da projeção do vetor no espaço
de repouso instantâneo do observador comovente. Ainda nesse sistema de coordenadas
o tensor métrico do tri-espaço perpendicular a v α assume a seguinte forma simples:
h0α =0
˙ (4.6)
hij =g
˙ ij (4.7)
Todo tensor pode ser decomposto em suas partes perpendicular a v α (espaço de repouso
instantâneo do observador comovente) e paralela a v α , para nós será de particular
interesse a decomposição da derivada covariante do vetor velocidade:
vα||β = hµα hνβ vµ||ν + aα vβ , (4.8)
onde ()||α denota a operação de derivada covariante. Nessa expressão aα = vα||β v β é a

aceleração do fluido e como vα v α = 1 segue que aα vα = 0. A projeção perpendicular
a v α do gradiente da velocidade vamos denotar por vαβ ≡ hµα hνβ vµ||ν . Esse tensor pode
ser decomposto em suas partes irredutı́veis como:
1
vαβ = hαβ θ + σαβ + ωαβ . (4.9)
3
onde
θ = vαα , (4.10)
1 1
σαβ = (vαβ + vβα ) − hαβ θ, (4.11)
2 3
e
1
ωαβ = (vαβ − vβα ) (4.12)
2
são respectivamente, a expanção, o tensor de cisalhamento e o tensor de rotação.
Exercı́cio. Mostre que no espaço de repouso instantâneo do observador comovente esses
tensores se reduzem aos correspondentes objetos da hidrodinâmica Newtoniana. No
RCI, em coordenadas adaptadas, a lei de Pascal é valida e a pressão exercida por uma
dada porção do fluido é a mesma em todas as direções e perpendicular a área onde
ela atua, logo
hα µ Tµν dsν =
˙ δα i Tij dsj =
˙ δα i p dsi (4.13)
Segue dai que

Tij =
˙ p gij =
˙ p hij (4.14)
178
Tendo isso em conta, conteudo de energia e momento do fluido perfeito em um sistema
arbitrário de coordenadas é descrito pelo tensor
T αβ = ρ v α v β − p hαβ (4.15)
Esse tensor satisfaz a seguinte equação (consequência direta das equações de Einstein):
T αβ ||β = 0. (4.16)
Essa equação pode ser decomposta em suas partes paralela (vα T αβ ||β = 0) e perpen-
dicular (hα β T βλ = 0) a v α como segue:
ρ|α v α + θ (ρ + p) = 0 (4.17)
p|α hαβ = (ρ + p) v β (4.18)
É facil mostrar que no (RCI) essas equações se reduzem a:

∂ρ .
~ . ~v =
+ (ρ + p)∇ 0 (4.19)
∂t
∂~v . ~
(ρ + p) = ∇p. (4.20)
∂t
Além dessas equações devemos acressentar a equação de conservação do número de
particulas
N α ||α = (n v α )||α = 0 (4.21)
e a equação de conservação de entropia
S α ||α = ( s N α )||α = 0 (4.22)
Nessa expressão s é a entropia especı́fica. Vimos então que um fluido perfeito é car-
acterizado pelas variáveis (N α , S α , T αβ ), essas variáveis devem satisfazer as equações
de conservação que discutimos anteriormente. Nesse conjunto de variáveis temos sete
variáveis e seis equações de conservação. Ademais dessas equações a termodinâmica
nos fornesse a equação de Gibbs
ρ 1
T ds = d( ) + p d( ) (4.23)
n n
Essa equação nos mostra que são necessários dois escalares como variáveis indepen-
dentes e uma nova variável conhecida como temperatura (T ) é introduzida. Assim
supondo que o fluido perfeito já determinou a geometria temos um sistema de oito
variáveis e sete equações. Para podermos determinar o sistema é nessário ainda for-
nesser uma equação de estado, usulamente p = p(ρ, n). Dependendo do caso es-
pecı́fico a ser tratado é comum utilizar-se outras variáveis independentes, a saber
(s, ρ), (s, T ), (n, T ), etc. Tomando como variáveis independentes (ρ, p) na equação de
Gibbs no caso de um fluido perfeito temos:

ρ + p ∂n ∂n 1
T ds = − 2 dρ + dp + dρ (4.24)
n ∂ρ ∂p n
179
ou
n2 T

n ∂n ∂n
ds = − dρ − dp (4.25)
ρ+p ρ + p ∂ρ ∂p
Como n = n(ρ, p) segue que
∂n ∂n
ṅ = ρ̇ + ṗ. (4.26)
∂ρ ∂p
Logo
∂n ṅ ∂n ṗ
= − (4.27)
∂ρ ρ̇ ∂p ρ̇
Substituindo esse resultado na expressão anterior para a equação de Gibbs encon-
tramos:
n2 T

n ṅ ∂n ṗ ∂n
ds = − − dρ − dp (4.28)
ρ+p ρ + p ρ̇ ∂p ρ̇ ∂p
Finalmente usando a equação de conservação para o numero de particulas e densidade
de energia obtemos:
2 ∂n ṗ
n T ds = (ρ + p) dρ − dp (4.29)
∂p ρ̇
Dessa expressão segue que para um fluido barotrópico p = p(ρ), ds = 0. Os exemplos
mais comuns de fluidos desse tipo é a radiação p = 13 ρ. Em cosmologia costuma-se
usar equação de estado barotropica linear:
p = (γ − 1)ρ (4.30)
Em geral a velocidade do som adiabática é dada por

2 ∂p
cs = . (4.31)
∂ρ s
Escolhendo (s, ρ) como variáveis independentes, em geral segue que:

∂p ∂p
dp = dρ + ds (4.32)
∂ρ s ∂s ρ
No caso particular de um fluido barotrópico ou num regime adiabático (ds = 0) tem-se

que:
ṗ
c2s = (4.33)
ρ̇
Note que em geral essa expressão não é válida.
4.1 Termodinâmica de Processos Dissipativos

Vamos considerar agora fluidos submetidos a processos dissipativos, por simplicidade
vamos restringir nossa análise a fluidos simples (uma componente). Nas descrições
originais[2,7], extensões relativı́sticas das descrições clássicas, o estado de um fluido
180
de uma componente fora do equilı́brio é determinado por uma variável cinética, a
velocidade do fluido v µ , e duas variáveis termodinâmicas, o número de partı́culas por
unidade de volume n e a energia interna especı́fica. A idéia básica que orienta essas
descrições é a hipótese do equilı́brio local[8] que impõe que a equação fundamental da
termodinâmica depende localmente das mesmas variáveis como no equilı́brio; não são
necessárias variáveis adicionais e a equação fundamental contem toda a informação
sobre o sistema. Nessas descrições o tensor momento energia, bem como a corrente de
partı́culas, são modificadas respectivamente como
Tµν = ρ vµ vν − p hµν + 4Tµν = T̄µν + 4Tµν , (4.34)
N µ = n v µ + 4N µ , (4.35)
onde ∆Tµν e ∆Nµ representam o efeito da dissipação presente na dinâmica do flu-
ido.Antes de seguirmos adiante devemos chamar a atenção para o fato de que a
quadrivelocidade do fluido V µ não tem sentido fı́sico preciso uma vez que podemos
tomá-la como a velocidade do fluxo de energia v µ = vEµ ou a velocidade do fluxo de
µ
particulas v µ = vN . No primeiro caso, no referencial definido por vEµ , o fluxo de energia
é nulo:
Tνµ vEν = ρvEµ (4.36)
No segundo caso, no referencial definido por vEµ , o fluxo de particulas é nulo

µ
N µ = n vN (4.37)
Tendo feito as correções do tensor energia-momento e do vetor corrente de particulas,

as definições das variáveis de equilibrio ρ, p, n tornam-se, como consequência da am-
biguidade de v µ , indeterminadas. Essa dificuldade é superada fixando-se v µ e definindo
ρ e n no referencial comovente:
ρ = T µν v ν v ν (4.38)
n = N µ vµ (4.39)
Ademais dessas definições temos de caracterizar se o referencial comovente escolhido é

µ
o de Eckart (vN ) ou o de Landau (vEµ ). Esses são caracterizados respectivamente pelas
seguintes condições:
N µ hαN µ = N µ (δµα − vN
α
vN µ ) = 0 (4.40)
Tνµ vEµ hαEν = 0 (4.41)
As duas formulações, em primeira ordem, são inteiramente equivalentes.

Iremos inicialmente adotar a descrição de Eckart. Nesse caso é fácil mostar que segue
diretamente das definições anteriores que
∆N α = v α v β ∆Tαβ = 0 (4.42)
assim todos os efeitos dissipativos estão contidos em ∆T µν . O tensor T αβ e o vetor N µ
satisfazem as leis de balanço (4.16), (4.17), (4.18) e (4.21), assim podemos escrever:
ρ+p
vµ T¯µν ;ν = ρ̇ + θ(ρ + p) = ρ̇ − ṅ = −vµ (∆T µν );ν (4.43)
n
A equação acima é local, utilizando agora a equação de Gibbs
1 ρ+p
T ṡ = ρ̇ − ṅ (4.44)
n n2
181
podemos reescrever (4.43)como
vµ T¯µν ;ν = T n ṡ = −vµ (∆T µν );ν (4.45)
ou ainda
T (n s v µ );µ = −vµ (∆ T µν );ν . (4.46)
Partindo dessa expressão definimos o vetor corrente de entropia commo:

1
sµ = n s v µ + vα ∆T µα (4.47)
T
A lei de balanço para a entropia (4.46) agora pode ser escrita como:
vα;µ T,µ
sµ ;µ = − ∆T αµ + 2 vα ∆T αµ (4.48)
T T
A segunda lei da termodinâmica requer que o lado direito de (4.48) seja positivo
definido , essa imposição nos permite determinar ∆T µν como uma combinação linear
dos gradientes da temperatura e velocidade. Note que a correção ∆T µν não pode
conter termos envolvendo gradientes das variáveis de equilibrio ρ, n e p pois, nesse
caso, não seria possı́vel obter para o lado direito de (4.48) termos positivos definidos
para configurações arbitrárias do fluido. A seguir vamos utilizar a bem conhecida
decomposição de vαµ em suas partes irredutiveis:
1
vαβ = σαµ + ωαµ + θ hαµ + aα vµ (4.49)
3
Substituindo (4.49) em (4.48) obtemos:
∆T αµ

θ T,µ aα v µ
sα;α = σαµ + hαµ − vα − ∆T αµ (4.50)
3 T T2 T
Expressando ∆T αµ em função de suas partes irredutiveis e tendo em conta (4.15)

obtemos:
∆T αµ = π αµ + π hαµ + v α q µ + v µ q α (4.51)
onde π, π αµ e q µ são respectivamente, a viscosidade ”bulk”, a pressão anisotrópica e
o fluxo de calor; os dois ultimos são perpendiculares a v µ e π µν tem traço nulo.
Substituindo (4.50) em (4.51) obtemos:
σαµ π αµ

α θπ T,µ aµ
s ;α = − − 2
− qµ (4.52)
T T T T
A imposição de que o lado direito dessa expressão seja positivo definido nos leva a:
π αµ = η θ (4.53)
π = −ζ θ (4.54)
q µ = χ hµα (T,α − T aα ) (4.55)
182
Nessas expressões η, ζ e χ são respectivamente os coeficientes de viscosidade de dis-
torção ou ligamento, de viscosidade volumar e de condução de calor. Esses coeficien-
tesdevem ser todos positivos definidos. Assim obtemos:
πµν π µν π2 q µ qµ
sµ ||µ = + − (4.56)
ηT ζT χT 2
As relações constitutivas (4.53), (4.54),(4.55), as equações de balanço (), (), e () e

as equações de estado fornecem um conjunto de 16 equações para as 16 variáveis in-
dependentes: ρ, n, T, p, π, q µ , π µν e as três componentes independentes da velocidade.
Assim o problema está completamente determinado para convenientes condições de
iniciais e de contorno.
Essa formulação, válida para processos quase estacionários, apresenta, no en-
tanto, algumas dificuldades de princı́pio e de ordem experimental que passamos a
enumerar([5]).
a) A formulação está baseada, a priori, no princı́pio de equilibrio local, que parece
excessivamente restritivo em muitos casos. Diferentes variáveis própias para descr-
ever processos fora do equilibrio podem ser utilizadas para modificar as equações da
Termodinâmica em situações fora do equilı́brio.
b) As equações constitutivas levam, quando introduzidas nas equações de balanço,
a equações parabólicas implicando velocidade infinita para a propagaçào de sinais
térmicos e viscosos.
c)Do ponto de vista microscópico, tendopor base a teoria cinética, obtêm-se equações
constitutivas que são mais gerais do que as que as que obtivemos, incluindo tempo de
relaxação e termos não lineares.
Essas deficiências são devidas ao fato de que as teorias convencionais fazem hipóteses
excessivamente restritivas concernentes à relação entre os fluxos de entropia, energia
e número de partı́culas.
Neste primeiro curso não iremos apresentar a termodinâmica estendida, o leitor inter-
essado pode consultar as referencias ([4][5]).
4.2 Aplicação á Cosmologia

É longamente aceito que apenas modelos cosmológicos possuindo um estado inicial
extremamente denso e com uma temperatura muito alta podem explicar as observações
que temos de nosso Universo. Entre essas, a mais importante é a radiação de 3 ◦ K
juntamente com a abundância de He. Até a decada de 1970, os diferentes modelos
utilizados para descrever a fase primordial da evolução do Universo utilizavam como
fonte das equações de Eisntein um fluido perfeito ultra-relativistico (p = 31 ρ).
Esses modelos não possuem elementos para explicar a enorme entropia adimensional
por bárion da ordem de 108 − 109 , como enfatizado principalmente por Zeldovich [6].
A questão que decorre imediatamente desse dados é: como originou-se essa enorme
quantidade de calor? Weinberg [7], levando em conta a ação de processos dissipativos,
fez uma estimativa da produção de entropia devido à viscosidade volumar. Nesses
cálculos ele utilizou o coeficiente de viscosidade obtido atrvés da solução do problema
de transporte de radiação quando o livre caminho médio e o livre tempo médio são
183
muito pequenos comparados com o inverso da constante de Hubble. O resultado obtido
foi muito inferior ao valor observado. Seguiram-se vários trabalhos p.ex. [8], [9], [10],
onde os autores dedicaram-se à procura de uma solução para esse problema. Iremos
dedicar especial atenção ao modelo de Murphy. Nesse a fonte das equações de Einstein
é um fluido viscoso homogêneo e isotrópico, sendo a viscosidade volumar descrita pela
equação fenomenológica
π = −ζ θ (4.57)
Em modelos desse tipo a viscosidade decorre da interação da matéria com a radiação.
No trabalho de Murphy a expressão para o coeficiente de viscosidade volumar adotada
foi a seguinte ([10]):
ζ = αρ (4.58)
Nesse caso, a expressão para o fluido se reduz a:
Tµν = ρ vµ vν − (p − α ρ θ) hµν (4.59)
A geometria do espaço-tempo é descrita pela métrica de Robertson-Walker:

a2 (t)
ds2 = dt2 − dx2 = dy 2 + dz 2

kr2 2
(4.60)
(1 + 4 )
Por simplicidade, vamos considerar apenas modelos com seção plana k = 0. Nesse caso
as equações de Einstein se escrevem como:
1 2 ȧ
8πGρ = θ = 3 H 2 := 3 (4.61)
3 a

8πG (γ − 1 − 3α H) ρ = − 2 Ḣ + 3 H 2 , (4.62)
onde utilizamos a equação de estado p = (γ − 1) ρ.
Eliminando ρ nas equações (4.61) e (4.62) obtemos:
3(γ − 3αH) 2
Ḣ + H =0 (4.63)
2
Primeiramente notemos a solução simples Ḣ = 0, nesse caso:
γ
H = H0 = , (4.64)
3α
e a pressão total do fluido se reduz a
p = pe + π = (γ − 1)ρ − 3 α ρ H0 = − ρ. (4.65)
Nesse caso a solução obtida é a solução de Sitter, sem a necessidade de introduzir a

constante cosmológica.
A solução geral para a eq.(4.63) é:
3γH0 (t − t0 )
= ln a3γ/2 + C a3γ/2 , (4.66)
2
onde substituimos α em função de H0 . Essa solução possui duas situações limites de
interesse:
a << 1 | ln a3γ/2 | >> C a3γ/2 ⇒ a = exp H0 t. (4.67)
184
O outro limite é
C a3γ/2 >> | ln a3γ/2 |. (4.68)
Então
a = (3 γ H0 t /2C)2/3γ , (4.69)
que é uma solução do tipo Friedmann, sendo os efeitos da viscosidade desprezı́veis.
Devemos ressaltar que as soluções obtidas NÃO TÊM SINGULARIDADE. Esse re-
sultado, que inicialmente despertou grande interesse para o modelo, não resistiu a
uma análise mais geral da dinâmica do modelo. Em 1975 e posteriormente em 1977,
Belinski e Khalatnikov [11], [12] utilizaram a técnica de análise qualitativa para estu-
dar o sistema de equações que acabamos de obter. Nesse trabalhos ficou demonstrado
que mesmo em situações mais gerais do que a estudada por Murphy, a singularidade
não pode ser evitada dado que a solução de Murphy não é estável frente a peque-
nas perturbações. Essas dificuldades podem ser ultrapassadas utilizando a teoria da
termodinâmica causal [13], [14], [15].
4.3 Exercı́cio
Mostre que as descrições de Landau e Eckart são equivalentes quando levamos em
conta apenas termos em primeira ordem nas correções ∆N α e ∆T µν .

[1] Gravitation and Cosmology, S. Weinberg, John Wiley (1972).
[2] Fluid Mechanics, L. D. Landau and E. M. Lifshitz. Pergamon Press (1982).
[3] Gravitation, C. M. Misner, K. S. Thorne and J. A. Wheeler. Freeman and Com-
pany (1973).
[4] W. Israel, Ann. of Physics 100, 310, (1976).
[5] D. Jou, J. Casas-Vasquez and G. Lebon. Rep. Prog. Phys.51,1105, (1988).
[6] Ya. B. Zeldovich, Sov. Phys. Uspekhi,9, 602, (1967).
[7] S. Weinberg, Astr. Journ. 168, 175, (1971).
[8] M. Heller, L. Suszycki, Acta Phys. Pol. B5, 345, (1974).
[9] L. Suszycki, Acta Cosmologica CCCCLXXXIII, 147, (1978).
[10] G. L., Murphy, Phys. Rev. D 8, 4231, (1973).
[11] V. A. Belinskii, I. M. Khalatnikov, Sov. Phys. JET 42, 205, (1975).
[12] V. A. Belinskii, I. M. Khalatnikov, Sov. Phys. JET 45, 1, (1977).
[13] H. P. de Oliveira, J.M. Salim, Acta Phys. Pol. B19, 649, (1988).
[14] M. Novello, H. P. de Oliveira, J.M. Salim, J. Torres, Acta Phys. Pol. B21, 571,
(1989).
[15] D. Pavon, D. Jou, et all, Class. Quantum Grav.8, 347, (1991).
185
Capı́tulo 5
Fı́sica de Objetos Compactos
Herman J. Mosquera Cuesta1
O leitor se perguntará: Por quê estudar os fundamentos da fı́sica de objetos as-

trofı́sicos compactos no âmbito do Programa Mı́nimo de Cosmologia? Sem dúvida,
uma resposta a esta questão passa pela consideração que a matéria visı́vel do Universo,
conforme o conhecemos hoje, esta principalmente constituı́da por estrelas, além é
claro da poeira e gás interstelar e intergaláctico. A transformação dessas estrelas ao
longo de suas vidas, segundo a teoria padrão da evolução estelar, deve produzir como
remanescente uma famı́lia muito especial de corpos celestes: buracos negros, estrelas
de nêutrons e anãs brancas, referidos na literatura cientı́fica como objetos compactos
por causa que seus tamanhos são excessivamente pequenos quando comparados com
estrelas normais da mesma massa, que tı́picamente possuem um raio como o do Sol.
São inúmeras as informações sobre a origem e evolução do Universo que podem ser
obtidas através do estudo desta classe de objetos. Por exemplo, alguns modelos de
supernovas tipo Ia (cujas observações sugerem que o universo está numa fase de
expansão acelerada) envolvem a coalescência de duas anãs brancas. Mais importante
ainda, o estudo da taxa de esfriamento das anãs brancas permite impôr limites sobre
sua idade, e consequentemente sobre a idade do universo, e ainda sobre a existência ou
não de dimensões espaciais extras. Isto por si só justifica o estudo apresentado a seguir.
5.1 Introdução
O estudo da origem, ou formação , e evolução das estrelas nos mostra que estas
evoluem de tal maneira que ao final de suas vidas dramáticos eventos acontecem, e
como consequência destes uma classe de objetos estelares muito peculiares podem
vir a ser produzidos. Esta classe de objetos é referida em astrofı́sica como Objetos
Compactos, em clara referência a sua comparação , em termos de escalas de massas
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
186
e tamanhos, com as estrelas normais conhecidas como estrelas da sequência principal
(ver Figura 5.1, o diagrama de Hertzsprung-Russell, ou diagrama HR). Esta classe de
objetos compactos é constituı́da por estrelas anãs brancas (ABs), estrelas de nêutrons
(ENs) (incluem-se aqui as estrelas de quarks), e buracos negros (BNs). A ordem de
apresentação usada neste capı́tulo segue a hierarquia de intensidades do campo grav-
itacional em cada um destes objetos, supondo que eles possuam uma mesma massa
(ver Tabela 1).
Tabela 1??
Desta forma, estes corpos celestes representam o ponto final da evolução de estrelas
normais, e passam a ser, portanto, um ingrediente fundamental do conteudo fı́sico do
Universo.
Nesta primeira aproximação á fı́sica de tais objetos, estaremos procurando entender
tanto a origem de suas principais propriedades fı́sicas, bem como caracterizando-os
em relação ao resto dos corpos celestes que podem de alguma maneira ser observados
com os modernos instrumentos astronômicos como os telescópios de raios-X e raios-γ,
os radiotelescópios, e o telescópio espacial Hubble, dentre muitos outros.
Para começarmos esta fundamentação da fı́sica dos objetos compactos é bom lembrar
as propriedades fı́sicas que os tornam definitivamente diferentes das estrelas normais.
Em primeiro lugar, eles são remanescentes da evolução estelar normal, isto é; eles con-
stituem o estágio final da vida das estrelas ordinárias. Ao alcançar este estágio, uma
estrela normal teria esgotado todo seu combustı́vel nuclear. Isto a deixaria pronta para
sofrer o colapso gravitacional no seu interior, processo através do qual estes objetos
compactos poderão vir a se formar. De fato, é a queima deste combustı́vel durante a
fase de estrela da sequência principal(SP) o que sustenta estas estrelas normais em
contra da atração gravitacional produzida pela própria matéria que as constitue, evi-
tando assim seu colapso. Visto desta maneira, uma estrela normal, ou da SP, é uma
esfera de gás em equilı́brio hidrostático. Este equilı́brio acontece entre a força gravita-
cional, que tenta compactar esta matéria, e a pressão térmica gerada pela queima do
combustı́vel nuclear que tenta espargı́-la, ou desagregá-la, para o infinito onde não há
força atrativa qualquer capaz de re-agregá-la. Só para exemplificar, uma anã branca
(AB) é suportada pela força de repulsão (pressão) quântica, ou de degenerescência,
dos seus elétrons. Entretanto, uma estrela de nêutrons (ENs) é sustentada pela pressão
quântica de seus nêutrons, também degenerados 2 .
O outro elemento diferenciador entre objetos compactos e estrelas ordinárias é o seu
tamanho, excessivamente pequeno quando comparado com estrelas normais de massa
comparável. Tem de se notar aqui que objetos de massa similar mas de raio compar-
ativamente menor possuem campos gravitacionais em suas superfı́cies que são pro-
porcionalmente mais intensos. Uma estimativa da intensidade destes campos grav-
itacionais pode ser obtida calculando (a lá Newton) a aceleração gravitacional na
superfı́cie de uma estrela AB, de nêutrons, ou ainda de um buraco negro, e compará-
la com aquela na superfı́cie de nosso planeta, por exemplo. É bom frisar aqui que este
conceito aplica-se a estrelas totalmente colapsadas, isto é, estrelas que não encontram
meios de se suportar em contra do puxão produzido pela sua própria gravidade e co-
2
Diz-se que uma distribuição de matéria é degenerada quando sua pressão não se reduz a zero apesar
de sua temperatura, ou energia térmica, pode ser quase nula, i.e., ∆T ∼ 0. Posto de outra maneira, a
pressão quântica não responde a mudanças de temperatura, mas sim ao Principio de Exclusão de Pauli.
187
188
189
lapsam a uma singularidade. A descrição da fı́sica de buracos negros é o assunto do
Capı́tulo 6 deste curso.
Esclarecemos ainda que nosso objetivo aqui é fornecer uma introdução ao estudo desta
classe de corpos astrofı́sicos, focalizando nossa atenção nos elementos “essenciais” de
sua fı́sica e evolução . Assim sendo, apresentar-se-ão neste capı́tulo os fundamentos
desta fı́sica, ficando para os interessados revisarem algumas das referências forneciadas
ao final para obterem uma descrição mais detalhada destes objetos. Em particular,
nossa fonte mais imediata é o livro de S. L. Shapiro & S. A. Teukolsky: Black holes,
white dwarfs and neutron stars: The physics of compact objects (Wiley & Sons, New
York, 1983). Entretanto, cabe alertar que estudos mais aprofundados irão requerer de
um entendimento fı́sico refinado da estrutura da matéria a altas densidades e pressões e
da natureza das interações entre partı́culas, incluindo as forças forte e fraca, o eletro-
magnetismo, e a gravitação , as quais desempenham um papel crı́tico na dinâmica
destes sistemas. Um tal estudo está fora do escopo deste livro.
5.2 Anãs brancas

O entendimento atual (modelo padrão) da evolução estelar sugere que as anãs bran-
cas se formam a partir de estrelas leves com massas M não maiores do que 4.0 M ,
após uma explosão de energia moderada, denominada (Helium flash), que da origem
à formação de uma nebulosa planetaria, a qual possui uma AB como principal re-
manescente em seu centro. No caso das anãs brancas vamos focar nossa atenção em
duas propriedades fı́sicas fundamentais: a) a condição de equilı́brio hidrostático, e b)
o limite de massa para estas estrelas estabelecido por S. Chandrasekhar na década dos
anos ’30s.
5.2.1 O advento da degenerescência: mecânica quântica em

ação
Imagine uma distribuição esfericamente simétrica de matéria. A massa contida num

raio r é dada por
Z r
dm(r)
m(r) = 4πρr2 dr −→−→−→ = 4πρr2 , . (5.1)
0 dr
onde ρ ' ρ0 é a densidade de matéria em repouso. Supómos também que esta é
não-relativı́stica, isto é, suas partı́culas satisfazem a condição v < c. Uma vez que a
estrela encontra-se em estado estacionário, a força gravitacional contrabalança, ponto-
a-ponto a força oriunda da pressão. Para derivar a equação de equilı́brio hidrostático
podemos considerar um elemento infinitesimal de fluido de área dA, perpendicular
à direção radial, e localizado entre r e r + dr. A atração gravitacional entre m(r)
e dm = ρ dAdr resulta ser a mesma que se obtém ao se considerar que m(r) está
concentrada num ponto no centro da distribuição , enquanto que a massa externa não
exerce força alguma sobre o elemento dm. A força neta devida á pressão para fora é
o produto da diferença de pressões sobre essa superfı́cie, á distância r, vezes a área
do elemento de fluido, isto é: P (r + dr) − P (r)]dA, de tal maneira que o equilı́brio se
190
estabelece se
dP m(r)
− = G 2 dm, (5.2)
dr r
ou equivalentemente,
dP m(r)ρ
= −G 2 . (5.3)
dr r
~ = −ρ∇Φ,
De modo geral, equilı́brio hidrostático implica que ∇P ~ onde Φ é o potencial
gravitacional produzido pela distribuição de massa m(r), o qual pode ser obtido a
aprtir da equção de Poisson.
Uma consequência imediata da lei de equilı́brio hidrostático é o chamado Teorema
do Virial, o qual determina que a energia potencial gravitacional W de uma dis-
tribuição de matéria (a estrela) é dada por
Z R
m(r)ρ
W =− G 2
4πr2 dr. (5.4)
0 r
Usando a Eq.(5.3) acima, pode-se escrever
Z R
dP (r)
= 4πr3 dr (5.5)
0 dr
Z R
= −3 4πr2 P (r)dr, (5.6)
0
obtida após uma integração por partes.

Por outro lado, se o gás é caracterizado por uma equação de estado (adiabática) do
tipo politrópica
P = KρΓ0 , (5.7)
onde K e Γ são, correspondentemente, a constante e expoente politrópicos. Podemos
usar a primeira lei da termodinâmica, supondo mudanças adiabáticas na sua evolução ,
para escrever
E 1
d = −P d , (5.8)
ρ0 ρ0
onde E é a densidade de energia total, de tal forma que a densidade de energia do gás
(excluı́da sua massa de repouso) vem a ser dada por
P (r)
E0 = . (5.9)
Γ−1
A equação (5.8) pode ser integrada usando a eq.(5.7) para obter
P (r)
E = ρc2 + , (5.10)
Γ−1
que conduz ao resultado:
E 0 ≡ E − ρ0 c2 . (5.11)
A equação (5.6) pode ser rescrita como
W = −3(Γ − 1)U, (5.12)
191
onde Z R
U= 4πr2 E 0 dr (5.13)
0
é definida como a energia interna total da estrela. Assim, a energia total da estrela se
escreve então como E = W + U . Para um gás de Maxwell-Boltzmann com expoente
adiabático Γ, a energia de movimento translacional ET é dada por ET = 23 (Γ − 1)U ,
de tal forma que o teorema do virial para esse gás se reduz a
1
ET = − W. (5.14)
2
Portanto, a energia total dessa estrela é
3Γ − 4
ET + W + U = − |W |, (5.15)
3(Γ − 1)
2
onde W ∼ −G MR . Além disto, pode-se mostrar que se a equação de estado do gás
da estrela segue a lei politrópica descrita pela eq.(5.7), então a energia potencial dela
resulta ser dada (após uma dupla integração por partes) pela expressão
3(Γ − 1) GM 2
W =− . (5.16)
5Γ − 6 R
Quando uma estrela normal esgota seu combustı́vel nuclear sua energia total E diminui
por causa da radiação que ela emite. Assim, segundo as eqs.(5.15,5.16), se ∆E ≤ 0
então ∆R ≤ 0 sempre que Γ 34 , isto é, a estrela se contrai. Dai surge a pergunta,
até que ponto pode a estrela se contrair? Ou em outras palavras, pode a estrela se
contrair indefinidamente até alcançar um raio R ∼ 0 ? A resposta a esta questão é não!
sempre e quando a massa da estrela M for da ordem de 1M , conforme demonstramos
a seguir.
Suponha que a pressão durante um colapso em quase-equilı́brio seja dada pela lei de
Maxwell-Boltzmann
ρ0
P = κT, (5.17)
µmu
onde µ define o peso molecular médio do gás, mu a unidade atómica de massa, T a
temperatura do gás, e κ uma constante. Note que para Carbono (12 C) puro e ionizado
µ = 12/7. Assim, pelo teorema do virial
Z R
−W = 3 4πr2 P (r)dr, (5.18)
0
3κT̄ R
Z
= 4πr2 ρ0 dr, (5.19)
µmu 0
3M
= κT̄ , (5.20)
µmu
onde T̄ representa a temperatura média na estrela. Desta maneira T̄ ∝ M/R, isto é,
T̄ aumenta quando R diminui. No entanto, note ρ̄ ∝ M/R3 , de modo que a densidade
aumenta muito mais rapidamente ainda. Este resultado sugere a não validade da lei
de Maxwell-Boltzmann nestas condições de colapso, pois o gás de elétrons se torna
degenerado!, e portanto provê uma fonte de suporte de pressão inclusive a temperatura
192
zero! Vejamos o por quê. A diferença de momento linear tı́pico entre elétrons num gás
de Maxwell-Boltzmann é
1/2
1/2 12me GM mu µ
∆Pe ∼ 6me κT̄ ∼ , (5.21)
7R
onde usamos Γ = 5/3 e as eqs.(5.16, 5.20). Observe que para dois elétrons
1/2
∆prms = (p~1 − p~2 )2 . (5.22)
Uma vez que a separação tı́pica entre elétrons é

1/3 1/3
4µe mu R3

µe mu
∆qe ∼ ∼ , (5.23)
ρ0 M
o volume ocupado por um elétron no espaço de fase resulta ser

3/2
3 12µ 3
(Gme R)1/2 m5/6 1/6

(∆prms ∆qe ) ∼ u M (5.24)
7
1/6 1/2 #3
M −26 R 2 −1
∼ 40 1 × 10 g cm s (5.25)
M R
1/2 3/2
3 M R
∼ 180h . (5.26)
M R
Desta maneira, quando uma estrela de 1 M se contrai até alcançar um raio R ∼

3 × 10−2 R , o volume do espaço de fase ocupado por um elétron passa a ser ∼ h3 !
Neste ponto, o Principio de Exclusão de Pauli se torna importante, e a estatı́stica de
Fermi-Dirac deve ser usada. Mostraremos logo mais que inclusive a temperatura zero
um tal gás exerce pressão, a qual é denominada pressão de degenerescência. É esta a
que suporta estrelas tipo anãs brancas e de nêutrons.
5.3 Modelagem de anãs brancas tipo politropo

A equação de estado (EOS) de um gás perfeito de Fermi reduz-se à forma politrópica
simples da eq.(5.7) no caso limite extremo de elétrons não-relativı́sticos (Γ = 5/3) e
ultra-relativı́sticos (Γ = 4/3). Configurações de equilı́brio que sejam descritas por uma
tal equação de estado são chamadas de politropos e são relativamente simples de se
analisar.
5.3.1 Limite de baixa densidade (Γ = 5/3)
As equações de equilı́brio hidrostático (5.1) e (5.3) podem-se combinar para produzir
r2 dP

1 d
= −4πGρ. (5.27)
r2 dr ρ dr
193
Substituindo a equação de estado (5.7), e definindo Γ ≡ 1 + n1 , onde n é o chamado
ı́ndice politrópico, podemos escrever esta equação em forma adimensional usando as
definições seguintes
ρ
= θn , (5.28)
ρc
r
= ξ (5.29)
a
!1/2
(1/n−1)
[n + 1]Kρc
a = , (5.30)
4πG
onde ρc = ρ(r = 0) define a densidade no centro da estrela. Desta forma
1 d 2 dθ
ξ = −θn . (5.31)
ξ 2 dξ dξ
Esta é a conhecida equação de Lane-Emden para a estrutura de um politropo de
ı́ndice n. As condições de fronteira no centro de uma estrela politrópica são (o simbolo
0
indica derivada com respeito a ξ)
θ(0) = 1 θ0 (0) = 0. (5.32)
A primeira condição na eq.(5.32) segue-se diretamente da Eq.(5.29), enquanto que a

segunda obtém-se do fato que m(r) ' 4πr3 ρc /3 perto do centro da estrela, de modo
que a Eq.(5.3): dP (ρ)/dr = 0 implica dρ/dr = 0 no centro.
A equação de Lane-Emden pode ser integrada numericamente, iniciando em ξ = 0
com as condições de contorno (5.32). Encontra-se que para n < 5, (Γ > 6/5), as
soluções decrescem monotonicamente e possuem um mı́nimo (zero!) para um valor
finito ξ = ξ1 , tal que θ(ξ1 ) = 0. Este ponto corresponde à superfı́cie da estrela onde
P = ρ = 0. Assim, o raio da estrela é obtido a partir desta condição como
1/2
[n + 1]K
R = aξ1 = ρ(1−n)/2n
c ξ1 , (5.33)
4πG
enquanto que a massa da estrela vem dada por

Z R
M = 4πr2 ρdr (5.34)
0
Z ξ1
3
= 4πa ρc ξ 2 θn dξ (5.35)
0
Z ξ1
3 d 2 dθ
= −4πa ρc ξ dξ (5.36)
0 dξ dξ
= 4πa3 ρc ξ12 |θ0 (ξ1 )| (5.37)
3/2
[n + 1]K
= 4π ρc(3−n)/2n ξ12 |θ0 (ξ1 )|. (5.38)
4πG
Eliminado ρc entre as Eqs.(5.33) e (5.38) obtém-se a relação massa-raio para politro-

pos:
n/(n−1)
[n + 1]K (3−n)/(1−n) 2
M = 4πR (3−n)/(1−n)
ξ1 ξ1 |θ0 (ξ1 )|. (5.39)
4πG
194
As soluções nas que estamos mais interessados correspondem a valores dos parâmetros
[tomados da lista de parâmetros calculados por S. Chandrasekhar no livro: An intro-
duction to the stellar structure, Dover (1939)]

5 3 2 0
Γ = −→ n= , ξ1 = 3.65375, ξ1 |θ (ξ1 )| = 2.71406 (5.40)
3 2
4
ξ12 |θ0 (ξ1 )| = 2.01824 .(5.41)

Γ = , −→ n = 3, ξ1 = 6.89685,
3
Desta maneira, podemos ver que para anãs brancas de baixa densidade (Γ = 35 ) as
propriedades fı́sicas fundamentais da estrela resultam ser:
−1/6
4 ρc µe −5/6
R = 1.122 × 10 km, (5.42)
106 g cm3 2
1/2
ρc µe −5/2
M = 0.4964 M (5.43)
106 g cm3 2
−3
R µe −5
= 0.7011 4
M . (5.44)
10 km 2
5.3.2 Limite de alta densidade (Γ = 4/3)

No caso de anãs brancas de alta densidade obtemos os seguintes resultados para as
principais propriedades fı́sicas :
−1/3
4 ρc µe −2/3
R = 3.347 × 10 km, (5.45)
10 g cm3
6 2
µ 2
e
M = MCh = 1.457 M (5.46)
2
(5.47)
Pode-se observar que neste limite relativı́stico extremo a massa M da AB independe de

ρc , e portanto também R (ver Eq.(5.47)). Assim, podemos concluir que para ρ → ∞,
os elétrons se tornam mais e mais relativı́sticos no interior da estrela, e que a massa
assintoticamente se aproxima do valor dado pela equação (5.47) enquanto R → 0. Esta
massa crı́tica MCh é chamada limite de Chandrasekhar, por ter sido este pesquisador
indiano o primeiro a ter obtido este resultado. Ela representa a massa máxima possı́vel
para uma AB. Note-se que no caso do gás perfeito, a dependência de MCh na com-
posição quı́mica da estrela fica enteiramente contida na propriedade µe .
5.4 O limite de massa de Chandrasekhar

A existência de uma massa limite para uma estrela degenerada é um resultado tão
fundamental que deve ser entendido da maneira mais simples possı́vel. A seguir usamos
o argumento de Landau (1932) que bem se aplica tanto as anãs brancas quanto às
estrelas de nêutrons.
Suponha que N férmions estão formando uma estrela de raio R, tal que a densidade
numérica pode ser definida como n ∼ N/R3 . O volume por férmion é então ∼ 1/n
195
(por causa do Principio de Exclusão de Pauli), de forma que a relação de incerteza de
Heisenberg indica que o momento linear do férmion é pF ∼ ~n1/3 . Assim, a energia de
Fermi de uma partı́cula do gás no regime relativı́stico é
1/3 ~cN 1/3

EF ∼ ~n c ∼ . (5.48)
R
Entretanto, a energia gravitacional per férmion é
GM mB
EG ∼ − , (5.49)
R
onde M = N mB . (Note que a pressão provêm dos elétrons, mas a massa da estrela
é definida pelos bárions, ı́ons de hidrogênio, hélio, e alguns nêutrons). A condição de
equilı́brio (ver mais adiante) é alcançada para um mı́nimo da energia total
~cN 1/3 GN m2B
E = EF + EG = − . (5.50)
R R
Assim, quando E é positivo, isto é, quando N é pequeno, E pode ser reduzida
forçando um aumento de R. Isto decresce EF e portanto os elétrons tendem a ser
não-relativı́sticos, com EF ∼ p2F ∼ 1/R2 . Eventualmente, EG domina sobre EF para R
crescente. Neste ponto, E se torna negativo, e tende a zero enquanto R → ∞. Deve
existir, portanto, um equilı́brio estável para algum valor finito de R.
Por outro lado, quando E é negativo, isto é, quando N é grande, E pode ser reduzida
sem limite através da redução de R. Isto quer dizer que não existe equilı́brio algum
para esta configuração , e o colapso gravitacional se põe em marcha.
O número bariônico máximo para o equilı́brio é portanto determinado fixando E = 0
na eq.(5.50). Isto conduz a
3/2
~c
Nmax ∼ 2
∼ 2 × 1057 , (5.51)
GmB
e portanto a massa máxima vem dada por
Mmax ∼ Nmax mB ∼ 1.5M . (5.52)
Exceto pelos fatores que exprimem a dependência com a composição quı́mica, a massa
máxima de uma estrela degenerada depende portanto somente de constantes funda-
mentais. Assim, o raio de equilı́brio associado com massas que se aproximam de Mmax
fica determinado pelo advento da degenerescência relativı́stica:
EF ≥ mc2 , (5.53)
onde m refere-se tanto a elétrons quanto a nêutrons. Desta forma, usando as
equações (5.48) e (5.51), esta condição produz (para nêutrons, de massa mn , e elétrons,
de massa me )
1/2
~ ~c
R ≤ (5.54)
mc Gm2B
∼ 5 × 108 cm, m = me , (5.55)
5
∼ 5 × 10 cm, m = mn . (5.56)
Consequentemente, há dois regimes de colapso: um para densidades acima dos valores
para anãs brancas e outro para densidades acima da densidade nuclear. Em ambos os
casos Mmax ∼ 1.5M .
196
Figura 5.3: Localização de algumas anãs brancas famosas (Syrio B e Procyon B) no
diagrama HR, quando comparadas com a posição da sequência principal (curva central na
figura). (Tomada do site de Davison E. Soper, Institute of Theoretical Science, University
of Oregon).
5.5 Anãs brancas: São verdadeiramente obser-

vadas no céu?
Um estudo aprofundado das propriedades fı́sicas das anãs brancas mostra que es-
tas se esfriam em escalas de tempo que são suficientemente longas como para que
muitas anãs degeneradas permaneçam visı́veis durante suficiente tempo por causa da
radiação emitida desde suas superfı́cies. Esta circunstância fortuita leva a um teste
“de ordem zero” da teoria das anãs brancas— isto é, sua localização no diagrama
de Hertzsprung-Russell (HR). Este diagrama HR é basicamente um gráfico em escala
‘log-log’ da luminosidade, L, vs. a temperatura efetiva, Te , que é definida através da
expressão
L = 4πR2 σSB Te4 , (5.57)
onde σSB é a constante de Stefan-Boltzmann. Anãs brancas com uma massa definida
(M ∼ 1M ) têm um raio definido (R ∼ 109 cm), de modo que elas ocupam uma
linha bem definida no diagrama HR onde L ∝ T 4 . Uma vez que pela teoria acima
apresentada espera-se que toda anã branca tenha uma massa próxima de ∼ 1M , todas
as anãs brancas deverão ocupar uma banda estreita no diagrama HR, bem à esquerda
e abaixo da sequência principal para estrelas de idade zero. Uma comparação afinada
com as observações produz um acordo satisfatório, conforme ilustrado na Figura 5.1.
A maneira mais correta de se determinar o raio de uma AB é ajustando modelos de
197
atmosferas estelares à radiação residual observada. O fluxo Fν , em unidades erg s−1
cm−2 Hz−1 , medido na terra, é definido em função do fluxo na superfı́cie da AB como
R2 Fν (?)
Fν (⊕) = , (5.58)
D2
onde R é a raio da estrela e D é sua distância. Para anãs brancas ‘vizinhas’ a grandeza
D é determinada medindo o paralaxe da estrela. Seguidamente, constrói-se um modelo
de atmosfera, que depende da temperatura efetiva e da gravidade superficial da estrela,
de forma a reproduzir o fluxo Fν (?) observado em diferentes comprimentos de onda, e
a partir deste encontra-se o raio R. A determinação desta grandeza para inúmeras (&
4000) anãs brancas mostra que a discordância entre teoria e observação é menor de
10%. A Figura 5.3, também ilustra esta propriedade. A Figura 5.3 indica que o raio
de Syrio B e Procyon B é aproximadamente de uns 7300 km para cada uma delas. As
observações mais recentes indicam que uma grande parcela destas anãs brancas possui
uma composição quı́mica que se estende até elementos como 12 C e 16 O (é claro sem
excluir a possibilidade de se encontrarem estrelas com composição inclusive de 56 Fe
puro !).
Em geral, é difı́cil estimar dinamicamente e diretamente as massas de anãs bran-
cas (algo semelhante acontece com outras estrelas compactas). O melhor dos casos
é quando a estrela forma parte de um sistema binário, ou triplo, cujos parâmetros
orbitais podem ser medidos astrometricamente. No caso de ABs em binárias suas mas-
sas foram estimadas analisando a dinâmica de variáveis cataclı́smicas, ou em sistemas
binários que contém como companheira uma ENs. Estas estimativas indicam que efe-
tivamente todas as ABs observadas possuem massas menores do que M ∼ 1.445 M .
5.6 Estabilidade de estrelas anãs brancas

Se algum processo astrofı́sico, por exemplo acrescência de matéria, perturbar o estágio
quiescente de uma AB, cómo responde a estrela a tal perturbação ? Na teoria básica
de fluidos mostra-se que o equilı́brio hidrostático corresponde a um mı́nimo da ener-
gia. A seguir analisar-se-á como se comporta uma AB perante perturbações , isto é,
pequenos desvios de sua configuração de equilı́brio. Faremos esta análise no contexto
da teoria geral da relatividade, uma vez que este curso esta fundamentado nesta teoria
da gravitação (de fato, o caso newtoniano pode se estudar como um limite do caso
relativı́stico aqui sob análise.
O critério de estabilidade considera a resposta da estrela a pequenas variações do
seu ponto de equilı́brio. Este critério pode igualmente ser relacionado a uma análise
de modos normais de oscilação da estrela. Estes modos podem ser descritos pela sua
dependência temporal e de posição espacial
ξ j (~x, t) = ξ j (~x)eiωj t , (5.59)
sendo que a estrela estará em equilı́brio se a frequência de um determinado modo j
satisfazer a condição ωj2 < 0, conforme mostra-se a seguir.
5.6.1 Estabilidade de ABs na relatividade geral

Nosso objetivo nesta seção é determinar a densidade crı́tica para o advento da instabil-
idade de uma AB em relatividade geral (a densidade define univocamente a frequência
198
Figura 5.4: Relação massa-raio para anãs brancas de 12 C, 24 M g, e 56 F e previstas por
modelos teóricos. As linhas tracejada-pontilhada, pontilhada e duplamente pontilhada,
respectivamente, são comparada com determinações desta propriedade através de ob-
servações de 40 Eri B, Sirius B, Procyon B. (Tomada de F. Weber, [astro-ph/0112058
(2001)]).
199
do modo fundamental de oscilação de um fluido). Para analisarmos a estabilidade de
uma AB levando em consideração os efeitos da relatividade geral (GR), conforme
expresso pelo termo ∆EGR , pode-se escrever a energia total da estrela na forma
E = Eint + Egrav + ∆Eint + ∆EGR . (5.60)
Numa primeira aproximação , somente os dois primeiros termos estariam presentes.

Estes podem ser avaliados para uma distribuição de densidade politrópica como
Z
nP
Eint = dm, (5.61)
ρ
Z ξ1
1/n n
= Kρc M 2 0 ξ 2 θn+1 dξ. (5.62)
|ξ1 θ (ξ1 )| 0
Z
m
Egrav = −G dm, (5.63)
r
ξ1
GM 5/3
Z
1/3
= (4πρc ) M 2 0 ξ 3 θn+1 dξ. (5.64)
|ξ1 θ (ξ1 )|5/3 0
Assim, pode-se escrever a relação

Z ξ1 Z ξ1
1 d
ξ 3 θn θ0 dξ = ξ 3 θn+1 dξ (5.65)
0 n+1 0 dξ
Z ξ1
3
= − ξ 2 θn+1 dξ. (5.66)
n+1 0
A última integral na eq.(5.66) pode avaliar-se usando o procedimento de integração por
partes. Lembrando o resultado para a energia potencial gravitacional obtido anterior-
mente na eq.(5.16), encontramos que para um politropo
3 GM 2
Egrav = − . (5.67)
5−n R
Notando que a relação massa-raio pode-se escrever também como
M 4πρc |θ0 |
= , (5.68)
R3 ξ1
podemos escrever a energia gravitacional na forma
1/3
4π|θ0 |

3 5/3 1/3
Egrav = − GM ρc . (5.69)
5−n ξ1
Comparando as eqs.(5.64) e (5.66), encontra-se que

Z ξ1
n+1 3 0 2
ξ 2 θn+1 dξ = ξ |θ | . (5.70)
0 5−n 1
Portanto, obtemos
Eint = κ1 Kρ1/n
c M, (5.71)
e também
Egrav = −κ2 Gρ1/3
c M
5/3
, (5.72)
200
onde as constantes κ1 e κ2 são definidas (para n = 3, Chandrasekhar 1939) como
n(n + 1) |ξ12 θ0 |
κ1 = = 1.75579, (5.73)
5−n ξ1
e
3 |4πξ12 θ0 |1/3
κ2 = = 0.639001. (5.74)
5−n ξ1
Entretanto, o termo ∆Eint representa o desvio da equação de estado com respeito
àquela de um politropo com n = 3, em razão de que os elétrons não são completamente
relativı́sticos. Assim, a energia interna por unidade de massa (u ≡ U/M ) é
Ee − me c2 ne
u= , (5.75)
ρ
onde ρ = µe mu ne ≡ ρ0 . Assim, usando o limite para elétrons relativı́sticos dado no já
citado livro de Chandrasekhar (1939), escrevemos

1 4 2 1
Ξ(x) −→ 2 x + x − ln 2x... , (5.76)
4π 2
no qual o momento linear de Fermi adimensional, ou parâmetro relativı́stico da
equação de estado, é definido como: x ≡ pF /me c >> 1. A partir disto, encontra-
se que
3 me c2

4 2 1
u= x + x − ln 2x... . (5.77)
4 µe mu 2
Na eq.(5.77), o termo proporcional a x, isto é, 12 ln 2x, é simplesmente 3P/ρ, que é o
mesmo que foi usado para calcular Eint . O termo seguinte é uma constante e pode ser
desprezada usando o principio variacional, de tal modo que
3 me c2
Z
1
∆Eint = dm. (5.78)
4 µe mu x
Retomando a definição de densidade dada acima, e lembrando que a densidade

numérica de elétrons escreve-se como
1
ne = 2 3
x3 , (5.79)
3π λe
onde λe = ~/me c é o comprimento de onda Compton do elétron, vemos que o
parâmetro relativı́stico pode ser escrito em função da densidade da estrela e de con-
stantes fundamentais, como
2 3 1/3
3π λe
x= . (5.80)
µe mu
Desta maneira, pode-se avaliar ∆Eint integrando sobre uma distribuição politrópica
com n = 3. Neste caso, o erro será de order superior. Portanto,
m2e c3

∆Eint = κ3 M ρc−1/3 , (5.81)
~(µe mu )2/3
onde define-se a constante κ3 como
1/3 Z ξ1
3 1 1
κ3 = ξ 2 θ2 dξ = 0.519723. (5.82)
4 3π 2 |ξ12 θ0 | 0 1
201
Por outro lado, a correção relativı́stica pode ser obtida integrando a equação de Lane-
Emden para um politropo com n = 3, e resulta ser dada por (κ4 = 0.918294)
G2 7/3 2/3
∆EGR = −κ4 2 M ρc . (5.83)
c
Assim, a energia total pode escrever-se como
E = (AM − BM 5/3 )ρc1/3 + CM ρc−1/3 − DM 7/3 ρc2/3 , (5.84)
onde as seguintes constantes são definidas:
m2e c3 G2

A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.85)
~(µe mu )2/3 c2
Desta forma, o equilı́brio se estabelece se a condição ∂E/∂ρc = 0 é satisfeita. Obtemos
então
1 1 2
(AM − BM 5/3 )ρc−2/3 − CM ρc−4/3 − DM 7/3 ρ−1/3 c = 0. (5.86)
3 3 3
Considerando soluções até primeira ordem na densidade central ρc , podemos igno-
rar os termos proporcionais a C e D. A partir do que recuperamos a expressão de
Chandrasekhar para a massa máxima
3/2 µ −2
A e
M= = 1.457 M , (5.87)
B 2
onde fizemos uso da definição da constante politrópica K dada por
( )
31/3 π 2/3 ~c 1.2435 × 1015
K= 4/3 4/3
= 4/3
em unidades c.g.s. (5.88)
4 mu µe µe
Por outro lado, se mantivermos os termos C e D obtemos pequenas correções ao valor
de M , que dependem de potências de ρc .
Assim sendo, a instabilidade se desencadeia quando a condição ∂ 2 E/∂ρ2c = 0 é satis-
feita. Nesta ocasião obtemos
12 14 21
− (AM − BM 5/3 )ρ−5/3 c + CM ρ−7/3
c + DM 7/3 ρ−4/3
c = 0. (5.89)
33 33 33
Resolvendo a eq.(5.86), e subtituindo na eq.(5.89), observando que todas as grandezas
são da mesma ordem de magnitude, podemos substituir M por (A/B)3/2 , para achar-
mos finalmente que
CB 2 16κ3 κ22
2 2
mu µe
ρc = 2
= 2 2/3 2
, (5.90)
DA (3π ) κ4 κ1 λ3e me
µ 2
e
= 2.646 × 1010 g cm−3 , (5.91)
2
que define a densidade crı́tica para o surgimento da instabilidade numa AB dev-
ido a relatividade geral. Lembre-se que para 56 Fe µe = 2, 154, e portanto ρc =
3.07 × 1010 g cm−3 . Note que este limite é maior do que o valor crı́tico para o de-
caimento β-inverso: ρc = 1.14 × 109 g cm−3 , e por consequência a relatividade geral
é irrelevante para anãs brancas compostas puramente de ferro. No entanto, para 4 He
ou 12 C a densidade crı́tica obtida considerando os efeitos devidos à relatividade geral
é ρc = 2.65 × 1010 g cm−3 . Esta densidade é menor do que o limite para neutron-
(4 He) (12 C)
ização ,(neutron drip) ρc = 1.37 × 1011 g cm−3 e ρc = 3.90 × 1010 g cm−3 .
Nestes casos, certamente é a relatividade geral a que limita a densidade central da
estrela.
202
Figura 5.5: A foto mostra a região central da Nebulosa do Caranguejo, o remanescente da
explosão supernova do ano 1054. A estrela brilhante no centro da imagem, da qual parecem
emanar jatos de radiação , é o pulsar do Caranguejo. (Foto cortesia do CHANDRA X-ray
Observatory).
5.7 Estrelas de Nêutrons
Por volta de 1932, Landau ofereceu uma explicação elementar da natureza do limite
de Chandrasekhar, conforme foi discutido na seção anterior. Inspirado nestas idéias
ele aplicou esses mesmos argumentos ao conceito de estrelas de nêutrons, após tomar
conhecimento da descoberta do nêutron. Em 1934 W. Baade e F. Zwicky propuseram
a idéia das estrelas de nêutrons (ENs), salientando que estas deveriam ser objetos
de alta densidade que possuiriam raios muito pequenos. Com uma sugestão defini-
tivamente visionária estes pesquisadores ainda conjecturaram que estas estrelas de
nêutrons seriam formadas em explosões de supernova! De fato, hoje em dia conhece-
mos dois caminhos bem estabelecidos para a formação de uma ENs: a) a ENs pode-se
formar durante a explosão de supernova de uma estrela com massa entre 5 e 30 massas
solares (massas maiores do que 30 M supõe-se produziriam buracos negros como re-
manescentes), ou b) a ENs pode ser o resultado do colapso gravitacional induzido por
acrescência de matéria sobre uma AB numa variável cataclı́smica. Um das supernovas
mais conhecidas é a que foi observada por astrônomos chineses no ano 1054, à qual,
sabemos hoje, esteve associada a formação do pulsar do Caranguejo (The Crab pulsar,
ver Figura 5.5).
Tempo depois, em 1939, o primeiro cálculo teórico de um modelo de ENs foi realizado
por Oppenheimer & Volkoff (OV) usando relatividade geral. Apesar dessa evidência
teórica da existência desta classe de objetos estelares, a idéia foi praticamente aban-
203
donada durante de mais de 30 anos. Foi só quando os pulsares3 foram descobertos por
Jocelyn Bell, e explicados por Anthony Hewish em 1968, que tais estrelas tornaram-
se uma realidade astrofı́sica. Hoje sabemos da existência, conforme registrada em
catálogos, de mais de 2000 pulsares, embora o número provável de estrelas de nêutrons
na nossa galáxia estime-se ser de centenas de milhões. Com a descoberta das fontes
cósmicas de raios-X não-locais (i. e., não solares), por Giaconni et al. em 1962, muitos
teóricos especularam que o telescópio de raios-X estaria vendo estrelas de nêutrons,
jóvens e quentes! A onda se propagou, e uma corrida pela modelagem do esfriamento,
entre muitas outras propriedades, das estrelas de nêutrons começou. O resultado final,
conforme o entendemos hoje, é que as estrelas de nêutrons são laboratórios de fı́sica
extrema, como diria Jocelyn Bell [Astron. & Geophys., Vol 45, 1.7 (2004)].
5.8 Equação de estado de gás perfeito no domı́nio

nuclear
Em primeira aproximação , a estrutura de uma ENs é obtida supondo que o gás de-
generado que a forma está constituı́do por partı́culas (nêutrons) que não interagem
entre si: ou seja um gás ideal. De fato, o argumento dimensional de Landau apre-
sentado antes supõe um gás perfeito degenerado de nêutrons e obtém uma massa
Mmax ∼ 1.5M e seu correspondente raio R ∼ 3 km.4
Para começar, podemos analisar o caso de uma gás puro de nêutrons cuja equação de
estado é a de um politropo
P = KρΓ0 , (5.92)
onde ρ0 = mn nn = 6.1067 × 1015 g cm−3 , Γ = 5/3 para um gás não-relativı́stico,
e 4/3 para um gás ultra-relativı́stico. A constante politrópica K foi definida antes.
Usando a equação de equilı́brio hidrostático em relatividade geral, ou equação de
Tolmann-Oppenheimer-Volkoff (TOV) (ver Apêndice A),
G (P + ρ) M (r) + 4πr3 cP2

dP
=− , (5.93)
dr 2 2GM (r)
r 1 − c2 r
(5.94)
TOV obtiveram configurações de equilı́brio de massa máxima com os seguintes

parâmetros:
Mmax = 0.7 M R = 9.6 Km ρc = 5 × 1015 g cm−3 . (5.95)
Em geral, configurações com densidade central ρc ≥ 5 × 1015 g cm−3 são instáveis e

sofrem colapso gravitacional. O limite de massa de Chandrasekhar para uma ENs pura,
isto é, um politropo newtoniano com n = 3 (o que implica uma densidade infinita), é
M ∼ 5.73M . A relatividade geral reduz este valor por duas razões principais: a) a
massa máxima ocorre a um valor finito da densidade central ρc para o qual os nêutrons
se tornam relativı́sticos, mas não são ultra-relativı́sticos. b) M ∼ 5.73M é a massa
3
Todo pulsar deve ser uma ENs!
4
As massas calculadas nesta aproximação estariam Ok!, mas os raios das ENs ... hhhhmmm !?!?!?
204
de repouso dos nêutrons, mas a massa total é menor do que esta por causa da energia
de ligação gravitacional da estrela.
Entretanto, ENs de baixa densidade com equação de estado de gás perfeito de nêutrons
podem ser aproximadas por politropos newtonianos com n = 3/2. Usando as fórmulas
da seção precedente encontramos
−1/6
ρc
R = 14.64 , (5.96)
1015 g cm−3
1/2
ρc
M = 1.102 M , (5.97)
1015 g cm−3
3
15.12 km
= M . (5.98)
R
Assim, na equação TOV no existe uma massa mı́nima para a ENs pois quando M −→
0, R −→ ∞ quando ρc −→ 0. De fato, os nêutrons se tornam instáveis ao decaimento
β a densidades muito mais baixas.
Os resultados de TOV podem ser obtidos de forma aproximada usando o principio
variacional da energia. Uma vez que ρc é definida, a Mmax fica restrita à região de
transição do regime não-relativı́stico para o relativı́stico. Porém, não é enteiramente
claro que classe de politropo se aproxima melhor da configuração de estrela constituı́da
por puros nêutrons quando a massa da estrela se aproxima a Mmax .
Usando as definições dadas acima para Eint , e Egrav temos
Eint = κ1 Kρc2/3 M, κ1 = 0.795873, (5.99)
e
Egrav = −κ2 Gρc1/3 M 5/3 , κ2 = 0.760777. (5.100)
Assim, para calcular ∆Eint , primeiramente temos de calcular
En − mn c2 nn
u= , (5.101)
ρ0
para a qual ρ0 = mn nn = mn x3 /(3π 2 λ3n ), onde o parâmetro relativı́stico x 1.
Usando, mais uma vez, o resultado para elétrons não relativı́sticos (ver livro de Chan-
drasekhar 1939)
1 3 3 5 3 7
Ξ(x) → 2 x + x − x .... , (5.102)
3π 10 56
encontramos que
2 3 2 3 4
u=c x − x . (5.103)
10 56
O primeiro termo na eq.(5.103) dá Eint , enquanto o segundo conduz a
Z
3 2
∆Eint = − c x4 dm. (5.104)
56
Substituindo para x em termos de ρ0 de sua definição dada acima, e fazendo a usual
substituição para um politropo na integral anterior, obtemos
~4

∆Eint = −κ3 16/3
M ρc4/3 , (5.105)
mn c2
205
onde agora para ENs
Z ξ1
3 2 4/3 1
κ3 = (3π ) θ3.5 ξ 2 dξ = 1.1651. (5.106)
56 |ξ12 θ0 (ξ1 )| 0
Finalmente, a correção devida à relatividade geral, ∆EGR , pode ser obtida usando as
definições dadas acima
G
∆EGR = −κ4 2 M 7/3 ρc2/3 , (5.107)
c
onde
Z ξ1 Z ξ1
(4π)2/3 5 + 2n − n2

3 0 n+1 3 4 0 2 n
κ4 = − 2 ξ θ θ dξ + (n − 1) ξ (θ ) θ dξ .
(5 − n)[ξ12 |θ0 (ξ1 )|]7/3(n + 1) 0 2 0
(5.108)
Caso a estrela for constituı́da só de nêutrons, a avaliação numérica destas integrais
produz κ4 = 0.6807. Desta forma, a energia total da ENs é dada por
E = AM ρc2/3 − BM 5/3 ρc1/3 − CM ρ4/3

c − DM 7/3 ρ2/3
c , (5.109)
onde, desta vez, as seguintes constantes foram introduzidas
~4 G2

A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.110)
(mn )16/3 c2 c2
Desta forma, o equilı́brio se estabelece se a condição ∂E/∂ρc = 0 é satisfeita. Esta

relação implica
2Aρ−1/3
c − BM 2/3 ρc−2/3 − 4Cρc1/3 − 2DM 4/3 ρ−1/3
c = 0. (5.111)
Pode-se verificar que se mantivermos os dois primeiros termos só, rencontramos o

resultado para o politropo n = 3/2. Enquanto que se mantivermos todos os termos
obtemos uma melhor aproximação à relação M vs. ρc de TOV.
Portanto, a instabilidade ocorre quando a condição ∂ 2 E/∂ρ2c = 0 é satisfeita. Esta
condição se traduz em
−2Aρ−1/3
c + BM 2/3 ρc−2/3 − 4Cρc1/3 + 2DM 4/3 ρ−1/3
c = 0. (5.112)
Assim, somando as Eqs.(5.111) e (5.112) obtém-se
BM 2/3
ρc = . (5.113)
8C
Substituı́ndo isto na Eq.(5.112), e introduzindo o parâmetro y = M 4/9 , chegamos a
uma equação cúbica em y que tem a forma
2A − 3B 2/3 C 1/3 y − 2Dy 3 = 0. (5.114)
A raı́z positiva desta acontece para o valor de y = 6.605 × 1014 em unidades c.g.s., de
modo que
M = 1.11 M , ρc = 7.43 × 1015 g cm−3 . (5.115)
206
Figura 5.6: Relação massa-raio de modelos teóricos de estrelas de nêutrons comparada
com determinações desta propriedade através de observações das fontes de raios-X Vela
X-1, Cyg X-2, e o pulsar binário PSR 1913+16. (Tomada de F. Weber [Prog. Part. Nucl.
Phys. 54, 193 (2005)]. Copyright Elsevier 2005).
Observe-se que M , conforme determinada na eq.(5.115), é verdadeiramente a massa

de repouso dos nêutrons (lembre-se que as fórmulas politrópicas apresentadas antes
usam dm = 4πr2 ρ0 dr). Se substituirmos os valores de M e ρc dados pela Eq.(5.115)
na Eq.(5.109), encontramos que
E
= −0.08 M . (5.116)
c2
Desta maneira, se tirarmos esta fração da massa obtida na Eq.(5.115), resulta que a
EN s
massa total máxima prevista para uma ENs é Mmax = 1.03 M ! Esta é quase 40%
maior do que a obtida com a equação de TOV no modelo de um gás puro de nêutrons,
conforme referido na Eq.(5.95).
207
5.9 Modelos realı́sticos de estrelas de nêutrons
Uma equação de estado5 mais realı́stica considera uma mistura (ideal) de nêutrons,
prótons e elétrons que não interagem entre si. As caracterı́sticas principais desta
equação de estado são: 1) os nêutrons só estão presentes a densidades que excedem
ρn = 1.2 × 107 g cm−3 , 2) a razão nêutron/próton alcança um máximo ao redor de
ρn/p = 7.8 × 1011 g cm−3 , e 3) ultrapassado este máximo esta razão diminui até o valor
8 quando a densidade ρ → ∞. (Lembre-se sempre: para um gás perfeito P → ρ3 c2
quando ρ → ∞). Assim, os modelos estelares construı́dos com esta equação de estado
diferem muito dos resultados obtidos por TOV, visto que P (ρ) é muito semelhante ao
caso de nêutrons puros. Como exemplo, os parâmetros das estrelas nesta caso resultam
ser:
M = 0.72 M , R = 8.8 km, ρc = 5.8 × 1015 g cm−3 . (5.117)
Portanto, estrelas de nêutrons com densidades ρc ≤ 7.8 × 1011 g cm−3 verdadeira-

mente pertencem ao ramo de alta-densidade das anãs brancas, e consequentemente
são instáveis. Assim sendo, devemos esperar encontrar um mı́nimo local na curva
M vs.ρc próximo deste valor de ρc .
A fı́sica nuclear e a fı́sica de partı́culas elementares modernas prevêem que a estrutura

interna de uma ENs seja certamente bem mais complexa do que aquela para um
gás perfeito constituı́do de puros nêutrons ou ainda de um gás de nêutrons, prótons e
elétrons, estes últimos necessários para se garantir a estabilidade da estrela previnindo
o decaimento do seu enorme número de nêutrons. (Ver Figura 5.7).
Podemos agora comparar modelos realı́sticos de estrelas de nêutrons que resultam

quando são utilizadas equações de estado diferentes na equação de TOV. As Figuras
5.6 e 5.8 mostram curvas teóricas para a razão massa-raio de estrelas de nêutrons
obtidas usando algumas das equações de estado tidas como mais “realı́sticas”. (ver
Figura 5.8). Destas figuras algumas caracterı́sticas gerais emergem:
a) Modelos estelares calculados com a equação de estado, por exemplo do tipo Bethe-
Johnson, têm massas máximas muitos maiores do que estrelas obtidas a partir de
equações de estado ‘moles’, como, por exemplo, a equação do tipo Reid.
b) Estrelas calculadas com uma EOS ‘dura’ têm uma densidade central baixa, um raio
maior, e uma crosta mais grossa do que estrelas da mesma massa modeladas com uma
EOS mole (ver Figura 5.7).
5
Uma equação de estado é uma relação entre a densidade de matéria e sua pressão. Note, de passagem,
que as equações de estado (EOS) classificam-se em: 1) duras (‘stiff’) se seu volume ou densidade é difı́cil
de alterar, por exemplo a água, 2) moles (‘soft’) se estas propriedades podem ser modificadas facilmente,
por exemplo o ar, e moderadamente duras (‘semi-stiff) se admitem alguma mudança importante. Assim
sendo, o conhecimento da EOS nos diz quão flexı́vel é a matéria sob consideração .
208
Figura 5.7: Visão moderna da estrutura interna de uma ENs. Pode-se ver a diversidade de
partı́culas elementares que acredita-se possam existir no interior destes objetos. (Versão
original de F. Weber, nos Proceedings of the VIII International Workshop on Hadron
Physics, April 14-19, 2002, Rio Grande do Sul, Brazil).
209
Figura 5.8: Relação massa-raio do objeto candidato a ser uma strange star: SAX J1808.4-,
conforme determinada a partir de observações com o Rossi XTE, comparada com modelos
teóricos de estrelas de nêutrons e estrelas estranhas. (Versão original de X. D. Li, et al.
[Phys. Rev. Lett. 83, 3776 (1999)]. Copyright 1999, by the Americam Physical Society).
c) A condensação de pı́ons (ver Figura 5.7), se esta acontece, tende a contrair, i.e.,
tornar de raio menor, a ENs de uma massa dada ao mesmo tempo que dimui sua
massa máxima Mmax .
Conforme pode-se verificar na Figura 5.7, a estratificação das configurações é simples-
mente uma consequência do advento de regimes diferentes na EOS enquanto se avança
em direção a densidades mais altas. As camadas podem ser identificadas como segue:
a) A superfı́cie (ρ ≤ 106 g cm−3 ), uma região na qual as temperaturas e campos
magnéticos, que se supõe que existem nessas estrelas, podem afetar a EOS.
b) A crosta exterior (106 ≤ ρ ≤ 1011 g cm−3 ), uma região sólida em que a rede
cristalina (‘lattice’) de Coulomb de núcleos pesados coexiste em equilı́brio β com o
gás degenerado de elétrons (ver EOS de ABs).
c) A crosta interior (4.3 × 1011 ≤ ρ ≤ 2.14 × 1014 g cm−3 ), que coexiste com a rede
cristalina de núcleos ricos em nêutrons, com um gás de nêutrons superfluido e um gás
de elétrons.
d) O lı́quido de nêutrons (2.14×1014 ≤ ρ ≤ ρcore ), que contém principalmente nêutrons
superfluidos com uma pequena concentração de prótons superfluidos e elétrons nor-
mais.
e) A região do core (ρ > ρcore ), que pode or não existir em algumas estrelas. Isto
depende de se ocorre ou não condensação de pı́ons, ou se ocorre uma transição de fase
210
a um sólido de nêutrons ou a matéria de quarks, ou alguma outra fase fisicamente
distinta de um lı́quido de nêutrons a densidades acima de algum valor crı́tico ρcore ).
Se a EOS é dura, a densidade central de uma ENs relativamente maciça (1.4 M ) é ρ ≤
1015 g cm−3 , e de fato, ainda as ENs estáveis mais maciças, têm ρ . few ×1015 g cm−3 .
Desta forma, uma transição a matéria de quark ou alguma outra forma exótica de
matéria parece improvável nestas condições . No entanto, existe a possibilidade de um
terceiro ramo estável de ‘estrelas estranhas’ no diagrama M vs. ρc (ver Figura 5.6),
além das ABs e ENs.
Entretanto, na natureza, estrelas de nêutrons com massas perto do limite de Chan-
drasekhar de 1.4 M parecem ser favorecidas. Tais estrelas com EOS moderadamente
duras não são susceptı́veis á formação de condensados de pı́ons. Isto parece precisar
que a condição ρ ≥ 2 ρnuc seja satisfeita se elas verdadeiramente se formam. Por outro
lado, a massa mı́nima de uma ENs estável é determinada fixando o valor médio do
ı́ndice adiabático Γ igual ao valor crı́tico ∼ 43 para estabilidade radial contra o colapso.
Isto conduz a Mmin ∼ 0.09 M . Enquanto isso, todos os cálculos microscópicos de EOS
levam a ENs com massa máxima Mmax ∼ 3 M , conforme mostrado a seguir.
5.9.1 Massa máxima de ENs
A possibilidade de se discriminar entre alguns objetos compactos como buracos negros

e estrelas de nêutrons descansa em parte em sermos capazes de estabelecer categorica-
mente que o objeto observado tem uma massa maior do que o valor máximo de massa
permitido para uma ENs (ou uma AB) estável. Portanto, pode-se colocar a seguinte
questão:
Existe algum limite superior que possa ser imposto sobre a massa de ENs que in-
dependa das peculiaridades da EOS no regime desconhecido de altas densidades? A
resposta a esta pergunta é: Sim !
Um tratamento geral do problema da massa máxima de uma ENs estável foi fornecido
por Rhoades & Ruffini em 1974 [6] com base nas seguintes suposições :
a) A relatividade geral é a teoria correta da gravitação . Isto significa que la equação de
TOV determina a estrutura de equilı́brio.
b) A EOS satisfaz a condição de estabilidade ‘microscópica’
dP
≥ 0. (5.118)
dρ
Se esta condição for violada, elementos pequenos de matéria colapsariam espontanea-

mente.
c) A EOS satisfaz a condição de causalidade
211
dP
≤ c2 . (5.119)
dρ
isto é, a velocidade do som na matéria da estrela é menor do que a velocidade da luz
no vácuo.
d) A EOS abaixo de uma ‘densidade de junção ’ ρ0 é conhecida.
Rhoades e Ruffini efetuaram um cálculo variacional para determinar que EOS acima
de ρ0 , sujeita aos vı́nculos das eqs.(5.118) e (5.119), maximiza a massa. O resultado
dessa análise mostra que
P = P0 + (ρ − ρ0 ) c2 , ρ ≥ ρ0 (5.120)
−1/2
é o mais plausı́vel. O que se traduz na relação Mmax ∝ ρ0 para ρ < ρ0 . Desta
maneira, a integração numérica da equação de TOV com uma EOS tipo Harrison-
Wheeler mostra que
−1/2
ρ
Mmax = 3.2 M . (5.121)
4.6 × 1014 g cm−3
Modelos mais sofisticados implementados em modernos estudos desta propriedade
mostram que essencialmente a massa máxima de ENs fica por volta de 3 M .
Acima deste limite, qualquer objeto compacto que venha a ser encontrado poderá
caracterizar-se como um buraco negro. O estudo desta classe particular de OCs é o
tema do capı́tulo seguinte deste livro.
5.10 Estrelas de nêutrons: são realmente obser-

vadas no céu? Possuem as propriedades preditas?
Para sabermos, efetivamente, se algumas destas estrelas compactas são verdadeira-
mente ENs, precisamos determinar suas massas e raios de maneira direta. A maneira
mais confiável de se determinar a massa de objetos astronômicos é via a terceira lei
de Kepler. Considere duas massas esféricas M1 e M2 em órbita circular ao redor de
seu centro de massa. A separação entre as duas massas é a e suas distâncias do centro
de massa são a1 e a2 , tal que
a = a1 + a2 , (5.122)
M1 a1 − M2 a2 = 0. (5.123)
Se chamarmos i ao ângulo de inclinação do plano orbital respeito da linha de visada,

vemos que qualquer caracterı́stica espectral emitida desde M1 será deslocada via efeito
Doppler, de tal forma que a amplitude da variação é V1 , que é a projeção da velocidade
orbital de M1 ao longo da linha de visada
2π
V1 = a1 seni, (5.124)
P?
212
onde P? é o perı́odo orbital. Assim, se o espectro de M1 mostrar variações periódicas,
então P? e V1 podem ser medidos e portanto se obter uma função para a1 seni. Alter-
nativamente, para pulsos de raios-X podem medir-se variações periódicas no tempo
de chegada dos pulsos. A amplitude destas variações é simplesmente o tempo de vôo
através da órbita projetada, isto é, a1 seni/c.
Ora, a lei de Kepler estabelece que
2
G(M1 + M2 ) 2π
= . (5.125)
a3 P?
Das equações da dinâmica da órbita (5.123) temos
M1 + M2
a= a1 , (5.126)
M2
de modo que a função de massa f , que depende só dos observáveis P? e V1 (ou a1 seni),
é definida como
(M2 seni)3 P? V13

f (M1 , M2 , i) ≡ = . (5.127)
(M1 + M2 )2 2πG
Se somente uma função de massa pode ser medida para um sistema binário, então não
se pode proseguir além da Eq.(5.127) sem ter informações adicionais. Só em alguns
casos de binárias de raios-X tem sido possı́vel medir ambas as funções de massa, da
companheira óptica, O, e da fonte de raios-X, X, obtendo-se
(MO seni)3 (MX seni)3

fX = , fO = . (5.128)
(MX + MO )2 (MX + MO )2
A razão entre estas duas expressões da a razão de massa, q ≡ M MO

X
, pudendo se escrever
então a partir da Eq.(5.128)
fX q(1 + q)2
MX = . (5.129)
sen3 i
Um valor único de MX ainda depende de seni. Na prática, observações da duração de
eclipses de raios-X e/ou variações na curva de luz óptica são usadas para impôr vı́nculos
geométricos sobre seni. Desta forma foram feitas as determinações das massa dos
objetos apresentados na Figura 5.9.
5.10.1 Pulsares binários
Os pulsares binários constituem um dos laboratórios astrofı́sicos mais importantes para

testar predições teóricas dos mais diversos gêneros. Muitos desses sistemas possuem
‘pulsares radio’ que com frequência têm perı́odos de rotação de milisegundos como
resultado de transferência de massa desde suas estrelas companheiras orbitais. Estes
fornecem relógios em movimento muito precisos que nos permitem investigar uma am-
pla gama de problemas astrofı́sicos, de outra maneira inacessı́veis. Os parâmetros or-
bitais estimados a partir de ‘pulsar timing’ provêem vı́nculos sobre a evolução binária,
213
Figura 5.9: Massas de ENs obtidas a partir de observações de sistemas binários que contém
pelo menos um pulsar radio. Note que a média corresponde a 1.35 ± 004 M . (Versão
original publicada por S. E. Thorsett & D. Chakrabarty, The Astrophysical Journal 512,
288 (1999). Copyright The American Astronomical Society (1999)).
214
caracterı́sticas da população de pulsares binários, e massas de estrelas de nêutrons
com diferentes histórias de transferência de massa. Particularmente, no caso de teo-
rias como as da gravitação , eles permitem discriminar de maneira efetiva entre as
várias alternativas para se descrever esta interação na natureza, colocando vı́nculos
fortes sobre os desvios em relação à relatividade geral. Procuras por novos pulsares
(‘surveys’) produzem sistemas binários novos que aumentam nossa compreensão de
todos estes campos e podem abrir áreas da fı́sica enteiramente novas, como espectacu-
larmente demonstrado pela recente descoberta do único sistema (conhecido até hoje)
duplo de pulsares extremamente relativı́stico: J0737-3039 A,B !
No caso do pulsar binário de Taylor & Hulse (PSR 1913+16), somente uma função de
massa é disponı́vel a partir de observações em radio. A estrela companheira é um
objeto compacto de algum tipo, mas não tem sido possı́vel observá-lo diretamente.
Contudo, a alta precisão das observações do pulsar, combinadas com a velocidade
orbital (V1 acima) relativamente alta permitiram medições do avanço do periastro
devido ao efeito previsto pela relatividade geral e o deslocamento Doppler de segunda
ordem. Estes forneceram duas relações a mais entre M1 , M2 , a1 e seni, além das
Eqs.(5.124, 5.127), que permitiram uma solução completa para todos os parâmetros.
O melhores valores das massas neste sistema são:
Massas das ENs no PSR 1913 + 16

MPSR = 1.41 ± 0.06 M , (5.130)
MCompanheira = 1.41 ± 0.06 M ! (5.131)
Finalmente, a descoberta do PSR J0737+3039A,B poderá vir a contribuir a um en-

tendimento mais preciso da dinâmica destes sistemas, governada pela relatividade
geral, uma vez que possuindo um perı́odo orbital P ' 2 : 450 , que é muito menor
do que o perı́odo do PSR 19313+16, P ∼ 7 : 450 , efeitos da relatividade geral como
o acoplamento spin-órbita, parâmetros pós-newtonianos, avanço do periastro, efeito
Shapiro, emissão de ondas gravitacionais, etc., poderão ser medidos com altı́ssima
precisão em escalas de tempo muitı́ssimo mais curtas, da ordem de cinco (5) anos. As
massas das ENs neste sistema são:
P SR J0737 + 3039A, B (5.132)

MA = 1.338 M , (5.133)
MB = 1.249 M ! (5.134)
O confronto entre estes resultados observacionais e as predições das diversas teorias

da gravitação definitivamente iluminará o caminho para sabermos se Einstein estava,
ou não, verdadeiramente certo.
215
Figura 5.10: Descrição esquemática da órbita de
um pulsar binário. (Versão original tomada do site
http://astrosun2.astro.cornell.edu/academics/courses//astro201/psr1913.htm).
216
5.11 Apêndice A
Lembramos que esta equação é obtida usando as equações de Einstein
Gµν = −kTµν , (5.135)
onde Gµν = Rµν − 21 Rgµν é chamado de tensor de Einstein. A estrela é modelada pela
métrica (gµν ) esfericamente simétrica de Schwarzschild
dr2

2 RS
ds = 1 − dt2 − RS
− r2 (dθ2 + sen2 θdφ2 ) , (5.136)
r 1− r
supondo um tensor-energia momento para um gás perfeito
Tµν = (P + E)U µ U ν + P g µν . (5.137)
Para mais detalhes ver o capı́tulo sobre a teoria da gravitação .
5.12 Exercı́cios
Anãs brancas
Exercı́cio AB-1 ??.— Mostre que a razão entre a densidade média e a densidade central
0
num politropo é dada por ρρ̄c = 3 |θ ξ(ξ11 )| .
Tópico especial: A luminosidade de Eddington
Existe um limite natural para luminosidade que um objeto ligado gravitacionalmente
pode emitir. Neste limite a força gravitacional dirigida para o centro do objeto é
contra-balanceada pela pressão de radiação que aponta para fora de sua superfı́cie.
Embora esta luminosidade limite, (Luminosidade de Eddington), possa ser contornada
de várias maneiras, ela fornece uma estimativa útil da massa mı́inima de uma fonte
particular de radiação .
a. considere hidrogênio ionizado. Cada par elétron-próton possui uma massa da ordem
da massa do próton (mp ) e uma seção de choque à radiação igual a seção de choque
de Thomson (σT ).
b. a pressão de radiação é dada pelo fluxo dividido pela velocidade da Luz (a Lei de
Stefan).
c. equacione a força para fora devida à radiação sobre o par com a força da gravidade
sobre o mesmo par de partı́culas.
d. resolva para a luminosidade como função da massa.
Qual é a luminosidade de Eddington para o Sol, cuja massa é 2 × 1033 gramas (1 M )?
Estrelas de nêutrons
217
-2 Embora não discutidas neste capı́tulo, as propriedades rotacionais de um objeto
compacto são interessantes para entendermos algumas de suas caracterı́stica dinâmicas
e suas propriedades estruturais. Vejamos o que sucede com uma estrela de nêutrons
em rotação .
a. o Sol gira a cada 24 a 30 dias dependendo da latitude. Quão rápido ele poderia
rodar se fosse comprimido até um raio de 10 km, enquanto conserva seu momento
angular?
b. quão rápido poderia rodar uma estrela de nêutrons sem arrebentar-se? Suponha
que ela possui uma massa equivalente a 1.4 M , e tem um raio de 10 km.
c. quais o momento angular e energia rotacional de uma estrela de nêutrons? Usar as
seguintes relações e parâmetros
M R2
I ' 0.21 (5.138)
(1 − 2) GM
Rc2
e um perı́odo de spin igual a: 1.6 ms, 33 ms, e 6 s.

-3 Estrutura de uma estrela de nêutrons (ENs)
a. considere uma estrela de massa, M, e raio, R. Construa, com base numa análise
dimensional, a pressão caracterı́stica e a densidade tı́pica a partir destas grandezas e
da constante de Newton da gravitação G.
b. A equação de estado politrópica é uma relação entre pressão e densidade, P = Kρn .
Substitua a pressão e densidade caracterı́sticas na equação de estado politrópica para
obter a razão massa-raio.
c. Quais valores de n têm propriedades especiais ?
-4 Pressão central
a1 . use as equações de equilı́brio hidrostático da relatividade geral para determinar a
pressão central de uma estrela de massa M e raio R. Suponha que o material desta
é incompressı́vel, isto é, sua densidade é constante. a2 . Podem estas equações ser
integradas de maneira a obter uma relação entre M e R? (dica: procure eliminar a
densidade constante dentre estas grandezas)
b. Usando novamente a análise dimensional, tente descobrir onde fatores de G e c
aparecem nas equações de equilı́brio hidrostático.
c. obtenha o limite Newtoniano destas equações , isto é, imponha a condição limite
c → ∞.
d. refaça o mesmo cálculo para a pressão em mecãnica Newtoniana.
e. qual é o raio mı́nimo para uma estrela de densidade constante de uma dada massa?
Qual é a massa máxima de uma estrela com uma densidade especı́fica? Qual é a massa
máxima de uma estrela com densidade nuclear 1015 g cm−3 ?
218
-5 Massa de uma estrela de nêutrons
a. use a pressão e densidade caracterı́sticas discutidas acima (3.a) para obter a
relação entre a massa e o raio de uma estrela. Note que ENs possuem nêutrons rel-
ativı́sticos tal que sua pressão é dada, aproximadamente, pelo produto da densidade
vezes a velocidade da luz ao quadrado, isto é, P ∼ ρc2 .
b. um gás relativı́stico degenerado tem uma densidade de uma partı́cula por cada
comprimento de onda Compton. Combine isto com o resultado de a. para calcular
qual a massa da estrela.

[1] S. L. Shapiro, S. A. Teukolsky, White dwarfs, black holes and neutron stars: The
Physics of compact objetcs. Wiley & Sons, New York (1983)
[2] S. Chandrasekhar, An introduction to the study of stellar structure, Dover Publi-
cations Inc., New York (1958)
[3] R. d’Inverno, Introducing Einstein’s Relativity, Clarendon Press, Oxford, UK
(1992)
[4] P. C. Peters, J. Mathews, Phys. Rev. 131, 435-439 (1963)
[5] J. H. Taylor, J. M. Weisberg, RELATIVISTIC BINARY PULSAR B1913+16:
THIRTY YEARS OF OBSERVATIONS AND ANALYSIS, Proceedings of Aspen
Winter Conference on Astrophysics: Binary Radio Pulsars, Aspen, Colorado, 11-
17 Jan. (2004)
[6] Clifford E. Rhoades, Jr., Remo Ruffini, Phys. Rev. Lett. 32:324-327 (1974).
219
Capı́tulo 6
Buracos Negros
Santiago Esteban Perez Bergliaffa1
6.1 Um pouco de história

Embora o estudo sistemático das propriedades dos buracos negros tenha começado
na segunda metade do século passado, a idéia básica foi proposta muito antes da
criação da RG. Em 1783, John Michell [1] aplicou a lei da gravitação de Newton a luz,
que segundo a teoria vigente naquela época era composta de partı́culas que movimento
com velocidade c. O raciocı́nio de Michell é simples: se uma partı́cula de luz de massa
m é lançada verticalmente para cima desde a superfı́cie de uma estrela, em qualquer
ponto da trajetória é valida a conservação da energia [2] ,
1
E = mvz2 + V (z), (6.1)
2
onde V (z) = −GmM/z, G é a constante de Newton, M é a massa da estrela, e a
origem da coordenada z coincide com o centro da estrela. Lembrando que a energia
cinetica não pode ser negativa, do gráfico do potencial (Fig. 6.1) vemos que para E < 0
a partı́cula atinge um zmax e volta à superfı́cie, mas para E ≥ 0 a partı́cula consegue
escapar. A velocidade de escape ve é definida como a mı́nima velocidade inicial com
que a partı́cula consegue chegar “apenas” (isto é, com velocidade zero) ao infinito. Do
gráfico vemos que neste caso E = 0, e então segue da equação (6.1) que
r
2M G
ve = (6.2)
R
onde R é o raio da estrela. A tı́tulo de referencia, no caso da Terra, ve ≈ 106 cm/seg.
1
Afiliação : Departamento de Fı́sica Teórica, Instituto de Fı́sica, Universidade do Estado de Rio de
Janeiro, Rua São Francisco Xavier 524, Maracanã 20550-900, Rio de Janeiro - RJ.
220
Figura 6.1: Potencial gravitacional na teoria de Newton para movimento vertical. O
movimento depende do sinal da energia.
A expressão para ve mostra que fixando a massa M , ve é maior quanto menor é o

raio da estrela (o que é compreensı́vel já que a partı́cula estarı́a saindo de uma região
onde a gravitação é mais intensa). Michell concluiu que existe uma circunferência
crı́tica, tal que ve é igual á velocidade da luz c: para uma estrela com raio menor
do que Rc = 2M G/c2 , a luz não pode escapar da estrela. Ele ainda foi mais longe,
e postulou que poderia existir no universo um grande número destas estrelas escuras
(antepassados dos buracos negros da RG), sem que pudessem ser vistas, e anunciou
estes resultados em 1783. Treze anos mais tarde, Pierre Laplace apresentou os mesmos
resultados no livro Le system du Monde. Infelizmente esta idéia caiu logo no esqueci-
mento devido aos experimentos de interfêrencia da luz realizados por Thomas Young,
que apoiavam a tese (defendida entre outros por Christian Huygens) de que a luz era
uma onda e não um “jato” de partı́culas. Foi preciso esperar quase 150 anos para que
ela renascesse, já no contexto da teorı́a da gravitação de Einstein, graças ao trabalho
de Karl Schwarszchild.
Pouco tempo depois da publicação do artigo apresentando a RG,

Schwarszchild divulgou no exemplar de 25 de Novembro de 1915 dos Proceed-
ings of the Prussian Academy of Science [3] a solução das equações de Einstein
para o exterior de uma estrela com simetria esférica e sem rotação 2 . Em 1916, ele
conseguiu calcular ainda a solução para o interior do mesmo tipo de estrela, quatro
meses antes de morrer por causa de uma doença contraı́da na frente russa da Primeira
Guerra Mundial. Como veremos na seção seguinte, a solução de Schwarszchild tem
caracterı́sticas exóticas, que levaram aos especialistas da época (o próprio Einstein e
A. Eddington entre eles) a não acreditar na existencia de objetos por ela descritos
na natureza. Em particular, a questão da(s) singularidade(s) desta solução só
ficou esclarecida definitivamente nos anos 50 [37]. Paralelamente a questão das
caracterı́sticas da solução de Schwarszchild, foi progredindo o estudo do interior das
2
Os detalhes da historia do desenvolvimento do conceito de buraco negro estão em [36].
221
estrelas e do colapso gravitacional, graças aos trabalhos de Chandrasekhar (anãs
brancas) e Oppenheimer (colapso esférico), entre outros. Em 1963, Roy Kerr publicou
[4] a primeira solução das EE descrevendo o espaço-tempo gerado pelo que ele pensou
se tratava de uma estrela com momento angular não nulo, mas no ano seguinte
Brandon Carter mostrou que a solução de Kerr descrevia não uma estrela mas um
outro tipo de objeto em rotação, com uma estrutura de singularidades mais complexa
que a de Schwarszchild. Em 1965 a solução de Kerr foi generalizada ao caso de uma
configuração com carga por Newman et al [5]. O nome de buraco negro foi dado em
1967 por John Wheeler ao estado final do colapso gravitacional de uma estrela muito
massiva, sendo mais tarde generalizado para abranger qualquer solução que apresente
horizonte(s) de eventos 3 (tal como as de Schwarszchild, Kerr e Kerr-Newmann).
Dois anos mais tarde, Roger Penrose desenvolveu um processo para extrair energia
rotacional do buraco negro de Kerr. Um outro resultado que foi sendo elaborado na
decada dos 60 foi o teorema que mostra que “os buracos negros não tem cabelo”.
Isto quer dizer que os buracos negros não conservam nenhum detalhe da estrela que
colapsou para formá-los. De outra forma, os únicos parâmetros que caraterizam um
buraco negro são a massa, o momento angular, e a carga elétrica.
No inicio da década dos 70 foi estudada toda a teorı́a de perturbações da geometria
de Schwarszchild, completando assim o entendimento dos buracos negros do ponto
de vista clássico. Para completar a discussão das caracterı́sticas clásicas dos buracos
negros, na Sec. 6.7 apresentaremos os buracos negros astrofı́sicos.
Como veremos na Sec. 6.8, a surpresa chegou no ano 1974, quando Hawking mostrou
que efeitos quânticos fazem com que o buraco negro emita radiação com espectro de
corpo negro. Esta descoberta abriu a porta para a formulação da termodinâmica de
buracos negros, colocando também novos problemas (ver Sec. 6.9). Na seção seguinte,
começaremos nosso estudo com a solução de Schwarszchild.
6.2 A solução de Schwarszchild

A solução de Schwarszchild [3] é a métrica exterior de um corpo com simetria esférica.
É conveniente resumir aqui o que foi apresentado na seção 2.6.1. A métrica de
Schwarszchild nas coordenadas (t, r, θ, φ) tem a forma
2
rg 2 rg −1 2
ds = 1 − dt − 1 − dr − r2 (dθ2 + sin2 θdφ2 ), (6.3)
r r
onde rg = 2M G/c2 ≈ 3(M/M ) km. Revisemos algumas de suas caracterı́sticas mais
importantes:
• Simetria esférica. Para t e r fixos, as distâncias são determinadas pelo elemento

de linha na esfera,
ds2 = r2 (dθ2 + sin2 θdφ2 ), (6.4)
3
A rigor, qualquer solução não cosmológica.
222
onde 0 ≤ θ ≤ π, −π ≤ φ ≤ π.
• Ausência da coordenada t na métrica no sistema de coordenadas escolhido. Isto re-

flete o fato de que as coordenadas (t, r, θ, φ) são adequadas para a descrição do bu-
raco negro de Schwarszchild, pois evidenciam uma propriedade importante deste
espaço-tempo: ele é estático. Em outros sistemas coordenados, a dependência
com o tempo dos coeficientes métricos poderia induzir ao erro de pensar que se
trata de um espaço-tempo não estático. Neste caso, a questão somente pode-
ria ser respondida calculando invariantes da geometria (ver Cap.??, sec.??), ou
utilizando critérios de geometria diferencial 4 .
De fato, o Teorema de Birkhoff, já enunciado na seção 2.6, garante que a
solução das EE com simetria esférica em ausência de materia é estática, e está
dada pela métrica de Schwarszchild. Uma conseqüência deste teorema é que se
uma estrela estiver pulsando ou em colapso conservando a simetria esférica, a
métrica fora da estrela é a a métrica de Schwarszchild 5 . Este resultado está
intimamente ligado com a natureza da interação gravitacional. Como veremos no
capı́tulo 7, as ondas gravitacionais são transversais a direção de movimento. Con-
seqüentemente, qualquer onda gravitacional gerada pela estrela quebraria a sime-
tria esférica. Em outras palavras, estrelas com simetria esférica em pulsação não
podem emitir ondas gravitacionais.
• A solução de Schwarszchild é assintoticamente plana (se reduz á geometria de

Minkowski em coordenadas esféricas no limite r → ∞).
• Ela representa a solução exterior de um objeto com massa M , como foi mostrado
a partir do limite de campo fraco na Sec. 2.6.
Como em qualquer outra solução das EE, a métrica terá informação não só da ge-
ometria mas também do sistema de coordenadas escolhido. É bom lembrar que uma
escolha judiciosa do sistema coordenado ajuda tanto na resolução das EE quanto na
obtenção de uma métrica que mostre de cara algumas das propriedades do espaço-
tempo em questão. Por exemplo, no caso da geometria de Schwarszchild o problema
de achar a solução das EE, que envolve em principio determinar os 10 coeficientes da
métrica, foi reduzido usando somente questões de simetria (ver Sec.2.6) ao problema
de achar duas funções A(r) e B(r). Estas foram determinadas através das EE para o
caso de vácuo.
A seguir, estudaremos uma outra caracterı́stica da solução de Schwarszchild, extrema-

mente importante no que diz respeito aos buracos negros, e relacionada com o fato de
que a métrica (6.3) apresenta problemas na superfı́cie r = rg e no ponto r = 0.
4
Um espaço-tempo estático é aquele no qual existe um vetor de Killing tipo tempo ortogonal ás
hipersuperfı́cies t =constante ver por exemplo [17].
5
Notar que a “inversa” do teorema não é valida: uma fonte que é descrita no exterior pela solução de
Schwarszchild não tem necessariamente simetria esférica.
223
6.2.1 Singularidades
Em geral, um dado sistema de coordenadas não cobre completamente a variedade que

representa o espaço-tempo. Por exemplo, o eixo θ = 0, π não pode ser descrito pela
métrica de Minkowski nas coordenadas (t, r, θ, φ), já que para tais valores do ângulo θ
o elemento de linha de Minkowski (assim como qualquer outro com simetria esférica)
é degenerado. Isto é o que se chama uma singularidade de coordenadas, porque reflete
uma deficiência no sistema coordenado escolhido (enquanto o espaço-tempo é regular),
e pode ser removida (no caso, introduzindo coordenadas cartesianas). A métrica de
Schwarszchild é degenerada no caso θ = 0, π e ainda em outros dois casos: eles são
r = 0 e r = rg . Qual seria o critério conveniente para decidir se uma singularidade é
fictı́cia (isto é, devida a uma escolha inadequada do sistema de coordenadas) ou real?
[33]. Poderiamos por exemplo calcular invariantes associados a curvatura, e se algum
deles divergisse, estariamos em presença de uma singularidade “essencial´’, já que a
invariancia assegura que a divergência acontece em qualquer sistema coordenado. No
caso da métrica (6.3), é suficiente calcular um dos invariantes, por exemplo
48M 2
Rµνρσ Rµνρσ = , (6.5)
r6
para mostrar que o ponto r = 0 é uma singularidade essencial. Mas este resultado
não permite concluir nada sobre a superfı́cie r = rg 6 . Um outro critério que pode-
riamos adotar é o seguinte: uma singularidade é real se as forcas de maré que agem
sobre um objeto na suposta singularidade são infinitas 7 . Este critério concorda com a
noção de singularidade como divergência da força associada ao campo, bem conhecida
no caso do eletromagnetismo por exemplo. Para calcular as forças de maré utilizaremos
a equação do desvio geodésico
D2 η i
− Rabcd eia v b v c ejd η j = 0, (6.6)
Dη 2
onde η j = (η r , η θ , η φ ) é o vetor de Jacobi, que une as geodésicas de duas partı́culas

vizinhas em queda livre, e eia são as tetradas, definidas como segue:
e0a ≡ (1 − 2M/r)−1/2 (1, 0, 0, 0), (6.7)
e1a ≡ (1 − 2M/r)1/2 (0, 1, 0, 0), (6.8)

e2a ≡ r−1 (0, 0, 1, 0), (6.9)
e3a ≡ (r sin θ)−1 (0, 0, 0, 1). (6.10)
A equação do desvio (6.6) se reduz neste caso a
D2 η r 2M
2
= + 3 ηr ,
Dη r
6
Nesta seção e nas seguintes faremos c = G = 1.
7
As forças de maré foram discutidas na Seção 1.2.4 e .....
224
D2 η θ M θ
= − η ,
Dη 2 r3
D2 η φ M φ
= − η .
Dη 2 r3
O sinal “+” do lado direito da primeira equação indica uma tensão ou esticamento
na direção radial, enquanto que o sinal “-” das outras equações indica uma pressão
ou compressão nas direções transversais. Claramente vemos que as forças de maré são
finitas em r = rg , mas divergem na origem, confirmando o caráter essencial da singu-
laridade em r = 0, e estabelecendo que a superfı́cie r = rg não é uma singularidade
real, mas um artefato do sistema de coordenadas escolhido 8 . Veremos na Sec. 6.2.3
que é possı́vel construir sistemas de coordenadas bem comportados em r = rg , que
nos ajudarão a entender melhor a natureza da solução de Schwarszchild.
Para aprofundar o entendimento da geometria da solução de Schwarszchild podemos
analizar o comportamento dos cones de luz (veja Seção 12.7.3). É conveniente lembrar
que o cone de luz é definido como o locus dos pontos xµ + dxµ na vizinhança de um
ponto xµ tal que
gµν dxµ dxν = 0.
No caso da geometria de Minkowski em coordenadas cartesianas, a expressão anterior

toma a forma
dt2 − dx2 − dy 2 − dz 2 = 0.
A estrutura de cone de luz restringe as possı́veis linhas de universo de uma partı́cula,

já que a tangente a uma destas necessariamente deve estar dentro ou sobre o cone
de luz (caso contrário, a velocidade da partı́cula seria maior que c = 1). No espaço-
tempo plano, o cone de luz é uma estrutura global, enquanto que em presença de
um campo gravitacional, o cone de luz é uma estrutura local [6]. Isto está ligado ao
fato de que a RG se reduz, numa vizinhança pequena o suficiente de um ponto, à RR
(veja a Seção 11.5). A curvatura do espaço-tempo se manifesta só quando saimos da
vizinhança e nos dislocamos para pontos não tão próximos. Em particular, quando o
espaço-tempo é curvo, a curvatura faz os cones se achatarem e/ou inclinarem, como
veremos a seguir.
6.2.2 Diagrama do espaço-tempo na geometria de

Schwarszchild
Sendo os cones de luz definidos pelas trajetórias de partı́culas de massa nula, estu-
daremos aqui as geodésicas nulas, começando pelas geodésicas radiais, definidas por
ds2 = 0, θ = const., φ = const.

8
Este resultado, que hoje parece mais ou menos evidente, só foi aceito definitivamente nos anos 60.
225
É conveniente lembrar que o movimento de partı́culas no espaço-tempo de
Schwarszchild foi estudado na Sec.2.6.1 utilizando a equação da trajetória r = r(φ).
Aqui estudaremos a dependência das coordenadas com o parâmetro afim λ (no caso
de partı́culas com massa zero), ou com o tempo coordenado t (no caso de partı́culas
com massa não nula).
Da EOM (2.271) obtemos para o caso de massa nula e momento angular zero,
ṙ = ±E, (6.11)
onde o ponto representa a derivada com relação ao parâmetro afim. Para analizar o
diagrama espaço-tempo precisamos conhecer t = t(r). Usando a integral da expressão
(2.263),
(1 − 2M/r)ṫ = E
na identidade
dt ṫ
= ,
dr ṙ
obtemos (tomando o sinal positivo em (6.11))
dt r
= , (6.12)
dr r − 2M
que pode ser integrada dando como resultado
t = r + 2M ln |r − 2M | + constante. (6.13)
A partir do fato de que os coeficientes gtt e grr mudam de sinal em r = rg = 2M ,

dividimos tentativamente a geometria de Schwarszchild em duas regiões, tendo a su-
perfı́cie r = rg como fronteira.
Na região r > 2M (que chamaremos região II), vemos da Eq.(6.12) que r aumenta
quando t aumenta. As curvas r vs. t da Eq.(6.13) definem então uma congruência de
geodésicas nulas emergentes. Já o sinal negativo de (6.11) define uma congruência de
geodésicas nulas incidentes, dadas por
t = −(r + 2M ln |r − 2M | + constante). (6.14)
Agora podemos usar as equações das congruências para desenhar o diagrama do

espaço-tempo da solução de Schwarszchild nas coordenadas de Schwarszchild, para
θ e φ fixos (ver fig. 6.2). Notar que este diagrama (e todos os outros do tipo que us-
aremos nas seções seguintes) é bidimensional: cada ponto dele deve ser pensado como
uma 2-esfera de área 4πr2 . Para r → ∞ as geodésicas formam ângulos de 45◦ com os
eixos, mostrando que o espaço-tempo é asintoticamente plano.
Na região r < 2M os cones aparecem virados, devido á mudança da coordenada r (t)
de tipo espaço (tempo) a tipo tempo (espaço) (vide a expressão da métrica Eq.(6.3)).
Em particular, nesta região as retas r = constante ficam fora do cone de luz, ou seja
que nenhum corpo pode se manter em repouso alı́, sendo atraı́do inevitávelmente pela
226
Figura 6.2: Solução de Schwarszchild em coordenadas de Schwarszchild
singularidade. Vemos claramente então uma das caracterı́sticas fundamentais do bu-

raco negro de Schwarszchild: fatalmente a singularidade atrai qualquer partı́cula que
esteja dentro da superfı́cie r = rg .
Uma outra conseqüência interessante da equação (6.12) é que dela segue que
dr
= 0.
dt r=2M
Em outras palavras, a velocidade “coordenada” de uma partı́cula de massa zero (como

por exemplo o fóton) é zero no horizonte. Isto sugere que levaria um tempo infinito
para que uma partı́cula que se move na direção da origem na região II chegue a
r = 2M . De fato, integrando a equação (6.12) obtivemos
t = r + 2M ln |r − 2M | + constante. (6.15)
Vemos desta equação que t → ∞ para r → 2M . Ou seja que leva um tempo coordenado
infinito para o fóton alcançar r = 2M independendo da posição inicial. Voltaremos a
esta questão daqui a pouco.
Passemos agora a estudar as geodésicas radiais de partı́culas com massa não nula. As
equações de movimento que seguem de (2.263) e (2.264) são
(1 − 2M/r)ṫ = E, (6.16)
(1 − 2M/r)ṫ2 − (1 − 2M/r)−1 ṙ2 = 1. (6.17)

(o ponto representa a derivada com relação ao tempo próprio τ da partı́cula). Impondo
que t ≈ τ no infinito, segue que
2
dτ r
= .
dr 2M
227
Integrando,
2 3/2
τ − τ0 = √ r0 − r3/2 . (6.18)
3 2M
Esta expressão mostra que a partı́cula passa através do horizonte e atinge r = 0 num
tempo finito, contrariamente ao que sugere a Figura 6.2. Vejamos agora o que acontece
na descrição do movimento usando a coordenada t. Integrando a equação
r 1/2 −1
dt ṫ 2M
= =− 1− ,
dr ṙ 2M r
obtemos
1/2
2 3/2 3/2 1/2 1/2 (r1/2 + (2M )1/2 )(r0 + (2M )1/2 )
t−t0 = − √ (r −r0 +6M (r −r0 ))+2M ln 1/2 .
3 2M (r0 + (2M )1/2 )(r1/2 − (2M )1/2 )
(6.19)
É facil ver que esta equação coincide com a equação (6.18) no caso em que r, r0 >>
2M . No entanto, para r ≈ 2M ,
r − 2M = (r0 − 2M )e−(t−t0 )/2M ,
de onde segue que t → ∞ quando r → 2M . Vemos que, independendo da massa,

a partı́cula demora uma quantidade infinita de tempo coordenado para chegar até
r = 2M . Mas como foi discutido na Seção 6.2, as forças de maré são finitas em
r = 2M e nada impede a passagem da partı́cula através desta superfı́cie. Concluimos
então que a coordenada t é conveniente só para descrever o movimento longe de r =
2M , mas claramente é patológica perto desta superfı́cie. O comportamento do tempo
coordenado vs o tempo próprio é mostrado na Figura 6.3.
Figura 6.3: Tempo coordenado vs. tempo próprio, a partir das equações (6.18) e (6.19).
A linha em r = 0 indica a singularidade.
A seguir mostraremos que é possı́vel introduzir uma nova coordenada temporal que
remova a singularidade aparente em r = 2M .
228
6.2.3 Outros sistemas dee coordenadas?
Coordenadas de Eddington-Finkelstein “imergentes”
Um sistema coordenado que melhora o problema das coordenadas de Schwarszchild em

r = 2M foi introduzido por Eddington em 1924 e redescoberto por Finkelstein em
1958. Definindo uma nova coordenada
t̄ = t + 2M ln(r − 2M ) (6.20)
para r > 2M , vemos que a equação (6.14) que define a congruência das geodésicas
incidentes toma a forma
t̄ = −r + constante, (6.21)
que é uma reta que faz um angulo de -45◦ com o eixo r. Diferenciando a equação (6.20)
e eliminando dt na métrica de Schwarszchild em favor de dt̄ obtemos

2 2M 2 4m 2M
ds = 1 − dt̄ − dt̄ dr − 1 + dr2 − r2 dΩ2 , (6.22)
r r r
que é a forma de Eddington-Finkelstein (E-F) da métrica de Schwarszchild. O dia-

grama espaço-temporal para a solução de Schwarszchild nas coordenadas E-F é dado
na figura 6.4. Novamente os cones abrem a 45◦ em r = ∞. O lado esquerdo dos cones
Figura 6.4: Solução de Schwarszchild em coordenadas de Eddington-Finkelstein

avançadas
(correspondente aos “fótons imergentes”) é dado por uma linha a -45◦ com o eixo r.
O lado direito (correspondente aos “fótons emergentes”) começa a 45◦ em infinito, e
depois vai se fechando a medida que r diminue, atingindo a vertical em r = 2M , e
229
continuando a se fechar depois. Vemos que em r = 2M os fótons emergentes “ficam no
lugar”. A diferença com relação a figura (6.2) é que esta figura mostra corretamente
o que acontece com uma partı́cula em queda radial.
Note que a solução de Schwarszchild nestas coordenadas é regular em r = 2M . De
fato, ela é regular no intervalo 0 < r < ∞. Ou seja, a transformação (6.20) extendeu
o intervalo da variável r coberto pelo sistema coordenado de Schwarszchild, de jeito
semelhante ao que acontece na extensão analı́tica de uma função em análise complexa
[7], e por isso a métrica (6.22) se chama extensão analı́tica da métrica (6.3). O sis-
tema de coordenadas de Schwarszchild cobre então somente uma parte da variedade
espaço-tempo, trata-se de um local coordinate patch sobre a variedade completa. As
coordenadas de E-F imergentes por sua vez cobrem uma parte maior da variedade
(mas veremos depois que não cobrem toda a variedade) 9 .
A métrica (6.22) pode ser re-escrita introduzindo a coordenada
v = t̄ + r.
onde v é a coordenada tempo avançado. Vemos da equação (6.21) que a congruência

de geodésicas incidentes é dada por v = constante. Em termos desta nova coordenada,
a métrica toma a forma

2 2M
ds = 1 − dv 2 − 2 dv dr − r2 dΩ2 . (6.23)
r
Note que embora as coordenadas de E-F imergentes descrevem a trajetória das

partı́culas caindo na direção do buraco negro sem singularidade aparente em r = 2m,
as partı́culas emergentes sofrem a mesma patogı́a que no caso de Schwarszchild (veja
Fig.6.4). Poderı́amos definir também coordenadas de E-F “emergentes” através da
relação u = t̄ − r (ver por exemplo [13]). Elas descrevem bem o movimento das
partı́culas emergentes, mas a singularidade aparente em r = 2m ainda está presente
para aquelas em movimento na direção do buraco negro. É necessário então um sistema
de coordenadas mais abrangente, o sistema de Kruskal-Szekeres, que estudaremos na
Sec.6.5.
Mesmo com a deficiêncian apontada acima, as coordenadas de E-F imergentes são
extremamente úteis no estudo do colapso gravitacional (veja [9] e Sec.6.3).
6.2.4 Horizonte de eventos
Da figura 6.4 vemos que longe da origem, os cones de luz são os do espaço-tempo de
Minkowski. A medida que vamos nos aproximando a r = 0, as frentes de onda emer-
gentes são atraı́dos “para dentro” (isto é, os cones viram). Em r = 2m, fótons radiais
9
Rigorosamente, a análise na região 0 < r < 2m da seção anterior é correta a posteriori, já que as
coordenadas de Schwarszchild não cobrem essa região. Mas a análise nas coordenadas de E-F e Kruskal
(ver Sec. 6.5) concorda com a interpretação que segue das coordenadas de Schwarszchild “internas”.
230
emergentes ficam sobre a superfı́cie, enquanto todos os outros são arrastados para
dentro de r = 2M . Já na região II, dentro da superfı́cie r = 2M , até os fótons radiais
emergentes são desviados na direção da singularidade. Segue então que a superfı́cie
r = 2M age como uma membrana unidirecional 10 , permitindo que as curvas tipo
tempo ou nulas dirigidas ao futuro passem da região II para a I, mas não deixando
que curvas tipo tempo ou nulas dirigida ao futuro possam sair da região I para a II.
A superfı́cie r = 2M é chamada de horizonte de eventos já que representa a fron-
teira dos eventos que podem ser observados desde r > 2M . A figura 6.5 representa
esquematicamente num diagrama espacial o comportamento dos cones de luz no plano
equatorial do buraco negro de Schwarszchild. Note que o horizonte existe tanto para
Figura 6.5: Diagrama espacial do espaço-tempo de Schwarszchild nas coordenadas de E-F

avançadas.
curvas geodésicas como para curvas aceleradas, já que mesmo as partı́culas aceleradas
se movem dentro do cone de luz (mas não seguindo retas).
A soulção de Schwarszchild em outros sistemas de coordenadas
Para encerrar por enquanto a discussão sobre sistemas coordenados , mencionaremos

que existem outros sistemas de coordenadas úteis para descrever o espaço-tempo de
Schwarszchild. Entre eles, dois dos mais conhecidos são o sistema isotrópico, e o sis-
tema de Painlevé-Gullstrand. No primeiro deles a métrica tem a forma
4
(1 − 21 m/ρ)2 2

2 1 2 2 2 2 2

ds = 1 dt − 1 + m/ρ dρ + ρ (dθ + sin θdφ ) . (6.24)
(1 + 2 m/ρ)2 2
Note que neste sistema, a métrica sobre uma superfı́cie t = constante qualquer é a
métrica do espaço-tempo plano multiplicada pou um fator (chamado fator conforme).
10
De fato, a analogia com uma membrana pode ser levada bem longe, ver [30].
231
Já no sistema de coordenadas de Painlevé-Gullstrand, o elemento de linha (também
conhecido como elemento de linha de Lemâitre), tem a forma
r
2GM 2GM
ds2 = 1 − dt2 ± dr dt − dr2 − r2 dΩ2 . (6.25)
r r
Neste sistema, as superfı́cies t=constante sao planas: toda a curvatura do espaço-
tempo está nas componentes t−t e t−r da métrica. Outras caracterı́sticas da solução de
Schwarszchildnestas coordenadas são discutidas em [8].
Temos discutido até agora as caracterı́sticas matemáticas da solução de Schwarszchild.
Mas qual é a situação fı́sica por ela descrita? Para responder esta pergunta, seremos
obrigados a efetuar um breve desvio para falar de colapso gravitacional.
6.3 Colapso gravitacional e buracos negros

Como foi visto no capı́tulo 5, a teoria de evolução estelar mostra que estrelas com
massa da ordem de 1 M atingem o equilı́brio como anãs brancas ou estrelas de
neutrons, mas não existe estado de equilı́brio ao final da evolução de estrelas de massa
muito maior do que M . Neste caso, a materia não consegue gerar pressões grandes
o suficiente para contrabalançar a ação da gravitação , e o colapso é inevitável: as
camadas centrais da estrela são afundadas pelo peso das camadas externas. A RG
prediz que o resultado do colapso de uma estrela com simetria esférica é um objeto
descrito pela solução de Schwarszchild completa, isto é um buraco negro.
Embora existam modelos detalhados de colapso gravitacional (alguns deles com
solução
analı́tica, mas a maioria exige tratamento numérico), em geral eles são complicados 11
Analisaremos aqui qualitativamente o caso de uma estrela com simetria esférica e mo-
mento angular nulo que está colapsando, até que o raio da superfı́cie da estrela alcance
o valor r = 2M . Lembremos que enquanto a estrela permaneça com simetria esférica,
o campo externo é descrito pela solução de Schwarszchild. Para visualizar o que acon-
tece durante o colapso, utilizaremos um diagrama espaço-tempo bidimensional nas
coordenadas de Eddington-Finkelstein. Vemos do gráfico que os fótons emitidos desde
a superfı́cie da estrela nos estágios iniciais do colapso conseguem chegar até infinito,
mas o intervalo entre eles cresce com o tempo, sendo que aqueles fótons emitidos
quando a superfı́cie atinge r = 2M ficam nessa superfı́cie, e os emitidos posterior-
mente são inexorablemente atraı́dos pela singularidade. A superfı́cie da estrela some
então da vista do observador em infinito, dando lugar a um buraco negro, que captura
todo aquilo que passe perto o suficientes dele.
A métrica de Schwarszchild seria útil então em dois casos. No primeiro, ela poderia
representar o exterior de um objeto compacto (uma estrela de neutrons, por exemplo,
11
Aqueles interessados nos detalhes do cálculo podem consultar a referência [9]. Veja também [10].
232
Figura 6.6: Colapso em coodenadas de Schwarszchild.
ver capı́tulo 5). Neste caso, o raio gravitacional está sempre no interior do corpo,
não existe nenhuma singularidade, e a métrica de Schwarszchild descreve a geometria
a partir da superfı́cie do mesmo 12 . O segundo caso é aquele o mostrado na figura 6.6, no
qual, como resultado do colapso, a superfı́cie da estrela atravessa o raio gravitacional,
e o horizonte fica “a descuberto”. Este é o caso do buraco negro 13 .
O que acontece no caso mais geral de uma estrela colapsando sem manter a simetria
esferica? Não existe critério geral que permita decidir em quais condições se formará
um horizonte, dada uma situação inicial arbitrária. A dificuldade principal deste prob-
lema é a dependência temporal do processo: durante o colapso, existe um perı́odo de
tempo durante o qual o horizonte está aumentando desde raio zero até 2M no caso
de Schwarszchild. Isto fica claro da figura 6.6, onde vemos que existe um último fóton
(o “marginal”) que fica no horizonte. Nesta situação de simetria esférica não é difı́cil
determinar a posição do horizonte, mas em situações assimétricas, e com emissão de
radiação gravitacional, o cálculo é extremamente complexo. Contudo, alguns resulta-
dos têm sido obtidos:
• Se o colapso é quase esférico, a parte não esférica da distribuição de massa

(momentos quadrupular, octupolar, etc) é eliminada em forma de ondas gravita-
cionais, e o resultado final é um buraco negro de Kerr (ou de Schwarszchild no
caso de momento angular zero) [11].
12
O interior deve ser descrito por uma solução das EE em presencia de materia, que deve ser “colada
” continuamente com a solução de Schwarszchild na superfı́cie do objeto.
13
É conveniente notar que embora existe unanimidade quase absoluta sobre a existencia do horizonte,
pelo menos uma ideia alternativa tem sido apresentada na literatura, ver ref.[32].
233
• Diversos cálculos indicam que qualquer horizonte (mesmo em ausência total de
simetria) acabará sendo estacionário (o que se conhece como a conjectura de “no
hair”).
• Um resultado conhecido para o caso de horizontes não estacionários é o teorema
da área de Hawking (ver Seção 6.9).
Na seção seguinte estudaremos o movimento de partı́culas na geometria de

Schwarszchild.
6.4 Mecânica celeste no campo gravitacional de um

buraco negro de Schwarszchild
Nesta seção estudaremos o movimento de partı́culas livres no espaço-tempo da

solução de Schwarszchild. Os resultados desta seção são importantes para entender
os fenômenos que acontecem nas vizinhanças de um buraco negro ”astrofisico´´, isto
é, um buraco negro imerso num meio, em interação com matéria (veja a Seção 6.7).
O movimento pode ser descrito em forma exata resolvendo a equação diferencial das
geodésicas,
d2 xµ α
µ dx dx
β
+ Γ αβ = 0,
dτ 2 dτ dτ
adequada ao caso de Schwarszchild. Na Seção 2.6.2 foi calculada a trajetória para
partı́culas com e sem massa na geometria de Schwarszchild. No entanto, muita in-
formação sobre o movimento pode ser extraida usando um método de análise qual-
itativo: o potencial efetivo. Da mecânica newtoniana sabemos [2] que o movimento
radial de uma partı́cula de massa unitária com energia E e momento angular L no
campo gravitacional de uma massa M somente é possı́vel para aqueles valores de r
nos quais a desigualdade
2
1 dr E
= − VN (r) ≥ 0
2 dt 2
é satisfeita, onde VN (r) é o potencial newtoniano efetivo, dado por VN (r) = −M/r +
L2 /(2r2 ). Em particular, aqueles r tais que E = VN (r) são os pontos de retorno, e
neles a velocidade da partı́cula é zero. Começaremos revisando o movimento no caso
newtoniano, deixando o caso de Schwarszchild para a seção seguinte, onde veremos que
existem grandes diferências devidas á RG. O diagrama correspondente ao potencial
efetivo VN é dado na figura 6.7. Vemos dele que
• partı́culas com E > 0 vem desde infinito, são refletidas pelo potencial no ponto
r = rret dado pela equação E = VN (rret ), e voltam para o infinito seguindo
órbitas abertas (parabólicas ou hiperbólicas), enquanto
234
Figura 6.7: Potencial efetivo para o caso newtoniano com diferentes valores de a = L/M :
a1 = 1, a2 = 4.
• partı́culas com E < 0 e momento angular grandes o suficiente percorrem uma

órbita com r1 ≤ r ≤ r2 , com r1 e r2 soluções da equação V (r) = E2 .
Detalhes sobre o movimento neste caso podem ser encontrados em qualquer livro de
mecânica clássica, por exemplo [12], mas é importante lembrar que o potencial efetivo
não tem informação sobre a parte angular do movimento. Esta segue da equação de
movimento correspondente á φ (ver eq.(6.27)).
Veremos a seguir que um raciocinio análogo ao aplicado no caso newtoniano pode ser
desenvolvido no caso da solução de Schwarszchild, mas com resultados bem diferentes.
Como foi mostrado na Seção refmteste, no movimento de partı́culas teste (isto é,
aquelas que não alteram a geometrtia de fundo) na métrica de Schwarszchild,
dr2

2 2M
ds = 1 − dt2 − 2M
− r2 (dθ2 + sin2 θdφ2 ),
r 1− r
duas quantidades são conservadas: pt e pφ . Daremos a estas quantidades os nomes
pt ≡ E, pφ ≡ ±L.
E é a energia total da partı́cula, incluindo a massa m (se a partı́cula está em repouso

muito longe da origem, onde o campo gravitacional é desprezivel, E = mc2 ), e L é o
módulo do momento angular. Da expressão da magnitude do vetor energia-momento,
gµν pµ pν = m2 , obtemos a equação
2
E2 L2

1 dr
2M
− − = m2 .
1 − 2M

1− r r
dλ r2
onde λ é o tempo próprio por unidade de massa. Dividindo por m2 e definindo ≡ E/m
e ` ≡ L/m obtemos
2
dr 2
= − v 2 (r), (6.26)
dτ 2
235
onde τ é o tempo próprio e
s
rg `2
v(r) = 1− 1+ 2 .
r r
é o potencial efetivo [13], definido para r > 2M . A equação diferençial (6.26) determina
a variação de r com τ . Para a variação das outras duas coordenadas relevantes temos
dφ 1 dφ pφ g φφ L `
= = = = 2, (6.27)
dτ m dλ m m r
dt 1 dt pt g tt E
= = = = . (6.28)
dτ m dλ m m 1 − 2M/r
Obtendo r = r(τ ) a partir de (6.26), estas duas equações determinan a dependência
de t e φ com τ (notar que para objetos de massa nula não podemos utilizar o tempo
próprio; veremos como resolver isto mais adiante).
Vamos examinar agora as possı́veis órbitas de uma partı́cula de massa não nula na
geometria de Schwarszchild, utilizando o potencial efetivo,
r
2M `2 2M `2
v(r) = 1 − + 2− . (6.29)
r r r3
A primeira coisa a ser notada é que para r < 2M o potencial é imaginario,
não existindo então pontos de retorno, definidos por = v(r). Em outras palavras, se
a partı́cula entra na superfı́cie r = 2M já não volta a sair, confirmando o fato de que
esta superfı́cie é um horizonte.
Por meio de álgebra simples é possı́vel mostrar que o potencial tem extremos em
`2 ± (`4 − 12`2 M 2 )1/2

r± = . (6.30)
2M
Para ` < 12M não existem pontos extremos: uma partı́cula caindo na direção de
r = 0 (mas não necessariamente com φ = constante) passará através de r = 2M e
chegará na singularidade r = 0 inevitavelmente. Note que não existem tais órbitas de
captura no caso newtoniano (veja Fig. 6.9).
No caso `2 > 12M 2 , r+ é um mı́nimo de V, enquanto r− é um máximo. Neste caso
existem órbitas circulares estáveis em r = r+ , e instáveis em r = r− . Notar que para
L >> M , a expressão para r+ fica r+ ≈ L2 /M , que é a expressão da teoria newtoniana
para o raio de uma órbita circular de uma partı́cula de momento angular por unidade
de massa L orbitando em torno de um corpo de massa M (Fig. 6.9).
Note que da eq.(6.30) segue que r+ > 6M , ou seja que não existem órbitas circulares
estáveis para raios menores que 6M , e ainda que as órbitas instáveis estão restritas
ao intervalo 3M < r− < 6M . Ou seja, não existem órbitas circulares para r < 3M .
As figuras (6.8) e (6.9) mostram algumas das caracteristicas do potencial efetivo da
métrica de Schwarszchild.
236
Figura 6.8: Potencial efetivo para a =??. O movimento depende do valor da energia.
Impondo as condições para que a órbita r = rc seja circular (isto é, ∂V /∂r = 0 e
dr/dt = 0) obtemos que a energia numa órbita de raio rc é dada por
rc − 2M
E(rc ) = √ √ .
rc rc − 3M
A energia de ligação por unidade de massa EB da ultima órbita circular estável em

r = 6M é
p
EB (6M ) = 1 − E(6M ) = 1 − 8/9 ≈ 0.06. (6.31)
Como veremos no capı́tulo de ondas gravitacionais, uma partı́cula em órbita na geome-
tria de Schwarszchild emitirá radiação gravitacional, e por causa da perda de energia,
será desviada do movimento geodésico. É possivel mostrar que uma partı́cula inicial-
mente numa órbita circular com rc >> M (e então com E ≈ 1), cairia lentamente per-
correndo uma espiral, até chegar em r = 6M . A partir dalı́, a órbita se torna instável,
e a queda para r = 0 é rápida. A equação (6.31) mostra que aproximadamente 6% da
energia original da partı́cula será convertida em radiação até chegar em r = 2M . Já
no caso de um buraco negro de Kerr (ver Sec. 6.6.1), a fração correspondente é aprox-
imadamente 42%. Isto mostra que embora a emissão de radiação gravitacional seja
fraca, grandes quantidades de energia podem ser convertidas em radiação gravitacional
em processos astrofı́sicos. Esta grande eficiência (maior que a dos processos nucleares)
na conversão de matéria em queda por energia é a que faz que os buracos negros
sejam candidatos para explicar observações de processos astronômicos que envolvem
uma quantidade imensa de energia liberada (tais como os quasares).
Se uma partı́cula for perturbada da posição de equilı́brio r+ , ela descreverá os-
cilações radiais centradas em r = r+ . Para deslocamentos pequenos o suficiente, o
movimento será harmônico simples, com freqüência
M (r+ − 6M )
ωr2 = kef = 3
. (6.32)
r+ (r+ − 3M )
onde o tempo implı́cito nesta equação é o tempo próprio da partı́cula. Já a freqüência
237
Figura 6.9: Potencial efetivo para diferentes valores de a. Note a aparição do poço, que
possibilita órbitas finitas.
angular, dada pela equação (6.27), é

L2 M
ωφ2 = 4
= 2 .
r+ r+ (r+ − 3M )
No limite de órbitas newtonianas, r+ >> M , temos que ωr ≈ ωφ . Se ωr = ωφ , a
partı́cula retornará num dado valor de r exatamente no tempo dado pelo perı́odo
órbital, ou seja, a órbita será fechada. De fato, na teoria newtoniana, todas as órbitas
finitas são fechadas. Em RG, no entanto, existe uma precessão, como já foi estudado
na 2.6.1. De fato, um dos primeiros triunfos da RG foi explicar a precessão de Mercurio
(43 seg. por século). Veremos no capı́tulo de ondas gravitacionais um outro exemplo
deste fenômeno, o pulsar binário, onde a precessão é de 4 seg. por ano.
Passemos agora ao estudo do caso de partı́culas de massa zero (como fótons e talvez
neutrinos). Precisamos mudar o procedimento seguido no caso m 6= 0, já que nele
aparecem constantes definidas por unidade de massa. Para partı́culas de massa nula,
gµν pµ pν = 0, e obtemos a equação
2
E2 1 dr L2
− − = 0,
1 − 2M 1 − 2M

r r
dλ r2
onde λ é um parâmetro afin, E é a energia total da partı́cula, e L o momento angular.
O potencial efetivo toma a forma
s
L2 2M
V (r) = 1− .
2r2 r
A forma de V independe de L, e o único extremo da função é o máximo em r = 3M
(Fig. 6.10). A existência deste máximo posibilita órbitas circulares instáveis para os
fótons no regime de campo forte. Estas órbitas têm grande importância no problema
do desvio de fótons num campo gravitacional, o lensing gravitacional [14], que no
regime de campo fraco foi discutido na seção 2.6.2. Os detalhes do caso de campo
forte foram estudados em [15].
238
Figura 6.10: Potencial efetivo no caso de partı́culas de massa nula.
Terminamos aqui o estudo qualitativo das geodésicas no espaço-tempo de

Schwarszchild. Aqueles interesados no detalhe das geodésicas, incluindo a parte angu-
lar, podem consultar o livro de Chandrasekhar [16], que contém um estudo exhaustivo
das propriedades matematicas dos buracos negros de Schwarszchild, assim como dos
de Kerr e Reissner-Nordstrom (que discutiremos mais adiante).
6.5 Coordenadas de Kruskal-Szekeres

Vimos que as coordenadas de E-F eliminam parcialmente a singularidade do sistema
de coordenadas de Schwarszchild em r = 2M . O sistema de E-F é uma extensão das
coordenadas originais, e cobre portanto uma porção maior da variedade associada ao
espaço-tempo. A extensão foi sugerida pelo fato de que as geodésicas radiais imergentes
passam sem problemas por r = 2M e seguem para a singularidade. É natural se
preguntar se podemos extender ainda mais estas coordenadas. Não discutiremos aqui
os teoremas que respondem a esta questão em forma geral [37], mas mostraremos
que existe um sistema de coordenadas que é uma extensão das coordenadas E-F.
Trata-se da a solução de Kruskal-Szekeres (K-S), que apresenta caracterı́sticas muito
particulares, uma das quais é que ela é máxima (no sentido de inextensı́vel), e única.
A parte relevante da métrica no que tem a ver com a singularidade em r = 2M é a
dos coeficientes gtt e grr :
−1
2 2M 2 2M
ds = 1 − dt − 1 − dr2 . (6.33)
r r
Como vimos na sec. 6.2.2, as geodésicas nulas de Schwarszchild satisfazem
t = ±r∗ + constante,
onde a coordenada “tartaruga” [13] introduzida por Regge and Wheeler está definida
por r
r∗ = r + 2M ln −1 ,
2M
239
de jeito tal que −1
dr∗ 2M
= 1− .
dr r
Definimos agora coordenadas nulas u e v como segue:
u = t − r∗ , v = t + r∗ .
Nestas coordenadas, a métrica (6.33) toma a forma

2 2M
ds = 1 − du dv, (6.34)
r
onde r está definido implicitamente em termos de u e v como segue,
r v−u
r + 2M ln − 1 = r∗ = .
2M 2
Usando esta equação podemos reescrever a métrica (6.34) na forma
2M e−r/2M (v−u)/4m
ds2 = e du dv.
r
Introduzindo agora novas coordenadas
U = e−u/4m , V = ev/4m ,
a métrica se escreve
32M 3 e−r/2M
ds2 = − dU dV.
r
Finalmente, fazendo mais uma transformação ,
U +V V −U
T = , X= ,
2 2
e escrevendo a métrica em 4 dimensões, obtemos a métrica de Kruskal-Szekeres
32M 3 e−r/2M
ds2 = (−dT 2 + dX 2 ) + r2 (dθ2 + sin θ2 dφ2 ). (6.35)
r
A relação entre as coordenadas (t, r) e as (T, X) é dada pelas equações
r
− 1 er/2M = X 2 − T 2 , (6.36)
2M

t T +X −1 T
= ln = 2 tanh . (6.37)
2M X −T X
Note que na equação (6.35) r é função de X e T por causa da equação (6.36). O
intervalo permitido para as coordenadas X e T fica definido pela condição r > 0, ou
X 2 − T 2 > −1. O diagrama de espaço-tempo da extensão de K-S é mostrado na figura
6.11. A estrutura causal do espaço-tempo de Schwarszchild extendido é facilmente en-
tendida do diagrama, já que as geodésicas radiais nulas são linhas a 45◦ nas coordendas
K-S. Note que o diagrama mostra que a singularidade em “r = 0” das coordenadas de
Schwarszchild corresponde nas coordenadas de K-S à duas singularidades, dadas por
240
Figura 6.11: Solução de Schwarszchild em coordenaas de Kruskal-Szekeres.
√
X = ± T 2 − 1. Elas estão no futuro da região II e no passado da III respectivamente.
Veja também que embora as coordenadas K-S são muito convenientes para analizar
a região de campo forte da geometria de Schwarszchild, não são uteis para estudar o
limite r → ∞, já que guu e gvv caem exponencialmente com r.
O espaço-tempo de Schwarszchild extendido tem uma estrutura complexa. A região I

da figura corresponde à região r > 2M nas coordenadas de Schwarszchild, e pode ser
usada para representar o exterior de um corpo esférico. Já no caso de um buraco negro,
qualquer partı́cula em queda radial na região I atravesará a linha X = T (ou r = 2m)
√
a(e não poderá mais sair dela), e atingirá a singularidade situada em X = T 2 − 1.
A região II é então o interior de um buraco negro. De fato, a figura mostra que as
linhas de r =constante são hipérboles. Para r > 2M , as hiperboles são quase verticais,
enquanto que para r < 2M , elas são quase horizontais. Segue que uma partı́cula se
movendo dentro do cone de luz em r < 2M não pode permanecer com r = constante;
a sua coordenada r vai diminuindo até cair inevitavelmente na singularidade.
O diagrama mostra também que o horizonte é uma linha nula (isto é, ela forma um
ângulo de 45◦ com o eixo horizontal). Isto reflete o fato de que o horizonte é a divisoria
entre aqueles raios que não podem escapar e aqueles que escapam. Ele é o caminho
percorrido pelo raio “marginal”.
A região III é exatamente o contrário: trata-se de um buraco branco. Qualquer

partı́cula presente na região III deve necessariamente ter saido da singularidade
√
X = − T 2 − 1, e deve deixar a região III num tempo finito. A região IV tem as
mesmas propriedades que a I, e representa uma outra região assintoticamente plana.
Notar que não é possı́vel trocar sinais entre pontos das regiões I e IV: inevitávelmente
se produz um encontro com a singularidade 14 .
A pregunta é: representa esta extensão da solução original de Schwarszchild algum

objeto existente na natureza? A métrica extendida é solução das equações de Einstein
14
De fato, a métrica de K-S não é estática, ela evolue no tempo [42].
241
no vácuo, mas da discusão de colapso gravitacional sabemos que o interior de um
corpo em colapso não será descrito pela métrica de Schwarszchild (já que Tµν 6= 0
alı́). Por causa do teorema de Birkhoff, o exterior do corpo estará representado pela
geometria de Schwarszchild. O espaço-tempo correspondente ao colapso gravitacional
nas coordenadas de K-S está representado pela figura 6.12. As regiões III e IV (assim
Figura 6.12: Espaço-tempo resultante do colapso gravitacional completo de um corpo com

simetria esférica. As regiões III e IV da solução de Schwarszchild extendida estão cobertas
por matéria.
como partes da I e II) são cobertas por materia, e nelas a solução das EE não é a de
vácuo. Somente uma parte da região II do espaço-tempo de K-S aparecerá quando a
matéria colapsando atravessar r = 2M . Assim, as regiões III e IV não são relevantes
no colapso gravitacional.
6.6 Outros buracos negros
Até aqui analisamos a solução de Schwarszchild, que possui um alto grau de sime-
tria (ela é esféricamente simétrica e estática). Do ponto de vista da astrofı́sica, seria
interessante dispor também de soluções descrevendo objetos em rotação (isto é com
simetria axial). Estudaremos a seguir um tipo de buraco negro que possui velocidade
angular não nula.
6.6.1 O buraco negro de Kerr
A métrica que descreve o espaço-tempo de um buraco negro em rotação pode ser

escrita convenientemente de três formas diferentes. A primeira é a forma de Eddington-
Finkelstein avançada, dada por

2 2M r 2M r
ds = 1− 2 dv 2 − 2 dv dr + 2 (2a sin2 θ) dv dφ̄ + 2a sin2 θ dr dφ̄ − ρ2 dθ2
ρ ρ
242

2M r 2 4
2 2 2
− (r + a ) sin θ + 2 a sin θ) dφ̄2 , (6.38)
ρ
onde
ρ2 = r2 + a2 cos2 θ.
Esta forma pode ser obtida a partir da métrica de Schwarszchild , fazendo uma trans-
formação de coordenadas onde r pode ter valores complexos [5]. A segunda forma da
solução é em coordenadas tipo cartesianas, como foi descoberta por Kerr. Pode ser
obtida da anterior fazendo a transformação
t̄ = v − r,
x = r sin θ cos φ + a sin θ sin φ,

y = r sin θ sin φ − a sin θ cos φ,
z = r cos θ.
O resultado é
2M r3

2 2 2 2 2 r a z
ds = dt̄ −dx −dy −dz − 4 d t̄ + (x dx + y dy) + (y dx − x dy) + d
r + a2 z 2 a2 + r2 a2 + r 2 r
Finalmente, a métrica de Boyer-Lindquist (B-L):
∆ sin2 θ 2 2 ρ2 2
ds2 = (dt − a sin 2
θdφ 2 2
) − (r + a 2
)dφ − adt − dr − ρ2 dθ2 , (6.39)
ρ2 ρ2 ∆
onde
∆ = r2 − 2M r + a2 .
Os detalhes do cálculo da solução podem ser encontrados por exemplo em [31].
6.6.2 Propriedades da solução de Kerr
A forma de B-L é talvez a mais utilizada, e vale a pena salientar algumas das suas
propriedades. Primeiramente, as superfı́cies t = constante, r = constante não tem a
métrica da 2-esfera, como era de esperar numa geometria sem simetria esférica. Em
segundo lugar, a métrica de Kerr depende de dois parâmetros, m e a. Fazendo a = 0
recuperamos a solução de Schwarszchild nas coordenadas de Schwarszchild (eq.(6.3)),
e então M é a massa do buraco negro. Vemos também que os coeficientes da métrica in-
dependem de t e φ, e conseqüentemente a solução é estacionaria e axialmente simétrica
(ela é invariante respeito de rotações com eixo z). A métrica tem ainda duas simetrias
discretas: ela é invariante sob a transformação
t → −t, φ → −φ,
e sob
t → −t, a → −a.
243
A primeira sugere que o campo tem como fonte um corpo em rotação, já que correr
o tempo para atrás com uma direção de rotação negativa é equivalente a correr o
tempo para adiante com uma direção de rotação positiva. A outra simetria sugere que
a tem relação com o momento angular. De fato, e possı́vel mostrar que a é o momento
angular por unidade de massa, a = J/M [17].
Singularidades e horizontes
O cálculo dos invariantes mostra que a métrica de Kerr tem somente uma singularidade
intrı́nseca quando ρ = 0. Da definição de ρ,
ρ2 = r2 + a2 cos2 θ,
vemos que ρ = 0 traz como conseqüência r = cos θ = 0. A partir da transformação de

coordenadas ligando a métrica em coordenadas E-F com a métrica em coordenadas
tipo cartesianas obtemos as equações
x 2 + y 2 = a2 , z = 0,
que fornecem os pontos singulares. Fica claro que a diferença do caso de

Schwarszchild onde a singularidade é um ponto, a singularidade na geometria de Kerr é
um anel de raio a no plano equatorial z = 0. As superfı́cies dadas pela condição g00 = 0,
ou
√
rS± = M ± M 2 − a2 cos2 θ,
que chamaremos S+ e S− têm propriedades especiais, como veremos mais adiante. No
limite a = 0, a expressão para rS± se reduz a rS+ = 2M , rS− = 0. As superfı́cies tem
simetria axial, e a S− está dentro da S+ . Já os dois horizontes da solução de Kerr
estão determinados pela equação g 11 = 0, cuja solução é
√
r± = M ± M 2 − a2 .
no caso em que a2 < M 2 (o momento angular é menor que a massa), que é o rele-
vante em astrofı́sica 15 . A solução de Kerr é então regular nas três regiões seguintes:
r+ < r < ∞, r− < r < r+ , e 0 < r < r− . O horizonte r+ está totalmente dentro de S+ ,
e a região entre eles é a ergosfera, cujas propriedades discutiremos depois. A figura 6.13
mostra um esquema da solução de Kerr. Note que no caso a > M terı́amos o campo
gravitacional de uma singularidade “nua” (isto é, não “vestida” pelo horizonte). Dev-
ido ao fato de que tanto o espaço e o tempo deixam de ter sentido nas vizinhanças da
singularidade, e sendo que as leis da fisica pressupõem a existência destes, uma singu-
laridade nua seria um “lugar onde todo vale”. Por este motivo, R. Penrose formulou
em 1969 a Conjectura de Censura Cósmica , que afirma que o colapso gravitacional
não pode ter como resultado uma singularidade nua. Quase 30 anos depois de sua
formulação , ainda não foi possı́vel provar tal conjectura.
15
Veremos uma justificativa para este resultado mais abaixo.
244
Figura 6.13: Esquema da solução de Kerr
As congruências nulas principais
A solução de Kerr não tem simetria esférica, e por tanto não existem nela curvas
que correspondam a geodésicas radiais. Na relatividade geral, isto pode ser entendido
como o fato de que a fonte em rotação arrasta o espaço perto dela e conseqüentemente
as geodésicas (veja Sec.6.6.2). A situação é bem diferente do que acontece na teoria
de Newton, onde sempre podemos levar a fonte ao repouso mudando ao referencial
em rotação com a fonte. Mas isto não é possı́vel na RG já que não existe nenhuma
transformação de coordenadas que leve da métrica de Kerr na de Schwarszchild. Não
estudaremos aqui o detalhe das geodésicas (ver [16] e [17]), mas é possı́vel mostrar que
existem duas congruências de geodésicas nulas, definidas pelas equações
(r2 + a2 )l
ṫ = ,
∆
ṙ = ±l,
al
φ̇ = ,
∆
onde l é uma constante do movimento. Como no caso de Schwarszchild, temos duas
congruencias nulas, correspondentes aos dos sinais na equação para ṙ. Escolhendo
ṙ = +l, as equações podem ser integradas no caso a2 < M 2 , e o resultado é
M2 M2

t=r+ M +√ ln |r − r+ | + M − √ ln |r − r− | + constante,
M 2 − a2 M 2 − a2
a r − r+
φ= √ ln + constante.
2
2 M −a 2 r − r−
245
Do fato que ∆ > 0 nas regiões I e III, e < 0 na II, junto com a equação
dt ṫ r 2 + a2
= = ,
dr ṙ ∆
segue que dr/dt > 0 na região I, e consequentemente esta congruência é chamada
de congruência principal de geodésicas nulas emergentes. A solução com o sinal “-”
pode ser obtida da solução com o sinal “+”, fazendo a mudança t → −t, φ → −φ.
Obtem-se então a congruência principal de geodésicas nulas incidentes. Estas duas con-
gruências desempenham um papel análogo as congruências estudadas na solução de
Schwarszchild. Fazendo um diagrama espaço-tempo encontramos na região I uma
situação semelhante aquela vista na Fig. 6.2 no caso de Schwarszchild. Os cones de
luz vão se afinando quanto mais perto chegarmos de r = r+ , onde t e φ são infinitos,
sugerindo que se trata de una singularidade do sistema de coordenadas. Fazendo as
transformações
2M r
t → t̄, onde dt̄ = dt + dr,
∆
a
φ → φ̄, onde dφ̄ = dφ + dr,
∆
e definindo uma coordenada tempo avançado,
v = t̄ + r,
obtemos a forma de E-F da métrica Kerr, ver figura (6.14). Vemos do diagrama que
nenhum raio de luz pode sair da região II para a região I. Segue então que a superfı́cie
r = r+ é um horizonte. Já na região II, os cones estão inclinados na direção da
singularidade em r = 0, e qualquer partı́cula que entre na região II se moverá na
direção da singularidade até cruzar a superfı́cie r = r− ou alcançá-la asintoticamente.
Já na região III, a partı́cula não necessariamente cai na singularidade.
Arraste dos sistemas inerciais
Diferentemente da métrica de Schwarszchild, a métrica de Kerr tem um termo

não diagonal, dado por
2M r sin2 θ
gtφ = −a .
ρ2
Este termo origina o fenomeno do dragging dos sistemas inerciais de referência, como
veremos a seguir. Como a métrica de Kerr dada na equação (6.39) independe de t e
φ, os momentos associados pt e pφ são conservados [13]16 . Temos
pφ = g φα pα = g φφ pφ + g φt pt ,
pt = g tα pα = g tt pt + g tφ pφ .
16
A métrica de Kerr tem um tensor de Killing que fornece mais uma constante de movimento, o que
permite integrar explicitamente as equações das geodésicas, como foi mostrado num belo artigo por B.
Carter [43], utilizando a separabilidade das equações de Hamilton-Jacobi deste problema.
246
Figura 6.14: Solução de Kerr em coordenadas de E-F avançadas (a2 < M 2 ).
Seja agora uma partı́cula se deslocando com momento angular nulo, isto é pφ = 0
(notar que esta condição quer dizer que a partı́cula foi “jogada” com velocidade inicial
na direção radial no infinito). Das definições
dt dφ
pt = m , pφ = m ,
dτ dτ
a trajetória da partı́cula pode ser obtida (no caso pφ = 0) como segue:
dφ pφ g φt
= t = tt ≡ ω(r, θ).
dt p g
Esta equação define a velocidade angular de uma partı́cula com momento angular zero.
Note que ω(r, θ) sempre será diferente de zero no caso em que gtφ 6= 0. Temos então o
resultado que uma massa caindo “reto” desde infinito é arrastada pela influência da
gravitação e adquire uma velocidade angular (com o mesmo sentido que a rotação da
fonte, como veremos em seguida). No caso da métrica de Kerr em coordenadas de B-L,
√
a sin θ ± ∆
ω(r, θ) = √ .
(r2 + a2 ) sin θ ± ∆ sin2 θ
Quando ω(r, θ) > 0 (que é o caso do sinal ”+”) as partı́culas seguem órbitas no sentido
da rotação da fonte. É facil mostrar que na região I,
√
ω < 0 ↔ a sin θ − ∆ ≤ 0 ↔ r ≥ rS+ .
247
Ou seja, na superfı́cie S+ , ω = 0 17 , e dentro (na chamada ergosfera) os cones
de luz são ”inclinados” na direção de φ ”crescente”, de jeito tal que as partı́culas
são obrigadas a descrever órbitas na direção de rotação da fonte (ver figura 6.15).
Figura 6.15: Diagrama espacial da solução de Kerr (a2 < M 2 ) no plano equatorial.
Assim como a métrica de Schwarszchild pode ser usada para descrever o campo grav-
itacional no exterior de uma estrela com simetria esférica, a métrica de Kerr com
0 < a2 < m2 pode representar o exterior de uma estrela em rotação. Mas enquanto
no caso de Schwarszchild existem soluções interiores (isto é, soluções das equações de
Einstein com a matéria que compõe a estrela como fonte) que são coladas suavemente
com o exterior de Schwarszchild, não se conhecem soluções internas realistas para a
métrica de Kerr.
Finalmente, note que a métrica de Kerr pode ser estendida maximalmente utilizando
as coordenadas de E-F avançadas e retardadas (ver por exemplo [17]).
Órbitas de fótons no plano equatorial
Para entender as diferenças com o caso estático, nesta seção estudaremos as órbitas de
partı́culas de massa nula no plano θ = π/2. Neste caso, dθ = 0, mas a diferença do caso
de Schwarszchild, que tem simetria esférica, aqui estamos nos restringindo a um caso
particular: fótons que não estejam no equador podem ter órbitas bem diferentes das
que vamos estudar aqui. Não obstante, fótons inicialmente com pθ = 0 permanecerão
assim, já que a métrica tem simetria com respeito a uma reflexão no plano θ = π/2.
As simetrias da métrica garantem que pt = E e pφ = L são constantes de movimento.
17
É por isto que a superfı́cie S+ é chamada também de superfı́cie do limite estacionário.
248
Seguindo os passos dados na seção 6.4 obtemos
2
dr
= g rr [−g tt E 2 + 2g tφ EL − gφφ L2 ],
dλ
que pode ser escrita como
2
(r2 + a2 )2 − a2 ∆ r2 − 2M r

dr 2 4M ra 2
= E − 2 EL − 2 L .
dλ r4 (r + a2 )2 − a2 ∆ (r + a2 )2 − a2 ∆
(6.40)
Esta equação se reduz à equação (6.26) no caso a = 0. Note que por causa do termo
EL não podemos definir um potencial efetivo utilizando (dr/dλ)2 = E 2 − V 2 , mas o
lado direto da (6.40) pode ser fatorado assim:
2
dr (r2 + a2 )2 − a2 ∆
= (E − V+ )(E − V− ), (6.41)
dλ r4
onde √
2M ra ± r2 ∆
V± (r) = 2 L. (6.42)
(r + a2 )2 − a2 ∆
Esta equação deve ser comparada com a (6.26) do caso de Schwarszchild, na qual o
potencial efetivo é imaginário dentro do horizonte. Já V± se torna imaginário para
∆ < 0. Nos dois casos isto significa que não há soluções para a equação dr/dλ = 0,
isto é não há pontos de retorno para os fótons, independente da energia dos mesmos.
Uma vez que os fótons cruzam a linha ∆ = 0 não podem sair. A equação ∆ = 0 então
delimita o horizonte no equador, e de fato pode mostrar-se que ela define o horizonte
mesmo fora do equador (como já vimos da figura 6.14).
A partir do gráfico de V± é possı́vel analizar qualitativamente o movimento. Nos re-
stringiremos a r ≥ r+ . Discutiremos primeiro o caso em que o fóton tem momento
angular no sentido do momento angular do buraco negro (fig. 6.16). Note que para r
Figura 6.16: Potencial efetivo no caso em que o fóton tem momento angular no sentido
do momento angular do buraco negro.
grande, as duas curvas caem como 1/r, e a rotação não tem importância. Já para r
249
perto do horizonte, aparecem caracterı́sticas próprias da rotação. Da equação (6.41)
vemos que o movimento só poder acontecer quando E > V+ ou E < V− . Aqueles
fótons com E > 0 não apresentam maiores novidades: eles vêm desde infinito, e
atingem um r mı́nimo para depois voltar para infinito, ou passam pelo horizonte se
não encontram antes o potencial. A condição E < V− permite fótons com E < 0, mas
é possı́vel mostrar que estes devem ser descartados se admitirmos que as partı́culas
somente podem viajar em direção ao futuro [18]. Devemos considerar então no gráfico
(6.16) somente geodésicas com E > V+ .
No caso de fótons com momento angular negativo aparecem novidades (ver Fig. 6.17).
De fato, da Eq.(6.42) vemos que neste caso as curvas são trocadas. Aplica-se ainda o
Figura 6.17: Potencial efetivo no caso em que o fóton tem momento angular no sentido
contrário ao momento angular do buraco negro.
raciocı́nio anterior, e só curvas com E > V+ são permitidas. Mas surpreendentemente
algums fótons que satisfazem esta condição tem energia negativa: são aqueles dentro
de r < r0 , isto é, dentro da ergosfera. A existência desta região permite que aconteça
um fenômeno incomun, que foi discutido por R. Penrose em 1969. Suponha que em
algum ponto entre r+ e r0 é criado um par de fótons, um deles tendo energia +E
e o outro −E, de manera tal que a energia total é zero, e com momentos opostos
tal que o fóton com energia positiva escapa para o infinito, enquanto o outro cai na
singularidade. O efeito resultante é que o fóton de energia positiva deixará o buraco
negro, e sua energia pode ser convertida no infinito em trabalho. Isto sugere que
é possivel extrair energia (ergo massa) do buraco negro com custo zero. Das figuras
(6.16) e (6.17) vemos que isto é possivel só se no processo diminuir o momento angular
do buraco negro. A energia extraida vem então da energia rotacional do buraco. Este
processo de extração de energia (chamado processo de Penrose) poderia acontecer toda
vez que exista uma ergosfera, seja no caso de um buraco negro em rotação ou no caso
de estrelas “exóticas” (ver [18]). Ele não tem relevância em astrofı́sica [40], mas foi
importante no desenvolvimento da termodinámica de buracosn negros (veja Sec. 6.9).
250
6.6.3 Buracos negros carregados
Existe de fato um outro tipo de buraco negro, importante do ponto de vista teórico, e
provavelmente significativo para a astrofı́sica (como parecem indicar os resultados do
modelo de emissão de gamma-ray bursts desenvolvidos em [19]). Trata-se do buraco
negro carregado, ou mais precisamente, da solução estática, assintoticamente plana, e
com simetria esférica das equações de Einstein-Maxwell descoberta por H. Reissner em
1916, e redescoberta por G. Nordstrom em 1918 (mas a interpretação da solução como
descrevendo um buraco negro carregado foi feita por J. Graves e D. Brill em 1960).
As equações relevantes são as da RG junto com as do campo eletromagnetico,
Rµν = 8πTµν ,
∇ν F µν = 0, ∂[µ Fνρ] = 0.
A fonte do campo elétrico é uma carga pontual situada na origem (logo o campo será
radial). Sem entrar nos detalhes do cálculo, a métrica de R-N tem a forma
−1
q2 q2

2 2M 2 2M
ds = 1 − + 2 dt − 1 − + 2 dr2 − r2 (dθ2 + sin2 θdφ2 ), (6.43)
r r r r
e o campo elétrico é
q
E(r) = .
r2
No caso q = 0, a solução de R-N se reduz à métrica de Schwarszchild. A análise da
solução mostra que no caso q 2 > m2 existe somente uma singularidade, localizada na
origem. Já no caso q 2 < m2 , a métrica tem duas singularidades, situadas em
p
r± = m ± m2 − q 2 .
O estudo da solução em coordenadas de Eddington-Finkelstein para o caso q 2 < m2

mostra que r = r+ é um horizonte, mas a singularidade em r = r− é artificial, e pode
ser removida com uma extensão analı́tica [17].
6.6.4 O buraco negro mais geral
É possı́vel obter a solução mais geral de buraco negro usando uma trans-
formação complexa na solução de R-N em coordenadas de E-F, como foi feito para
passar da métrica de Schwarszchild para a métrica de Kerr (ver detalhes em [17]). O
resultado é a métrica de Kerr-Newman
2M r q 2

2 2a
ds = 1 − 2 + 2 dv 2 − 2 dv dr + 2 (2M r − q 2 ) sin2 θ dv dφ̄ + 2a sin2 θ dr dφ̄
ρ ρ ρ
sin2 θ 2
−ρ2 dθ2 − [(r2 + a2 )2 − (r2 − 2M r + a2 + q 2 ) a2 sin2 θ] dφ̄ , (6.44)
ρ2
que depende de três parametros: m, a, q (massa, carga, e momento angular do bu-
raco negro respectivamente). Esta solução se reduz a de Schwarszchild no caso
251
q = a = 0, d́e Kerr se q = 0, e a de Reissner-Nordstrom se a = 0. Trata-se de
uma solução estacionária com simetria axial e assintoticamente plana, que tem uma
superfı́cie estacionária limite dada por
p
r = m + m2 − q 2 − a2 cos2 θ,
e um horizonte de eventos externo em

p
r =m+ m2 − q 2 − a2
para a2 + q 2 ≤ m2 . Os detalhes desta solução podem ser encontrados em [16].

Foi mostrado por Carter, Hawking e Robinson que a solução de Kerr-Newman é a única
solução estacionária das equações de Einstein no vácuo. Sendo que aparentemente não
existem objetos astrofı́sicos com carga apreciável, a solução de Kerr (que inclui a de
Schwarszchild como caso especial) é a solução relevante do ponto de vista astrofı́sico.
De fato, aceitando a validade da conjectura da censura cósmica, o resultado de um
colapso arbitrário (isto é, sem simetrı́as) deve dar como resultado um buraco negro de
Kerr. Ou seja, sem importar o estado inicial da matéria em colapso, o estado final é
caracterizado por M e J.
Concluimos aqui o nosso estudo das propriedades clássicas dos buracos negros iso-
lados. Várias questões fundamentais dentro deste item, mas exigindo ferramentas
matemáticas além das apresentadas neste curso, não foram abordadas aqui. Entre
elas podemos citar a teoria de perturbações em geometrias descrevendo buracos ne-
gros [16], e os detalhes do colapso gravitacional. Na seção seguinte estudaremos alguns
fenômenos astrofı́sicos envolvendo buracos negros.
6.7 Buracos Negros Astrofı́sicos

Até aqui exploramos algumas propriedes clássicas de buracos negros isolados, mas
estes dificilmente podem ser observados. Nesta seção discutiremos brevemente a ob-
servação de buracos negros em interação com um corpo celeste (uma estrela normal ou
uma anã branca por exemplo). Neste caso, a fortı́ssima atração gravitacional do bu-
raco negro faz com que a matéria que compõe a estrela começe a “cair” na direção do
buraco. A descrição deste fenômeno é extremamente complicada: trata-se de um prob-
lema de hidrodinâmica onde o fluxo se produz num disco que gira em torno do equador
do buraco negro. As diferentes camadas do disco giram com uma velocidade angular
que aumenta com a proximidade ao buraco, provocando o aquecimento do material em
queda até altissimas temperaturas. O material quente emite radiação , que pode ou
não interagir fortemente com o gas. Em muitos casos existe um campo magnético na
estrela, o que transforma o processo num problema de magnetohidrodinâmica. Final-
mente, todo isto acontece com a geometria de Kerr como pano de fundo. Resumindo,
trata-se de um problema de magnetohidrodinâmica relativista dependente do tempo,
252
Figura 6.18: O desenho mostra o disco de acreção em torno de um buraco negro que
atrai matéria de uma estrela normal (ilustrando a situação no sistema GRO J1655-40, na
galáxia Scorpius). Vemos ainda o vento produzido pela presença de um campo magnético,
e o espectro de emissão de raios X. Crédito: Chandra Photo Album.
com equações em duas (ou três) dimensões, com transferência radiativa! [45] (veja a
Figura 6.18).
O caminho que leva a o modelo descrito no parágrafo anterior começou no ano 1962,
quando foram observadas as primeiras fontes de raios X em nossa galáxia, num pro-
jeto comandado por R. Giacconi (Prêmio Nobel 2002 por seu trabalho em astronomia
de raios X). Logo foram observadas fontes variáveis no tempo, algumas com contra-
partida na parte óptica do espectro. Mas o aporte decisivo foi o do primer satélite
dedicado à observações astronómicas, o Uhuru 18 . Ele observou mais de 300 fontes
de raios X, muitas delas em sistemas binários. Estes dados foram interpretados como
conseqüência da acreção de matéria num objeto compacto. Os motivos que sustentam
tal interpretação ão os seguintes:
• A variabilidade observada na emissão dos raios X tem uma escala temporal curta,
o que se deve ao fato de que a região emissora deve ser pequena (do tamanho de
um objeto compacto).
• Muitas das fontes são efetivamente sistemas binários, com uma estrela observável
no óptico em órbita elı́ptica em torno de um companheiro “invisı́vel”.
• Como mencionado na seção 6.4, a queda de matéria num buraco negro é um meio
muito eficiente de conversão de massa em energı́a.
Acredita-se hoje que a emissão de raios X deve-se ao processo descrito acima, cuja
observação é uma prova indireta da existência dos buracos negros. De fato, supõe-se
que buracos negros supermassivos (com massas entre 105 e 109 vezes a massa do Sol)
existem no centro da maioria das galáxias (incluindo a nossa), e buracos negros da
ordem de algumas massas solares compõem os sistemas binários mencionados acima.
18
Uhuru significa liberdade em swahili, lingua falada na Etiopia, paı́s de onde foi lançado o satélite.
253
Mas devemos mencionar o fato de que no caso dos sistemas binários é preciso decidir
por meio da observação (por exemplo através da medida da massa) se o objeto “escuro”
é um buraco negro ou uma estrela de nêutrons. Uma outra possibilidade envolve
a diferência fundamental entre estes dois objetos: a estrela de nêutrons tem uma
superfı́cie sólida, enquanto o horizonte do buraco negro é uma superfı́cie matemática
(veja [41] para detalhes).
Para concluir, é importante notar que toda a evidência observacional que apoia a
existência de buracos negros é indireta, mas a quantidade de evidência disponı́vel
crece rápidamente, apontando para a plausibilidade da hipôtese da existência dos
buracos negros [44].
6.8 Buracos negros e mecânica quântica

Em 1974 Hawking surpreendeu a comunidade dos fı́sicos teóricos ao mostrar que os
buracos negros são negros somente quando considerados como objetos clássicos. Se
levarmos em conta as leis da mecânica quântica, os buracos negros emitem energia
continuamente, e não são então as estruturas permanentes que a fı́sica clássica prediz
[20]. Os cálculos de Hawking estão baseados no uso de teoria quântica de campos num
espaço-tempo curvo, e nos limitaremos aqui a apresentar uma justificativa heuristica
deste resultado.
A teoria quântica nos diz que o estado que chamamos de vácuo clássico pode ser
pensado como um mar de partı́culas virtuais, que se materializam em pares partı́cula-
antipartı́cula, para aniquilarem-se pouco depois. Esta ideia que pode parecer um pouco
bizarra tem conseqüências observacionais diretas, como por exemplo o Lamb shift no
espectro do átomo de hidrogênio [21]. Lembrando que a solução de Schwarszchild é
uma solução de vácuo das equações de Einstein, perto do horizonte acontecerá também
a criação de pares. Embora muitos pares sejam engolidos pelo buraco, dependendo
do momento de cada uma das partı́culas do par, alguns pares podem ser separados,
caindo uma das partı́culas no buraco negro e escapando a outra em direção ao infinito,
onde seria interpretada como radiação emitida pelo buraco. Hawking mostrou que a
radiação estarı́a distribuida segundo um espectro de corpo negro. Este processo, que
diminue a massa (e o tamanho) do buraco negro, continua sem interrupção, até a
evaporação final do buraco. Para buracos negros grandes a evaporação total levaria
muito tempo (1066 anos para um buraco de massa M ).
O resultado de Hawking é de extrema importância para a compreensão de fenômenos
descritos pela teoria quântica de campos em espaço-tempo curvo. Mas a possibili-
dade de observar em buracos negros astrofı́sicos a radiação decorrente é nula, já que
os buracos negros astrofı́sicos estão rodeados por material em queda em espiral na
direção da singularidade. Este material forma um disco de acreção, e está a temper-
aturas elevadas, emitindo consequentemente radiação a altas temperaturas perto do
254
horizonte (por causa da fricção). Por outra parte, a intensidade da radiação do efeito
Hawking é extremamente baixa, e não existe então possibilidade alguma de observar
este efeito nos buracos negros astrofı́sicos. Mas como veremos a seguir, existe uma
chance de medir a radiação de Hawking... no laboratório!
Buracos negros análogos
Numa direção aparentemente sem relação com a anterior, W. Unruh [22] mostrou em
1981 que é possivel gerar um modelo análogo de um buraco negro no laboratório, sem
a intervenção da gravitação. A ideia é muito simples. Considere o fluxo de um fluido
ideal (isto é, sem viscosidade). Se a velocidade do fluxo superar a partir de algum
ponto a velocidade do som no fluido, os fónons (“partı́culas de som”) que passem
deste ponto não poderam voltar, ficando então confinadas (ver Figuras 6.19 e ??).
Isto é o análogo de um buraco negro, mas para o som exclusivamente, e não para
Figura 6.19: Diagrama simplificado de um buraco negro análogo. As flechas longas indicam
a velocidade do fluido, que é maior que a velocidade dos fónons (representada com flechas
curtas) a partir da superfı́cie r = rh
outras ondas que existam no fluido (luz por exemplo). É claro que, como vimos antes,
o fenômeno da radiação de Hawking é eminentemente quântico, mas Unruh mostrou
que ao considerar o som como composto de particulas quânticas (“fonons”), o buraco
negro análogo (ou melhor, buraco “mudo” análogo!) emitiria radiação de Hawking
“sônica”. A possibilidade de observar este fenômeno gerou uma intensa atividade de
pesquisa na área de modelos análogos, onde tem sido publicados centenas de arti-
gos [23]. Em muitos deles tenta-se generalizar o fenômeno a sistemas mais complexos
(fluidos dielétricos, superfluidos, condensados de Bose-Einstein, etc), enquanto que em
outros a noção de sistema análogo foi generalizada para abranger outros sistemas difer-
entes dos buracos negros (como por exemplo os buracos de minhoca [24]). No que diz
respeito a observação da radiação de Hawking, existem ainda problemas experimen-
tais, relacionados fundamentalmente com o fato de que a temperatura da radiação é,
em todos os casos estudados até agora, bastante menor que a temperatura do ruı́do
de fundo [25].
255
Figura 6.20: O desenho mostra um corte transversal de um buraco “mudo” realizado a
partir de um fluido em fluxo radial. Vemos como os cones de luz vão sendo inclinados na
direção do centro do buraco. Crédito: [23].
6.9 Termodinâmica de buracos negros
Mencionamos na Sec.6.3 um resultado importante, obtido por Hawking: o teorema

da área, que diz que em qualquer processo fı́sico que envolva um horizonte, a área
do horizonte não pode diminuir. Este resultado pode ser enunciado matematicamente
como segue:
dA
≥ 0.
dt
Por outra parte, vimos na seção anterior que um buraco negro emite fótons com o
espectro de um corpo negro de temperatura

~ −7 M
T = ≈ 10 K , (6.45)
8πkM M
onde k é a constante de Boltzmann. No caso do buraco negro de Schwarszchild,

2
2GM
A = 4π ,
c2
e então dA = 32π(G/c2 )M dM , ou
c6 dA
d(M c2 ) = ≡ T dS
G2 32πM
Como T = ~/(8πkM ) é a temperatura, segue da equação anterior que a entropia S
do buraco negro vem dada por
kc3 A
S= ,
G~ 4
e não pode diminuir por causa do teorema da área 19 . Temos então o inesperado
resultado de que o buraco negro se comporta como um corpo negro de temperatura
19
Note que S é um número extremamente grande.
256
h/8πM e entropia proporcional a A. É possı́vel mostrar que a escala temporal asociada
à perda de energia (“evaporação ”) vem dada por [45]
3
M3

M
τ≈ ≈ 1010 yr ,
~ 1015 g
que é irrelevante para buracos negros de algumas massas solares, mas não para M .
1015 g.
O fato de que os buracos negros deviam possuir entropia já tinha sido notado por
Wheeler 20 , mas a temperatura de um buraco negro segundo a fı́sica clássica é
zero, já que ele absorbe e não emite nada. Foi somente depois da descoberta da
radiação de Hawking que a termodinâmica de buracos negros foi aceita. Sem entrar
em detalhes, apresentamos a seguir uma tabela comparando as leis da termodinâmica
com conceitos de buracos negros (no caso de um buraco negro estático, κ é a força
que é necessário fazer desde o infinito para manter uma partı́cula pequena sobre o
horizonte [33]).
LEI TERMODINÂMICA BURACOS NEGROS

Zero T é constante num corpo em equilı́brio termico κ é constante no horizonte
de um bn estacionário
Primeira dE = T dS +termos de trabalho dM = κ/(8π) dA + ΩdJ
Segunda δS ≥ 0 em qualquer processo δA ≥ 0 em qualquer processo
Terceira É impossivel atingir T = 0 É impossivel atingir κ = 0
via processos fı́sicos via processos fı́sicos
6.10 Coda
Quase um século tem transcorrido desde que Schwarszchild, Reissner e Nordstrom

descobriram as soluções de buraco negro sem e com carga. Neste tempo, os buracos
negros têm se mostrado como objetos fascinantes, que podem nos conduzir a grandes
descobertas. Mencionaremos a seguir somente algumas destas possibilidades.
Como discutimos brevemente na Seção 6.9, é possivel associar uma temperatura e
uma entropia ao buraco negro. Mas a fı́sica estatı́stica mostra que no caso de sis-
temas de muitas partı́culas, a temperatura e a entropia são manifestações da fı́sica mi-
croscópica que governa as interações entre as partı́culas. Em particular, a entropia tem
relação com o número de configurações microscópicas compatı́veis com um dado es-
tado macroscópico [26]. Qual serı́a então a “fı́sica microscópica” por detrás da entropia
do buraco negro? Esta é uma pergunta que as duas teorias que pretendem descrever a
gravitação num nı́vel fundamental (isto é, a teoria de cordas e a gravitação quântica)
20
De outra forma, se um buraco negro engolise um corpo caliente, a entropia total do sistema corpo +
buraco negro decreceria para um observador externo.
257
têm tentado responder, com diferentes graus de sucesso. Embora existam respostas
parciais ao problema (ver por exemplo [27]), ainda não temos a resposta definitiva.
Seja qual for, ela estará nos dando informação sobre o regime quântico da gravitação .
Um problema que teria uma forte relação com o anterior é o do paradoxo da in-
formação. Como vimos antes, os buracos negros emitem radiação com temperatura
TH dada pela equação (6.45). Em princı́pio a emissão continuaria até o buraco negro
se evaporar completamente, deixando somente radiação, cuja temperatura e demais
caracteristicas dependem só dos parámetros que caracterizam ao buraco negro. Ou
seja, o resultado final independe do estado inicial, isto é, do estado da materia que
colapsa para formar o buraco. Em outras palavras, dado um estado final descrito pelas
caracterı́sticas da radiação , não é possivel determinar a partir dele o estado inicial.
Este é o problema da “perda de informação ”. Por argumentos que não reproduziremos
aqui, esta perda de informação traria uma violação a evolução unitária (um dos pi-
lares da mecânica quântica usual), e como conseqüência, a gravitação quântica deveria
incorporar esta não unitariedade [28].
A possibilidade de produzir micro-buracos negros em aceleradores de partı́culas tem
recibido bastante atenção recentemente. Isto tem a ver com teorias que incorporam
a idéia de que o espaço-tempo tem 4+n dimensões, sendo as n dimensões extras
de tamanho microscópico 21 (um exemplo deste tipo de teorias é a teoria de cor-
das). Nestas teorias, os efeitos da gravitação quântica começariam a se manifestar
a energias bastante menores do que EPlanck ≈ 1019 GeV, e um destes efeitos seria a
produção copiosa de micro-buracos negros. Este fenômeno poderia ser observado no
Large Hadron Collider, que entrará em funcionamento em 2008, e na interação de
partı́culas com energias muito grandes (como raios cósmicos ultraenergéticos ou neu-
trinos) [29].
Vemos então que, os buracos negros tem um enorme potencial para desempenhar um
papel fundamental no desenvolvimento das ideias da fı́sica moderna.
6.11 Exercı́cios
1. Calcule as componentes do tensor de Riemann da métrica de Schwarszchild no
sistema das tetradas dadas nas equações (6.7)-(6.10) (compare com a eq. (8) da
ref.[35]), e o invariante dado na eq.(6.5).
2. Mostre que a transformação de coordenadas
2
MG
r =ρ 1+
2ρ
leva a métrica de Schwarszchild na métrica isotrópica dada na equação 6.24.

21
Medidas decorrentes do efeito Casimir mostram que o tamanho das dimensões extras deve ser bem
menor do que 1 mm.
258
3. Mostre que a transformação de coordenadas
p
2GM/r
dtP G = dtS ± dr
1 − 2GM/r
leva a métrica de Schwarszchild á métrica de Painlevé-Gullstrand dada na
equação 6.25. Qual é a interpretação do sinal duplo?
4. Mostrar a partir das definições que seguem do potencial efetivo da métrica de
Schwarszchild , que (a) r+ > 6M , ou seja que não existem órbitas estáveis para
raios menores que 6M , e (b) que as órbitas instáveis estão restritas ao intervalo
3M < r− < 6M .
5. Prove que se uma partı́cula for perturbada da posição de equilı́brio r+ do po-
tencial de Schwarszchild, para deslocamentos pequenos o suficiente o movimento
será harmônico simples, com freqüência dada pela equação (6.32).
6. Uma partı́cula na gemoetria de Schwarszchild “em infinito” se desloca radial-
mente na direção do horizonte com velocidade coordenada u0 . Mostre que para
um valor finito r do raio a velocidade coordenada vem dada por

dr 2M 1 2M
= 1− 1− 2 1− ,
dt r γ0 r
onde γ0 = (1 − u20 )−1/2 . Determine a velocidade relativa a um observador esta-
cionario em r, e mostre que ela se aproxima de 1 quando r toma valores próximos
a rg , independentemente de u0 .
7. O efeito gravitomagnetico. Dois relogios se movem em direções opostas numa
órbita circular no plano equatorial da geometria de Kerr (r = constante, θ = π/2).
(a) Mostre que a equação das geodésicas radias se reduz neste caso a
Γrtt dt2 + 2Γrφt dφ dt + Γrφφ dφ2 = 0.
(b) Calcule os simbolos de Christoffel e mostre que a equação toma a forma

2
dt dt r3
− 2a + a2 − = 0.
dφ dφ M
(c)Use a solução desta equação e a identidade para a 4-velocidade para mostrar
que o intervalo de tempo próprio dτ medido por um relogio que se desloca um
ângulo dφ vem dado por
r
3M
dτ = 1 − ± 2aω0 dφ,
r
onde ω0 = (M/r3 )1/2 é a velocidade angular de um relogio se deslocando na ge-
ometria de Schwarszchild (segundo a 3a lei de Kepler). Os sinais mais e menos
aparecem por causa do movimento direto e retrógrado, respectivamente. (d)
Mostre que na primeira ordem em a, a diferência entre os tempos proóprios
numa órbita completa (φ → φ + 2π) é
τ+ − τ− ≈ 4πa = 4πJ/M.
259
Livros de texto
Básicos: Refs.[6],[13], [17], [18], [30].
Avançados:[16], [38], [39].
Recursos em Internet
• Página sobre buracos negros do telescópio Hubble
http://hubblesite.org/explore astronomy/black holes/
• Página sobre buracos negros do observatório de raios X Chandra
http://chandra.harvard.edu/xray sources/blackholes.html
• Perguntas freqüentes sobre buracos negros
http://cosmology.berkeley.edu/Education/BHfaq.html
• Introdução aos buracos negros
http://www.damtp.cam.ac.uk/user/gr/public/bh home.html
• Uma viagem virtual a um buraco negro
http://antwrp.gsfc.nasa.gov/htmltest/rjn bht.html

[1] J. Michell, Phil. Trans. R. Soc. (London), 74, 35 (1784).
[2] Mecânica newtoniana, lagrangiana e hamiltoniana, J. Barcelos Neto, Ed. Livraria
da Fı́sica (2004).
[3] K. Schwarszchild, Sitzber. Deut. Akad. Wiss. Berlin Kl. Matyh-Phys. 189 (1916).
[4] Gravitational field of a spinning mass as an example of algebraically special met-
rics, Roy P. Kerr, Phys. Rev. Lett. 11, 237 (1963).
[5] E. T. Newman, R. Couch, K. Chinnapared, A. Exton, A. Prakash, R. Torrence,
J. Math. Phys. 6, 918 (1965).
[6] Spacetime Physics, E. Taylor e J. Wheeler, W. H. Freeman (1992).
[7] Complex Variables and Applications, J. Brown e R. Churchill, McGraw-Hill
(2003).
[8] A simple stationary line element for the Schwarszchild geometry, and some ap-
plications, P. Kraus, F. Wilczek, gr-qc/9406042.
[9] Simple analytic models of gravitational collapse, R.J. Adler, J.D. Bjorken, P.
Chen, J.S. Liu, gr-qc/0502040.
[10] Global aspects in gravitation and cosmology, P. S. Joshi, Clarendon Press, OUP,
Oxford (1993).
260
[11] R. Price. Phys. Rev. D 5, 2439 (1972).
[12] Ver por exemplo Classical Mechanics, H. Goldstein, C. P. Poole, J. L. Safko,
Addison Wesley (2001).
[13] Gravitation, K. Thorne, C. Misner, e J. Wheeler, W. H. Freeman (1973).
[14] Ver por exemplo Gravitation and Cosmology : Principles and Applications of the
General Theory of Relativity, S. Weinberg, Ed. Wiley (1972).
[15] Schwarszchild black hole lensing, K. Virbhadra e G. Ellis, Phys. Rev. D 62, 084003
(2000).
[16] The Mathematical Theory of Black Holes, S. Chandrasekhar, Oxford U. Press
(1998).
[17] Introducing Einstein’s Relativity, R. D’Inverno, Oxford U. Press (1992).
[18] A first course in General Relativity, B. Schutz, Cambridge University Press
(1995).
[19] The blackholic energy: long and short gamma-ray bursts (new perspectives in
physics and astrophysics from the theoretical understanding of gamma-ray bursts,
II), R. Ruffini, M. G. Bernardini, C. L. Bianco, P. Chardonnet, F. Fraschetti,
V. Gurzadyan, L. Vitagliano, She-Sheng Xue, Anais da XIth Brazilian School
of Cosmology and Gravitation, Rio de Janeiro, Brazil, 19-23 Jul 2004, a serem
publicados pela AIP em 2005, astro-ph/0503476.
[20] Black hole explosions, S. Hawking, Nature 248, 30 (1974).
[21] Ver por exemplo Introducción a la mecánica cuántica, L. de La Peña, Editora
FCE (1979).
[22] Experimental black hole evaporation, W. Unruh, Phys. Rev. Lett. 46, 1351 (1981).
[23] Artificial Black Holes, M. Novello, M. Visser e G. Volovik, World Scientific (2002).
[24] A nongravitational wormhole, F. Baldovin, M. Novello, S. E. Perez Bergliaffa, J.
Salim, Class. Quant. Grav. 17, 3265 (2000), gr-qc/0003075.
[25] Effective geometry, M. Novello, Santiago E. Perez Bergliaffa, Anais da Xth Brazil-
ian School of Cosmology and Gravitation Rio de Janeiro, Brazil, 29 Jul - 9 Aug
2002, publicados pela AIP Conf.Proc. 668, 288 (2003), gr-qc/0302052.
[26] Para uma introdução básica, ver por exemplo Fundamentals of Statistical and
Thermal Physics McGraw-Hill (1965).
[27] Strings, loops, and others: a critical survey of the present approaches to quantum
gravity, C. Rovelli, gr-qc/9803024.
[28] Ver por exemplo Black Holes: Classical Properties, Thermodynamics and Heuris-
tic Quantization, J. Bekenstein, Cosmology and Gravitation, M. Novello (ed.), At-
lantisciences, France,1 (2000), Black holes and information theory, J. Bekenstein,
Contemp. Phys. 45, 31 (2003), quant-ph/0311049.
261
[29] Production of black holes in Tev-scale gravity, A. Ringwald, Fortsch. Phys. 51,
830 (2003), hep-ph/0212342.
[30] Black Holes : The Membrane Paradigm, D. MacDonald, R. Price, and K. Thorne,
Yale U. Press (1986).
[31] Introduction to General Relativity, R. Adler, M. Bazin, e M. Schiffer, McGraw-
Hill, NY (1965).
[32] Dark energy stars, G. Chapline, astro-ph/0503200.
[33] Para uma discussão detalhada do problema das singularidades veja por exemplo
o capı́tulo 9 de General Relativity, R. Wald, The University of Chicago Press
(1984), ou a referência [37].
[34] Ver por exemplo Gravitational radiation, B. Schutz, gr-qc/0003069.
[35] Wormholes in spacetime and their use for interstellar travel: A tool for teaching
general relativity, M. Morris e K. Thorne, Am. J. Phys. 395 (1988).
[36] Agujeros Negros y Tiempo Curvo. El escandaloso legado de Einstein, Kip S.
Thorne, Ed. Crı́tica (1995).
[37] Para uma discussão do conceito de singularidade, e da sua história, veja Bangs,
Crunches, Whimpers, and Shrieks - Singularities and Acausalities in Relativistic
Spacetimes, J. Earman, Oxford U. Press (1995).
[38] Black Hole Physics - Basic Concepts and New Developments, V. Frolov e I.
Novikov, Springer (July 1998).
[39] A Relativist’s Toolkit: The Mathematics of Black-Hole Mechanics, E. Poisson,
Cambridge U. Press (2004).
[40] J. Bardeen, W. Press, e S. Teukolsky, Astrophys. J. 178, 347 (1972).
[41] Trust but verify: The Case for astrophysical black holes, Scott A. Hughes, Pro-
ceedings of 33rd SLAC Summer Institute on Particle Physics: Gravity in the
Quantum World and the Cosmos, p L006 (2005), hep-ph/0511217.
[42] Gravitation and Spacetime, Hans C. Ohanian e Remo Ruffini, W. W. Norton
(1994).
[43] B. Carter,Phys. Rev. 174, 1559 (1968).
[44] Para mais detalhes com relação à observação de buracos negros, veja R. Narayan,
New J. Phys.7, 199 (2005), gr-qc/0506078.
[45] Para uma introdução veja o livro Black Holes, White Dwarfs, and Neutron Stars:
the physics of compact objects, S. Shapiro e S. Teukolsky, Wiley (1983).
262
Capı́tulo 7
Astrofı́sica de Ondas Gravitacionais
Herman J. Mosquera Cuesta1
Em 1916, Einstein publicou sua teoria da gravitação : A Teoria Geral da Relatividade

(TGR). Essa teoria sugere que a estrutura fundamental do Universo é o espaço-tempo
(ST), uma espécie de tecido global (’substratum’) que contem tudo e interage com
tudo. Esta visão descreve a interação gravitacional entre corpos materiais, ou sim-
plesmente gravitação , como o resultado de um efeito geométrico que faz o ST sofrer
deformação , ou curvatura, ao serem colocadas nele distribuições de matéria como
galáxias, estrelas, planetas, etc. Se perturbada, esta curvatura produz uma onda de
espaço-tempo, ou uma onda gravitacional (OG). Assim, uma onda gravitacional é uma
onda de curvatura! (a curvatura é fraca longe da fonte, e muito intensa nas vizinhanças
dela). Uma OG é produzida ao ser acelerado um corpo material (uma massa qualquer)
ou energia. Neste capı́tulo, estudar-se-ão algumas das fontes astrofı́sicas destas OGs,
visando sua caracterização face a uma potencial detecção das mesmas com os mod-
ernos observatórios de OGs tais como LIGO, VIRGO, GEO-600), TAMA-300, já em
operação .
7.1 Introdução
Da mesma maneira que barcos navegando através do ocêano produzem ondas na água,
o movimento de massas, por exemplo estrelas ou buracos negros, produz OGs no
tecido do ST. Quanto mais maciço (massivo) for o corpo que se movimenta mais
poderosas serão as OGs por ele geradas, enquanto que objetos que se movimentam
1
Brazil.
263
Figura 7.1: Simulação da geração de OGs por um sistema binário de estrelas
tal como o pulsar de Taylor & Hulse PSR 1913 + 16. (Versão original do site
http://imagine.gsfc.nasa.gov/docs/features/topics/edge.html).
muito rapidamente produzirão também mais OGs durante um intervalo de tempo

determinado.
7.2 Geração de ondas gravitacionais na TGR
A Fı́sica básica necessária para se descrever consistentemente a geração de OGs na

TGR exibe uma grande similaridade com aquela correspondente ao electromagnetismo
na teoria de Maxwell. Isto é, as equações que regem esses fenômenos possuem carac-
terı́sticas muito semelhantes, e sua interpretação em termos de multipólos é também
bastante parecida, conforme veremos a seguir, guardadas as exceções próprias da na-
tureza tensorial da TGR e vetorial da teoria eletromagnética de Maxwell. Esta abor-
dagem, baseada nesta analogia segue um percurso análogo ao utlizado na principal
referência sobre o tema, o livro de S. L. Shapiro & S. A Teukolsky: The physics of
compacts objetcs (Wiley & Sons. New York, 1983)
No eletromagnetismo de Maxwell, a radiação multipolar de primeira ordem que é
emitida por uma distribuição não-relativı́stica de carga é radiação dipolar. Neste caso,
o potencial vetor no ‘gauge’ de Lorentz na zona de onda é dado por
1 d n r o
Aj (t, ~x) = dj t − , (7.1)
c r dt c
REFERENCIA??
onde r ≡ |~x|, e d~ é o momento de dipólo elétrico. Os campos elétrico e magnético
do tipo 1/r calculados a partir da fórmula dada pela Eq.(7.1) dependem somente
das componentes de d~ transversas à direção de propagação ~n = ~x/r, de maneira que
podemos substituir dj na Eq.(7.1) por sua parte transversa,
264
dTj ≡ Pjk dk , (7.2)
onde Pij é o tensor de projeção ,
Pjk ≡ δjk − nj nk . (7.3)
Assim, substituindo os campos E ~ e B~ obtidos da Eq.(7.1) (usando as equações de

Maxwell) na expressão para o vetor de Poynting, obtém-se a distribuição angular do
fluxo de energia dessa radiação eletromagnética, a qual é calculada usando a expressão
2 T 2 T
d2 E d (dj ) d (dj )

1
= 3
, (7.4)
dt dΩ 4πc dt2 dt2
2 !
d2 (dj ) d2 (dj ) d2 (dj )

1
= − nj . (7.5)
4πc3 dt2 dt2 dt2
A grandeza dj deverá ser avaliada no tempo retardado t − r/c. Se escolhermos o eixo

z ao longo de ~n, pode-se integrar facilmente a Eq.(7.5) sobre ângulos sólidos para se
obter a luminosidade eletromagnética de dipólo
d2 (dj ) d2 (dj )

dE 2
LEM ≡ = . (7.6)
dt 3 c3 dt2 dt2
Escrevendo dj = e xj para uma carga pontual, vemos que a equação acima é simples-
mente a fórmula de Larmor.
Entretanto, e sobre bases dimensionais, podemos esperar que o termo equivalente para
a emissão de radiação gravitacional (OG), isto é; o termo de primeira ordem no caso
das OGs emitidas por uma fonte com velocidades internas baixas deve ser igualmente
dipolar, isto é: 2
G d (dj ) d2 (dj )
LOG ∝ , (7.7)
c3 dt2 dt2
onde o momento de dipólo gravitacional de um sistema de A partı́culas é definido
como
X
dj = m A xA , (7.8)
A
onde fizemos a substituição e2 −→ Gm2 na Eq.(7.6). Assim sendo, a Eq.(7.8) produz
d2 (dj ) X d2 (mA xA
j )
X dPjA
= = , (7.9)
dt2 A
dt2 A
dt
onde P~ A é o momento linear da Aesima partı́cula. Uma vez que o momento total do sis-
d2 (d )
tema se conserva, i.e., dt2j = 0, então podemos concluir que não há radiação dipolar
na relatividade geral.
265
Retornando ao eletromagnetismo, as componentes de ordem superior de ra-
diação multipolar são o dipólo magnético e o quadrupólo elétrico. O momento de
dipólo magnético de ‘massa’ é definido como
1X A d~xA 1 X~A
~≡
µ ~x × (mA )= j , (7.10)
c A dt c A
onde ~j A é o momento angular da Aesima partı́cula. Ora, pela lei de conservação do

momento angular, µ ~ = 0: isto implica que não há radiação de dipólo magnético em
relatividade geral. O termo de ordem inferior que segue na expansão é o quadrupolo
elétrico. Desta maneira, o análogo da Eq.(7.1) para as OGs demonstra-se ser2
2 G d2 n ¯T T r o
hTjkT = I t − , (7.11)
r c4 dt2 jk c
onde r é a distância até a fonte, e I¯jk
TT
é o momento quadrupolar de massa definido
como
¯TT
X
A A 1 A 2
Ijk = mA xj xk − δjk (x ) . (7.12)
A
3
O superı́ndice TT
significa tomar a parte transversa-sem traço da grandeza I¯jk , isto é,
1
I¯jk
TT
= Pjl Pkm I¯lm − Pjk (Plm I¯lm ). (7.13)
2
Note, de passagem, que a Eq.(7.11) pode ser obtida diretamente como uma solução das
equações de Einstein linearizadas. Este procedimento é ilustrado mais adiante na
seção sobre OGs radiadas por pulsares acelerados. (Observe-se, ainda, que para esti-
mativas de ordem de magnitude podemos escrever a amplitude da OG como o escalar
r V 2
S p
h' , (7.14)
r c2
onde rS = GM/c2 é definido como o raio de Schwarzschild, associado com a massa

em movimento, e com distribuição de quadrupólo, e que possui uma velocidade car-
acterı́stica Vp .)
Entretanto, o fluxo de energia no caso da distribuição quadrupolar é dado pela com-
ponente (0, r) do tensor energia-momento
* +
1 G d(I¯jkTT
) d(I¯jk
TT
)
T0r = (7.15)
32π c4 dx0 dr
2
O procedimento correto para se obter esta expressão é um processo elaborado que exige, entre out-
ras várias etapas, linearizar as equações de Einstein, a implementação apropriada de várias (2) trans-
formações de calibres, demonstrar que a onda (perturbação hjk ) possui duas polarizações , além de ser de
natureza quadrupolar, transversal e sem-traço. Após a identificação destas propriedades, resta resolver
a equação de onda para uma distribuição de matéria cujo ’tensor de inércia’ é Ijk . Este procedimento
produz o resultado indicado pela equação 7.11. Tudo isto será descrito em detalhe na próxima seção .
266
Subtituindo a Eq.(7.11) na Eq.(7.15), obtemos as equações análogas das Eqs.(7.4,7.5)
* +
d3 (I¯jk
TT
) d3 (I¯jk
TT
2
dE G )
= , (7.16)
dt dΩ 8πc5 dt3 dt3
* 2 +
d3 (I¯jk ) d3 (I¯jk ) d3 (I¯ij ) d3 (I¯jk ) d3 (I¯jk )

G 1
= − 2ni nk + nj nk (7.17)
.
8πc5 dt3 dt3 dt3 dt3 2 dt3
Integrando sobre ~n, isto é, sobre a parte angular da radiação , obtém-se a luminosidade
emitida na forma de OGs
3 ¯
d (Iij ) d3 (I¯ij )

dE G
LOG ≡ = . (7.18)
dt 5 c5 dt3 dt3
Esta relação é conhecida como a fórmula de quadrupolo da relatividade geral, e é

válida para fontes em movimento lento (V c), e com campo gravitacional fraco,
isto é; potencial quase-newtoniano (Φ c2 ). Note que a anulação de LOG para fontes
esfericamente simétricas é um resultado geral, conhecido como o Teorema de Birkhoff.
1
No caso do eletromagnetismo, a fórmula análoga à Eq.(7.18) tem um coeficiente de 20
ao invés de 15 porque as ondas E-M estão associadas a campos vetoriais (ou de spin-1),
e não a campos tensoriais (ou de spin-2) como as OGs. Note, todavia, as unidades da
quantidade
−1
c5

G
L0 ≡ = = 3.6 × 1059 erg s−1 ! (7.19)
c5 G
Uma vez que conheçemos a massa M , velocidade caracterı́stica V e escala de tempo

dinâmica T , podemos definir a potência interna da fonte de OGs como
MV 2 Lint
Lint = −→−→−→ LOG ∼ Lint ! (7.20)
T L0
A força de reação de radiação correspondente à perda de energia descrita pela
Eq.(7.18) pode-se escrever como o gradiente de um potencial Newtoniano
G d5 (I¯jk )
F~ react = −m∇Φreact , Φreact = xj xk . (7.21)
5 c5 dt5
Assim, pode-se verificar que
dE X
= V~A · F~Areact (7.22)
dt A
2G d5 (I¯jk ) A
X
= − mA VAj 5 5
xk (7.23)
A
5c dt
G d5 (I¯jk ) d X
= − 5 5
mA xA A
j xk (7.24)
5 c dt dt A
G d5 (I¯ij ) d(I¯ij )
= − 5 , (7.25)
5 c dt5 dt
267
onde a última linha foi obtida depois de lembrar que I¯ij δij = 0, isto é, o tensor é de
traço nulo! Calculando a média sobre vários ciclos (para uma fonte periódica), ou
sobre um tempo longo comparado com a escala temporal dinâmica (para movimento
de fontes confinadas), nos permite integrar por partes, duas vezes consecutivas, para
assim transformar
d5 (I¯ij ) d(I¯ij ) d3 (I¯ij ) d3 (I¯ij )
−→−→−→ , (7.26)
dt5 dt dt3 dt3
e dessa forma recuperar o resultado da Eq.(7.18).
Um procedimento análogo ao de cima, permite mostrar que o momento angular car-
regado pelas OGs (i.e., conforme dissipado pela força de reação de radiação )
dJi X A(react)
= ijk xA
j Fk (7.27)
dt A
pode-se rescrever como

d2 (I¯jm ) d3 (I¯km )

dJi 2G
= − 5 ijk . (7.28)
dt 5c dt2 dt3
Note-se que se a fonte for axissimétrica ! o momento angular seria preservado, isto
é, nenhuma OG seria produzida por tal fonte. Este é também é um resultado geral
conhecido como Teorema de Birkhoff.
7.3 Linearização da TGR

Considere-se uma pequena perturbação métrica hµν sobre um S-T de fundo
minkowskiano
gµν = ηµν + hµν , |hµν | ≡ h << 1 , (7.29)
na qual definiu-se o tensor
hµν ≡ η αµ η βν hαβ , (7.30)
tal que
(ηµν + hµν ) η αβ − hαβ

= (7.31)
ηµα η αβ − ηµα hαβ + hµα η αβ = δµβ . (7.32)
Para se obter uma teoria linearizada da TGR, começamos por definir o sı́mbolo de
Christoffel
1
Γαβν = g ασ (gσβ,ν + gνσ,β − gβν,σ ) . (7.33)
2
Substituindo a Eq.(7.29) na Eq.(7.33) obtém-se
Γαβν = (η ασ − hασ ) {hσβ,ν + hνσ,β − hβν,σ } (7.34)

1 α
h β,ν + hα ν,β h − h,α

= βν . (7.35)
2
268
CORREGIR
Ora, das seções anteriores, a definição do tensor de Riemann no referencial inercial
(no qual as Γs são nulas, mas não suas derivadas) é
Rµ ναβ = Γµ νβ,α − Γµ να,β

1 µ
hβ,να − hµα ,νβ − h,µ ,µ

= νβα + hναβ , (7.36)
2
CORREGIR podemos substituir a Eq.(7.35) na Eq.(7.36). Este resultado pode ser então
levado ao tensor de Riemann (note que o traço e o operador D’Alembertiano são dados,
respectivamente, por
hµ µ,νβ = h,νβ (7.37)

h,µ
νβ µ = hνβ . (7.38)
)
CORREGIR
Rµ νµβ = Rνβ (7.39)

= Γµ νβ,µ − Γµ νµ,β (7.40)
1 µ
hβ,νµ + hµν,µβ − hµµ,νβ − h,µ

= νβµ (7.41)
2
1 µ
hβ,νµ + hµν,µβ − h,νβ − hνβ .

= (7.42)
2
Finalmente, pode-se calcular o escalar de curvatura a partir da expressão

1 νµ
h,νµ + hµν ν ν

R = ν,µ − h,ν − hν (7.43)
2
1
= (2hµν ,µν − 2h)
2
= (hµν ,µν − h) . (7.44)
As expressões assim obtidas podem ser substituidas nas equações de campo, as quais
tomam a seguinte forma
1
Rµν − gµν R = 8πTµν (7.45)
2
1 α 1
hν,µα + hαµ,αν − h,µν − hµν − hµν

,µν − h gµν =
2 2
1h α i
hν,µα + hαµ,αν − h,µν − hµν − ηµν hαβ,αβ − h = 8πTµν . (7.46)
2
A Eq.(7.46) constitui a realização do processo de linearização da TGR. Ela descreve a
propagação de OGs cuja fonte (distribuição de matéria-energia) é bem caracterizada
pelo tensor Tµν .
269
7.3.1 A transformação de calibre
Ao analisar a estrutura da Eq.(7.46) vemos que esta possui um número grande

de termos que são combinações diversas dos sub-ı́ndices que definem o tensor per-
turbação hµν . Isto sugere que deve existir uma maneira de reduzir ao mı́nimo esta
expressão. Este procedimento se conhece como uma transformação de calibre. Assim,
sob uma transformação infinitesimal de coordenandas na qual 3
0
xα −→ x µ = xµ + ξ µ , (7.47)
as equações da TGR linearizada passam a ser

∂x0α
Λ0µ β = (7.48)
∂xβ
∂xα ∂ξ α
= +
∂xβ ∂xβ
= δ β + ξ µ ,β .
α
(7.49)
Portanto,
xα = x0α − ξ α , (7.50)
do qual se segue que
∂xα
Λαβ0 =
∂x0β
∂
= (x0α + ξ α )
∂x0β
∂ξ α
= δ α β − 0β
∂x
µ
∂x ∂ξ α
= δβα − 0β µ
∂x ∂x
∂ ∂ξ α
= δβα − 0β (x0µ − ξ µ ) µ
∂x ∂x
= δ α β − ξ α 0β . (7.51)
Nesta expressão, termos de ordem superior em foram desprezados. Assim, lembrando

0
que gµν transforma segundo a regra
0 ∂xα ∂xβ
gµν = gαβ
∂x0µ ∂x0ν
= gµν − 2ξ(µ,ν) (7.52)
podemos mostrar que a perturbação pode se escrever como
h0µν = hµν − 2ξ(µν) . (7.53)
Agora, pela analogia com o electromagnetismo dsiscutida acima, podemos propor a

seguinte transformação de calibre4 :
1
ψµν ≡ hµν − ηµν h , (7.54)
2
3
Esta transformação é gerada por um vetor ξ µ cujás componentes são funções da posição, tal que ξ µ
é suficientemente pequeno, isto é, |ξ α ,β | 1.
4
Note que ψ ≡ −h
270
do qual segue-se que o tensor de Ricci passa a ter a forma
1 α
ψ ν,µα + ψ αµ,αν − hµν ,

Rµν = (7.55)
2
enquanto que o escalar de curvatura resulta ser
1 να

R= 2ψ,αν − h . (7.56)
2
Desta maneira, o tensor de Einstein passa a ser escrito como
1 α
+ ψα − ψµν − ηµν ψ αβ

Gµν = ψ ν,µα µ,αν ,αβ (7.57)
2
A Eq.(7.57) pode ser então reduzida a uma equação de onda se impusermos a condição
que
ψ µ ν,µ = 0 , (7.58)
ou equivalentemente
1
hµν,µ = h,ν . (7.59)
2
CORREGIR
O calibre definido pela Eq.(7.59) é conhecido como calibre de Einstein, Hilbert, de
Donder, ou Fock. É interesante notar como muda este calibre sob uma transformação
de coordenadas do tipo
hµν −→ h0µν = hµν − 2ξ(µ,ν) . (7.60)
O calibre da Eq.(7.59) neste caso toma forma
0
ψµν = ψµν − 2ξ(µ,ν) + ηαβ ξ µ ,µ . (7.61)
Desta maneira, a nova variável ψ 0µν se transforma em
ψ 0µ ν = ψµ ν − 2ξ µ( , ν) + δ µν ξ σ ,σ . (7.62)
a qual após uma primeira derivação respeito de xµ torna-se
ψ 0µ ν,µ = ψ µν,µ − ξν . (7.63)
Portanto, essa transformação deixa o calibre invariante se fizermos a seguinte escolha
ψµ ν,µ = ξν . (7.64)
A Eq.(7.64) não fixa o calibre univocamente visto que sempre poderemos realizar
transformações adicionais com a outra parte da igualdade, isto é, com ξµ , o que
permitirá manter ψ µν,µ do jeito que era.
Desta maneira, as equações de Einstein em presença de matéria tomam a forma
ψµν = −16πTµν ,
(7.65)
271
enquanto no vácuo escrevem-se
hµν = 0 . (7.66)
Podemos propor uma solução de onda para a Eq.(7.66) do seguinte tipo
α
ψµν = Aµν eikα x , (7.67)
onde o quadri-vetor kα respresenta as componentes constantes de algum tipo de 1-
forma, e Aµν define as componentes constantes de algum tensor simétrico. Assim
sendo, a Eq.(7.66) pode-se escrever na seguinte forma
kα k α ψ µν = 0 . (7.68)
Esta condição só pode ser satisfeita se kα k α = 0, isto é, se kα é um vetor nulo. Portanto,
para um valor de xν k ν constante teremos uma hipersuperficie em que hµν é constante,
tal que
kα xα = k0 t − kx = constante . (7.69)
Por convenção , passaremos a nos referir a k0 como a frequência da onda após a
decomposição (3+1) espaço-temporal
kα −→ (ω, k) . (7.70)
Uma vez que o vetor kα é nulo, nos temos
k α kα = k 0 k0 − k i ki = 0
k 0 k0 = k i ki
ω 2 = |k|2 . (7.71)
Esta equação define a relação de dispersão para essa onda. Note ainda que a velocidade
de fase da onda é c = 1! (nestas unidaes), bem como sua velocidade de grupo.
7.4 Mais um vı́nculo

As equações de Einstein assumem a forma ψ αβ = 0 se nos impôrmos sobre o termo
ψ αβ mais uma condição de calibre do seguinte tipo
ψ µν ,ν = 0 . (7.72)
Este nos conduz a
kµ Aµν = 0 . (7.73)
A Eq.(7.73) implica que kµ é ortogonal a Aµν . Isto, por sua vez, impõe também uma
α
restrição sobre a amplitude da onda. A solução Aµν expixα k é chamada uma onda
plana. Os teoremas oriundos da análise de Fourier indicam que qualquer solução ao
conjunto de equações
ψ µν = 0
ψ µν ,ν = 0 (7.74)
é uma superposição de soluções do tipo onda plana.
272
7.4.1 O calibre transverso-sem-traço
Até agora só impusemos uma restrição sobre a Eq.(7.66). Portanto, se lembrarmos
agora que a outra parte da restrição tinha relação direita com o vetor ξ, o qual satisfaz
uma equação de campo igual á Eq.(7.66), podemos então impôr algum outro tipo de
restrição sobre o próprio vetor ξ. Desta maneira,
ξµν = 0. (7.75)
Para resolver esta equação podemos escolher uma solução da forma

α
ξµ = Bµ expikα x , (7.76)
onde kα é um vetor de onda nulo, e Bµ é uma constante. Viu-se acima que isto produz
uma mudança em hµν dada por
h0µν = hµν − ξµ,ν − ξν,µ , (7.77)
e consequentemente uma mudança em ψµν , levando-o á forma
0
ψµν = ψµν − ξµ,ν − ξν,µ + ηµν ξ α ,α . (7.78)
Retornando á Eq.(7.76) e substituindo obtemos
A0µν = Aµν − Bµ kµ + ηµν B α kα . (7.79)
Se escolhermos Bµ de tal maneira que possamos impôr sobre Aµν o seguinte par de
restrições
Aµµ = 0 −→ sem-traço (7.80)

Aµν uν = 0 −→ transverso, (7.81)
onde uν é um quadri-vetor velocidade fixo, isto é, qualquer vetor tipo-tempo unitário
que nos quisessemos escolher.
O conjunto de equações (7.80,7.81) é chamado vı́nculo transverso-sem-traço, ou T T .
Notemos que tanto a condição do traço nulo bem como a Eq.(7.54) implicam que
1
ψµν = hµν − ηµν h
2
TT TT TT
ψµν = hµν = hµν . (7.82)
Retornando ao referencial de Lorentz, no “background” do espaço-tempo de

Minkowski, onde o vetor uµ tem a forma uµ = δ0µ , vê-se que a Eq.(7.81) implica
que
Aα0 = 0 , ∀α! (7.83)
273
Neste referencial vamos escolher o eixo ordenado z tal que
k −→ (ω, 0, 0, ω) . (7.84)
Assim, a Eq.(7.73) implica que

Aαz = 0; ∀α! (7.85)
A expressão anterior dá origem ao rótulo “transverso” para o calibre! Isto é, Aµν não
tem qualquer projeção sobre a direção do eixo z. As restrições anteriores significam
que as componentes Axx , Axy , Ayx e Ayy são não-nulas. Além disso, a condição de
traço-nulo implica que
Aµ ν = 0
Ax x + Ay y = 0
Axx = −Ayy . (7.86)
Desta maneira, podemos escrever o tensor de perturbação Aµ ν em forma matricial

 
0 0 0 0
 0 A Axy 0 
xx
ATµνT =  .
 
 0 Axy −Axx 0 
0 0 0 0
Analisando esta matriz vemos que só duas de suas componentes são linearmente in-
dependentes.
Consideremos a seguir o que aconteceria a uma partı́cula que fosse atingida por uma
onda gravitacional na TGR, no caso uma onda se propagando na direção do eixo z.
Vamos supôr que a partı́cula está inicialmente em uma região livre de ondas. Se escol-
hermos o referencial de Lorentz, no qualÂ a partı́cula está inicialmente em repouso, o
calibre T T associado a este sistema de referência cuja quadri-velocidade é uα , será tal
que a partı́cula obedece a equação geodésica para uma partı́cula livre, i. e.,
duα
+ Γα µν u
µ ν
u = 0. (7.87)
dτ
Lembrando que a partı́cula esta inicialmente em repouso, segue-se que
α
du
= −Γα µν δ0µ δ0ν (7.88)
dτ τ =0
1
= −Γα 00 = − η αβ (hβ0,0 + h0β,0 − h00,β ) , (7.89)
2
mas sabemos também que A0α=0 , portanto
α
du
= 0. (7.90)
dτ τ =0
Isto significa que a partı́cula sempre permanecerá em repouso uma vez que tal
condição seria mantida para qualquer outro instante de tempo. Entretanto, embora
274
estar em repouso signifique que a partı́cula mantém sua posição coordenada constante
com tempo, não podemos dar uma interpretação simples a tal fato já que ao fazermos
a escolha do calibre T T nos definimos um sistema coordenado que permanece fixo ás
partı́culas, individualmente.
Para se ter uma melhor idéia do que acontece, vamos considerar duas partı́culas (ambas
em repouso): uma na origem do sistema coordenado e a outra na posição x = . Além
disso, vamos supôrÂ que y = z = 0. Portanto, ambas as partı́culas estarão fixas
em suas posições coordenadas, do qual segue-se que sua distância média é dada pela
relação

1 1 k
∆l = |gxx (x = 0) | 2 = (1 − khxx ) 2 = 1 − Axx cos (ωt) . (7.91)
2
Isto mostra que a distância própria entre as duas partı́culas muda com o tempo.
As partı́culas permanecem em repouso relativo respeito de suas coordenadas, mas as
coordenadas mesmas oscilam em relação a uma fita métrica.
Uma maneira alternativa de se entender este proceso seria observar o desvio geodésico
entre as duas partı́culas, quando conectadas por um vetor ξ µ (sendo µ = 0, 1, 2, 3 ou
t, x, y, z ) que obedece a equação
d2 ξ α
= Rα µνβ u
µ ν β
u ξ . (7.92)
dτ 2
Neste caso, esta caracterı́stica pode se escrever ξ β −→ (0, , 0, 0), e portanto
d2 ξ
= Rα 00α ξ
α
= −Rα 0α0 ξ
α
= −Rx 0x0 . (7.93)
dτ 2
Lembrando a (Eq.7.36) temos que
1 T
Rx 0x0 = Rx0x0 = − hTxx,00 (7.94)
2
1 TT
Ry 0x0 = Ry0x0 = − hxy,00
2
1 T
Ry 0y0 = Ry0y0 = −Rx0x0 = − hTyy,00 , (7.95)
2
o qual indica que as partı́culas afastadas ao longo do eixo x tem um vetor deslocamento
ξ µ que satisfaz a relação
d2 ξ α ∂ 2ξ1 1 ∂ 2 hxx
= =
dτ 2 ∂t2 2 ∂t2
∂ 2ξx 1 ∂ 2 hxy
= (7.96)
∂t2 2 ∂t2
Entretanto, se as partı́culas estivessem afastadas ao longo do eixo y teriamos que
∂ 2ξ2 1 1 ∂ 2 hxx
= hyy = −
∂t2 2 2 ∂t2
∂ 2ξy 1 ∂ 2 hyx
= . (7.97)
∂t2 2 ∂t2
275
Figura 7.2: Deformação sofrida por um “anel” de partı́culas em repouso quando é atingido
por uma onda gravitacional.
7.5 Polarização de Ondas Gravitacionais
O formalismo descrito acima pode nos ajudar a descrever a polarização da onda grav-
itacional. Para tal feito, consideremos um anel de partı́culas inicialmente em repouso
no plano x, y. Neste caso, h21 = hxy = h12 = 0, e o elemento de linha será
ds2 = dt2 − (1 + hxx ) dx2 − (1 − hxx ) dy 2 . (7.98)
Observemos o que acontece com as duas partı́culas que inicialmente tem coordenadas
(x0 , y0 ) e (x0 + dx, y0 ). Tomando o elemento de linha
ds2 = − (1 + hxx ) dx2 , (7.99)
e considerando hxx como uma função oscilatória, vemos que quando hxx passa de
hxx = 0 para hxx ≥ 0, as partı́culas se afastam entre si, e viceversa, quando hxx
passa de hxx = 0 para hxx ≤ 0, elas tendem a se juntar. Uma situação análoga
deverá acontecer se considerassemos as partı́culas com (x0 , y0 + dy). Assim, se uma
onda plana propaga-se na direção z, e incide sobre um anel de partı́culas no plano
x, y, o anel vai se distorcer formando uma elipse pulsante cujo eixo maior gira até
ficar paralelo inicialmente ao eixo x, e posteriormente ao eixo y. Define-se este tipo de
polarização como polarização +.
Analisemos agora o que acontece quando hyx = hxy = h12 = h21 6= 0. Neste caso, o
elemento de linha é
ds2 = dt2 − dx2 − dy 2 − dz 2 + 2hxy dxdy. (7.100)
Efetuando uma transformação de coordenadas que faz rodar os eixos coordenados por
276
π/4 radianos no plano x, y obtemos
1
y −→ y 0 = √ (y + x)
2
1
x −→ x0 = √ (y − x) . (7.101)
2
de forma que o elemento de linha passa a ser
Figura 7.3: Polarização de ondas gravitacionais. Modo + á esquerda e modo × á direita.
ds2 = dt2 − (1 + hxx ) dx2 − (1 − hxx ) dy 2 − dz 2 . (7.102)
Comparando este com o elemento de linha da Eq.(7.99) percebe-se que são os mesmos
elementos de linha, e que por tal motivo causam idênticos efeitos que hxx , mas após
uma rotação de 45 graus dos eixos coordenados, ou equivalentemente, a uma defasagem
de π/4. A este tipo de polarização se denomina polarização ×.
Para concluir, note-se que uma onda gravitacional é em geral uma superposição dos
dois modos de polarização + e ×.
7.6 Ondas gravitacionais emitidas por massas acel-

eradas: Pulsares
7.6.1 OGs a partir de pulsares accelerados na Galáxia
Para se descrever a emissão de OGs durante a fase de impulsão inicial de pulsar, que é
acelerado a alta velocidade na Galáxia, durante por exemplo, uma explosão supernova,
podemos começar por linearizar as equações de Einstein (conforme a gente viu acima)
Gµν = −kTµν ; (7.103)
onde Gµν e Tµν são, respectivamente, os tensores de Einstein e de matéria-energia, e

k é uma constante. Uma vez que o campo gravitacional, ou perturbação , gerado pelo
277
deslocamento do pulsar é fraco (devido a sua baixa velocidade: VPSR c), pode-se
usar então a expansão métrica
gµν ' ηµν + hµν , (7.104)
onde ηµν define a métrica de Minkowski, e hµν << 1 representa a perturbação do

espaço-tempo produzida pelo lançamento com movimento ‘tipo-foguete’ de um pulsar
especı́fico.
Doravante usar-se-á a métrica gµν com a assinatura (−+++), coordenadas cartesianas
rλ = (t, ri ), onde ri = x1 = x, x2 = y, x3 = z, e também unidades geométricas nas
que G = c = 1, de maneira que a constante acima k = 8π. Desta forma, no ‘gauge’
harmônico (ou de de Donder)
h̄αν0ν = 0, (7.105)
obtemos
2h̄µν = h̄µν0 ββ = 16πTµν , (7.106)
onde
1
h̄µν = hµν − ηµν hαα . (7.107)
2
O pulsar é imaginado daqui para frente como sendo uma ‘partı́cula’ de massa M?
movendo-se ao longo de uma linha-mundo rλ (τ ) (com τ sendo o tempo próprio) e
possuindo um tensor energia-momento
Z
Tµν (x) = M? Vµ Vν δ (4) [x − r(τ )] dτ , (7.108)
onde V α = drα /dτ é o 4-vetor velocidade da partı́cula. Note que os super/[sub])-

ı́ndices são subidos[baixados] com a métrica de Minkowski ηµν ). Substituindo este
tensor energia-momento na Eq.(7.106) nos conduz à solução retardada (uma general-
ização da solução de Lienard-Wiechert do eletromagnetismo)
Vµ (τ )Vν (τ )
h̄µν = 4 M? . (7.109)
−Vλ · [x − r(τ )]λ τ =τ0
Este resultado deve ser avaliado no tempo retardado, o qual corresponde ao tempo
de interseção de rα (τ ) com o cone-de-luz passado do observador. Note que é este
fator −Vλ · [x − r(τ )]λ ; que depende da velocidade no denominador da Eq.(7.109),
que é responsável pela caracterı́stica da amplitude de ser não-evanescente, a chamada
“memória” do sinal de OG produzido pelo lançamento do pulsar à sua trajetória atual.
Esta perturbação métrica pode ser rescrita no ‘gauge’ de Lorentz, passando a ter a
forma
1
hµν = h̄µν − ηµν h̄αα ; (7.110)
2
ou equivalentemente

4 M? 1
hµν = Vµ (τ )Vν (τ ) + ηµν . (7.111)
−Vλ · [x − r(τ )]λ 2
278
Figura 7.4: Sinais de OG emitidos: a) durante a aceleração de um pulsar e b) na ocorrência
de um ‘gamma-ray burst’. Compara-se a distribuição com o ângulo de visada do sinal de
OG produzido durante a fase inicial de aceleração de um pulsar (linha tracejada –verde),
com parâmetros: V?ave = 450 km s−1 , e distância = 10 kpc, com o sinal de OG produzido
por um ‘gamma-ray burst’ (linha sólida–vermelha), como uma função do ângulo que o
jato forma com a linha de visada, e com parâmetros: Eave = 1051 erg, γ = 100, à distância
= 1 Mpc. Notável resulta a localização do máximo em cada curva.
A Eq.(7.111) deve finalmente ser rescrita no ‘gauge’ transverso, sem-traço (T T ), isto

é; hµν −→ hTµνT ; que é o mais apropriado para se discutir a resposta do detector de OGs
ao sinal. Este procedimento leva ao resultado apresentado na Eq.(7.112), abaixo. Uma
análise mais detalhada [ver Refs. [?, ?])] mostra que a deformação máxima da OG no
detector é obtida para um vetor de onda, ~n, que seja ortogonal ao braço do detector.
Neste caso, a amplitude de OG gerada pela impulsão abrupta do pulsar (limite não
relativı́stico) resulta ser (unidades c.g.s. reinseridas)
Z θV
γ M? β 2 sen3 θsen2∆φ

G
hmax = 2 2 dθ , (7.112)
c 0 D? ∆Ω(1 − β cos θ)

onde ∆Ω ' π(∆θ)2 , ∆φ = cos−1 cos ∆θ−cos θV cos θ
senθV senθ
, β = |~v |/c, com |~v | a velocidade 3-
D do pulsar, tal grandeza é definida como: V?fin (t), θ o ângulo entre ~v e ~n (isto é; ~v ·~n =
V?fin (t) cos θ), D? a distância ao pulsar, e γ o fator de Lorentz; o qual pode ser suposto
neste caso igual a 1 porque V?fin (t) c. O resultado mostrado na Fig.7.4, estabelece
que a perturbação de OG do espaço-tempo não é fortemente colimada na direção para
frente ~n, como é o caso da radiação eletromagnética. Contrariamente a esta última,
a perturbação métrica no limite ultra-relativı́stico (não aplicável aos RAPs) tem uma
dependência direcional que é proporcional a 1+cos θ. Num tal caso, devido o forte efeito
de colimação como nos ‘gamma-ray bursts’; por exemplo, a radiação eletromagnética
emitida pela fonte durante o mesmo intervalo de tempo é visı́vel somente dentro do
pequenı́ssimo ângulo sólido (θ ∼ γ −1 )2 , enquanto que o sinal de OG é observável
dentro de um ângulo sólido maior: quase 2π radianos (ver Fig.7.4). Além do que, a
279
frequência observada da OG é deslocada para o azul na direção para diante, e portanto
o fluxo de energia carregado pelas OGs é também colimado na direção para frente.
Ainda mais notável, no caso dos RAPs, é que o sinal de OG terá seu máximo para
ângulos de visada θ ∼ π/2, isto é, para o movimento do pulsar puramente no plano
do céu, conforme ilustrado na Fig.7.4.
Figura 7.5: Sensibilidades do LIGO I e de sua versão avançada, comparadas com as

caracterı́sticas do sinal de OG produzido por cada um dos 153 pulsáres que perambu-
lam pela nossa galáxia, para os quais conhecemos suas atuais velocidades e distâncias.
Pode-se verificar que muitos (∼ 45) destes sinais individuais serão detectáveis pela con-
figuração avançada do observatório LIGO.
7.7 Ondas gravitacionais emitidas por sistemas

binários
Considere primeiro o caso de duas massas pontuais M1 e M2 em uma órbita circular de
raio a (ver Figura 7.7), por exemplo uma estrela compacta ao redor de sua companheira
orbital. Se a1 e a2 são suas distâncias ao centro de massa, então
M1 a1 = M2 a2 = µa, (7.113)
onde definiu-se
M1 M2
µ≡ , (7.114)
M1 + M2
como a massa reduzida do sistema binário. Se o eixo z for o eixo de rotação , e φ
o ângulo azimutal medido desde o eixo x à linha que une as massas, então podemos
escrever
I¯xx = M1 a21 + M2 a22 cos2 φ + Constante.

(7.115)
Aqui usamos a convenção de que Mi a21 /3, i = 1, 2 é uma ‘Constante’ para cada
partı́cula. A Eq.(7.115) pode-se rescrever também como
1
I¯xx = µa2 cos 2φ + Constante. (7.116)
2
280
Figura 7.6: Descrição esquemática da órbita de um pulsar binário. ([7](Site
http://astrosun2.astro.cornell.edu/academics/courses/astro201/psr1913.htm).
Similarmente,
1
I¯yy = − µa2 cos 2φ + Constante. (7.117)
2
1
I¯xy = I¯yx = µa2 sen2φ. (7.118)
2
Visto que φ = Ωt, onde ω é a frequência angular orbital, encontramos usando a terceira
lei de Kepler,
GM
Ω2 = 3 , com M ≡ M1 + M2 , (7.119)
a
que a luminosidade em OGs emitida pelo sistema vem dada por
3 ¯
d (Iij ) d3 (I¯ij )

G
LOG = (7.120)
5 c5 dt3 dt3

G 6 1 2
= 5
(2Ω) µa sen2 2Ωt + sen2 2Ωt + 2 cos2 2Ωt (7.121)
5c 2
32 G4 M 3 µ2
= . (7.122)
5 c 5 a5
A perda de energia leva a um decréscimo da separação a e portanto um decréscimo

no perı́odo orbital P ≡ 2π/Ω. Lembrando que a energia é

1 GM1 M2
E = M1 a1 + M2 a2 Ω2 −
2 2
, (7.123)
2 a
1 GµM
= − , (7.124)
2 a
temos que
1 dP 3 da
= , (7.125)
P dt 2a dt
3 1 dE
= (7.126)
2a E dt
96 G3 µM 2
= − . (7.127)
5 c 5 a4
281
Com base na análise precedente pode-se demonstrar que as relações acima são válidas
quando a −→ 0, de maneira que o tempo T0 transcorrido até a −→ 0 é dado por
(Peters & Mathews 1964)
5 c5 a4atual
T0 = . (7.128)
256 G3 µM 2
Entretanto, usando a Eq.(7.28), que define o momento angular radiado na forma de
OGs, pode-se mostrar que para órbitas circulares
dJ 32 G7/2 µ2 M 5/2
=− , (7.129)
dt 5 c5 a7/2
de maneira que a perda de energia e de momento angular satisfazem a condição
dE dJ
=Ω . (7.130)
dt dt
Esta última relação indica que uma órbita circular permanece circular enquanto as
estrelas do sistema binário se aproximam entre si.
Por outro lado, se as duas massas estão em órbita elı́ptica com excentricidade e, e se
calcularmos a média das grandezas dE
dt
e dJ
dt
, para uma única órbita, obtemos (Peters
& Mathews 1964)
dE dE
= f (e), (7.131)
dt dt e=0
dJ dJ
= g(e), (7.132)
dt dt e=0

73 2 37 4 −7/2
f (e) = 1+ e + e 1 − e2 , (7.133)
24 96

7 2 −2
g(e) = 1+ e 1 − e2 . (7.134)
8
Uma vez que as Eqs.(7.119) e (7.123) são válidas para órbitas elı́pticas, a Eq.(7.125)
se transforma em
1 dP 96G3 µM 2
=− 5 f (e). (7.135)
P dt 5c a4
7.8 Taylor & Hulse: Um prêmio Nobel pelas OGs

do pulsar binário PSR 1913 + 16
Atualmente, a evidência mais forte da existência das ondas gravitacionais proviene dos
estudos da órbita do primeiro pulsar binário descoberto em observações astronômicas.
Este feito foi logrado por J. Taylor & R. Hulse em 1974. O sistema hoje é chamado o
pulsar de Taylor & Hulse ou PSR 1913 + 16 (suas coordenadas celestes).
Imediatamente após sua descoberta, estes pesquisadores perceberam que mudanças
aparentes na frequência do pulsar poderiam ser explicadas pelo efeito Doppler devido
282
ao movimento orbital ao redor de uma companheira invisı́vel com perı́odo de 7h:45’. A
presença de um relógio de altı́ssima precisão, o pulsar, movendo-se a uma velocidade
de ∼ 300 km s−1 através do campo gravitacional da companheira causou uma ‘onda’
de atividade na comunidade relativı́stica. A Natureza teria fornecido um sistema as-
trofı́sico no qual poderiam se testar, muito além dos limites fornecidos pelos estudos
de dinâmica pós-newtoniana (PPN) no Sistema Solar, vários outros efeitos previstos
pela TGR. Na prática, estes efeitos são procurados através do estudo dos tempos de
chegada dos pulsos emitidos pelo pulsar.
Para entendermos melhor esta análise, suponhamos que M1 seja a massa do pulsar e
M2 a de sua companheira. Se supormos que eles são astros esféricos, então na ordem
mais baixa (gravidade Newtoniana) eles se movem em órbitas elı́pticas ao redor de
seu centro de massa comum. Se supormos que a órbita está no plano x − y, com sua
origem no centro de massa, a inclinação do plano orbital em relação à linha de visada
será i. Podemos ainda supôr que o eixo x está orientado ao longo da linha de nós, ou
seja, a linha que passa através da origem ao longo da intersecção do plano orbital com
o plano perpendicular à linha de visada (ver Figura 7.7). Seja ω a distância angular do
periastro a partir do nó, medido no plano orbital. Com estas definições , a posição do
pulsar a qualquer instante é dada por
x = r1 cos φ, y = r1 senφ, (7.136)
onde
a1 (1 − e2 )
ψ = ω + φ, r1 = . (7.137)
1 + e cos φ
O ângulo φ, a coordenada polar medida a partir do periastro, é chamada de anomalia
verdadeira, na mecânica celeste.
A razão entre o perı́odo emitido pelo pulsar e aquele recebido pelo observador, pode-se
escrever como
∆t|rec ∆t|rec ∆t|stat

= , (7.138)
∆t|em ∆t|stat ∆t|em
onde o subı́ndice ‘stat’ denota um observador na posição do pulsar, que é estacionário

com relação ao centro de massa. suponha de momento que o receptor na Terra, é
também estático com relação ao centro de massa. Assim, se r é a distância entre M1
e M2 , então
−1
∆t|rec GM2
= 1− , (7.139)
∆t|stat rc2
pela definição do deslocamento para o vermelho ou ‘redshift’. A fórmula Doppler dá
−1/2 " #
V12 V~1 · ~n

∆t|stat
= 1− 2 1+ , (7.140)
∆t|rec c c
283
Figura 7.7: Órbita do Pulsar Binário PSR J0737-3039A,B conforme vista da Terra. Note
que o pulsar binário PSR 1913+16 apresenta uma configuração similar, mas sua geome-
tria é muito diferente. [Original de Dunc Lorimer, in the 19th European Cosmic Rays
Symposium (10/09/2004)].
284
onde ~n é um vetor unitário que aponta da terra ao emissor. Assim, a Eq.(7.138) se
transforma (até ordem (V 2 )) e (M/r)) em
" #
∆t|rec ~
V1 · ~n 1 V12 GM2
= 1+ + + . (7.141)
∆t|em c 2 c2 rc2
Agora, note que da Figura 7.7 se tem ~n = ~ez0 = cos i~ez + seni~ey . Desta forma, a
Eq.(7.136) conduz a
V~1 · ~n = (r1 senψ + r1 ψ̇ cos ψ)seni. (7.142)
Usando a Eq.(7.137) e a segunda lei de Kepler, esta última escrita na forma

2π
φ̇ = 2 3/2
(1 + e cos φ)2 , (7.143)
P (1 − e )
encontra-se, depois de um pouco de algebra simples, que
V~1 · ~n = K{cos(ω + φ) + e cos ω)2 }, (7.144)
onde
2πa1 seni
K≡ . (7.145)
P (1 − e2 )1/2
A análise apresentada até agora é exatamente a mesma que é feita para uma binária
espectroscópica de uma ‘única-linha’, com a importante diferença de que ∆t|em , não
sendo de uma linha espectral, não resulta ser conhecido. Assim, qualquer termo con-
stante do lado direito da Eq.(7.141) não é mesurável: ele é simplesmente absorbido em
∆t|em . Em particular, uma velocidade uniforme entre o centro de massa do sistema
solar e o centro de massa do pulsar não é mesurável. (O movimento orbital da Terra
introduz um efeito Doppler que deve ser substraı́do usando a velocidade, conhecida,
da Terra no sistema solar).
A partir do termo Doppler de primeira ordem, os seguintes parâmetros podem ser
encontrados: e e P através da Eq.(7.143), que quando integrada dá φ(t), e também K
e ω a partir dos dois termos independentes, que variam com o tempo, proporcionais
a cos φ e senφ na Eq.(7.144). A partir de K obtém-se a1 seni, e a partir de P e a1 seni
se obtém a função de massa introduzida no Cap.??, Sec. 9.7 .
(M2 seni)3 (a1 seni)3

2π 2
f (M1 , M2 , i) ≡ = ( ). (7.146)
(M1 + M2 )2 G P
Devido a alta precisão do acompanhamento temporal de evolução do pulsar (‘pulsar

timing’) os termos de deriva Doppler transversa e redshift gravitacional na Eq.(7.141)
podem ser medidos. Encontra-se que
V12 = ṙ12 + r12 ψ̇ 2 (7.147)

2
2π 2 a1
= ( ) (1 + 2e cos φ + e2 ), (7.148)
P 1 − e2
285
e também
GM2 GM22
= . (7.149)
r (M1 + M2 )r
Além do que, pela terceira lei de Kepler
2π 2 GM23
( ) = , (7.150)
P (M1 + M2 )2 a31
obtém-se
1 2 GM2
V + = β cos φ + Constante, (7.151)
2 1 r
onde foi definido
GM22 (M1 + 2M2 ) e
β≡ . (7.152)
(M1 + M2 )2 a1 (1 − e2 )
Note que o teorema do virial implica que só mais uma nova variável apareceria se
usarmos o redshift gravitacional e o efeito Doppler, ambos de segunda ordem. Contudo,
note -se que a dependência temporal na Eq.(7.151) é exatamente a mesma daquela do
termo de primeira ordem K cos ω cos φ na Eq.(7.144). Mais peculiar ainda, note que
para movimento elı́ptico o parâmetro β não é mensurável! E então, como fica esta
questão ?
Felizmente, a relatividade geral salva a gente desta ‘encrucilhada’ ! A órbita não é
exatamente uma elipse. Ela ‘deriva’ ou precessiona! com o avanço do periastro sendo
dado por
6πGM2
ω̇ = . (7.153)
a1 (1 − e2 )P c2
A média de ω̇ é ∼ 4.20 por ano para o pulsar binário. Este valor pode comparar-se
00
aos ∼ 43 por século para o planeta Mercúrio! Assim, se fizermos ω −→ ω0 + ωt
na Eq.(7.144), teremos agora quatro combinações trigonométricas de φ e ω̇t indepen-
dentes, que variam com o tempo. Portanto, mediante observações do PSR 1913 + 16,
em uma escala temporal de anos poderá se separar K, ω0 , ω̇ e β. Em particular, ω̇ e
β envolvem duas combinações diferentes dos quatro parâmetros M1 , M2 , a1 e seni, a
partir da função de massa, e a1 seni. Em conclusão, medições de ω̇ e β permitem uma
solução completa para os parâmetros do sistema binário.
Agora, considere a Eq.(7.153) para Ṗ de um sistema binário. Uma vez que todos
os parâmetros orbitais são conhecidos, podemos predizer um valor para Ṗ . Se este
concordar com o valor medido, teriamos por força confirmado a existência das ondas
gravitacionais !!
Uma ampla gama de outros efeitos astrofı́sicos poderiam também produzir uma
variação do perı́odo orbital do pulsar binário com magnitude similar á observada.
Contudo, a moderna análise de todos estes possı́veis efeitos tem demonstrado que ou
eles não agem neste sistema ou sua contribuição é excessivamente pequena como para
concorrer com as predições da relatividade geral [ver Taylor (2003) para uma revisão
completa desta questão fundamental].
286
Figura 7.8: Parâmetros da órbita do Pulsar Binário (PSR 1913 + 16) medidos pelo grupo
de J. H. Taylor. T0 é a época, ou origem do tempo para as medições . Os números entre
parentesis representam a incerteza nos últimos dı́gitos. (Tabela original publicada por
Clifford M. Will em ‘The Living Reviews on General Relativity’).
Na medida em que a precisão do ‘timing’ melhora, resulta possı́vel medir outros efeitos
relativı́sticos. Dentre estes, o atraso-temporal de sinais que atravessam a órbita em
caminho à Terra, são efeitos hoje já medidos com sondas espaciais no sistema solar.
Além disto, existem vários desvios periódicos pós-Newtonianos do movimento elı́ptico,
ainda não verificados no sistema solar. Na relatividade geral cada um destes termos
contém uma combinação desconhecida de M1 , M2 , a1 e seni. Enquanto mais e mais
destes termos sejam medidos (hoje sabemos quantos destes termos foram efetivamente
medidos) e se eles concordam com as predições da relatividade geral, então o argu-
mento em favor da relatividade geral, e das ondas gravitacionais, em particular, se
tornará cada vez mais incontestável.
O pulsar binário tem sido observado durante mais de trinta anos por J. Taylor e
seus colaboradores, sendo a precisão das observações cada vez maior. O valores atuais
dos vários parâmetros do sistema aparecem na Tabela apresentada na Figura 7.8. A
grandeza γ, um dos parâmetros pós-Newtonianos, está relacionada com β, o segundo
287
parâmetro PPN, através da condição
βP (1 − e2 )
γ≡ . (7.154)
2πc2
O efeito de atraso temporal e os efeitos orbitais pós-Newtonianos são muito bem
conhecidos hoje (ver Tabela da Figura 7.8). Note, entretanto, que a Eq.(7.153) pode
rescrever-se como
6πGM2 seni
ω̇ = (7.155)
a1 seni(1 − e2 )P c2
5/3
3G2/3 (M1 + M2 )2/3

2π
= (7.156)
(1 − e2 )c2 P
Usando o valor medido de ω̇ dado na Tabela da Figura 7.8, junto com os valores de
P e e, encontramos que
M1 + M2 = 2.8278(7) M . (7.157)
Ainda podemos escrever os parâmetros γ, seni, e Ṗ , que são determinados com muita
menor precisão, inserindo os valores de P , e, a1 seni, e M1 + M2 . A Eq.(7.154) se
transforma em
1/3
G2/3 M2 (M1 + M2 )e P
γ= = (0.0007344 s)M2 (2.8278 + M2 ), (7.158)
(M1 + M2 )4/3 2π
com M2 medido em massas solares (M ). A terceira lei de Kepler, Eq.(7.150), produz
2/3
2π (M1 + M2 )2/3 a1 seni 1.019
seni = 1/3
= , (7.159)
P G M2 M2
enquanto que a Eq.(7.153) leva a
192πG5/3 M1 M2 f (e)

2π 5/3
Ṗ = − 5 1/3
) (7.160)
5c (M1 + M2 ) P
= −1.202 × 10−12 M2 (2.8278 − M2 ). (7.161)
Note que em ordem de magnitude, ∆P ∼ 10−4 s yr−1 . Considerando que o pulsar

binário está a quase 5 kpc de distância, é supreendente que a precisão do ‘timing’
permita, a todos nós, conferir a medição de um efeito tão pequeno! Tomando γ =
(0.00438 ± 0.000024) s, encontra-se da Eq.(7.158) que M2 = (1.41 ± 0.06) M , e
portanto da Eq.(7.157) M1 resulta ter o mesmo valor! Consequentemente, a Eq.(7.161)
prediz
s
Ṗ = −2.40 × 10−12 , (7.162)
s
em excelente concordância com o valor medido de (−2.30 × 10−12 ). Este resultado
fundamental é ilustrado na Figura 7.9.
Alcançado este momento, devemos fazer uma pausa para uma breve reflexão a respeito
da importância deste sistema para a validação das teorias da gravitação . Passaram-
se já mais de trinta anos de observações do PSR 1913 + 16, e apesar das inúmeras
288
Figura 7.9: Evolução da órbita do Pulsar Binário (PSR 1913 + 16): Deriva cumulativa
do tempo (s) de passagem pelo periastro durante 25 anos de observação , comparada
com a predição da relatividade geral para a evolução da mesma grandeza como devida
a perda de momento angular por emissão de OGs. (Versão tomada do original do site
http://astrosun2.astro.cornell.edu/academics/courses/astro201/psr1913.htm).
289
alternativas existentes para se entender sua evolução , a teoria da relatividade geral
parece ser todo o que se necessita para explicar sua dinâmica. A fórmula de quadrupólo
para a emissão de ondas gravitacionais tem sido confirmada com um erro de 0.1%!
Em conclusão: a demonstração direta da existência das OGs abrirá uma nova janela
para o Cosmo, de modo semelhante ao sucedido com a verificação em laboratório da
existência das ondas eletromagnéticas previstas por Maxwell e descobertas por Hertz.
Neste sentido, a ‘fortuna’ dos astrofı́sicos relativistas não parece ter chegado a seu
fim: em 2003 foi confirmada a observação de um novo pulsar verdadeiramente binário,
formado por duas estrelas de nêutrons! Este sistema conhecido como PSR J0737-3039
A,B, conforme já referido anteriormente, constitui-se num laboratório ainda melhor
para a realização de testes das teorias da gravitação . A Natureza parece continuar a
nos providenciar O Laboratório Ideal!
7.9 Astronomia de ondas gravitacionais
Retomando nossa analogia inicial entre o eletromagnetismo e a gravitação , vejamos

o que as observações de OGs poderão nos dizer a respeito do Universo.
Primeiramente, note que contrário às ondas eletromagnéticas (OEMs) que são ab-
sorbidas e reemitidas por corpos materiais, as OGs sendo vibrações do próprio S-T
não podem ser absorvidas pela matéria já que esta segue o “caminho” definido pela
geometria do S-T. Elas atravessam praticamente todo sem qualquer absorção pelo
meio material. Além disto, o comprimento tı́pico de uma OEM é sempre muito menor
do que o tamanho da fonte que a emite. Contrário a isto, as OGs possui comprimentos
de onda caracterı́sticos que se comparam ou resultam ser maiores do que a escala fı́sica
das fontes que as emitem. Em consequência, as OGs não podem ser usadas para formar
imágens das fontes, mas podem ser o análogo do som (onda de natureza longitudinal),
e podem portanto fornecer uma descrição estereofônica da dinâmica da fonte graças a
seus dois modos de polarização (transversais á direção de propagação da onda).
Ainda, os grávitons num surto de OGs são coerentes em fase; enquanto que os fótons
das OEMs normalmente são incoerentes em fase. Isto se deve ao fato que cada gráviton
é produzido a partir do movimento global da matéria da fonte ou da curvatura do
espaço-tempo, enquanto que os fótons são gerados por eventos independentes, difer-
entes que envolvem átomos, ı́ons e elétrons. Vistas desta maneira, as OGs são similares
à luz laser! Os detectores de OGs tiram proveito desta importante propriedade fı́sica.
Uma consequência extremamente importante desta coerência é que a grandeza direta-
mente observável da radiação gravitacional é a deformação (‘strain’) h, que cai com o
inverso da distância como 1/r. Por isso, medir OGs coerentes é o análogo de medir um
campo eletromagnético coerênte do tipo 1/r. Esta queda comparativamente lenta com
a distância r, tem um tremendo impacto sobre a ‘Ciência’ a ser feita com OGs: Dobrar
a sensibilidade de um detector significa dobrar a distância até as fontes que podem ser
290
detectadas. Isto aumenta enormemente, num fator de 8, o volume do universo para o
qual as fontes são mesuráveis.
Finalmente, em muitos casos a astronomia eletromagnética está baseiada em um im-
ageamento profundo de pequenos campos de visada. Assim, os observadores obtém
uma grande quantidade de informação sobre as fontes em uma pequena parcela do
céu. Oposto a isto, a astronomia de OGs será uma ‘affair’ de quase o céu inteiro! Os
detectores de OGs tem uma cobertura de quase 4 π stereoradianos de sensibilidade
a eventos no céu. Isto significa que um detector moderno tem uma capacidade não
muito boa de localizar uma fonte no céu com base nos padrões astronômicos, mas
ao mesmo tempo isto significa que qualquer fonte no céu poderá ser detectável, não
somente aquela para o qual o instrumento está apontado! Este contraste entre sen-
sibilidade de céu inteiro mas uma pobre resolução angular dos observatórios de OGs,
e a resolução angular, pontuada dos telescópios é muito semelhante ao contraste de
resolução angular do ouvir e enxergar, o que reforça ainda mais a utilidade da analogia
das OGs com o som.
Para terminar, lembramos que o espectro de frequências (fGW ) das OGs divide-se, na
perspectiva de sua detectabilidade no futuro ‘próximo’, em a) OGs de alta frequência,
se
10 Hz < fGW < 104 Hz, (7.163)
que corresponde a banda de sensibilidade de observatórios de OGs já opera-
cionais como o ‘Laser Interferometric Gravitational-Wave Observatory’ (LIGO,
http://www.ligo.caltech.edu/LIGO web/about/), e seus similiares VIRGO, GEO-600,
TAMA-300, e AIGO (também já operacionais), e b) OGs de baixa frequência, se
10−1 Hz < fGW < 10−5 Hz, (7.164)
que corresponde a banda de sensibilidade de observatórios planejados para serem colo-

cados em órbita seguindo a Terra ao redor da Sol, tal como o ‘Laser Interferometric
Space Antenna’ (LISA). Salientamos ainda que esta frequência caracterı́stica da OG
emitida por uma fonte especı́fica pode ser estimada usando o inverso da escala tem-
poral dinâmica do sistema sob consideração , isto é:
fGW (Hz) ∼ {Tdin (s)}−1 . (7.165)
As fontes mais alvejadas para detecção variam desde a coalescência de sistemas

binários de estrelas de nêutrons, buracos negros, ou combinações entre estes, exp-
losões de supernova, colapso gravitacional de estrelas massivas, modos quase-normais
de estrelas de nêutrons e também de buracos negros, transições de fase em estrelas de
nêutrons, OGs relı́quias do Big Bang, transições de fase primordias, coalescência de
buracos negros en núcleos ativos de galáxias (AGNs), etc., e conforme sugerido pela
primeira vez no Capı́tulo 6 deste PMC, a novidosa predição da detectabilidade das
OGs emitidas durante a fase inicial de aceleração dos pulsáres acelerados observados
hoje perambulando pela na nossa galáxia.
291
7.10 Exercı́cios
1. Usando a Eq.(??) e a condição da Eq.(??), obter a Eq.(7.106).
2. Calcule a potência total radiada por um pulsar de uma massa solar, e 10 km de
raio, que é impulsado do repouso até alcançar uma velocidade final de 10.000
km/s em 0.02 µas de distância. Qual é a amplitude do sinal de OG emitido neste
processo? Qual sua frequência?
3. Mostre que usando a relação para a órbita elı́ptica
2EJ 2
e2 = 1 + , (7.166)
G2 µ3 M 2
se conclue que a emissão de OGs tende a circularizar uma órbita elı́ptica ! Isto
é, mostre que de/dt < 0.
4. Verifique a relação expressa na Eq.(??) .
5. usando a relação de Peters & Mathews (1964)[6], descrita na seção do pulsar
binário, i.e., Eq.(7.125), determine a escala temporal para a coalescência ou co-
lisão entre as estrelas componentes da binária de Taylor & Hulse devido á emissão
adiabática de OGs.
6. Sugere-se ao leitor mais dedicado ao estudo deste curso completar as passagens
analı́ticas formais faltantes no processo estudado na Seção Ondas gravita-
cionais emitidas por massas aceleradas: Pulsares

[1] S. L. Shapiro, S. A. Teukolsky, White dwarfs, black holes and neutron stars: The
Physics of compact objetcs. Wiley & Sons, New York (1983)
[2] R. d’Inverno, Introducing Einstein’s Relativity, Clarendon Press, Oxford, UK
(1992)
[3] Ehud B. Segalis, Amos Ori, Phys. Rev. D 64, 064018 (2001)
[4] Norichika Sago, Kunihito Ioka, Takashi Nakamura, Ryo Yamazaki, Phys. Rev. D
70, 104012 (2004)
[5] V. Braginsky, K. S. Thorne, Nature 316, 610-612 (1985)
[6] P. C. Peters, J. Mathews, Phys. Rev. 131, 435-439 (1963)
[7] J. H. Taylor, J. M. Weisberg, RELATIVISTIC BINARY PULSAR B1913+16:
THIRTY YEARS OF OBSERVATIONS AND ANALYSIS, Proceedings of Aspen
Winter Conference on Astrophysics: Binary Radio Pulsars, Aspen, Colorado, 11-
17 Jan. (2004)
[8] H. J. Mosquera Cuesta, arXiv:0711.3046 [astro-ph] (2007)
292
Capı́tulo 8
Astropartı́culas I
Sergio E. Jorás1
8.1 Introdução
Por que estudar partı́culas elementares em um curso de Cosmologia?

Um resultado experimental bastante conhecido é que o universo está em processo de
expansão. Tal como um gás ideal, ele se esfria à medida em que se expande. Assim, se
o estudarmos em épocas cada vez mais antigas, ele apresentará temperaturas cada vez
maiores. Temperaturas altas correspondem a grandes valores de energia disponı́vel, e
por isso é comum alternar-se entre as duas descrições. Por exemplo, em um certo in-
stante tH , quando a radiação presente no universo atinge uma temperatura de 104 K,
a energia média destes fótons é de E ≈ kB T ≈ 13, 6 eV , ou seja, suficiente para a
ionização do átomo de hidrogênio. 2 Assim, para instantes anteriores a tH , podemos
pensar que o universo era composto (basicamente) por núcleos do átomo de hidrogênio
(prótons) e elétrons dissociados uns dos outros, além, claro, de fótons. O que acontece
se retocedermos no tempo, aumentando ainda mais a temperatura da radiação? É nat-
ural imaginarmos que as partı́culas “elementares” se dissociem em seus constituintes,
tal qual o átomo de hidrogênio em próton e elétron. Assim, o Universo primordial
pode ser visto como um acelerador de partı́culas extremo, onde energias inimagináveis
foram de fato atingidas. A experiência, claro, não pode ser repetida como em um
1
Afiliação : Instituto de Fisica, Cidade Universitaria, UFRJ, Caixa Postal 68528 21945-970 Rio de
Janeiro, RJ.
2
Um estudo mais rigoroso leva em conta o espectro dos fótons, ou seja, sua distribuição em relação
à energia, e mostra que tH é, na verdade, um pouco posterior ao instante que este argumento ingênuo
indica.
293
laboratório terrestre, mas a quantidade de informação adquirida não pára de crescer
ainda hoje, mesmo depois de bilhões de anos de realizada.
Na seção 8.2 veremos como o estudo das forças forte e fraca propiciaram a classi-
ficação das partı́culas elementares segundo o modelo padrão adotado atualmente. Na
seção 8.3, estudaremos os elementos básicos que nos ajudarão a entender a abordagem
matemática da classificação padrão. Na seção 8.4 faremos uma rápida introdução à
Teoria de Campos, que é o formalismo moderno para descrição das interações. To-
dos os aspectos serão colocados em conjunto na última seção deste capı́tulo, onde
estudaremos a história térmica do universo — veja também o capı́tulo 2.
8.2 Modelo Padrão de Partı́culas Elementares
Nesta seção estudaremos as forças nucleares e os métodos usados para classificar dois
importantes grupos de partı́culas elementares: os quarks e os léptons.
8.2.1 A força forte
Em 1932, experiências de Chadwick e Joliot-Curie mostraram que os núcleos atômicos

eram formados por prótons e nêutrons. A força forte, atuando entre eles, impede
que o núcleo se desfaça sob ação da força eletromagnética. Estas duas partı́culas
apresentam massas similares entre si mas se diferenciam, principalmente, pela carga
elétrica existente no primeiro. Se lembrarmos que a força eletromagnética entre dois
prótons é cerca de 1000 vezes menor que a força forte entre eles, seremos levados
a admitir a existência de uma simetria, ainda que não exata, entre eles. Inspirados
no elétron, que pode se apresentar em dois estados de spin, conjecturou-se que uma
partı́cula denominada núcleon poderia manifestar-se como um próton ou um nêutron,
dependendo do seu estado de isospin. Estas partı́culas formavam, então, um par ou
dubleto !
p+
. (8.1)
n
Este novo número quântico, isospin, poderia assumir os valores ±1/2 e era conservado
pela interação forte. Em 1947, no entanto, o pı́on – considerado então o mediador da
força forte – foi descoberto pela equipe de Occhialini e Powell, com a participação
fundamental do fı́sico brasileiro Cesar Lattes. Nos anos seguintes, outras partı́culas
que compartilhavam a interação forte foram descobertos, e o núcleon perdeu seu lugar
de destaque no quadro das partı́culas elementares. Algumas destas partı́culas apresen-
tavam meia-vidas extremamente longas (Σ− , por exemplo), apesar de serem relativa-
mente massivas. Não se compreendia porque elas não decaı́am em outras mais leves
através de reações perfeitamente plausı́veis do ponto de vista energético, por exem-
plo. Em 1953, Gell-Mann e Nishijima [1] sugeriram uma explicação para a mı́riade de
294
Q B S Y
u +2/3 1/3 0 1/3
d -1/3 1/3 0 1/3
s -1/3 1/3 -1 -2/3
Tabela 8.1: Números quânticos – carga elétrica, bariônico, estranheza e hipercarga, re-
spectivamente – dos três quaks mais leves.
partı́culas “elementares” observadas e para a meta-estabilidade de algumas delas. A

numerosa variedade de partı́culas poderia ser explicada nos mesmos moldes da tabela
de elementos atômicos de Mendeleiev, que descrevia todos os elementos quı́micos a
partir de combinações com diferentes números de prótons e nêutrons. Isto poderia ser
feito aqui, ampliando-se a simetria de isospin usada anteriormente com o núcleon. Os
hádrons – partı́culas que interagem através da força forte – seriam formados a partir
de combinações de 3 elementos básicos:
 
u
 d  . (8.2)
 
A meta-estabilidade, por sua vez, poderia ser explicada através da existência de um

novo número quântico. Da mesma forma que uma reação nuclear deve conservar o
momento linear P ou a carga elétrica Q dos reagentes, a conservação desta nova
quantidade impedia (ou dificultava) o decaimento de algumas partı́culas, aumentando
assim sua vida média. Este número quântico recebeu o nome de “estranheza”3 S. Para
levar em consideração também a conservação do número de bárions (ou bariônico) B,
definiu-se a hipercarga Y = B + S. Como um bárion apresenta, obviamente, B = ±1
e Q = ±e, cada um destes novos elementos básicos deve ter B = ±1/3 e Q = ±1/3e.
Veja a tabela 8.1. A suposição de uma estrutura mais fundamental colocou ordem no
zoológico de partı́culas que começava a se formar na década de 60. Suas caracterı́sticas
também poderiam ser facilmente explicadas admitindo-se que eram compostas por 2
ou 3 elementos básicos, definindo assim os mésons e os bárions, respectivamente:
De fato, em 1967, experiências no SLAC (Stanford Linear Accelerator) indicaram
que os prótons e nêutrons pareciam ter estruturas internas. Já sabia-se que colisões
p − p (10 GeV ) produziam um grande número de pı́ons praticamente colineares com
a direção da colisão, o que indicava que prótons eram formados por muitas partı́culas
praticamente livres em relação à força forte. O problema é que, no SLAC, elétrons
(20 GeV ) eram espalhados inelasticamente por prótons em ângulos muito grandes,
como se colidissem com poucas partı́culas carregadas eletricamente. Para conciliar
ambas as experiências, Bjorken e Feynman sugeriram que o próton era formado por
uma coleção de partı́culas eletricamente carregadas – os pártons e, possivelmente,
3
Do inglês strangeness.
295
MÉSONS BÁRIONS
π+ : ud¯ p+ : uud
π− : dū n: ddu
q
0
π : 1
(uū ¯ Σ+ :
− dd) uus
2
.. ..
. .
Tabela 8.2: Composição de alguns mésons e bárions.
outras partı́culas neutras responsáveis pelas suas interações. Um elétron com energia
suficiente poderia arrancar um párton do núcleo, e os pedaços da colisão se mate-
rializariam como jatos de hádrons. No referencial do projétil, a dilatação temporal
diminui a taxa de interação entre os pártons, o que justifica considerá-los pratica-
mente livres durante o processo de colisão. Este comportamento se traduz experimen-
talmente através da análise das seções de choques, que diferiam daquelas esperadas
para partı́culas puntiformes [2]:

dσ dσ
= |F (~q)|2 , (8.3)
dΩ exp dΩ punt
onde q é o momento linear transferido pelo projétil e o fator de forma F (~q) indica a
distribuição de carga ρ(~x) no alvo (se ignorarmos seu recuo):
Z
F (~q) = ρ(~x) e−i~q·~x d3 x . (8.4)
A estrutura do próton pode ser verificada experimentalmente através da generalização

relativı́stica do fator de forma definido acima. Sendo ~x a fração do momento linear do
próton carregada por cada párton, o fator de forma relativı́stico F2 (x) apresentaria
um pico em x = 1 se o próton fosse realmente elementar (ou composto por apenas
um párton). Sendo composto por 3 pártons livres, F2 (x) deveria apresentar um pico
em x = 1/3. A interação entre eles, no entanto, redistribui o momento, o que alarga
a curva do fator de forma, mas ainda não reproduz o comportamento observado. Este
só pode ser explicado admitindo-se a existência de um mar de partı́culas lentas. Os
3 pártons podem ser comparados aos elétrons de valência dos átomos. Estes elétrons
definem as ligações quı́micas, mas sua existência e distribuição só podem ser explicadas
se levarmos em consideração os elétrons localizados nas “camadas” inferiores.
O modelo de pártons, no entanto, é incompleto, pois ignora o papel dinâmico dos
intermediários da força forte, os glúons, que podem carregar cerca de 50% do momento
linear total do próton. Um efeito previsto pelo modelo de pártons e contrariado pela
experiência era a colinearidade entre o jato hadrônico resultante da colisão e − p e o
fóton virtual trocado pelo elétron e pelo párton interagente. Ou seja, não era possı́vel
explicar a existência de jatos com momento linear transversal não nulo.
Sabe-se hoje que a simetria proposta por Gell-Mann e Zweig é apenas aproximada, e
fornece bons resultados porque os elementos básicos usados correspondem aos 3 quarks
296
Figura 8.1: Fatores de forma relativı́sticos F2 (q) em função da fração x do momento do
próton carregada por cada partı́cula constituinte, para diversos modelos de composição
do próton: (a) sem estrutura interna; (b) composto por 3 partı́culas elementares livres;
(c) por 3 partı́culas interagentes e (d) como o anterior, mas na presença de um mar de
quarks.
mais leves, cujas massas são muito menores que a dos outros. Aliado aos resultados
animadores do modelo de pártons, este modelo abriu o caminho para a classificação
das partı́culas elementares descrita na seção 8.2.3.
Resta ainda um ingrediente fundamental: Todos os quarks são férmions, isto é, têm
spin fracionário, enquanto os bárions podem ter spin inteiro (sendo classificados então
como bósons) ou não. A conseqüência básica desta caracterı́stica4 e que nos interessa
é que os férmions obedecem à estatı́stica de Fermi-Dirac — enquanto que os bósons
obedecem à estatı́stica de Bose-Einstein; daı́ seus nomes. Ou seja, os férmions seguem
o Princı́pio de Exclusão de Pauli: não podem ocupar o mesmo estado quântico simul-
taneamente, ao contrário dos bósons, que podem formar os chamados Condensados
de Bose-Einstein, estado no qual todas as partı́culas estão no mesmo estado funda-
mental. A existência da ressonância ∆++ , formada por três quarks up, apontou um
problema: como três quarks idênticos podem ocupar o estado fundamental, sendo
férmions? A saı́da foi acrescentar um novo número quântico, de tal forma que cada
quark ocupasse um estado diferente, obedecendo, assim, o Princı́pio de Exclusão de
Pauli. Dito de outra forma, o estado fundamental é triplamente degenerado. Este novo
número quântico recebeu o nome de cor, que, obviamente, não tem relação alguma
com as faixas do espectro eletromagnético visı́vel. Assim, na ressonância ∆++ , um
quark ocupa o estado vermelho, outro o estado azul e outro, o verde. O conjunto como
um todo — tal qual um disco de Newton — é branco: ou seja, a ressonância ∆++
não possui cor. Mésons, formados por um quark e um anti-quark, também devem
ser brancos. Para isso, deve-se sempre agrupar uma cor com sua anti-cor: vermelho
4
Ver Teorema Spin-Estatı́stica [3].
297
Figura 8.2: Criação de um par quark-antiquark na tentativa de separação do par já
existente.
com anti-vermelho, por exemplo. Quarks são, portanto, eletricamente carregados e

coloridos.
Como veremos mais adiante, a força forte entre dois quarks é mediada pela troca
de cores entre eles, ou seja, por 8 glúons bicolores (que são eletricamente neutros).
Glúons, portanto, interagem entre si – ao contrário de fótons, que apesar de mediarem
a interação eletromagnética, são neutros. Além disso, a intensidade da interação tem
um comportamento oposto ao esperado: diferentemente do que acontece com outras
partı́culas, a interação entre quarks não cai com a distância; pelo contrário, aumenta!
Seu valor só tende a zero quando a distância entre elas também o faz – a denomi-
nada liberdade assintótica dos quarks. Figurativamente, pode-se comparar a interação
quark-antiquark com a força exercida por uma mola entre duas massas: quanto maior
a distensão, maior será a força de atração. De uma maneira ilustrativa, pode-se dizer
que a energia armazenada na mola dará origem a um novo par quark-antiquark quando
atingir um valor alto o bastante (veja Figura 8.2). Assim, não é possı́vel observar um
quark isoladamente, por maior que seja a energia do processo de colisão. Pode-se fazer
uma analogia do par quark-antiquark com um ı́mã, cujos pólos não podem ser sepa-
rados. Pelo mesmo motivo, não é possı́vel observar nenhuma partı́cula “colorida” na
natureza: todos os quarks se agrupam de forma a formar partı́culas “brancas”. Esta
caracterı́stica é fundamental, já que a necessidade deste novo número quântico é indi-
reta, não tendo sido observado diretamente. David Gross, Frank Wilczek e H. David
Politzer receberam o Prêmio Nobel de 2004 pelo desenvolvimento da Cromodinâmica
Quântica, que apresenta naturalmente o conceito de liberdade assintótica.
8.2.2 A força fraca
Os lentos decaimentos do pı́on π − e do muon µ− , com meia-vidas de 10−8 s e 10−6 s,

respectivamente, indicaram a existência de uma outra força nuclear, mas de intensi-
dade muito menor que a da forte. O pı́on, em particular, não pode decair através da
interação forte, já que é o hádron de menor massa que existe.
A equação de Dirac, que descreve partı́culas de spin 1/2, introduziu o conceito de
helicidade (também conhecida como quiralidade) como um novo número quântico
298
conservado. A helicidade é definida como a projeção do spin na direção do momento
linear da partı́cula em questão. Para partı́culas sem massa, ela só pode assumir os
valores ±~/2. De acordo com o sinal, diz-se que a partı́cula é de “mão direita” (helici-
dade positiva) ou “mão esquerda” (negativa). Pode-se mostrar que a interação eletro-
magnética também conserva a helicidade em altas energias. A simetria entre partı́culas
de helicidades opostas é chamada de paridade. A interação fraca, no entanto, quebra
esta simetria: apenas neutrinos de mão esquerda (e anti-neutrinos de mão direita)
se acoplam a léptons carregados através desta interação. Os (anti-)neutrinos com he-
licidade “errada”, portanto, não podem interagir e não são observados. Até hoje as
experiências concordam com este modelo, mas ele só é válido para o caso de neutrinos
sem massa. De outra forma, poder-se-ia realizar uma transformção de Lorentz para um
referencial onde o momento do neutrino teria o sinal oposto, e também a helicidade.
Isto seria equivalente a transformar um neutrino de mão esquerda em um de direita,
e vice-e-versa.
O passo natural que se seguiu foi, como antes, a ampliação da simetria através da in-
clusão do quark c, de “charmoso” 5 . De fato, o estudo de colisões elétron-pósitron con-
firmou sua existência em 1974. 6 O novo quark c foi necessário para explicar alterações
na esperada estrutura de jatos ao atingir-se a energia necessária para sua criação. Os
férmions conhecidos até então podiam ser dispostos em 2 famı́lias de dubletos7 :
! !
e− µ−
νe νµ
L L
, (8.5)
! !
u c
d s
onde o ı́ndice L lembra que apenas estados de mão esquerda participam da in-
teração. Transições entre os membros de cada dubleto acontecem através da força
fraca. Esperava-se, portanto, transições apenas entre os quarks u e d e entre c e s.
Havia, no entanto, um contra-exemplo:
K + (us̄) −→ µ+ ν̄µ . (8.6)
Foi necessário, então, admitir que a interação fraca acoplava quarks “rotacionados”:
! !
u c
e , (8.7)
d0 s0
5
Do inglês charm.
6
O leitor atento pode-se perguntar como se obtém quarks a partir da colisão de elétrons, que não são
formados por eles. Na verdade, o uso de partı́culas elementares como elétrons facilita muito os cálculos
e a interpretação dos resultados: a aniquilação de um par e− − e+ pode gerar energia suficiente para a
criação de um par q − q̄ e daı́, jatos de hádrons.
7
E nos singletos de “mão-direita” e− −
R , µR .
299
onde 
0
 d =
 d cos θc + s sin θc
(8.8)
 0
s = −d sin θc + s cos θc .

A variável θc , conhecida como ângulo de Cabibbo, foi introduzida em 1963 para

explicar o decaimento de partı́culas estranhas, e é determinado experimentalmente:
θc ≈ 13o . A existência desta rotação não foi detectada anteriormente porque cos2 (θc )
sin2 (θc ). Rotações totalmente equivalentes poderiam ter sido definidas no setor (u, c)
ou em todos os 4 quarks simultaneamente. Este mixing acontece porque os autoestados
da interação fraca (d0 , s0 ) não são autoestados de massa. No setor leptônico, por outro
lado, isto não pode acontecer se os neutrinos forem de fato, não massivos.
Em 1977, com a descoberta do quark b, de “baixo” 8 , a estrutura de dubletos dos
quarks passou a indicar a existência de um sexto integrante, o quark t, de “topo” 9 .
O mecanismo de mistura (ou rotação) de Cabibbo foi então estendido por Kobayashi
e Maskawa para descrever interações entre todos eles. Os termos Uud , Ucs e Utb desta
matriz (denominada CKM ) são claramente dominantes. Em particular, |Ucs | ≈ 0.97
indica que partı́culas charmosas decaem, preferencialmente, em partı́culas estranhas.
Uma diferença fundamental existe na matriz CKM : ela apresenta elementos com-
plexos que não podem ser eliminados, que implicam a violação da simetria CP (carga
e paridade). O operador C inverte o sinal da carga da partı́cula, enquanto que o op-
erador P equivale à reflexão em um espelho, invertendo o sinal da helicidade. Assim,
a aplicação CP leva uma partı́cula à anti-partı́cula correspondente. Seria natural es-
perar que ambas se comportassem da mesma maneira, ou seja, a simetria CP dveria
ser respeitada pela natureza. Mas, na verdade, Kobayashi e Maskawa propuseram a
existência da terceira geração de quarks para explicar a violação de CP já detectada
9 anos antes, no decaimento do káon neutro K0 (ds̄), que ocorre em taxa ligeiramente
diferente do K̄0 . Esta assimetria foi fundamental para que o número de bárions se
tornasse ligeiramente maior do que o de anti-bárions no universo primordial.
8.2.3 A classificação padrão
Aqui faremos uma rápida descrição da classificação atual das partı́culas elementares,
antecipando alguns resultados que serão discutidos mais adiante.
As partı́culas elementares podem ser classificadas em dois grandes grupos: os léptons
e os hádrons. Pode-se ainda falar em um terceiro grupo, formado pelos chamados
campos de gauge, responsáveis pela propagação das interações entre as partı́culas dos
dois primeiros grupos. A caracterı́stica fundamental dos léptons é não interagirem
através da força nuclear forte. Os léptons são formados por três famı́lias (ou sabores),
8
Do inglês bottom.
9
Do inglês top.
300
cada uma com dois participantes: a primeira, mais leve, é formada pelo elétron (e)
e pelo neutrino a ele associado (νe ). A segunda, pelo muon (µ) e seu neutrino (νµ );
a terceira, pelo tauon (τ ) e seu neutrino (ντ ). Os primeiros membros de cada famı́lia
tem cargas elétricas iguais entre si, enquanto que os outros são, como o próprio nome
indica, neutros.
! ! !
e µ τ
, eR , µR , τR (8.9)
νe νµ ντ
L L L
Os membros da primeira linha dos dubletos são massivos, e há fortes indı́cios exper-
imentais de que os neutrinos também o sejam. Os seis quarks existentes receberam
nomes exóticos como up, down, charm, strange, top e bottom e também são ordenados
em 3 famı́lias, em ordem crescente de massa:
! ! !
u c t
(8.10)
d s b
Os membros da primeira linha têm carga elétrica positiva, igual em módulo a 2/3 da
do elétron — que não é, portanto, a carga elétrica fundamental — e os da segunda
linha, carga negativa igual a −1/3e. Os hádrons são formados pelos quarks, sempre em
grupos de dois ou três, caracterizando os chamados mésons e bárions, respectivamente.
Os bárions presentes na matéria comum — prótons e nêutrons — são formados por
combinações apenas dos dois quarks mais leves. Assim, para conseguirmos uma carga
elétrica igual (em módulo) à do elétron para o próton, temos que combinar dois quarks
up e um down. Para anular a carga elétrica total do nêutron, basta juntarmos um up
e dois down.
Reações nucleares devem conservar os chamados “bons” números quânticos, como a
carga elétrica total Q e o número de léptons (ou leptônico) L. Por exemplo, um nêutron
(Q = 0, L = 0) decai em um próton (Q = +1, L = 0) emitindo um elétron (Q = −1,
L = 1) e um anti-neutrino do elétron (Q = 0, L = −1). Deste modo, podemos prever
a existência de um anti-neutrino ao invés de um neutrino como sub-produto desta
reação.
n −→ p + e + ν̄e
Q : 0 = +1 −1 +0 (8.11)
L: 0 = 0 +1 −1
Os campos de gauge, como já mencionado, são responsáveis pela interação entre os
léptons e hádrons. Assim, a força eletromagnética é intermediada pelo fóton (γ), en-
quanto que a força nuclear fraca o é pelos bósons vetoriais Z o e W ± . 10 O fóton, por não
10
Na verdade, como veremos mais adiante, pode-se descrever estas duas forças através do mesmo
formalismo matemático, o que significa que são apenas aspectos diferentes da mesma interação, conhecida
como eletrofraca [6]. O mesmo raciocı́onio nos leva a falar da força eletromagnética, mesclando seus
aspectos elétrico e magnético.
301
ter carga, não interage consigo mesmo e é o único bóson interagente sem massa. Já as
partı́culas responsáveis pela interação forte, os glúons, carregam 2 cores, e, portanto,
interagem entre si.
Até hoje, os léptons e os quarks não mostraram sinais de uma estrutura interna e, por-
tanto, até resultados em contrário, podem ser considerados partı́culas verdadeiramente
elementares ou fundamentais.
8.3 Elementos de Teoria de Grupos
Em Mecânica clássica, é usual investigar as simetrias de um sistema frente a mudanças

em seus graus de liberdade externos: a invariância de um sistema sob translações
espaciais leva à conservação do momento linear; sob transformações espaciais, à con-
servação da energia; sob rotações, à conservação do momento angular. Veremos na
Seção 8.4 que o mesmo raciocı́nio pode ser aplicado em Teoria de Campos. O que
poderemos aprender se investigarmos as simetrias dos graus de liberdade internos das
partı́culas elementares?
O tratamento rigoroso das simetrias encontradas em uma classificação das partı́culas
elementares pode nos fornecer mais do que uma simples justificativa estética. Um
estudo detalhado pode prever a existência de partı́culas ainda não observadas e, como
veremos mais tarde, indicar o caminho da unificação das forças fundamentais — que
deve ter sido percorrido pelo universo primordial.
Nesta seção veremos os ingedientes fundamentais de Teoria de Grupos, com ênfase
naqueles que nos serão úteis mais adiante. Referências especı́ficas [8, 9] podem ajudar
a preencher as lacunas aqui deixadas (veja também a Seção 12.9).
8.3.1 Definições
Um grupo G é um conjunto de elementos Ai que obedecem a uma regra de composição

adequada:
• a composição de dois elementos também é um elemento do mesmo grupo;

• a composição é associativa.
Os elementos neutro A0 , tal que
A0 · Ai = Ai · A0 = Ai , ∀Ai (8.12)
e inversos (Ai )−1 , tais que
(Ai )−1 · Ai = Ai · (Ai )−1 = A0 , ∀Ai (8.13)
302
são obrigatórios em um grupo. Se a composição de quaisquer dois elementos de um
grupo independe da ordem destes elementos, isto é, se
Ai · Aj = Aj · Ai ∀{Ai , Aj } ∈ G , (8.14)
então o grupo G é dito comutativo ou abeliano. O número de elementos é a ordem

do grupo. Um grupo de ordem 1 é obrigatoriamente composto apenas pelo elemento
neutro. Um grupo de ordem 2 contém, além do elemento neutro, apenas um outro
elemento, que portanto deve ser sua própria inversa. Dois elementos pertencentes a
grupos de ordem 2 já foram mencionados: os operadoes de paridade P e carga Q. O
primeiro equivale à troca x → −x e o segundo, à troca q → −q. Os vários exemplos
concretos de um mesmo grupo abstrato são chamados realizações do grupo.
Um grupo é dito contı́nuo quando seus elementos são “próximos” entre si. Isto acon-
tece, por exemplo, quando os elementos do grupo são dados em função de um ou mais
parâmetros que variam continuamente: Aa,b,... , com a, b ∈ <. Se houver um número
finito de tais parâmetros, o grupo é finito. Se seu domı́nio de variação finito, o grupo
é chamado fechado. A regra de composição impõe relações entre os parâmetros de 3
elementos do grupo:
Aa = Ab · Ac ⇒ a = f (b, c) . (8.15)
Ou seja, a é uma função de b e c. Se esta função for infinitamente diferenciável e se

o parâmetro que fornece o inverso de um dado elemento for dado por uma função
analı́tica dele, ou seja,
Ab = (Aa )−1 ⇒ b = f (a) , onde f é uma função analı́tica, (8.16)
então G é dito um grupo de Lie.
8.3.2 Exemplos
Vamos nos concentrar em alguns grupos especı́ficos para fixar os conceitos introduzidos
e facilitar a explicação de novos.
• Multiplicação simples por escalar

Um exemplo simples de grupo de Lie é dado pela operação x0 = ax, a 6= 0. A
regra de composição dos elementos Aa ≡ a é a multiplicação simples: c = ba; o
elemento neutro é A1 = 1 e o inverso, (Aa )−1 = A1/a = 1/a.
• Translações
Este grupo é formado pelo conjunto de translações no espaço de coordenadas:
µ
x µ → x 0 = x µ + aµ . (8.17)
303
É fácil verificar que esta operação obedece às regras para formar, de fato, um
grupo. A regra de composição é a soma vetorial; o elemento neutro é o vetor nulo
e o inverso, −aµ .
A variação em uma função escalar destas coordenadas provocada por uma
translação infinitesimal é
δφ(xµ ) ≡ φ(xµ + aµ ) − φ(xµ ) (8.18)

≈ φ(xµ ) + aα ∂α φ(xµ ) − φ(xµ )
≈ aα ∂α φ(xµ ) . (8.19)
O operador aµ ∂µ é dito, portanto, o gerador de translações.

• O(2)
Este é o grupo formado pelas transformações lineares em um espaço bidimensional
(xy) que deixam a distância até a origem invariante:
x2 + y 2 : invariante . (8.20)
É claro que estamos tratando as rotações em torno do eixo perpendicular ao plano

em questão. Se x e y forem consideradas componentes de um vetor, podemos usar
notação matricial e escrever:
!
cos θ sin θ
~r 0 = O ~r , onde O = . (8.21)
− sin θ cos θ
A matriz O é ortogonal: OT = O−1 , como pode ser facilmente verificado. Seu

determinante só pode assumir os valores ±1, pois
1 = det(OOT ) = det O det OT = (det O)2 . (8.22)
As matrizes com determinante −1 formam um subgrupo à parte, composto pelos

mesmos elementos de SO(2) multiplicados pela matriz
!
1 0
P = , (8.23)
0 −1
que provoca uma reflexão em relação ao eixo x, e que corresponde à operação

de Paridade já mencionada e a uma simetria discreta: P 2 = 1. As matrizes com
determinante +1 formam o subgrupo11 SO(2). Este é claramente um subgrupo
de apenas um elemento, contı́nuo e fechado, pois θ ∈ [0, 2π]. Também é abeliano,
pois O(θ1 )O(θ2 ) = O(θ1 + θ2 ) = O(θ2 )O(θ1 ). As transformações pertencentes ao
subgrupo SO(2) podem ser levadas continuamente para a identidade, e, portanto,
pode-se falar de transformações infinitesimais, cujas expressões podem ser obtidas
11
Onde S vem do inglês special.
304
expandindo-se a Eq. (8.21) em torno de θ = 0. A variação em cada componente
do vetor ~r é escrita
δx = −y δθ (8.24)
δy = x δθ . (8.25)
A mudança em uma função qualquer F (~r) causada por uma transformação in-
finitesimal como esta é
∂F ∂F
δF = δx + δy
∂x ∂y

∂ ∂
= δθ x −y F . (8.26)
∂y ∂x

∂ ∂
O operador X ≡ − x ∂y y ∂x
é o operador – ou gerador – de transformações
infinitesimais do grupo O(2), e corresponde ao momento angular em torno do
eixo z.
• SU(1)
Vamos investigar uma transformação especı́fica em objetos complexos z, dada
pela operação z 0 = U (θ)z, onde U (θ) ≡ exp(iθ). Este operador é obviamente
unitário, isto é,
U † = U −1 . (8.27)
O leitor pode verificar que o conjunto de operadores U (θ), com θ ∈ [0, 2π] forma
um grupo abeliano, denominado U (1). Como tem o mesmo número de parâmetros
(1) e a mesma regra de composição do grupo O(2), diz-se que estes grupos são
isomorfos.
Este é um grupo de simetria presente na Mecânica Quântica, onde o parâmetro θ
representa a fase da função de onda, inobservável [7]. Como veremos mais tarde,
esta simetria também aparece no eletromagnetismo.
• O(3)
Esta é a generalização direta do grupo O(2) para três dimensões. Este grupo é
formado pelas transformações lineares que mantém invariante a distância até a
origem:
x2 + y 2 + z 2 : invariante . (8.28)
Em notação matricial12 :
(xj )0 = Ojk xk , (8.29)
onde O são matrizes 3 × 3 ortogonais. Se nos restringimos ao subgrupo SO(3),

como antes, podemos tratar as transformações infinitesimais e escrever O = 1+B,
12
Aqui, o espaço é euclideano e não há necessidade de mudar o andar dos ı́ndices.
305
onde B é uma matriz anti-simétrica com apenas três elementos infinitesimais
independentes (i ), correspondentes aos três ângulos de Euler [10]:
 
0 −3 −2
B =  3 0 1  (8.30)
 
2 −1 0
Analogamente ao caso anterior, podemos escrever a variação de uma função

F (x, y, z) sob ação de uma transformação infinitesimal como

∂ ∂ ∂ ∂ ∂ ∂
δF = 1 z −y − 2 z −x + 3 y −x F .
∂y ∂z ∂x ∂z ∂x ∂y
(8.31)
j k
Os operadores Xi ≡ −ijk (x ∂k − x ∂k ) são os operadores de momento angular
em cada direção, e obedecem a
[X1 , X2 ] = X3 , [X2 , X3 ] = X1 , [X3 , X1 ] = X2 . (8.32)
Este grupo, portanto, não é abeliano. Estas regras de composição mostram que há
um espaço vetorial, associado ao grupo SO(3), cuja base é dada pelos operadores
infinitesimais Xi . As regras da mutiplicação acima mostram que este espaço é
fechado e definem sua álgebra de Lie.
Qualquer matriz ortogonal pode ser escrita como a exponencial de uma matriz
anti-simétrica:
∞
X 1
O(θ) = exp(θA) ≡ (θA)n . (8.33)
n=0
n!
Como os elementos de SO(3) são defindos por três parâmetros, qualquer matriz
O pertencente a este grupo pode ser escrita na forma
3
!
X
O = exp i θj Aj , (8.34)
j=1
onde podemos tomar

     
0 0 0 0 0 −1 0 1 0
1
A = −i  0 0 1  A2 = −i  0 0 0  A3 = −i  −1 0 0  .
     
0 −1 0 1 0 0 0 0 0
(8.35)
As matrizes Aj também obedecem a sua álgebra de Lie:
[Aj , Ak ] = i jkl Al . (8.36)
Os coeficientes do lado direito das relações de comutação acima são as constantes

de estrutura da álgebra.
• SU(2)
306
Este grupo generaliza o SO(2) para coordenadas e parâmetros complexos:
! !
x0 x
=A , (8.37)
y0 y
onde todos os elementos são complexos e det A = +1. Exigindo-se a conservação

da distância à origem, descobrimos que a matriz A deve ser unitária: A† = A−1 .
Qualquer matriz unitária pode ser escrita como a exponencial de uma matriz
hermiteana (H † = H):
A = exp(iH) (8.38)
Como a matriz A tem (2 × 4) − 4 − 1 = 3 parâmetros livres (verifique!), qualquer

elemento do SU (2) deve poder ser escrito como
A = exp(iθj Hj ) j = 1, 2, 3 (8.39)
onde a soma sobre ı́ndices repetidos está implı́cita13 . Um conjunto particular-

mente útil de três matrizes hermiteanas é dado pelas matrizes de spin de Pauli:
! ! !
0 1 0 −i 1 0
σ1 = σ2 = σ3 = , (8.40)
1 0 i 0 0 −1
que obedecem à mesma álgebra de Lie dos elementos de O(3), dada pela
Eq. (8.36). Assim, os grupos O(3) e SU (2) são isomorfos. 14 A utilização deste
grupo leva ao tratamento espinorial, que foge ao escopo deste livro.
• SU(3)
Este é o grupo das transformações unitárias em três dimensões. A representação
matricial tem determinante 1 e (32 − 1) = 8 parâmetros livres. Tal como na
álgebra de momentos angulares em Mecânica Quântica, aqui também há apenas
dois operadores que podem ser diagonalizados simultaneamente.
Trataremos das propriedades deste grupo com mais detalhe ao discutirmos a força
forte.
Um conceito bastante importante é o de redutibilidade. Dada uma certa representação

de um grupo – uma matriz M – é possı́vel expressá-la em termos de outras mais simples
– matrizes diagonais (em bloco) ou triangulares, por exemplo? Se a resposta for sim,
diz-se que a representação utilizada inicialmente é redutı́vel.
Se for possı́vel escrever todos os geradores de um grupo na forma de matrizes diagonais
em bloco, ou seja, como !
D1 0
M= , (8.41)
0 D2
13
Aqui também ignoramos os andares dos ı́ndices.
14
Apenas localmente, pois não é possı́vel fazer uma associação biunı́voca global entre os geradores.
307
onde D1 e D2 são matrizes m × m e n × n, respectivamente, então ele é dito com-
pletamente redutı́vel. Neste caso, o espaço gerado pelos vetores de estado ψ pode ser
separado em 2 subespaços invariantes (e, portanto, desconexos); um com dimensão m
e outro com dimensão n. O espaço pode então ser escrito como a soma direta destes
dois subespaços.
Freqüentemente, uma representação só pode ser reduzida à forma triangular, ou seja,
!
D1 T
M= . (8.42)
0 D2
Neste caso, o subespaço m−dimensional, correspondente às primeiras m componentes

da base adotada, é invariante, mas não o restante. Vamos a um exemplo [9]: digamos
que, em uma dada representação de um grupo que atua em um espaço tridimensional,
os operadores têm a forma triangular dada por
 
a b c
M= d e f  . (8.43)
 
0 0 g
Neste caso, um vetor com a terceira componente nula

 
x
v1 =  y  (8.44)
 
será transformado em  
ax + by
v10 = Mv1 =  dx + ey  , (8.45)
 
0
o que ilustra a invariância do subespaço gerado pelos vetores (1, 0, 0) e (0, 1, 0). O
subespaço gerado pelo vetor  
0
v2 =  0  , (8.46)
 
z
por outro lado, não é invariante (verifique!).
Esta redução, quando permitida, indica os vetores fundamentais de cada grupo, que
estarão ligados, como veremos adiante, às particulas básicas da natureza. Para explic-
itar a relação destes grupos de simetria com a classificação das partı́culas elementares,
vamos seguir uma linha cronológica.
8.3.3 Revisitando a classificação das partı́culas elementares
Até o inı́cio da década de 50, julgava-se que o núcleon seria uma partı́cula capaz de
assumir dois estados: próton e nêutron, que seriam autoestados de um certo operador
308
T1 :
T1 ψn = λn ψn : nêutron (8.47)
T1 ψp = λp ψp : prótron . (8.48)
O operador T1 é, portanto, diagonal na base formada por ψn e ψp :

!
λn 0
T1 = . (8.49)
0 λp
Os operadores T2 e T3 respondem pela transformação de um nêutron em um próton e

vice-e versa15 : ! !
0 1 0 0
T2 = T3 = . (8.50)
0 0 1 0
Fisicamente, a aplicação destes operadores representam um decaimento beta (inverso
ou não):
n −→ p+ + e− + ν̄e .
Os operadores Ti definidos acima obedecem a uma álgebra de Lie semelhante àquela

dos operadores de momento angular da Eq. (8.32), se tomarmos λn = −λp = 1/2. O
espaço gerado pelos vetores de estado ψn e ψp é chamado espaço de spin isotópico.
Em 1953, Gell-Mann e Zweig sugeriram que havia apenas três partı́culas fundamentais,
os quarks, que formavam uma representação do grupo SU (3). Mésons seriam formados
por dois quarks, e bárions por três. Podemos agrupá-los de acordo com a simetria sob a
operação dos elementos de SU (3): há 6 combinações simétricas e 3 anti-simétricas sob
a troca de 2 quarks. Cada combinação corresponde a uma partı́cula subatômica. Pode-
se também classificá-los de outra forma: há uma combinação totalmente simétrica, que
se mantém invariante: r
1
1= (uū + dd¯ + ss̄) (8.51)
3
¯ sd,¯ ¯ e
p
e outras 8 que se transformam entre si: sū, dū, ds̄, us̄, ud, 1/2(uū − dd)
1/6(uū + dd¯ − 2ss̄), formando um singleto e um octeto, respectivamente. Ambas
p
classificações podem ser indicadas por
Mésons: 3 ⊗ 3 = 6 ⊕ 3̄ = 8 ⊕ 1 (8.52)
Da mesma forma, os bárions podem ser classifcados em 10 combinações simétricas,

que se transformam entre si (um decupleto), 2 octupletos e um singleto:
Bárions: 3 ⊗ 3 ⊗ 3 = 10 ⊕ 8 ⊕ 8 ⊕ 1 . (8.53)
Cada combinação corresponde a uma partı́cula subatômica.

15
Qual delas transforma um próton em um nêutron?
309
Como já mencionado anteriormente, atualmente sabe-se que esta simetria é apenas
aproximada. Como ela relaciona quarks de diferentes famı́lias (também conhecidas
como gerações ou sabores), ela é conhecida como flavor SU (3).
A simetria SU (3) referente à cor, por outro lado, é exata. Para diferenciá-la da anterior,
indica-se SU (3)C . As três cargas coloridas vermelho, verde e azul – ou R, G e B,
tomando suas inciais do inglês – formam uma representação fundamental deste grupo.
A analogia com cor não é perfeita, pois induz à conclusão errônea que um estado
simétrico (branco) em relação a SU (3)C pode ser definido agrupando apenas um quark
de uma cor com outro que possua a anti-cor. No entanto, é fácil ver que um estado
verdadeiramente simétrico deve conter todas as 3 cores:
q q̄ = (RR̄ + GḠ + B B̄) . (8.54)
Os geradores são 8 matrizes 3 × 3, das quais apenas 2 podem ser diagonalizadas
simultaneamente e que têm R, G e B como autoestados. Outros geradores (glúons)
atuando sobre estados (quarks) mudarão suas cores. Veja o que acontece, por exemplo,
quando o gerador λ1 atua sobre o estado R. Sendo
   
0 1 0 1
λ1 =  1 0 0  e R =  0  , (8.55)
   
0 0 0 0
então  
0
λ1 R =  1  = G . (8.56)
 
0
Assim, pode-se dizer que o glúon λ1 carrega 2 cores: verde e anti-vermelho; ao interagir
com o quark vermelho (R), troca a cor deste, de vermelho para verde. Como glúons
carregam cores, podem interagir entre si – ao contrário de fótons, que são eletricamente
neutros apesar de mediarem a interação eletromagnética.
Devemos mencionar ainda o grupo responsável pela força fraca: SU (2). Se recordarmos
que neutrinos de mão direita ainda não foram observados – porque não interagem ou
porque não existem – percebemos que os elétrons de mão direita não tem como serem
agrupados, formando singletos. Neutrinos de mão esquerda, por outro lado, interagem
com elétrons (e suas versões mais massivas, o múon e o táuon); estes podem ser
agrupados, portanto, em dubletos.
! ! !
e− µ− τ−
νe νµ ντ
L L L
! ! !
u c t . (8.57)
d0 s0 b0
L,R L,R L,R

− − −
e µ τ
R R R
310
Agora podemos explicar a necessidade do ângulo de Cabibbo de um outro ponto
de vista: os autoestados dos geradores de SU (2)L não são autoestados de massa.
Isto também justifica a inexistência de uma mistura equivalente no setor leptônico:
neutrinos têm massa nula, e por isso, são autoestados simultâneos de massa e dos
geradores de SU (2)L .
As diversas simetrias indicam a conservação das diversas “cargas” a elas associadas,
como pode-se verificar pelos argumentos expostos acima. Precisamos, contudo, de um
formalismo matemático capaz de explicar as interações entre as partı́culas, em especial
entre quarks. Por que eles ainda não foram observados individualmente? Na verdade,
o mesmo acontece com qualquer partı́cula colorida. Por quê? Este é o objetivo da
próxima seção.
8.4 Elementos de Teoria de Campos
No Modelo Padrão, todas as interações fundamentais (com exceção da gravitação!) são

descritas através de simetrias de gauge — a serem definidas adiante — como acontece
no eletromagnetismo (EM). Nesta seção faremos uma breve introdução ao formalismo
de Teoria de Campos, com ênfase nos pontos que serão necessários mais adiante.
8.4.1 Campo Escalar Real
Um formalismo bastante elegante para a Mecânica Clássica é o Lagrangeano, pois

permite uma extensão direta à Teoria de Campos, Clássica ou Quântica. Faremos
agora uma breve revisão desta abordagem.
A equação de movimento de uma partı́cula pode ser obtida a partir do Princı́pio da
Mı́nima Ação S, que é definido como
Z t2
S[x(t)] = L[x(t), ẋ(t)] dt (8.58)
t1
δS = 0 , (8.59)
onde L é a Lagrangeana da partı́cula. A trajetória clássica xc (t) que liga dois pontos
fixos x(t1 ) = x1 e x(t2 ) = x2 pode ser obtida exigindo-se que a S[xc (t)] seja um
extremo no espaço funcional, ou seja, δS[xc (t)] = 0. Assim,
Z t2
dL δL
δS = δ ẋ + δx dt (8.60)
t1 dẋ δx
Z t2
d dL d dL dL
= δx − δx + δx dt (8.61)
t1 dt dẋ dt dẋ dx
t2 Z t2
dL d dL dL
= δx − − δx dt (8.62)
dẋ t1 t1 dt dẋ dx
311
onde admitimos que podemos escrever δ ẋ = (δx). ˙ O primeiro termo da Eq. (8.62) é
nulo, uma vez que os extremos da trajetória são fixos. Termos deste tipo são conhecidos
genericamente como termos de superfı́cie. O segundo termo deve, portanto, se anular
para quaisquer δx. Obtemos, assim, a equação de Euler-Lagrange:
d dL dL
− =0 (8.63)
dt dẋ dx
O estudo de um campo escalar aparece naturalmente como a extensão da Mecânica
Clássica a sistemas contı́nuos. Assim, podemos pensar em uma coleção de osciladores
(harmônicos) formando uma rede unidimensional de parâmetro a, cujos deslocamentos
ηi das respectivas posições de equilı́brio definirão o campo escalar φ(t, x) ao tomarmos
o limite para o contı́nuo a → 0. A Lagrangeana deste sistema deve ser a soma das
Lagrangeanas de todos os osciladores:
1X 1 X
L= mi η̇i2 − k (ηi+1 − ηi )2 , (8.64)
2 i 2 i
A Lagrangeana total pode ser então escrita como
" 2 #
1X m 2 ηi+1 − ηi
L = a η̇ − ka (8.65)
2 i a i a
" 2 #
1X η i+1 − ηi
= a µ η̇i2 − Y (8.66)
2 i a
X
= aLi (8.67)
Zi
−→ dx L quando a → 0 , (8.68)
onde µ = m/a é a densidade linear de massa, Y = ka é o Módulo de Young do meio e

" 2 #
2
1 ∂φ ∂φ
L= µ −Y (8.69)
2 ∂t ∂x
é a chamada densidade de Lagrangeana, por motivos óbvios, e a integral é realizada
sobre todo o “volume” ocupado pelo campo. A aplicação da equação de Lagrange
resulta na bem conhecida equação de uma onda que se propaga com velocidade v =
p
Y /µ:
d2 φ Y d2 φ
− =0 . (8.70)
dt2 µ dx2
Terı́amos obtido exatamente a mesma equação se tivéssemos começado com uma La-
grangeana que difere da Eq. (8.68) apenas por uma constante multiplicativa (o fator
1
2
é mantido por convenção):
" 2 #
1 m 2 ηi+1 − ηi
L = η̇ − (8.71)
2 ka2 i a
" 2 2 #
a→0 1 1 ∂φ ∂φ
−→ − . (8.72)
2 v ∂t ∂x
312
Por isso, quando φ descreve perturbações que se propagam com velocidade da luz, é
natural substituir v por c na equação acima e escrever sua Lagrangeana16 em 3 + 1
dimensões como
1
L = ∂µ φ ∂ µ φ . (8.73)
2
O campo φ é de fato um escalar relativı́stico, pois sob uma transformação de coorde-
nadas (veja Eq. (12.48))
µ
xµ → x0 = Λµ ν xν + aµ (8.74)
se transforma como
φ(x) → φ0 (x0 ) = φ(x) . (8.75)
Pode-se mostrar que o sistema obedece às equações de Lagrange equivalentes para o
campo escalar φ,
dL dL
∂µ − =0 , (8.76)
d(∂µ φ) ∂φ
a menos de termos de superfı́cie, como antes.
Se a Ação for invariante sob uma transformação de um parâmetro α na Lagrangeana,
então é fácil mostrar que
dL dφβ
Z
δS = ∂µ δα d4 x . (8.77)
d∂µ φβ dα
A corrente
dL dφβ
Jαµ ≡ , (8.78)
d∂µ φβ dα
R
portanto, é conservada. Definindo a carga Qα ≡ Jα0 d3 x e integrando
Z
d
0 = ∂µ Jαµ d3 x = Qα + termos de superfı́cie. (8.79)
dt
Em outras palavras, a carga Q é conservada se não houver fluxo através da superfı́cie
que limita o sistema. Todas as simetrias existentes, portanto, implicam a conservação
de uma “carga” – este é o teorema de Noether [3]. Se a simetria acontece no espaço
de coordenadas, obtemos a conservação de energia, momento linear e angular, etc. No
caso dos grupos que atuam no espaço interno das partı́culas, obtemos a conservação
dos números quânticos: carga elétrica, número bariônico, etc.
Aplicando este raciocı́nio ao grupo de translações através da Eq. (8.19), obtemos
aµ ∂µ L = δL (8.80)
dL ν dL ν
= a ∂ν φ + a ∂ν ∂µ φ (8.81)
dφ d∂µ φ

ν dL
= a ∂µ ∂ν φ , (8.82)
d∂µ φ
16
Como trataremos, daqui por diante, sempre de campos, o termo “densidade” deverá estar subenten-
dido ao nos referirmos à Lagrangeana.
313
onde foi utilizada a equação de Euler-Lagrange na última passagem. Igualando o
primeiro e o último termos da expressão acima, obtém-se

dL
∂µ ∂ν φ − L δν aν = 0 ∀aν
µ
, (8.83)
d∂µ φ
que nos permite definir o tensor momento-energia de um campo escalar φ

dL
T µν ≡ ∂ν φ − L δνµ , (8.84)
d∂µ φ
que é conservado, como mostra a Eq. (8.83).

A maior generalização que se pode fazer para a Lagrangeana (8.73) é acrescentar um
termo de potencial V [φ]:
1
L = ∂µ φ ∂ µ φ − V [φ(x)] , (8.85)
2
Quando o potencial é quadrático e dado por V [φ] = 21 µ2 φ2 , obtém-se a equação de
Klein-Gordon:17
(∂µ ∂ µ + µ2 )φ = 0 . (8.86)
que descreve a propagação de perturbações em um campo com massa µ. De fato,

quando µ = 0, recaı́mos na Eq.(8.73), com propagação na velocidade da luz. Além
disso, podemos passar ao espaço dos momenta, realizando uma Transformada de
Fourier na equação acima, obtendo
−E 2 + p2 + µ2 = 0 . (8.87)
Uma regra fácil de ser aplicada para a determinação da massa de um campo — sem
correções quânticas — é calcular a derivada segunda do seu potencial no seu estado
de menor energia. Assim, de modo geral, pode-se dizer que
∂ 2V
µ2 = . (8.88)
∂φ2 φ0
A quantização deste campo, que foge ao escopo deste curso, mostra que µ é realmente
a massa dos quanta deste campo.
8.4.2 Campo Eletromagnético
O potencial vetor A ~ e o potencial elétrico φ do eletromagnetismo (EM) podem ser

~ É fácil verificar que ele de fato se comporta
usados para definir o 4-vetor Aµ ≡ (φ, A).
como tal sob uma transformação de coordenadas do tipo (12.48). Procuramos agora
uma Lagrangeana que forneça as equações de Maxwell ou, equivalentemente, uma
equação de onda para o campo Aµ . Como o potencial vetor define o campo magnético a
17
Note que o sinal do último termo depende da assinatura da métrica usada.
314
menos de um gradiente, esta Lagrangeana deve ainda ser invariante sob transformações
do tipo
Aµ −→ Aµ + ∂µ Λ . (8.89)
Duas transformações consecutivas deste tipo estão relacionadas a uma terceira do

mesmo tipo:
∂µ Λ1 + ∂µ Λ2 = ∂µ Λ3 ⇐⇒ Λ1 + Λ2 = Λ3 . (8.90)
Estas transformações de gauge – ou de calibre – formam um grupo, cuja regra de

composição é a mesma do grupo U (1). O EM é, portanto, invariante sob U (1).
A Lagrangeana que fornece as equações de Maxwell do EM é
L ≡ C Fµν F µν − j µ Aµ , (8.91)
onde C é uma constante (ver exercı́cio 8) e
Fµν ≡ ∂µ Aν − ∂ν Aµ (8.92)
j µ ≡ (ρ, ~j) (8.93)
cujos componentes designam os campos elétrico e magnético e a densidade e corrente

elétricas.
Note que um termo de massa, do tipo 21 m2γ Aµ Aµ , não seria invariante pela trans-
formação (8.89). Por um lado, esta é uma boa notı́cia; afinal, fótons não têm massa.
Por outro lado, deve haver uma maneira de contornarmos esta restrição, se desejamos
descrever as interações eletromagnética e a fraca através do mesmo formalismo, já
que esta é mediada por bósons massivos, como já mencionado. Poderı́amos perguntar
porque não se acrescenta novos termos que se transformem de modo a cancelar a con-
tribuição dos termos de massa. A razão é que estes novos termos levariam a uma teoria
não-renormalizável.18 O procedimento adequado, chamado Mecanismo de Higgs, será
tratado a seguir.
8.4.3 Mecanismo de Higgs
Vamos considerar um campo escalar um pouco mais geral: o complexo. A Lagrangeana

mais simples que podemos escrever é dada por
1 1
L = (∂µ φ)∗ ∂ µ φ − m2φ φ∗ φ , (8.94)
2 2
onde (·)∗ indica o complexo conjugado. Note que ela é invariante sob a transformação
φ → φ exp(ieα), pertencente ao grupo U (1). Quando α é uma constante, a simetria
sob U (1) é dita global.
18
Onde os termos divergentes não podem ser absorvidos por redefinições dos parâmetros da teoria.
315
Figura 8.3: Potencial com quebra espontânea de simetria para um campo escalar com-
plexo, com a 6= 0. O plano horizontal é definido pelas componentes real e imaginária do
campo φ. O cı́rculo, pertencente a este plano, é o vácuo deste campo.
Suponhamos agora uma Lagrangeana que acople este campo e o EM, dada por19
1
L = − Fµν F µν + (Dµ φ)∗ (Dµ φ) − V (φ) (8.95)
4
λ ∗ 2
onde V (φ) = φ φ − a2 , (8.96)
4!
na ausência de termos de fontes do EM. A definição da chamada derivada covariante20
Dµ ≡ ∂µ + ieAµ torna esta Lagrangeana invariante sob transformações locais U (1) (ou
SO(2), claro) de ambos os campos, na quais o parâmetro α depende da posição xν no
espaço de coordenadas:
φ(x) → φ(x) exp[ieα(x)] (8.97)

Aµ (x) → Aµ (x) − ∂µ α(x) (8.98)
Note que esta definição identifica a constante e com a carga elétrica, que acopla o
campo EM com o campo φ – representando, portanto, uma partı́cula carregada elet-
ricamente.
Um esboço do potencial V (φ) pode ser visto na Fig.(8.3). A configuração de menor
energia do campo φ – seu vácuo – é definida pelo mı́nimo deste potencial, em φ∗ φ = a.
Podemos estudar suas excitações ao redor de um vácuo especı́fico, φP = a e escrever
as variações em relação a φP em termos de suas partes real e imaginária, φ ≡ φR +i φI ,
ou seja,
1
φ(x) = a − √ (φR (x) + i φI (x)) . (8.99)
2
Ao redor deste ponto, o potencial dado pela Eq. (8.96) fica
1 λa2 2
V (φ) = φR + O(φ3 ) . (8.100)
2 6
Seguindo a mesma argumentação usada no campo escalar real, Eq. (8.88), podemos
ver que o campo φR possui massa quadrada m2R = λa2 /6, enquanto que o campo φI
19
Por que não há um fator 1/2 multiplicando o termo cinético do campo φ?
20
Não confundir com a derivada covariante da Relatividade geral.
316
não tem massa. Este é o chamado bóson de Goldstone, e aparece sempre que a simetria
do campo é quebrada espontaneamente [11].
O campo de gauge Aµ também adquire um termo de massa. Expandindo o termo da
derivada covariante e lembrando que o módulo do campo φ no seu estado de vácuo
vale a 6= 0, obtemos o termo
e2 a2 Aµ Aµ (8.101)
√
o que indica uma massa mA = 2ea para o campo de gauge Aµ .
8.5 Unificação das Forças Fundamentais e

Transições de Fase
Na seção anterior, acoplamos um campo escalar complexo ao campo eletromagnético
(EM) exigindo que a Lagrangeana resultante fosse invariante sob transformações locais
U (1). Assim, obtivemos um termo de massa para o campo Aµ — o ingrediente de que
precisávamos (seção 8.4.2) para conectar os campos do EM (sem massa) e da força
nuclear fraca (com massa). Agora vamos verificar, de maneira mais formal, como o
mecanismo de Higgs permite a unificação destas forças.
A generalização da derivada covariante para manter a Lagrangeana invariante sob a
ação de grupos não-abelianos é direta:
i i
∂µ −→ Dµ ≡ ∂µ + gAcµ σ c − g 0 Bµ , (8.102)
2 2
onde há 4 campos de gauge: três Acµ (c = 1, 2, 3), associados ao grupo SU (2), e Bµ ,
ao U (1). As matrizes σ c são as matrizes de Pauli, como discutido anteriormente, na
Eq. (8.40). Da mesma forma que antes, usamos o potencial (8.96) para o campo φ,
pois apresenta um vácuo não-trivial. Assim, podemos estudar o comportamento da
Lagrangeana ao redor de !
1 0
φP = √ . (8.103)
2 a
p
O campo φ, como antes, adquire massa mφ = a λ/6. Os valores das massas adquiridas
pelos campos de gauge podem ser obtidos calculando |Dµ φ|2 diretamente da expressão
(8.102), o que leva aos termos extras
1 a2 2 1 2
g (Aµ ) + g 2 (A2µ )2 + (−gA3µ + g 0 Bµ )2

(8.104)
2 4
na Lagrangeana. Os campos A1µ e A2µ são associados aos bósons vetoriais carregados
Wµ± , com massa ag/2. O terceiro termo acima representa o Zµ0 , com massa a/2. Estes
são os três mediadores da força fraca. Há um quarto grau de liberdade, pois começamos
com 4 campos de gauge. Exigindo-se ortogonalidade ao Zµ0 , obtemos a expressão
1 0 3

Aµ = p g Aµ + gBµ , (8.105)
g2 + g02
317
que é associado ao fóton. Assim, o campo eletromagnético não é associado à simetria
U (1) presente no inı́cio, mas à que permaneceu após a quebra. Indica-se este processo
por
SU (2)L ⊗ U (1)Y −→ U (1)EM , (8.106)
associando a simetria incial à hipercarga discutida anteriormente.
Esta é a teoria das interações eletrofracas de Glashow-Weinberg-Salam [6], pela qual

seus autores ganharam o prêmio Nobel de 1979. O bóson de Higgs, representado aqui
pelo campo φ, é o único campo escalar previsto no modelo padrão, e até o momento
ainda não foi observado. Exatamente o mesmo processo acontece em supercondutivi-
dade, e pode ser usado para explicar a expulsão do campo magnético de dentro de
supercondutores: o fenômeno Meissner, que passamos a explicar. À medida em que a
temperatura abaixa, a forma do potencial passa de um mı́nimo global para uma que
apresenta mı́nimos degenerados, como o discutido aqui. Assim, a simetria é quebrada,
e o campo de gauge mediador da interação adquire massa. A diferença é que aqui a
interação efetiva é a eletromagnética; pode-se dizer, então, que tudo acontece como se
os fótons fossem massivos no interior do material, tendo, portanto, um alcance finito:
não há campos EM nesta região do espaço!
Todo o mecanismo é possı́vel graças à forma do potencial, que permite que o campo
φ tenha um valor não-nulo no seu estado de vácuo. Se isto não acontecesse, as forças
fraca e eletromagnéticas seriam mediadas pelos campos de gauge Acµ e Bµ , todos sem
massa.21 . O cálculo do potencial efetivo requer conhecimentos de Teoria Quântica de
Campos que fogem a este curso, mas podemos entendê-lo como o potencial clássico
adicionado de correções quânticas. Em primeira ordem, estas correções indicam a
energia das flutuações ao redor da configuração clássica do campo φ. A principal
caracterı́stica dos potenciais efetivos que nos interessa é a mudança no sinal do termo
de massa, que depende da temperatura do sistema:
1 σ λ
VT (φ) = m2T φ2 + φ3 + φ4 (8.107)
2 3! 4!
Assim, o potencial pode ter um ou dois mı́nimos, se o sistema estiver, respectivamente,

acima ou abaixo da temperatura crı́tica Tc definida pela mudança de sinal de m2T .22 A
quebra de simetria com a diminuição da temperatura não é totalmente inesperada. O
mesmo fenômeno acontece, por exemplo, em um ferromagneto. Em altas temperaturas,
os spins eletrônicos estão orientados em todas as direções – o sistema é simétrico
sob ação de O(3). Quando o sistema se esfria abaixo da temperatura de Ginzburg,
aparecem domı́nios de orientação: blocos onde o spin está orientado na mesma direção.
O sistema escolheu um vácuo e quebrou a simetria.
21
Basta fazer a = 0 nas expressões acima.
22
Aqui optamos por utilizar a notação usual na literatura e indicar o termo de massa por m2 , ainda
que este possa ser negativo.
318
Figura 8.4: Comportamento do potencial efetivo V [φ] com a mudança progressiva no
sinal do termo de massa para uma transição de fase de primeira (à esquerda) e segunda
(à direita) ordens.
Mais do que uma curiosidade, há uma analogia formal entre a quebra de simetria
em Teoria de Campos a temperatura Finita (isto é, não nula) e transições de fase
em Mecânica Estatı́stica. Pode-se adotar, por exemplo, o valor esperado do vácuo
do campo φ como parâmetro de ordem; a fase ocupada pelo sistema é caracterizada
pelo valor deste parâmetro. Seguindo a nomenclatura clássica de transições de fase,
diz-se que a transição é de primeira ordem quando a mudança no valor é brusca e
se dá através da nucleação de bolhas da nova fase em meio à atual. O potencial
efetivo apresenta um mı́nimo local na posição da fase atual, e um global na posição
da fase nova, para a qual o sistema está passando – ver Fig. (8.4a). Assim sendo,
é energeticamente favorável realizar a transição, que acontence tanto por ativação
térmica quanto por tunelamento. Existe um valor crı́tico para o raio das bolhas23
abaixo do qual a tensão superficial supera o ganho energético da transição e faz com
que elas encolham até desaparecer por completo. As bolhas com raio maior que este
valor crı́tico se expandem até percolarem, ocupando, então, todo o volume disponı́vel
e completando a transição. Um exemplo tı́pico é a transição lı́quido-vapor que a água
sofre ao atingir a temperatura de ebulição. 24 Quando a mudança no parâmetro de
ordem é suave, a transição é dita de segunda ordem. Não há barreira no potencial
efetivo entre as fases atual e futura – ver Fig. (8.4b). Este processo de transição recebe
o nome de decomposição espinodal e pode ser entendido decompondo-se o campo φ
em seus modos normais: os de maiores comprimentos de onda decaem primeiro. Ou
seja, a transição se dá de maneira deslocalizada no espaço.
A busca por uma teoria de unificação (GUTs25 ) da força forte com eletrofraca é
perseguida avidamente. Um dos indı́cios de que esta unificação é real é a observação de
que as constantes de acoplamento das três forças convergem para aproximadamente
o mesmo valor à medida em que a energia aumenta. No caso do eletromagnetismo,
23
Neste caso, a configuração do campo recebe o nome de sphaleron.
24
Em um lı́quido real, claro, há que se levar em conta o empuxo, que dificulta a colisão entre as bolhas
antes que elas sejam literalmente jogadas para fora do sistema.
25
Do inglês Grand Unified Theories.
319
Figura 8.5: Esquematização do processo de blindagem de uma carga elétrica positiva em
um meio dielétrico.
esta constante é (proporcional a) a carga elétrica e. Sua dependência com a energia

pode ser entendida através da criação de pares virtuais, também conhecida como po-
larização do vácuo – visto como um meio dielétrico ordinário. Assim, a carga vista
por um projétil depende da sua distância mı́nima até a carga espalhadora central e,
portanto, da energia do processo de colisão. Este efeito, conhecido como blindagem ou
screening, está ilustrado na Fig. 8.5 e equivale ao aumento da carga elétrica (ou seja,
do acoplamento) com a energia.
Em teorias não-abelianas, ao contrário, acontece o efeito inverso: a anti-blindagem

[3]. A constante de acoplamento diminui com o aumento da energia. Este processo
está intimamente ligado com o que se chama de liberdade assintótica dos quarks, já
mencionado anteriormente.
Uma extrapolação deste comportamento mostra que as três constantes de interação

(eletromagnética, fraca e forte) devem alcançar aproximadamente o mesmo valor em
torno de E ∼ 1015 GeV – veja a Fig. 8.5. Atualmente, os aceleradores atingem cerca
de 105 GeV . Para se chegar a este resultado, somos obrigados a supor que nada fora do
modelo padrão acontecerá no deserto de várias ordens de grandeza em energia entre
a unificação eletrofraca e a total.
Tentativas de agrupamento das simetrias SU (2)L , U (1)Y e SU (3)C ainda não foram
bem sucedidas. O grupo mais simples com graus de liberdade suficientes é o SU (5)
[4, 5], no qual os quarks e léptons são membros do mesmo multipleto. Infelizmente,
este modelo foi descartado porque previa um decaimento do próton em uma escala de
tempo já descartada experimentalmente.
Outros motivos para buscar um grupo mais fundamental são dados pelas falhas do
modelo padrão em explicar o grande número de parâmetros livres (constantes de
acoplamento, massas), a existência de três famı́lias de léptons, que parecem se repetir,
e a existência do bóson de Higgs, ainda não observado experimentalmente. Um dos
candidatos atuais a este posto é a chamada supersimetria, que permitiria a trans-
formação de férmions em bósons, colocando-os em um mesmo multipleto.
320
Figura 8.6: Variação das constantes de interação com a energia. O eixo horizontal se
estende por várias ordens de grandeza.
8.6 O Universo como um acelerador
O modelo padrão das partı́culas elementares é bem testado até a unificação eletrofraca.
Um modelo verdadeiramente fundamental para as partı́culas elementares, contudo,
deve ser válido, no mı́nimo, até a energia de Planck, da ordem de 1019 GeV , acima da
qual a gravitação deve obrigatoriamente ser considerada. É claro que energias deste
nı́vel não podem ser obtidas em nenhum acelerador no planeta, mas há um local, ou
melhor, uma época, quando elas eram perfeitamente acessı́veis: quando o universo
tinha cerca de 10−44 s de idade. A partir deste instante, a expansão do universo foi
paulatinamente diminuindo a temperatura e, acredita-se, permitindo uma seqüência
de quebras de simetrias (veja também o Capı́tulo 2):
• GUT
Pelas justificativas apresentadas anteriormente, acredita-se que um grupo de
simetria que englobaria as forças forte e eletrofraca deve ter se dividido nos
conhecidos SU (3)C ⊗ SU (2)L ⊗ U (1)Y quando T ∼ 1015 GeV e t ∼ 10−36 s.
• Eletro-fraca
A transição eletro-fraca, que separou a força fraca da eletromagnética quebrando
os grupos SU (2)L ⊗ U (1)Y → U (1)EM , ocorreu em t ∼ 10−10 s, a uma tem-
peratura T ∼ 300 GeV . Nesta quebra as partı́culas adquirem massa através do
mecanismo de Higgs. Não se sabe, ao certo, qual a ordem desta transição, mas
parece ser fracamente de primeira ordem.
Acredita-se que esta transição seja fundamental para a existência de matéria
atualmente em nosso universo, através do mecanismo explicado mais adiante.
• Quiral
Dois fenômenos caracterizam o final da época das transições, quando t ∼ 10−6 s,
e T ∼ 1 GeV : o confinamento dos quarks e a conseqüente formação dos hádrons.
Nesta faixa de energia, é razoável desprezar as massas dos dois ou três quarks
mais leves: u, d e s. A quebra espontânea da simetria quiral fornece, através
321
do mecanismo de Higgs, massa para estes quarks — que são então confinados.
Claro, as massas efetivas adquiridas são muito maiores do que as massas inici-
ais desprezadas, o que justifica a aproximação. Os bósons de Goldstone desta
simetria são os pı́ons, cujas pequenas massas indicam a validade do raciocı́nio.
Esta simetria não descreve uma relação fundamental, e é conseqüência apenas
dos pequenos valores das massas dos três quarks mencionados.
Antes desta transição, o universo era composto por um plasma de quarks e
glúons. Experiências estão atualmente em curso no Relativistic Heavy Ion Col-
lider (RHIC), em Brookhaven (NY, EUA), para tentar reproduzir este estado da
matéria.
A partir deste ponto, o universo é muito bem descrito pelo modelo cosmológico padrão.
Vejamos a seguir como este cenário pode responder a uma pergunta fundamental: se
partı́culas e anti-partı́culas foram criadas em igual número, de onde veio toda a matéria
que conhecemos? Não é plausı́vel imaginar um mecanismo que separasse estes pares
por distâncias tão grandes a ponto de não poderem se aniquilar.
Deve haver, portanto, um mecanismo para criar mais partı́culas do que anti-partı́culas.
A diferença relativa, expressa em função do número total de bárions NB e de anti-
bárions NB̄ como
NB − NB̄
δ= (8.108)
NB + NB̄
é estimada em torno de 10−9 . Apesar de parecer pequena, corresponde a toda a matéria
ordinária presente no universo.
Sakharov [13] determinou as três condições necessárias para a criação de bárions — a

chamada bariogênese:
1. Interações que violem a conservação do número de bárions:

De outra forma, um bárion seria criado sempre com um anti-bárion, e deveria-se
imaginar um mecanismo bastante eficiente para separá-los espacialmente e evitar,
assim, sua futura aniquilação mútua.
2. O sistema deve estar fora do equilı́brio térmico:

Em equilı́brio, as reações que geram a procurada assimetria podem ser invertidas
com a mesma taxa, anulando seu efeito. Isto é alcançado quando as taxas de
reações são menores que a taxa de expansão do universo (dada pela constante de
Hubble) ou em transições de fase de primeira ordem, como as que acontecem em
algumas quebras de simetria, dependendo do potencial efetivo.
3. Interações que discriminem matéria de anti-matéria:

Ou seja, violação das simetrias discretas de carga (C) e paridade (P) simultane-
amente. Já observadas em laboratório no decaimento do káon, controlado pela
interação fraca.
322
Antes da primeira quebra de simetria, não havia diferença entre as partı́culas e suas
forças de interação; partı́culas supermassivas presentes – quaisquer que fossem – po-
diam decair em prótons ou em elétrons e vice-e-versa. Não havia conservação, por-
tanto, de número bariônico (item 1 de Sakharov). Isto, contudo, não era suficiente,
pois bárions e anti-bárions eram criados à mesma taxa.
Abaixo da escala de unificação, no entanto, as partı́culas supermassivas devem decair
em bárions ou léptons, mas esta reação não podem ser invetida, pois a taxa de expansão
do universo é muito alta: não há mais energia disponı́vel para criar as partı́culas
supermassivas – o sistema está fora do equilı́brio (item 2).
O último ingrediente é obtido pelas interações fracas, que violam CP naturalmente.
O processo de geração da assimetria bariônica durante a quebra de simetria eletro-fraca
pode ser assim resumido: o universo atinge a temperatura crı́tica; o potencial efetivo
correspondente adquire uma estrutura de mı́nimos degenerados. A seguir, os mı́nimos
diferenciam-se e bolhas da nova fase, mais favorável energeticamente, começam a
surgir; aquelas com raio acima de um certo valor crı́tico se expandem. Dentro de cada
bolha, a simetria foi quebrada; fora, o sistema ainda está na fase anterior. À medida em
que uma determinada bolha se expande, o parâmetro de ordem muda abruptamente
com a passagem da parede, deixando o sistema fora do equilı́brio térmico: o sistema
passa rapidamente de um mı́nimo local a um global. Uma flutuação local no número
médio de bárions, presente no instante de passagem da parede da bolha, seria então
mantida.
Embora todos os ingredientes pareçam estar presentes no universo primordial, o
mecanismo exato e seus detalhes permanecem em aberto e são objeto de intenso estudo
atual.
8.7 Exercı́cios
1. Conjecture a existência de partı́culas compostas por cinco quarks (um pen-
taquark), obtidas através da colisão de raios γ ou de pósitrons sobre núcleos
de Deutério. Quais quarks comporiam estas partı́culas, supondo que elas teriam
cargas +1 ou nula? Procure nos ArXives referências a respeito.
2. Mostre que o operador de paridade é um elemento do grupo de ordem 2. Qual a
regra de composição adequada?
3. Considere o grupo de ordem 3. Mostre que este é um exemplo de grupo cı́clico,
isto é, onde todos os elementos são potencias de um mesmo. Mencione algumas
realizações deste grupo.
4. O grupo de matrizes 2 × 2 com elementos reais com multiplicação matricial como
regra de composição é um grupo de Lie. Determine seus elementos inversos e o
neutro. Este grupo é abeliano?
323
5. Prove que a matriz B, dada pela Eq. (8.30) deve ser anti-simétrica.
6. Prove a Eq. (8.31).
7. Prove a Eq. (8.33). Dica: separe a expansão em potências pares e ı́mpares.
8. Deduza as equações de Maxwell no vácuo a partir da Eq. (8.91). Qual equação
deve ser imposta para obtê-las na forma usual? Determine a constante C ade-
quada.
9. Considere o potencial V (φ) = aφ2 + bφ3 + cφ4 , com a, b e c constantes conhecidas
e com os sinais adequados para uma transição de fase de primeira ordem. Estime
o valor crı́tico para o raio da bolha.

[1] M; Gell-Mann, Phys. Rev. 92, 883 (1953), Nuovo Cimento 4, Suppl. 2, 848 (1956).
T. Nakano e K. Nishijima, Prog. Theor. Phys. 10, 581 (1953).
[2] Quarks and Leptons: An Introductory Course in Modern Particle Physics, F.
Halzen e A.D. Martin (Wiley, 1984)
[3] An introduction to Quantum Field Theory, M.E. Peskin e D.V. Schroeder (Addi-
son Wesley, 1995).
[4] J.C. Pati e A. Salam, Phys. Rev. Lett. 31, 275 (1973).
[5] H. Georgi e S.L. Glashow, Phys. Rev. Lett. 32, 438 (1974).
[6] S.L. Glashow, Nucl. Phys. 22 (1961) 579. S. Weinberg, Phys. Rev. Lett. 19 (1967)
1264. A. Salam, Proceedings of the Eighth Nobel Symposium, N. Svartholm (Ed.)
(1968, Wiley-Interscience, New York), p. 367.
[7] Quantum Mechanics, C. Cohen-Tannoudju, B. Diu e F. Laloë (John Wiley &
Sons, 1977).
[8] Quantum Field Theory, M. Kaku (Oxford Univ. Press, 1993)
[9] Group Theory and its application to physical problems, M. Hamermesh (Dover,
1962).
[10] Classical Mechanics, H. Goldstein (Addison Wesley, 1965)
[11] J. Goldstone Nuovo Cimento 19 (1961) 154. J. Goldstone, A. Salam, e S. W.
Weinberg, Phys. Rev. 127 965.
[12] P.W. Higgs, Phys. Lett. 12 (1964) 132; Phys. Rev. Lett. 13 (1964) 308; Phys. Rev.
145 (1966) 1156. T.W.B. Kibble, Phys. Rev. 155 (1967) 1554.G.S. Guralnik, C.R.
Hagen and T.W.B. Kibble,Phys. Rev. Lett. 13 (1964) 585. F. Englert e R. Brout,
Phys.Rev. Lett. 13 (1964) 321.
[13] A.D. Sakharov, Pis’ma Zh. Eksp. Teor. Fiz. 5 (1967) 32.
324
Capı́tulo 9
Astropartı́culas II
Júlio C. Fabris1
9.1 Introdução
A relatividade geral é a moderna teoria da gravitação, que substituiu a teoria da
gravitação newtoniana, contendo-a unicamente como o limite de campos fracos. A
relatividade geral é uma teoria clássica, no sentido de não quântica, que quando apli-
cada ao estudo do Universo como um todo gera o que usualmente se denomina de
Modelo Cosmolǵico Padrão (MCP). A descrição do Universo utilizando como base a
teoria da relatividade geral está, em geral, em excelente acordo com a observação.
Mas, sob vários aspectos, a descrição que ela fornece é considerada incompleta. Ao
mesmo tempo, existem uma série de problemas que afetam o MCP que, mantendo-se a
nı́vel puramente clássico, só podem ser resolvidos introduzindo condições inicias muito
especiais no inı́cio da história do Universo.
A teoria quântica de campos é um outro alicerce da fı́sica moderna. Ela é a base
do modelo padrão das partı́culas elementares. Este modelo padrão das partı́culas el-
ementares, assim como os conceitos básicos da teoria quântica de campos, foram de-
scritos no capı́tulo precedente. Quando se considera a existência de campos quânticos
no Universo em expansão descrito pela relatividade geral, vários fenômenos novos
são preditos. Em particular, espera-se a formação de defeitos topológicos devido às
transições de fase nos sistemas quânticos graças ao processo de resfriamento do Uni-
verso que se expande. Por outro lado, campos quânticos podem gerar sistemas com
pressão negativa, em fases altamente “quentes” da história do Universo, dando lugar
1
Afiliação : Departamento de Fı́sica, Universidade Federal do Espı́rito Santo, Goiabeiras - Vitória -
CEP29060-900, Espı́rito Santo .
325
ao que se denomina de “modelos inflacionários”. Estes modelos inflacionários podem
responder favoralmente aos problemas de condições iniciais no Universo a que se fez
menção acima. Ao mesmo tempo, talvez a existência de campos quânticos no Universo
possa resolver dois dos maiores problemas existentes atualmente em cosmologia: o da
matéria e energia escura.
Neste capı́tulo abordaremos alguns tópicos relacionados à introdução de campos
quânticos em um Universo em expansão descrito pela teoria (clássica) da relativi-
dade geral. Os tópicos selecionados, em um área extremamente vasta, abrangem os
defeitos topológicos, o modelo inflacionário, o problema da matéria e energia escura,
abordando-se rapidamente outros assuntos como os raios cósmicos de alta energia. Em
vez de exaurir o problema das consequências da existência de campos quânticos em um
Universo em expansão, procura-se ilustrar alguns aspectos da combinação da teoria
quântica de campos e a cosmologia, através de uma análise relativamente detalhada
dos tópicos citados acima.
9.2 Defeitos Topológicos
9.3 Introdução
Defeitos topológicos são estruturas resultantes de transições de fase em um sistema
fı́sico. Nem toda transição de fase implica no aparecimento de defeitos topológicos;
entretanto, se há, em um dado sistema, defeitos topológicos, podemos dizer que houve
neste sistema uma transição de fase. Um dos exemplos mais simples de formação
de defeitos topológicos é o processo de congelamento de uma superfı́cie de um lago.
No estado lı́quido, as moléculas de água se encontram em um estado completamente
desordenado, e portanto altamente simétrico: a água parecerá sempre ter o mesmo
aspecto em qualquer lugar do fluido. Entretanto, quando a temperatura cai abaixo
do ponto crı́tico de congelamento (zero grau Celsius), gelo se forma, o que implica
que as moléculas se ordenam naquela região, formando uma estrutura cristalina. Mas,
a superfı́cie de um lago não se congela instantânea e simultaneamente em todos os
pontos. Desta forma, o ordenamento do cristal em uma região que se congelou pode
não ser o mesmo que em outra região onde também houve o congelamento. Quando
estas regiões diferentes se tocam, a interface entre elas forma um defeito topológico
devido exatamente ao diferente ordenamento da estrutura cristalina que cada uma
delas apresenta. Muitos outros exemplos de formação de defeitos topológicos podem
ser extraı́dos da fı́sica do estado sólido.
Em cosmologia, os defeitos topológicos surgem devido ao processo de resfriamento
que ocorre graças à expansão do Universo. A Teoria Quântica de Campos prevê que,
à medida que a temperatura abaixa, transições de fase devem ocorrer. O mecanismo
que gera estas transições de fase foi descrito no capı́tulo precedente. No processo de
326
transição de fase, o sistema descrito por campos quânticos deve tender ao seu estado
de vácuo, quer dizer, o estado de energia mı́nima. Se o vácuo de um dado sistema
não é único, então diferentes regiões do espaço podem estar em diferentes estados de
vácuo. Na interface entre estas diferentes regiões, defeitos topológicos se formarão.
O horizonte cosmológico define uma região que está causalmente conectada. De uma
maneira grosseira podemos definir o horizonte cosmológico, em um dado tempo t,
como a distância percorrida por um raio luminoso entre o instante inicial da evolução
do Universo e o instante de tempo t. Como será descrito na próxima seção, o Uni-
verso visı́vel hoje pode ser constituı́do de regiões que não tinham conexão causal em
épocas bem remotas. Se transições de fase ocorreram naquela época, podemos ter a
presença de defeitos topológicos no Universo visı́vel pois diferentes regiões podem ter
”escolhido” diferentes estados de vácuo. Entretanto, estas regiões que estavam, no Uni-
verso primordial, causalmente desconectada podem se encontrar dentro do horizonte
cosmológico hoje.
A natureza do defeito topológico que se forma devido ao resfriamento provocado pela
expansão do Universo, e da existência de um horizonte causal finito, depende da
estrutura dos campos quânticos envolvidos. Dito de outra forma, a natureza do defeito
topológico depende da estrutura do vácuo da teoria. Há três defeitos principais que
podem se formar no processo de expansão do Universo: as paredes cósmicas, as cordas
cósmicas e os monopolos2 . As paredes seriam defeitos bi-dimensionais, ao passo que as
cordas seriam defeitos uni-dimensionais e os monopolos defeitos pontuais. A formação
de um destes defeitos será determinada pelo tipo de simetria apresentado pelo estado
de vácuo. Descreveremos a seguir o processo de formação de cada um destes defeitos
e suas consequências para a evolução ulterior do Universo.
9.4 Paredes cósmicas

As paredes cósmicas se formam quando o estado de vácuo não é único e apresenta, além
disto, simetria discreta. Isto quer dizer que poderemos, por exemplo, ter dois diferentes
estados de energia mı́nima. Vamos considerar um campo escalar real quântico cuja
Lagrangiana, no espaço-tempo de Minkowski, é dada por
1
L = ∂µ φ∂ µ φ − V (φ) , (9.1)
2
onde o primeiro termo do lado direito corresponde ao termo cinético, ao passo que
o segundo termo corresponde ao potencial. Suponhamos agora que o potencial, que
representa a auto-interação do campo, seja dado por
λ 2
V (φ) = (φ − η 2 )2 . (9.2)
4
2
Há ainda um outro tipo importante de defeito topológico denominado de textura, sobre o qual faremos
menção posteriormente
327
O potencial é sempre positivo definido, se anulando unicamente em dois pontos, φ =
±η, o que define os estados de vácuo. Neste caso, observe-se primeiramente que o vácuo
não é único; os dois estados de vácuo estão ligados por operação discreta: η → −η.
Além disto, o potencial tem um máximo local em φ = 0. Este é um ponto de equilı́brio
mas meta-estável. Este estado é chamado de falso vácuo.
A equação de movimento que rege a evolução deste campo é,
2φ = −V 0 (φ) , (9.3)
onde a linha indica derivada em relação ao campo φ. Utilizamos também a notação

padrão para o operador D’Alambertiano:
1 ∂2 ∂2 ∂2 ∂2
2≡ − − − . (9.4)
c2 ∂t2 ∂x2 ∂y 2 ∂z 2
Consideremos agora uma configuração estática do campo φ onde ele dependa apenas
da coordenada z. Neste caso a equação (9.3) se simplifica, resultando em,
d2 φ
2
= V 0 (φ) . (9.5)
dz
Esta equação admite a integral primeira (após ser multiplicada por dφ
dz
), que tem a
forma
1 dφ 2
−V (φ) = C , (9.6)
2 dz
onde C é uma constante. Procurando agora uma solução tal que o potencial e o
termo cinético se anulem quando z → ±∞, o que é necessário para que a energia da
configuração seja finita, obtemos a integral
Z r Z
dφ 2 dφ
z − z0 = ± p =± . (9.7)
2V (φ) λ φ2 − η 2
Esta integral tem solução sob a forma,

√
2 φ
z − z0 = ∓ √ arctanh . (9.8)
η λ η
Ou,
h η √λ i
φ = ∓η tanh √ (z − z0 ) . (9.9)
2
Observe-se que, quando z → ±∞, φ → ±η. Além do mais, a derivada de φ tende a
zero neste limite, o que mostra a coerência com a condição inicialmente imposta.
A solução descrita anteriormente pode dar origem a uma parede cósmica. Existem,
de fato, duas soluções: a que corresponde ao sinal positivo e a que corresponde ao
sinal negativo. No primeiro caso, a configuração tende para o estado de vácuo −η
quando z → +∞, e para o estado de vácuo +η quando z → −∞. No segundo caso, o
comportamento é invertido. A existência de uma parede cósmica, neste caso, é devido
328
ao fato que, se em duas regiões vizinhas, uma delas se encontra no primeiro estado,
e a outra no segundo estado, há um defeito topológico na superfı́cie de contato entre
estas duas regiões. No caso, a superfı́cie de contato que define o defeito topológico é o
plano (x, y); logo, a parede cósmica é um defeito topológico bi-dimensional. Observe-
se que uma das configurações não pode se deformar continuamente levando à outra
configuração. Desta forma, o defeito se forma inevitavelmente na interface entre as
duas regiões que se estabeleceram em diferentes estados de vácuo.
Na interface entre duas regiões em diferentes estados de vácuo o campo escalar não
pode se encontrar em nenhum dos dois estados de vácuo diferentes. Logo, a única
possibilidade é que o campo escalar esteja no estado de falso vácuo, quer dizer, no
estado φ = 0. Portanto, a parede carrega uma energia com densidade correspondendo à
do falso vácuo. As paredes cósmicas são, devido a isto, defeitos topológicos perigosos
do ponto de vista cosmológico: como são objetos bi-dimensionais, a quantidade de
energia que elas carregam é imensa, e pode conduzir ao recolapso do Universo ainda
em sua fase primordial. Entretanto, configurações mais complexas que a descrita acima
podem fornecer resultados que evitam este problema.
9.5 Tensor de momento energia para um fluido de

parede cósmica
Podemos calcular a energia e a equação de estado de um fluido de paredes cósmicas.
O tensor de momento-energia associado a um campo escalar com auto-interação é
1 1
Tµν = φ,µ φ,ν − gµν φ,ρ φ,ρ + gµν V (φ) . (9.10)
2 2
A densidade de energia está associada à componente 0 − 0 do tensor de momento-
energia, enquanto a pressão está associada às componentes espaciais Tij :
T00 = ρ , Tij = pδij . (9.11)
Calcularemos primeiramente a densidade de energia:

1
ρ = T00 = ∂t φ∂t φ − g00 ∂ρ φ∂ ρ φ + g00 V (φ)
2
1 2 1
= ∂z φ + λ(φ2 − η 2 )2
2 4
λ 4 1
= η h √ i , (9.12)
2 cosh4 η√ λ (z − z )
2 0
onde utilizamos a solução para paredes cósmicas (9.9) e a métrica minkowskiana gµν =
ηµν = (1, −1, −1, −1). Para a pressão px ao longo do eixo x, temos
1
px = Txx = ∂x φ∂x φ − gxx ∂ρ φ∂ ρ φ + gxx V (φ)
2
329
1 2 1
= − ∂z φ − λ(φ2 − η 2 )2
2 4
λ 4 1
= − η h √ i . (9.13)
2 cosh4 η√ λ (z − z )
2 0
Seguindo os mesmos passos, podemos encontrar a expressão para a pressão nas direções
y e z:
λ 1
py = − η 4 h √ i , (9.14)
2 cos4 η√ λ (z − z )
2 0
pz = 0 . (9.15)
Desta forma, a expressão o tensor de momento-energia de uma corda cósmica é

λ 4 1
Tµν = η h √ i (1, −1, −1, 0) . (9.16)
2 cos4 η√ λ (z − z )
2 0
O exemplo apresentado acima refere-se a uma parede cósmica orientada ao longo da

direção z. Em um Universo homogêneo e isotrópico, tem-se na verdade um gás de
paredes cósmicas, com orientações aleatórias. Logo, para se obter a equação de estado
associado a um fluido de paredes cósmicas, é preciso realizar uma média espacial sobre
todas as orientações possı́veis. Realizando esta média espacial, obtém-se a seguinte
expressão para um fluido cosmológico de paredes cósmicas:
Tµν = ρ(1, −2/3, −2/3, −2/3) . (9.17)
Logo, neste caso, a equação de estado para um fluido cosmológico de cordas cósmicas
é
2
p=− ρ . (9.18)
3
As cordas cósmicas representam, portanto, um fluido com pressão negativa. Estes
tipos de fluidos desempenham um papel muito importante em cosmologia visto que eles
podem gerar uma fase de expansão acelerada do Universo, o que é bastante interessante
por razões que serão expostas posteriormente.
9.6 Cordas cósmicas e monopolos

As propriedades discutidas acima para o caso das paredes cósmicas estão intrinsica-
mente ligadas ao fato que o estado de vácuo para o campo escalar apresenta a simetria
discreta η → −η. Entretanto, existem teorias de campos baseadas em campos escalares
complexos. Para estes campos a simetria do estado de vácuo muda inteiramente. Além
do mais, o próprio campo escalar pode ser um multipleto, com componentes definidas
em um espaço abstrato, que podemos denominar de espaço interno. Podemos ilustrar
o significado deste espaço interno considerando o caso das partı́culas elementares. Os
330
quarks, por exemplo, aparecem em três pares, como explicitado no capı́tulo anterior.
Cada par é caracterizado por um ”sabor”, sendo que as partı́culas de cada par se
distinguem pela carga elétrica. Existem propriedades de simetria conectando estas
partı́culas. Diz-se então que estas simetrias agem sobre o espaço abstrato, interno,
onde cada vetor neste espaço caracteriza um estado associado a uma determinada
partı́cula com um valor para a carga elétrica e com um determinado sabor. Estas
simetrias diferem portanto das simetrias do espaço-tempo, como translação e rotação.
Do ponto de vista do espaço-tempo, o campo complexo a que nos referimos inicial-
mente é um escalar; mas do ponto de vista do espaço interno, ele se comporta como
uma quantidade contendo componentes e que possui simetrias especı́ficas. Com es-
tas estruturas mais complexas, podem-se se formar defeitos topológicos chamados de
cordas cósmicas, ou ainda podem se formar os chamados monopolos magnéticos. O
que distingue um caso do outro é a estrutura do vácuo, em particular seu grupo de
simetria.
No caso das cordas cósmicas o campo escalar é complexo. Portanto, a Lagrangiana
que descreve o sistema lê-se
√ h1 i
L= −g ∂ρ φ∗ ∂ ρ φ − V (φ∗ φ) . (9.19)
2
Seguindo o exemplo anterior, pode-se escolher um potencial sob a forma
λ ∗
V (φ∗ φ) = (φ φ − η 2 )2 . (9.20)
4
Este potencial tem um estado de vácuo, caracterizado como antes por V (φ∗ φ) = 0,
correspondendo a
φ = η eiθ . (9.21)
Quando θ é uma constante, teremos uma corda cósmica global. Por outro lado, quando
θ for uma função das coordenadas espaciais e temporais, tem-se uma corda cósmica
local. Neste último caso, é necessário considerar também, na análise do problema, o
campo eletromagnético que corresponde a esta corda. Por simplicidade, vamos nos
deter no caso das cordas cósmicas globais.
O potencial (9.20) tem a forma de um ”chapéu mexicano” que foi mostrado no capı́tulo
anterior. O estado de vácuo onde V (φ∗ φ) = 0 corresponde a um cı́rculo. Existe ainda
4
um máximo local em φ = 0, onde a energia é dada por V (0) = λη4 . Quando o campo
escalar se estabelece no seu estado de menor energia, ele deve ”escolher” um valor para
o mı́nimo permitido por (9.21), o que implica em definir um valor para θ no intervalo
0 ≤ θ ≤ 2π. Diferentes regiões, que não possuam contato causal, escolherão diferentes
valores para θ, portanto diferentes estados de vácuo. Isto novamente criará defeitos
topológicos. Só que agora, devido à simetria do estado de vácuo, os objetos serão cor-
das cósmicas, defeitos topológicos unidimensionais que apresentam, por conseguinte,
simetria cilı́ndrica, como veremos posteriormente.
331
Quando duas regiões com diferentes escolhas de θ se tocam, é possı́vel ”girar” contin-
uamente a orientação do vácuo de maneira a fazer a transição de um estado de vácuo
para o outro e nenhum defeito topológico ocorre. Mas quando três regiões que corre-
spondem a diferentes ”escolhas” de θ se tocam, isto não ’e mais possı́vel. A interseção
entre três regiões formará uma linha. Nestes pontos de interseção, o campo escalar
não poderá ter o valor correspondente a nenhum dos três estados de vácuo. Logo, a
única configuração de equilı́brio possı́vel é que o campo escalar fique no máximo local
correspondente a φ = 0. Este é o estado de falso vácuo para esta teoria. Temos por-
tanto uma corda cósmica, um defeito topológico que, no modelo descrito pelo potencial
(9.20), possui uma energia associada ao estado de falso vácuo.
O cálculo das componentes do tensor de momento-energia da corda cósmica apre-
senta dificuldades consideráveis, comparado com o que foi apresentado para as pare-
des cósmicas. As equações, de fato, são muito mais complicadas, sobretudo quando
se considera cordas cósmicas com simetria local, e em geral é preciso realizar uma
série de aproximações ou simplesmente empregar métodos numéricos. Tais análises
mostram que quando se tem um fluido cosmológico de cordas cósmicas, o tensor de
momento-energia deste fluido assume a forma
Tµν = ρ(1 − 1/3, −1/3, −1/3) . (9.22)
O fluido cosmológico de cordas cósmicas apresenta, como no caso das paredes cósmicas,
pressão negativa.
Ao contrário do caso das paredes cósmicas que apresentam vários problemas quando
introduzidas em uma estrutura cosmológica, as cordas cósmicas se revelam bem mais
interessantes. Em primeiro lugar, a contribuição de um fluido de cordas cósmicas para
a densidade total de energia do Universo não é tão catastrófica como no caso das
paredes cósmicas, justamente por se tratarem de objetos uni-dimensionais: um fluido
de corda cósmica pode existir sem contradizer o cenário de um Universo em expansão
compatı́vel com as observações. Além do mais, as cordas cósmica fornecem um cenário
para a formação de estruturas locais no Universo (galáxias, aglomerados de galáxias,
etc.) bem atraente.
De fato, um dos grandes problemas para explicar a existência de estruturas locais no
Universo reside no mecanismo de aglomeração local de matéria quando se considera
um universo globalmente homogêneo e isotrópico. O espaço-tempo criado por uma
corda cósmica se assemelha ao de um plano do qual se teria tirado uma fatia em
forma de cunha, a partir do ponto onde se localiza a corda cósmica, e depois colado as
bordas. Isto é denominado de ”déficite angular”. Partı́culas que se deslocam a partir
de regiões distantes (portanto planas), em trajetórias paralelas, ao se aproximarem da
corda cósmica são como que ”focalizadas”, suas trajetórias se aproximando. Quando
as cordas cósmicas se deslocam em um espaço onde as partı́culas estão em repouso
(precisamente o que acontece em um universo homogêneo e isotrópico, no sistema
332
de coordenadas co-móvel), este deslocamento provoca aglomeração de matéria, dev-
ido ao déficite angular na geometria na vizinhança da corda cósmica, provocando o
aparecimento de poços de potencial que gerarão posteriormente objetos como galáxias
e aglomerados de galáxias. Se este cenário corresponde realmente ao que ocorre na
natureza, apenas uma comparação detalhada com a observação poderá decidir.
Outro defeito topológico possı́vel são os monopolos magnéticos. Para que eles ocorram
é necessário que exista um multipleto de campos escalares. Quando este multipleto
inclui três campos escalares, podemos escrever
~ = (φ1 , φ2 , φ3 ) .
φ (9.23)
Ao escrevermos o campo como em (9.23) estamos querendo dizer que os três campos
escalares estão relacionados por transformações de simetria, que no caso são simetrias
internas (quer dizer, simetrias diferentes às do espaço-tempo), como às do isospin.
Neste caso, o grupo de simetria é o SO(3) que corresponde ao grupo rotação neste
espaço abstrato.
Os monopolos seriam, portanto, descritos pela Lagrangeana
√ ~ µφ~ − V (φ.
~ φ)]
~
L= −g[∂µ φ.∂ , (9.24)
onde o potencial pode ser, por exemplo,
V (φ. ~ = λ (φ.
~ φ) ~φ ~ − η 2 )2 . (9.25)
4
Observem que definimos um produto interno no espaço interno onde ”vive” o mul-
tipleto de campos escalares. Novamente, temos um máximo local, correspondendo a
~ = ~0, e um estado de vácuo correspondendo a φ.
φ ~φ ~ = η 2 . Agora, o estado de vácuo
tem uma simetria SO(3), com a estrutura de uma esfera, e não mais de um cı́rculo
como no caso das cordas cósmicas.
Para que um defeito topológico se forme agora será preciso a interseção de quatro
regiões que se estabeleceram em diferentes estados de vácuo. Temos assim um ponto.
Neste ponto, os campos não poderão estar em nenhum dos diferentes estados de vácuo
das regiões que se interceptam. Assim, de novo, a única possibilidade é que ali os
campos se encontrem no estado de equilı́brio correspondente ao máximo local. Temos
portanto um defeito pontual. É este defeito que chamamos de ”monopolo magnético”.
Esta denominação se deve ao fato que, além do defeito ser pontual, a interação que
ele cria em torno dele, possui simetria esférica. Tudo se passa, portanto, como se este
defeito correspondesse a uma carga pontual.
Os monopolos magnéticos carregam também uma energia associada ao fato de se en-
contrarem em um estado de falso vácuo. Mas, a existência de monopolos magnéticos
traz também problemas a nı́vel cosmológicos. Isto porque a energia deste estado
de falso vácuo é determinada pela energia em que ocorre a transição de fase. Con-
figurações do tipo monopolar surgem em teorias de Grande Unificação, que predizem
333
transições de fase com escalas de energia da ordem de 1014 GeV . Como no caso das
cargas elétricas, teremos dois ”sinais” possı́veis, correspondendo aos monopolos e anti-
monopolos. Calculando a abundância de monopolos criados no momento da transição
de fase, teremos uma contribuição destes objetos para a densidade total do Universo
muito superior à densidade crı́tica, e o Universo já teria se recolapsado muito antes
que as galáxias pudessem ter se formado. Este problema pode ser resolvido no âmbito
do modelo de inflação a ser descrito posteriormente.
Existem várias outras estruturas de defeitos topológicos possı́veis. Se considerarmos,
por exemplo, um multipleto de campos escalares com quatro componentes, transições
de fase podem originar o que se denomina usualmente de texturas. A representação
visual de tais defeitos é bem mais complicada. Por outro lado, podem existir defeitos
hı́bridos, como cordas cósmicas que têm em suas extremidades monopolos magnéticos.
Outras configurações são possı́veis, e que dependem do conteúdo da teoria e do mecan-
ismo de quebra de simetria.
9.6.1 Defeitos topológicos e os raios cósmicos de alta energia
Existem ”sinais” que permitem detectar a presença dos defeitos topológicos descritos
acima? Em princı́pio, existem várias possibilidades de verificar se defeitos topológicos
se formaram durante a evolução do Universo. Uma delas já foi mencionada: as cordas
cósmicas podem gerar um mecanismo para a formação das estruturas locais existentes
no Universo. Se as cordas cósmicas foram realmente as ”sementes” das estruturas
locais, o mecanismo de geração dessas estruturas deve estar refletido nas caracterı́sticas
gerais da distribuição de matéria no Universo, por exemplo no espectro da anisotropia
da radiação cósmica de fundo, que será descrito posteriormente.
Mas, existem outras possibilidades. Uma delas vem dos chamados ”raios cósmicos de
alta energia”. A Terra é constantemente bombardeada por partı́culas vindas do espaço,
por exemplo prótons. Estes prótons possuem em geral uma energia extremamente alta,
e ao colidirem com as partı́culas da região externa da atmosfera terrestre, geram um
”chuveiro” de partı́culas secundárias que chegam à superfı́cie da Terra. O estudo da
estrutura deste ”chuveiro” de partı́culas permite ter várias informações, como a energia
do próton primário, a direção da região no espaço de onde veio o próton, etc.
Raios cósmicos de energias extremamente altas já foram detectados. Tem-se eventos
de raios cósmicos com energia de até 1022 eV , o que é uma energia muito alta. Afinal,
aceleradores na Terra permitem acelerar partı́culas com energia de até 1012 eV . Muitos
daqueles raios cósmicos de alta energia podem ter se originados em mecanismo con-
hecidos, como a explosão de supernovas. Mas, quando a energia se torna muito elevada,
não se tem ainda um mecanismo eficaz para gerá-los.
Além do mais, as partı́culas ao se deslocarem no espaço interagem com os fótons
da radiação cósmica de fundo. Eles perdem portanto energia devido à interação com
334
estes fótons através do efeito Compton. Cálculos detalhados indicam que nenhuma
partı́cula deveria chegar à Terra com energia superior a aproximadamente 1020 eV .
Este é o chamado limite GZK3 . O fato de partı́culas de origem cósmica com energia
superior ao estabelecido por aquele limite já tenham sido detectadas é um dos grandes
enigmas na fı́sica atual.
Os defeitos topológicos são um dos candidatos para a origem de raios cósmicos com
energia tão alta. Como já foi dito, os defeitos topológicos carregam uma grande quan-
tidade de energia. Partı́culas podem, portanto, se encontrar aprisionadas no defeito.
Devido a própria dinâmica seguida por estes defeitos, estas partı́culas podem se lib-
erar, decaindo em seguida em, por exemplo, prótons com energia compatı́vel com
os raios cósmicos mais energéticos já detectados. Este mecanismo é particularmente
atraente no caso dos monopolos e das cordas cósmicas. Mas, apenas um estudo mais
detalhado permitirá decidir a verdadeira origem destes misteriosos raios cósmicos de
alta energia.
9.7 O modelo de Inflação
9.7.1 Introdução
O modelo cosmológico padrão (MCP) é muito bem sucedido sob vários aspectos.
Esteticamente, trata-se de um modelo simples e coerente. Além disto ele leva a
predições que concordam de maneira surpreendente (dada a sua simplicidade) com
as observações. Em primeiro lugar, ele incorpora naturalmente o cenário de um Uni-
verso em expansão. Depois, ele explica de forma muito natural a existência de uma
temperatura do Universo, representada pela radiação cósmica de fundo, altamente
isotrópica, consistente com o espectro planckiano de um corpo negro à temperatura
de 2, 7 K. Por fim, o MCP prevê a abundância dos elementos quı́micos leves (hidrogênio
até o lı́tio), com uma concordância com os dados observacionais a menos de 1%, algo
extraordinário tendo-se em vista que o processo de nucleossı́ntese primordial ocorreu
nos primeiros 180 s da história do Universo, quer dizer, em torno de 15 bilhões de anos
atrás.
Os sucessos do MCP não devem, entretanto, ocultar os sérios problemas que o afetam.
Entre estes problemas podemos citar, notadamente, o da platitude do Universo, o do
horizonte e o da formação das estruturas locais (galáxias, aglomerados de galáxias,
etc) observadas. Esses problemas serão descritos com mais detalhes a seguir, mas
no momento podemos unicamente enfatizar que todos eles estão relacionados com a
questão da escolha de condições iniciais muito particulares para o Universo no seu
inı́cio para que aqueles sucessos citados anteriormente sejam obtidos.
3
Abreviação dos sobrenomes dos fı́sicos que determinaram este fenômeno, o americano Kenneth
Greisen e os russos Georgi Zatsepin e Vadim Kuz’min
335
Estas dificuldades associadas ao MCP podem ser, de uma certa maneira, resolvidas se
supusermos que existiu uma fase de expansão exponencial no Universo primordial, bem
antes que a nucleossı́ntese ocorra. Este perı́odo de expansão exponencial, ou quase ex-
ponencial, é denominado de fase inflacionária. Chama-se de modelos inflacionários as
tentativas de explicar porque esta fase ocorreu. Este capı́tulo destina-se a fornecer uma
visão geral do que seria esta fase inflacionária, como ela resolve alguns dos problemas
do MCP, e quais são as dificuldades que se encontram para sua implementação. Um
aspecto muito interessante dos modelos inflacionários é que eles constituem uma inter-
essante aplicação dos conceitos e técnicas da teoria quântica de campos à cosmologia,
tais como teorias de unificação, transições de fase, etc. Fundamentalmente, o modelo
de inflação se baseia em um campo escalar, denominado inflaton, que adquire massa
em um processo de quebra espontânea de simetria devido ao processo de expansão, e
consequente resfriamento, do Universo.
9.8 Os problemas do Modelo Cosmológico Padrão

Vamos descrever agora brevemente quatro dos principais problemas do modelo cos-
mológico padrão: o problema do horizonte; o problema da platitude; o problema das
perturbações cosmológicas iniciais; o problema dos monopolos magnéticos.
9.8.1 O problema do horizonte
O Universo encontra-se hoje em um estado de equilı́brio térmico, exibindo uma tem-

peratura de 2, 7 K. Em qualquer direção do céu, o espectro fotônico de fundo é sempre
o mesmo, a menos de pequenas anisotropias da ordem de 10−5 . Entretanto, se recuar-
mos no passado, percebe-se que estamos recebendo fótons de regiões que, no momento
de sua emissão, não se encontravam em contato causal. Logo, é surpreendente que
estas regiões exibam a mesma temperatura.
Para compreender quantititativamente isto, vamos considerar que recebemos agora
fótons vindos de duas fontes localizadas em direção diametralmente opostas no céu.
Estes fótons foram emitidos no momento em que a radiação se desacoplou da matéria.
No MCP, isto ocorreu em td ∼ 1012 s, sendo que t0 ∼ 1017 s corresponde ao momento
atual. Podemos calcular a distância da fonte até nós considerando a trajetória do
fóton. Vamos supor que esta trajetória seja radial. Por simplicidade, será assumido
que o fator de escala se comporta como a(t) = a0 t1/2 , sendo a0 uma constante que fixa
a escala, durante toda a história do Universo. Isto introduz, em relação ao resultado
exato, um erro da ordem da unidade. Então,
dt
ds2 = c2 dt2 − a2 (t)dr2 = 0 → dr = ±c
a(t)
Z 0 Z tr
dt 1 1
dr = −c → re = 2c (tr1/2 − te1/2 ) ≈ 2c t1/2 . (9.26)
re te a(t) a0 a0 r
336
onde designamos pelo sub-escrito e as quantidades de emissão, e pelo sub-escrito r
as quantidades de recepção. Escolhemos acima o sinal negativo de maneira a ter um
valor positivo para a distância coordenada da fonte ao receptor. Consideramos que
tr >> te .
Por outro lado, nós podemos calcular o tamanho do horizonte causal na época em que
os fótons foram emitidos, quer dizer, te . Isto define a região que possui conexão causal.
Para calcular esta região, naquela época, devemos avaliar a distância percorrida por
um fóton desde o inı́cio da história do Universo. Temos, usando o mesmo procedimento
que no caso anterior,
Z te 1/2
dt te
rc = c = 2c .. (9.27)
0 a(t) a0
Dividindo a distância coordenada entre as fontes pela distância causal, obtemos
r
2re tr
= ∼ 103 . (9.28)
rc te
Assim, as regiões que emitiram os fótons que recebemos hoje em direções diametral-
mente opostas, estavam separadas por uma distância mil vezes maior que o horizonte
causal naquela época. Logo, elas não poderiam se encontrar hoje em equilı́brio térmico.
Entretanto, observamos que estas regiões exibem a mesma temperatura. Este é o prob-
lema do horizonte.
9.8.2 O problema da platitude
Em princı́pio, o Universo pode apresentar uma curvatura espacial positiva (uma es-
fera), nula (um plano) ou negativa (uma pseudo-esfera). A curvatura espacial do Uni-
verso é determinada pela densidade de matéria nele existente. Para uma dada densi-
dade, denominada de densidade crı́tica, o Universo teria curvatura espacial nula; se
a densidade for superior a esta densidade crı́tica, sua curvatura será positiva; se a
densidade for inferior à densidade crı́tica, a curvatura será negativa.
Consideremos a equação de Friedmann, quer dizer, a componente temporal das
equações de Einstein:
8π
H2 + 2 = Gρ , (9.29)
a 3
onde H = aȧ , ρ é a densidade total de matéria do Universo, incluindo a contribuição dos
bárions, radiação, etc, e k é a curvatura da seção espacial. Dividindo toda a equação
por H 2 e re-arranjando os termos, temos então,
8πG ρ
1−Ω=− , Ω= . (9.30)
a2 H 2 3 H2
O parâmetro Ω é conhecido como parâmetro de densidade. Observe-se que quando Ω =
1, o Universo é espacialmente plano, quer dizer, k = 0. Isto define a densidade crı́tica.
Utilizando os valores de hoje, quer dizer, H0 ≈ 72 Mkmpc.s
, obtemos ρc0 ≈ 10−29 cmg 3 .
337
As observações hoje indicam que Ω0 ∼ 1, 02, quer dizer, a densidade do Universo é,
pelo menos, muito próxima à densidade crı́tica. O problema da platitude surge do fato
que a equação (9.30) depende do tempo. Para um Universo em expansão dominado
pela matéria, a = a0 t2/3 e H = 3t2 . Assim,
9 t2/3
1−Ω=− . (9.31)
4a20
Logo, a medida que o tempo passa, o parâmetro de densidade se afasta do seu valor
crı́tico, salvo se desde o inı́cio Ω = 1, o que fixa de uma vez por todas k = 0.
Reversamente, a medida que voltamos a tempos anteriores, para um dado valor de Ω,
mais e mais o parâmetro de densidade se aproxima do seu valor crı́tico. Em outras
palavras, a densidade crı́tica representa um ponto de equilı́brio instável. Por exemplo,
se hoje (t0 ∼ 1017 s), Ω0 é próximo da unidade pelo valor citado acima, quer dizer
Ω0 −1 ∼ 0.02, na época do desacoplamento entre a matéria e a radiação (td = 1011 s), o
parâmetro de densidade deveria ter um valor tal que Ωd −1 ∼ 2×10−4 . Se remontarmos
ao perı́odo da nucleossı́ntese primordial (tn ∼ 1 s), Ωn − 1 ∼ 10−6 .
Em outras palavras, para que o parâmetro de densidade tenha hoje um valor próximo
ao crı́tico, em tempos anteriores, ele deveria estar extremamente próximo ao valor
crı́tico.
Este fato implica que, para explicar o valor de Ω hoje, é preciso uma escolha ex-
tremamente particular do parâmetro de densidade no inı́cio da história do Universo.
Esta escolha parece ser pouco natural, por ser muito particular. Este é o problema da
platitude.
9.8.3 O problema das perturbações primordiais
O raio visı́vel do Universo hoje é o chamado raio de Hubble. O raio de Hubble pode ser
caracterizado pela distância que a luz percorreu desde o inı́cio da história do Universo
até hoje. Logo,
c
RH = , (9.32)
H0
uma vez que a idade do Universo é dada pelo inverso da constante de Hubble. As
estruturas locais no Universo são caracterizadas por flutuações na distribuição de
matéria cuja escala é dada pelo comprimento de onda λ. Em princı́pio, λ se estende,
teoricamente, de zero a infinito. Vamos considerar uma flutuação ocorrida no Uni-
verso primordial, de comprimento de onda λi . À medida que o Universo expande, o
comprimento de onda da flutuação é também esticado devido à variação do fator de
escala a(t). Aliás isto resulta da própria noção de fator de escala. Entretanto, o raio
de Hubble definido acima varia com a constante de Hubble, isto é, cresce linearmente
com o tempo, já que H ∝ 1t . Mas, para um Universo dominado pela radiação ou pela
matéria, o fator de escala varia com o tempo segundo uma lei de potência: a(t) ∝ t2/3
338
para um Universo dominado pela matéria; a(t) ∝ t1/2 , para um Universo dominado
pela radiação. Assim, se uma dada perturbação se originou no Universo primordial
dentro do raio de Hubble naquela época (o que devemos esperar, uma vez que a flu-
tuação deve ter uma origem causal), ela terá uma escala efetiva cada vez menor que o
raio de Hubble, de maneira que hoje todas aquelas flutuações deveriam ter uma escala
extremamente menor que raio de Hubble hoje. Mas, existem estruturas cuja dimensão
caracterı́sticas são da ordem do raio de Hubble. Há aı́ uma dificuldade inegável.
Por outro lado, é preciso compreender a origem das flutuações primordiais que deram
origem às estruturas conhecidas hoje. O mecanismo de geração destas flutuações deter-
mina as propriedades estatı́sticas da aglomeração de matéria hoje. No MCP, não existe,
em princı́pio, nenhum mecanismo natural, a não ser as flutuações estatı́sticas normais
de um gás. Ocorre, que isto resulta em flutuações de amplitude extremamente pequenas
que não poderiam resultar nas estruturas observadas hoje. Há também o mecanismo
das cordas cósmicas que, entretanto, parece ser desfavorecido pela observação.
9.8.4 O problema dos monopolos magnéticos
Poderı́amos dizer que o problema do monopolo reflete na verdade a dificuldade do

MCP de incorporar, por si só, o aparecimento de qualquer fóssil de uma transição
de fase ocorrida no Universo primordial. Suponhamos uma transição de fase ocor-
rida quando o Universo tinha t ∼ 10−30 s. Nesta época, a temperatura do Universo
deveria ser da ordem de T ∼ 1016 GeV . O raio de Hubble na época era igual a
RHi ∼ 10−20 cm. Suponhamos agora que um monopolo magnético tenha sido for-
mado, graças a esta transição de fase, em cada região causal. Quer dizer, terı́amos um
monopolo magnético por horizonte de Hubble naquela época. Ora, a massa de cada
monopolo pode ser avaliada, e para transições no seio da Teoria de Grande Unificação,
terı́amos uma massa mm ∼ 1016 GeV . Isto conduz a uma densidade de matéria, na
época, devido aos monopolos, da ordem de ρi ∼ 1045 cmg 3 . Se a densidade de matéria
decresce com o cubo do fator de escalar, isto corresponderia hoje a uma densidade
de matéria devida aos monopolos da ordem de ρ0 ∼ 1013 cmg 3 . Esta densidade é 42
ordens de magnitude maior que a densidade crı́tica. Em outras palavras, a existência
de monopolos magnéticos devido a transição de fase resultante da quebra espontânea
de simetria em Teorias de Grande Unificação, implicaria que o Universo teria uma
curvatura positiva extremamente grande, e já teria recolapsado muito antes que as
galáxias (e consequentemente a vida tal como a conhecemos) tivessem se formado.
Assim, o MCP dificilmente poderia incorporar a existência de fósseis das transições
de fase que devem ter ocorrido no Universo primordial.
339
9.9 Uma fase de expansão acelerada no Universo
primordial
Uma das caracterı́sticas importantes do MCP é o fato que o Universo exibe uma
expansão sub-luminal. Isto quer dizer que o Universo está desacelerando: ä < 0. A
desaceleração do Universo é fruto do tipo de matéria que nele existe, radiação ou
matéria sem pressão. De fato, a partir das equações de Einstein, nós temos
n
ä 4πG X
=− (1 + 3ωi )ρi , (9.33)
a 3 i=0
onde i = 1, ..., n indicam oss diferentes componentes materiais, e onde supomos que
estes diferentes componentes obedecem uma equação de estado pi = αi ρi . É evidente,
a partir desta expressão, que se 1 + 3αi > 0, então inevitavelmente ä < 0, e o Universo
desacelera. Isto ocorre em particular se a pressão de cada fluido é positiva. Mas, se
por acaso existem fluidos de pressão negativa, é possı́vel gerar uma fase de expansão
acelerada.
Os problemas citados anteriormente que afetam o MCP podem ser solucionados se
houver uma fase na história primordial do Universo em que os fluidos que dominaram
o conteúdo energético têm pressão negativa, gerando conseqüentemente uma expansão
acelerada. A seguir, nós veremos que a introdução de uma fase de expansão acelerada,
pode solucionar os problemas citados acima. Entretanto, podemos observar a partir
de (9.33) que para se obter uma expansão acelerada é preciso introduzir um fluido
com pressão negativa, tal que 1 + 3αi < 0.
Fluidos com pressão negativa são, em princı́pio, objetos exóticos. Mas, na verdade,
eles ocorrem em situações ordinárias. Pode-se ter uma descrição de situações onde
eles surgem nas referências [5, 6]. Em Relatividade Geral, há uma forma natural de
introduzir uma fase acelerada: a inclusão de uma constante cosmológica nas equações
de Einstein. Na verdade, a quatro dimensões, a forma mais geral de se escrever as
equações de Einstein é:
1
Rµν − gµν R − Λgµν = 8πG Tµν , (9.34)
2
onde Λ é a constante cosmológica. Esta é a forma mais geral das equações de Einstein
visto que o lado esquerdo desta equação representa o tensor mais geral que se pode
escrever a quatro dimensões que tenha divergência nula e que conduza a equações
diferenciais de segunda ordem (ainda que não lineares).
Com a introdução da constante cosmológica, as equação (9.33) se torna,
n
ä 4πG X Λ
=− (1 + 3ωi )ρi + , (9.35)
a 3 i=0 3
Portanto, a constante cosmológica pode gerar uma fase de expansão acelerada (ä > 0)
se este termo dominar sobre as outras formas de matéria.
340
Vamos, a seguir, considerar que o termo cosmológico domina sob os demais. Se pode-
mos ignorar o primeiro termo do lado direito de (9.35), nós temos como solução para
o fator de escala, para o caso onde a secção espacial é plana:
r Λ
a(t) ∝ exp t . (9.36)
3
Quer dizer, o Universo se expande exponencialmente. Uma fase onde o Universo se
comporta desta forma é denominada de fase de de Sitter.
Vamos supor, por enquanto, que o Universo atravessou uma fase de expansão aceler-
ada bem no inı́cio de sua história. Isto pode conduzir a uma solução para os problemas
citados acima. A solução para o problema da platitude é imediata. Basta analisar a
equação (9.30): O termo H é constante, enquanto o fator de escala cresce exponen-
cialmente; logo, 1 − Ω se aproxima exponencialmente de zero; uma fase acelerada
prediz que o Universo deve tender rapidamente para uma situação onde sua densidade
é quase igual à densidade crı́tica, como observamos hoje.
No que diz respeito ao problema do horizonte, é preciso analisar novamente a evolução
do horizonte partı́cula. Tı́nhamos visto que a distância coordenada do horizonte
partı́cula é dado por (9.26). Agora, nós devemos dividir o processo de integração
em duas partes: primeiramente, o Universo é dominado pela constante cosmológica,
o que gera a expansão acelerada; depois, a radiação domina o conteúdo material do
Universo. Os detalhes relativos à implementação deste cenário serão discutidos poste-
q
riormente. O fator de escala se comporta inicialmente como a(t) = a1 eM t , M = Λ3 ,
evoluindo posteriormente como a(t) = a2 t1/2 . As constantes a1 e a2 dependem das
condições de junção, que impõe que o fator de escala deve ser uma função contı́nua
do tempo, e da normalização escolhida para este mesmo fator de escala. Neste caso,
considerando que a fase de expansão acelerada termina em t = tf , impondo que o
valor do fator de escala neste momento é igual a 1 (o que sempre é possı́vel, já que
isto implica em fixar a escala), obtemos :
a = eM (t−tf ) , 0 ≤ t ≤ tf ; (9.37)
(9.38)
Assim,
tf
dt0
Z
rc = . (9.39)
0 a(t0 )
Tem-se então,
1 M tf
rc = (e − 1) . (9.40)
M
Vamos supor que tf ∼ 10−33 s, que é a época onde a Teoria de Grande Unificação
sofre uma quebra espontânea de simetria. O valor final de rc , quer dizer, da região
causalmente conectada, pode ser extremamente grande se M tf >> 1. Isto implica que
o valor da constante cosmológica deverá ser muito grande para que o problema do
horizonte seja resolvido. Veremos posteriormente que isto pode de fato ocorrer.
341
O problema da superprodução de monopolos é resolvido similarmente. Como a den-
sidade de monopolo decresce com o inverso do cubo do fator de escala, obtemos que,
devido a expansão exponencial do Universo, a densidade de monopolos decresce ex-
ponencialmente, e com isso a contribuição dos monopolos para a densidade total do
Universo deve ser extremamente pequena. No caso dos problemas das flutuações pri-
mordiais, a expansão acelerada também conduz a resultados bastante positivos. Afi-
nal, as distâncias fı́sicas variam com o fator de escala. Desta forma, durante a fase de
expansão acelerada, os comprimentos de onda das perturbações são esticadas expo-
nencialmente, enquanto o raio de Hubble H = aȧ permanece essencialmente constante.
Com isto, nessa fase, o comprimento de onda das perturbações se torna muito maior
que o raio de Hubble. Quando a fase de expansão acelerada termina, o comprimento
de onda cresce mais lentamente que o raio de Hubble, e pode-se assim facilmente se
ter hoje perturbações cuja escala é comparável ao raio de Hubble hoje.
A fase de expansão acelerada fornece uma elegante explicação para a origem das
flutuações que resultaram nas estruturas observadas hoje no Universo. Como o com-
primento de onda cresce exponencialmente durante esta fase, elas poderiam ser ini-
cialmente muito menores que o raio de Hubble naquela época. Com isto, podemos
pensar que as flutuações primordiais eram de origem quântica. Os termos perturba-
tivos devem, portanto, serem descritos por modos quânticos. Estes modos quânticos
devem ser, obviamente, ortonormais. Devido ao processo de normalização dos modos
quânticos, é possı́vel obter o valor da amplitude destas flutuações assim como suas
caracterı́sticas estatı́sticas, uma vez que o estado de vácuo quântico pode ser rep-
resentado por uma distribuição gaussiana, como no caso do problema do oscilador
harmônico na mecânica quântica usual. De fato, os modos perturbativos podem ser
pensados como um conjunto de osciladores harmônicos desacoplados. As observações
recentes do espectro da anisotropia da radiação cósmica de fundo parecem estar em
acordo com este cenário. No caso clássico, a amplitude das perturbações permanece
completamente arbitrária.
9.10 Implementando um modelo inflacionário
Os resultados descritos acima indicam que a existência de uma fase de expansão acel-
erada do Universo, conhecida como fase inflacionária, pode resolver satisfatoriamente
os problemas mais importantes que afetam o modelo cosmológico padrão. A questão é
como gerar esta fase de expansão acelerada. Vimos acima que isto pode ser conseguido
através de uma constante cosmológica. Mas, há um problema maior em utilizar uma
constante cosmológica para este fim: exatamente porque o valor de Λ é constante, en-
quanto todas as outras formas de energia implicam uma densidade que decresce com
a expansão do Universo. Logo, uma vez que a constante cosmológica domina sobre
as outras formas de energia, ela continuará dominando posteriormente. Neste caso, a
342
fase de expansão acelerada jamais terminaria, e isto está em evidente contradição com
o que se conhece do Universo.
Há uma forma elegante e bastante atraente de se lidar com este problema. Ela consiste
em considerar que a fase de expansão acelerada não é gerada por uma constante cos-
mológica, mas por um campo que evolui com a expansão do Universo e que, por um
breve perı́odo de tempo, se comporta como uma constante cosmológica. Tais campos
podem se originar no processo de quebra espontânea de simetria em teorias funda-
mentais, como a teoria de Grande Unificação.
Consideremos um campo escalar com auto-interação. O tensor de momento-energia
para tal campo é dado por
1
Tµν = ∂µ φ∂ν φ − gµν ∂ρ φ∂ ρ φ + V (φ) , (9.41)
2
onde V (φ) é o termo de potencial que expressa a auto-interação do campo. No caso
em que consideramos a métrica de Friedmann-Robertson-Walker,
ds2 = dt2 − a2 (t)γij dxi dxj , (9.42)
onde γij é a métrica sobre a seção espacial a curvatura constante, temos então para
as componentes do tensor momento-energia do campo escalar,
1
T00 = φ̇2 + V (φ) , (9.43)
2
1
Tij = φ̇ − V (φ) a2 (t)γij .
2
(9.44)
2
Podemos comparar estas expressões com as de um fluido perfeito, para o qual
T00 = ρ , Tij = p a2 (t)γij . (9.45)
Assim, a densidade de energia e a pressão associada a este campo escalar se escrevem,

respectivamente,
1
ρ = φ̇2 + V (φ) , (9.46)
2
1
p = φ̇2 − V (φ) . (9.47)
2
Vimos anteriormente que para gerar uma fase de expansão acelerada é necessário que
o Universo seja dominado por um fluido de pressão negativa. Isto pode acontecer, no
caso de um campo escalar com auto-interação, caso o termo de potencial domine sobre
o termo cinético. De fato, se
1
V (φ) >> φ̇2 , (9.48)
2
então
p ≈ −ρ . (9.49)
Ora, uma equação de estado p = −ρ é o que caracteriza uma constante cosmológica
ou, em outras palavras, um fluido cuja densidade de energia é constante. De fato,
343
Figura 9.1: Forma tı́pica do potencial do inflaton.
utilizando a lei de conservação para um fluido de densidade ρ e pressão p em um

Universo em expansão, junto com a equação de estado acima, temos,
ȧ
ρ̇ + 3 (ρ + p) = 0 ⇒ ρ̇ = 0 ⇒ ρ = constante . (9.50)
a
O que se deseja no fundo, é um campo escalar com auto-intereção tal que, inicialmente,
o termo cinético domine sobre o termo de potencial, seguido de uma fase onde o termo
de potencial domine sobre o termo cinético (o que gera a expansão acelerada), depois
do que o termo cinético volta a dominar, de tal maneira que o Universo se comporte
como no MCP. Isto pode ser obtido se o potencial tiver, por exemplo, a forma esboçada
na figura (9.1). Um exemplo de potencial com as caracterı́sticas desejadas é o dado
por
V (φ) = V0 − βφ3 + λφ4 , (9.51)
onde V0 , β e λ são constantes positivas. Este potencial diverge para φ → ±∞. Por
outro lado, ele se comporta de forma praticamente constante para φ ≈ 0. Além do
mais, ele tem um mı́nimo absoluto em
3β
φm = . (9.52)
4λ
Obviamente, tal potencial representa um campo massivo. De fato, a massa de um
campo escalar é dada por
9 β2
m2 = V 00 (φ)|φ=φm = . (9.53)
4 λ
Um aspecto fundamental no cenário inflacionário é a necessidade que tal modelo leve

a uma transição para a fase de um Universo dominado pela radiação. Afinal, é preciso
que a nucleossı́ntese ocorra, e isto requer um Universo quente, dominado pela radiação.
O modelo descrito acima pode conduzir a esta transição para um Universo dominado
pela radiação. De fato, quando φ ≈ 0, a energia do campo escalar está armazenada
sob a forma de energia potencial, a pressão efetiva é negativa, e o campo escalar se
344
comporta como uma constante cosmológica, gerando uma expansão acelerada. Lenta-
mente, o campo escalar se dirige ao mı́nimo do potencial. Quando isto ocorre, ele
começa a oscilar em torno do ponto mı́nimo. Esse campo escalar não é o único campo
fundamental a estar presente no Universo. Existem os outros campos, que represen-
tam as demais interações. Estes campos estão, no fundo, acoplados. O processo de
oscilação do inflaton, conjuntamente com o seu acoplamento aos outros campos, gera
uma transferência de energia. Os outros campos são excitados, dando inı́cio a um
Universo dominado pela radiação. Tal processo se denomina reaquecimento. Pode-se
também entender este processo como sendo a transformação da energia potencial em
cinética.
Um aspecto delicado no modelo inflacionário reside no fato que não se conhece ainda
campos escalares fundamentais. Entretanto, estes campos devem resultar de teorias
como a Teoria de Grande Unificação, cujos efeitos caracterı́sticos se manifestam a
escalas de energia extremamente altas, muito superiores às que podem ser alcançadas
nos atuais aceleradores de partı́culas. Entretanto, as consequências muito positivas que
tais teorias teriam a nı́vel cosmolológico, as tornam extremamente atrativas. Poderia
ser dito que as consequências cosmológicas de tais teorias são evidências indiretas que
elas devem se realizar na natureza.
9.11 Matéria e energia escuras
9.11.1 Introdução
Um dos problemas maiores em cosmologia consiste em medir a quantidade de matéria

existente no Universo e sua natureza. A forma mais direta de realizar esta medida é
através da detecção e análise da radiação eletromagnética emitida pela matéria dis-
persa no Universo. Entretanto, existem dificuldades quando se tenta deduzir a quan-
tidade de matéria existente no Universo a partir deste método direto. A mais evidente
delas é devido ao processo de absorção: a luz emitida, por exemplo, por um gás em
uma galáxia distante é absorvida parcialmente ou totalmente pela matéria que existe
entre os emissores e os nossos detectores. Logo, devemos esperar que a determinação
da matéria existente no Universo pelo método de detecção direta revele apenas uma
fração da massa total existente.
Assim, é interessante desenvolver métodos indiretos de estimativas da matéria exis-

tente no Universo que não sejam unicamente baseados na detecção da radiação emitida
pela matéria. Um dos métodos indiretos possı́veis é a análise do efeito gravitacional que
a matéria exerce nas suas vizinhanças. Outros métodos foram desenvolvidos através
da análise da anisotropia da radiação cósmica de fundo, lentes gravitacionais, estudo
da distância luminosidade de objetos distantes, como as supernovas tipo Ia, etc. Tais
345
testes, frequentemente, permitem fornecer informações não apenas sobre a quantidade
de matéria, como também sobre sua natureza.
Quando tais métodos indiretos são utilizados, grandes surpresas aparecem. Aparente-
mente, a maior parte da matéria existente no Universo, em torno de 99%, não é detec-
tada diretamente. Uma fração substancial desta matéria não deve ser constituı́da de
átomos ou pelas partı́culas elementares que conhecemos. Além do mais, a maior parte
desta ”matéria oculta” deve ser constituı́da por um fluido exótico cuja a pressão é neg-
ativa (denominado de energia escura), enquanto a outra parte deve ter pressão nula
(denominado de matéria escura). O que são estes constituintes ”não-convencionais”
do Universo? Este é um dos problemas mais importantes hoje em cosmologia.
Neste capı́tulo, revisaremos como se chega às conclusões expostas acima e quais são
as hipóteses para explicar a existência e a natureza da matéria exótica no Universo.
O leitor poderá também consultar as referências [7, 8].
9.12 A matéria escura
A primeira evidência da existência de um constituinte material exótico no Universo

vem da dinâmica das galáxias espirais. As galáxias em geral podem ser classificadas
em espiriais (barradas ou não), elı́pticas e irregulares. As galáxias espiriais são, grosso
modo, caracterizados por uma parte central extremamente densa, de formato aprox-
imadamente esférico, chamado bojo, e pelos braços espirais, bem menos densos. Os
objetos (estrelas, nuvens de gás, etc.) que formam estas galáxias giram em torno
do centro da galáxia em órbitas bem definidas: são órbitas elı́pticas, quase circulares,
sendo o sentido de rotação inteiramente determinado pela estrutura dos braços espirais.
Estas órbitas são chamadas de keplerianas, pois suas caracterı́ticas são essencialmente
as mesmas que as do problema da órbita de um planeta em torno do sol.
Estudanto a órbita das estrelas e nuvens de gás em torno do centro da galáxia, pode-
se ter informações sobre a quantidade de matéria existente. Para simplificar a análise
do problema vamos fazer a aproximação (muito grosseira) que a galáxia é um objeto
esférico. Um cálculo mais preciso mudará os resultados por um fator da ordem da
unidade. Além do mais, e ainda para simplificar a análise, vamos considerar que a
densidade é constante e que as órbitas são circulares. Considere então uma órbita de
raio r menor que o raio da galáxia (a definição do que seja o raio da galáxia não é
algo simples, mas vamos ignorar no momento esta questão). A velocidade de rotação
será, nas circunstâncias descritas acima, determinada pela massa contida na esfera
interior à órbita. Digamos que M é a massa total da galáxia. A densidade de matéria
ρ (suposta uniforme) então será dada por
3M
ρ= , (9.54)
4πR3
346
onde R é o raio da galáxia. Usando o teorema de Gauss, o campo gravitacional a uma
distância r do centro da galáxia será dado por
m(r) M r3
~g = −G 2 r̂ , m(r) = , (9.55)
r R3
onde m(r) designa a massa total no interior da esfera de raio r. Assim, o campo
gravitacional pode ser escrito como
Mr
~g = −G r̂ . (9.56)
R3
Como as órbitas são circulares, a aceleração da estrela (ou nuvem de gás) é dada por
2
a = vr . Assim, tem-se
v2 Mr
=G 3 ⇒ v∝r . (9.57)
r R
Desta forma, a velocidade de rotação deve crescer com a distância ao centro da galáxia.
Por outro lado, se a estrela se encontra além do raio da galáxia (existem de fato objetos
ligados gravitacionalmente à galáxia e que estão a uma distância do centro maior que o
raio da galáxia), toda a massa da galáxia estará em seu interior. Desta forma, tem-se,
ainda para órbitas circulares,
v2 M 1
=G 2 ⇒ v∝√ . (9.58)
r r r
Assim, na borda da galáxia a velocidade de rotação deve cair com o inverso da raiz
quadrada da distância ao centro da galáxia.
Pode-se medir a velocidade de rotação nas galáxias espirais usando o efeito Doppler.
O resultado é surpreendente: enquanto no interior da galáxia a velocidade de rotação
cresce realmente com a distância, nas bordas da galáxia ela permanece constante, e
isto para distância às vezes muito superiores ao raio ótico da galáxia. Isto contraria o
que foi deduzido acima. Uma maneira de explicar este resultado é dizer que a galáxia
está envolta em um halo de matéria escura, que não pode ser detectada pela emissão
de radiação eletromagnética de nenhuma espécie, e que se estende muito além do raio
ótico. A adição deste halo escuro pode explicar as caracterı́sticas da curva de rotação
observada ajustando-se o tamanho do halo e sua densidade.
Uma quantidade importante na caracterização de uma galáxia é a razão massa-
luminosidade, quer dizer a quantidade de matéria dividida pela quantidade de luz
emitida, ambos em unidades solares. Estudando-se a vizinhaça do sol, tem-se que a
razão massa-luminosidade é da ordem de 5. A adição de matéria escura necessária
para explicar a curva de rotação observada pode aumentar esta relação luminosidade
para 15 ou mais: há muito mais matéria do que a que pode ser detectada diretamente
através da emisssão de radiação eletromagnética.
A situação se torna muito mais séria quando se considera agora aglomerados de
galáxias. Galáxias podem formar sistemas gravitacionalmente ligados, os chamados
347
Figura 9.2: Forma tı́pica da curva de rotação predita e observada em galáxias espirais.
aglomerados de galáxias. Existem aglomerados de algumas dezenas de galáxias até

aglomerados contendo centenas de galáxias, os chamados aglomerados ricos. Pode-se
avaliar a quantidade de matéria total do aglomerado utilizando o teorema do virial,
que estabelece que em um sistema dinamicamente em equilı́brio, a energia cinética
média é a metade da energia potencial:
1
< Ec >= − < Ep > . (9.59)
2
Para provar esta relação considere um sistema de partı́culas sob atração gravitacional
mútua:
N N 0
X X mi mj
mi~v˙i = −G 2
r̂ij , (9.60)
i=1 i,j=1
rij
onde rij = |~ri − ~rj | e a linha na somatória (dupla) do lado direito indica que o caso
i = j deve ser excluı́do. Calculando o produto escalar de toda a expressão por ~ri ,
temos
N N 0
X
˙
X mi mj
mi~ri .~vi = −G 3
~ri .(~rj − ~ri ) . (9.61)
i=1 i,j=1
rij
Integrando por partes, o lado esquerdo se torna,

N N N
X X d X
mi~ri .~v˙i = − mi vi2 + mi (~ri .~vi ) . (9.62)
i=1 i=1
dt i=1
para o lado direito temos

N 0 N 0
X mi mj X mj mi
G 3
~ri .(~rj − ~ri ) = G 3
~rj .(~ri − ~rj )
i,j=1
rij i,j=1
rij
N 0
X mj mi
= −G 3
~rj .(~rj − ~ri ) . (9.63)
i,j=1
rij
Logo, o lado direito pode ser escrito como

N 0 N 0 N 0
X mi mj 1 X mi mj 1 X mi mj
G 3
~ri .(~rj − ~ri ) = G 3
~ri .(~rj − ~ri ) + G 3
~ri .(~rj − ~ri )
i,j=1
rij 2 i,j=1 rij 2 i,j=1 rij
348
N 0 N 0
1 X mi mj 1 X mi mj
= G 3
~ri .(~rj − ~ri ) − G 3
~rj .(~rj − ~ri )
2 i,j=1 rij 2 i,j=1 rij
N 0
1 X mi mj
= − G = Ep . (9.64)
2 i,j=1 rij
Desta forma, obtém-se

N N N 0
X d X 1 X mi mj
− mi vi2 + mi (~ri .~vi ) = G
i=1
dt i=1 2 i,j=1 rij
N
d X
−2Ec + mi (~ri .~vi ) = Ep . (9.65)
dt i=1
O segundo termo do lado esquerdo se anula quando se calcula seu valor médio ao longo
de uma órbita fechada, pois o produto interno muda de sinal ao longo de um ciclo.
Assim, obtém-se o teorema do virial:
1
< Ec >= − < Ep > . (9.66)
2
Em um aglomerado de galáxias pode-se medir, também por efeito Doppler, a veloci-

dade de cada galáxia. Tem-se assim a energia cinética do aglomerado. Se o aglomerado
está em equilı́brio dinâmico, o teorema do virial se aplica, e pode-se então estimar a
energia potencial do aglomerado e, por conseguinte, sua massa. Aplicando-se este pro-
cedimento ao aglomerado de COMA, que possui algo como 500 galáxias, obtém-se
uma relação massa-luminosidade da ordem de 200, quer dizer, da ordem de dez vezes
mais que a obtida para uma galáxia espiral isolada. Novamente, isto pode ser expli-
cado introduzindo-se matéria que não emite radiação e que, provavelmente, não é de
origem bariônica. O fato é que todas estas observações indicam que a matéria escura
é pelo menos 6 vezes mais abundante que a matéria bariônica.
O que é esta ”matéria escura”? Existem vários candidatos possı́veis, todos oriundos
de teorias fundamentais como a de Grande Unificação (áxions), supersimetria (neu-
tralinos), etc. Um aspecto complexo disto é que nenhuma destas teorias ainda foi
verificada experimentalmente, permanecendo, no momento atual, como teorias espec-
ulativas, ainda que muito bem fundamentadas. Por várias razões, acredita-se que a
pressão efetiva da matéria escura deva ser nula. Uma destas razões é que, como a
matéria escura segue a distribuição de galáxias, ela deve sofrer o processo de colapso
gravitacional, e isto requer que sua pressão efetiva seja essencialmente nula. Logo, a
massa das partı́culas que constituem a matéria escura não pode ser nula, pois massa
nula implicaria um gás de partı́culas relativistas, cuja pressão não é nula. A massa das
partı́culas que constituiriam a matéria escura depende da origem destas partı́culas.
Se elas forem axions, partı́culas que se originam em quebras de simetria nas teorias
de Grande Unificação, estima-se que a massa as partı́culas constituintes da matéria
349
escura deva ser tal que m > 5 eV . Se forem neutralinos, partı́culas que surgem em
teorias supersimétricas, ela deve ser da ordem de 50 GeV .
Por outro lado, a matéria escura deve ser formada por partı́culas que interagem fraca-
mente com a matéria ordinária, bariônica, pois senão elas já teriam sido detectadas.
Assim, elas são denominadas de WIMPS, abreviação em inglês para partı́culas massi-
vas de fraca interação. Tanto o áxion quanto o neutralino satisfazem esta condição.
9.13 A energia escura
As observações descritas anteriormente da dinâmica das galáxias espirais e de aglom-

erados de galáxias indicam a existência de muito mais matéria no Universo do que
podemos detectar diretamente. A abundância de matéria bariônica no Universo é da
ordem de Ωb = 0, 04 em unidades da densidade crı́tica ρc , que é a densidade necessária
para que o Universo seja espacialmente plano. A densidade crı́tica hoje seria em torno
de ρc = 10−29 g/cm3 , como já foi dito anteriormente. As observações de objetos aglom-
erados indicam Ωme ∼ 0, 3, onde o subscrito me refere-se a matéria escura. No entanto,
existem outros testes indiretos para avaliar o conteúdo material total do Universo, e
que não se referem unicamente à análise da dinâmica de objetos aglomerados como
galáxias e aglomerados de galáxias. Quando estes outros métodos são empregados,
resultados mais surpreendentes emergem.
Um destes novos testes indiretos é a análise da anisotropia da radiação cósmica de
fundo. O modelo cosmológico padrão é composto fundamentalmente de duas fases:
o perı́odo inicial onde a radiação domina o conteúdo material do Universo, seguido
do perı́odo (que incluiria o que vivemos hoje) em que a matéria bariônica domina
o conteúdo material4 . Vivemos hoje imersos em um banho térmico a 2, 7 K que é
uma relı́quia da fase radioativa. Esta radiação é extremamente isotrópica. Entretanto,
devemos esperar a existência de pequenas anisotropias nesta temperatura devido a
existência de perturbações que deram origem às estruturas observadas no Universo
em grande escala, como galáxias e aglomerados de galáxias.
Durante os anos 80, procurou-se detectar aquelas anisotropias na RCF utilizando-
se sobretudo detectores baseados na Terra. Durante muito tempo, o máximo que
se conseguiu foi estabelecer limites superiores: se estas flutuações na temperatura
existissem, elas deveriam ser, em termos fracionais, tais que
∆T
≤ 10−4 . (9.67)
T
No inı́cio dos anos 90, entretanto, observações feitas a partir do satélite COBE5 final-
4
Freqüentemente, na literatura recente, a fase inflacionária primordial também é incluı́da no cenário
padrão
5
Abreviação para o nome em ingês Cosmic Observatory Background Explorer
350
Figura 9.3: Espectro da anisotropia da radiação cósmica de fundo com os diferentes
resultados observacionais.
mente detectaram a existência de flutuações tais que

∆T
∼ 10−5 . (9.68)
T
Desde então, uma série de outros programas observacionais (Boomerang, WMAP,
etc.) confirmaram a existência destas flutuações. Um exame detalhado do espectro
destas flutuações foi feito. A análise do espectro da radiação cósmica de fundo é feita
essencialmente através da decomposição multipolar, obtida exprimindo as flutuações
em harmônicos esféricos:
∞ m=+l
∆T (θ, φ) X X
= alm Ylm (θ, φ) , (9.69)
T l=0 m=−l
onde os alm são os coeficientes multipolares. A análise des coeficientes multipolares

conduz a uma série de informações sobre o conteúdo material do Universo, além de
desevendar a natureza das flutuações primordiais que geraram as estruturas hoje ob-
servadas no Universo.
O espectro da anisotropia possui caracterı́sticas bastante claras: há inicialmente
uma parte plana, correspondendo a valores pequenos de l, que implicam grandes
distâncias angulares, seguido de uma sequência de picos de amplitude, denominados
picos acústicos. A posição do primeiro pico acústico está relacionado com a densidade
total do Universo através da expressão
l
ΩT ∼ , (9.70)
220
onde ΩT é o parâmetro de densidade total do Universo e l indica a ordem multipolar
onde o primeiro pico aparece. As observações indicam que o primeiro pico ocorre em
l ∼ 220, o que implica ΩT ∼ 1. Logo, o Universo deve ser quase espacialmente plano.
Entretanto, as observações da dinâmica da matéria aglomerada indicam Ω ∼ 0, 3.
351
Assim, a anisotropia da RCF sugere que 70% da matéria existente no Universo não se
aglomera. Esta componente ”suave” foi denominada de energia escura, visto que ela
participa da dinâmica do Universo, mas não se aglomera e nem pode ser detectada
por meios diretos.
Outro teste que indica a existência de energia escura é a determinação do valor do
parâmetro de desaceleração hoje, q0 , que é definido como
aä
q0 = − |t=t0 , (9.71)
ȧ2
sendo a o fator de escala e t0 o tempo hoje. Este parâmetro pode ser avaliado através
do desvio da lei de Hubble do seu regime linear. A lei de Hubble estabelece que a
velocidade de recessão de objetos distantes deve ser proporcional à distância destes
objetos de nós. Mas, tal relação só se aplica estritamente para objetos relativamente
próximos; a grande distância, esta lei deve ser modificada, tomando a forma
1
rH0 ≈ z − (1 + q0 )z 2 , (9.72)
2
onde z é o desvio para o vermelho associado à radiação emitida pelo objeto distante,
definido por
∆λ
z= , (9.73)
λ
sendo λ o comprimento de onda da radiação emitida e ∆λ a mudança deste compri-
mento devido ao efeito Doppler cosmolológico.
Até aproximadamente 1998, acreditava-se que o Universo se encontrava em uma fase
desacelerada, quer dizer, q0 > 0. Isto aliás era de se esperar, visto que se pensava
até então que o conteúdo material do Universo era dominado por fluidos com pressão
positiva ou nula. De fato, considerando o Universo dominado por um único fluido com
densidade ρ e pressão p, temos pelas equações de Einstein,
ȧ 2 8πG
= ρ , (9.74)
a 3
ä ȧ 2
2 + = −8πG p . (9.75)
a a
Combinando as duas equações obtém-se,
ä 8πG
=− (ρ + 3p) . (9.76)
a 3
Desta forma pode-se ver que se a pressão é positiva, inevitavelmente ä será negativo
e o parâmetro de desaceleração será positivo.
Para se medir o desvio da linearidade da lei de Hubble é necessário observar objetos
bastante distantes, com altos z, quer dizer, z ∼ 1. Observar objetos tão distantes
traz problemas consideráveis. Em geral, utiliza-se galáxias. Mas, não se conhece ainda
muito bem o processo evolutivo das galáxias, e as medidas apresentam grandes in-
certezas. Desde a segunda metade da década de 90, passou-se a observar supernovas
352
do tipo Ia. Estas supernovas originam-se do processo de acréscimo de massa de uma
anã branca devido a presença de uma estrela massiva em um sistema binário. Quando a
massa da anã branca ultrapassa o limite de Chandrasekhar, quer dizer M ∼ 1, 4 M ,
ela se torna instável, dando origem a uma supernova. Como a explosão da estrela
ocorre em condições sempre muito semelhantes, a luminosidade intrı́nseca da super-
nova é padrão. Medindo-se a magnitude aparente, tem-se então a distância desta
supernova com grande precisão. As supernovas apresentam grande luminosidade, o
que permite observá-las a grande distância.
As observações de tais supernovas indicaram q0 < 0. Isto implica, a partir de (9.76) que
o Universo deve ser dominado hoje por um fluido de pressão negativa. Além do mais,
um estudo detalhado tem mostrado que os resultados observacionais são compatı́veis
com os teóricos se ΩT ∼ 1. Novamente, o estudo das supernovas tipo Ia indicam que
70% da matéria do Universo não aparecem na dinâmica dos objetos aglomerados,
constituindo uma componente ”suave” da matéria existente no Universo e que, além
do mais, deve exibir pressão negativa.
9.14 Constante cosmológica, quintessência ou...
Tı́nhamos visto anteriormente que a possibilidade da existência de matéria escura no

Universo traz o problema de qual seria o seu constituinte. Existem várias possibilidades
ligadas a predições de teorias fundamentais como a de Grande Unificação. A possı́vel
existência de uma energia escura traz um problema ainda maior: além de não poder
ser detectada diretamente, a energia escura deve exibir pressão negativa; ela seria um
fluido altamente exótico. O que seria esta energia escura?
Existem vários candidatos possı́veis. O primeiro destes candidatos seria a constante
cosmológica Λ. Nós discutimos a constante cosmológica no capı́tulo sobre o modelo in-
flacionário. Vamos revisar, entretanto, seus aspectos essenciais tendo em mente agora
o problema da energia escura. A constante cosmológica foi incluı́da nas equações de
Einstein desde o inı́cio da teoria da Relatividade Geral, na busca de soluções que
revelassem um Universo estático. Mas, elas foram rapidamente descartadas devido
a descoberta da expansão do Universo, no final dos anos 20, por Hubble. Entre-
tanto, teoricamente, nada impede introduzir a constante cosmológica nas equações
de Einstein. De fato, a forma mais geral de equações de campo geométricas levando a
equações diferenciais de segunda ordem, a quatro dimensões, é
1
Rµν − gµν R − Λgµν = 8πGTµν , (9.77)
2
onde Λ é a constante cosmológica. Essas equações conduzem também à conservação
da matéria, da mesma forma que no caso tradicional onde Λ está ausente, pois a
derivada covariante da métrica é nula. À constante cosmológica podemos associar
353
uma densidade de energia dada por
Λ
ρΛ = . (9.78)
8πG
Esta densidade de energia permanece constante, mesmo para um Universo em ex-
pansão. Uma constante cosmológica pode ser também representada por um fluido
com pressão negativa tal que pΛ = −ρΛ . De fato, pela lei de conservação para um
Universo homogêneo e isotrópico em expansão, temos
ȧ
ρ̇Λ + 3 (ρΛ + pΛ ) = 0 ⇒ ρ̇Λ = 0 ⇒ ρΛ = constante . (9.79)
a
Como as formas de energia têm densidade decrescente em função da expansão do
Universo, se existe uma constante cosmológica não nula, ela deverá dominar a dinâmica
cósmica a partir de um certo momento. Mas, se ela começa a dominar hoje a dinâmica
do Universo, não há contradição com as observações ao contrário do que ocorria no
caso do cenário inflacionário.
Por enquanto, tudo parece concorrer para se admitir que é a constante cosmológica a
responsável pela expansão acelerada do Universo hoje. Mas, há vários problemas com
este cenário. O primeiro vem da teoria quântica de campos. Suponhamos um campo
quântico que possa ser representado sob a forma de osciladores harmônicos. A energia
deste campo é dada por
∞
X 1
E= n+ ~ω . (9.80)
n=0
2
O estado de vácuo é dado por n = 0. O estado de vácuo quântico é descrito por
uma expressão idêntica à da constante cosmológica, pois o vácuo quântico deve ser
invariante de Lorentz. Consideremos a densidade de energia deste campo quântico no
seu estado de vácuo. Ela será dada por
Z
ρ = ~ω dVω , (9.81)
onde dVω é o volume do espaço de fase. Temos então,

Z ∞
ρ = 4π ~ω 3 dω . (9.82)
0
Na verdade a integração deve ser feita até ωP l que é a frequência de Planck, pela
simples razão que desconhecemos qual fı́sica deve ser utilizada acima desta frequência.
Assim, a densidade de energia do vácuo seria dada por
ρ = π~ωP4 l ∼ 1072 GeV 4 . (9.83)
Este valor é muito superior ao valor que deve ter a densidade de energia associada
à constante cosmológica necessário para explicar a aceleração do Universo hoje, que
é ρΛ = 10−47 GeV 4 . Há uma discrepância de 120 ordens de magnitude entre o valor
predito e o valor observado.
354
Outro problema se refere à chamada coincidência cósmica. Por que a constante cos-
mológica, se ela existe, tem um valor tal que somente agora ela começou a dominar o
conteúdo material do Universo? De fato, se a constante cosmológia tivesse um valor
maior que o observado, o Universo teria começado a se acelerar muito mais cedo e isto
comprometeria o processo de formação de galáxias, já que em um Universo acelerado as
perturbações que devem dar origem às estruturas locais, como galáxias e aglomerados
de galáxias, não crescem. Assim, se o Universo tivesse começado a se acelerar muito
antes que a fase atual, as galáxias não teriam se formado. Consequentemente, a vida
inteligente muito provavelmente não teria surgido. Para tentar contornar estas dificul-
dades, foram propostos cenários alternativos, como o de quintessência. Neste cenário,
recupera-se o mecanismo de inflação descrito anteriormente e que visava resolver os
problemas do modelo cosmológico padrão. Tenta-se, ao mesmo tempo, resolver o prob-
lema da coincidência cósmica de uma forma dinâmica: a própria evolução dos campos
responsáveis pela fase inflacionária atual implicaria que o Universo só poderia começar
a se acelerar em uma fase posterior à fase de formação das galáxias.
No modelo de quintessência, a aceleração do Universo é provocada por um campo
escalar com auto-interação descrito por uma Lagrangiana do tipo
1 √
L= ∂µ φ∂ µ φ − V (φ) −g . (9.84)
2
Como foi visto no caso do modelo inflacionário, a este modelo de campo escalar com
auto-interação podemos associar uma densidade de energia e uma pressão. Com uma
escolha judiciosa do potencial, pode-se ter um cenário onde inicialmente o campo
escalar apresente pressão positiva, evoluindo depois para uma configuração de pressão
negativa, o que induziria a fase de expansão acelerada.
Potenciais oriundos de teorias fundamentais como as de supergravidade podem ter as
boas caracterı́ticas para a descrição da quintessência. Entretanto, para que o resultado
final concorde com a observação é necessário um ajuste de parâmetros, o que sempre
provoca um certo desconforto. Entretanto, modelos de quintessência podem conduzir a
uma explicação para a questão da concordância cósmica: a dinâmica do campo escalar
é tal que só em momentos muito recentes ele pode provocar uma expansão acelerada
do Universo. Mas, várias outras propostas têm surgido na literatura e o campo está
inteiramente aberto para novas sugestões.
Exercı́cios
1. Mostre, por princı́pio variacional, que a Lagrangiana
1
L = ∂µ φ∂ µ φ − V (φ)
2
conduz à equação de movimento para o campo φ
2φ = −V 0 (φ) ,
355
onde a linha indica derivada em relação a φ.
2. Qual é a velocidade que teria uma bola de tênis, de massa m = 50 g, com energia
igual a 1022 eV ?
3. Calcule o valor da energia associada à constante cosmológica quando
√
Λ
∆t = 60 , ∆t = 10−30 s .
3
4. Deduza a partir da equação (9.41) as expressões para a densidade de energia e
pressão (9.46,9.47) .
5. Se a energia escura representa 70% da densidade crı́tica hoje, e a constante cos-
mológica é responsável por ela, deduza a densidade de energia associada à con-
stante cosmológica, no sistema de unidades CGS e em undidades GeV 4 , fazendo
neste último caso c = 1 e ~ = 1.
6. A razão massa-luminosidade, em unidades solares, do aglomerado de COMA, é
aproximadamente igual a 200 em unidades solares. Se o aglomerado de COMA
fosse formado por 500 galáxias idênticas à Via Láctea, qual seria a massa total
do aglomerado em gramas?
7. Estime a energia do vácuo quântico caso a frequência de corte for determinada
pela energia da quebra de simetria eletrofraca, Eef ∼ 100 GeV .

[1] A. Vilenkin, E. P. S. Shellard e P. V. Landshoff, Cosmic string and other topo-
logical defects, Cambridge University Press, Cambridge(1994).
[2] P. Peter e A. Gangui, Des défauts dans l’Univers, CNRS Editions, Paris(2003).
[3] S.K. Blau e A.H. Guth, in 300 Years of Gravitation, editado por S. Hawking e
W. Israel, Cambridge University Press, Cambridge(1987).
[4] E.W. Kolb e M.S. Turner, The early Universe, Addison-Wesley, Nova
Iorque(1990).
[5] L. Landau e E. Lifchitz, Physique statistique, Edições Mir, Moscou(1967).
[6] H. Maris e S. Balibar, Physics Today, fevereiro de 2002;
[7] C.A.W. de Souza, Ciência Hoje, 32, 6(2003).
[8] K.A. Olive, TASI lectures on astroparticle physics, astro-ph/0503065;
[9] S.M. Carroll, The cosmological constant, Living Reviews in Relativity 4, 1(2001).
356
Capı́tulo 10
Gravitação e Cosmologia Quânticas
Nelson Pinto Neto1
10.1 Introdução
Neste curso foram introduzidos os fundamentos da moderna teoria da gravitação, a
Teoria da Relatividade Geral (TRG), e da Cosmologia. Viu-se que, como toda forma de
energia presente na natureza interage gravitacionalmente, a teoria que descreve a in-
teração gravitacional pode ser entendida como uma teoria dinâmica do espaço-tempo,
propiciando, quando aplicada à totalidade do mundo fı́sico, uma teoria cosmológica
consistente de um Universo dinâmico com distintas fases em sua história. Estas foram
duas das grandes revoluções ocorridas na fı́sica no século XX, que modificaram total-
mente nossas concepções de espaço, tempo e cosmo.
A terceira grande revolução acontecida no século passado foi, como todos sabem, a
formulação da Teoria Quântica. Num nı́vel fundamental, ela mostrou-se absolutamente
necessária para a descrição correta e precisa de todo tipo de matéria, campos e sistemas
que existem na natureza com apenas uma exceção: justamente o campo gravitacional,
aquele que interage com tudo que existe e, como consequência, o Universo. Assim,
por um lado a TRG e a Cosmologia contemporâneas são teorias puramente clássicas
e por outro toda a Teoria Quântica (TQ) de partı́culas e campos se desenvolve num
espaço-tempo fixado de inı́cio (em franca oposição ao que há de mais básico na TRG, a
inexistência de um espaço-tempo fundamental a priori). Ou seja, as grandes revoluções
do século XX são teorias universais mas não se interpenetram, o que soa como um
contrasenso, indicando que a nossa compreensão da fı́sica contemporânea ainda não
1
Brazil.
357
está completa, que estas são apenas teorias efetivas, sendo necessária a construção de
uma Teoria Quântica da Gravitação (TQG) e da chamada Cosmologia Quântica (CQ).
Entretanto, não há nenhuma observação que nos imponha a construção destas teorias.
Pior, todas as tentativas feitas até hoje mostraram a imensa dificuldade de se construir
tais teorias, parecendo que seus princı́pios fundamentais não podem ser colocados lado
a lado, ou seja, que a TRG e a TQ devem realmente se manter separadas. Apesar
disso, tentarei mostrar nesta introdução porque a construção destas teorias é tão
importante. Na verdade, as tentativas de construı́-las apresentaram grande avanço na
última década além de terem propiciado uma compreensão bem mais ampla da TRG,
da Cosmologia e, principalmente, da TQ.
10.1.1 Argumentos a favor da construção de uma Teoria

Quântica da Gravitação e da chamada Cosmologia Quântica
1) A presença de singularidades na TRG e na Cosmologia
Viu-se nos capı́tulos anteriores que a TRG, sob condições bastante razoáveis, desen-
volve singularidades do espaço-tempo, como os buracos negros e a singularidade inicial
cosmológica, onde quantidades fı́sicas como a curvatura do espaço-tempo e densidades
de energia divergem e nenhuma fı́sica faz sentido. Ou seja, a TRG prevê situações
onde ela própria não se aplica. Este tipo de problema já esteve presente em outras
teorias fı́sicas, como o colapso da estrutura clássica da matéria (o eletron clássico gi-
rando em volta do núcleo atômico perderia energia através da emissão de radiação
eletromagnética e cairia no núcleo) e a a divergência do campo elétrico clássico na
vizinhança de uma partı́cula carregada, ambas resolvidas através da teoria quântica
da matéria e da Eletrodinâmica Quântica. Talvez, como nesses casos, efeitos quânticos
do campo gravitacional descritos numa TQG consistente possam evitar essas singu-
laridades, propiciando uma descrição completa e consistente dos buracos negros e do
Universo. Cabe salientar, porém, que tais singularidades também podem ser evitadas
através de modificações clássicas da TRG, como o aparecimento de interações, não
previstas na teoria de Einstein, entre os campos de matéria e a curvatura nestas
situações extremas (quanto maior a curvatura mais estas modificações se tornariam
importantes), ou pela existência de materiais exóticos com pressão muito negativa
cujos efeitos fı́sicos só se manifestariam nestas regiões.
2) Incompatibiliade entre um campo gravitacional clássico e demais campos

e matéria quânticos
O problema está relacionado com a insistência em mantermos a geometria clássica

mesmo sabendo que a matéria e demais campos da Natureza são fundamentalmente
quânticos. A única maneira de compatibilizar a TRG clássica com os efeitos quânticos
358
da matéria seria através da generalização das equações de Einstein
Gµν = −κTµν −→ Gµν = −κ < T̂µν >, (10.1)
onde κ ≡ 8πG/c4 sendo G a constante de Newton e c a velocidade da luz no vácuo, e

<> significa valor médio dos operadores presentes em T̂µν avaliado no estado quântico
do sistema obtido de uma equação tipo Schrödinger
∂Ψ
i~ = ĤΨ, (10.2)
∂t
onde o operador hamiltoniano Ĥ é calculado supondo que o espaço-tempo de fundo seja

plano com métrica de Minkowski ηµν . Note que não se pode escrever simplesmente T̂µν
do lado direito porque o lado esquerdo, por hipótese, não tem operadores. Entretanto,
< T̂µν > curva o espaço tempo através da equação de Einstein modificada (10.1),
transformando ηµν num novo gµν e, por consequência, a hamiltoniana quântica do
sistema Ĥ e a equação (10.2). Assim, o valor médio terá que ser tomado em um novo
estado, modificando o valor de < T̂µν >, o que implicará numa outra métrica, e assim
por diante. Este procedimento não converge e a teoria não faz sentido.
3) Medidas de distância sugerem a discretização do espaço se a Relatividdae

Geral e a Mecânica Quântica forem levadas em conta.
Um argumento heurı́stico para a discretização do espaço abaixo de uma certa escala
de distância pode ser descrito da seguinte forma: sabemos da mecânica quântica que
para medir um comprimento l precisamos de pacotes de onda contendo fótons com
comprimento de onda λ < ∆x < l , onde ∆x é o tamanho do pacote onde sua energia
está localizada, para que nào haja difração. Mas a energia do pacote é tipicamente
E ≈ hc/λ, onde h é a constante de Planck, e portanto o raio de Schwarzchild deste
pacote, como vimos em cursos anteriores, é dado por
2GM 2GE 2Gh

rs = 2
= 4 = 3 . (10.3)
c c cλ
Quanto menor for l, menor deve ser λ e maior será o raio de Schwarzchild do pacote,
até atingir-se a situação onde o comprimento a ser medido é da ordem do raio de
Schwarzchild do pacote. Neste caso, este colapsaria num buraco negro e nada poderia
ser visto. Isto se dá quando
2Gh
l< 3 , (10.4)
cl
o que implica que distâncias l tais que
r
2Gh √
l< 3
=: 2 πlpl (10.5)
c
não seriam possı́veis de ser medidas. O comprimnto lpl é chamado de comprimento de
Planck, escala a partir da qual o espaço provavelmente deva ser quantizado.
359
4) A existência da escala de Planck sugere uma TQG.
Tomando conjuntamente a constante de Newton G, a constante de Planck ~ e a ve-
locidade luz c, constantes fundamentais que dizem respeito à gravitação, mecânica
quântica e Relatividade, respectivamente, obtemos uma escala de comprimento,
tempo, massa e densidade de energia: a escala de Planck. Elas são:
r
~G
lpl = ≈ 10−33 cm, (10.6)
c3
r
~G
tpl = ≈ 10−43 s, (10.7)
c5
r r
~c ~c3
mpl = ≈ 10−5 g ; Epl = ≈ 1028 ev; (10.8)
G G
c5
ρpl = 2
≈ 1094 g/cm3 . (10.9)
~G
Como se vê, o comprimento e o tempo de Planck são extremamente pequenos: o
comprimento de Planck é tão menor que as dimensões de um núcleo atômico, da
ordem de 10−20 cm, quanto uma árvore é menor que uma galáxia tı́pica, e existem mais
tempos de Planck numa piscada de olho do que átomos no Monte Everest! Por outro
lado, a massa de Planck e a densidade de Planck são imensas: a massa de um eletron é
me ≈ 10−28 g, as energias mais altas que se atingiram até hoje nos grandes aceleradores
de partı́culas são da ordem de 1012 ev e a densidade de um núcleo atômico, o objeto
mais denso que se conhece, é da ordem de 1015 g/cm3 . É nessas escalas de tempo,
comprimento e energia que se espera que efeitos quânticos do campo gravitacional se
tornem importantes. Devido a esses valores extremos, não surpreende que até agora
não se tenha podido detetar tais efeitos. Por outro lado, a esperança de podermos
observá-los num futuro próximo parece bem difı́cil.
5) O problema da constante cosmológica.

Vimos em capı́tulos anteriores que a constante cosmológica efetiva observada tem que
ser tal que Λef < 10−56 cm−2 . Esta constante cosmológica efetiva tem uma contribuição
da constante cosmológica introduzida por Einstein e da energia do vácuo quântico:
Λef = Λ + Λvac . Entretanto, a teoria quântica de campos sugere que Λvac ≥ 106 cm−2
2
. Assim temos, na melhor das hipóteses, 10−56 cm−2 = 106 cm−2 + Λ. Para que esta
igualdade seja satisfeita, a constante Λ, arbitrária classicamente, deveria ter ajustados
62 dos seus dı́gitos para reduzir a enorme constante cosmológica do vácuo quântico
aos valores ı́nfimos observados da constante cosmológica efetiva. Este é o chamado
2
Como os campos quânticos são, a grosso modo, uma coleção infinita de osciladores harmônicos, a
energia do vácuo seria a soma das energias de ponto zero de todos eles, E = ~w/2, onde o máximo desta
enegia deveria ser a energia da quebra da supersimetria (Eqss > 1013 ev), que será discutida mais adiante.
Esta é a energia a partir da qual as energias do vácuo dos férmions se cancelariam com as dos bósons
devido à existência desta simetria. Isto leva a este valor mı́nimo para Λvac , que pode ser muito maior se
a supersimetria não existir.
360
problema do ajuste fino da constante cosmológica, um dos maiores problemas da fı́sica
teórica contemporânea, que provavelmente só poderá ser resolvido com a elaboração
de uma Teoria Quântica da Gravitação consistente.
6) A unificação de todas as interações da Natureza exige uma TQG.
Ao longo da história tem-se verficado a unificação de descrições de fenômenos

fı́sicos aparentemente distintos: o movimento de projéteis na Terra e o movimento
planetário através da teoria de Newton, os fenômenos elétricos e magnéticos através
da Eletrodinâmica de Maxwell, a unificação das interações eletromagnéticas e fraca na
teoria eletrofraca de Salam-Weinberg, etc. Isto tem levado muitos fı́sicos a acreditar
ser possı́vel unificar todas interações da natureza numa única descrição. Como todas
as demais interações são quantizadas, isto só será possı́vel se a gravitação também o
for. Note que esta é uma razão puramente estética já que não há nenhuma evidência
observacional ou teórica de que tal teoria de grande unificação de fato exista.
7) A Cosmologia Quântica pode servir como teoria de condições iniciais

para a Cosmologia.
Para se fazer previsões sobre um sistema fı́sico clássico ou quântico, duas etapas são
necessárias: a formulação de uma dinâmica que descreva a evolução deste sistema
através de equações diferenciais e as condições iniciais satisfeitas por este sistema
para determinar univocamente sua evolução. Normalmente, tais condições iniciais são
especificadas através de uma preparação experimental (ao lançarmos, num exemplo
clássico, um projétil de uma determinada posição com uma determinda velocidade
inicial ou, num exemplo quântico, para avaliarmos a probabilidade de decaimento de
um átomo excitado quando ele é preparado inicialmente neste estado), ou através de
especificações originadas do ambiente no qual o sistema está inserido (por exemplo, se
estivermos interessados na evolução do campo eletromagnético em uma sala onde não é
observada a entrada de qualquer radiação eletromagnética, resolvemos as equações de
Maxwell com condições de contorno de acordo com este fato). Entretanto, o Universo,
objeto de estudo da Cosmologia, é um sistema essencialmente diferente já que não
se pode manipular ou preparar o Universo, nem há nada exterior ao Universo que
passe suas especificações para ele. Assim, tão importante quanto haver uma teoria
dinâmica para o Universo, que sabemos ser a TRG, é crucial formular uma teoria de
condições iniciais para que possamos entender este sistema sem paralelo na fı́sica de
forma completa. Isto se torna ainda mais importante quando sabemos que o Universo
em que vivemos é bastante peculiar por ser altamente homogêneo e isotrópico (dentro
das possı́veis soluções cosmológicas das equações de Einstein, a grande maioria não
tem qualquer traço de homogeneidade e isotropia 3 ).
3
Numa contagem simplória, a probabilidade de encontrarmos uma solução homogênea e isotrópica
dentre todas a possı́veis soluções das equações de Einstein é 1/∞3 , ou seja, zero!
361
Uma formulação quântica para a Cosmologia talvez possa resolver este problema
pois usualmente em teoria quântica surgem regras de seleção e a noção de estado
quântico fundamental. Isto será discutido mais adiante quando falarmos em Cosmolo-
gia Quântica.
Este problema não se restringe puramente à Cosmologia. Existem várias hipóteses

dentro da fı́sica que assumimos sem questionar que dependem da caracterização do
estado quântico inicial do Universo. Seguem alguns exemplos:
i) Uma prática fundamental utilizada por todo fı́sico ao estudar algum sistema é isolá-
lo, ou seja, considerar que sistemas distantes não interferem na evolução do mesmo.
Entretanto, isto não seria possı́vel se a função de onda do Universo não pudesse ser
escrita da forma
Ψ(q i , QA , t) ≈ ψ(q i , t)ϕ(QA , t), (10.10)
onde q i representa os graus de liberdade do sistema e QA do resto do Universo. Se

Ψ(q i , QA , t) não pudesse ser separada como na Eq.(10.10), haveria um entrelaçamento
quântico entre o sistema e o resto do Universo que impediria o isolamento do sistema
em estudo. Ou seja, o próprio fato de podermos fazer fı́sica tal como a conhecemos
depende do estado quântico inicial do Universo!
ii) Vários sistemas fı́sicos se comportam classicamente. Entretanto, isto depende

também da função de onda do Universo. Para ilustrar este ponto, do teorema de
Ehrenfest temos que md2 < x > /dt2 = − < ∂V (x)/∂x >, onde <> significa valor
médio. Para que o limite clássico seja atingido é necessário mudar o lado direito desta
igualdade para
d2 < x > ∂V (< x >)
m ≈ − , (10.11)
dt2 ∂<x>
o que só é possı́vel para determinadas funções de onda (tipicamente pacotes de onda
estreitos). Num quadro mais geral, vemos que a existência do mundo clássico que
observamos também depende do estado inicial do Universo.
iii) Como Boltzmann uma vez setenciou, a segunda lei da termodinâmica (a entropia
de sistemas isolados cresce com o tempo) também está relacionada com o estado
inicial do Universo: ‘A segunda lei da termodinâmica pode ser provada de uma teoria
mecânica [invariante por reversão temporal 4 ] se for assumido que o estado atual do
Universo ... começou a evoluir de um estado altamente improvável’.
Vê-se portanto que a construção da Gravitação e Cosmologia Quânticas, embora sem

nenhuma motivação observacional direta, é altamente desejável do ponto de vista
teórico, seja por razões de auto-consistência, para resolver problemas em aberto ou
por razões estéticas. O objetivo é altamente ambicioso e por isso mesmo o caminho
para atingı́-lo é bastante difı́cil de percorrer. É o que veremos a seguir.
4
Quase todas as interações fundamentais da natureza satisfazem esta simetria.
362
10.2 Gravitação Quântica
Dentro da TRG, quantizar a gravitação significa quantizar o próprio espaço-tempo.
O que se havia feito até então era quantizar campos em espaços-tempos de fundo
fixados, ou seja, quantizar objetos se propagando em uma arena fixa. Agora, ter-se-ia
que quantizar a própria arena!
Essencialmente dois tipos de abordagem foram utilizados para quantizar a gravitação.
A primeira, a chamada quantização canônica, utilizou métodos canônicos de quan-
tização através da construção da hamiltoniana da TRG (o que implica numa separação
do espaço-tempo em espaço e tempo), procurando respeitar o aspecto mais profundo
da TRG: não há espaço-tempo absoluto. A segunda, chamada de quantização covari-
ante, procurou usar os mesmos métodos utilizados para os outros campos. Expandiu-se
a métrica gµν na forma gµν = ηµν + hµν para quantizar o campo hµν no espaço-tempo
de fundo de Minkowski cuja métrica é ηµν . Embora não seja necessária uma separação
do espaço-tempo em espaço e tempo como na primeira, daı́ o nome covariante, esta
abordagem utiliza a métrica de fundo ηµν como palco absoluto onde se propaga o
campo hµν .
Por ter sido a primeira abordagem a ser tratada de forma séria, vamos rever primeiro
a Quantização Canônica.
10.2.1 Quantização Canônica
No final da década de 40 do século passado iniciou-se o programa de quantização da

TRG. Àquela época, a Eletrodinâmica Quântica já se encontrava razoavelmente bem
estabelecida e o próximo passo seria quantizar a outra teoria fundamental conhecida
naquele instante: a TRG. Paul Dirac, o mesmo que compatibilizou a Relatividade
Restrita com a TQ através da famosa equação que leva o seu nome, passou a dedicar-
se neste momento a fazer o mesmo com a Relatividade Geral. Para tanto, dentro
da perspectiva da quantização canônica, era necessário encontrar a hamiltoniana da
TRG. Como sabemos, para se escrever a equação de Schroedinger de um sistema é
preciso conhecer a hamiltoniana do mesmo:
∂Ψ(q, t)
i~ = H(p̂, q̂)Ψ(q, t), (10.12)
∂t
onde H é a função hamiltoniana do sistema expressa em termos dos operadores mo-
mentum e posição.
Entretanto, a simples tarefa de se encontrar a hamiltoniana da TRG revelou-se mais
difı́cil do que se esperava. O fato de a TRG ser uma teoria covariante por trans-
formações gerais de coordenadas e expressa em termos de tensores, como visto nos
cursos anteriores, implica que várias componentes do tensor métrico podem ser fix-
adas mediante escolhas apropriadas das coordenadas (lembre-se como foram obtidas
363
as métricas de Schwarzchild e cosmológica: várias simplificações foram feitas através
de escolhas de coordenadas que acomodassem as simetrias presentes em cada caso).
Assim, nem todas as componentes do tensor métrico são graus de liberdade genuı́nos:
muitas delas podem ser eliminados. No formalismo hamiltoniano, isto se traduz em ter-
mos de relações entre componentes do tensor métrico e seus momenta canonicamente
associados que devem ser satisfeitas pelos mesmos. Estas relações são chamadas de
vı́nculos.
Uma outra maneira de ver a presença destes vı́nculos é através das equações de Ein-
stein:
Gµν = −κTνµ . (10.13)
É fácil verificar que as equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i (i varia de 1 a
3 e corresponde aos ı́ndices espaciais) não envolvem derivadas segundas da métrica, só
derivadas primeiras. Como as derivadas primeiras estão usualmente relacionadas aos
momenta, estas são as relações de vı́nculo citadas acima. As únicas equações dinâmicas,
que envolvem derivadas segundas da métrica, em particular, das componentes gij , são
as equações com ı́ndices µ = i, ν = j.
Como não há equações envolvendo derivadas segundas das componentes g00 e g0i ,
estas não são variáveis dinâmicas, podendo portanto ser fixadas por uma escolha con-
veniente de coordenadas. Assim, dada uma hipersuperfı́cie tridimensional inicial de
métrica gij (xk , t0 ), que não pode ser qualquer uma pois ela deve satisfazer os vı́nculos
provenientes das equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i, as equações de
Einstein com µ = i, ν = j nos dizem como encontrar a hipersuperfı́cie de métrica
gij (xk , t0 + ∆t) num instante posterior. O empilhamento destas hipersuperfı́cies tridi-
mensionais ao longo do tempo nos dão a quadri-geometria gµν que é solução das
equações de Einstein com estas condições iniciais.
Para lidar com os vı́nculos da TRG e chegar a sua hamiltoniana, Dirac desenvolveu
toda uma teoria denominada formalismo hamiltoniano de sistemas vinculados, com
aplicações também ao Eletromagnetismo e outras interações. Nesta formulação, a
hamiltoniana final é composta pela hamiltoniana canônica Hc = pq̇ − L, adicionada de
multiplicadores de Lagrange multiplicando os vı́nculos para garantir a sua validade.
Desta maneira, ele chegou a uma hamiltoniana correta para a TRG, que depois foi
colocada sob uma forma bem mais simples, envolvendo quantidades geométricas bem
definidas, por Arnowitt, Deser e Misner. Esta hamiltoniana tem a forma
Z
H = d3 x[N H(x) + Ni Hi (x)] + T S (10.14)
onde H(x) e Hi (x) são os vı́nculos referidos anteriormente e dependem das coordenadas
espaciais x. O primeiro está relacionado com a invariância da TRG por transformações
da coordenada temporal e o segundo com a invariância da TRG por transformações
de coordenadas espaciais. Os ı́ndices i variam de 1 a 3. N e Ni , relacionados com as
componentes g00 e g0i da métrica, são os multiplicadores de Lagrange que impõem a
364
validade dos mesmos: ao derivarmos a hamiltoniana com respeito a eles encontramos
H(x) = 0 e Hi (x) = 0, que reproduzem na linguagem hamiltoniana as equações de
Einstein (10.13) com µ = 0, ν = 0 e µ = 0, ν = i.
As funções H(x) e Hi (x) dependem apenas de gij , de eventuais campos que descrevam
a matéria e campos não gravitacionais, e de seus momenta conjugados. As equações
de Hamilton para estas quantidades (a forma geral das equações de Hamilton para
varáveis canônicas q e p é q̇ = ∂H/∂p e ṗ = −∂H/∂q) fornecem as equações de
Einstein com µ = i, ν = j. Desta maneira, obtemos todas as equações de Einstein
(10.13) dentro deste formalismo.
O termo T S é um termo de superfı́cie no infinito envolvendo todo o espaço. Ele só pode
ser calculado em situações bastante especiais. Se o espaço é fechado, isto é, finito e sem
fronteiras como a superfı́cie de uma bola de futebol, ele é zero. Para visualizarmos este
fato, sigamos com o exemplo da superfı́cie de uma bola de futebol. Nesta superfı́cie, o
análogo de uma esfera envolvendo um ponto no espaço tridimensional é um cı́rculo en-
volvendo um ponto na superfı́cie da bola. Ao aumentarmos progressivamente o cı́rculo
em torno do ponto, ele desaparecerá no ponto diametralmente oposto ao ponto inicial.
Assim, a integral T S será sobre um domı́nio nulo e portanto T S = 0 neste caso. Nos
restringiremos a partir de agora a esta situação, que é o caso de interesse cosmológico.
Note que para espaços fechados, onde o termo T S é nulo, a hamiltoniana, por ser uma
combinação linear dos vı́nculos aos quais toda solução deve satisafazer, é nula. Se ex-
trapolarmos para a TRG a interpretação usual da hamiltoniana como sendo a energia
do sistema, a conclusão é que a energia total de qualquer sistema gravitacional que
tenha espaço fechado é nula. Por isso, universos com espaços fechados são preferidos
em Cosmologia: eles têm energia zero!
Os passos usuais para se quantizar uma teoria são:
i) Transformar as variáveis canônicas em operadores que obedecem regras de co-

mutação oriundas dos parênteses de Poisson. Em geral, para funções A(q, p) e B(q, p)
temos [Â, B̂] ≡ ÂB̂ − B̂ Â = i~{A, B} ≡ (∂A/∂q)(∂B/∂p) − (∂B/∂q)(∂A/∂p),
ii) Escrever a hamiltoniana em termos destes operadores.
iii) Escrever a equação de Schroedinger associada [Eq.(10.12)].
Mas o que fazer quando aparece um vı́nculo f (q, p) = 0 na teoria? Não podemos
escrevê-los simplesmente como identidades entre operadores pois se f (q̂, p̂) = 0 então
[f, A] = 0 para qualquer A. Entretanto, {f, A} não se anula para qualquer A (tente
se convencer disso com um exemplo) e assim terı́amos uma contradição com a regra
(i). Dirac propôs então a regra5 :
iv) f (q̂, p̂)Ψ = 0

5
Na verdade a nova regra depende do tipo de vı́nculo em questão. Mas na TRG só aparecem vı́nculos
do tipo em que a regra a seguir é válida.
365
Neste momento, o melhor a fazer é investigarmos um exemplo concreto para fixarmos
estas idéias.
Seja uma partı́cula não relativı́stica com a ação
Z
S = dtL(q, dq/dt, t) (10.15)
onde L representa a sua lagrangeana. A hamiltoniana pode ser definida a par-

tir da definição do momentum p = ∂L/∂(dq/dt) e da transformação de Legendre
H = pdq/dt − L. A quantização da teoria fornece a equação de Schroedinger usual
(10.12).
Suponha agora que escolhamos um novo parâmetro temporal τ e que o tempo t antigo
se torne uma nova coordenada generalizada t = t(τ ). A nova ação fica:
Z
S = dτ ṫL(q, q̇/ṫ, t). (10.16)
O ponto significa derivada em relação a τ . É fácil mostrar que a ação (10.16) não muda
de forma se reparametrizarmos novamente o tempo, τ̃ = τ̃ (τ ), ou seja, ela apresenta
a mesma propriedade da ação da TRG de ser invariante por transformações gerais no
tempo.
A nova lagrangeana é dada por L̄(q, q̇, t, ṫ) = ṫL(q, q̇/ṫ, t). Os momenta são dados por
∂ L̄ ∂L ∂(dq/dt)
π≡ = ṫ =p (10.17)
∂ q̇ ∂(dq/dt) ∂ q̇
e
∂ L̄ dq
π0 ≡ = L(q, q̇/ṫ, t) − p = −H(q, p, t) = −H(q, π, t). (10.18)
∂ ṫ dt
Assim temos o vı́nculo
π0 + H(q, π, t) = 0, (10.19)
que é uma relação do tipo f (q, t, π, π0 ) = 0.
A hamiltoniana canônica é
Hc = π0 ṫ + π q̇ − L̄ = ṫ[π0 + H(q, π, t)], (10.20)
que é nula devido ao vı́nculo (10.19). Assim, segundo a prescrição de Dirac, a hamil-
toniana total é
HT = N [π0 + H(q, π, t)], (10.21)
onde N é o multiplicador de Lagrange associado ao vı́nculo (10.19).
É fácil verificar que esta hamiltoniana fornece as equações corretas do sistema. A
variação em relação a N fornece o vı́nculo H = 0. As equações de Hamilton ṫ =
∂HT /∂π0 , π˙0 = −∂HT /∂q0 , q̇ = ∂HT /∂π e π̇ = −∂HT /∂q nos dão que N = ṫ, a
conservação de H em t se esta não depende explicitamente do tempo t e as equações
de Hamilton do sistema original envolvendo a evolução no tempo t, respectivamente.
366
Aplicando as regras de quantização de Dirac para este tipo de sistema obtemos a
equações
∂Ψ(q, t, τ )
i~ = HT (π̂, πˆ0 , q̂, τ̂ , )Ψ(q, t, τ ), (10.22)
∂τ
e a regra de quantização (iv) fornece, neste caso,
[π̂0 + H(q̂, π̂, t̂)]Ψ(q, t, τ ) = 0. (10.23)
Usando a Eq.(10.23) em (10.22) obtemos que o lado direito é nulo e portanto Ψ não
depende de τ . Na representação π̂0 = −i~∂/∂t, a Eq.(10.23) fornece exatamente a
equação de Schroedinger original (10.12). As regras de quantização de Dirac para
sistemas vinculados são perfeitamente consistentes.
Voltemos agora a hamiltoniana da TRG
Z
H = d3 x[N H(x) + Ni Hi (x)] (10.24)
já assumindo T S = 0. Note que, como no exemplo acima, a hamiltoniana é zero: ela
é uma combinação linear de vı́nculos. Isto implica, como no exemplo anterior, que
ao impormos a equação de Scroedinger encontraremos simplesmente que a função de
onda não depende de t, ou seja, ela depende somente da métrica gij , a única variável
dinâmica relacionada ao campo gravitacional, e dos campos de matéria. Temos ainda
as equações quânticas provenientes dos vı́nculos:
ĤΨ = 0 (10.25)
e
Ĥi Ψ = 0. (10.26)
A segunda atesta simplesmente que a função de onda é invariante por transformações

gerais de coordenadas espaciais.
Como a primeira está ligada ao vı́nculo relacionado à invariância da TRG por trans-
formações gerais da coordenada temporal, presume-se, analogamente ao exemplo ex-
ibido, que ela forneça a dinâmica da função de onda com relação a algum tempo escon-
dido nas demais variáveis canônicas. Ela é chamada de equação de Wheeler-DeWitt,
em homenagem aos seus formuladores Bryce DeWitt e John Wheeler.
No caso da partı́cula não relativı́stica descrito anteriormente, foi fácil encontrar a
variável canônica que faz o papel do tempo: o vı́nculo (10.19) apresenta um termo
linear num dos momenta conjugados. Desta forma, a coordenada conjugada a este
momento pode ser associada ao tempo já que a dependência linear no seu momento
conjugado implica, na representação de coordenadas, uma derivada de primeira ordem
nesta coordenada, exatamente como acontece com o tempo na equação de Schrödinger
usual, como foi visto acima. Entretanto, na maior parte dos casos, Ĥ não apresenta
dependência linear em nenhum dos momenta que nele aparecem e portanto fica muito
367
difı́cil saber qual variável faz o papel do tempo nesta aboradgem da TQG. Pior que
isso, como a equação (10.25) em geral não se apresenta na forma de Schrödinger, fica
muito difı́cil saber como calcular probabilidades a partir de uma solução Ψ. Uma boa
probabilidade tem que ser positiva definida e sua soma ou integral sobre todos os
resultados possı́veis ser igual a 1. Se Ψ satisfaz uma equação tipo Schrödinger (com
derivada primeiro no tempo), é fácil mostrar, sendo Ĥ auto-adjunto, que |Ψ|2 satisfaz
estas propriedades. Caso contrário, o problema é bem mais complexo.
Há algumas saı́das para este problema:
i) Aceitar que neste nı́vel fundamental realmente não exista noção de tempo. O tempo
só aparece quando a geometria começa a se comportar classicamente. De fato, foi
mostrado que na aproximação clássica, a equação (10.25) pode ser escrita na forma de
Schrödinger. No regime puramente quântico, deve-se procurar outras formas de definir
probabilidade com Ψ.
ii) Encontrar nos campos de matéria o tempo ou reescrever (10.25) na forma de

Schrödinger de alguma maneira.
iii) Utilizar uma interpretação da TQ onde probabilidades não sejam fundamentais.

Isto será visto com mais detalhe na próxima seção.
Além deste problema do tempo, a equação de Wheeler-DeWitt é extremamente com-

plicada. Não se conhece nenhuma solução para ela, a não ser que várias simplificações
sejam impostas de inı́cio.
Estes problemas deixaram por algum tempo esta abordagem parada, até que nos
anos 80, Abhay Ashtekar conseguiu simplificar dramaticamente o vı́nculo H utilizando
novas variáveis, chamadas variáveis de Ashtekar, tornando-o similar aos vı́nculos que
aparecem em outras teorias cuja quantização é bem conhecida. Isto deu um novo
impulso à quantização canônica da gravitação.
Estas novas variáveis eram generalizações complexas da conexão. Um grave prob-

lema inicial foi o de retornar a variáveis reais, que exigia resolver equações quase
tão complicadas quanto a própria equação de Wheeler-DeWitt original. Após alguns
anos de trabalho, com algumas desistências pelo meio do caminho, mostrou-se que
generalizações das variáveis de Ashtekar originais, que podiam ser reais e continham
um parâmetro arbitrário, também simplificavam a equação de Wheeler-DeWitt. A
seguir, foram encontradas inúmeras soluções destas equações quânticas, que formam
uma base, em termos de integrais de caminho fechado destas variáveis. Probabili-
dades bem definidas foram construı́das a partir destas soluções. A teoria passou a se
chamar Gravitação Quântica de Laços, os laços se referindo a esses caminhos fechados
nas integrais. Mostrou-se que esses laços poderiam se agrupar nas chamadas redes de
spin, entidades matemáticas que já haviam sido sugeridas por Roger Penrose como
relevantes para a Gravitação Quântica. Hoje, esta formulação da TQG apresenta um
quadro bem preciso do espaço-tempo quântico na escala de Planck em termos desta
368
rede de spins e dos nós que estes laços podem apresentar. Não há noção de tempo nesta
escala, ou seja, nesta teoria foi adotada a postura (i) citada acima para resolver o prob-
lema do tempo na equação de Wheeler-DeWitt. Foi possı́vel mostrar a quantização da
área e do volume nestas escalas. Com o ajuste adequado do parâmetro arbitrário que
aparece nas novas variáveis, citado acima, conseguiu-se também mostrar a fórmula da
entropia dos buracos negros em função da área do seu horizonte.
O grande problema deste formalismo é obter, a partir destas redes de spin, o estado
fundamental da teoria e o espaço-tempo contı́nuo da TRG clássica. Sem isso, é im-
possı́vel fazer qualquer predição que possa ser testada. Este é o problema crucial que
os pesquisadores que atuam nesta área estão agora atacando.
10.2.2 Quantização Covariante
Na década de 60 do século XX, foi iniciada uma outra abordagem para quantizar
a gravitação baseada no que já se tinha feito para quantizar outras interações da
natureza.
Por exemplo, a repulsão eletromagnética entre dois elétrons é vista, do ponto de vista
quântico, como uma troca incessante dos quanta de campo eletromagnético, os fótons,
partı́culas de spin 1, como dois patinadores de gelo que se afastam um do outro ao
arremessarem um ao outro uma pesada bola. Esta troca é regida pelo tipo de potencial
de interação entre os elétrons e o fóton e é calculada perturbativamente através de
uma expansão em potências do parâmetro adimensional da teoria, e2 /(~c) = 1/137,
onde e é a carga do elétron. As possibilidades quânticas no caminho do fóton entre
os dois elétrons são inúmeras: o fóton pode ir direto, mas também pode desapare-
cer no meio do caminho produzindo um par partı́cula e anti-partı́cula, um elétron e
um pósitron, que logo após desaparecem fazendo reaparecer o fóton. Como só os dois
elétrons em interação podem ser observados, o fóton e o par entre eles não podem ser
detetados e por isso são chamados de partı́culas virtuais. Este processo intermediário
pode acontecer várias vezes no caminho do fóton e num curtı́ssimo intervalo de tempo.
Lembrando a relação de incerteza quântica envolvendo tempo e energia, as energias
envolvidas neste processo podem ser muito altas. O resultado final do cálculo de todos
esses processos possı́veis são inúmeros infinitos, o que parece tornar a teoria inconsis-
tente. Mesmo as massas e cargas dos elétrons calculadas desta maneira são infinitas.
Mas foi observado um fato matemático espantoso: se simplesmente retirarmos os in-
finitos das cargas e massas para que estas apresentem os valores finitos observados,
todos os outros infinitos desaparecem! Desta maneira a teoria faz sentido e produz
números que estão de acordo com resultados experimentais em até 12 casas decimais!
Este processo de retirada de infinitos é chamado de renormalização e a teoria é dita
renormalizv́el.
A idéia é fazer o mesmo com a gravitação. Para tal, escreve-se a métrica gµν na
369
forma gµν = ηµν + hµν (cuja inversa g µν se escreve como uma série infinita, g µν =
η µν + hµν + hµα hνα + ...), onde ηµν é a métrica de Minkoski, e faz-se a substituição
na lagrangiana da TRG. A teoria agora é entendida não da forma geométrica que
Einstein propôs mas como uma teoria do campo hµν se propagando no espaço-tempo de
Minkowski, interagindo com todos os campos da Natureza e consigo próprio (lembre-
se que o campo gravitacional interage com qualquer forma de energia). A quantização
da teoria levaria a um quadro similar ao da Elotrodinâmica Quântica descrito acima:
duas formas de energia interagiriam gravitacionalmente através da troca de quanta do
campo hµν , o chamado gráviton, de spin 2, que se propagaria no espaço-tempo de fundo
de Minkowski. Entretanto, os cálculos através de métodos perturbativos similares aos
da Eletrodinâmica Quântica mostraram uma situação catastrófica: os infinitos são
infinitamente diversos, ou seja, a remoção a mão de 2 ou 3 deles através de uma
renormalização não elimina os demais. Seriam necessárias infinitas renormalizações
para se encontrar resultados finitos. A TRG não é renormalizável do ponto de vista
perturbativo. Uma das razões é que, diferentemente das outras interações onde altas
energias não implicam em forte interação, partı́culas virtuais com energia tendendo
a infinito, permitidas pelo princı́pio da incerteza, interagem gravitacionalmente de
forma ilimitada, produzindo infinitos intratáveis.
Isto desanimou grande parte da comunidade até que um novo alento surgiu. Sabia-
se até então da existência de dois tipos de partı́culas fundamentais: os férmions,
de spin semi-inteiro, relacionados com a matéria propriamente dita, e os bósons, de
spin inteiro, relacionados com os quanta das interações fundamentais. Elas obedecem
estatı́sticas totalmente diferentes devido ao princı́pio da exclusão de Pauli. Em meados
da década de 70, mostrou-se a existência de uma simetria, chamada supersimetria, que
relacionava bósons com férmions: para cada bóson existiria um férmion associado (o
fóton, de spin 1, teria seu parcerio supersimétrico, o fotino, de spin 1/2, e assim
por diante) e vice-versa. Teorias supersimétricas teriam bem menos infinitos que as
teorias usuais já que os infinitos dos férmions se cancelam com os dos bósons. Com isto
foi construı́da a chamada supergravidade, uma teoria supersimétrica da gravitação e
que também pretendia ser uma teoria de unificação. Entretanto tal teoria, embora
bem menos problemática do ponto de vista perturbativo que a TRG, ainda não era
renormalizável.
Na década de 60 surgiu a idéia de se descrever processos da interação forte, aquela
responsável por manter o núcleo atômico estável, por meio de cordas segurando as
partı́culas do núcleo. Esta abordagem foi abandonada devido ao sucesso da teoria
que passou a descrever estas interações, a Cromodinâmica Quântica. Como era sabido
que as excitações destas cordas produziam, entre outras, partı́culas de spin 1 como
o fóton e de spin 2 como o gráviton, foi sugerido na década de 80 que elas fossem
utilizadas não apenas para descrever as interações fortes mas para um projeto bem
mais ambicioso: a descrição unificada de todas as interações. Assim, o mundo não
seria constituı́do de partı́culas mas de cordas, cujas excitações nos dariam todas as
370
partı́culas mediadoras das interações conhecidas e, quando tornada supersimétrica, as
partı́culas que compõem os átomos formadores da matéria usual. A teoria era formu-
lada em 9 dimensões espaciais e 1 de tempo, sua expansão perturbativa não continha
infinitos e produzia, num certo limite, a TRG. Houve grande excitação já que esta
era a primeira vez que se inseria a TRG numa teoria consitente perturbativamente, e
ainda por cima que encampava as outras interações.
Entretanto, vários problemas foram surgindo:
i) Percebemos apenas 3 dimensões espaciais e portanto é necessário incluir na teoria
uma dinâmica que possibilite a compactificação das outras 6 dimensões espaciais em
tamanhos minúsculos para que não possamos percebê-las. Porém, existem milhares
de esquemas de compactificação possı́veis, deixando a teoria praticamente sem poder
preditivo: cada maneira de compactificar implica em um determinado tipo de teoria
de campos e partı́culas nas 3 dimensões espaciais não compactificadas que observamos.
ii) Embora a série perturbativa tenha seus elementos finitos, existem fortes indicações
de que a série não converge, deixando assim muitas dúvidas sobre a validade do trata-
mento perturbativo também para esta teoria.
iii) A teoria é formulada num espaço-tempo de fundo fixado, sem dinâmica, onde as
cordas se propagam e interagem, em franca oposição ao espı́rito da TRG, onde não
cabe um espaço-tempo a priori.
Hoje existem algumas teorias de corda, todas elas interligadas por certas trans-
formações, que levou muitos a conjecturar que exista uma teoria ainda mais fun-
damental, denominada teoria M, da qual todas elas provêm.
As teorias de cordas também são bem sucedidas em calcular a entropia do buraco
negro, mas só dos carregados cuja carga elétrica, quando multiplicada pelas constantes
apropriadas, tem valor bem próximo da sua massa. As teorias de corda têm uma escala
diferente da escala de Planck já que existe uma quantidade, a tensão fundamental
da corda, que define outras escalas de comprimento, tempo e energia. A escala de
comprimento é maior que o comprimento de Planck. A constante gravitacional G é
governada por um campo e portanto varia com o tempo, tendendo ao valor atual após
vários processos dinâmicos ocorridos na teoria.
10.2.3 Gravitação Quântica de Laços ou Supercordas? Ou

ambas?
Os problemas e virtudes da Gravitação Quântica de Laços (dificuldade de se obter o

espaço-tempo clássico e fazer cálculos de espalhamento por um lado, independência de
um espaço de fundo, formulação não perturbativa com descrição detalhada do espaço-
tempo quântico, por outro) são complementares aos problemas e virtudes da teoria de
cordas (dificuldade de se formular a teoria sem um espaço-tempo de fundo, formulação
371
perturbativa problemática, ambiguidade por haver inúmeras teorias possı́veis por um
lado, possibilidade de fazer cálculos de espalhamento utilizando a noção de gráviton,
espaço-tempo clássico facilmente recuperável, teoria de unificação, por outro).
Isto sugere a alguns pesquisadores que elas sejam dois lados complementares de uma
teoria mais fundamental, ademais sabendo que a escala de comprimento vinda das
cordas é maior que a escala de Planck. Na escala de Planck mais fundamental, terı́amos
então uma teoria de laços, nós e redes de spins, que em escalas maiores geram as cordas,
e não diretamente o espaço-tempo contı́nuo, que então nos levaria aos espaços-tempos
soluções das equações de Einstein que tanto procuramos. Talvez este seja o melhor
esboço da teoria M que se tem hoje mas ainda falta muito para obtê-la em termos
matemáticos precisos.
10.3 Cosmologia Quântica

Poder-se-ia pensar que, uma vez obtida uma TQG consistente, sua aplicação à Cos-
mologia seria imediata. Entretanto, a formulação de uma TQG consistente é uma
condição necessária mas não suficiente para se obter uma Cosmologia Quântica com-
pleta. Isto se deve ao fato de a Cosmologia ser uma disciplina da fı́sica muito especial:
o sistema de estudo é a totalidade de todos os processos fı́sicos. Isto impõe dois prob-
lemas adicionais.
O primeiro, já discutido na introdução, diz respeito às condições iniciais: não basta
ter as equações da TQG e sua solução geral mas é preciso haver um critério para
selecionar dentre elas aquela que represente a função de onda do Universo.
O segundo, diz respeito à interpretação da Teoria Quântica: aquela que se aprende
nos cursos de graduação em fı́sica, a interpretação de Copenhaguen, não pode ser
aplicada ao Universo. Isto vem da maneira como ela resolve o problema da medida
quântica. Quando um aparelho de medida interage com o sistema observado para medir
o valor de um observável, a função de onda que descreve tanto o sistema quanto o
aparelho de medida se divide em vários ramos que não se superpõem, cada um contendo
um dos auto-estados possı́veis do sistema relacionados aos possı́veis auto-valores do
observável e o ponteiro do aparelho de medida apontando para este auto-valor. Este
processo pode ser descrito pela equação de Schrödinger que evolui a função de onda.
Entretanto, o resultado final da medida é apenas um desses ramos. Diz-se portanto
que os outros ramos colapsam, o chamado colapso da função de onda. Este processo
não pode ser descrito pela equação de Schrödinger, ou qualquer equação quântica
linear que implique num operador evolução que conserve probabilidade. Desta forma,
a interpretação de Copenhaguen afirma que este processo se dá num mundo clássico,
através de uma aparelho de medida e/ou observador macroscópicos que só podem ser
descritos classicamente, exterior ao sistema observado. Mas se o sistema é o Universo,
que contem tudo que existe, inclusive nós, os observadores, não há lugar para um
372
mundo clássico externo a este sistema. Assim a interpretação de Copenhaguen não
pode ser utilizada na Cosmologia Quântica.
Há no entanto interpretações da TQ alternativas a de Copenhaguen, algumas formu-

ladas exatamente para resolver este problema, que podem ser utilizadas. Elas são:
1) Mecânica quântica não linear.
Nesta abordagem, a intervenção de um aparelho de medida clássico macroscópico induz

não linearidades na equação de Schrödinger que provoca dinamicamente o colapso.
Esta tese é defendida por Ghirardhi, Rimini e Penrose, este último argumentando que
os efeitos gravitacionais do aparelho macroscópico induziriam este processo.
2) A interpretação de vários mundos.
Esta interpretação foi sugerida por Everett no final da década de 50 do século XX

justamente para ser aplicada à Cosmologia Quântica. Nela não há colapso: todos os
ramos nos quais a função de onda se dividiu continuam existindo, cada uma contendo
um observador que registra o seu respectivo auto-valor. Nenhum dos observadores tem
consciência da existência dos outros pois os ramos não se interpenetram. Ou seja, há
uma multiplicação de mundos em cada processo de medida quântica e para cada ob-
servador o colapso é aparente mas de fato não é real. Isto soa estranho mas não há
nenhuma evidência concreta que ela esteja errada. Mesmo que não seja respeitada a
conservação de energia com a criação de todos esses mundos, cada observador perce-
berá que no mundo que ele observa vale a lei de conservação de energia.
Não havendo colapso, não há necessidade de mundo clássico externo, a evolução
quântica é sempre linear e pode ser aplicada ao Universo. Esta é a interpretação
mais usada em Cosmologia Quântica e defendida por vários teóricos de fundamentos
da TQ.
3) A interpretação de Bohm-de Broglie.
Nesta interpretação, proposta por Louis de Broglie e elaborada por David Bohm no
começo dos anos 50, além da função de onda, o sistema quântico é definido também
pelas trajetórias de partı́culas e campos bem definidas e com realidade objetiva (exis-
tem independentemente da observação). No processo de medida, as partı́culas que de-
screvem o sistema observado e o aparelho de medida entram em apenas um dos ramos
seguindo a sua trajetória, singularizando este ramo com respeito aos outros. Pode-se
mostrar que os demais ramos, sem a presença das partı́culas e por isso chamadas de
ondas vazias, não podem ser detetadas por qualquer outro observador. Assim, como
no caso anterior, o colapso é aparente mas não é real. O auto-valor selecionado é
aquele em cujo ramo as partı́culas entraram. Novamente, não havendo colapso, não
373
há necessidade de mundo clássico externo, a evolução quântica é sempre linear e pode
ser aplicada ao Universo.
Por enquanto não há nenhuma evidência experimental que privilegie uma interpretação
em relação a outra, incluindo a interpretação de Copenhaguen. As preferências por
uma ou por outra são de caráter puramente estético e/ou filosófico. Para fins didáticos
passarei a descrever com mais detalhe a interpretação de Bohm-de Broglie por ser
aquela onde é mais fácil obter resultados e interpretá-los em Cosmologia Quântica.
10.3.1 A interpretação de Bohm-de Broglie
Em 1927, de Broglie apresentou sua interpretação de onda piloto da mecânica quântica

no congresso de Solvay. Pauli fez crı́ticas que de Broglie não conseguiu responder e
ela foi abandonada em favor da interpretação de Copenhaguen, que emergia na época.
Após escrever seu livro de mecânica quântica, utilizando a interpretação da Copnh-
aguen, Bohm, insatisfeito com as várias lacunas desta interpretação, escreve em 1952
um artigo cientı́fico onde elabora a teoria de de Broglie e responde às crı́ticas de Pauli.
Vamos examinar como ela funciona no caso da mecânica quântica não relativı́stica:
Seja a equação de Schrödinger
~2 2

∂Ψ(x, t)
i~ = − ∇ + V (x) Ψ(x, t). (10.27)
∂t 2m
Escrevendo Ψ na forma polar Ψ = A exp(iS/~) obtem-se
∂A2 ∇S
+ ∇· A2 = 0, (10.28)
∂t m
∂S (∇S)2 ~2 ∇2 A
+ +V − = 0. (10.29)
∂t 2m 2m A
A primeira é simplesmente uma equação de continuidade para A2 . A segunda é uma
~2 ∇2 A
equação de Hamilton-Jacobi com um potencial extra Q ≡ − 2m A
.
Até aqui, apenas escreveu-se equação de Schrödinger de outra forma. Entretanto, esta
forma sugere as novas hipóteses de Bohm, que são:
i) A trajetória x(t) da partı́cula existe, independentemente de observações! Esta é
uma mudança radical em relação à interpretação de Copenhaguen, para a qual o
mundo quântico não observado não passa de um conjunto de meras potencialidades
sem existência concreta.
ii) A equação (10.29), do tipo Hamilton-Jacobi, sugere que a trajetŕia da partı́cula
satisfaça a equação p = mẋ = ∇S(x, t), como na formulação de Hamilton-Jacobi
da mecânica clássica usual. A solução desta equação x = x(x0 , t) é a trajetória da
374
partı́cula, que no entanto só será determinada completamente com o conhecimento
da constante inicial x0 . A grande diferença do caso clássico é a presença do potencial
~2 ∇2 A
Q ≡ − 2m A
, cujas propriedades serão discutidas adiante. Devido à presença deste
potencial, S não é a função de Hamilton-Jacobi clássica e portanto as trajetórias
encontradas a partir dela serão diferentes da trajetória clássica. O potencial Q ≡
~2 ∇2 A
− 2m A
é portanto o responsável pelos efeitos quânticos. Por isso ele é chamado de
potencial quântico.
iii) A condição inicial x0 é a variável escondida da teoria. O sistema só é comple-

tamente determinado se a conhecermos mas se procurarmos obtê-la através de uma
medida, a partı́cula sairá da sua trajetória inicial. Se pensarmos agora um fluido destas
partı́culas com diferentes posições iniciais x0 cuja distribuição de probabilidade é dada
por P (x0 ) = A2 (x, t = t0 ), a equação (10.28) implica que a probabilidade de encon-
trarmos a partı́cula numa posição qualquer x num tempo posterior é P (x) = A2 (x, t),
recuperando-se todas as previsões estatı́sticas da mecânica quântica usual. Note que,
neste ponto de vista de fluidos e uma vez que as partı́culas do fluido satisafazem
mẋ = ∇S(x, t), a equação (10.28) nada mais é que dP/dt = 0, ou seja, as trajetórias
não podem ser criadas ou aniquilidas (lembre-se que estamos tratando de partı́culas
não-relativı́sticas).
Algumas observações importantes:
a) Q é altamente não local e dependente de contexto. Ele é o responsável pelos efeitos

quânticos. Por exemplo, na experiência de interferência quântica da fenda dupla, é ele
que age nos elétrons no caminho para o anteparo, levando-o a trajetórias totalmente
diferente das clássicas. Como a função de onda na experiência da fenda dupla depende
da abertura das fendas e da separação entre elas, o potencial quântico também. Assim
esta informação está a todo instante sendo passada às partı́culas e não apenas por
interações locais com a fenda quando elas passam por elas como aconteceria com
partı́culas clássicas. O resultado final é uma distribuição de partı́culas no anteparo
exatamente igual à figura de interferência que todos vemos nos cursos de quântica.
Note que, contrariamente ao que muitas vezes é ensinado, a interferência quântica na
experiência da fenda dupla não implica que trajetórias não façam sentido em mecânica
quântica. A teoria de Bohm é um sólido contra exemplo.
b) Q = 0 é o limite clássico.
c) Contrariamente a todas as outras interpretações, probabilidades não são as únicas

informações que podemos extrair de um sistema quântico já que há muita informação
contida também na equação p = mẋ = ∇S(x, t). Esta é uma vantagem desta inter-
pretação em relação a todas as outras quando a aplicamos à Cosmologia Quântica de-
vido à dificuldade apontada anteriormente de se definir probabilidades nesta situação.
Veremos um exemplo disso na próxima sub-seção.
375
10.3.2 A Cosmologia Quântica e a singularidade cosmológica
Um das grandes perguntas que se espera poder responder com a Cosmologia Quântica
é saber se o Universo teve um começo realmente ou se ele é eterno. Evidentemente
esta pergunta ainda não pode ser respondida no estágio atual mas os caminhos que
podem nos levar a uma resposta definitiva e que tipo de resposta pode ser dada estão
cada vez mais claros.
O procedimento utilizado foi o de usar as grandes simetrias apresentadas pelo Universo
em que vivemos, sua homogeneidade e isotropia, para simplificar drasticamente a
equação de Wheeler-DeWitt e resolvê-la. Assim, ao invés de se quantizar o campo
gravitacional na sua generalidade, quantiza-se apenas os graus de liberdade que restam
de uma geometria homogênea e isotrópica.
Seja portanto a métrica homogênea e isotrópica mais geral dada por:
ds2 = N (t)2 dt2 − a(t)2 γij dxi dxj

a(t)2
= N (t)2 dt2 − [dr2 + r2 (dθ2 + sin2 (θ)dϕ2 )] , (10.30)
(1 + 4 r2 )2
onde N (t) é uma função colocada para deixar livre a escolha do tempo (N (t) = 1
corresponde ao tempo cósmico, N (t) = a(t) ao tempo conforme, etc) e corresponde ao
N (x, t) que aparece no formalismo hamiltoniano da TRG completa em (10.14), a(t) é
o fator de escala, com dimensão de comprimento e que não pode ser negativo e k é a
curvatura das hipersuperfı́cies espaciais: k = ±1, 0.
A ação de Einstein-Hilbert que fornece a parte gravitacional das equações de Einstein
gerais é
√
Z
1
I=− dt d3 x −gR , (10.31)
2κ
onde g é o determinante da métrica e R o escalar de curvatura.
Substiuindo a métrica (10.30) em (10.31) encontramos:
3 √ N a3 ȧ2
Z Z
1 ä ȧ Ṅ
I= d x γ dt + − + . (10.32)
2κ 6 N 2 c2 a2 N 2 c2 a a c2 N 3 a2
Escrevendo
ȧa2
äa 2 2
ȧa Ṅ d ȧ2 a
N
− = −2 , (10.33)
N N2 dt N
e substituindo em (10.32), eliminando a derivada total e fazendo a integral espacial
que fornece o volume comóvel V total do tri-espaço fechado, encontramos:
ȧ2
Z
3V
I= N a3 − 2 2 + 2 dt . (10.34)
κ N a a
Vamos agora estudar dois modelos simples de Cosmologia Quântica, o primeiro cuja
fonte é a constante cosmológica com = 1 e o segundo um fluido radiativo com p = ρ/3
com = 0.
376
a) Constante cosmológica e = 1
Adicionando-se a constante cosmológica Λ > 0 à ação (10.34) tem-se:
ȧ2
Z
3V 3
1 Λ
I= Na − 2 2 2 + 2 − dt . (10.35)
κ cN a a 3
É fácil verificar que a variação desta ação com relação a N fornece a equação de
Friedmann (a equação de vı́nculo correspondente à equação de Einstein G00 = −Λ)
ȧ2 1 Λ
2 2 2
=− 2 + , (10.36)
cN a a 3
enquanto a outra nos dá a equação dinâmica (correspondente à equação Gij = −Λδji )
2ä ȧṄ N ȧ2

−2 2 + 2 + 2 2 − ΛN = 0 . (10.37)
c2 aN c aN a caN
Para reobter as equações no tempo cósmico é só fazer N = 1 nestas equações.
Podemos também facilmente obter a hamiltoniana definindo p = ∂L/∂ ȧ e λ =
3V c4 /(8πG) encontrando:
2 2
λΛa3

cp
H ≡ N H0 = N − − λa + , (10.38)
λ4a 3
As constantes foram absorvidas na definição de N . É fácil verificar que, usando a

equação de hamilton ȧ = ∂H/∂p, o vı́nculo H0 = 0 fornece (10.36), enquanto que
a outra equação de hamilton ṗ = −∂H/∂a nos dá (10.37). Compare esta hamilto-
niana com a hamiltoniana geral da TRG (10.14). Vemos que só aparece o vı́nculo
relacionado às transformações no tempo. O vı́nculo relacionado às transformações de
coordenadas espaciais não aparece aqui porque as simetrias de isotropia e homogenei-
dade das hipersuperfı́cies espaciais impuseram uma escolha de coordenadas espaciais
adaptadas a esta simetria. Veja também como foi importante considerarmos N na
métrica (10.30): sem isto não terı́amos obtido a equação de Friedmann (10.36), obtida
tanto da ação (10.35) quanto da hamiltoniana (10.38) pela variação destas em relação
a N.
Implementando agora o método de quantização de Dirac exposto na seção anterior,
encontramos a seguinte equação de Wheeler-DeWitt para este modelo:
2 2
" #
2lpl ∂2
Ĥ0 Ψ(a) = 0 → − + a2 − Λa4 Ψ(a) = 0. (10.39)
3V ∂a2
Ela corresponde a uma equação de Schrödinger unidimensional estacionária (o tempo

não aparece) para a variável a com energia nula e potencial V (a) = a2 − Λa4 . A
região entre a = 0 (a singularidade) e a = Λ−1/2 é uma região classicamente proibida
pois o potencial V (a) > 0 = E e a região a > Λ−1/2 é classicamente permitida
pois V (a) < 0 = E. Este modelo bem simples sugere a possibilidade quântica de o
377
Universo ter tido um começo não singular tunelando do nada e passando a existir
com raio mı́nimo a = Λ−1/2 . Este tipo de comportamento aparece em outros modelos
mais elaborados. Note que esta criação quântica do Universo é também a criação do
espaço-tempo.
b) Fluido de radiação e = 0
Como neste caso a obtenção da hamiltoniana da parte material não é trivial, embora a
sua forma final seja bastante simples, escreverei-a diretamente. Cabe ao leitor verificar
que ela de fato gera as equações de Einstein para o modelo do Friedmann com radiação
e k = 0. Ela se escreve na forma
2 2
pc PT
H ≡ N H0 = N − + . (10.40)
λ4a a
A quantidade conservada PT está relacionada à quantidade total de radiação no Uni-

verso ρR = PT /a4 e tem dimensão [PT ] = g cm3 /s2 . Note que ele aparece linearmente
na hamiltoniana e portanto sua variável conjugada T pode ser associada ao tempo
(embora [T ] = s/cm). Escolher esse T é equivalente a fazer N = a/l0 , l0 sendo uma
constante arbitrária com dimensão de comprimento que será cancelada (verifique), ou
seja, escolher o tempo conforme. Este é um daqueles casos onde a matéria fornece uma
referência temporal. Definindo η = cT e
r
a 3V
ã = ,
lpl 8π
a quantização fornece
∂Ψ ∂ 2Ψ
Ĥ0 Ψ(a, η) = 0 → i =− . (10.41)
∂η 4∂a2
Uma solução para esta equação pode ser obtida da evolução unitária da gaussiana
inicial6 : 8b 1/4
Ψ0 (a) = exp(−ba2 ), (10.42)
π
gerando
8b 1/4 1 1/2 nih i i o
Ψ(a, η) = exp 1+ a2 . (10.43)
π bη − i η (bη − i)
Vamos interpretar esta solução usando a interpretação de Bohm-de Broglie após es-
crevermos Ψ = AeiS e substituindo em (10.41) obtendo:
∂A2 ∇S
+ ∇· A2 = 0, (10.44)
∂t 2
∂S (∇S)2 ~2 ∇2 A
+ − = 0. (10.45)
∂t 4 4 A
6
O fato do domı́nio de a ser o conjunto dos reais positivos torna a tarefa um pouco mais elaborada,
R∞
tendo que se ter cuidado para que a solução encontrada satisfaça 0 da|Ψ2 (a, η)| = 1.
378
Através da equação p = 2ȧ = ∇S = ∂S/∂a, de onde interpretamos a primeira equação
como uma equação de continuidade [veja a sub-seção (3.1)], é possı́vel integrar a(t)
obtendo
p
a(η) = a0 b2 η 2 + 1 (10.46)
Esta solução é bastante interessante. Representa um universo eterno sem singulari-

dade que se contrai de η = −∞ classicamente, onde ele é imenso, praticamente vazio
e plano, chega a un mı́nimo quando sua contração é interrompida pela ação do po-
tencial quântico, que funciona como um potencial repulsivo neste momento, e depois
se expande novamente até atingir o limite clássico em η = ∞. Pode-se mostrar que o
potencial quântico tende a zero para η = ±∞ mas é bastante relevante perto do raio
mı́nimo. Assim, efeitos quânticos podem evitar a singularidade tornando o Universo
eterno. Como radiação é um bom modelo para a descrição do Universo primordial
(a temperaturas altas, todas as partı́culas se tornam relativı́sticas pois suas energias
cinéticas ficam muito maiores que as energias de repouso), este resultado pode real-
mente indicar o que acontece com o Universo primordial a altas energias. Note que
após a fase quântica, este modelo entra numa fase clássica consistente com as ob-
servações. Este resultado é vaĺido qualquer que seja o valor da constante inicial (a
variável escondida de Bohm) a0 . Chegamos portanto a essas conclusões sem usar a
noção de probabilidade, o que mostra a força desta interpretação.
Existem ainda outras possibilidades de descrição da história completa do Universo,

algumas vindas das teorias de cordas.
Numa delas, o Universo viria de uma eterna expansão acelerada com k = 0 desde
t = −∞ com a(t) ∝ |t|−p , p > 0. Este comportamento é bastante curioso: para
t → −∞ o Universo é muito pequeno, a(t) → 0, mas é praticamente plano pois a
curvatura R ∝ |t|−2 tende a zero. Para t → 0 o Universo é muito grande, a(t) → ∞,
mas tende à singularidade pois a curvatura R ∝ |t|−2 tende a infinito neste limite.
Nesta situação, correções quânticas provenientes da teoria de cordas imporiam uma
transição para uma nova fase em t > 0 de expansão desacelerada a(t) ∝ tp (com
0 < p < 1) do Universo clássico usual. Note que tanto neste caso como no exemplo (b)
acima, podemos entender fundamentalmente o Universo como tendo evoluı́do de uma
instabilidade quântica do espaço-tempo de Minkwski, no primeiro caso pequeno que
se expande aceleradamente e no segundo muito grande que se contrai, e que num certo
momento efeitos quânticos introduzem uma transição para a expansão desacelerada
do Universo clássico usual.
10.3.3 Condições iniciais
Existem várias propostas de condição de contorno para a equação de Wheeler-DeWitt

que permita obter uma única solução da mesma. A mais famosa é a de Hartle-Hawking.
379
Eles se utilizam de uma definição de estado de vácuo baseada em uma formulação da
mecânica quântica em termos de integrais de trajetória proposta por Richard Feyn-
man, onde não é necessária a definição de energia mas que obviamente fornece o estado
de mı́nima energia e excitação nos sistemas onde estes conceitos podem ser definidos.
Esta definição pode ser generalizada e aplicada à quantização da TRG de onde produz,
em sistemas cosmológicos, a função de onda do Universo. É uma proposta com grande
apelo geométrico que já produziu alguns resultados bastante razoáveis (no sentido
de implicar a formação do Universo observado). Entretanto, em algumas situações,
esta prescrição não produz uma única solução da equação de Wheeler-DeWitt: muitas
vezes os caminhos nas integrais de trajetória têm que ser complexos e o resultado final
pode depender do caminho complexo escolhido. Este assunto ainda está em discussão.
Existem outras propostas, como a condição de contorno de tunelamento proposta
por Alexander Vilenkin, que essencialmente tenta impor às soluções da equação de
Wheeler DeWitt que, como no exemplo (a) da subseção anterior, o Universo surgiu
de um tunelamento do nada. Ela não tem o mesmo apelo geométrico da condição
de Hartle-Hawking mas também produz resultados consistentes, em alguns exemplos
melhores que os provenientes da condição de Hartle-Hawking.
Esta área de pesquisa ainda é muito especulativa pois depende muito da formulação
final de uma TQG consistente mas isto não impede a proposição de sugestões e seu
estudo em sistemas simples, como exposto acima, para examinar sua consistência e
viabilidade.
10.4 Comparação com a Observação

Embora por muito tempo se considerasse que a construção de uma TQG e CQ fosse
apenas um exercı́cio teórico sem qualquer possibilidade de verificação experimental,
dada a pequenez das escalas de Planck de tempo e comprimento e o alto valor das en-
ergias envolvidas, hoje já se começa a vislumbrar algumas possibilidades de verificação
observacional das idéias propostas. Vamos citar algumas:
10.4.1 Verficação da natureza discreta do espaço-tempo
Os ‘átomos’ de espaço-tempo, segundo as teorias descritas aqui, teriam dimensões ex-

tremamente pequenas, da ordem do comprimento de Planck, e portanto muito difı́ceis
de serem observadas. Entretanto, para partı́culas que viajassem por longas distâncias,
o efeito desta natureza discreta do espaço-tempo pode ser cumulativo e se tornar
relevante.
Um exemplo de aplicação desta idéia seriam os raios cósmicos de altas energias que
atingem a atmosfera terrestre. Eles provavelmente têm origem cosmológica (sua dis-
tribuição no céu é bem isotrópica, não parecendo vir de uma localidade vizinha), en-
380
ergias altı́ssimas da ordem de 1020 ev (lembre-se das energias produzidas nos grandes
aceleradores, da ordem de 1012 ev) e parecem ter viajado por longas distâncias. É um
mistério eles conseguirem viajar por tão longas distâncias: por serem altamente en-
ergéticos, eles perecebem, do ponto de vista do seu referencial próprio, a radiação
de fundo cósmica a altı́ssima temperatura e portanto tenderiam a se aniquilar pela
contı́nua exposição a esta radiação. Existem possı́veis explicações convencionais para
este fenômeno e nem se sabe ao certo se eles viajaram reamente por longas distâncias
(não é descartada a hipótese deles terem sido produzidos nas imediações da nossa
galáxia). Entretanto, nenhuma dessas explicações paraece satisfatória.
Porém, alguns teóricos vislumbraram uma outra explicação para a observação destes
raios cósmico. A natureza discreta do espaço-tempo implica que num nı́vel fundamental
as transformações de Lorentz não sejam válidas. Estas transformações são deduzidas do
princı́pio da relatividade, invariância da velocidade da luz e da suposição que o espaço-
tempo é homogêneo e isotrópico. Mas um espaço-tempo discreto não é homogêneo.
Ademais, se realmente existe uma TQG que se manifesta na escala da energia de
Planck, esta escala também tem que ser um invariante pois senão observadores com
diferentes velocidades discordariam da energia segundo a qual efeitos quânticos são
p
importantes. Por exemplo, da fórmula relativı́stica E = mc2 com m = m0 / 1 − v 2 /c2 ,
onde m0 é a massa de repouso de uma partı́cula, com E = m0 c2 << Epl , vê-se
facilmente que observadores com velocidades próximas a da luz veriam esta partı́cula
com altı́ssima energia, talvez bem maior que a energia de Planck, discordando de
um observador em repouso em relação a partı́cula sobre se ela deve ser tratada por
uma TQG ou não. Isto implica numa modificação das transformações de Lorentz para
energias da ordem da energia de Planck. Um exemplo seria
mc2
E= 2 . (10.47)
1 + mc
Epl
É fácil ver que jamais a energia da partı́cula pode superar a energia de Planck segundo
esta fórmula.
Modificações na expressão da energia de partı́culas altamente relatı́visticas, como é o
caso destes raios cósmicos, poderiam implicar que eles não veriam a radiação de fundo
cósmica tão energética, e portanto poderiam atravessá-la por longas distâncias e chegar
até nós. Para saber se esta especulação é verdadeira, será necessário um estudo mais
aprofundado destes raios cósmicos de altı́ssimas energias, o que será feito em breve
pelo Observatório Auger na Argentina. Talvez seja possı́vel que as observações do
Auger evidenciem a natureza discreta do espaço-tempo.
10.4.2 Uma escala de Planck observável
Uma possibilidade surgida nas teorias de cordas, que como descrito anteriormente são
teorias formuladas em 9 dimensões espaciais e 1 de tempo, é a possibilidade das de-
381
mais dimensões espaciais não serem diminutas e compactas mas extensas. Para que
não as observemos, basta que as interações fundamentais não gravitacionais estejam
confinadas nas 3 dimensões espaciais que observamos. A única interação que poderia
penetrar nas outras dimensões seria a gravitacional mas o modelo pode ser ajustado
de forma a ainda não ser possı́vel detetar estas interações com experimentos gravita-
cionais. Entretanto, o fato da interação gravitacional se diluir em outras dimensões
implicaria numa redução drástica na energia de Planck, reduzindo-a a patamares onde
o novo grande acelerador que está sendo construı́do em Genebra, no CERN, poderia
alcançar (energias da ordem de 1013 ev). Assim, se este modelo estiver correto, efeitos
da gravitação quântica poderiam ser testados neste novo acelerador.
Entretanto, cabe ainda uma questão final: o que leva os fı́sicos a acreditarem que a
nova escala de Planck seria exatamente esta e não qualquer valor entre 1013 ev e a es-
cala de Planck usual? A resposta é que isto explicaria um grande mistério da fı́sica de
partı́culas. Vários experimentos indicam que o bóson de Higgs, aquele que dá massa
às partı́culas fundamentais, tenha uma energia da ordem de 1012 ev enquanto argu-
mentos teóricos sugerem uma energia da ordem da energia de Planck (este problema é
análogo ao problema constante cosmológica). Se esta tiver o valor mencionado acima,
não haveria discrepância alguma entre a previsão teórica e a indicação experimen-
tal, contrariamente ao valor usual, muitas ordens de grandeza maior que o sugerido
experimentalmente7 .
10.4.3 A radiação de fundo e a Cosmologia Quântica
As medidas das anisotropias da radiação de fundo têm se tornado cada dia mais
precisas. Estas anisotropias têm origem, como explicado em outros cursos deste livro,
nas pequenas flutuações de densidade, possivelmente de origem quântica, que existiam
no Universo primordial.
Os modelos de Cosmologia Quântica mencionados na seção anterior, principalmente
aqueles modelos eternos provenientes de uma instabilidade do espaço-tempo plano,
geram anisotropias da radiação de fundo com sinais bem caracterı́sticos. Por exemplo,
os modelos com uma fase de contração anterior à fase de expansão em que vivemos
provavelmente implicam em pequenas oscilações no espectro de anisotropias da ra-
diação de fundo que poderiam ser observadas num futuro próximo, principalmente
quando o satélite Planck começar a produzir resultados no final da presente década.
Entretanto, tais oscilações podem ter outras origens que não evoquem a Cosmologia
Quântica.
Um canal observacional mais limpo é a observação das anisotropias da radiação de
fundo provocadas por ondas gravitacionais primordiais e seus efeitos na polarização
7
A supersimetria também poderia resolver esta discrepância já que ela introduz uma nova escala na
fı́sica de partı́culas.
382
desta radiação. Existem poucos dados observacionais atualmente mas a situação deve
melhorar nos próximos anos. Neste caso, modelos de Cosmologia Quântica prevêem
resultados diferentes da Cosmologia clássica padrão que são difı́ceis de ser explicados
de outra maneira.
Finalmente, algumas cosmologias provenientes das teorias de cordas citadas na seção
anterior já foram refutadas pelas observações das anisotropias da radiação de fundo
por não reproduzirem uma faixa do espectro observado. Ou seja modelos cosmológicos
oriundos de teorias quânticas da Gravitação já podem ser refutados pelas observações!
10.5 Conclusão
A história da quantização da gravitação já tem mais de 50 anos e ainda não está
acabada. Poucas vezes na história da fı́sica tantas mentes brilhantes levaram tanto
tempo para realizar uma tarefa sem obter ainda um resultado conclusivo. De fato,
quantizar o espaço-tempo, a arena da fı́sica envolve imensas dificuldades.
Entretanto, como vimos, houve grande progresso. Pela primeira vez temos uma teoria
quântica do espaço-tempo, a Gravitação Quântica de Laços, que embora não pos-
samos afirmar ser a definitiva TQG pela falta de predições observáveis, mostra que os
princı́pios da TRG e os princı́pios da TQ não são afinal incompatı́veis como muitos
afirmavam. Ela é um forte contra-exemplo a esta crença. Ademais, ela mostrou como
construir uma TQG sem usar métodos perturbativos que parecem, inapropriados num
nı́vel fundamental.
As duas abordagens principais, a quantização canônica, através da Gravitação
Quântica de Laços, e a quantização covariante, através das teorias de supercordas,
têm produzido resultados complementares que servem para montar um quadro mais
abrangente da teoria fundamental que as contem. A formulação desta teoria pode es-
tar mais próxima uma vez que as duas comunidades que antes trabalhavam nos seus
respectivos setores sem se comunicar, têm dialogado mais. Alguns temas obscuros,
como a termodinâmica dos buracos negros, têm sido melhor compreendidos e elucida-
dos. Como vimos na seção anterior, até mesmo a possibilidade de testar estas teorias
têm sido vislumbradas.
A Cosmologia Quântica, embora ainda esteja longe de produzir resultados definitivos,
tem oferecido descrições bastante sensatas a respeito do Universo primordial e se teve
ou não um começo. Se teve um começo, o Universo surgiu muito pequeno, mas com
um tamanho finito, de um tunelamento quântico a partir do nada (aqui entendido de
uma maneira mais radical como a ausência de espaço, tempo e matéria). Mas outros
modelos sugerem que ele possa ser eterno, resultante da instabilidade do espaço-tempo
plano. O mais impressionante é que estes modelos podem talvez ser testados num
futuro próximo através do estudo dos efeitos destas fases primordiais nas anisotropias
383
da radiação de fundo, alguns deles até já tendo sido refutados pelas observações! Uma
teoria cientı́fica começa a adquirir status quando ela permite ser refutada. Ademais, a
Cosmologia Quântica propiciou um grande aprofundamento na compreensão da TQ.
Percebeu-se as fortes limitações da interpretação de Copenhaguen, todos os pontos
obscuros que eram colocados debaixo do tapete e que não podiam lá continuar quando
o objeto a ser quantizado era o Universo. Construiu-se interpretações alternativas
ou tentou-se aprimorar a interpretação de Copenhaguen, implicando numa grande
evolução do nosso conhecimento sobre a TQ.
Evidentemente, a construção de uma teoria consistente da gravitação e cosmologia
quânticas com confirmação observacional e experimental não significa o fim da fı́sica,
mesmo que ela seja uma teoria unificada de todas as interações. Em primeiro lu-
gar porque as teorias fı́sicas são construções mentais às quais tentamos acomodar
os fenômenos naturais conhecidos e por isso mesmo podem ser refutadas diante de
qualquer novo fenômeno.
Em segundo lugar porque, ao contrário, ela abrirá portas que hoje nem imaginamos.
Por exemplo, será que com o conhecimento destas novas teorias conseguiremos con-
struir os chamados buracos de minhoca, atalhos do espaço-tempo que conectam dois
lugares distantes possibilitando a sua travessia em tempos curtı́ssimos? E com estes
atalhos, será possı́vel constrir máquinas do tempo? Será que as energia e matéria
escuras que parecem compor 97% da matéria do Universo não são simplesmente man-
ifestações de modificações da TRG em larga escala que serão compreendidas pela
TQG, da mesma maneira que a precessão do perihélio de Mercúrio foi explicada por
uma revolução na teoria de Newton, a TRG, e não pela presença de um planeta não
observado (Vulcano) entre Mercúrio e o Sol?
A construção da Gravitação e da Cosmologia quânticas é certamente um dos proble-
mas mais profundos e difı́ceis da história da fı́sica. Sua solução exige trabalho árduo,
colaboração e criatividade e certamente trará resultados surpreendentes e inúmeras
perspectivas. Por isso este é, a meu ver, o problema mais fascinante da fı́sica contem-
porânea.
10.6 Leituras Recomendadas
1) Lee Smolin, Three Roads to Quantum Gravity, Basic Books-New York (2001).
2) Jonathan Halliwell, Quantum Cosmology and the Creation of the Universe, Scientific
American 265, n 6, 76 (1991).
3) Michio Kaku, Hiperespaço, Editora Rocco (1994).
4) Nelson Pinto Neto, Quantum Cosmology, Cosmology and Gravitation II: Proceed-
ings of the VIII Brazilian School of Cosmology and Gravitation, 229, editado por
Mário Novello, (Editions Frontieres 1995).
384
5) Franck Laloe, Do we really understand quantum mechanics?, American Journal of
Physics 69, 655 (2001).
6) Kip S. Thorne, Black Holes and Time Warps, W.W. Norton and Company (1994).
Exercı́cios
1. Prove que a ação da equação (11) não muda de forma por uma transformação
τ̃ = τ̃ (τ ).
2. Prove as relações (12,14,15).
3. Encontre as equações de Hamilton da hamiltoniana (16) e interprete-as.
4. Deduza as equações (23) e (24) da equação (22).
5. Mostre, usando uma analogia com fluidos e a relação p = mẋ = ∇S(x, t), que a
equação (23) é uma equação de continuidade.
6. Deduza a ação (29) da ação mais geral (26) se usarmos (25).
7. Obtenha as equações de Friedmann da ação (30) e obtenha a solução clássica
para N = 1.
8. Obtenha a hamiltoniana (33) e calcule as equações de hamilton. Compare com o
resultado do exercı́cio anterior.
9. Calcule as equações de Hamilton provenientes da hamiltoniana (35) e encontre
as equações de Friedmann para radiação. Interprete Pt . Encontre as soluções
para N = 1 e N = a/l0 , onde l0 é uma constante arbitrária com dimensão de
comprimento.
10. Mostre que (38) é solução de (36).
11. De p = 2ȧ = ∂S/∂a, encontre a solução (41) e interprete-a para η >> 1/b.
12. Calcule o potencial quântico correspondente à função de onda (38) e faça o seu
gráfico. Verifique o seu comportamente ao longo das trajetórias (41) e interprete
o seu resultado.
13. Da relação (42), faça um gráfico E x v para 0 < v < c.
10.7 Agradecimentos
Agradeço ao CNPq pela bolsa de pesquisa concedida.
385
Capı́tulo 11
Geometria Diferencial
Nelson Pinto Neto1
11.1 Introdução
No inı́cio do século XX, as chamadas geometrias curvas já eram bem conhecidas. Elas
foram desenvolvidas ao se abandonar o quinto postulado da geometria plana de Eu-
clides. Esse postulado afirma que se uma reta cruza outras duas e se a soma dos ângulos
internos às duas retas for menor que 180o num lado, então as retas se encontrarão,
se estendidas para além desse lado. Durante dois milênios tentou-se provar que esse
postulado poderia ser deduzido dos outros quatro, mas o máximo que se conseguiu
foi escrevê-lo de formas equivalentes. Até que o jesuı́ta Geralamo Saccheri tentou ver-
ificar, pela primeira vez, como seria uma geometria sem o quinto postulado. A partir
daı́, o estudo dessas geometrias ganhou um grande impulso com Gauss, Lobachevski
e Bólyai, com seus estudos de geometrias curvas bi-dimensionais e com Riemann, que
generalizou esse estudo para geometrias n-dimensionais, por volta de meados do século
XIX. Nessas geometrias, coisas bizarras acontecem, como a soma dos ângulos inter-
nos de um triângulo ser diferente de 180o e o perı́metro d de um cı́rculo ser diferente
de 2πr. O ramo da Matemática que estuda estas geometrias denomina-se Geometria
Diferencial. Resumiremos a seguir seus principais conceitos e deifinições.
1
386
11.2 Objetos geométricos
11.2.1 Curvas e vetores
Uma curva é uma função diferenciável xµ (λ) do < → <n , que associa a cada valor do
parâmetro λ ∈ < sobre a curva. as coordenadas xµ ∈ <n de um ponto p do espaço
curvo de dimensão n, onde os ı́ndices µ assumem n valores.
Um vetor é qualquer elemento de um espaço vetorial, cuja definição é bem conhecida
da Ágebra Linear. Exemplos de vetores são os vetores deslocamento num espaço plano,
velocidade instantânea (tangente a uma curva) e, num campo mais abstrato, os oper-
adores de diferenciação ∂/∂xµ . Num espaço curvo, o vetor deslocamento perde sentido
(por exemplo, o deslocamento entre dois pontos de uma esfera sequer pertence à
esfera). Por isso vamos definir vetores lançando mão de operadores de diferenciação
associados às tangentes a uma curva. Assim, vetores tangentes a uma curva num ponto
p, que formam um espaço vetorial de dimensão n, são dados por
d dxµ ∂
V≡ = , (11.1)
dλ dλ ∂xµ
onde os operadores de diferenciação atuam numa função escalar teste qualquer f (xµ ),
fornecendo a sua derivada no ponto p, e usamos a convenção de Einstein: ı́ndices
repetidos correspondem a uma soma de 1 a n.
Pode-se entender o conjunto de n vetores eµ ≡ ∂/∂xµ como uma base particular deste
espaço vetorial, constituı́da dos vetores tangentes às linhas coordenadas xµ no ponto
p, e dxµ /dλ como as componentes do vetor d/dλ nesta base. Se quisermos utilizar
um outro sistema de coordenadas para descrever os pontos do espaço curvo através
da transformação de coordenadas x0 µ = g µ (xν ) que, para ser bem definida, deve ter
jacobiano não nulo no ponto p, J ≡det|∂xν /∂x0 µ | = 6 0, as novas componentes do
mesmo vetor V = d/dλ = (dx /dλ)(∂/∂x ) na base (∂/∂x0 µ ) associada a estas novas
0µ 0µ
coordenadas serão dadas por
0µ dx0 µ ∂x0 µ dxν ∂x0 µ ν

V ≡ = = V . (11.2)
dλ ∂xν dλ ∂xν
e a base muda como
∂ ∂xν ∂ ∂xν
eµ0 ≡ = = eν . (11.3)
∂x0 µ ∂x0 µ ∂xν ∂x0 µ
Note que a base se transforma contrariamente às componentes e por isso os vetores
tangentes são também chamados de vetores contravariantes.
11.2.2 Tensores
O espaço vetorial de vetores tangentes à curva no ponto p definido acima, denotado

Tp , é chamado de espaço tangente e existe um espaço tangente diferente a cada ponto
387
da variedade. Como sabemos da álgebra linear, pode-se construir o espaço dual a
Tp , chamado Tp∗ , através do conjunto das aplicações lineares b̃ que levem um vetor
tangente pertencente a Tp num número real, b̃(V) = a. Pode-se construir a chamada
base dual de Tp∗ , w̃µ , através da definição
w̃µ (eα ) = δαµ . (11.4)
Os elementos deste espaço b̃ = bµ w̃µ , chamados de 1-formas ou vetores covariantes [é

fácil ver que suas componentes bµ se tranformam como a base (11.3)], são os tensores
(0,1), enquanto os vetores tangentes, ou contravariantes, são os tensores (1,0). Gen-
eralizando, os tensores T (M,N) são definidos como as aplicações (M,N)-lineares que
levam M 1-formas e N vetores tangentes num número real: T(b̃, d, ˜ ..., V, U, ...) = a.
Suas componentes são dadas pelo número real obtido da aplicação de T numa base
de 1-formas e vetores tangentes,
αβ...
Tµν... ≡ T(w̃α , w̃β , ...eµ , eν , ...). (11.5)
Se fizermos uma mudança de coordenadas, usarmos a linearidade da tranformação e

as Eqs. (11.3,11.4), é fácil mostrar que as componentes do tensor T se transformam
como
αβ... λ ∂x0 α ∂x0 β ∂xθ ∂xφ ρσ... λ

T 0 µν... (x0 ) = ρ σ
... 0 µ 0 ν ...Tθφ... (x ). (11.6)
∂x ∂x ∂x ∂x
Campos tensoriais são os conjuntos de tensores T avaliados em cada ponto da var-

αβ...
iedade, de componentes Tµν... (x ).
11.3 Derivada covariante de campos tensoriais
A noção de derivada pressupõe a comparação de dois objetos em pontos diferentes.

Como os objetos geométricos em pontos diferentes de um espaço curvo pertencem
a espaços vetoriais diferentes (os espaços tangentes), é necessária uma definição de
transporte para que possamos levar um objeto geométrico de um ponto a outro do
espaço curvo e assim compararmos objetos pertencentes a um mesmo espaço tangente.
A derivada covariante é obtida a partir de uma noção de transporte de tensores que

exige a definição de uma nova quantidade Γαµν chamada conexão, que conecta vetores de
espaços tangentes diferentes através do chamado transporte paralelo. As componentes
do vetor transportado paralelamente são então dadas por
Akα (xγ + dxγ ) = Aα (xγ ) − Γαλµ (xγ )Aλ (xγ )dxµ , (11.7)
388
o que define a derivada covariante como
Aβ (xγ + dxγ ) − Akβ (xγ + dxγ )
Aβ||α ≡ Aβ;α ≡ ∇α Aβ ≡ lim
dx →0α dxα
= ∂α Aβ + Γβαν Aν . (11.8)
Outra maneira equivalente de definir Γβαµ é através da base: ∇α eµ ≡ Γβαµ eβ , ou seja,

Γβαµ é a componente β na base e do vetor resultante da aplicação da componente α
da derivada covariante no vetor de base eµ . Usando a regra de Leibniz e o fato de o
operador ∇α se reduzir a ∂α ao atuar numa função, pode-se reobter a equação (11.8)
de ∇α Aβ ≡ (∇α A)(w̃β ) e A = Aµ eµ (exercı́cio).
Da Eq. (11.4), pode-se obter ∇α w̃µ = −Γµαβ w̃β e assim a derivada covariante de
qualquer tensor (M,N):
αβ...
∇λ Tµν... αβ...
≡ ∂λ Tµν... ηβ...
+ Γαηλ Tµν... + Γβηλ Tµν...
αη...
+ ...
−Γηµλ Tην...
αβ...
− Γηνλ Tµη...
αβ...
− .... (11.9)
Uma curva geodésica é definida como aquela cujo vetor tangente transportado parale-
lamente ao longo da curva do ponto p ao ponto q é igual ao próprio vetor tangente no
ponto q [V α (λ + dλ) = V kα (λ + dλ)], o que implica em V α ∇α V β = 0. Isto impõe a
equação da geodésica, dada por
d2 xµ α
µ dx dx
ν
+ Γ αν = 0. (11.10)
dλ2 dλ dλ
Como será visto, ela está relacionada com a queda livre dos corpos num campo grav-
itacional.
Note que no espaço plano em coordenadas cartesianas, cujas bases são constantes,
∇α eµ = 0 ⇔ Γβαµ = 0 (ou seja, no espaço plano em coordenadas cartesianas o trans-
porte paralelo não altera o vetor, como já sabemos) e a solução de (11.10) é a reta
tradicional. Evidentemente, para outros espaços, ou se trabalharmos com coordenadas
curvilı́neas no espaço plano, a conexão Γ não será nula e a solução da equação da
geodésica não será mais uma reta.
Como ∇α Aβ são as componentes de um verdadeiro tensor (1,1) e como ∂α Aβ não
se tranforma como um tensor, então Γβαµ também não pode se transformar como
um verdadeiro tensor para poder compensar este fato. É fácil verificar que Γβαµ se
transforma como
α γ ∂x0 α ∂xθ ∂xφ ρ γ ∂x0 α ∂ 2 x

Γ0 µν (x0 )
= Γ (x ) + . (11.11)
∂xρ ∂x0 µ ∂x0 ν θφ ∂x ∂x0 µ ∂x0 ν
A existência do termo não homogêneo simétrico permite anular a parte simétrica da
conexão num ponto p mediante uma escolha de coordenadas. A parte anti-simétrica
α
da conexão, Tµν = Γαµν − Γανµ , é chamada torção e não pode ser anulada, por se tratar
de um verdadeiro tensor. No nosso curso consideraremos a torção nula.
389
Figura 11.1: Transporte paralelo.
11.4 O tensor de curvatura

O tensor de curvatura é definido como
Rµνβα Aν ≡ ∇α ∇β Aµ − ∇β ∇α Aµ . (11.12)
Das equações acima podemos obter sua relação com a conexão:
Rµνβα = ∂α Γµνβ − ∂β Γµνα + Γµα Γνβ − Γµβ Γνα . (11.13)
Pode-se mostrar que o tensor de curvatura é proporcional à mudança sofrida por

um vetor quando este é transportado paralelamente ao longo de uma curva fechada.
Por exemplo (veja figura 11.1), transporte paralelamente o vetor A através da curva
coordenada xµ (µ é um ı́ndice determinado) de xµ = a até xµ = a + δa, depois
transporte-o ao longo da curva coordenada xν (ν é outro ı́indice determinado com
ν 6= µ) de xν = b até xν = b + δb, a seguir retorne ao longo da curva coordenada xµ
de xµ = a + δa até xµ = a, e finalmente volte ao ponto inicial através do transporte
ao longo da curva coordenada xν de xν = b + δb até xν = b. É fácil mostrar que a
diferença entre o vetor original e o transportado ao longo da curva fechada, supondo
os deslocamentos infinitesimais e indo até segunda ordem, é dada por
δAα = −Rαβµν Aβ δaδb (11.14)
O tensor de curvatura também está relacionado com uma quantidade muito impor-
tante: o desvio geodético. Seja η α o vetor que conecta dois pontos de mesmo parâmetro
ao longo de duas geodésicas vizinhas de vetor tangente V µ , que diferem uma da outra
apenas por uma pequena diferença nas suas condições iniciais. A equação do desvio
geodético é dada por
D2 ~η µ
≡ V α ∇α (V β ∇β η µ ) = Rµναβ V ν η α V β . (11.15)
Dλ2
390
Note que o tensor de curvatura é um tensor e não pode ser anulado por uma trans-
formação de coordenadas. Pode-se mostrar que um espaço é plano se e somente se o
tensor de curvatura é nulo em todos os pontos. Assim, o mais importante para carac-
terizar um espaço curvo não é a equação da geodésica, já que a conexão pode ser não
nula no espaço plano ou nula num ponto em um espaço curvo, mas sim a equação do
desvio geodético. Ela está relacionada, como será visto, com os efeitos de maré num
dado campo gravitacional.
O tensor de curvatura ainda satisfaz as chamadas identidades de Bianchi (verifique):
∇ Rµναβ + ∇β Rµνα + ∇α Rµνβ = 0 (11.16)
11.5 O tensor métrico
Esta é uma outra estrutura que podemos definir sobre a variedade, totalmente inde-
pendente da conexão. Ela é um campo tensorial (0,2) que associa dois vetores a um
número real, que fornece o ângulo entre eles. Tratando-se do mesmo vetor, podemos
associar tal número a sua magnitude. Suas componentes são gµν ≡ g(eµ , eν ). Nestas
notas, consideraremos a métrica simétrica. Para dois eventos separados pelo vetor
infinitesimal dxµ , o elemento de linha infinitesimal será dado por
ds2 = gµν dxµ dxν . (11.17)
Note que para um espaço plano n-dimensional em coordenadas cartesianas, gµν = δµν
(g = I) e para o espaço-tempo de Minkowski, gµν = ηµν .
Com o tensor métrico podemos definir um vetor covariante associado ao vetor con-
travariante V α da forma Vβ ≡ gβα V α ou, reciprocamente, com a sua inversa g µν ,
V β ≡ g βα Vα .
Podemos estabelecer uma relação entre a conexão e o tensor métrico impondo que
o ângulo entre dois vetores transportados pela conexão ao longo de uma curva se
mantenha constante ao longo deste transporte. Isto implica (verifique) que ∇α gµν = 0.
Estes são chamados de espaços de Riemann. Pode-se obter a conexão simétrica de um
espaço de Riemann completamente em função da geometria permutando-se os ı́ndices
da equação ∇α gµν = 0, obtendo (verifique)
1
Γβαν ≡ g βµ (∂ν gαµ + ∂α gνµ − ∂µ gαν ). (11.18)
2
Quando a conexão é dada por (11.18), as curvas geodésicas são também curvos com
ds extremo. Para o espaço plano, isto significa distância mı́nima. Para o espaço-tempo
plano de Minkowski, isto implica em distância mı́nima ou tempo próprio máximo
dependendo se a geodésica é tipo-espaço ou tipo-tempo, respectivamente.
391
Nos espaços de Riemann, o tensor de curvatura Rµναβ é anti-simétrico na troca de
ı́ndices nos primeiro e segundo pares, simétrico na troca global do primeiro par pelo
segundo e ainda satisfaz uma propriedade cı́clica nos últimos 3 ı́ndices
Rµναβ + Rµβνα + Rµαβν = 0. (11.19)

Isto faz com que ele tenha somente 20 componentes independentes, permitindo a
definição, sem ambiguidade, do tensor de Ricci
Rνβ ≡ Rαναβ , (11.20)

do escalar de curvatura
R ≡ g νβ Rνβ , (11.21)
e do tensor de Einstein
1
Gµν ≡ Rµν − Rgµν , (11.22)
2
que satisfaz, das identidades de Bianchi (11.16),
∇α Gαν = 0. (11.23)
Num ponto p, é sempre possı́vel diagonalizar a métrica e normalizar seus elementos

mediante uma escolha apropriada do sistema de coordenadas no ponto. O conjunto de
sinais destes termos diagonais é chamado de assinatura da métrica. Na Relatividade
Geral, que tem como limite a Relatividade Especial, esta assinatura é (+, −, −, −).
Como ainda podemos anular as conexões ou, equivalentemente num espaço de Rie-
mann, as derivadas primeiras da métrica, pode-se nestes sistemas escrever a métrica
em torno do ponto p como
1 ∂ 2 gµν
gµν = ηµν + | δxα δxβ + ... . (11.24)
2 ∂xα ∂xβ p
Portanto, nestes sistemas efeitos gravitacionais só podem ser percebidos em segunda
ordem nos deslocamentos. Referenciais associados a estes sistemas são chamados de
referenciais de Lorentz locais, em torno dos quais Einstein formulou seu Princı́pio de
Equivalência.
11.6 Exercı́cios
1) Mostre que, usando a regra de Leibniz e o fato de o operador ∇α se reduzir a ∂α
ao atuar numa função, pode-se reobter a equação (11.8) de ∇α Aβ ≡ (∇α A)(w̃β ) e
A = Aµ eµ .
392
2) Mostre as Eqs. (11.9),(11.10) e (11.11).
3) Mostra a Eq. (11.13) a partir de (11.12). Deduza (11.14).
4) Mostre que se o produto escalar entre dois vetores transportados pela conexão ao
longo de uma curva se mantem constante ao longo deste transporte então ∇α gµν = 0.
A seguir obtenha a Eq. (11.18) realizando permutações desta relação.
5) Mostre a identidade de Bianchi (11.16) e sua consequência (11.23). Sugestão: utilize
o sistema de coordenadas em que a conexão é nula e mostre que o resultado obtido é
válido em qualquer sistema de coordenadas.
6) Usando a mesma sugestão da questão anterior, demonstre a Eq. (11.19) e mostre
que o tensor de Riemann tem apenas 20 componentes independentes em 4 dimensões.
7) Calcule expressão explı́cita em termos de coordenadas esféricas em um espaço plano
tri-dimensional do laplaciano covariante de uma função escalar f , g αβ ∇α ∇β f , usando
a Eq. (11.18). Compare com o resultado conhecido.
393
Capı́tulo 12
Teoria da Relatividade Especial
Renato Klippert1
12.1 Introdução
A intuição corresponde a uma espécie de sı́ntese das experiências (vividas ou pen-
sadas) que constituem o passado daquele que possui tal intuição. Portanto, trata-se
de uma noção não objetiva, mas fortemente dependente do observador. Apesar disso,
ao deparar-se pela primeira vez com o estudo da Relatividade Especial, o aluno de
cursos de ciências exatas já deve ter sido apresentado a alguma disciplina de Mecânica
de Newton e, possivelmente, também ao Eletromagnetismo de Maxwell. Desta forma,
sua intuição incluirá certas experiências conceituais básicas relativas a tais temas. À
intuição partilhada por uma expressiva parcela da população denominamos senso co-
mum. Esta intuição é extremamente útil para avaliar o que é ou não razoável num
enorme número de problemas simples da vida cotidiana, e não deve de modo algum
ser descartada. Contudo, esta mesma intuição é por vezes um freio à compreensão de
novos fenômenos ou idéias, e isto freqüentemente de fato ocorre no estudo da Relativi-
dade Especial. Desta forma, este capı́tulo pretende levar o aluno a desenvolver uma
intuição relativı́stica.
12.1.1 Sinopse
São imprescindı́veis neste capı́tulo conhecimentos prévios de mecânica, brevemente re-

vista na Sub-seção 12.2.1, bem como de cálculo diferencial e integral; já o estudo prévio
1
Afiliação: Instituto de Ciências Exatas (ICE), Universidade Federal de Itajubá (UNIFEI), PO Box
50 37500-903 Itajuba, MG.
394
do eletromagnetismo será importante somente para a leitura da Sub-seção 12.2.3 (a
qual pode ser omitida sem prejuı́zo na compreensão do conteúdo posterior). A Seção
12.3 desenvolve as bases fı́sicas da Relatividade, e a Seção 12.4 apresenta sua for-
mulação matemática em termos de coordenadas cartesianas. A Seção 12.5 detalha al-
gumas conseqüências desta teoria para a descrição cinemática de fenômenos da fı́sica,
e faz uso de conhecimentos básicos de ondulatória na Sub-seção 12.5.2 (a qual pode
ser omitida). A Seção 12.6 apresenta uma formulação relativı́stica da mecânica new-
toniana. Toda esta construção baseia-se numa unificação dos conceitos (previamente
independentes) de espaço e de tempo, numa nova entidade denominada espaço-tempo,
conforme é apresentado na Seção 12.7, numa técnica que é utilizada para resolver
problemas tı́picos da Teoria da Relatividade na Seção 12.8. Na Seção 12.9 analisa
uma generalização relativı́stica do Grupo de Galileu da mecânica clássica, fazendo
uso marginal do conceito matemático de grupo (cujo estudo prévio não é essencial), e
dando lugar à construção das grandezas fundamentais da fı́sica relativı́stica: os ten-
sores. A Seção 12.10 apresenta uma lista sumária de resultados de testes experimentais
da Relatividade Especial, servindo como uma justificativa pragmática ao estudo desta
teoria. As citações bibliográficas ao longo deste capı́tulo correspondem à lista a seguir
apresentada. Exercı́cios relativos ao presente capı́tulo encontram-se colecionados na
Seção 12.12. Um ı́ndice analı́tico dos principais termos utilizados no capı́tulo figura ao
final do mesmo.
A idéia básica desse texto consiste em servir como material de apoio a um mini-curso
do tema, de modo que sua estrutura pode ser particionada em aulas (com duração de
duas horas cada). Uma primeira aula é dedicada à apresentação do curso e às Secs.
12.2 e 12.3. As demais seções deste capı́tulo foram programadas para apresentação em
uma aula cada. Assim, a segunda aula é dedicada à Sec. 12.4, a terceira aula à Sec.
12.5, a quarta aula à Sec. 12.6, a quinta aula à Sec. 12.7, a sexta aula à Sec. 12.8 (com
possibilidade de inclusão de crı́ticas adicionais), e a sétima aula à Sec. 12.9. Desta
forma, o estudo dirigido deste capı́tulo requer um total de 14 horas, distribuı́das num
total de 7 aulas.
12.2 Mecânica versus Eletromagnetismo
A Mecânica de Newton [3] consiste numa das mais sólidas e frutı́feras estruturas
conceituais até hoje concebidas no âmbito cientı́fico. Aliás, a noção atual do termo
ciência adquire seu significado à luz dessa teoria. Por outro lado, a primeira e mais bem
sucedida teoria de campo da fı́sica foi o Eletromagnetismo de Maxwell [2]. Nesta seção,
observaremos que a estrutura de invariância associada às leis da Mecânica Newtoniana
é incompatı́vel com aquela das leis do Eletromagnetismo Maxwelliano. A observação
deste fato levou os fı́sicos do século XIX a admitirem a existência do éter luminı́fero,
um meio material tênue e virtualmente imponderável, com respeito ao qual as leis
395
de Maxwell seriam válidas. Tentativas de evidenciar experimentalmente a presença
desse éter foram todas infrutı́feras (conforme os resultados da Sec. 12.10), fato que foi
julgado paradoxal na sua época mas que é essencial à Teoria da Relatividade Especial.
12.2.1 Mecânica de Newton
Apresenta-se aqui uma breve revisão dos conceitos e leis da mecânica de Newton [3].
A forma de apresentação adotada não necessariamente coincide com aquela suposta-
mente estudada anteriormente [7, 8].
Postulados de Newton
Tempo (Absoluto) é uma noção exata e universal, e flui uniformemente sem

relação com qualquer coisa externa.
Espaço (Absoluto) é uma noção exata e universal, e se extende uniformemente
sem relação com qualquer coisa externa.
Referencial Inercial é uma coleção coerente de instrumentos de medida
(réguas e relógios) capaz de determinar diferenças de Tempo Absoluto e
de Espaço Absoluto.
Momentum Linear é uma grandeza vetorial para cada sistema fı́sico que de-
termina sua capacidade potencial de modificar sua vizinhança.
Força é uma grandeza vetorial que determina a forma como os corpos sensı́veis
interagem mutuamete.
Leis da Mecânica de Newton relativas às observações e medidas efetuadas por um
referencial inercial.
Inércia Apresenta momentum linear constante no tempo todo e somente aquele
sistema sobre o qual seja nula a resultante vetorial das forças atuantes.
Dinâmica A taxa de variação temporal do momentum linear total de um sistema
equivale à força resultante que sobre ele atua.
Ação e Reação A cada força exercida por um sistema X sobre um sistema Y,
corresponde uma força de mesma direção e magnitude e de sentido contrário,
exercida pelo sistema Y sobre o sistema X.
Decorre dessas definições e leis que, do ponto de vista estrito da mecânica de Newton,
todos os referenciais inerciais são indistingüı́veis entre si. Este importante re-
sultado constitui a assim denominada Relatividade Galileana da mecânica de Newton,
garantindo a possibilidade de escolha do referencial inercial a ser adotado conforme a
necessidade e/ou conveniência de cálculos. Os detalhes dessa relatividade de Galileu
serão analisados na Sec. 12.2.2, que corresponde à estrutura matemática subjacente à
Teoria Newtoniana.
396
Método de Galileu-Newton
1. Identificação do Sistema de interesse.

2. Identificação da Vizinhança do Sistema de interese.
3. Escolha de um Referencial inercial.
4. Escolha de um Sistema de coordenadas.
5. Identificação das interações da Vizinhança sobre o Sistema de interesse.
6. Expressão das leis da Mecânica para o Sistema de interesse.
7. Retorno ao item (1) acima, tantas vezes quantas sejam necessárias (possivel-
mente nenhuma), visando o equilı́brio entre o número de relações e o número
de variáveis.
8. Manipulação das equações obtidas no item (6), segundo as regras do cálculo
vetorial e de comparação de medidas entre referenciais inerciais, visando a
determinação explı́cita das variáveis.
A noção de força postulada por Newton apresenta problemas conceituais que foram
percebidos à época de sua construção. Em particular, a idéia de força pressupõe uma
espécie de ação à distância: um corpo atua sobre outro instantaneamente, indepen-
dentemente da distância entre ambos. Assim, para determinar todas as influências
sobre um dado corpo, faz-se necessário conhecer tudo o que existe em todo o Universo
sensı́vel.
Esta dificuldade levou à construção teórica da noção de campo, uma espécie de in-
termediário das interações entre os corpos, responsável pela transmissão através do
espaço e do tempo da informação relativa à presença do corpo-agente até o corpo-
objeto. A forma como este campo é produzido é descrita pela fı́sica de forma análoga
às leis de força, enquanto que sua ação sobre os corpos é descrita por uma lei que
envolve somente o corpo-objeto e o valor do campo na posição deste objeto. Para
descrever a forma de propagação desse campo, a fı́sica se vale usualmente da teoria
ondulatória. Com isso, o campo produzido por um corpo corresponde às potenciais
influências deste corpo sobre seu ambiente, e se propaga na forma de uma onda.
12.2.2 Grupo de Galileu
Conforme observado na Seção 12.2.1, a mecânica de Newton apresenta como estrutura

de invariância o Grupo de Galileu2 relativo à mudanca de coordenadas cartesianas
adaptadas a referenciais inerciais em movimento relativo. Assim, seja O um referencial
2
Matematicamente, um grupo é um par ordenado da forma (X, ∗), onde X é um conjunto e ∗ é uma
operação binária em X tal que: (1) a operação ∗ é associativa, (x∗y)∗z = x∗(y ∗z) para todos x, y, z ∈ X;
(2) existe um elemento identidade i ∈ X neutro pela operação ∗, de modo que i ∗ x = x = x ∗ i para
todo x ∈ X; (3) para cada x ∈ X, existe um correspondente elemento x−1 ∈ X inverso de x, tal que
x−1 ∗ x = i = x ∗ x−1 .
397
inercial com coordenadas cartesianas de espaço e tempo (t, x, y, z), para o qual as
leis de Newton são válidas. Analogamente, seja O0 um outro referencial inercial com
coordenadas cartesianas (t0 , x0 , y 0 , z 0 ) — para o qual as leis de Newton são igualmente
válidas.
Suponhamos que o referencial O0 se move com velocidade V~OO0 , conforme determinada
pelo referencial O. Se ambos os referenciais são inerciais, então a velocidade relativa
V~OO0 entre eles é constante. Seja P um arbitrário evento (isto é, um ponto do espaço
num especı́fico instante de tempo). Sejam (tP , xP , yP , zP ) as coordenadas de espaço
e de tempo do evento P relativas ao referencial O, e designemos as correspondentes
coordenadas deste mesmo evento P relativas ao referencial O0 por (t0P , x0P , yP0 , zP0 ). Por
simplicidade, suponhamos que os eixos cartesianos correspondentes nos referenciais
inerciais O e O0 sejam paralelos, e que a velocidade relativa V~OO0 seja V dirigida ao
longo do eixo Ox. Esses conjuntos de coordenadas se relacionam segundo o Grupo
de Galileu:  0

 tP = tP + to
 x0 = x − V t + x

P P P o
0
(12.1)


 y P = yP + yo
 0
zP = zP + zo .
Nas Eqs. (12.1) figuram as constantes (to , xo , yo , zo ), as quais correspondem tão so-
mente a uma translação constante na origem temporal e espacial, e que são usualmente
omitidas por simplicidade. Destas relações decorre que as diferenças entre essas co-
ordenadas são ∆t0P = ∆tP e ∆R ~ 0 = ∆R ~ − V~OO0 ∆tP (em notação vetorial). Assim, a
velocidade do referencial O com respeito ao referencial O0 é
dR~0 d ~ ~
V~O0 O = O
= (RO − ~OO0 tO ) = dRO − V~OO0 = −V~OO0 ,
V
dt0O dtO dtO
onde a última igualdade acima resulta do fato de ser constante no tempo a posição
no espaço da origem espacial do referencial O, conforme determinado pelo próprio
~ O /dtO = ~0. Assim, obtemos que V~O0 O = −V~OO0 .
referencial O. Isto é, dR
Do ponto de vista do referencial O0 , e considerando o resultado acima, temos as Eqs.
(12.1) na forma inversa
tP = t0P + t0o



 x = x0 + V t 0 + x0

P P P o
0 0
(12.2)


 yP = yP + yo
zP = zP0 + zo0 ,

onde as novas constantes (t0o , x0o , yo0 , zo0 ) podem ser facilmente determinadas em termos
de (to , xo , yo , zo ) e da velocidade relativa V~OO0 entre os referenciais.
12.2.3 Eletromagnetismo de Maxwell
Apresenta-se aqui somente um resumo da Teoria Eletromagnética de Maxwell [2, 9]. As

leis de Maxwell do eletromagnetismo descrevem os fenômenos elétricos e magnéticos,
398
bem como a propagação de ondas eletromagnéticas (tais como a luz visı́vel). Esta
~ = (Ex , Ey , Ez ) e magnético B
teoria baseia-se na existência dos campos elétrico E ~ =
(Bx , By , Bz ), bem como na noção de carga elétrica q e de corrente elétrica i. Por
simplicidade, consideraremos somente o eletromagnetismo no vácuo.
~ e
Um corpo carregado com carga q e velocidade ~v , na presença de campos externos E
~ encontra-se sujeito à força local de Lorentz
B,
~ + q ~v × B.
F~ = q E ~ (12.3)
c
As leis de Maxwell no vazio podem ser expressas conforme segue.3
Monopolo elétrico O fluxo de campo elétrico através de qualquer superfı́cie fechada

equivale à quantidade total de carga elétrica envolvida por esta superfı́cie.
Monopolo magnético O fluxo de campo magnético através de qualquer superfı́cie

fechada é igual a zero.
Lei de Faraday-Lenz A circulação do campo elétrico no contorno de qualquer su-

perfı́cie aberta equivale ao oposto da taxa de variação temporal do fluxo de campo
magnético através desta superfı́cie.
Lei de Ampère-Maxwell A circulação do campo magnético no contorno de qual-

quer superfı́cie aberta equivale à soma da taxa de variação temporal do fluxo
de campo elétrico através desta superfı́cie com a quantidade lı́quida de corrente
elétrica que a atravessa.
Mais formalmente, essas leis podem ser escritas no sistema internacional de unidades
(por meio da permissividade elétrica do vácuo εo e da permeabilidade magnética do
vácuo µo ) na forma integro-diferencial
~ = Q
~ · dS
H
S
E εo
~ ~
H
S
B · dS = 0
(12.4)
~ = −d
~ · d` ~
~ · dS
H R
E B
C dt

S

~ = µ o i + εo d
~ · d` ~ ,
~ · dS
H R
B E
C dt S
onde S representa uma superfı́cie fechada arbitrária nas duas primeiras igualdades e
Q é a carga elétrica lı́quida contida no volume limitado pela superfı́cie S, ao passo que
nas duas últimas igualdades S é uma superfı́cie aberta arbitrária cujo contorno é a
curva C e i é a corrente elétrica lı́quida que atravessa a superfı́cie S. Alternativamente,
3
As leis de Maxwell foram traduzidas em palavras visando o máximo de simplicidade, às custas de
precisão: o sistema de unidades no qual tais enunciados são válidos pode ser desconhecido ao estudante.
399
podemos escrever essas leis na forma diferencial
~ ·E
∇ ~ = ρ
εo
~ ·B
∇ ~ = 0
(12.5)
∇ ~ = −∂B
~ ×E ~
∂t

∇ ~ = µo J~ + εo ∂ E
~ ×B ~ ,
∂t
onde ρ é a densidade volumétrica de carga elétrica e J~ é a densidade superficial de
corrente elétrica.
As Eqs. (12.5), quando escritas na ausência de fontes (ρ = 0 e J~ = ~0 ), implicam (ver
Exercı́cio 1) que cada uma das componentes cartesianas de ambos os campos elétrico
e magnético são soluções da equação da onda
1 ∂2

2
− ∇ Φ(t, x, y, z) = 0, (12.6)
v 2 ∂t2
√
(isto é, Φ = Ex e Φ = By são soluções), com velocidade v = 1/ µo εo = c cujo
valor numérico coincide com o valor experimental (Sec. 12.10) para a velocidade de
propagação da luz no vácuo. Assim, a teoria de Maxwell prevê uma velocidade natural
de propagação da luz no espaço vazio, em contradição com a relatividade de Galileu.
Pois, conforme as Eqs. (12.1), se algum referencial inercial O determina para a luz
uma velocidade de propagação v = c, outro referencial inercial O0 que se move com
respeito ao primeiro com velocidade u 6= 0 (na mesma direção e sentido do movimento
luminoso) irá determinar para a luz uma velocidade de propagação v 0 = c − u distinta
da velocidade v = c.
12.3 Fundamentos da Relatividade Especial

Dada a incompatibilidade teórica discutida na Seção 12.2, e tendo a experiência re-
sultado favorável ao eletromagnetismo (conforme Seção 12.10), faz-se necessário re-
formular a mecânica de Newton de modo a descrever adequadamente situações que
envolvem velocidades comparáveis à da luz no vácuo. São aqui apresentados os fun-
damentos de uma generalização da Mecânica Newtoniana, tal que seja adequada ao
problema proposto acima, e que recupera (em caráter aproximado) os resultados da
teoria de Newton na situação convencional de velocidades pequenas (se comparadas à
velocidade da luz no vácuo).
A dificuldade básica da mecânica, sob o ponto de vista da teoria mais correta do
eletromagnetismo, consiste na fórmula de adição de velocidades
vO0 = vO − VOO0 ,
relativa a medidas arbitrárias em distintos referenciais inerciais, e conseqüência ime-

diata do princı́pio de relatividade de Galileu. Mas, se a teoria prevê uma velocidade
400
absoluta para a propagação da luz no vácuo, então o princı́pio de relatividade de
Galileu deve estar errado. Portanto, (pelo menos) uma dentre as seguintes alternati-
vas deverá ser verdadeira: ou existem referenciais inerciais privilegiados (aqueles que
determinam para a luz a velocidade c prevista teoricamente, e que se encontram em
repouso no espaço absoluto), ou as Eqs. (12.1) não são válidas no caso geral envol-
vendo altas velocidades. As evidências experimentais apontaram para a última dessas
possibilidades (conforme a relação apresentada na Seção 12.10), e o raciocı́nio que
segue admite isto como válido.
12.3.1 Princı́pio da Relatividade Especial
A Teoria da Relatividade Especial [4] supõe verdadeiras as afirmações a seguir.
Postulados de Einstein
Covariância As leis da fı́sica apresentam a mesma forma em qualquer referencial

inercial.
Invariância A velocidade da luz no vácuo é independente do estado de movi-
mento do observador bem como da fonte luminosa.
Sabemos, da geometria analı́tica, que uma igualdade da forma A = B ~ é desprovida de

sentido (uma grandeza escalar não pode ser igual a uma grandeza vetorial). Assim, uma
tal expressão é rejeitada pelo crivo lingüı́stico da geometria. O postulado de covariância
parece uma natural generalização à toda fı́sica (e não somente à mecânica) do princı́pio
de relatividade de Galileu. Na forma acima, ele garante que somente aquelas relações
que preservam sua forma perante uma mudança de referenciais inerciais podem ser
aptas ao tı́tulo de Lei da Fı́sica. O postulado de covariância exige da Fı́sica uma
espécie de crivo lingüı́stico da relatividade, justificando assim seu nome: as leis da
fı́sica são covariantes perante mudança de referencial inercial. Observa-se que a noção
de covariância não é uma inovação da Relatividade Especial, mas igualmente ocorre
na Geometria [1] (covariância vetorial) e na Mecânica de Newton [3] (covariância de
Galileu). O caráter original deste postulado refere-se ao tipo de covariância em questão,
e será detalhado no que segue (bem como nas Seções 12.4, 12.5 e 12.9).
O postulado de invariância da velocidade da luz no vácuo é bem menos intuitivo. Com

efeito, nossa crença na relatividade de Galileu é tanta que este postulado parece-nos, à
primeira vista, contradizer o postulado anterior. Demonstraremos a seguir o contrário
disto, ou seja, a compatibilidade desses dois princı́pios. Contudo, é verdade que diver-
sos resultados usuais da fı́sica pré-relativı́stica, tomados tacitamente como verdadeiros
por nosso senso comum, tornam-se incorretos se analisados sob a perspectiva da Re-
latividade Especial.
401
A noção de espaço é claramente dependente da escolha do observador inercial que
o determina, bem como a idéia de deslocamento.4 Por outro lado, a velocidade de
um corpo material (ponderável ou não) é, por definição, o espaço por ele percorrido
na unidade de tempo, conforme determinados por um observador (inercial). Assim, a
conjunção dos dois postulados de Einstein implicam (ver Exercı́cio 2) que a noção de
intervalo de tempo seja também dependente de observador, de tal modo que a razão
Espaço percorrido pela luz
Tempo de percurso
possa resultar numa grandeza absoluta (e igual a c), independente do observador
inercial escolhido, tal como requer o postulado de invariância. Portanto, as idéias
Newtonianas de tempo absoluto e de velocidades relativas ao observador devem ser
substituı́das na Relatividade Especial pelas idéias Einsteinianas de tempo relativo
ao observador e de velocidade da luz absoluta.5 Isto posto, fica claro que o enunci-
ado “Tudo é relativo”, usualmente atribuı́do à Relatividade Especial, é exagerado e
enganoso, se não quisermos ser rigorosos em considerá-lo como sendo completamente
equivocado.
É usual o estudante sentir dificuldades na mecânica de Newton ao estudar o tema ‘re-
ferenciais inerciais’, por não depositar a devida atenção à questão “Qual observador
faz qual medida?”. Essas dificuldades costumam ter lugar também no estudo da Re-
latividade Especial, pela mesma razão, e são agravadas pela relatividade das medidas
de tempo impostas por esta teoria (contrariamente ao senso comum que atribui ao
tempo uma noção absoluta). Assim sendo, o item (8) do Método de Newton (Seção
12.1) deve ser entendido na Relatividade Especial como referindo-se à comparação
relativı́stica entre medidas efetuadas em distintos referenciais inerciais, tema central
da Seção 12.4.
Ainda com respeito aos fundamentos da teoria, é freqüente encontrar textos mencio-
nando que a Relatividade Especial vale apenas para movimento uniforme, sendo ina-
dequada para descrever movimentos acelerados (cujo estudo requereria a Relatividade
Geral para uma descrição relativı́stica adequada). Também isto é incorreto, embora
um pouco mais próximo da verdade. A Relatividade Especial é uma teoria sobre a
comparação entre medidas efetuadas por referenciais inerciais em movimento relativo,
e não sobre quais são essas medidas. Desta forma, ela admite que o observador seja
inercial, mas nada afirma a respeito do tipo de movimento de um corpo descrito por
esse observador. Em outras palavras, a aceleração do Sistema de interesse é um con-
ceito tão lı́cito na Relatividade Especial quanto o é na Mecânica Newtoniana. Contudo,
referenciais não inerciais são desqualificados pela Relatividade Especial (tal como o
eram pela Mecânica Newtoniana). Medidas feitas por tais “maus observadores” com
efeito requerem a Relatividade Geral para uma descrição adequada a situações onde
4
Esta relatividade do espaço também ocorre na mecânica de Newton.
5
Velocidades outras que não a da luz no vácuo são dependentes de observador também na Relatividade
Especial, conforme a Seção 12.5.1.
402
as velocidades envolvidas são comparáveis à velocidade da luz no vácuo. O estudo da
Teoria da Relatividade Geral é tema do Capı́tulo 1.
Como última observação de caráter geral, cumpre salientar o papel do sistema de
coordenadas. Visto que a Relatividade Especial resulta ser, em essência, uma teoria
sobre a linguagem da fı́sica, não é surpreendente que distintos sistemas de coordenadas
sejam tratados de forma distinta. Em primeiro lugar, é comum (e nem sempre cor-
reto) identificar escolha do referencial inercial com escolha do sistema de coordenadas
cartesianas. Quando isto é feito, entende-se que o sistema de coordenadas escolhido
está adaptado ao observador; ou seja, a coordenada que mede o tempo associado aos
eventos neste sistema coordenado coincide com algum instrumento (como um relógio)
que mede a passagem do tempo ao longo da história do observador (isto é, a coleção
de eventos que o localizam no espaço ao longo do tempo). Embora seja bastante raro
uma escolha de coordenadas não adaptadas ao observador no contexto da Relativi-
dade Especial, observa-se o contrário na Teoria da Relatividade Geral. Desta forma,
o presente capı́tulo utiliza-se exclusivamente de sistemas coordenados adaptados ao
observador.
Em segundo lugar, o sistema de coordenadas cartesianas nem sempre é a forma mais
conveniente de descrever um dado Sistema (fı́sico ou matemático) de interesse. Com
efeito, o estudante talvez já esteja familiarizado com alguns sistemas de coordenadas
curvilı́neas, tais como as coordenadas polares (a duas dimensões), e as cilı́ndricas
e esféricas (a três dimensões). Embora seja possı́vel utilizar tais sistemas coordena-
dos não cartesianos na Relatividade Especial, isto introduz complicações matemáticas
desnecessárias neste momento, de modo que a apresentação neste capı́tulo restringe-se
ao uso de coordenadas cartesianas. Tais dificuldades não podem ser evitadas no estudo
da Relatividade Geral, contudo. Portanto, é sugerido ao leitor que, após ter concluı́do
o estudo dos Capı́tulos 1 e 11, retorne ao presente capı́tulo para considerar as modi-
ficações necessárias à Teoria da Relatividade Especial quando descrita em termos de
sistemas de coordenadas não cartesianos.
12.3.2 Sincronicidade
Dos resultados obtidos na Sec. 12.3.1 temos que o conceito relativı́stico de tempo não
é independente do observador inercial que o determina. Apesar disso, como veremos
na Sec. 12.4.2, a ordem temporal com que os observadores percebem os eventos é
preservada. Esta ordem unı́voca corresponde, de certa forma, à noção de causalidade da
fı́sica: as influências ocorrem de modo que as causas precedem seus próprios
efeitos. A conexão entre ordem temporal de eventos e causalidade requer uma espécie
de revisão no contexto da Relatividade Especial.
Entende-se por referencial uma coleção de observadores (um em cada ponto relevante
do espaço), em repouso relativo entre si, dispondo de réguas e relógios sincronizados.
403
Um destes observadores é qualificado, arbitrariamente, como sendo a “origem” do
referencial. A cada um desses observadores, associa-se coordenadas espaciais corres-
pondentes à sua respectiva posição relativa à origem, conforme medidas por qualquer
um deles. Embora essas posições espaciais não representem dificuldade, a sincronização
de seus relógios apresenta certa arbitrariedade.
Suponhamos que os observadores desse referencial disponham de relógios que operem
com mecanismos idênticos. Um desses observadores “mostra” ao outro a medida que
consta em seu próprio relógio. Para que o outro observador “veja” isto, é necessário
que a luz que codifica essa imagem viaje desde o primeiro observador até o segundo,
percorrendo com velocidade c a distância finita entre eles e, portanto, levando neste
percurso um tempo finito. Assim, a imagem que o segundo observador percebe do
relógio do primeiro encontra-se temporalmente atrasada com respeito àquela de seu
próprio relógio no evento A caracterizado por “segundo observador vê o relógio do
primeiro observador”. Este atraso inferido ∆t corresponde à razão entre a distância
∆x entre os observadores e a velocidade da luz nesse percurso retilı́neo, ou seja ∆t =
∆x/c. Desta forma, se a diferença entre a leitura do relógio do segundo observador no
evento A e a leitura por ele visualizada no relógio do primeiro observador nesse evento
coincidir exatamente com o cálculo ∆t acima, então dizemos que os relógios desses
dois observadores estão sincronizados (a la Einstein).
Para efetuar a sincronização de todos os relógios de um dado referencial inercial pelo
método acima, imaginemos que o observador na origem deste referencial ilumina mo-
mentaneamente seu próprio relógio no instante em que este marca o tempo “zero”. A
imagem assim produzida evolui no espaço, e progressivamente atinge os demais ob-
servadores desse referencial, tanto mais atrasada quanto maior a distância da origem
até cada um deles. Cada um desses observadores A, à distância dA da origem, é pre-
viamente instruı́do para acionar seu relógio, marcando “zero” + (dA /c), no instante
em que a imagem do tempo “zero” na origem o atinge. Como tratam-se de relógios
com mecanismos idênticos, seu funcionamento similar a partir de então deve preservar
este sincronismo inicial,6 de modo tal que esses relógios estarão sincronizados (a la
Einstein) para medições futuras de tempo.
12.4 Transformações de coordenadas de Lorentz
Com base nos postulados de Einstein (Sec. 12.3.1), encontram-se desenvolvidas aqui as
regras relativı́sticas de comparação de medidas efetuadas por referenciais inerciais em
movimento relativo, denominadas Leis de Transformação de Coordenadas (Cartesianas
adaptadas) de Lorentz (ou simplesmente Transformações de Lorentz). Estas regras as-
sumem, na Relatividade Especial, o papel desempenhado na Mecânica de Newton
6
Isto é válido se o espaço é homogêneo e isotrópico, como estamos ora supondo, mas via de regra não
é verdadeiro nas situações mais amplas descritas pela Relatividade Geral.
404
pelas leis de transformação de coordenadas de Galileu, Eqs. (12.1). A obtenção das
Transformações de Lorentz encontra-se a seguir desenvolvida passo-a-passo [7], em
termos de Gedankenexperiment, (experiências de pensamento), isto é, experimentos
idealizados realizáveis em princı́pio (porém não realizados efetivamente), cujos resulta-
dos podem ser previstos teoricamente apenas com base nos postulados e nas definições
das grandezas fı́sicas envolvidas.
12.4.1 Coordenadas transversas
Suponhamos um referencial inercial O e outro referencial inercial O0 que se move

relativamente a O com velocidade u constante, dirigida ao longo do sentido positivo
do eixo cartesiano Ox. Suponhamos ainda que os eixos coordenados espaciais cor-
respondentes nesses referenciais sejam paralelos.7 Consideremos dois bastões, A e B,
idênticos em tamanho e forma. Suponhamos que o bastão A esteja em repouso com
respeito ao referencial inercial O, ao longo do eixo Oy deste, e com uma de suas
extremidades na origem deste referencial, de modo que y ≥ 0 para eventos sobre o
bastão A. Analogamente, suponhamos que o bastão B esteja em repouso com respeito
ao referencial inercial O0 , ao longo do eixo O0 y 0 deste, e com uma de suas extremidades
na origem deste referencial, de modo que y 0 ≥ 0 para eventos sobre o bastão B. Ver
Fig. 12.1 (a).
Figura 12.1: As coordenadas transversas ao movimento relativo devem apresentar na-

tureza invariante perante a mudança de referencial inercial, de modo que a noção de
evento possa ser independente do observador.
Seria possı́vel, em princı́pio, que o referencial O atribuı́sse tamanhos distintos aos

bastões A e B, devido ao fato deste último encontrar-se com velocidade u (ao passo que
A está em repouso) com respeito a este referencial. Suponhamos, momentaneamente
e para fixar idéias, que o movimento na direção x tornasse mais curtas as dimensões
transversas y e z. Neste caso, para O, o bastão B pareceria menor do que o bastão A
7
Salvo menção explı́cita em contrário, todos os referenciais inerciais utilizados nesse capı́tulo utilizam-
se de sistemas de coordenadas com eixos correspondentes paralelos entre si.
405
e, ao passar por este, determinaria um ponto interno ao bastão A correspondente à
extremidade superior de B naquele evento, conforme Fig. 12.1 (b).
Consideremos o ponto de vista do observador O0 , para quem B está em repouso e A
encontra-se com velocidade u dirigida ao longo do sentido negativo do eixo O0 x0 . Como
supusemos que o movimento encurta as dimensões transversas, parecerá a O0 que o
bastão A é o menor. Portanto, ao passar por B, o bastão A determinaria um ponto
interno àquele correspondente à extremidade superior de A naquele evento, conforme
Fig. 12.1 (c).
A noção de evento, contudo, não deve depender do observador: se o evento “extremi-
dade superior do menor bastão no instante de encontro dos bastões” localiza para O
um ponto interno ao bastão A, então é inaceitável que este mesmo evento localize para
O0 a extremidade de A. Assim, a hipótese acima de que o movimento ao longo de x
reduz as dimensões y e z não pode ser verdadeira, pois conduziria a uma contradição.
É imediato perceber que a hipótese de que o movimento em x dilate as dimensões
y e z conduziria analogamente a resultados igualmente inaceitáveis, sendo portanto
igualmente falsa. Resulta desse raciocı́nio que o movimento ao longo da direção x não
modifica quaisquer das dimensões transversas y e z:
(
y = y0
(12.7)
z = z0.
Em geral, temos que comprimentos ao longo de direções transversas ao movi-

mento não são por este alteradas.
12.4.2 Dilatação do tempo
Considere os mesmos referenciais inerciais O e O0 acima, em movimento relativo com

velocidade u ao longo da direção x. Suponhamos que O0 dispõe de uma lanterna e de
um espelho, fixando a lanterna na origem e o espelho a uma altura fixa y 0 = d sobre
o eixo O0 y 0 . Então, o observador O0 aciona a lanterna, disparando um lampejo de luz.
O raio de luz sobe a distância d até encontrar o espelho, reflete-se (instantaneamente)
neste, e retorna pelo mesmo caminho até a origem. Ver Fig. 12.2 (a).
A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de subida e descida é 2d, então devemos ter t0 = 2d/c para o tempo de
trânsito da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal. Para O, o cami-
nho percorrido pelo raio de luz que atinge o espelho e retorna à lanterna não é vertical,
406
Figura 12.2: A invariância da velocidade da luz requer que o tempo entre dois dados
eventos pareça menor para o observador inercial que os situa no mesmo ponto do espaço
do que para qualquer outro observador inercial em movimento com respeito ao primeiro.
mas sim uma trajetória inclinada como ilustra a Fig. 12.2 (b). Para a subida, enquanto
o raio luminoso desloca-se verticalmente a distância y = d — igual àquela medida pelo
referencial O0 , pois trata-se de um comprimento medido perpendicularmente ao movi-
mento relativo, conforme discutido na Sec. 12.4.1 — ele também desloca-se horizontal-
mente a distância x = ut1 no tempo de subida t1 . Assim, a distância total percorrida
p
pela luz na subida é dada (pelo teorema de Pitágoras) por l1 = d2 + (ut1 )2 . Como
trata-se de um raio de luz percorrendo no vácuo a distância l1 no tempo t1 , temos (por
postulado) que l1 = ct1 , de modo que a igualdade entre estas distâncias resulta em
√
t1 = d/ c2 − u2 . Para o trajeto de descida, temos relações análogas: a distância per-
p √
corrida no tempo t2 de descida será l2 = d2 + (ut2 )2 = ct2 , donde t2 = d/ c2 − u2 .
√
O tempo total do percurso luminoso será t = t1 + t2 = 2d/ c2 − u2 .
Desta forma, os eventos A e B definem para o observador O o intervalo de tempo
t0
t= p , (12.8)
1 − (u/c)2
onde t0 é o intervalo de tempo definido entre esses mesmos eventos pelo observador O0
que os observa no mesmo ponto do espaço. Em geral, o intervalo de tempo τ = t0 na
Eq. (12.8), relativo a medidas entre dois eventos A e B no mesmo ponto do espaço,
é denominado (no contexto da Relatividade Especial) de tempo próprio entre esses
eventos, e corresponde ao menor lapso de tempo possı́vel entre os referidos eventos que
pode ser determinado por algum referencial inercial (pois t ≥ t0 ). É usual representar
intervalos de tempo próprio pelo sı́mbolo τ .
407
12.4.3 Contração do comprimento
Considere os mesmos referenciais inerciais O e O0 acima, em movimento relativo com

velocidade u ao longo da direção x. Suponhamos novamente que O0 disponha de uma
lanterna e de um espelho, fixando a lanterna na origem e o espelho a uma posição fixa
x0 = d sobre o eixo O0 x0 . Então, o observador O0 aciona a lanterna, disparando um
lampejo de luz. O raio de luz percorre a distância d até encontrar o espelho, reflete-se
(instantaneamente) neste, e retorna pelo mesmo caminho até a origem. Ver Fig. 12.3
(a).
Figura 12.3: A invariância da velocidade da luz requer que a distância entre dois dados
eventos pareça maior para o observador inercial que os determina entre pontos em repouso
no espaço do que para qualquer outro observador inercial em movimento com respeito ao
primeiro.
A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de ida e volta é 2d, então devemos ter t0 = 2d/c para o tempo de trânsito
da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal, conforme a Fig.
12.3 (b). Para O, o ponto do espaço onde a luz atinge o espelho corresponde ao encontro
no instante intermediário t1 do raio de luz (com velocidade c a partir da origem) com
o espelho (com velocidade u a partir da posição inicial x). Assim, temos ct1 = x + ut1 ,
donde x = (c − u)t1 , pois o espelho e o raio de luz viajam no mesmo sentido. Para
o retorno do raio de luz, contudo, o raio de luz e seu alvo (a lanterna), embora
inicialmente separados pela mesma distância x acima, viajam em sentidos opostos
com velocidades de mesma magnitude que acima. Portanto, o tempo de retorno t2
satisfaz à relação x = (c + u)t2 . Desta forma, o tempo total (ida e volta) do percurso
408
luminoso será
1 1 2c
t = t1 + t2 = x + =x .
c−u c+u c2 − u2
Conforme o resultado da Sec. 12.4.2, o tempo próprio t0 entre os eventos A e B (pois
o referencial O0 os determina no mesmo ponto do espaço) relaciona-se com o tempo t
acima por meio da Eq. (12.8), de modo que temos
1 t 2xc/(c2 − u2 ) x 1
p = 0 = = .
1 − (u/c)2 t 2d/c d 1 − (u/c)2
Desta forma, obtemos finalmente que a distância x entre a lanterna e o espelho em
movimento, como determinado pelo referencial O, é dada por
p
x = 1 − (u/c)2 x0 , (12.9)
em termos do comprimento próprio ` = x0 = d, determinado pelo referencial O0

que localiza em repouso no espaço os pontos que localizam as extremidades desse
comprimento. É usual representar intervalos de comprimento próprio pelo sı́mbolo `.
12.4.4 Simultaneidade relativa
Estando sincronizados os relógios de um dado referencial inercial pelo procedimento

descrito na Sec. 12.3.2, consideremos dois eventos A e B correspondendo ao acender
das lâmpadas de dois postes de iluminação pública nas posições a e b, ao longo de
uma avenida. Para tanto consideremos novamente os mesmos referenciais inerciais O
e O0 acima, em movimento relativo com velocidade u ao longo da direção x.
Suponhamos que O0 percebe os postes em repouso, associando a eles uma distância
própria x0 = 2`. Suponhamos, também, que os eventos A e B são vistos por O0 como
simultâneos, de modo que os raios de luz provenientes dos eventos A e B atingem
simultaneamente o ponto médio do espaço entre as posições espaciais desses eventos
(conforme determinadas por O0 ) no evento C, à distância ` deles. Ver Fig. 12.4 (a).
Do ponto de vista do referencial O, que também tem seus relógios sincronizados a la
Einstein, as posições a e b dos postes estão em movimento uniforme com velocidade u.
p
De acordo com os resultados da Sec. 12.4.3, a distância entre a e b é x = 2` 1 − (u/c)2 .
p
Desta forma, o ponto médio entre a e b encontra-se à distância ` 1 − (u/c)2 destes,
e viaja igualmente com velocidade u. O raio de luz de a para b viaja com velocidade c
no sentido oposto ao movimento dos postes, aproximando-se com uma velocidade c+u
p
do ponto médio, e atingindo-o, portanto, após o tempo tA = ` 1 − (u/c)2 /(c + u).
Ver Fig. 12.4 (b). Já o raio de luz de b para a viaja com velocidade c no mesmo sentido
de movimento dos postes, aproximando-se com uma velocidade c − u do ponto médio,
p
e atingindo-o no tempo tB = ` 1 − (u/c)2 /(c − u), como ilustrado na Fig. 12.4 (c).
Portanto, a diferença de tempo
2` u/c2

p 1 1
t = tB − tA = ` 1 − (u/c)2 − =p
c−u c+u 1 − (u/c)2
409
Figura 12.4: Eventos simultâneos para um dado referencial inercial podem ser caracteriza-
dos como ocorrendo em tempos diferentes para um referencial inercial em movimento com
respeito ao primeiro, devido ao procedimento de Einstein de sincronização de relógios.
entre a chegada ao ponto médio dos pulsos de luz emitidos nos eventos A e B é
percebida pelo referencial O como sendo a diferença de tempo entre esses eventos.
Assim, se o referencial O0 determina como simultâneos dois eventos separados pela

distância x0 , o referencial O que se move com respeito ao primeiro com velocidade u
determina esses eventos como ocorrendo em instantes distintos, separados pelo lapso
de tempo
x0 u 1
t= 2 p . (12.10)
c 1 − (u/c)2
Para O, o evento A precede temporalmente o evento B, pois a posição espacial b

de B precede a posição espacial a de A relativamente à orientação da velocidade u.
Desta forma, um outro referencial O00 , com velocidade u com respeito a O0 no sentido
negativo do eixo O0 x0 , perceberia os eventos A e B também separados temporalmente
pelo tempo dado pela Eq. (12.10), porém de modo que o evento B precede o evento
A. Com isto, a ordem temporal entre os eventos A e B depende do observador. De
acordo com o procedimento de sincronização de relógios de Einstein (Sec. 12.3.2), se
existir um referencial inercial que observa eventos espacialmente separados
como sendo simultâneos, então existirão outros referenciais inerciais que
os distingüem temporalmente. A ordem temporal com que esses eventos ocorrem
depende da escolha do referencial.
12.4.5 Transformações de Lorentz

p
Por simplicidade de notação, visto ser o fator adimensional 1 − (u/c)2 que figura
nas Eqs. (12.8)–(12.10) muito freqüente em expressões relativı́sticas, é conveniente
introduzir para ele um sı́mbolo especial. Assim, define-se o “fator de Lorentz”
1
γ=q , (12.11)
1 − (u/c)2
410
de mudança de coordenadas entre referenciais inerciais com magnitude da velocidade
relativa u. O fator de Lorentz satisfaz a relação γ ≥ 1. Nos casos em que esta velocidade
relativa u não seja clara do contexto, a notação γu é preferı́vel.
Com o auxı́lio da Eq. (12.11), podemos exprimir as considerações anteriores sobre

coordenadas transversas, dilatação temporal, contração espacial, e simultaneidade re-
lativa, expressos nas Eqs. (12.7)–(12.10) na forma a seguir. Temos que ∆y 0 = ∆y e
∆z 0 = ∆z. Se o referencial O0 efetua medidas no mesmo ponto do espaço (∆x0 = 0),
então temos ∆t = γ ∆t0 em acordo com a Eq. (12.8). No caso de medidas simultâneas
para o referencial O (∆t = 0), temos ∆x0 = γ ∆x em acordo com a Eq. (12.9). Para
medidas simultâneas para O0 (∆t0 = 0), temos ∆t = (γu/c2 ) ∆x0 em acordo com a
Eq. (12.10). Admitindo a linearidade das transformações de coordenadas de espaço e
tempo, estes resultados podem ser sumarizados na forma da lei de transformação de
coordenadas de Lorentz
 0

 t = γ(t − ux/c2 ) + to
 x0 = γ(x − ut) + x

o
0
(12.12)


 y = y + y o
 0
z = z + zo ,
e sua lei inversa (ver Exercı́cio 5), a qual pode ser obtida daquela acima por meio das
~ ↔R
substituições formais t ↔ t0 , R ~ 0 , e u → −u (além de to → t0o e R
~o → R
~0 )
o
t = γ(t0 + ux0 /c2 ) + t0o




 x = γ(x0 + ut0 ) + x0

o
0 0
(12.13)


 y = y + yo
z = z 0 + zo0 ,

onde as constantes (to , xo , yo , zo ) e suas análogas (t0o , x0o , yo0 , zo0 ) desempenham, na
Relatividade Especial, papel análogo das constantes homônimas que figuram nas Eqs.
(12.1) na Mecânica de Newton — e serão, em geral, omitidas na teoria de Einstein
tal como o eram na de Newton. Aliás, as Eqs. (12.12) desempenham elas próprias na
Relatividade Especial o mesmo papel das Eqs. (12.1) na Mecânica de Newton.
Cumpre notar que as Eqs. (12.12) de Lorentz aproximam-se das Eqs. (12.1) de Galileu
no limite de baixas velocidades u c (de modo que c2 → ∞ e γ → 1). Por exemplo,
para uma velocidade u = 30Km/s (tı́pica para o movimento dos planetas em torno do
Sol, e sensivelmente maior do que as velocidades de objetos macroscópicos na superfı́cie
terrestre), temos u/c ≈ 10−4 e γ − 1 ≈ 5 · 10−9 . Portanto, a Mecânica de Newton deve
ser encarada, nesta perspectiva, como o limite de baixas velocidades da Mecânica de
Einstein (ou relativı́stica), a qual será formulada posteriormente (Sec. 12.6) com base
nos resultados acima.
411
12.5 Cinemática relativı́stica
Uma vez determinadas as leis fundamentais de transformação de coordenadas en-

tre referenciais inerciais, codificadas nas Eqs. (12.12) da Seção 12.4, analisaremos
aqui o problema da comparação do movimento conforme descrito por tais referenciais.
Determinam-se, desta forma, em analogia com as Eqs. (12.12), leis de transformação
entre referenciais inerciais das principais grandezas cinemáticas envolvidas no estudo
da mecânica — o deslocamento, a velocidade, e a aceleração de um arbitrário sistema
mecânico — e da ondulatória — o comprimento de onda, a freqüência, e o vetor de
onda de um arbitrário sistema ondulatório.
12.5.1 Sistemas mecânicos
Considere o movimento de uma partı́cula material P (ou qualquer outro sistema fı́sico
de interesse cuja descrição, em cada instante, resume-se a um ponto do espaço),
conforme descrito por um referencial inercial O. Assim, num genérico instante t,
a partı́cula P encontra-se no ponto caracterizado pelo vetor posição R ~ = R(t)
~ =
~ ~ ~
x(t)i + y(t)j + z(t)k expresso nas coordenadas cartesianas utilizadas pelo referencial
O. Com isto, a história da partı́cula P (ou sua
linha
de universo) é definida (por
~
O) pela coleção de eventos da forma t, R(t) = t, x(t), y(t), z(t) para todos os
valores do parâmetro t no domı́nio das funções x(t), y(t), e z(t).
Embora a representação de um evento em coordenadas possa depender do observador
inercial escolhido, o evento não é dependente do observador nem das coordenadas por
ele escolhidas. Assim, a história da partı́cula P , conforme a definição acima, é uma
noção relativisticamente invariante.
Considere dois arbitrários eventos A e B na história de P , respectivos aos (igual-
mente arbitrários) instantes de tempo tA e tB determinados por O. O deslocamento
Newtoniano da partı́cula P desde A até B é dado por

~ ~ ~
RAB = R(tB ) − R(tA ) = x(tB ) − x(tA ), y(tB ) − y(tA ), z(tB ) − z(tA ) .
Com isto, a velocidade média Newtoniana de P nesse percurso é dada por
~ AB
~v AB = (vABx , vABy , vABz ) = t R− tA
B
x(tB ) − x(tA ) y(tB ) − y(tA ) z(tB ) − z(tA )
= tB − tA , tB − tA , tB − tA .
A velocidade instantânea Newtoniana de P no evento A é então

~vA = vx (tA ), vy (tA ), vz (tA ) = lim ~v AB
tB →tA
x(tB ) − x(tA ) y(tB ) − y(tA ) z(tB ) − z(tA )
= lim t −t , lim t −t , lim t −t ,
tB →tA B A tB →tA B A tB →tA B A
412

e, em geral, ~v (t) = vx (t), vy (t), vz (t) para cada instante de tempo t.
A aceleração média Newtoniana de P no percurso de A para B é dada por

~v AB vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
~aAB = = , , .
tB − tA tB − tA tB − tA tB − tA
A aceleração instantânea Newtoniana de P no evento A é então

~aA = ax (tA ), ay (tA ), az (tA ) = lim ~aAB
tB →tA
vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
= lim t −t , lim t −t , lim t −t ,
tB →tA B A tB →tA B A tB →tA B A

e, em geral, ~a(t) = ax (t), ay (t), az (t) para cada instante de tempo t.
Consideremos a construção dessas mesmas quantidades cinemáticas conforme deter-
minadas pelo referencial inercial O0 , que se move com respeito ao referencial O com
velocidade u dirigida no sentido positivo do eixo Ox, conforme a Sec. 12.4. Para O0 , os
eventos que constituem a história de P são representados, conforme as Eqs. (12.12),
por

t0 , x0 (t0 ), y 0 (t0 ), z 0 (t0 ) = γu [t − u x(t)/c2 ], γu [x(t) − u t], y(t), z(t) .
Assim, o deslocamento Newtoniano de P desde A até B é dado por

~ 0 ~ 0 0 ~ 0 0 0 0 0 0 0 0 0 0 0 0 0 0
R AB = R (tB ) − R (tA ) = x (tB ) − x (tA ), y (tB ) − y (tA ), z (tB ) − z (tA )

= γu {[x(tB ) − x(tA )] − u[tB − tA ]}, y(tB ) − y(tA ), z(tB ) − z(tA ) .
Com isto, a velocidade média Newtoniana de P nesse percurso é dada por
0 0 0 0 R~0
~v AB = (vABx , vABy , vABz ) = 0 AB 0
tB − tA
0 0
x (tB ) − x (tA ) y (tB ) − y 0 (t0A ) z 0 (t0B ) − z 0 (t0A )
0 0 0 0
= , ,
t0B − t0A t0B − t0A t0B − t0A

γu {[x(tB ) − x(tA )] − u(tB − tA )} y(tB ) − y(tA ) z(tB ) − z(tA )
= , ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 } t0B − t0A t0B − t0A

[x(tB ) − x(tA )]/(tB − tA ) − u y(tB ) − y(tA ) z(tB ) − z(tA )
= , , .
1 − u[x(tB ) − x(tA )]/[c2 (tB − tA )] t0B − t0A t0B − t0A
Ou seja, a componente longitudinal (isto é, na direção do movimento relativo entre os
0 0
referenciais) da velocidade ~v AB é então vABx = [vABx − u]/[1 − vABx u/c2 ]. Já para as
0
componentes transversais da velocidade ~v AB , temos
0 y(tB ) − y(tA ) vABy
vABy = 2 = ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c } γu (1 − vABx u/c2 )
0
e analogamente vABz = vABz /[γu (1 − vABx u/c2 )]. Para a velocidade instantânea de P
em A, temos
~v 0A = 0
lim (vABx 0
, vABy 0
, vABz )
t0B →t0A

v Ax − u vAy vAz
= , , .
1 − vAx u/c2 γu (1 − vAx u/c2 ) γu (1 − vAx u/c2 )
413

Para cada instante de tempo t0 , temos v 0 (t0 ) = vx0 (t0 ), vy0 (t0 ), vz0 (t0 ) ≡ (vx0 , vy0 , vz0 )
onde
vx0 = vx − u 2





 1 − vx u/c
 vy
vy0 = (12.14)

 γu (1 − vx u/c2 )

 vz0 =

 vz ,
γu (1 − vx u/c2 )
onde foram omitidas as dependências funcionais por simplicidade de notação. As Eqs.

(12.14) representam a lei de transformação de velocidades ~v e ~v 0 entre os referenciais
inerciais O e O0 , cuja lei inversa deve ter a mesma forma dessa (ver Exercı́cio 6), e
pode ser dela obtida pelas substituições formais u → −u e ~v ↔ ~v 0 :
vx0 + u

 vx =
1 + vx0 u/c2




vy0


vy = (12.15)

 γu (1 + vx0 u/c2 )
vz0



 vz =
 .
γu (1 + vx0 u/c2 )
Observa-se que os numeradores dessas relações coincidem com as expectativas Newto-

nianas para essas velocidades, e que os denominadores apresentam valores próximos
da unidade para movimentos de corpos macroscópicos na vizinhança da superfı́cie ter-
restre (i.e., para v c). Além disso, é notável a distinção de tratamento entre as
componentes longitudinal e transversais da velocidade para a lei de transformação de
velocidades, Eq. (12.14), tal como são distintamente tratadas as coordenadas longitu-
dinal e transversais pela lei de transformação de coordenadas, Eq. (12.12).
A aceleração média Newtoniana de P no percurso de A para B, conforme determinada

pelo referencial O0 , é então ~a0AB = (a0ABx , a0ABy , a0ABz ), de modo que sua componente
longitudinal é dada na forma
vx (tB ) − u vx (tA ) − u
2 −
vx0 (t0B )
− vx0 (t0A ) 1 − vx (tB )u/c 1 − vx (tA )u/c2
a0ABx = =
t0B
− t0A γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 }
[vx (tB ) − u][1 − vx (tA )u/c2 ] − [vx (tA ) − u][1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ]γu (tB − tA )[1 − vABx u/c2 ]
[vx (tB ) − vx (tA )][1 − u2 /c2 ]
=
γu [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](tB − tA )[1 − vABx u/c2 ]
= aABx .
(γu )3 [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
414
Para as componentes transversais, temos
vy (tB ) vy (tA )
vy0 (t0B )
− vy0 (t0A ) −
γ [1 − vx (tB )u/c ] γu [1 − vx (tA )u/c2 ]
2
a0ABy = = u
t0B
− t0A γu (tB − tA )[1 − vABx u/c2 ]
vy (tB )[1 − vx (tA )u/c2 ] − vy (tA )[1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](γu )2 (tB − tA )[1 − vABx u/c2 ]
vABy − {[vy (tB ) − vy (tA )]vx (tA ) − vy (tA )[vx (tB ) − vx (tA )]}u/c2
=
(γu )2 (tB − tA )[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
aABy − [aABy vx (tA ) − vy (tA )aABx ]u/c2
=
(γu ) [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
2
aABy [1 − vx (tA )u/c2 ] + aABx vy (tA )u/c2

= ,
(γu ) [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
2
e analogamente
aABz [1 − vx (tA )u/c2 ] + aABx vz (tA )u/c2

a0ABz = .
0
A
aceleração instantânea Newtoniana de P no evento A é então expressa na forma ~aA =
a0x (t0A ), a0y (t0A ), a0z (t0A ) = 0lim0 ~a0AB = 0lim0 (a0ABx , a0ABy , a0ABz ), com componente
tB →tA tB →tA
longitudinal
a0x (t0A ) = lim aABx

tB →tA
ax (tA )
= ,
(γu )3 [1 − vx (tA )u/c2 ]3
e componentes transversais
aABy [1 − vx (tA )u/c2 ] + aABx vy (tA )u/c2

a0y (t0A ) = lim 2 2 2 2
tB →tA (γu ) [1 − vx (tA )u/c ][1 − vx (tB )u/c ][1 − vABx u/c ]
a (t )[1 − vx (tA )u/c2 ] + ax (tA )vy (tA )u/c2

= y A ,
(γu )2 [1 − vx (tA )u/c2 ]3
e
az (tA )[1 − vx (tA )u/c2 ] + ax (tA )vz (tA )u/c2
a0z = .
(γu )2 [1 − vx (tA )u/c2 ]3

Em geral, ~a (t ) = ax (t ), ay (t ), az (t ) ≡ (a0x , a0y , a0z ) para cada instante de tempo
0 0 0 0 0 0 0 0
t0 , onde
ax

a0x = 3
vx u/c2 ]3




 (γ u ) [1 −
a [1 − vx u/c2 ] + ax vy u/c2


a0y = y (12.16)
 (γu )2 [1 − vx u/c2 ]3

a [1 − vx u/c2 ] + ax vz u/c2


 a0z = z ,


(γu )2 [1 − vx u/c2 ]3
onde a dependência funcional das funções foi omitida por simplicidade de notação.
As Eqs. (12.16) estabelecem a lei de transformação de acelerações entre referenciais
415
inerciais, cuja lei inversa deve ter a mesma forma (ver Exercı́cio 6), e pode ser dessa
obtida pelas substituições formais u → −u e ~v ↔ ~v 0 e ~a ↔ ~a0
γu a0x

a x =
[1 + vx0 u/c2 ]3





a0 [1 + vx0 u/c2 ] − a0x vy0 u/c2


ay = y (12.17)

 γu [1 + vx0 u/c2 ]3

0 0 2 0 0 2
 az = az [1 + vx u/c 0] − a2x v3z u/c .



γu [1 + vx u/c ]
Observa-se das Eqs. (12.16) que, à diferença do que ocorre no caso das velocidades
Eqs. (12.14), a escolha do observador pode alterar o número de componentes não nulas
da aceleração de um dado sistema fı́sico: por exemplo, se ax 6= 0 e ay = 0, com vy 6= 0,
então as Eqs. (12.16) implicam em a0x 6= 0 e a0y 6= 0.
12.5.2 Sistemas ondulatórios
Façamos algumas considerações concernentes ao movimento ondulatório, de modo a

fornecer as correções relativı́sticas ao efeito Doppler longitudinal, cujo exemplo quo-
tidiano é o fenômeno de alteração da freqüência sonora atribuı́da a uma sirene móvel
conforme esta se aproxima ou se afasta do observador. E apresentamos o efeito Doppler
transversal, o qual não possui análogo Newtoniano [7]. Para o estudo desta seção, serão
necessários os conhecimentos elementares de fı́sica ondulatória: significado e manipu-
lação dos conceitos de comprimento de onda λ, de freqüência ν, do perı́odo T , e de
velocidade V de uma onda.
A primeira observação importante, no que tange ao conceito de uma onda, consiste
em sua classificação. Entre outras classificações relevantes de ondas, estamos aqui
interessados em sua classificação quanto ao tipo:
Ondas Mecânicas são perturbações ondulatórias de configurações materiais, e por-

tanto sua propagação exige a presença de um meio mecânico. Exemplos familiares
são as ondas sonoras (perturbação na densidade e na pressão) em um fluido, e
as ondas elásticas (perturbação na conformação espacial) em uma corda ou em
uma mola.
Ondas de Campos são perturbações ondulatórias na configuração de campos fun-
damentais da fı́sica, cuja existência prescinde de um meio material (e podem se
propagar no interior da matéria bem como no vácuo). Exemplos familiares são
as ondas eletromagnéticas (perturbação na configuração dos campos elétrico e
magnético) que constituem a caracterização clássica da luz visı́vel e de outras ra-
diações eletromagéticas invisı́veis ao olho humano (infra-vermelho, ultra-violeta,
raio-X etc).
Embora sua descrição seja mais trabalhosa, as ondas mecânicas são usualmente mais
intuitivas ao leigo, talvez por tratarem de conformações materiais ao invés de con-
416
figurações de grandezas abstratas. Assim sendo, discutiremos inicialmente o efeito
Doppler para ondas mecânicas.
Considere uma fonte F e um detector D de pulsos mecânicos ondulatórios, ambos imer-

sos num meio material M homogêneo e isotrópico com respeito ao qual esses pulsos
propagam-se8 com velocidade V , e sejam νo = 1/To e λo respectivamente a freqüência
e o comprimento de onda desses pulsos conforme determinados pelo referencial inercial
fixo à fonte F . O efeito Doppler consiste na descrição da possı́vel diferença existente
entre essas grandezas e as quantidades νd = 1/Td e λd correspondentes que são deter-
minadas pelo referencial inercial fixo ao detector D, devido ao movimento de F e/ou
de D com respeito a M .
Supondo que M seja um meio inercial (isto é, seja não acelerado), denomine-se O um
referencial inercial com respeito ao qual M encontra-se em repouso. Analogamente,
sejam O0 e O00 referenciais inerciais (com coordenadas cujos eixos sejam paralelos aos
correspondentes eixos das coordenadas de O) tais que se encontram em repouso F
com respeito a O0 e D com respeito a O00 . Por simplicidade, trataremos inicialmente
o problema unidimensional (direção Ox). Sejam xF e vF respectivamente a posição e
a velocidade da fonte, e sejam xD e vD respectivamente a posição e a velocidade do
detector, com respeito a O. Se xD − xF > 0, então temos que vF > 0 significa que o
movimento de F aproxima-a de D, e vD > 0 significa que o movimento de D afasta-o
de F .
Consideremos os eventos A “extremidade esquerda do primeiro pulso no instante si-

multâneo para O0 de geração de sua extremidade direita”, B “extremidade direita do
primeiro pulso no instante de geração desta”, e C “extremidade direita do segundo
pulso no instande de geração desta”. Cada pulso propaga-se com velocidade V (por
hipótese) no meio M , atingindo posteriormente o detector D se V 6= vD . Neste caso,
consideremos os eventos9 Ā “extremidade esquerda do primeiro pulso no instante si-
multâneo para O00 de detecção de sua extremidade direita”, B̄ “extremidade direita do
primeiro pulso no instante de detecção desta”, e C̄ “extremidade direita do segundo
pulso no instante de detecção desta”.
Para um observador em repouso com respeito a O0 (tal como a fonte F , por exemplo),
cada pulso produzido por F tem extensão espacial λo , sendo dois sucessivos pulsos
separados pelo lapso de tempo To . Por definição de comprimento de onda e de perı́odo,
8
A propagação de uma dada onda num dado meio é tema da fı́sica ondulatória, e a velocidade de
propagação desta onda resulta depender tanto das carcterı́sticas desta quanto das do meio material no
qual ela se propaga. Não serão discutidos aqui esses detalhes.
9
Observa-se que não estamos supondo que os pulsos possuam identificação invariante, de modo que o
“primeiro pulso produzido por F ” pode eventualmente jamais ser detectado por D. Os termos primeiro e
segundo que figuram nos enunciados dos eventos referem-se ora à ordem com que os pulsos são produzidos
por F (para os eventos A, B, C), ora à ordem com que eles são detectados por D (para os eventos Ā, B̄,
C̄).
417
neste referencial temos λo = |x0AB | (os eventos A e B são simultâneos) e To = t0BC (os
eventos B e C ocorrem no mesmo ponto do espaço).
Para um observador em repouso com respeito ao referencial O00 (tal como o detector
D, por exemplo), temos λd = |x00ĀB̄ | (pois os eventos Ā e B̄ são simultâneos) e Td = t00B̄ C̄
(pois os eventos B̄ e C̄ ocorrem no mesmo ponto do espaço).
Para um observador em repouso com respeito a O (tal como o meio M , por exemplo),
as quantidades xAB e tBC podem ser obtidas da lei de transformação de coordenadas
de Lorentz, Eqs. (12.13), fazendo u = vF (velocidade de O0 com respeito a O) nes-
sas equações. Resulta, portanto, que xAB = γvF λo e tBC = γvF To . Analogamente, as
quantidades xĀB̄ e tB̄ C̄ podem ser obtidas daquela mesma lei fazendo u = vD (veloci-
dade de O00 com respeito a O) nessas equações. Resulta, portanto, que xĀB̄ = γvD λd
e tB̄ C̄ = γvD Td . Mas, e quanto à relação existente entre xĀB̄ e xAB (bem como aquela
existente entre tB̄ C̄ e tBC )?
Figura 12.5: Perı́odo Tm e comprimento de onda λm de uma onda produzida por uma
fonte F em movimento e detectada por um detector D em movimento, em termos de um
referencial que a caracteriza com velocidade V .
Como os eventos A e B são simultâneos para O0 , aparentam para O estarem sepa-

rados temporalmente pelo intervalo tAB = γvF |vF |λo /c2 . E também, como os eventos
B e C ocorrem no mesmo ponto do espaço para O0 , aparentam para O estarem
separados espacialmente pela distância |xBC | = γvF |vF |To . De forma análoga, temos
tĀB̄ = γvD |vD |λd /c2 e |xB̄ C̄ | = γvD |vD |Td . Denote-se respectivamente por νm = 1/Tm e
λm a freqüência e o comprimento de onda dos pulsos produzidos por F , tal como são
determinados pelo referencial O. Então, em termos dos eventos B e C da emissão por
F , o espaço xBC = vF tBC percorrido pela fonte somado à distância V Tm entre dois
pulsos deve igualar a distância V tBC percorrida pelo pulso, donde Tm = (1−vF /V )tBC ;
analogamente, temos Tm = (1 − vD /V )tB̄ C̄ em termos dos eventos B̄ e C̄ de detecção
418
por D, conforme a Fig. 12.5 (a). Da igualdade entre essas duas expressões, temos
s
V − vF tB̄ C̄ γvD Td 1 − (vF /c)2 Td
= = = ,
V − vD tBC γvF To 1 − (vD /c)2 To
de modo que a freqüência νd = 1/Td medida pelo detector D é dada em termos da

freqüência νo = 1/To medida pela fonte F por
s
νd V − vD 1 − (vF /c)2
= . (12.18)
νo V − vF 1 − (vD /c)2
Por outro lado, em termos dos eventos A e B, a distância xAB entre as duas ex-
tremidades do mesmo pulso (em instantes distintos) deve corresponder à soma do
comprimento de onda λm com a distância V tAB percorrida pelo pulso. Ver Fig. 12.5
(b). Deste modo, temos λm = xAB − V tAB em termos da emissão por F ; analoga-
mente, λm = xĀB̄ − V tĀB̄ em termos da detecção por D. Da igualdade entre essas
duas expressões, temos
xĀB̄ − V tĀB̄ γvD (1 − V vD /c2 )λd
1= = ,
xAB − V tAB γvF (1 − V vF /c2 )λo
de modo que o comprimento de onda λd medido pelo detector D é dado em termos
do comprimento de onda λo medido pela fonte F por
s
λd 1 − V vF /c2 1 − (vD /c)2
= . (12.19)
λo 1 − V vD /c2 1 − (vF /c)2
As Eqs. (12.18) e (12.19) descrevem a versão relativı́stica do efeito Doppler Newtoniano

(ou longitudinal) para ondas mecânicas. A interpretação elementar deste efeito consiste
em observar dois fatos: primeiro, devido à velocidade da fonte, os pulsos tornam-se
mais próximos diante da fonte e mais afastados atrás desta, o que altera o comprimento
de onda; e segundo, devido à velocidade do detector, o número de frentes de onda por
ele observadas aumenta caso seu movimento seja no sentido da fonte e diminui caso
seja no sentido oposto, o que altera a freqüência da onda. Combinados, esses dois
resultados dão conta das frações à direita do sinal de igualdade (e que envolvem a
velocidade V da onda) em ambas as Eqs. (12.18) e (12.19). A contribuição da raiz
quadrada, em ambos os casos, corresponde à correção relativı́stica desse fenômeno, e
deve-se à diferença entre as noções de simultaneidade para os referenciais envolvidos.
Para o caso em que os pulsos propagam-se com velocidade V = c com respeito a O
(e, portanto, também com respeito a O0 e O00 ), a construção acima permanece correta
— embora seja um tanto artificial, pois o referencial O não é definido fisicamente —
e seus resultados podem ser expressos (ver Exercı́cio 7) na forma
 r
ν 1 + v/c
 νdo =


r − v/c
1
(12.20)
λ d 1 − v/c
= ,


λo 1 + v/c

419
onde v = (vF − vD )/(1 − vD vF /c2 ), obtida das Eqs. (12.14), é a velocidade da fonte
F como medida pelo detector D, a qual é tomada como positiva caso a fonte e o
detector se aproximem e negativa caso se afastem. As Eqs. (12.20) descrevem o efeito
Doppler longitudinal para ondas de campo (tais como, por exemplo, as ondas eletro-
magnéticas). Assim, a luz visı́vel emitida por um corpo que se afasta do observador
é detectada por este como apresentando uma tonalidade mais avermelhada (compri-
mento de onda maior e freqüência menor) do que aquela com que foi emitida; con-
trariamente, essa tonalidade lhe parecerá mais azulada (comprimento de onda menor
e freqüência maior) no caso de aproximação relativa entre a fonte e o observador.
Consideremos, agora, o efeito de diferença no comprimento de onda e na freqüência
de uma onda devido ao movimento da fonte F e do detector D na direção transversal
à direção de propagação da onda, fenômeno conhecido como efeito Doppler transver-
sal. Podemos construir esse efeito a partir do raciocı́nio anterior, fazendo a veloci-
dade da onda V na direção Oy. Para evitar aproximações desnecessárias ao problema,
suponhamos que os pulsos gerados por F são frentes de onda plana horizontais. Com
isto, o movimento horizontal da fonte e/ou do detector em nada modificam a in-
terpretação Newtoniana para o movimento dos pulsos e sua detecção, de modo que
terı́amos νd /νo = 1 e λd /λo = 1. As correções relativı́sticas a esse resultado Newtoni-
ano se aplicam da mesma forma que no caso anterior, de modo que o efeito Doppler
transversal para ondas mecânicas é descrito (ver Exercı́cio 8) por
 r
ν 1 − (vF /c)2
 νdo =


2
r1 − (vD /c) (12.21)
1 − (vD /c)2
 λd = .


λo 1 − (vF /c)2
Para o caso de ondas de campo, propagando-se com velocidade c em qualquer re-

ferencial, a construção acima ainda é correta, embora carregue o mesmo grau de
artificialidade observado para o caso do efeito Doppler longitudinal de ondas de campo.
O resultado pode ser obtido mais diretamente das leis de dilatação do tempo (donde
contração da freqüência), e de contração do comprimento, em termos da velocidade
relativa v entre F e D, de modo que o efeito Doppler transversal para ondas de campo
é dado (ver Exercı́cio 9) na forma
ν
 p
 νdo = 1 − (v/c)2

λd 1 (12.22)
 λo = p
 .
1 − (v/c)2
12.6 Mecânica relativı́stica
Observa-se que a cinemática relativı́stica consiste numa coleção de regras de comu-

nicação das medidas efetuadas por diferentes referenciais inerciais, mas não atenta
420
para a questão fundamental de caracterizar as leis fı́sicas que determinam tais me-
didas. Com base na cinemática relativı́stica por um lado e na mecânica Newtoniana
por outro, apresenta-se aqui um resumo da teoria fı́sica que pretende generalizar a
mecânica de Newton para os domı́nios de movimentos com velocidades comparáveis à
da luz no vácuo.
A estrutura das leis da Mecânica de Newton baseia-se não apenas na idéia de in-
variância de Galileu, mas também na noção fundamental de momentum linear. Em
particular, a lei de inércia garante a conservação no tempo do momentum linear total
de um sistema isolado, resultado que deve ser válido em qualquer referencial inercial.
Embora a noção Newtoniana de força seja frágil em seu aspecto de ação à distância, a
idéia de campo permite validar seu aspecto de ação local (tal como no caso das forças
de contato). Desta forma, a Teoria da Relatividade Especial não se furta de fazer uso de
algumas forças. Mas, devido à forma distinta com que são tratadas pelas Eqs. (12.14)
as componentes longitudinal e transversais da velocidade, a conservação da quanti-
P
dade k mk~v k num referencial inercial implica, em geral, em sua não conservação em
outros referenciais inerciais em movimento relativo com respeito ao primeiro. Assim,
essas expressões relativı́sticas contradizem a Mecânica de Newton. Este fato, a ser
detalhado a seguir, suscita uma correção relativı́stica à definição Newtoniana p~ = m ~v
do momentum linear de um sistema de massa m com velocidade ~v . Tal correção tem
implicações na noção de energia de um sistema fı́sico, originando assim uma nova
forma de energia: a energia de repouso.
12.6.1 Momentum linear
O exemplo mais simples de contradição entre a noção clássica de momentum linear e a

lei relativı́stica de transformação de velocidades advém de tratar-se a colisão elástica
de duas partı́culas idênticas A e B de massa m. Seja o referencial inercial O do centro
de massa do sistema isolado composto pelas partı́culas A e B. Neste referencial, antes
da colisão, as partı́culas têm velocidades ~v Ai e ~v Bi iguais e opostas: vxA
i i
= −vxB ≡ vx e
i i
vyA = −vyB ≡ vy , conforme ilustrado na Fig. 12.6. No instante da colisão, as partı́culas
A e B encontram-se em contato segundo uma direção — representada verticalmente
na Fig. 12.6 — não paralela à velocidade inicial relativa ~v Bi − ~v Ai = −2(vx~i + vy~j )
entre ambas, caracterizando assim uma colisão não frontal. Sendo a colisão elástica,
a energia mecânica do sistema é conservada pela colisão. Sendo o sistema isolado,
e desprezando-se a interação à distância entre as partı́culas, a energia mecânica do
sistema resume-se à sua energia cinética.
Considere a descrição pelo referencial O. No instante i antes da colisão, a partı́cula

A apresenta energia inicial KAi = m(vx2 + vy2 )/2 e momentum linear inicial com
componentes pixA = m vx e piyA = m vy , e a partı́cula B apresenta energia inicial
KBi = m[(−vx )2 + (−vy )2 )]/2 e momentum linear inicial cujas componentes são dadas
421
Figura 12.6: Colisão elástica não frontal de duas partı́culas idênticas, analisada no referen-
cial do centro de massa do sistema, antes (diagonal SW-NE), depois (diagonal NW-SE),
e no momento (centro) da colisão.
por pixB = −m vx e piyB = −m vy . Designando pelo ı́ndice f as correspondentes quan-

tidades após a colisão, a conservação da energia
KAf + KBf = KAi + KBi , (12.23)
e de cada componente cartesiana do momentum linear total do sistema

(
pfxA + pfxB = pixA + pixB
(12.24)
pfyA + pfyB = piyA + piyB ,
fornecem, em conjunto, o familiar resultado Newtoniano [7, 8]

( (
f i f i
vxA = vx = vxA vxB = −vx = vxB
f i f i
(12.25)
vyA = −vy = −vyA , vyB = vy = −vyB ,
ilustrado na Fig. 12.6. A conservação do momentum linear clássico do sistema

( (
f f
Pxi = m(vxAi i
+ vxB )=0 Pxf = m(vxA + vxB )=0
i i i f f f
Py = m(vyA + vyB ) = 0, Py = m(vyA + vyB ) = 0,
tem a forma Pxf = 0 = Pxi e Pyf = 0 = Pyi .
Considere a colisão das partı́culas A e B conforme determinada pelo referencial inercial

O0 que se move na direção Ox com velocidade u = vx . Para O0 , em acordo com as
Eqs. (12.14) de transformação de velocidades entre referenciais inerciais, a partı́cula
i0 i0
p
A apresenta velocidade inicial vxA = 0 e vyA = vy / 1 − (vx /c)2 e velocidade final
f0 f0
p
vxA = 0 e vyA = −vy / 1 − (vx /c)2 ; e a partı́cula B apresenta velocidade inicial
i0 i0
p
vxB = −2vx /[1 + (vx /c)2 ] e vyB = −vy 1 − (vx /c)2 /[1 + (vx /c)2 ] e velocidade final
422
f0 f0
p
vxB = −2vx /[1+(vx /c)2 ] e vyB = vy 1 − (vx /c)2 /[1+(vx /c)2 ]. Com isto, o momentum
linear (clássico) total do sistema tem componentes
−2m vx

i0 i0 i0
 Px = m(vxA + vxB ) = 1 + (vx /c)2


2
i0 i0 i0 2m vy (v x /c)
 P
 y
 = m(vyA + vyB ) = p ,
[1 + (vx /c)2 ] 1 − (vx /c)2
−2m vx

f0 f0 f0 i0
 Px = m(vxA + vxB ) = 1 + (v /c)2 = Px


x
f0 f0 −2m vyp (vx /c)2

 Pyf 0 = m(vyA + vyB ) = = −Pyi 0 .


[1 + (vx /c)2 ] 1 − (vx /c)2
Desta forma, o referencial O0 observa a conservação do momentum linear clássico
longitudinal Pxf 0 = Pxi 0 , mas percebe uma violação na conservação do momentum
linear clássico tranversal Pyf 0 6= Pyi 0 devido à inversão do sinal algébrico. Esta violação
é precisamente aquilo que se pretendia evidenciar, e demonstra a incompatibilidade
da Mecânica Newtoniana com as Transformações de Lorentz.
Uma solução conveniente para esse impasse consiste em efetuar modificações sutis
na Mecânica Newtoniana, imperceptı́veis no regime de baixas velocidades ao qual
nosso senso comum é adequado, mas que sejam suficientes para que a compatibilidade
com a cinemática relativı́stica possa ser mantida. Como já antecipado, a Mecânica
Relativı́stica será aqui construı́da com base numa modificação no conceito Newtoniano
de momentum linear. De fato, conforme a análise da dilatação temporal da Sec. 12.4.2,
temos que um intervalo de tempo coordenado dt entre dois eventos relaciona-se com o
intervalo de tempo próprio dτ (caso exista, conforme a Sec. 12.7) entre esses mesmos
p
dois eventos pela equação dt = γ dτ , onde γ = 1/ 1 − (u/c)2 em termos da velocidade
u < c de movimento uniforme entre os referidos eventos. Enquanto dt depende de
observador, temos que dτ é independente da escolha de referencial. Este fato sugere a
definição relativı́stica do momentum linear
~
dx ~
dx m ~v
P~ = m = γv m = γv m ~v = p . (12.26)
dτ dt 1 − (|~v |/c)2
Observa-se que a diferença com respeito à definição clássica do momentum linear é
a presença do fator de Lorentz γ na expressão relativı́stica, de modo tal que a Eq.
(12.26) produz resultados muito semelhantes aos da mecânica clássica nos casos de
baixas velocidades.
Em termos da Eq. (12.26), podemos re-analisar a colisão entre as partı́culas A e B. Para
o referencial O, todosqos momenta anteriormente calculados devem ser multiplicados
pelo mesmo fator 1/ 1 − (vx2 + vy2 )/c2 , de modo que a conservação do momentum
linear relativı́stico nesse referencial é equivalente à conservação do momentum linear
clássico construı́da anteriormente.
1 − (vx /c)2 = vAf 0 para a partı́cula A,
0 i0
p
Para o referencial
q O , temos v A = v y /
e vBi 0 = (2vx )2 + vy2 − (vx vy )2 /c2 /[1 + (vx /c)2 ] = vBf 0 para a partı́cula B. Com
423
p
isto, temos γA = [1 − (vx /c)2 ]/{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula A, e
p
γB = [1 + (vx /c)2 ]/ [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula B. Desta
f0
i0
p
forma, temos γA vyA = −γA vyA = vy / 1 − [(vx /c)2 + (vy /c)2 ] para a partı́cula A, e
f0 f0
i0
p i0
γB vxB = γB vxB = −2vx / [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} e γB vyB = −γB vyB =
f0
γA vyA para a partı́cula B. Finalmente, as expressões relativı́sticas para o momentum
linear do sistema são
−2m vx

 Pxi 0 = m(γA vxA
i0 i0
+ γB vxB )= p
[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}

 i0
 i0 i0
Py = m(γA vyA + γB vyB ) = 0,
−2m vx

f0 f0
 Pxf 0 = m(γA vxA + γB vxB ) = p

[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}
 f0
 f0 f0
Py = m(γA vyA + γB vyB ) = 0.
Obtém-se assim que, tanto para o referencial O quanto para o referencial O0 , na colisão
das partı́culas A e B acima, vale a conservação do momentum linear relativı́stico dado
pela Eq. (12.26), onde as medidas de velocidade efetuadas por esses dois referenciais
são relacionadas pela lei de transformação de velocidades de Lorentz, Eqs. (12.14). Em-
bora seja um caso particular, este cálculo ilustra um resultado geral de conservação do
momentum linear relativı́stico de um sistema fı́sico isolado. Este resultado estabelece,
portanto, a versão relativı́stica da Lei de inércia da Mecânica Newtoniana.
12.6.2 Energia
Suponhamos que a Lei da dinâmica Newtoniana F~ = dP~ /dt seja válida no contexto
relativı́stico, onde F~ é uma força de origem local, por meio de uma re-interpretação do
vetor P~ como sendo o momentum relativı́stico da Eq. (12.26). Neste caso, o teorema
Trabalho-Energia fornece a variação da energia cinética de um sistema de massa m
sujeito à ação da força F~ na forma
∆K = F~ · ds ~ = dP~ · ~v dt = d(γ m ~v ) · ~v dt = ~v · d(γ m ~v )

R R R R
R dt Rdt R
= [d(~v · γ m ~v ) − γ m ~v · d~v ] = d(γ m v 2 ) − γ m v dv
R x=v/c x dx √
= ∆ (γ m v 2 ) − m c2 √ = ∆ (γ m v 2
) + ∆ m c2
1 − x 2
1 − x2 x=v/c
2 2 2 2
= ∆ (γ m c [(v/c) + 1/γ ]) = ∆ (γ m c ) .
Assim, se a força resultante F~ sobre o sistema de massa m acelera-o desde o repouso

inicial até a velocidade final v, temos Kv = γv m c2 − γ0 m c2 = (γ − 1)m c2 . Desta
forma, a energia cinética relativı́stica de um sistema de massa m com velocidade v é
dada pela relação
K = (γ − 1)m c2 , (12.27)
em termos do fator γ de Lorentz desse sistema. Fazendo a aproximação de baixas
velocidades, o fator γ pode ser escrito em série de potências em v/c até segunda or-
dem na forma γv = 1 + v 2 /2c2 + O(v/c)4 . Com isto, obtemos que a energia cinética
424
relativı́stica, Eq. (12.27), toma a forma Newtoniana K ≈ m v 2 /2 a menos de correções
relativı́sticas de quarta ordem na razão v/c. Desprezı́veis no contexto de baixas veloci-
dades, essas correções tornam-se significativas quando v → c. Pois a energia cinética
relativı́stica assume valores arbitrariamente grandes neste último limite. Desta forma,
acelerar um corpo de massa m desde o repouso até a velocidade da luz no vácuo
demandaria uma energia infinita, sendo portanto impossı́vel. Estas previsões foram
verificadas experimentalmente (Sec. 12.10).
Observa-se que a energia cinética relativı́stica corresponde à diferença entre a grandeza

γ m c2 dependente do movimento e a quantidade constante m c2 que independe do
estado de movimento do sistema. Este resultado sugere que esta constante seja uma
forma de energia do sistema de massa m, associada meramente à sua condição massiva.
Define-se, portanto, a energia de repouso de um sistema fı́sico de massa m pela
relação
Eo = m c2 . (12.28)
Cumpre notar que a Eq. (12.28) fornece uma grande quantidade de energia para
quantidades relativamente pequenas de massa, nas escalas familiares de grandeza. Em
valores numéricos, m = 1Kg equivale a cerca de Eo = 8, 987 · 1016 J. Tendo em conta
a forma de repouso da energia, tem lugar a definição da energia total
E = γ m c2 , (12.29)
ou E = K + Eo , do sistema mecânico isolado, bem como a definição da energia

mecânica total EM = E + U = K + U + Eo de um sistema mecânico sob a ação de
uma força resultante conservativa F~ = −∇U
~ com energia potencial U .
Observa-se (ver Exercı́cio 11) que, para um sistema mecânico de massa m, sua energia
total E dada pela Eq. (12.29) relaciona-se com seu momentum relativı́stico P~ dado
pela Eq. (12.26) na forma
E 2 − c2 P~ · P~ = (Eo )2 , (12.30)
onde Eo é a energia de repouso desse corpo, dada pela Eq. (12.28). Ademais, segundo
uma transformação de Lorentz entre referenciais, um referencial inercial O0 que deter-
mina para o corpo de massa m uma energia total E 0 e um momentum relativı́stico P~ 0
descreve a relação entre energia total e momentum na forma (E 0 )2 − c2 P~ 0 · P~ 0 = (Eo )2 ,
a qual é formalmente similar à Eq. (12.30).
Ainda, é comum interpretar as Eqs. (12.26)–(12.27) sob uma perspectiva excessiva-

mente Newtoniana, observando que a combinação relativı́stica γ m aparece nessas
relações em substituição à massa m que figura nas expressões clássicas. Isto enseja
a definição de uma massa relativı́stica m(v) = γv m dependente da velocidade v, em
termos da massa de repouso m. Este ponto de vista não será adotado no presente
estudo.
425
12.7 Espaço-tempo
A linguagem estabelecida pela Relatividade Especial parece inicialmente pouco intu-

itiva, e suas expressões matemáticas — tais como as leis de transformação de coor-
denadas Eqs. (12.12), de velocidades Eqs. (12.14), de acelerações Eqs. (12.16) etc —
não raro são difı́ceis de memorizar devido à sua elaboração algébrica. Visando sim-
plificar a compreensão dos fenômenos envolvidos, mas sem restringir-se ao âmbito
da metafı́sica [6], apresenta-se nesta seção uma interpretação geométrica dos resulta-
dos relativı́sticos, a qual unifica o tempo e o espaço fı́sicos numa nova estrutura de-
nominada contı́nuo de espaço-tempo [4]. Em termos dessa nova e abstrata estrutura,
inicialmente estranha ao estudante, os problemas tratados por essa teoria tornam-se
representáveis na forma de diagramas, favorecendo assim o desenvolvimento de uma
intuição relativı́stica baseada em figuras ao invés de fórmulas. Com efeito, as expressões
relativı́sticas assusmem uma forma muito mais simples quando expressas em termos
de espaço-tempo. Com o auxı́lio dessa interpretação, os paradoxos mais comuns da
relatividade são discutidos na Sec. 12.8. Embora os aparentes paradoxos representem
historicamente uma crı́tica Newtoniana à nova teoria, sua solução revela o cuidado
requerido pela relatividade para com a linguagem, de modo que esta possa revelar-se
útil e objetiva.
Embora o espaço-tempo não seja uma estrutura essencial na descrição dos fenômenos
concernentes à Relatividade Especial, mas somente uma ferramenta útil nesse con-
texto, trata-se de uma noção sine qua non ao estudo da Teoria da Relatividade Geral,
conforme a apresentação no Cap. 1.
12.7.1 O espaço-tempo de Minkowski
Já tivemos oportunidade de verificar, nas seções precedentes deste capı́tulo, que a
noção fundamental da relatividade (qual seja, a idéia de “evento”) requer, para sua
completa especificação num dado sistema coordenado de um referencial dado, quatro
valores numéricos: um deles qualificando um instante no tempo e os demais determi-
nando uma posição no espaço. Com o auxı́lio da velocidade da luz no vácuo c, admitida
por postulado como uma constante da fı́sica, podemos uniformizar as unidades fı́sicas
dessas coordenadas dos eventos. Com efeito, um evento A caracterizado num dado refe-
rencial por (t, x, y, z) equivalentemente pode ser caracterizado por (ct, x, y, z) nesse
mesmo referencial. Para facilitar essa padronização, denominaremos por coordenadas
de eventos no espaço-tempo aos valores (x0 , x1 , x2 , x3 ), onde
 0

 x = ct
 x1 =

x
(12.31)


 x2 = y
 3
x = z.
426
A escolha do ı́ndice 0 como correspondente à coordenada temporal10 de eventos no
espaço-tempo evita ambigüidades posteriores,11 e salienta o caráter distinto dessa co-
ordenada com respeito às demais, representadas por um ı́ndice “espacial” positivo.
Quanto ao fato de utilizarmos uma notação de ı́ndices sobrescritos x0 ao invés de
ı́ndices subescritos x0 , esta escolha corresponde ao caráter tensorial a ser discutido
na Sec. 12.9. Embora possa causar estranheza, por assemelhar-se a uma potência
algébrica, a ambigüidade é evitada utilizando-se da notação (x)0 (sem omitir os
parênteses, que de outro modo seriam supérfluos) sempre que for necessária uma
potência de uma grandeza com componentes coordenadas.
Temos à disposição, portanto, um ambiente quadridimensional denominado espaço-
tempo (de Minkowski, em referência ao matemático Herman Minkowski que o estabe-
leceu em 1908), cuja estrutura autônoma deve-se, em grande medida, à possibilidade
de uniformização das unidades fı́sicas correspondentes às medidas ao longo de seus
“eixos ortogonais” de espaço e de tempo. Embora seja algo difı́cil “visualizar” figu-
ras em quatro dimensões, podemos visualizar com facilidade as suas diversas seções
bidimensionais, obtidas por técnica similar à construção de curvas de nı́vel (de altura
constante) a partir do mapa topográfico de um terreno. A principal diferença con-
ceitual introduzida por esta abordagem consiste no fato que, com freqüência, uma
das coordenadas apresentadas nessa visualização por redução dimensional possui um
caráter temporal.
Expressos em termos dessa linguagem, os corpos mecânicos não evoluem no espaço
conforme a passagem do tempo, mas somente existem no espaço-tempo, sendo cada
um deles caracterizado por sua respectiva história. Desta forma, a noção de espaço-
tempo acima corresponde a uma visão estática do mundo. Embora revisada, esta visão
filosófica de um mundo mecânico estático (apesar de sua dinâmica intrı́nseca) perdura
na Relatividade Geral (Cap. 1), bem como na Cosmologia Relativı́stica (Caps. 2 e 3).
Tal como os espaços vetoriais abstratos da geometria analı́tica, o espaço-tempo acima
possui uma estrutura matemática de espaço vetorial: podemos definir um vetor
posição quadridimensional X no espaço-tempo como sendo a representação de even-
tos12 em termos das coordenadas (x0 , x1 , x2 , x3 ) utilizadas por um referencial inercial
O. Ou seja, escrevemos a relação X = (x0 , x1 , x2 , x3 ). Dados arbitrariamente o es-
calar α e os vetores X = (x0 , x1 , x2 , x3 ) e Y = (y 0 , y 1 , y 2 , y 3 ) (expressos no mesmo
sistema de coordenadas de um mesmo referencial inercial), as operações vetoriais de
soma X + Y = (x0 + y 0 , x1 + y 1 , x2 + y 2 , x3 + y 3 ) e de multiplicação por escalar
10
Observe-se que as unidades fı́sicas de comprimento dessa coordenada não alteram seu caráter tem-
poral, pois especifica um instante de tempo do referencial escolhido.
11
Sob a perspectiva relativı́stica, o número quatro acima não é fundamental: poder-se-ı́a estabelecer
igualmente a Relatividade Especial em d dimensões espaciais, sendo d um número inteiro positivo ar-
bitrário. A escolha d = 3 deve-se à nossa percepção usual do mundo mecânico como sendo composto de
objetos existentes num ambiente espacial de três dimensões.
12
Mais rigorosamente, trata-se do deslocamento com respeito à origem deste espaço vetorial. A noção
de vetor será apresentada de modo mais preciso na Sec. 12.9.
427
α X = (α x0 , α x1 , α x2 , α x3 ) localizam igualmente eventos válidos do espaço-tempo.
E, por conseguinte, são vetores legı́timos dessa estrutura vetorial abstrata. Como uma
interpretação geométrica, a soma X + Y localiza com respeito à origem O o evento
localizado por Y relativamente à origem deslocada Ō, a qual é localizada por X com
respeito a O. A interpretação para o produto por escalar no espaço-tempo é menos
intuitiva, contudo.
Em vista da universalidade da constante c, uma velocidade Newtoniana ~u ar-
bitrária pode ser completamente caracterizada pela grandeza tridimensional β~ =
(βx , βy , βz ) = ~u/c denominada velocidade Newtoniana adimensional. Esta definição
corresponde meramente a medir a velocidade Newtoniana ~u em unidades da veloci-
dade da luz no vácuo c. Em termos dessa escala de unidades, a velocidade da luz
no vácuo tem valor unitário. Em alguns textos avançados, isto corresponde à escolha
geométrica de unidades c = 1.
Consideremos dois referenciais inerciais O e O0 em movimento relativo com velocidade
relativa u de O0 com respeito a O, dirigida ao longo do sentido positivo do eixo Ox.
Seja um arbitrário evento A. Em termos do referencial O, este evento corresponde ao
vetor X = (x0 , x1 , x2 , x3 ). Já com respeito ao referencial O0 , este evento corresponde
ao vetor X0 = (x0 0 , x0 1 , x0 2 , x0 3 ). A relação entre os vetores X e X0 — mais rigo-
rosamente, trata-se do mesmo vetor expresso em dois distintos referenciais — pode
ser imediatamente obtida da lei de transformação de coordenadas de Lorentz entre
referenciais inerciais, Eqs. (12.12), na forma
 00

 x = γ(x0 − βx1 )
 x0 1

= γ(x1 − βx0 )
(12.32)


 x0 2 = x2
 03
x = x3 ,
p
onde γ = 1/ 1 − (β)2 é o fator de Lorentz da Eq. (12.11) expresso em termos da
velocidade Newtoniana adimensional β, ou sua representação recı́proca
γ(x0 0 + βx0 1 )
 0

 x =
 x1 = γ(x0 1 + βx0 0 )

(12.33)


 x2 = x0 2
x0 3 .
 3
x =
As Eqs. (12.32) são a representação das Eqs. (12.12) em termos de grandezas no

espaço-tempo, sendo portanto igualmente denominadas como a lei de Lorentz de trans-
formação de coordenadas entre referenciais inerciais.
Consideremos mais seriamente a noção vetorial de velocidade. Do ponto de vista New-
toniano, a velocidade de um dado corpo pode ser representada por meio da linguagem
vetorial tridimensional usual em termos de três valores numéricos que determinam
a taxa de deslocamento desse corpo com respeito ao tempo em cada uma das três
428
direções espaciais. Expressa na linguagem quadridimensional do espaço-tempo rela-
tivı́stico, contudo, a velocidade vetorial de um corpo num arbitrário evento A dado
corresponde à razão entre o vetor quadridimensional XAB = XB − XA que especifica
seu deslocamento até um evento B futuro na história desse corpo e o intervalo de
tempo próprio x0 0 = c τAB (expresso em unidades de comprimento) entre esses dois
eventos, no limite B → A. Pois, para que essa razão forneça como resultado um vetor
(também quadridimensional), ela deve ser tal que corresponde à operação de produto
do vetor XAB por um escalar. Mas, sendo c tAB uma das componentes de um vetor
(qual seja, o vetor XAB ), este intervalo de tempo coordenado não é um escalar, e muda
de valor perante as Eqs. (12.12). Já o intervalo de tempo próprio entre dois eventos é
uma noção invariante perante mudança de referenciais, donde é um escalar no espaço-
tempo. Podemos expressar o tempo próprio em termos do tempo coordenado na forma
x0 0 = x0 /γ, em acordo com a Eq. (12.8) e as Eqs. (12.32). Com isto, definimos o vetor
velocidade relativı́stica (quadridimensional) V = (V 0 , V 1 , V 2 , V 3 ) por
 0
 V0 = γ dx0 =γ
dx1



γ dx0

 V1 =

= γ βx
dx2 (12.34)
 V = γ dx0
2
= γ βy
dx3



V 3 = γ dx0

= γ βz ,


dx
onde ~v = c β~ = (c/V 0 )(V 1 , V 2 , V 3 ) = (v 1 , v 2 , v 3 ) corresponde à velocidade vetorial

Newtoniana, e γ = (1 − β~ · β~ )−1/2 . Assim, a velocidade relativı́stica V de um corpo
mantém correspondência biunı́voca com sua correspondente velocidade Newtoniana,
pois qualquer uma das duas determina univocamente a outra. Uma importante relação
entre as componentes coordenadas da velocidade relativı́stica da Eq. (12.34) é
(V 0 )2 − [(V 1 )2 + (V 2 )2 + (V 3 )2 ] = γ 2 {1 − [(β 1 )2 + (β 2 )2 + (β 3 )2 ]} = 1.
Considere a velocidade relativı́stica do mesmo corpo no mesmo evento, porém de-

terminada pelo referencial inercial O0 descrito anteriormente. Assim, temos V0 =
(V 0 0 , V 0 1 , V 0 2 , V 0 3 ), em correspondência com a velocidade Newtoniana ~v 0 que este
referencial determina. Poderı́amos obter a lei de transformação entre as velocidade
relativı́sticas Eqs. (12.34) a partir da lei de transformação entre as correspondentes
velocidades Newtonianas, Eqs. (12.14) (ver Exercı́cio 13). Ao invés disso, observamos
que V = dX/d(c τ ) e V0 = dX0 /d(c τ ), onde τ é o tempo próprio sobre a história do
corpo em estudo. Com isto, a regra da cadeia fornece
dX0 ∂X0 ∂X0

0 dX
V = = · = · V,
d(c τ ) ∂X d(c τ ) ∂X
onde a matriz 4 × 4 de derivadas parciais (∂X0 /∂X) pode ser imediatamente calculada
429
das Eqs. (12.32) na forma
 
γ −γβ 0 0
∂X0
 −γβ γ 0 0 
= . (12.35)
 
∂X  0 0 1 0 
0 0 0 1
É então evidente que a velocidade relativı́stica apresenta, perante uma mudança de

referenciais inerciais, lei de transformação cuja estrutura algébrica possui a mesma
forma das Eqs. (12.32) de Lorentz,
 00

 V = γ(V 0 − βV 1 )
 V 0 1 = γ(V 1 − βV 0 )

(12.36)
 V 02 = V 2


 03
V = V 3.
Assim, a velocidade relativı́stica evidencia um caráter de elevada simetria em com-

paração com a correspondente noção de velocidade Newtoniana. O preço a pagar por
este ganho em simplicidade consiste em considerar uma componente a mais para a
velocidade, a qual aponta “na direção do tempo”.
E quanto à aceleração Newtoniana? Será verdade que existe uma aceleração rel-
ativı́stica que, à semelhança do caso da velocidade, perante uma mudança de ref-
erenciais inerciais apresenta lei de transformação mais simples do que aquela cod-
ificada pelas Eqs. (12.16)? Felizmente, a resposta é afirmativa. Em analogia com
a velocidade relativı́stica, podemos definir a aceleração relativı́stica na forma A =
(A0 , A1 , A2 , A3 ) = dV/d(c τ ) = γ dV/dx0 = (γ/c) dV/dt. A regra da cadeia fornece
dγ/dx0 = (∂γ/∂ β) ~ · (dβ/dx
~ 0
) = (γ/c)3 ~v · ~a, onde ~v = (vx , vy , vz ) = (v 1 , v 2 , v 3 ) e
~a = (ax , ay , az ) = (a1 , a2 , a3 ) são respectivamente a velocidade e a aceleração Newto-
nianas. Com isto, a aceleração relativı́stica A é dada em componentes em termos da
velocidade e aceleração Newtonianas ~v e ~a por
dV 0 = γ 4 ~v · ~a

0
 A = γ
dx0 c32


2
 A1 = γ dV = γ [ax + γ ~v · ~a vx ]

 1

0 2
dx c2 2
c2 (12.37)
2
2 γ
dV = [a + γ ~
v · ~a
 A = γ y v y ]
dx0 c2 c2



 A3 = γ dV 3 = γ 2 [a + γ 2~v · ~a v ],


dx0 c2 z c2 z
de modo que a aceleração Newtoniana ~a pode igualmente ser calculada em termos da

velocidade e aceleração relativı́sticas V e A na forma
c 2 c2 A 0 1 2 c2 A0 2 3 c2 A0 3

1
~a = A − 0 3V ,A − 0 3V ,A − 0 3V .
V0 (V ) (V ) (V )
E quanto à mudança de referencial inercial inicialmente proposta? No referencial O0

acima, a aceleração relativı́stica é dada na forma A0 = (A0 0 , A0 1 , A0 2 , A0 3 ). Usando o
430
mesmo raciocı́nio adotado para a transformação de velocidades, temos
dV0 ∂V0 ∂X0

0 dV
A = = · = · A,
d(c τ ) ∂V d(c τ ) ∂X
de modo que a aceleração relativı́stica também segue uma lei de transformação na

forma  00

 A = γ(A0 − βA1 )
 A0 1 = γ(A1 − βA0 )

02 2
(12.38)


 A = A
 03
A = A3 .
Desta forma, também para a aceleração é verdadeira a afirmação que a formulação
relativı́stica (i.e. no espaço-tempo) oferece simplificação com respeito às leis de trans-
formação entre referenciais inerciais. Apesar de sua conexão com a versão Newtoniana
da aceleração não ser tão simples quanto as equações correspondentes para a veloci-
dade, as expressões para a aceleração acima guardam notável simetria entre suas
componentes espaciais.
Pode-se também introduzir no espaço-tempo um vetor P (vetor momentum-energia)
para caracterizar as grandezas dinâmicas E = γmc2 e P~ = γm~v dos sistemas
mecânicos, conforme a discussão na Sec. 12.6.2. Em termos do referencial O que usa
coordenadas (x0 = ct, x1 = x, x2 = y, x3 = z), definimos
 0

 P = γv mc2
 P1 =

−γv mv 1
(12.39)
 P2 =
 −γv mv 2

 3
P = −γv mv 3 .
O referencial O0 com coordenadas (x0 0 = ct0 , x0 1 = x0 , x0 2 = y 0 , x0 3 = z 0 ) relacionadas

às coordenadas de O por meio das transformações de Lorentz Eqs. (12.12) determina
um vetor energia-momentum P0 = (γv0 mc2 , γv0 mv 0 1 , γv0 mv 0 2 , γv0 mv 0 3 ) que pode ser
escrito (ver Exercı́cio 15) em termos do vetor P na forma
 00

 P = γu (P0 − βu P1 )
 P0 1

= γu (P1 − βu P0 )
(12.40)


 P0 2 = P2
 03
P = P3 .
12.7.2 Geometria do espaço-tempo de Minkowski
Podemos acentuar ainda mais o caráter geométrico do espaço-tempo de Minkowski

construı́do na Sec. 12.7.1. Isto é obtido introduzindo uma noção invariante de distância
entre pontos desse espaço vetorial (que são os eventos do espaço-tempo). Veremos que
essa noção generaliza a idéia da distância Euclidiana entre pontos do espaço tridimen-
sional, evidenciando o caráter pseudo-Euclidiano do espaço-tempo. Isto significa que,
431
embora o espaço e o tempo não tenham existência invariante independentemente, mas
encontrem-se unificados num contı́nuo de espaço-tempo, ainda assim as noções intu-
itivas de espaço e de tempo são tais que não podem ser completamente identificadas
entre si.
Consideremos um lampejo luminoso produzido no evento A origem de um referen-
cial inercial O por uma fonte puntual isotrópica. Conforme determinado por esse
referencial, o pulso propaga-se (no vácuo) em todas as direções espaciais com veloci-
dade c, de modo que num instante posterior dt apresenta forma esférica com raio
p
r = (dx)2 + (dy)2 + (dz)2 = c dt. Assim, um genérico evento B sobre a superfı́cie
esférica desse pulso satisfaz uma relação
(dx0 )2 − [(dx1 )2 + (dx2 )2 + (dx3 )2 ] = 0, (12.41)
semelhante na forma àquela verificada pelas componentes da velocidade relativı́stica

V (naquele caso, o lado direito era igual a 1). Os eventos correspondentes ao inte-
rior espacial dessa superfı́cie esférica — ou seja, aqueles considerados por O como
simultâneos com o evento B e cuja distância espacial até a origem é menor do que r
— são tais que o lado esquerdo da Eq. (12.41) torna-se positivo (i.e. o termo “tem-
poral” é dominante na equação acima). Estes eventos são exatamente aqueles que,
em acordo com a lei de transformação de Lorentz Eqs. (12.32) (ou melhor, com sua
generalização proposta no Exercı́cio 12), podem ser considerados por um referencial
inercial O0 como ocorrendo no mesmo ponto do espaço em que o pulso luminoso foi
produzido. Pois a velocidade Newtoniana (medida por O) requerida para o referencial
O0 para que sua história contenha o evento A e um arbitrário, mas fixo, de tais eventos
seria inferior à velocidade c, exigência matemática para a validade das leis de Lorentz.
Portanto, existe o tempo próprio entre o evento A e qualquer evento localizado no
interior espacial da superfı́cie esférica do pulso luminoso. Analogamente, os eventos
correspondentes ao exterior espacial da superfı́cie esférica do pulso luminoso são tais
que o lado esquerdo da Eq. (12.41) torna-se negativo (os termos “espaciais” dominam).
Estes últimos eventos são exatamente aqueles que, não podendo ser considerados como
ocorrendo no mesmo ponto do espaço por nenhum referencial inercial, podem contudo
ser considerados por um referencial inercial O00 como simultâneos com o evento A de
emissão do pulso. Portanto, existe comprimento próprio entre o evento A e qualquer
evento localizado no exterior espacial da superfı́cie esférica do pulso luminoso. Para o
próprio evento B, bem como para qualquer outro sobre a superfı́cie esférica do pulso
luminoso, não existem nem o tempo próprio nem o comprimento próprio até o evento
A.
Podemos verificar, desses resultados, que a noção invariante de existência seja de um
tempo próprio (caráter temporal) seja de um comprimento próprio (caráter espacial)
entre quaisquer eventos próximos A e B (não necessariamente aqueles mencionados
acima) encontra-se condicionada ao fato de resultar respectivamente positivo ou neg-
ativo o cálculo do lado esquerdo da Eq. (12.41) para esse par de eventos; a existência
432
de qualquer dessas duas grandezas será impossı́vel caso a Eq. (12.41) seja satisfeita
(sendo A e B eventos distintos). Define-se, assim, um intervalo de espaço-tempo
ds2AB (ou distância relativı́stica) entre A e B como sendo o escalar, invariante por
transformações de Lorentz entre referenciais inerciais (ver Exercı́cio 16), dado por13
ds2AB = (dx0AB )2 − [(dx1AB )2 + (dx2AB )2 + (dx3AB )2 ]. (12.42)
Para o caso ds2AB < 0, diz-se que esses eventos determinam entre si um intervalo tipo
espaço ds2AB = −(dÀB )2 onde dÀB é a distância própria entre A e B. Caso ds2AB = 0,
esses eventos determinam entre si um intervalo tipo luz (ou nulo), de modo que um
raio de luz viajando livremente no vácuo pode propagar-se entre A e B. Finalmente,
se ds2AB > 0, os eventos determinam entre si um intervalo tipo tempo ds2AB = c dτAB
onde dτAB é o tempo próprio entre A e B.
12.7.3 Diagramas de espaço-tempo
A fı́sica elementar nos mostra que uma boa ilustração pode conter uma grande quanti-
dade de informações. Adotaremos essa perspectiva geométrica no restante desta seção
para as investigações no âmbito relativı́stico. Tendo em vista a completa semelhança
fı́sica entre as coordenadas espaciais dos eventos, vamos freqüentemente restringir-
nos nesta seção ao estudo do espaço-tempo no setor bidimensional (t, x). Ou seja,
trataremos somente de casos em que y e z sejam constantes para todos os eventos en-
volvidos. Embora a construção dos diagramas de espaço-tempo discutidos nesta seção
poderia prescindir das noções genéricas de espaço-tempo apresentadas previamente, a
compreensão que esses diagramas proporcionam ao estudante seria consideravelmente
prejudicada.
Considere o problema do pulso luminoso esférico emitido a partir da origem do refer-
encial inercial O, apresentado na Sec. 12.7.2. Podemos representar a trajetória desse
pulso de luz num diagrama de espaço-tempo (x0 , x1 ). Nesta representação bidimen-
sional, os eventos sobre a história do pulso luminoso encontram-se sob as duas semi-
retas bissetrizes dos dois primeiros quadrantes desse diagrama. Seja A o evento na
origem do referencial O, e seja B um qualquer evento próximo de A tal que ds2AB é
do tipo tempo com dτAB > 0, de modo que B encontra-se no futuro de A. Então,
B localiza-se “entre” a cunha formada pelas duas semi-retas, conforme a Fig. 12.7
(a). Analogamente, seja C um evento próximo de B com ds2BC do tipo tempo com
dτBC > 0 (de modo que C encontra-se no futuro de B). Resulta que o evento C localiza-
se também entre aquela cunha, e encontra-se “visualmente” mais longe da origem A
do que o evento B. O evento C encontra-se, portanto, também no futuro14 de A. Este
13
A escolha do sinal global na Eq. (12.42) é arbitrária. Seja a escolha apresentada ou a sua oposta, o
intervalo ds2 pode apresentar qualquer sinal algébrico.
14
Note que o intervalo de tempo próprio dτAC em geral não corresponde à soma dτAB + dτBC , pois
esses três tempos próprios podem estar associados a três distintos referenciais inerciais.
433
Figura 12.7: Diagrama bidimensional (a) de espaço-tempo para o referencial O, que ilustra
a transitividade de intervalos tipo tempo e a falta de transitividade de intervalos tipo
espaço. Raios de luz no vácuo são representados por retas a 45o . Uma versão simplificada
(b) do diagrama tridimensional de espaço-tempo apresenta as regiões relativas ao evento
A e a história de um corpo material M .
raciocı́nio pode ser repetido indefinidamente, de modo que podemos concluir que toda
a região entre as cunhas pertence ao futuro do evento A. Uma construção inteiramente
análoga mostra que a “região” entre a cunha tracejada da Fig. 12.7 (a) (correspon-
dente ao prolongamento da trajetória do pulos luminoso para tempos anteriores à sua
produção) determina eventos no passado de A. Dado seu caráter geométrico, esses
dois setores desconexos do espaço-tempo são conhecidos como futuro invariante (ou
absoluto) e passado invariante (ou absoluto) do evento A. Um qualquer evento D
no contorno dessas regiões é caracterizado de modo invariante como estando sobre o
cone de luz do evento A. Um arbitrário evento E que não pertence nem ao futuro
invariante de A, nem ao seu passado invariante, e nem ao cone de luz desse evento,
é tal que pode ser considerado simultâneo ao evento A por algum referencial inercial
RE
O0 , de modo que o intervalo A ds2 entre os eventos A e E é do tipo espaço, qualquer
que seja a escolha dos eventos que compõe no espaço-tempo a “integral de trajetória”
de modo a formar um “caminho contı́nuo” que conecta os eventos A e B; embora o
valor dessa integral possa mudar, seu sinal algébrico não se altera. Geometricamente,
o evento E está exterior (isto é, “para fora”) ao cone de luz de A. A coleção de eventos
exteriores ao cone de luz de A caracteriza invariantemente o setor do espaço-tempo
denominado alhures (ou presente relativo) desse evento, ilustrado na Fig. 12.7 (b), e
compreende o conjunto de eventos que não apresentam conexão causal com o evento
A: não existe sinal que possa propagar-se entre A e algum desses eventos com veloci-
dade não superior à velocidade c da luz no vácuo; a seqüência temporal entre A e um
arbitrário (mas fixo) desses eventos alhures pode ser alterada perante uma mudança
de referencial inercial, conforme a análise da Sec. 12.4.4. Analogamente, seja F um
434
evento externo ao cone de luz de E, de modo que o intervalo entre E e F seja do tipo
espaço. Embora os intervalos entre A e E bem como entre E e F sejam ambos do tipo
espaço, o intervalo entre A e F não necessariamente será do tipo espaço, conforme
ilustrado na Fig. 12.7 (a). Em particular, podemos ter F = B se ÀE > c τAB .
Temos que a história de um corpo material M é constituı́da pela coleção de eventos

que o localizam. Independentemente das leis que determinem a forma especı́fica de
movimento desse corpo, é necessário que, em cada instante ao longo de sua trajetória,
sua velocidade Newtoniana seja inferior à da luz no vácuo, conforme determinados (ins-
tante e velocidade) por um referencial inercial O. Pois, caso houvesse algum evento A
no qual a velocidade Newtoniana do corpo não fosse menor do que c, os eventos futuros
a A pela história de M infinitesimalmente próximos desse evento A seriam considerados
por O como alhures de A, de modo que haveria algum referencial inercial O0 que os
determinaria no passado de A. Essa inversão na seqüência temporal de eventos é
fisicamente irrelevante para eventos sem conexão causal, mas seria contraditória para
eventos que possam ser denominados causa e efeito. Portanto, a história de M pode
ser representada no espaço-tempo como uma curva contı́nua completamente contida
no interior do cone de luz de qualquer evento que a constitui, conforme ilustra a Fig.
12.7 (b).
Considere a representação num diagrama bidimensional de espaço-tempo, conforme

determinada por um referencial inercial O, dos eixos coordenados relativos às coor-
denadas (x0 0 , x0 1 ) adotadas por um referencial inercial O0 que se move com respeito
a O com velocidade adimensional β orientada no sentido positivo do eixo Ox1 , no
instante em que as origens dos dois referenciais coincidem. Note que o eixo O0 x0 0
corresponde aos eventos com coordenada x0 1 = 0, e o eixo O0 x0 1 àqueles com coor-
denada x0 0 = 0. Por meio das Eqs. (12.32) de Lorentz no espaço-tempo, temos que
x0 0 = 0 ⇔ x0 − βx1 = 0 e x0 1 = 0 ⇔ x1 − βx0 = 0, de modo que os eixos O0 x0 0
e O0 x0 1 são representados respectivamente pelas retas x1 = βx0 e x0 = βx1 . Na Fig.
12.8, ilustra-se como aparentam para O os eixos de tempo e espaço utilizados por O0
no instante de coincidência das origens, conforme a simultaneidade determinada por
O. Do ponto de vista de O, os eixos de O0 parecem não ser perpendiculares entre si,
mas cada um deles “apertado” na direção do outro: as componentes positivas desses
eixos apertados localizam eventos interiores ao primeiro quadrante no diagrama. Con-
sidere o ângulo ᾱ tal que tan ᾱ = β. O ângulo medido por O entre os eixos temporais
Ox0 e O0 x0 0 vale −ᾱ, enquanto que aquele entre os eixos espaciais Ox1 e O0 x0 1 vale
ᾱ, segundo a orientação convencional de ângulos positivos no sentido anti-horário.
Assim, a interpretação geométrica no espaço-tempo para a velocidade (adimensional)
Newtoniana é a medida do arco cuja tangente fornece a inclinação dos eixos adaptados
ao referencial que se move com essa velocidade.
As escalas de medida dos eixos nos dois referenciais podem ser determinadas por
435
Figura 12.8: Representação no espaço-tempo da lei de transformação de Lorentz das
coordenadas, onde o eixo vertical convencionalmente tem caráter temporal. Hipérboles da
forma (x0 )2 − (x1 )2 = a2 e (x1 )2 − (x0 )2 = b2 são invariantes.
métodos geométricos. Com efeito, das Eqs. (12.32), temos

(x0 0 )2 − (x0 1 )2 = γ 2 [(x0 − βx1 )2 − (x1 − βx0 )2 ] = γ 2 (1 − β 2 )[(x0 )2 − (x1 )2 ]
= (x0 )2 − (x1 )2 ,
de modo que hipérboles da forma (x0 )2 − (x1 )2 = a2 (cujas assı́ntotas são o cone
de luz da origem) são preservadas perante uma mudança de referenciais inerciais; e
resultam igualmente invariantes as hipérboles da forma (x1 )2 − (x0 )2 = b2 (com as
mesmas assı́ntotas), conforme ilustrado na Fig. 12.8. Com isto, a hipérbole invariante
(x0 )2 − (x1 )2 = 1 intercepta os eixos temporais Ox0 e O0 x0 0 respectivamente nos even-
tos (x0 , x1 ) = (±1, 0) e (x0 0 , x0 1 ) = (±1, 0). Analogamente, a hipérbole invariante
(x1 )2 −(x0 )2 = 1 intercepta os eixos espaciais Ox1 e O0 x0 1 respectivamente nos eventos
(x0 , x1 ) = (0, ±1) e (x0 0 , x0 1 ) = (0, ±1).
Graças à identidade trigonométrica hiperbólica cosh2 α − senh2 α = 1, a relação entre
as coordenadas dos referenciais O e O0 dada pelas Eqs. (12.33) pode ser expressa
matricialmente como
! ! !
x0 cosh α senh α x0 0
= , (12.43)
x1 senh α cosh α x0 1
onde fizemos cosh α = γ e senh α = γβ, donde obtemos tan ᾱ = β = tanh α, sendo
α um ângulo hiperbólico (isto é, um número real) determinado pela expressão α =
ln[γ(1 + β)] (ver Exercı́cio 18). Portanto, fixar um valor para β implica em fixar
um valor para α, e vice-versa. A tı́tulo de comparação com a representação acima,
podemos também representar matricialmente o efeito de uma rotação de eixos segundo
um ângulo θ na forma
! ! !
x2 cos θ −sen θ x0 2
= . (12.44)
x3 sen θ cos θ x0 3
436
Figura 12.9: Rotação elı́ptica (a) de eixos espaciais do espaço-tempo segundo um ângulo
θ, e rotação hiperbólica (b) de eixos temporal e espacial do espaço-tempo segundo um
ângulo α = tanh−1 β. A construção geométrica das coordenadas de espaço-tempo de um
ponto/evento P arbitrário é apresentada em ambos os casos.
Enquanto a Eq. (12.43) preserva hipérboles da forma (x0 )2 − (x1 )2 = ±a2 , temos
que a Eq. (12.44) preserva circunferências da forma (x2 )2 + (x3 )2 = +a2 . Da seme-
lhança formal entre as Eqs. (12.43) e (12.44), a lei de transformação de Lorentz é
também denominada rotação hiperbólica no espaço-tempo, ao passo que a rotação
usual é denominada rotação elı́ptica no espaço-tempo. O efeito de cada uma dessas
transformações encontra-se ilustrado na Fig. 12.9.
12.8 Cálculos simples em relatividade
Os resultados da Relatividade Especial foram, até agora, apresentados de uma forma

direta, e não foram aqui criticados, ainda que alguns deles sejam bastante estranhos
ao senso comum. Crı́ticas não faltam, contudo. Expõe-se, a seguir, duas dentre as
mais comuns. Em geral, o problema surge de utilizar-se uma intuição Newtoniana sem
atentar devidamente para o exato significado daquilo que é medido, ou por quem é
medido. Portanto, a solução de tais paradoxos aparentes consiste em geral numa clara
especificação dos eventos envolvidos, e em recusar-se a caracterizá-los em coordenadas
sem mencionar explicitamente com respeito a qual referencial inercial tais coorde-
nadas são escolhidas. A representação do problema em um diagrama de espaço-tempo
freqüentemente dirime todas as dificuldades conceituais a que o estudante pode ser
induzido na relatividade pelo uso da imprecisa linguagem quotidiana com que estamos
habituados [5].
437
12.8.1 Paradoxo dos gêmeos
Seguramente, o chamado paradoxo dos gêmeos é a mais difundida dessas crı́ticas [12,
13]. Considere dois irmãos gêmeos, denominados I e G (as iniciais de Irmãos Gêmeos),
e suponha que I seja um fı́sico e G um astronauta. No dia em que eles comemoram
seu trigésimo aniversário, G embarca numa espaçonave e viaja em direção a uma
Estrela fixa a 20 anos-luz de distância,15 movendo-se relativamente à Terra a 80% da
velocidade c da luz no vácuo. Ao atingir a referida Estrela, passados 25 anos de seu
embarque segundo os cálculos de I (pois 20/0, 8 = 25), o astronauta G é acometido de
súbita melancolia, e decide voltar imediatamente a seu planeta natal, desenvolvendo
no retorno a mesma velocidade com que percorreu a primeira parte de sua jornada.
Tendo G enviado para a Terra por rádio sua decisão, seu irmão pode prever que o
percurso total levará 50 anos, de modo que I contará com a avançada idade de 80 anos
até que possa rever seu irmão novamente. Contudo, por seus estudos de relatividade,
I estima que o tempo passe mais lentamente na espaçonave, seja na ida quanto no
retorno, segundo um fator de Lorentz γ = [1 − (0, 8)2 ]−1/2 = 5/3. Assim sendo, o
tempo total de viagem de G medido por ele próprio deverá ser de apenas 30 anos
(50 · 3/5 = 30), de modo que G deve contar com 60 anos no momento do re-encontro.
Portanto, I estará 20 anos mais velho que seu irmão gêmeo G ao revê-lo na Terra.
Até aqui, trata-se apenas de mais uma das “esquisitices” da relatividade. Con-
tudo, para ser astronauta, G também precisou estudar alguns elementos dessa teoria
(ainda que contra sua própria vontade). Sendo constante a velocidade relativa entre a
espaçonave e a Terra, seja na ida quanto no retorno, a simetria da cinemática confere
a G o direito de fazer uso de um raciocı́nio similar. Do ponto de vista de G, foi seu
irmão I quem “viajou para trás” e retornou depois. Portanto, G pode calcular para si
mesmo a idade de 80 anos e para seu irmão I a idade de 60 anos, de modo que I será
20 anos mais jovem do que G ao se re-encontrarem na Terra.
Embora possam estar ambos errados, não resta dúvida que os cálculos de I e de G
não podem ser ambos corretos: estando ambos frente a frente, a diferença de idade
entre I e G não pode ser 20 anos para mais e para menos. A lógica elementar parece
depor contra a relatividade, segundo o paradoxal argumento exposto acima.
A solução do paradoxo poderia ser obtida pelo “argumento de autoridade”: sendo I

um fı́sico, ele deve saber mais sobre fı́sica do que seu irmão G, de modo que I será o
gêmeo mais velho quando ambos se re-encontrarem. Mas esta forma de argumentação
não deve satisfazer o estudante (ou, pelo menos, não deveria). Passemos, portanto,
para uma linha de raciocı́nio mais convincente, baseada em argumentos de caráter
demonstrativo que estejam mais em acordo com o espı́rito investigativo tı́pico do
estudante.
15
Ano-luz é definido como a distância percorrida por um raio de luz que viaja no vácuo pelo perı́odo
de um ano terrestre (cerca de 3, 156 · 107 segundos), e vale cerca de 9, 459 · 1015 metros.
438
Note que G sofre uma aceleração infinita ao inverter o sentido de velocidade de sua
espaçonave, enquanto que I é um observador inercial durante toda a viagem (note que
o problema proposto é acadêmico, ignorando os movimentos não inerciais do planeta).
Assim sendo, os dois observadores não são fisicamente equivalentes, de modo que a
descrição dos fenômenos caracterizados por eles não precisaria ser simétrica. Com isto,
a lógica elementar não depõe contra a relatividade, tal como parecia fazê-lo à primeira
vista: embora seja estranha ao senso comum, uma diferença de idades resultante não
contradiz a si mesma. Mas qual dentre os dois irmãos gêmeos resulta, após decorrida
a viagem, ser “primogênito a posteriori”?
Sejam os eventos A “posição e instante em que I e G se separam”, B “posição e

instante em que G e a estrela se encontram”, e C “posição e instante em que I e G
se re-encontram”. Seja O um referencial inercial fixo à Terra cujo eixo coordenado
Ox aponta diretamente para a referida estrela. Seja O0 um referencial inercial que se
move com respeito a O com a mesma velocidade βO0 = 0, 8 da espaçonave no trajeto
AB, e seja O00 um referencial inercial que se move com respeito a O com a mesma
velocidade βO00 = −0, 8 da espaçonave no trajeto BC, sendo ambos os eixos espaciais
O0 x0 e O00 x00 orientados na mesma direção do eixo O. Temos γO0 = γO00 = 5/3 = γO .
Por simplicidade, adotaremos as escalas de medida de tempo em anos terrestres, e de
distância em anos-luz; e também adotaremos a coincidência das origens de todos os
referenciais.
Com respeito ao referencial O, o observador G é co-móvel com o referencial O0 no

trajeto AB, e é co-móvel com o referencial O00 no trajeto BC. O referencial O de-
termina o evento A com coordenadas (tA , xA ) = (0, 0). Estando a Terra e a Estrela
em repouso, o observador I na Terra determina a distância própria `T E = 20 entre a
Terra e a Estrela, de modo que xB = 20. Como o observador G efetua o deslocamento
xAB = 20 com velocidade βO0 = 0, 8, o tempo de percurso neste deslocamento será
tAB = xAB /βO0 = 25, de modo que o evento B tem coordenadas (tB , xB ) = (25, 20).
Analogamente, I percorre o deslocamento xBC = −20 com velocidade βO00 = −0, 8, de
modo que o evento C apresenta coordenadas (tC , xC ) = (50, 0). Tendo permanecido
em repouso ao longo de todo o experimento, o observador I determina o tempo próprio
τAC = 50 de duração da viagem de G.
Com respeito ao referencial O0 , o evento A tem coordenadas (t0A , x0A ) = (0, 0). Tendo
permanecido em repouso (neste perı́odo), o observador G determina o tempo próprio
τAB para o deslocamento da Estrela até a espaçonave. Da lei de Lorentz, temos τAB =
tAB /γO = 15, de modo que o evento B tem coordenadas (t0B , x0B ) = (15, 0). Como o
observador I mede o tempo próprio τAC = 50, temos t0C = γO τAC = 250/3. Visto que
o observador I se move com velocidade βO = −βO0 = −0, 8, temos x0AC = βO t0AC =
−200/3, de modo que o evento C tem coordenadas (t0C , x0C ) = (250/3, −200/3).
Com respeito ao referencial O00 , o evento A tem coordenadas (t00A , x00A ) = (0, 0). Como
o observador I mede o tempo próprio τAC = 50, a lei de Lorentz fornece t00C = γO τAC =
439
250/3. Visto que I se move com velocidade β̄O = 0, 8, temos x00AC = β̄O t00AC = 200/3,
de modo que o evento C se expressa em coordenadas por (t00C , x00C ) = (250/3, 200/3).
Como o observador G mede o tempo próprio τBC , temos τBC = tBC /γO = 15, de modo
que t00B = t00C − τBC = 205/3. Visto que I mede a distância própria `T E entre a Terra
e a Estrela, temos x00AB = `T E /γO = 12, de modo que o evento B tem coordenadas
(t00B , x00B ) = (205/3, 12).
Enquanto a viagem do observador G leva o tempo próprio τAC = 50, a viagem do

observador I leva o tempo próprio τAB + τBC = 30. Desta forma, no evento C de
re-encontro dos irmãos gêmeos, I terá 80 anos de idade, enquanto G terá 60 anos de
idade. Os cálculos de I estavam corretos, enquanto que G cometeu um equı́voco (pos-
sivelmente causado por ter estudado relatividade contra sua vontade) ao subestimar
a importância da necessária troca de referencial inercial no evento B, ocasionada pela
sua própria aceleração (infinita) nesse evento. O resultado enunciado pelo argumento
de autoridade é verdadeiro, mas agora temos uma boa justificativa para afirmá-lo.
Figura 12.10: Diagrama de espaço-tempo para o paradoxo dos gêmeos na forma qualitativa
(eixos representados fora de escala). O intervalo τEF determina a diferença de idades, a
menos do fator multiplicativo relativı́stico γ/(1 + γ).
O diagrama de espaço-tempo determinado pelo referencial O, ilustrado de forma

qualitativa na Fig. 12.10, apresenta uma justificativa geométrica para a diferença
de idades acima. Em termos dos eventos E “posição de I simultânea para O0 ao
evento B”, e F “posição de I simultânea para O00 ao evento B”, podemos verificar
que a simetria cinemática clamada por G fornece as igualdades τAC = γ(τAB + τBC )
e (τAB + τBC ) = γ(τAE + τF C ) = γ(τAC − τEF ) (movimento relativo com velocidade
β = 0, 8), de modo que temos
∆τ = τAC − (τAB + τBC ) = γ[(τAB + τBC − (τAC − τEF )] = γ(τEF − ∆τ ),
440
donde ∆τ = [γ/(1 + γ)]τEF . Em números, obtemos τAE = 9 = τF C e τEF = 32, donde
a diferença de idade resultante ao final da viagem de ida e retorno de G (pois foi G
quem sofreu aceleração no evento B) consiste em ∆τ = 20 anos.
O exemplo idealizado acima corresponde a uma simplificação nos cálculos advinda da
aceleração infinita de G no evento B, o que ocasiona-lhe a “perda” do tempo próprio
τEF . Em uma situação mais realista, G sofreria uma aceleração elevada (porém finita)
durante um certo tempo no entorno do evento B, o que ocasionaria uma rápida (porém
contı́nua) passagem daquele tempo se comparada ao curto intervalo de tempo próprio
de duração de sua aceleração.
12.8.2 Paradoxo da garagem
Menos popular do que o paradoxo dos gêmeos, a variação dos comprimentos com
respeito ao estado de movimento, que origina o problema da garagem, será analisada
de forma substancialmente mais suscinta.
Considere um milionário M , que enriqueceu após ter estudado a Relatividade Especial.
O milionário M possui uma grande mansão, com uma garagem bastante ampla. Ele
adquiriu a poucos instantes um carro novo de altı́ssima performance, mas tão longo
que seu comprimento Lo ultrapassa a extensão d da garagem. Ao verificar que seu
exagero causou-lhe um inconveniente, M lembra-se de seus antigos estudos, e percebe
que pode utilizar a contração relativı́stica de comprimentos em seu favor. Ele pede à
sua esposa E, excelente motorista, para dirigir seu carro novo em direção à garagem,
de modo que o velocı́metro acuse o valor v, e freá-lo bruscamente imediatamente antes
da colisão com o fundo dessa. A novı́ssima performance de seu carro lhe confere, além
de alta velocidade, a possibilidade de parar instantaneamente. Com respeito a M , que
permanece à entrada da garagem, o carro apresenta um comprimento reduzido L =
Lo /γv < d (para a velocidade v escolhida), de modo que M pretente fechar o portão
de ingresso da garagem imediatamente após o carro encontrar-se completamente no
interior desta. Sendo freado subitamente após isto, o carro não poderia “expandir-
se” ao seu comprimento natural Lo , pois estaria limitado pela garagem em seus dois
extremos: estando ambos em repouso relativo, o carro e a garagem não poderão colidir
— o carro deverá permanecer “encolhido”.
Nova “esquisitice”, mas pode piorar. Pois, tendo desconfiado da longa demora nas
reuniões de trabalho de seu marido, E revirou os pertences deste, tendo encontrado
alguns textos universitários que lhe explicaram fisicamente o fenômeno de dilatação
do tempo. Ficando muito impressionada com esta justificativa, E dedicou-se a ler o
restante, e também aprendeu algo a respeito do fenômeno de contração do compri-
mento. Assim, enquanto dirigia o novo carro de seu marido, E fez algumas contas de
cabeça. Do ponto de vista de E, a situação é completamente simétrica: é a garagem
que se move com velocidade −v, de modo que é esta que apresenta um comprimento
441
reduzido d/γv . Assim, E julga que o problema do estacionamento do carro novo é
ainda mais difı́cil devido à relatividade.
Claro está, a razão
comprimento do carro
comprimento da garagem
não pode aumentar e diminuir devido ao movimento relativo entre ambos. Eis que,
novamente, encontramos um paradoxo.
A solução para o impasse apresentado acima decorre, tal como no caso do paradoxo dos
gêmeos, de um maior cuidado com o uso da linguagem. E, talvez não por coincidência,
também aqui é a relatividade da simultaneidade a causa dos mal-entendidos. Sejam os
referenciais inerciais O que determina M em repouso, e O0 que se move com velocidade
Newtoniana β = v/c com respeito a O no sentido positivo do eixo Ox. Seja o evento
A “posição e instante em que a extremidade dianteira do carro e a parede da garagem
se encontram”.
Omitindo a discussão algébrica de todos os eventos relevantes à solução desse pro-
blema, passemos diretamente para a sua formulação geométrica no espaço-tempo,
ilustrada na Fig. 12.11. Conforme o acordo proposto, E freia o carro no evento A. Da
invariância das hipérboles, obtemos que os eventos A e B apresentam coordenadas
espaciais xB = L = γv Lo e x0A = L numericamente iguais x0A = xB ; analogamente,
temos x0D = Lo = xC . Como L < Lo , a extremidade posterior do carro encontra-se
no evento F no instante do evento A, conforme a simultaneidade de O0 . Do ponto de
vista de O, os eventos A e F não são simultâneos: apesar de M ter solicitado que E
freasse (todo) o carro apenas para evitar a colisão, parece-lhe que sua esposa se recusa
a fazê-lo, utilizando-se dos freios traseiros bem antes do momento em que seu marido
julga necessário fazê-lo.
Do ponto de vista do observador M , o carro não se comporta como um corpo rı́gido

tal como se poderia imaginar à primeira vista, mas “estica-se” enquanto é freado
gradativamente desde sua extremidade posterior até a anterior. Este fato também
ilustra um resultado genérico, que poderia ser obtido diretamente do princı́pio fı́sico
de causalidade: a Relatividade Especial é incompatı́vel com a noção clássica
de corpo rı́gido, visto que este último poderia propagar informações com velocidade
virtualmente infinita.
Assim, a engenhosa solução proposta por M para estacionar seu carro novo não fun-
ciona, devido a um problema de comunicação com sua esposa E: enquanto esta
encontra-se em movimento ao volante, a noção de simultaneidade não é partilhada
pelo casal. Também este é um paradoxo aparente. Os cálculos de ambos os cônjuges
estava errado (talvez por estarem mais habituados a cifras monetárias do que rela-
tivı́sticas). A situação fı́sica invariante é que aquele carro definitivamente não cabe
naquela garagem.
442
Figura 12.11: Diagrama de espaço-tempo para o paradoxo da garagem. A linha vertical
representa a história da parede. Arcos das hipérboles invariantes que contém os eventos
A e C também estão ilustrados.
12.9 Formalismo tensorial
Apresenta-se nesta seção uma linguagem adequada à representação de quaisquer pro-

blemas de natureza vetorial, ainda que sua aplicação seja aqui discutida somente para
dois tipos de vetores: os vetores tridimensionais espaciais usualmente manipulados nos
cursos elementares de fı́sica, e os vetores quadridimensionais do espaço-tempo apresen-
tados na Sec. 12.7. Trata-se do formalismo tensorial [11], inicialmente identificado com
notação de ı́ndices.16 Esta linguagem baseia-se nas leis da álgebra matricial, e atende
ao mesmo propósito das matrizes e dos vetores: representar de forma compacta uma
coleção de quantidades.
12.9.1 Rotações espaciais
Utilizando a mesma notação (x1 , x2 , x3 ) ≡ (x, y, z) introduzida na Sec. 12.7, podemos

escrever a relação inversa da Eq. (12.44) de rotação no plano yz segundo um ângulo
θ na forma matricial tridimensional
    
x0 1 1 0 0 x1
 02  
 x = 0 cos θ sen θ   x2  .
 
x0 3 0 −sen θ cos θ x3
16
O estudante atento à nomenclatura observará, no estudo da Relatividade Geral (Cap. 1), que a
notação de ı́ndices se aplica com igual propriedade também para grandezas não tensoriais. A noção
precisa de tensor será formalizada na Sec. 12.9.2.
443
Da mesma forma, uma rotação no plano xy segundo um ângulo ϕ e uma rotação no
plano xz segundo um ângulo ϑ têm a forma
    
x0 1 cos ϕ sen ϕ 0 x1
 02  
 x  =  −sen ϕ cos ϕ 0   x2 
 
x0 3 0 0 1 x3
    
x0 1 cos ϑ 0 sen ϑ x1
 02  
 x = 0 1 0   x2  .
 
x0 3 −sen ϑ 0 cos ϑ x3
Denominando temporariamente por Rθ , Rϕ , e Rϑ as três matrizes quadradas que figu-

ram nas três equações matriciais acima, observa-se que cada uma dessas três matrizes
apresenta determinante unitário: det Rθ = det Rϕ = det Rϑ = 1. Além disso, cada
uma dessas matrizes admite uma matriz inversa do mesmo tipo, correspondente ao
negativo do ângulo de rotação original, e que resulta ser igual à matriz transposta da
matriz original, donde são ditas ortogonais. Uma rotação genérica no espaço tridimen-
sional (x1 , x2 , x3 ) pode ser representada pela multiplicação das matrizes de rotação
elementares Rθ , Rϕ , e Rϑ que figuram nas três equações matriciais acima. A ordem
com que as matrizes se encontrem multiplicadas é relevante, visto que essas matrizes
não comutam entre si no caso geral. Além disso, observa-se que tal multiplicação re-
presenta a sucessão de três rotações, de modo que o eixo fixo da segunda pode estar
alterado pela ação da primeira (os eixos dessas três rotações não coincidem com os
eixos cartesianos originais, no caso geral). Sem entrar nos detalhes desse estudo, pode-
mos afirmar genericamente que uma rotação em torno de um qualquer eixo que passa
pela origem pode ser expressa na forma
   
x0 1 x1
 02 
 x  = R  x2  , (12.45)
 
x0 3 x3
em termos de uma única matriz de rotação ortogonal R = R(θ, ϕ, ϑ) com determi-

nante unitário, det R = 1, e com inversa dada pela matriz transposta R̄. O conjunto de
todas as rotações espaciais constitui o Grupo de Rotações (ou Grupo Ortogonal),
caracterizado por 3 parâmetros independentes (os 3 ângulos θ, ϕ, ϑ acima). Geometri-
camente, dois desses ângulos especificam a direção do eixo de rotação, enquanto que
o ângulo remanescente determina a extensão do giro em torno desse eixo.
A transformação de rotação descrita pela Eq. (12.45) preserva esferas de raio r ar-
bitrário centradas na origem,
(x1 )2 + (x2 )2 + (x3 )2 = r2 = (x0 1 )2 + (x0 2 )2 + (x0 3 )2 .
Uma equação matricial é dita verdadeira exatamente quando forem iguais as compo-
nentes correspondentes das matrizes equacionadas, de modo que podemos escrever a
444
Eq. (12.45) em suas componentes na forma
3
X
x 0 i = R i 1 x1 + R i 2 x2 + R i 3 x3 = R i j xj , (12.46)
j=1
para cada valor de i = 1, 2, 3, em termos da notação de somatório ( ). Aqui, Ri j

P
representa o elemento de matriz na i-ésima linha e na j-ésima coluna da matriz R,

enquanto que xj representa o elemento de matriz na j-ésima linha da matriz-coluna
x (e analogamente para o elemento x0 i da matriz-coluna x0 ). Observe que a operação
designada pelo sı́mbolo de somatório corresponde à soma de monômios onde o ı́ndice
de soma (j) figura exatamente duas vezes, uma vez como ı́ndice superescrito (em
xj ) e outra como ı́ndice subescrito (em Ri j ). Além disso, o ı́ndice livre (ou seja,
que não encontra-se somado nessa operação) aparece igualmente em cada termo da
equação, conferindo-lhe o caráter vetorial desejado; por não estar somado, o ı́ndice
i da Eq. (12.46) pode assumir qualquer valor dentre as possibilidades i = 1, i = 2,
e i = 3, fornecendo em cada caso uma equação numérica. Quanto às esferas que a
transformação dada pela Eq. (12.46) preserva, podemos escrevê-las de acordo com as
observações acima na forma 3i=1 3j=1 Iij xi xj = r2 , onde
P P
 
1 0 0
I= 0 1 0 
 
0 0 1
é a matriz identidade (Iij = 1 se i = j, e Iij = 0 se i 6= j). Note que a representação

mais simples 3i=1 xi xi = r2 não é conveniente, pois o ı́ndice de soma i no monômio
P
xi xi figura duas vezes na forma superescrita.

É fácil perceber que, para expressões com uma complexidade algébrica maior, a con-
strução acima nos conduz à manipulação de um número considerável de sı́mbolos
de somatório. Porém, se tomarmos o cuidado de que sejam satisfeitas ambas as ob-
servações acima por toda expressão que escrevermos, podemos simplificar-lhes a escrita
por meio da omissão dos sı́mbolos de somatório onde quer que apareçam. Com isto, a
Eq. (12.46) pode ser escrita na forma definitiva
x0 i = R i j xj , (12.47)
onde a mera repetição do ı́ndice j em alturas diferentes (uma vez subescrito e outra
vez superescrito) no monômio Ri j xj determina implicitamente sua soma sobre todas
as possibilidades de valores desse ı́ndice. Esta notação de ı́ndices é conhecida como
notação tensorial, e a convenção de omissão dos sı́mbolos de somatório é conhecida
por convenção de soma implı́cita de Einstein.
Em termos dessa notação, podemos escrever a forma recı́proca da Eq. (12.47) como
xi = R̄i j x0 j (soma implı́cita no ı́ndice j), onde R̄ é a matriz inversa da matriz R. Isto é,
o produto matricial de R e R̄ em ambas as ordens possı́veis fornece a matriz identidade
445
I (I i k = 1 se i = k, e I i k = 0 se i 6= k) representada acima: Ri j R̄j k = I i k = R̄i j Rj k .
Do ponto de vista geométrico, R̄ representa a rotação inversa àquela representada por
R.
Para uma transformação de coordenadas dada pela Eq. (12.47), temos que ∂x0 i /∂xj =
Ri j , de modo que a matriz de rotação R pode ser interpretada como a matriz Jaco-
biana da transformação de coordenadas. Analogamente, temos a relação recı́proca
R̄i j = ∂xi /∂x0 j . Da regra da cadeia, e fazendo uso da convenção de Einstein, temos
que as derivadas parciais com respeito às coordenadas x0 são dadas por ∂/∂x0 j =
R̄i j (∂/∂xi ) em termos das derivadas parciais com respeito às coordenadas x, por uma
regra distinta daquela da Eq. (12.47): além de fazer uso de matrizes inversas entre
si, o ı́ndice livre (não somado) encontra-se em posições diferentes em cada caso, ora
subescrito ora superescrito.
Por meio da convenção de Einstein, as esferas invariantes do problema acima podem
ser escritas na forma Iij xi xj = r2 . Como outro exemplo, na álgebra matricial obtém-
se [14] a identidade det A = [(Tr A)3 − 3(Tr A) Tr (A2 ) + 2 Tr (A3 )]/6, válida para
qualquer matriz A de ordem 3 × 3, onde o traço Tr A de uma matriz A é definido
como sendo igual à soma de suas componentes diagonais. Em termos da convenção de
Einstein, temos Tr A = Ai i . Com isto, essa convenção permite expressar a condição
de determinante unitário da matriz de rotação R na forma
(Ri i )3 − 3Ri i Rj k Rk j + 2Ri j Rj k Rk i = 6.
Observa-se, nesta expressão, o uso de diversos ı́ndices com soma implı́cita. O uso do
mesmo nome i para o ı́ndice de soma no monômio (Ri i )3 e no monômio −3Ri i Rj k Rk j
não significa qualquer correlação entre eles, mas reflete apenas uma economia no
número de sı́mbolos envolvidos.
O estudante deve atentar para o fato de não ser válido “isolar” um fator que apresenta
um ı́ndice somado numa equação que seja escrita segundo a convenção de Einstein.
Assim, por exemplo, sendo válida a equação Iij xi xj = 3 (cujo significado fı́sico é irre-
levante para o argumento), seria completamente errado daı́ obter que Iij = 3/(xi xj ),
tal como de A~·B~ = 5 seria errado obter que A ~ = 5/B. ~
12.9.2 Grupo de Lorentz-Poincaré
Consideremos a relação inversa da Eq. (12.43) escrita matricialmente levando em con-

sideração todas as dimensões espaciais (além da dimensão temporal), na forma
x0 0 x0
    
γ −γβ 0 0
 x0 1   −γβ γ 0 0   x1 
= , (12.48)
     
x0 2 x2
  
   0 0 1 0   
x0 3 0 0 0 1 x3
446
onde a matriz quadrada de ordem 4 × 4 acima é a mesma que tı́nhamos encontrado
na Eq. (12.35). Por seu uso freqüente na relatividade, esta matriz (e qualquer outra
dela obtida por uma rotação de eixos espaciais, multiplicando-a convenientemente
por versões quadridimensionais de espaço-tempo das matrizes R da Sec. 12.9.1) é
re-denominada pelo sı́mbolo Λ e referida como matriz de Lorentz. Não seria muito
apropriado utilizar-se da nomenclatura Λi j para designar as componentes dessa matriz,
pois a notação de ı́ndices estabelecida na Sec. 12.9.1 nos induziria a pensar que trata-
se de uma matriz espacial 3 × 3. Introduz-se, assim, uma nova categoria de ı́ndices,
designados por letras gregas minúsculas (α, β, γ, etc), para designar as componentes de
matrizes quadridimensionais no espaço-tempo. Mais explicitamente, as possibilidades
de valores para um ı́ndice α são: α = 0, α = 1, α = 2, e α = 3. Com esta convenção, a
matriz de Lorentz Λ tem componentes Λα β . As coordenadas do espaço-tempo, reunidas
na forma da matriz-coluna da Eq. (12.48), são analogamente designadas pelo sı́mbolo
x, cujas componentes xα são precisamente essas coordenadas.
Podemos escrever a Eq. (12.48) de Lorentz na linguagem tensorial, na forma x0 α =
P3 α β
β=0 Λ β x . Porém, usando a convenção de Einstein (agora para ı́ndices quadridi-
mensionais de espaço-tempo), essa equação toma sua forma definitiva x0 α = Λα β xβ .
Neste momento, é interessante recuperar as constantes aditivas que figuram nas ex-
pressões originais da lei de Lorentz, Eqs. (12.12) da Sec. 12.4.5. Definindo o conjunto
quadridimensional de constantes z 0 = c to , z 1 = xo , z 2 = yo , e z 3 = zo , a lei de trans-
formação de coordenadas de Lorentz no espaço-tempo assume a forma de Poincaré
x0 α = Λα β xβ + z α . (12.49)
A matriz de Lorentz Λ resulta ser a matriz Jacobiana dessa transformação,

∂x0 α
Λα β = , (12.50)
∂xβ
conforme já havı́amos determinado na Eq. (12.35). Observa-se que a Eq. (12.50) é
válida mesmo no caso da transformação generalizada de Poincaré. Consideremos a
transformação inversa de Poincaré, xα = Λ̄α β x0 β − Λ̄α β z β , onde Λ̄α β é a matriz inversa
quadridimensional da matriz Λα β (isto é, Λα β Λ̄β γ = I α γ = Λ̄α β Λβ γ , onde I α γ = 1
se α = γ e I α γ = 0 se α 6= γ). Com isto, obtemos Λ̄α β = ∂xα /∂x0 β , de modo que
a lei de transformação para as derivadas parciais com respeito às coordenadas de
espaço-tempo, dada pela regra da cadeia, toma a forma
∂ ∂
0 β
= Λ̄α β α , (12.51)
∂x ∂x
à semelhança do resultado tridimensional obtido na Sec. 12.9.1. Observa-se, ainda,
que Λ̄σ τ (β~ ) = Λσ τ (−β~ ), onde β~ representa uma velocidade Newtoniana entre dois
referenciais inerciais cujas coordenadas se relacionam segundo a Eq. (12.49).
Na forma simétrica dada pela Eq. (12.48), a matriz de Lorentz Λ representa uma
rotação hiperbólica no plano x0 x1 (conforme a Sec. 12.7.3), e temos que det Λ = 1.
447
Fazendo β = 0 na Eq. (12.48) e transformando as coordenadas espaciais por uma
rotação de eixos, conforme a Sec. 12.9.1, a matriz de Lorentz resultante representa
uma rotação elı́ptica, e temos det Λ = 1 (conforme a Sec. 12.9.1). Neste caso, a matriz
de Lorentz torna-se uma forma quadridimensional da matriz R de rotação espacial. No
caso geral, a matriz Λ pode representar uma rotação genérica no espaço-tempo, seja do
tipo hiperbólico (matriz simétrica) ou elı́ptico (matriz ortogonal), ou de ambos os tipos.
O determinante da matriz de Lorentz é unitário em qualquer caso, det Λ = 1. Com isto,
temos que a matriz Λ (com 16 componentes) apresenta 6 componentes independentes,
determinadas pelos 3 ângulos elı́pticos (medidos nos planos x1 x2 , x1 x3 , e x2 x3 ) e
pelos 3 ângulos hiperbólicos (medidos nos planos x0 x1 , x0 x2 , e x0 x3 ). Desta forma, o
chamado Grupo de Lorentz é caracterizado por 6 parâmetros independentes.
Se aliarmos ao Grupo de Lorentz a matriz-coluna z α da Eq. (12.49), obtemos o
chamado Grupo de Poincaré, caracterizado por 10 parâmetros independentes. En-
quanto o Grupo de Lorentz descreve rotações arbitrárias no espaço-tempo, preser-
vando as seções hiperbólicas (x0 )2 − [(x1 )2 + (x2 )2 + (x3 )2 ] = constante, o Grupo
de Poincaré descreve transformações lineares arbitrárias (translações e rotações) no
espaço-tempo, preservando as seções hiperbólicas entre eventos A e B da forma
(x0B − x0A )2 − [(x1B − x1A )2 + (x2B − x2A )2 + (x3B − x3A )2 ] = constante.
Observamos também que a lei de transformação para a velocidade relativı́stica, con-
forme as Eqs. (12.36), pode ser escrita na forma
v 0 α = Λα β v β , (12.52)
e aquela correspondente à aceleração relativı́stica, conforme as Eqs. (12.38), na forma

a0 α = Λα β aβ . Verifica-se, formalmente que, à semelhança do caso das rotações tridi-
mensionais, as leis de transformação dadas pelas Eqs. (12.51) e (12.52) são distintas:
para a última destas relações o ı́ndice livre (isto é, não somado) é o ı́ndice superescrito
da matriz Λ, enquanto que para a primeira é o ı́ndice subescrito da matriz inversa
Λ̄. Com isto, definimos dois tipos de tensores no espaço-tempo: temos vetores con-
travariantes, Y α , cuja lei de transformação assemelha-se à das velocidades
Y 0 α = Λα β Y β , (12.53)
e vetores covariantes, Zβ , cuja lei de transformação assemelha-se à dos gradientes
Zβ0 = Λ̄α β Zα , (12.54)
perante uma mudança de referenciais de Poincaré dada pela Eq. (12.49). Devido à ho-
mogeneidade dos ı́ndices livres que figuram nas equações tensoriais, decorre que vetores
contravariantes apresentam um ı́ndice livre superescrito, enquanto que vetores covari-
antes apresentam um ı́ndice livre subescrito. Em conseqüência, também denominam-se
contravariantes os ı́ndices superescritos, e covariantes os ı́ndices subescritos, em uma
equação tensorial.
448
Resulta da definição acima que a diferença entre as coordenadas de espaço-tempo de
dois eventos (para evitar as constantes aditivas da tranformação de coordenadas de
Poincaré) constituem um vetor contravariante, bem como são vetores contravariantes
as versões relativı́sticas da velocidade e da aceleração; enquanto que as derivadas
parciais com respeito às coordenadas do espaço-tempo constituem um vetor covariante.
Seja o produto direto P das componentes de dois vetores, P α β = X α Yβ . Como esta

equação apresenta dois ı́ndices livres, o resultado desse produto é uma matriz quadridi-
mensional no espaço-tempo. Perante uma mudança de coordenadas de Poincaré, Eq.
(12.49), a matriz P transforma-se como P 0 α β = Λα σ Λ̄τ β P σ τ . Assim, as componentes
da matriz P 0 relacionam-se às componentes da matriz P perante o produto matri-
cial com as matrizes Λ e Λ̄ de Lorentz, segundo uma lei contravariante e covariante.
Portanto, podemos generalizar a idéia de vetor no espaço-tempo para o noção de um
tensor de segunda ordem, cujos ı́ndices podem apresentar a posição covariante (Pαβ ),
contravariante (P αβ ), ou ambas (P α β ou Pα β ), conforme as três possı́veis leis de trans-
formação de suas componentes (tais que envolvem somente o produto matricial com
Λ e Λ̄) perante uma mudança de coordenadas de Poincaré.
Este raciocı́nio pode ser estendido para produtos diretos de mais do que dois vetores,
dando lugar a grandezas abstratas que necessitam de mais ı́ndices para especificar uma
de suas componentes. Este resultado nos permite definir, em definitiva, um tensor no
espaço-tempo como sendo um objeto Z com m ı́ndices contravariantes α1 , α2 , . . . , αm
e n ı́ndices covariantes β1 , β2 , . . . , βn , de modo que suas componentes se relacionam
por
Z 0 α1 α2 ...αm β1 β2 ...βn = (Λα1 σ1 Λα2 σ2 · · · Λαm σm )(Λ̄τ1 β1 Λ̄τ2 β2 · · · Λ̄τn βn )Z σ1 σ2 ...σm τ1 τ2 ...τn ,
(12.55)
perante uma mudança de coordenadas dada pela Eq. (12.49). Este tensor é dito de
ordem (m, n), ou m vezes contravariante e n vezes covariante. Quando a diferença
entre o caráter de contravariância e de covariância não for importante para o contexto,
o tensor Z acima é dito de ordem m + n. Assim, por exemplo, dirı́amos que o tensor
P construı́do explicitamente acima apresenta ordem (1, 1), ou simplesmente que é um
tensor de ordem 2. Em particular, as matrizes de Lorentz Λ e Λ̄ são, ambas, tensores
de ordem (1, 1). Tensores de ordem superior a 2 não são freqüentes na Relatividade
Especial, mas um tensor de ordem (1, 3) é fundamental na descrição geométrica da
interação gravitacional pela Teoria da Relatividade Geral (o tensor de curvatura de
Riemann, conforme o Cap. 1).
A estrutura fundamental do espaço-tempo de Minkowski, apresentado na Sec. 12.7.2,

pode ser expressa de forma simples em termos da noção de tensor no espaço-tempo.
Considere o tensor g de ordem (0, 2), dado em coordenadas (x0 , x1 , x2 , x3 ) de um
449
referencial inercial por
 
1 0 0 0
 0 −1 0 0 
gµν =  . (12.56)
 
 0 0 −1 0 
0 0 0 −1
Com o auxı́lio do tensor g, o intervalo invariante ds2AB entre dois eventos A e B —
dado pela Eq. (12.42) da Sec. 12.7.2 — pode ser expresso na forma
ds2AB = gµν dxµAB dxνAB , (12.57)
ou meramente ds2 = gµν dxµ dxν . O caráter de invariância do intervalo ds2 decorre
imediatamente da forma como a Eq. (12.57) foi escrita, pois corresponde a uma con-
tração (soma implı́cita de Einstein) do tensor g de ordem (0, 2) com dois tensores dx
de ordem (1, 0), de modo que não resta nunhum ı́ndice livre nesta relação. O tensor g
da Eq. (12.56) é denominado “tensor métrico”, ou métrica, do espaço-tempo, pois es-
tabelece uma generalização ao espaço-tempo do Teorema de Pitágoras ds2 = Iij dxi dxj
tridimensional. Esta última observação mostra que a própria noção de tensor definida
acima também admite uma generalização. Com efeito, os tensores caracterizados pela
Eq. (12.55) fazem explı́cita menção à lei de Lorentz (ou de Poincaré) de transformação
de coordenadas do espaço-tempo. Poderı́amos, alternativamente, ter privilegiado uma
outra lei de transformação de coordenadas, ou mesmo utilizar coordenadas num espaço
vetorial distinto do espaço-tempo (como no caso do espaço tridimensional), de modo a
construir uma noção diferente de tensor. Assim, o termo tensor carrega, implicita ou
explicitamente, uma particular lei de transformação de coordenadas assumida como
fundamental. Por vezes, designam-se num mesmo contexto os tensores quadridimen-
sionais do espaço-tempo (transformação de Lorentz) e os tensores tridimensionais es-
paciais (transformação de coordenadas espaciais de Galileu).
As Eqs. (12.5) da eletrodinâmica de Maxwell apresentadas na Sec. 12.2.3 admitem uma
formulação compacta na linguagem tensorial. Definem-se os dois seguintes tensores [10]
de ordem (2, 0):
 
0 −Ex −Ey −Ez
µν
 E
 x 0 −Bz By 
F =  (12.58)


 Ey Bz 0 −Bx 
Ez −By Bx 0
 
0 −Dx −Dy −Dz
µν
 Dx 0 −Hz Hy 
P =  , (12.59)
 
 Dy Hz 0 −Hx 
Dz −Hy Hx 0
~ = εE
onde D ~ eH
~ = B/µ
~ são os vetores de indução eletromagnética (no vácuo, ε = εo
e µ = µo ). As Equações de Maxwell tomam, então, a forma
∂ µν
F = 0 (12.60)
∂xν
450
∂ µν
P = J µ, (12.61)
∂xν
onde J µ = (ρ, Jx , Jy , Jz ) em termos da densidade volumétrica ρ de carga elétrica e da
densidade superficial J~ = (Jx , Jy , Jz ) de corrente elétrica.
12.10 Contribuições da fı́sica experimental

Apresentam-se nesta seção duas listagens sumárias (e não exaustivas) de alguns expe-
rimentos efetivamente levados a cabo. A primeira listagem descreve alguns métodos de
determinação experimental da velocidade da luz no vácuo, sendo os resultados obtidos
todos compatı́veis com o valor teórico c = 2.997 · 108 m/s previsto por Maxwell [2]. A
segunda listagem relata alguns experimentos cujos resultados encontram-se em acordo
com a Teoria da Relatividade Especial [4], e em desacordo com a Fı́sica Newtoniana [3].
Um breve comentário sobre cada experimento apresentado permite ao estudante esti-
mar a forma de sua execução, bem como avaliar o seu significado contextual histórico
no desenvolvimento da assim denominada fı́sica moderna [8].
• Determinação experimental da velocidade da luz no vácuo
Perı́odo de satélites dos planetas exteriores O perı́odo de translação, em torno

de Júpiter, de sua lua mais próxima denominada Io, apresenta comportamento
variável conforme a distância da Terra ao planeta. A diferença observada corres-
ponde ao tempo de trânsito da luz ao percorrer o diâmetro da órbita da Terra
em torno do Sol.
Aberração óptica A observação astronômica de corpos distantes requer o apon-
tamento do telescópio segundo um ângulo ligeiramente distinto da posição do
astro, devido ao movimento da Terra, para evitar que sua luz atinja as paredes
do equipamento (tal como um guarda-chuva deve ser mantido algo à frente do
corpo de alguém que anda rápido sob a chuva sem vento).
Roda dentada Um feixe luminoso passa entre os dentes de uma roda dentada em
rápida rotação na ida e retorno de uma longa trajetória. O tempo de percurso
deve corresponder ao tempo de giro pelo ângulo de um dos dentes.
Cavidade ressonante A medida da freqüência de ressonância para um dado número
de metades de comprimento de onda de radiação luminosa contidos numa cavi-
dade material com paredes internas refletoras permite determinar a velocidade
(de fase) da luz, dada por c = λ ν.
• Testes experimentais da Teoria da Relatividade Especial
Interferômetro de Michelson-Morley Um feixe luminoso coerente (laser) é sepa-

rado em dois raios que percorrem trajetórias ortogonais, sendo a seguir recombi-
nado, de modo a produzir franjas de interferência. A hipótese do éter luminı́fero
451
prevê para a luz velocidades diferentes nos braços do interferômetro, produzindo
um deslocamento nas franjas de interferência ao longo do tempo. Este desloca-
mento de franjas previsto não foi observado.
Decaimento de partı́culas A vida-média de múons (partı́cula semelhante ao
elétron, porém mais pesada) produzidos em laboratório é menor do que seria
necessário classicamente para permitir a observação no solo de múons produzi-
dos na alta atmosfera, provenientes de raios cósmicos. A relatividade explica a
observação dos múons ou pela dilatação do tempo ou pela contração do compri-
mento.
Acelerador linear Embora sujeitas a elevadas forças de aceleração, as partı́culas
elementares massivas observadas nos aceleradores adquirem velocidades limitadas
superiormente pela velocidade da luz no vácuo, em acordo com a energia cinética
relativı́stica.
Acelerador sı́ncrotron Partı́culas carregadas podem ser aceleradas em anéis circu-
lares pela ação de campos eletromagnéticos oscilantes. A freqüência de oscilação
adequada ao efeito é dada pela lei de Lorentz.
Pulsos de radar A distância média da Terra à Lua é conhecida com grande pre-
cisão por medidas de radar, e suas variações são descritas pelo efeito Doppler
relativı́stico.

[1] René Descartes, “The geometry of René Descartes” [1637] (Dover, New York,
1954).
[2] James Clerk Maxwell, “A treatise on electricity and magnetism” [1873] (Dover,
New York, 1954) [baseado na 3ª edição (Clarendon, Oxford, 1891)].
[3] Isaac Newton, “Philosophiæ naturalis principia mathematica” [1686], 2ª edição da
tradução para o português (EdUSP, São Paulo, 2002).
[4] Albert Einstein, “A teoria da relatividade especial e geral” [1916] (Contraponto,
Rio de Janeiro, 1999).
[5] Hans Reichenbach, “From Copernicus to Einstein” [1927] (Dover, New York, 1980)
[baseado na 1ª edição corrigida (Phylosophical Library, 1942)].
[6] Henri Poincaré, “O valor da ciência” [1905] (Contraponto, Rio de Janeiro, 1995).
[7] Charles Kittel, Walter D. Knight, e Malvin A. Ruderman, “Berkeley physics course
Vol. 1. Mechanics” (McGraw-Hill, New York, 1965).
[8] Marcelo Alonso e Edward J. Finn, “Fı́sica: um curso universitário Vol. I.
Mecânica”, 2ª edição (Edgard Blücher, São Paulo, 1972).
452
[9] John David Jackson, “Classical electrodynamics”, 3ª edição (John Wiley & Sons,
New York, 1999).
[10] Lev D. Landau & Eugene M. Lifshitz, “Elettrodinamica dei mezzi continui” (Ri-
uniti, Roma, 1986) [Coleção de Fı́sica Teórica v. 8].
[11] Jan Arnoldus Schouten, “Tensor analysis for physicists” (Dover, New York, 1989)
[baseado na 2ª edição (Clarendon, Oxford, 1954)].
[12] “Scientific American Brasil”, edição especial, ano 3, nº 29 (Duetto, São Paulo,
outubro de 2004).
[13] “Galileu” nº 161 (Globo, Rio de Janeiro, dezembro de 2004).
[14] Ronaldo Rodrigues da Silva, “The trace formulas yield the inverse metric for-
mula”, Journal of Mathematical Physics, vol. 39 (N. 11), pag. 6206-6213 (1998).
453
12.12 Exercı́cios
1. Demonstre que, no espaço vazio e na ausência de densidades de carga e corrente

~ bem
elétricas, as Eqs. (12.5) implicam que cada componente do campo elétrico E,
como cada componente do campo magnético B, ~ satisfaz a Eq. (12.6) da onda no
~ = ∇(
espaço. [Pode ser útil a seguinte identidade vetorial: ∇2 A ~ ∇~ ·A~)−∇ ~ ×
~ ×A
(∇ ~ ).]
2. Verifique que os dois postulados de Einstein (Seção 12.3.1) são incompatı́veis com
a idéia Newtoniana de que todos os referenciais inerciais determinam o mesmo
intervalo de tempo entre dois dados eventos.
3. A sincronização de relógios apresentada na Sec. 12.3.2 baseia-se no postulado de
invariância da velocidade da luz. Explique, com suas próprias palavras, porque
é desaconselhável o método de simplesmente acionar cada um dos relógios na
origem, simultaneamente, evitando as ambigüidades, e somente então transportá-
los para suas correspondentes posições fixas no referencial.
4. Considere em repouso um bastão de comprimento `, inclinado no plano xy se-
gundo um ângulo θ com o eixo horizontal Ox, conforme determinado por um
referencial inercial O. Seja O0 um referencial inercial em movimento na direção
Ox com velocidade v, segundo as medidas do referencial O. Determine o compri-
mento e a orientação espacial do bastão, segundo as medidas efetuadas pelo
p
referencial O0 . [Solução: `0 = ` 1 + (γ v cos θ/c)2 e tan θ0 = tan θ/γ, onde
γ = (1 − v 2 /c2 )−1/2 .]
5. A lei inversa de transformação de coordenadas de Lorentz, Eq. (12.13), foi obtida
no texto por simetria com respeito à velocidade relativa entre os referenciais.
Mostre, por substituição direta, que as Eqs. (12.13) são inversas das Eqs. (12.12),
ignorando as constantes (to , xo , yo , zo ) e (t0o , x0o , yo0 , zo0 ).
6. Repita o exercı́cio 5 acima para as leis de transformação de velocidade e de
aceleração entre referenciais inerciais. Isto é, mostre por substituição direta que
as Eqs. (12.15) são inversas das Eqs. (12.14), e que as Eqs. (12.17) são inversas
das Eqs. (12.16).
7. Obtenha as expressões (12.20) da Sec. 12.5.2 para o efeito Doppler longitudinal
de ondas de campo, a partir das Eqs. (12.18)–(12.19). [Sugestão: use a relação
p p
1 − (v 0 /c)2 (1 − uvx /c2 ) = [1 − (u/c)2 ][1 − (v/c)2 ], onde v e v 0 são os módulos
das velocidades de uma mesma partı́cula relativamente aos observadores O e O0
que se movem ao longo do eixo Ox com velocidade relativa u.]
8. Obtenha as expressões (12.21) da Sec. 12.5.2 para o efeito Doppler transversal de
ondas mecânicas, a partir da construção de eventos de emissão e detecção dessas
ondas e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
9. Obtenha as Eqs. (12.22) da Sec. 12.5.2 para o efeito Doppler transversal de ondas
454
de campo, a partir da construção de eventos de emissão e detecção dessas ondas
e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
10. Um dado semáforo de trânsito encontra-se brilhando com sua luz vermelha. Deter-
mine o estado de movimento de um condutor de veı́culo automotor com respeito
ao semáforo para que esse brilho lhe pareça verde.
11. Deduza a Eq. (12.30) da Sec. 12.6.2, que descreve a relação invariante existente
entre a energia total E de um sistema mecânico de massa m e seu momentum
relativı́stico P~ .
12. Generalize a lei de Lorentz de transformação de coordenadas do espaço-tempo,
Eqs. (12.32) da Sec. 12.7.1, para o caso de um movimento relativo de referenciais
com velocidade Newtoniana adimensional β~ numa direção arbitrária. [Solução:
x0 0 = γ(x0 − β~ ·~x) e ~x0 = ~x + (γ − 1)(β~ ·~x)β/(
~ β~ · β)
~ − γ βx
~ 0 , onde ~x ≡ (x1 , x2 , x3 ).]
13. Verifique que a lei de transformação da velocidade relativı́stica Eqs. (12.36) da
Sec. 12.7.1 determina velocidades tridimensionais compatı́veis com a lei de trans-
formação da velocidade Newtoniana Eqs. (12.14) da Sec. 12.5.1.
14. Considere o problema de lançamento de um projétil a partir do solo, com veloci-
dade Newtoniana ~u segundo um ângulo θ com o plano horizontal. Admitindo
que um referencial inercial O fixo ao solo verifique ser correta a cinemática
Newtoniana para esse projétil (que fornece a trajetória parabólica usual), de-
termine as componentes dos vetores velocidade V~ e aceleração A ~ relativı́sticas do
projétil ao longo de sua trajetória. [Solução: V~ = (γ/c)(c, v cos θ, v sen θ − g t, 0)
eA~ = (γ 2 g/c3 ){γ(g t − v cos θ)V~ − (0, 0, c, 0)}, com 0 ≤ t ≤ 2 v sen θ/g, onde
√ p
v = ~u · ~u e γ = 1/ 1 − (v/c)2 .]
15. Utilizando o resultado do Exercı́cio 11 acima, obtenha as Eqs. (12.40) da Sec.
12.7.1.
16. Considere dois eventos A e B infinitesimalmente próximos, descritos em termos
de um referencial O por A = (x0 , x1 , x2 , x3 ) e B = (x0 + dx0AB , x1 + dx1AB , x2 +
dx2AB , x3 + dx3AB ). Seja O0 um referencial relacionado a O pelas transformações
de Lorentz Eqs. (12.12). Desprezando diferenciais de ordem superior, mostre que
o elemento de intervalo no espaço-tempo definido pela Eq. (12.42) é invariante.
Isto é, mostre que
(dx0AB ) − [(dx0AB
0 2
) + (dx0AB
1 2
) + (dx0AB
2 2 3 2
) ] = (dx0 )2 − [(dx1 )2 + (dx2 )2 + (dx3 )2 ].
17. Considerando a Fig. 12.8 da Sec. 12.7.3, que apresenta como o observador O
descreve os eixos coordenados do observador O0 , esboce o diagrama de espaço-
tempo recı́proco, que ilustra a forma como o observador O0 descreve os eixos
coordenados do observador O.
18. Obtenha a expressão α = ln[γ(1 + β)] para o ângulo α de rotação hiperbólica no
espaço-tempo devido a uma mudança de coordenadas dadas pelas Eqs. (12.32)
de Lorentz. [Sugestão: tanh α = senh α/ cosh α = (e2α − 1)/(e2α + 1).]
455
Capı́tulo 13
Panorama Breve da Cosmologia

Contemporânea
Luiz Alberto Oliveira1
13.1 Introdução: A Cosmologia e seus Objetivos
PARAGRAFOS!!
A Cosmologia cientı́fica é uma ciência fı́sica que objetiva descrever a gênese, a con-
stituição e o desenvolvimento da totalidade organizada dos eventos fı́sicos, denomi-
nada de Cosmos, que identificamos ao Universo astronômico enquanto expressão mais
abrangente da realidade natural. Ademais das leis fı́sicas conhecidas em laboratório, a
moderna Cosmologia possui como suporte observacional as evidências produzida pela
Astronomia profunda e, como quadro conceitual de fundo, a Teoria da Relatividade
Geral (TRG), que permite caracterizar o cenário global (o contı́nuo espaço-tempo)
onde sucederiam os processos fı́sicos relevantes em escala cósmica.
Dois planos de análise - o primeiro compreendendo uma apreciação do território

epistêmico em que se fundamentam os princı́pios e concepções básicas que informam o
programa da Cosmologia Relativı́stica moderna desde seu estabelecimento como dis-
ciplina cientı́fica, no primeiro quarto do Sec. XX; o segundo, um resumo histórico das
diferentes abordagens propostas para tratar os problemas cosmológicos, suas vicissi-
tudes, sucessos e impasses - permitem definir os traços gerais da cosmovisão corrente-
mente aceita e indicar suas perspectivas de transformação.
1
456
13.2 Os Antecedentes
Iniciemos nossa exploração indagando pela origem da imagem comum, habitual, que
temos sobre o Cosmos. Há diversos conceitos básicos que precisamos conhecer para
compreender o mundo natural e, em particular, descrever as caracterı́sticas do Uni-
verso, como espaço, tempo, corpo, causa, luz, dentre outros. Vamos, então, empreen-
der uma genealogia, uma análise histórico-genética desses conceitos, principiando pelos
mais básicos, que são as noções de espaço e de tempo. Para este fim vamos narrar uma
série de episódios que, em linhas gerais, nos fornecerão um entendimento suficiente
sobre os antecedentes da atual visão cientı́fica sobre o Cosmos.
Espaço e Tempo da Sensibilidade:
Nossa narrativa começa com um experimento que hoje é clássico, realizado por Mat-
urana e outros nos anos 50. Eletrodos foram fixados nos nervos ópticos de uma rã, na
tentativa de identificar as formas de objetos que os excitariam. Os resultados foram
surpreendentes: a rã reagia a dois padrões de movimento somente, o de um pequeno
objeto esvoaçando horizontalmente (o ”padrão-inseto”, do qual a rã tendia a se aprox-
imar) e o de uma grande sombra pairando ao alto (o ”padrão-cegonha”, do qual a rã
procurava se afastar). Ora, rãs comem insetos, e cegonhas comem rãs; os comporta-
mentos de ataque e fuga são perfeitamente compreensı́veis. O singular é que entre a
apresentação dos padrões a rã não processava quaisquer estı́mulos visuais - como se o
mundo simplesmente desaparecesse. Ela sequer podia distinguir se uma mosca única
foi e voltou ou se duas moscas distintas passaram sucessivamente - dois padrões-mosca
sucederam, é tudo. O Universo da rã é descontı́nuo, sua ’cosmologia’ é ’estroboscópica’:
não existem objetos perduráveis no mundo da rã. A pergunta então é: como surgiram
os objetos?
Para procurar uma resposta, devemos recorrer à Paleoneurologia, a ciência da evolução
dos sistemas nervosos. Nossa história remonta assim a cerca de 65 milhões de anos
atrás, quando um acidente cósmico - o choque de um grande asteróide com a Terra
- provocou mudanças profundas nas condições ambientais do planeta e determinou
a extinção do gênero então dominante - os dinossauros. Foi a partir desta catástrofe
(coincidente, além disso, com a erupção de grandes vulcões e o possı́vel alastramento
de epidemias de vı́rus) que os mamı́feros, até então circunscritos a nichos ecológicos
especı́ficos, encontraram campo livre para expandir-se e aceleraram sua evolução. Em
particular, um fato decisivo transcorreu: com o abandono dos hábitos noturnos em fa-
vor da atividade diurna agora possı́vel, a visão dos mamı́feros, acostumada às condições
da noite, teve de adaptar-se à clareza do dia. A flexibilização dos centros cerebrais da
visão, requerida para tal tarefa, permitiu que o sistema perceptivo dos mamı́feros
adquirisse uma capacidade notável, que podemos chamar de sı́ntese dos sentidos de
longo alcance, ou seja, seus cérebros passaram a integrar os estı́mulos recebidos pela
visão, pelo olfato e pela audição num mapa unificado - operação extremamente sofisti-
cada, uma vez que os sinais visuais, olfativos e sonoros são de natureza muito distinta.
457
Esta sı́ntese permitiu que os objetos percebidos ganhassem identidade e estabilidade,
ainda que estivessem em movimento ou que o observador mudasse seu ponto de vista (é
por isso que ao caminharmos em volta de uma árvore, digamos, ela continua a mesma,
embora os estı́mulos que recebemos dela estejam variando continuamente!). Em con-
seqüência, o mundo dos mamı́feros ganhou continuidade e passou a ser constituı́do
por objetos duráveis. Esta objetificação do mundo foi o nascimento do Tempo e do
Espaço da Sensibilidade, o quadro biológico de fundo a partir do qual apreendemos a
realidade e nos situamos nela.
Espaço e Tempo Simbólicos:
Nossa próxima etapa também está associada a uma variação climática: há cerca de 5
milhões de anos, na África, grandes regiões de densas florestas tropicais foram pouco
a pouco se transformando em savanas de vegetação baixa. Privados do ambiente mul-
tidimensional da floresta fechada, alguns primatas que aı́ viviam adaptaram-se às
novas condições assumindo uma postura ereta (ou seja, verticalizando a coluna verte-
bral). Esta mudança aparentemente tão simples teve imensas consequências. As patas
dianteiras puderam ser liberadas da função exclusiva de locomoção; a progressiva
oposição do polegar aos outros dedos (permitindo pinçar os objetos) combinada a um
delicado alinhamento do olhar com o movimento dos punhos (garantindo a precisão
dos gestos) acabou por transformar as patas em mãos. Assim, esses primatas cam-
inhantes - nossos ancestrais - se tornaram animais técnicos, e conseguiram, há um
milhão de anos, o extraordinário feito de adquirir controle sobre um processo: o fogo.
As mãos passaram a levar o alimento à boca; liberada da função de agarrar a presa, a
mandı́bula pôde suavizar-se e diminuir de tamanho, facilitando a emissão de sons (e
o aumento concomitante da capacidade craniana). A maneira mais ’econômica’ de se
produzir todo este conjunto de alterações morfológicas é atrasar a maturação dos fetos
- processo a que os paleoantropólogos chamam de neotenia. Os bebês proto-humanos,
assim, passaram a nascer cada vez mais ’inacabados’, ou seja, sua maturação com-
pleta começou a ocorrer depois de nascidos. O desenvolvimento retardado reduz a
influência dos padrões de comportamento inatos e aumenta a capacidade (graças aos
cérebros aumentados e complexificados) de se aprender padrões; progressivamente, a
transmissão de comportamentos torna-se cada vez mais importante.
Ora, estes bebês neotênicos são, durante um longo perı́odo, relativamente incapazes, e
requerem por isso cuidados intensivos por parte do grupo. A simples sobrevivência da
espécie exigiu então uma forte coesão da coletividade, uma socialização integradora,
para que os cuidados com os infantes pudessem ser ministrados. A inovação revolu-
cionária que fomentou o fortalecimento dos laços sociais foi uma nova forma de co-
municação, apoiada na facilidade de emitir sons. A voz converteu-se assim em um
novo suporte de registro em que o significado dos gestos e posturas (de alerta, de
afeto, etc) empregados pelo grupo foi traduzido em palavras. O surgimento da fala:
talvez o acontecimento mais decisivo da história de nossa espécie. Ao comunicar-se
458
entre si, esses animais falantes produziram uma tecnologia prodigiosa, uma memória
compartilhada, fora do corpo dos indivı́duos. Pela simbolização, a codificação de sinais
substituindo coisas ou ações, o repertório de experiências e conhecimentos de todo o
grupo podia agora ser continuamente acumulado e transmitido às novas gerações. À
medida que os ciclos naturais - os perı́odos de migração de manadas e as estações do
ano, por exemplo - foram sendo recordados e correlacionados, os registros de fatos já
vividos transformaram-se em expectativas, e daı́ em previsões; rebatida sobre o fu-
turo, a memória se converte em antecipação, possibilitando a nossos ancestrais operar
com uma dimensão sem precedentes, que nenhum outro animal parece apreender: o
amanhã. Este foi o nascimento do Tempo e do Espaço Simbólicos, o quadro coletivo
de fundo a partir do qual concebemos a realidade e atuamos nela.
Ciclos e Simetrias:
A observação de que a natureza é rica em regularidades - isto é, fenômenos rı́tmicos

ou periódicos - foi um dos sinais inequı́vocos do desenvolvimento da inteligência no
homem, e suas evidências arqueológicas remontam a dezenas de milhares de anos.
Não admira que a imagem mais arcaica do tempo de que podemos dispor, segundo os
historiadores das idéias, seja a do ciclo. Desde as eras mais remotas, inúmeros povos
compartilharam a convicção de que a Natureza se organizaria ritmicamente, sendo
a conjugação dos diversos ritmos naturais a própria expressão da ordem cósmica ou
divina vigente. Por exemplo, nas mitologias de praticamente todas as culturas hu-
manas encontramos a associação de eventos primordiais (relatos da Origem, episódios
fundadores, feitos heróicos) com a disposição de constelações no céu. Tão generalizada
parece ter sido a prática humana de codificar acontecimentos modelares por meio de
uma simbologia celeste - ou estelar - que Giorgio de Santillana arrisca-se a afirmar,
invertendo os termos da equação habitual, que a observação ’cientı́fica’ precederia a
enunciação ’mı́tica’, e resume esta opinião numa fórmula atrevidamente atraente: ’O
Homem é o animal que olha para o céu’.
Não há controvérsias, todavia, acerca do papel verdadeiramente capital desempenhado

na história do conhecimento cientı́fico pelo longo (e possivelmente árduo) processo de
registro de correlações entre os ritmos que regulam os fenômenos naturais - biológicos,
climáticos, sazonais - terrestres e a repetição de configurações dos astros. Neste sentido,
a Astronomia seria indubitavelmente a ”primeira” das ciências, e a elaboração de
calendários - tabelas que exprimem associações entre ciclos da natureza e ciclos celestes
- a ”primeira” das tecnologias. Ao seu estabelecimento se deve o triunfo da revolução
agrı́cola do Neolı́tico e a conseqüente aparição e prosperidade das grandes civilizações
antigas, cujas mitologias e cosmogonias costumavam conceber o Tempo exatamente
como a repetição cı́clica dos acontecimentos.
Os Gregos, a quem se costuma atribuir a gênese do sistema de pensamento que virá

a ser chamado de Ocidente, ofereceram uma contribuição inteiramente original para a
representação da Natureza ao lançarem mão de imagens geométricas como sı́mbolos,
459
metáforas para figurar os seres e os acontecimentos do mundo natural e, em particular,
para a descrição da relação entre o Céu e a Terra. Se considerarmos a história das
culturas, encontraremos uma variedade de formas para esta relação: os egı́pcios, por
exemplo, figuravam o céu como uma mulher que abraça seu enamorado, o mundo; os
navajos norte-americanos falavam da grande serpente do céu, cuja troca periódica de
escamas correspondia ao ciclo das estações, e assim por diante, na Índia, em Babilônia,
etc. Essas alegorias de ı́ndole animista não deveriam nos admirar; surpreendente, na
verdade, é a concepção abstrata, de caráter artificial, que graças à inspiração de Tales
de Mileto e de Pitágoras de Samos os Gregos da época clássica produziram, ao tomarem
como sı́mbolo de perfeição, ordem e equilı́brio uma figura geométrica maximalmente
simétrica, a esfera, e afirmarem que o Todo se assemelharia a uma seqüência de cascas
esféricas concêntricas, encaixadas umas nas outras. Esta imagem de uma totalidade
grandiosamente arredondada, que surge já em traços bem acabados no Timeu de
Platão, foi denominada de Cosmos, significando Todo-Ordenado ou Todo-Belo, pois
para estes Gregos as noções de simetria e ordem vinculavam-se à de beleza (em grego,
kosmé, raiz também de cosmético). Uma totalidade em que cada parte tem o seu lugar
definido em função de um princı́pio ideal de proporções harmoniosas: não seria absurdo
afirmar que a apreensão dessa Harmonia constituiu o objetivo último da Ciência grega.
Era uma concepção de mundo que ninguém havia imaginado antes, e que irá dominar
a imaginação dos homens por quase 20 séculos.
O Cosmos de Dante:
Assim, o céu foi convertido em uma abóbada, uma cúpula esférica, e o tempo cı́clico
recebeu uma metáfora inesquecı́vel: o cı́rculo. Tal como os astros se moveriam em
órbitas esféricas porque perfeitas, o Tempo, que Platão chama de ”imagem móvel
da eternidade”, exibiria a forma irretocável da circularidade. Aristóteles manterá
a esfericidade essencial do Cosmos e denominará o Tempo de ”medida do movi-
mento”, recusando-lhe autonomia mas confirmando sua reiteração circular. O tempo
aristotélico continuará a ter como modelo o ciclo, uma vez que os movimentos ce-
lestes perfeitos são cı́clicos; eventualmente, esses ciclos se completarão numa espécie
de grande ano cósmico. No século II da Era Comum, no cadinho de culturas e tradições
ocidentais e orientais que era Alexandria, esta concepção cosmológica qualitativa, ge-
ometricamente inspirada, advinda da filosofia helênica encontrou-se com a astronomia
observacional muito precisa dos Babilônios e, em particular, com a aritmética de base
sexagesimal (muitı́ssimo mais manejável que a dos Gregos) que estes empregavam.
Desta mescla entre esquema geométrico, medições detalhadas e agilidade de cálculo
resultou uma das grandes obras do pensamento Antigo, o Almagesto (”O Grande
Tratado”) de Ptolomeu. Primeiro modelo descritivo e preditivo da Fı́sica Matemática,
o Cosmos de Ptolomeu permitia representar quantitativamente os movimentos dos
astros errantes (suas ”revoluções”) através da concatenação de sucessivas rotações (os
”epiciclos”, assentados sobre cı́rculos básicos ou ”eferentes”), cuja resultante podia
ser projetada como uma linha (a ”trajetória”) numa carta ou planisfério. Gerações de
460
astrônomos aperfeiçoaram este arranjo de ciclos e epiciclos, complicando-o cada vez
mais; o esforço de Copérnico, no sec XVI, não visava senão simplificar essa barafunda
de esferas engrenadas em esferas - mas acabou, como veremos, por assinalar uma
mudança da própria civilização.
O Ocidente, porém, foi poderosamente marcado por uma outra concepção de espaço
e de tempo, igualmente original, mas inteiramente diversa da dos Gregos: a de que o
mundo (e portanto o tempo) teve um começo (e terá um fim). Atribuı́da a Zoroastro,
o profeta persa, e imensamente difundida pela Bı́blia judaico-cristã, esta doutrina
extraordinária afirma que há acontecimentos singulares que nunca se repetiram nem
se repetirão (a Gênese, a Crucificação, o Apocalipse), sendo o tempo demarcado por
estes eventos únicos. O Genesis, de fato, consiste de uma exposição temporalizada
da criação em que o espaço está quase ausente, e é decididamente secundário (sua
principal representação é o Tabernáculo, cuja estrutura remete diretamente à de uma
tenda quadrangular, montada sobre as areias do deserto). Jorge Luı́s Borges, em uma
página memorável de História da Eternidade, registra sua perplexidade perante esta
figura do tempo, pois se a essência do tempo é haver um antes sucedido por um depois,
o que dizer de um instante que não teria precedentes, que não seria a sucessão de um
instante anterior? (Kant chegará a reconhecer nesta borda absurda do tempo uma
antinomia, isto é, uma contradição intrı́nseca, da própria Razão.) Mas se os Gregos
encarnavam a repetição periódica na metáfora do cı́rculo, a figura bı́blico-zoroastriana
do tempo corresponderia a uma outra entidade geométrica: um segmento de reta,
confinado por extremidades abertas (e inconcebı́veis). Como é evidente, estas dı́ades
de imagens do espaço e do tempo, o Céu esferóide e a repetição perpétua, o Céu
poliédrico e a duração finita, são rigorosamente dı́spares, e para compatibilizá-las o
Ocidente teve que aguardar a obra de dois santos, Agostinho e Tomás de Aquino. A
concepção de Todo vigente na Idade Média européia - o magnı́fico Cosmos de Dante
- resultou deste autêntico milagre de conciliação de incompossı́veis.
De fato, recebemos desse grandı́ssimo pensador medieval a figura de um cosmos organi-
camente estruturado, demarcado por noções bem-definidas de duração e eternidade, e
de limite e infinidade. Vejamos o modelo espaciotemporal que Dante nos oferece: trata-
se antes de tudo da associação entre dois reinos ou domı́nios distintos, o material e o
espiritual. A geografia, ou mais exatamente, a cosmografia que Dante nos apresenta
articula-se com a imagem nuclear da cosmovisão medieval, a Grande Cadeia dos Seres,
segundo a qual todo e qualquer acontecimento subordina-se a uma ordem cósmica
global. Neste mundo organicamente estruturado, nenhum evento pode suceder num
local qualquer que não seja um reflexo dessa ordem cósmica - e que não se reflita nela
(por isso o terror dos cometas e dos meteoros, daquilo que surge inesperadamente no
céu e quebra a boa ordem da natureza, resultando invariavelmente em catástrofes para
reinos e pessoas). Essa subordinação do local ao global, consubstanciada na Grande
Cadeia dos Seres, é coetânea à imagem de um mundo cerrado, fechado sobre si, hi-
erarquizado formalmente. Com efeito, a forma de cada ser prescreve seu lugar numa
461
hierarquia vertical: há a profundidade infernal, a superfı́cie da Terra - onde ressalta
o monte do Purgatório - em seguida a sucessão de cascas cristalinas concêntricas (as
órbitas) em que estão engastados os astros errantes ou planetas (inclusive o Sol e a
Lua), culminando na abóbada das estrelas fixas. Envolvendo esse mundo fı́sico finito,
tão reminiscente do cosmos de Ptolomeu, encontra-se a derradeira expressão da cor-
poralidade, a camada denominada de Primum Mobile que recheia, se assim se pode
dizer, a separação entre os domı́nios fı́sico e espiritual e tem a função de realizar a
causa inicial (o ”Primeiro Motor”) dos movimentos requerido por Aristóteles. Para
além, estende-se indefinidamente o reino incorporal celeste, o Empı́reo, habitado pelas
almas bem-aventuradas e pelos querubins, anjos e arcanjos da tradição cristã.
Dois aspectos dessa composição de espaços são especialmente notáveis. Primeiramente,

a assimetria vertical que manifesta a ordem cósmica global imposta pela Grande
Cadeia dos Seres e que se vincula, no âmbito terrestre, com o peso (leve ou grave)
das coisas. Além disso, há a existência de um locus fı́sico privilegiado, o centro da
Terra, em relação ao qual distribuem-se as distâncias e coordenam-se os movimentos;
desta inomogeneidade do espaço fı́sico resulta que a Terra, que repousa neste ponto
focal, deve necessariamente ser imóvel. Daı́ também decorre a dupla natureza dos
movimentos dos corpos: circular, perpétua e perfeita, nas esferas supralunares em que
se encontram os astros; linear, efêmera e aberrante, na esfera sublunar em que agem
os homens. Em segundo lugar, podemos distinguir no cosmos Dantesco uma estrutura
hierarquizada de temporalidades que reflete a organização espacial esboçada acima:
duas eternidades - a dos bem-aventurados no Paraı́so acima, a dos condenados no
Inferno abaixo - circundam a brevidade da existência neste vale de lágrimas, em que
somos colocados durante um curto transcurso para que nossas almas sejam postas à
prova. Particularmente fascinante, porém, é a dupla função exercida pela contribuição
verdadeiramente original do Medievo à doutrina cristã tradicional, o Purgatório. De
fato, espacialmente trata-se de um monte que as almas devem ascender, aliviando-se
pouco a pouco da carga (o peso) dos pecados cometidos, de modo a alcançarem o
topo - onde se encontra o Jardim do Éden perdido - já purificadas da grosseira gravi-
dade corporal e prontas para ’saltarem’ para o Empı́reo; mas paralelamente trata-se
também de um dispositivo temporal de regressão, de uma ’máquina do tempo’ que
permite à alma retornar à pureza do estado de ser primordial, anterior à Queda. Em
resumo, dois espaços - o domı́nio espiritual envolvendo os reinos astral e terrestre,
correspondendo a uma eternidade duplicada - a paradisı́aca e a infernal - envolvendo
as duas durações (inversas) da vida e da purgação.
A passagem:
Esta magnı́fica imagem de um Cosmos a um só tempo orgânico e sublime sofrerá

um golpe demolidor no Renascimento. Precursores como Nicolau de Cusa e Gior-
dano Bruno, reformadores como Copérnico e Osiander, e revolucionários como Kepler,
Galileu e Descartes nos legaram uma nova concepção de Todo ao descentralizar e homo-
462
geneizar o Espaço, liberar o Tempo de sua sujeição ao movimento, e deslocar a noção
de Causa das coisas para o comportamento das coisas. Autêntica refundação do pen-
samento do Ocidente sobre o mundo natural, cujo eixo foi o destronamento da herança
aristotélica em favor de uma concepção platônica, suas principais caracterı́sticas estão
consubstanciadas na célebre sentença de Galileu, que os séculos seguintes não es-
quecerão: ”Deus escreveu o Livro da Natureza em linguagem matemática; trata-se
doravante, para o Entendimento, de decifrar essa linguagem”. A passagem decisiva se
dá com uma série de experimentos conjeturais - perfeitamente análogos aos Gedanken-
experimente (”experimentos conjeturais”) que Einstein tanto apreciava - que acabam
por fazer Galileu concluir que os corpos tendem a manter o movimento que neles foi
impresso, até que um outro agente intervenha obrigando sua alteração (o que é a
essência do Princı́pio de Inércia, que Descartes pouco depois irá formalizar, e Newton
adotará como fundamento da moderna Mecânica). Ora, isso torna possı́vel conceber
um movimento retilı́neo de extensão e duração indefinidas, ou seja, um corpo colo-
cado em movimento retilı́neo e uniforme poderia se mover continuamente, durante
um perı́odo em princı́pio arbitrariamente longo, até sofrer uma interrupção. A prin-
cipal conseqüência dessa idéia extraordinária é abolir a distinção de natureza entre
os mundos sub- e supra-lunar; em particular, inaugura-se a possibilidade de poderem
ocorrer movimentos perpétuos lineares, e não somente circulares: à repetição cı́clica
dos astros vêm agora se somar os movimentos inerciais indefinidamente duráveis. Mas
se um corpo se move interminavelmente em linha reta, então é necessário que o espaço
fı́sico tenha uma extensão correspondentemente interminável. Rompem-se as bordas
do mundo fechado de Dante, e entra em cena o Universo infinito que será a glória de
Newton.
Vemos bem o cataclismo de que advém a Modernidade: se o espaço fı́sico se prolonga

infindavelmente, então o espaço espiritual é empurrado para depois do infinito. Se
o território propriamente espiritual que era seu lugar natural torna-se infinitamente,
logo inconcebivelmente, distante, o único domı́nio que resta às almas humanas é nossa
interioridade; somente dentro de nós pôde subsistir ainda a separação absoluta entre
corpo e alma. Transformada por Descartes em distinção entre res cogitans e res ex-
tensa, entre sujeito e objeto, essa fissura perdurará como condição de possibilidade do
sujeito moderno. Por outro lado, um movimento infindavelmente prolongado requer
uma duração igualmente infindável, e assim a eternidade do Empı́reo (em sua dupla
versão de castigo ou ventura perpétuos) é analogamente deslocada por um novo tipo
de eternidade, a da duração infinita. Tudo o que resta ao mundo é o tempo da trans-
formação; a redenção alcançada ao cabo do Purgatório se converte na expectativa
de realização da essência humana pela História. A instalação do mito moderno por
excelência, o Progresso, acompanha assim a geometrização do espaço e do tempo que
marca a ruptura entre as duas eras.
O Mundo Fechado:
463
Examinemos em algum detalhe como sucedeu a passagem do Mundo Fechado medieval
para o Universo Infinito moderno, ao cabo do perı́odo revolucionário do Renascimento.
No âmbito concreto, material, do Cosmos medieval, ocorrem duas naturezas distintas:
o mundo sublunar, o domı́nio abaixo da orbis ou camada onde a Lua está inscrita,
correspondente aos acontecimentos que sucedem na Terra; e o mundo supralunar, o
mundo da perfeição celeste, associado ao extraordinário sistema de cascas esféricas
móveis que representam o céu. Há então dois modos de movimento, correspondentes
às duas instâncias da natureza: o modo natural, espontâneo, perpétuo e perfeito dos
astros, e o modo sempre imperfeito, sempre limitado, sempre causado externamente,
dos movimentos terrestres, chamados de ”aberrantes”, pois nunca são duradouros,
invariavelmente começam aqui e terminam ali, nem espontâneos, invariavelmente as
coisas são obrigadas ”de fora” a se deslocar. Na verdade, os movimentos sublunares são
concebidos, nesta cosmovisão aristotélica, como mudanças análogas ao envelhecimento:
tirar um corpo daqui e colocá-lo ali é submetê-lo a uma transformação, é realizar
uma modificação semelhante ao envelhecer. Observemos que o conceito fundamental
aqui é o de indivı́duo; assim, o lugar que um corpo ocupa é, primordialmente, um
atributo seu, enquanto entidade individualizada. O mundo material, assim, consiste
do conjunto de todos os indivı́duos, do que decorre a noção medieval do espaço fı́sico
como correspondendo ao conjunto dos lugares habitados pelos indivı́duos. Numa tal
concepção não há lugar para o vazio - se retiramos um corpo que está separando outros
dois, seu ”lugar” viaja com ele, e os corpos restantes terão de entrar em contato.
Disso então resulta um mundo pleno, um mundo inteiramente denso, em que o vazio
é impossı́vel.
Além disso, há Quatro Causas ou Princı́pios Primeiros que explicam o que são as
coisas ou indivı́duos, isto é, dão conta de sua origem, essência e razão de ser, que po-
dem ser ilustradas pela famosa imagem das etapas de criação de uma estátua por um
escultor, que Aristóteles nos legou e a posteridade não esqueceu. Há primeiramente a
causa material, uma base ou suporte, análoga a um bloco de mármore bruto sobre o
qual nenhuma forma foi ainda inscrita, mas que tem a potência de receber incontáveis
formas. A seguir, há a causa formal que corresponde a uma planta ou diagrama de
proporções concebido na mente do artesão, no qual estão definidos os limites que serão
impostos àquela matéria bruta. Há então a causa eficiente, identificada ao trabalho
concreto do escultor ao desbastar a pedra e imprimir-lhe os contornos da forma dese-
jada, e enfim a causa final que é a finalidade ou objetivo da estátua pronta, ou seja,
o uso a que se destina, cerimonial, estrutural, ornamental, etc. Em suma, as Quatro
Causas dizem o quê uma coisa é - a causa material, porquê é - a causa formal, como
é - a causa eficiente, para quê é - a causa final.
Ao ser aplicada ao problema da compreensão do movimento, a doutrina das Quatro
Causas vai nos apresentar um quadro sumamente curioso. Fundamentalmente, têm
importância primordial as causas formal (segundo a qual um corpo tende a cair para
o solo ou ascender para o primeiro céu) e final (segundo a qual recuperar o repouso é
464
a tendência de todo corpo que sofre um deslocamento). É a causa formal que vai fazer
um corpo massivo, pesado, tender a dirigir-se à superfı́cie da Terra; ou, ao contrário, se
tem natureza leviana, aérea, como o fogo, tender a dirigir-se à casca da Lua, ao céu. Já
a causa final será responsável pelo destino último do movimento, que é sua extinção,
ou seja, o repouso. Todo movimento é uma transformação, e todo ser resiste a esta
transformação; portanto, quando se desloca um corpo, colocando-o em movimento,
ele naturalmente busca fazer cessar esse movimento, e para isso dirige-se para o seu
lugar natural de repouso. Quando se toma um corpo pesado, como uma pedra, e a
largamos, o que se testemunha é que ela espontaneamente se dirige para o seu lugar
natural, a superfı́cie da Terra, e lá repousa em definitivo; sem uma nova interferência
externa, ela não mais vai se animar. É essa combinação entre as causas formal e final
que irá governar o comportamento dos corpos no domı́nio sublunar.
Trata-se de uma concepção de caráter formal-qualitativo, ou seja, não importam os
caracteres quantitativos dos movimentos: não importa de que altura foi largada a
pedra, basta saber que é da sua natureza dirigir-se à Terra e lá repousar. Há, por outro
lado, uma distinção essencial entre o movimento, que é uma transformação forçada,
e o repouso, que é o estado natural de todas as coisas. Consideremos o exemplo do
movimento balı́stico: tomemos uma pedra e a lancemos para cima e para adiante.
Vemos um percurso aparentemente paradoxal: a pedra inicialmente sobe, alcança
uma altura máxima, e depois começa a descair, até chegar ao solo e parar. Por quê
a pedra não cai diretamente no chão, assim que a soltamos da mão? Não seria essa
a sua tendência ’natural’ ? Para dar conta desse tipo de fenômeno, Aristóteles lança
mão da noção de perı́stase (’quase-imobilidade’). Ao soltarmos a pedra, ela desloca o
ar de seu lugar natural, comprimindo-o à frente e o rarefazendo atrás. Ora, o ar busca
retornar a seu estado natural de imobilidade, e assim trata de compensar o desarranjo
em que se encontra migrando da frente da pedra para trás, o que resulta em um
empurrão contı́nuo do ar sobre a pedra na direção do movimento. É a combinação
entre as tendências da pedra e do ar de retornar a seus devidos lugares naturais que
explicará - de maneira inteiramente consistente com os princı́pios causais adotados, e
conforme ao testemunho dos sentidos - as trajetórias balı́sticas.
Por outro lado, trata-se de um mundo finito, isto é, o espaço, o conjunto de lu-
gares habitados pelos indivı́duos, é necessariamente finito. Por quê? De acordo com
o princı́pio da causa formal, quando um corpo é afastado do seu lugar natural de
repouso espontâneo, ele tem avidez de retornar a esse lugar, de recuperar a natural-
idade do repouso. Sabemos que de quanto mais alto for largada uma pedra, maior
será sua velocidade ao precipitar-se de volta ao chão, porque maior será sua avidez
de recuperar seu lugar natural (isto nos faria crer, por exemplo, que uma bala acel-
era ao deixar a arma...). Em resumo, quanto mais distante estiver um corpo de seu
lugar natural, maior será sua avidez em recuperá-lo. Ora, se houvesse um corpo a
uma distância infinita da Terra, ele buscaria a Terra com uma velocidade infinita -
e nós não vemos corpos passarem por nós com velocidades infinitas; logo, não há
465
corpos situados a uma distância infinita, e portanto o mundo é finito e fechado, o
espaço é cerrado. Não obstante o rigor lógico desse raciocı́nio, a finitude do Cosmos
vai colocar interessantı́ssimos problemas para os medievais; por exemplo, é possı́vel
a um anjo colocar o braço para além da última das esferas? Se o anjo puder fazer
isto, lugar, ou seja, espaço, estará sendo criado, o que é em princı́pio uma violação
da ordem cósmica preestabelecida desde o momento singular - e supostamente único
- da criação. Por outro lado, se o anjo não puder estender o braço para fora da última
esfera, então mesmo a onipotência da divindade terá limites; a vontade do anjo terá de
estar submetida à sua razão, Deus terá de ser racional antes de ser voluntarioso. Este e
outros problemas ditos ”bizantinos” - quantos anjos cabem na cabeça de um alfinete,
como fazer um camelo passar pelo buraco de uma agulha - costumam hoje em dia ser
ridicularizados, mas na verdade constituı́ram esforços profundos de investigação lógica
acerca da natureza do espaço.
Essa concepção das causas do movimento vai estar intimamente associada a uma noção
correlata acerca do tempo como um conceito derivado, dependente do conceito de
movimento: é porque há movimento que há o tempo, enquanto imagem ou sintoma da
mudança; se porventura as mudanças cessassem, cessaria todo transcurso. Assim, para
os escolásticos medievais, cultores do aristotelismo, o Espaço fı́sico era definido como a
soma dos lugares ocupados pelos corpos (e portanto o vazio - o lugar de corpo nenhum
- era absurdo), o Movimento era entendido como uma transformação, a remoção de
um corpo de seu estado ’natural’ de repouso devido a uma perturbação externa, e
o Tempo era um mero efeito da transformação em curso num dado fenômeno, sem
existência ou autonomia próprias. Ora, podemos dizer que uma das principais vias
de passagem do Mundo medieval fechado e orgânico ao Universo moderno infinito
e mecânico ocorrerá através de uma renovação do entendimento acerca da natureza
do movimento, envolvendo um deslocamento da noção de causa e uma libertação do
tempo de sua dependência ao movimento.
A Revolução do Renascimento:
Quais foram, primeiramente, as novas considerações acerca das causas do movimento?

A ênfase deixa de recair sobre as causas formal e final, para doravante privilegiar-se
a causa eficiente. Ou seja: há um agente que opera sobre um corpo e lhe imprime
movimento, e esse movimento tenderá a ser mantido, conservado pelo corpo, até que
um outro agente novamente aja sobre ele e modifique este estado de movimento. Esta
mudança de ênfase para a causa eficiente pode ser ilustrada por uma série de notáveis
experimentos concebidos e descritos por Galileu (embora, para muitos, alguns deles
nunca tenham sido realizados de fato).
Suponhamos, diz Galileu, que alguém esteja à beira de um cais num lago tranqüilo,
e que um marinheiro esteja no alto do mastro de um barco que está passando bem
próximo, num curso paralelo ao cais. Quando estão frente a frente, e quase podem
se tocar, ambos largam uma pedra, simultaneamente; o mesmo fenômeno, ocorrendo
466
em circunstâncias muito próximas. O que irá se passar? As duas pedras vão cair em
locais separados, uma no pé do cais, outra no pé do mastro do barco, embora tanto
o observador do cais quanto o marinheiro barco considerem a queda da sua pedra
perfeitamente vertical. A conclusão brilhante de Galileu é que para o experimentador
no cais o movimento do barco para avante foi emprestado para a pedra embarcada,
e reciprocamente, para o marinheiro foi o movimento ’para trás’ do cais em relação
ao barco que foi emprestado para a pedra terrestre. Ou seja, movimentos podem ser
cedidos a um corpo e se compor, adicionar-se, subtrair-se, até mesmo compensar-se;
ainda mais, corpos idênticos (com a mesma forma, portanto) podem se mover de modo
diferente de acordo com a composição de movimentos recebida - ou, equivalentemente,
de acordo com o movimento relativo entre os observadores. Galileu acabou de estab-
elecer que a velocidade de um corpo é uma grandeza relativa, ou seja, seu valor varia
para cada observador, conforme seu respectivo estado de movimento. O movimento
principia a se descolar da causa formal.
Ainda mais significativo é a conclusão seguinte, em que Galileu anuncia que um corpo
abandonado a si próprio manteria seu estado de movimento. Ele derivou esta concepção
revolucionária da seguinte experiência: seja uma esfera lisa, que deixamos escorregar
num plano inclinado. O que se verifica? Que a esfera adquire velocidade na descida,
alcança o piso, anda um pouco - e pára. Suponhamos, diz Galileu, que o piso seja
bem encerado. Nesse caso, observarı́amos a esfera, largada da mesma altura, atingir
uma distância bem maior. E se estivéssemos em um daqueles magnı́ficos palácios flo-
rentinos, com um assoalho de mármore perfeito, e exaustivamente encerado, a esfera
iria mais longe ainda. Neste momento, Galileu realiza um salto cognitivo, exibe uma
ousadia conceitual raras vezes igualada, e sugere: se o piso fosse um plano perfeita-
mente liso, um plano geométrico ideal, o corpo a que fosse emprestada essa velocidade
jamais cessaria seu movimento, se moveria perpetuamente. É importante notar que
invariavelmente se vê as coisas saı́rem daqui e pararem ali, quer dizer, ninguém jamais
observou este movimento interminável suceder - não se trata portanto de simplesmente
descrever um fenômeno tı́pico, pertinente ao mundo sensı́vel, e sim de vislumbrar o
fenômeno ’purificado’, apreendido em sua essência ou arquétipo. Galileu, revelando
sua inspiração platônica, irá defender resolutamente a predominância dessa realidade
esquemática, idealizada, sobre a realidade concreta; afirmação ardente de uma con-
cepção idealista em oposição ao senso comum fundado na experiência sensı́vel - como
se Platão fosse, ironicamente, o renovador de Aristóteles...
Mas nesse caso o movimento não seria governado por sua extinção: ambos, repouso e
movimento, tenderiam a se manter. Desaparece a diferença de natureza entre repouso
e movimento, e portanto a regência da causa final: o repouso é somente um caso
particular de movimento, o movimento com velocidade nula. Desaparece também, em
princı́pio, a distinção entre movimentos celestes e terrestres: uma vez que se conceba
a possibilidade de que um movimento possa ser impresso a um corpo sem buscar
extinguir-se no repouso, então, em princı́pio, esse movimento pode perdurar, quiçá in-
467
definidamente; ou seja, deixam de haver fronteiras invioláveis entre os orbes terrestre
e celeste, não há distâncias preestabelecidas que esse corpo não possa alcançar, movi-
mentos celestes e terrestres podem ambos ser perpétuos. Um movimento aberrante
de duração indefinida... Estilhaçam-se os contornos do mundo fechado medieval, e se
inaugura a extraordinária concepção de um espaço e de um tempo infinitos.
O Universo Infinito:
Os medievais diziam: a Terra é imóvel. Como é possı́vel demonstrar essa imobilidade?

Simples, vamos até o alto de uma torre e de lá lançamos um corpo pesado. Se a Terra
estivesse em movimento, ela se deslocaria por debaixo do corpo durante a queda,
de modo que o corpo cairia sempre longe do pé da torre, e não na vertical, como
notoriamente acontece. Portanto, o fato de que os corpos caem na vertical é uma
comprovação de que a Terra está imóvel. Essa demonstração se baseia nas noções
aristotélicas de que o movimento é uma transformação à qual o móvel resiste, que o
movimento busca extinguir-se, que o movimento não é mantido pelo corpo. É esta
também a experiência sensı́vel imediata, indiscutı́vel, que temos desse fenômeno. Mas
eis que chega Galileu, proclama que os corpos tendem a manter seu movimento, e
se agora vamos até o alto de uma torre de lá lançamos um corpo pesado, o que
observamos? Que a pedra, como sempre, cai na vertical. Mas se por hipótese a Terra
estivesse girando, a pedra compartilharia e manteria este movimento, e giraria junto
com a Terra; perfeitamente compreensı́vel, portanto, que ela caia no pé da torre, uma
vez que ambos, a Terra e a pedra, estão num movimento sı́ncrono. Vemos aqui, com
clareza, que um mesmo fenômeno - a queda de um corpo - pode ser interpretado
de diferentes maneiras, e servir para validar conjuntos de explicações completamente
distintos, dependendo de como é concebido e contextualizado. Ou seja, os fatos, neles
próprios, não são suficientes para definir um sentido para os acontecimentos; apenas
a conjunção dos fatos com uma teoria, em cujo âmbito são inseridos e interpretados,
é que pode proporcionar a elaboração de uma visão-de-mundo integrada e eficaz. Um
novo conceito (a composição de movimentos) transforma o sentido do fato (a queda
vertical do corpo); em conseqüência, o deslocamento da Terra torna-se consistente
com as evidências do senso comum - e a ’hipótese simplificadora’ de Copérnico, de que
era o Sol e não a Terra o centro imóvel dos movimentos celestes, pode doravante ser
admitida como válida.
O modelo heliocêntrico de Copérnico é pouco mais que uma adaptação, buscando a

simplificação, do modelo geocêntrico de Ptolomeu, sancionado pela Igreja.. Fiel aos
ideais platônicos de uniformidade do movimento dos objetos celestes, incomodava-se
com as velocidades variáveis que, na concepção dos epiciclos de Ptolomeu, os astros
exibiam ao girar em volta da Terra. Assim, procura restaurar a perfeição platônica
propondo, sob a guisa de ’facilitar’ os cálculos envolvidos no modelo de Ptolomeu,
a hipótese de centrar-se os movimentos celestes não na Terra, mas no Sol. Em vida,
Copérnico relutou em autorizar a publicação de seus escritos; após sua morte, deu-
468
se a ’traição’ de seu amigo Andreas Osiander, que ainda assim apresenta a proposta
heliocêntrica como mera conjetura. Em breve, porém, a concepção de Copérnico irá
destronar a tradição ptolomaica.
De fato, as repercussões que a obra de Copérnico - ”Sobre a Revolução dos Orbes

Celestes” - terá no século seguinte foram tamanhas que o próprio sentido do termo
’revolução’, que não designava senão a circularidade monótona e invariável dos movi-
mentos dos astros, passou a indicar uma transformação radical, abrupta e até violenta,
dos fundamentos de uma época ou sistema. Galileu foi apenas um dentre muitos outros
leitores ávidos e defensores entusiasmados da concepção heliocêntrica esboçada nesse
livro, mas coube a ele concretizar o processo de ’excentrização’ da Terra que acabaria
por desmantelar definitivamente a velha Imagem de Mundo geocêntrica. Ao receber
da Holanda um arranjo de lentes dispostas sobre um suporte (o ’perspicilo’, que logo
será chamado de telescópio), Galileu imediatamente o aperfeiçoou com sua habilidade
de artesão (e a seguir ofereceu, como criação sua, para o governo de Veneza prevenir-
se dos ataques da frota otomana). Mas o perspicilo era encarado então como uma
’curiosidade’, um dispositivo de trucagem que servia para produzir ilusões, análogo
a um caleidoscópio de brinquedo: quando era apontado para um alvo, este não ape-
nas era aparentemente ’trazido para perto’ como aparecia invertido, de cabeça para
baixo, embora evidentemente não tivesse saı́do do lugar - prova bastante da natureza
de truque de prestidigitação, ou mesmo da ı́ndole diabólica, do ardiloso artefato.
Galileu, porém, empreende uma verdadeiro programa de experimentação sistemática,

conferindo cuidadosamente se as caracterı́sticas do alvo, tal como surgiam na imagem
ampliada exibida pelo telescópio e por ele desenhadas em seu caderno, coincidiam
fielmente com a realidade. Ele repetiu esta comprovação centenas de vezes, até se cer-
tificar que o telescópio não produzia ilusões: a imagem obtida era uma representação
fidedigna do objeto observado. Com este procedimento metódico, Galileu transformou
o telescópio de um mero brinquedo em um instrumento de observação. Quando en-
fim apontou sua luneta para o céu, estava seguro de que tudo o que visse seria real.
Descobre incontáveis novos astros, distingue montanhas na Lua, registra satélites gi-
rando em torno de Júpiter, ou seja: expande os limites do Cosmo aristotélico, abole
a diferença de natureza entre os mundos sub e supra-lunar, demonstra que há mais
de um centro de movimentos. Em O Mensageiro das Estrelas, apresenta de uma só
vez tais ”coisas que ninguém nunca viu antes”, exprime ”pensamentos que ninguém
nunca teve”. O arrebatamento de Galileu perante a conquista que lhe foi concedida
é enorme; ele havia sido agraciado com o privilégio de fazer nascer um novo mundo
das cinzas da visão aristotélica - que era sancionada pela Igreja. Levado às barras do
tribunal da Inquisição, abjura do heliocentrismo, mas tem a ı́ntima convicção - que a
Era Moderna que então se inaugura irá vindicar - de que o mundo, agora, se move.
A Ciência Moderna:
Vemos assim as grandes linhas esboçadas por Galileu para a nova maneira de empreen-
469
der as investigações da Filosofia Natural: a partir de estudos empı́ricos (experimentos
e observações) de cada classe de fenômenos (descartando a vinculação ’orgânica’ en-
tre local e global que vigorava na Grande Cadeia dos Seres), trata-se de elaborar
regras quantitativas (expressas, portanto, em linguagem matemática) que incorporem
os dados medidos (por exemplo, sobre velocidades, distâncias percorridas, durações,
no caso de um movimento), correlacionando as grandezas relevantes para a caracter-
ização teórica (ou seja, universal) desses eventos. É esta abordagem empı́rico-teórica
que Kepler, num dos maiores feitos da história das Ciências, emprega para extrair
das tabelas de observações astronômicas de Tycho Brahe as leis cinemáticas que de-
screvem as trajetórias dos planetas no Sistema Solar. Ironicamente, o próprio Galileu
não valorizará essa conquista, porque o método galileano de Kepler acabou por revelar
órbitas planetárias elı́pticas, e não circulares, como invocavam os venerandos preceitos
que entronizavam a esfericidade como imagem da perfeição celeste - que Galileu, ele
mesmo, não foi capaz de abandonar... A fidelidade às medições, porém, encarnará
o traço mais decisivo desta nova forma de dialogar com a Natureza: as observações
empı́ricas - ou seja, os próprios fenômenos - terão a última palavra acerca da validação
ou não de uma dada teorização, tornando o empreendimento cientı́fico auto-corretivo e,
portanto, progressivo. Novas observações serão sempre capazes de impor modificações
aos princı́pios e noções já estabelecidos.
Por exemplo, consoante à subordinação do local ao global, os acontecimentos da na-
tureza deviam estar sempre em harmonia com a ordem cósmica; assim, os ciclos que se
repetem na disposição dos astros fundavam a imagem de um tempo quotidiano, comez-
inho, submetido à determinação das esferas celestiais. Ao incorporar as medições dos
perı́odos dos acontecimentos às leis formais que doravante irão descrevê-los, Galileu
opera uma transmutação fundamental: de sintoma ou efeito do movimento, o tempo
se externaliza, passa a ser uma referência externa, um descritor autônomo e indepen-
dente para os fenômenos. O tempo se liberta do movimento: mal podemos imaginar as
dificuldades excruciantes com que seu espı́rito se defrontou para lograr essa autêntica
transição entre duas eras do pensamento.
A princı́pio, essa modificação vai se dar quase imperceptivelmente, a partir de uma
inovação no domı́nio da música. Nos conventos cristãos medievais perpetuava-se a
tradição judaica da ”salmodia”, que consiste em fazer uma leitura cantada do Evan-
gelho, do texto sagrado. Contudo, quando se procurou usar vários leitores, de modo
a que suas vozes se combinassem nessa fala cantada, surge o problema de como fazer
todos os cantores entrarem em compasso. Este é o problema da constituição da música
polifônica - como fazer todas as vozes atuarem em conjunto (que é o mesmo problema
do mestre de harmonia na escola de samba). Num pergaminho datado do século XIII,
encontrado em Notre Dame, surge uma solução: a elaboração de uma notação musical
inovadora, um signo abstrato que representa uma unidade arbitrária de duração. A
extensão dessa unidade não é definida, pode ser mais curta ou mais longa, de acordo
com a decisão do regente; o que importa é que as vozes irão entrar na canção numa
470
seqüência bem determinada, garantindo a harmonização dos diferentes cantores (mais
tarde, o metrônomo irá realizar precisamente essa função).
Foi dessa maneira tão pouco espetacular que foi concebida a idéia de que o tempo pode
ser dividido. Delineia-se agora a idéia de um tempo que seria essencialmente divisı́vel,
segmentável, e que portanto pode ser concebido como uma sucessão de unidades fixas.
Quando essa noção aparentemente inconseqüente encontrou-se com um dispositivo
igualmente revolucionário - o relógio mecânico - o resultado foi uma transformação
sem precedentes das próprias bases da cultura ocidental. No mundo medieval, a rigor,
a divisão do tempo não tinha um sentido profundo, porque o tempo cı́clico é um
fluir contı́nuo, o ciclo do dia e da noite encadeando-se com o das semanas, e com o
das estações, e com o dos anos. Ademais, os pedaços do dia, ou seja, as horas, eram
elásticas: mais compridas no verão, mais curtas no inverno, e assim só possuı́am,
desde a Antiguidade, um caráter meramente convencional. Uma vez que a verdadeira
natureza do tempo seria contı́nua, cortá-lo só podia ser encarado como um artifı́cio. O
relógio mecânico veio mudar tudo isso, graças à invenção, por um gênio desconhecido,
do escape, um dispositivo muito simples (como costumam ser as grandes invenções)
que permitia transformar um processo contı́nuo - a queda de um peso - num processo
descontı́nuo, repetidamente interrompido e retomado, que torna o ’fluir’ do tempo
numa sucessão de segmentos de duração fixa.
Até então os relógios eram grandes mecanismos que procuravam encarnar os ciclos
naturais. O curso dos planetas e da Lua, o dia, a noite, os relógios representavam
pictoricamente esses grandes ciclos naturais. Mas um gênio florentino desconhecido
teve a idéia de colocar num cantinho despretensioso um movimento que dependia ex-
clusivamente das engrenagens do próprio relógio, um movimento que não remetia a
nenhum ciclo natural. Uma medida de tempo puramente convencional, dependente
apenas da estrutura interna do relógio. Por exemplo, a divisão do dia em doze ho-
ras é uma herança da aritmética babilônia (que usava a base doze), que persistiu
através da astrologia; não representa qualquer aspecto particular da natureza. Graças
à colocação dos relógios no alto da torre das igrejas, esse ciclo puramente convencional
de tempo rapidamente vai se tornar a referência em relação à qual os ciclos naturais
serão medidos. Em conseqüência, o tempo natural passará a ser coordenado. Até então,
trabalhava-se do nascer ao por do sol; no verão esse perı́odo tem uma extensão, no
inverno outra - mas agora a independência com relação aos ciclos naturais, assegurada
pela convencionalidade do tempo do relógio mecânico, vai tornar possı́vel que meninos
de doze anos trabalhem nas minas de Gales, no final do século passado, um perı́odo
fixo: dezesseis horas por dia...
Vemos assim que em certos momentos cruciais da história do pensamento, a Arte

antecipou-se à Ciência ao inaugurar a utilização de noções que posteriormente desem-
penhariam um papel capital em transformações cientı́ficas basilares. O mesmo sucedeu
no que diz respeito às concepções do espaço, tal como revela um exame da passagem da
471
pintura Medieval para a Renascentista. Recordemos as Madonas medievais: as figuras
são bidimensionais, plasmadas na tela, suas proporções são estruturadas simbolica-
mente e definidas apenas pelos contornos. Não há qualquer intenção de se representar
’realisticamente’ as figuras: a Madona e o Menino são imensos (dada sua importância
religiosa) frente aos minúsculos pastores e animais presentes na base do quadro, a
paisagem de fundo é tão somente ornamental. Tampouco se pretende apresentar acon-
tecimentos: o objetivo é transmitir o sı́mbolo da sagrada Maternidade de Deus, e não
descrever as tensões musculares dos braços da Dama ao sustentar o corpo do Infante.
O tempo, portanto, está ausente: mesmo na Via Sacra, em que a história do martı́rio
de Cristo é narrada em sucessivas etapas, cada quadro retrata uma cena exemplar - e
essencialmente estática. Quando Simão o Cireneu se compadece do Cristo vergado sob
a cruz e lhe empresta o braço para aliviar Sua carga, trata-se da imagem paradigmática
da Caridade solidária, e não do movimento corporal requerido para a ação fı́sica de
rebalancear o peso do madeiro.
Na passagem da arte Medieval para a Renascentista, a introdução da dobra - especi-

ficamente, as pregas das vestimentas, importadas da arte bizantina - faz os corpos
representados ganharem espessura, enchendo-se em volumes, e assim o plano pictórico
adquire uma dimensão suplementar, a profundidade. Qual é o efeito de uma dobra?
Induzir a existência de uma outra superfı́cie, não vista mas intuı́da, ’por detrás’ da su-
perfı́cie aparente. Mas então o olhar se detém na camada ’externa’, depois segue para
a segunda camada, e ainda para uma terceira... Ou seja: a dobra vai permitir que os
corpos se avolumem e que portanto o quadro adquira uma terceira dimensão espacial,
uma profundidade. Este novo espaço representativo tridimensional logo depois será
ordenado more geometrico pela adoção da perspectiva, ”naturalizando-se”. Ora, se os
corpos se encheram e passaram a ser posicionados segundo as regras da perspectiva,
com as proporções das figuras simulando as distâncias entre elas, então o olhar se
demora ao penetrar nesse espaço, e assim ainda uma outra dimensão suplementar é
acrescentada - o tempo. A introdução da terceira dimensão espacial é simultaneamente
a aparição de uma sensação de duração - o que vai permitir que a arte Renascentista
passe a reproduzir movimentos, retratando acontecimentos e não somente conteúdos
puramente simbólicos. Um bom exemplo são as gloriosas flâmulas dos cavaleiros de
Paolo Ucello. Guerreiros de armadura, montados em corcéis magnificamente ajaeza-
dos, portando imensas lanças em cujas extremidades se desfraldam pendões - e esses
pendões drapejam, ondulam, se contorcem. Quase se pode sentir o vento, e o galope
dos cavalos, e o ı́mpeto da marcha, graças ao tremular dos estandartes. Represen-
tar acontecimentos concretos numa ambiência geometricamente estruturada, voltar-se
para os estados-de-coisas segundo um viés naturalista, explicitar o tempo: estas foram
as inovações maiores da revolução artı́stica do Renascimento. Como as mudanças da
Arte, muitas vezes, antecipam os avanços da Ciência, a revolução cientı́fica do Re-
nascimento nutriu-se largamente da artı́stica. Giotto é um indispensável predecessor
de Galileu.
472
A Arte, então, preparou a passagem da antiqüı́ssima noção do tempo como um fluxo
contı́nuo para a nova noção do tempo como uma sucessão de unidades descontı́nuas
- que o relógio mecânico virá a implementar - e organizou geometricamente o espaço,
abrindo caminho tanto para a Mecânica quanto para a Óptica. Com o espaço iden-
tificado a um volume geométrico, as distâncias serão definidas pela separação entre
pontos geométricos, e da mesma maneira as durações serão medidas em termos de
unidades referidas a um tempo descritor, exteriorizado e autônomo.
O Corte Cartesiano:
Essa tematização revolucionária da realidade fı́sica encontrará seu acabamento com

Descartes, talvez o último grande filósofo-cientista. Descartes vai radicalizar a postura
de Galileu de abandonar as amarras da cosmovisão finalista e globalizante que domi-
nava a época anterior, e investigar apenas os fatores que diretamente incidem sobre um
dado fenômeno. Ou seja, para se descrever o movimento de um corpo não importam
sua cor, ou cheiro, os sons que o cercam, etc.; apenas o seu caráter de ocupar espaço, e
sua capacidade de, dessa posição, deslocar-se para outra. Descartes leva ao limite essa
desvinculação entre local e global, identificando matéria e extensão: da matéria, tudo
o que importa dizer - tudo que é indispensável dizer - é que ela ocupa largura, com-
primento e profundidade. Opera-se aqui uma identificação extraordinária: um corpo
e a região que habita, matéria e extensão, são uma e a mesma coisa. Por outro lado,
Descartes rejeita a idéia de vazio com maior ênfase ainda que os aristotélicos. Os atom-
istas, por exemplo, afirmavam que os corpos materiais são compostos por diminutas
unidades elementares chamadas átomos, e entre eles haveria um vazio, a ausência de
qualquer meio fı́sico. Descartes nega essa hipótese e concebe um plenum que acaba
por identificar à própria natureza do espaço. O espaço fı́sico não seria um vazio, pois
estaria sempre preenchido desse plenum ou éter, que seria percorrido pelos corpos em
seus movimentos.
Em seguida, Descartes quantifica os movimentos através da definição de momentum ou

quantidade de movimento: quando se imprime movimento a um determinado corpo,
essa ação corresponde a uma certa quantidade de impulsão, que tenderá a permanecer
inalterada enquanto uma ação externa não incidir sobre o móvel. Descartes enuncia
assim a chamada ”lei da conservação da quantidade de movimento”: todo corpo em
movimento livre tem conservado o seu momentum, a quantidade de movimento que
lhe está associada, que só será alterada se um outro corpo qualquer lhe ceder ou retirar
movimento. A lei da conservação da quantidade de movimento vai estar intimamente
associada à chamada ”lei da inércia”, que constitui a primeira das três leis da Mecânica
que Newton irá sintetizar meio século mais à frente.
O princı́pio de inércia afirma que quando não há agentes externos operando sobre
um corpo, esse corpo realizará um movimento retilı́neo e uniforme, com velocidade
constante, ou seja, a intensidade, a direção e a natureza do movimento serão man-
tidas. Descartes separa estes três aspectos do princı́pio de inércia: a quantidade de
473
movimento ser invariante, o corpo manter a direção, e o movimento ser retilı́neo.
Mas para nós modernos (para nós, cartesianos) esses três aspectos na verdade são
um só: um corpo deixado entregue a si mesmo move-se espontaneamente em movi-
mento retilı́neo e uniforme, ou seja, permanentemente com a mesma taxa. A noção de
inércia irá fundamentar a metáfora do mundo fı́sico como o análogo de uma máquina,
a metáfora-matriz da modernidade.
Novamente, temos a imagem de uma plenitude fı́sica, um mundo perfeitamente cheio,

só que agora Descartes também será radical ao negar, devido ao princı́pio da inércia,
que esse mundo possa ter limites. Se um corpo em movimento pode se mover in-
definidamente, os contornos desse mundo perfeitamente cheio, ao contrário do cosmos
cerrado medieval, são também indefinidos. Como Alexandre Koyré assinala, para de-
screver a abrangência do universo Descartes não usa o termo infinito (que reserva para
Deus), mas sim os termos intérmino, ilimitado, indefinido. Ele sustenta essa concepção
na célebre querela com Henry More acerca dos atributos de Deus e dos atributos do
espaço. Uma outra contribuição fundamental de Descartes é a geometria analı́tica,
que é a tradução, em relações algébricas, puramente quantitativas, das formas da ge-
ometria; como se fosse a transposição de uma linguagem das formas espaciais para
uma linguagem algébrica, de signos abstratos. Descartes faz essa convergência de lin-
guagens mostrando que é possı́vel uma associação entre formas e coordenadas, entre
números e curvas que compõem formas, entre medidas e linhas de pontos.
Essa associação vai permitir que a inovadora noção do tempo como uma seqüência de
unidades se torne ainda mais revolucionária, porque agora vai tornar possı́vel conceber-
se - e Descartes é o primeiro a fazê-lo - uma unidade de tempo de extensão nula; um
ponto de tempo (ou instante). Com efeito, se as etapas do movimento devem ser
referidas a frações sucessivas de tempo, como compatibilizar a continuidade suave do
deslocamento de um corpo com uma duração descontı́nua, segmentada? Dito de outro
modo, como encaixar as ’bordas’ dos perı́odos consecutivos? O que se passaria nas
extremidades de cada segmento unitário - e pior ainda, entre elas? O mundo se desfaria
para em seguida se reconstituir por inteiro? Para superar estes obstáculos Descartes
propõe que a noção de unidade de tempo seja levada ao limite infinitesimal, ou seja,
as durações são contraı́das até a aniquilação, até a extensão nula: o ponto. Ocorre
assim uma assimilação completa do tempo a uma imagem geométrica: identificado
a uma linha de pontos, o tempo torna-se denso - entre duas durações inextensas ou
instantes sempre há um outro instante - e portanto contı́nuo. Com Galileu o tempo
havia adquirido externalidade, mas é Descartes que arremata esta vasta operação de
geometrização do tempo, ao lhe conferir o atributo da densidade. Configura-se assim a
Imagem do tempo como uma linha infinita de pontos, percorrida uniformemente pelo
agora perpetuamente movente, desde um passado infinitamente remoto até um futuro
infinitamente ignoto, e correspondentemente o real, o mundo que está em ato, se acha
embarcado numa perene viagem ao longo desta linha dos instantes, deste tempo único.
474
Igualmente notável é o deslocamento seguinte: a identificação do espaço real no qual
os corpos se movem ao espaço abstrato da geometria euclidiana. Ou seja, um am-
biente concreto como uma sala, onde há cheiros, gostos, luzes, tensões, pressões,
onde fenômenos acontecem, passa a ser recoberto por um espaço abstrato de pon-
tos geométricos. Observemos que se trata de um feito extraordinário do pensamento,
absolutamente não trivial, o de recobrir o mundo sensı́vel com uma capa de pontos
geométricos. De tal maneira que doravante vai-se definir a relação de distância, a sep-
aração entre objetos, em termos da distância que existe entre pontos que representam
cada um dos objetos. Desse modo, o espaço fı́sico da sala será identificado a um vol-
ume geométrico, um paralelogramo, digamos. Seu principal atributo é a capacidade de
conter corpos, de ser preenchido - ou não - por corpos fı́sicos. Contudo, ainda que tais
corpos sejam retirados, o espaço dantes ocupado permanece; de fato, o espaço passa a
ser, fundamentalmente, espaço vazio, pura capacidade de continência. Essa noção de
espaço contentor é também o modelo do próprio universo; basta estender ilimitada-
mente as paredes dessa caixa. Habitado por corpos materiais que atuam uns sobre os
outros pela ação de forças - agentes da modificação de movimentos, que concretizam
a prevalência da causa eficiente - esse espaço geometrizado, neutro e abstrato, que
Newton chamará de ”absoluto”, será o substituto do espaço hierarquizado do cosmos
medieval.
A Mecânica:
Com todos estes componentes, não é de admirar que se possa de fato pensar o mundo
como um colossal mecanismo; tal como as engrenagens em uma máquina, o Universo
tem suas partes precisamente ajustadas de tal modo que o movimento de uma delas
implica nos movimentos de todas as demais. Todavia, não há mais aqui, na mod-
ernidade, uma ordem hierárquica entre o todo e a parte. Agora a parte é homogênea
ao todo, ambos têm a mesma natureza. Corpos em movimento, extensão em movi-
mento: apenas isto é o que existe. Entre o local e o global, entre o mundo terrestre e
o mundo celeste; por toda parte, vigora tão somente a uniformidade mecânica. Agora,
então, o pensamento deve procurar não mais os universais, aqueles nomes gerais que
dizem as classes de seres que existem no mundo; o que doravante interessa ao pensa-
mento é o simples, é a parte mais elementar à qual seja possı́vel reduzir-se um sistema,
um corpo, um todo.
Newton recebe estas concepções modernas de espaço, tempo e movimento e as pro-

move a um patamar ainda mais abstrato em sua grande sı́ntese das leis dinâmicas, a
Mecânica. O tempo Newtoniano, por exemplo, além de linear, sucessivo e instanta-
neizado, é universal, uniforme e absoluto - quer dizer, todas as regiões do espaço são
englobadas pelo mesmo instante, os instantes se sucedem sempre na mesma cadência
(o tempo não se condensa nem se distende, não ’acelera’ nem ’freia’), e quaisquer obser-
vadores concordarão quanto à duração que separa dois eventos dados. Como em cada
instante haverá uma dada distribuição de corpos ao longo do espaço, o ’transcurso do
475
tempo’ - a duração de um dado acontecimento, por exemplo - será caracterizado pela
diferença na distribuição espacial dos objetos. Todos os sistemas mecânicos periódicos
podem ser eleitos como ”relógio”, em função de cujo ritmo a evolução de outros sis-
temas mecânicos será descrita; como se, de fato, constituı́ssem encarnações distintas
de um único relógio universal. Assim, qualquer movimento escolhido como padrão
pode ser ’abstratizado’ para adquirir esta função de ’relógio cósmico’, que fornecerá
uma medida absoluta (global, única e independente) para os intervalos entre instantes
e para o qual as leis da Mecânica assumirão a forma mais simples. Todos os relógios,
uma vez sincronizados, manterão perpetuamente esse sincronismo concordando invari-
avelmente em assinalar o mesmo instante, independentemente de suas localizações ou
movimentos. Contudo, como as leis da Mecânica dependem apenas da extensão da sep-
aração temporal entre dois quaisquer eventos, o tempo Newtoniano é intrinsecamente
reversı́vel, ou seja, não é orientado, não define um sentido absoluto entre passado e
futuro. Cada estágio da ’história cósmica’ (as mudanças na constelação dos corpos)
determina (e é equivalentemente determinado por) todos os estágios precedentes e
subsequentes.
Os relógios, portanto, foram fundamentais na instalação da concepção mecanicista
do mundo natural, inclusive na medida em que forneceram a metáfora nuclear desta
Imagem de Mundo: a de que o Universo seria comparável a uma grande Máquina, a um
vasto mecanismo cujo funcionamento é rigorosamente determinado (e por conseguinte
inteiramente predizı́vel) em virtude da concatenação exata de suas peças, de suas
partes simples. Esta analogia não apenas privilegiou a postura analı́tica e reducionista
que se tornaria tı́pica do Mecanicismo, como deu também lugar àquela que talvez seja
a mais espantosa concepção de divindade jamais imaginada por qualquer sociedade
humana: a do Deus Relojoeiro, que monta o mecanismo do mundo e depois se afasta,
deixando o pobre aparelho entregue a si mesmo... Implı́cita nesta imagem maquı́nica do
mundo está a idéia de determinismo, tão cara ao século XIX: nenhum acontecimento
natural é ”livre”, cada parte da grande máquina universal está determinada, está
condicionada a mover-se em acordo com o movimento das outras peças, de tal modo
que se conhecemos uma configuração do conjunto das engrenagens num dado momento,
poderemos em princı́pio prever qualquer configuração futura ou retroceder a qualquer
configuração passada.
Por exemplo, se conhecemos a posição e a velocidade da Lua hoje, aplicando as leis da
Mecânica clássica poderemos prever a posição e a velocidade da Lua daqui a um mês ou
rever a posição que ocupava no mês passado, com a exatidão que desejarmos. Assim, se
fosse possı́vel tirar fotografias da totalidade - recordemos que fotografias, antigamente,
se chamavam ”instantâneos” - a história universal, a história do Cosmos, poderia ser
reduzida a uma série de ”instantâneos”, cada um retratando uma dada configuração,
uma dada distribuição dos corpos no espaço. Isto corresponde à idéia de que cada
instante é universal, é o mesmo em toda parte, a mesma badalada ressoa em todos os
confins do Universo, o infinito do espaço habita o infinitésimo do tempo. Não admira
476
que possamos então conceber o Universo como uma máquina, como um conjunto de
engrenagens perfeitamente ajustadas e azeitadas que, ao se movimentarem, assumem
de instante a instante uma disposição diferente. Na verdade, é discutı́vel a aplicação do
termo ’história’ - na medida em que este denotar uma autêntica progressão evolutiva
dos sistemas materiais - ao Cosmos mecânico. Perante uma imagem tão completa-
mente inumana da totalidade, não admira o espanto e o temor que acometem Pascal,
como nos recorda Jorge Luis Borges. Contemplando a frieza incomensurável do cos-
mos mecânico, Pascal se interroga: se o espaço é infinito, a rigor não há um onde; se
o tempo é infinito, a rigor não há um quando. Quem somos nós? O que somos nós?
Talvez não seja inútil observar, por fim, que no âmbito do determinismo mecanicista
a Vida, com seu repertório de contingências e imprevisibilidades, assume a feição de
uma anomalia.
A Revolução Cientı́fica Contemporânea:
Desde seu inı́cio, o século XX testemunhou a realização de uma série de experimen-

tos decisivos e teorizações audaciosas que acabaram por demonstrar a inadequação
da abordagem Newtoniana ou clássica com respeito a fenômenos que ocorrem em
escalas (de comprimentos, durações ou velocidades) inumanas, estranhas à nossa per-
cepção costumeira dos acontecimentos - como o comportamento dos componentes
microscópicos da matéria (moléculas, átomos, partı́culas) ou a estrutura do universo
astronômico (galáxias, grupos, aglomerados). Esses novos domı́nios de investigação
terão uma conseqüência deveras notável: a Natureza deixa de ser monótona. O que
os avanços do presente século vão engendrar é uma multiplicação, uma tripartição,
digamos, dos modos de apresentação da natureza, ou seja, a Natureza vai apresentar
distintos modos de ser de acordo com a escala do fenômeno investigado, aparições
diferenciadas se focamos a escala microscópica, a escala clássica (que estamos mam-
iferamente equipados a experimentar) ou a escala cosmológica, astronômica. Depen-
dendo da escala que se considera, diferentes naturezas, ou seja, diferentes conjuntos
de fenômenos, com suas relações tı́picas, seus caracteres próprios, serão manifestadas.
Logo, o mundo natural deixa de ser unânime, não é mais o mesmo em todas as escalas.
Toda uma série de problemas interessantı́ssimos e revolucionários vão surgir a partir
dessa constatação.
A Revolução Cientı́fica contemporânea - para usar a bem conhecida denominação

de Thomas Kuhn - motivou toda uma nova compreensão acerca da realidade fı́sica
básica e acarretou a instalação, atualmente em curso, de uma Imagem de Mundo
renovada, profundamente original. Pois para que se pudesse descrever corretamente
essas classes de fenômenos até então inacessı́veis, foi necessário proceder a uma revisão
radical dos próprios princı́pios que fundamentavam o estimado paradigma mecanicista
e circunscrever seu domı́nio de validade observacional. Podemos tentar resumir as
conseqüências deste conjunto de inovações radicais sobre o panorama epistemológico
da atualidade associando-as à introdução de um novo tipo de objeto do conhecimento
477
- o objeto complexo, por referência ao que seria o objeto simples, tı́pico da forma
de conhecimento clássica vigente até o século passado. Evidentemente, a aparição
do objeto complexo será correlata à constituição de uma nova noção de sujeito do
conhecimento.
O objeto complexo perpassa os vários domı́nios ou modos de natureza, do mais ele-
mentar ao mais abrangente - e cada um deles parece se esmerar em nos surpreender.
A Microfı́sica quântica, na escala atômica, delineia uma matéria dessubstancializada,
elusiva, eivada de paradoxalidades, em relação à qual o observador se torna um par-
ticipador, configurando-se assim uma realidade elementar fundamentalmente incerta,
em que desaparece, por exemplo, a distinção entre corpúsculo e onda, entre corpo lo-
calizado e padrão extenso. Já no que podemos chamar de escala mesofı́sica, que exper-
imentamos diretamente pelos sentidos, o estudo dos Sistemas Dinâmicos não-lineares
conduz à concepção de estados longe do equilı́brio marcados pela imprevisibilidade,
mas aptos a engendrar hierarquias sofisticadas de organização, bem como comporta-
mentos ricos em potenciais de evolução, forçando assim o pensamento a abdicar da
pretensão mecanicista de lograr um controle absoluto, correlato de uma previsibili-
dade sem limites, sobre os processos do mundo natural. A Macrofı́sica relativı́stica,
enfim, na escala astronômica, possibilitou a maior descoberta que o homem já fez
sobre o mundo natural - a constatação de que habitamos e somos parte de um Todo
dinâmico, evolutivo, inacabado, em suma, de uma totalidade aberta. Tal concepção
de um Cosmos histórico leva-nos a identificar o Universo como o próprio reino da
complexidade.
Esta entidade tão peculiar - a Totalidade Evolutiva - é o objeto de estudo da Cos-
mologia contemporânea.
13.3 Os Fundamentos: As Teorias da Relatividade
As Teorias da Relatividade de Albert Einstein nos proporcionam os meios de tratar

tanto os processos fı́sicos mais fundamentais (a Relatividade Especial) quanto os mais
abrangentes (a Relatividade Geral) - e as figuras de espaço e tempo que ambas oferecem
parecem de tal modo paradoxais para nosso senso comum que torna-se lı́cito duvidar
se nossos cérebros mamı́feros teriam a capacidade de representá-las de outro modo
que não através de conceitos abstratos, expressos em linguagem matemática. Para
as criaturas eminentemente visuais que somos, tal impossibilidade de representação
imagética é terrı́vel: as essências dos conteúdos do mundo se destacam definitivamente
de suas aparências, como se Apolo, o deus grego das formas, tivesse desertado de nós...
A Teoria Especial da Relatividade
Após considerar longamente certas incongruências entre as prescrições da Mecânica
e do Eletromagnetismo, no anno mirabili de 1905 Einstein apresentou uma nova
478
fundação conceitual para regular a comparação de medidas obtidas por diferentes ob-
servadores inerciais (ou seja, associados a corpos em movimento livre), centrada não
mais no postulado da invariância dos intervalos temporais introduzido por Galileu
(e que conduzia à noção de simultaneidade absoluta de eventos), e sim no caráter
invariante doravante conferido a uma razão entre medidas de espaço e de tempo -
a velocidade de propagação da radiação luminosa. A Relatividade Especial é assim
uma nova teoria da relação entre observadores, subordinada ao princı́pio de que as leis
fı́sicas devem ser indiferentes aos modos particulares com que cada observador procede
ao etiquetamento, por meio de medidas de distâncias e durações, dos fenômenos fı́sicos,
e resultou no que Géza Szamosi chama de ”ruptura da fundação mamı́fera”, pois suas
conseqüências para a compreensão da estrutura do mundo fı́sico se revelaram devas-
tadoras: as medidas de distância (que definem o espaço) e de duração (que definem
o tempo) não serão mais absolutas, seus valores deixam de ser os mesmos para todo
observador, ou seja, cada observador recorta de uma maneira própria, relativa ao seu
’ponto-de-vista’, a massa de acontecimentos do mundo - e esses recortes individuais, a
espacialização e a temporalização que os observadores realizam sobre seus dados, são
meras perspectivas, irrelevantes para a descrição concreta desses acontecimentos.
O que importa são as relações invariantes (que têm o mesmo valor para qualquer obser-
vador) que possam ser construı́das com esses dados, como a velocidade de propagação
da radiação eletromagnética no vácuo (ou velocidade da luz, denotada pela letra c),
que irá governar a comunicação entre os observadores e determinar uma estrutura
causal única para o mundo. Isto significa, por exemplo, que em geral a separação tem-
poral - a duração - entre dois eventos dados dependerá do observador: os intervalos de
tempo medidos por um observador se dilatam ou se contraem com respeito às medi-
das de outro, e por conseguinte fica por completo abolida a noção de simultaneidade
universal - eventos que são coincidentes para um observador serão descompassados
para outros. O mesmo vale para as distâncias, as separações espaciais: observadores
em diferentes estados de movimento obterão distintos valores ao medirem os compri-
mentos caracterı́sticos de um dado sistema - implicando que a distribuição espacial de
seus componentes, e portanto sua forma, será doravante relativa a cada observador.
A dilatação dos tempos, bem como a contração dos comprimentos, são fatos concre-
tos, determinados com grande precisão nos laboratórios - mas o tempo e o espaço
relativı́sticos, maleáveis e individualizados, não mais constituem uma regra métrica
unânime abrangendo a totalidade da existência: acabaram-se o instante global e a
forma unı́voca. O famoso paradoxo dos gêmeos ilustra a ruptura das noções rela-
tivı́sticas com o bom senso velho de guerra:
Os gêmeos X e Y têm, obviamente, a mesma idade. X permanece na Terra, enquanto
Y empreende uma viagem espacial numa nave muito rápida (capaz de mover-se quase
à velocidade da luz). Para X, a viagem do irmão dura dez anos, ao longo dos quais
seu coração bateu cerca de 36 milhões de vezes. Para Y, contudo, a viagem demorou
um ano, e seu coração bateu 3,6 milhões de vezes. Ao se reencontrarem, X está fisio-
479
logicamente 9 anos mais velho que seu irmão; deixaram de ser gêmeos...
Mais ainda, ao longo destes dez anos, todos os dias X levantava a vista para o Sol
e, vendo-o sempre com o mesmo aspecto - o de um cı́rculo dourado - não obstante
o movimento de translação da Terra durante todo o ano, concluiu com bem-fundada
convicção que nossa estrela é uma esfera amarela. Para Y, porém, ao dirigir-se em alta
velocidade em direção ao Sol, este lhe surgiu como se um disco achatado, semelhante
a uma panqueca, e azul; recordou-se então que, quando partiu, o Sol também lhe
parecera um disco achatado - só que vermelho. A gloriosa esfericidade áurea do Astro-
Rei, longe de definir sua essência, não passa de mero ponto-de-vista...
A multiplicação dos espaços e dos tempos - doravante meramente noções relativas

aos pontos-de-vista de diferentes observadores - não é ainda, contudo, o aspecto mais
paradoxal das conceituações relativı́sticas. É indiscutı́vel, para nós, a distinção de
natureza entre distâncias e durações, entre espaço e tempo. Para a Relatividade, essa
distinção é, mais uma vez, dispensável: uma dada grandeza de um fenômeno, que um
observador mede com uma régua e define como um comprimento, um outro observador
poderá medir com um relógio e definir como uma duração. Inaugura-se do mesmo modo
a possibilidade de conversão mútua entre massa (medida da inércia de um corpo) e
energia (medida da atividade do corpo), expressa na célebre fórmula: E = mc2 .
Em resumo, as distinções entre tempo e espaço e entre matéria e movimento tornam-

se fisicamente irrelevantes. A formulação mais apropriada para a aplicação das leis
da Natureza não envolve mais o cenário Newtoniano de três dimensões espaciais e
uma dimensão temporal essencialmente distintas e autônomas, mas sim o chamado
continuum quadridimensional ou espaço-tempo de Minkowski, a coleção causalmente
ordenada de eventos (acontecimentos no espaço e no tempo) registrados por classes
de observadores, cada qual construindo seu ”aqui-e-agora” particular. O ’espaço’ e
o ’tempo’ se convertem assim em simples medidas de parâmetros, e de constituintes
fundamentais da realidade fı́sica passam a ser tão-somente um resultado do aparato
instrumental de cada observador.
A formulação de Minkowski, porém, não pode ser representada visualmente. Consid-

eremos um exemplo básico, o da propagação da luz. De acordo com nossa perspectiva
’espaço e tempo’, quando acendemos uma lâmpada o que ’vemos’ é uma esfera lu-
minosa se expandindo (ocupando diferentes posições em diferentes momentos). Na
linguagem ’espaço-tempo’, este fenômeno é descrito por uma pura forma geométrica,
correspondente à figura de um cone em quatro dimensões: não há movimento algum.
A noção habitual de trajetória (percurso de um corpo no espaço, referido a um dado
decurso de tempo) deve ser substituı́da por um conceito análogo, mas relativistica-
mente invariante: o de linha-de-universo (percurso de um corpo no espaço-tempo).
O mundo fı́sico pode ser entendido como o conjunto de todas as linhas-de-universo
distribuı́das numa variedade Minkowskiana. Contudo, a evolução natural não parece
ter dotado os centros visuais de nosso cérebro com a capacidade de figurar objetos
480
quadridimensionais, tais como os chamados hipercubos ou tesseracts; o espaço-tempo
pode ser concebido e compreendido, mas não pode ser visto. Quem sabe, no futuro,
um artista pós-mamı́fero se tornará no Giotto dos tesseracts?
Mas talvez, para nossa perspectiva lastreada no bom senso nosso de cada dia, a pos-
sibilidade mais perturbadora oferecida pelas abordagens relativı́sticas seja a admissi-
bilidade de ocorrerem circuitos cronológicos fechados, ou seja, caminhos que podem
retornar sobre si mesmos no espaço e no tempo - de tal modo que prosseguir rumo ao
futuro não significaria necessariamente afastar-se do passado! Caso existam de fato (no
momento só sabemos que não parecem ser impossı́veis), estas curvas ’fechadas’ rompe-
riam com um dos atributos mais estimados de nossa figuras tradicionais do tempo, a
globalidade temporal: linhas-de-universo de objetos fı́sicos devem ser monótonas, ou
seja, cruzar um ponto do espaço-tempo uma e só uma vez. A (presumı́vel) viabilidade
fı́sica de tais ”viagens no tempo”, para além de proporcionar material saboroso para
ficcionistas, coloca problemas agudos para nosso entendimento sobre a causalidade -
como exemplificado pelos paradoxos do tipo ’neto viaja no tempo e mata o próprio
avô, mas então não haveria neto para matar o avô, então o avô não morre, então
poderia haver um neto que o matasse’, e assim por diante, !!!!!
A Teoria da Relatividade Geral
Já em 1917 Einstein, exclusivamente a partir da consideração de princı́pios primeiros

e independentemente de quaisquer evidências ou dados sugestivos, completou a elab-
oração da teoria da Relatividade Geral - para Max Born, ”o maior feito do pen-
samento humano sobre a natureza, a mais impressionante combinação de penetração
filosófica, intuição fı́sica e habilidade matemática”. Procurando generalizar a aplicação
do princı́pio de invariância das leis fı́sicas (ou seja, tais leis devem ser expressas por
relações matemáticas manifestamente independentes do particular procedimento de
etiquetamento dos eventos fı́sicos adotado) para observadores não-inerciais (ou seja,
associados a corpos acelerados), Einstein termina por promover uma fecunda - e in-
teiramente imprevista - combinação entre a interação gravitacional (a força universal
de atração entre as massas, descoberta por Newton) e a estrutura geométrica do
espaço-tempo (que irá agora constituir o cenário básico global para a descrição dos
eventos fı́sicos). A geometria do mundo não está fixada a priori, como se pensava
desde Euclides, mas é na verdade determinada fisicamente: os campos gravitacionais
gerados por uma dada distribuição de matéria-energia serão associados, de maneira
não-linear, a tensões do tecido espaciotemporal, como se a estrutura geométrica do
mundo fosse elástica. A gravidade (força) se identifica às deformações do espaço-tempo
(geometria). A Relatividade Geral, com efeito, é um exemplo de teoria fı́sica explici-
tamente não-linear, em cujo escopo é admissı́vel o rebatimento - ou mútua afecção -
entre a curvatura (gravitação) e suas fontes materiais. De fato, é possı́vel até mesmo
a ocorrência de processos de autocatálise pelo quais a gravitação gera gravitação - ou
seja, modelos fı́sicos em que campos gravitacionais (equivalentes a deformações da ge-
481
ometria do mundo) alteram suas caracterı́sticas interagindo consigo próprios. Em con-
seqüência, pode-se até mesmo gerar configurações não-deterministas (”caóticas”) em
que a evolução dinâmica do problema (inclusive no caso do sistema fı́sico ”Universo”)
apresentará bifurcações, ou seja, comportamento irredutivelmente imprevisı́vel.
A TRG pode ser resumida, de modo extremamente esquemático, à combinação de
duas idéias tão simples quanto poderosas. A primeira é o Princı́pio de Equivalência
(o ponto-de-vista de um observador acelerado não pode ser distinguido, por nenhum
experimento laboratorial, do ponto-de-vista de um observador inercial imerso em um
campo gravitacional), que vincula não-inercialidade e gravitação; a segunda é a rev-
olucionária associação entre a força gravitacional experimentada por um corpo e a
deformação (não-Euclidianicidade) que vigora na região do contı́nuo em que ele se en-
contra, que vincula gravitação (força) e geometria (curvatura). A geometria torna-se
um agente dinâmico, determinado em cada local pela distribuição de matéria-energia
ali presente, e simultaneamente prescrevendo o comportamento gravitacional desta
matéria. De acordo com a hipótese mais simples para a interação da gravitação com
os demais campos da fı́sica (o princı́pio do acoplamento mı́nimo), os espaços curvos de
Riemann (nos quais o comprimento de vetores permanece invariante sob transporte
infinitesimal) surgiram como generalização ’natural’ dos espaços de Minkowski para
situações em que a intensidade do campo gravitacional (ou seja, o grau de distorção das
linhas de universo na região sob exame) não pode ser desprezada. Na TRG, portanto,
a caracterização da estrutura do espaço-tempo como uma geometria não-Euclidiana de
Riemann permitirá conferir um conteúdo operacional à noção fundamental de intervalo
entre dois quaisquer eventos, pra quaisquer observadores inerciais ou acelerados.
Os notáveis sucessos da teoria no que tange a fenômenos à escala do sistema so-
lar (os chamados ”testes clássicos”) garantiram-lhe o estatuto de quadro conceitual
de fundo para a investigação dos fenômenos gravitacionais - planetários, estelares,
galáticos e, inclusive, os referentes à peculiar entidade fı́sica que denominamos de Uni-
verso. Com efeito, no escopo da Relatividade Geral torna-se possı́vel elaborar modelos
matemáticos capazes de representar a estrutura Riemanniana que, de acordo com as
equações geométrico-gravitacionais de Einstein, estaria associada ao conteúdo mate-
rial do Universo astronômico em larga escala. Coube à TRG, sobretudo, assimilar a
extraordinária observação de Edwin Hubble, de 1929, acerca do afastamento uniforme
das galáxias (ou seja, que o Universo encontra-se num estado dinâmico de expansão
global), que para muitos foi a maior descoberta já feita pelo Homem sobre o mundo
natural e assinala o nascimento da atual Cosmologia Relativı́stica.
13.4 A Cosmologia Relativı́stica
O que mais nos interessa neste ponto é constatar a aparição no domı́nio das ciências
fı́sicas, graças aos modelos cosmológicos relativı́sticos, de uma nova figura de total-
482
idade: o espaço-tempo Riemanniano da Relatividade Geral, que pelas equações ge-
ometrodinâmicas de Einstein se articularia não-linearmente com a distribuição de
matéria-energia em escala cósmica, de modo a constituir um modelo matemático do
Universo que pode ser comparado às observações. Espaço-tempo-matéria-energia: eis
a nova face do Todo, de Tudo-o-que-existe. O caráter universal (ou seja, o alcance
infinito) da atração gravitacional lhe assegura a função de organizar essa totalidade,
que pode ser denominada, praticamente no sentido do termo original grego de todo-
ordenado, de Cosmos.
Particularmente notável é o fato de podermos dispor de evidências acerca de carac-
terı́sticas globais dessa entidade: por exemplo, seu conteúdo material visı́vel, segundo
a astronomia profunda têm nos revelado, se assemelha a um ”fluido cosmológico”
notavelmente homogêneo (mais ”liso”, ou uniforme, que a superfı́cie de uma bola de
bilhar), composto por cerca de cem bilhões de galáxias - cada uma contendo em média
cem bilhões de sóis - reunidas numa hierarquia crescente de grupos, aglomerados, su-
peraglomerados e, finalmente, estruturas em larga escala, tudo isso distribuı́do num
volume de cerca de doze bilhões de anos-luz - ou cem quintilhões de quilômetros - de
raio. Ainda mais significativo, porém, é seu caráter dinâmico, caracterizado pelo afas-
tamento mútuo das galáxias descoberto por Hubble: a configuração dessa totalidade
é mutável, ou seja, o Cosmos tem uma história. Em resumo, a Totalidade pode ser
observada, e é evolutiva. Todavia, ainda que legı́timo do ponto de vista da epistemolo-
gia das ciências naturais, o Todo Evolutivo, foco do estudo da Cosmologia, será um
objeto fı́sico deveras peculiar.
Curiosamente, ao principiar as aplicações da Relatividade Geral à Cosmologia o
próprio Einstein procurou desenvolver um modelo de um Cosmos finito e estático,
por ele considerado como o mais pertinente dos pontos de vista da simplicidade e
elegância filosófica. A natureza exclusivamente atrativa da gravitação, porém, impôs
a adição de um termo suplementar ”repulsivo” nas equações de Einstein, a chamada
”constante cosmológica”, para que um modelo estático pudesse ser logrado. A insta-
bilidade intrı́nseca do Universo de Einstein frente a perturbações e, mais ainda, as
observações de Hubble acerca do processo global de afastamento das galáxias - ev-
idenciado pelo desvio para o vermelho da luz por elas emitida, tão mais acentuado
quanto mais distante estiver a fonte - logo inviabilizaram o modelo de Einstein, que
cedeu lugar à concepção de Friedman de um Universo dinâmico. Trabalhos seguintes de
De Sitter, Lemâitre e Robertson motivaram a adoção das cosmologias espacialmente
homogêneas de Friedman-Robertson-Walker (FRW) como ”geometrias-padrão”. Os
modelos FRW admitem a ocorrência de um estágio primordial muito denso e quente
que, segundo os estudos de Gamow nos anos 50 permitiriam, em conjugação com as
teorias da Fı́sica Nuclear e das Partı́culas Elementares, a elaboração de uma ”história
térmica” da matéria cósmica, associada à evolução do cenário cósmico global, repro-
duzindo adequadamente as abundâncias globais observadas dos elementos quı́micos
(nucleossı́ntese); de acordo com esta proposta, a história do Cosmos se iniciaria com
483
um prodigioso ’disparo’ primordial que assinalaria a entrada em existência do próprio
Universo, e prosseguiria até o estágio homogêneo, pouco denso e moderadamente ex-
pansivo que testemunhamos hoje.
Bondi, Hoyle e Gold, por outro lado, criticaram a concepção de Gamow, batizando-a,
ironicamente, de modelo da ”Grande Explosão Quente”(Hot Big-Bang), e sugeriram
como alternativa o chamado ”Modelo do Estado Estacionário” (Steady-State cosmol-
ogy), em que periodicamente ocorreria criação de matéria adicional de modo a fazer
a densidade cósmica invariante, apesar da expansão de Hubble, tornando assim a
evolução cosmológica compatı́vel com o chamado ”Princı́pio Cosmológico Perfeito” (o
Universo é homogêneo no espaço e no tempo). O debate só seria resolvido ao final dos
anos 60, com a descoberta (acidental) de Penzias e Wilson da presença de uma radiação
térmica (ou seja, com espectro de corpo negro) que permearia o Cosmos de todas as
direções (a chamada ”radiação cósmica de fundo de 3◦ K”) e que pôde ser interpretada,
no escopo do modelo do Big-Bang, como uma radiação residual ou ”fóssil” remanes-
cente do perı́odo primordial de grande compressão (quando o Universo, devido à alta
densidade, era opaco para os fótons). Esses sucessos - a descrição da nucleossı́ntese
e a incorporação ra radiação cósmica de fundo - fundamentaram a consolidação, na
década de 1970, do modelo da Grande Explosão Quente como eixo paradigmático
(ou ”Modelo-Padrão”) dos estudos cosmológicos. Pela primeira vez, havia sido pro-
duzida uma cosmogonia legitimamente cientı́fica, porque verificável pela observação;
a Cosmologia tornou-se assim uma disciplina própria da Fı́sica.
13.5 Problemas da Cosmologia Relativı́stica

Alternativas ao Modelo-Padrão
Não obstante esses sucessos, o Modelo-Padrão HBB apresenta uma série de graves
dificuldades técnicas e filosóficas, que podemos grupar genericamente sob dois tı́tulos:
problemas das condições iniciais - ocorrência primordial de horizontes causais que im-
pediriam a homogeneização hoje verificada; ”coincidência” com o limiar Euclidiano
entre expansão perene e recolapso, exigindo um ”ajuste fino” das condições primor-
diais; ausência da constante cosmológica, que não obstante é prevista por uma var-
iedade de teorias acerca do espectro observado de partı́culas elementares; explicação
pouco convincente para a formação das galáxias, dentre outros; e problemas da sin-
gularidade - divergências (valores infinitos) das grandezas fı́sicas na origem explosiva,
implicando, por conseguinte, a violação, nessa origem, de leis fundamentais como a
da conservação da energia e resultando em uma proveniência inescrutável para as leis
fı́sicas, dado que tal singularidade inicial constituiria uma fronteira absoluta para o
conhecimento através de modelagens causais.
Esses aspectos sumamente incômodos, bem como a escassez de observações defini-
tivas acerca do comportamento dos campos fı́sicos sob condições extremas (ou seja,
484
não-solares) conduziram ao surgimento, nos últimos anos, de uma série de propostas
alternativas visando eliminar ou ao menos atenuar as caracterı́sticas problemáticas
exibidas pelo HBB, através da alteração ou substituição de alguns dos ingredientes
básicos em jogo - por exemplo, sugestões de reinterpretação da atual fase expansiva;
modificações dos atributos usuais da matéria; introdução de outros campos fı́sicos de
caráter primordial (como nos modelos inflacionários); abandono do requisito de estrita
homogeneidade; teorias alternativas da gravitação e/ou do espaço-tempo; esboços de
cosmologia quântica, etc. Recentemente, um número crescente de observações tem in-
dicado que as variedades de matéria luminosa presente no Cosmos constituiriam não
mais que escassos 5% (cinco por cento!) do conteúdo cósmico, sendo os 95% restantes
compostos por espécies de matéria e energia ”escuras” (não-luminosas) cujos atributos
e natureza são inteiramente desconhecidos. Este problema inesperado e perturbador é
sem dúvida o grande desafio para os cosmólogos na presente década.
Transição Paradigmática?
Parece outrossim crescer entre os cosmólogos o entendimento de que a cosmogonia

associada ao HBB singular representaria um estágio preliminar de uma teoria cos-
mológica mais completa, ainda por ser estabelecida. Por exemplo, desde os anos 80
diferentes abordagens, clássicas e quânticas, têm coincidido na obtenção de cenários
compatı́veis com modelos de universos tipo-FRW porém não-singulares, ou seja, sem
”princı́pio” nem ”fim”. Assim, a idéia de um Universo ”eterno” tem ganho vigor teórico
e vem sendo encarada como suporte para uma nova visão cósmica. Num modelo sim-
ples, por, exemplo, o Universo se estenderia a partir de uma região no infinito passado
que pode ser identificada com o vazio do espaço-tempo e retornaria a esse vazio no
infinito futuro. Nosso universo hierarquizado e populado seria assim nada mais do que
uma flutuação, um estado transiente, de uma estrutura fundamental de espaço-tempo
que identificamos com o vazio Minkowskiano: uma região isenta de matéria ou de
qualquer ação dinâmica, e portanto privada de qualquer manifestação de existência
ou processo fı́sico.
Paralelamente a essa revolução nas nossas idéias sobre a totalidade espaço-tempo, os

fı́sicos vem examinando a possibilidade de um casamento entre a Teoria Quântica da
matéria e a Cosmologia provocando, por sua vez, questões de fronteira extremamente
delicadas. Entre estas, e só para citar um exemplo notável, a idéia francamente auda-
ciosa - (mas cientificamente respeitável, porquanto produzida no contexto da ciência) -
de que nosso Universo seria a conseqüência de um processo que, embora proibido den-
tro das leis da Fı́sica Clássica, ganha na Fı́sica Quântica uma probabilidade de ocorrer
(a criação do Universo por ”tunelamento quântico”). Assim, nosso Universo teria uma
probabilidade não nula de existir a partir de uma flutuação do ”vazio quântico”. Mas
quem mediria essa probabilidade? Quer dizer, se definimos nossa totalidade cósmica
como um evento quântico, que procedimento observacional a teria retirado do ”limbo”
quântico dos estados não observados, do oceano de Universos possı́veis, mas irrealiza-
485
dos (pelo menos por nós), associados a outras flutuações? Alguns cientistas foram
obrigados por essa e outras questões análogas a reverem os dogmas da interpretação
tradicional da Escola de Copenhagen, para que a concepção de um Cosmos Quântico
(totalidade que se auto-observaria) pudesse ganhar sentido.
Caberia então indagar: estarı́amos a ponto de presenciar uma autêntica transição
ou revolução paradigmática na Cosmologia? Não obstante as óbvias dificuldades do
paradigma-padrão encarnado no HBB, suas bases observacionais não foram ainda
postas em dúvida, e as várias propostas alternativas presentemente sob exame procu-
ram incorporar essas bases, dispondo portanto de um estatuto observacional equiv-
alente. Assim, somente a obtenção de novas evidências cósmicas poderá regular a
seleção dentre as variadas abordagens em curso hoje em dia e definir as linhas gerais
de uma cosmovisão reconhecidamente mais aperfeiçoada. A inauguração, na presente
década e na próxima, de aparatos de medida inovadores - detectores de ondas gravita-
cionais e de neutrinos cósmicos, novos telescópios terrestres e espaciais - permitirá pôr
em teste muitas de nossas atuais concepções fundamentais sobre o Universo em larga
escala (inclusive a TRG), permitindo antecipar a excitante perspectiva de importantes
inovações a curto e médio prazos.
13.6 Questões Epistemológicas
Finalmente, no que tange a uma avaliação do território epistemológico de moderna

Cosmologia, uma série de graves questões requer consideração atenta. O projeto cos-
mológico contemporâneo da construção de uma racionalidade para o Universo fı́sico
identifica-se, desde os trabalhos pioneiros de Einstein, Lemâitre, Eddington e outros,
às tentativas de conceituação do Universo como uma totalidade fechada, auto-referente
e (de acordo com os preceitos da TRG) organizada tão-somente pela interação grav-
itacional. A introdução dessa concepção do Cosmos como uma totalidade fechada,
todavia, acarreta dificuldade técnicas, filosóficas e mesmo puramente lógicas (como
indica o teorema de Gödel sobre sistemas formais privados de contexto).
Por exemplo, na Relatividade Geral trabalha-se com pelo menos duas noções de tempo
diferentes, o ’tempo próprio’ que cada observador emprega para comparar, de maneira
invariante, intervalos temporais (mas que carece de globalidade espacial, visto depen-
der da própria estrutura métrica local), e o tempo paramétrico ou ’coordenada-tempo’,
que possui globalidade mas não metricidade (não permite uma medida invariante
de intervalos) e pode ser reescalado de ponto a ponto (ou seja, há infinitos tempos
paramétricos equivalentes!). O tempo paramétrico, de fato, constitui a noção mais
rudimentar que se pode associar ao termo ’tempo’: uma simples linha contı́nua. Ora,
se o Universo é histórico, podemos então definir uma assimetria cósmica global (ou
tempo cosmológico) associada à expansão cósmica. Este tempo, porém, é privado
de externalidade - já que é o resultado da interação entre a configuração global de
486
matéria-energia e o tecido do espaço-tempo, e é referido a uma classe privilegiada
de observadores ditos co-moventes ou ”fundamentais” - dos quais, curiosamente, a
Cosmologia não pôde ainda se desvencilhar de modo convincente.
Se, por outro lado, definimos ”existir” por ”acontecer no espaço e no tempo”, como
é costumeiro, então ”tudo-o-que-existe” se identifica à estrutura global do contı́nuo
espaço-tempo da TRG, que é a figura de totalidade representativa dos eventos espa-
ciotemporais (acontecimentos) introduzida por Einstein e assimilada, em seguida, ao
paradigma padrão unificacionista vigente. Mas a própria Relatividade Geral, funda-
mento conceitual de tal programa, implica na possı́vel ocorrência de uma variedade
de entidades bizarras que, paradoxalmente, elidem a capacidade de registro e rep-
resentação de eventos de qualquer observador - buracos negros (sorvedouros de que
nada foge), buracos brancos (nascedouros em que nada penetra), indescritı́veis sin-
gularidades ”nuas”; ou regiões do mundo para sempre alheias, mesmo em princı́pio,
a toda possibilidade de contato ou observação devido a horizontes causais (que de-
sconectariam por completo diferentes regiões do espaço-tempo); ou ainda a existência
de ”torpezas” topológicas (como monopolos, cordões cósmicos, paredes de domı́nio)
que equivaleriam a ’fraturas’ do tecido geométrico; e até mesmo a viabilidade da con-
strução de caminhos ”fechados” nos quais avançar para o futuro significaria, para um
viajante, aproximar-se de seu passado (”viagens no tempo”), graças a ”buracos de
minhoca” construı́dos com algum tipo de matéria ”exótica” e que possibilitariam por
em contato locais muitı́ssimo distantes do Universo (ou até, especulativamente, de
Universos diferentes...), e etcetera. Qual o estatuto de existência dessas configurações
peculiares que, embora postas em cena pela TRG (o quadro conceitual de fundo,
repetimos, para nossa descrição dos fenômenos em escala cósmica) acabam por se
evadir de toda representação espaciotemporal? Seria necessário, talvez, invocar uma
modalidade ainda mais abrangente de ”realidade”, ou mesmo uma nova ”totalidade
universal”, que subsumisse igualmente essas entidades exóticas? Ou um tal impasse
sugeriria uma crise dos próprios fundamentos metacosmológicos em que se apóia a cos-
mologia clássica, que assim demandaria uma profunda crı́tica da razão cosmológica?
Em relação aos problemas associados à noção de totalidade cabe ainda citar a busca por
uma formulação unificada da qual todos os fenômenos observados pudessem ser deriva-
dos, a qual remonta à antiga aspiração por uma unificação das causas dos fenômenos
fı́sicos (”Unidade do Mundo”) e que constitui o cerne do moderno Programa de Ein-
stein em prol da obtenção de uma ordem harmônica e determinada para o Universo.
Na atualidade, este objetivo se encarna na procura por uma base comum que permita
a fusão das linguagens próprias aos domı́nios Macro- e Microscópico da Fı́sica, através
da integração das quatro interações conhecidas - gravitação, eletromagnetismo, força
nuclear fraca, força nuclear forte - em um único corpo descritivo - uma Teoria de Tudo.
As chamadas Teorias de Cordas e Teorias de Branas são, na atualidade, as candidatas
mais bem consideradas para a viabilização deste programa.
487
Embora dominante em nossa época, principalmente em virtude dos sucessos al-
cançados pelas chamadas teorias de calibre da Fı́sica de Partı́culas, este projeto de
modo algum é o único perseguido pelos fı́sicos (como alternativas, podem ser cita-
dos por exemplo o Programa de Boltzmann de fundamentação do mundo fı́sico a
partir de um fecundo ”caos” originário, ou o Programa de Dirac de multiplicação das
variáveis cósmicas) e tem sido obstaculizado pela forte não-linearidade das equações da
gravitação, que impediu até aqui a elaboração de uma teoria satisfatória da gravitação
e do espaço-tempo em escalas quânticas. A aguda sensibilidade dos modelos de que
atualmente dispomos com relação a variações das (inacessı́veis) condições iniciais -
insinuando um ”design” cósmico primordial incrivelmente preciso para uma variedade
de cenários razoáveis - é outra dificuldade encontrada na implementação de uma to-
talização auto-suficiente do mundo. Como derradeira observação, sugerimos que o
próprio apogeu do programa cosmológico contemporâneo, seus impasses e realizações,
parecem demandar por uma reavaliação das diretrizes metodológicas e mesmo do ”te-
los” conceitual do atual corpo de modelizações totalizantes e auto-referentes acerca do
Universo em que habitamos, procurando ampliar o escopo de compreensão dos pro-
cessos cósmicos, já como pertinentes a um Universo contextualizado, incorporado a
um complexo ulterior de relações que o abrange e ultrapassa - uma totalidade aberta.
Bibliografia básica:
A. Novaes, Org., A Crise da Razão (MINC/Funarte - Companhia das Letras, São
Paulo, 1996).
A. Novaes, Org., O Homem-Máquina (Companhia das Letras, São Paulo, 2003).
Alexandre Koyré, Do Mundo Fechado ao Universo Infinito (Forense/EdUSP, São
Paulo, 1979).
Arthur Koestler, O Homem e o Universo (Ibrasa, São Paulo, 1989).
Craig Stanford, Como nos Tornamos Humanos (Campus, Rio de Janeiro, 2004)
Daniel Boorstin, Os Descobridores (Civilização Brasileira, Rio de Janeiro, 1989).
Edward Speyer, Seis Caminhos a partir de Newton, (Campus, Rio de Janeiro, 1995).
Ernesto Sábato, Nós e o Universo (Francisco Alves, Rio de Janeiro, 1985).
F. Balibar, Einstein: uma Leitura de Galileu e Newton, (Edições 70, Lisboa, 1988).
F. Durham & R. Purrington, Frame of the Universe (Columbia University Press, New
York, 1983).
Fayga Ostrower, A Sensibilidade do Intelecto (Campus, Rio de Janeiro, 1998).
G. C. Branco, Org., Descartes - A Ordem das Razões , A Ordem das Paixões (NAU
Editora, Rio de Janeiro, 1999).
George Withrow, O Tempo na História (Jorge Zahar, Rio de Janeiro, 1997).
Géza Szamosi, Tempo e Espaço - as Dimensões Gêmeas (J. Zahar, Rio de Janeiro,
1988).
488
Giorgio de Santillana & Hertha von Deschend, Hamlet’s Mill (David R. Godine,
Boston, 1983).
Heinz Pagels, O Código Cósmico (Gradiva, Lisboa, s/d).
Hubert Reeves, Um Pouco Mais de Azul (Martins Fontes, São Paulo, 1986).
Ian Stewart, Será que Deus joga dados? (J. Zahar, Rio de Janeiro, 1991).
Ilya Prigogine & Isabelle Stengers, Entre o Tempo e a Eternidade (Gradiva, Lisboa,
1990).
Jean Pierre Vernant, As Origens do Pensamento Grego (Difel, São Paulo, 1981).
Jorge Luı́s Borges, Ficções (Globo, São Paulo, 1997).
M. Doctors, Org., Tempo dos Tempos (J. Zahar, Rio de Janeiro, 2003).
Margaret Wertheim, Uma História do Espaço de Dante à Internet (J. Zahar, Rio de
Janeiro, 2002).
Mário Novello, Cosmos e Contexto (Forense Universitária, Rio de Janeiro, 1988).
Mário Novello, O Cı́rculo do Tempo (Campus, Rio de Janeiro, 1997).
Martin Rees, A Evolução do Universo, in Andrew C. Fabian, Org., A Evolução (Ter-
ramar, Lisboa, 2000).
Max Born, Einstein’s Theory of Relativity (Dover, New York, 1965).
Michael Friedman, Foundations of Space-Time Theories (Princeton University Press,
New Jersey, 1983).
Mircea Eliade, O Mito do Eterno Retorno (Edições 70, Lisboa, s/d).
Nigel Calder, O Universo de Einstein (Ed. UnB, Brası́lia, 1988).
P. Coveney & R. Highfield, A Flecha do Tempo (Siciliano, Rio de Janeiro, 1993).
Paul Davies, Space and Time in the Modern Universe (Cambridge University Press,
London, 1977).
Rudy Rucker, The Fourth Dimension (Houghton Mifflin, Boston, 1984).
Steven Weinberg, Os Primeiros Três Minutos (Gradiva, Lisboa, 1988).
Thomas S. Kuhn, A Estrutura das Revoluções Cientı́ficas (Perspectiva, São Paulo,
1975).
Timothy Ferris, O Despertar na Via-Láctea (Campus, Rio de Janeiro, 1990).
489

Programa Mínimo de Cosmologia

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Programa Mínimo de Cosmologia

Enviado por

Direitos autorais:

Formatos disponíveis

Programa Mı́nimo de Cosmologia

3 Introdução à Cosmologia 122

4 Termodinâmica em Relatividade Geral. 177

5 Fı́sica de Objetos Compactos 186

6 Buracos Negros 220

7 Astrofı́sica de Ondas Gravitacionais 263

11 Geometria Diferencial 386

12 Teoria da Relatividade Especial 394

13 Panorama Breve da Cosmologia Contemporânea 456

1.2 Teoria Newtoniana da gravitação

Diferentemente das outras constantes universais a constante de gravitação G não é

G = (6, 6742 ± 0, 0010) × 10−11 m3 kg −1 s−2 .

As quantidades m1 e m2 aparecendo nas equações acima são os termos de fonte da

Como é bem conhecido, a energia potencial Ep é construı́da a partir do conhecimento de

De maneira similar, definimos o potencial gravitacional como a energia potencial por

Uma vez que dm0 = ρ(~r 0 )dV 0 , segue que

Figura 1.4: Distribuição contı́nua de massa: representação a partir de um sistema de

Esta expressão corresponde exatamente ao potencial gravitacional gerado por uma

1.2.2 Multipolos gravitacionais

Então xk , com k = 1, 2, 3, representa a k-ésima componente do vetor ~r. Nesta

Esta igualdade é conhecida como princı́pio de equivalência Newtoniano.

1.2.4 Forças de maré

posta em movimento permanece em movimento com velocidade constante. É importante

Fazemos agora a seguinte pergunta: é possı́vel para o observador no laboratório em

Similarmente, a origem O0 estará sujeita a uma aceleração gravitacional

Então, a componente na direção x desta aceleração será

que podemos apresentar na forma

Supondo que x  ro , podemos efetuar a expressão

onde F k representa a k-ésima componente da força gravitacional sobre uma dada

onde a última igualdade segue diretamente de Eq. (1.45).

uµ = γ (c, vx , vy , vz ) = γ(c, v i ). (1.56)

Então, de (1.56) e (1.57), segue

Na última igualdade acima definimos (identificamos) a energia total relativı́stica

e o momentum relativı́stico (componentes)

Como vemos, a energia e o momentum aparecem como componentes de um mesmo objeto,

1.3.2 O tensor energia-momento de um fluido perfeito em movi-

As equações (1.70) e (1.71) correspondem, respectivamente à equação da continuidade e

Assim, de (1.71) e (1.76)

1.4 Teoria Linear da Gravitação

∂α ∂ α φµν + a ∂α ∂ (µ φν)α + b ∂ µ ∂ ν φα α + c τ µν ∂α ∂ α φβ β + d τ µν ∂α ∂β φαβ = −κ T µν , (1.78)

onde a, b, c, d e κ são constantes que trataremos de fixá-las a seguir. Obviamente,

Assim, as equações de campo se reduzem à,

(1 + a) ∂ α ∂α ∂ν φµν + (a + d) ∂ µ ∂α ∂β φαβ + (b + c) ∂ µ ∂ α ∂α φβ β = 0, (1.80)

mostrando assim, que as constantes devem obedecer às seguintes condições :

Os valores que podem tomar as constantes b e c (b ou c), conduzem a diferentes equações

∂α ∂ α φµν − ∂α ∂ (µ φν)α + ∂ µ ∂ ν φα α − τ µν ∂α ∂ α φβ β − ∂α ∂β φαβ = −κ T µν .

φµν;α α − φα(µ;ν) α + φα α;µν − γµν φβ β ;α α − τ µν φαβ ;αβ = −κ T µν ,

Do princı́pio da mı́nima ação 9 , se tomarmos a variação de Sφ igual a zero, estaremos

e as equações de campo resultam do princı́pio da mı́nima ação :

de onde, usando a propriedade de simetria do tensor potencial, resulta as seguintes

4 C1 φαβ,γ γ + 2 C2 φρ(α,β) ρ + 2 C3 φ,αβ + 4 C4 τ αβ φ,τ τ + 2 C3 τ αβ φτ σ ,τ σ = −κ T αβ . (1.99)

Logo, em vista de se obter uma lei de conservação , ou mais diretamente, comparando

Por conveniência de notação , vamos definir o tensor simétrico de ordem 2, G(L)

φαβ → φαβ + Λ(α,β) . (1.108)

1.4.4 Problemas com a Lei de Conservação da Energia

e a identidade (1.113) leva à seguinte lei de conservação :

1.4.5 O tensor energia-momento do campo gravitacional — primeira

L = L(ξ, ξ,µ ), (1.116)

1.4.6 Balanço de momentum-energia entre a Matéria e o Campo

e a lei de conservação que segue é dada por,

O termo do lado esquerdo pode se expandido na forma

Mas, transformando a última integração de volume para superfı́cie — teorema de Gauss

Vamos definir o 4-vetor momentum13 , Pα , da partı́cula,

E por último, usaremos uma aproximação para a expressão do tensor momentum-energia

Supondo que x ro , podemos efetuar a expressão

u = vo + v1 + O(2 ). (1.301)