Você está na página 1de 497

Programa Mı́nimo de Cosmologia

Frontispı́cio
Este é o texto do frontispı́cio do livro.

ii
Índice

1 Teoria da Gravitação 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoria Newtoniana da gravitação . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 A lei da gravitação universal . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Multipolos gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 Massa inercial e massa gravitacional . . . . . . . . . . . . . . . . . 11
1.2.4 Forças de maré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 O tensor energia-momento . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Notação e definições . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.2 O tensor energia-momento de um fluido perfeito em movimento . . 17
1.4 Teoria Linear da Gravitação . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 Construindo as Equações de Campo . . . . . . . . . . . . . . . . . . 19
1.4.2 Equações de Campo como Consequência de um Princı́pio Variacional 22
1.4.3 Transformação de calibre . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.4 Problemas com a Lei de Conservação da Energia . . . . . . . . . . . 25
1.4.5 O tensor energia-momento do campo gravitacional — primeira aprox-
imação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.4.6 Balanço de momentum-energia entre a Matéria e o Campo Grav-
itacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.7 As Equações de Campo no Limite Newtoniano . . . . . . . . . . . . 31
1.5 Teoria da Relatividade Geral . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5.1 O princı́pio da equivalência . . . . . . . . . . . . . . . . . . . . . . 33
1.5.2 As equações de campo . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.5.3 O limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6 A solução de Schwarzschild e aplicações . . . . . . . . . . . . . . . . . . . . 41
1.6.1 Movimento de partı́culas teste na solução de Schwarzschild . . . . . 44
1.6.2 Testes de campo solar . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1.8 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

2 Cosmologia I: Fenomenologia 58
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.2 O Universo Observado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2.1 Galáxias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2.2 Grupos e Aglomerados de Galáxias . . . . . . . . . . . . . . . . . . 66
2.2.3 O Cosmos Dinâmico: O Universo em Expansão . . . . . . . . . . . 74
2.2.4 Estrutura em Grande Escala . . . . . . . . . . . . . . . . . . . . . . 78
2.3 O Universo Homogêneo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.1 Dinâmica: A equação de Friedmann . . . . . . . . . . . . . . . . . 82

iii
2.4 O Universo Homogêneo II . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.4.1 Uma Breve História Térmica do Universo . . . . . . . . . . . . . . . 87
2.5 O Universo Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.5.1 O Crescimento Linear das Estruturas (Newtoniano) . . . . . . . . . 91
2.5.2 O Universo Muito Perturbado: Simulações Computacionais . . . . . 103
2.6 Sı́tios de Internet Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . 103
2.7 Livros sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.8 Artigos Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.9 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.10 Glossário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.11 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

3 Introdução à Cosmologia 122


3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.2 Cosmologia Relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.3 Quantidades Cinemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
3.4 Fontes da Curvatura do Espaço-Tempo . . . . . . . . . . . . . . . . . . . . 132
3.5 Modelos Cosmológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
3.5.1 Modelo Cosmológico de Einstein . . . . . . . . . . . . . . . . . . . . 137
3.5.2 Modelos Cosmológicos de Lemaı̂tre . . . . . . . . . . . . . . . . . . 139
3.5.3 Modelo cosmológico de Friedman . . . . . . . . . . . . . . . . . . . 141
3.5.4 Análise geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
3.6 Modelos cosmológicos com menos simetria . . . . . . . . . . . . . . . . . . 143
3.7 Modelo Cosmológico de Kasner (1921) . . . . . . . . . . . . . . . . . . . . 143
3.8 Modelo de Gödel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
3.8.1 A Solução de Gödel . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
3.9 Campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.10 Universo Homogêneo Isotrópico não Singular . . . . . . . . . . . . . . . . . 160
3.10.1 Fótons Não-Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . 160
3.10.2 Solução Cósmica Homogênea e Isotrópica . . . . . . . . . . . . . . . 162
3.11 Modelo cosmológico padrão: sucessos e dificuldades . . . . . . . . . . . . . 163
3.11.1 Equação de evolução de σµν . . . . . . . . . . . . . . . . . . . . . . . 164
3.11.2 Equação de evolução de ωµν . . . . . . . . . . . . . . . . . . . . . . 165
3.11.3 Equações de vı́nculo . . . . . . . . . . . . . . . . . . . . . . . . . . 165
3.11.4 Decomposição de um tensor anti-simétrico . . . . . . . . . . . . . . 168
3.11.5 Tensor de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.11.6 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . 174
3.12 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

4 Termodinâmica em Relatividade Geral. 177


4.1 Termodinâmica de Processos Dissipativos . . . . . . . . . . . . . . . . . . . 180
4.2 Aplicação á Cosmologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
4.3 Exercı́cio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
4.4 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185

5 Fı́sica de Objetos Compactos 186


5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
5.2 Anãs brancas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
5.2.1 O advento da degenerescência: mecânica quântica em ação . . . . . 190
5.3 Modelagem de anãs brancas tipo politropo . . . . . . . . . . . . . . . . . . 193

iv
5.3.1 Limite de baixa densidade (Γ = 5/3) . . . . . . . . . . . . . . . . . 193
5.3.2 Limite de alta densidade (Γ = 4/3) . . . . . . . . . . . . . . . . . . 195
5.4 O limite de massa de Chandrasekhar . . . . . . . . . . . . . . . . . . . . . 195
5.5 Anãs brancas: São verdadeiramente observadas no céu? . . . . . . . . . . . 197
5.6 Estabilidade de estrelas anãs brancas . . . . . . . . . . . . . . . . . . . . . 198
5.6.1 Estabilidade de ABs na relatividade geral . . . . . . . . . . . . . . 198
5.7 Estrelas de Nêutrons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.8 Equação de estado de gás perfeito no domı́nio nuclear . . . . . . . . . . . . 204
5.9 Modelos realı́sticos de estrelas de nêutrons . . . . . . . . . . . . . . . . . . 208
5.9.1 Massa máxima de ENs . . . . . . . . . . . . . . . . . . . . . . . . . 211
5.10 Estrelas de nêutrons: são realmente observadas no céu? Possuem as pro-
priedades preditas? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.10.1 Pulsares binários . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11 Apêndice A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.13 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

6 Buracos Negros 220


6.1 Um pouco de história . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
6.2 A solução de Schwarszchild . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
6.2.1 Singularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
6.2.2 Diagrama do espaço-tempo na geometria de Schwarszchild . . . . . 225
6.2.3 Outros sistemas dee coordenadas? . . . . . . . . . . . . . . . . . . . 229
6.2.4 Horizonte de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 230
6.3 Colapso gravitacional e buracos negros . . . . . . . . . . . . . . . . . . . . 232
6.4 Mecânica celeste no campo gravitacional de um buraco negro de Schwarszchild234
6.5 Coordenadas de Kruskal-Szekeres . . . . . . . . . . . . . . . . . . . . . . . 239
6.6 Outros buracos negros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
6.6.1 O buraco negro de Kerr . . . . . . . . . . . . . . . . . . . . . . . . 242
6.6.2 Propriedades da solução de Kerr . . . . . . . . . . . . . . . . . . . . 243
6.6.3 Buracos negros carregados . . . . . . . . . . . . . . . . . . . . . . . 251
6.6.4 O buraco negro mais geral . . . . . . . . . . . . . . . . . . . . . . . 251
6.7 Buracos Negros Astrofı́sicos . . . . . . . . . . . . . . . . . . . . . . . . . . 252
6.8 Buracos negros e mecânica quântica . . . . . . . . . . . . . . . . . . . . . . 254
6.9 Termodinâmica de buracos negros . . . . . . . . . . . . . . . . . . . . . . . 256
6.10 Coda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
6.11 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 258
6.12 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260

7 Astrofı́sica de Ondas Gravitacionais 263


7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
7.2 Geração de ondas gravitacionais na TGR . . . . . . . . . . . . . . . . . . . 264
7.3 Linearização da TGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.3.1 A transformação de calibre . . . . . . . . . . . . . . . . . . . . . . . 270
7.4 Mais um vı́nculo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
7.4.1 O calibre transverso-sem-traço . . . . . . . . . . . . . . . . . . . . 273
7.5 Polarização de Ondas Gravitacionais . . . . . . . . . . . . . . . . . . . . . 276
7.6 Ondas gravitacionais emitidas por massas aceleradas: Pulsares . . . . . . . 277
7.6.1 OGs a partir de pulsares accelerados na Galáxia . . . . . . . . . . . 277
7.7 Ondas gravitacionais emitidas por sistemas binários . . . . . . . . . . . . . 280

v
7.8 Taylor & Hulse: Um prêmio Nobel pelas OGs do pulsar binário PSR 1913
+ 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.9 Astronomia de ondas gravitacionais . . . . . . . . . . . . . . . . . . . . . . 290
7.10 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
7.11 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292

8 Astropartı́culas I 293
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
8.2 Modelo Padrão de Partı́culas Elementares . . . . . . . . . . . . . . . . . . 294
8.2.1 A força forte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
8.2.2 A força fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
8.2.3 A classificação padrão . . . . . . . . . . . . . . . . . . . . . . . . . 300
8.3 Elementos de Teoria de Grupos . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
8.3.3 Revisitando a classificação das partı́culas elementares . . . . . . . . 308
8.4 Elementos de Teoria de Campos . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.1 Campo Escalar Real . . . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.2 Campo Eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . 314
8.4.3 Mecanismo de Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . 315
8.5 Unificação das Forças Fundamentais e Transições de Fase . . . . . . . . . . 317
8.6 O Universo como um acelerador . . . . . . . . . . . . . . . . . . . . . . . . 321
8.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
8.8 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

9 Astropartı́culas II 325
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
9.2 Defeitos Topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.3 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.4 Paredes cósmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
9.5 Tensor de momento energia para um fluido de parede cósmica . . . . . . . 329
9.6 Cordas cósmicas e monopolos . . . . . . . . . . . . . . . . . . . . . . . . . 330
9.6.1 Defeitos topológicos e os raios cósmicos de alta energia . . . . . . . 334
9.7 O modelo de Inflação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.8 Os problemas do Modelo Cosmológico Padrão . . . . . . . . . . . . . . . . 336
9.8.1 O problema do horizonte . . . . . . . . . . . . . . . . . . . . . . . . 336
9.8.2 O problema da platitude . . . . . . . . . . . . . . . . . . . . . . . . 337
9.8.3 O problema das perturbações primordiais . . . . . . . . . . . . . . . 338
9.8.4 O problema dos monopolos magnéticos . . . . . . . . . . . . . . . . 339
9.9 Uma fase de expansão acelerada no Universo primordial . . . . . . . . . . . 340
9.10 Implementando um modelo inflacionário . . . . . . . . . . . . . . . . . . . 342
9.11 Matéria e energia escuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.12 A matéria escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.13 A energia escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
9.14 Constante cosmológica, quintessência ou... . . . . . . . . . . . . . . . . . . 353
9.15 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356

vi
10 Gravitação e Cosmologia Quânticas 357
10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
10.1.1 Argumentos a favor da construção de uma Teoria Quântica da
Gravitação e da chamada Cosmologia Quântica . . . . . . . . . . . 358
10.2 Gravitação Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.1 Quantização Canônica . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.2 Quantização Covariante . . . . . . . . . . . . . . . . . . . . . . . . 369
10.2.3 Gravitação Quântica de Laços ou Supercordas? Ou ambas? . . . . . 371
10.3 Cosmologia Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.3.1 A interpretação de Bohm-de Broglie . . . . . . . . . . . . . . . . . . 374
10.3.2 A Cosmologia Quântica e a singularidade cosmológica . . . . . . . . 376
10.3.3 Condições iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
10.4 Comparação com a Observação . . . . . . . . . . . . . . . . . . . . . . . . 380
10.4.1 Verficação da natureza discreta do espaço-tempo . . . . . . . . . . . 380
10.4.2 Uma escala de Planck observável . . . . . . . . . . . . . . . . . . . 381
10.4.3 A radiação de fundo e a Cosmologia Quântica . . . . . . . . . . . . 382
10.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
10.6 Leituras Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
10.7 Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385

11 Geometria Diferencial 386


11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386
11.2 Objetos geométricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.2.1 Curvas e vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.2.2 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387
11.3 Derivada covariante de campos tensoriais . . . . . . . . . . . . . . . . . . . 388
11.4 O tensor de curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
11.5 O tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
11.6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392

12 Teoria da Relatividade Especial 394


12.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
12.1.1 Sinopse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394
12.2 Mecânica versus Eletromagnetismo . . . . . . . . . . . . . . . . . . . . . . 395
12.2.1 Mecânica de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . 396
12.2.2 Grupo de Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
12.2.3 Eletromagnetismo de Maxwell . . . . . . . . . . . . . . . . . . . . . 398
12.3 Fundamentos da Relatividade Especial . . . . . . . . . . . . . . . . . . . . 400
12.3.1 Princı́pio da Relatividade Especial . . . . . . . . . . . . . . . . . . 401
12.3.2 Sincronicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
12.4 Transformações de coordenadas de Lorentz . . . . . . . . . . . . . . . . . . 404
12.4.1 Coordenadas transversas . . . . . . . . . . . . . . . . . . . . . . . . 405
12.4.2 Dilatação do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
12.4.3 Contração do comprimento . . . . . . . . . . . . . . . . . . . . . . . 408
12.4.4 Simultaneidade relativa . . . . . . . . . . . . . . . . . . . . . . . . . 409
12.4.5 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . 410
12.5 Cinemática relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
12.5.1 Sistemas mecânicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
12.5.2 Sistemas ondulatórios . . . . . . . . . . . . . . . . . . . . . . . . . . 416
12.6 Mecânica relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420

vii
12.6.1 Momentum linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
12.6.2 Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
12.7 Espaço-tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
12.7.1 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . 426
12.7.2 Geometria do espaço-tempo de Minkowski . . . . . . . . . . . . . . 431
12.7.3 Diagramas de espaço-tempo . . . . . . . . . . . . . . . . . . . . . . 433
12.8 Cálculos simples em relatividade . . . . . . . . . . . . . . . . . . . . . . . . 437
12.8.1 Paradoxo dos gêmeos . . . . . . . . . . . . . . . . . . . . . . . . . . 438
12.8.2 Paradoxo da garagem . . . . . . . . . . . . . . . . . . . . . . . . . . 441
12.9 Formalismo tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.1 Rotações espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.2 Grupo de Lorentz-Poincaré . . . . . . . . . . . . . . . . . . . . . . . 446
12.10Contribuições da fı́sica experimental . . . . . . . . . . . . . . . . . . . . . . 451
12.11Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
12.12Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454

13 Panorama Breve da Cosmologia Contemporânea 456


13.1 Introdução: A Cosmologia e seus Objetivos . . . . . . . . . . . . . . . . . . 456
13.2 Os Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
13.3 Os Fundamentos: As Teorias da Relatividade . . . . . . . . . . . . . . . . 478
13.4 A Cosmologia Relativı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . 482
13.5 Problemas da Cosmologia Relativı́stica . . . . . . . . . . . . . . . . . . . . 484
13.6 Questões Epistemológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

viii
Capı́tulo 1

Teoria da Gravitação

Vitorio de Lorenci1

1.1 Introdução
Desde o surgimento da teoria da gravitação universal, fundamentada por I. Newton
no ano de 1686 [1], os efeitos relacionados a este fenômeno vêm sendo testados experi-
mentalmente nas mais distintas situações , e com regularidade crescente. A interação
gravitacional é reconhecidamente muito fraca quando comparada às demais interações
da natureza e em consequência é muito difı́cil a realização de testes para tal fenômeno
em laboratórios terrestres. O cosmos, há muito tempo vem exercendo o papel de nosso
melhor campo de medições dos efeitos gravitacionais e de fato, a sua observação ao longo
de tantos anos foi fator preponderante no encaminhamento das formulações teóricas para
a descrição deste processo.
Já no inı́cio do século XX a comunidade cientı́fica estava ciente da não aplicabilidade
da teoria Newtoniana na previsão de alguns fenômenos naturais, como por exemplo a
precessão do periélio das órbitas planetárias, o que levou diversos pesquisadores a propor
novas teorias a fim de completar o quadro experimental até então determinado. A in-
trodução de outras teorias, na maior parte das vezes, levou à predição de novos efeitos,
que puderam ser submetidos à examinação a fim de se resolver pela consistência da teoria
em seus resultados. Neste sentido, a ciência teórica e experimental, no que diz respeito à
interação gravitacional, tem caminhado em contı́nua dependência.
Das teorias que surgiram no intervalo de tempo que vai de 1686 até os dias atuais,
uma única tem se mostrado, pela excelência de seus resultados postos à experimentação ,
como a boa teoria da gravitação . Esta, a bem conhecida teoria da relatividade geral,
desenvolvida por A. Einstein [2] na primeira metade do século XX, tem sido amplamente
testada e comprovada em todas as suas predições 2 .
1
Afiliação: Instituto de Ciências Exatas (ICE), Universidade Federal de Itajubá (UNIFEI), PO Box
50 37500-903 Itajuba, MG.
2
Existem certos efeitos relacionados à precessão do periélio das órbitas de sistemas estelares duplos,
onde a configuração de campo é extremamente forte, que ainda não se pode dizer que sejam adequada-
mente previstos pelas soluções da teoria da relatividade geral. Os mais famosos destes sistemas são o
DI Herculis e AS Camelopardalis. No entanto, existem muitos fatores extras, relacionados a estrutura
interior das estrelas e da vizinhança, que devem resultar em grandes perturbações em seu movimento.

1
Vamos fazer um breve histórico de algumas das possibilidades que são de particular
interesse ao nosso trabalho, no que diz respeito a teorias para o campo gravitacional, antes
de examinarmos alguns aspectos da relatividade geral.
Uma primeira condição fundamental que qualquer teoria da gravitação deve satisfazer
é o princı́pio de covariância de Lorentz. O que significa que, na situação em que o
campo gravitacional for nulo, a teoria da relatividade especial (veja o Capı́tulo 12 e [3])
deve emergir naturalmente do arcabouço da teoria gravitacional. Esta condição deve
ser imposta sobre a teoria para que a mesma seja compatı́vel com a experimentação ,
que já é largamente verificada para este princı́pio. Uma segunda condição consiste na
obtenção da formulação clássica Newtoniana como uma situação limite na aproximação
de campo gravitacional fraco em regime de baixas velocidades. Como é bem conhecido,
nesta situação limite, a teoria clássica se ajusta bem aos dados experimentais. Uma vez
obtida uma formulação que respeite a estas condições assimptóticas, deve-se passar aos
testes padrões da gravitação , quais sejam: (i) desvio espectral; (ii) a deflexão dos raios
luminosos em um dado campo gravitacional; (iii) o atraso temporal dos pulsos de radar
emitidos (e refletidos) ao encontro de uma região de campo gravitacional crescente, como
por exemplo na direção dos planetas interiores (mais próximos do Sol); e por fim, (iv)
a precessão do periélio das órbitas planetárias. Para uma revisão sobre os testes padrões
da gravitação , veja as referências [4, 5, 6, 7, 8, 9, 10]. Estes testes são conhecidos como
testes de campo solar, e foram os primeiros realizados no intuito de se testar a teoria
da relatividade geral. Estes requerimentos são, como ponto de partida, indispensáveis a
qualquer boa teoria da gravitação .
Ao passarmos à formulação da teoria, surge a questão da escolha dos objetos matemá-
ticos que devem ser usados na sua construção . Podemos escolher, de forma geral, entre
uma formulação escalar, vetorial ou tensorial, a qual está intimamente relacionada com o
spin da partı́cula que carregará a interação gravitacional. Para os casos acima citados o
spin será sempre inteiro3 . Uma boa maneira de se resolver qual quantidade matemática é
mais adequada à descrição da gravitação consiste em estabelecermos qual deve ser a fonte
material para este fenômeno. Para isto, devemos impor que exista uma lei de conservação
envolvida, que será manifestada pela divergência nula do objeto representando a fonte
para a interação em questão. De inı́cio, já podemos descartar a formulação vetorial,
uma vez que o único objeto vetorial que conhecemos que tem associado a ele uma lei de
conservação é o 4-vetor corrente, assim uma teoria construı́da com este objeto em nada
diferiria do eletromagnetismo. Além disto, uma teoria construı́da com campos de spin 1
— vetorial — leva a dois tipos de potencial, um atrativo e outro repulsivo. E, uma vez que
a gravitação somente se manifesta atrativamente, não podemos usar tais objetos na sua
descrição matemática. Um histórico sobre as possibilidades de se formular tais teorias foi
realizado por Gupta, especialmente na referência [12]. A menos do 4-vetor corrente, existe
o tensor momentum-energia da matéria, Tµν , que é um objeto Lorentz-covariante e tem
dimensão de densidade de energia, assim como esperarı́amos de um bom candidato à fonte
material da gravitação . Com este tensor, à primeira vista, podemos dar prosseguimento
tanto à formulação escalar, tomando o traço de Tµν para representar a fonte material,
quanto a formulação tensorial, assumindo o tensor momentum-energia completo como
fonte material da teoria. O primeiro caso é particularmente problemático, pois como é bem
conhecido, o traço do tensor momentum-energia associado ao campo de Maxwell (teoria do
Com a melhoria da tecnologia dos rádio-telescópios nos últimos anos, tais problemas poderão ser avaliados
com maior precisão brevemente e uma resposta mais conclusiva poderá ser aferida.
3
Spin semi inteiro leva a problemas com respeito a obtenção de configurações de campo gravitacional
estático, que está em contradição imediata com os resultados da teoria Newtoniana. Para um breve
estudo sobre este assunto, veja o prefácio da referência [11].

2
campo eletromagnético) é identicamente nulo, logo, não contribuiria como fonte material
da gravitação caso a teoria que a representasse fosse escalar. Fato este que está em contra-
ponto com o princı́pio de equivalência Newtoniano4 , que estabelece que a massa de repouso
total de um sistema interage com o campo gravitacional. Poderı́amos ainda, construir
objetos escalares com o tensor momentum-energia utilizando contrações com 4-vetores,
como por exemplo com o 4-vetor velocidade. No entanto, de forma geral teorias escalares
à gravitação não são compatı́veis com os resultados experimentais. Para fins de revisão,
umas das melhores tentativas de teorias escalares foi formulada por Otto Bergmann, em
1955, e prescreve um valor para a precessão do periélio das órbitas planetárias que é 1/6
do valor correto e em sentido de precessão contrário ao observado [13]. Resta-nos assim,
o caso tensorial. Nesta formulação , a fonte dos efeitos gravitacionais é representada
pelo tensor de momentum energia da matéria, e em princı́pio, não apresenta problemas,
contrariamente ao que acontece para as teorias escalar e vetorial. Ora, se admitirmos a
fonte material do campo gravitacional sendo um tensor de segunda ordem, é natural que
façamos a escolha de um objeto tensorial também de segunda ordem para representar o
próprio campo gravitacional.
Vamos começar examinando a situação mais simples possı́vel, em que as equações
resultem ser lineares. O único critério que temos para nos orientar na derivação das
equações de campo, consiste na imposição de uma lei de conservação associada ao
tensor momentum-energia da matéria. A teoria que emerge deste procedimento é a bem
conhecida teoria de Fierz-Pauli [14] para campos de spin-2. Uma vez obtida a equação
de movimento, a construção desta teoria através de um princı́pio variacional é elementar,
ou seja, pode-se facilmente obter a Lagrangeana que resulta nestas equações . Entretanto,
um grave problema ocorre quando procuramos ajustar tal teoria à descrição dos efeitos
gravitacionais, qual seja, o limite de campo fraco e baixas velocidades não resulta na teo-
ria clássica Newtoniana. Este problema tem origem na lei de conservação envolvida para
a teoria linear onde encontramos que o tensor momentum-energia se conserva separada-
mente. Este processo gera uma inconsistência fı́sica, pois o próprio campo gravitacional
tem uma energia associada, e como qualquer tipo de energia interage gravitacionalmente,
esta energia deve também ser fonte do próprio campo, logo, o tensor momentum-energia
da matéria não pode se conservar separadamente. Eis a razão da teoria estritamente lin-
ear não corresponder ao limite clássico. Uma maneira de se contornar este problema é
somando às equações de campo a energia do campo gravitacional. Podemos realizar isto
facilmente se observarmos que a Lagrangeana da teoria linear tem associado a ela um
tensor de momentum-energia (que é de ordem 2 do campo), assim, podemos derivá-lo e
acrescentá-lo às equações . Agora, as equações que resultam, possuem uma lei de con-
servação e o limite Newtoniano é recuperado. Entretanto, surge aqui uma interessante
questão: como somamos às equações de campo um novo termo, que chamamos de ten-
sor momentum-energia do campo gravitacional, as mesmas foram modificadas, assim, a
Lagrangeana que as resulta não é mais a da teoria linear. Então, se derivarmos a nova
Lagrangeana para esta teoria, associada a ela haverá um novo tensor momentum-energia,
agora em ordem maior de não linearidade no tensor que representa o campo gravitacional.
E, se somarmos este objeto nas equações de movimento, as modificaremos novamente,
gerando um processo que se repete a cada ordem de correção da energia, apontando final-
mente para uma inconsistência nesta formulação . A única forma de tornarmos esta teoria
completa é somando todos os infinitos termos de energia que surgem da Lagrangeana do
campo corrigida em cada ordem. Uma excelente abordagem deste procedimento é apre-
4
Consequentemente com a observação , onde se pode medir efeitos gravitacionais relacionados com a
energia do campo eletromagnético.

3
sentada na referência [11]. Alguns autores demonstraram que a teoria que emerge desta
série infinita é exatamente a relatividade geral de Einstein [15, 16].
Um procedimento alternativo de tornar consistente uma teoria a partir da formulação
linear que exploramos acima, foi proposto por S. Deser e B. E. Laurent [17] e também
por C. G. Bollini, J. J. Giambiagi e J. Tiomno [18]. Nesta proposta eles introduzem um
objeto com divergência indenticamente nula construı́do com as projeções não locais do
tensor momentum-energia da matéria para ser fonte do campo gravitacional, resultando
assim em uma teoria consistente para a gravitação . Este tipo de teoria é chamada de
“quase linear”. Podemos dizer que a não localidade faz o papel da não linearidade. Tal
construção é capaz de prescrever a estrutura de campo esférico, se ajustando perfeita-
mente bem aos dados observacionais. Entretanto, falha em algumas predições que estão
fundamentalmente relacionadas aos efeitos da não-localidade introduzida nas equações
de campo. Estes problemas foram apontados por C. M. Will, no trabalho [19]. Existem
ainda diversas teorias alternativas propostas ao longo dos últimos anos, mas a maioria
apresenta problemas que as tornam não viáveis.
O ponto fundamental que separa a teoria clássica Newtoniana da teoria da relativi-
dade geral tem origem na introdução do princı́pio da equivalência Einsteiniano5 . Uma
formulação deste princı́pio diz que todos os corpos caem, em um dado campo gravitacional
externo, com a mesma aceleração , implicando que para um observador em um laboratório
que cai livremente no mesmo campo gravitacional, os corpos deverão ser observados como
se estivessem livres de aceleração . Assim, a medida que seus movimentos mecânicos são
considerados, os corpos se comportam como se o campo gravitacional estivesse ausente.
Ainda mais, Einstein postulou que, não somente as leis da mecânica, mas todas as leis da
fı́sica, deveriam se comportar em tal laboratório como se a gravitação estivesse ausente.
De forma mais rigorosa, este princı́pio determina que uma teoria da gravitação é uma
teoria métrica, ou seja, deve satisfazer aos postulados de metricidade, que são: (i) o
espaço tempo é deformado pela presença de um dado campo gravitacional, podendo as-
sim ser representado por uma estrutura métrica efetiva, distinta da Minkowskiana; (ii)
as partı́culas teste tem seus movimentos determinados pelas geodésicas desta geometria;
e ainda, (iii) se escolhermos um referencial local de Lorentz6 , quaisquer leis naturais de
origem não gravitacional, devem ser aquelas da relatividade especial, isto é, que satisfazem
aos princı́pios da relatividade especial.
Como podemos perceber, este princı́pio da equivalência determina que a estrutura
de propagação das partı́tulas7 testes (não importando a sua constituição material) é
universal. Entretanto, em seu conteúdo, este princı́pio não estabelece que a estrutura de
propagação da própria interação gravitacional deva ser, necessariamente, a mesma das
partı́culas materiais. Assim, para estarmos consistentes com o princı́pio da equivalência
basta impormos que a geometria do espaço tempo, determinada pelo campo gravitacional,
é universalmente sentida pelas partı́culas materiais. Ainda não há um único experimento
realizado que determine que o princı́pio da equivalência deva ser estendido no que diz
respeito à interação gravitacional.
Existe uma grande expectativa com respeito a possibilidade de detectarmos ondas
gravitacionais nos próximos anos. Nunca se construiu tamanho número de aparelhos de
5
Uma boa revisão sobre o princı́pio de equivalência e suas consequências experimentais pode ser
encontrada no livro do C. M. Will [7].
6
A escolha de um referencial local de Lorentz quer dizer que podemos sempre anular localmente o
campo gravitacional.
7
Estamos denotando por partı́culas, àquelas que podem ser descritas pelo tensor de momentum energia
da matéria. Assim, partı́culas podem ser massivas, como planetas ou elétrons, ou não massivas, como
fótons.

4
medida para tal fim como a partir dos anos 70, quando descobriu-se que a perda de
energia em um sistema estelar duplo colapsante — pulsar binário — estava fortemente
relacionada com a emissão de ondas gravitacionais. Tal observação garantiu o prêmio
Nobel de Fı́sica ao pesquisador J. H. Taylor (veja as referências [20, 21, 22]). Com isto
a comunidade cientı́fica entendeu que a existência destas ondas gravitacionais estivesse
sendo indiretamente comprovada por tal efeito, como de fato acontece, uma vez que todas
as outras formas de interação puderam ser calculadas e desprezadas para tal situação .
No entanto, até os dias de hoje, nenhum detector de ondas gravitacionais obteve qualquer
resposta conclusiva a respeito da observação direta destas ondas. E ainda mais, a sua
existência comprovada indiretamente através deste experimento nos diz pouco a respeito
da sua forma de propagação , uma vez que o efeito que resultaria de um pequeno desvio na
velocidade destas ondas seria certamente não detectável e talvez, até mesmo, confundido
com perturbações da galáxia próxima. Por isso, uma pergunta natural a se fazer é a
seguinte: a velocidade de propagação das ondas gravitacionais é a mesma encontrada
para os raios luminosos? Ou seria melhor perguntar: O princı́pio da equivalência pode
ser estendido para abarcar a própria interação gravitacional?
Vamos abordar aqui alguns aspectos da teoria da gravitação. Revisaremos a teoria da
gravitação universal de Newton, construiremos uma teoria de campos para a gravitação
dentro de uma aproximação linear, e finalmente examinaremos brevemente a teoria da
relatividade geral de Einstein e exploraremos algumas de suas soluções.
Por fim, salientamos que estas notas correspondem a uma compilação (essencialmente,
dos livros citados ao longo da apresentação ), e não contém contribuições pessoais ao tema
tratado. Para alcançar um aprofundamento nos aspectos apresentados nestas notas, o
leitor deve se dirigir às referências listadas no final do capı́tulo.

1.2 Teoria Newtoniana da gravitação


1.2.1 A lei da gravitação universal
A lei da gravitação universal de Newton pode ser apresentada através do seguinte enun-
ciado:

a interação gravitacional entre dois corpos pode ser expressa por uma força central,
atrativa, diretamente proporcional às massas dos corpos e inversamente proporcional ao
quadrado da distância entre eles.
Isac Newton, Principia, Livro III, Proposiç~
ao VII e corolário.

Matematicamente teremos
m1 m2
F =G ,
r2
onde G é uma constante que deve ser obtida experimentalmente, conhecida por constante
de gravitação.
A partir de um referencial O, podemos escrever

(~r2 − ~r1 )
F~12 = Gm1 m2 ,
|~r2 − ~r1 |3

onde F~12 simboliza a força atuante em m1 devido a interação com o corpo m2 . Adicional-
mente, notamos que F~12 = −F~21 .

5
Figura 1.1: Interação gravitacional entre dois corpos de massas m1 e m2 . Note que
F~12 = −F~21 (terceira lei de Newton).

Diferentemente das outras constantes universais a constante de gravitação G não é


conhecida com muita precisão. Atualmente conhecemos o seu valor com apenas cinco
algarismos significativos. A dificuldade em medir o valor de G é devida ao fato de que a
força de origem gravitacional entre corpos em laboratórios é muito pequena. O melhor
valor medido para G até 2003 é 8

G = (6, 6742 ± 0, 0010) × 10−11 m3 kg −1 s−2 .

As quantidades m1 e m2 aparecendo nas equações acima são os termos de fonte da


gravitação e são chamadas de cargas gravitacionais, ou ainda, massas gravitacionais. A
massa gravitacional na teoria da gravitação desempenha o papel equivalente ao da carga
elétrica na teoria do eletromagnetismo.
Vamos considerar agora o problema de se obter uma expressão para a força gravita-
cional sobre uma partı́cula de massa gravitacional m, localizada em uma posição dada pelo
vetor posição ~r, devida a um aglomerado de N partı́culas com massas mi (i = 1, 2, · · · , N ).
A força F~i que atua sobre a partı́cula m devida a presença da partı́cula mi no aglomerado
S 0 (conforme está representado na figura 1.2) será tal que
(~r − ~ri )
F~i = −Gmmi .
|~r − ~ri |3
Assim, a força total exercida sobre a partı́cula m pode ser obtida somando a contribuição
de cada partı́cula presente no aglomerado:
N N N
X X (~r − ~ri ) X
F~ (~r) = F~i = −Gm mi 3
= Gm ~ r − ~ri |−1 .
mi ∇|~ (1.1)
i=1 i=1
|~r − ~ri | i=1

Como é bem conhecido, a energia potencial Ep é construı́da a partir do conhecimento de


F~ através da expressão
F~ (~r) = −∇E
~ p. (1.2)
Para a situação considerada em Eq. (1.1), inferimos que a energia potencial associada a
interação gravitacional entre o aglomerado S 0 e a partı́cula m é dada por
N
X mi
Ep (~r) = −Gm . (1.3)
i=1
|~r − ~ri |

Definimos o campo gravitacional ~g (~r) como a força por unidade de massa. Matematica-
mente esta definição é escrita na forma
N
F~ X (~r − ~ri )
~g (~r) = = −G mi . (1.4)
m i=1
|~r − ~ri |3
8
Atualizações deste valor podem ser obtidas no endereço http://physics.nist.gov/constants

6
Figura 1.2: Representação dos vetores posições no caso de um aglomerado de partı́culas
interagindo gravitacionalmente com uma massa externa m.

De maneira similar, definimos o potencial gravitacional como a energia potencial por


unidade de massa:
N
Ep (~r) X mi
Φ(~r) = = −G . (1.5)
m i=1
|~
r − ~
r i |
~ r). O campo gravitacional ~g (~r) é considerado como o agente da
Note que ~g (~r) = −∇Φ(~
interação e a sua determinação independe da existência de partı́culas teste, mas somente
das caracterı́sticas da fonte do campo (neste caso, do aglomerado). Para o caso de uma
distribuição contı́nua de massa M (veja figura 1.4), podemos escrever
dm0
Z
Φ(~r) = −G . (1.6)
r − ~r 0 |
M |~

Uma vez que dm0 = ρ(~r 0 )dV 0 , segue que


ρ(~r 0 )
Z
Φ(~r) = −G dV 0 , (1.7)
V |~r − ~r 0 |
onde ρ(~r 0 ) representa a densidade de massa do corpo. Como pode ser facilmente entendido
da Eq. (1.7), o potencial gravitacional obedece a equação de Poisson:
∇2 Φ(~r) = 4πGρ(~r). (1.8)
Assim, todo o conhecimento a respeito do potencial gravitacional (e do campo, por con-
seguinte) poder ser obtido a partir do conhecimento da distribuição de massa presente no
espaço.
• Obs:
O potencial gravitacional na região exterior a uma distribuição de massa com sime-
tria esférica pode ser determinado, a partir da Eq. (1.8), resultando em:
GM
Φ(r) = − . (1.9)
r
7
Figura 1.3: Potencial gravitacional devido a uma partı́cula localizada na origem r = 0. O
potencial negativo é caracterı́stica de uma interação atrativa.

Figura 1.4: Distribuição contı́nua de massa: representação a partir de um sistema de


coordenadas externo à distribuição .

8
Figura 1.5: Distribuição contı́nua de massa: situação na qual o ponto de medida do
campo esta situado a uma distância muito grande da distribuição .

Esta expressão corresponde exatamente ao potencial gravitacional gerado por uma


partı́cula de massa M localizada na origem do sistema de coordenadas (Fig. 1.3).

1.2.2 Multipolos gravitacionais


Como foi visto, o potencial gravitacional gerado por uma distribuição arbitrária de massa
em uma certa região do espaço é dado por Eq. (1.7). Para o caso de uma partı́cula, ou
de uma distribuição de massa com simetria esférica, a expressão para o potencial gravita-
cional se reduz à Eq. (1.9). A fim de examinar situações mais complexas será conveniente
considerar uma expansão do potencial [Eq. (1.7)] em termos de seus momentos de mul-
tipolos. Antes porém, para ganharmos em simplicidade, vamos escolher um sistema de
coordenadas de tal forma que a distribuição de massas esteja localizada nas vizinhanças
da origem deste sistema.
Ainda, vamos admitir que a distribuição de massas possa ser totalmente encerrada
por uma esfera de raio R que será sempre pequeno quando comparado ao ponto de ob-
servação. Nas condições especificadas anteriormente, podemos construir uma expansão
em multipolos para o potencial gravitacional. Assim considerando uma expansão em série
de Taylor do termo
1
|~r − ~r 0 |
em torno de ~r 0 = 0, encontraremos
 0 3
1 1 ~r · ~r 0 (~r · ~r 0 )2 1 r02 r
= − 3 +3 − +O . (1.10)
|~r − ~r 0 | r r r5 2 r3 r

• Obs:
Vamos utilizar a seguinte notação:

x1 = x, x2 = y, x3 = z

Então xk , com k = 1, 2, 3, representa a k-ésima componente do vetor ~r. Nesta


notação X
r2 = x k xk .
k

9
Usando a notação de ı́ndices, a equação (1.10) pode ser apresentada na forma
1 1 X x k xk 1 X 0k 0l
 k l
02 kl x x
≈ + + 3x x − r δ . (1.11)
|~r − ~r 0 | r k
r 3 2 k,l
r 5

Finalmente, o potencial gravitacional avaliado no ponto P (x, y, z), determinado pelo vetor
posição ~r, será dado por
GM G X k k G X kl xk xl
Φ(~r) = − − 3 x D − Q + ··· (1.12)
r r k 2 k,l r5

onde Z
M= dV 0 ρ (~r 0 ) (1.13)
V0
representa a massa total do aglomerado, e definimos os momentos de dipolo Dk e quadripolo
Qkl como:
Z
.
k
D = dV 0 x0k ρ (~r 0 ) (1.14)
V 0
Z
.
kl
Q = dV 0 (3x0k x0l − r02 δ kl )ρ (~r 0 ) . (1.15)
V0

• Obs:
1. Os momentos acima definidos são momentos de massa. Podemos continuar a
série (1.12) até quanto for necessário para descrever o potencial gravitacional
de uma certa distribuição de massa.
2. Nas expressões acima Dk representa as componentes do vetor de dipolo grav-
~ enquanto Qkl representa as componentes do tensor de quadripolo
itacional D,

gravitacional Q.
3. Em geral, os planetas possuem formas que desviam da forma perfeitamente
esférica por pequenas diferenças. No caso do Sol, seu diâmetro equatorial difere
do diâmetro polar por uma quantidade da ordem de 10−5 . Esta diferença gera
um momento de quadripolo na expressão para o seu potencial gravitacional.
Um dos efeitos importantes gerados pela presença do termo de quadripolo é a
precessão do periélio das órbitas planetárias. No caso da precessão de Mercúrio,
o momento de quadripolo solar implica em uma precessão da ordem de uns
poucos segundos de arco por século. Este valor, no entanto, é pequeno quando
comparado à precessão devido à interação com outros planetas do sistema solar
(500 segundos de arco por século). Adicionalmente, a teoria da relatividade
geral (que será vista mais a frente) acrescenta mais ∼ 43 segundos de arco por
século para a precessão do periélio de Mercúrio.
4. Note que este mecanismo pode ser utilizado de maneira inversa; ou seja, a partir
da observação das perturbações da órbita elı́ptica (Kleperiana) de satélites or-
bitando um determinado planeta, podemos obter resultados precisos a respeito
da distribuição de massa deste planeta.
5. Para o caso de um sistema composto por uma Pdistribuição de partı́culas, o
momento de dipolo de massa é dado por Dk = mxk . Assim, uma vez que
..
o momentum linear total do sistema isolado se conserva, segue que Dk = 0.
Este resultado está diretamente relacionado com o fato de que não pode existir
radiação gravitacional de origem dipolar.

10
1.2.3 Massa inercial e massa gravitacional
Como é bem conhecido, corpos que se movimentam sob a ação exclusiva do campo grav-
itacional sofrem uma aceleração que não depende de suas propriedades fı́sicas. Esta lei
pode ser apresentada na seguinte construção. A equação de movimento de uma partı́cula
de massa m em um dado campo gravitacional (cujo potencial é Φ), é dada por:

d 2 xk ∂Φ
mi 2
= −mg k , (1.16)
dt ∂x
ou seja
mi a = mg g. (1.17)
Assim
mg
a= g. (1.18)
mi
Trocando em palavras
 
massa gravitacional
aceleração = × intensidade do campo gravitacional.
massa inercial
Uma vez que a aceleração experimentada pela partı́cula em um dado campo gravitacional
é sempre a mesma (independentemente do seu estado e de sua natureza), concluı́mos que
a massa gravitacional e a massa inercial devem manter a mesma relação para todos os
corpos, ou seja
mi ∝ mg . (1.19)
Por uma escolha adequada de unidades, podemos fazer com que

mi = mg . (1.20)

Esta igualdade é conhecida como princı́pio de equivalência Newtoniano.

• Obs:
Se o corpo em consideração for extenso, então, a acelaração do seu centro de massa
será dada por
d 2 xk
Z

mi 2 = − dV 0 ρg (~r 0 ) 0k Φ(~r 0 ), (1.21)
dt V0 ∂x
onde ρg (~r 0 ) representa a densidade de massa gravitacional do corpo e a integral é
tomada por todo o seu volume. Assim, a equação (1.16) somente será recuperada
caso ∂Φ/∂xk possa ser considerado constante ao longo do volume do corpo.
Em resumo, o princı́pio de equivalência Newtoniano somente será válido em campos
gravitacionais homogêneos com corpos suficientemente pequenos.

1.2.4 Forças de maré


Vamos explorar um pouco as consequências do princı́pio da equivalência Newtoniano.
Consideremos um observador no interior de um ambiente fechado, um laboratório, que
esteja caindo livremente sob a ação do campo gravitacional terrestre. Este observador
experimenta uma sensação de flutuação (assim como todos os corpos no laboratório),
como se não houvesse qualquer campo gravitacional agindo sobre ele. Um referencial
ligado ao laboratório em queda livre equivale a um referencial inercial com respeito ao
observador: uma partı́cula em repouso dentro do laboratório permanece em repouso, e se

11
Figura 1.6: Forças de maré: Nesta representação , o sistema de coordenadas O0 está
adaptado a um corpo que cai livremente sob a ação do campo gravitacional terrestre.

posta em movimento permanece em movimento com velocidade constante. É importante


notar que este cenário não seria possı́vel caso o princı́pio de equivalência Newtoniano
não fosse verdadeiro (neste caso, corpos de naturezas distintas seriam espontaneamente
acelerados no interior do laboratório).

• Obs:
O princı́pio da equivalência Newtoniano implica que corpos suficientemente pe-
quenos localizados em uma região de campo gravitacional suficientemente homogêneo
experimentam a mesma aceleração. Note, entretanto, que uma região de campo
gravitacional “suficientemente” homogêneo não significa “exatamente” homogêneo.

Fazemos agora a seguinte pergunta: é possı́vel para o observador no laboratório em


queda livre realizar um experimento capaz de detectar a presença do campo gravitacional?
Ou ainda, serão os efeitos gravitacionais completamente eliminados pelo fenômeno da
queda livre?
Vamos a seguir mostrar que o observador pode, efetivamente, detectar a presença do
campo gravitacional através de uma medida da força da maré produzida por este campo.
O fundamental aqui é supor que o campo gravitacional não será exatamente homogêneo,
não importa o quão próximo da homogeneidade ele possa ser considerado. A fim de
demonstrar a afirmação acima, vamos considerar a seguinte construção: seja um ponto
de referência se movendo em queda livre, e consideremos este ponto como origem de um
sistema de coordenadas com eixo Z paralelo à direção radial (com respeito à Terra). Uma
partı́cula localizada em uma posição Pz (0, 0, z) neste sistema de referência (veja a figura
1.6) estará sujeita a um campo gravitacional dado por

~ z) = − GM GM
~g (OP 2 ẑ = − ẑ. (1.22)
|~ro + ~z| (ro + z)2

Similarmente, a origem O0 estará sujeita a uma aceleração gravitacional

~ 0 ) = ~g (~ro ) = − GM
~g (OO ẑ. (1.23)
ro 2

12
Assim, a aceleração da partı́cula em Pz relativa à origem O0 será

~ z ) − ~g (OO
~ 0) = − GM GM
~g (OP 2 ẑ + ẑ. (1.24)
(ro + z) ro 2

Mas, uma vez que z  ro , podemos expandir o primeiro termo no lado direito de Eq.
(1.24) em série de Taylor, resultando em
"  2 #
~ z ) − ~g (OO
~ 0) = − GM 2z z GM
~g (OP 1 − + O ẑ + ẑ
ro 2 ro ro ro 2
2GM z
= ẑ. (1.25)
ro 3
Este resultado mostra que, relativo à origem O0 , a partı́cula em Pz experimenta uma força
repulsiva f~z dada por
2GM mz
f~z = ẑ. (1.26)
ro 3
Vejamos agora uma partı́cula localizada na posição Px (x, 0, 0). Esta partı́cula estará
sujeita a uma aceleração dada por:

~ x ) = − GM (~ro + ~x) .
~g (OP (1.27)
|~ro + ~x|3

Então, a componente na direção x desta aceleração será

~ x ) · ~x = − GM x
~g (OP , (1.28)
(ro 2 + x2 )3/2

que podemos apresentar na forma


−3/2
x2

~ x ) · ~x = − GM x
~g (OP 1+ 2 . (1.29)
ro 3 ro

Supondo que x  ro , podemos efetuar a expressão


−3/2
x2 3x2

1+ 2 =1− + O(x4 /ro 4 ). (1.30)
ro 2ro 2

No entanto, somente o primeiro termo desta expressão será mantido, uma vez quel ele
será o termo de primeira ordem em Eq. (1.29). Assim

~ x ) · ~x = − GM x .
~g (OP (1.31)
ro 3
Resumindo, uma partı́cula de massa m situada na posição x estará, relativamente à origem
O0 , experimentando uma força
GM m
f~x = − xx̂. (1.32)
ro 3
Similarmente, concluı́mos que para uma partı́cula situada em Py , segue:

GM m
f~y = − y ŷ. (1.33)
ro 3

13
Figura 1.7: Corpo esférico coberto por uma camada lı́quida em um laboratório em repouso
longe da ação de campos gravitacionais externos.

As forças f~ são denotadas por forças de maré, e atuam sobre um dado corpo em queda
livre de tal maneira a provocar, ao longo da direção radial, um “esticamento”, e ao
longo do plano perpendicular, uma “compressão”. A figura 1.7 resume graficamente estes
resultados. Como vemos, as forças de maré podem ser utilizadas como um mecanismo
para a detecção de um campo gravitacional. Somente na situação teórica onde o campo
gravitacional seja homogêneo, as duas configurações acima seriam indistinguı́veis.
• Obs: Forças de maré em notação de componentes.
Para um referencial cuja origem se encontra em queda livre sob a ação de um
dado campo gravitacional, a força de maré pode ser representada na seguinte forma
(notação indicial):
X  ∂F k 
k
f = xi i
, (1.34)
i
∂x x i =0

onde F k representa a k-ésima componente da força gravitacional sobre uma dada


partı́cula. Vejamos como esta expressão se reduz às equações (1.26), (1.32) e (1.34).
Primeiramente, a componente k = 1 será tal que
3
1
X ∂Fx
f = fx = xi . (1.35)
i=1
∂xi

Mas
GM mx
Fx = F~ · ~x = − (1.36)
(ro 2 + x2 )3/2
conforme inferimos de Eq. (1.28). Assim,
∂Fx GM m ∂Fx ∂Fx
=− ; = =0 (1.37)
∂x x=0 ro 3 ∂y ∂z
e
GM m
fx = −
x. (1.38)
ro 3
Analogamente a expressão para fy , teremos, de Eq. (1.22)
GM m
Fz = F~ · ~z = − . (1.39)
(ro + z)2
Assim
∂Fz 2GM m ∂Fz ∂Fz
= 3
; = =0 (1.40)
∂z z=0 ro ∂x ∂y
e
2GM m
fz = z. (1.41)
ro 3

14
Figura 1.8: Corpo esférico coberto por uma camada lı́quida em uma laboratório em queda
livre em uma região de campo gravitacional.

A equação (1.34) pode ser reescrita em termos do potencial gravitacional Φ como segue
(das equações (1.2) e (1.5)):
X ∂ 2Φ
fk = − mxi i k . (1.42)
i
∂x ∂x
Vamos definir o objeto (tensor)
. 1 ∂F k 1 ∂ 2Φ
Rk oio = − 2 = (1.43)
mc ∂xi c2 ∂xk ∂xi
que chamaremos de tensor de forças de maré. Usando esta definição, encontramos que a
força de maré que atua sobre uma partı́cula localizada em um dado ponto xi , com respeito
ao referencial em queda livre, na aproximação xi  ro , pode ser apresentada na forma
X
f k = −mc2 xi Rk oio . (1.44)
i

Para este caso analizado acima, Rk oio pode ser apresentado na forma matricial
 
1 0 0
GM
Rk oio = 3 2  0 1 0  . (1.45)
ro c
0 0 −2
A divergência de f k em uma região vazia do espaço é sempre nula. Este resultado pode
ser mostrado, para o caso geral, a partir da Eq. (1.42) e usando a equação de Poisson
(1.8) fazendo ρ = 0. Para o caso partı́cular examinado acima, temos que:
~ · f~ = ∂k f k

X ∂xi
= −mc2 k
Rk oio
i
∂x
X
2
= −mc Ri oio = 0, (1.46)
i

onde a última igualdade segue diretamente de Eq. (1.45).


• Obs:
Limite de validade da teoria Newtoniana:
Gm0
|Ep |  mc2 ⇒ r  ,
c2
v  c.

15
1.3 O tensor energia-momento
1.3.1 Notação e definições
O intervalo de espaço-tempo ds2 é dado por
3
X
2 2 2 2 2 2
ds = c dt − dx − dy − dz ≡ τµν dxµ dxν , (1.47)
µ,ν=0

onde denotamos
xµ ≡ (ct, x, y, z). (1.48)
Usaremos a convenção de Einstein para a soma, segundo a qual ı́ndices repetidos (super-
escritos e sub-escritos) indicam um somatório. Assim, a equação (1.47) poderá ser apre-
sentada na forma compacta
ds2 = τµν dxµ dxν , (1.49)
onde τµν é o tensor métrico do espaço-tempo de Minkowski. Em notação matricial teremos
 
1 0 0 0
 0 −1 0 0 
τµν =  0 0 −1 0  .
 (1.50)
0 0 0 −1

Da equação (1.47),

v2
 
2 2 2 2 2 2 2 2

ds = dt c − vx − vy − vz = c dt 1 − 2 . (1.51)
c

Definimos
v2
 
−2
γ = 1− 2 . (1.52)
c
Assim
γ 2 ds2 = c2 dt2 . (1.53)
Como pode ser facilmente entendido ds2 é invariante frente a transformações de Lorentz,
sendo, portanto, uma grandeza escalar. Vamos adotar
r
ds v2
= dτ = dt 1 − 2 . (1.54)
c c
Em um referencial ligado à partı́cula (referencial de repouso da partı́cula) teremos dτ = dt,
o que nos indica que τ deve ser sempre o tempo próprio da partı́cula. Mais especifica-
mente dτ é o intervalo de tempo medido por um relógio que se move com a partı́cula.
Denotaremos t como tempo coordenado.
Definiremos o quadri-vetor velocidade, ou simplesmente 4-velocidade, na forma
µ
 
µ . dx dt dx dy dz
u = = c , , , . (1.55)
dτ dτ dτ dτ dτ
dt
Uma vez que dτ
= γ, teremos

uµ = γ (c, vx , vy , vz ) = γ(c, v i ). (1.56)

16
Denotando por m a massa de repouso de uma partı́cula, definiremos o quadri-vetor mo-
mentum, ou simplesmente 4-momentum, como
.
pµ = muµ . (1.57)

Então, de (1.56) e (1.57), segue


 
µ
 . i E i
p = γmc, γmv = ,p . (1.58)
c

Na última igualdade acima definimos (identificamos) a energia total relativı́stica

E = γmc2 , (1.59)

e o momentum relativı́stico (componentes)

pi = γmv i . (1.60)

Como vemos, a energia e o momentum aparecem como componentes de um mesmo objeto,


sendo a energia identificada como a componente temporal p0 e o momentum a componente
espacial pi .

• Obs:
Usaremos em todo o texto letras gregas como ı́ndices de espaço-tempo (ex.: µ =
0, 1, 2, 3) e letras latinas como ı́ndices somente espaciais (ex.: i = 1, 2, 3).

O nosso objetivo agora é construir (ou identificar) um objeto matemático que carregue
toda a informação a respeito do conteúdo de energia e momentum de uma partı́cula, ou
conjunto de partı́culas. A motivação para isto está no fato de que, em relatividade, massa
e energia são ambos fontes de campo gravitacional, e uma vez que a energia aparece como
a componente temporal do 4-vetor momentum, é esperado que este objeto apareça na
construção.

• Obs:
Note que a energia relativı́stica E não é um escalar!

1.3.2 O tensor energia-momento de um fluido perfeito em movi-


mento
Um fluido pode ser caracterizado por um campo de velocidades uµ e duas variáveis ter-
modinâmicas, que escolheremos como sendo a densidade própria ρ e a pressão p. A fim
de garantir que ρ seja um escalar, definiremos a densidade própria como sendo a massa
de repouso por unidade de volume de repouso (ou volume próprio).
O tensor energia-momento de um fluido perfeito é dado pelo tensor de ordem-2, T µν ,
simétrico:
.
 p p
T µν = ρ + 2 uµ uν − 2 η µν . (1.61)
c c
• Obs:
A projeção de T µν na direção da 4-velocidade uµ é dada por

T µν uν = c2 ρuµ , (1.62)

17
que representa, a menos do fator c2 , a densidade de 4-momentum. Usamos acima
que, de Eq. (1.56),
2
uµ uµ = u0 u0 + ui ui = u0 + γ 2 v i vi
v2
 
= γ c − γ v = γ c 1 − 2 = c2 .
2 2 2 2 2 2
(1.63)
c

O tensor momentum energia de um sistema isolado é tal que possui divergência nula. Este
fato (que pode ser demonstrado facilmente) representa a lei de conservação do momentum
e energia, em sua forma diferencial.
Assim, para sistemas isolados,
∂T µν
= 0, (1.64)
∂xν
ou ainda, em notação mais compacta:

T µν ,ν = 0. (1.65)

Vamos, a seguir, explorar esta lei de conservação no contexto do modelo proposto em Eq.
(1.61) para um fluido em movimento.
Das equações (1.61) e (1.65),
h p i
ρ + 2 uµ uν − pτ µν = 0 (1.66)
c ,ν

ou
1 p 1
(ρuµ ),µ uν + ρuµ uν ,µ + 2
p,µ uµ uν + 2 uµ ,µ uν + 2 puµ uν ,µ − p,µ τ µν = 0. (1.67)
c c c
Podemos obter, a partir de Eq. (1.67), uma equação escalar projetando-a na direção de
uµ :
1
c2 (ρuµ ),µ + ρuµ uν uν ,µ + p,µ uµ + puµ ,µ + 2 puµ uν uν ,µ − p,µ uµ = 0 (1.68)
c
mas, uma vez que uµ uµ = c2 , segue que

uν uν ,µ = 0 (1.69)

e, de (1.68) resulta
1 µ
(ρuµ ),µ +
pu ,µ = 0. (1.70)
c2
Finalmente, introduzindo Eq. (1.70) em (1.67), obtemos
   
1 µ ν µν 1 µ ν
ρ + 2 p u u ,µ = τ − 2 u u p,µ . (1.71)
c c

As equações (1.70) e (1.71) correspondem, respectivamente à equação da continuidade e


à equação de movimento para fluidos perfeitos relativı́sticos. Este resultado, então nos
assegura a validade da lei proposta pela divergência nula do tensor momentum energia.

• Obs:
No limite não relativı́stico de baixa velocidade

vc (1.72)

18
e baixa pressão
p  ρc2 , (1.73)
obtemos, de Eq. (1.70), a equação da continuidade clássica:
∂ρ ~
+ ∇ · (ρ~v ) = 0; (1.74)
∂t
e de Eq. (1.71), obtemos a conhecida equação de Euler:

∂~v  ~  1~
+ ~v · ∇ ~v = − ∇p. (1.75)
∂t ρ

A equação (1.71) pode ser apresentada em uma forma mais intuitiva se reescrevermos o
termo uµ uν ,µ na seguinte forma:

dxµ ∂
 ν
µ ν dx
u u ,µ = µ
dτ ∂x dτ
 ν
d dx d 2 xν
= = . (1.76)
dτ dτ dτ 2

Assim, de (1.71) e (1.76)


  2 µ  
1 dx µν 1 µ ν
ρ + 2p = τ − 2 u u p,µ . (1.77)
c dτ 2 c
Como vemos, quando p,µ = 0 as partı́culas de fluido seguem geodésicas. Em outras
palavras, as partı́culas de fluido seguem trajetórias que desviam das geodésicas sempre
que houver um gradiente de pressão.
Para qualquer configuração de fluidos (fluidos imperfeitos, fluidos carregados, etc.)
ou campos (campo eletromagnético por exemplo) o tensor momentum-energia poderá ser
constituı́do como um tensor simétrico com divergência nula.

• Obs:
Todo o tratamento utilizado foi realizado considerando um espaço-tempo plano
com métrica de Minkowski τ µν . A generalização para espaços-tempos curvos é
operacionalizável requerendo o critério de covariância das equações. Neste caso, as
derivadas simples são substituı́das por derivadas covariantes e a métrica plana τ µν
é substituı́da pela métrica curva gµν .

1.4 Teoria Linear da Gravitação


1.4.1 Construindo as Equações de Campo
Como ponto de partida para a construção de uma teoria da gravitação , devemos decidir a
respeito da fonte de tais efeitos. Sabemos que, do “princı́pio de equivalência” Newtoniano
[6, 23], a massa inercial total de um sistema sofre interação gravitacional, ou seja, toda
forma de energia contribui para este tipo de interação . Desta maneira, a fonte para a
gravitação deve ser a densidade de energia do sistema fı́sico em questão. Entretanto,
apenas com a densidade de energia do sistema, não podemos construir uma teoria que
seja Lorentz-covariante (invariante), desde que poderı́amos, por uma simples mudança de
sistema de referência, passar a observar uma densidade de energia e um fluxo de energia,

19
ou fluxo de momentum. Assim, devemos procurar por um objeto que possa representar
todas estas formas de “energia”, da mesma maneira, em todos os referenciais Lorentzianos.
Um bom objeto que é conforme a estas caracterı́sticas e pode ser usado como fonte da
gravitação é o tensor momentum-energia da matéria, que denotamos por Tµν [5, 4].
Este objeto encerra toda a informação a respeito de qualquer tipo de matéria e energia
de origem não gravitacional. Note que, quando falamos energia, entendemos energia de
interação . Neste caso, Tµν carrega a contribuição da energia de interação entre a matéria
com ela própria e com o campo gravitacional, mas não a do campo gravitacional consigo
próprio.
Poderı́amos ser levados a pensar na possibilidade de considerar como fonte da gra-
vitação , o traço do tensor momentum-energia, T α α , que certamente é uma quantidade
Lorentz-invariante e representa uma densidade de energia. No entanto, se analisarmos
o caso do campo eletromagnético, vê-se que o traço do tensor momentum-energia cor-
respondente é identicamente nulo, de onde resulta que uma teoria construı́da com este
objeto determinaria que energia de origem eletromagnética não atuaria como fonte de in-
teração gravitacional. Fato este que entra em direta contradição com a experimentação .
Este problema aparece aqui, em consequência da teoria eletromagnética de Maxwell ser
linear. Em verdade, é possı́vel pensar na viabilização de uma formulação não linear
para o eletromagnetismo que resulte em um tensor momentum-energia com traço não
nulo, contribuindo finalmente para uma teoria construı́da de tal maneira a admitir este
escalar, T α α , como fonte material do campo. Entretanto, tal construção nos levaria por
outros caminhos, contrariamente ao que estamos propondo discutir neste trabalho. Uma
completa revisão sobre este assunto pode ser encontrada no livro sobre eletrodinâmica
não linear, escrito por J. Plebanski (veja ref.: [24]). Uma vez que a teoria de Maxwell é
teoria do eletromagnetismo por excelência, somos levados a aceitar o tensor momentum-
energia, simétrico e de ordém 2, como um bom candidato para representar a fonte do
campo gravitacional.
Desde que o termo de fonte é um tensor de ordem 2, vamos escolher o tensor potencial
gravitacional que denotaremos por φµν , para representar esta interação . Acrescentamos
ainda que φµν seja simétrico,
φµν = φνµ ,
e impomos que este tensor seja adimensional, isto é,

[φµν ] = 1.

A maneira mais geral de escrever as equações de campo, de tal forma que: (i) respeitem
ao critério de linearidade; (ii) sejam construı́das com derivadas de no máximo ordem 2, e
ainda; (iii) que contenham Tµν como fonte material, resulta na combinação que segue:

∂α ∂ α φµν + a ∂α ∂ (µ φν)α + b ∂ µ ∂ ν φα α + c τ µν ∂α ∂ α φβ β + d τ µν ∂α ∂β φαβ = −κ T µν , (1.78)

onde a, b, c, d e κ são constantes que trataremos de fixá-las a seguir. Obviamente,


poderı́amos escrever a equação (1.78) acrescentando ainda os termos φµν e τ µν φα α , desde
que estamos chamando a expressão acima de a mais geral. No entanto, é notório que a
adição de tais termos implicaria em uma configuração de campo — no caso estático
— que decresce exponencialmente com a distância, e como admitimos que a interação
gravitacional seja de longo alcance, desprezamos de uma vez estes termos indesejados.
Poderı́amos também ter somado um termo de traço do tensor momentum-energia, porém,
esta feita corresponderia a uma simples redefinição das constantes já existentes, não
trazendo assim nada de novo.

20
Para procurar o valor das constantes envolvidas, vamos estabelecer o princı́pio de
conservação da energia, ou seja, imporemos que o tensor momentum-energia, escolhido
para atuar como fonte do campo, tenha divergência nula

T µν ,ν = 0. (1.79)

Assim, as equações de campo se reduzem à,

(1 + a) ∂ α ∂α ∂ν φµν + (a + d) ∂ µ ∂α ∂β φαβ + (b + c) ∂ µ ∂ α ∂α φβ β = 0, (1.80)

mostrando assim, que as constantes devem obedecer às seguintes condições :

a = −1, (1.81)
d = +1, (1.82)
b = −c. (1.83)

Os valores que podem tomar as constantes b e c (b ou c), conduzem a diferentes equações


de campo, embora consequentes de uma mesma construção teórica. Alguns valores são,
realmente, não permitidos [6]. Vamos fixar o valor da constante b como sendo

b = 1,

sem entrar em outros detalhes que esta escolha sugere [11]. Assim, temos as seguintes
equações de campo, lineares, para a descrição do campo gravitacional,

∂α ∂ α φµν − ∂α ∂ (µ φν)α + ∂ µ ∂ ν φα α − τ µν ∂α ∂ α φβ β − ∂α ∂β φαβ = −κ T µν .



(1.84)

Reconhecemos a constante que resta, κ, como uma constante de acoplamento, e seu valor
pode ser fixado facilmente quando procurarmos pelo limite assimptótico da teoria, qual
seja, confrontando-a com resultados experimentais verificados na teoria Newtoniana.
Apesar de termos escrito as equações acima utilizando um sistema de coordenadas
cartesiano, as mesmas podem, sempre que necessário, ou conveniente, passar para uma
forma mais geral, válida em um sistema arbitrário de coordenadas no espaço tempo plano.
A justificativa é fundamentada no fato de que as equações obedecem ao princı́pio de
covariância, portanto, são válidas em qualquer sistema de coordenadas. Logo, para pro-
cedermos a tal generalização , devemos substituir as derivadas simples por derivadas
covariantes, com respeito a métrica geral γαβ , e substituir a métrica constante ταβ por
γαβ . Desta forma, a equação tensorial (1.84) pode ser reescrita como:

φµν;α α − φα(µ;ν) α + φα α;µν − γµν φβ β ;α α − τ µν φαβ ;αβ = −κ T µν ,



(1.85)

onde (;) simboliza a derivada covariante com respeito a métrica geral para o espaço tempo
plano, γµν . Desde que nada perdemos em generalidade, usaremos sempre o sistema de
coordenadas que torna mais simples as operações matemáticas. Só escreveremos as
expressões de maneira geral em sua forma final, quando for conveniente.
As equações lineares para campos de spin-2, foram primeiramente apresentadas por
M. Fierz e W. Pauli no trabalho [14], onde derivaram as equações de onda para partı́culas
com spin arbitrário em um dado campo eletromagnético.

21
1.4.2 Equações de Campo como Consequência de um Princı́pio
Variacional
De maneira alternativa a que realizamos para chegar à equação (1.85), podemos pensar
em construir a teoria linear da gravitação a partir de um princı́pio variacional, escrevendo
primeiramente uma Lagrangeana para representar o campo de spin-2, o que denominamos
de campo gravitacional, e dela derivar as equações de movimento seguindo o procedimento
usual que o princı́pio da mı́nima ação estabelece. Na literatura existem vários trabalhos
usando o formalismo Lagrangeano na derivação das equações lineares para a gravitação .
Uma boa revisão deste assunto pode ser encontrada no trabalho de W. E. Thirring,
indicada na referência [25]. Vamos usar a mesma motivação da seção 1.4.1 e aceitar
que a fonte do campo seja completamente determinada pelo tensor energia-momento da
matéria, Tµν . Vamos, então, procurar pela expressão mais geral possı́vel que possa ser
escrita em termos do potencial tensor, φµν , e derivadas de, no máximo, ordem 2. Note
que para resultar em equações de campo lineares, diferenciais de segunda ordem em φµν ,
a Lagrangeana deve ser de ordem 2 nas primeiras derivadas do potencial tensor. Com
estas caracterı́sticas, a quantidade mais geral pode ser escrita da seguinte maneira:
1
C1 φαβ,γ φαβ,γ + C2 φαβ ,β φγ α,γ + C3 φαβ ,β φγ γ,α + C4 φα α,γ φβ β,γ .

Lφ = (1.86)
κ
Em verdade, Lφ é a densidade de Lagrangeana do campo gravitacional, como fixaremos
a seguir quando avaliarmos a dimensão da constante de acoplamento. Esta expressão é a
mais geral no sentido em que qualquer outro termo que possamos construir desta forma,
pode ser convertido em um dos quatro já presentes em (1.86), a menos de termos de
superfı́cie, que não contribuiriam para a derivação das equações de campo.
Antes de prosseguir com o cálculo das variações , vamos examinar as dimensões fı́sicas
das quantidades que introduzimos. Da forma como escrevemos, a expressão (1.86) é uma
densidade de Lagrangeana, e como a Lagrangeana de um sistema fı́sico deve ter dimensão
de energia, implica que Lφ deva ter dimensão de densidade de energia. Assim, como o
tensor potencial, φαβ , foi escolhido para ser adimensional, podemos escrever as dimensões
de (1.86) na forma:
1 1
[Lφ ] = , (1.87)
[κ] L2
onde utilizamos
1
[φαβ,µ ] = .
L
Mas, impondo que
M L2 1
 
energia
[Lφ ] = ≡ ,
T 2 L3 volume
encontramos, comparando as expressões acima,
M L2 1 1 1
2 3
= .
T L [κ] L2
De onde resulta que a dimensão da constante de acoplamento deve ser dada por
T2
 
1
[κ] = = . (1.88)
ML força
Vemos assim, que a constante κ que aparece em (1.86) e também em (1.84), tem dimensão
de inverso de força. Então, visto que κ é uma constante dimensional e, como as únicas

22
constantes naturais que dispomos são a constante de Newton (G) e a velocidade da luz (c),
podemos encontrar uma relação de proporcionalidade entre elas. Vejamos, as dimensões
de G e c são, respectivamente,

L3
[G] = (1.89)
MT 2
L
[c] = . (1.90)
T
Desta feita, as equações (1.88), (1.89) e (1.90) podem ser combinadas de tal forma que
encontramos a seguinte relação :  
G
[κ] = 4 . (1.91)
c
Ou seja, a menos de um fator numérico, multiplicativo, a constante de acoplamento, κ,
pode ser escrita em termos das constantes naturais c e G, na forma:
G
κ∼ . (1.92)
c4
Só poderemos escrever a expressão exata realizando algum teste observacional com a
teoria, ou mais diretamente, exigindo que a mesma se reduza, no limite de campo fraco e
baixas velocidades, ao caso Newtoniano.
A ação do campo gravitacional, Sφ , é construı́da como,
Z
1
Sφ = − d4 xLφ . (1.93)
c

Do princı́pio da mı́nima ação 9 , se tomarmos a variação de Sφ igual a zero, estaremos


implicitamente derivando as equações de movimento do campo gravitacional para o vazio.
De modo a completar a teoria, além da ação para o campo, devemos somar a ação da
matéria, SM . Assim, a ação total será dada por

S = Sφ + SM , (1.94)

e as equações de campo resultam do princı́pio da mı́nima ação :

δS = 0. (1.95)

Por enquanto, deixaremos em aberto a descrição da matéria por meio de uma La-
grangeana especı́fica e escreveremos somente que
Z
1
SM = d4 xLM , (1.96)
c
onde LM obedece à variação
1
δLM = T αβ δφαβ , (1.97)
2
a fim de que a variação da ação com respeito ao campo φαβ resulte no tensor de momentum-
energia da matéria.
Vamos considerar, então, a variação da ação total definida pela equação (1.94),

δS = δSφ + δSM = 0.
9
Veja a Seção 8.4.1.

23
De posse das relações acima definidas, a variação efetuada10 fornece,
Z 
1 4 1
2 C1 φαβ,γ γ + 2 C2 φαρ,β ρ + C3 φ,αβ + 2 C4 τ αβ φ,τ τ + C3 τ αβ φτ σ ,τ σ

dx
c κ

1 αβ
+ T δφαβ = 0,
2
(1.98)

de onde, usando a propriedade de simetria do tensor potencial, resulta as seguintes


equações de movimento:

4 C1 φαβ,γ γ + 2 C2 φρ(α,β) ρ + 2 C3 φ,αβ + 4 C4 τ αβ φ,τ τ + 2 C3 τ αβ φτ σ ,τ σ = −κ T αβ . (1.99)

Logo, em vista de se obter uma lei de conservação , ou mais diretamente, comparando


estas equações obtidas do princı́pio variacional com as equivalentes, derivadas em (1.84),
estabelecemos os seguintes valores para as constantes:

1
C1 = + (1.100)
4
1
C2 = − (1.101)
2
1
C3 = + (1.102)
2
1
C4 = − . (1.103)
4
Assim sendo, as equações de movimento tomam a forma já esperada, apresentada na
equação (1.84). Substituindo finalmente os valores das contantes na Lagrangeana (1.86),
resulta:
1
φαβ,γ φαβ,γ − 2 φαβ ,β φγ α,γ + 2 φαβ ,β φγ γ,α − φα α,γ φβ β,γ .

Lφ = (1.104)

Por conveniência de notação , vamos definir o tensor simétrico de ordem 2, G(L)


µν , como

(L)
Gµν uφµν − φα (µ,ν),α + φ,µν − τµν (u
=t tφα α − φαβ ,αβ ). (1.105)

A letra (L) indica que este objeto é linear na sua dependência no potencial tensor, φαβ .
Em termos deste objeto, as equações de campo podem ser apresentadas compactamente
como,
G(L)
µν = −κ Tµν , (1.106)
e a Lagrangeana Lφ pode ser convenientemente reescrita, a menos de termos de superfı́cie,
na seguinte forma:
1
Lφ = − G(L) φµν . (1.107)
4κ µν
Vemos então, que a teoria linear para campos de spin 2 pode ser facilmente derivada de
um formalismo Lagrangeano, como apresentamos nesta seção .
10
Devemos notar que abandonamos integrais de superfı́cie, admitindo que o tensor potencial gravita-
cional tenha suporte compacto.

24
1.4.3 Transformação de calibre
Como podemos notar, das equações de campo, uma dada solução de φµν continua a
ser solução se somarmos o objeto simétrico Λµ,ν . Em outras palavras, as equações de
campo, (1.106), são invariantes sob a seguinte transformação :

φαβ → φαβ + Λ(α,β) . (1.108)

Isto significa que estas equações não determinam as soluções univocamente, mas a menos
de uma transformação , indicada pela expressão (1.108), gerando assim uma ambiguidade
na determinação das mesmas. Uma maneira de se tentar eliminar esta ambiguidade seria
pela introdução de certas condições . Vamos definir a seguinte condição sobre o tensor
potencial (Gauge de Hilbert):
1
φαβ ,β − τ αβ φ,β = 0, (1.109)
2
ou ainda, se introduzirmos a mudança de variável,
1
hµν ≡ φµν − τµν φ, (1.110)
2
obteremos,
hαβ ,β = 0. (1.111)
Em termos desta nova variável e usando as condições acima, as equações de campo se
reduzem à
t
uhµν = −κTµν . (1.112)
Esta é uma forma simples e muito conveniente de expressar as equações que resultam
desta construção linear. Nos capı́tulos que seguem, as usaremos para derivar algumas das
soluções necessárias para a verificação do limite Newtoniano. Mais detalhes a respeito
de introdução de condições sobre equações de campo, podem ser encontrados em vários
livros textos de gravitação , como por exemplo nas referências [5, 26, 4] dentre outras.

1.4.4 Problemas com a Lei de Conservação da Energia


Na construção da teoria linear para a gravitação , tomamos o cuidado de escolher as
constantes multiplicativas de tal forma a resultar em uma lei de conservação da en-
ergia. Desta maneira, obtivemos um objeto, G(L) µν , com divergência identicamente nula,
implicando em
Gµν
(L) ,ν = 0 ⇒ T µν ,ν = 0. (1.113)
Entretanto, o tensor energia-momento da matéria carrega informação a respeito de qual-
quer tipo de energia e da sua interação com o campo gravitacional — quando considerado
o acoplamento com o mesmo —, exceto aquela energia que é proveniente do próprio campo
gravitacional. Assim sendo, não contém os termos de auto interação do campo, e, desde
que energia deve sofrer interação com a gravitação , não importando a sua origem, re-
sulta que a lei de conservação apresentada pela teoria linear, imposta pela divergência do
(L)
tensor Gµν , deve ser inconsistente — ou pelos menos incompleta —, uma vez que o tensor
energia-momento não pode se conservar separadamente, mas somente quando considerada
também a energia do campo gravitacional. Desta feita, devemos alterar as equações de
movimento e somar ao tensor energia-momento da matéria, o tensor energia-momento do
campo gravitacional, que chamaremos de tµν .

25
Então, as equações de movimento devem ser alteradas para a forma,

G(L)
µν = −κ (Tµν + tµν ) , (1.114)

e a identidade (1.113) leva à seguinte lei de conservação :

(T µν + tµν ) ,ν = 0, (1.115)

que representa uma lei de conservação adequada, deixando as equações de campo repre-
sentadas pela expressão (1.114), livre de inconsistências.
O próximo passo consiste, necessariamente, em encontrar a forma explı́cita do novo
objeto, tµν . Aqui surge um interessante problema. É bem conhecido que existe um pro-
cedimento canônico de se obter o tensor energia-momento, associado a um campo, a partir
da Lagrangeana deste dado campo. No entanto, a Lagrangeana que construı́mos é tal que
resulta, juntamente com a matéria, nas equações de movimento (1.106), que, como já
vimos, não são completas. Assim, o tensor energia-momento que poderemos encontrar
a partir desta Lagrangeana, não poderá ser o tensor energia-momento completo para a
gravitação , mas apenas uma primeira aproximação deste. Entretanto, quando escrever-
mos este objeto — primeira aproximação — deveremos somá-lo às equações (1.106)
no intuito de as aproximar para a forma fechada (1.114), e esta operação , modificando
as equações de campo, modifica como consequência a Lagrangeana que as resulta de
um princı́pio variacional. Então, a fim de corrigir esta Lagrangeana de modo a acertar a
teoria nesta ordem, devemos acrescentar a ela o complemento adequado. Ora, uma vez
que a Lagrangeana agora está modificada, um novo tensor de energia-momento do campo
poderá ser derivado, resultando ser este — segunda aproximação — mais completo. É
evidente que este procedimento se extende indefinidamente, e em cada estágio, estaremos
com a teoria mais completa para descrever o campo gravitacional. A teoria final surge
quando realizarmos infinitas interações deste tipo.
A teoria que emerge deste procedimento é identificada com a relatividade geral por
alguns autores. Os primeiros esforços nesta direção , foram realizados por R. H. Kraichnan
[27, 28] e, na mesma época, por S. N. Gupta [29]. No entanto, um excelente exame a
respeito destas questões foi feito, independentemente, por R. P. Feynman em um curso de
gravitação que ministrou durante os anos de 1962-63 na Califórnia-EUA, e cujas notas de
aula foram recentemente publicadas por dois de seus alunos (veja ref.: [11]). Veja também
a referência [15], onde o assunto é apresentado em sua versão mais completa.

1.4.5 O tensor energia-momento do campo gravitacional — primeira


aproximação
Associada a uma Lagrangeana qualquer, escrita na forma

L = L(ξ, ξ,µ ), (1.116)

o princı́pio da mı́nima ação fornece uma quantidade conservada, dada pela expressão,
∂L
Λµ ν = ξ,µ − δµ ν L, (1.117)
∂ξ,ν
11
que chamamos de tensor energia-momento do campo ξ.
11
Uma boa discussão deste objeto é apresentada no livro do L. D. Landau e E. M. Lifshitz, na referência
[30]. Veja também a Seção 8.4.1.

26
Assim, o tensor energia-momento associado ao campo gravitacional pode ser obtido
por meio da expressão:
∂Lφ
tµ ν = φαβ,µ − δµ ν Lφ , (1.118)
∂φαβ,ν
onde Lφ é a densidade de Lagrangeana do campo, dada em (1.104). Vamos introduzir a
seguinte relação de derivação das derivadas do tensor potencial,
∂φστ,ω 1
= δ µ (σ δ ν τ ) δ ρ ω . (1.119)
∂φµν,ρ 2
ν
Finalmente, usando esta relação , o tensor momentum-energia, t(1)
µ , pode ser encontrado,
e resulta na seguinte expressão:

ν 1 
t(1)
µ = φαβ,µ φαβ,ν − 2 φβ ν ,µ φβρ ,ρ + φα ν ,µ φ,α + φ,µ φνρ ,ρ − φ,µ φ,ν

δµ ν

αβ,γ αβ γ αβ ,α

− φαβ,γ φ − 2 φ ,β φ α,γ + 2 φ ,β φ,α − φ φ,α . (1.120)
2
Como já comentamos anteriormente, este tensor consiste apenas na primeira aproximação
do tensor completo, por este motivo escrevemos o indice “(1) ” na expressão acima. Desta
feita, as equações de movimento são reescritas, nesta ordem, na forma:
 
G(L) (1)
µν = −κ Tµν + tµν . (1.121)

No caso de fixarmos condições sobre o tensor potencial, φαβ , definidas pela relação
(1.111),
1
φαβ ,β = φ,α , (1.122)
2
o tensor t(1)
µν se reduz à forma,

δµ ν
  
(1) ν
1 αβ,ν 1 ,ν αβ,γ 1 ,α
tµ = φαβ,µ φ − φ,µ φ − φαβ,γ φ − φ φ,α . (1.123)
2κ 2 2 2
Note que, para reescrevermos esta última expressão em termos da variável hαβ , é necessário,
simplesmente, substituir a letra φ pela letra h.
O tensor momentum-energia do campo gravitacional associado à Lagrangeana da teo-
ria linear, para uma escolha de coordenadas harmônicas, foi primeiramente apresentado
por S. N. Gupta, quando examinava um método de quantização da teoria da relatividade
geral, em aproximação linear — veja Refs.: [31, 32].

1.4.6 Balanço de momentum-energia entre a Matéria e o Campo


Gravitacional
Vamos seguir, procurando entender quais consequências traz a lei de conservação imposta
pela equação (1.115). Adotando as condições (1.111), as equações de campo se reduzem
em primeira aproximação no tensor momentum-energia do campo, à:
 
uhµν = −κ Tµν + t(1)
t µν (1.124)

e a lei de conservação que segue é dada por,

T µν ,ν + t(1)µν ,ν = 0. (1.125)

27
Mas, da equação (1.123), reescrita em termos da variável hαβ , e tomada a sua divergência,
encontramos:  
(1)αβ
1 µν,α 1 ,α
t ,β = tuhµν h − tuhh . (1.126)
2κ 2
Entretanto, se introduzirmos aqui as equações de campo, (1.124), e desprezando quaisquer
contribuições de ordem superior a que estamos tratando12 , ou seja, desprezando termos
de ordem O(φ3 ), a expressão acima se reduz à interessante forma,

1
t(1)αβ ,β = − Tµν φµν,α , (1.127)
2
donde a lei de conservação expressa pela relação (1.125), pode ser reescrita mais conve-
nientemente como,
1
Tα β ,β − φµν,α T µν = 0. (1.128)
2
Esta é a equação que representa o balanço de momentum-energia entre a matéria e o
campo gravitacional. A partir desta relação , podemos derivar a equação que governa o
movimento das partı́culas materiais imersas em um dado campo gravitacional fraco. Para
isto, começamos por integrar a equação (1.128) num volume V , fornecendo a relação
integral: Z Z
3 β 1
d xTα ,β = d3 xφµν,α T µν . (1.129)
V 2 V

O termo do lado esquerdo pode se expandido na forma


Z Z Z
3 β 3 0
d xTα ,β = d xTα ,0 + d3 xTα k ,k . (1.130)
V V V

Mas, transformando a última integração de volume para superfı́cie — teorema de Gauss


— segue, Z Z
3 k
d xTα ,k = dSk Tα k (1.131)
V S

e, como podemos estender a superfı́cie de integração para fora da região onde existe
conteúdo material, esta integração se anula, resultando assim:
Z Z
3 β
d x Tα ,β = d3 xTα 0 ,0 . (1.132)
V V

Vamos definir o 4-vetor momentum13 , Pα , da partı́cula,


Z
1
Pα ≡ d3 xTα 0 . (1.133)
c V
12
A razão para desprezarmos termos de ordem superior a 2, no campo, é muita clara, uma vez que
se considerassemos estes termos, estarı́amos perdendo toda a ordem 3 que viria do próximo termo do
tensor momentum-energia do campo gravitacional, e assim por diante. De qualquer forma, o objetivo que
almejamos nesta seção é procurar pelo limite Newtoniano, que corresponde à estrutura de campo fraco,
donde a aproximação é plenamente justificada.
13
É conveniente chamar esta quantidade de momentum devido à sua dimensão fı́sica:

ML
[Pµ ] = = {momentum linear} .
T

28
Assim, de (1.129), Z
∂Pα 1
= d3 xφµν,α T µν . (1.134)
∂t 2 V

Para calcular a integração que aparece no lado direito da equação (1.134), vamos
usar dois argumentos. Primeiramente, façamos a hipótese de que o potencial tensor tenha
variação desprezı́vel sobre o volume da partı́cula, ou seja, pode ser considerado constante
nesta região. Desta forma, φαβ,µ pode sair da integração acima, restando,
Z
∂Pα 1
= φµν,α d3 xT µν . (1.135)
∂t 2 V

E por último, usaremos uma aproximação para a expressão do tensor momentum-energia


da matéria,
T µν = ρuµ uν + O(φ) (1.136)
com
m
ρ= (1.137)
V
α
e u o 4-vetor velocidade, ou mais simplesmente, a 4-velocidade:
∂xα
uα = = γ(c, v k ), (1.138)
∂τ
onde γ = (1 − v 2 /c2 )−1/2 . Na expressão (1.137), m representa a massa da partı́cula e V
o seu volume, enquanto na expressão (1.138), τ é o tempo próprio. A densidade própria
de energia da partı́cula ρ0 é escrita em termos de ρ através da expressão:
ρ
ρ0 = . (1.139)
1 − v 2 /c2
Consideraremos a aproximação (1.136) em (1.135). Esta aproximação é aceitável devido
a presença do potencial φµν,α multiplicativo. Desta maneira, o termo que desprezamos
contribuiria somente em ordem O(φ2 ) para as equações de movimento das partı́culas.
Obviamente, não conhecemos a forma explı́cita do tensor momentum energia da matéria,
e também, esta expansão não pode ser utilizada para o cálculo de Pα , em (1.135), uma vez
que os termos da ordem desprezada contribuiriam na ordem de aproximação considerada.
Então, introduzindo a expressão (1.136) em (1.135), resulta
Z
∂Pα 1
= φµν,α d3 x ρ0 uµ uν + O(φ2 ). (1.140)
∂t 2 V

Se explicitarmos os termos nesta equação de acordo com os resultados obtidos anterior-


mente, poderemos realizar a integração facilmente, resultando por fim,
∂Pα m
− φµν,α uµ uν = 0, (1.141)
∂τ 2
onde utilizamos adicionalmente, a relação :
r
v2
dτ = dt 1− . (1.142)
c2
A equação (1.141) é a equação de movimento de uma partı́cula de massa m imersa
em um campo gravitacional, em uma primeira aproximação . É bem verdade que ainda
devemos prosseguir e procurar escrever a expressão para o 4-momentum da partı́cula,

29
assim como o fizemos com o lado direito das equações (1.135). Até este ponto, podemos
apenas inferir que sua forma seja dada por termos do tipo

Pα ∼ {m uα ; m φαβ uβ },

desde que qualquer outro termo necessitaria de uma nova constante dimensional. De qual-
quer modo, uma maneira particularmente interessante de se obter a expressão procurada,
formalmente, é por meio de comparação com as equações de Euler-Lagrange, que são,
equivalentemente, as equações de movimento da partı́cula.
Para uma dada Lagrangeana, que seja função das coordenadas {xµ } e da 4-velocidade
uα , o princı́pio de Hamilton fornece as seguintes equações de movimento:

d ∂L ∂L
µ
− µ = 0. (1.143)
dτ ∂u ∂x
Se compararmos estas equações com (1.141), poderemos identificar os seguintes termos:

∂L
= Pµ (1.144)
∂uµ
e
∂L m
= φαβ,µ uα uβ . (1.145)
∂xµ 2
A equação (1.145) pode ser integrada imediatamente, fornecendo a expressão para a
Lagrangeana, L:
m
L = φαβ uα uβ + L0 (u), (1.146)
2
onde L0 (u) é a constante proveniente da integração com respeito a xµ , logo, uma função
arbitrária da 4-velocidade. Podemos encontrar a forma desta função L0 (u) impondo que
o limite assimptótico seja válido, i.e., para uma situação de campo nulo (φµν = 0), a
Lagrangeana deve se reduzir ao caso de uma partı́cula livre, para o qual,
m α
L0 = u uα . (1.147)
2
Assim, retornando à equação (1.146), escrevemos
m m
L= φαβ uα uβ + uα uα . (1.148)
2 2
Finalmente, de posse deste resultado, podemos derivar a expressão para o 4-momentum,
Pµ , através da relação apresentada em (1.144), fornecendo então:

Pµ = m uµ + m φαµ uα . (1.149)

e a equação diferencial que governa o movimento de uma partı́cula imersa em um campo


gravitacional, é reescrita na forma14 :

d 1
(uµ + φαµ uα ) − φαβ,µ uα uβ = 0. (1.150)
dτ 2
14
Note que esta equação é independente da massa da partı́cula, já mostrando ser válido o princı́pio
de Galileu, ou seja, o movimento de uma partı́cula teste submetida a um campo de forças de origem
gravitacional é tal que independe da massa da partı́cula. Com isso, partı́culas de massas diferentes
sentem a mesma aceleração proveniente da interação com este campo.

30
A derivada da 4-velocidade com respeito ao tempo próprio é chamada de 4-aceleração ,
e é da ordem do próprio campo, implicando que a derivação do segundo termo entre
parênteses pode ser simplificada, resultando assim em:

duµ 1
+ φµα,β uα uβ − φαβ,µ uα uβ = 0. (1.151)
dτ 2
Lembramos que a única aproximação que utilizamos para derivar esta equação de movi-
mento, foi a aproximação para campo fraco. No entanto, não impomos limite para baixas
velocidades. Assim, se quizermos verificar o limite Newtoniano, deveremos impor uma
condição adicional, uma vez que a teoria é relativista. É o que realizaremos na próxima
seção .

1.4.7 As Equações de Campo no Limite Newtoniano


Das equações de campo, utilizando o gauge de Hilbert, obtivemos a expressão (1.124).
Como já sabemos, estas equações possuem termos de ordem O(φ) e O(φ2 ). Naturalmente,
qualquer teoria que seja construı́da para descrever o campo gravitacional, deve ser capaz
de exibir os resultados da teoria Newtoniana em uma aproximação de campo fraco e
regime de baixa velocidade. Assim, para procurar por este limite, devemos impor as
seguintes condições sobre as equações de campo:
(i) estrutura de campo fraco:
φαβ  1; (1.152)
(ii) regime de baixas velocidades:
v  c. (1.153)
Vamos, adicionalmente, procurar resolver a situação de campo estático. Neste limite, as
componentes espaciais da 4-velocidade serão condicionadas pela relação :

dxk
uk = ≈ v k  c. (1.154)

Das condições (1.152) e (1.153), vemos que termos de ordem v 2 e v φ poderão ser de-
sprezados nas equações que seguem, uma vez que são de ordem O(2) na aproximação
considerada. As equações de movimento se reduzem, para este caso, à forma:

dv k c2
+ c2 φk 0,0 − φ00 ,k = 0. (1.155)
dt 2
Desde que estamos interessados em examinar o caso estático, o segundo termo em (1.155)
se anula, restando
dv k c2
= φ00 ,k . (1.156)
dt 2
No entanto a equação equivalente na teoria Newtoniana é dada por:

dv k
= Φ,k , (1.157)
dt
onde Φ representa o potencial Newtoniano. Assim, comparando estes resultados, encon-
tramos:
c2
Φ = φ00 . (1.158)
2
31
Agora que já identificamos o potencial gravitacional para esta situação assimptótica,
vamos operar diretamente com as equações de movimento (1.124). Primeiramente, vamos
analisar as componentes do tensor momentum-energia, T µν , cujas componentes se reduzem
à:

T 00 ≈ ρ0 c2 ≈ ρ c2 (1.159)
T kµ ≈ ρ uk uµ ≈ 0. (1.160)

O tensor momentum-energia do campo gravitacional, que aparece no segundo termo do


lado esquerdo nas equações (1.124), já é desprezado inteiramente por ser de ordem
superior — O(φ2 ). Assim, as componentes das equações de campo, se reduzem à:

52 h00 ≈ κ ρ c2 (1.161)
52 hkµ ≈ 0. (1.162)

Desta feita, das relações acima, concluı́mos que

52 h ≈ κ ρ c 2 , (1.163)

e podemos escrever finalmente a expressão para o Laplaciano do campo φ00 , que já rela-
cionamos previamente com o potencial Newtoniano. Assim operando, encontramos

1
52 φ00 = κ ρ c2 . (1.164)
2

Introduzindo nesta última, a relação (1.158), poderemos fixar o valor da constante κ.


Vejamos:
 
2 00 2 2Φ 1
5 φ =5 2
= κ ρ c2 , (1.165)
c 2

ou ainda,
κ ρ c4
52 Φ = . (1.166)
4
Porém, da teoria Newtoniana,
52 Φ = 4π G ρ. (1.167)

Logo, comparando estas expressões, encontramos que a constante de acoplamento tem o


valor de modo a ajustar a teoria ao limite Newtoniano, resultando:

16 π G
κ= . (1.168)
c4

As equações (1.156) e (1.164) mostram que a teoria construı́da é perfeitamente re-


dutı́vel a teoria de Newton da gravitação .
Note que a teoria que apresenta o limite Newtoniano não é a teoria linear desen-
volvida nas primeiras seções deste capı́tulo, mas a teoria corrigida pela adição do tensor
momentum-energia do campo em primeira aproximação , que é de segunda ordem no
tensor potencial gravitacional.

32
Nota
A densidade de Lagrangeana associada à teoria linear (aproximação linear) da gravitação
foi apresentada através da equação (1.148). Da mecânica Lagrangeana, pode ser demons-
trado que a expressão uα (∂L/∂uα )−L corresponde a uma constante de movimento. Assim,
usando este resultado na Lagrangeana encontrada em Eq. (1.148), teremos, após algumas
simplificações,
φαβ uα uβ + uα uα = c2 . (1.169)
Finalmente, usando a definição para a 4-velocidade, esta equação pode ser reapresentada
na forma
ds2 = (ταβ + φαβ )dxα dxβ . (1.170)
Esta expressão mostra claramente que na ausência de campo gravitacional (φ) o espaço-
tempo se reduz a forma plana Minkowskiana, e quanto φ 6= 0 (na presença de campo
gravitacional), ds2 corresponderá ao elemento de linha de um espaço-tempo curvo (em
geral).

1.5 Teoria da Relatividade Geral


1.5.1 O princı́pio da equivalência
Primeiramente, vamos definir dois termos que serão usados nesta seção :
(i) partı́cula teste: uma partı́cula eletricamente neutra, cuja auto-energia gravitacional
seja despresı́vel, e com dimensões suficientemente pequenas, a fim de não sentir as inomo-
geneidades do campo gravitacional externo.
(ii) experimento local não gravitacional: qualquer experimento realizado em laboratório
caindo livremente sob a ação de um dado campo gravitacional, sendo o laboratório blin-
dado (com paredes fechadas), suficientemente pequeno, a fim de não ser perturbado por
inomogeneidades de campos externos, e ainda, cujos efeitos de auto interação gravita-
cional possam ser desprezados.
Vamos separar o nosso estudo em termos da versão Newtoniana e Einsteiniana do
princı́pio da equivalência. Como vimos na seção 1.2, o princı́pio da equivalência New-
toniana estabelece que a massa inercial de qualquer corpo material é igual à sua massa
(carga) gravitacional:
mI = mG . (1.171)
Em outras palavras, podemos dizer que este princı́pio estabelece que todos os corpos
caem, em um dado campo gravitacional, com a mesma aceleração , independentemente de
suas massas ou composição material. De maneira mais rigorosa, definiremos o princı́pio
da equivalência Newtoniano da seguinte forma:
“Se uma partı́cula teste estiver situada em um dado ponto do espaço-tempo, e lhe for
inferida uma dada velocidade inicial, sua trajetória será independente de sua estrutura
material.”
A partir deste princı́pio Einstein foi capaz de desvendar os caminhos que o levaram
à teoria da relatividade geral. O novo ingrediente acrescentado ao princı́pio Newtoniano
foi observar que, se todos os corpos caem, em um dado campo gravitacional externo, com
a mesma aceleração , então, para um observador em um laboratório que cai livremente
no mesmo campo gravitacional, os corpos deverão ser observados como livres de acel-
eração . Assim, a medida que seus movimentos mecânicos são considerados, os corpos se
comportam como se o campo gravitacional estivesse ausente.

33
• Obs:
Obviamente, existem efeitos devido a não homogeneidade do campo gravitacional,
mas os mesmos podem ser considerados desprezı́veis a medida que utilizamos um lab-
oratório de dimensões muito pequenas. Para fins práticos a dimensão do laboratório
utilizado no experimento deve ser tal que influência devida a não homogeneidade do
campo recaia, no valor medido para a grandeza em consideração , sobre algarismos
não significativos do valor medido.

– Deve-se notar, entretanto, que a mecânica quântica impõe limites (princı́pio da


incerteza de Heizenberg) quanto à dimensão fı́sica do laboratório. Em verdade,
não podemos propor o experimento com laboratório arbitrariamente pequeno.

Einstein foi ainda além e estabeleceu que, não somente as leis da mecânica, mas todas
as leis da fı́sica deveriam se comportar em tal laboratório como se a gravitação estivesse
ausente. Similarmente ao caso Newtoniano, vamos definir o princı́pio da equivalência
Einsteiniano da seguinte forma:
i) “O princı́pio da equivalência Newtoniano é válido;
ii) O resultado de qualquer experimento local não gravitacional é independente da
velocidade de queda livre do aparatus, bem como independente de onde e quando no
universo ele for realizado”.

• Obs:
A verificação do princı́pio da equivalência para uma dada teoria, candidata à
gravitação , implica para a mesma na verificação dos postulados de uma teoria
métrica para este fenômeno. Estes postulados estabelecem que o espaço-tempo,
preenchido pelo campo gravitacional, deve ser deformado pelo mesmo, podendo, as-
sim, ser representado por uma estrutura métrica, que definiremos através do tensor

g µν . (1.172)

As partı́culas teste seguem geodésicas nesta geometria; e ainda, se escolhermos um


referencial local de Lorentz, quaisquer leis naturais de origem não gravitacional,
devem ser aquelas da relatividade especial (ou seja, que satisfazem ao princı́pio da
relatividade especial).

1.5.2 As equações de campo


Vimos na seção 1.4 que, na construção linear (aproximação linear) da teoria gravita-
cional, o elemento de linha ds2 associado ao espaço-tempo plano Minkowskiano

ds2 = τµν dxµ dxν (1.173)

sofre uma modificação quando o campo gravitacional está presente. Neste caso (o caso
linear) resulta que
ds2 = (τµν + φµν )dxµ dxν . (1.174)
Assim, podemos interpretar que uma partı́cula teste no espaço-tempo preenchido por um
campo gravitacional (que na aproximação linear foi denotado por φαβ ) “experimenta”
uma geometria efetiva, em geral curva, dada por

g̃µν = τµν + φµν . (1.175)

34
As equações de movimento desenvolvidas na seção 1.4 podem ser reapresentadas em
termos de gµν por simples substituição de φµν por gµν , uma vez que somente aparecem
termos contendo derivadas de φµν na expressão para o G(L) µν . Nesta representação , as
equações de campo ficam

ug̃µν − ∂ α ∂(ν g̃µ)α + ∂µ ∂ν g̃ αα − τµν t


ug̃ αα − ∂ α ∂ β g̃αβ = −κ Tµν .

t (1.176)

• Obs:
A métrica do espaço-tempo na aproximação linear é τµν .
As equações exatas, não lineares para a descrição dos fenômenos gravitacionais não
podem ser derivadas por critérios puramente lógicos, e constituem uma lei fı́sica. No
entanto, podemos propor alguns aspectos que esperamos serem verificados pelas equações
de campo, e, a partir desses aspectos procurar pela sua formulação (da teoria).
Exigiremos que as equações de campo respeitem aos seguintes critérios:
(i) As equações de campo devem ser invariantes frente a transformações gerais de co-
ordenadas: desde que uma teoria da gravitação que incorpore o princı́pio da equivalência
deve admitir sistemas de referências não inerciais gerais, as leis devem ser tensoriais, de
modo que dois quaisquer sistemas de coordenadas arbitrárias não possam ser distinguidas
pela lei fı́sica.
(ii) As equações de campo devem ser diferenciais de segunda ordem no tensor métrico
gµν (x): a fim de resultar no limite correto da teoria Newtoniana.
(iii) As equações de campo devem admitir uma métrica de Lorentz como solução
particular.
(iv) As equações de campo devem ser lineares nas derivadas segundas de gµν (x): com
isto garantimos a unicidade das soluções .
(v) As equações de campo devem ser dez equações diferenciais para os campos gµν (x):
uma vez que o campo gravitacional deve ser descrito pelas dez componentes do tensor
métrico. Assim, as equações para gµν devem ser expressas através de tensores construı́dos
com gµν e suas derivadas, e dadas numa forma covariante tensorial.
A escolha mais simples que contempla os critérios acima estabelecidos pode ser apre-
sentada através de contrações do tensor de curvatura e da métrica (explicitamente), para
o vazio (ausência de matéria), na forma

Rµν + aRgµν + Λgµν = 0 (1.177)

onde a e Λ são constantes a serem determinadas. Na presença de conteúdo material, as-


sumiremos o tensor momentum-energia como fonte do campo. Assim, devemos completar
as equações como
K
Rµν + aRgµν + Λgµν = − Tµν . (1.178)
2
Na equação acima, introduzimos uma nova constante K a fim de realizar o acopla-
mento do tensor momentum energia com as equações para geometria gµν . O fator 21 foi
introduzido apenas para posterior conveniência (mostraremos mais a frente que a con-
stante K será identificada com a constante de mesmo nome introduzida na aproximação
linear).
Da lei de conservação do tensor momentum energia

T µ νkµ = 0, (1.179)

implica que
(Rµ ν + aRg µ ν )kµ = 0. (1.180)

35
• Obs:
15
– Estamos usando o sı́mbolo k para representar a derivada covariante
– Já utilizamos na expressão acima que

gµνkα = 0. (1.181)

Agora, a fim de que a equação 1.180 seja satisfeita, escolheremos a constante

1
a=− , (1.182)
2
o que resulta em  
µ 1 µ
R ν − R∂ ν = 0; (1.183)
2 kµ

que é a bem conhecida identidade de Bianchi.


Desta forma, concluı́mos que as equações de campo devem ser dadas por

1 K
Rµν − Rgµν = − Tµν . (1.184)
2 2
Note que restam ainda duas constantes a serem determinadas (Λ e K).
Para uma região livre de matéria as equações de campo são dadas por

1
Rµν − Rgµν + Λgµν = 0. (1.185)
2
Uma solução gµν (x) dada em um sistema de coordenadas (xµ ) está determinada a
menos de uma transformação de coordenadas
0
xα → x α (x), (1.186)

que introduz na solução quatro funções arbitrárias. A fim de nos livrarmos desta arbi-
trariedade devemos impor 4 condições de coordenadas envolvendo gµν . Estas condições
não são covariantes e são satisfeitas por qualquer métrica somente quando um sistema
de coordenadas for escolhido. Assim, teremos 10 equações de campo e 4 condições
de coordenadas. Ainda, devemos lembrar que a identidade de Bianchi implica em uma
dependência entre algumas equações . Em verdade, temos apenas 6 equações indepen-
dentes. Desta maneira, temos 6 equações de campo e 4 condições de coordenadas,
resultando em dez equações para dez incógnitas.
As constantes K e Λ podem ser fixadas quando impomos que as equações de campo
(equações de Einstein) devem, no limite de campo fraco e baixa velocidade, reduzir à
teoria Newtoniana. Neste caso, pode-se mostrar que

16πG
K= (1.187)
c4
e Λ deve ser zero, ou ter um valor muito pequeno a ponto de não interferir com os
resultados experimentais conhecidos dentro da faixa de algorismos significativos.
15
Ao longo do texto serão usadas outros sı́mbolos, tais como “;” e “∇”. Veja a definição de derivada
covariante no Capı́tulo ??

36
A constante Λ é conhecida na literatura como constante cosmológica e o termo cos-
mológico Λgµν é interpretado em algumas situações como a energia do vácuo. Para ver
isto, vamos reescrever convenientemente as equações de Einstein na forma

c4 Λ
 
1 8πG
Rµν − Rgµν = − 4 Tµν + gµν . (1.188)
2 c 8πG

Nesta forma o termo cosmológico aparece como uma contribuição extra ao tensor momentum-
energia.

• Obs:
Mesmo admitindo um pequeno valor para Λ (de tal forma a verificarmos os resul-
tados experimentais conhecidos nos testes de campo solar), a presença do termo
cosmológico pode trazer modificações profundas em um cenário cosmomógico de-
scrito pelas equações de Einstein.

A fim de explorar um pouco mais as consequências da presença do termo cosmológico nas


equações de Einstein, vamos considerar brevemente o limite Newtoniano. No limite de
campo fraco o tensor métrico, em primeira ordem, pode ser escrito como gµν = τµν + φµν
(com φµν ≈ 0). Então, as equações de Einstein se tornam

c4
 
1 8πG
uφµν − τµν t
t uφ = − 4 Tµν + Λτµν (1.189)
2 c 8πG

onde usamos também que Λ ≈ 0. Esta equação pode ser reescrita na forma
 
8πG 1
t
uφµν = − 4 Tµν − T τµν + Λτµν . (1.190)
c 2

Assim, na ausência de matéria, teremos

t
uφµν = λτµν (1.191)

Finalmente, considerando o limite de baixa velocidade v << c e usando que φ00 = 2 cΦ2 ,
onde Φ é identificado com o potencial Newtoniano, a equação (1.191) se reduz a

c2
52 Φ = − Λ. (1.192)
2
Se relembrarmos da equação de Poisson [Eq. (1.8)]:

52 Φ = 4πGρ, (1.193)

ganhamos a seguinte interpretação para a constante cosmológica Λ: a constante Λ nas


equações de Einstein equivale a uma densidade uniforme de massa distribuı́da por todo
o espaço, e de tal forma que
Λ
ρ̃ = − . (1.194)
4πG
Assim, se Λ > 0 o vácuo possuirá uma densidade efetiva de massa negativa (ρ̃ < 0); se
Λ < 0 o vácuo possuirá uma densidade efetiva de massa positiva (ρ̃ > 0).
A seguir estaremos interessados em examinar algumas situações onde o campo gravita-
cional poderá ser considerado fraco e o espaço-tempo assimptoticamente plano. A fim de

37
Figura 1.9: Pontos ao longo da trajetória da partı́cula são determinados pelas coordenadas
xµ (τ ), onde τ é um parâmetro afim.

não termos problemas com o limite assimptótico, deixaremos de lado o termo cosmológico
a partir deste ponto16 , e consideraremos as equações de Einstein na forma
κ
Gµ ν = − T µ ν , (1.195)
2
ou, antecipando o valor da constante de acoplamento κ,
8πG µ
Gµ ν = − T ν (1.196)
c4
onde introduzimos o tensor de Einstein
1
Gµ ν = Rµ ν − Rg µ ν . (1.197)
2

1.5.3 O limite Newtoniano


Vamos examinar o movimento de uma partı́cula teste na presença de um campo gravita-
cional. Como já vimos, o seu movimento se dará ao longo de uma geodésica do campo,
que pode ser representada na forma
Duµ
= 0, (1.198)

onde τ representa um parâmetro afim ao longo da trajetória da partı́cula, conforme rep-
resenta a figura 1.9. De forma explı́cita, teremos
d 2 xµ α
µ dx dx
β
+ Γ αβ = 0, (1.199)
dτ 2 dτ dτ
onde Γµαβ são os sı́mbolos de Christoffel (veja o Capı́tulo 11). A equação da geodésica
corresponde à equação de uma partı́cula caindo livremente sob a ação do campo grav-
itacional. Ao longo de uma geodésica o observador pode, em cada ponto, anular os efeitos
gravitationais através da escolha conveniente do sistema de coordenadas. Este fato con-
stitui a base do princı́pio da equivalência.
Com o objetivo de testar o limite Newtoniano da teoria estabelecida pelas equações
de Einstein Eq. (1.195), deveremos considerar duas aproximações :
• o limite de campo fraco:

gµν = τµν + φµν ; φµν << 1. (1.200)


16
Testes com sistemas binários de estrelas indicam que se Λ existir o seu valor deve ser tal que |Λ| <
10−33 m−2 .

38
• o limite de baixas velocidades:
v << c. (1.201)

O elemento de linha (intervalo) será dado, usando Eq. (1.200), na forma

ds2 = gµν dxµ dxν = c2 dt2 − dl2 + φdxµ dxν . (1.202)

Assim, considerando a aproximação acima Eq. (1.201) resulta


 2
ds
= c2 + c2 φ00 + ... (1.203)
dt

Vamos considerar estas aproximações na equação da geodésica (1.199). Primeiramente o


sı́mbolo de Christoffel se reduzirá à forma
1
Γµαβ = τ µλ (φλα,β + φλβ,α − φαβ,λ ) . (1.204)
2
Ainda, em (1.199),
2 2
dxα dxβ dxα dxβ dxβα
 
dt 2 dx dt
= =c (1.205)
dτ dτ dt dt dτ dt dt ds

e considerando a expressão (1.203) e o limite de campo fraco, obtemos

dxα dxβ dxα dxβ


= (1 − φ00 ) . (1.206)
dτ dτ dt dt
As componentes espaciais deste resultado podem ser negligenciadas por serem de ordem
superior em v. A componente mista (α = 0; β = k) é da ordem v. No entanto, quando
multiplicada pela conexão (1.204), teremos somente termos de ordem superior. Assim,
somente as componentes temporais sobriverão na aproximação requerida. Resulta então,
de Eq. (1.199):
d 2 xµ
+ c2 Γµ00 = 0. (1.207)
dτ 2
Finalmente, supondo ainda o regime de campo estático, teremos

d 2 xµ d2 xµ dt
≈ (1 − φ00 ). (1.208)
dτ 2 dt2 dτ
Assim, de Eq. (1.207), e dentro da ordem considerada, segue:

d 2 xµ
+ c2 Γµ00 = 0. (1.209)
dt2
Como estamos examinando a situação de campo estático, teremos que a componente
µ = 0 da equação (1.209) será identicamente nula, como esperado. A componente
espacial será tal que
d 2 xi c2
= − ∂i φ00 . (1.210)
dt2 2
Esta equação pode ser reapresentada na forma vetorial:

d2~x
 2 
~ c φ00
2
= −∇ , (1.211)
dt 2

39
e representa a equação de movimento de uma partı́cula teste. Comparando com os
resultados provenientes da mecânica Newtoniana, concluı́mos que o potencial Newtoniano
será identificado com φ00 na forma

c2 φ00
Φ= . (1.212)
2

Note que a derivação da equação (1.211) compreendeu apenas aspectos oriundos da


equação da geodésica.
Vamos agora considerar as aproximações de baixa velocidade e campo fraco nas
equações de Einstein. Com isto pretendemos mostrar que Φ satisfaz à equação de
Poisson, e poderemos assim determinar a constante κ que aparece em Eq. (1.195).
Na aproximação requerida, somente a componente T00 do tensor momento-energia
sobrevive, e será dado por
T00 ≈ ρc2 . (1.213)

Das equações de Einstein (1.195-1.197)

1 κ
Rµ ν − Rg µ ν = − T µ ν , (1.214)
2 2
Mas
κ κ
R= T ≈ ρc2 . (1.215)
2 2
Assim, retornando à eq. (1.214):
κ κ
Rµν = − Tµν + ρgµν c2 (1.216)
2 4
A componente R00 será então
κρc2
R00 = − . (1.217)
4
Mas
Rµν = Γαµα,ν − Γαµν,α + termos de ordem superior. (1.218)
Assim, no regime de campo estático encontramos

1 1
R00 = −Γk00,k = − φ00,kk = − ∇2 φ00 . (1.219)
2 2

Finalmente, das equações (1.217) e (1.219), usando a definição do campo Φ, obtemos

c4 κρ
∇2 Φ = . (1.220)
4
Comparando esta equação com a equação de Poisson, concluı́mos que

16πG
κ= .
c4
Desta maneira, mostramos que a teoria da relatividade geral contém a teoria Newtoniana
no seu limite de campo fraco e baixas velocidades.

40
1.6 A solução de Schwarzschild e aplicações
Encontrar soluções exatas para as equações de Einstein não é uma tarefa fácil, haja visto
o grau de não-linearidade que as mesmas apresentam. Ainda hoje, o estudo de técnicas
para obtenção de soluções exatas é um tema bastante pesquisado. Para uma revisão
sobre está questão, é aconselhável consultar a referência [33]. A primeira solução exata
das equações de Einstein foi obtida em 1916 por K. Schwarzschild, e constitui uma solução
para o tensor métrico gµν representando um campo gravitacional estático e esfericamente
simétrico, como é esperado que ocorra no caso de sistemas planetários como o sistema
solar. Ainda, a solução foi derivada para a região exterior a uma distribuição de massa
com simetria esférica. Vamos derivar esta solução a partir das equações de Einstein, e
para isto, seguiremos os mesmos passos realizados na derivação original de Schwarzschild
[34].
Vamos recorrer aos seguintes critérios:
1. O campo deve ser estático;

2. O campo deve ter simetria esférica;

3. O espaço-tempo exterior à distribuição de massa é vazio;

4. O espaço-tempo deve ser assimptoticamente plano.

• Obs:
Em verdade os critérios (2) e (3) implicam em (1). Este fato foi demonstrado por
Birkhoff e é conhecido como teorema de Birkhoff.

Vamos adotar um sistema de coordenadas xµ = {t, r, θ, ϕ} onde t é uma coordenada tipo


tempo, r é uma certa coordenada radial, e θ e ϕ são coordenadas angulares polares. Então
assumindo que
ds2 = A(r)dt2 − B(r)dr2 − r2 dθ2 − r2 sin2 θdϕ (1.221)
precisaremos determinar as duas funções arbitrárias A(r) e B(r).
Como vemos, as hipóteses (1) e (4) se realizam na forma sugerida para ds2 :

• gµν não depende do tempo ⇐⇒ (1)

• superfı́cies (r, t) = constante levam à geometria de 2-esferas:

ds2 = r2 (dθ2 + sin2 θdϕ2 ) ⇐⇒ (2)

• A hipótese (3) requer que A(r) e B(r) devem ser derivadas a partir das equações de
campo para o vazio:
Rµν = 0. (1.222)

• A hipótese (4) determina condições assimptóticas para as soluções de A(r) e B(r):

lim A(r) = c2 (1.223)


r→∞
lim B(r) = 1. (1.224)
r→∞

• Obs:
Note que o limite 1.224 não precisa necessariamente ser 1, uma vez que, até este
ponto, não podemos identificar a coordenada r com distância radial.

41
Resta-nos agora utilizar a métrica proposta em Eq. (1.221) como uma solução-tentativa
para o problema. Devemos procurar por soluções de Eq. (1.222). Como já foi definido,

Rµν = ∂ν Γαµα − ∂α Γαµν + Γµβα Γναβ − Γµνα Γαββ (1.225)

e
1
Γαµν = g αβ (gβµ,ν + gβν,µ − gµν,β ) . (1.226)
2
De Eq. (1.221) podemos escrever (na forma matricial):
 
A(r) 0 0 0
 0 −B(r) 0 0 
gµν =  2
 (1.227)
 0 0 −r 0 
2 2
0 0 0 −r sin θ

Assim, usando Eq. (1.227) em Eq. (1.226) teremos as seguintes componentes não nulas
da conexão:
A0
Γ010 = = Γ001
2A
A0
Γ001 =
2B
B0
Γ111 =
2B
B0
Γ111 =
2B
r
Γ122 =−
B
r sin2 θ
Γ133 =− (1.228)
B
1
Γ212 = = Γ221
r
Γ233 = − sin θ cos θ
1
Γ133 = = Γ331
r
Γ233 = cot θ = Γ332 .
.
Denotamos Z 0 = dZ/dr.
Introduzindo os resultados acima em Eq. (1.225), e usando Eq. (1.222), resultam

A00 A0 A0 B 0 A0
 
R00 = − + + − =0 (1.229)
2B 4B A B rB
A00 A0 A0 B 0 B0
 
R11 = − + − =0 (1.230)
2A 4A A B rB
 0
B0

1 r A
R22 = − 1 + − =0 (1.231)
B 2B A B
R33 = R22 sin2 θ = 0. (1.232)

Com todas as outras componentes sendo identicamente nulas. Como vemos, das 4 equações,
apenas três precisam ser resolvidas.

42
Consideremos a seguinte operação: (A/B)R00 + R11 . Assim

1 A0 B 0
 
− + =0
r A B
de onde concluı́mos que:
A0 B0
=− . (1.233)
A B
Podemos integrar esta equação na forma
d
[ln (AB)] = 0, (1.234)
dr
O que resulta em

AB = const. (1.235)

Esta constante pode ser obtida a partir da hipótese (4) [veja Eqs. (1.223) e (1.224)]; e
resulta:
AB = c2 . (1.236)
Logo, resolvendo para B:
c2
B= (1.237)
A
e retornando este resultado em Eq. (1.231), resulta

rA A0 A0
 
A
−1+ 2 + =0 (1.238)
c2 2c A A
ou

rA0 + A = c2
d
(rA) = c2 (1.239)
dr
com solução:  
2 λ
A=c 1+ (1.240)
r
e, de Eq. (1.237):
1
B= (1.241)
1 + λ/r
Se retornarmos estas soluções nas equações de campo verificaremos facilmente que as
mesmas constituem uma solução para as mesmas. Concluı́mos então que
 
2 2 λ 1
ds = c 1 + dt2 − dr2 − r2 dθ2 − r2 sin2 θdϕ2 . (1.242)
r 1 + λ/r

Vamos passar agora à determinação da constante λ (que seguramente deve estar rela-
cionada à massa do objeto que produz o campo gravitacional).
Se considerarmos o limite de campo fraco, correspondente à região onde r  1, o
intervalo acima fica escrito na forma
   
2 λ 2 2 λ
dr2 − r2 dθ2 + sin2 θdϕ2 ,

ds = 1 + c dt − 1 − (1.243)
r r

43
e poderemos comparar com a expressão

ds2 = (τµν + φµν ) dxµ dxν , (1.244)

conforme discutimos nas seções anteriores. Nesta situação identificamos [conforme Eq.
(46) nas notas da seção 1.5]:
2
φ00 = 2 Φ (1.245)
c
onde Φ representa o potencial Newtoniano. Finalmente, uma vez que
λ
φ00 = , (1.246)
r
e, do potencial Newtoniano associado a uma configuração esferica de massa
GM
Φ=− , (1.247)
r
resulta
2GM
λ=− . (1.248)
c2
Assim, a solução de Schwarzschild fica sendo
   −1
2 2GM 2 2 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .

ds = 1 − 2 c dt − 1 − 2 (1.249)
cr cr

• Obs:
A presença do termo cosmológico altera a solução acima para
−1
Λr2 2 2 Λr2
  
2 2GM 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .

ds = 1 − 2 − c dt − 1 − 2 −
cr 3 cr 3
(1.250)
Note que neste caso a métrica não será assimptoticamente plana quando r → ∞.

1.6.1 Movimento de partı́culas teste na solução de Schwarzschild


Na seção anterior encontramos que o campo gravitacional exterior a uma distribuição de
massa com simetria esférica (ou de uma massa pontual) em torno da origem r = 0, é dado
por    −1
2 2m 2 2 2m
dr2 − r2 dθ2 + sin2 θdϕ2 ,

ds = 1 − c dt − 1 − (1.251)
r r
onde definimos o parâmetro:
. GM
m= 2 . (1.252)
c
• Obs:
A expressão (1.251) está escrita em coordenadas esféricas, t é o tempo coordenado.

O sistema de coordenadas utilizado na expressão (1.251) não é adequado para descrever o


espaço-tempo na região r  2m, embora os invariantes construı́dos a partir da geometria
sejam regulares nesta região. O valor limite
2GM
rs = 2m = (1.253)
c2
44
é denominado por raio de Schwarzschild. Para qualquer corpo macroscópico conhecido
o raio rs está sempre no interior do corpo, onde as equações para o vazio (Eq. (1.222)
não mais são válidas e, portanto, a solução (1.251) não é adequada. Desta maneira, não
precisamos nos preocupar com esta região para o caso da descrição do movimento de
partı́culas (planetas, por exemplo) em sistemas planetários, como é o caso do sistema
solar.

• Obs: Raio de Schwarzschild para alguns objetos:

– Sol
MSol = 1, 98 × 1030 kg
rSol = 6, 96 × 105 km
rs = 2, 94 km
– Terra
MT erra = 5, 98 × 1024 kg
rT erra = 6, 37 × 103 km
rs = 8, 86 mm
– Próton
MP roton = 1, 67 × 10−27 kg
rs = 2, 48 × 10−54 k

Nesta seção estaremos interessados em examinar o movimento de partı́culas massivas e


não-massivas na solução determinada por Eq. (1.251).
A trajétoria de partı́culas com massa será derivada a partir das geodésicas tipo-tempo
(ds2 > 0) do espaço-tempo, enquanto que o movimento de partı́culas sem massa (como o
fóton) será derivada a partir das geodésicas tipo-tempo.
Escolhendo o tempo próprio τ como o parâmetro afim teremos as geodésicas do campo
dadas por
d 2 xµ α
µ dx dx
β
+ Γ αβ = 0. (1.254)
dτ 2 dτ dτ
Temos, adicionalmente que

dxµ dxν
 2
c , massa 6= 0
gµν = (1.255)
dτ dτ 0, massa = 0.

Vamos escrever genericamente

gµν ẋµ ẋν = b, b = (0, c2 ) (1.256)

onde denotamos, por simplicidade de notação:

. dxα
ẋα = . (1.257)

Da Eq. (1.254), usando a notação acima e introduzindo a expressão para a conexão afim,
resulta
dẋµ 1 µρ
+ g (gρα,β + gρβ,α + gαβ,ρ )ẋα ẋβ (1.258)
dτ 2
que pode ser reescrita na forma mais simples:
d 1
(gλµ ẋµ ) = gαβ,λ ẋα ẋβ . (1.259)
dτ 2
45
Vamos expressar a métrica (1.251) como

ds2 = Ac2 dt2 − A−1 dr2 − r2 dθ2 + sin2 θdϕ2



(1.260)

ou, de Eq. (1.256)


b = Ac2 ṫ2 − A−1 ṙ2 − r2 θ̇2 − r2 sin2 θϕ̇2 . (1.261)
Vamos agora procurar integrar as equações (1.259) para ẋµ = (cṫ, ṙ, θ̇, ϕ̇).
De Eq. (1.259):

• λ = 0:
d 3 
c Aṫ = 0 (1.262)

• λ = 1:
A0 2
 
d  1
− A−1 ṙ = 2 0 2 2 2
c A ṫ − 2 ṙ − 2rθ̇ − 2r sin θϕ̇2
(1.263)
dτ 2 A

• λ = 2:
d  2 
r θ̇ = r2 sin θ cos θϕ̇2 (1.264)

• λ = 3:
d 2 2 
r sin θϕ̇ = 0 (1.265)

Vamos considerar as seguintes condições iniciais de movimento:
π
θ= e θ̇ = 0. (1.266)
2

Assim, usando Eq. (1.266) em Eq. (1.264) vemos que θ̈ e qualquer outra derivada de
ordem maior em θ serão nulas. Isto determina que a órbita fica confinada ao plano
θ = π/2.
As equações Eq. (1.262) e Eq. (1.265) podem ser integradas diretamente resultando
em, respectivamente

Aṫ = const ≡ ε, (1.267)


r2 ϕ̇ = const ≡ `, (1.268)

onde ε e ` são constantes de integração. Estas equações correspodem, no limite Newtoni-


ano, às leis de conservação da energia e do momentum linear, respectivamente.
Resta-nos integrar a equação (1.263). No entanto, podemos trabalhar diretamente
com a equação (1.261) que corresponde a uma primeira integral do movimento. Então,
dos resultados (1.266) a (1.268) em (1.261), resulta:

`2
 
2 2 2
ṙ = c ε − + b A, (1.269)
r2

ou ainda
`2
  
2 2 2 2m
ṙ = c ε − +b 1− . (1.270)
r2 r

46
A fim de descrevermos a trajetória das partı́culas, necessitaremos procurar pela expressão
de como r varia com a coordenada angular ϕ (lembrando que θ está fixada). Desta forma,
podemos escrever
 2  2  2  2
2 dr dr dϕ 2 dr `2 dr
ṙ = = = ϕ̇ = 4 . (1.271)
dτ dϕ dτ dϕ r dϕ

Então, de (1.270) e (1.271)


 2
`2 dr `2 2m `2
 
2 2
=c ε −b− 2 + +b . (1.272)
r4 dϕ r r r2
Ainda é conveniente introduzirmos uma nova variável
1 du du dr 1 dr
u= ⇒ = =− 2 . (1.273)
r dϕ dr dϕ r dϕ
Logo, substituindo (1.273) em (1.272):
 2
2 du
= c2 ε2 − b − `2 u2 + 2mu `2 u2 + b ,

` (1.274)

ou, 2
c2 ε2 − b 2mb

du
+ u2 = + 2 u + 2mu3 . (1.275)
dϕ `2 `
Esta é a equação para partı́culas teste no espaço-tempo de Schwarzschild.

1.6.2 Testes de campo solar


Trajetórias de partı́culas teste com massa (b = c2 )
Neste caso, a equação para as órbitas possı́veis será
 2
du c2  2mc2
+ u2 = 2 ε2 − 1 + 2 u + 2mu3 . (1.276)
dϕ ` `
Tomando a derivada desta equação com respeito a ϕ, resulta

du d2 u du mc2
   
2
2 +u =2 + 3mu (1.277)
dϕ dϕ2 dϕ `2
ou
d2 u mc2
+ u = + 3mu2 . (1.278)
dϕ2 `2
A menos do termo 3mu2 , esta equação corresponde à equação Newtoniana para a órbita
de uma partı́cula teste no campo gravitacional produzido por um corpo massivo pontual,
onde ` deve ser identificado como `N

`N = r2 . (1.279)
dt
Na equação (1.278) o termo 3mu2 corresponde a uma perturbação quando comparado ao
termo mc2 /`2 , e portanto podemos considerar a solução da equação (1.278) por meio de
uma expansão perturbativa.

47
• Obs:
Para o planeta Mercúrio (que está sujeito ao campo mais forte) temos os seguintes
dados

hrorbital i = 5, 79 × 1010 m
perı́odo = 7, 60 × 106 s

Assim
∆ϕ
` ≈ r2 = 2, 78 × 1015 m2 /s
∆t
Comparando os dois últimos termos em Eq. (1.278):

3mu2 3`2
= ≈ 7, 68 × 10−8 ,
mc2 /`2 c2 r 2

O que mostra claramente que 3mu2 corresponde a uma correção do termo mc2 /`2 .

Assim, desprezando o termo 3mu2 em Eq. (1.278), resulta:

d2 u o mc2
+ u o = , (1.280)
dϕ2 `2

cuja solução é dada por


mc2
uo = (1 + e cos ϕ) . (1.281)
`2
Notoriamente Eq. (1.281) corresponde à equação de uma elipse cuja excentricidade é
dada pelo parâmetro e. Neste método perturbativo estamos considerando uma expansão
da solução na forma
u = uo + u1 , (1.282)
onde o termo 3muo 2 foi considerado como um termo de segunda ordem [O(u1 )]. De Eq.
(1.278):
d2 mc2
2
(u o + u1 ) + uo + u1 = 2
+ 3muo 2 . (1.283)
dϕ `
Mas, uma vez que d2 uo /dϕ + uo = mc2 /`2 , resulta

d2 u 1 3m3 c4
+ u 1 = 3muo
2
= (1 + e cos ϕ)2 . (1.284)
dϕ2 `4
ou
d2 u 1 3m3 c4 6m3 c4 e 3m3 c4 e2
+ u 1 = + cos ϕ + cos2 ϕ. (1.285)
dϕ2 `4 `4 `4
Uma vez que |cos ϕ| ≤ 1 e, para os planetas do sistema solar, a excentricidade é ≤ 0, 2,
podemos desprezar o último termo na equação (1.285). Ainda, o efeito do termo 3m3 c4 /`4
na equação (1.285) é somente de reavaliar as constantes que aparecem em (1.281). Uma
vez que estas constantes podem ser ajustadas aos valores observados, não precisamos nos
preocupar com este termo também. Então, só precisaremos determinar uma solução para

d2 u1 6m3 c4 e
+ u 1 = cos ϕ, (1.286)
dϕ2 `4

48
que pode ser encontrada na forma:

3m3 c4 e
u1 = ϕ sin ϕ. (1.287)
`4
Retornando à Eq. (1.282) conclı́mos que

mc2 3m3 c4 e
u= (1 + e cos ϕ) + ϕ sin ϕ. (1.288)
`2 `4
Vamos reescrever a Eq. (1.288) na forma mais conveniente

mc2
u= (1 + e cos ϕ + eδω sin ϕ) , (1.289)
`2
onde definimos
3m2 c2
δω = ϕ. (1.290)
`2
Note que (δω)2  δω  1. Então, podemos reapresentar a Eq. (1.289) como

mc2
u= [1 + e cos(ϕ − δω)] . (1.291)
`2
• Obs:
Vejamos a interpretação desta equação. A equação clássica de uma elipse com
excentricidade e e distância a partir da origem f (conforme mostra a figura 1.10), é
dada por
u = a(1 + e cos φ), (1.292)
onde
f
a= = semi-eixo maior
e

Figura 1.10: Curva representando uma elipse.

Então, em analogia com a construção apresentada para a equação (1.292), segue que Eq.
(1.291) representa a equação de uma elipse com excentricidade e e semi-eixo maior

mc2
a= . (1.293)
`2
49
Quando o argumento da função cosseno varia de 2π radianos, em Eq. (1.291), teremos a
coordenada angular ϕ variando de
ϕ = 2π + δω|ϕ=2π . (1.294)
Assim, a cada revolução o afélio (ou periélio) da órbita avança de uma quantidade δω,
dada por (retornando o valor de m):
6πG2 M 2
δω = . (1.295)
c2 `2
Usando os dados experimentais conhecidos para o planeta Mercúrio encontramos (usando
para ` o valor médio obtido anteriormente [imediatamente após Eq. (1.279)]),
δω = 4, 83 × 10−7 rad/revolução
ou
δω = 2, 77 × 10−5 o /revolução.
Desde que o perı́odo orbital de Mercúrio é τM = 7, 60 × 106 s e o da Terra é τT =
3, 16 × 107 s. Segue que
δω = 41, 43 arcsec/século.
• Obs:
– Um melhor ajuste para ` leva à
`2 = aGM (1 − e2 ) (1.296)
Assim, de (1.295):
6πGM
δω = , (1.297)
ac2 (1 − e2 )
resultando em
δω = 42, 99 arcsec/século.

– Valor observado para δω [35]:


δω = (43, 1 ± 0, 1) arcsec/século.

Trajetórias de partı́culas não massivas (b=0)


Neste caso, da equação de movimento (1.275), teremos
 2
du c2 ε 2
+ u2 = 2 + 2mu3 . (1.298)
dϕ `
Da mesma forma como procedemos para derivar a expressão (1.278), obtemos
d2 u
+ u = 3mu2 . (1.299)
dϕ2
Uma vez que o termo 3mu2 é pequeno comparado aos outros, poderemos (como antes)
resolver esta equação apelando ao método perturbativo. Vamos denotar o coeficiente
.
3m = . Assim
d2 u
+ u = u2 . (1.300)

50
Figura 1.11: Representação gráfica da equação da reta Eq. (1.306).

• Obs:
O tratamento perturbativo é válido neste caso pois estaremos interessados em testes
de campo solar. Neste caso, a menor distância possı́vel para uma partı́cula teste,
a partir da origem (que está fixada no centro do Sol), será o raio do Sol (situação
limite). Neste caso r = 105 GM/c2 . Assim, de (1.299):
3mu2 3m 3GM/c2
= = 5 ≈ 10−5 .
u r 10 GM/c2

Vamos considerar uma expansão da solução para u na forma

u = vo + v1 + O(2 ). (1.301)

Então, de (1.301) e (1.300):


d2 vo d2 v1
2
+  2
+ vo + v1 = vo 2 + O(2 ), (1.302)
dϕ dϕ
que podemos separar em ordens de  na forma:
d2 vo
+ vo = 0 (1.303)
dϕ2
e
d2 v1
2
+ v1 = vo 2 (1.304)

De (1.303) encontramos a seguinte solução
1
vo = cos ϕ, (1.305)
Ro
ou ainda
cos ϕ
= Ro , (1.306)
vo
onde Ro = constante. Note que Eq. (1.306) consiste na equação de uma reta. Usando a
solução (1.305) em (1.304) resulta na seguinte equação:
d2 v1 1
2
+ v1 = cos2 ϕ (1.307)
dϕ Ro 2
com solução
1
1 + sin2 ϕ .

v1 = 2
(1.308)
3Ro

51
Desta forma, a solução aproximada para este problema será
1 m
cos ϕ + 2 1 + sin2 ϕ .

u= (1.309)
Ro Ro
• Obs:
A solução (1.305) pode ser escrita na forma mais geral vo = Ro−1 cos(ϕ − ϕo ). Por
uma escolha conveniente de eixos fazemos ϕo = 0, e resulta na Eq. (1.305).

Como vemos da equação (1.309), a trajetória de uma partı́cula sem massa nas vizinhanças
de um corpo de massa M localizado na origem, se afasta de uma trajetória retilı́nea pelo
termo
m
1 + sin2 ϕ ,

Ro 2

que é uma perturbação quando comparado ao primeiro termo no lado direito em Eq.
(1.309).
A fim de calcular o desvio da trajetória retilı́nea, vamos considerar a mudança de
coordenada angular
π
ϕ = − δ. (1.310)
2
Em termos de δ a equação (1.309) se escreve como:
1 m
sin δ + 2 1 + cos2 δ .

u= (1.311)
Ro Ro
Quando r → ∞, teremos δ → ∆  1, e u → 0. Assim
1 m
∆ + 2 (1 + 1) + O ∆2 ,

0= (1.312)
Ro Ro
de onde
2m
∆=− . (1.313)
Ro
O sinal negativo indica que a trajetória da partı́cula sofre um desvio para dentro com
respeito a trajetória retilı́nea determinada por Eq. (1.305). Uma vez que ocorre um
desvio angular na aproximação e no afastamento da partı́cula, concluı́mos que o desvio
total sofrido pela partı́cula será
4m 4GM
D = |2∆| = = 2 . (1.314)
Ro c Ro
Na expressão acima Ro representa a distância de máxima aproximação da partı́cula com
respeito à origem. A figura 1.12 apresenta a trajetória da partı́cula de acordo com os
resultados acima.
No caso do Sol, um raio luminoso cuja trajetória tangencia o disco solar, sofrerá um
desvio

D = 1, 74 arcsec

• Obs:
Valor experimental medido em 1952:

D = (1, 70 ± 0, 10) arcsec.

52
Figura 1.12: Desvio da trajetória retilı́nea Newtoniana, conforme previsto pela equação
(1.309). Esta figura não está em escala. A fim de que as relações angulares ficassem
evidentes, as distâncias ao longo do eixo Y foram encolhidas e o desvio angular aumentado.

53
1.7 Exercı́cios
1. Verifique a última igualdade na Eq. (1.1).

2. Mostre que a divergência de f k (componentes do vetor força de maré) em uma região


vazia do espaço é sempre nula.

3. Obtenha o resultado apresentado na Eq. (1.10).

4. Mostre que as equações (1.15) e (1.16) se reduzem às equações clássicas (1.19) e
(1.20) no limite não relativı́stico.

5. Mostre que a Lagrangeana (1.108) pode ser reescrita na forma (1.112).

6. Obtenha Eq. (1.120).

7. Obtenha os resultados apresentados nas equações (1.229-1.232).

8. A partir da expressão para a métrica de Schwarzschild Eq. (1.249), obtenha as com-


ponentes Rk 0i0 do tensor de curvatura. Mostre que este objeto se reduz à expressão
Eq. (1.43) no limite Newtoniano.

9. Usando o valor máximo possı́vel para a constante cosmológica Λ, avalie o valor da


sua contribuição nos testes de campo solar realizados na seção 1.6.

10. O tensor energia-momentum de um fluido perfeito pode ser apresentado na forma

T µ ν = (ρ + p/c2 )uµ uν − pδ µ ν .

Mostre que a divergência nula deste tensor resulta em equações de conservação.


Comente sobre o

11. Seja λµ um campo vetorial covariante.

(a) Mostre que


λα;βγ − λα;γβ = Rµ αβγ λµ .
(b) Mostre que Rµ αβγ , definido no item anterior, satisfaz à identidade de Bianchi:

Rµ ναβ;γ + Rµ νβγ;α + Rµ νγα;β = 0.

(c) Mostre que o tensor de Einstein, definido por

. 1
Gµ ν = Rµ ν − Rδ µ ν ,
2
possui divergência identicamente nula.

12. As equações de Einstein com constante cosmológica podem ser apresentadas na


forma
Gµ ν + Λδ µ ν = κT µ ν .

(a) Suponha que Λ = 0 e mostre que a equação de Poisson pode ser obtida a partir
das equações de Einstein considerando-se a sua componente-00 na aproximação
de campo fraco e baixa velocidade.

54
(b) Suponha que Λ 6= 0 e reescreva a equação de Poisson apresentando o termo
contendo Λ.
(c) Suponha agora que Λ 6= 0 e T µ ν = 0. Neste caso, interprete o significado de Λ
a partir dos resultados obtidos anteriormente.

13. A solução de Schwarzschild corresponde à solução estática e esfericamente simétrica


das equações de Einstein para a região exterior a um corpo de massa M . Com base
no conhecimento desta solução, resolva os itens abaixo.

(a) Determine o intervalo de tempo coordenado ∆t associado a propagação de


um sinal luminoso desde a sua emissão, efetuada por um observador O fixo
em um ponto com coordenada radial Ro , até a sua chegada em um ponto com
coordenada radial R (R > Ro ). Suponha que a propagação ocorra radialmente.
(b) Para o mesmo experimento mencionado no item anterior, determine o intervalo
de tempo próprio ∆τ medido pelo observador O.
(c) Suponha que Ro = 2m+ε. De acordo com os resultados obtidos nos itens ante-
riores, o que você pode concluir a respeito dos intervalos de tempo coordenado
∆t e de tempo próprio ∆τ , na situação limite onde ε → 0.

1.8 Referências bibliográficas


[1] I. Newton, em Philosophiae Naturalis Principia Mathematica. (London, 1686);

[2] A. Einstein, Annalen der Physik 49, 769 (1916). Traduzido para o inglês em The
Principle of Relativity. (Methuen, 1923. Reimpresso pela ed. Dover Publications);

[3] A. Einstein, em Zur Elektrodynamik Bewegter Körper. Annalen der Physik 17, 891
(1905). Traduzido para o potuguês em Textos Fundamentais da Fı́sica Moderna: H.
A. Lorentz, A. Einstein and H. Minkowski. (Volume I, “O Principio da Relatividade”.
Fund. Calouste Gulbenkian, Lisboa, 1971);

[4] S. Weinberg, em Gravitation and Cosmology: Principles and Applications of the Gen-
eral Theory of Relativity. (John Wiley & Sons, New York, 1972);

[5] R. Adler, M. Bazin e M. Schiffer, em Introduction to General Relativity. (Mc. Graw-


Hill, Inc., New York, 1975);

[6] H. C. Ohanian, em Gravitation and Spacetime. (W. W. Norton & Company, New
York, 1976);

[7] C. M. Will, em Theory and Experiment in Gravitational Physics. (Cambridge Univer-


sity Press, Cambridge, 1993);

[8] C. W. Misner, D. S. Thorne e J. A. Wheeler, em Gravitation. (Freeman, San Francisco,


1973);

[9] R. C. Tolman, em Relativity, Thermodynamics and Cosmology. (Oxford University


Press, Oxford, 1987);

[10] Ivano Damião Soares, Notas do curso de Gravitação ministrado na Primeira Escola
de Cosmologia e Gravitação (CBPF, Rio de Janeiro, Julho de 1991);

55
[11] R. P. Feynman, F. B. Morinigo e W. G. Wagner, in Feynman Lectures On Gravitation.
(Addison-Wesley Pub. Company, Massachusetts, 1995);

[12] S. N. Gupta, Eintein’s and Other Theories of Gravitation. Phys. Rev. 96, 1683 (1954);

[13] O. Bergmann, Scalar Field Theory as a Theory of Gravitation. I (1955);

[14] M. Fierz e W. Pauli, On Relativistic Wave Equations for Particles of Arbitrary Spin
in an Electromagnetic Field. Proc. Roy. Soc. 173A, 211 (1939);

[15] S. Deser, Self-Interaction and Gauge Invariante. J. Gen. Rel. Grav. 1, 9, (1970);

[16] L. P. Grischuck, A. N. Petrov e A. D. Popova, Exact Theory of the (Einstein) Grav-


itational Field in an Arbitrary Background Space-Time. Commun. Math. Phys. 94,
379 (1984);

[17] S. Deser e B. E. Laurent, Gravitation Without Self-Interaction. Ann. Phys. 50, 76


(1968);

[18] C. G. Bollini, J. J. Giambiagi e J. Tiomno, A Linear Theory of Gravitation. Lett.


Nuovo Cimento III, 65 (1970);

[19] C. M. Will, em Relativistic Gravity in the Solar System III. Experimental Disproof
of a Class of Linear Theories of Gravitation. Astrophys. J. 185, 31 (1973);

[20] J. H. Taylor, Discover of a Pulsar in a Binary System. Ann. N. Y. Acad. Sci. 262,
490 (1975);

[21] J. H. Taylor, L. A. Fowler e M. McCulloch, Measurements of General Relativistic


Effects in the Binary PSR1913+16. Nature 277, 437 (1979);

[22] J. H. Taylor, Binary Pulsars and Relativistic Gravity. Rev. Mod. Phys. 66, 711
(1994);

[23] R. H. Dicke, Mach’s Principle and Equivalence. Em Evidence for Gravitational Theo-
ries. (Proceedings of Course 20 of the International School of Physics “Enrico Fermi,”
ed. C. Moller. Academic, New York, 1962);

[24] J. Plebanski, em Lectures on Non-Linear Electrodynamics. (Nordita, Danmark,


1970);

[25] W. E. Thirring, An Alternative Approach to the Theory of Gravitation. Ann. Phys.


16, 96 (1961);

[26] V. Fock, em The Theory of Space, Time and Gravitation. (Pergamon Press, Oxford,
1964);

[27] R. H. Kraichnan, em Quantum Theory of the Linear Gravitational Field. (Tese de


doutorado não publicada, Massachusetts Inst. Tech., Mass., 1947);

[28] R. H. Kraichnan, Special-Relativistic Derivation of Generally Covariant Gravitation


Theory. Phys. Rev. 98, 1118 (1955);

[29] S. N. Gupta, Gravitation and Electromagnetism. Phys. Rev. 96, 1683 (1954);

[30] L. D. Landau e E. M. Lifshitz, em Teoria do Campo. (Editora Mir, Moscou, 1980);

56
[31] S. N. Gupta, Quantization of Einstein’s Gravitational Field: Linear Approximation.
Proc. Phys. Soc. A 65, 162 (1952);

[32] S. N. Gupta, Quantization of Einstein’s Gravitational Field: General Treatment.


Proc. Phys. Soc. A 65, 608 (1952);

[33] H. Stephani, D. Kramer, M. MacCallum, C. Hoenselaers e E. Heret, em Exact Solu-


tions of Einstein’s Field Equations. (Cambridge University Press, Cambridge, 2003);

[34] J. Foster & Nightingale, em A Short Course in General Relativity. (Longman Scien-
tific & Technical, Hong Kong, 2003);

[35] Anderson, J. D.; et al, Acta Astronautica 5, 43 (1978).

57
Capı́tulo 2

Cosmologia I: Fenomenologia

Martin Makler1

2.1 Introdução
O leitor pode estar se perguntando o que significa a palavra fenomenologia no tı́tulo
deste capı́tulo. Por isso, vamos começar conceituando esse termo no contexto cos-
mológico. Como a palavra dá a entender, essa área possui uma conexão direta com
os fenômenos, ou seja, com o que é observado no Universo. Não se trata exatamente
da cosmologia observacional, que precisa lidar com um grande número de aspectos
relacionados à aquisição e tratamento dos dados (imagens, espectros, etc.), estratégias
observacionais, instrumentos utilizados, etc. Por outro lado, a cosmologia teórica en-
volve aspectos mais fundamentais relacionados a modelos e teorias de gravitação e
fı́sica de partı́culas. O foco principal da fenomenologia é exatamente a relação entre
as observações astronômicas e os modelos teóricos. Essa área tem tido um crescimento
vigoroso nos últimos anos graças ao vasto conjunto de dados observacionais voltados
para a cosmologia, coletados a partir de telescópios na Terra e no espaço, varrendo os
mais diversos comprimentos de onda da radiação eletromagnética, dos raios gama às
ondas de rádio.
Muitas pessoas se referem ao momento atual da cosmologia como “era de precisão”.
Embora esse termo possa ser discutido, não há dúvidas de que a cosmologia passou
por uma profunda transformação na última década. Há cerca de vinte anos, a dis-
persão nos valores da maioria das quantidades relevantes para a cosmologia chegava
facilmente a 100%. O parâmetro de Hubble (i.e., a taxa de expansão do Universo), por
exemplo, oscilava entre 50 e 100 Km/s/Mpc, dependendo do método de medida. As
medidas da densidade de matéria tinham incertezas comparáveis e não havia pratica-
mente nenhuma informação sobre a variação da taxa de expansão (i.e. a aceleração)
do Universo. Com as pesquisas detalhadas utilizando a radiação cósmica de fundo, os
levantamentos de posições de galáxias e as supernovas do tipo Ia, entre outros, esse
panorama mudou por completo. Para se ter uma idéia, a temperatura da radiação
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.

58
cósmica de fundo é conhecida com uma incerteza de 0,1% e a densidade de matéria
ordinária (prótons e nêutrons) é estimada com uma incerteza de cerca de 3%.
Essa mudança qualitativa na cosmologia observacional deveu-se à disponibilidade de
dados em abundância, graças aos desenvolvimentos tecnológicos e ao interesse nessa
área de pesquisa. Para se ter uma idéia do volume de dados disponı́vel, um mapea-
mento ótico do céu, conhecido como Sloan Digital Sky Survey (SDSS), disponibilizou
publicamente em 2006 seu quinto data release, contendo imagens de 215 milhões de
objetos e espectros de cerca de 670.000 galáxias, totalizando uma base de dados de
mais de 9 TB. Por outro lado, a sonda espacial WMAP realizou um mapa completo do
céu na faixa da radiação cósmica de fundo (microondas) com uma resolução de algu-
nas dezenas de segundo de arco. De um modo geral, podemos dizer que a cosmologia
contemporânea se caracteriza por uma grande abundância de dados observacionais, ao
menos no que se refere a um conjunto de observáveis que inclui os mencionados acima
(distribuição de galáxias e aglomerados, radiação cósmica de fundo e supernovas).
Essa situação implica na necessidade de utilizar métodos estatı́siticos apropriados para
lidar com esse conjunto de dados, permitindo extrair a maior quantidade de informação
fı́sica a partir destes. Outra implicação da abundância de dados é a necessidade de
uma modelagem realista dos sistemas observados e dos métodos utilizados. Lembrando
de uma distinção apreendida nos cursos de fı́sica experimental, existem os erros es-
tatı́sticos e os sistemáticos. Quando há muitos dados, os erros sistemáticos passam a
ser dominantes. Isso significa que é preciso levar em conta de forma detalhada como
as medidas e indicadores estatı́siticos se relacionam com os processos fı́sicos que se
quer investigar. Longe de ser uma tarefa enfadonha, a necessidade de levar em conta
essas questões abre una nova janela de possibilidades para pesquisas tanto de cunho
mais teórico, quanto mais aplicado, em um terrenho bastante recente no contexto
cosmológico.
Infelizmente, tanto pelas limitações espaço-temporais, quanto pelo caráter introdutório
deste livro, não será possı́vel explorar a vasta área da fenomenologia em cosmologia.
O objetivo muito mais modesto deste capı́tulo é apresentar um breve panorama do
Universo observado e introduzir alguns conceitos e equações que permitem descrever a
sua estrutura e evolução. Naturalmente, em vários momentos procuraremos enfatizar
a conexão entre os modelos e as observações.
Quase todos os resultados deste capı́tulo serão baseados na chamada “cosmologia new-
toniana”, onde poderemos nos centrar nos conceitos sem a neccessidade de utilizar o
ferramental da relatividade geral. Através dessa formulação newtoniana da cosmolo-
gia poderemos abordar um grande número de fenômenos cosmológicos, incluindo a
dinâmica global (média) do Universo e a formação de estruturas em grande escala.
Procuraremos deixar claro as limitações dessa abordagem, apontado o que muda e o
que fica igual quando consideramos a cosmologia relativista. No próximo capı́tulo será
discutida em detalhes a cosmologia relativista.

2.2 O Universo Observado


Nesta seção apresentamos uma panorama geral de alguns componentes do Universo tal
como o conhecemos e de algumas observações que fundamentam a nossa compreensão
atual do Cosmos. Vamos percorrer as escalas astronômicas desde as galáxias até a
estrutura em grande escala do Universo, mostrar como foi descoberta a expansão do

59
Universo, introduzir o conceito de matéria escura, e apresentar as supernovas do tipo
Ia e a sua utilizade em cosmologia.

2.2.1 Galáxias
Pode-se escolher como marco do nascimento da cosmologia observacional a descoberta
da expansão do Universo. Como veremos mais adiante, essa descoberta foi feita a partir
de medidas do afastamento das galáxias. Esses objetos proporcionaram, portanto, as
primeiras formas de sondar o nosso Cosmos e continuam até hoje a ser uma das
principais fontes de informação para cosmologia. Nada mais justo do que começar o
nosso passeio pelo Universo falando um pouco sobre a natureza desses objetos. Nesse
caminho também procuraremos que o leitor se familiarize com algumas ordems de
magnitude das escalas cosmológicas2 .

A Distância a Andrômeda e a Natureza das Galáxias

Quase tudo o que vemos a olho nú no céu está contido na Via Láctea, a nossa galáxia.
No entanto, há bilhões de galáxias no Universo osbervável. A natureza extra-galáctica
das “nebulosas espirais”, ou seja, o fato desses objetos serem externos à Via Láctea
(constituindo outros “universos-ilha”, como nossa galáxia), só foi estabelecida na
década de 1920. Essa descoberta está intimamente relacionada à medida da distância à
galáxia de Andrômeda (M31, veja a fig. 2.1), que havia sido assunto de intenso debate
durante a década anterior (para uma cronologia resumida, veja as refs. [1, 2, 3]).
A questão chave é justamente a dificuldade de se realizar medidas de distância em
escalas astronômicas, já que apenas para as estrelas mais próximas é possı́vel medir
as distâncias de forma direta, através de sua paralaxe3 . Quase todos os métodos para
medir distâncias cosmológicas se baseiam no conhecimento de alguma propriedade
intrı́nseca do objeto (ou conjunto de objetos) que se quer observar. Por exemplo, se
sabemos a luminosidade L de um objeto, ou seja, a energia total por unidade de tempo
que ele emite, é fácil obter a sua distância, já que o seu fluxo observado (energia por
unidade de tempo e área) cai com o inverso do quadrado da distância (e o fluxo é
uma quantidade diretamente observável, ligado ao brilho aparente do astro). Uma
boa parte da cosmologia observacional do século XX foi dedicada à busca por relações
que permitam obter a luminosidade intrı́sica a partir de propriedades observáveis de
algum objeto. Um exemplo desse tipo de relação foi a proposta por Ernst Öpik4 em
1921. Öpik desenvolveu um método de medida de distâncias baseado na velocidade
de rotação das galáxias. Ele pressupôs que a razão massa/luminosidade (M/L) das
galáxias (espirais) é aproximadamente constante e que o seu brilho superficial também
não sofre grandes variações entre galáxias distintas. Com isso ele chegou à relação
L ∝ Vc4 , onde Vc é a velocidade circular máxima de uma galáxia, medida através da
largura das linhas do seu espectro. A partir desse resultado, Öpik encontrou que M31
2
As unidades de distância mais utilizadas em astronomia, e portanto em cosmologia observacional, são
o parsec (abrevia-se pc) e seus derivados. Veja o glossário (seção 2.10) para a sua definição e a conversão
para outras unidades.
3
A paralaxe é a variação na posição de uma estrela próxima em relação a estrelas distantes causada
pelo movimento da Terra ao longo do Sol. Esse efeito geométrico pode ser utilizado para medir a distância
de algumas estrelas usando trigonometria elementar.
4
Para uma breve biografia de Öpik, com a discussão de suas contribuições para a astronomia, veja
http://www.aai.ee/muuseum/Reprints/HTML/index.html?ernstopikcentenary.htm.

60
Figura 2.1: Imagem da galáxia de Andrômeda (M31) e de duas galáxias satélites, M31
(abaxio) e M110 (mais alongada, no canto superior esquerdo da foto). Crédito: T.A.Rector
e B.A.Wolpa/NOAO/AURA/NSF.

está a 750 quiloparsecs (kpc, veja o glossário) da Terra, uma distância bem maior do
que o tamanho estimado de nossa galáxia. Embora o seu resultado não tenha recebido
muita atenção na época (realmente as hipóteses que levaram a essa relação são um
pouco grosseiras), as suas idéias são a base de um método de medida da distância a
galáxias espirais utilizado até hoje, conhecido como método de Tully-Fisher.
Uma forma de medir distâncias melhor fundamentada do ponto de vista empı́rico
foi desenvolvida a partir dos trabalhos da astrônoma Henrietta Leavitt em 1911-12.
Leavitt estudou um tipo de estrela variável conhecido como cefeida e verificou que
havia uma relação entre o perı́odo de variação e o brilho máximo dessas estrelas.
Ela chegou a essa conclusão ao estudar 25 cefeidas na pequena nuvem de magalhães
(fig. 2.3). Supondo que elas estavam aproximadamente à mesma distância da Terra, a
relação entre o brilho aparente e o perı́odo de variação deveria ser uma conseqüência de
uma relação intrı́nsica entre perı́odo e luminosidade. Com isso, seria possı́vel saber a
distância relativa entre duas cefeidas, mas ainda faltava obter o chamado “ponto zero”,
que daria a distância absoluta das cefeidas. Pouco tempo após a descoberta de Leavitt,
Ejnar Hertzsprung (1913) e Harlow Shapley (1918) obtiveram medidas de distância
para cefeidas em aglomerados globulares utilizando um método estatı́stico associado
à paralaxe. Agora era possı́vel medir distâncias astronômicas utilizando cefeidas.5
N~
ao há refer^
encia a esta figura no texto
Em 1917, George Willis Ritchey descobriu estrelas “novas” em “nebulosas”, o que mo-
tivou Edwin Hubble a estudar a variabilidades desses objetos. Assim, Hubble acabou
descobrindo várias estrelas do tipo cefeida em M31. A partir das cefeidas, Hubble
obteve, em 1923, o valor de 275 kpc para a distância de M31, o que, embora estando
abaixo do valor obtido por Öpik, confirmava a sua natureza extra-galáctica. Essa foi a
evidência considerada decisiva de que Andrômeda estava realmente fora da Via Láctea
5
Para uma discussão mais detalhada sobre a medida de distância com cefeidas e a sua história, veja
a ref. [3].

61
Figura 2.2: Curvas de luz (variação do brilho em função do tempo) de quatro cefeidas na
galáxia M33 obtidas por Hubble. Fonte: referência [5].

e era o que hoje conhecemos como galáxia, encerrando o chamado “grande debate”
sobre a natureza desses objetos. É oportuno salientar que Hubble só pôde utilizar a
relação descoberta por Leavitt pois ele tinha acesso ao recém inaugurado telescópio
Hooker – o maior de sua época, com um espelho de 100 polegadas de diâmetro – o que
permitiu identificar estrelas individuais em Andrômeda e medir a variação do brilho
das cefeidas ali descobertas.
Uma medida moderna da distância a M31 fornece o valor 784 ± 13 ± 17 kpc (in-
cluindo os erros estatı́sticos e sistemáticos) [4]. Essa diferença é devida à existência
de duas populações (classes) diferentes de cefeidas, obedecendo a relações perı́odo-
luminosidade distintas6 , fato desconhecido na época das medidas de Hubble. Esse erro
sistemático se propagou também na estimativa da taxa de expansão do universo, como
mencionaremos mais adiante. Cabe ressaltar que o valor encontrado por Öpik, emb-
ora seja surpeendentemente próximo do valor atual, também estava sujeito a muitas
incertezas. O próprio pesquisador chegou a obter valores próximos de 400 kpc para a
mesma distância.
O método baseado em estrelas cefeidas ainda é muito utilizado para medir distâncias
de galáxias relativamente próximas e para determinar a taxa de expansão do Universo,
como será discutido nas seções (2.2.3) e (2.2.4).
idem

Tipos de Galáxias

As dimensões tı́picas das galáxias são da ordem de dezenas de quiloparsecs. O disco


da Via Láctea, por exemplo, possui um diâmetro de aproximadamente 30 kpc.7 Na
verdade as galáxias não possuem fronteiras bem definidas, apenas uma densidade
6
Veja a ref. [3] para uma discussão histórica sobre a descoberta, durante a Segunda Guerra Mundial,
das duas populações de cefeidas.
7
A distância do Sol ao centro da Via Láctea é 8.2 ± 0.15 ± 0.15 kpc.

62
Figura 2.3: Relação perı́odo-luminosidade das Cefeidas obtida por Henrietta Leavitt.
Magnitudes aparentes de 25 cefeidas na Pequena Nuvem de Magalhães em função do
logaritmo do perı́odo em dias. Os pontos superiores (inferiores) correspondem aos máximos
(mı́nimos) da luminosidade de cada estrela. Fonte: referência [7].

continuamente decrescente de estrelas em sua periferia. Um “tamanho” bem definido


é dado pelo raio Rm que engloba a metade de sua luz. O tamanho ótico tı́pico de uma
galáxia em uma foto é da ordem de 3 Rm . Radio-telescópios detectam hidrogênio até
aproximadamente 10 Rm .
Na década de 1920, Edwin Hubble elaborou um critério de classificação das galáxias
a partir de sua morfologia. Na realidade existe um contı́nuo nas formas das galáxias
e nos seus tipos espectrais, mas podemos dividı́-las em três tipos básicos: espirais,
elı́pticas e irregulares. Exemplos de galáxias espirais brilhantes são dados pela Via
Láctea e a galáxia de Andrômeda. A componente luminosa das galáxias espirais é
formada por um bojo central esferoidal, o disco e o halo. O bojo é composto por
estrelas velhas com órbitas aleatórias. Já o disco, onde estão os braços espirais, é
composto predominantemente por estrelas jovens, algumas ainda em formação, gás
e poeira que efetuam órbitas circulares em torno do centro galáctico. As velocidades
de rotação são tipicamente de centenas de km/s. Há um halo esférico, que se estende
além o disco, e possui pouco gás, sendo formado por estrelas velhas em aglomerados
globulares.
Como o próprio nome diz, nas galáxias elı́pticas as estrelas estão distribuı́das na forma
de um elipsóide, cujas formas variam da esférica até um achatamento de 3:1. Essas
galáxias possuem um movimento de rotação muito lento comparado com as espirais,
já que as estrelas seguem órbitas aleatórias. Elas são geralmente formadas por estrelas
velhas, possuindo pouco gás e apresentando baixa taxa de formação estelar. Devido a
suas populações estelares, as galáxias elı́pticas são geralmente avermelhadas, enquanto
as espirais são azuladas.
As galáxias irregulares têm uma aparência amorfa e são constituı́das por estrelas de
idades variadas, possuindo muito gás e poeira e altas taxas de formação estelar Geral-
mente são menos luminosas do que a maioria das elı́pticas e espirais. De certa forma,
as galáxas irregulares se assemelham a um pedaço de braço espiral. Evidentemente as
estrelas e o gás seguem trajetórias irregulares.

63
Figura 2.4: Imagem da galáxia de Andrômeda obtida por Hubble com a anotação “var”
ao lado de uma estrela variável. Crédito: Observatories of the Carnegie Institution of
Washington, Mount Wilson Observatory Historical Archive.

Em resumo, à medida que passamos de galáxias elı́pticas para espirais e depois para
irregulares, seguimos uma seqüência de estrelas velhas para estrelas novas, ausência
de gás e poeira para abundância destes e baixa formação estelar para alta formação
estelar.

As luminosidades das galáxias variam de 10−3 vezes a da Via Láctea até 5 vezes esta,
que equivale a 15 × 109 vezes a luminosidade do Sol. Há muito mais galáxias tênues
do que luminosas, mas a maior parte das estrelas está em galáxias com luminosidade
comparável à da Via Láctea.

Curvas de Rotação e Matéria Escura

Graças ao efeito Doppler, podemos medir a velocidade de rotação das galáxias. Por
exemplo, a partir de um espectro cobrindo diferentes partes de uma galáxia espiral
vista de perfil pode-se determinar a velocidade de rotação em função da distância ao
centro galáctico. Esse resultado, obtido tipicamente através do estudo algumas linhas
de emissão do gás (por exemplo a linha de 21 cm do hidrogênio), é chamado curva
de rotação. Durante a década de 1970, Vera Rubin — que nos anos 1950 já havia
descoberto a rotação das galáxias e proposto a existência da estrutura em grande
escala — obteve curvas de rotação para diversas galáxias [8]. A partir desses dados
é possı́vel fazer uma estimativa da distribuição de massa nas galáxias. Por exemplo,
supondo que o gás e as estrelas estão em movimento estacionário circular e utilizando
a lei de Newton temos:
M (r) [V (r)]2
G 2 = , (2.1)
r r
64
Figura 2.5: Detalhe da galáxia M100, localizada no aglomerado de galáxias da Virgem. Nos
destaques é possı́vel ver a variação de uma estrela cefeida, descoberta através do telescópio
espacial Hubble. Créditos: Dr. Wendy L. Freedman, Observatories of the Carnegie Insti-
tution of Washington, STScI e NASA.

onde V é a velocidade tı́pica das estrelas situadas a uma distância r do centro galáctico
e M é a massa no interior de sua órbita8 . Para estrelas e gás na periferia da galáxia,
a massa contida em sua órbita seria aproximadamente igual à massa total: M (r) '
Mgaláxia = const. Dessa forma, a velocidade deveria cair com a raiz quadrada da
distância, nas partes mais externas das galáxias.

As curvas V (r) × r preditas pela luminosidade observada (estrelas + gás) não con-
seguem explicar as velocidades medidas a grandes distâncias do centro galáctico (veja
a figura 2.9). Em vez de decair, a velocidade permanece aproximadamente constante a
grandes distâncias. Se adicionamos uma componente de matéria com uma distribuição
do tipo ρ ∝ r−2 à distribuição de massa detectada, é possı́vel reproduzir as velocidades
observadas. No entanto, não há sinal da matéria visı́vel em nenhum comprimento de
onda seguindo essa distribuição. Por isso, chamamos esta matéria de matéria escura.
Na maioria das galáxias, há de 3 a 10 vezes mais matéria escura do que matéria visı́vel.
Os halos de matéria escura se extendem por distâncias bem maiores que o raio visual
(óptico) das galáxias. É possı́vel que o halo da Via Láctea, por exemplo, se extenda
por centenas de kpc.

É importante destacar que o resultado discutido acima se mantém mesmo quando


são utilizados modelos realistas e detalhados da distribuição de gás e estrelas, indo
muito além da estimativa grosseira obtida a partir da equação (2.1). Além disso, ele se

8
Naturalmente haveria correções devido à galáxia não ser esfericamente simétrica. No entanto, o termo
dominante da força gravitacional é o de monopolo e só queremos fazer uma estimativa do resultado.

65
Figura 2.6: A galáxia espiral M83. Crédito: Telescópio SOAR.

repete de forma bastante genérica para outras galáxias em que é possı́vel obter curvas
de rotação: não é possı́vel explicar essas curvas somente com a matéria luminosa.9

2.2.2 Grupos e Aglomerados de Galáxias


Uma fração das galáxias se econtra na forma de agrupações gravitacionalmente ligadas,
que podem ter de uma dezena até milhares de membros. Embora não haja uma divisão
clara entre elas, costuma-se chamar de grupos os conjuntos gravitacionalmente ligados
contendo menos de 50 galáxias e aglomerados aos objetos maiores. Por exemplo, a Via
Láctea, a galáxia de Andrômeda (M31), M33, as Nuvens de Magalhães e mais três
dezenas de pequenas galáxias (e um número equivalente de galáxias anãs), formam
o Grupo Local10 . O aglomerado mais próximo da nossa galáxia é o aglomerado de
Virgem, que inclui as galáxias M87 e M100, e é constituı́do de aproximadamente
2.000 membros. Ele ocupa uma grande área do céu, de uns 5◦ de abertura e está
a uma distância de aproximadamente 16 Mpc de nossa galáxia.11 Outro aglomerado
próximo, situado a cerca de 100 Mpc, é o aglomerado de Coma12 , que possui da ordem
de 3.000 galáxias.
O tamanho tı́pico de um grupo de galáxias é de 1-2 Mpc e as suas massas são da ordem
de 1013 massas solares. Já os aglomerados possuem diâmetros da ordem de 5 Mpc e
9
Vale lembrar que esse resultado vale no contexto da teoria da gravitação de Newton (ou no limite
newtoniano da teoria de relatividade geral, que é justificado nesse contexto). Teorias alternativas de
gravitação podem fornecer resultados distintos.
10
Para saber mais sobre o grupo local, veja o sı́tio
http://seds.org/messier/more/local.html.
11
Uma medida de distância utilizando estrelas cefeidas em M100 descobertas com o telescópio Hubble
fornece o valor 16.1 ± 1.3 Mpc [10].
12
Na verdade a denominação correta em portugês deveria ser “aglomerado da Cabeleira”, já que o seu
nome decorre dele estar na direção da constelação Coma Berenices, que significa Cabeleira de Berenice.
Por uma questão de estética, manteremos o nome Coma.

66
Figura 2.7: A galáxia elı́ptica gigante M87, situada no aglomerado de Virgem. Créditos:
David Malin e Anglo-Australian Observatory.

massas tipicamente entre 1014 e 1015 massas solares (M ). Denomina-se “riqueza”


ao número de galáxias de um grupo ou aglomerado. Os aglomerados chamados ricos
possuem de centenas a milhares de galáxias (tipicamente entre 200 e 1000). Embora
sejam muito massivos, a sua abundância é pequena, e apenas uma minoria das galáxias
(5-10%) está nesse tipo de aglomerado.
Em 1958, o astrônomo George Abell elaborou um catálogo de 2.712 aglomerados a
partir de placas fotográficas do Palomar Observatory Sky Survey. Esse catálogo foi
ampliado ao longo dos anos (eram 4500 em 1989) tendo sido uma das fontes mais
importantes de informações sobre aglomerados. Hoje há catálgos contendo cerca de
14.000 aglomerados de galáxias e centenas de milhares de grupos, identificados no
Sloan Digital Sky Survey (SDSS, ref. [11]). Estima-se que há cerca de 106 aglomerados
no universo observável.
Observa-se que a aglomeração das galáxias depende do seu tipo: as galáxias espirais
têm uma maior tendência a estarem isoladas (chamadas “galáxias de campo”) en-
quanto as elı́pticas são encontradas preponderantemente em aglomerados. Nos aglom-
erados ricos, por exemplo, 60-80% das galáxias são elı́pticas, enquanto fora dessas
estruturas 60% são espirais. Devido a suas populações estelares, as galáxias espirais
são mais “azuis” (por possuı́rem estrelas jovens), enquanto as elı́pticas são “vermel-
has”. O efeito de segregação por morfologia é facilmente visı́vel em catálogos onde as
galáxias são identificadas por sua cor (veja a próxima seção). Uma forma de detectar
aglomerados de forma automatizada utiliza esse efeito, procurando por agrupamentos
em torno de galáxias vermelhas brilhantes, que são geralmente os centros de massa

67
Figura 2.8: A Grande Nuvem de Magalhães é uma galáxia irregular, satélite da Via
Láctea. Créditos: Anglo-Australian Observatory/Royal Observatory, Edimburgh.

dessas agrupações [11].


Comparados com as galáxias, os aglomerados podem ser modelados teoricamente com
relativa facilidade. De fato, desde a década de 1970 existem modelos analı́ticos que
descrevem a formação desses objetos e predizem a sua abundância em função do mod-
elo cosmológico [12]. Desse modo, observáveis relacionados a aglomerados constituem
um importante teste para os modelos cosmológicos. Por exemplo, a sua abundância
em função da massa e a variação do número de aglomerados ao longo da história
cósmica permitem estabelecer limites sobre a composição do Universo. Nos útlimos
anos houve um grande progresso na modelagem desses objetos, tanto com abordagens
semi-analı́ticas, quanto do ponto de vista das simulações computacionais (veja a seção
2.5.2). Hoje um grande número de propriedades observadas dos aglomerados, tais como
como abundância, distribuição espacial e estrutura, é reproduzido nessas simulações,
proporcionando uma descrição desses objetos a partir de primeiros princı́pios (e não
de forma apenas empirica, como é o caso de muitas propriedades das galáxias).
Uma das propriedades que tornam esses objetos relativamente simples, além deles
serem as maiores estruturas gravitacionalmente ligadas do Universo, é o fato da
dinâmica dos aglomerados ser dominada pela matéria escura, como veremos a seguir.
De ponto de vista observacional, os aglomerados têm um interesse especial, pois po-
dem ser estudados em um amplo espectro de comprimentos de onda, como veremos
na seção (2.2.2). Além disso, eles podem ser estudados pelo desvio que o seu campo
gravitacional causa na trajetória da luz de galáxias distantes, produzindo o efeito de
lente gravitacional (seção 2.2.2).

Dispersão de Velocidades e Matéria Escura

Além de possuirem um movimento coletivo constituindo a velocidade global do aglom-


erado,13 as galáxias executam um movimento aleatório em relação ao seu centro de
massa. Através da medida dos desvios para o vermelho das galáxias em um mesmo
aglomerado, é possı́vel obter a dispersão das velocidades destas (veja a figura 2.11).
13
Como veremos na seção (2.2.3), a maior contribuição para a velocidade de afastamento dos aglomer-
ados com relação a nossa galáxia é devida à expansão do universo.

68
Figura 2.9: Curva de rotação da galáxia M33, segundo a referência [9]. A curva com
tracejado curto mostra a contribuição do disco da galáxia para as velocidades, enquanto a
com tracejado longo mostra a contribuição do gás. A curva contı́nua mostra o modelo que
melhor ajusta as velocidades obtidas observacionalmente. A curva com tracejado curto e
longo mostra a contribuição do halo de matéria escura inferida a partir da distribuição de
velocidades observada e do modelo utilizado para ajustar esses dados.

Supondo que o aglomerado está, aproximadamente, em um estado de equilı́brio


dinâmico, conhecido como “equilı́brio do virial”, é possı́vel utilizar a velocidade
quadrática média para obter a sua massa: M ' 2R hv 2 i /G, onde R é o raio do
aglomerado.

Em 193314 Fritz Zwicky e colaboradores mediram as velocidades relativas de galáxias


no aglomerado de Coma (que são da ordem de 103 km/s)15 e utilizaram essas ob-
servações para estimar a massa desses aglomerados. Comparando a razão massa-
luminosidade (M/L) desses aglomerados com a das estrelas, eles obtiveram valores
duas ordens de magnitude superiores. Portanto a maior parte da massa dos aglomera-
dos não podia estar sob a forma de estrelas. Em outras palavras, a matéria “luminosa”
era insuficiente para explicar os movimentos das galáxias no aglomerado: surgia pela
primeira vez uma evidência para a “matéria escura” (ou “matéria faltante”, como
também ficou conhecida). A análise de Zwicky16 foi repetida inúmeras vezes para out-
ros aglomerados e a conclusão é sempre a mesma, a maior parte da matéria não pode
estar sob a forma de estrelas.

Além de surpreendente, o resultado obtido por Zwicky foi muito controverso e não foi
bem aceito na época de sua descoberta. O conceito de matéria escura só ganhou força
após os trabalhos de Vera Rubin na década de 70 mencionados acima.

14
Apenas uma referência posterior, de 1937 é fácil de ser obtida [13].
15
A velocidade de dispersão das galáxias em grupos é da ordem de 150 km/s.
16
O teorema do virial nos permite ter uma estimativa da ordem de grandeza dos aglomerados. Natural-
mente, modelos muito mais detalhados para a distribuição de velocidades das galáxias foram estudados.
A conclusão é sempre a mesma: a matéria escura domina a dinâmica dos aglomerados.

69
Figura 2.10: Aglomerado de galáxias de Coma (Abell 1656). Composição de exposições
em três filtros feitas com o telescópio de 90cm do Kitt Peak National Observatory. Crédito:
O. Lopez-Cruz (INAOEP) et al., AURA, NOAO, NSF.

Aglomerados de Galáxias como Lentes Gravitacionais

Uma conseqüência natural da deflexão da luz por um corpo massivo, predita pela teoria
da relatividade geral, é a possibilidade da existência de lentes gravitacionais. Embora
seja um fato ainda pouco conhecido, Einstein obteve a equação de lente gravitacional,
a possibilidade de imagens duplas e a magnificação das imagens em anotações de
1912 [15]. Em 1924, Chwolson publicou o primeiro artigo sobre lentes gravitacionais
[16], mencionando a idéia de “estrelas duplas fictı́cias”. Ele também discutiu o caso
simétrico de duas estrelas exatamente alinhadas com a Terra, resultando em uma
imagem circular da estrela mais distante. Já em 1936, Einstein previu o aparecimento
de um “cı́rculo luminoso” para um alinhamento entre fonte e lente,17 e de duas imagens
magnificadas para dois objetos levemente desalinhados18 [17]. Em 1937 Zwicky notou
que seria muito mais provável observar o efeito de lente gravitacional em galáxias do
que em estrelas e que as lentes gravitacionais podem ser utilizadas como um “telescópio
natural” [13]. No mesmo ano ele propôs a utilização do efeito de lente gravitacional
para determinar a massa de aglomerados de galáxias.
A deflexão da luz, predita por Einstein em 1911 (com um erro de um fator dois) e com
a teoria de relatividade geral em 1915, foi confirmada experimentalmente durante o
eclipse solar de 1919 observado em Sobral, no Ceará (e também na na Ilha Prı́ncipe,
mas o resultado teve uma significância menor). Entretanto, apenas em 1979 foi de-
scoberta a primeira lente gravitacional: uma imagem dupla de um quasar, causada por
uma galáxia. A partir daı́ as lentes gravitacionais se tornaram uma área observacional
com inúmeras aplicações em astrofı́sica e cosmologia e que vem sendo explorada cada
vez mais. A primeira lente gravitacional formada por um aglomerado de galáxias foi
17
Hoje em dia essa configuração de lente é chamada de “anel de Einstein”, mas talvez devesse ser
chamada de “anel de Einstein-Chwolson”.
18
Para uma animação desse efeito, mostrando a distorção de uma radiofonte ao passar por trás de uma
galáxia, veja o link
http://www.usm.uni-muenchen.de/people/botzler/lecture/animated lens large.gif.

70
Figura 2.11: Velocidade de recessão das galáxias no aglomerado de Coma obtidas a partir
dos desvios para o vermelho. A velocidade de cada galáxia é mostrada em função de sua
distância angular ao centro do aglomerado. Também aparecem galáxias no mesmo campo
angular, mas que não pertencem ao aglomerado.

encontrada por acaso, por Roger Lynds e Vahe Petrosian e, independentemente, por
Soucail et al., em 1986 [19].
Além do efeito mais espectacular de gerar imagens múltiplas e arcos (conhecido como
efeito forte, veja a figura 2.12), as lentes gravitacionais podem produzir um efeito
fraco, para objetos mais distantes da linha de visada entre a Terra e a lente (ou
seja, o alomerado) ou para lentes em que não há suficiente concentração de matéria
no centro. Esse efeito consiste em uma deformação das imagens de galáxias situadas
atrás do aglomerado na direção tangencial (veja a figura 2.13). Tal distorção pode
ser extremamente sutı́l e detectável apenas estatisticamente para um grande número
de galáxias (ao contrário da fig. 2.13). Tanto o efeito forte, quanto o fraco, têm sido
utilizados para estimar massas de aglomerados. Os resultados são consistentes com os
obtidos a partir da dispersão de velocidades, ou seja, a maior parte de sua massa está
sob a forma de matéria escura.

Além do Ótico: Aglomerados em Outros Comprimentos de Onda

Os aglomerados não são formados apenas por suas galáxias membro e pela matéria
escura. Eles são permeados por um gás rarefeito (basicamente Hidrogênio e Hélio) em
equilı́brio hidrostático (pelo menos em primeira aproximação). Para não colapsar sob
a ação dos fortes campos gravitacionais dos aglomerados, esse gás intra-aglomerado
tem que estar a temperaturas altı́ssimas, da ordem de 107 ∼ 108 K, correspondendo
a energias da ordem dos quilo-elétron-volts (veja o glossário 2.10). O gás emite fótons
nessa faixa de energia, que corresponde aos “raios-x moles”. De fato, as primeiras
observações em raios-x, na década de 197019 detectaram a emissão de aglomerados
nessa faixa do espectro eletromagnético. A partir do espectro em raios-x é possı́vel
determinar a temperatura do gás e, utilizando da hipótese de equilı́brio, obtem-se
uma estimativa do potencial gravitacional que “segura” o gás, ou seja da massa do
19
As observações em raios-x precisam ser feitas do espaço, pois a atmosfera é praticamente opaca nessa
faixa do espectro.

71
Figura 2.12: Região central do aglomerado de galáxias 0024+1654, situado a aproxi-
madamente 1,5 Gpc. Fica claro o efeito forte de lente gravitacional causado por esse
aglomerado, exibindo imagens múltiplas da mesma galáxia azul, distando o dobro que o
aglomerado. Esses arcos foram descobertos em 1988 por David Koo, do observatório Lick.
Crédito desta foto: W.N. Colley e E. Turner (Princeton University), J.A. Tyson (Bell
Labs, Lucent Technologies) e NASA/STScI.

aglomerado. Os resultados obtidos com essa técnica são consistentes com as estimativas
feitas a partir da dispersão de velocidades (veja a seção 2.2.2) e do efeito de lente
gravitacional (seção 2.2.2). Para aglomerados relaxados (ou seja próximos do estado
de equilı́brio) as estimativas de massa com esses três métodos diferem em cerca de
20% entre si apenas (veja, por exemplo, a ref. [20]), mantendo o resultado de que a
matéria em galáxias corresponde a poucos centésimos da massa total do aglomerado.
A partir da luminosidade em raios-x dos aglomerados (LX ∼ 109 − 1011 L , onde
L á a luminosidade total do Sol) é possı́vel obter a densidade do gás, que corre-
sponde a 10−4 − 10−2 partı́culas por cm3 . Mesmo com uma densidade tão baixa, o
gás intergaláctico responde pela grande maioria da matéria “comum” (não escura)
nos aglomerados. A massa em gás pode chegar a 20 vezes a massa das estrelas em
galáxias (massa luminosa). Ainda assim, a maior parte da massa dos aglomerados é
proporcionada pela matéria escura. A composição de um aglomerado pode ser resum-
ida da seguinte forma: 2-5% da massa em galáxias, 10-15% no gás intra-aglomerado e
80-90% em matéria escura.20
Além do ótico e dos raios-x, os aglomerados também são estudados no infra-vermelho
(onde são mais facilmente identificados do que no ótico), em ondas de rádio (onde há
menos contaminação por outras fontes) e em microondas. Nesse último caso, os fótons
não são emitidos pelo aglomerado, mas são provenientes da radiação cósmica de fundo
(RCF).
Como veremos mais adiante, existe uma radiação, na faixa de microondas, que per-
meia todo o Cosmos e é o resquı́cio de uma fase quente e densa do Universo. Nós
detectamos esses fótons vindos de uma camada muito distante, conhecida como su-
perfı́cie de último espalhamento. Em seu trajeto em direção à Terra um fóton da RCF
20
Para uma contabilidade mais detalhada sobre a contribuição de cada componente (estrelas, galáxias,
gás ionizado, etc.) para o conteúdo total dos bárions no universo, veja as refs. [21].

72
Figura 2.13: O aglomerado de galáxias Abell 1689. É fácil ver o efeito de lente grav-
itacional sobre as imagens de galáxias situadas atrás do aglomerado, criando arcos para
galáxias próximas ao seu centro e provocando uma distorção tangencial nas galáxias mais
distantes Crédito: NASA/STScI, N. Benitez (JHU), T. Broadhurst (The Hebrew Univer-
sity), H. Ford (JHU), M. Clampin (STScI), G. Hartig (STScI), G. Illingworth (UCO/Lick
Observatory), ACS Science Team e ESA.

Figura 2.14: Galáxias e emissão de raios-x no aglomerado de Coma. Os pontos e as cruzes


mostram as posições das galáxias cujo desvio para o vermelho é conhecido (e os três pontos
maiores representam as galáxias dominantes do aglomerado). As curvas de nı́vel mostram
a intensidade da emissão em raios-x obtida pelo satélite ROSAT. Esta figura foi retirada
da ref. [14] (os cı́culos em pontilhado representam as regiões estudadas nessa referência).

73
Figura 2.15: Imagem da região central do aglomerado Abell 586 obtida pelo Gemini Multi-
Object Spectrograph (GMOS), no telescópio Gemini Norte. As curvas sólidas representam
regiões de igual intensidade (isofotas) da emissão em raios-x, medida pelo telescópio espa-
cial Chandra, espaçadas logaritmicamente. As curvas tracejadas representam a densidade
de massa reconstruı́da através do efeito fraco de lentes gravitacionais. Fonte: Cypriano,
et al. (ref. [20]), gentilmente cedida pelos autores.

pode interagir com os elétrons do gás intra-aglomerado (que é ionizado devido à alta
temperatura), ganhando energia. Esse processo é conhecido como efeito Compoton
inverso, pois são os elétrons que cedem energia aos fótons. Portanto, à raiz dessa in-
teração, a temperatura da RCF muda na direção dos aglomerados massivos, fenômeno
conhecido como efeito Sunyaev-Zel’dovich (SZ). Desse modo, olhando para a RCF en
alta resolução, é possı́vel detectar os aglomerados pelo efeito SZ. A grande vantagem
desse método é que o efeito SZ independe da distância do aglomerado a nossa galáxia.
A intensidade dos fótons emitidos pelo aglomerado, seja no ótico ou no raio-x, decresce
com o inverso do quadrado da distância, enquanto o efeito SZ permanece constante.
O efeito SZ é portanto um método promissor para detectar aglomerados distantes.
Há vários projetos sendo desenvolvidos para identificar aglomerados com esse método
e obter várias quantidades fı́sicas, como a sua massa. Entre os que estão operando,
podemos citar o Sunyaev-Zeldovich Array21 e o Arcminute Microkelvin Imager22 , que
cobrem áreas relativamente pequenas do céu. Está entrando em operação o South Pole
Telescope [22], que mapeará uma extensa área do céu e descobrirá da ordem de 40.000
aglomerados. Para maiores detalhes sobre as aplicações cosmológicas do efeito SZ, veja
a referência [23].

2.2.3 O Cosmos Dinâmico: O Universo em Expansão


A técnica de espectroscopia (veja o glossário), desenvolvida na segunda metade do
século XIX, causou um verdadeira revolução na astrofı́sica. A partir dos espectros
do Sol e das estrelas foi possı́vel identificar os elementos quı́micos que os compõem e
verificar que são os mesmos que existem na superfı́cie da Terra. Também a partir da
espectroscopia, foi possı́vel medir a velocidade de astros, mesmo se nenhum desloca-
mento pode ser perceptı́vel. Isso se deve ao efeito descoberto por Doppler em 1842.
21
http://astro.uchicago.edu/sza/overview.html
22
http://www.mrao.cam.ac.uk/telescopes/ami/

74
Quando um corpo emitindo ondas (por exemplo, eletromagnéticas, ou ondas sonoras)
está em movimento em relação a um observador, este detecta essas ondas com um
comprimento distinto do emitido. Em particular, se movimento é de aproximação em
relação ao observador, o comprimento de onda detectado é menor. Se o emissor se
afasta, o comprimento de onda aumenta. Como os elementos quı́micos emitem a ra-
diação em uma sequência bem definida de comprimentos de onda (linhas de emissão
ou absorção), é fácil medir o efeito Doppler através do espectro. Uma vez que uma
linha é identificada no espectro de um objeto celeste o comprimento de onda desta
(λr ) é comparado com o comprimento de onda de repouso associado a essa linha (λe ).
Assim, define-se o desvio para o vermelho (ou rubro desvio) pela relação
λr − λe
z := ,
λr
onde λr é o comprimento de onda detectado na Terra e λe é o comprimento de onda
emitido (ou seja, em repouso em relação à fonte). No caso não relativı́stico, o desvio
para o vermelho é dado por z = v/c, onde c é a velocidade da onda (no caso, a
velocidade da luz) e v é a velocidade relativa entre fonte e observador.

Figura 2.16: Ilustração esquemática da medida do desvio para o vermelho.

A primeira medida do desvio espectral de uma galáxia foi feita pelo astrônomo Vesto
Melvin Slipher em 1912. Utilizando o telescópio refrator de Lowel, ele obteve o espec-
tro de Andrômeda (M31) e mediu o seu rubro desvio. Ele precisou fazer uma exposição
de 40h em várias noites, para captar o espectro numa chapa fotográfica. Ele obteve
que M31 se aproxima de nossa galáxia a cerca de 300 Km/s. Depois ele mediu a veloci-
dade da galáxia de sombrero, que desta vez de afasta a uma velocidade de cerca de 100
Km/s. Em 1915, Slipher tinha medido os desvios para o vermelho de 15 galáxias (neb-
ulosas espirais, na época), dos quais 13 eram positivos, ou seja, as galáxias estavam se
afastando. Slipher continuou a observar mais galáxias e esse resultado se mantinha, ou
seja, a grande maioria tinha uma velocidade de recessão. Intrigado por esse resultado,
Hubble, com a ajuda de Milton Humason, repetiu as medidas de Slipher e obteve
os desvios para o vermelho de 46 galáxias, em 1929 (novamente, graças ao telescópio
Hooker de Monte Wilson, que era capaz de captar 17 vezes mais luz que o utilizado
por Slipher).
Como vimos na seção (2.2.1), Hubble mostrou que as nebulosas espirais eram extra-
galácticas, aplicando a relação perı́odo-luminosidade de estrelas cefeidas para obter

75
a distância de Andrômeda. Restava agora identificar variáveis cefeidas nas outras
galáxias para as quais eles dispunham do rubro desvio. O resultado foi apresentado
em 1929 e se tornou um mais conhecidos de toda a história da ciência. Hubble mostrou
um diagrama contendo as velocidades e distâncias de 24 galáxias individuais e de uma
combinação de galáxias separadas em 9 grupos (veja a fig. 2.17). O resultado evi-
denciava uma “relação aproximadamente linear entre as velocidades e as distâncias”,
precisamente o que era esperado de um Universo em expansão! No seu artigo, Hubble
conclui “The outstanding feature, however, is the possibility that the velocity-distance
relation may represent the de Sitter effect, and hence that numerical data may be
introduced into discussions of the general curvature of space” (ref. [24]), ou seja, ele
tinha noção das possı́veis implicações desse resultado no contexto da relatividade geral
(embora ele não tenha utilizado o termo expansão do Universo).

Figura 2.17: Diagrama original obtido por Hubble em 1929 (ref. [24]). A legenda original
diz: “Velocidades radiais, corrigidas pelo movimento do Sol, são graficadas em função das
distâncias estimadas pelas estrelas envolvidas e pelas luminosidades de nebulosas [galáxias]
em grupos. Os discos cheios e a linha contı́nua representam a solução para o movimento
solar [ou seja, em relação à Via-Lactea] usando nebulosas individuais. Os cı́rculos rep-
resentam a solução combinando as nebulosos em grupos. A cruz representa a velocidade
média de 22 nebulosas cujas distâncias não puderam ser estimadas individualmente. Nota:
aparentemente, naquela época era comum apresentar a velocidade em quilômetros (e não
em km/s!). Fonte: referência [24].

Voltaremos a falar em mais detalhes sobre a relação distância-rubro desvio nas


próximas seções.Por ora, é suficiente apontar para a interpretação intuitiva desse re-
sultado. Se o Universo está (na média) em expansão uniforme, significa que galáxias
eqüidistantes, estarı́am se separando a uma mesma velocidade, independentemente de
onde estejam. Imagine três galáxias A, B e C, dispostas em linha nessa ordem, sendo a
distância entre A e B igual àquela entre B e C. Assim, A se afastaria de B com veloci-
dade v, e do mesmo modo B se afastaria de C com velocidade v. Assim, A se afastaria
de C com velocidade 2v, mas a distância tamém é o dobro qua a distância a B. Dessa
forma, obtemos uma velocidade proporcional à distância. Mesmo com distâncias irreg-
ulares e em três dimensões, o mesmo resultado é esperado. É importante destacar que,
embora as galáxias pareçam se afastar de nossa, o mesmo efeito seria visto de qualquer
outra. Isso é uma conseqüência da homogeneidade da expansão. Portanto, apesar de
um aparente afastamento radial para um dado observador, a expansão não possui cen-

76
tro. Portanto, é conceitualmente errado associá-la a uma explosão. Explosões possuem
um centro, uma origem bem definida, a expansão cósmica não.
Também é importante enfatizar que o efeito linear é esperado apenas em distâncias
relativamente pequenas, menores que 1Gpc. O raciocı́nio que levou à linearidade não
leva em conta que: i) a taxa de expansão pode variar no tempo, ii) as observações são
feitas a tempos distintos, pela finitude da velocidade da luz (diz-se que as observações
são feitas no cone de luz ), iii) a curvatura do Universo pode afetar esse resultado.
Em 1931 Hubble conseguiu medir as distâncias e desvios para o vermelho de galáxias
vinte vezes mais distantes, o que confirmou o seu resultado de uma relação aproxi-
madamente linear [6]. Hubble já era famoso por ter resolvido o debate sobre a natureza
das nebulosas espirais. Agora ele virou estrela por ter descoberto experimentalmente
a expansão do Universo.
A relação de Hubble costuma se expressa na seguinte forma

v = H0 D,

onde v, é a velocidade de recessão e D é a distância a nossa galáxia. O parâmetro H0 é


conhecido como “constante” de Hubble (embora o seu valor possa variar com o tempo
e não esteja relacionado com as constantes da natureza) e costuma-se parametrizá-lo
na forma
H0 = 100 h Km/s/Mpc.

Os dados de Hubble mostravam que h ∼ 5. No entanto, como foi mencionado na seção


(2.2.1), ainda não se sabia da existência de dois tipos de cefeida. Para um mesmo
perı́odo, as cefeidas do tipo desconhecido eram intrinsicamente mais brilhantes que
as cefeidas estudadas na nossa galáxia e nas Nuvens de Magalhães. Por um efeito
de seleção, apenas essas cefeidas mais brilhantes eram vistas em outras galáxias. Isso
levou Hubble a super-estimar a taxa de expansão. Uma boa parte da cosmologia
observacional do século XX foi dedicada a melhorar as determinações de H0 . Como a
incerteza ainda era significativa até a última década desse século, costuma-se expressar
todas as distâncias cosmológicas (e uma série de quantidades a ela relacionadas) em
termos de h.
Um dos projetos chave to telescópio espacial Hubble foi a determinação de H0 através
da combinação de uma série de métodos de medida de distâncias. Eles utilizaram e
recalibraram a escala de distâncias baseada em cefeidas e aplicaram uma série de outros
métodos para medir a distâncias de galáxias mais distantes23 . Os resultados desse
projeto foram (veja a ref. [25]): h = 0.71±0.2±0.6 (sistemático), a partir de supernovas
do tipo Ia; h = 0.71± 0.3± 0.7, relação de Tully-Fisher; h = 0.70± 0.5± 0.6, flutuações
de brilho superficial; h = 0.72± 0.9± 0.7, supernovas do tipo II e h = 0.82± 0.6± 0.9,
plano fundamental (veja a figura 2.19). A combinação desses resultados, devidamente
pesados, resulta em h = 0.72 ± 0.8, que hoje é considerado praticamente um padrão.
Compare o alcance da figura (2.19), com os dados originais do Hubble (fig. 2.17), que
iam até 2Mpc apenas.
23
O ponto de partida para calibrar esses outros indicadores de distância são as cefeidas, que por sua
vez têm as suas distâncias calibradas utilizando outros métodos. Esse processo em que as escalas de
distância maiores são calibradas através de métodos obtidos para escalas menores é conhecido como
“escada cósmica”.

77
Figura 2.18: Velocidade versus distância de galáxias, obtidas a partir de estrelas cefeidas
com o projeto Hubble Space Telescope Key Project (ref. [25]). Um ajuste desses dados
por uma reta fornece H0 = 75 ± 10 (estatı́sico) km s−1 Mpc−1 , em acordo, dentro das
incertezas, com o valor de H0 obtido a partir de métodos que se extendem a distâncias
maiores.

2.2.4 Estrutura em Grande Escala

Para finalizar esta seção sobre o Universo osbervado, vamos falar das escalas que
vão além dos aglomerados. Embora a maior parte da matéria que se aglomera em
estruturas esteja formada por matéria escura, as galáxias podem ser consideradas
os “tijolos”, ou melhor, os marcadores da estrutura em grande escala no universo.
Portanto, para estudar as estruturas em grande escalas é preciso mapear as posições
das galáxias, preferencialmente em 3 dimensões. Medir a posição angular das galáxias
é bastante trivial, o difı́cil é obter estimativas de distâncias para um grande número
delas, sobretudo as mais distantes. Nesse caso não é possı́vel detectar estrelas cefeidas
e a probabilidade de observar uma supernova em cada uma delas é muito pequena. O
que se pode fazer é medir o desvio para o vermelho de uma fração das galáxias. Se todas
as galáxias seguissem a expansão homogênea do Universo, seria muito simples obter
a distância a partir do rubro desvio seguindo a relação de Hubble: D ' H0−1 cz. No
entanto, justamente devido às aglomerações locais de matéria, cada galáxia tem o seu
movimento próprio, além da expansão. É como se todas as velocidades pudessem ser
decompostas em vexp +vpec , onde vexp é a componente devida à expansão do Universo e
vpec é uma velocidade peculiar, de cada objeto. Podemos fazer uma analogia com uma
caixa contendo um gás. Se movemos a caixa a uma velocidade v, as moléculas desse gás
terı́am uma velocidade que á a combinação da velocidade relativa própria delas com o
movimento global, médio, que representa o movimento da caixa. No caso cosmológico,
a velocidade vexp aumenta com a distância. Já as velocidades peculiares não variam
com a distância (mas sim com a densidade local de matéria). Esse efeito é claramente
visı́vel na figura (2.11): as galáxias possuem um movimento próprio em relação a uma
média (nesse caso, da ordem de 7000 Km/s). Essa média é dada pelo afastamento
do aglomerado em relação a nós, devido à expansão do Universo. As velocidades
peculiares em aglomerados podem chegar a ser muito altas, justamente porque elas são
as maiores estruturas gravitacionalmente ligadas no Universo (veja a seção 2.2.2). Já
para as estruturas em escalas maiores, as velocidades são menores. A medida individual
do desvio para o vermelho de uma galáxia fornece cz = vexp + vpec = H0 D + vpec .

78
Figura 2.19: Velocidade versus distância de galáxias, obtidas com o projeto Hubble Space
Telescope Key Project (ref. [25]). Quadrados: supernovas do tipo Ia; cı́rculos cheios:
relação de Tully-Fisher; triângulos: plano fundamental; diamantes: flutuações de brilho
superficial; quadrados vazios: supernovas do tipo II. É mostrada uma inclinação de
H0 = 72 km s−1 Mpc−1 entre duas linas deslocadas de ±10%. Abaixo: valor de H0
em função da distância.

Claramente o primeiro termo aumenta com a distância. O segundo termo deve ficar
próximo de zero, num certo volume apreciável e fazendo uma média num grande
número de galáxias.
O resumo da discussão acima é que as velocidades peculiares impedem uma conexão
direta entre o rubro desvio e a distância. Num diagrama distância-rubro desvio isso
não é um problema, pois o que importa é a relação média. As velocidades peculiares
apenas causam uma dispersão e ainda assim, esta só é apreciável a distâncias menores.
Já para fazer um mapa da distância individual das galáxas a partir de z, isso poderia
ser um problema. No entanto, como foi dito, o efeito de vpec não é muito grande e não
influencia nas estruturas nas maiores escalas. Desse modo, um mapa de (z, θ φ) para
cada galáxia fornece uma excelente representação da estrutura em grande escala em
três dimensões (z é a coordenada radial e θ e φ são as coordenadas angulares). Um
mapa desse tipo é mostrado na figura (2.22).
Antes de que fossem feitos os primeiros levantamentos da distribuição de galáxias,
esperava-se que não houvesse estruturas em escalas maiores que aglomerados de
galáxias. Acreditavasse que, a partir dessas escalas, o universo deveria ser homogêneo.
Foi uma grande surpresa quando os primeiros resultados do CfA, na década de 1980
[47], mostraram a existência de complexas estruturas: super-aglomerados, filamentos,
paredes e vazios de matéria (voids). Os super-aglomerados são formados por grupos,
aglomerados e galáxias isoladas e têm dezenas de Mpc de extensão. Por exemplo, o
super-aglomerado local, onde está o nosso grupo de galáxias mede cerca de 30 Mpc.
Outro super-aglomerado próximo é o de Coma-Virgem. Os superaglomerados ficam
no cruzamento entre filamentos, que por sua vez aparecem na interseção de estruturas
achatadas, como o “grande muro” que tem dimensões da ordem de 80 Mpc por 220
Mpc. Portanto, a estrutura em grande escala do universo tem uma aparência ”espon-
josa” e que é predominantemente filamentar. Em escalas maiores, acima de centenas

79
de Mpc a alguns Gpc, o Universo tende à homogeneidade (veja, por exemplo a ref.
[51]).
Uma grande importância da estrutura em grande escala é o fato dela ter sido pouco
afetada pela dinâmica complexa que deu origem a estruturas menores, como os aglom-
erados. Nas maiores escalas, as flutuações de densidade são relativamente pequenas
ρEGE /ρuniverso . 1. Por isso, diz-se que elas são lineares. De fato, pode-se mostrar que
nesse caso, e num universo dominado por matéria escura, as flutuações mantêm a sua
forma original, aumentando apenas de amplitude (veja a seção 2.5.1). Ou seja, a forma
das perturbações de densidade na estrutura em grande escala guarda a memória de
heterogeneidades que estavam presentes em fases muito mais remotas da história do
Universo.
A distribuição de matéria em grandes escalas proporciona mais uma evidência para a
existência de matéria escura, já que num universo composto apenas por bárions, não
teria havido tempo suficiente para a formar as estruturas observadas (veja a seção
2.5.1, em particular o resultado 2.42).
Uma compreensão da distribuição atual de matéria em grandes escalas é crucial para
entender a origem das estruturas no universo e testar cenários detalhados de sua
formação. Por sua vez, a determinação desses cenários permite impor limites sobre os
parâmetros cosmológicos e as teorias do universo primordial que predizem as primeiras
flutuações.

Mapas cósmicos: passado, presente e futuro

Como mencionamos acima, para investigar a distribuição de matéria no universo


efetuam-se levantamentos sistemáticos da posição de galáxias (e também de quasares).
Os dois tipos mais utilizados são os levantamentos das posições angulares e catálogos
espectroscópicos. No primeiro, como as distâncias não são conhecidas, temos uma dis-
tribuição projetada numa esfera. A vantagem é o grande número de objetos que podem
ser levantados: no APM survey [44], por exemplo, temos a distribuição de 2 milhões
de galáxias (veja a fig. 2.21). No segundo, são obtidos os espectros dos objetos, per-
mitindo obter os desvios para o vermelho de forma precisa, fornecendo portanto um
panorama da distribuição tridimensional da matéria. Um exemplo é o Las Campanas
survey [45, 46], com 23.700 galáxias. Um dos primeiros levantamentos desse tipo foi
o CfA redshift survey, com 9.000 galáxias [47]. Em 2003 foram tornados públicos os
dados do Two Degree Field (2dF [48]), que obteve os desvios para a o vermelho de
mais de 220.000 galáxias distribuı́das em várias fatias do céu (fig. 2.22).
Até o momento, o levantamento de galáxias e quasares com maior número de desvios
para o vermelho é o Sloan Digital Sky Survey (SDSS [49]). Em 2006 foi disponibilizado
o data release 5 do SDSS correspondendo a uma cobertura angular de aproximada-
mente 10% do céu. Esse catálogo inclui dados fotométricos com a posição angular de
215 milhões de galáxias, quasares e estrelas e espectros (logo, o desvio para o vermelho)
de 674,749 galáxias, 90.611 quasares e 154,925 estrelas, totalizando 14,4 TB de dados.
Já está em andamento o SDSS II e planeja-se realizar o SDSS III, que ampliarão ainda
mais a cobertura angular e o número de especros.
No que se refere à fotometria, ou seja, imagnes, o Dark Energy Survey (DES)24 rep-
resentará a próxima geração de catálogos de galáxias, sendo bem mais profundo que
24
Veja em http://www.darkenergysurvey.org, http://www.des-brazil.org/.

80
o SDSS e cobrindo um volume quatro vezes maior. Apenar do projeto não ter espec-
troscopia, poderão ser feitas boas estimativas do rubro desvio, devido à informação
em cinco bandas do espectro (filtros). Depois de 2015, entrará em operação o Large
Synoptic Survey Telescope (LSST) que será capaz de cobrir todo o céu de sua área de
observação em poucos dias e atingirá magnitudes ainda mais profundas do que os pro-
jetos anteriores. No plano de espectroscopia, há projetos para construir espectrógrafos
capazes de captar cerca de 5000 espectros por exposição, proporcionando medidas
precisas do desvio para o vermelho para milhões de galáxias.

Uma nota sobre a interpretação da expansão do universo

Alguns autores afirmam que, como há objetos com z > 1, isso implicaria em veloci-
dades superluminais, o que violaria a relatividade, de modo que não se pode inter-
pretar a expansão do universo como um afastamento real das galáxias, e sim como
a “expansão do espaço-tempo”. Essa afirmação é totalmente falsa, pois baseia-se na
equação não relativı́stica v = cz. O resultado exato da relatividade restrita para o
efeito Doppler é s
∆λ 1 + vc
z= = − 1.
λ 1 − vc
Portanto, para velocidades de recessão relativı́sticas, z pode atingir valores arbitraria-
mente altos. Assim, não há nenhum problema em se interpretar a expansão do universo
como um real afastamento das galáxias. Ao contrário, não é possı́vel separar fisica-
mente as velocidades como sendo uma ”velocidade de expansão” e uma “velocidade
real”. A separação entre um “fluxo de Hubble” e velocidades peculiares resulta apenas
das propriedades do nosso universo, que é aproximadamente homogêneo em grandes
escalas, com heterogeneidades que aumentam à medida que as escalas diminuem. As-
sim, é conveniente separar a descrição dinâmica em quantidades médias e perturbações,
como é feito na seção (2.5.1). Por incrivel que pareça, a interpretação da expansão do
universo ainda é assunto de debates. Para uma discussão e alguma bibliografia veja,
por exemplo, a referência [74].

2.3 O Universo Homogêneo I


Agora que introduzimos um pouco da fenomenologia do Universo, incuindo alguns de
seus componentes e suas escalas fı́sicas, vamos passar a uma descrição mais quanti-
tativa. Como regra geral na fı́sica, partimos de um modelo o mais simples possı́vel e
verificamos se ele pode dar uma descrição aproximada dos fenômenos. Se a reposta
for positiva, passa-se ao detalhes para tentar descrever o maior número possı́vel de
aspectos envolvidos. A hipótese mais simples neste caso é supor que o Universo é ho-
mogêneo e isotrópico, ou seja, é igual quando observado de todos os pontos e em todas
as direções. Depois de toda a discussão acima sobre as estruturas do Universo, essa
hipótese pode parecer o famoso caso da “vaca esférica”. No entanto, a idéia é procu-
rar descrever o comportamento global, médio, do Universo. Se esse modelo conseguir
explicar os fenômenos associados a essa situação, passaremos a estudar perturbações
sobre o modelo. De fato hoje há uma grande abundância de informações astronômicas
mostrando que o Universo se torna cada vez mais homogêneo à medida que aumenta-
mos a escala e que de fato ele é estatisticamente homogêneo, ou seja, diferentes partes

81
do Universo, embora recheadas de estruturas, têm propriedades estatı́sticas semel-
hantes. Além disso, sabemos também que o Universo era muito mais homogêneo no
passado, com perturbações de uma parte em dez mil ((ρ − ρ̄)/ρ̄ ∼ 10−5 ).
Se bem hoje em dia temos muitas motivações para escolher um Universo homogêneo e
isotrópico como primeira aproximação, essa escolha não estava tão bem fundamentada
quando foram desenvolvidos os primeiros modelos cosmológicos com o advento da
teoria da relatividade geral. Naquela época, duas motivações devem ter norteado essa
escolha, a simplicidade e o “princı́pio de Copérnico”, segundo o qual não deveria haver
nem pontos nem direções privilegiadas no Universo.
De certa forma a história da cosmologia se confunde com a história da gravitação,
e é imprescindı́vel conhecer a teoria da gravitação (no caso, a teoria da relatividade
geral) para compreender a cosmologia. No entanto, neste capı́tulo, procuraremos uti-
lizar o mı́nimo possı́vel de resultados da relatividade geral, por questões pedagógicas,
de modo que ele seja accessı́vel às pessoas ainda não familiarizadas com a cosmolo-
gia relativı́sta. Grande parte dos resultados e conceitos aqui discutidos não requerirá
todo o arcabouço formal da gravitação. Ainda assim, eles incluirão os ingredientes
necessários para entender os modelos cosmológicos atuais. Portanto, partiremos agora
da mecânica newtoniana para construir um modelo para a dinâmica do Cosmos.

2.3.1 Dinâmica: A equação de Friedmann


Nesta seção vamos introduzir as equações da cosmologia newtoniana partindo da
própria mecânica de Newton. Como veremos a seguir, a teoria newtoniana não se
aplica diretamente à cosmologia: é preciso estabelecer um procedimento para eliminar
as inconsistências que surgem ao considerarmos uma distribuição infinita de matéria.
Em última instância, a justificativa para esse tratamento vem da aplicação da rela-
tividade geral, que fornece as mesmas equações a serem deduzidas nesta seção.
Para determinar as forças gravitacionais, devemos calcular o potencial gravitacional
Φ, que é obtido pela solução da equação de Poisson

∇2 Φ = 4πGρ(~r, t).

No entanto, essa equação apenas não é suficiente par determinar Φ: precisamos


fornecer condições de fronteira. Num universo ilimitado, não há um critério para definir
essas condições e portanto não temos como calcular Φ a priori. Assim, as equações
da mecânica, junto com a equação de Poisson, não são suficientes para determinar a
solução do problema cosmológico.
Essa ambigüidade na teoria newtoniana aparece somente no estudo de um espaço
infinito preenchido de matéria. Em problemas nos quais a densidade cai suficiente-
mente rápido no infinito, podemos utilizar a condição Φ → 0 para r → ∞. Essa
condição, juntamente com a equação de Poisson, permite determinar o potencial Φ
completamente:
ρ (~r0 , t) 3 0
Z
Φ(~r, t) = −G d r.
|~r − ~r0 |
Se insistirmos em utilizar essa expressão quando ρ não decai para r → ∞, então
Φ diverge. A impossibilidade de se obter uma cosmologia puramente newtoniana é
atribuı́da por muitos autores à divergência de Φ. No entanto, as quantidades ob-
serváveis são as derivadas segundas ∂Φ/∂ri ∂rj , que determinam a aceleração relativa

82
de partı́culas vizinhas. Elas ficam indefinidas devido à divergência do potencial, ou
melhor, pela falta de condições de fronteira apropriadas.
Qual seria o valor do campo gravitacional ~g num meio infinito e homogêneo? Se
consideramos primeiro o campo dentro de uma esfera finita de raio R temos, pelo
teorema de Gauss, ~g = −(4π/3)Gρ~r (para r < R). Esse resultado não muda para
R → ∞ e logo serı́amos tentados a concluir que o campo está bem definido em qualquer
r finito. Suponha agora que estejamos no interior de um esferóide de excentricidade
e > 0. Nesse caso o campo gravitacional não é radial. A única diferença está na casca
entre o esferóide e a esfera nele circunscrita, no entanto o campo muda em todos
os pontos (exceto em r = 0). Extendendo esse esferóide indefinidamente, temos um
exemplo explı́cito em que o campo gravitacional depende das condições de contorno no
infinito. Outro problema é que, mesmo num espaço homogêneo o campo dependeria
fortemente da posição e da origem do sistema de coordenadas.
Vamos ver agora um modo de evitar esses problemas que nos permite construir uma
cosmologia newtoniana. Dessa forma, as condições de contorno no infinito já estarão
“embutidas” nas equações de movimento.
Como discutido na seção 2.2.3, as observações de galáxias distantes mostram que o
universo está se expandindo (há outras evidências da expansão do universo que irão
aparecendo nas seções seguintes e muitas que nem serão mencionadas neste capı́tulo).
Se a expansão fosse perfeitamente uniforme, as separações entre objetos co-móveis
com a expansão cósmica mudariam com o mesmo fator a(t), denominado fator de
escala do Universo. Na verdade sabemos que ela não é uniforme, mas podemos fatorar
a expansão média, ou seja, separar a dinâmica em uma parte global e homogênea e
perturbação em relação a esse comportamento médio. É nesse processo que desapare-
cerá a indeterminação de ~g . Para isso, é necessário utilizar coordenadas co-móveis ~x,
definidas pela relação25
~r
~x:= . (2.2)
a(t)
Também é conveniente utilizar uma nova variável temporal, o tempo conforme η,
definido pela relação26
dt
dη := . (2.3)
a(t)

Para uma expansão perfeitamente uniforme os vetores posição co-móveis ~x per-


manecem fixos para todas as partı́culas. No caso de uma expansão perturbada, cada
partı́cula segue uma trajetória ~x (η). A velocidade em coordenadas co-móveis, con-
hecida como velocidade peculiar é definida por

d~x 1 d~r da/dη d~r


~v := = − ~
r = − H~r, (2.4)
dη a dη a2 dt

onde H é o parâmetro de Hubble, definido por

1 da 1 da
H(t) := 2
= .
a dη a dt
25
As coordenadas cartesianas usuais de uma partı́cula ou elemento de volume serão denotadas por ~r.
26
A variável t, conhecida como tempo cosmológico, é o tempo próprio medido por um observador
co-móvel com a expansão média.

83
Note que ~v é a velocidade medida por um observador cuja coordenada co-móvel é fixa
(para esse observador, ~r = a ~x e portanto a sua velocidade é dada por (da/dt) (1/a) ~r =
H~r ).
Como sempre podemos multiplicar o fator de escala a por uma constante, é melhor
trabalhar com quantidades que são invariantes com relação a essa mudança, estas
serão chamadas de quantidades próprias. Assim H e vi = dxi /dη = (adri ) / (adt) são
quantidades próprias, enquanto dxi /dt não é. Essa é uma razão para utilizarmos η em
vez de t como variável independente.
Para deduzir as leis que governam a expansão média, consideraremos uma distribuição
esfericamente simétrica e uniforme com densidade ρ̄. Para que a homogeneidade seja
mantida, é preciso que todas as escalas se alterem por igual. Dessa forma a trajetória
de um elemento de volume de massa m será dada por r(t) = a(t)x com x fixo (difer-
entes valores de x denotam elementos de diferentes cascas esféricas). A equação de
conservação da energia para esse elemento de volume é
 2
1 dr GM m
m − = E,
2 dt r
onde M é a massa contida numa esfera de raio r. Logo27
2
da
dt
x 4π
3
ρ̄ (ax)3 E
−G = .
2 ax m
Assim, obtemos
8πG 2
(aH)2 = ρ̄a − K,
3
onde K = −2E/mx2 . Essa equação é conhecida como equação de Friedmann. Para ter-
mos uma expansão homogênea, a função a (η) deve ser a mesma para todos os elemen-
tos de volume, logo devemos ter K = const. A equação de Friedmann que acabamos
de deduzir é idêntica àquela obtida utilizando a relatividade geral (eq. [aqui, citar a
eq. de Friedmann como aparece no curso do Novello]).28 Na relatividade geral pode-se
mostrar que K está relacionado à curvatura do espaço (ou seja, das hipersuperfı́cies
com η constante)[colocar referências para a(s) seção(ões) de relatividade geral e/ou
cosmologia relativı́stica]. A equação de Friedmann geralmente é expressa na forma
 2
da/dt 8πG K
= ρ̄ − 2 . (2.5)
a 3 a
Para resolver essa equação ainda é preciso obter uma relação do tipo ρ̄ = ρ̄ (a (η)).
Para tal, primeiramente consideraremos o caso de matéria não relativı́stica, ou seja,
um fluido composto por partı́culas cuja energia cinética é muito menor do que a sua
massa de repouso.

Atenção: de agora em diante, para aliviar a notação, eliminaremos a barra para deno-
tar a densidade média, ficando implı́cito que ρ se refere à densidade média. Apenas na
seção (2.5.1) voltaremos a utilizar essa notação, dado que estudaremos as perturbações
sobre um fundo homogêneo.
27
Note que cada casca pode ter uma energia total diferente E(x). Ela é fixada pelas condições iniciais.
28
No entanto, na dedução acima ρ denota a densidade de massa, enquanto na relatividade a quantidade
que aparece é a densidade de energia. Quando a pressão não é relativı́stica, que é a situação relevante
para a formação de estruturas, essas quantidades são equivalentes.

84
Matéria não relativı́stica

Consideremos um elemento de volume V formado por um dado conjunto de partı́culas


e cuja densidade é ρ. A conservação da massa implica em ρV = m = const. No caso da
expansão uniforme, uma esfera de raio r(t) = xa(t) terá sempre as mesmas partı́culas,
assim ρ (4π/3) (ax)3 = const. ou seja29

ρ ∝ a−3 . (2.6)

Substituindo essa expressão na eq. (2.5) obtemos uma equação diferencial de 1a ordem
no tempo para o fator de escala a(t) [ou a(η)]
2  2
8πGρi a3i 1

1 da da
= = − K, (2.7)
a dη dt 3 a
onde ρi e ai são os valores de ρ e a num tempo ti dado. Essa equação pode ser
integrada para vários valores de K. Os diversos valores dessa constante determinam o
comportamento assintótico do fator de escala.

O Universo de Einstein-de Sitter Um caso importante consiste em escolher K =


0. Juntamente com a equação (2.6), essa escolha corresponde ao chamado modelo de
Einstein-de Sitter, proposto por ambos em 1932. Nesse caso, a solução da equação de
Friedmann (2.7) fica muito simples:
 2
η − η0
a(η) = , (2.8)
ηi

onde ηi2 = 3/ (2πGρi a3i ). De agora em diante escolheremos o instante η0 = 0, que


corresponde ao “Big-Bang”. Note que sempre é possı́vel redefinir ai , de modo que
a (η) é determinado a menos de uma constante multiplicativa. O importante é o com-
portamento temporal a ∝ η 2 . No universo
R de Einstein-de Sitter a conversão para o
tempo cosmológico t, fica fácil: t = a(η)dη o que leva a η ∝ t1/3 . Dessa forma, temos
a ∝ t2/3 .

A conservação da energia

Uma conseqüência fundamental da relatividade restrita é a equivalência entre massa


e energia. A energia total de um objeto é dada, aproximadamente, pela soma de suas
energias cinética e de repouso (mc2 ). No caso de um fluido, a densidade de energia total
é dada pela soma da densidade de energia de repouso %0 com a densidade de energia
interna ε (que pode corresponder à energia cinética do movimento microscópico das
partı́culas e também à energia potencial de ligação de seus componentes). Se o fluido
é composto por partı́culas de massa m, teremos

% = %0 + ε = nmc2 + ε, (2.9)

onde n é a densidade de partı́culas (número por unidade de volume).


29
Aqui estamos supondo implicitamente que a pressão não é relativı́stica, de modo que a densidade
de energia total é dada apenas pela densidade de massa de repouso. É possı́vel estender esse tratamento
considerando fluidos relativı́sticos, ou mesmo misturas de fluidos, como veremos nas próximas seções.
Nesse caso a (2.6) deixa de ser válida.

85
Nos cursos de termodinâmica vemos que, se não há produção de entropia, a con-
servação de energia leva a
dE = −pdV,
onde E é a energia (interna) contida num volume V (E = εV ) e p é a pressão. Um
volume que acompanha a expansão do Universo terá as suas dimensões proporcionais
ao fator de escala a (como no exemplo acima para matéria não-relativı́stica), ou seja,
ao longo da expansão, seu volume será proporcional a a3 . Nesse caso, a equação acima
leva a
a3 dε + 3εa2 da = −3pa2 da.
Se as partı́culas não são criadas nem destruı́das, o seu número total (nV ) não mudará
com a expansão, desse modo, temos a3 dn = −3a2 nda. Combinando essa expressão
com a equação acima e utilizando a (2.9), obtemos
da
d% + 3 (% + p) = 0. (2.10)
a
Essa é a equação da conservação da energia (veja a seção 3.49), quando levamos em
conta a contribuição da energia interna (através da pressão) para a densidade de
energia total. Podemos expressar a equação (2.10) em função da densidade de massa
(total, e não apenas de repouso) ρ = %c2 . Assim, teremos
 p  da
dρ + 3 ρ + 2 = 0. (2.11)
c a
Esse resultado é idêntico ao encontrado quando aplicamos a relatividade geral a um
Universo homogêneo e isotrópico, mesmo se há a criação de partı́culas.
Para processos adiabáticos e sem criação de partı́culas, a pressão é apenas uma função
da densidade30 , p = p (ρ). Nesse caso, podemos utilizar essa equação de estado na
equação (2.11) para obter ρ (a) . Substituido esse resultado na equação de Friedmann
(2.5), podemos obter a dinâmica do Universo.

Como estamos tratando o caso de um universo homogêneo, as variações na equação


(2.11) são em relação ao tempo, assim, é conveniente escrever
dρ ȧ  p
+3 ρ+ 2 =0 (2.12)
dt a c

Soluções da equação de conservação da energia Vamos agora discutir alguns


casos simples em que a equação (2.11) possui uma solução analı́tica. O caso de um
fluido não relativı́stico (p/c2  ρ) foi discutido na seção 2.3.1. Podemos verificar, a
partir da equação (2.11) e desprezando p, que o resultado ρ ∝ a3 é reobtido (eq. 2.6).
Um caso muito importante do ponto de vista cosmológico é dado por um gás de fótons,
ou seja, radiação eletromagnética. Nesse caso, sabemos dos cursos de eletromagnetismo
que p = ρc2 /3. Desse modo, a solução da (2.11) fica

ρ ∝ a−4 .

Mais adiante, veremos que esse resultado possui uma interpretação fı́sica simples. O
resultado acima ainda é válido no caso de um gás relativı́stico de partı́culas com massa,
30
Esse tipo de equação de estado é conhecido como barotrópico.

86
para o qual p ' ρc2 /3. Assim, quando a temperatura é muito alta e a energia cinética
das partı́culas é muito maior do que a energia de repouso, o gás se comporta como
radiação. Isso ocorreu, por exemplo, em uma época primordial da história do Universo.
Outro exemplo de interesse cosmológico é a equação de estado do vácuo p = −ρ, para
a qual obtemos ρ = const. De modo geral, uma equação de estado do tipo p = wρc2
possui solução analı́tica simples (ρ ∝ a−3(1+w) ).
Outras equações de estado menos simples, como p ∝ ρα ainda admitem uma
solução analı́tica para a equação (2.11). Nos casos em que ela não pode ser resolvida
analı́ticamente, basta resolver a equação diferencial, ou converter a solução em uma
integral.

Aceleração cósmica Combinando as equações (2.5) e (2.11) é fácil obter a acel-


eração do universo
d2 a 4πG  p
=− ρ+3 2 . (2.13)
dt2 3 c
Essa expressão será útil para compreender o conceito de energia escura e também para
obter as equações de perturbação para estudar a formação de estruturas (seção 2.5.1)

2.4 O Universo Homogêneo II


Se o universo está se expandindo, isto significa que ele foi mais denso, e portanto
quente, no passado. Pela teoria de Einstein da gravitação, e com um conteúdo de
matéria clássico, teria havido uma singularidade primordial, com a densidade e tem-
peratura tornando-se infinitas à medida que nos aproximamos desse “instante inicial”,
também chamado de Big-Bang. Com singularidade ou não, o fato é que o universo
passou por fases extremamente quentes e densas no passado. Nesse perı́odo ocorreu
uma série processos fı́sicos que deixaram rastros observáveis. O modelo do Big-Bang
quente foi introduzido por Gamow no final da década de 1940. Em seu artigo com
Alpher (e Bethe), Gamow previu a nucleossı́ntese primordial e a radiação cósmica de
fundo.
Vamos discutir agora alguns processos fı́sicos que ocorreram durante a história do
universo. Nos limitaremos àqueles cujos mecanismos são melhor conhecidos e cujos
rastros foram observados 31 .

2.4.1 Uma Breve História Térmica do Universo


Uma conseqüência importante das altas densidades do passado é que as taxas das
reações eram muito maiores no universo primitivo. Por exemplo, quando a temperatura
do universo era maior do que alguns32 MeV (∼ 1010 K), a taxa do processo e− +νe ←→
e− + νe era maior do que a taxa de expansão. Dessa forma, antes que o universo
pudesse duplicar de tamanho, um neutrino era espalhado muitas vezes pelos elétrons.
Essas colisões faziam com que os neutrinos estivessem em equilı́brio com o resto do
plasma cósmico. Esse é apenas um exemplo de um fenômeno que ocorre com todas as
espécies que compõem o universo: se uma partı́cula é espalhada com uma taxa maior
31
ALguns dos pontos discutidos aqui serão ampliados no Capı́tulo 8.
32
Veja o glossário (seção 2.10), para a definição das escalas de energia e temperatura.

87
que a expansão cósmica, então essa partı́cula fica em equilı́brio. Quando a densidade
diminui, a taxa de espalhamento é reduzida. Se ela for menor que a taxa de expansão,
a partı́cula perde contato com o resto do plasma cósmico. Muitas partı́culas passaram
por esse processo, conhecido por desacoplamento, no universo primitivo.

Hadronização

Quando a temperatura era por volta de 1GeV (∼ 1013 K), a matéria bariônica estava
sob a forma de um plasma de quarks e glúons. Quando ela baixou para uns 200 MeV
(∼ 2 × 1012 K), por volta de 10−4 s após o Big-Bang, houve a hadronização e foram
criados os bárions (e anti-bárions) e os mésons.

Aniquilação próton-anti-próton

Logo após a hadronização, bárions e anti-bárions começaram a se aniquilar. Como


havia uma assimetria de uma parte em dez bilhões de bárions sobre anti-bárions
((nb − nb̄ ) /nb ' 10−10 ), estes teriam se aniquilado totalmente, deixando uma fração de
10−10 dos bárions. Como a aniquilação produz fótons, isso elevou a razão fóton/próton
para 1010 .

Alquimia Cósmica: Nucleosı́ntese primordial

Quando a temperatura caiu para uns 10 MeV (∼ 1011 K) a taxa da reação p + e− ←→


n + νe tornou-se menor do que a taxa de expansão. A razão entre prótons e nêutrons
ficou constante depois que essa reação cessou. A maioria dos nêutrons acabou formando
átomos de hélio, alguns decaı́ram em prótons e uma pequena fração foi para outros
elementos leves. Dessa forma, a razão nêutron/próton naquela época determina a
razão hélio/hidrogênio hoje, assim como a abundância dos outros elementos leves. A
nucleossı́ntese primordial ocorreu de 0.01 a 100 segundos após o Big-Bang (de T ∼ 10
MeV a 0.1 MeV).

Desacoplamento dos neutrinos e aniquilação elétron-pósitron

Como foi mencionado anteriormente, quando a temperatura ficou abaixo de 1 MeV


(∼ 1010 K), os neutrinos perderam o contato com o resto do plasma.
Depois que os neutrinos se desacoplaram, os fótons continuaram acoplados aos elétrons
e pósitrons, que tinham todos a mesma abundância a temperaturas da ordem do
MeV. Quando a temperatura ficou abaixo da massa do elétron (0.511 MeV), elétrons
e pósitrons se aniquilaram em fótons. Do mesmo modo que ocorreu com os prótons,
sobrou apenas um elétron para cada dez bilhões de fótons.

Recombinação

A interação dos fótons com a matéria se dá principalmente através do espalhamento


Compton pelos elétrons. A taxa de espalhamento γ + e− ←→ γ + e− , ficou menor do
que a taxa de expansão quando a temperatura ficou próximo de 0.26 eV (uns 3.000
K), o que ocorreu em torno de 300.000 anos após o Big-Bang. Depois disso os fótons se

88
Evento T (Kelvin) t (segundos)
Tempo de Plack — inı́cio da era clássica (?) 1032 10−43
Transição de fase GUT — báriogênese (?) 1029 10−37
Hadronização — aniquilação p − p̄ 1012 10−4
Nucleossı́ntese — formação de He, D, Li 1011 − 109 10−2 − 102
Igualdade matéria–radiação 104 1012
Recombinação — desacoplamento dos γ 103 1013
Primeiras estrelas e galáxias — H2 é formado 102 1015
Aglomerados de galáxias, QSOs 10 1017
Agora 3 4 × 1017
Tabela 2.1: Algumas etapas importantes na evolução cósmica. As transições com ponto
de interrogação se referem a fases para as quais não há evidências observacionais ou cujos
mecanismos fı́sicos ainda são desconhecidos. A última coluna denota o tempo transcorrido
desde a extrapolação para um “instante inicial” até a referida etapa.

desacoplaram da matéria, mantendo o seu espectro térmico. Após o desacoplamento


a maioria desses fótons se propagou livremente sem interagir com outras partı́culas.

Por volta da mesma época do desacoplamento matéria-radiação, foram formados os


primeiros átomos, num processo chamado de recombinação. Dessa forma o universo
deixou de ser um plasma e passou a ser transparente à radiação.

Formação de estruturas

Como veremos mais a diante, o crescimento substancial das pequenas flutuações pri-
mordiais ocorreu quando o universo passou a ser dominado pela matéria. A matéria
escura começou a se aglomerar por causa da atração gravitacional. Regiões ligeira-
mente mais densas do que a média (tipicamente um milésimo mais densas, na época
do desacoplamento) acabaram gerando grandes concentrações de matéria criando uma
estrutura rica e variada.

O conteúdo do Universo em qualquer tempo é determinado pela sua temperatura e


densidade. Nos primórdios ele era dominado por espécies exóticas de partı́culas, mas
depois de alguns minutos após o Big-Bang, há uma mistura de bárions é fótons a
temperaturas de bilhões de graus. As temperaturas são tão elevadas que a matéria
bariónica é ionizada, até que, depois de uns 300.000 anos ocorre a “recombinação”33
depois da qual a matéria no universo é praticamente neutra.

Há ainda outras transições de fase que o universo pode ter sofrido, mas que ainda são
mais incertas: transição eletrofraca, transição da grande unificação, quebra da super
simetria, inflação, etc.

33
Esse nome não é muito apropriado no sentido que o Universo fica neutro pela primeira vez na sua
história. Pode-se falar alternativamente na “época do desacoplamento”, embora as duas coisas não sejam
exatamente a mesma...

89
2.5 O Universo Perturbado
As observações da radiação cósmica de fundo e da distribuição de galáxias mostram
que o Universo é homogêneo e isotrópico em grandes escalas (da ordem de Gpc). Entre-
tanto, ele se mostra heterogêneo em escalas menores, exibindo um padrão complexo
de grandes estruturas filamentares, regiões vazias e superaglomerados (veja a seção
2.2.4), com dimensões tı́picas da ordem de 10 - 100 Mpc. Nessas escalas, as flutuações
na densidade média de matéria são relativamente pequenas ((ρ − ρ̄)/ρ̄ ' 1). Diz-se
que elas estão no regime linear, pois podem ser tratadas como pequenas perturbações
sobre um fundo homogêneo. Em escalas ainda menores, correspondendo às galáxias
e aglomerados, as flutuações são não lineares ((ρ − ρ̄)/ρ̄  1). Entender a complexa
distribuição de matéria no Universo nas diversas escalas é um dos grandes desafios da
cosmologia moderna.
O estudo do problema de formação de estruturas em cosmologia, utilizando uma teoria
relativista da gravitação, foi inaugurado em 1946, pelo artigo pioneiro de Lifshitz [75].
Neste trabalho foi mostrado como se comportam as perturbações na densidade em
um modelo cosmológico isotrópico e homogêneo, no regime linear (veja seção 2.5.1).
Desde aquela época, a área de formação de estruturas no universo tem sido uma das
mais ativas da cosmologia e da astrofı́sica, tanto em seus aspectos teóricos quanto
observacionais.
Os modelos atuais levam em conta o processo de geração das flutuações e a evolução dos
modos perturbados ao longo das diferentes fases da evolução do Universo. Processos
não lineares também têm sido abundantemente estudados, o que permite compreender
a formacão de estruturas até as dimensões dos aglomerados de galáxias. No que se ref-
ere à formação de galáxias, aglomerados e super-aglomerados, não é possı́vel limitar-se
a uma aproximação linear de modo que outra abordagem é necessária. O desenvolvi-
mento recente de simulações numéricas de N-corpos levou a uma verdadeira revolução
na área, permitindo modelar detalhadamente a evolução não linear das estruturas.
Tais simulações chegam a envolver sistemas com 1010 partı́culas que se movem sob a
ação de sua própria gravidade num Universo em expansão (veja a seção 2.5.2).
Como se não bastassem os avanços teóricos, computacionais e observacionais men-
cionados acima, o estudo das estruturas em grandes escalas tem tido um interesse
renovado como meio de estudar a energia escura, uma componente de matéria-energia
que responderia por cerca de 80% da densidade cosmológica. A compreensão da ener-
gia escura envolve necessariamente modificações na fı́sica fundamental, seja na teoria
da gravitação ou no domı́nio das partı́culas elementares e campos. Projetos como o
DES (veja a seção 2.2.4) visam estudar a estrutura em grande escala como meio de
aprender sobre o comportamento da energia escura.
Desse modo, a estrutura em grandes escalas no Universo é hoje um dos instrumentos
mais importantes para a cosmologia. A combinação entre teoria e observação permite
a discriminação de modelos fı́sicos (matéria e energia escuras, massa dos neutrinos,
flutuações primordiais, etc.) e a determinação dos parâmetros cosmológicos.

Na próxima seção, retomaremos formulação da cosmologia newtoniana em coorde-


nadas co-móveis desenvolvida na seção (2.3.1), obtendo as equações para a evolução
das perturbações no inverso. Em última instância, a justificativa para esse tratamento
vem do limite newtoniano da relatividade geral, que fornece as mesmas equações a
serem deduzidas nesta seção.

90
A cosmologia newtoniana é de fundamental importância para estudar a formação de
estruturas. No regime não-linear, apenas um tratamento newtoniano é factı́vel, por-
tanto quase todas as simulações computacionais (veja a seção 2.5.2) e aproximações
analı́ticas são feitas com base na cosmologia newtoniana. Além disso, o limite newto-
niano é uma ótima aproximação para a dinâmica das estruturas em grandes escalas
dentro do raio de Hubble, DH := c/H0 = h−1 3000 M pc. Para pequenas flutuações
é possı́vel fazer um tratamento relativı́stico, mas a análise newtoniana é muito mais
simples e ajudará a compreender fisicamente o inı́cio da formação das estruturas.

2.5.1 O Crescimento Linear das Estruturas (Newtoniano)


Nesta seção introduziremos as equações de fluido da cosmologia newtoniana e estu-
daremos o seu comportamento para pequenas flutuações de um universo homogêneo.
Mostraremos como funciona o mecanismo de crescimento das estruturas no regime
linear, introduziremos o comprimento de Jeans e veremos como surgem as oscilações
acústicas num fluido com colisões. Também discutiremos como aparecem os modos
adiabáticos crescentes e decrescentes e mostraremos a importância da matéria escura
para a formação de estruturas.
É importante destacar que as equações deste capı́tulo só serão válidas para flutuações
com dimensões menores que o raio de Hubble. Além disso, só poderemos estudar as
perturbações na componente não relativı́stica, na era dominada pela matéria. Com
essas restrições, os resultados newtonianos são idênticos aos da teoria de perturbação
relativı́stica34 .

Em um meio não uniforme, a distribuição de massa pode ser escrita como:35

ρ(~x, η) = ρ̄(η) + δρ(~x, η),


R
onde ρ̄ é a densidade média: ρ̄ = (1/V ) V ρ(~x, η)d3 x, se V é um volume “representa-
tivo” do universo.
Vamos partir da equação de Newton

d2~r ~r − ~r0 3 0
Z
= ~g = −G ρ d r,
dt2 |~r − ~r0 |3

e transformá-la para coordenadas co-móveis e tempo conforme. Utilizando as (2.2-2.4),


obtemos36
d2~r 1 d2~x
 
1 d ȧ ȧ d~x
2
= 2
+ ~x + 2 .
dt a dη a dη a a dη
Assim, a equação de movimento fica
34
Ainda é possı́vel estudar alguns aspectos das perturbações na componente relativı́stica com equações
muito semelhantes às newtonianas. Basta fazer uma pequena modificação nessas equações para incluir os
efeitos inerciais e gravitacionais da pressão (veja, por exemplo, as refs. [74, 76]).
35
Aqui é necessário fazer a hipótese de que o universo seja homogêneo – em média – a partir de uma
certa escala (senão a integral não converge e ρ̄ não é bem definido). Esse tratamento não seria válido num
universo com estrutura fractal ilimitada, mas é perfeitamente aplicável se a distribuição de matéria é
aproximadamente fractal até uma dada escala. A hipótese da existência de uma escala de homogeneidade
é corroborada do ponto de vista observacional e constitui uma das bases do modelo padrão da cosmologia.
36
Nesta seção utilizaremos a notação ˙ ≡ ∂/∂η.

91
d2~x ~x − ~x0 3 0
  Z
d ȧ ȧ d~x 2
+ ~x + = −Ga (ρ̄(η) + δρ(~x, η)) d x.
dη 2 dη a a dη |~x − ~x0 |3

Agora podemos eliminar os termos que aparecem num universo homogêneo da seguinte
forma. O primeiro termo do lado direito é o campo gerado por uma distribuição
uniforme de matéria (multiplicado por a). Se supomos que o universo é (em média)
esfericamente simétrico a grandes distâncias, esse termo dá −(4π/3)Ga2 ρ̄ ~x. É aqui que
as condições de contorno no infinito são usadas explicitamente. Agora podemos utilizar
a equação (2.13), escrita em termos de η (o notando que estamos nos restringindo ao
caso não relativı́stico), para eliminar os termos proporcionais a ~x. Desse modo, a
equação de movimento fica37

d2~x ȧ d~x (~x − ~x0 ) 3 0


Z
−Ga 2 0 ~
+ = δρ(~
x , η) 3 d x = −∇x φ̃ , (2.14)
dη 2 a dη 0
|~x − ~x |

onde
δρ(~x0 , η) 3 0
Z
2
φ̃(~x, η) := −Ga d x. (2.15)
|~x − ~x0 |
Note que φ̃ é uma quantidade própria: a2 d3 x0 /|~x − ~x0 | ∼ d3 r/|~r − ~r0 |.
R
Como V δρ d3 x → 0 em grandes escalas, φ̃ é finito e bem definido (exceto sobre mas-
sas pontuais, que ignoramos ao tratar o campo de densidade como contı́nuo). Não há
mais ambigüidade na equação de movimento para ~x(η). O campo φ̃ não varia muito
com a origem do sistema de coordenadas, já que a contribuição da distribuição de
matéria distante é pequena; o que resolve mais um paradoxo da cosmologia newto-
niana. Concluı́mos que φ̃, chamado de potencial gravitacional peculiar, é o potencial
apropriado para a cosmologia newtoniana, desde que trabalhemos em coordenadas
co-móveis. Esse tratamento é válido mesmo em regiões altamente heterogêneas, já que
em nenhum momento foi preciso supor que δρ  ρ̄. O procedimento efetuado nesta
seção serve apenas para eliminar o problema das condições de contorno no infinito.
Em resumo, as equações de movimento ficam:

d2~x ȧ d~x ~ x φ̃ ,
+ = −∇ ∇2x φ̃ = 4πGa2 δρ(xi , η) (2.16)
dη 2 a dη
As mesmas equações saem do limite de campos fracos (|φ|  c2 ) e baixas velocidades
(v 2  c2 ) da relatividade geral para um espaço-tempo de Robertson-Walker per-
turbado. Localmente, a descrição da relatividade geral num universo de Friedmann-
Lemaı̂tre perturbado é equivalente à cosmologia newtoniana, com a condição de fron-
teira de que a distribuição de massa é homogênea e isotrópica no infinito. O trata-
mento da cosmologia newtoniana requer que o espaço seja euclidiano, o que é uma
ótima aproximação; exceto próximo a objetos compactos (como buracos negros), e
eventualmente, em escalas da ordem da distância de Hubble c/H0 .

Observação: Há vários modos de se eliminar a indeterminação em ∂φ2 /∂ri ∂rj , que
foi discutida no inı́cio desta seção. Um método consiste no exame preliminar de um
37
Se ρ̄ inclui matéria relativı́stica, tanto o campo gravitacional como o comportamento de a(η) mudam.
Os termos homogêneos também se cancelam nesse caso, mas a sua justificativa requer a relatividade geral.

92
corpo finito, seguido da transição para um corpo infinito. Foi esse o caminho aqui
adotado, aplicado a uma distribuição de matéria esférica. O mesmo procedimento
pode, por exemplo, ser extendido a um elipsóide homogêneo. Ao investigar o caso de
um elipsóide finito, vemos que é possı́vel acrescentar infinitas camadas sem alterar
a sua evolução temporal, nem o campo gravitacional em seu interior. Assim pode-
mos produzir um universo infinito com as propriedades das condições de fronteira
do elipsóide. O resultado seria portanto diferente do obtido nesta seção, que está em
acordo com os dados observacionais e com o limite newtoniano de um universo de
Friedmann-Lamaı̂tre perturbado. Dessa forma, vemos que não é possı́vel introduzir
uma cosmologia puramente newtoniana de forma unı́voca.
Uma outra forma de se obter a cosmologia newtoniana é estudar o desvio geodésico
num universo homogêneo, através da formulação da gravitação newtoniana na lin-
guagem do espaço curvo [64, 65]. No entanto, essa abordagem é muito mais compli-
cada, pois utiliza o aparato matemático da geometria diferencial. Além disso ela não
leva imediatamente às equações newtonianas para um universo heterogêneo.

Equações Cosmológicas de Fluidos

Um fluido é um conjunto de partı́culas tratado como um contı́nuo. Em cosmologia


lidamos com dois tipos de fluido: se as colisões entre as partı́culas são suficientemente
rápidas para estabelecer um equilı́brio térmico local (ou seja uma distribuição de
velocidades de Maxwell-Boltzmann), o fluido é um gás. Se não há colisões, temos um
gás de matéria escura. As equações de fluido discutidas nesta seção aplicam-se a gases
com colisões ou à matéria escura38 . Vamos lidar com um gás não relativı́stico e ignorar
forças elétricas e magnéticas.
As equações de fluido vêm das leis de conservação da massa e do momentum e das
equações de estado. A conservação da massa é representada pela equação de con-
tinuidade. Nas coordenadas (~r, t) ela é dada por
∂ρ ~ d~r
+ ∇ · (ρ~v) = 0 , ~v = . (2.17)
∂t dt
Como na seção anterior, reescrevemos a densidade e a velocidade fatorando o compor-
tamento médio:
ρ = ρ̄(1 + δ) , (2.18)
~v = d~
r
dt
= H~r + ~v (2.19)
onde δ = δρ/ρ̄ e ~v = d~x/dη é a velocidade peculiar. Transformando a equação de
continuidade (2.17) para coordenadas co-móveis e tempo conforme (eqs. 2.2 e 2.3)39 ,
obtemos
∂δ ~
+ ∇x · [(1 + δ)~v ] = 0 . (2.20)
∂η
A conservação do momentum é representada pela equação de Euler
d~v ~ − 1 ∇p
~ .
= −∇Φ (2.21)
dt ρ
38
A descrição de fluido é válida antes do cruzamento das trajetórias das partı́culas da matéria escura.
Quando as trajetórias se interceptam, a descrição de contı́nuo deixa de valer. Isso ocorre tipicamente na
formação de objetos gravitacionalmente ligados, onde as trajetórias seguem órbitas caóticas. No regime
linear, a matéria escura pode ser descrita como um fluido com p = 0.
x ~ ~ 1 ~
39
Note que ∂t ∂
= ∂η ∂ ∂~
∂t ∂η + ∂t · ∇x e ∇r = a2 ∇x .

93
Escrevendo essa equação em coordenadas co-móveis e notando que d/dt = (1/a)d/dη,
obtemos  
d~v d ~x d ȧ ȧ 1 d~v
= (H~r + ~v ) = + ~v 2 + .
dt dt a dη a a a dη
Como vimos na seção 2.3.1, o campo gravitacional é

~ r Φ = − 4πG ρ̄ a~x − 1 ∇
~g = −∇ ~ x Φ̃. (2.22)
3 a
Ao substituirmos estes resultados na (2.21) notamos que os termos proporcionais a ~x
se cancelam (pela 2.13). Assim, obtemos finalmente:
d~v ȧ ~ − 1 ∇p
~ ,
+ ~v = −∇Φ (2.23)
dη a ρ
com as derivadas sendo calculadas no sistema co-móvel, e Φ representando o potencial
peculiar (a partir de agora não colocaremos mais o til, nem o sı́mbolo x na derivada).
Para fechar as equações de fluido ainda é necessária uma equação de evolução para
a pressão, ou para outra variável termodinâmica, como por exemplo a entropia. Para
um gás com colisões temos uma equação de estado p = p(ρ, S) onde S é a entropia
especı́fica (i.e. entropia por unidade de massa). Num um gás monoatômico ideal não-
relativı́stico, em processos reversı́veis temos,
   
3p 1
T dS = d + pd . (2.24)
2ρ ρ

Os principais efeitos da pressão do gás podem ser extraı́dos da teoria de perturbação


linear. Nela linearizamos as equações de fluido em torno da solução uniforme. Essa
técnica é útil para analisar a instabilidade gravitacional e outras instabilidades. As
equações de fluido linearizadas proporcionam uma descrição razoável das flutuações
na matéria (escura e luminosa) de pequena amplitude e grande escala, mesmo se as
estruturas não são lineares em escalas menores. Essa é uma suposição usual na teoria
das estruturas em grandes escalas. Ela é sustentada razoavelmente pelas simulações
numéricas.
Consideraremos que δ e ~v são pequenos (O(ε) ) e desprezaremos termos de segunda
ordem (O(ε2 ) ). Linearizando as equações de continuidade e de Euler temos

~ · ~v ≈ 0 , ∂~v ȧ ~ − 1 ∇p
~
δ̇ + ∇ + ~v ≈ −∇Φ (2.25)
∂η a ρ̄
A pressão pode ser obtida da equação de estado p = p(ρ, S). Para um gás monoatômico
ideal não-relativı́stico, utilizando a (2.24), obtemos
1~ ~ + 2 T ∇S
~ , ∂p 5p
∇p = c2s ∇δ c2s := = . (2.26)
ρ 3 ∂ρ 3ρ
Como estamos lidando com pequenas perturbações de um universo homogêneo,
podemos escrever a temperatura e a entropia como: T (~x, η) = T̄ (η) + δT (~x, η) e
S(~x, η) = S̄(η) + δS(~x, η). O lado direito da (2.26) fica, em 1a ordem: (2/3)T̄ ∇2 (δS).
De modo geral, é suficiente manter apenas termos de primeira ordem na equação
(2.26). Assim, podemos utilizar c2s = (5/3)(p̄/ρ̄) nessa equação e manter apenas a
desidade homogênea ρ̄ no lado esquerdo da equação.

94
Há cinco variáveis do fluido (ρ, S e três componentes de ~v ), e portanto há cinco modos
linearmente independentes40 . A perturbação linear geral é uma combinação desses mo-
dos. Do ponto de vista cosmológico, apenas o modo irrotacional e sem perturbação na
entropia tem interesse prático (veja, por exemplo, a ref. [74]). Portanto, discutiremos
em mais detalhes apenas esse modo, que no regime linear corresponde às flutuações
de densidade.

Flutuações Isentrópicas e o Critério de Jeans

Vamos estudar primeiramente o comportamento de flutuações isentrópicas, para as


quais não há gradientes de entropia entre elementos vizinhos. Esse tipo de perturbação
seria o produto natural das flutuações quânticas durante a inflação seguida pelo reaque-
cimento [56] (veja a Seção 9.7). As interações rápidas entre partı́culas em equilı́brio
térmico eliminariam os gradientes de entropia. Se ∇S ~ = 0, as equações linearizadas
do fluido e do campo gravitacional (2.25), (2.26) e (2.16) são

~ · ~v = 0 , ∂~v ȧ ~ − c2 ∇δ
~ ,
δ̇ + ∇ + ~v = −∇φ s ∇2 φ = 4πGρ̄a2 δ . (2.27)
∂η a

Aplicando o operador ∇~ na equação de Euler e combinando com as duas restantes,


obtemos uma equação de onda acústica forçada e amortecida para δ:

δ̈ + δ̇ = 4πGρ̄a2 δ + c2s ∇2 δ . (2.28)
a
Exceto pelo amortecimento de Hubble (segundo termo) e pelo termo gravitacional,
essa equação é idêntica à que obterı́amos para ondas de som num meio estático.
Para eliminar o laplaciano aplicamos a transformada de Fourier na equação de onda.
A equação para o modo ~k fica:

δ̈ + δ̇ = 4πGρ̄a2 − k 2 c2s δ ≡ kJ2 − k 2 c2s δ ,
 
(2.29)
a
onde definimos o numero de onda de Jeans co-móvel
1/2
4πGρ̄a2

kJ := . (2.30)
c2s

Note que a dependência de δ em ~k se dá apenas em termos de k = ~k , o que é uma


conseqüência de isotropia do espaço.
Desprezando o amortecimento de Hubble (colocando a = 1), a dependência temporal
da solução da equação (2.29) seria δ ∝ exp(±iωη), com

ω 2 = −ωJ2 + k 2 c2s , ωJ = kJ cs = (4πGρ̄)1/2 . (2.31)

onde ωJ é a freqüência de Jeans. Modos com k < kJ são instáveis (ω 2 < 0), como foi
observado por Jeans em 1902. Fisicamente, as forças de pressão não podem evitar o
colapso gravitacional quando o tempo para o som atravessar o corpo λ/cs é maior que
o tempo de queda livre (Gρ)−1/2 para uma perturbação de tamanho λ = 2πa/k.
40
De fato, temos cinco equações que governam a dinâmica desse sistema, as equações (2.25) e (2.26) e
mais uma relação termodinâmica.

95
O comprimento de Jeans (co-móvel) é definido por λJ := 2π/kJ . Para perturbações
muito maiores que esse comprimento (k  kJ ) a evolução se comporta como num
fluido sem colisões, isto é, a pressão é desprezı́vel.
Incluindo o amortecimento, a instabilidade de Jeans passa a ter um comportamento
em lei de potência no tempo, em vez de exponencial, para k  kJ . Em geral há uma
solução crescente e outra decrescente para δ(k, η); elas serão denotadas por δ± (k, η).

Modos crescentes e decrescentes Vamos agora considerar o efeito da expansão


do universo sobre a evolução das perturbações. Começaremos estudando o caso de
um fluido não relativı́stico sem colisões, como a matéria escura fria. Nessa situação, a
expressão (2.28) fica

δ̈ + δ̇ = 4πGρ̄a2 δ. (2.32)
a
Essa equação também é válida num fluido com p 6= 0 para modos com k  kJ .
Para resolver essa equação, precisamos conhecer ȧ/a, ou seja a evolução do “fundo”
(parte homogênea). Para uma boa parte da história da formação das estruturas, o
universo de Einstein-de Sitter (EdS) é uma boa aproximação. A partir da equação de
Friedmann (2.5), vemos que para pequenos valores do fator de escala a, o termo de
curvatura K/a2 deve ser desprezı́vel frente à densidade de energia da matéria e da
radiação (proporcionais, respectivamente, a a−3 e a−4 ). Além disso, os dados observa-
cionais mostram que esse termo não deve ser importante para a dinâmica do universo,
mesmo em tempos atuais. Dessa forma, quando as primeiras estruturas foram for-
madas o termo de curvatura era totalmente desprezı́vel. Assim que o universo passa
a ser dominado pela matéria, de modo que a (2.6) é válida, o fator de escala a é dado
pela solução de Einstein-de Sitter.
Desse modo, mesmo num universo em que Ω 6= 1 e K 6= 0, a solução de EdS (eq. 2.8),
fornece uma boa descrição da dinâmica do universo na fase em ele que é dominado pela
matéria, portanto desde antes do desacoplamento matéria-radiação (ver seção 2.4.1)
até próximo da era de expansão acelerada. Assim, o Universo de EdS é apropriado
para investigar as primeiras fases da formação de estruturas após o desacoplamento.
Num fundo EdS (Ω = 1, matéria não relativı́stica), a equação de Friedmann (2.5) fica
4πGρ̄a2 = (3/2)(ȧ2 /a2 ), cuja solução é dada por a(η) = (η/η0 )2 (eq. 2.8). Dessa forma
o termo 4πGρ̄a2 fica igual a 6/η 2 e a equação (2.32) pode ser escrita como
2 6
δ̈ + δ̇ = 2 δ .
η η
As soluções dessa equação são

δ+ ∝ η 2 ∝ a e δ− ∝ η −3 , (2.33)

que são chamados de modos crescente e decrescente, respectivamente


Para Ω 6= 1, a equação (2.32) também possui modos crescentes e decrescentes, que
podem ser calculados a partir do fator de escala a (η).

Critério de Jeans no universo em expansão Vamos ver agora o papel da pressão


na evolução das estruturas. Estudaremos um caso particular que permite obter uma
solução analı́tica simples e que ilustra o comportamento geral para c2s 6= 0.

96
Suporemos que depois de recombinação a temperatura dos bárions é da ordem da tem-
peratura dos fótons (Tγ ≈ Tgas ). Esta é uma aproximação razoável, já que a ionização
residual acopla termicamente os dois fluidos por um longo perı́odo, mesmo havendo
uma transferência de momentum desprezı́vel. Num gás de fótons ργ ∝ Tγ4 além disso
temos que ργ ∝ a−4 logo Tγ ∝ a−1 . Para um gás ideal p/ρ ∝ Tgas . Assim c2s = c20s a−1
onde c0s é constante. Num universo de Einstein-de Sitter a eq. (2.29) fica:

2  δ
δ̈ + δ̇ = 6 − k 2 c20s η02 2 .
η η

As soluções dessa equação são potências de η:


p
−1 ± 25 − 4(kc0s η0 )2
δ± (k, η) ∝ η n , n = . (2.34)
2
Note que, neste caso, c0s η0 = cs η. Em situações mais genéricas, as soluções√dependem
de η e cs η mesmo que este último não seja constante41 . Para kcs0 η0 < 6 ' 2.45,
há soluções crescentes e decrescentes. Para kcs0 η0 > 5/2 temos oscilações amortecidas
(pois n2 < 0 e Re(n) < 0). Note que o número de onda crı́tico kcr = (5/2)(1/cs0 η0 ) é
muito próximo do número de onda de Jeans kJ (2.30):
√ 1 ∼
kJ = 6 = 0.98 kcr .
cs0 η0

No limite k  kJ a solução (2.34) fica igual ao resultado (2.33). As soluções


oscilatórias para k  kJ são ondas sonoras. Nesse limite, a (2.34) fica δ± ∝
η −1/2 exp(±ikcs0 η0 ln(η)), o que leva, para uma onda plana, a δ± (x, η) ∝
η −1/2 exp(ik x ± ikcs0 η0 ln(η)). Para determinar a velocidade da onda, devemos cal-
cular dx/dη tal que a fase seja constante. Assim a velocidade instantânea da onda é
dada por d/dη(kcs0 η0 ln(η)/k) = cs , que coincide com a velocidade do som no meio.
Esse comportamento se repete em situações mais genéricas, obtendo-se oscilações
acústicas para k  kJ . Essas oscilações suprimem o crescimento para pequenos com-
primentos de onda. No limite k  kJ (grandes comprimentos de onda) o comporta-
mento fica igual ao da poeira, e δ± não depende de k (como podemos ver a partir das
eqs. 2.29 e 2.30).
Num universo estático a amplitude acústica para uma onda plana adiabática fica con-
stante. Já num universo em expansão, ela é geralmente amortecida (como no exemplo
acima). Uma exceção importante consiste nas oscilações no fluido de bárions e fótons
na era dominada pela radiação, na qual a amplitude dessas oscilações permanece con-
stante. Para mostrar isso é preciso generalizar as equações de fluido para um gás
relativı́stico, o que está fora do escopo deste livro.

Amplitude das flutuações Como a (2.29) é uma equação diferencial linear, as


duas soluções
 δ+ (k, η) e δ− (k, η) são obtidas a menos de constantes multiplicativas
~
A± k . Essas constantes são determinadas pelas condições iniciais para cada k. A
determinação de δ (k, ηi ) em um dado tempo inicial ηi é um problema fundamental
41
Por exemplo, quando a velocidade do som é constante, num universo de Einstein-de Sitter, a solução
da (2.29) é [66]:δ+ (k, η) ∝ j2 (kcs η) , δ− (k, η) ∝ y2 (kcs η) , onde j2 e y2 são as funções esféricas de Bessel
(no entanto essa solução não é realista).

97
em cosmologia. Uma teoria completa da formação de estruturas deve especificar essa
função a partir de considerações fı́sicas. Por exemplo, o cenário inflacionário oferece
uma previsão para variação da amplitude com o número de onda k (ou seja, ela fornece
A(k) a menos de um valor multiplicativo global, veja a Seção 9.7). Modelos em que o
universo passa por um ricochete também podem fazer esse tipo de previsão (veja as
Seções 3.10 e 10.3.2).

Flutuações de densidade no espaço real A solução geral para δ (~x,η) é:


Z   Z  
~ ~
δ (~x, η) = A+ k δ+ (k, η) e d k + A− ~k δ− (k, η) eik·~x d3 k
~ i k·~
x 3
(2.35)

Se k  kJ , δ− decai rapidamente, de forma que só os modos crescentes sobrevivem.


Para poeira, a evolução de δ não depende de k. Mantendo apenas os modos crescentes,
vemos que δ (~x,η) mantém a sua forma e é apenas multiplicado por δ+ (η) (que no caso
de EdS é o próprio fator de escala a(η)).

Evolução do potencial gravitacional É interessante escrever a equação de onda


linear em termos de Φ, em vez de δ. Para isso, usamos a transformada de Fourier na
equação de Poisson ∇2 Φ = 4πGa2 ρ̄δ, obtendo
4πG
Φ(~k, η) = − 2 a2 ρ̄δ(~k, η) ∝ a−1 δ . (2.36)
k
Note que, para modos crescentes num universo de Einstein-de Sitter, no regime linear,
temos Φ = const. Essa propriedade possui uma implicação muito interessante para a
energia escura. A variação do potencial gravitacional pode ser detectada na radiação
cósmica de fundo a partir do efeito Sachs-Wolfe integrado (veja a seção 2.5.1, eq. 2.43).
Portanto, se tal efeito é medido e levando em conta que Ωtot ' 1, isso é uma forte
evidência para a presença da energia escura, já que num universo composto apenas de
matéria escura ele estaria ausente, posto que φ = const.
Substituindo a expressão (2.36) na equação (2.29) e utilizando equação de Friedmann
(2.5), obtemos:
ä 1 ȧ2 3
 

Φ̈ + 3 Φ̇ + − − K Φ + k 2 c2s Φ = 0. (2.37)
a a 2 a2 2
Utilizando novamente e equação de Friedmann, em conjunto com a (2.13) podemos
mostrar que ä/a − (1/2)ȧ2 /a2 = −(1/2)K. Assim a (2.37) fica

Φ̈ + 3 Φ̇ + k 2 c2s − 2K Φ = 0 .

(2.38)
a
Quando escrita em termos do potencial gravitacional, em vez do contraste de densi-
dade, a equação de onda perde seu termo de fonte gravitacional.
As soluções da eq. (2.38) dependem do comportamento temporal da velocidade do
som, assim como da cosmologia de fundo. Para termos uma idéia, vamos considerar a
evolução do potencial num universo de Einstein-de Sitter composto de um gás ideal.
Usando a aproximação c2s = c20s a−1 a eq. (2.38) fica:
6 Φ
Φ̈ + Φ̇ + (kc0s η0 )2 2 = 0
η η

98
As soluções dessa equação são42 :
p
−5 ± 25 − 4(kc0s η0 )2
Φ± (k, η) ∝ η m , m = . (2.39)
2
Nessa solução, modos crescentes de grandes comprimentos de onda (kcs η  1) têm
potencial correspondente Φ+ = const., enquanto os modos decrescentes têm Φ− ∝
−5
R −3
η ∝ a dη. Esse comportamento se repete para qualquer equação de estado usual
num universo de Einstein-de Sitter. As perturbações na densidade e no potencial
diferem por um fator ρ̄a2 ∝ a−1 (2.36). Se K < 0 ou k 2 c2s > 0, então Φ+ decai com o
tempo, embora δ+ continue crescendo.

A importância da matéria escura A equação (2.29) pode ser generalizada para


várias componentes da matéria. Nesse caso, o termo gravitacional contém as con-
tribuições de todas as componentes e a equação fica
ȧ X
δ̈A + δ̇A + k 2 c2s δA = 4πGa2 ρ̄B δB ,
a B

onde43 δB := (ρB − ρ̄B ) /ρ̄B .


Um exemplo importante é o sistema bárions + matéria escura logo após o desacopla-
mento. Para k  kJ a evolução será governada pelo sistema de equações

δ̈M E + δ̇M E = 4πGa2 (ρ̄b δb + ρ̄M E δM E ) ' 4πGa2 ρ̄M E δM E , (2.40)
a

δ̈b + δ̇b = 4πGa2 (ρ̄b δb + ρ̄M E δM E ) ' 4πGa2 ρ̄M E δM E . (2.41)
a
Antes do desacoplamento as flutuações na componente bariônica não evoluem, pois
ela está em forte interação com a radiação. Já as perturbações na matéria escura
podem evoluir livremente na era dominada pela matéria (η > ηeq ). Por isso, logo após
o desacoplamento, temos ρ̄M E δM E  ρ̄b δb .
Como para a ∼ adesacoplamento  1, temos a ' aEdS ∝ η 2 , o modo crescente será dado
por δ+ (η) ' a (η) e a solução da equação (2.40) será

δM E = Ca,

onde c é uma constante. Substituindo essa relação na (2.41) e usando que, em EdS
4πGa2 ρ̄ = 6/η 2 , temos

δ̈b + δ̇b = 6C.
a
A solução do modo crescente dessa equação é
 
b
δb = C (a (η) − b) = δM E 1 − , (2.42)
a (η)

onde b é uma constante. Essa solução mostra que δb → δM E para a (η)  b, mesmo se
δb ' 0 para algum a (ηi ) = b, que pode ocorrer, digamos, para ηi = ηdesacoplamento .
42
Esse resultadoP
poderia ser P
obtido substituindo a (2.34) na (2.36).
43
De modo que B ρ̄B δB = B (ρB − ρ̄B ) = ρtot − ρ̄tot = ρ̄tot δtot .

99
Esse importante resultado mostra que as perturbações na matéria bariônica são in-
duzidas pelas flutuações da matéria escura após o desacoplamento. Isso mostra que a
matéria escura é a principal responsável pela formação das primeiras estruturas em
grande escala. Sem a matéria escura, as flutuações seriam muito menores e não teria
havido tempo de produzir as estruturas em grande escala que são observadas.

Flutuações na Radiação Cósmica de Fundo

Nas seções precedentes, estudamos o comportamento de pequenas perturbações de um


universo homogêneo. Há duas formas de observar essas flutuações: nas estruturas em
grandes escalas, onde as concentrações de matéria ainda são lineares e na radiação
cósmica de fundo. Nesse último caso, é preciso transformar as flutuações na densidade
nas anisotropias de temperatura que são observadas.
A distribuição dos fótons da radiação cósmica de fundo (RCF) é dada por uma dis-
tribuição de corpo negro com altı́ssimo grau de precisão44
   
E p
f (~x, p~, η) = fPlanck = fPlanck ,
kT kT0 (1 + ∆)

onde T0 = 2.725K é a temperatura média da RCF [52] e ∆ (~n, η) = δT /T0 é a flutuação


de temperatura para fótons vindos da direção ~n. A densidade no espaço de fase é dada
por um corpo negro, mas a temperatura depende da direção de chegada do fóton (ou
seja, da direção no céu), como resultado das variações intrı́nsecas da temperatura de
emissão e de processos gravitacionais e de espalhamento sofridos no caminho até o
detector.
O campo ∆ é definido em todos os pontos ~x, mas só podemos observá-lo aqui (~x0 ) e
agora (η0 ). A única coisa com que podemos trabalhar é a variação da temperatura em
função da direção ~n. Desse modo, toda a riqueza que observamos vem das mudanças
de temperatura em função de ~n.
A radiação cósmica de fundo parece vir de uma fina camada chamada fotosfera, como
ocorre com a radiação vinda da superfı́cie do Sol. A fotosfera pode ser aproximada
por uma camada infinitamente fina, supondo que a recombinação é instantânea. Nessa
aproximação a fração de elétrons livres, e portanto a opacidade, caem abruptamente
em ηrec , o tempo conforme na época da recombinação (z ≈ 1100):

∞ χ > χrec = η0 − ηrec ,
ηC =
0 0, χ < χrec .

Com essa aproximação, a flutuação de temperatura é dada por


  Z χrec
1 ∂Φ
∆ (~n, η0 ) = δγ + Φ + vr +2 dχ , (2.43)
4 rec 0 ∂η

onde vr := ~ve · ~n é a componente radial da velocidade. Esse resultado foi obtido


primeiramente por Sachs e Wolfe [58].
A radiação cósmica de fundo é causada pelos desvios em relação ao equilı́brio
hidrostático. Pode-se mostrar que, se o gás de fótons estivesse em equilı́brio
44
De fato, a radiação cósmica de fundo oferece o melhor espectro de corpo negro já observado.

100
hidrostático, terı́amos δγ /4 + Φ = 0 (e obviamente ve = 0) de modo que não have-
ria anisotropias primárias na RCF. As flutuações seriam dadas apenas pela variação
ocorrida na trajetória da luz, que é o chamado efeito Sachs-Wolfe integrado e é dado
pelo último termo na expressão (2.43).
Sachs e Wolfe [58] mostraram que, para perturbações adiabáticas na era dominada
pela matéria, em escalas maiores que o horizonte acústico, as contribuições intrı́nseca
e gravitacional dominam. A soma desses fatores (os dois primeiros termos da expressão
2.43) é Φ/3. Dessa forma, em escalas maiores do que 1◦ (que equivale aproximadamente
o tamanho do horizonte acústico) as anisotropias na radiação cósmica de fundo são
uma medida direta do potencial gravitacional na fotosfera, na recombinação.
O fator Φ/3 pode ser compreendido com a combinação do desvio para o vermelho
causado pelo campo gravitacional e uma dilatação temporal. Para sair do poço de
potencial o fóton perde energia, de modo que

∆1 = Φ.

Além disso, como o potencial produz uma dilatação temporal, quando vemos o fóton
ele viajou um caminho maior e veio portanto de uma época mais quente. A variação
temporal é dada por δt/t = Φ. Utilizando que a ∝ t2/3 e que T ∝ a−1 obtemos
2
∆2 = − Φ.
3
A combinação desses dois efeitos dá
Φ δk
∆SW = ∝ 2,
3 k
que é o chamado efeito Sachs-Wolfe. Na última relação, utilizamos a equação (2.36).
Desse modo, as flutuações na temperatura se relacionam diretamente com as per-
turbações na densidade.
Em escalas angulares menores que 1o predomina o efeito Doppler. Nessas regiões
menores do que o horizonte acústico, ocorrem as oscilações acústicas discutidas na
seção 2.5.1. Essas oscilações dão origem aos picos no espectro da radiação cósmica
de fundo que foram detectados no ano 2000 por dois experimentos em balões es-
tratosféricos [36, 37] e medidos com grande precisão pela sonda WMAP em 2003.

O espectro da radiação cósmica de fundo

O espectro de potência angular fornece a amplitude quadrática média da radiação


cósmica de fundo por componente de esférico harmônico. Expande-se a anisotropia da
temperatura em esféricos harmônicos
X
∆ (~n) = alm Ylm (~n) .
l,m

Os dados observacionais proporcionam valores bem definidos de alm . No entanto, só é


possı́vel predizer teoricamente a distribuição de probabilidade de alm . Para flutuações
estatisticamente isotrópicas (que não possuem nenhuma direção privilegiada a priori),
os alm são variáveis estocásticas, cuja covariância é dada por

halm a∗l0 m0 i = Cl δll0 δmm0 , (2.44)

101
ou seja, eles não são correlacionados. A variância de cada harmônico é dada pelo es-
pectro de potência angular Cl . A simetria rotacional faz com que ele seja independente
de m.

O espectro de potência da RCF pode ser calculado a partir da estatı́stica das flutuações
primordiais e da evolução temporal dessas flutuações. Pode-se mostrar que [57]:
Z
Cl = 4π d3 kPΦ (k) Dl2 (k) , (2.45)

onde PΦ (k) é o espectro das flutuações primordiais no potencial gravitacional45 . A


função de transferência Dl está relacionada à evolução das perturbações até o de-
sacoplamento.

No limite de grandes escalas angulares a função de transferência é dada por Dl =


jl [k (η0 − ηrec )] /3 [57]. Nesse caso a (2.45) pode ser calculada analiticamente para
PΦ ∝ k n−4 . Quando n = 1 o resultado é l (l + 1) Cl = const. Os resultados obtidos
pelas sondas COBE (que varreu escalas angulares equivalentes a 2 ≤ l ≤ 34) e WMAP
(2 ≤ l ≤ 500 no primeiro ano de dados) são consistentes com n = 1, o que é predito pelo
modelo inflacionário para flutuações quânticas primordiais. Vemos que as variações na
temperatura da radiação cósmica de fundo permitem sondar o espectro primordial das
flutuações.

Para pequenas escalas angulares, o espectro l (l + 1) Cl , apresenta uma série de pi-


cos. Esses picos são devidos às oscilações acústicas, que modificam o potencial Φ e a
velocidade vr na recombinação.

O primeiro pico no espectro da RCF está associado ao comprimento de Jeans. A


posição angular desse primeiro pico depende do tamanho aparente de λJ . A curvatura
do universo afeta diretamente os tamanhos angulares, de modo que a determinação
de sua posição coloca limites muito fortes sobre K e portanto sobre Ωtot . Segundo
o modelo inflacionário, que prevê curvatura nula, esse pico estaria em l ≈ 200. O
experimento de Balão MAXIMA [37], explorou escalas angulares equivalentes a 36 ≤
l ≤ 785 e, juntamente com o BOOMERGANG [36], detectou o primeiro pico na
posição esperada para um universo chato. Como a instabilidade de Jeans só ocorre
na matéria bariônica, a determinação dos picos no espectro da RCF também permite
calcular a Ωb (na verdade Ωb H02 ). Esse parâmetro está associado à diferença de altura
entres os picos pares e ı́mpares. A sonda WMAP mediu a posição do primeiro pico
com grande precisão e os resultados de um ano de dados fornecem l1 = 220.1 ± 0.8
[55].

As medidas em grandes escalas angulares fornecem informações sobre o espectro


das flutuações primordiais na densidade, que incluem tanto a CDM como a matéria
bariônica. Já em pequenas escalas angulares, podemos ter informação sobre Ωb e ΩTot .
Na verdade, o espectro da radiação cósmica de fundo permite estabelecer limites sobre
todos os parâmetros cosmológicos. Por exemplo, os dados do WMAP limitaram vários
desses parâmetros com com grande precisão (veja, por exemplo, a tabela 3 da ref.
[53]).

45
O espectro Pφ (k) está associado ao espectro das flutuações primordiais na densidade, pela relação
Pφ (k) ∝ P (k) /k 2 (eq. 2.36).

102
2.5.2 O Universo Muito Perturbado: Simulações Computa-
cionais
A análise linear das perturbações ajuda a compreender a radiação cósmica de fundo, as
primeiras fases da formação de estruturas e a estrutura em grande escala do universo.
Nas maiores escalas observáveis, as flutuações na densidade são pequenas e a teoria
linear ainda pode ser aplicada. No entanto, em escalas menores, talvez já nos super-
aglomerados e certamente nos grupos e aglomerados de galáxias, a aglomeração de
matéria não é linear (δρ/ρ > 1). Nesses casos, as variações na densidade são da
ordem de 105 (ρgaláxias /ρuniverso ) ou 102 − 103 (ρaglomerados /ρuniverso ) [39]. Portanto, para
compreender as estrutura no universo, é preciso fazer simulações computacionais, ou
recorrer a aproximações para a evolução não-linear.
Nas simulações numéricas utilizam-se condições de contorno periódicas para repre-
sentar um universo infinito. Como o volume simulado é fixo nas coordenadas ~x, na
verdade temos uma fronteira que evolui acompanhando a expansão média. A equação
de Poisson (2.16) é resolvida numericamente, utilizando a transformada de Fourier,
ou algum método hierárquico. Em geral, para simular a matéria escura utilizam-se al-
goritmos de N -corpos. Cada partı́cula segue uma trajetória dada pela equação (2.16).
A matéria bariônica (gás) é simulada utilizando algoritmos de fluidos para resolver
as eqs. (2.20) e (2.23), como por exemplo SPH (Smoothed Particle Hydrodynamics
[59]). A referência [60] é um excelente artigo de revisão sobre simulações numéricas
em cosmologia.
As simulações com matéria escura e gás são feitas para determinar a temperatura
final do gás (e comparar com os resultados das observações de raios-X ou do efeito
Sunyaev-Zel’dovich), ou para acompanhar a formação de galáxias. Nas escalas maiores
a dinâmica é dominada pela matéria escura, e portanto o gás não teria muita influência.
Por isso muitas simulações da formação de estruturas utilizam apenas matéria com
p = 0 (N -corpos).
Um exemplo atual de uma simulação de N -corpos é dado pela millenium simullation
[63], que envolveu mais de 1010 partı́culas, distribuı́das em um cubo com 500h−1 M pc
(i.e., cerca de 109 anos luz) de lado. A resolução é de 5h−1 kpc, de modo que a sim-
ulação varre um intervalo dinâmico de 5 ordens de grandeza. Simulações que incluem
a hidrodinâmica são limitadas a um intervalo dinâmico menor (∼ 103 ).
As simulações computacionais têm sido um instrumento fundamental para o estudo
da formação e evolução de estruturas. Elas parecem convergir em suas predições até a
escala dos aglomerados de galáxias, mas ainda estão longe de reproduzirem a formação
de galáxias individuais, devido à complexa fı́sica envolvida e às limitações de resolução.

2.6 Sı́tios de Internet Sugeridos


Institutos de Cosmologia:

• Instituto de Cosmologia Relatividade e Astrofı́sica (ICRA-CBPF):


www.icra.cbpf.br
• Institute for Computational Cosmology (Reino Unido):
http://icc.dur.ac.uk/

103
• The Kavli Institute for Cosmological Physics (EUA):
http://cfcp.uchicago.edu/
• Dark Cosmology Center (Dinamarca): www.dark-cosmology.dk
• Laboratoire Astroparticule & Cosmologie: http://www.apc.univ-paris7.fr/
• Beecroft Institute for Particle Astrophysics and Cosmology
http://www.development.ox.ac.uk/mpsnewsbee.htm

Páginas introdutórias sobre cosmologia

• Páginas de cosmologia da Divisão de Astrofı́sica do INPE:


http://www.das.inpe.br/cosmo/saber mais.htm
• Tutorial de cosmologia do Ned Wright: http://www.astro.ucla.edu/~wright/cosmolo
[http://www.astro.ucla.edu/~wright/cosmo 01.htm]
• Seleção de temas cosmológicos do sı́tio “Pergunte a um astrônomo”:
http://curious.astro.cornell.edu/cosmology.php.
• Level 5, A Knowledgebase for Extragalactic Astronomy and Cosmology: banco
de dados com artigos de revisão e links para outras páginas
http://nedwww.ipac.caltech.edu/level5/

Revisão das escalas de distância, do Sistema Solar até as maiores estruturas do universo
(da ref. [35]):
http://www.astro.princeton.edu/~mjuric/universe/
Atualização do livro de John Peacock, com algumas discussões interessantes:
http://www.roe.ac.uk/~jap/book/additions.html

Páginas de cosmologia para o público não especialista

• Sloan Digital Sky Survey Skyserver: http://skyserver.fnal.gov/en/


• Introdução à cosmologia do projeto MAP (Microwave Anisotropy Probe):
http://map.gsfc.nasa.gov/m uni.html
• Lonely Planet Guide to the Cosmos: http://snap.lbl.gov/EPO/lonely-planet/
• Página de center for science education de Berkeley:
http://cse.ssl.berkeley.edu/

Levantamentos de grande área e busca de supernovas (do tipo Ia)

• High Redshift Supernova Search / Supernova Cosmology Project:


http://panisse.lbl.gov/
• ESSENCE, “Equation of State: SupErNovae trace Cosmic Expansion” aka
“the w project” http://www.ctio.noao.edu/~wsne/
• CFHLS: Canada France Hawaii Telescop Legacy Survey:
http://www.cfht.hawaii.edu/Science/CFHLS/
– SuperNova Legacy Survey: http://www.cfht.hawaii.edu/SNLS/
• Pan-STARRS – the Panoramic Survey Telescope & Rapid Response System:
http://pan-starrs.ifa.hawaii.edu/public/index.html

104
– Galaxies and cosmology:
http://pan-starrs.ifa.hawaii.edu/public/science/cosmology.html
– Supernoave, Gamma Ray Bursts, Active Galaxy Nuclei:
http://pan-starrs.ifa.hawaii.edu/public/science/active.html

Simulações Numéricas:

• Virgo Consortium: http://www.virgo.dur.ac.uk/


• Hubble Volume: http://www.physics.lsa.umich.edu/hubble-volume
• Millenium Project: http://www.mpa-garching.mpg.de/galform/millennium/

Levantamentos de galáxias (espectros e fotometria):

• Redshift Surveys and Cosmology (um resumo sobre catálogos de desvio para o
vermelho de gláxias):
http://www.atnf.csiro.au/pasa/17 3/colless/paper/node2.html
• APM: http://www-astro.physics.ox.ac.uk/~wjs/apm survey.html
• CfA redshift survey: http://cfa-www.harvard.edu/~huchra/zcat/
• Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html
• Southern Sky Redshift Survey: http://arxiv.org/abs/astro-ph/9804064
• Sloan Digital Sky Survey: http://www.sdss.org
• 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.aao.gov.au/2df/
• 6dF: http://www.aao.gov.au/local/www/6df/
• Dark Energy Survey: http://www.darkenergysurvey.org,
http://www.des-brazil.org/
• Links para vários levantamentos e outras informações sobre astronomia e as-
trofı́sica: http://www.sdss.org/links.html

Levantamentos in infra-vermelho:

• UKIDSS (UKIRT Infrared Deep Sky Survey): http://www.ukidss.org/


• Visible and Infrared Survey Telescope for Astronomy (VISTA):
http://www.roe.ac.uk/atc/projects/vista/

Radiação cósmica de fundo

• Lambda - Legacy Archive for Microwave Background Data (excelente fonte de


recursos para a RCF, incluindo links e disponibilização de dados e aplicativos):
http://lambda.gsfc.nasa.gov/
• Wayne Hu: http://background.uchicago.edu/~whu/ (discussão da fı́sica da
CMB, com animações e links)
• Max Tegmark: http://www.hep.upenn.edu/~max/ (principalmente radiação
cósmica de fundo e formação de estruturas, com ênfase na parte de dados)
• MAXIMA: http://efpa.berkeley.edu/group/cmb/index.html

105
• BOOMERANG: http://oberon.roma1.infn.it/boomerang/
• MAP: http://map.gsfc.nasa.gov
• Planck: http://planck.esa.int (lançamento previsto em 2007), [ver também
http://astro.estec.esa.nl/(SA-general/Projects/)Planck]
• CAMB (Code for Anisotropies in the Microwave Background):
http://camb.info/
• CMBEASY: an Object Oriented Code for the Cosmic Microwave Background :
www.cmbeasy.org
• CMBFAST: http://physics.nyu.edu/matiasz/CMBFAST/cmbfast.html
• COSMICS: Cosmological Initial Conditions and Microwave Anisotropy Codes,
http://arcturus.mit.edu/cosmics/

Efeito Sunyaev-Zel’dovich: http://astro.uchicago.edu/sza/primer.html

• Projetos de Supernovas:

High Redshift Supernova Search / Supernova Cosmology Project:


http://panisse.lbl.gov/

• Listas com mais links de astronomia, astrofı́sica e cosmologia:

http://webusers.astro.umn.edu/~hlee/astro.html
http://www.iafe.uba.ar/relatividad/gangui/cosmocurso/
http://cfcp.uchicago.edu/education/resources/index.html

• Astronomia e Astrofı́sica: http://astro.if.ufrgs.br/

Íntegra do livro de Kepler de Souza Oliveira Filho e Maria de Fátima Oliveira Saraiva
da UFRGS. É um texto bem geral de astronomia e astrofı́sica, não penas cosmolo-
gia. Leitura recomendada: capı́tulos introdutórios e aqueles depois do “A Escala do
Universo”.

Pacotes/aplicativos/códigos

• DarkSUSY Home Page [fortran package for supersymmetric dark matter cal-
culations.]: http://www.physto.se/~edsjo/darksusy/, P. Gondolo, J. Edsjö,
P. Ullio, L. Bergstöm, M. Schelke and E.A. Baltz, JCAP 0407 (2004) 008;
astro-ph/0406204
• RECFAST: www.astro.ubc.ca/people/scott/recfast.html (Seager, Sas-
selov, Scott, 2000)

106
2.7 Livros sugeridos
Os anais da Escola Brasileira de Cosmologia e Gravitação, proporcionam uma exce-
lente fonte bibliográfica em muitos ramos da cosmologia e gravitação. A maior parte
dos cusos está disponı́vel integralmente on-line no sı́tio: www.icra.cbpf.br. Segue
abaixo uma lista com outros livros sugeridos no contexto deste capı́tulo:
Kolb, E. W, Turner, M. S., The Early Universe (Addison - Wesley, Redwood City,
CA, 1990) [dados um pouco desatualizados, mas abordagem moderna sobre modelo
padrão da cosmologia]
Weinberg S., Gravitation and Cosmology, J.Wiley, New York (1972)
Padmanabhan T., Structure Formation in theUniverse, Cambridge University Press
(1993)
Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe (Rela-
tivistic Astrophysics, volume 2), The University of Chicago Press (1983)
Peebles, P. J. E., The large scale structure of the Universe, Cambridge University
Press (1980)
Peebles, P. J. E. Principles of Physical Cosmology. Princeton, NJ: Princeton Univer-
sity Press (1993) [Contém extensos comentários sobre o desenvolvimento histórico da
cosmologia, escritos por quem foi parte dessa história].
Hawking, S. W. and Ellis, G. F. R. The Large Scale Structure of Space-Time. Cam-
bridge University Press (1975)
Peacock, J. A. Cosmological Physics. Cambridge University Press (1999)
Dodelson, S., Modern Cosmology, Academic Press (Elsevier Science) (2003) [per-
turbações, focando/discussão detalhada de CMB, análise estatı́stica]
Rindler, W., Introduction to Special Relativity, Oxford University Press (2004)
[primeira edição de 1960]

2.8 Artigos Sugeridos


Mencionamos abaixo alguns artigos relevantes para os temas discutidos neste capı́tulo.
Grande parte deles pode ser acessada a partir da excelente base de dados arXiv
(www.arXiv.org). Basta colocar o código (por exemplo astro-ph/0209486) no canto
superior direito da página principal (Search or Article-id ) Essa base de dados é uma
ótima fonte para procurar bibliografia sobre temas de fı́sica, astronomia, matemática
e ciências afins. Cabe no entanto uma ressalva: não necessariamente os artigos alı́
armazenados passaram por um processo de revisão independente, como ocorre nas
revistas cientı́ficas. Portanto é preciso estar especialmente atento à qualidade do que
é postado (embora um espı́rito crı́tico seja fundamental, independentemente de um
artigo ser aceito um não para publicação em uma revista especializada). Outra base
de dados excelente é o Astrophysics Data System (ADS, busca na base de dados em:
http://adsabs.harvard.edu/abstract service.html). Há ainda uma base da da-
dos voltada para a fı́sica de altas energias que é bastante completa em cosmologia e
astrofı́sica. Trata-se do HEP-SPIRES (busca de artigos em
http://www.slac.stanford.edu/spires/hep/search/). Procure utilizar essas
bases de dados para localizar os artigos abaixo que não possuem um número de arXiv.

107
Artigo original do Hubble:

• Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3
(1929), reproduzido em
http://antwrp.gsfc.nasa.gov/diamond jubilee/1996/hub 1929.html

Um ótimo artigo sobre a história da descoberta (observacional) da expansão do uni-


verso e da medida da constante de Hubble:

• G. A. Tammann, B. Reindl, Cosmic Expansion and H0 : A Retro- and Pro-


spective Note.
disponı́vel em: http://moriond.in2p3.fr/J02/Talks2002/G.Tammann/tammann.ps

Artigos gerais sobre cosmologia (artigos de revisão, notas de escolas):

• Escola Brasileira de Cosmologia e Gravitação. Vários cursos accessı́veis em


www.icra.cbpf.br
• Mark Trodden, Sean M. Carroll, TASI Lectures: Introduction to Cosmology,
astro-ph/0401547
• Wendy L. Freedman, Michael S. Turner, Measuring and Understanding the Uni-
verse, Rev. Mod. Phys. 75, 1433-1447 (2003), astro-ph/0308418
• S. M. Carroll, TASI Lectures: Cosmology for String Theorists, hep-th/0011110
• A. Sandage, Observational Tests of World Models, Annu. Rev. Astron. Astro-
phys. 26, 561-630 (1988). Disponı́vel em
http://nedwww.ipac.caltech.edu/level5/Sept01/Sandage/Sand contents.html
• Thomas F. Jordan, Cosmology calculations almost without general relativity,
astro-ph/0309756
• Breve revisão da cosmologia padrão, incluindo possı́veis problemas do modelo
atual: veja a referência [32].

Lentes gravitacionais:

• J. Wambsganss, Gravitational Lensing in Astronomy, Living Rev. Relativity 1,


12 (1998); http://www.livingreviews.org/lrr-1998-12 [artigo de revisão, in-
cluindo uma breve introdução histórica]

Um ótimo artigo sobre as definições de distância em cosmologia:

• David W. Hogg, Distance measures in cosmology, astro-ph/9905116

Estrutura em grande escala do Universo e mapeamentos de posições de galáxias:

• Matthew Colless, Redshift Surveys and Cosmology: A Summary of the Dunk


Island Conference, Publ. Astron. Soc. Aust., 17, 215 (2000); pdf disponı́vel em
http://www.atnf.csiro.au/pasa/17 3/colless/paper/node2.html

108
Energia Escura:

• Da desaceleração à aceleração, Adam G. Riess e Michael S. Turner, Scientific


American Brasil, número 22, março de 2004
• Sean M. Carroll, Why is the Universe Accelerating?, astro-ph/0310342
• P.J.E. Peebles, B. Ratra, The Cosmological Constant and Dark Energy, Rev.
Mod. Phys. 75, 559 (2003); astro-ph/0207347.
• S.M. Carrol, The Cosmological Constant, Living Reviews in Relativity 4, 1
(2001),
http://relativity.livingreviews.org/Articles/lrr-2001-1/
• V. Sahni, A.A. Starobinsky, The Case for a Positive Cosmological Λ Term, Int.
J. Mod. Phys. D 9, 373 (2000); astro-ph/9904398
• M.S. Turner, Phys. Rep. 333, 619 (2000)
• I. Waga, Dark Energy and the Accelerated Expansion of the Universe, Braz. J.
Phys. 30, 2, 370 (2000)
http://www.sbfisica.org.br/bjp/download/v30/v30a40.pdf
• S. Weinberg, The cosmological constant problem, Rev. Mod. Phys. 61, 1-23
(1989).
• Andreas Albrecht, et al., Report of the Dark Energy Task Force,
astro-ph/0609591 (compara e padroniza diversos métodos e projetos para es-
tudar a energia escura)

Matéria Escura

• G. Bertone, D. Hooper, J. Silk, Particle Dark Matter: Evidence, Candidates and


Constraints, Phys.Rept. 405, 279 (2005), hep-ph/0404175;
• Hitoshi Murayama, Physics Beyond the Standard Model and Dark Matter, Les
Houches Summer School, Session 86, Particle Physics and Cosmology: the Fabric
of Spacetime, July 31- August 25, 2006, arXiv:0704.2276v1.
• K. Griest, M. Kamionkowski, Phys. Rep. 333, 167-182 (2000);
• M.S. Turner, Phys. Rep. 197, 67 (1990);
• G.G. Raffelt, Phys. Rep. 198, 1 (1990).
• Limite experimental em áxions: E. Zavattini, et al., Experimental observation
of optical rotation generated in vacuum by a magnetic field, Phys.Rev.Lett. 96
(2006) 110406; arXiv:hep-ex/0507107v3.

Artigos de divulgação sobre os resultados de supernovas do tipo Ia:

• Saul Perlmutter, Supernovae, Dark Energy, and the Accelerating Universe,


Physics Today, April 2003, pp. 53 (disponı́vel em:
http://www.lbl.gov/Science-Articles/Archive/
assets/images/2003/Sep-05-2003/PhysicsTodayArticle.pdf)
• James Glanz, Exploding Stars Point to a Universal Repulsive Force, Science, Vol
279, Number 5351, pp. 651-652, 30 Jan. 1998

109
• James Glanz, Astronomers See a Cosmic Antigravity Force at Work, Science, Vol
279, Number 5355, pp. 1298-1299, 27 Feb. 1998

Supernovas e cosmologia:

• S. Perlmutter, B. P. Schmidt, Measuring Cosmology with Supernovae, in Super-


novae & Gamma Ray Bursts, K. Weiler, Ed., Springer, Lecture Notes in Physics
(in press), astro-ph/0303428.
• Artigo do Supernova Cosmology Projetc: Knop, et al., New Constraints on ΩM ,
ΩΛ , and w from an Independent Set of Eleven High-Redshift Supernovae Observed
with HST,ApJ 598, 102 (2003), astro-ph/0309368.

Limites atuais sobre a idade do universo a partir de aglomerados globulares:

• L. M. Krauss, B. Chaboyer, Age Estimates of Globular Clusters in the Milky


Way: Constraints on Cosmology, Science, 299, 5603, pp. 65-70 (2003).
• L. M. Krauss, Dark Energy and the Hubble Age, ApJ, 604, 481 (2004),
astro-ph/0212369.
• N. Dauphas, The U/Th production ratio and the age of the Milky Way from
meteorites and Galactic halo stars, Nature 435, 1203 (2005).

Medidas da densidade de matéria escura através da emissão em raios-x de aglomerados:

• S. W. Allen, P. R. W. Schmidt, H. Ebeling, A. C. Fabian,.L.van Speybroeck, Con-


straints on dark energy from Chandra observations of the largest relaxed galaxy
clusters, astro-ph/0405340.
• S. W. Allen, P. R. W. Schmidt and A. C. Fabian, Cosmological constraints from
the X-ray gas mass fraction in relaxed lensing clusters observed with Chandra,
MNRAS, 334, L11 (2002).
• A. Vikhlinin, A. Kravtsov, W. Forman, C. Jones, M. Markevitch, S. S. Murray,
L. Van Speybroeck, Chandra sample of nearby relaxed galaxy clusters: mass, gas
fraction, and mass-temperature relation, astro-ph/0507092.

Radiação cósmica de fundo

• W. Hu, S. Dodelson, Cosmic Microwave Background Anisotropies, Annual Re-


view of Astronomy and Astrophysics, 40, 171-216 (2002), astro-ph/0110414
• D. Scott, G. Smoot, Cosmic Background Radiation Mini-Review,
astro-ph/0406567. [Uma mini-revisão sobre radiação cósmica de fundo]
• Hu, W., Sugiyama, N., Anisotropies in the cosmic microwave background: an
analytic approach, ApJ, 444, 489 (1995).
• Hu, W., Sugiyama, N., Small-Scale Cosmological Perturbations: an Analytic Ap-
proach, ApJ 471, 542 (1996).
• U. Seljak & M. Zaldarriaga, A line of sight approach to Cosmic Microwave Back-
ground anisotropies, ApJ 469, 437 (1996),
• Bertschinger, E., COSMICS: Cosmological Initial Conditions and Microwave
Anisotropy Codes, astro-ph/9506070

110
• A. Lewis, A. Challinor, A. Lasenby, Efficient Computation of CMB anisotropies
in closed FRW models, ApJ 538 (2000) 473-476, astro-ph/9911177
• Doran M., CMBEASY: an Object Oriented Code for the Cosmic Microwave Back-
ground, astro-ph/0302138

Efeito Sunyaev-Zel’dovich [ótimo review sobre o que promete ser um dos assuntos mais
quentes da cosmologia observacional nos próximos anos]

• J. E. Carlstrom, G. P. Holder, E. D. Reese, Cosmology with the


Sunyaev-Zel’dovich Effect, Ann. Rev.Astron.Astrophys. 40, 643 (2002),
astro-ph/0208192

WMAP (maps e cosmological implications):


Correlação entre a estrutura em grande escala e as anisotropias na radiação cósmica
de fundo:

• Fosalba, E. Gaztañaga, F. Castander, Astrophys. J. 597, L89 (2003)


• R. Scranton et al., Physical Evidence for Dark Energy, astro-ph/0307335
• M. R. Nolta et al., Astrophys. J. 608, 10 (2004)
• N. Afshordi, Y.-Sh. Loh, and M. A. Strauss, Phys. Rev. D 69, 083524 (2004)
• S. Boughn and R. Crittenden, Nature 427, 45 (2004)
• P. Fosalba and E. Gaztañaga, Mon. Not. Roy. Astron. Soc. 350, L37 (2004)
• E. Gaztanaga, M. Manera, and T. Multamaki, New light on Dark Cosmos,
Mon.Not.Roy.Astron.Soc. 365, 171 (2006); astro-ph/0407022.

Medidas de distância e do parâmetro de Hubble:

• W. Freedman, Final Results from the Hubble Space Telescope Key Project to
Measure the Hubble Constant, ApJ 553, 47 (2001), astro-ph/0012376.

Eevolução não linear e simulações de formação de estruturas:

• E. Bertschinger, Simulations of Structure Formation in the Universe, Annual


Review of Astronomy and Astrophysics, 36, 599 (1998)
• V. Springel, et al., Simulations of the formation, evolution and clustering of galax-
ies and quasars, Nature, 435, 629 (2005), astro-ph/0504097 [disponı́vel também
em http://www.mpa-garching.mpg.de/galform/millennium/, com imagens e
animações de alta resolução]

111
2.9 Exercı́cios
Exercicio: Unidades e ordens de grandeza

1) A temperatura da radiação cósmica de fundo (RCF) hoje é T0 = 2.725 ± 0.002 [67].


Lembrando da lei de Stephan-Boltzmann (ρ = σT 4 ) calcule a densidade (e densidade
de energia) dos fótons da RCF. Expresse seus resultados em g/cm3 . Note que, para
usar a lei de Stephan-Boltzmann, estamos supondo que os fótons da RCF obedecem
à distribuição de Planck, o que é verificado experimentalmente com uma excelente
precisão.

2) O parâmetro de Hubble é geralmente escrito na forma H0 = 100 h Mpc/Km/s. A


partir dessa quantidade, obtenha o tempo de Hubble tH = H0−1 , em segundos e em
anos. Também podemos definir uma distância de Hubble pela relação DH = c/H0 .
Obtenha DH em kilômetros e em megaparsecs (Mpc).
Alguns resultados atuais fornecem h ' 0.72 [25]. Calcule tH e DH para esse valor da
constante de Hubble.

3) Obtenha a densidade crı́tica ρcrit := 3H02 /8πG em g/cm3 em termos de h. Em


cosmologia, é muito conveniente introduzirmos os parâmetros cosmológicos de densi-
dade, definidos pela relação Ωi = ρi0 /ρcrit , onde o ı́ndice i denota cada componente
do conteúdo energético-material do universo. Calcule Ωγ (parâmetro de densidade dos
fótons) em termos de h e para h = 0.72.

Observações: Os cosmólogos e fı́sicos de partı́culas costumam utilizar convenções em


que c = 1, onde c é a velocidade da luz (no vácuo). Insira essa quantidade para obter
as dimensões corretas nos exercı́cios acima, quando for necessário.
O subscrito 0 costuma denotar quantidades calculadas “hoje”, ou seja, na presente
idade do universo.

Respostas
8π 5 k4
1) ργ0 = 4.642 × 10−34 g/cm3 (σ = 15c3 h3
= 7. 566 × 10−16 kgm−3 K−4 ).
2) H0−1 = h−1 3.08568025 × 1017 s ' h −1
9.8 × 109 anos, DH = c
H0
= h−1 3000 M pc
3H 2
3) ρcrit = 8πG
= h2 1.8788 × 10−29 g/cm3 .
Ω0γ = 2.471 × 10−5 h−2 . Para h = 0.72, temos Ω0γ = 4.766 × 10−5

Problema: Idade do Universo


Não se assuste! Este problema pode parecer um pouco longo, mas não é difı́cil. É um
tutorial passo a passo para obter a idade do universo (na cosmologia de Friedmann-
Lemaı̂tre-Robertson-Walker).

1) Equação de Friedmann e parâmetros de densidade.


Lembrando que o parâmetro de Hubble é dado por

H (t) = (2.46)
a
112
(onde a é o fator de escala e o ponto denota a derivada temporal), utilize as definições
dos parâmetros de densidade, da densidade crı́tica, junto com a equação de Friedmann
 2
ȧ 8πG X Λ K
= ρi + − 2 , (2.47)
a 3 i
3 a

para obter X
Ωi + ΩΛ + ΩK = 1,
i

onde ΩΛ = Λ/(3H02 ) e ΩK = −K/H02 . Incluindo a constante


P cosmológica e a curvatura
como “componentes de matéria”, temos simplesmente j Ωj = 1 onde o ı́ndice j
denota as componentes materiais (bárions, matéria escura, fótons, etc.), a curvatura
e a constante cosmológica.

2) Conservação da energia.
Reescreva a equação da conservação de energia

ρ̇ + 3H (ρ + p) = 0

utilizando a como variável. Mostre que para radiação (p = ρ/3), matéria (p = 0) e


“vácuo” (p = −ρ) as soluções são, respectivamente, ρr = ρr0 (a/a0 )4 , ρm = ρm0 (a/a0 )3
e ρv = ρv0 = const. Se quiser, é fácil encontrar a solução para uma equação de estado
um pouco mais geral, da forma p = wρ.
Utilize esses resultados na equação de Friedmann (2.47), junto com as definições dos
parâmetros cosmológicos (parâmetros de densidade e parâmetro de Hubble), para
obter (num universo composto por matéria, radiação, curvatura e constante cos-
mológica) s  
4  3  2
a a a
H (a) = H0 Ωr + Ωm + ΩK + ΩΛ
a0 a0 a0
onde ΩΛ pode denotar tanto a constante cosmológica, quanto um termo do tipo energia
do vácuo, ou uma combinação dos dois.
3) Idade do Universo.
Utilizando a definição do parâmetro de Hubble (2.46) obtenha a expressão para a
idade do universo
Z t0 Z a0
−1 da
t0 = dt = H0 r   . (2.48)
0 0 4  3  2
a a a
a Ωr a0 + Ωm a0 + ΩK a0 + ΩΛ

Calcule a idade do universo (em Ga = 109 anos) para Ωm = 0.3, ΩΛ = 0.7 e h = 0.72.
O valor de Ωr será dado pelo resultado do exercı́cio 3) (aqui, apenas com propósitos
didáticos, desprezaremos a contribuição dos neutrinos) [Como obter o valor de ΩK ?].
O que ocorre se desprezamos a contribuição da radiação? E da curvatura?
Como fica a idade do Universo se agora ΩΛ = 0 e ΩK = 0?
Supondo que o universo é plano (K = 0) e desprezando a radiação, faça um gráfico
de t0 em unidades de h−1 Ga em função de Ωm .

113
Faça o mesmo gráfico, mas agora para ΩΛ = 0 (e portanto K 6= 0).

Diversas estimativas atuais para a idade das estrelas mais velhas indicam um limite
inferior de 11 Ga (veja, por exemplo, a ref. [31]). Naturalmente esse valor fornece um
limite inferior para a idade do universo. A que conclusões você pode chegar, tendo em
vista os resultados que você obteve acima?

Como mencionado no curso, podemos definir um “inı́cio do universo” extrapolando


a curva a (t) para a → 0. Isso implica em supor que as componentes de matéria vão
continuar a se comportar como deduzido no ı́tem 2). No entanto, não sabemos como
é a equação de estado da matéria a temperaturas altı́ssimas, onde podem intervir
inúmeros efeitos ainda não estudados em laboratório. Que condições seria preciso
impor ao comportamento da matéria para o universo não ter tido um inı́cio, ou seja,
para a integral (2.48) divergir?

2.10 Glossário

Parsec (pc)
Unidade de distância amplamente utilizada em astronomia cujo nome deriva de “per
second arc”. Corresponde à distância na qual um segmento medindo uma unidade
astronômica (equivalente à distância média da Terra ao Sol) subtende um ângulo de um
segundo de arco. Sua origem decorre da utilização da paralaxe para medir distâncias
às estrelas mais próximas. Um pc equivale a 3.26 anos luz ou 3.086 × 1013 Km. As
distâncias cosmológicas são usualmente medidas em Megaparsec (Mpc = 106 pc) e
Gigaparsec (Gpc = 109 pc).

Elétron Volt (eV)


Unidade de energia muito utilizada em fı́sica de partı́culas. Ela corresponde à energia
ganha por um elétron ao atravessar um potencial de um Volt, ou seja 1 eV ' 1.6×10−19
J. A energia de ionização do hidrogênio no estado fundamental, por exemplo, é de 13.6
eV. Também são muito utilizados em fı́sica de altas energias os múltiplos do eV, como
keV, MeV, GeV, TeV, PeV, EeV, correspondendo, respectivamente, a 103 , 106 , 109 ,
1012 , 1015 e 1018 eV.

Seção de choque
A seção de choque é uma medida da probabilidade de ocorrência de uma dada reação.
Ela é definida como o número de reações por unidade de tempo dividido pelo número
de colisões (“encontros” entre partı́culas) por unidade de tempo por unidade de área,
ou seja, é o número de reações por unidade de tempo dividido pelo fluxo incidente. A
seção de choque depende da energia das partı́culas e da reação em questão. Pode-se
pensar na seção de choque como uma área efetiva para as colisões, daı́ o seu nome.
De fato, o número de reações pode ser calculado assumindo-se que o núcleo tem uma
área e que uma dada reação ocorre sempre que uma partı́cula atinge aquela área.

114
2.11 Referências bibliográficas
[1] G.A. Tammann, B. Reindl, Cosmic Expansion and H0 : A Retro- and Pro-Spective
Note, proceedings of the XXXVIIth Moriond Astrophysics Meeting “The Cosmo-
logical Model”, Les Arcs, France, March 16-23, 2002, astro-ph/0208176
[2] Hoskin, M. A., Ritchey, Curtis and the Discovery of Novae in Spiral Nebulae,
Journal for the History of Astronomy, 7, 47 (1976)
[3] Nick Allen, Msc thesis: The Cepheid Distance Scale: A History, 2001
(http://www.institute-of-brilliant-failures.com/).
[4] K. Z. Stanek, P. M. Garnavich, Distance to M31 With the HST and Hipparcos
Red Clump Stars, astro-ph/9802121
[5] Hubble, E. P., A spiral nebula as a stellar system: Messier 33, Astrophys. J., 63,
236-274 (1926)
[6] Hubble, Edwin; Humason, Milton L., The Velocity-Distance Relation among
Extra-Galactic Nebulae, Astrophysical Journal, vol. 74, p.43 (1931)
[7] Leavitt, Henrietta S.; Pickering, Edward C., Periods of 25 Variable Stars in the
Small Magellanic Cloud, Harvard College Observatory Circular, vol. 173, pp.1-3
(1912)
[8] V.C. Rubin & W.K. Ford, Astrophys. J. 159, 379 (1970)
[9] E. Corbelli, P. Salucci, The Extended Rotation Curve and the Dark Matter
Halo of M33, MNRAS, 311, 441 (2000), astro-ph/9909252 [veja também E.
Corbelli, Dark matter and visible baryons in M33, MNRAS 342, 199 (2003),
astro-ph/0302318]
[10] L. Ferrarese et.al., The Extragalactic Distance Scale Key Project. IV. The Discov-
ery of Cepheids and a New Distance to M100 Using the Hubble Space Telescope,
ApJ 464, 568 (1996).
[11] Koester, B.P. , et al., A MaxBCG Catalog of 13,823 Galaxy Clusters from the
Sloan Digital Sky Survey, astro-ph/0701265.
[12] Press W.H., Schechter, P.L., Astrophys. J. 187, 425 (1974)
[13] F., Zwicky, On the Masses of Nebulae and of Clusters of Nebulae, ApJ, 86, 217
(1937).
[14] M. Colless, A.M. Dunn, Structure and Dynamics of the Coma Cluster, ApJ, 458,
435 (1996), astro-ph/9508070.
[15] J. Renn, T. Sauer, & J. Stachel, The origin of gravitational lensing: A postscript
to Einstein’s 1936 Science paper, Science, 275, 184 (1997).
[16] Chwolson, O., Über eine mögliche Form fiktiver Doppelsterne [Sobre um Possı́vel
Tipo de Estrelas Duplas Fictı́cias], Astron. Nachr., 221, 329, (1924).
[17] A. Einstein, Lens-like action of a star by the deviation of light in the gravitational
field, Science, 84, 506, (1936).
[18] F., Zwicky, Nebulae as Gravitational Lenses, Phys. Rev. Lett., 51, 290 (1937);
F., Zwicky, On the Probability of Detecting Nebulae Which Act as Gravitational
Lenses, Phys. Rev. Lett., 51, 679, (1937).
[19] Lynds, R., Petrosian, V., BAAS, 18, 1014 (1986); Lynds, R., & Petrosian, V.,
Astropys. J, 336, 1 (1989); Soucail, G., Fort, B., Mellier, Y., & Picat, J. P.,
Astronomy & Astrophys., 172, L14 (1987).

115
[20] E.S. Cypriano, G.B. Lima Neto, L. Sodré, J.-P. Kneib, L.E. Campusano, Luis E.,
Gemini and Chandra observations of Abell 586, a relaxed strong-lensing cluster,
Astrophys.J. 630 (2005) 38, astro-ph/0504036
[21] M. Fukugita, C. J. Hogan, P. J. E. Peebles, The Cosmic Baryon Budget, ApJ.
503, 518 (1998), astro-ph/9712020; M. Fukugita, P. J. E. Peebles, The Cosmic
Energy Inventory, ApJ 616, 643 (2004), astro-ph/0406095.
[22] South Pole Telescope: http://spt.uchicago.edu/
[23] J. E. Carlstrom, G. P. Holder, E. D. Reese, Cosmology with the Sunyaev-
Zel’dovich Effect, Ann.Rev.Astron.Astrophys. 40, 643 (2002), astro-ph/0208192
[24] Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3,
163 (1929)
[25] W.L.Freedman, et al., Final Results from the Hubble Space Telescope Key Project
to Measure the Hubble Constant, ApJ, 553, 47 (2001), astro-ph/0012376.
[26] J. Huchra, M. Davis, D. Latham, J. Tonry, A survey of galaxy redshifts. IV - The
data, ApJS, 52, 89 (1983).
[27] V. de Lapparent, M.J. Geller, J.P. Huchra, A slice of the universe, ApJ, 302, L1
(1986).
[28] L. N. da Costa, et al., The Southern Sky Redshift Survey, ApJ, 327, 544 (1988).
[29] L. N. da Costa, et al., A complete southern sky redshift survey, ApJ, 424, L1
(1994); L. N. da Costa, et al., The Southern Sky Redshift Survey, Astron. J., 116,
1 (1998), astro-ph/9804064.
[30] S.A. Shectman, et al., The Las Campanas Redshift Survey, ApJ, 470, 172 (1996),
astro-ph/9604167.
[31] L. M. Krauss, B. Chaboyer, Science, 299, 5603, 65 (2003); L. M. Krauss, ApJ,
604, 481 (2004), astro-ph/0212369.
[32] J.R. Primack, Precision cosmology, New Astronomy Reviews, 49, 25 (1995),
astro-ph/0408359.
[33] R. A. Daly, ApJ, 426, 38 (1994); veja também: E. J. Guerra, R. A. Daly, L.
Wan, ApJ, 544, 659 (2000); R. A. Daly, E. J. Guerra, AJ, 124, 1831 (2002); S.
Podariu, R. A. Daly, M. P. Mory, B. Ratra, ApJ, 584, 577 (2003).
[34] M. Visser, Jerk, snap, and the cosmological equation of state, Class. Quant. Grav.
21, 2603 (2004), gr-qc/0309109; veja também R. R. Caldwell, M. Kamionkowski,
Expansion, Geometry, and Gravity, astro-ph/0403003 e T. Chiba, T. Nakamura,
The Luminosity Distance, the Equation of State, and the Geometry of the Uni-
verse, Prog. Theor. Phys. 100, 1077 (1998); astro-ph/9808022
[35] J.R. Gott, et al., A Map of the Universe, ApJ, 624, 463 (2005),
astro-ph/0310571.
[36] de Bernardis, P., et al. 2000, Nature, 404, 955 (2000); Lange, A. E., et al., 2000,
Phys. Rev. D., 63, 042001, astro-ph/0005004.
[37] S. Hanany et al., ApJ 545, L5 (2000); A. Balbi et al., ApJ 545, L1 (2000).
[38] Netterfield, C. B., et al., A Measurement by BOOMERANG of Multiple Peaks in
the Angular Power Spectrum of the Cosmic Microwave Background, ApJ, 571,
604 (2002).

116
[39] Kolb, E. W., Turner, M. S.,The Early Universe, Addison-Wesley (1994).
[40] P. J. E. Peebles, Large-scale background temperature and mass fluctuations due
to scale-invariant primeval perturbations, ApJ 263, L1 (1982).
[41] J. R. Bond & G. Efstathiou, Cosmic Background Radiation Anisotropies in Uni-
verses Dominated by Nonbaryonic Dark Matter, ApJ 285, L45 (1984)
[42] S. Burles, K. M. Nollett, M. S. Turner, Big-Bang Nucleosynthesis Predictions for
Precision Cosmology, ApJ 552, L1 (2001), astro-ph/
[43] D. Kirkman, D. Tytler, N. Suzuki, J. M. O’Meara, D. Lubin, The cosmological
baryon density from the deuterium to hydrogen ratio towards QSO absorption
systems: D/H towards Q1243+3047, Astrophys. J., Suppl. Ser. 149, 1 (2003),
astro-ph/0302006
[44] Maddox, S. J., Efstathiou, G., Sutherland, W. J. & Loveday, J., Galaxy corre-
lations an large scales, MNRAS, 242, 43 (1990); Maddox, S. J., Efstathiou, G.,
Sutherland, W. J. & Loveday, J., MNRAS, 243, 692 (1990)
[45] Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html.
[46] Shectman, S. A., et. al., The Las Campanas Redshift Survey, ApJ, 470, 172
(1996)
[47] Lapperent, V., Geller, M. J., Huchra J. P., A Slice of the Universe, ApJ, 302, L1
(1986)
[48] 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.roe.ac.uk/~jap/2df/
[49] Sloan Digital Sky Survey: http://www.sdss.org
[50] Dark Energy Survey: http://www. darkenergysurvey.org
[51] K. S. Wu, O. Lahav & M. J. Rees, The large-scale smoothness of the Universe,
Nature, 397 (1999)
[52] J. C. Mather, D. J Fixsen, R. A. Shafer, C. Mosier, D. T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), Astro-
phys. J., 512, 511 (1999).
[53] C. L. Bennett, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Preliminary Maps and Basic Results, astro-ph/0302207, submit-
ted to The Astrophysical Journal.
[54] D. N. Spergel, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Determination of Cosmological Parameters, astro-ph/0302209,
submitted to The Astrophysical Journal.
[55] G. Hinshaw, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: The Angular Power Spectrum, astro-ph/0302217, submitted to
The Astrophysical Journal,
L. Page, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP) Ob-
servations: Interpretation of the TT and TE Angular Power Spectrum Peaks,
astro-ph/0302220, submitted to The Astrophysical Journal.
[56] Bertschinger E., Cosmological Dynamics, in R. Schaeffer, J. Silk, M. Spiro and V.
Zinn-Justin eds., Cosmology and Large Scale Strucutre, XV Les Houches Summer
School (1993), Elsevier Science, Amsterdam (1996) 273, astro-ph/9503125
[57] Bertschinger, E., Cosmological Perturbation Theory and Structure Formation, in
M. C. Bento, O. Bertolami, L. Teodoro eds., COSMOLOGY 2000 Conference
Proceedings, astro-ph/0101009

117
[58] Sachs R. K., Wolfe A. M., Perturbations of a Cosmological Model and Angular
Variations of the Microwave Background, ApJ 147, 73 (1967)
[59] Monaghan J. J., Smoothed Particle Hydrodynamics, Annu. Rev. Astron. Astro-
phys., 30, 543 (1992)
[60] Bertschinger, E., Simulations of Structure Formation in the Universe, Annu. Rev.
Astron. Astrophys., 36, 599-654 (1998)
[61] Virgo Consortium: www.virgo.dur.ac.uk
[62] Hubble Volume: http://www.physics.lsa.umich.edu/hubble-volume
[63] Springel V., et al., Simulations of the formation, evolution and clustering of galax-
ies and quasars, Nature 435, 629 (2005); astro-ph/0504097
[64] Tipler, F. J., Rigurous Newtonian Cosmology, Am. J. Phys. 64, 10, 1311 (1996)
[65] Tipler, F. J., Newtonian Cosmology Revisited, MNRAS, 282, 206 (1996)
[66] Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe
(Relativistic Astrophysics, volume 2), The University of Chicago Press (1983)
[67] J.C. Mather, D. J. Fixsen, R.A. Shafer, C. Moser, D.T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), ApJ
512, 511 (1999), astro-ph/9810373. [T0 = 2.725 ± 0.002]
[68] M. Fukugita, P.J.E. Peebles, The Cosmic Energy Inventory, Astrophys. J. 616,
643 (2004), astro-ph/0406095.
[69] Biviano et al., A catalogue of velocities in the central regions of the Coma cluster,
Astron. Astrophys. Suppl. Ser. 111, 265 (1995).
[70] Novello, M., A Spinor Theory of Gravity and the Cosmological Framework,
arXiv:gr-qc/0701120
[71] Novello, M., Constructing Dirac linear fermions in terms of non-linear Heisenberg
spinors, arXiv:0705.2692
[72]
[73] Hawkins, E., et al., The 2dF Galaxy Redshift Survey: correlation functions, pe-
culiar velocities and the matter density of the Universe, MNRAS 346, 78 (2003);
astro-ph/0212375
[74] Makler, M., Dinâmica Gravitacional da Formação de Estruturas no Universo,
Tese de doutorado, CBPF (2001)
[75] Lifshitz, E. M., On the gravitational stability of the expanding universe. J. Phys.
USSR 10, 116 (1946)
[76] Reis, R. R., Domain of validity of the evolution of perturbations in Newtonian
cosmology with pressure, Phys. Rev. D 67 7301 (2003); Erratum ibid 68, 9901
(2003).

118
Figura 2.20: Diagrama ilustrando a hierarquia e ordens de grandeza das dimensões das
estruturas no Universo.

Figura 2.21: O catálogo de galáxias APM (do inglês automatic plate machine) contém
mais de 2 milhões de galáxias, cobrindo aproximadamente 1/10 da esfera celeste. As inten-
sidades em cada pı́xel são proporcionais ao número de galáxias, com as cores azul, verde
e vermelho representando galáxias brilhantes, de brilho médio e fracas, respectivamente.
As áreas escuras recortadas foram excluı́das por conter estrelas brilhantes e outros obje-
tos que impediram a identificação das galáxias de fundo. Créditos: Steve Maddox, Will
Sutherland, George Efstathiou, Jon Loveday, Gavin Dalton e Departamento de Astrofı́sica
da Universidade de Oxford. Veja referência [44].

119
Figura 2.22: Distribuição de galáxias em função do desvio para o vermelho obtida pelo
projeto 2dF [48] (http://magnum.anu.edu.au/∼TDFgg/).

Figura 2.23: Estrutura em grande escala segundo a millenium simulation. A figura mostra
a distribuição de matéria escura em uma “fatia” dessa simulação, nas maiores escalas (veja
a ref. [63]).

120
Figura 2.24: Distribuição de matéria em um aglomerado massivo segundo a millenium
simulation. Esta imagem representa um zoom na figura 2.23 (veja a ref. [63]).

121
Capı́tulo 3

Introdução à Cosmologia

Mário Novello1

3.1 Introdução
Neste capı́tulo descreveremos alguns aspectos teóricos da Cosmologia Relativista. De-
vido ao caráter universal e somente atrativo da gravitação é ela a força responsável
pela estrutura e evolução do universo. Assim, a cosmologia do século XX se inicia
quando em 1917 Einstein aplicou as suas equações da Teoria da Relatividade Geral
(TRG) ao universo2 .

3.2 Cosmologia Relativista


O princı́pio básico que orienta a Cosmologia Moderna é o chamado Princı́pio Cos-
mológico. Ele pode ser descrito em termos de duas afirmativas:
a) As leis da fı́sica tal como as determinamos em nossa vizinhança são
válidas em qualquer região e momento da história do Universo, em qual-
quer escala de distância e tempo.
b) O Universo é espacialmente homogêneo e isotrópico .
A primeira afirmação é indispensável para que se possa construir um modelo cos-
mológico. Sem ela, nada se poderia afirmar sobre o comportamento da matéria
em regiões longı́nquas do Universo e em diferentes épocas de sua história. Sendo
1
Afiliação:ICRA-BR/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
2
O leitor interessado na história da Cosmologia ao longo do século XX pode consultar o livro de
Merleau-Ponty. Para um estudo mais aprofundado do significado da Cosmologia e suas relações com a
Fisica pode consultar M. Novello

122
uma hipótese de trabalho, possivelmente tal afirmação não seja válida em algumas
situações, mas sem assumı́-la, jamais poderemos determinar as suas limitações .
Como consequência desta primeira afirmação, conclui-se, a partir de nossas ob-
servações astronômicas locais, que os objetos celestes devem ter carga total muito
próxima de zero. Sendo assim, das duas únicas interações de longo alcance conhecidas
na natureza, o eletromagnetismo e a gravitação, somente esta última tem relevância
para a Cosmologia.
Como discutido em Capı́tulo 1, em 1915, Einstein completou a formulação de uma
nova teoria da gravitação, a Teoria da Relatividade Geral. Nela, a gravitação não é
descrita como uma força provocada pela existência de grandes massas, mas como uma
modificação da geometria do espaço-tempo provocada pela energia sob qualquer forma,
nele contida. As partı́culas nesta região, se não sofrerem a influência de nenhuma
outra força, são ainda consideradas partı́culas livres, descrevendo trajetórias que são o
caminho extremal entre dois pontos do espaço-tempo isto é geodésicas do tipo tempo
e nula de geometria. As equações de Einstein da gravitação relacionam algebricamente
a curvatura do espaço-tempo com a distribuição de matéria e energia.
Uma vez construı́da uma nova teoria da gravitação, o passo lógico seguinte é aplicá-la
à Cosmologia. Entretanto, como estas equações são muito complexas, faz-se necessária
uma hipótese simplificadora, que é a segunda parte do Princı́pio Cosmológico.
Em uma geometria que possui estrutura espacial homogênea e isotrópica todos os pon-
tos do espaço, bem como todas as direções a partir de qualquer ponto são equivalentes.
Isto restringe bastante as possı́veis geometrias espaciais. Na verdade, é possı́vel mostrar
que só existem 3 geometrias que satisfazem este Princı́pio (veja Ref.[1], capı́tulo 13).
A primeira consiste no espaço plano. Outra possibilidade, em duas dimensões, é a
superfı́cie de uma esfera. Não há pontos ou direções preferenciais nesta superfı́cie.
Entretanto, a superfı́cie de uma esfera tem apenas 2 dimensões e vivemos em 3 di-
mensões. É possı́vel generalizar este conceito para 3 dimensões? Vejamos: uma esfera
bidimensional, denotada por S 2 , é definida num espaço tridimensional plano, no qual
os comprimentos infinitesimais são dados por

dl2 = dx2 + dy 2 + dz 2 , (3.1)

ou, em coordenadas esféricas,

dl2 = dr2 + r2 [dθ2 + sin2 θdφ2 ], (3.2)

com r2 = x2 + y 2 + z 2 , através do vı́nculo r = a, onde a é o raio da esfera. A


generalização de S 2 para a esfera tridimensional S 3 é facilmente obtida tomando-se
um espaço plano quadridimensional

dl2 = dw2 + dr2 + r2 [dθ2 + sin2 θdφ2 ], (3.3)

e impondo-se o vı́nculo w2 + x2 + y 2 + z 2 = w2 + r2 = a2 (a constante  foi introduzida


por razões que veremos a seguir, mas no momento ela vale 1), sendo a, analogamente,
o raio da 3-esfera. Do vı́nculo obtemos que wdw + rdr = 0. Substituindo na Eq. (3.3),
usando o vı́nculo, redefinindo r̄ ≡ r/a e omitindo as barras, obtemos
n dr2 o
dl2 = a2 + r 2
[dθ 2
+ sin 2
(θ)dφ2
] . (3.4)
1 − r2

123
Examinemos a dependência em  da Eq. (3.4). Para  = 1 temos, como vimos, a 3-
esfera. Se fizermos  = 0, reencontramos o espaço plano da Eq. (3.2), que é também
homogêneo e isotrópico, com um fator multiplicativo a2 . O caso  = −1 é a terceira
possibilidade de espaço homogêneo e isotrópico, que pode também ser obtido através
de seções hiperbólicas do espaço-tempo de Minkowski

ds2 = dt2 − dr2 − r2 [dθ2 − sin2 (θ)dφ2 ], (3.5)

dadas por a2 = t2 − r2 (verifique). Note que a tem dimensão de comprimento e c é a


velocidade da luz no vácuo.
A Eq. (3.4) representa, portanto, as 3 possibilidades de geometrias espaciais ho-
mogêneas e isotrópicas impostas pelo Princı́pio Cosmológico. Para  = ±1, estas
geometrias são curvas, a 3-esfera para  = 1 e o 3-hiperbolóide para  = −1.
Como seria a geometria do espaço-tempo cosmológico? Temos que acrescentar à Eq.
(3.4) a dimensão tempo. Poderı́amos ter um termo N 2 (t)dt2 (note que a função N
não pode depender das coordenadas espaciais senão perderı́amos a homogeneidade).
Entretanto, pode-se redefinir o tempo dt̄ ≡ N (t)dt de tal maneira a fazer N = 1.
Termos do tipo dtdxi (xi representa as 3 coordenadas espaciais) também não podem
existir pois senão a geometria não seria invariante por inversões xi → −xi , perdendo
sua propriedade de isotropia. Assim, a geometria mais geral possı́vel compatı́vel com
homogeneidade e isotropia é dada por

n dr2 o
ds2 = dt2 − a2 (t) + r 2
[dθ 2
+ sin 2
(θ)dφ2
] . (3.6)
1 − r2
Note que a única função arbitrária a ser determinada pelas equações de Einstein no
caso do universo isotrópico e homogêneo é o fator de escala a(t). Note que temos duas
possibilidades com relação às unidades. Podemos considerar as coordenadas espaciais
sem unidades e jogar as unidades de comprimento em a(t), ou conservar as unidades
nas coordenadas, e adimensionalizar o fator de escala fazendo a(t) → a(t)/a(t0 ), onde
t0 é um tempo de referência. Adotaremos aquı́ a segunda possibilidade.
Vamos tentar entender fisicamente o significado da geometria (3.6) e sua relação com
o Universo real. Em primeiro lugar, é fácil verificar da geometria (3.6), através da
equação da geodésica (11.10), que os objetos astronômicos sujeitos apenas ao campo
gravitacional cosmológico e livres de outras forças (seguindo, portanto, as geodésicas
da geometria (3.6)), têm coordenadas espaciais (r, θ, φ) constantes ao longo de sua
história. Por isso as chamamos de coordenadas co-moventes. Assim, a distância espa-
cial entre dois objetos astronômicos só varia de t = t1 =cte. a t = t2 =cte. através
do fator de escala a(t) (veja Eq.(3.6) com dt = 0). A situação é análoga a pontos na
superfı́cie da Terra determinados por suas latitudes e longitudes. Se a Terra inflasse
(através do aumento do raio da Terra a(t)), as latitudes e longitudes destes pontos
permaneceriam as mesmas mas suas distâncias reais aumentariam proporcionalmente
ao incremento em a(t). Sobre marcações de tempo, um mesmo objeto astronômico
teria seu tempo próprio dado, ao longo de sua história, pela coordenada t, chamado
tempo cósmico (veja Eq.(3.6) com dr = dθ = dφ = 0).
A geometria dada pela equação (3.6) é chamada geometria de Friedman, e a ob-
servação mostra que ela descreve bem o universo (ver Capitulo 2). Veremos a seguir
outras propriedades do elemento de linha dado pela Eq.(3.6). Para isso, é conveniente

124
introducir a coordenada χ usando r = σ(χ), onde a função σ vem definida por

 sin χ para  = 1,
σ(χ) = χ para  = 0,
sinh χ para  = −1.

Em função da nova coordenada χ, a Eq.(3.6) se escreve

ds2 = dt2 − a2 (t) dχ2 + σ 2 (χ) dθ2 + sen2 θdφ2 .


 
(3.7)

Um cálculo direto permite obter as curvaturas contraidas Rµν :



R00 = +3 ,
a
 2
ä ȧ 2 σ 00
R11 = +2 − ,
a a a2 σ
 2 "  0 2 #
00
ä ȧ 1 σ σ 1
R22 = +2 − 2
+ − ,
a a a σ σ σ
R33 = R22 . (3.8)

As demais componentes são identificamente nulas. O escalar R de curvatura é dado


por

R = R00 + R11 + R22 + R33


" 2
#
ä ȧ2 2 2σ 00 σ 0 1
= 6 +6 2 − 2 + 2 − 2 . (3.9)
a a a σ σ σ

(3)
Chamando R o escalar de curvatura do 3-espaço t=constante, temos
" #
00 02
(3) 2σ σ 1
R ≡ (−2) + 2 − 2 ,
σ σ σ
1 (3)
e pondo  ≡ 6
R temos3
ä ȧ2
 

R=6 + + . (3.10)
a a2 a2
Podemos então obter as componentes
1
Gµν ≡ Rµν − Rδ µν .
2
As únicas não-nulas, são:
 2
ȧ 
G00 = −3 − 3 2, (3.11)
a a
 2
ä ȧ 
G11 = −2 − − 2, (3.12)
a a a
 2
ä ȧ 
G22 = G33 = −2 − − 2,
a a a
(3.13)
3 (3)
Um cálculo direto mostra que, partindo da definição de R, temos que  = +1, 0, −1.

125
Desvio para o Vermelho

A propagação de um foton é dada pelo elemento de linha ds = 0. Para um raio


luminoso radial (dθ = dφ = 0) temos, na métrica de Friedman:

dt dr
= ±√ .
a(t) 1 − r2
O sinal depende do sentido da direção de propagação do fóton. Integrando esta ex-
pressão desde um tempo te (tempo de emissão) até um tempo t0 (tempo de observação),
temos: Z t0 Z re
dt dr
= √ = f (re ).
te a(t) 0 1 + r2
Consideremos um segundo raio luminoso que começa a sua trajetória um pequeno
intervalo de tempo após o primeiro (t02 = te + ∆te ). Este segundo raio chegará até nós
no tempo t0 + ∆t0 , onde
Z t0 +∆t0
dt
= f (re ),
te +∆te a(t)
onde a função f (re ) é a mesma nos dois casos, devido a que r é uma coordenada
comovente, e tanto a fonte quanto o observador se movem com o fluido cosmológico.
Subtraindo essas expressões, a considerando as aproximações ∆t0 << t0 e ∆te << te ,
temos
∆t0 ∆te
= .
a(t0 ) a(te )
Se νe é o comprimento de onda da radiação emitida e ν0 é o comprimento de onda
observado, temos
λe ∆te a(te )
= = .
λ0 ∆0 a(t0 )
Considerando o desvio espectral medido por z

λ0 − λe
z≡ ,
λ0
temos
a(t0 )
1+z = .
a(te )
Um desvio para o vermelho implica que a função a(t) é crescente: o Universo se
encontra em expansão. Este é precisamente o desvio medido por E. Hubble em 1929
(veja a Seção 2.2.3).

Horizontes

Dado que existe uma velocidade limite para a propagação de qualquer partı́cula,
devemos considerar o problema seguinte: quais pontos podem enviar sinais luminosas
tais que possam ser recebidas por qualquer observador até o tempo arbitrário t? Us-
ando novamente a função f (r), dada por
Z r
dr0
f (r) = √ ,
0 1 + r02

126
a distancia real entre a origem espacial e uma partı́cula situada em r1 , no tempo t, é
dada por Z r1
dr0
`(t) = a(t) √ ,
0 1 + r02
isto é,
`(t) = a(t)f (r1 ).
A partir da métrica de RW dada na eq.(3.6), o movimento de um fóton emitido
radialmente (dθ = dφ = 0) em direção à origem (isto é, em direção á posição do
observador) é descrito por
t r
dr0
Z Z
dt
=− √ ,
te a(t) re 1 + r02

onde te é o tempo de emissão de um fóton situado no ponto de coordenada re . Daı́,


t re r
dr0 dr0
Z Z Z
dt
= √ − √ .
te a(t) 0 1 + r02 0 1 + r02

Segue então que


Z t
dt
f (r) = f (re ) − .
te a(t)
Vamos supor que a integral no tempo é limitada, isto é,
Z ∞
dt
< ∞,
te a(t)

e converge para o valor finito f0 . Logo, para cada valor do tempo, digamos t0 , existe
uma distância r0 tal que
f (r0 ) = f0 ,
isto é, tal que o fóton emitido em r0 no instante t0 atinge a origem (o observador ali
colocado) em um tempo infinito. Com efeito,
Z ∞
dt
f (r) = f (r0 ) − = f (r0 ) − f0 = 0.
t0 a(t)

Fótons emitidos no instante t0 , e afastados da origem por uma distância f (r) > f (re )
nunca serão observados pelo observador situado na origem. Dessa maneira, f (r0 ) = f0
define uma região chamada horizonte de eventos, pois ela separa eventos observáveis
de eventos para sempre inobserváveis.
Um exemplo de Universo onde esse fenômeno ocorre é dado pela geometria de de
Sitter, cujo elemento de linha pode se escrever como:

ds2 = dt2 − eHt (dx2 + dy 2 + dz 2 ) .

Neste caso, com H = constante,



e−Ht0
Z
dt eHt = = Σ0 .
t0 H

127
Voltemos agora nossa atenção para fenômenos já observados desde a origem dos tempos
(t = 0), ate um dado valor t0 . Um fenômeno arbitrário terá sido observado por um
observador se a distância f (r) se anulou. Temos agora
Z t0
dt
f (r) = f (re ) − .
0 a(t)
Rt
Em t = t0 , as partı́culas afastadas da origem por um valor f (re ) > 0 0 dt/a(t) ainda
não foram observadas (pelo observador na origem).
Rt
A região definida pelo valor f0 = 0 0 dt/a(t) caracteriza, como a expressão análoga
anterior, um horizonte, chamado horizonte de partı́culas. À medida que o tempo passa,
mais e mais partı́culas vão sendo observadas. Se todas serão observadas, isto é, se
Rconheceremos

no futuro toda a região espacial para um dado t, depende do valor de
0
dt/a(t) ser convergente ou não.

3.3 Quantidades Cinemáticas


Até aqui estudamos somente as caracteristicas geometricas do universo FLRW. Para
estudar a fonte de matéria que gera esta geometria é preciso caracterizar de forma
precisa o campo de velocidades associado à matéria.

Tensor de Projeção

Seja v µ um campo vetorial do tipo tempo definido sobre uma variedade espaço-
tempo M4 . Em cada ponto P de M4 , ele determina um sub-espaço tri-dimensional
constituido de vetores ortogonais ao campo de velocidades normalizado v µ :

vµ vν g µν = 1 (3.14)

Se identificarmos este campo vetorial com uma classe de observadores movendo-se com
esta velocidade, o sub-espaço H, determinado pelo conjunto de vetores ortogonais a
v µ , constitui o que chamamos simplesmente ”espaço” - verdadeiramente o tri-espaço
associado ao observador correspondente. Construiremos o tensor hµν de projeção no
tri-espaço H, pela expressão
hµν ≡ gµν − vµ vν . (3.15)
Esse tensor projeta objetos geométricos, como tensores, por exemplo, definidos em M4 ,
no sub-espaço H perpendicular à v µ . É simples mostrar que hµν tem as caracterı́sticas
de um projetor. Com efeito, ele satisfaz as propriedades:

(i) h2 = h. Segue da própria definição

hαβ hβν = (gαβ − vα vβ )(g βν − v β vν ) = gαν − vα vν = hαν .

(ii) h é perpendicular a v µ :. Temos

hαβ v β = gαβ v β − vα vβ v β = 0.

128
Note ademais que hµν é simétrico:

hµν = hνµ .

Podemos então identificar o tensor hµν com a métrica induzida em H pela geome-
tria de M4 . Um observador de velocidade ~v , localizado em um dado ponto P de M4
de coordenadas xα (P ) mede a sua distância a um ponto Q vizinho, de coordenadas
xα (P ) + ∆xα pela forma:

ds2 (P Q) = gµν dxµ dxν = hµν dxµ dxν + (vµ dxµ )2 (3.16)

A distância de P a Q separa-se em uma parte puramente espacial d` =


(−hµν dxµ dxν )1/2 e um intervalo de tempo dt = vµ dxµ . Assim, hµν determina sobre
H uma afinidade métrica (3) Γαµν [6]
(3)
Definimos o operador ∇µ que atua em H segundo a expressão
(3)
∇µ Wλ ≡ hαµ hλ β ∇α Wβ .

Tal operação gera um tensor Bµλ ≡(3) ∇µ Wλ que pertence a H. Com efeito, v λ Bµλ = 0
e também v µ Bµλ = 0 .
Um cálculo simples permite mostrar que a conexão (3) Γαµν está associada à métrica hµν
no tri-espaço H, pois
(3)
∇µ hβν = 0.
Com efeito, temos
(3)
∇µ hβλ = hµα hβσ hλρ ∇α hσρ = −hµα hβσ hλρ ∇α (Vσ Vρ ) = 0.

Parâmetros Óticos

Para descrever a matéria contida no universo precisamos escolher um referencial.


Uma escolha conveniente é o referencial em movimento com o fluido cosmológico. Ver-
emos a seguir que a derivada covariante de v µ 4 pode ser decomposta em termos das
quantidades que caracterizam o fluido: a expansão, a vorticidade, e o shear (cisal-
hamento). Consideremos um conjunto de curvas Γ que interceptam H na vizinhança
de um ponto arbitrário P de H. Iremos calibrar os valores do parâmetro afim si sobre
cada curva de tal modo a que em H os valores desses parâmetros - que chamaremos de
tempo próprio - coincidam. Chamamos vetor conexão, e denotamos por ~η , o vetor que
liga duas curvas da congruência Γ com o mesmo valor de s. No caso acima, ~η consiste
em um vetor pertencente a H. Podemos estender esta definição e considerar o vetor
conexão como aquele que une duas curvas com o mesmo valor do parâmetro afim s,
sem impor necessariamente a condição de que tal vetor seja ortogonal às curvas. É
possı́vel mostrar que a velocidade de afastamento dos pontos P e P + dP em H é dada
por [7]
α
v(rel) = Qαµ η µ ,
onde o tensor Qαµ vem definido pela expressão

Qαµ = hαβ hµλ v β;λ .


4
Lembre que v µ é o vetor tangente à linha mundo das ”partı́culas de fluido”.

129
Usando o teorema de decomposição de tensores em partes irredutı́veis, podemos escr-
ever
θ
Qαβ = hαβ + σαβ + ωαβ , (3.17)
3
onde σαβ é tensor simétrico de traço nulo e ωαβ tensor anti-simétrico. Segue que
1 1
ωαβ = (Qαβ − Qβα ) = h[αµ hβ]λ vµ;λ , (3.18)
2 2
1 µ λ 1
σαβ = h h vα;λ − θhαβ , (3.19)
2 [α β] 3
θ = hαλ vα;λ = v α ;α . (3.20)

Vemos que os tensores σµν e ωµν pertencem a H. Com efeito, das definições acima
segue que σµν v µ = 0, e ωµν v µ = 0 Podemos então escrever
θ
hαβ hµλ vα;µ = hβλ + σβλ + ωβλ . (3.21)
3
Desenvolvendo o lado esquerdo temos

(δ αβ − v α vβ )(δ µλ − v µ vλ )vα;µ = δ αβ δ µλ − δ αβ v µ vλ − v α vβ δ µλ + v α v µ vβ vλ vα;µ




= vβ;λ − v̇β vλ − vα;λ v α vβ + v̇α v α vβ vλ .

Levando em conta que vα;λ v α = 0, temos que

hαβ hµλ vα;µ = vβ;λ − v̇β vλ , (3.22)

onde o ponto significa derivação na direção vα :

v̇β ≡ vβ;α v α .

O modelo descrito pela métrica (3.7)) é isotrópico, irrotacional, e apresenta expansão,


já que o fluido de matéria que lhe dá origem possui σµν = 0, ωµν = 0 e θ 6= 0. Estas
propriedades podem ser demonstradas do seguinte modo. Consideremos um observador
comovente com o fluido, isto é, tal que no sistema de coordenadas (t, χ, θ, φ) seu vetor
velocidade tenha componentes
v µ = δ µ0 (3.23)
Definimos anteriormente o projetor no tri-espaço ortogonal a v µ como

hµν = gµν − vµ vν .

Da expressão (3.19) temos


1 θ
σαβ = h(αµ hβ)λ Vµ;λ − hαβ ,
2 3
isto é,
1 θ
σαβ = − h(αµ hβ)λ Γεµλ Vε − hαβ ,
2 3
ou seja
σµν = 0. (3.24)
Isso significa que para o observador co-movente v µ = δ µ0 o Universo de Friedmann é
isotrópico.

130
Propagação das Quantidades Cinemáticas

Vamos examinar as equações de evolução dos parâmetros θ, σµν e ωµν ao longo da


congruência Γ. Da definição do tensor de curvatura, temos

vα;β;γ − vα;γ;β = Rαεβγ v ε .

Multiplicando por v γ temos:

(vα;β )· − vα;γ;β v γ = Rαεβγ vεv γ .

Mas,

vα;γ;β v γ = (vα;γ v γ );β − vα;γ v γ ;β =


= (v̇α );β − vα;γ v γ ;β ,

ou, definindo v̇α ≡ aα , escrevemos:

(vα;β )· − aα;β + vα;γ v γ ;β = Rαεβγ v ε v γ .

Projetando no espaço H, tem-se:

hαµ hβν (vµ;ν )· − hαµ hβν aµ;ν + hαµ hβν vµ;γ v γ ;ν = Rµενγ v ε v γ hµα hνβ , (3.25)

ou, usando (12) e a definição (8) de Qαµ :

hαµ hβν (Qµν +aµ vν )· −hαµ hβµ aµ;ν +hαµ hβν (Qµγ +aµ vγ )(Qγν +aγ aµ ) = Rαεβγ v ε v γ . (3.26)

Daı́,

hαµ hβν Q̇µν + aµ aν hαµ hβν − hαµ hβν aµ;ν + +hαµ hβν Qµγ Qγν + hαµ hβ aµ vγ Qγν = Rαεβγ v ε v γ .
(3.27)
µ
Lembrando que aµ Q ν = 0, obtemos finalmente,

hαµ hνβ Q̇µν + aα aβ − hαµ hνβ aµkν + Qαγ Qγβ = Rαεβγ v ε v γ . (3.28)

Essa expressão contém toda informação necessária para a obtenção da evolução


dos parâmetros cinemáticos. A seguir apresentaremos a equação de evolução de θ,
deixando as outras para o apêndice.

Equação de Evolução de θ

Contraindo a equação (3.28) nos ı́ndices α e β, tem-se

hµν Q̇µν + aα aα − hµν aµkν + Qαµ Qµα = Rµν V µ v ν .

Mas

hµν Q̇µν = (hµν Qµν )· − ḣµν Qµν


= (Qµµ )· + aµ v ν Qµν + aν v µ Qµν = (Qµµ )· .

Lembrando a expressão de Qµν , temos

Qαβ = hαµ hβν vµ;ν ,


Q = Qαβ g αβ = hµν vµ;ν = v µ ;µ − v µ v ν vµ;ν = v µ ;µ ,

131
isto é, Q = θ Daı́, temos

θ̇ + aµ aµ − aµkµ + aµ;ν v ν v µ + Qαµ Qµα = Rµν v µ v ν .

Mas
  
µα θ θ µα
Qαµ Q = hαµ + σαµ + ωαµ h + σ µα + ω µα =
3 3
θ2
= + σµα σ µα + ωαµ ω µα .
3
Definiremos as normas σ 2 , ω 2 :
1
σ2 ≡ σµν σ µν ,
2
1
ω2 ≡ ωµν ω µν .
2
Daı́,
θ2
Qαµ Qµα = + 2σ 2 − 2ω 2 .
3
Então
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ + ȧµ v µ + aµ aµ = Rµν v µ v ν .
3
Mas,
ȧµ v µ = (aµ v µ )· − aµ aµ = −aµ aµ .
Tem-se, finalmente:
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ = Rµν v µ v ν . (3.29)
3
A equação (3.29) determina a evolução do parâmetro θ ao longo da curva e é conhecida,
em Cosmologia, como equação de Raychaudhuri. Ela pode ser usada para demostrar
que o universo descrito pela solução de Friedman é singular, assumindo a validade de
algumas hipóteses, como por exemplo a chamada condição de energia forte, dada por
ρ+3p > 0. É importante notar que a inevitabilidade da existência de uma singularidade
inicial tem sido contestada em diversas ocasiões ao longo da história da cosmologı́a.
De fato, existem modelos que não apresentam singularidade (veja mais adiante).

3.4 Fontes da Curvatura do Espaço-Tempo


Uma das questões mais fundamentais em Cosmologia consiste em procurar estab-
elecer as propriedades do fluido cósmico responsável pela curvatura do espaço-tempo
global. A existência de processos dinâmicos e a própria dependência com o tempo
cósmico das propriedades globais do Cosmos sugerem a caracterização de distintas
épocas na história do Universo. Cada uma dessas épocas está associada a um partic-
ular tipo de conteúdo material que domina sobre os demais sendo assim o principal
responsável, naquele perı́odo, pela curvatura do espaço-tempo. Embora a caracter-
ização final dessas épocas não tenha sido estabelecida definitivamente, podemos com
boa aproximação distinguir algumas fases no Universo representadas por distribuições
especı́ficas da energia.

132
Nesta Seção apresentaremos a teoria geral do fluido cósmico, bem como estudaremos
a expressão da energia gerada por campos escalar, vetorial, etc., em um espaço de
Riemann arbitrário. Deixaremos a discussão da caracterização das diversas fases do
nosso Universo para outro lugar.

Decomposição do tensor energia-momento

Consideremos o vetor v µ do tipo-tempo normalizado

v µ v ν gµν = +1.

Utilizando essa velocidade, podemos separar o tensor de energia-momento (simétrico)


do fluido, Tµν em suas partes irredutı́veis:

Tµν = ρvµ vν − phµν + qµ( vν) + πµν , (3.30)

onde (ρ) é a densidade de energia total do fluido, (p) é a pressão isotrópica, (q µ )


representa a propagação de calor, e πµν é a pressão não isotrópica. Tal decomposição
de Tµν não se limita a um fluido especial mas pode ser realizada indistintamente
para qualquer configuração, mesmo se estivermos tratando com campos de radiação.
Adiante mostraremos como realizar essa decomposição para campo eletromagnético,
escalar, etc.
Os tensores qµ e πµν satisfazem os vı́nculos

qµ v µ = 0,
πµν v µ = 0,
πµν g µν = 0,
πµν = πνµ .

A partir destas propriedades obtemos da equação (3.30)


1
ρ = Tµν v µ v ν ; p = Tµ· ν hµν ;
3
qλ = Tαβ v β hαλ ; πµν = Tαβ hαµ hβν + phµν .

Conservação da Energia

A expressão co-variante da conservação local de energia, se escreve

T µν;ν = 0. (3.31)

Vamos projetar essa equação vetorial, paralela e ortogonalmente ao vetor v µ obtendo


dessa forma as equações da variação da densidade de energia com o tempo (medido
como parâmetro ao longo da trajetória do observador de velocidade v µ ), e a gen-
eralização para o espaço de Riemann da equação de Navier-Stokes. Multiplicando a
equação (3) por vµ e substituindo a forma geral (1), temos

(ρv µ v ν );ν vµ − (phµν );ν vν + (q µ v ν + q µ v ν );ν v µ + π µν;ν vµ = 0.

Desenvolvendo por partes, temos:

(ρv µ v ν );ν vµ = ρ̇ + ρθ,

133
onde
ρ̇ ≡ v µ ∂µ ρ ,
(phµν );ν vµ = −pθ,
(q µ v ν + q ν v µ )kν vµ = q̇ µ vµ + q νkν + q ν v µkν vµ = q̇ µ vµ + q µkµ ,
Pois, temos
v µ;µ vµ = 0.
E o quarto termo dará

π µν;ν vν = (π µν vµ );ν − π µν vµ;ν


= −π µν σµν . (3.32)

Colectando os diferentes termos, tem-se a equação de conservação de energia:

ρ̇ + (ρ + p)θ + q̇ µ vµ + q µ;µ − π µν θµν = 0. (3.33)

Vamos agora projetar a equação (3) no 3-espaço ortogonal a v µ (o espaço H, conforme


Seção 3.3).
T µν;ν hµα = 0.
Por partes, temos

(ρv µ v ν );ν hµα = ρv̇ µ hµα = ρv̇α ,


− (phµν );ν hµα = −p,ν hνα + pv̇α ,
(q µ v ν );ν hµα = θqα + q̇ µ hµα
(q µ v µ );ν hµα = q ν θνµ + q ν ωαν
π µν;ν hµα = πα;νν
+ π µν θµν vα . (3.34)

Coletando os termos teremos

(ρ + p)v̇α − p,µ hµα + q̇µ hµα + θqα + q ν θαν + q ν ωαν + πα;ν


ν
+ π µν σµν vα = 0. (3.35)

As equações (3.33) e (3.35) constituem a expressão da lei de conservação de energia e


momento e serão utilizadas amplamente a seguir. Particular ênfase será dado a fluidos
perfeitos, isto é, àqueles em que a pressão é isotrópica (πµν = 0), e não há fluxo de
calor (qα = 0), isto é, quando pudermos escrever:

Tµν = ρvµ vν − phµν . (3.36)

Neste caso, as leis de conservação (3.33) e (3.35) reduzem-se às formas simples:

ρ̇ + (ρ + p)θ = 0, (3.37)
p,µ hµα = 0. (3.38)

A primeira equação é conseqüência da aplicação da primeira lei da termodinâmica

T dS = dE + pdV,

ao caso do universo descrito pela métrica de Friedman, para o qual o volume é pro-
porcional à a(t)3 , e a expansão é adiabática (S =constante).

134
Na investigação de um modelo idealizado capaz de representar o fluido cósmico, somos
levados a considerar equações de estado que estabelecem dependência funcional da
pressão com a densidade de energia. Supondo uma equação de estado barotrópica,
p = p(ρ) em particular, consideraremos dependência linear de p com ρ:

p = λρ,

com o valor de λ limitado ao domı́nio 0 < λ < 1. O valor λ = 0 corresponde à matéria


incoerentemente distribuida (p = 0) e o limite λ = 1 é dado pela condição de que a
velocidade do som  
∂p
Vs =
∂ρ S=constante
não pode exceder à velocidade de luz (c = 1).
Vamos agora fazer um exercı́cio para esclarecer o papel do observador na expressão
da equação de estado de um fluido. Consideremos um fluido perfeito caracterizado por
(ρ, p) para um dado observador v µ com p = λρ e por ρe, pe, com pe = λ
e ρe para um outro
µ
observador ve . Pergunta: em que circunstâncias o valor de λ não muda? Antes de
responder a esta questão consideremos o caso genérico de transformação. Temos para
o observador v µ a expressão

Tµν = (ρ + p) vµ vν − pgµν , (3.39)

onde
ρ = Tµν v µ v ν ,
e
1
Tµν (g µν − v µ v ν ).
p=
3
Um segundo observador, com velocidade veµ decompõe o mesmo tensor momento-
energia sob a forma
ρ + pe) veµ veν − pegµν ,
Tµν = (e (3.40)
onde
ρe = Tµν veµ veν ,
e
1
pe = Tµν (g µν − veµ veν ).
3
A questão que queremos responder envolve a relação entre λ e λ e onde p = λρ e pe = λe
eρ.
Temos a relação
(ρ + p) vµ vν − pgµν = (e
ρ + pe) veµ veν − pegµν (3.41)
Multiplicando por veµ veν e definindo β ≡ v µ veµ obtemos

ρe = β 2 − β 2 λ − λ ρ

(3.42)

isto é
1 2
β λ − β 2 + 1 − 2λ ,

pe = (3.43)
3
Finalmente
2 2
e = 1 β λ − β + 1 − 2λ .
λ (3.44)
3 β 2 − β 2λ − λ

135
Podemos agora responder à pergunta anterior sobre qual o valor de λ para o qual
qualquer observador atribui o mesmo valor. Segue desta expressão acima que isso
ocorre para λ = − 1. Um tal fluido com a equação de estado p = −ρ é chamado
de vácuo. Em 1917, Einstein modificou as equações da RG adicionando um termo
proporcional à métrica:
1
Rµν − gµν R + Λgµν = Tµν , (3.45)
2
onde Λ é a constante cosmológica.
O que dizer sobre a parte material? Qualquer fluido pode ser caracterizado por uma
densidade de energia, uma pressão isotrópica, pressões anisotrópicas e fluxo de calor.
Com a suposição de isotropia, pressões anisotrópicas e fluxo de calor (que indicaria
uma direção privilegiada) não devem existir. A hipótese de homogeneidade implica
que tanto a densidade de energia quanto a pressão isotrópica devam ser funções só do
tempo, denotadas a partir de agora por ρ(t) e p(t), respectivamente. Atualmente, as
partı́culas que formam esse fluido seriam aglomerados de galáxias com pouca interação
entre si, e portanto pressão praticamente nula. Na situação onde as escalas de distância
são bem menores, quando não existem gláxias mas partı́culas fundamentais e radiação
em equilı́brio térmico, a pressão seria relevante. Sendo ela dada, aproximadamente, por
p = ρ < v 2 > /3c, onde < v 2 > representa o valor médio do quadrado das velocidades
dos constituintes do fluido e c a velocidade da luz, terı́amos que, em situações de alta
temperatura onde tais partı́culas teriam velocidades próximas da velocidade da luz,
p ≈ ρ/3 (correções relativı́sticas não alteram este resultado), muito próximo de um
gás de fótons, onde p = ρ/3 exatamente.
Qual a relação entre a densidade de energia e o fator de escala para o caso de poeira
e radiação? Para a poeira, se há conservação de massa, então ρ x volume ∝ ρa3 =cte.
Para radiação, se há conservação do número de fótons com frequência ν, N (ν) =cte.
(hipótese bastante razoável na maior parte da história do Universo), teremos que
ρ(ν) = N (ν)hν/volume, onde hν é a energia de um fóton de frequência ν (h é a
constante de Planck). Mas o comprimento de onda de um fóton é diretamente propor-
cional ao fator de escala (como segue da Eq.2.2), e portanto a sua frequência e energia
inversamente proporcional a este. Assim, ρa4 = cte. Concluindo temos, para poeira
ρp = cp /a3 e para radiação ρr = cr /a4 , onde cr e cp são constantes. Estas relações
poderiam ter sido obtidas a partir da equação relativı́stica de conservação de energia
numa geometria dada pela Eq.(3.6)

ρ̇ + 3 (ρ + p) = 0, (3.46)
a
substituindo-se na mesma as equações de estado p = 0 e p = ρ/3, correspondentes à
poeira e radiação, respectivamente. No caso de uma equação de estado geral, dada por
p = ωρ, com ω arbitrario, a equação (3.46) pode ser integrada, dando como resultado
ρa3(1+ω) = const. (3.47)

3.5 Modelos Cosmológicos


Vamos considerar a geometria de Friedman e estudar as diferentes possibildades de
evolução do fator de escala a(t) para diferentes formas do tensor de energia-impulso.
Das equações de Einstein,
Gµν = −Tµν ,

136
e das expressões (3.13) e (3.36) seguem as equações
 2
ȧ 3ε
3 + 2 = 8πGρ + Λ, (3.48)
a a
ä 4πG Λ
=− (ρ + 3p) + , (3.49)
a 3 3
já exibidas no Capı́tulo 2. Junto com estas podemos considerar a conservação da
energia, dada na eq.(3.46). Da identidade de Bianchi

Gµν;ν ≡ 0,

segue que estas três equações não são independentes. Quando a constante cosmológica
Λ é nula, podemos caracterizar a seção espacial do modelo cosmológico, através de
uma medida da densidade de energia contida no Universo. Com efeito, temos (quando
Λ = 0)
8πGρ 2
= a − ȧ2 . (3.50)
3
Definindo uma densidade critica ρc pela relação
 2
3 ȧ 3H 2
ρc = ≡ , (3.51)
8πG a 8πG
podemos escrever (3.50) sob a forma
a2
= (ρ − ρc ) . (3.52)
3
Vemos desta equação que o sinal de ρ − ρc implica em tres possibilidades:

ρ > ρc =⇒  > 0 =⇒  = 1,
ρ = ρc =⇒  = 0,
ρ > ρc =⇒  < 0 =⇒  = −1.

onde a normalização da constante  é simplesmente uma questào de convenção. A


densidade crı́tica ρc caracteriza assim uma situação limite.

3.5.1 Modelo Cosmológico de Einstein


A proposta de descrição do universo por Einstein (1917) partiu da hipótese
apriorı́stica de que o universo é estático. A matéria, fonte principal da curvatura
do espaço-tempo quadri-dimensional é descrita por um fluido incoerente (isto é, sem
qualquer interação entre suas partes) de densidade ρ e velocidade v µ = δ µ0 em um
sistema de coordenadas co- movente com o fluido. O universo de Einstein não pos-
sui nem rotação, nem expansão, nem deformação. Ele é estático. Não tem começo
nem fim, não evolui. Vamos descrevê-lo começando por mostrar que um universo com
tais caracterı́sticas é incompatı́vel com as equações originais (1915) de Einstein da
gravitação.
Com efeito, a equação de Raychaudhuri (3.29) para um fluido sem aceleração, sem
deformação, sem rotação e sem expansão se reduz a

Rµν v µ v ν = 0. (3.53)

137
A partir das equações de Einstein
1
Rµν = −Tµν + T gµν , (3.54)
2
temos que
1
Rµν V µ V ν = −Tµν V µ V ν +
T.
2
Para um fluido perfeito, sem pressão, o tensor momento-energia assume a forma

Tµν = ρVµ Vν = ρ δµ0 δν0 .

Dai
ρ
Rµν v µ v ν = − ,
2
que é incompatı́vel com a eq. (3.53), mostrando que as propriedades cinemáticas im-
postas a priori para o fluido cósmico no modelo de Einstein são incompatı́veis com
uma densidade de matéria diferente de zero. Para identificar tal modelo como rep-
resentativo do nosso cosmos, Einstein foi levado a alterar suas equações originais da
gravitação com a introdução de uma constante cósmica fundamental que foi repre-
sentada pela letra grega Λ. Assim, as equações que descrevem a gravitação a longas
distâncias deveriam ser distintas das equações gravitacionais em nossa vizinhança, isto
é, para distâncias não-cósmicas (por exemplo no Sistema Solar). O modo mais simples
de alteração das equações originais de Einstein conduziu à expressão:
1
Rµν − Rgµν + Λgµν = −Tµν , (3.55)
2
onde Λ tem dimensão de (comprimento)−2 . Equivalentemente, escrevemos:
1
Rµν = −Tµν + T gµν + Λgµν . (3.56)
2
Note que para que a energia se conserve (isto é, para que a divergência covariante de
Tµν se anule, T µν;ν = 0) é preciso que Λ seja uma constante. Com a nova expressão eq
(3.56) tem-se  
1
Tµν − T gµν − Λgµν v µ v ν = 0,
2
isto é,
ρ = 2Λ , (3.57)
mostrando assim a possibilidade de compatibilização das novas de equações de
gravitação com um fluido estacionário. A metrica da geometria de Einstein é dada
por
ds2 = dt2 − a2 dχ2 + σ 2 (χ) dθ2 + sen2 θdφ2 ,
 
(3.58)
onde a é uma constante e σ(χ) uma função, a única a ser determinada para o conheci-
mento completo desta geometria. Usando as equações (3.8),(3.9), e seguintes obtemos,
da equação (3.55), Componente (0 − 0) :
3
= 8πGρ + Λ. (3.59)
a2
Componente (1 − 1) :  00 
1 σ
2 + 3 = Λ. (3.60)
a2 σ

138
Componente (2 − 2) :
1 σ 00
= −Λ. (3.61)
a2 σ
Destas equações seguem os resultados

σ = senχ, (3.62)
1
Λ = 2. (3.63)
a
(3)
Usando esses valores na definição da curvatura espacial R,

(3) σ 00 2 σ02
R=4 − 2 + 2 2 = 6,
σ σ σ
encontramos
 = 1,
e de (3.59) a relação encontrada anteriormente:
Λ
ρ= .
4πG
Assim, a positividade da energia implica que Λ deve ser uma quantidade positiva.
Finalmente, a métrica de Einstein se escreve:
1 2
ds2 = dt2 − dχ + sen2 χ dθ2 + sen2 θdφ2 .

(3.64)
Λ
O domı́nio das variáveis é dado por −∞ < t < +∞; 0 < χ < π; 0 < θ < π;
0 < φ < 2π. É fácil ver que o volume do universo de Einstein é independente do
tempo e dado por V = 2π 2 Λ−3/2 .

3.5.2 Modelos Cosmológicos de Lemaı̂tre


Por volta de 1920, o belga G. Lemaı́tre estudou modelos cósmicos homogêneos e
isotrópicos nos quais a constante cosmológica Λ é não nula. Vamos examinar aqui
algumas propriedades desses modelos.
Começamos por considerar o caso no qual a densidade de energia da matéria é de-
sprezı́vel, comparada com o valor de Λ. As equações de Einstein neste caso se escrevem
 2
ȧ 3
3 + 2 = −Λ, (3.65)
a a
 2
ä ȧ 1 σ 00
+ + 2 = −Λ. (3.66)
a a a σ
Analisemos separadamente os três possı́veis valores de ε.

Caso I: Seção Euclideana (ε = 0; σ = χ). Temos, neste caso:


 2

3 = −Λ, (3.67)
a
 2
ä ȧ
3 + = −Λ. (3.68)
a a

139
De (3.67) vemos que o modelo sera compatı́vel se Λ < 0. As equações (3.67) e (3.68)
são facilmente integráveis. Obtemos
√ Λ
a(t) = a0 e − 3 t. (3.69)
Neste caso, a expansão θ = 3ȧ/a se reduz a uma constante:

θ = −2Λ.
Esta geometria foi descoberta por de Sitter em 1917, e constituiu durante bastante
tempo um modelo cosmológico competitivo com os modelos expansionistas de Fried-
man.

Caso II: Seção Aberta (ε = −1; σ = senχ). A solução do sistema de equações neste
caso, dado por
 2
ȧ 3
3 − 2 = −Λ,
a a
 2
ä ȧ 1
2 + − 2 = −Λ,
a a A
depende do sinal da constante cosmológica. Se Λ < 0, temos:
s r !
3 |Λ|
a(t) = sinh t ,
|Λ| 3
e, consequentemente "r #
p |Λ|
θ = 3|Λ| coth t .
3
Se Λ > 0, a solução para a(t) é dada por
r r !
3 Λ
a(t) = sen t ,
Λ 3
e para a expansão: "r #
√ Λ
θ= 3Λ cot g t .
3
Caso III: Seção Fechada (ε = 1; σ = senχ). Temos as equações:
 2
ȧ 3
3 − 2 = −Λ,
a a
 2
ä ȧ 1
2 + − 2 = −Λ.
a a a
A solução é dada par s r !
3 |Λ|
a(t) = sinh t .
|Λ| 3
Note que como consequência da equação
 2
ȧ 3
3 − 2 = −Λ
a a
a constante cosmológica, neste caso, não pode ser positiva.

140
3.5.3 Modelo cosmológico de Friedman
Como vimos anteriormente, o conteúdo material do univeso pode ser modelado usando
um fluido perfeito. As equações de Einstein, dadas por Gµν = 8πGTµν para a métrica
de Friedman e tendo um fluido perfeito como fonte, incluindo a constante cosmologica,
são dadas por:  2
ȧ  8πG
+ 2 = ρ, (3.70)
a a 3
4  p
ä = − πG ρ + 3 2 a, (3.71)
3 c
onde ρ e p são a densidade de energia e a pressão totais (incluindo a constante cos-
mológica). Conforme discutido anteriormente, distingue-se três periodos distintos na
evoluç ao do universo, caracterizados por diferentes fontes da curvatura. Primeira-
mente, consideraremos uma fase de radiação na qual p = 1/3 ρ), em seguida uma
fase de poeira ou matéria incoerente onde p = 0, e finalmente uma fase de expansão
acelerada, causada pela “energia escura”. Nas considerações que seguem modelare-
mos a fase atual usando a constante cosmológica como energia escura. Somando estas
contribuições podemos escrever
 2
8πG ρ0m ρ0r
 
ȧ  Λ
+ 2 = + 4+ , (3.72)
a a 3 a3 a 8πG
onde ρ0m e ρ0r são a densidade de matéria e radiação em algum momento da evolução .
Definindo as quantidades
ρm
Ωm = ,
ρc
ρr
Ωr = ,
ρc
Λ
ΩΛ = , (3.73)
8πGρc
podemos escrever
8πGa2 ρc
= (Ωm + Ωr + ΩΛ − 1) . (3.74)
3
Assumindo uma equação de estado p = ωρ, podemos encontrar a forma genérica do
fator de escala. Como vimos em (3.47),

ρ ∝ a−3(1+ω) .

Note que para tempos pequenos, se ω > −1/3, podemos desprezar o termo /a2 frente
aos termos de matéria na equação (3.70) e ao termo da constante cosmológica. Assim,
podemos integrar a (3.70):
a(t) ∝ t2/3(1+ω) . (3.75)
No universo primitivo, podemos supor que as partı́culas são relativı́sticas, com ω =
1/3. Da (3.75),
ar (t) ∝ t1/2 .
Para tempos mais longos, é a matéria não relativı́stica quem domina o lado direito da
(3.70), com ω = 0. Supondo que  = 0 obtemos

am (t) ∝ t2/3 .

141
3.5.4 Análise geral
A equação de Friedmann (3.72) com poeira, radiação e constante cosnológica, para 
arbitrário pode ser escrita da seguinte forma:

8πG  ρ0r ρ0m  Λa2


ȧ(t)2 = + −  + . (3.76)
3 a2 a 3
Da equação acima vê-se que a radiação domina para a muito pequeno, seguida, para
a crescente, da poeira, termo de curvatura e constante cosmológica. Vejamos como
essa equação pode ser entendida como uma equação de conservação de energia.
Lembremos que no caso de uma partı́cula em movimento unidimensional, m2 ẋ2 +V (x) =
E, ou
2
ẋ2 = (E − V (x)).
m
Comparando com a (3.76), vemos que trata-se do análogo de uma partı́cula de cuja
“posição ” vem dada por a, com massa m = 1, energia E = −/2, e potencial

4πG  ρ0r ρ0m  Λa2


V (a) = − + − . (3.77)
3 a2 a 6
Analizaremos qualitativamente a variação deste potencial com a para determinar os
possı́veis comportamentos do fator de escala. Consideraremos primeiramente Λ > 0.
Para a → 0, V (a) → −∞ e para a → ∞, V (a) → −∞. Portanto, este potencial tem
um máximo. Como veremos na próxima seção, a poeira rapidamente domina sobre a
radiação. Sendo assim, podemos desprezar o termo de radiação no cálculo do máximo
deste potencial, que acontece para um valor de a grande o suficiente para que ele seja
desconsiderado. Cálculos simples fornecem a3max = 4πGcp /(Λ) e V (amax ) = −Λa2max .
Podemos expressar ρ0m em função de Ω0p e Ω0Λ , obtendo:
1/3
Ω0Λ  Ω0p 2/3
V (amax ) = − , (3.78)
|Ω0 − 1| 2
onde Ω0 ≡ Ω0Λ + Ω0p . Com os valores observados das quantidades Ω hoje, a saber,

Ω0 = 1.010+0.018
−0.017 , (3.79)

Ω0p = 0.27+0.03
−0.04 , (3.80)
e
Ω0Λ = 0.70+0.04
−0.03 , (3.81)
vemos que V (amax ) < −1. Assim, no cenário idealizado de Friedman o universo,
para qualquer que seja o valor de  o Universo se expande desaceleradamente desde a
singularidade presente neste modelo a = 0 até amax , passando então, a partir daı́, a se
expandir aceleradamente. De fato, é este tipo de comportamento que as observações
vêm indicando. Para este modelo, a idade do Universo seria dada por (veja Exerı́cio)
1/2
2 −1 −1/2 h 1 + Ω0Λ i
t0 = H0 Ω0Λ ln 1/2
, (3.82)
3 1 − Ω0Λ

Segue então, para Ω0Λ = 0.69 e h = 0.66, um valor de t0 de 14.5 bilhões anos.
adicionar exercicio: análise geral do potnecial (do d’inverno)

142
3.6 Modelos cosmológicos com menos simetria
Na investigação das possı́veis estruturas métricas do Universo, encontramos dois
tipos caracterı́sticos de modelos. Chamamos modelo convencional àquele que admite
como fonte principal de curvatura um fluido perfeito (incluindo o vazio); e denotamos
modelo não-convencional os demais. Não deve causar espanto o fato de que modelos
convencionais, possuindo uma fonte tão simples, tenham sido historicamente descober-
tos numa primeira fase da investigação cosmológica, e que os não convencionais tenham
história mais recente. Nesta seção trataremos dos modelos descobertos por Gödel e
Kasner.
Como foi discutido, o tensor momento-energia do fluido cósmico é descrito por:

Tµν = (ρ + p)vµ vν − pgµν , (3.83)

onde ρ é a densidade total de energia, v µ é o quadri-vetor velocidade do fluido, e p


é a pressão isotrópica. Os modelos tratados na seção anterior e os que trataremos
nesta podem ser caracterizados de um modo bastante simples através do valor dos
parâmetros cinemáticos do fluido, segundo se mostra no tabela 1.

Modelo
Cosmológico Expansão Rotação Deformação
Einstein Não Não Não
Friedmann Sim Não Não
Kasner Sim Não Sim
Gödel Não Sim Não

Tabela 3.1: Quantidades cinemáticas associadas a modelos cosmológicos.

3.7 Modelo Cosmológico de Kasner (1921)


Embora o estágio atual do nosso Universo seja bastante isotrópico, um perı́odo não-
isotrópico pode ter ocorrido na história do Cosmos. Entre os argumentos que foram
examinados nesse sentido, podemos destacar o seguinte. Vimos na Sec.(3.2) que mod-
elos homogêneos isotrópicos possuem horizonte. Isso significa que para um dado t,
diferentes regiões espaciais não poderiam trocar informações e consequentemente não
poderiam ser homogeneizadas por mecanismos fı́sicos tipo interações entre partı́culas.
Uma possı́vel saı́da dessa dificuldade seria admitir uma fase anisotrópica inicial que
(devido a processos fı́sicos a serem determinados) evoluiria no sentido de eliminação
da dilatação ou shear. Um modelo anisotrópico tı́pico foi encontrado pelo matemático
Kasner, já em 1921. Ele representa um universo idealizado no qual a participação da
matéria na criação de curvatura é desprezı́vel: a curvatura se sustenta a si própria 5 .
A métrica de Kasner se escreve sob a forma:

ds2 = dt2 − a2 (t)dx2 − b2 (t)dy 2 − c2 (t)dz 2 . (3.84)


5
Note que esta é uma propriedade exclusiva das equações não lineares.

143
Escolhendo uma base de tetradas ortonormalizadas eA
µ tal que

e0µ = δµ0

e1µ = a(t)δµ1

e2µ = b(t)δµ2

e3µ = c(t)δµ3

obtemos as componentes não-nulas da curvatura na base de tetrada:

0 ȧ
R101 =
a

0 ḃ
R202 =
b

0 ċ
R303 =
c

0 ȧ ḃ
R212 = (3.85)
ab

0 ȧ ċ
R313 =
ac

0 ḃ ċ
R313 =
bc
onde definimos as componentes das tetradas para um tensor X AB pela relação

X AB = eA B µν
µ eν X .

Contraindo,

ä b̈ c̈
R00 = +
a bc !
ä ȧ ḃ ċ
R11 = + + (3.86)
a a b c
 
2 b̈ ḃ ȧ ċ
R2 = + +
b b a c
!
c̈ ċ ȧ ḃ
R33 = + +
c c a b

As equações de Einstein para o vazio se escrevem como

RAB = 0 (3.87)

144
Kasner propôs uma solução dessas equações sob a forma de potências de t. Ponhamos

a(t) = tp1
b(t) = tp2 (3.88)
c(t) = tp3

onde pl , p2 , p3 são constantes. As únicas relações entre elas, impostas por (3.87) dão
(faça como exercı́cio)

p1 + p2 + p3 = 1 (3.89)
(p1 )2 + (p2 )2 + (p3 )2 = 1 (3.90)

Podemos observar logo que um desses pk é negativo e os outros dois positivos. Ademais,
o domı́nio deles pode ser descrito facilmente analisando-se a eq. (11). Vamos denotar
os números pk em uma ordem tal que sempre teremos p1 < p2 < p3 . Então devemos
ter para o domı́nio dos pk os valores:

1
− ≤ p1 ≤ 0
3
2
0 ≤ p2 ≤ (3.91)
3
2
≤ p3 ≤ 1
3
Note que quando (p1 , p2 , p3 ) = (0, 0, 1) a geometria se reduz ao espaço plano de
Minkowskii (faça como exercı́cio ). Vamos agora calcular os parâmetros de congruência
da geodésica v α = δ0α . (Deixamos ao leitor a demonstração de que essa curva é real-
mente uma geodésica da geometria de Kasner.) Temos, da definição da expansão θ:
α α
θ = v;α = v,α + Γαεα v ε = Γα0α
ȧ ḃ ċ (abc)·
= + + = ,
a b c abc

ou θ = V̇ /V , e definimos o volume V = abc. Calculemos agora a dilatação σij . Temos

1 θ
σµν = (Vµ;ν + Vν;µ ) − hµν (3.92)
2 3
com h11 = g11 = −a2 . Dai
ȧ 1 V̇ 2
σ11 = − a,
a 3 V
e, analogamente

ḃ 1 V̇
σ22 = − ,
b 3 V
ċ 1 V̇
σ33 = − .
c 3 V
145
Note que σ11 + σ22 + σ33 = 0, como deveria ser. Da definição de rotação , temos imedi-
atamente que:
1
ωµν = V[µ;ν] = 0.
3
Assim, a geometria de Kasner representa um Universo sem matéria (o campo grav-
itacional se auto-alimenta) com expansão distinta segundo três eixos ortogonais, isto
é, possui anisotropia, mas não apresenta rotação. A análise do comportamento do
Universo nas vizinhanças da singularidade admite duas atitudes, a saber:

(i) Admite-se que o modelo de Friedmann do Universo atual pode ser extrapolado
pare o passado sem qualquer limite.
(ii) Admite-se que o modelo de Friedmann é um estágio ulterior de um processo
inicial (eventualmente caótico) no qual todos os possı́veis comportamentos pode-
riam co -existir.

A posição (i) tradicionalista choca-se com a evidente dificuldade de representação


do ponto singular - e a total ausência de continuidade de leis fı́sicas. Os números
qua caracterizam nosso Universo (como por exemplo, o número total de Baryons
existentes,) seriam condições iniciais e estariam para sempre fora de nosso controle.
Procurar suas ”causas” não seria então tarefa para os fı́sicos. A posição (ii), menos
convencional, requer a elaboraçao de um modelo eficiente de processos fı́sicos que
conduziriam (univocamente ? ) o universo a partir de um possı́vel estágio inicial
caótico a seu estágio bem-comportado atual. Esta geometria de Kasner foi usada para
este exame. O leitor interessado pode consultar as referências ao final do texto.

3.8 Modelo de Gödel


Em 1949, K. Gödel apresenta um modelo cosmológico que viria a desempenhar um
importante papel na história da Cosmologia Relativista. Neste modelo descreve-se
um Universo contendo matéria incoerentemente distribuı́da no espaço, cujo estado
de movimento, independente do tempo, possui a propriedade de ter rotação não-
nula. Como veremos adiante, o modelo de Gödel possui propriedades particularmente
interessantes que colocam uma série de questões profundas sobre a estrutura topológica
do espaço-tempo em larga escala.
O elemento de linha da métrica de Gödel em coordenadas (t, x, y, z) se escreve

1 2cx 2
ds2 = dt2 + 2ecx dy dt + e dy − dx2 − dz 2 . (3.1)
2
Assim, o tensor métrico tem a forma matricial seguinte:

 
1 0 ecx 0
 0 −1 0 0 
gµν =
 ecx 1 2cx
 (3.2)
0 2
e 0 
0 0 0 −1

A sua inversa é dada por:

146
2e−cx
 
−1 0 0
 0 −1 0 0 
gµν =
 2e−cx
 (3.3)
0 −2e−2cx 0 
0 0 0 −1

O determinante g tem o valor dado por


√ 1
−g = √ ecx . (3.4)
2
Vamos escolher um sistema de tétradas de tal modo a podermos escrever a métrica
(1) sob a forma Minkowskiiana.

ds2 = θA θB ηAB = (θ0 )2 − (θ1 )2 − (θ2 )2 − (θ3 )2 . (3.5)

As componentes não-nulas das tetradas eA


(α) são dadas por

e0(0) = 1,
e0(2) = ecx , (3.6)
e1(1) = 1,
1
e2(2) = √ ecx ,
2
3
e(3) = 1,

As tétradas inversas, definidas por eAα eAB = gαβ são:


(0)
e0 = 1,
(0)

e2 = − 2, (3.7)
(1)
e1 = 1,
(2)

e2 = 2 e−cx ,
(3)
e3 = 1.

As curvaturas de Riemann RABCD , valem

0 c2
R101 = , (3.8)
2
0 c2
R202 = , (3.9)
2
1 c2
R212 =− . (3.10)
2
A única componente não nula do tensor de curvatura contraı́do RAB é dado por

R00 = −c2 (3.11)

Assim, o escalar da curvatura R assume a expressão

R = R00 = −c2 (3.12)

147
3.8.1 A Solução de Gödel
No modelo de Gödel, a fonte de curvatura é um fluido de densidade de energia ρ sem
pressão. No sistema de tétradas que estamos utilizando podemos escrever o tensor
momento-energia sob a forma
TAB = ρ δA0 δB0 , (3.13)
onde a velocidade vA no sistema inercial local vale vA = δA0 . A equação de Einstein
com termo cosmológico se escreve:
κ
RAB = −κ TAB + T ηAB + Λ ηAB (3.14)
2
Da componente 0 − 0 obtemos
κρ
c2 = − Λ, (3.15)
2
e da componente 1 − 1,
0 = −κρ − 2Λ. (3.16)
As demais componentes diagonais repetem a expressão de 1 − 1. Temos então que

κρ = −2Λ = c2 . (3.17)

A positividade da energia está assegurada (c2 > 0) e temos então que Λ deve ser
negativa. Para entender o significado da constante c vamos estudar as congruências
de curvas comoventes com o fluido.

Quantidades Cinemáticas

Das relações acima podemos calcular os parâmetros cinemáticos do espaço-tempo de


Gödel.

(i) Expansão: Da definição da expansão obtemos

θ=0

(ii) Deformacão: Obtemos


σAB = 0.

(iii) Rotação: Da definição dada anteriormente o único termo não-nulo é dado por

2ω 12 = −γ 012 + γ 021 = − 2 c

isto é,
c
ω12 = − √ . (3.18)
2
A
Para o vetor de rotação ω encontramos, na base de tetradas
 
A c
ω = (0, 0, 0, ω12 ) = 0, 0, 0, − √ . (3.19)
2

148
Chamando de −Ω2 a norma de ω A (lembre que ω A é um vetor do tipo espaço), teremos

c2
Ω2 = −ω A ωA = . (3.20)
2
Assim, escrevemos
ω A = (0, 0, 0, −Ω)
Esse resultado permite escrever então que vale a relação

κρ = 2Ω2 , (3.21)

isto é, a densidade de energia do espaço-tempo de Gödel é proporcional à intensidade


de sua rotação.

Sistema de Coordenadas Cilı́ndrico

Algumas das propriedades da geometria de Gödel aparecem mais evidentes quando


estudadas em um sistema de coordenadas cilı́ndrico. Vamos assim considerar a métrica
(1) no sistema (t, r, φ, z) onde o elemento infinitesimal de linha assume a forma

ds2 = a2 [dt2 − dr2 − dz 2 + g(r)dφ2 + 2h(r)dφ dt] , (3.22)

onde a é uma constante. Escolhamos o seguinte sistema inercial local de tetradas


Explicitando eA
α temos:

e0(0) = a
e0(2) = ah
e1(1) = a (3.23)
e2(2) = a∆
e3(3) = a
p
onde definimos ∆ pela relação ∆ ≡ h2 − g. As inversas:

(0) 1
e0 =
a
(0) h1
e2 = −
∆a
(1) 1
e1 = (3.24)
a
(2) 11
e2 =
a∆
(3) 1
e3 =
a
A
Daı́, obtemos as curvaturas RBCD :
 2
1 h0
R0101 = 2 ,
4a ∆

149
2
1 h00 h0 ∆0

R0112 =− 2 − 2 ,
2a ∆ ∆
 2
1 h0
R0202 = 2 ,
4a ∆
"  0 2 #
00
1 ∆ 3 h
R1212 = 2 − ,
a ∆ 4 ∆

Para os tensores contraı́dos RAB , encontramos os valores:


 2
1 h0
R00 = 2 ,
2a ∆
1 ∆00 1 h02
 
R11 = 2 − ,
a ∆ 2 ∆2
1 ∆00 1 h02
 
R22 = 2 − = R11 ,
a ∆ 2 ∆2
 00
h0 ∆0

1 h
R02 = 2 − + 2 .
2a ∆ ∆
Os demais termos são nulos.
Consideraremos agora um fluido perfeito sem pressão, como examinado por Gödel.
A inexistência de fluxo de calor impõe
R02 = 0 ,
e de (3.25) obtemos
h0
= constante. (3.28)

As demais equações de Einstein se escrevem:
κρ
R00 = − + Λ,
2
κρ
R11 = − − Λ,
2
κρ
R22 = − − Λ,
2
κρ
R33 = − − Λ.
2
De R33 = 0, segue

κρ = −2Λ , (3.29)
e consequentemente,  2
∆00 1 h0
− =0 (3.30)
∆ 2 ∆
Uma solução de (3.30), encontrada por Gödel, é dada por


h = 2 sinh2 r (3.31)
∆ = sinh r cosh r (3.32)

150
Assim, temos:  2
1 h0 κρ
− 2 = − + Λ = −κρ (3.33)
2a ∆ 2
Mas √ √
h0 = 2 2 sinh r cosh r = 2 2 ∆
e então,
4
κρ = (3.34)
a2
Lembrando que a rotação ω A vale
1 ABC
ωA = ε ωBC
2
1 h0
e que o tensor de rotação vale ω12 = − 2a ∆
, temos:
 " √ #
1 h0

A 2
ω = 0, 0, 0, − = 0, 0, 0, − (3.35)
2a ∆ 2

De Ω2 = −ω A ωA , temos:
2
Ω2 = (3.36)
a2
κρ = 2Ω2 (3.37)
que foi o resultado obtido anteriormente (cf. eq. (3.21)).

Causalidade em Universos em Rotação

Uma propriedade particularmente intrigante da geometria de Gödel está associada à


existência nesta geometria de curvas do tipo tempo fechadas. De (32) e da definição
de ∆ temos que, na geometria de Gödel

g = h2 − ∆2 = 2 sinh4 r − sinh2 r cosh2 r


= sinh4 r − sinh2 r

Seja RC o raio crı́tico tal que sinh(RC ) = 1. Para os valores de rI tais que 0 < rI < RC
temos g < 0, e para rII < RC tem-se g > 0. Isto é, o cı́rculo nulo (g = 0) definido
por z = constante, t = constante, r = RC separa o espaço-tempo de Gödel em duas
regiões que chamaremos C e A (iniciais de causal e acausal, respectivamente). Na região
interna a RC , isto é, a região C, as curvas fechadas são do tipo espaço. No entanto, em
A, os cı́rculos definidos por t = constante, r = constante, z = constante, são do tipo
tempo. Isto é, um observador real poderia nesta região viajar ao seu passado. Como
a geometria de Gödel é homogênea, devemos concluir que por cada ponto passe uma
curva acausal. Considere , no entanto, o observador centrado em 0. Pelo que vimos
acima, as curvas fechadas só ocorrem para r > RC . Como conciliar esse resultado com
a homogeneidade da geometria de Gödel ? Seja P um ponto vizinho de 0. Existe,
pelo que vimos acima, uma curva de raio constante passando por P centrado em 00
tal que para o observador em 00 , a curva por P está além de seu raio crı́tico R0 c .
Ocorre que a curva por P que viola causalidade cruza duas vezes a fronteira RC de 0,
penetrando assim na região acausal de 0. Se limitarmos nossas observações em 0 ao

151
interior de seu raio crı́tico, não podemos verificar violação de causalidade pela curva
em P . Isto evidencia o caráter global, isto é, não local, da causalidade. Dificuldades
nessa geometria de Gödel ocorrem se o observador caminha além de seu raio crı́tico.
Aı́, a questão da violação da causalidade aparece inevitavelmente.
Um exemplo explı́cito de uma curva do tipo tempo fechadas em Gödel pode ser descrita
considerando a curva γ : xα = xα (s) tal que

z = cte
t = cte (3.38)
r = cte

0 < ϕ < 2π

ds2(γ) = a2 (h2 − ∆2 )dϕ2


= a2 sinh2 r 2 sinh2 r − cosh2 r dϕ2
 

= a2 sinh2 r cosh2 r − 2 dϕ2


 

Chamamos de raio critico ao ponto r = rc no qual

sinh rc = 1

Assim, para r > rc ⇒ ds2 > 0 e a curva é do tipo tempo e fechada; nós a deno-
taremos pela sigla inglesa CTC. É deixado como exercicio mostrar que esta curva
não é geodésica. A existencia de CTC implica que não é possivel dividir a variedade
espaço-tempo quadridimensional em termos de uma dimensão de tempo (global) e três
de espaço – a separação dita 3 + 1.

3.9 Campo escalar


Algumas partı́culas da natureza, tanto compostas quanto fundamentais, podem ser
descritas por um campo escala ϕ(xµ ) que pode, portanto, ser fonte de curvatura.
Em Cosmologia, campos escalares não necessariamente ligados a estas partı́culas con-
hecidas, são utilizados não só devido a sua simplicidade formal como também por se
acreditar que eles tenham exercido um papel fundamental na evolução do Universo
como veremos neste e em outros capı́tulos.
A equação fundamental de movimento de um campo escalar com potencial V (ϕ) no
espaço-tempo de Minkowski é dada por

∂V (ϕ)
2ϕ + =0 (3.39)
∂ϕ

onde o operador 2 em um sistema arbitrário de coordenadas é definido pela expressão:

1 √
2ϕ ≡ √ −g ϕ,α g αβ ,β .

−g

152
Note que nesta expressão gµν representa a métrica de Minkowski escrita em um sistema
arbitrário de coordenadas. A equação (3.39) pode ser obtida a partir da Lagrangiana:
1
Lϕ = ϕ,α ϕ,β g αβ − V (ϕ) (3.40)
2
Se o potencial se restringe à expressão
1 2 2
V (ϕ) = µϕ (3.41)
2
então o campo escalar é livre e massivo com massa igual a m = µ~/c (isto porque,
no espaço de momenta, cada modo do campo escalar com quadri-momentum k µ se
comporta como uma partı́cula livre massiva satisfazendo gµν k µ k ν = m2 ).
De posse desta Lagrangiana, podemos obter a expressão do tensor momento-energia
através da relação (veja a Eq.1.117)

2 δ −gLϕ
Tµν ≡ √
−g δg µν

Usando a expressão
√ 1√
δ −g = − −ggµν δg µν , (3.42)
2
é fácil mostrar que para Lϕ dada pela equação (3.40) obtem-se:

Tµν [ϕ] = ϕ,µ ϕ,ν − Lϕ gµν (3.43)

Vamos agora examinar o que ocorre quando o campo escalar interage com um campo
gravitacional. Em geral, quando qualquer campo da fı́sica está em interação gravita-
cional, dois tipos de acoplamento são possiveis:

• Acoplamento mı́nimo;
• Acoplamento direto com a curvatura ou não-mı́nimo.

No primeiro caso, a generalização da equação de qualquer campo não gravitacional no


espaço-tempo de Minkowski para espaços curvos se dá pela substituição da métrica
plana pela métrica curva e das derivadas simples por derivadas covariantes. Como sem-
pre é possı́vel encontrar um sistema de coordenadas onde, numa região suficientemente
pequena, a métrica pode ser colocada na forma de Minkowski e a conexão se torna
nula, então, nesta pequena região (o chamado elevador de Einstein em queda livre),
e apenas nela, todos os efeitos gravitacionais podem ser desconsiderados. Isto implica
na aceitação do Princı́pio de Equivalência de Einstein que afirma que ”localmente (no
elevador de Einstein) as leis da Relatividade Especial são válidas.
No segundo caso vemos que, como aparecem termos de curvatura explicitamente na
Lagrangiana, tal interação não desaparece localmente em nenhum sistema de coor-
denadas já que a curvatura é representada por um verdadeiro tensor e portanto não
pode ser anulada num ponto por uma mera transformção de coordenadas. Neste caso
não vale o Princı́pio de Equivalência de Einstein mas continua valendo o Princı́pio de
Equivalência Fraco, que atesta que toda partı́cula livre num dado campo gravitacional
segue a mesma trajetória, independentemente da sua natureza (é este princı́pio que
garante a geometrização do campo gravitacional).

153
No caso do campo escalar, claro está que qualquer termo do tipo f (R)ϕ2 , para uma
função f arbitrária, acrescido à Lagrangeana no espaço plano poderia ser admitida
como gerando um bom sistema de equações capaz de conduzir no limite de pequena
curvatura (como perto da Terra), Rαβρσ → 0, às equações do campo escalar no espaço
de Minkowski. Infelizmente, essa arbitrariedade não é possı́vel de ser removida sem
a introdução de um critério adicional como, por exemplo, com uma nova invariância
para o campo escalar.
Alguns autores, seguindo este caminho, propuseram alterar a Lagrangeana escalar
para a forma
1 R
Lcϕ = ϕ,α ϕ,β g αβ − ϕ − V (ϕ) (3.44)
2 6
A principal motivação para essa alteração está associada à invariância das equações
de movimento obtidas a partir de Lϕ , quando V (ϕ) = λϕ4 /4, mediante as chamadas
transformações conformes, a saber, a aplicação

geµν (x) = Ω2 (x) gµν (x), (3.45)


e
e (x) = Ω−1 (x) ϕ (x),
ϕ (3.46)
que preserva ângulos. Segue então de cálculo direto as formas de transformação cor-
respondentes:

geµν (x) = Ω− 2 (x) g µν (x).

eαβ = Ω− 2 Rαβ µν − 1 δ [ α [ µ Lβ ] ν ]
R µν
4
onde os colchetes significam antissimetrização e usamos que

Lα β ≡ 4 Ω− 1 (Ω− 1 ), β; λ g αλ − 2 (Ω− 1 ), µ (Ω− 1 ), ν g µν δβα .

Contraindo a expressão do tensor de curvatura, encontramos a variação do tensor de


Ricci e do escalar R:

eαµ = Ω− 2 Rα µ − 1 Lα µ − 1 Lδµα
R
2 4
e = Ω−2 R + 6 2 Ω
 
R (3.47)

Finalmente, coletando essas transformações, obtém-se para o tensor de Weyl a lei:

f αβ = Ω− 2 W αβ µν
W µν

e, então, segue a invariância do tensor

f α = W α βµν
W βµν

que é, por esta razão, também chamado de tensor de curvatura conforme.

154
Voltando à Lagrangiana (3.44), variando-se Lcϕ obtemos
R
2 ϕ+ ϕ + λϕ3 = 0 (3.48)
6
Da equação (3.47) e da relação
2
e ϕ̃ = −Ω−4 ϕ 2 Ω + Ω−3 2 ϕ,
obtem-se  
R
e R
2
e ϕ̃ + ϕ̃ + λϕ 3
e =Ω−3
2 ϕ+ + ϕλϕ 3
6 6
Vemos assim que a introdução do fator proporcional ao escalar de curvature R na
Lagrangeana gera uma nova simetria: a invariância da equação do campo escalar por
transformação conforme.
Vamos a seguir detalhar um pouco mais os dois tipos de acoplamento.

Acoplamento Mı́nimo

Seja a Lagrangiana de um campo escalar intearagindo com a gravitação pelo acopla-


mento mı́nimo

L = LE + Lϕ
onde LE representa a Lagrangiana de Einstein-Hilbert e Lϕ a Lagrangiana do campo
escalar dada por:

1
L= ϕ,µ ϕ,ν g µν − V (ϕ) (3.49)
2
Da definição do tensor energia-momento (3.43) segue a expressão
Tµν = ϕ, µ ϕ, ν − L gµν (3.50)
cujo traço é
T = −ϕ,µ ϕ,µ + 4 V.
Uma situação bastante estudada consiste em identificar o termo de potencial V com um
polinômio de ordem n. Consideremos, como um exemplo particular, a forma quártica

1 1
V = µ2 ϕ2 + λ ϕ4 . (3.51)
2 4
A equação de movimento é dada por

∂V
2ϕ + = 0.
∂ϕ
Quando o potencial não é um monômio, existe a possibilidade de uma solução ho-
mogênea. Isso ocorre quando V possui um extremo6
∂ V 
= 0.
∂ ϕ ϕ0 = const
No caso em que V é dado por (3.51) temos duas possibilidades
6
Nessa seção estamos considerando o campo ϕ como real.

155
• ϕ = 0.
• ϕ0 = − µ2 /λ.
p

Como o campo é real segue que para existir a solução não-trivial acima é preciso que
tenhamos λ < 0. Com a forma anterior para a distribuição de energia deste campo,
podemos calcular a sua expressão explı́cita no caso homogêneo não-trivial. Temos

Tµν = Λef gµν


onde

Λef ≡ V ( Φ0 ).
Segue então o resultado notável:

• A distribuição homogênea de energia de um campo escalar em seu estado funda-


mental é equivalente a uma constante cosmológica.

Acoplamento Não-Mı́nimo

Seja a Lagrangiana dada por:

1 1
Lc = ϕµ ϕν g µν − V (ϕ) +  R ϕ2 + 2 Λ + R (3.52)
2 κ
Vamos examinar o caso especial do acoplamento conforme onde a constante  = − 16 .
A equação do campo escalar é dada por
1 ∂V
2ϕ + Rϕ+ = 0. (3.53)
6 ∂ϕ

Escrevendo a equação para a geometria sob a forma da Relatividade Geral, isto é

Gµν = −T c µν − Λ gµν (3.54)


onde o tensor de energia-momento conforme T c µν é dado por
1 1 1 1
gµν (ϕ, λ ϕ, λ − V ) − ϕ2 Gµν + 2 ϕ2 gµν − ϕ2 , µ ; ν )
T c µν = ϕ, µ ϕ, ν − (3.55)
2 6 6 6
Tomando o traço deste tensor temos:

1 1
T c = −ϕ, λ ϕ, λ + 2 V + R ϕ2 + 2 ϕ2
6 2
e, usando a equação de movimento dá

1 ∂V
Tc = 2V − ϕ
2 ∂ϕ
Note que quando a massa for zero e o potencial V reduzir-se ao monômio de quarta
ordem, da equação acima segue o resultado que procurávamos, a saber

• O traço do tensor de momento-energia do campo escalar se anula no limite de


massa zero com acoplamento conforme.

156
Estrutura Riemanniana e a geometrização do campo escalar

A idéia de associar a força gravitacional à geometria do espaço-tempo foi tão sin-


gular, tão à parte dos caminhos convencionais empreendidos pelos fı́sicos no começo
do século XX, que ela provocou uma mudança no modo de apreender a realidade
fı́sica notável. Em particular, interessa-nos aqui, suas consequências referentes a mod-
ificações da geometria distintas da proposta na RG. Atraı́dos pela simplicidade for-
mal, mas de grandes consequências, dessa geometrização de uma importante parte da
Fı́sica, alguns cientistas começaram a se perguntar se um tal procedimento não pode-
ria ser estendido para outras formas de interação, outros processos. Em particular, eles
procuraram examinar a possibilidade de introduzir o outro campo de longo alcance
então conhecido, o campo eletromagnético, num esquema de geometrização7 .
Uma dessas propostas foi arquitetada pelo matemático H. Weyl através da geometria
de Weyl. Embora tenha sido possı́vel mostrar que sua idéia de modificação da estru-
tura geométrica do espaço-tempo não permitia identificá-la com as propriedades da
interação eletromagnética, a geometria que ele elaborou, e que carrega seu nome, tem
interêsse em outros aspectos da Fı́sica e, em particular, na Cosmologia.
A teoria da Relatividade Geral parte da hipótese de que os processos gravitacionais
podem ser interpretados como sendo modificações produzidas, por qualquer forma de
energia, inclusive gravitacional, sobre a geometria do espaço-tempo. A estrutura deste
espaço é admitida, a priori, como sendo Riemanniana. Isso significa que além de um
tensor métrico gµν existe uma conexão Γα µν que não são independentes mas estão
relacionados pela condição de metricidade definida por

gµν;α = 0. (3.56)

Esta condição implica que geodésicas são também curvas com elemento de linha
extremo (máximo se for uma geodésica tipo-tempo e mı́nimo se for tipo-espaço) e
que o transporte paralelo de vetores preserva o ângulo entre eles, ambas propriedades
também presentes no espaço-tempo plano.
Segue desta expressão que a conexão é métrica, isto é ela pode ser escrita em termos
de derivadas do tensor métrico (se a parte anti-simétrica da conexão, chamada torsão,
for nula), através da fórmula:

1
Γα µν = g αβ [gβµ, ν + gβν, µ − gµν, β ] (3.57)
2

Existe um método alternativo, atribuido a Palatini, capaz de associar tal estrutura a


uma dinâmica8 . Como se a própria natureza Riemanniana do espaço-tempo postulada
pela RG pudesse ser gerada através de interação. Vejamos como isso é possı́vel. O
ponto de partida é a ação de Hilbert:


Z
SH = −gRd4 x.

7
Chamaria a atenção do leitor para o fato de que, ainda hoje, passado quase 80 anos, estes são os únicos
campos de longo alcance conhecidos. Embora algumas propostas de existência de campos de longo alcance
tenham aparecido neste século, nenhuma delas conseguiu exibir alguma evidência de sua existência.
8
Nós o chamaremos de método EP.

157
Ao examinarmos as consequências do princı́pio variacional sobre esta ação, ao invés de
considerarmos como usualmente é feito, que a estrutura métrica é dada a priori, nós
deixaremos isso para ser decidido no próprio espectro das variações permitidas neste
Princı́pio. Isto é, consideraremos que as variações possı́veis são completamente ar-
bitrárias, sem impormos o vı́nculo Riemanniano que relaciona as variações da métrica
às variações da conexão, admitiremos que as variações δgµν e δΓµαβ são independentes.
Consideremos um sistema local quase-Euclideano de coordenadas onde as variações
do tensor contraı́do de Ricci possa ser escrito sob a forma:

δRµν = δΓα µα;ν − δΓα µν;α ,


onde a derivação covariante ; deve ser executada na geometria não-perturbada. Ob-
servemos que apesar de Γαµν se tranformar de forma não homogenea mediante uma
transformação geral de coordenadas, sua diferença δΓαµν é um verdadeiro tensor já que
o termo não homogêneo que o descaracterizaria como tal é cancelado na subtração.
Segue daı́ a relação:
 1 √ √
δLEH = Rµν − Rgµν −gδg µν + −gg µν δRµν .
2
Usando a expressão acima para calcular a variação de Rµν temos, depois de fazer uma
integração por partes:

√ √ 1 √ 1 √
Z Z h
 1  i
δSH = µν
−g Rµν − Rgµν δg + ( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ δΓα µ .
2 2 2
Segue então que

√ 1 √ 1 √
( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ = 0.
2 2
α
Multiplicando por δµ obtemos:


( −gg µ );α = 0.
Uma simples manipulação algébrica implica então que

gµ;α = 0 (3.58)
isto é, o espaço-tempo da Relatividade Geral é Riemanniano. A outra equação obtida
do princı́pio variacional é precisamente a equação de Einstein. Devemos reconhecer
que um tal resultado permite dar um passo além, retirando a análise da geometria do
mundo de considerações aprioristicas para colocá-la no território no qual se estrutura
a dinâmica.

Estrutura Riemanniana e matéria

A questão que queremos responder nesta seção decorre naturalmente do resultado


anterior e pode ser sintetizada assim:

• A construção acima da geometria Riemanniana, a partir da ação de Hilbert,


persiste ao se introduzir a interação da geometria com a matéria?

158
Nós iremos mostrar que a resposta a esta pergunta depende do modo pelo qual a
matéria se acopla com a gravitação. Esse é talvez um dos mais inesperados resulta-
dos da extensão do método introduzido por Palatini, na caracterização da estrutura
geométrica do espaço-tempo. O modo mais simples de demonstrar isso consiste em
considerar um exemplo especı́fico. Aprendemos, no que vimos no exame da interação
entre um campo escalar e a gravitação, que há dois tipos de acoplamento possı́vel, a
saber:

• Acoplamento mı́nimo
• Acoplamento direto ou não-mı́nimo.

No caso do campo escalar, o acopalmento mı́nimo mantem o resultado acima, mas


no caso do acoplamento não-mı́nimo obtem-se resultado diferente. Como um exemplo,
examinemos a teoria descrita pela Lagrangiana


Lϕ = −gRϕ2 . (3.59)
Usando o procedimento variacional anterior temos:

√ √ 1 √ 1 √
Z Z h
1 
δSϕ = µν
−gϕ Rµν − Rgµν δg + ( −gϕ2 g µ );α − ( −gϕ2 g µν );ν δα − ( −gϕ2 g ν );ν δ
2
2 2 2
Segue daı́, por um cálculo semelhante ao caso anterior (deixado como exercicio:

( −gϕ2 g µν ); = 0,

isto é, não segue da variação que a estrutura do espaço-tempo é Riemanniana, pois
temos

gµν α = Qµνα ,
onde o tensor Qµνα é função do tensor métrico e do campo ϕ. Para calcular a forma
explı́cita deste tensor podemos proceder por analogia com a estrutura Riemanniana.
Temos:

gµν;α = gµν,α − Γ µα gν − Γ να gµ .


Considerando permutação cı́clica dessa expressão e somando, depois de uma pequena
manipulação algébrica:

1
Γλ µα = ∆λ µα − [Qµ λ α + Qλ αµ − Qαµ λ ].
2
Usando o resultado anterior:

ϕ2 ,λ
Qµνλ = − gµν ,
ϕ2
isto é,

ϕ,α
gµν;α = −2 gµν . (3.60)
ϕ

159
Este tipo de geometria é chamada de geometria de Weyl integrável. Chegamos assim à
estrutura de Weyl através da interação não mı́nima entre gravitação e campo escalar.
Ele foi utilizado na Cosmologia para examinar cenários cosmológicos não singular, isto
é, possuindo uma fase de colapso anterior à fase de expansão.

3.10 Universo Homogêneo Isotrópico não Singular


A comunidade dos cosmólogos acredita que a existência de singularidade nos modelos
expansionistas de Friedmann constitui uma grave dificuldade inerente a estes univer-
sos. A razão dessa dificuldade está associada ao fato de que a singularidade requer o
abandono da descrição contı́nua e completa do Universo ao longo de sua história. Emb-
ora o significado dessa questão não esteja totalmente compreendida, alguns cosmólogos
continuam por se questionar sobre a inevitabilidade daquela singularidade. Não ire-
mos aqui discutir essa questão. O leitor interessado pode consultar as referências ao
fim deste capitulo. Veremos somente em seguida, como é possı́vel gerar solução ex-
pansionista não-singular como consequência da existência de fótons não-lineares no
Universo.

3.10.1 Fótons Não-Lineares


A gravitação curva o espaço-tempo e afeta consequentemente a propagação de fótons
em sua trajetória. Como se manifesta a influência desta curvatura sobre o campo
eletromagnético? De um modo bastante geral, os fı́sicos tem se manifestado de co-
mum acordo em aceitar como hipótese de trabalho que a interação eletromagnética
com a gravitação obedece ao princı́pio do acoplamento mı́nimo. Tal princı́pio requer
que a alteração, devido à curvatura do espaço-tempo, na dinâmica de qualquer pro-
cesso fı́sico, seja feita somente pela substituição das derivadas simples por derivadas
covariantes, na função lagrangeana. Para o campo de Maxwell este princı́pio induz a
equação

F µν;ν = J µ (3.61)
proveniente da Lagrangeana

 
1 µν µ
L = −g − Fµν F + Jµ A , (3.62)
4

onde
Fµν = Aµ,ν − Aν,µ .
Entretanto, pode-se argumentar que na presença de campos gravitacionais intensos,
acoplamentos envolvendo funcionais da curvatura poderiam se tornar importantes e
alterar o sistema de equações do Eletromagnetisno. Essa idéia foi desenvolvida por
Novello e Salim. Eles argumentaram que, para campos fortes (isto é, quando a cur-
vatura do espaço-tempo é grande) a dinâmica do processo é descrita pela Lagrangeana
não-mı́nima:

 
1 µν µν µ ν
L = −g − Fµν F + λ R Aµ Aν g + β Rµν A A + LE + Lµ , (3.63)
4

160
onde

dim λ ≡ [λ] = [κ],


[β] = 0,

LE = R é a Lagrangiana de Einstein e Lµ é a Lagrangeana qua descreve os demais


campos. Vamos examinar aqui o caso em que a constante β é nula. O termo adicional
não-mı́nimo da Lagrangeana, isto é, RAµ Aµ pode ser interpretado
√ como um termo
de massa mγ para o fóton (gerada pela gravitação), com mγ ∼ R. As equações de
movimento induzidas pela Lagrangeana são:

1
(1 + λA2 ) (Rµν − R gµν ) − λ 2 A2 gµν +
2
+λA2,µ;ν + λRAµ Aν = − Eµν − k Mµν
µ
F µν;ν = −λ RW µ + Jext (3.64)

onde Eµν e o tensor momento-energia de Maxwell


1
Eµν ≡ Fµα F αν + gµν Fµβ F αβ ,
4
Mµν é o tensor momento-energia da matéria, e

A2 ≡ Aµ Aν gµν .

O tensor momento-energia para o campo vetorial se obtem de



2 δ( −gL)
Eµν ≡ √ , (3.65)
−g g µν
e como
√ √  √
Z Z Z
µν 4 µν 4
δ −gFµν F d x = δ −g Fµν F d x + −g δFµν Fαβ g µα g νβ , (3.66)

obtem-se o resultado esperado


1
Eµν = Fµα F αν + gµν Fαβ F αβ .
4
Segue então que o traço E ≡ Eµν g µν se anula identicamente.
µ
Jext representa a corrente não-gravitacional que gera o campo eletromagnético.
Tomando a divergência da última equação do sistema (3.64) temos
µ
Jext;µ = λ (RAµ );µ

Impondo a condição de Lorentz generalizada

(RAµ );µ = 0 (3.67)


µ
vemos que a corrente Jext é conservada. Tomando o traço da primeira equação do
sistema (3.64) temos:
R = M − 3λ2 A2 (3.68)

161
onde M = Mµν g µν . Substituindo esse valor de R na última equação do sistema (3.64)
temos:
3λ2 µ
F;νµν = −λ M Aµ + (2 A2 )Aµ + Jext (3.69)
k
A equação (3.69) exibe explicitamente o caráter não-linear da interação eletro-
magnética induzida pela curvatura do espaço-tempo. Vemos dessas equações que, para
campos fracos, o modelo de universo coincide com o obtido sem acoplamento direto,
isto é, para (λ = 0), que constitue uma primeira aproximação da interação entre os
campos eletromagnético e gravitacional.

3.10.2 Solução Cósmica Homogênea e Isotrópica


Vamos procurar uma solução do sistema de equações (3.64) tal que a geometria seja
descrita pelo elemento de linha homogêneo isotrópico dado por,
ds2 = dt2 − a2 (t)[dχ2 + σ 2 (χ) (dθ2 + sen2 θ dφ2 )], (3.70)
onde σ(χ) pode assumir as formas χ, senχ ou senhχ, correspondendo a seções espa-
ciais planas, de curvatura positiva ou curvatura negativa, respectivamente. Como não
existe direção privilegiada no espaço na qual os campos elétrico e magnético possam
estar direcionados, concluimos que estes se anulam. Consequentemente, na ausência
de matéria (e corrente externa), o escalar de curvatura se anula (veja a última equação
do sistema (3.64)):
R=0 (3.71)
A primeira equação do sistema (3.64) se reduz à expressão:
(1 + λA2 ) Rµν + λA2,µ;ν = 0. (3.72)
Vamos definir a variável Ω pela relação
Ω ≡ 1 + λA2 (3.73)
Segue então
Ω,µ;ν
Rµν = − (3.74)

e
2Ω = 0 (3.75)
Substituindo o elemento de linha (3.70) em (3.74) conduz às equações:
ä Ω̈
3 =− (3.76)
a Ω
ä 2ȧ2 2 ȧ Ω̇
+ 2 +  = − (3.77)
a a a2 aΩ
ä 2ȧ2 2 ȧ Ω̇
+ 2 − =− , (3.78)
a a a2 aΩ
onde  = R(3) /6 = 0 ± 1, dependendo se as seções espaciais são planas, de curvatura
positiva ou de curvatura negativa, e R(3) é o escalar de curvatura destas seções.. As
soluções para Ω e a são então dadas por:

a(t) = −t2 + bt + c (3.79)
−2t + b
Ω(t) = Ω0 .
a
162
Vemos de (3.79) que, por exemplo, quando

b2 + 4c < 0

a função a(t) não se anula. Consequentemente, o raio do Universo mantém-se finito,


assim como os invariantes do campo. Uma inspeção na função a(t) mostra que um
tal caso só pode existir se o modelo tiver seção espacial com curvatura negativa ( =
−1). Neste caso, no limite t → ∞, a geometria tende para o espaço de Minkowski
nas coordenadas de Milne. Este modelo mostra, portanto, um comportamento não-
singular, consequência direta do acoplamento não-mı́nimo do fóton com a gravitação.
Um tal exemplo sugere a necessidade de se desenvolver modelos menos simplistas da
interação gravitacional com a matéria.

3.11 Modelo cosmológico padrão: sucessos e difi-


culdades
.
O modelo cosmológico padrão (MCP) apresenta uma descrição razoavelmente boa
da evolução do universo desde o momento da produção dos elementos quimicos leves
(como Hidrogênio e Hélio), a chamada nucleosintese primordial. Simplificadamente, o
MCP se fundamenta nas seguintes hipóteses:

• A força gravitacional é descrita pela teoria da relatividade Geral;


• O universo é uma estrutura solidária e única que satisfaz o Princı́pio cosmológico.
isto é, é possivel definir um tempo cósmico global e todas as quantidades ob-
serváveis dependem somente deste tempo gaussiano;
• Em grandes escalas (da ordem de 100 Mpc) o conteúdo material/energético pode
ser descrito em termos de um fluido perfeito;
• A geometria do universo é descrita pelo modelo de Friedman-Robertson-Walker.

Embora este modelo apresenta um cenário coerente e capaz de prover uma descrição de
boa parte das observações cósmicas - isto é, não local - algumas dificuldades, tanto de
natureza formal quanto observacional, levaram a uma profunda crı́tica deste modelo.
Dentre estas podemos citar:

• Como conciliar o MCP com a inevitabilidade de uma singularidade tipica dos


modelos FRW com fluido perfeito? Como estabelecer uma superfı́cie de dados
iniciais (o problema de Cauchy) ”ao começo” da expansão ( posto que neste ponto
as quantidades fisicas assumem o valor infinito )?
• Se os modelos FRW possuem horizonte, isso significa que nem todas as diferentes
partes do universo poderiam ter trocado informação ao longo de sua história.
Como então entender a alta dose de isotropia presente na radiação cósmica de
fundo observada?
• Por que o tensor de Weyl é nulo?
• Como se formaram, em um universo espacialmente homogêneo e isotrópico, as
estruturas observadas tais como as galáxias, aglomerados, etc?

163
• Como conciliar as observações recentes de que o fator de escala do universo está
sendo acelerado com a positividade da energia e pressão, no cenário padrão?
Com o propósito de resolver alguns desses problemas, nos ultimos anos uma mudança
profunda vem sendo realizada na Cosmologia. Não iremos entrar nestes detalhes aqui,
mas comentaremos ao longo deste curso algumas dessas tentativas recentes de afasta-
mento do MCP. Alguns deles (como o chamado modelo inflacionário) são extensões
do MCP e são até mesmo entendidas como constituindo o novo modelo cosmológico
padrão (NMCP). Entretanto, a maior parte destas novas modificações ainda estão no
território da especulação.

Apêndice 1: Dedução das outras equações para os


parâmetros cinemáticos.

3.11.1 Equação de evolução de σµν .


Simetrizando a equação (18) podemos escrever:

θ̇ µ ν 1
hαµ hβν σ̇µν + hα hβ hµν + aα aβ − hαµ hβν (aµ;ν + aµ;µ ) +
3 2
1 µ 1
+ Qαµ Q β + Qβµ Qα = Rαεβν v ε v µ
µ
2 2
Mas
  
θ θ µ
Qαµ Qµβ = hαµ + σαµ + ωαµ µ µ
h +σ β +ω β =
3 3 β
θ2 2 2
= hαβ + θσαβ + θωαβ + σαµ σ µβ +
9 3 3
+σαµ ω µβ + ωαµ σ µβ + ωαµ ω µβ

Daı́
2 2 4
Qαµ Qµβ + Qβµ Qµα = θ hαβ + θσαβ + 2σαµ σ µβ + 2ωαµ ω µβ
9 3
Para simplificar esta expressão, usaremos a definição do vetor de rotação dado por
1 αβρτ
ωτ = η ωαβ vρ
2
cuja inversa é dada por
ωαβ = ηαβµν ω µ v ν
Tem-se, então:

ωαµ ω µβ = ηαµρσ ω ρ v σ η µβ ε τ
ετ ω v
βετ ρ
= δαρσ ω ωε v σ vτ
= ωµ ω µ hβα − ω β ωα

pois, ω µ é um vetor em H, isto é,

ω µ vµ = 0

164
Coletando esses cálculos, obtemos
1 1
hαµ hβν σ̇µν + hαβ θ̇ + aα aβ − hαµ hβν (aµ;ν + aν;µ ) +
3 2
θ2 2
+ hαβ + θσαβ + σαµ σ µβ + ωµ ω µ hαβ − ωβ ωα = Rαεβν V ε V ν
9 3
Usando a equação de evolução temos:
1
hαµ hβν σ̇µν + hαβ −ω 2 − 2σ 2 + aλ ;λ + aα aβ +
 
3
1 2
− hαµ hβν (aµ;ν + aν;µ ) + θσαβ + σαµ σ µβ − ωα ωβ =
2 3
ε ν 1 µ ν
= Rαεβν v v − Rµν v v hαβ (3.80)
3
que é a expressão da equação de evolução de σµν .

3.11.2 Equação de evolução de ωµν


Anti-simetrizando a equação fundamental tem-se:
2hαµ hβν ω̇µν − hαµ hβν (aµ;ν − aν;µ ) +
+Qαµ Qµβ − Qβµ Qµα = 0
Mas
4
Qαµ Qµβ − Qβµ Qµα = θωαβ + 2σαµ ω µβ − 2σβµ ω µα
3
Então
1
hαµ hβν ω̇µν − 2
hαµ hβν (aµ;ν − aν;µ )
+ 32 θωαβ + σαµ ω µβ − σβµ ω µα = 0 (3.81)
que é a expressão da equação de evolução de ωµν .

3.11.3 Equações de vı́nculo


Além das equações (19), (20), (21) que descrevem a evolução dos parâmetros
cinemáticos de uma congruência, existem certas relações entre estas quantidades que
devem ser satisfeitas independentemente do valor do parâmetro afim sobre a curva
χα = χα (S). Tais relações são, dessa forma, chamadas equações de vı́nculo. Passemos
agora, à tarefa de demonstrá-las. Da relação de definição do tensor de curvatura,
vα;β;γ − vα;γ;β = Rαεβγ v ε (3.82)
Contraindo α, β e projetando em H, temos
hγλ (v α ;α );γ − hγλ v α ;γ;α = Rεγ v ε hλγ (3.83)
Mas
 
θ α
hγλ v α ;γ;α = α
h + σ γ + +a vγ α
hγλ =
3 γ ;α
1
σ αγ + ω αγ ;α hγλ + θ,α hαλ + aα (σγα + ωγα )

=
3
165
Daı́, usando esse resultado na equação (23) teremos:
2
θ,µ hµλ − σ αγ + ω αγ ;α hγλ − aα (σλα + ωλα ) = Rµα v µ hαλ

(3.84)
3
que consiste na primeira equacão de vı́nculo.
Passemos agora à segunda relação. Temos, usando a equação (22) sucessivamente:
vα;β;γ − vα;γ;β = Rαµβγ v µ
vβ;γ;α − vβ;α;γ = Rβµγα v µ
vγ;α;β − vγ;β;α = Rγµαβ v µ
Somando,
(vα;β − vβ;α );γ + (vγ;α − vα;γ );β +
+ (vβ;γ − vγ;β );α = (Rµαγβ + Rµβαγ + Rµγβγ ) v µ
O lado direito dessa expressão é identicamente nulo, devido às propriedades do tensor
de Riemann Rαβµν . Usando a equação (12) temos
vα;β − vβ;α = ωαβ + aα vβ − ωβα − aβ vα
= 2ωαβ + aα vβ· − aβ vα
Então, temos
(2ωαβ + aα vβ − aβ vα );γ η αβγλ = 0 ,
ou ainda, devido ao fato do espaço ser Riemanniano (isto é, gµν;λ = 0)
ωαβ η αβγλ ;γ + (aα vβ );γ η αβγλ = 0

(3.85)

Multiplicando ainda por v λ temos


ωαβ η αβγλ vλ + aα vβ;γ vλ η αβλγ = 0


1 αβρτ
Lembrando a definição de ω τ = η ωαβ vρ , podemos escrever
2
ωαβ η αβγλ vλ − ωαβ η αβγλ vλ;γ + aα vλ vβ;γ η αβγλ = 0


isto é,
−2ω α ;α − ωαβ ωλγ η αβλγ − 2ω λ aλ − 2aα ω α = 0
ou ainda
ω α ;α + 2ω α aα = 0 (3.86)

Finalmente vamos procurar a terceira equação de vı́nculo. Multiplicando a equação


(22) pelo tensor ηργβε vε , temos:
1
vα;β;γ ηργβε vε = Rαµβγ v µ ηργβε vε (3.87)
2
Desenvolvendo o lado esquerdo obtemos
 
γβε θ
vα;β;γ ηρ vε = hαβ + σαβ + ωαβ + aα vβ ηργβε vε
3 ;γ
1 2
= (σαβ + ωαβ )kγ ηργβε vε + θ,γ ηργ αε v ε − θvα ωρ + 2aα ωρ
3 3
166
Usando esse resultado na expressão (27) temos:
1
(σαβ + ωαβ );γ ηργβε vε + 3
θ,γ ηργ αε vε −

− 23 θvα ωρ + 2aα ωρ = 1
2
Rαµβγ v µ vε ηργβε

Simetrizando em α, ρ:

σβ(α − ωβ(α ;γ ηρ) γβε vε − 23 θv(α ωρ) +


 

+2a(α ωρ) = − 21 Rβγµ(α ηρ)γβε v µ vε

Apêndice 2: Um pequeno compêndio de formulas


matemáticas.
Nesta seção iremos apresentar algumas formulas e expressões matemáticas que apare-
cerão com bastante frequência ao longo deste curso. A maior parte delas será apresen-
tada sem demonstração, deixando-se para o leitor realizá-las.
Definimos o objeto completamente antissimétrico αβµν de Levi-Civita que vimos an-
teriormente e que vale 1 quando os indices têm o valor (0123) ou qualquer permutação
par, −1 para permutações ı́mpares e vale zero quando dois de seus indices são iguais.
A partir dele construı́mos a quantidade

ηαβµν = −g αβµν (3.88)

onde g é o determinante da métrica gµν . Com este objeto é possı́vel definir para
qualquer par de ı́ndices antissimétricos um objeto dual. Assim, para um tensor anti-
simétrico arbitrário Fµν = − Fνµ construı́mos o seu dual pela relação:

∗ 1
Fµν ≡ ηµναβ F αβ (3.89)
2
Segue então que a operação repetida (dual do dual) tem o efeito de trocar o sinal do
tensor:
∗∗
Fµν = − Fµν .

Definimos o objeto associado gαβµν pela relação:

gαβµν ≡ gαµ gβν − gαν gβµ (3.90)

satisfazendo as simetrias

gαβµν = −gαβνµ = −gβαµν = gµναβ (3.91)

Podemos então mostrar que


ηαβµν = − gαβµν (3.92)
e também:

ηαβµν η µνρσ = − 2 gαβρσ (3.93)

167
ρσλ
ηαβµν η αρσλ = − δβµν (3.94)
ρσλ
na qual a quantidade δβµν é o determinante da matriz 3x3

η αβµε η ενρσ = δνρσαβµ


= δνα δρβ δσµ − δνα δσβ σρµ
−δρε δνβ δσµ + δρα δσβ δµµ + δσα δρµ δνβ − δσα δρβ δνµ .

Segue então
ηασµν η βσµν = −6 δαβ (3.95)

3.11.4 Decomposição de um tensor anti-simétrico


Todo tensor de segunda ordem anti-simétrico , Fµν , como aquele que representa o
campo eletromagnético, pode ser decomposto em suas partes elétrica e magnética sob
a forma:
Fµν = −vµ Eν + vν Eµ + ηµνρσ vρ Bσ
onde os vetores elétrico (Eµ ) e magnético (Bµ ) são dados por

Eµ = Fµα v α
∗ α 1
Bµ = Fµα v = ηµαρσ Fρσ V α
2
Segue que estas quantidades estão definidas no tri-espaço do observador inercial de
velocidade v µ isto é,
Eµ v µ = 0

Bµ v µ = 0

3.11.5 Tensor de Weyl


É possivel decompor o tensor de curvatura de Riemann Rαβµν em suas partes irre-
dutı́veis. Para isso definimos o tensor conforme ou tensor de Weyl (que possui as
mesmas simetrias que o tensor de Riemann mas não possui traço). Temos assim:

1
Rαβµν = Wαβµν + Mαβµν − Rgαβµν (3.96)
6
onde
2Mαβµν = Rαµ gβν + Rβν gαµ − Rαν gβµ − Rβµ gαν . (3.97)
Desta definição segue que o tensor de Weyl tem somente 10 componentes indepen-
dentes. As outras 10 componentes que completam o tensor de Riemann estão contidas
no traço Rµν . As 10 componentes algebricamente independentes do tensor de Weyl po-
dem ser separadas em partes eletrica e magnética, para um observador de velocidade
v µ , como o fizemos para o campo de spin 1. Temos:

Eαβ = −Wαµβν v µ v ν (3.98)



Hαβ = −Wαµβν vµvν . (3.99)

168
Das simetrias de Wαβµν segue que a operação dual é independente do par ao qual ela
é aplicada.

Destas expressões acima segue que os tensores elétrico e magnético são simétricos, sem
traço e pertencem ao 3-espaço ortogonal ao observador, isto é:

Eµν = Eνµ

Eµν v µ = 0 (3.100)

Eµν g µν = 0,
e
Hµν = Hνµ

Hµν v µ = 0 (3.101)

Hµν g µν = 0.

Invariantes de Debever

Existem certas quantidades escalares, obtidas multiplicando e contraindo componentes


do tensor de curvatura, chamadas de invariantes de Debever que têm grande interesse
na teoria da gravitação. Nesta seção iremos apresentá-los. Para isso, iremos definir
algums quantidades tensoriais, a saber:

1
Cµν = Rµν − R gµν
4

Dµν ≡ Wµανβ C αβ


D̃µν ≡ Wµανβ C αβ

Os quatorze invariantes algebricamente independentes construidos por Debever a par-


tir do tensor de curvatura. Considerando que estamos usando a convenção segundo a
qual tensor metrico é adimensional, eles podem ser classificados por sua dimensional-
idade como segue:

Dimensionalidade Invariantes
L−2 I5
−4
L I1 , I3 , I6
−6
L I2 , I4 , I7 , I9 , I12
L−8 I8 , I10 , I13
−10
L I11 , I14

169
A expressão destes invariantes é dada por:

I1 = Wαβµν W αβµν

I2 = Wαβ ρσ Wρσ µν Wµν αβ


I3 = W αβµν Wαβµν

I4 = W αβρσ Wρσ µν Wµναβ


I5 = R

I6 = Cµν C µν

I7 = Cαβ C βµ Cµ α

I8 = Cαβ C βµ Cµλ C αλ

I9 = Cµν Dµν

I10 = Dµν Dµν

I11 = Cαβ Dβµ Dµ α

I12 = D̃µν C µν

I13 = D̃µν Dµν

I14 = D̃µν D̃να C µ α

onde usamos as definições:


Cµν ≡ Rµν − 41 Rgµν

Dµν ≡ Wµανβ C αβ (3.102)


D̃µν ≡ Wµανβ C αβ .

Apêndice 3: Tetradas
Um sistema de quatro vetores - um do tipo tempo e tres do tipo espaco - pode ser um
sistema de referências com os quais um dado observador descreve suas medidas. Nós
chamaremos a este conjunto de vetores um sistema de tetradas e denotaremos como

eAµ

onde o ı́ndice latino (variando de 1 a 4) representa cada um dos vetores e o ı́ndice grego
representa sua componente vetorial. Escolheremos o vetor e0µ como o campo de veloci-
dades de um observador e os demais ei µ como vetores do tipo espaço ortonormalizados.
Isto é:

170
e0µ e0ν g µν = 1
e1µ e1ν g µν = −1
e2µ e2ν g µν = −1
e3µ e3ν g µν = −1 (3.103)

Esta expressão pode ser escrita de forma compacta pela expressão

eAµ eB
νg
µν
= η AB (3.104)

na qual η AB representa o tensor métrico de Minkowski. Podemos definir as tetradas


inversas utilizando este tensor para subir e descer indices. Com efeito, temos para as
inversas eAµ por definição
eAµ eB A
µ = δ B (3.105)
O conjunto de tetradas pode ser usado para transformar indices de coordenadas
α, β, γ, etc. em indices de tetrada. Por exemplo, consideremos um vetor Zα . Obtemos
sua componente em tetradas pela contração

ZA = Zα eAα (3.106)

e, em geral, para qualquer tensor Tαβ :

TAB = Tαβ eAα eBβ (3.107)

Assim definido, podemos considerar transformações dos vetores-base das tetradas.


Pondo
eAµ −→ eeAµ = SAB eBµ . (3.108)
Para preservar as propriedades das tetradas (ortonormalidade) impomos que o tensor
métrico das tetradas η AB não se altera por esta transformação, isto é,

SAC ηCD SBD = ηAB (3.109)

Reconhecemos assim, que as transformações das tetradas constituem uma rotação de


Lorentz. Dessa forma, temos dois tipos de transformações possiveis:
i) Rotação local de Lorentz que atua nos indices de tetradas (A, B, C, ..);
ii)Transformações arbitrárias de coordenadas que atuam nos indices de coordenadas
(α, β, µ, ...).
equaç~
ao do desvio geodesico!!

Apêndice: Campo eletromagnético


A equação do campo vetorial (sem massa) e na ausência de carga é dada por

F µν;ν = 0 (3.110)

F µν;ν = 0 (3.111)

171
A equação (3.111) pode ser posta sob a forma

Fµν;λ + Fνλ;µ + Fλµ;ν = 0

Ela permite definir um potencial Aµ pela relação

Fµν = Aµ;ν − Aν;µ = Aµ,ν − Aν,µ

onde a segunda igualdade provém da simetria da conexão do espaço de Riemann.


A equação de movimento pode ser obtida, via princı́pio variacional, a partir da La-
grangeana
1
L = − Fµν F µν (3.112)
4
O tensor momento-energia para o campo vetorial se escreve

2 δ( −gL) 1
Tµν ≡ √ µν
= Fµα F αν + gµν Fαβ F αβ (3.113)
−g g 4
Com efeito, temos
√ √  √
Z Z Z
µν 4 µν 4
δ −gFµν F d x = δ −g Fµν F d x + −g δFµν Fαβ g µα g νβ (3.114)

Daı́
1
Tµν = Fµα F αν + gµν Fαβ F αβ
4
Segue então que o traço T ≡ Tµν g µν se anula identicamente.
A equação para F µν é dada por
λ
F µν;ν = − RAµ + J µ
κ
onde J ν é uma corrente externa. A lei de conservação de carga assume a forma
λ
J µ;µ − (RA);µ = 0
κ
Usando a decomposição do tensor Fµν em suas partes elétricas (Eσ ) e magnéticas
(Bα ) (para um dado observador V µ ) podemos escrever o tensor Tµν em função de
Eα , Bα . Vamos assim identificar suas componentes ρ, πµν e qµ (conforme notação
anterior). Seja o observador caracterizado pelo vetor tangente à sua linha de Universo
v µ , normalizado, isto é v µ v ν gµν = 1., Temos

Fµν = −Vµ Eν + Vν Eµ + ηµνρν Vρ Bσ

onde os vetores elétrico (Eµ ) e magnético (Bµ ) são dados por

Eµ = Fµα V α
1
Bµ = Fµ∗ α V α = ηµαρσ Fρσ V α
2
Alguns cálculos preliminares são necessários. Temos para o invariante Fαβ F αβ em
termos dos vetores eletrico (Em ) e magnético (Hµ ).

Fαβ F αβ = −vα vβ + vβ Eα + ηαβµν vµ Bµ −v α E β + v β E α + η αβρσ vρ Bσ


 

= −2E 2 + (−2) δ µρ δ νσ − δ µσ δ νρ Vµ V ρ Bν B σ = −2E 2 + 2B 2




172
com E 2 ≡ −Eα E α e B 2 ≡ −Bα B α (obs.: note que E α e B α são vetores do tipo espaço
e assim temos Eα E α < 0 e B α Bα < 0). Daı́
1
gµν (E 2 − B 2 ) .
2Tµν = Fµα F αν −
2
Usando estes resultados obtemos as expressões procuradas:
Densidade de energia:
1
ρ = Tµν v µ v ν = (E 2 + B 2 ) (3.115)
2
Pressão isotrópica:
1 1
p = −Tµν hµν = ρ
3 3
pois Tµν g µν = T = 0. Fluxo de calor (vetor de Poynting)
1 E2
qλ = Tαβ v β hαλ = Fλµ E µ − vλ (3.116)
2 2
Mas
Fλµ E µ = −vλ Eµ + vµ Eλ + ηλµρσ vρ Bσ E µ = E 2 vλ + ηλµρσ vρ Bσ Eµ


Daı́
1 µρσ
qλ = η Eµ vρ Bσ
2 λ
Finalmente, a pressão anisotrópica se escreverá:
πµν = Tαβ hαµ hβν + phµν =
 
1 1
= Fαε F β − gαβ (E − B ) hαµ hβν + phνν
ε 2 2
(3.117)
2 2
Calculando por partes:
Fµε E ε = −vµ Eε + vε Eµ + ηµερε vρ Bσ E ε =


= E 2 vµ + ηµερσ Eε vρ Bσ = E 2 vµ + 2qµ
Fµε F εµ = −vµ Eε + vε Eµ + ηµεαβ vα Hβ (−v ε Eν + vν E ε +


+ η ενρσ v ρ B σ =


= E 2 vµ vν − Eµ Eν + ηνερ E ε v ρ B σ vµ +
+ηµερσ E ε v ρ B σ vν + η αβ ε ρ σ
µ ηενρσ vα v Bβ B .

Mas
η αβµε η ενρσ = δνρσαβµ
= δνα δρβ δσµ − δνα δσβ σρµ
−δρε δνβ δσµ + δρα δσβ δµµ + δσα δρµ δνβ − δσα δρβ δνµ
Daı́
η αβµ ε ηενρσ Vα V ρ Hβ H σ = Vν Vµ H 2 − Hµ Hν − H 2 gµν
então
Fµε F εν = E 2 vµ vν − Eµ Eν + 2qν vν + 2qµ vν − B 2 gµν +
+ vµ vν B 2 − Bµ Bν
Colectando os termos, obtemos:
1 2 1
πµν = −Eµ Eν − E hµν − Bµ Bν − B 2 hµν .
3 3
173
3.11.6 Equações de Maxwell
Na presença de fontes, representada pela corrente vetorial J µ , as equações de Maxwell
se escrevem:

F µν ; ν = J µ (3.118)

F µν ; ν = 0 (3.119)
Vamos escrevê-las usando a decomposição acima.
Primeira Projeção
Multiplicando a expressão (3.118) por vµ temos

F µν ; ν vµ = −( v α E β ); β vα + ( v β E α );β vα + (η αβµν vµ Bν ); β vα .

Expandindo a derivada covariante do campo de velocidade em função de suas quanti-


dades invariantes, podemos escrever:

F µν ; ν vµ = −E;αα − E β v α vα; β + θ E α vα + Eα; β v α v β + η αβµν vµ; ν Bα vβ

isto é,

F µν ; ν vµ = −E;αα − E α v̇α + η αβµν (ωαβ ) Bµ vν


ou, usando a definição do vetor de vorticidade:

F µν ; ν vµ = −E;αα − E α v̇ α − 2ω µ Bµ (3.120)
Finalmente podemos escrever

E;αα + E α v̇α + 2ω µ Bµ = − ρ (3.121)

onde pusemos
ρ ≡ J µ vµ
Para um observador geodésico e irrotacional, encontramos o resultado convencional
~ = −ρ
div E

Segunda Projeção
Multiplicando a expressão (3.118) por hµν temos

Fµ ν ; ν hµλ = Jµ hµλ
Desenvolvendo o lado esquerdo (LE) dessa expressão temos

µν
LE = −(vα E β );β hαλ + (v β E α );β hαλ + ηαβ vµ Bν ; β hαλ

 
1 λβ
− λβ
σ + θh +ω λβ
Eβ + θ E λ + Ėβ hλβ + η αβµν vµ Bν ; β hα λ
3
+ η αβµν
ωµβ Bν hα λ + η αβµν vβ v̇µ Bν hα λ .

174
Mas
η αβµν ωµβ Bν = − 2ω λ Bλ v α .
Segue então
 
λβ λβ 2 λβ λβ
Ėβ h − σ − θ h + ω Eβ + η λβµν vµ Bν ; β + η λβµν vβ v̇µ Bν = Jµ hµλ (3.122)
3
De um modo equivalente obtemos o outro par de equações:

B;αα + B α v̇α − 2ω µ Eµ = 0. (3.123)


 
λβ λβ 2 λβ λβ
Ḃβ h + σ − θ h + ω Bβ − η λβµν vµ Eν ; β − η λβµν vβ v̇µ Eν = 0. (3.124)
3

Exercı́cios
1. Mostre que a o volume da seção espacial da métrica (3.6) no caso  = 1 é
V (t) = 2π 2 a(t)3 .
2. Mostre que a métrica de RW é conformemente plana.
3. Mostre que equação da conservação da energia (3.46) é conseqüência da
aplicação da primeira lei da termodinâmica

T dS = dE + pdV,

ao caso do universo descrito pela métrica RW, para o qual o volume é proporcional
à a(t)3 , e a expansão é adiabática (S =constante).
4. Mostre que v µ = δ µ0 é uma geodésica para a métrica de Friedmann. Mostre
também que a congruência gerada por essa geodésica não possue rotação.
5. Calcule os vetores de Killing (10) da geometria de Sitter. Calcule em seguida
as álgebras associadas. Compare com a álgebra das isometrias do espaço de
Minkowski.
6. Nos modelos de Friedmann (com Λ = 0) vemos que aparece uma singularidade
para um dado valor de t (identificado com a origem t = 0). Este singularidade,
aparece tanto na geometria (o raio do Universo A(t) se anula para t = 0, os
invariantes geométricos divergem) quanto na matéria (a densidade ρ de energia
diverge para t = 0). Mostre que a presença da constante cosmológica, no modelo
de Lemaı́tre, evita o aparecimento da singularidade.
7. Mostre que o volume do universo de Einstein é dado por V = 2π 2 a3 .
8. Calcule a idade do universo num modelo com constante cosmológica positiva e
poeira (resultado dado pela eq.(3.82).
9. Mostre que a equação (19) é invariante por transformação conforme, no limite
µ = 0.
Sugestão: faça a transformação

ϕ → ϕ̃ = Ω−1 ϕ
gµν → g̃µν = Ω2 gµν
1
Γ̃αµν = Γαµν + Ω,µ δ αν + Ω,ν δ αµ − Ω,λ g αλ gµν

(3.125)

175
10. Mostre que as equações de Maxwell são invariantes por transformação conforme.
11. Considere um campo vetorial acoplado não-minimalmente com a gravitação e
cuja equação provém da Lagrangeana
1 √ 1 √
L= −g (1 + λWµ W µ ) R − −g Fµν F µν + Lm (3.126)
κ 2
onde Lm é a Lagrangeana que descreve os demais campos materiais.
Obtenha a equação de movimento a partir da variação dessa Lagrangeana.
Solução:

(1 + λW 2 ) Rµν − 21 Rgµν − λ2W 2 gµν + λW,µ,ν


 2
+
+λRWµ Wν = −κEµν − κMµν (3.127)

onde Mµν é o tensor de energia-momento da matéria e Eµν é o tensor de Maxwell,


dado anteriormente pela expressão (22).
12. Calcule a equação de evolução de ω µ para uma congruência geodésica.
Solução:
2
ω̇ µ + θω µ = σ µα ω α .
3
13. Em que condições o dual do tensor de Riemann independe do par onde ele está
operando? Ou seja, qual a condição para que o dual tomado no primeiro par de
ı́ndices seja igual ao tomado no segundo par de ı́ndices, isto é:


Rαβµν = Rαβ ∗µν

Solução:
1
Rµν = Rgµν .
4
COMPLETAR REFERENCIAS!!

3.12 Referências bibliográficas


[1] Livro de Weinberg.
[2] M. Novello - Cosmologia Relativista (livro da II Escola de Cosmologia e
Gravitação do CBPF (1982).
[3] M. Novello, J. Salim - Equações Quase-Maxwellianas de Gravitação (I Escola de
Cosmologia do CBPF, 1978).
[4] M. Novello - O que é Cosmologia? Editora Jorge Zahar, 2006.
[5] S. Hawking, G.F.R. Ellis - The Large Scale Structure of Space Time - (1976).
[6] General Relativity, R. Wald, U. Chicago.
[7] Cosmologia Relativista, M. Novello, II Escola de Cosmologia e Gravitação (1980).

176
Capı́tulo 4

Termodinâmica em Relatividade
Geral.

J. M. Salim1

Introdução.
Iniciaremos o nosso estudo pelo sistema fı́sico denominado Fluido Perfeito. O leitor
interessado podera consultar as referê cias [1], [2], [3] Um fluido em geral é modelado
como um contimuun caracterizado primeiramente por um campo de velocidade media
v α normalizado v α vα = 1. No caso de um fluido perfeito a velocidade é univocamente
definida como a velocidade relativa a qual não há corrente de particulas nem fluxo
de calor. Claro está que esse modelo é uma aproximação e a validade da mesma
pressupõe que o livre caminho médio das particulas constituintes do fluido deve ser
muito menor que qualquer comprimento macroscópico caracteristico do sistema. O
campo vetorial que define localmente a velocidade do fluido, também chamado de
campo de observadores comoventes com o fluido, define uma separação covariante do
espaço-tempo em espaço e tempo. Essa separação é operada pelo tensor de projeção
definido como:
hαβ = gαβ − vα vβ (4.1)
Esse operador projeta os tensores definidos em cada ponto do espaço-tempo no espaço
de repouso instantaneo do observador comovente e a métrica desse tri-espaço é de-
terminada pelo tensor hαβ . As operações de derivação covariante no tri-espaço são
definidas como:
∇ˆ α φ = hβ φ|β (4.2)
α

ˆ α Aˆβ = hµα hνβ ∇µ hλµ Aλ


∇ (4.3)
e a generalização imediata que dai decorre para tensores de ordem mais alta. No
referencial comovente instantâneo (RCI) , usando coordenadas adaptadas temos que:
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.

177
v α = δ0α (4.4)

Um vetor arbitrário Aα projetado no RCI e utilizando-se coordenadas adaptadas tem


por compontes:

Aˆα ≡ hαβ Aβ =(0,


˙ ~
A) (4.5)

O ponto sobre o sinal de igual indica que a igualdade só vale nesse sistema de coorde-
nadas e o chapeu sobre o vetor Aα indica que se trata da projeção do vetor no espaço
de repouso instantâneo do observador comovente. Ainda nesse sistema de coordenadas
o tensor métrico do tri-espaço perpendicular a v α assume a seguinte forma simples:

h0α =0
˙ (4.6)

hij =g
˙ ij (4.7)

Todo tensor pode ser decomposto em suas partes perpendicular a v α (espaço de repouso
instantâneo do observador comovente) e paralela a v α , para nós será de particular
interesse a decomposição da derivada covariante do vetor velocidade:

vα||β = hµα hνβ vµ||ν + aα vβ , (4.8)

onde ()||α denota a operação de derivada covariante. Nessa expressão aα = vα||β v β é a


aceleração do fluido e como vα v α = 1 segue que aα vα = 0. A projeção perpendicular
a v α do gradiente da velocidade vamos denotar por vαβ ≡ hµα hνβ vµ||ν . Esse tensor pode
ser decomposto em suas partes irredutı́veis como:

1
vαβ = hαβ θ + σαβ + ωαβ . (4.9)
3
onde

θ = vαα , (4.10)
1 1
σαβ = (vαβ + vβα ) − hαβ θ, (4.11)
2 3
e

1
ωαβ = (vαβ − vβα ) (4.12)
2
são respectivamente, a expanção, o tensor de cisalhamento e o tensor de rotação.
Exercı́cio. Mostre que no espaço de repouso instantâneo do observador comovente esses
tensores se reduzem aos correspondentes objetos da hidrodinâmica Newtoniana. No
RCI, em coordenadas adaptadas, a lei de Pascal é valida e a pressão exercida por uma
dada porção do fluido é a mesma em todas as direções e perpendicular a área onde
ela atua, logo
hα µ Tµν dsν =
˙ δα i Tij dsj =
˙ δα i p dsi (4.13)

Segue dai que


Tij =
˙ p gij =
˙ p hij (4.14)

178
Tendo isso em conta, conteudo de energia e momento do fluido perfeito em um sistema
arbitrário de coordenadas é descrito pelo tensor

T αβ = ρ v α v β − p hαβ (4.15)

Esse tensor satisfaz a seguinte equação (consequência direta das equações de Einstein):

T αβ ||β = 0. (4.16)

Essa equação pode ser decomposta em suas partes paralela (vα T αβ ||β = 0) e perpen-
dicular (hα β T βλ = 0) a v α como segue:

ρ|α v α + θ (ρ + p) = 0 (4.17)

p|α hαβ = (ρ + p) v β (4.18)

É facil mostrar que no (RCI) essas equações se reduzem a:


∂ρ .
~ . ~v =
+ (ρ + p)∇ 0 (4.19)
∂t

∂~v . ~
(ρ + p) = ∇p. (4.20)
∂t
Além dessas equações devemos acressentar a equação de conservação do número de
particulas
N α ||α = (n v α )||α = 0 (4.21)

e a equação de conservação de entropia

S α ||α = ( s N α )||α = 0 (4.22)

Nessa expressão s é a entropia especı́fica. Vimos então que um fluido perfeito é car-
acterizado pelas variáveis (N α , S α , T αβ ), essas variáveis devem satisfazer as equações
de conservação que discutimos anteriormente. Nesse conjunto de variáveis temos sete
variáveis e seis equações de conservação. Ademais dessas equações a termodinâmica
nos fornesse a equação de Gibbs
ρ 1
T ds = d( ) + p d( ) (4.23)
n n

Essa equação nos mostra que são necessários dois escalares como variáveis indepen-
dentes e uma nova variável conhecida como temperatura (T ) é introduzida. Assim
supondo que o fluido perfeito já determinou a geometria temos um sistema de oito
variáveis e sete equações. Para podermos determinar o sistema é nessário ainda for-
nesser uma equação de estado, usulamente p = p(ρ, n). Dependendo do caso es-
pecı́fico a ser tratado é comum utilizar-se outras variáveis independentes, a saber
(s, ρ), (s, T ), (n, T ), etc. Tomando como variáveis independentes (ρ, p) na equação de
Gibbs no caso de um fluido perfeito temos:
 
ρ + p ∂n ∂n 1
T ds = − 2 dρ + dp + dρ (4.24)
n ∂ρ ∂p n

179
ou

n2 T
 
n ∂n ∂n
ds = − dρ − dp (4.25)
ρ+p ρ + p ∂ρ ∂p
Como n = n(ρ, p) segue que

∂n ∂n
ṅ = ρ̇ + ṗ. (4.26)
∂ρ ∂p
Logo
∂n ṅ ∂n ṗ
= − (4.27)
∂ρ ρ̇ ∂p ρ̇
Substituindo esse resultado na expressão anterior para a equação de Gibbs encon-
tramos:
n2 T
 
n ṅ ∂n ṗ ∂n
ds = − − dρ − dp (4.28)
ρ+p ρ + p ρ̇ ∂p ρ̇ ∂p
Finalmente usando a equação de conservação para o numero de particulas e densidade
de energia obtemos:  
2 ∂n ṗ
n T ds = (ρ + p) dρ − dp (4.29)
∂p ρ̇
Dessa expressão segue que para um fluido barotrópico p = p(ρ), ds = 0. Os exemplos
mais comuns de fluidos desse tipo é a radiação p = 13 ρ. Em cosmologia costuma-se
usar equação de estado barotropica linear:

p = (γ − 1)ρ (4.30)

Em geral a velocidade do som adiabática é dada por


 
2 ∂p
cs = . (4.31)
∂ρ s

Escolhendo (s, ρ) como variáveis independentes, em geral segue que:


   
∂p ∂p
dp = dρ + ds (4.32)
∂ρ s ∂s ρ

No caso particular de um fluido barotrópico ou num regime adiabático (ds = 0) tem-se


que:

c2s = (4.33)
ρ̇
Note que em geral essa expressão não é válida.

4.1 Termodinâmica de Processos Dissipativos


Vamos considerar agora fluidos submetidos a processos dissipativos, por simplicidade
vamos restringir nossa análise a fluidos simples (uma componente). Nas descrições
originais[2,7], extensões relativı́sticas das descrições clássicas, o estado de um fluido

180
de uma componente fora do equilı́brio é determinado por uma variável cinética, a
velocidade do fluido v µ , e duas variáveis termodinâmicas, o número de partı́culas por
unidade de volume n e a energia interna especı́fica. A idéia básica que orienta essas
descrições é a hipótese do equilı́brio local[8] que impõe que a equação fundamental da
termodinâmica depende localmente das mesmas variáveis como no equilı́brio; não são
necessárias variáveis adicionais e a equação fundamental contem toda a informação
sobre o sistema. Nessas descrições o tensor momento energia, bem como a corrente de
partı́culas, são modificadas respectivamente como
Tµν = ρ vµ vν − p hµν + 4Tµν = T̄µν + 4Tµν , (4.34)
N µ = n v µ + 4N µ , (4.35)
onde ∆Tµν e ∆Nµ representam o efeito da dissipação presente na dinâmica do flu-
ido.Antes de seguirmos adiante devemos chamar a atenção para o fato de que a
quadrivelocidade do fluido V µ não tem sentido fı́sico preciso uma vez que podemos
tomá-la como a velocidade do fluxo de energia v µ = vEµ ou a velocidade do fluxo de
µ
particulas v µ = vN . No primeiro caso, no referencial definido por vEµ , o fluxo de energia
é nulo:
Tνµ vEν = ρvEµ (4.36)

No segundo caso, no referencial definido por vEµ , o fluxo de particulas é nulo


µ
N µ = n vN (4.37)

Tendo feito as correções do tensor energia-momento e do vetor corrente de particulas,


as definições das variáveis de equilibrio ρ, p, n tornam-se, como consequência da am-
biguidade de v µ , indeterminadas. Essa dificuldade é superada fixando-se v µ e definindo
ρ e n no referencial comovente:
ρ = T µν v ν v ν (4.38)
n = N µ vµ (4.39)

Ademais dessas definições temos de caracterizar se o referencial comovente escolhido é


µ
o de Eckart (vN ) ou o de Landau (vEµ ). Esses são caracterizados respectivamente pelas
seguintes condições:
N µ hαN µ = N µ (δµα − vN
α
vN µ ) = 0 (4.40)
Tνµ vEµ hαEν = 0 (4.41)

As duas formulações, em primeira ordem, são inteiramente equivalentes.


Iremos inicialmente adotar a descrição de Eckart. Nesse caso é fácil mostar que segue
diretamente das definições anteriores que
∆N α = v α v β ∆Tαβ = 0 (4.42)
assim todos os efeitos dissipativos estão contidos em ∆T µν . O tensor T αβ e o vetor N µ
satisfazem as leis de balanço (4.16), (4.17), (4.18) e (4.21), assim podemos escrever:
ρ+p
vµ T¯µν ;ν = ρ̇ + θ(ρ + p) = ρ̇ − ṅ = −vµ (∆T µν );ν (4.43)
n
A equação acima é local, utilizando agora a equação de Gibbs
1 ρ+p
T ṡ = ρ̇ − ṅ (4.44)
n n2
181
podemos reescrever (4.43)como

vµ T¯µν ;ν = T n ṡ = −vµ (∆T µν );ν (4.45)

ou ainda

T (n s v µ );µ = −vµ (∆ T µν );ν . (4.46)

Partindo dessa expressão definimos o vetor corrente de entropia commo:


1
sµ = n s v µ + vα ∆T µα (4.47)
T

A lei de balanço para a entropia (4.46) agora pode ser escrita como:

vα;µ T,µ
sµ ;µ = − ∆T αµ + 2 vα ∆T αµ (4.48)
T T

A segunda lei da termodinâmica requer que o lado direito de (4.48) seja positivo
definido , essa imposição nos permite determinar ∆T µν como uma combinação linear
dos gradientes da temperatura e velocidade. Note que a correção ∆T µν não pode
conter termos envolvendo gradientes das variáveis de equilibrio ρ, n e p pois, nesse
caso, não seria possı́vel obter para o lado direito de (4.48) termos positivos definidos
para configurações arbitrárias do fluido. A seguir vamos utilizar a bem conhecida
decomposição de vαµ em suas partes irredutiveis:

1
vαβ = σαµ + ωαµ + θ hαµ + aα vµ (4.49)
3

Substituindo (4.49) em (4.48) obtemos:

∆T αµ
   
θ T,µ aα v µ
sα;α = σαµ + hαµ − vα − ∆T αµ (4.50)
3 T T2 T

Expressando ∆T αµ em função de suas partes irredutiveis e tendo em conta (4.15)


obtemos:
∆T αµ = π αµ + π hαµ + v α q µ + v µ q α (4.51)
onde π, π αµ e q µ são respectivamente, a viscosidade ”bulk”, a pressão anisotrópica e
o fluxo de calor; os dois ultimos são perpendiculares a v µ e π µν tem traço nulo.
Substituindo (4.50) em (4.51) obtemos:

σαµ π αµ
 
α θπ T,µ aµ
s ;α = − − 2
− qµ (4.52)
T T T T

A imposição de que o lado direito dessa expressão seja positivo definido nos leva a:

π αµ = η θ (4.53)

π = −ζ θ (4.54)
q µ = χ hµα (T,α − T aα ) (4.55)

182
Nessas expressões η, ζ e χ são respectivamente os coeficientes de viscosidade de dis-
torção ou ligamento, de viscosidade volumar e de condução de calor. Esses coeficien-
tesdevem ser todos positivos definidos. Assim obtemos:

πµν π µν π2 q µ qµ
sµ ||µ = + − (4.56)
ηT ζT χT 2

As relações constitutivas (4.53), (4.54),(4.55), as equações de balanço (), (), e () e


as equações de estado fornecem um conjunto de 16 equações para as 16 variáveis in-
dependentes: ρ, n, T, p, π, q µ , π µν e as três componentes independentes da velocidade.
Assim o problema está completamente determinado para convenientes condições de
iniciais e de contorno.
Essa formulação, válida para processos quase estacionários, apresenta, no en-
tanto, algumas dificuldades de princı́pio e de ordem experimental que passamos a
enumerar([5]).
a) A formulação está baseada, a priori, no princı́pio de equilibrio local, que parece
excessivamente restritivo em muitos casos. Diferentes variáveis própias para descr-
ever processos fora do equilibrio podem ser utilizadas para modificar as equações da
Termodinâmica em situações fora do equilı́brio.
b) As equações constitutivas levam, quando introduzidas nas equações de balanço,
a equações parabólicas implicando velocidade infinita para a propagaçào de sinais
térmicos e viscosos.
c)Do ponto de vista microscópico, tendopor base a teoria cinética, obtêm-se equações
constitutivas que são mais gerais do que as que as que obtivemos, incluindo tempo de
relaxação e termos não lineares.
Essas deficiências são devidas ao fato de que as teorias convencionais fazem hipóteses
excessivamente restritivas concernentes à relação entre os fluxos de entropia, energia
e número de partı́culas.
Neste primeiro curso não iremos apresentar a termodinâmica estendida, o leitor inter-
essado pode consultar as referencias ([4][5]).

4.2 Aplicação á Cosmologia


É longamente aceito que apenas modelos cosmológicos possuindo um estado inicial
extremamente denso e com uma temperatura muito alta podem explicar as observações
que temos de nosso Universo. Entre essas, a mais importante é a radiação de 3 ◦ K
juntamente com a abundância de He. Até a decada de 1970, os diferentes modelos
utilizados para descrever a fase primordial da evolução do Universo utilizavam como
fonte das equações de Eisntein um fluido perfeito ultra-relativistico (p = 31 ρ).
Esses modelos não possuem elementos para explicar a enorme entropia adimensional
por bárion da ordem de 108 − 109 , como enfatizado principalmente por Zeldovich [6].
A questão que decorre imediatamente desse dados é: como originou-se essa enorme
quantidade de calor? Weinberg [7], levando em conta a ação de processos dissipativos,
fez uma estimativa da produção de entropia devido à viscosidade volumar. Nesses
cálculos ele utilizou o coeficiente de viscosidade obtido atrvés da solução do problema
de transporte de radiação quando o livre caminho médio e o livre tempo médio são

183
muito pequenos comparados com o inverso da constante de Hubble. O resultado obtido
foi muito inferior ao valor observado. Seguiram-se vários trabalhos p.ex. [8], [9], [10],
onde os autores dedicaram-se à procura de uma solução para esse problema. Iremos
dedicar especial atenção ao modelo de Murphy. Nesse a fonte das equações de Einstein
é um fluido viscoso homogêneo e isotrópico, sendo a viscosidade volumar descrita pela
equação fenomenológica
π = −ζ θ (4.57)
Em modelos desse tipo a viscosidade decorre da interação da matéria com a radiação.
No trabalho de Murphy a expressão para o coeficiente de viscosidade volumar adotada
foi a seguinte ([10]):
ζ = αρ (4.58)
Nesse caso, a expressão para o fluido se reduz a:

Tµν = ρ vµ vν − (p − α ρ θ) hµν (4.59)

A geometria do espaço-tempo é descrita pela métrica de Robertson-Walker:


a2 (t)
ds2 = dt2 − dx2 = dy 2 + dz 2

kr2 2
(4.60)
(1 + 4 )

Por simplicidade, vamos considerar apenas modelos com seção plana k = 0. Nesse caso
as equações de Einstein se escrevem como:
1 2 ȧ
8πGρ = θ = 3 H 2 := 3 (4.61)
3 a
 
8πG (γ − 1 − 3α H) ρ = − 2 Ḣ + 3 H 2 , (4.62)
onde utilizamos a equação de estado p = (γ − 1) ρ.
Eliminando ρ nas equações (4.61) e (4.62) obtemos:
3(γ − 3αH) 2
Ḣ + H =0 (4.63)
2
Primeiramente notemos a solução simples Ḣ = 0, nesse caso:
γ
H = H0 = , (4.64)

e a pressão total do fluido se reduz a

p = pe + π = (γ − 1)ρ − 3 α ρ H0 = − ρ. (4.65)

Nesse caso a solução obtida é a solução de Sitter, sem a necessidade de introduzir a


constante cosmológica.
A solução geral para a eq.(4.63) é:
3γH0 (t − t0 )
= ln a3γ/2 + C a3γ/2 , (4.66)
2
onde substituimos α em função de H0 . Essa solução possui duas situações limites de
interesse:
a << 1 | ln a3γ/2 | >> C a3γ/2 ⇒ a = exp H0 t. (4.67)

184
O outro limite é
C a3γ/2 >> | ln a3γ/2 |. (4.68)
Então
a = (3 γ H0 t /2C)2/3γ , (4.69)
que é uma solução do tipo Friedmann, sendo os efeitos da viscosidade desprezı́veis.
Devemos ressaltar que as soluções obtidas NÃO TÊM SINGULARIDADE. Esse re-
sultado, que inicialmente despertou grande interesse para o modelo, não resistiu a
uma análise mais geral da dinâmica do modelo. Em 1975 e posteriormente em 1977,
Belinski e Khalatnikov [11], [12] utilizaram a técnica de análise qualitativa para estu-
dar o sistema de equações que acabamos de obter. Nesse trabalhos ficou demonstrado
que mesmo em situações mais gerais do que a estudada por Murphy, a singularidade
não pode ser evitada dado que a solução de Murphy não é estável frente a peque-
nas perturbações. Essas dificuldades podem ser ultrapassadas utilizando a teoria da
termodinâmica causal [13], [14], [15].

4.3 Exercı́cio
Mostre que as descrições de Landau e Eckart são equivalentes quando levamos em
conta apenas termos em primeira ordem nas correções ∆N α e ∆T µν .

4.4 Referências bibliográficas


[1] Gravitation and Cosmology, S. Weinberg, John Wiley (1972).
[2] Fluid Mechanics, L. D. Landau and E. M. Lifshitz. Pergamon Press (1982).
[3] Gravitation, C. M. Misner, K. S. Thorne and J. A. Wheeler. Freeman and Com-
pany (1973).
[4] W. Israel, Ann. of Physics 100, 310, (1976).
[5] D. Jou, J. Casas-Vasquez and G. Lebon. Rep. Prog. Phys.51,1105, (1988).
[6] Ya. B. Zeldovich, Sov. Phys. Uspekhi,9, 602, (1967).
[7] S. Weinberg, Astr. Journ. 168, 175, (1971).
[8] M. Heller, L. Suszycki, Acta Phys. Pol. B5, 345, (1974).
[9] L. Suszycki, Acta Cosmologica CCCCLXXXIII, 147, (1978).
[10] G. L., Murphy, Phys. Rev. D 8, 4231, (1973).
[11] V. A. Belinskii, I. M. Khalatnikov, Sov. Phys. JET 42, 205, (1975).
[12] V. A. Belinskii, I. M. Khalatnikov, Sov. Phys. JET 45, 1, (1977).
[13] H. P. de Oliveira, J.M. Salim, Acta Phys. Pol. B19, 649, (1988).
[14] M. Novello, H. P. de Oliveira, J.M. Salim, J. Torres, Acta Phys. Pol. B21, 571,
(1989).
[15] D. Pavon, D. Jou, et all, Class. Quantum Grav.8, 347, (1991).

185
Capı́tulo 5

Fı́sica de Objetos Compactos

Herman J. Mosquera Cuesta1

O leitor se perguntará: Por quê estudar os fundamentos da fı́sica de objetos as-


trofı́sicos compactos no âmbito do Programa Mı́nimo de Cosmologia? Sem dúvida,
uma resposta a esta questão passa pela consideração que a matéria visı́vel do Universo,
conforme o conhecemos hoje, esta principalmente constituı́da por estrelas, além é
claro da poeira e gás interstelar e intergaláctico. A transformação dessas estrelas ao
longo de suas vidas, segundo a teoria padrão da evolução estelar, deve produzir como
remanescente uma famı́lia muito especial de corpos celestes: buracos negros, estrelas
de nêutrons e anãs brancas, referidos na literatura cientı́fica como objetos compactos
por causa que seus tamanhos são excessivamente pequenos quando comparados com
estrelas normais da mesma massa, que tı́picamente possuem um raio como o do Sol.
São inúmeras as informações sobre a origem e evolução do Universo que podem ser
obtidas através do estudo desta classe de objetos. Por exemplo, alguns modelos de
supernovas tipo Ia (cujas observações sugerem que o universo está numa fase de
expansão acelerada) envolvem a coalescência de duas anãs brancas. Mais importante
ainda, o estudo da taxa de esfriamento das anãs brancas permite impôr limites sobre
sua idade, e consequentemente sobre a idade do universo, e ainda sobre a existência ou
não de dimensões espaciais extras. Isto por si só justifica o estudo apresentado a seguir.

5.1 Introdução
O estudo da origem, ou formação , e evolução das estrelas nos mostra que estas
evoluem de tal maneira que ao final de suas vidas dramáticos eventos acontecem, e
como consequência destes uma classe de objetos estelares muito peculiares podem
vir a ser produzidos. Esta classe de objetos é referida em astrofı́sica como Objetos
Compactos, em clara referência a sua comparação , em termos de escalas de massas
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.

186
e tamanhos, com as estrelas normais conhecidas como estrelas da sequência principal
(ver Figura 5.1, o diagrama de Hertzsprung-Russell, ou diagrama HR). Esta classe de
objetos compactos é constituı́da por estrelas anãs brancas (ABs), estrelas de nêutrons
(ENs) (incluem-se aqui as estrelas de quarks), e buracos negros (BNs). A ordem de
apresentação usada neste capı́tulo segue a hierarquia de intensidades do campo grav-
itacional em cada um destes objetos, supondo que eles possuam uma mesma massa
(ver Tabela 1).
Tabela 1??
Desta forma, estes corpos celestes representam o ponto final da evolução de estrelas
normais, e passam a ser, portanto, um ingrediente fundamental do conteudo fı́sico do
Universo.
Nesta primeira aproximação á fı́sica de tais objetos, estaremos procurando entender
tanto a origem de suas principais propriedades fı́sicas, bem como caracterizando-os
em relação ao resto dos corpos celestes que podem de alguma maneira ser observados
com os modernos instrumentos astronômicos como os telescópios de raios-X e raios-γ,
os radiotelescópios, e o telescópio espacial Hubble, dentre muitos outros.
Para começarmos esta fundamentação da fı́sica dos objetos compactos é bom lembrar
as propriedades fı́sicas que os tornam definitivamente diferentes das estrelas normais.
Em primeiro lugar, eles são remanescentes da evolução estelar normal, isto é; eles con-
stituem o estágio final da vida das estrelas ordinárias. Ao alcançar este estágio, uma
estrela normal teria esgotado todo seu combustı́vel nuclear. Isto a deixaria pronta para
sofrer o colapso gravitacional no seu interior, processo através do qual estes objetos
compactos poderão vir a se formar. De fato, é a queima deste combustı́vel durante a
fase de estrela da sequência principal(SP) o que sustenta estas estrelas normais em
contra da atração gravitacional produzida pela própria matéria que as constitue, evi-
tando assim seu colapso. Visto desta maneira, uma estrela normal, ou da SP, é uma
esfera de gás em equilı́brio hidrostático. Este equilı́brio acontece entre a força gravita-
cional, que tenta compactar esta matéria, e a pressão térmica gerada pela queima do
combustı́vel nuclear que tenta espargı́-la, ou desagregá-la, para o infinito onde não há
força atrativa qualquer capaz de re-agregá-la. Só para exemplificar, uma anã branca
(AB) é suportada pela força de repulsão (pressão) quântica, ou de degenerescência,
dos seus elétrons. Entretanto, uma estrela de nêutrons (ENs) é sustentada pela pressão
quântica de seus nêutrons, também degenerados 2 .
O outro elemento diferenciador entre objetos compactos e estrelas ordinárias é o seu
tamanho, excessivamente pequeno quando comparado com estrelas normais de massa
comparável. Tem de se notar aqui que objetos de massa similar mas de raio compar-
ativamente menor possuem campos gravitacionais em suas superfı́cies que são pro-
porcionalmente mais intensos. Uma estimativa da intensidade destes campos grav-
itacionais pode ser obtida calculando (a lá Newton) a aceleração gravitacional na
superfı́cie de uma estrela AB, de nêutrons, ou ainda de um buraco negro, e compará-
la com aquela na superfı́cie de nosso planeta, por exemplo. É bom frisar aqui que este
conceito aplica-se a estrelas totalmente colapsadas, isto é, estrelas que não encontram
meios de se suportar em contra do puxão produzido pela sua própria gravidade e co-
2
Diz-se que uma distribuição de matéria é degenerada quando sua pressão não se reduz a zero apesar
de sua temperatura, ou energia térmica, pode ser quase nula, i.e., ∆T ∼ 0. Posto de outra maneira, a
pressão quântica não responde a mudanças de temperatura, mas sim ao Principio de Exclusão de Pauli.

187
188
189
lapsam a uma singularidade. A descrição da fı́sica de buracos negros é o assunto do
Capı́tulo 6 deste curso.
Esclarecemos ainda que nosso objetivo aqui é fornecer uma introdução ao estudo desta
classe de corpos astrofı́sicos, focalizando nossa atenção nos elementos “essenciais” de
sua fı́sica e evolução . Assim sendo, apresentar-se-ão neste capı́tulo os fundamentos
desta fı́sica, ficando para os interessados revisarem algumas das referências forneciadas
ao final para obterem uma descrição mais detalhada destes objetos. Em particular,
nossa fonte mais imediata é o livro de S. L. Shapiro & S. A. Teukolsky: Black holes,
white dwarfs and neutron stars: The physics of compact objects (Wiley & Sons, New
York, 1983). Entretanto, cabe alertar que estudos mais aprofundados irão requerer de
um entendimento fı́sico refinado da estrutura da matéria a altas densidades e pressões e
da natureza das interações entre partı́culas, incluindo as forças forte e fraca, o eletro-
magnetismo, e a gravitação , as quais desempenham um papel crı́tico na dinâmica
destes sistemas. Um tal estudo está fora do escopo deste livro.

5.2 Anãs brancas


O entendimento atual (modelo padrão) da evolução estelar sugere que as anãs bran-
cas se formam a partir de estrelas leves com massas M não maiores do que 4.0 M ,
após uma explosão de energia moderada, denominada (Helium flash), que da origem
à formação de uma nebulosa planetaria, a qual possui uma AB como principal re-
manescente em seu centro. No caso das anãs brancas vamos focar nossa atenção em
duas propriedades fı́sicas fundamentais: a) a condição de equilı́brio hidrostático, e b)
o limite de massa para estas estrelas estabelecido por S. Chandrasekhar na década dos
anos ’30s.

5.2.1 O advento da degenerescência: mecânica quântica em


ação

Imagine uma distribuição esfericamente simétrica de matéria. A massa contida num


raio r é dada por
Z r
dm(r)
m(r) = 4πρr2 dr −→−→−→ = 4πρr2 , . (5.1)
0 dr
onde ρ ' ρ0 é a densidade de matéria em repouso. Supómos também que esta é
não-relativı́stica, isto é, suas partı́culas satisfazem a condição v < c. Uma vez que a
estrela encontra-se em estado estacionário, a força gravitacional contrabalança, ponto-
a-ponto a força oriunda da pressão. Para derivar a equação de equilı́brio hidrostático
podemos considerar um elemento infinitesimal de fluido de área dA, perpendicular
à direção radial, e localizado entre r e r + dr. A atração gravitacional entre m(r)
e dm = ρ dAdr resulta ser a mesma que se obtém ao se considerar que m(r) está
concentrada num ponto no centro da distribuição , enquanto que a massa externa não
exerce força alguma sobre o elemento dm. A força neta devida á pressão para fora é
o produto da diferença de pressões sobre essa superfı́cie, á distância r, vezes a área
do elemento de fluido, isto é: P (r + dr) − P (r)]dA, de tal maneira que o equilı́brio se

190
estabelece se
dP m(r)
− = G 2 dm, (5.2)
dr r
ou equivalentemente,
dP m(r)ρ
= −G 2 . (5.3)
dr r
~ = −ρ∇Φ,
De modo geral, equilı́brio hidrostático implica que ∇P ~ onde Φ é o potencial
gravitacional produzido pela distribuição de massa m(r), o qual pode ser obtido a
aprtir da equção de Poisson.
Uma consequência imediata da lei de equilı́brio hidrostático é o chamado Teorema
do Virial, o qual determina que a energia potencial gravitacional W de uma dis-
tribuição de matéria (a estrela) é dada por
Z R
m(r)ρ
W =− G 2
4πr2 dr. (5.4)
0 r
Usando a Eq.(5.3) acima, pode-se escrever
Z R
dP (r)
= 4πr3 dr (5.5)
0 dr
Z R
= −3 4πr2 P (r)dr, (5.6)
0

obtida após uma integração por partes.


Por outro lado, se o gás é caracterizado por uma equação de estado (adiabática) do
tipo politrópica
P = KρΓ0 , (5.7)
onde K e Γ são, correspondentemente, a constante e expoente politrópicos. Podemos
usar a primeira lei da termodinâmica, supondo mudanças adiabáticas na sua evolução ,
para escrever    
E 1
d = −P d , (5.8)
ρ0 ρ0
onde E é a densidade de energia total, de tal forma que a densidade de energia do gás
(excluı́da sua massa de repouso) vem a ser dada por

P (r)
E0 = . (5.9)
Γ−1
A equação (5.8) pode ser integrada usando a eq.(5.7) para obter

P (r)
E = ρc2 + , (5.10)
Γ−1
que conduz ao resultado:
E 0 ≡ E − ρ0 c2 . (5.11)
A equação (5.6) pode ser rescrita como

W = −3(Γ − 1)U, (5.12)

191
onde Z R
U= 4πr2 E 0 dr (5.13)
0

é definida como a energia interna total da estrela. Assim, a energia total da estrela se
escreve então como E = W + U . Para um gás de Maxwell-Boltzmann com expoente
adiabático Γ, a energia de movimento translacional ET é dada por ET = 23 (Γ − 1)U ,
de tal forma que o teorema do virial para esse gás se reduz a
1
ET = − W. (5.14)
2
Portanto, a energia total dessa estrela é

3Γ − 4
ET + W + U = − |W |, (5.15)
3(Γ − 1)
2
onde W ∼ −G MR . Além disto, pode-se mostrar que se a equação de estado do gás
da estrela segue a lei politrópica descrita pela eq.(5.7), então a energia potencial dela
resulta ser dada (após uma dupla integração por partes) pela expressão

3(Γ − 1) GM 2
W =− . (5.16)
5Γ − 6 R

Quando uma estrela normal esgota seu combustı́vel nuclear sua energia total E diminui
por causa da radiação que ela emite. Assim, segundo as eqs.(5.15,5.16), se ∆E ≤ 0
então ∆R ≤ 0 sempre que Γ  34 , isto é, a estrela se contrai. Dai surge a pergunta,
até que ponto pode a estrela se contrair? Ou em outras palavras, pode a estrela se
contrair indefinidamente até alcançar um raio R ∼ 0 ? A resposta a esta questão é não!
sempre e quando a massa da estrela M for da ordem de 1M , conforme demonstramos
a seguir.
Suponha que a pressão durante um colapso em quase-equilı́brio seja dada pela lei de
Maxwell-Boltzmann
ρ0
P = κT, (5.17)
µmu
onde µ define o peso molecular médio do gás, mu a unidade atómica de massa, T a
temperatura do gás, e κ uma constante. Note que para Carbono (12 C) puro e ionizado
µ = 12/7. Assim, pelo teorema do virial
Z R
−W = 3 4πr2 P (r)dr, (5.18)
0
3κT̄ R
Z
= 4πr2 ρ0 dr, (5.19)
µmu 0
3M
= κT̄ , (5.20)
µmu

onde T̄ representa a temperatura média na estrela. Desta maneira T̄ ∝ M/R, isto é,
T̄ aumenta quando R diminui. No entanto, note ρ̄ ∝ M/R3 , de modo que a densidade
aumenta muito mais rapidamente ainda. Este resultado sugere a não validade da lei
de Maxwell-Boltzmann nestas condições de colapso, pois o gás de elétrons se torna
degenerado!, e portanto provê uma fonte de suporte de pressão inclusive a temperatura

192
zero! Vejamos o por quê. A diferença de momento linear tı́pico entre elétrons num gás
de Maxwell-Boltzmann é
 1/2
1/2 12me GM mu µ
∆Pe ∼ 6me κT̄ ∼ , (5.21)
7R

onde usamos Γ = 5/3 e as eqs.(5.16, 5.20). Observe que para dois elétrons
1/2
∆prms = (p~1 − p~2 )2 . (5.22)

Uma vez que a separação tı́pica entre elétrons é


1/3 1/3
4µe mu R3
 
µe mu
∆qe ∼ ∼ , (5.23)
ρ0 M

o volume ocupado por um elétron no espaço de fase resulta ser


 3/2
3 12µ 3
(Gme R)1/2 m5/6 1/6

(∆prms ∆qe ) ∼ u M (5.24)
7
1/6   1/2 #3
M −26 R 2 −1
∼ 40 1 × 10 g cm s (5.25)
M R
 1/2  3/2
3 M R
∼ 180h . (5.26)
M R

Desta maneira, quando uma estrela de 1 M se contrai até alcançar um raio R ∼


3 × 10−2 R , o volume do espaço de fase ocupado por um elétron passa a ser ∼ h3 !
Neste ponto, o Principio de Exclusão de Pauli se torna importante, e a estatı́stica de
Fermi-Dirac deve ser usada. Mostraremos logo mais que inclusive a temperatura zero
um tal gás exerce pressão, a qual é denominada pressão de degenerescência. É esta a
que suporta estrelas tipo anãs brancas e de nêutrons.

5.3 Modelagem de anãs brancas tipo politropo


A equação de estado (EOS) de um gás perfeito de Fermi reduz-se à forma politrópica
simples da eq.(5.7) no caso limite extremo de elétrons não-relativı́sticos (Γ = 5/3) e
ultra-relativı́sticos (Γ = 4/3). Configurações de equilı́brio que sejam descritas por uma
tal equação de estado são chamadas de politropos e são relativamente simples de se
analisar.

5.3.1 Limite de baixa densidade (Γ = 5/3)

As equações de equilı́brio hidrostático (5.1) e (5.3) podem-se combinar para produzir

r2 dP
 
1 d
= −4πGρ. (5.27)
r2 dr ρ dr

193
Substituindo a equação de estado (5.7), e definindo Γ ≡ 1 + n1 , onde n é o chamado
ı́ndice politrópico, podemos escrever esta equação em forma adimensional usando as
definições seguintes
ρ
= θn , (5.28)
ρc
r
= ξ (5.29)
a
!1/2
(1/n−1)
[n + 1]Kρc
a = , (5.30)
4πG

onde ρc = ρ(r = 0) define a densidade no centro da estrela. Desta forma

1 d 2 dθ
ξ = −θn . (5.31)
ξ 2 dξ dξ
Esta é a conhecida equação de Lane-Emden para a estrutura de um politropo de
ı́ndice n. As condições de fronteira no centro de uma estrela politrópica são (o simbolo
0
indica derivada com respeito a ξ)

θ(0) = 1 θ0 (0) = 0. (5.32)

A primeira condição na eq.(5.32) segue-se diretamente da Eq.(5.29), enquanto que a


segunda obtém-se do fato que m(r) ' 4πr3 ρc /3 perto do centro da estrela, de modo
que a Eq.(5.3): dP (ρ)/dr = 0 implica dρ/dr = 0 no centro.
A equação de Lane-Emden pode ser integrada numericamente, iniciando em ξ = 0
com as condições de contorno (5.32). Encontra-se que para n < 5, (Γ > 6/5), as
soluções decrescem monotonicamente e possuem um mı́nimo (zero!) para um valor
finito ξ = ξ1 , tal que θ(ξ1 ) = 0. Este ponto corresponde à superfı́cie da estrela onde
P = ρ = 0. Assim, o raio da estrela é obtido a partir desta condição como
 1/2
[n + 1]K
R = aξ1 = ρ(1−n)/2n
c ξ1 , (5.33)
4πG

enquanto que a massa da estrela vem dada por


Z R
M = 4πr2 ρdr (5.34)
0
Z ξ1
3
= 4πa ρc ξ 2 θn dξ (5.35)
0
Z ξ1  
3 d 2 dθ
= −4πa ρc ξ dξ (5.36)
0 dξ dξ
= 4πa3 ρc ξ12 |θ0 (ξ1 )| (5.37)
 3/2
[n + 1]K
= 4π ρc(3−n)/2n ξ12 |θ0 (ξ1 )|. (5.38)
4πG

Eliminado ρc entre as Eqs.(5.33) e (5.38) obtém-se a relação massa-raio para politro-


pos:
 n/(n−1)
[n + 1]K (3−n)/(1−n) 2
M = 4πR (3−n)/(1−n)
ξ1 ξ1 |θ0 (ξ1 )|. (5.39)
4πG

194
As soluções nas que estamos mais interessados correspondem a valores dos parâmetros
[tomados da lista de parâmetros calculados por S. Chandrasekhar no livro: An intro-
duction to the stellar structure, Dover (1939)]
 
5 3 2 0
Γ = −→ n= , ξ1 = 3.65375, ξ1 |θ (ξ1 )| = 2.71406 (5.40)
3 2
4
ξ12 |θ0 (ξ1 )| = 2.01824 .(5.41)

Γ = , −→ n = 3, ξ1 = 6.89685,
3
Desta maneira, podemos ver que para anãs brancas de baixa densidade (Γ = 35 ) as
propriedades fı́sicas fundamentais da estrela resultam ser:
 −1/6  
4 ρc µe −5/6
R = 1.122 × 10 km, (5.42)
106 g cm3 2
 1/2  
ρc µe −5/2
M = 0.4964 M (5.43)
106 g cm3 2
 −3  
R µe −5
= 0.7011 4
M . (5.44)
10 km 2

5.3.2 Limite de alta densidade (Γ = 4/3)


No caso de anãs brancas de alta densidade obtemos os seguintes resultados para as
principais propriedades fı́sicas :
 −1/3 
4 ρc µe −2/3
R = 3.347 × 10 km, (5.45)
10 g cm3
6 2
 µ 2
e
M = MCh = 1.457 M (5.46)
2
(5.47)

Pode-se observar que neste limite relativı́stico extremo a massa M da AB independe de


ρc , e portanto também R (ver Eq.(5.47)). Assim, podemos concluir que para ρ → ∞,
os elétrons se tornam mais e mais relativı́sticos no interior da estrela, e que a massa
assintoticamente se aproxima do valor dado pela equação (5.47) enquanto R → 0. Esta
massa crı́tica MCh é chamada limite de Chandrasekhar, por ter sido este pesquisador
indiano o primeiro a ter obtido este resultado. Ela representa a massa máxima possı́vel
para uma AB. Note-se que no caso do gás perfeito, a dependência de MCh na com-
posição quı́mica da estrela fica enteiramente contida na propriedade µe .

5.4 O limite de massa de Chandrasekhar


A existência de uma massa limite para uma estrela degenerada é um resultado tão
fundamental que deve ser entendido da maneira mais simples possı́vel. A seguir usamos
o argumento de Landau (1932) que bem se aplica tanto as anãs brancas quanto às
estrelas de nêutrons.
Suponha que N férmions estão formando uma estrela de raio R, tal que a densidade
numérica pode ser definida como n ∼ N/R3 . O volume por férmion é então ∼ 1/n

195
(por causa do Principio de Exclusão de Pauli), de forma que a relação de incerteza de
Heisenberg indica que o momento linear do férmion é pF ∼ ~n1/3 . Assim, a energia de
Fermi de uma partı́cula do gás no regime relativı́stico é

1/3 ~cN 1/3


EF ∼ ~n c ∼ . (5.48)
R
Entretanto, a energia gravitacional per férmion é
GM mB
EG ∼ − , (5.49)
R
onde M = N mB . (Note que a pressão provêm dos elétrons, mas a massa da estrela
é definida pelos bárions, ı́ons de hidrogênio, hélio, e alguns nêutrons). A condição de
equilı́brio (ver mais adiante) é alcançada para um mı́nimo da energia total
~cN 1/3 GN m2B
E = EF + EG = − . (5.50)
R R
Assim, quando E é positivo, isto é, quando N é pequeno, E pode ser reduzida
forçando um aumento de R. Isto decresce EF e portanto os elétrons tendem a ser
não-relativı́sticos, com EF ∼ p2F ∼ 1/R2 . Eventualmente, EG domina sobre EF para R
crescente. Neste ponto, E se torna negativo, e tende a zero enquanto R → ∞. Deve
existir, portanto, um equilı́brio estável para algum valor finito de R.
Por outro lado, quando E é negativo, isto é, quando N é grande, E pode ser reduzida
sem limite através da redução de R. Isto quer dizer que não existe equilı́brio algum
para esta configuração , e o colapso gravitacional se põe em marcha.
O número bariônico máximo para o equilı́brio é portanto determinado fixando E = 0
na eq.(5.50). Isto conduz a
 3/2
~c
Nmax ∼ 2
∼ 2 × 1057 , (5.51)
GmB
e portanto a massa máxima vem dada por
Mmax ∼ Nmax mB ∼ 1.5M . (5.52)
Exceto pelos fatores que exprimem a dependência com a composição quı́mica, a massa
máxima de uma estrela degenerada depende portanto somente de constantes funda-
mentais. Assim, o raio de equilı́brio associado com massas que se aproximam de Mmax
fica determinado pelo advento da degenerescência relativı́stica:
EF ≥ mc2 , (5.53)
onde m refere-se tanto a elétrons quanto a nêutrons. Desta forma, usando as
equações (5.48) e (5.51), esta condição produz (para nêutrons, de massa mn , e elétrons,
de massa me )
 1/2
~ ~c
R ≤ (5.54)
mc Gm2B
∼ 5 × 108 cm, m = me , (5.55)
5
∼ 5 × 10 cm, m = mn . (5.56)
Consequentemente, há dois regimes de colapso: um para densidades acima dos valores
para anãs brancas e outro para densidades acima da densidade nuclear. Em ambos os
casos Mmax ∼ 1.5M .

196
Figura 5.3: Localização de algumas anãs brancas famosas (Syrio B e Procyon B) no
diagrama HR, quando comparadas com a posição da sequência principal (curva central na
figura). (Tomada do site de Davison E. Soper, Institute of Theoretical Science, University
of Oregon).

5.5 Anãs brancas: São verdadeiramente obser-


vadas no céu?
Um estudo aprofundado das propriedades fı́sicas das anãs brancas mostra que es-
tas se esfriam em escalas de tempo que são suficientemente longas como para que
muitas anãs degeneradas permaneçam visı́veis durante suficiente tempo por causa da
radiação emitida desde suas superfı́cies. Esta circunstância fortuita leva a um teste
“de ordem zero” da teoria das anãs brancas— isto é, sua localização no diagrama
de Hertzsprung-Russell (HR). Este diagrama HR é basicamente um gráfico em escala
‘log-log’ da luminosidade, L, vs. a temperatura efetiva, Te , que é definida através da
expressão
L = 4πR2 σSB Te4 , (5.57)
onde σSB é a constante de Stefan-Boltzmann. Anãs brancas com uma massa definida
(M ∼ 1M ) têm um raio definido (R ∼ 109 cm), de modo que elas ocupam uma
linha bem definida no diagrama HR onde L ∝ T 4 . Uma vez que pela teoria acima
apresentada espera-se que toda anã branca tenha uma massa próxima de ∼ 1M , todas
as anãs brancas deverão ocupar uma banda estreita no diagrama HR, bem à esquerda
e abaixo da sequência principal para estrelas de idade zero. Uma comparação afinada
com as observações produz um acordo satisfatório, conforme ilustrado na Figura 5.1.
A maneira mais correta de se determinar o raio de uma AB é ajustando modelos de

197
atmosferas estelares à radiação residual observada. O fluxo Fν , em unidades erg s−1
cm−2 Hz−1 , medido na terra, é definido em função do fluxo na superfı́cie da AB como
R2 Fν (?)
Fν (⊕) = , (5.58)
D2
onde R é a raio da estrela e D é sua distância. Para anãs brancas ‘vizinhas’ a grandeza
D é determinada medindo o paralaxe da estrela. Seguidamente, constrói-se um modelo
de atmosfera, que depende da temperatura efetiva e da gravidade superficial da estrela,
de forma a reproduzir o fluxo Fν (?) observado em diferentes comprimentos de onda, e
a partir deste encontra-se o raio R. A determinação desta grandeza para inúmeras (&
4000) anãs brancas mostra que a discordância entre teoria e observação é menor de
10%. A Figura 5.3, também ilustra esta propriedade. A Figura 5.3 indica que o raio
de Syrio B e Procyon B é aproximadamente de uns 7300 km para cada uma delas. As
observações mais recentes indicam que uma grande parcela destas anãs brancas possui
uma composição quı́mica que se estende até elementos como 12 C e 16 O (é claro sem
excluir a possibilidade de se encontrarem estrelas com composição inclusive de 56 Fe
puro !).
Em geral, é difı́cil estimar dinamicamente e diretamente as massas de anãs bran-
cas (algo semelhante acontece com outras estrelas compactas). O melhor dos casos
é quando a estrela forma parte de um sistema binário, ou triplo, cujos parâmetros
orbitais podem ser medidos astrometricamente. No caso de ABs em binárias suas mas-
sas foram estimadas analisando a dinâmica de variáveis cataclı́smicas, ou em sistemas
binários que contém como companheira uma ENs. Estas estimativas indicam que efe-
tivamente todas as ABs observadas possuem massas menores do que M ∼ 1.445 M .

5.6 Estabilidade de estrelas anãs brancas


Se algum processo astrofı́sico, por exemplo acrescência de matéria, perturbar o estágio
quiescente de uma AB, cómo responde a estrela a tal perturbação ? Na teoria básica
de fluidos mostra-se que o equilı́brio hidrostático corresponde a um mı́nimo da ener-
gia. A seguir analisar-se-á como se comporta uma AB perante perturbações , isto é,
pequenos desvios de sua configuração de equilı́brio. Faremos esta análise no contexto
da teoria geral da relatividade, uma vez que este curso esta fundamentado nesta teoria
da gravitação (de fato, o caso newtoniano pode se estudar como um limite do caso
relativı́stico aqui sob análise.
O critério de estabilidade considera a resposta da estrela a pequenas variações do
seu ponto de equilı́brio. Este critério pode igualmente ser relacionado a uma análise
de modos normais de oscilação da estrela. Estes modos podem ser descritos pela sua
dependência temporal e de posição espacial
ξ j (~x, t) = ξ j (~x)eiωj t , (5.59)
sendo que a estrela estará em equilı́brio se a frequência de um determinado modo j
satisfazer a condição ωj2 < 0, conforme mostra-se a seguir.

5.6.1 Estabilidade de ABs na relatividade geral


Nosso objetivo nesta seção é determinar a densidade crı́tica para o advento da instabil-
idade de uma AB em relatividade geral (a densidade define univocamente a frequência

198
Figura 5.4: Relação massa-raio para anãs brancas de 12 C, 24 M g, e 56 F e previstas por
modelos teóricos. As linhas tracejada-pontilhada, pontilhada e duplamente pontilhada,
respectivamente, são comparada com determinações desta propriedade através de ob-
servações de 40 Eri B, Sirius B, Procyon B. (Tomada de F. Weber, [astro-ph/0112058
(2001)]).

199
do modo fundamental de oscilação de um fluido). Para analisarmos a estabilidade de
uma AB levando em consideração os efeitos da relatividade geral (GR), conforme
expresso pelo termo ∆EGR , pode-se escrever a energia total da estrela na forma

E = Eint + Egrav + ∆Eint + ∆EGR . (5.60)

Numa primeira aproximação , somente os dois primeiros termos estariam presentes.


Estes podem ser avaliados para uma distribuição de densidade politrópica como
Z
nP
Eint = dm, (5.61)
ρ
Z ξ1
1/n n
= Kρc M 2 0 ξ 2 θn+1 dξ. (5.62)
|ξ1 θ (ξ1 )| 0

Z
m
Egrav = −G dm, (5.63)
r
ξ1
GM 5/3
Z
1/3
= (4πρc ) M 2 0 ξ 3 θn+1 dξ. (5.64)
|ξ1 θ (ξ1 )|5/3 0

Assim, pode-se escrever a relação


Z ξ1 Z ξ1
1 d
ξ 3 θn θ0 dξ = ξ 3 θn+1 dξ (5.65)
0 n+1 0 dξ
Z ξ1
3
= − ξ 2 θn+1 dξ. (5.66)
n+1 0
A última integral na eq.(5.66) pode avaliar-se usando o procedimento de integração por
partes. Lembrando o resultado para a energia potencial gravitacional obtido anterior-
mente na eq.(5.16), encontramos que para um politropo
3 GM 2
Egrav = − . (5.67)
5−n R
Notando que a relação massa-raio pode-se escrever também como
M 4πρc |θ0 |
= , (5.68)
R3 ξ1
podemos escrever a energia gravitacional na forma
1/3
4π|θ0 |

3 5/3 1/3
Egrav = − GM ρc . (5.69)
5−n ξ1

Comparando as eqs.(5.64) e (5.66), encontra-se que


Z ξ1
n+1 3 0 2
ξ 2 θn+1 dξ = ξ |θ | . (5.70)
0 5−n 1
Portanto, obtemos
Eint = κ1 Kρ1/n
c M, (5.71)
e também
Egrav = −κ2 Gρ1/3
c M
5/3
, (5.72)

200
onde as constantes κ1 e κ2 são definidas (para n = 3, Chandrasekhar 1939) como
n(n + 1) |ξ12 θ0 |
κ1 = = 1.75579, (5.73)
5−n ξ1
e
3 |4πξ12 θ0 |1/3
κ2 = = 0.639001. (5.74)
5−n ξ1
Entretanto, o termo ∆Eint representa o desvio da equação de estado com respeito
àquela de um politropo com n = 3, em razão de que os elétrons não são completamente
relativı́sticos. Assim, a energia interna por unidade de massa (u ≡ U/M ) é
Ee − me c2 ne
u= , (5.75)
ρ
onde ρ = µe mu ne ≡ ρ0 . Assim, usando o limite para elétrons relativı́sticos dado no já
citado livro de Chandrasekhar (1939), escrevemos
 
1 4 2 1
Ξ(x) −→ 2 x + x − ln 2x... , (5.76)
4π 2
no qual o momento linear de Fermi adimensional, ou parâmetro relativı́stico da
equação de estado, é definido como: x ≡ pF /me c >> 1. A partir disto, encontra-
se que
3 me c2
 
4 2 1
u= x + x − ln 2x... . (5.77)
4 µe mu 2
Na eq.(5.77), o termo proporcional a x, isto é, 12 ln 2x, é simplesmente 3P/ρ, que é o
mesmo que foi usado para calcular Eint . O termo seguinte é uma constante e pode ser
desprezada usando o principio variacional, de tal modo que
3 me c2
Z
1
∆Eint = dm. (5.78)
4 µe mu x

Retomando a definição de densidade dada acima, e lembrando que a densidade


numérica de elétrons escreve-se como
1
ne = 2 3
x3 , (5.79)
3π λe
onde λe = ~/me c é o comprimento de onda Compton do elétron, vemos que o
parâmetro relativı́stico pode ser escrito em função da densidade da estrela e de con-
stantes fundamentais, como
 2 3 1/3
3π λe
x= . (5.80)
µe mu
Desta maneira, pode-se avaliar ∆Eint integrando sobre uma distribuição politrópica
com n = 3. Neste caso, o erro será de order superior. Portanto,
m2e c3
 
∆Eint = κ3 M ρc−1/3 , (5.81)
~(µe mu )2/3
onde define-se a constante κ3 como
 1/3 Z ξ1
3 1 1
κ3 = ξ 2 θ2 dξ = 0.519723. (5.82)
4 3π 2 |ξ12 θ0 | 0 1

201
Por outro lado, a correção relativı́stica pode ser obtida integrando a equação de Lane-
Emden para um politropo com n = 3, e resulta ser dada por (κ4 = 0.918294)
G2 7/3 2/3
∆EGR = −κ4 2 M ρc . (5.83)
c
Assim, a energia total pode escrever-se como
E = (AM − BM 5/3 )ρc1/3 + CM ρc−1/3 − DM 7/3 ρc2/3 , (5.84)
onde as seguintes constantes são definidas:
m2e c3 G2
 
A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.85)
~(µe mu )2/3 c2
Desta forma, o equilı́brio se estabelece se a condição ∂E/∂ρc = 0 é satisfeita. Obtemos
então
1 1 2
(AM − BM 5/3 )ρc−2/3 − CM ρc−4/3 − DM 7/3 ρ−1/3 c = 0. (5.86)
3 3 3
Considerando soluções até primeira ordem na densidade central ρc , podemos igno-
rar os termos proporcionais a C e D. A partir do que recuperamos a expressão de
Chandrasekhar para a massa máxima
 3/2  µ −2
A e
M= = 1.457 M , (5.87)
B 2
onde fizemos uso da definição da constante politrópica K dada por
( )
31/3 π 2/3 ~c 1.2435 × 1015
K= 4/3 4/3
= 4/3
em unidades c.g.s. (5.88)
4 mu µe µe
Por outro lado, se mantivermos os termos C e D obtemos pequenas correções ao valor
de M , que dependem de potências de ρc .
Assim sendo, a instabilidade se desencadeia quando a condição ∂ 2 E/∂ρ2c = 0 é satis-
feita. Nesta ocasião obtemos
12 14 21
− (AM − BM 5/3 )ρ−5/3 c + CM ρ−7/3
c + DM 7/3 ρ−4/3
c = 0. (5.89)
33 33 33
Resolvendo a eq.(5.86), e subtituindo na eq.(5.89), observando que todas as grandezas
são da mesma ordem de magnitude, podemos substituir M por (A/B)3/2 , para achar-
mos finalmente que
CB 2 16κ3 κ22
  2 2
mu µe
ρc = 2
= 2 2/3 2
, (5.90)
DA (3π ) κ4 κ1 λ3e me
 µ 2
e
= 2.646 × 1010 g cm−3 , (5.91)
2
que define a densidade crı́tica para o surgimento da instabilidade numa AB dev-
ido a relatividade geral. Lembre-se que para 56 Fe µe = 2, 154, e portanto ρc =
3.07 × 1010 g cm−3 . Note que este limite é maior do que o valor crı́tico para o de-
caimento β-inverso: ρc = 1.14 × 109 g cm−3 , e por consequência a relatividade geral
é irrelevante para anãs brancas compostas puramente de ferro. No entanto, para 4 He
ou 12 C a densidade crı́tica obtida considerando os efeitos devidos à relatividade geral
é ρc = 2.65 × 1010 g cm−3 . Esta densidade é menor do que o limite para neutron-
(4 He) (12 C)
ização ,(neutron drip) ρc = 1.37 × 1011 g cm−3 e ρc = 3.90 × 1010 g cm−3 .
Nestes casos, certamente é a relatividade geral a que limita a densidade central da
estrela.

202
Figura 5.5: A foto mostra a região central da Nebulosa do Caranguejo, o remanescente da
explosão supernova do ano 1054. A estrela brilhante no centro da imagem, da qual parecem
emanar jatos de radiação , é o pulsar do Caranguejo. (Foto cortesia do CHANDRA X-ray
Observatory).

5.7 Estrelas de Nêutrons

Por volta de 1932, Landau ofereceu uma explicação elementar da natureza do limite
de Chandrasekhar, conforme foi discutido na seção anterior. Inspirado nestas idéias
ele aplicou esses mesmos argumentos ao conceito de estrelas de nêutrons, após tomar
conhecimento da descoberta do nêutron. Em 1934 W. Baade e F. Zwicky propuseram
a idéia das estrelas de nêutrons (ENs), salientando que estas deveriam ser objetos
de alta densidade que possuiriam raios muito pequenos. Com uma sugestão defini-
tivamente visionária estes pesquisadores ainda conjecturaram que estas estrelas de
nêutrons seriam formadas em explosões de supernova! De fato, hoje em dia conhece-
mos dois caminhos bem estabelecidos para a formação de uma ENs: a) a ENs pode-se
formar durante a explosão de supernova de uma estrela com massa entre 5 e 30 massas
solares (massas maiores do que 30 M supõe-se produziriam buracos negros como re-
manescentes), ou b) a ENs pode ser o resultado do colapso gravitacional induzido por
acrescência de matéria sobre uma AB numa variável cataclı́smica. Um das supernovas
mais conhecidas é a que foi observada por astrônomos chineses no ano 1054, à qual,
sabemos hoje, esteve associada a formação do pulsar do Caranguejo (The Crab pulsar,
ver Figura 5.5).

Tempo depois, em 1939, o primeiro cálculo teórico de um modelo de ENs foi realizado
por Oppenheimer & Volkoff (OV) usando relatividade geral. Apesar dessa evidência
teórica da existência desta classe de objetos estelares, a idéia foi praticamente aban-

203
donada durante de mais de 30 anos. Foi só quando os pulsares3 foram descobertos por
Jocelyn Bell, e explicados por Anthony Hewish em 1968, que tais estrelas tornaram-
se uma realidade astrofı́sica. Hoje sabemos da existência, conforme registrada em
catálogos, de mais de 2000 pulsares, embora o número provável de estrelas de nêutrons
na nossa galáxia estime-se ser de centenas de milhões. Com a descoberta das fontes
cósmicas de raios-X não-locais (i. e., não solares), por Giaconni et al. em 1962, muitos
teóricos especularam que o telescópio de raios-X estaria vendo estrelas de nêutrons,
jóvens e quentes! A onda se propagou, e uma corrida pela modelagem do esfriamento,
entre muitas outras propriedades, das estrelas de nêutrons começou. O resultado final,
conforme o entendemos hoje, é que as estrelas de nêutrons são laboratórios de fı́sica
extrema, como diria Jocelyn Bell [Astron. & Geophys., Vol 45, 1.7 (2004)].

5.8 Equação de estado de gás perfeito no domı́nio


nuclear
Em primeira aproximação , a estrutura de uma ENs é obtida supondo que o gás de-
generado que a forma está constituı́do por partı́culas (nêutrons) que não interagem
entre si: ou seja um gás ideal. De fato, o argumento dimensional de Landau apre-
sentado antes supõe um gás perfeito degenerado de nêutrons e obtém uma massa
Mmax ∼ 1.5M e seu correspondente raio R ∼ 3 km.4
Para começar, podemos analisar o caso de uma gás puro de nêutrons cuja equação de
estado é a de um politropo
P = KρΓ0 , (5.92)
onde ρ0 = mn nn = 6.1067 × 1015 g cm−3 , Γ = 5/3 para um gás não-relativı́stico,
e 4/3 para um gás ultra-relativı́stico. A constante politrópica K foi definida antes.
Usando a equação de equilı́brio hidrostático em relatividade geral, ou equação de
Tolmann-Oppenheimer-Volkoff (TOV) (ver Apêndice A),

G (P + ρ) M (r) + 4πr3 cP2


 
dP
=−   , (5.93)
dr 2 2GM (r)
r 1 − c2 r
(5.94)

TOV obtiveram configurações de equilı́brio de massa máxima com os seguintes


parâmetros:

Mmax = 0.7 M R = 9.6 Km ρc = 5 × 1015 g cm−3 . (5.95)

Em geral, configurações com densidade central ρc ≥ 5 × 1015 g cm−3 são instáveis e


sofrem colapso gravitacional. O limite de massa de Chandrasekhar para uma ENs pura,
isto é, um politropo newtoniano com n = 3 (o que implica uma densidade infinita), é
M ∼ 5.73M . A relatividade geral reduz este valor por duas razões principais: a) a
massa máxima ocorre a um valor finito da densidade central ρc para o qual os nêutrons
se tornam relativı́sticos, mas não são ultra-relativı́sticos. b) M ∼ 5.73M é a massa
3
Todo pulsar deve ser uma ENs!
4
As massas calculadas nesta aproximação estariam Ok!, mas os raios das ENs ... hhhhmmm !?!?!?

204
de repouso dos nêutrons, mas a massa total é menor do que esta por causa da energia
de ligação gravitacional da estrela.
Entretanto, ENs de baixa densidade com equação de estado de gás perfeito de nêutrons
podem ser aproximadas por politropos newtonianos com n = 3/2. Usando as fórmulas
da seção precedente encontramos
 −1/6
ρc
R = 14.64 , (5.96)
1015 g cm−3
 1/2
ρc
M = 1.102 M , (5.97)
1015 g cm−3
 3
15.12 km
= M . (5.98)
R
Assim, na equação TOV no existe uma massa mı́nima para a ENs pois quando M −→
0, R −→ ∞ quando ρc −→ 0. De fato, os nêutrons se tornam instáveis ao decaimento
β a densidades muito mais baixas.
Os resultados de TOV podem ser obtidos de forma aproximada usando o principio
variacional da energia. Uma vez que ρc é definida, a Mmax fica restrita à região de
transição do regime não-relativı́stico para o relativı́stico. Porém, não é enteiramente
claro que classe de politropo se aproxima melhor da configuração de estrela constituı́da
por puros nêutrons quando a massa da estrela se aproxima a Mmax .
Usando as definições dadas acima para Eint , e Egrav temos

Eint = κ1 Kρc2/3 M, κ1 = 0.795873, (5.99)

e
Egrav = −κ2 Gρc1/3 M 5/3 , κ2 = 0.760777. (5.100)
Assim, para calcular ∆Eint , primeiramente temos de calcular
En − mn c2 nn
u= , (5.101)
ρ0
para a qual ρ0 = mn nn = mn x3 /(3π 2 λ3n ), onde o parâmetro relativı́stico x  1.
Usando, mais uma vez, o resultado para elétrons não relativı́sticos (ver livro de Chan-
drasekhar 1939)  
1 3 3 5 3 7
Ξ(x) → 2 x + x − x .... , (5.102)
3π 10 56
encontramos que  
2 3 2 3 4
u=c x − x . (5.103)
10 56
O primeiro termo na eq.(5.103) dá Eint , enquanto o segundo conduz a
Z
3 2
∆Eint = − c x4 dm. (5.104)
56
Substituindo para x em termos de ρ0 de sua definição dada acima, e fazendo a usual
substituição para um politropo na integral anterior, obtemos
~4
 
∆Eint = −κ3 16/3
M ρc4/3 , (5.105)
mn c2

205
onde agora para ENs
  Z ξ1
3 2 4/3 1
κ3 = (3π ) θ3.5 ξ 2 dξ = 1.1651. (5.106)
56 |ξ12 θ0 (ξ1 )| 0

Finalmente, a correção devida à relatividade geral, ∆EGR , pode ser obtida usando as
definições dadas acima  
G
∆EGR = −κ4 2 M 7/3 ρc2/3 , (5.107)
c
onde
Z ξ1 Z ξ1
(4π)2/3 5 + 2n − n2
  
3 0 n+1 3 4 0 2 n
κ4 = − 2 ξ θ θ dξ + (n − 1) ξ (θ ) θ dξ .
(5 − n)[ξ12 |θ0 (ξ1 )|]7/3(n + 1) 0 2 0
(5.108)
Caso a estrela for constituı́da só de nêutrons, a avaliação numérica destas integrais
produz κ4 = 0.6807. Desta forma, a energia total da ENs é dada por

E = AM ρc2/3 − BM 5/3 ρc1/3 − CM ρ4/3


c − DM 7/3 ρ2/3
c , (5.109)

onde, desta vez, as seguintes constantes foram introduzidas

~4 G2
 
A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.110)
(mn )16/3 c2 c2

Desta forma, o equilı́brio se estabelece se a condição ∂E/∂ρc = 0 é satisfeita. Esta


relação implica

2Aρ−1/3
c − BM 2/3 ρc−2/3 − 4Cρc1/3 − 2DM 4/3 ρ−1/3
c = 0. (5.111)

Pode-se verificar que se mantivermos os dois primeiros termos só, rencontramos o


resultado para o politropo n = 3/2. Enquanto que se mantivermos todos os termos
obtemos uma melhor aproximação à relação M vs. ρc de TOV.
Portanto, a instabilidade ocorre quando a condição ∂ 2 E/∂ρ2c = 0 é satisfeita. Esta
condição se traduz em

−2Aρ−1/3
c + BM 2/3 ρc−2/3 − 4Cρc1/3 + 2DM 4/3 ρ−1/3
c = 0. (5.112)

Assim, somando as Eqs.(5.111) e (5.112) obtém-se

BM 2/3
ρc = . (5.113)
8C
Substituı́ndo isto na Eq.(5.112), e introduzindo o parâmetro y = M 4/9 , chegamos a
uma equação cúbica em y que tem a forma

2A − 3B 2/3 C 1/3 y − 2Dy 3 = 0. (5.114)

A raı́z positiva desta acontece para o valor de y = 6.605 × 1014 em unidades c.g.s., de
modo que
M = 1.11 M , ρc = 7.43 × 1015 g cm−3 . (5.115)

206
Figura 5.6: Relação massa-raio de modelos teóricos de estrelas de nêutrons comparada
com determinações desta propriedade através de observações das fontes de raios-X Vela
X-1, Cyg X-2, e o pulsar binário PSR 1913+16. (Tomada de F. Weber [Prog. Part. Nucl.
Phys. 54, 193 (2005)]. Copyright Elsevier 2005).

Observe-se que M , conforme determinada na eq.(5.115), é verdadeiramente a massa


de repouso dos nêutrons (lembre-se que as fórmulas politrópicas apresentadas antes
usam dm = 4πr2 ρ0 dr). Se substituirmos os valores de M e ρc dados pela Eq.(5.115)
na Eq.(5.109), encontramos que

E
= −0.08 M . (5.116)
c2

Desta maneira, se tirarmos esta fração da massa obtida na Eq.(5.115), resulta que a
EN s
massa total máxima prevista para uma ENs é Mmax = 1.03 M ! Esta é quase 40%
maior do que a obtida com a equação de TOV no modelo de um gás puro de nêutrons,
conforme referido na Eq.(5.95).

207
5.9 Modelos realı́sticos de estrelas de nêutrons

Uma equação de estado5 mais realı́stica considera uma mistura (ideal) de nêutrons,
prótons e elétrons que não interagem entre si. As caracterı́sticas principais desta
equação de estado são: 1) os nêutrons só estão presentes a densidades que excedem
ρn = 1.2 × 107 g cm−3 , 2) a razão nêutron/próton alcança um máximo ao redor de
ρn/p = 7.8 × 1011 g cm−3 , e 3) ultrapassado este máximo esta razão diminui até o valor
8 quando a densidade ρ → ∞. (Lembre-se sempre: para um gás perfeito P → ρ3 c2
quando ρ → ∞). Assim, os modelos estelares construı́dos com esta equação de estado
diferem muito dos resultados obtidos por TOV, visto que P (ρ) é muito semelhante ao
caso de nêutrons puros. Como exemplo, os parâmetros das estrelas nesta caso resultam
ser:

M = 0.72 M , R = 8.8 km, ρc = 5.8 × 1015 g cm−3 . (5.117)

Portanto, estrelas de nêutrons com densidades ρc ≤ 7.8 × 1011 g cm−3 verdadeira-


mente pertencem ao ramo de alta-densidade das anãs brancas, e consequentemente
são instáveis. Assim sendo, devemos esperar encontrar um mı́nimo local na curva
M vs.ρc próximo deste valor de ρc .

A fı́sica nuclear e a fı́sica de partı́culas elementares modernas prevêem que a estrutura


interna de uma ENs seja certamente bem mais complexa do que aquela para um
gás perfeito constituı́do de puros nêutrons ou ainda de um gás de nêutrons, prótons e
elétrons, estes últimos necessários para se garantir a estabilidade da estrela previnindo
o decaimento do seu enorme número de nêutrons. (Ver Figura 5.7).

Podemos agora comparar modelos realı́sticos de estrelas de nêutrons que resultam


quando são utilizadas equações de estado diferentes na equação de TOV. As Figuras
5.6 e 5.8 mostram curvas teóricas para a razão massa-raio de estrelas de nêutrons
obtidas usando algumas das equações de estado tidas como mais “realı́sticas”. (ver
Figura 5.8). Destas figuras algumas caracterı́sticas gerais emergem:

a) Modelos estelares calculados com a equação de estado, por exemplo do tipo Bethe-
Johnson, têm massas máximas muitos maiores do que estrelas obtidas a partir de
equações de estado ‘moles’, como, por exemplo, a equação do tipo Reid.

b) Estrelas calculadas com uma EOS ‘dura’ têm uma densidade central baixa, um raio
maior, e uma crosta mais grossa do que estrelas da mesma massa modeladas com uma
EOS mole (ver Figura 5.7).
5
Uma equação de estado é uma relação entre a densidade de matéria e sua pressão. Note, de passagem,
que as equações de estado (EOS) classificam-se em: 1) duras (‘stiff’) se seu volume ou densidade é difı́cil
de alterar, por exemplo a água, 2) moles (‘soft’) se estas propriedades podem ser modificadas facilmente,
por exemplo o ar, e moderadamente duras (‘semi-stiff) se admitem alguma mudança importante. Assim
sendo, o conhecimento da EOS nos diz quão flexı́vel é a matéria sob consideração .

208
Figura 5.7: Visão moderna da estrutura interna de uma ENs. Pode-se ver a diversidade de
partı́culas elementares que acredita-se possam existir no interior destes objetos. (Versão
original de F. Weber, nos Proceedings of the VIII International Workshop on Hadron
Physics, April 14-19, 2002, Rio Grande do Sul, Brazil).

209
Figura 5.8: Relação massa-raio do objeto candidato a ser uma strange star: SAX J1808.4-,
conforme determinada a partir de observações com o Rossi XTE, comparada com modelos
teóricos de estrelas de nêutrons e estrelas estranhas. (Versão original de X. D. Li, et al.
[Phys. Rev. Lett. 83, 3776 (1999)]. Copyright 1999, by the Americam Physical Society).

c) A condensação de pı́ons (ver Figura 5.7), se esta acontece, tende a contrair, i.e.,
tornar de raio menor, a ENs de uma massa dada ao mesmo tempo que dimui sua
massa máxima Mmax .
Conforme pode-se verificar na Figura 5.7, a estratificação das configurações é simples-
mente uma consequência do advento de regimes diferentes na EOS enquanto se avança
em direção a densidades mais altas. As camadas podem ser identificadas como segue:
a) A superfı́cie (ρ ≤ 106 g cm−3 ), uma região na qual as temperaturas e campos
magnéticos, que se supõe que existem nessas estrelas, podem afetar a EOS.
b) A crosta exterior (106 ≤ ρ ≤ 1011 g cm−3 ), uma região sólida em que a rede
cristalina (‘lattice’) de Coulomb de núcleos pesados coexiste em equilı́brio β com o
gás degenerado de elétrons (ver EOS de ABs).
c) A crosta interior (4.3 × 1011 ≤ ρ ≤ 2.14 × 1014 g cm−3 ), que coexiste com a rede
cristalina de núcleos ricos em nêutrons, com um gás de nêutrons superfluido e um gás
de elétrons.
d) O lı́quido de nêutrons (2.14×1014 ≤ ρ ≤ ρcore ), que contém principalmente nêutrons
superfluidos com uma pequena concentração de prótons superfluidos e elétrons nor-
mais.
e) A região do core (ρ > ρcore ), que pode or não existir em algumas estrelas. Isto
depende de se ocorre ou não condensação de pı́ons, ou se ocorre uma transição de fase

210
a um sólido de nêutrons ou a matéria de quarks, ou alguma outra fase fisicamente
distinta de um lı́quido de nêutrons a densidades acima de algum valor crı́tico ρcore ).
Se a EOS é dura, a densidade central de uma ENs relativamente maciça (1.4 M ) é ρ ≤
1015 g cm−3 , e de fato, ainda as ENs estáveis mais maciças, têm ρ . few ×1015 g cm−3 .
Desta forma, uma transição a matéria de quark ou alguma outra forma exótica de
matéria parece improvável nestas condições . No entanto, existe a possibilidade de um
terceiro ramo estável de ‘estrelas estranhas’ no diagrama M vs. ρc (ver Figura 5.6),
além das ABs e ENs.
Entretanto, na natureza, estrelas de nêutrons com massas perto do limite de Chan-
drasekhar de 1.4 M parecem ser favorecidas. Tais estrelas com EOS moderadamente
duras não são susceptı́veis á formação de condensados de pı́ons. Isto parece precisar
que a condição ρ ≥ 2 ρnuc seja satisfeita se elas verdadeiramente se formam. Por outro
lado, a massa mı́nima de uma ENs estável é determinada fixando o valor médio do
ı́ndice adiabático Γ igual ao valor crı́tico ∼ 43 para estabilidade radial contra o colapso.
Isto conduz a Mmin ∼ 0.09 M . Enquanto isso, todos os cálculos microscópicos de EOS
levam a ENs com massa máxima Mmax ∼ 3 M , conforme mostrado a seguir.

5.9.1 Massa máxima de ENs

A possibilidade de se discriminar entre alguns objetos compactos como buracos negros


e estrelas de nêutrons descansa em parte em sermos capazes de estabelecer categorica-
mente que o objeto observado tem uma massa maior do que o valor máximo de massa
permitido para uma ENs (ou uma AB) estável. Portanto, pode-se colocar a seguinte
questão:
Existe algum limite superior que possa ser imposto sobre a massa de ENs que in-
dependa das peculiaridades da EOS no regime desconhecido de altas densidades? A
resposta a esta pergunta é: Sim !
Um tratamento geral do problema da massa máxima de uma ENs estável foi fornecido
por Rhoades & Ruffini em 1974 [6] com base nas seguintes suposições :
a) A relatividade geral é a teoria correta da gravitação . Isto significa que la equação de
TOV determina a estrutura de equilı́brio.
b) A EOS satisfaz a condição de estabilidade ‘microscópica’

dP
≥ 0. (5.118)

Se esta condição for violada, elementos pequenos de matéria colapsariam espontanea-


mente.
c) A EOS satisfaz a condição de causalidade

211
dP
≤ c2 . (5.119)

isto é, a velocidade do som na matéria da estrela é menor do que a velocidade da luz
no vácuo.
d) A EOS abaixo de uma ‘densidade de junção ’ ρ0 é conhecida.
Rhoades e Ruffini efetuaram um cálculo variacional para determinar que EOS acima
de ρ0 , sujeita aos vı́nculos das eqs.(5.118) e (5.119), maximiza a massa. O resultado
dessa análise mostra que

P = P0 + (ρ − ρ0 ) c2 , ρ ≥ ρ0 (5.120)
−1/2
é o mais plausı́vel. O que se traduz na relação Mmax ∝ ρ0 para ρ < ρ0 . Desta
maneira, a integração numérica da equação de TOV com uma EOS tipo Harrison-
Wheeler mostra que
 −1/2
ρ
Mmax = 3.2 M . (5.121)
4.6 × 1014 g cm−3
Modelos mais sofisticados implementados em modernos estudos desta propriedade
mostram que essencialmente a massa máxima de ENs fica por volta de 3 M .
Acima deste limite, qualquer objeto compacto que venha a ser encontrado poderá
caracterizar-se como um buraco negro. O estudo desta classe particular de OCs é o
tema do capı́tulo seguinte deste livro.

5.10 Estrelas de nêutrons: são realmente obser-


vadas no céu? Possuem as propriedades preditas?
Para sabermos, efetivamente, se algumas destas estrelas compactas são verdadeira-
mente ENs, precisamos determinar suas massas e raios de maneira direta. A maneira
mais confiável de se determinar a massa de objetos astronômicos é via a terceira lei
de Kepler. Considere duas massas esféricas M1 e M2 em órbita circular ao redor de
seu centro de massa. A separação entre as duas massas é a e suas distâncias do centro
de massa são a1 e a2 , tal que

a = a1 + a2 , (5.122)
M1 a1 − M2 a2 = 0. (5.123)

Se chamarmos i ao ângulo de inclinação do plano orbital respeito da linha de visada,


vemos que qualquer caracterı́stica espectral emitida desde M1 será deslocada via efeito
Doppler, de tal forma que a amplitude da variação é V1 , que é a projeção da velocidade
orbital de M1 ao longo da linha de visada

V1 = a1 seni, (5.124)
P?

212
onde P? é o perı́odo orbital. Assim, se o espectro de M1 mostrar variações periódicas,
então P? e V1 podem ser medidos e portanto se obter uma função para a1 seni. Alter-
nativamente, para pulsos de raios-X podem medir-se variações periódicas no tempo
de chegada dos pulsos. A amplitude destas variações é simplesmente o tempo de vôo
através da órbita projetada, isto é, a1 seni/c.
Ora, a lei de Kepler estabelece que
 2
G(M1 + M2 ) 2π
= . (5.125)
a3 P?

Das equações da dinâmica da órbita (5.123) temos

M1 + M2
a= a1 , (5.126)
M2
de modo que a função de massa f , que depende só dos observáveis P? e V1 (ou a1 seni),
é definida como
(M2 seni)3 P? V13
 
f (M1 , M2 , i) ≡ = . (5.127)
(M1 + M2 )2 2πG
Se somente uma função de massa pode ser medida para um sistema binário, então não
se pode proseguir além da Eq.(5.127) sem ter informações adicionais. Só em alguns
casos de binárias de raios-X tem sido possı́vel medir ambas as funções de massa, da
companheira óptica, O, e da fonte de raios-X, X, obtendo-se

(MO seni)3 (MX seni)3


fX = , fO = . (5.128)
(MX + MO )2 (MX + MO )2

A razão entre estas duas expressões da a razão de massa, q ≡ M MO


X
, pudendo se escrever
então a partir da Eq.(5.128)
fX q(1 + q)2
MX = . (5.129)
sen3 i
Um valor único de MX ainda depende de seni. Na prática, observações da duração de
eclipses de raios-X e/ou variações na curva de luz óptica são usadas para impôr vı́nculos
geométricos sobre seni. Desta forma foram feitas as determinações das massa dos
objetos apresentados na Figura 5.9.

5.10.1 Pulsares binários

Os pulsares binários constituem um dos laboratórios astrofı́sicos mais importantes para


testar predições teóricas dos mais diversos gêneros. Muitos desses sistemas possuem
‘pulsares radio’ que com frequência têm perı́odos de rotação de milisegundos como
resultado de transferência de massa desde suas estrelas companheiras orbitais. Estes
fornecem relógios em movimento muito precisos que nos permitem investigar uma am-
pla gama de problemas astrofı́sicos, de outra maneira inacessı́veis. Os parâmetros or-
bitais estimados a partir de ‘pulsar timing’ provêem vı́nculos sobre a evolução binária,

213
Figura 5.9: Massas de ENs obtidas a partir de observações de sistemas binários que contém
pelo menos um pulsar radio. Note que a média corresponde a 1.35 ± 004 M . (Versão
original publicada por S. E. Thorsett & D. Chakrabarty, The Astrophysical Journal 512,
288 (1999). Copyright The American Astronomical Society (1999)).

214
caracterı́sticas da população de pulsares binários, e massas de estrelas de nêutrons
com diferentes histórias de transferência de massa. Particularmente, no caso de teo-
rias como as da gravitação , eles permitem discriminar de maneira efetiva entre as
várias alternativas para se descrever esta interação na natureza, colocando vı́nculos
fortes sobre os desvios em relação à relatividade geral. Procuras por novos pulsares
(‘surveys’) produzem sistemas binários novos que aumentam nossa compreensão de
todos estes campos e podem abrir áreas da fı́sica enteiramente novas, como espectacu-
larmente demonstrado pela recente descoberta do único sistema (conhecido até hoje)
duplo de pulsares extremamente relativı́stico: J0737-3039 A,B !

No caso do pulsar binário de Taylor & Hulse (PSR 1913+16), somente uma função de
massa é disponı́vel a partir de observações em radio. A estrela companheira é um
objeto compacto de algum tipo, mas não tem sido possı́vel observá-lo diretamente.
Contudo, a alta precisão das observações do pulsar, combinadas com a velocidade
orbital (V1 acima) relativamente alta permitiram medições do avanço do periastro
devido ao efeito previsto pela relatividade geral e o deslocamento Doppler de segunda
ordem. Estes forneceram duas relações a mais entre M1 , M2 , a1 e seni, além das
Eqs.(5.124, 5.127), que permitiram uma solução completa para todos os parâmetros.
O melhores valores das massas neste sistema são:

Massas das ENs no PSR 1913 + 16


MPSR = 1.41 ± 0.06 M , (5.130)
MCompanheira = 1.41 ± 0.06 M ! (5.131)

Finalmente, a descoberta do PSR J0737+3039A,B poderá vir a contribuir a um en-


tendimento mais preciso da dinâmica destes sistemas, governada pela relatividade
geral, uma vez que possuindo um perı́odo orbital P ' 2 : 450 , que é muito menor
do que o perı́odo do PSR 19313+16, P ∼ 7 : 450 , efeitos da relatividade geral como
o acoplamento spin-órbita, parâmetros pós-newtonianos, avanço do periastro, efeito
Shapiro, emissão de ondas gravitacionais, etc., poderão ser medidos com altı́ssima
precisão em escalas de tempo muitı́ssimo mais curtas, da ordem de cinco (5) anos. As
massas das ENs neste sistema são:

P SR J0737 + 3039A, B (5.132)


MA = 1.338 M , (5.133)
MB = 1.249 M ! (5.134)

O confronto entre estes resultados observacionais e as predições das diversas teorias


da gravitação definitivamente iluminará o caminho para sabermos se Einstein estava,
ou não, verdadeiramente certo.

215
Figura 5.10: Descrição esquemática da órbita de
um pulsar binário. (Versão original tomada do site
http://astrosun2.astro.cornell.edu/academics/courses//astro201/psr1913.htm).

216
5.11 Apêndice A

Lembramos que esta equação é obtida usando as equações de Einstein

Gµν = −kTµν , (5.135)

onde Gµν = Rµν − 21 Rgµν é chamado de tensor de Einstein. A estrela é modelada pela
métrica (gµν ) esfericamente simétrica de Schwarzschild

dr2
 
2 RS
ds = 1 − dt2 − RS
 − r2 (dθ2 + sen2 θdφ2 ) , (5.136)
r 1− r

supondo um tensor-energia momento para um gás perfeito

Tµν = (P + E)U µ U ν + P g µν . (5.137)

Para mais detalhes ver o capı́tulo sobre a teoria da gravitação .

5.12 Exercı́cios

Anãs brancas
Exercı́cio AB-1 ??.— Mostre que a razão entre a densidade média e a densidade central
0
num politropo é dada por ρρ̄c = 3 |θ ξ(ξ11 )| .
Tópico especial: A luminosidade de Eddington
Existe um limite natural para luminosidade que um objeto ligado gravitacionalmente
pode emitir. Neste limite a força gravitacional dirigida para o centro do objeto é
contra-balanceada pela pressão de radiação que aponta para fora de sua superfı́cie.
Embora esta luminosidade limite, (Luminosidade de Eddington), possa ser contornada
de várias maneiras, ela fornece uma estimativa útil da massa mı́inima de uma fonte
particular de radiação .
a. considere hidrogênio ionizado. Cada par elétron-próton possui uma massa da ordem
da massa do próton (mp ) e uma seção de choque à radiação igual a seção de choque
de Thomson (σT ).
b. a pressão de radiação é dada pelo fluxo dividido pela velocidade da Luz (a Lei de
Stefan).
c. equacione a força para fora devida à radiação sobre o par com a força da gravidade
sobre o mesmo par de partı́culas.
d. resolva para a luminosidade como função da massa.
Qual é a luminosidade de Eddington para o Sol, cuja massa é 2 × 1033 gramas (1 M )?
Estrelas de nêutrons

217
-2 Embora não discutidas neste capı́tulo, as propriedades rotacionais de um objeto
compacto são interessantes para entendermos algumas de suas caracterı́stica dinâmicas
e suas propriedades estruturais. Vejamos o que sucede com uma estrela de nêutrons
em rotação .
a. o Sol gira a cada 24 a 30 dias dependendo da latitude. Quão rápido ele poderia
rodar se fosse comprimido até um raio de 10 km, enquanto conserva seu momento
angular?
b. quão rápido poderia rodar uma estrela de nêutrons sem arrebentar-se? Suponha
que ela possui uma massa equivalente a 1.4 M , e tem um raio de 10 km.
c. quais o momento angular e energia rotacional de uma estrela de nêutrons? Usar as
seguintes relações e parâmetros

M R2
I ' 0.21 (5.138)
(1 − 2) GM
Rc2

e um perı́odo de spin igual a: 1.6 ms, 33 ms, e 6 s.


-3 Estrutura de uma estrela de nêutrons (ENs)
a. considere uma estrela de massa, M, e raio, R. Construa, com base numa análise
dimensional, a pressão caracterı́stica e a densidade tı́pica a partir destas grandezas e
da constante de Newton da gravitação G.
b. A equação de estado politrópica é uma relação entre pressão e densidade, P = Kρn .
Substitua a pressão e densidade caracterı́sticas na equação de estado politrópica para
obter a razão massa-raio.
c. Quais valores de n têm propriedades especiais ?
-4 Pressão central
a1 . use as equações de equilı́brio hidrostático da relatividade geral para determinar a
pressão central de uma estrela de massa M e raio R. Suponha que o material desta
é incompressı́vel, isto é, sua densidade é constante. a2 . Podem estas equações ser
integradas de maneira a obter uma relação entre M e R? (dica: procure eliminar a
densidade constante dentre estas grandezas)
b. Usando novamente a análise dimensional, tente descobrir onde fatores de G e c
aparecem nas equações de equilı́brio hidrostático.
c. obtenha o limite Newtoniano destas equações , isto é, imponha a condição limite
c → ∞.
d. refaça o mesmo cálculo para a pressão em mecãnica Newtoniana.
e. qual é o raio mı́nimo para uma estrela de densidade constante de uma dada massa?
Qual é a massa máxima de uma estrela com uma densidade especı́fica? Qual é a massa
máxima de uma estrela com densidade nuclear 1015 g cm−3 ?

218
-5 Massa de uma estrela de nêutrons
a. use a pressão e densidade caracterı́sticas discutidas acima (3.a) para obter a
relação entre a massa e o raio de uma estrela. Note que ENs possuem nêutrons rel-
ativı́sticos tal que sua pressão é dada, aproximadamente, pelo produto da densidade
vezes a velocidade da luz ao quadrado, isto é, P ∼ ρc2 .
b. um gás relativı́stico degenerado tem uma densidade de uma partı́cula por cada
comprimento de onda Compton. Combine isto com o resultado de a. para calcular
qual a massa da estrela.

5.13 Referências bibliográficas


[1] S. L. Shapiro, S. A. Teukolsky, White dwarfs, black holes and neutron stars: The
Physics of compact objetcs. Wiley & Sons, New York (1983)
[2] S. Chandrasekhar, An introduction to the study of stellar structure, Dover Publi-
cations Inc., New York (1958)
[3] R. d’Inverno, Introducing Einstein’s Relativity, Clarendon Press, Oxford, UK
(1992)
[4] P. C. Peters, J. Mathews, Phys. Rev. 131, 435-439 (1963)
[5] J. H. Taylor, J. M. Weisberg, RELATIVISTIC BINARY PULSAR B1913+16:
THIRTY YEARS OF OBSERVATIONS AND ANALYSIS, Proceedings of Aspen
Winter Conference on Astrophysics: Binary Radio Pulsars, Aspen, Colorado, 11-
17 Jan. (2004)
[6] Clifford E. Rhoades, Jr., Remo Ruffini, Phys. Rev. Lett. 32:324-327 (1974).

219
Capı́tulo 6

Buracos Negros

Santiago Esteban Perez Bergliaffa1

6.1 Um pouco de história


Embora o estudo sistemático das propriedades dos buracos negros tenha começado
na segunda metade do século passado, a idéia básica foi proposta muito antes da
criação da RG. Em 1783, John Michell [1] aplicou a lei da gravitação de Newton a luz,
que segundo a teoria vigente naquela época era composta de partı́culas que movimento
com velocidade c. O raciocı́nio de Michell é simples: se uma partı́cula de luz de massa
m é lançada verticalmente para cima desde a superfı́cie de uma estrela, em qualquer
ponto da trajetória é valida a conservação da energia [2] ,
1
E = mvz2 + V (z), (6.1)
2
onde V (z) = −GmM/z, G é a constante de Newton, M é a massa da estrela, e a
origem da coordenada z coincide com o centro da estrela. Lembrando que a energia
cinetica não pode ser negativa, do gráfico do potencial (Fig. 6.1) vemos que para E < 0
a partı́cula atinge um zmax e volta à superfı́cie, mas para E ≥ 0 a partı́cula consegue
escapar. A velocidade de escape ve é definida como a mı́nima velocidade inicial com
que a partı́cula consegue chegar “apenas” (isto é, com velocidade zero) ao infinito. Do
gráfico vemos que neste caso E = 0, e então segue da equação (6.1) que
r
2M G
ve = (6.2)
R
onde R é o raio da estrela. A tı́tulo de referencia, no caso da Terra, ve ≈ 106 cm/seg.
1
Afiliação : Departamento de Fı́sica Teórica, Instituto de Fı́sica, Universidade do Estado de Rio de
Janeiro, Rua São Francisco Xavier 524, Maracanã 20550-900, Rio de Janeiro - RJ.

220
Figura 6.1: Potencial gravitacional na teoria de Newton para movimento vertical. O
movimento depende do sinal da energia.

A expressão para ve mostra que fixando a massa M , ve é maior quanto menor é o


raio da estrela (o que é compreensı́vel já que a partı́cula estarı́a saindo de uma região
onde a gravitação é mais intensa). Michell concluiu que existe uma circunferência
crı́tica, tal que ve é igual á velocidade da luz c: para uma estrela com raio menor
do que Rc = 2M G/c2 , a luz não pode escapar da estrela. Ele ainda foi mais longe,
e postulou que poderia existir no universo um grande número destas estrelas escuras
(antepassados dos buracos negros da RG), sem que pudessem ser vistas, e anunciou
estes resultados em 1783. Treze anos mais tarde, Pierre Laplace apresentou os mesmos
resultados no livro Le system du Monde. Infelizmente esta idéia caiu logo no esqueci-
mento devido aos experimentos de interfêrencia da luz realizados por Thomas Young,
que apoiavam a tese (defendida entre outros por Christian Huygens) de que a luz era
uma onda e não um “jato” de partı́culas. Foi preciso esperar quase 150 anos para que
ela renascesse, já no contexto da teorı́a da gravitação de Einstein, graças ao trabalho
de Karl Schwarszchild.

Pouco tempo depois da publicação do artigo apresentando a RG,


Schwarszchild divulgou no exemplar de 25 de Novembro de 1915 dos Proceed-
ings of the Prussian Academy of Science [3] a solução das equações de Einstein
para o exterior de uma estrela com simetria esférica e sem rotação 2 . Em 1916, ele
conseguiu calcular ainda a solução para o interior do mesmo tipo de estrela, quatro
meses antes de morrer por causa de uma doença contraı́da na frente russa da Primeira
Guerra Mundial. Como veremos na seção seguinte, a solução de Schwarszchild tem
caracterı́sticas exóticas, que levaram aos especialistas da época (o próprio Einstein e
A. Eddington entre eles) a não acreditar na existencia de objetos por ela descritos
na natureza. Em particular, a questão da(s) singularidade(s) desta solução só
ficou esclarecida definitivamente nos anos 50 [37]. Paralelamente a questão das
caracterı́sticas da solução de Schwarszchild, foi progredindo o estudo do interior das
2
Os detalhes da historia do desenvolvimento do conceito de buraco negro estão em [36].

221
estrelas e do colapso gravitacional, graças aos trabalhos de Chandrasekhar (anãs
brancas) e Oppenheimer (colapso esférico), entre outros. Em 1963, Roy Kerr publicou
[4] a primeira solução das EE descrevendo o espaço-tempo gerado pelo que ele pensou
se tratava de uma estrela com momento angular não nulo, mas no ano seguinte
Brandon Carter mostrou que a solução de Kerr descrevia não uma estrela mas um
outro tipo de objeto em rotação, com uma estrutura de singularidades mais complexa
que a de Schwarszchild. Em 1965 a solução de Kerr foi generalizada ao caso de uma
configuração com carga por Newman et al [5]. O nome de buraco negro foi dado em
1967 por John Wheeler ao estado final do colapso gravitacional de uma estrela muito
massiva, sendo mais tarde generalizado para abranger qualquer solução que apresente
horizonte(s) de eventos 3 (tal como as de Schwarszchild, Kerr e Kerr-Newmann).
Dois anos mais tarde, Roger Penrose desenvolveu um processo para extrair energia
rotacional do buraco negro de Kerr. Um outro resultado que foi sendo elaborado na
decada dos 60 foi o teorema que mostra que “os buracos negros não tem cabelo”.
Isto quer dizer que os buracos negros não conservam nenhum detalhe da estrela que
colapsou para formá-los. De outra forma, os únicos parâmetros que caraterizam um
buraco negro são a massa, o momento angular, e a carga elétrica.
No inicio da década dos 70 foi estudada toda a teorı́a de perturbações da geometria
de Schwarszchild, completando assim o entendimento dos buracos negros do ponto
de vista clássico. Para completar a discussão das caracterı́sticas clásicas dos buracos
negros, na Sec. 6.7 apresentaremos os buracos negros astrofı́sicos.
Como veremos na Sec. 6.8, a surpresa chegou no ano 1974, quando Hawking mostrou
que efeitos quânticos fazem com que o buraco negro emita radiação com espectro de
corpo negro. Esta descoberta abriu a porta para a formulação da termodinâmica de
buracos negros, colocando também novos problemas (ver Sec. 6.9). Na seção seguinte,
começaremos nosso estudo com a solução de Schwarszchild.

6.2 A solução de Schwarszchild


A solução de Schwarszchild [3] é a métrica exterior de um corpo com simetria esférica.
É conveniente resumir aqui o que foi apresentado na seção 2.6.1. A métrica de
Schwarszchild nas coordenadas (t, r, θ, φ) tem a forma
2
 rg  2  rg −1 2
ds = 1 − dt − 1 − dr − r2 (dθ2 + sin2 θdφ2 ), (6.3)
r r
onde rg = 2M G/c2 ≈ 3(M/M ) km. Revisemos algumas de suas caracterı́sticas mais
importantes:

• Simetria esférica. Para t e r fixos, as distâncias são determinadas pelo elemento


de linha na esfera,
ds2 = r2 (dθ2 + sin2 θdφ2 ), (6.4)
3
A rigor, qualquer solução não cosmológica.

222
onde 0 ≤ θ ≤ π, −π ≤ φ ≤ π.

• Ausência da coordenada t na métrica no sistema de coordenadas escolhido. Isto re-


flete o fato de que as coordenadas (t, r, θ, φ) são adequadas para a descrição do bu-
raco negro de Schwarszchild, pois evidenciam uma propriedade importante deste
espaço-tempo: ele é estático. Em outros sistemas coordenados, a dependência
com o tempo dos coeficientes métricos poderia induzir ao erro de pensar que se
trata de um espaço-tempo não estático. Neste caso, a questão somente pode-
ria ser respondida calculando invariantes da geometria (ver Cap.??, sec.??), ou
utilizando critérios de geometria diferencial 4 .
De fato, o Teorema de Birkhoff, já enunciado na seção 2.6, garante que a
solução das EE com simetria esférica em ausência de materia é estática, e está
dada pela métrica de Schwarszchild. Uma conseqüência deste teorema é que se
uma estrela estiver pulsando ou em colapso conservando a simetria esférica, a
métrica fora da estrela é a a métrica de Schwarszchild 5 . Este resultado está
intimamente ligado com a natureza da interação gravitacional. Como veremos no
capı́tulo 7, as ondas gravitacionais são transversais a direção de movimento. Con-
seqüentemente, qualquer onda gravitacional gerada pela estrela quebraria a sime-
tria esférica. Em outras palavras, estrelas com simetria esférica em pulsação não
podem emitir ondas gravitacionais.

• A solução de Schwarszchild é assintoticamente plana (se reduz á geometria de


Minkowski em coordenadas esféricas no limite r → ∞).

• Ela representa a solução exterior de um objeto com massa M , como foi mostrado
a partir do limite de campo fraco na Sec. 2.6.

Como em qualquer outra solução das EE, a métrica terá informação não só da ge-
ometria mas também do sistema de coordenadas escolhido. É bom lembrar que uma
escolha judiciosa do sistema coordenado ajuda tanto na resolução das EE quanto na
obtenção de uma métrica que mostre de cara algumas das propriedades do espaço-
tempo em questão. Por exemplo, no caso da geometria de Schwarszchild o problema
de achar a solução das EE, que envolve em principio determinar os 10 coeficientes da
métrica, foi reduzido usando somente questões de simetria (ver Sec.2.6) ao problema
de achar duas funções A(r) e B(r). Estas foram determinadas através das EE para o
caso de vácuo.

A seguir, estudaremos uma outra caracterı́stica da solução de Schwarszchild, extrema-


mente importante no que diz respeito aos buracos negros, e relacionada com o fato de
que a métrica (6.3) apresenta problemas na superfı́cie r = rg e no ponto r = 0.
4
Um espaço-tempo estático é aquele no qual existe um vetor de Killing tipo tempo ortogonal ás
hipersuperfı́cies t =constante ver por exemplo [17].
5
Notar que a “inversa” do teorema não é valida: uma fonte que é descrita no exterior pela solução de
Schwarszchild não tem necessariamente simetria esférica.

223
6.2.1 Singularidades

Em geral, um dado sistema de coordenadas não cobre completamente a variedade que


representa o espaço-tempo. Por exemplo, o eixo θ = 0, π não pode ser descrito pela
métrica de Minkowski nas coordenadas (t, r, θ, φ), já que para tais valores do ângulo θ
o elemento de linha de Minkowski (assim como qualquer outro com simetria esférica)
é degenerado. Isto é o que se chama uma singularidade de coordenadas, porque reflete
uma deficiência no sistema coordenado escolhido (enquanto o espaço-tempo é regular),
e pode ser removida (no caso, introduzindo coordenadas cartesianas). A métrica de
Schwarszchild é degenerada no caso θ = 0, π e ainda em outros dois casos: eles são
r = 0 e r = rg . Qual seria o critério conveniente para decidir se uma singularidade é
fictı́cia (isto é, devida a uma escolha inadequada do sistema de coordenadas) ou real?
[33]. Poderiamos por exemplo calcular invariantes associados a curvatura, e se algum
deles divergisse, estariamos em presença de uma singularidade “essencial´’, já que a
invariancia assegura que a divergência acontece em qualquer sistema coordenado. No
caso da métrica (6.3), é suficiente calcular um dos invariantes, por exemplo

48M 2
Rµνρσ Rµνρσ = , (6.5)
r6
para mostrar que o ponto r = 0 é uma singularidade essencial. Mas este resultado
não permite concluir nada sobre a superfı́cie r = rg 6 . Um outro critério que pode-
riamos adotar é o seguinte: uma singularidade é real se as forcas de maré que agem
sobre um objeto na suposta singularidade são infinitas 7 . Este critério concorda com a
noção de singularidade como divergência da força associada ao campo, bem conhecida
no caso do eletromagnetismo por exemplo. Para calcular as forças de maré utilizaremos
a equação do desvio geodésico

D2 η i
− Rabcd eia v b v c ejd η j = 0, (6.6)
Dη 2

onde η j = (η r , η θ , η φ ) é o vetor de Jacobi, que une as geodésicas de duas partı́culas


vizinhas em queda livre, e eia são as tetradas, definidas como segue:

e0a ≡ (1 − 2M/r)−1/2 (1, 0, 0, 0), (6.7)

e1a ≡ (1 − 2M/r)1/2 (0, 1, 0, 0), (6.8)


e2a ≡ r−1 (0, 0, 1, 0), (6.9)
e3a ≡ (r sin θ)−1 (0, 0, 0, 1). (6.10)
A equação do desvio (6.6) se reduz neste caso a

D2 η r 2M
2
= + 3 ηr ,
Dη r
6
Nesta seção e nas seguintes faremos c = G = 1.
7
As forças de maré foram discutidas na Seção 1.2.4 e .....

224
D2 η θ M θ
= − η ,
Dη 2 r3
D2 η φ M φ
= − η .
Dη 2 r3
O sinal “+” do lado direito da primeira equação indica uma tensão ou esticamento
na direção radial, enquanto que o sinal “-” das outras equações indica uma pressão
ou compressão nas direções transversais. Claramente vemos que as forças de maré são
finitas em r = rg , mas divergem na origem, confirmando o caráter essencial da singu-
laridade em r = 0, e estabelecendo que a superfı́cie r = rg não é uma singularidade
real, mas um artefato do sistema de coordenadas escolhido 8 . Veremos na Sec. 6.2.3
que é possı́vel construir sistemas de coordenadas bem comportados em r = rg , que
nos ajudarão a entender melhor a natureza da solução de Schwarszchild.
Para aprofundar o entendimento da geometria da solução de Schwarszchild podemos
analizar o comportamento dos cones de luz (veja Seção 12.7.3). É conveniente lembrar
que o cone de luz é definido como o locus dos pontos xµ + dxµ na vizinhança de um
ponto xµ tal que
gµν dxµ dxν = 0.

No caso da geometria de Minkowski em coordenadas cartesianas, a expressão anterior


toma a forma
dt2 − dx2 − dy 2 − dz 2 = 0.

A estrutura de cone de luz restringe as possı́veis linhas de universo de uma partı́cula,


já que a tangente a uma destas necessariamente deve estar dentro ou sobre o cone
de luz (caso contrário, a velocidade da partı́cula seria maior que c = 1). No espaço-
tempo plano, o cone de luz é uma estrutura global, enquanto que em presença de
um campo gravitacional, o cone de luz é uma estrutura local [6]. Isto está ligado ao
fato de que a RG se reduz, numa vizinhança pequena o suficiente de um ponto, à RR
(veja a Seção 11.5). A curvatura do espaço-tempo se manifesta só quando saimos da
vizinhança e nos dislocamos para pontos não tão próximos. Em particular, quando o
espaço-tempo é curvo, a curvatura faz os cones se achatarem e/ou inclinarem, como
veremos a seguir.

6.2.2 Diagrama do espaço-tempo na geometria de


Schwarszchild

Sendo os cones de luz definidos pelas trajetórias de partı́culas de massa nula, estu-
daremos aqui as geodésicas nulas, começando pelas geodésicas radiais, definidas por

ds2 = 0, θ = const., φ = const.


8
Este resultado, que hoje parece mais ou menos evidente, só foi aceito definitivamente nos anos 60.

225
É conveniente lembrar que o movimento de partı́culas no espaço-tempo de
Schwarszchild foi estudado na Sec.2.6.1 utilizando a equação da trajetória r = r(φ).
Aqui estudaremos a dependência das coordenadas com o parâmetro afim λ (no caso
de partı́culas com massa zero), ou com o tempo coordenado t (no caso de partı́culas
com massa não nula).
Da EOM (2.271) obtemos para o caso de massa nula e momento angular zero,

ṙ = ±E, (6.11)

onde o ponto representa a derivada com relação ao parâmetro afim. Para analizar o
diagrama espaço-tempo precisamos conhecer t = t(r). Usando a integral da expressão
(2.263),
(1 − 2M/r)ṫ = E
na identidade
dt ṫ
= ,
dr ṙ
obtemos (tomando o sinal positivo em (6.11))
dt r
= , (6.12)
dr r − 2M
que pode ser integrada dando como resultado

t = r + 2M ln |r − 2M | + constante. (6.13)

A partir do fato de que os coeficientes gtt e grr mudam de sinal em r = rg = 2M ,


dividimos tentativamente a geometria de Schwarszchild em duas regiões, tendo a su-
perfı́cie r = rg como fronteira.
Na região r > 2M (que chamaremos região II), vemos da Eq.(6.12) que r aumenta
quando t aumenta. As curvas r vs. t da Eq.(6.13) definem então uma congruência de
geodésicas nulas emergentes. Já o sinal negativo de (6.11) define uma congruência de
geodésicas nulas incidentes, dadas por

t = −(r + 2M ln |r − 2M | + constante). (6.14)

Agora podemos usar as equações das congruências para desenhar o diagrama do


espaço-tempo da solução de Schwarszchild nas coordenadas de Schwarszchild, para
θ e φ fixos (ver fig. 6.2). Notar que este diagrama (e todos os outros do tipo que us-
aremos nas seções seguintes) é bidimensional: cada ponto dele deve ser pensado como
uma 2-esfera de área 4πr2 . Para r → ∞ as geodésicas formam ângulos de 45◦ com os
eixos, mostrando que o espaço-tempo é asintoticamente plano.
Na região r < 2M os cones aparecem virados, devido á mudança da coordenada r (t)
de tipo espaço (tempo) a tipo tempo (espaço) (vide a expressão da métrica Eq.(6.3)).
Em particular, nesta região as retas r = constante ficam fora do cone de luz, ou seja
que nenhum corpo pode se manter em repouso alı́, sendo atraı́do inevitávelmente pela

226
Figura 6.2: Solução de Schwarszchild em coordenadas de Schwarszchild

singularidade. Vemos claramente então uma das caracterı́sticas fundamentais do bu-


raco negro de Schwarszchild: fatalmente a singularidade atrai qualquer partı́cula que
esteja dentro da superfı́cie r = rg .
Uma outra conseqüência interessante da equação (6.12) é que dela segue que
dr
= 0.
dt r=2M

Em outras palavras, a velocidade “coordenada” de uma partı́cula de massa zero (como


por exemplo o fóton) é zero no horizonte. Isto sugere que levaria um tempo infinito
para que uma partı́cula que se move na direção da origem na região II chegue a
r = 2M . De fato, integrando a equação (6.12) obtivemos

t = r + 2M ln |r − 2M | + constante. (6.15)

Vemos desta equação que t → ∞ para r → 2M . Ou seja que leva um tempo coordenado
infinito para o fóton alcançar r = 2M independendo da posição inicial. Voltaremos a
esta questão daqui a pouco.
Passemos agora a estudar as geodésicas radiais de partı́culas com massa não nula. As
equações de movimento que seguem de (2.263) e (2.264) são

(1 − 2M/r)ṫ = E, (6.16)

(1 − 2M/r)ṫ2 − (1 − 2M/r)−1 ṙ2 = 1. (6.17)


(o ponto representa a derivada com relação ao tempo próprio τ da partı́cula). Impondo
que t ≈ τ no infinito, segue que
 2
dτ r
= .
dr 2M

227
Integrando,
2  3/2 
τ − τ0 = √ r0 − r3/2 . (6.18)
3 2M
Esta expressão mostra que a partı́cula passa através do horizonte e atinge r = 0 num
tempo finito, contrariamente ao que sugere a Figura 6.2. Vejamos agora o que acontece
na descrição do movimento usando a coordenada t. Integrando a equação
 r 1/2  −1
dt ṫ 2M
= =− 1− ,
dr ṙ 2M r

obtemos
1/2
2 3/2 3/2 1/2 1/2 (r1/2 + (2M )1/2 )(r0 + (2M )1/2 )
t−t0 = − √ (r −r0 +6M (r −r0 ))+2M ln 1/2 .
3 2M (r0 + (2M )1/2 )(r1/2 − (2M )1/2 )
(6.19)
É facil ver que esta equação coincide com a equação (6.18) no caso em que r, r0 >>
2M . No entanto, para r ≈ 2M ,

r − 2M = (r0 − 2M )e−(t−t0 )/2M ,

de onde segue que t → ∞ quando r → 2M . Vemos que, independendo da massa,


a partı́cula demora uma quantidade infinita de tempo coordenado para chegar até
r = 2M . Mas como foi discutido na Seção 6.2, as forças de maré são finitas em
r = 2M e nada impede a passagem da partı́cula através desta superfı́cie. Concluimos
então que a coordenada t é conveniente só para descrever o movimento longe de r =
2M , mas claramente é patológica perto desta superfı́cie. O comportamento do tempo
coordenado vs o tempo próprio é mostrado na Figura 6.3.

Figura 6.3: Tempo coordenado vs. tempo próprio, a partir das equações (6.18) e (6.19).
A linha em r = 0 indica a singularidade.

A seguir mostraremos que é possı́vel introduzir uma nova coordenada temporal que
remova a singularidade aparente em r = 2M .

228
6.2.3 Outros sistemas dee coordenadas?

Coordenadas de Eddington-Finkelstein “imergentes”

Um sistema coordenado que melhora o problema das coordenadas de Schwarszchild em


r = 2M foi introduzido por Eddington em 1924 e redescoberto por Finkelstein em
1958. Definindo uma nova coordenada

t̄ = t + 2M ln(r − 2M ) (6.20)

para r > 2M , vemos que a equação (6.14) que define a congruência das geodésicas
incidentes toma a forma
t̄ = −r + constante, (6.21)
que é uma reta que faz um angulo de -45◦ com o eixo r. Diferenciando a equação (6.20)
e eliminando dt na métrica de Schwarszchild em favor de dt̄ obtemos
   
2 2M 2 4m 2M
ds = 1 − dt̄ − dt̄ dr − 1 + dr2 − r2 dΩ2 , (6.22)
r r r

que é a forma de Eddington-Finkelstein (E-F) da métrica de Schwarszchild. O dia-


grama espaço-temporal para a solução de Schwarszchild nas coordenadas E-F é dado
na figura 6.4. Novamente os cones abrem a 45◦ em r = ∞. O lado esquerdo dos cones

Figura 6.4: Solução de Schwarszchild em coordenadas de Eddington-Finkelstein


avançadas

(correspondente aos “fótons imergentes”) é dado por uma linha a -45◦ com o eixo r.
O lado direito (correspondente aos “fótons emergentes”) começa a 45◦ em infinito, e
depois vai se fechando a medida que r diminue, atingindo a vertical em r = 2M , e

229
continuando a se fechar depois. Vemos que em r = 2M os fótons emergentes “ficam no
lugar”. A diferença com relação a figura (6.2) é que esta figura mostra corretamente
o que acontece com uma partı́cula em queda radial.
Note que a solução de Schwarszchild nestas coordenadas é regular em r = 2M . De
fato, ela é regular no intervalo 0 < r < ∞. Ou seja, a transformação (6.20) extendeu
o intervalo da variável r coberto pelo sistema coordenado de Schwarszchild, de jeito
semelhante ao que acontece na extensão analı́tica de uma função em análise complexa
[7], e por isso a métrica (6.22) se chama extensão analı́tica da métrica (6.3). O sis-
tema de coordenadas de Schwarszchild cobre então somente uma parte da variedade
espaço-tempo, trata-se de um local coordinate patch sobre a variedade completa. As
coordenadas de E-F imergentes por sua vez cobrem uma parte maior da variedade
(mas veremos depois que não cobrem toda a variedade) 9 .
A métrica (6.22) pode ser re-escrita introduzindo a coordenada

v = t̄ + r.

onde v é a coordenada tempo avançado. Vemos da equação (6.21) que a congruência


de geodésicas incidentes é dada por v = constante. Em termos desta nova coordenada,
a métrica toma a forma
 
2 2M
ds = 1 − dv 2 − 2 dv dr − r2 dΩ2 . (6.23)
r

Note que embora as coordenadas de E-F imergentes descrevem a trajetória das


partı́culas caindo na direção do buraco negro sem singularidade aparente em r = 2m,
as partı́culas emergentes sofrem a mesma patogı́a que no caso de Schwarszchild (veja
Fig.6.4). Poderı́amos definir também coordenadas de E-F “emergentes” através da
relação u = t̄ − r (ver por exemplo [13]). Elas descrevem bem o movimento das
partı́culas emergentes, mas a singularidade aparente em r = 2m ainda está presente
para aquelas em movimento na direção do buraco negro. É necessário então um sistema
de coordenadas mais abrangente, o sistema de Kruskal-Szekeres, que estudaremos na
Sec.6.5.
Mesmo com a deficiêncian apontada acima, as coordenadas de E-F imergentes são
extremamente úteis no estudo do colapso gravitacional (veja [9] e Sec.6.3).

6.2.4 Horizonte de eventos

Da figura 6.4 vemos que longe da origem, os cones de luz são os do espaço-tempo de
Minkowski. A medida que vamos nos aproximando a r = 0, as frentes de onda emer-
gentes são atraı́dos “para dentro” (isto é, os cones viram). Em r = 2m, fótons radiais
9
Rigorosamente, a análise na região 0 < r < 2m da seção anterior é correta a posteriori, já que as
coordenadas de Schwarszchild não cobrem essa região. Mas a análise nas coordenadas de E-F e Kruskal
(ver Sec. 6.5) concorda com a interpretação que segue das coordenadas de Schwarszchild “internas”.

230
emergentes ficam sobre a superfı́cie, enquanto todos os outros são arrastados para
dentro de r = 2M . Já na região II, dentro da superfı́cie r = 2M , até os fótons radiais
emergentes são desviados na direção da singularidade. Segue então que a superfı́cie
r = 2M age como uma membrana unidirecional 10 , permitindo que as curvas tipo
tempo ou nulas dirigidas ao futuro passem da região II para a I, mas não deixando
que curvas tipo tempo ou nulas dirigida ao futuro possam sair da região I para a II.
A superfı́cie r = 2M é chamada de horizonte de eventos já que representa a fron-
teira dos eventos que podem ser observados desde r > 2M . A figura 6.5 representa
esquematicamente num diagrama espacial o comportamento dos cones de luz no plano
equatorial do buraco negro de Schwarszchild. Note que o horizonte existe tanto para

Figura 6.5: Diagrama espacial do espaço-tempo de Schwarszchild nas coordenadas de E-F


avançadas.

curvas geodésicas como para curvas aceleradas, já que mesmo as partı́culas aceleradas
se movem dentro do cone de luz (mas não seguindo retas).

A soulção de Schwarszchild em outros sistemas de coordenadas

Para encerrar por enquanto a discussão sobre sistemas coordenados , mencionaremos


que existem outros sistemas de coordenadas úteis para descrever o espaço-tempo de
Schwarszchild. Entre eles, dois dos mais conhecidos são o sistema isotrópico, e o sis-
tema de Painlevé-Gullstrand. No primeiro deles a métrica tem a forma
4
(1 − 21 m/ρ)2 2

2 1  2 2 2 2 2

ds = 1 dt − 1 + m/ρ dρ + ρ (dθ + sin θdφ ) . (6.24)
(1 + 2 m/ρ)2 2
Note que neste sistema, a métrica sobre uma superfı́cie t = constante qualquer é a
métrica do espaço-tempo plano multiplicada pou um fator (chamado fator conforme).
10
De fato, a analogia com uma membrana pode ser levada bem longe, ver [30].

231
Já no sistema de coordenadas de Painlevé-Gullstrand, o elemento de linha (também
conhecido como elemento de linha de Lemâitre), tem a forma
  r
2GM 2GM
ds2 = 1 − dt2 ± dr dt − dr2 − r2 dΩ2 . (6.25)
r r
Neste sistema, as superfı́cies t=constante sao planas: toda a curvatura do espaço-
tempo está nas componentes t−t e t−r da métrica. Outras caracterı́sticas da solução de
Schwarszchildnestas coordenadas são discutidas em [8].
Temos discutido até agora as caracterı́sticas matemáticas da solução de Schwarszchild.
Mas qual é a situação fı́sica por ela descrita? Para responder esta pergunta, seremos
obrigados a efetuar um breve desvio para falar de colapso gravitacional.

6.3 Colapso gravitacional e buracos negros


Como foi visto no capı́tulo 5, a teoria de evolução estelar mostra que estrelas com
massa da ordem de 1 M atingem o equilı́brio como anãs brancas ou estrelas de
neutrons, mas não existe estado de equilı́brio ao final da evolução de estrelas de massa
muito maior do que M . Neste caso, a materia não consegue gerar pressões grandes
o suficiente para contrabalançar a ação da gravitação , e o colapso é inevitável: as
camadas centrais da estrela são afundadas pelo peso das camadas externas. A RG
prediz que o resultado do colapso de uma estrela com simetria esférica é um objeto
descrito pela solução de Schwarszchild completa, isto é um buraco negro.
Embora existam modelos detalhados de colapso gravitacional (alguns deles com
solução
analı́tica, mas a maioria exige tratamento numérico), em geral eles são complicados 11
Analisaremos aqui qualitativamente o caso de uma estrela com simetria esférica e mo-
mento angular nulo que está colapsando, até que o raio da superfı́cie da estrela alcance
o valor r = 2M . Lembremos que enquanto a estrela permaneça com simetria esférica,
o campo externo é descrito pela solução de Schwarszchild. Para visualizar o que acon-
tece durante o colapso, utilizaremos um diagrama espaço-tempo bidimensional nas
coordenadas de Eddington-Finkelstein. Vemos do gráfico que os fótons emitidos desde
a superfı́cie da estrela nos estágios iniciais do colapso conseguem chegar até infinito,
mas o intervalo entre eles cresce com o tempo, sendo que aqueles fótons emitidos
quando a superfı́cie atinge r = 2M ficam nessa superfı́cie, e os emitidos posterior-
mente são inexorablemente atraı́dos pela singularidade. A superfı́cie da estrela some
então da vista do observador em infinito, dando lugar a um buraco negro, que captura
todo aquilo que passe perto o suficientes dele.
A métrica de Schwarszchild seria útil então em dois casos. No primeiro, ela poderia
representar o exterior de um objeto compacto (uma estrela de neutrons, por exemplo,
11
Aqueles interessados nos detalhes do cálculo podem consultar a referência [9]. Veja também [10].

232
Figura 6.6: Colapso em coodenadas de Schwarszchild.

ver capı́tulo 5). Neste caso, o raio gravitacional está sempre no interior do corpo,
não existe nenhuma singularidade, e a métrica de Schwarszchild descreve a geometria
a partir da superfı́cie do mesmo 12 . O segundo caso é aquele o mostrado na figura 6.6, no
qual, como resultado do colapso, a superfı́cie da estrela atravessa o raio gravitacional,
e o horizonte fica “a descuberto”. Este é o caso do buraco negro 13 .

O que acontece no caso mais geral de uma estrela colapsando sem manter a simetria
esferica? Não existe critério geral que permita decidir em quais condições se formará
um horizonte, dada uma situação inicial arbitrária. A dificuldade principal deste prob-
lema é a dependência temporal do processo: durante o colapso, existe um perı́odo de
tempo durante o qual o horizonte está aumentando desde raio zero até 2M no caso
de Schwarszchild. Isto fica claro da figura 6.6, onde vemos que existe um último fóton
(o “marginal”) que fica no horizonte. Nesta situação de simetria esférica não é difı́cil
determinar a posição do horizonte, mas em situações assimétricas, e com emissão de
radiação gravitacional, o cálculo é extremamente complexo. Contudo, alguns resulta-
dos têm sido obtidos:

• Se o colapso é quase esférico, a parte não esférica da distribuição de massa


(momentos quadrupular, octupolar, etc) é eliminada em forma de ondas gravita-
cionais, e o resultado final é um buraco negro de Kerr (ou de Schwarszchild no
caso de momento angular zero) [11].
12
O interior deve ser descrito por uma solução das EE em presencia de materia, que deve ser “colada
” continuamente com a solução de Schwarszchild na superfı́cie do objeto.
13
É conveniente notar que embora existe unanimidade quase absoluta sobre a existencia do horizonte,
pelo menos uma ideia alternativa tem sido apresentada na literatura, ver ref.[32].

233
• Diversos cálculos indicam que qualquer horizonte (mesmo em ausência total de
simetria) acabará sendo estacionário (o que se conhece como a conjectura de “no
hair”).
• Um resultado conhecido para o caso de horizontes não estacionários é o teorema
da área de Hawking (ver Seção 6.9).

Na seção seguinte estudaremos o movimento de partı́culas na geometria de


Schwarszchild.

6.4 Mecânica celeste no campo gravitacional de um


buraco negro de Schwarszchild

Nesta seção estudaremos o movimento de partı́culas livres no espaço-tempo da


solução de Schwarszchild. Os resultados desta seção são importantes para entender
os fenômenos que acontecem nas vizinhanças de um buraco negro ”astrofisico´´, isto
é, um buraco negro imerso num meio, em interação com matéria (veja a Seção 6.7).
O movimento pode ser descrito em forma exata resolvendo a equação diferencial das
geodésicas,
d2 xµ α
µ dx dx
β
+ Γ αβ = 0,
dτ 2 dτ dτ
adequada ao caso de Schwarszchild. Na Seção 2.6.2 foi calculada a trajetória para
partı́culas com e sem massa na geometria de Schwarszchild. No entanto, muita in-
formação sobre o movimento pode ser extraida usando um método de análise qual-
itativo: o potencial efetivo. Da mecânica newtoniana sabemos [2] que o movimento
radial de uma partı́cula de massa unitária com energia E e momento angular L no
campo gravitacional de uma massa M somente é possı́vel para aqueles valores de r
nos quais a desigualdade
 2
1 dr E
= − VN (r) ≥ 0
2 dt 2

é satisfeita, onde VN (r) é o potencial newtoniano efetivo, dado por VN (r) = −M/r +
L2 /(2r2 ). Em particular, aqueles r tais que E = VN (r) são os pontos de retorno, e
neles a velocidade da partı́cula é zero. Começaremos revisando o movimento no caso
newtoniano, deixando o caso de Schwarszchild para a seção seguinte, onde veremos que
existem grandes diferências devidas á RG. O diagrama correspondente ao potencial
efetivo VN é dado na figura 6.7. Vemos dele que

• partı́culas com E > 0 vem desde infinito, são refletidas pelo potencial no ponto
r = rret dado pela equação E = VN (rret ), e voltam para o infinito seguindo
órbitas abertas (parabólicas ou hiperbólicas), enquanto

234
Figura 6.7: Potencial efetivo para o caso newtoniano com diferentes valores de a = L/M :
a1 = 1, a2 = 4.

• partı́culas com E < 0 e momento angular grandes o suficiente percorrem uma


órbita com r1 ≤ r ≤ r2 , com r1 e r2 soluções da equação V (r) = E2 .

Detalhes sobre o movimento neste caso podem ser encontrados em qualquer livro de
mecânica clássica, por exemplo [12], mas é importante lembrar que o potencial efetivo
não tem informação sobre a parte angular do movimento. Esta segue da equação de
movimento correspondente á φ (ver eq.(6.27)).
Veremos a seguir que um raciocinio análogo ao aplicado no caso newtoniano pode ser
desenvolvido no caso da solução de Schwarszchild, mas com resultados bem diferentes.
Como foi mostrado na Seção refmteste, no movimento de partı́culas teste (isto é,
aquelas que não alteram a geometrtia de fundo) na métrica de Schwarszchild,

dr2
 
2 2M
ds = 1 − dt2 − 2M
 − r2 (dθ2 + sin2 θdφ2 ),
r 1− r

duas quantidades são conservadas: pt e pφ . Daremos a estas quantidades os nomes

pt ≡ E, pφ ≡ ±L.

E é a energia total da partı́cula, incluindo a massa m (se a partı́cula está em repouso


muito longe da origem, onde o campo gravitacional é desprezivel, E = mc2 ), e L é o
módulo do momento angular. Da expressão da magnitude do vetor energia-momento,
gµν pµ pν = m2 , obtemos a equação
2
E2 L2

1 dr
2M
− − = m2 .
1 − 2M

1− r r
dλ r2

onde λ é o tempo próprio por unidade de massa. Dividindo por m2 e definindo  ≡ E/m
e ` ≡ L/m obtemos
 2
dr 2
= − v 2 (r), (6.26)
dτ 2

235
onde τ é o tempo próprio e
s  
 rg  `2
v(r) = 1− 1+ 2 .
r r

é o potencial efetivo [13], definido para r > 2M . A equação diferençial (6.26) determina
a variação de r com τ . Para a variação das outras duas coordenadas relevantes temos

dφ 1 dφ pφ g φφ L `
= = = = 2, (6.27)
dτ m dλ m m r
dt 1 dt pt g tt E 
= = = = . (6.28)
dτ m dλ m m 1 − 2M/r
Obtendo r = r(τ ) a partir de (6.26), estas duas equações determinan a dependência
de t e φ com τ (notar que para objetos de massa nula não podemos utilizar o tempo
próprio; veremos como resolver isto mais adiante).
Vamos examinar agora as possı́veis órbitas de uma partı́cula de massa não nula na
geometria de Schwarszchild, utilizando o potencial efetivo,
r
2M `2 2M `2
v(r) = 1 − + 2− . (6.29)
r r r3
A primeira coisa a ser notada é que para r < 2M o potencial é imaginario,
não existindo então pontos de retorno, definidos por  = v(r). Em outras palavras, se
a partı́cula entra na superfı́cie r = 2M já não volta a sair, confirmando o fato de que
esta superfı́cie é um horizonte.
Por meio de álgebra simples é possı́vel mostrar que o potencial tem extremos em

`2 ± (`4 − 12`2 M 2 )1/2


r± = . (6.30)
2M
Para ` < 12M não existem pontos extremos: uma partı́cula caindo na direção de
r = 0 (mas não necessariamente com φ = constante) passará através de r = 2M e
chegará na singularidade r = 0 inevitavelmente. Note que não existem tais órbitas de
captura no caso newtoniano (veja Fig. 6.9).
No caso `2 > 12M 2 , r+ é um mı́nimo de V, enquanto r− é um máximo. Neste caso
existem órbitas circulares estáveis em r = r+ , e instáveis em r = r− . Notar que para
L >> M , a expressão para r+ fica r+ ≈ L2 /M , que é a expressão da teoria newtoniana
para o raio de uma órbita circular de uma partı́cula de momento angular por unidade
de massa L orbitando em torno de um corpo de massa M (Fig. 6.9).
Note que da eq.(6.30) segue que r+ > 6M , ou seja que não existem órbitas circulares
estáveis para raios menores que 6M , e ainda que as órbitas instáveis estão restritas
ao intervalo 3M < r− < 6M . Ou seja, não existem órbitas circulares para r < 3M .
As figuras (6.8) e (6.9) mostram algumas das caracteristicas do potencial efetivo da
métrica de Schwarszchild.

236
Figura 6.8: Potencial efetivo para a =??. O movimento depende do valor da energia.

Impondo as condições para que a órbita r = rc seja circular (isto é, ∂V /∂r = 0 e
dr/dt = 0) obtemos que a energia numa órbita de raio rc é dada por
rc − 2M
E(rc ) = √ √ .
rc rc − 3M

A energia de ligação por unidade de massa EB da ultima órbita circular estável em


r = 6M é
p
EB (6M ) = 1 − E(6M ) = 1 − 8/9 ≈ 0.06. (6.31)
Como veremos no capı́tulo de ondas gravitacionais, uma partı́cula em órbita na geome-
tria de Schwarszchild emitirá radiação gravitacional, e por causa da perda de energia,
será desviada do movimento geodésico. É possivel mostrar que uma partı́cula inicial-
mente numa órbita circular com rc >> M (e então com E ≈ 1), cairia lentamente per-
correndo uma espiral, até chegar em r = 6M . A partir dalı́, a órbita se torna instável,
e a queda para r = 0 é rápida. A equação (6.31) mostra que aproximadamente 6% da
energia original da partı́cula será convertida em radiação até chegar em r = 2M . Já
no caso de um buraco negro de Kerr (ver Sec. 6.6.1), a fração correspondente é aprox-
imadamente 42%. Isto mostra que embora a emissão de radiação gravitacional seja
fraca, grandes quantidades de energia podem ser convertidas em radiação gravitacional
em processos astrofı́sicos. Esta grande eficiência (maior que a dos processos nucleares)
na conversão de matéria em queda por energia é a que faz que os buracos negros
sejam candidatos para explicar observações de processos astronômicos que envolvem
uma quantidade imensa de energia liberada (tais como os quasares).
Se uma partı́cula for perturbada da posição de equilı́brio r+ , ela descreverá os-
cilações radiais centradas em r = r+ . Para deslocamentos pequenos o suficiente, o
movimento será harmônico simples, com freqüência
M (r+ − 6M )
ωr2 = kef = 3
. (6.32)
r+ (r+ − 3M )

onde o tempo implı́cito nesta equação é o tempo próprio da partı́cula. Já a freqüência

237
Figura 6.9: Potencial efetivo para diferentes valores de a. Note a aparição do poço, que
possibilita órbitas finitas.

angular, dada pela equação (6.27), é


L2 M
ωφ2 = 4
= 2 .
r+ r+ (r+ − 3M )
No limite de órbitas newtonianas, r+ >> M , temos que ωr ≈ ωφ . Se ωr = ωφ , a
partı́cula retornará num dado valor de r exatamente no tempo dado pelo perı́odo
órbital, ou seja, a órbita será fechada. De fato, na teoria newtoniana, todas as órbitas
finitas são fechadas. Em RG, no entanto, existe uma precessão, como já foi estudado
na 2.6.1. De fato, um dos primeiros triunfos da RG foi explicar a precessão de Mercurio
(43 seg. por século). Veremos no capı́tulo de ondas gravitacionais um outro exemplo
deste fenômeno, o pulsar binário, onde a precessão é de 4 seg. por ano.
Passemos agora ao estudo do caso de partı́culas de massa zero (como fótons e talvez
neutrinos). Precisamos mudar o procedimento seguido no caso m 6= 0, já que nele
aparecem constantes definidas por unidade de massa. Para partı́culas de massa nula,
gµν pµ pν = 0, e obtemos a equação
 2
E2 1 dr L2
− − = 0,
1 − 2M 1 − 2M
 
r r
dλ r2
onde λ é um parâmetro afin, E é a energia total da partı́cula, e L o momento angular.
O potencial efetivo toma a forma
s  
L2 2M
V (r) = 1− .
2r2 r
A forma de V independe de L, e o único extremo da função é o máximo em r = 3M
(Fig. 6.10). A existência deste máximo posibilita órbitas circulares instáveis para os
fótons no regime de campo forte. Estas órbitas têm grande importância no problema
do desvio de fótons num campo gravitacional, o lensing gravitacional [14], que no
regime de campo fraco foi discutido na seção 2.6.2. Os detalhes do caso de campo
forte foram estudados em [15].

238
Figura 6.10: Potencial efetivo no caso de partı́culas de massa nula.

Terminamos aqui o estudo qualitativo das geodésicas no espaço-tempo de


Schwarszchild. Aqueles interesados no detalhe das geodésicas, incluindo a parte angu-
lar, podem consultar o livro de Chandrasekhar [16], que contém um estudo exhaustivo
das propriedades matematicas dos buracos negros de Schwarszchild, assim como dos
de Kerr e Reissner-Nordstrom (que discutiremos mais adiante).

6.5 Coordenadas de Kruskal-Szekeres


Vimos que as coordenadas de E-F eliminam parcialmente a singularidade do sistema
de coordenadas de Schwarszchild em r = 2M . O sistema de E-F é uma extensão das
coordenadas originais, e cobre portanto uma porção maior da variedade associada ao
espaço-tempo. A extensão foi sugerida pelo fato de que as geodésicas radiais imergentes
passam sem problemas por r = 2M e seguem para a singularidade. É natural se
preguntar se podemos extender ainda mais estas coordenadas. Não discutiremos aqui
os teoremas que respondem a esta questão em forma geral [37], mas mostraremos
que existe um sistema de coordenadas que é uma extensão das coordenadas E-F.
Trata-se da a solução de Kruskal-Szekeres (K-S), que apresenta caracterı́sticas muito
particulares, uma das quais é que ela é máxima (no sentido de inextensı́vel), e única.
A parte relevante da métrica no que tem a ver com a singularidade em r = 2M é a
dos coeficientes gtt e grr :
   −1
2 2M 2 2M
ds = 1 − dt − 1 − dr2 . (6.33)
r r
Como vimos na sec. 6.2.2, as geodésicas nulas de Schwarszchild satisfazem

t = ±r∗ + constante,

onde a coordenada “tartaruga” [13] introduzida por Regge and Wheeler está definida
por  r 
r∗ = r + 2M ln −1 ,
2M
239
de jeito tal que  −1
dr∗ 2M
= 1− .
dr r
Definimos agora coordenadas nulas u e v como segue:

u = t − r∗ , v = t + r∗ .

Nestas coordenadas, a métrica (6.33) toma a forma


 
2 2M
ds = 1 − du dv, (6.34)
r
onde r está definido implicitamente em termos de u e v como segue,
 r  v−u
r + 2M ln − 1 = r∗ = .
2M 2
Usando esta equação podemos reescrever a métrica (6.34) na forma

2M e−r/2M (v−u)/4m
ds2 = e du dv.
r
Introduzindo agora novas coordenadas

U = e−u/4m , V = ev/4m ,

a métrica se escreve
32M 3 e−r/2M
ds2 = − dU dV.
r
Finalmente, fazendo mais uma transformação ,
U +V V −U
T = , X= ,
2 2
e escrevendo a métrica em 4 dimensões, obtemos a métrica de Kruskal-Szekeres

32M 3 e−r/2M
ds2 = (−dT 2 + dX 2 ) + r2 (dθ2 + sin θ2 dφ2 ). (6.35)
r
A relação entre as coordenadas (t, r) e as (T, X) é dada pelas equações
 r 
− 1 er/2M = X 2 − T 2 , (6.36)
2M
   
t T +X −1 T
= ln = 2 tanh . (6.37)
2M X −T X
Note que na equação (6.35) r é função de X e T por causa da equação (6.36). O
intervalo permitido para as coordenadas X e T fica definido pela condição r > 0, ou
X 2 − T 2 > −1. O diagrama de espaço-tempo da extensão de K-S é mostrado na figura
6.11. A estrutura causal do espaço-tempo de Schwarszchild extendido é facilmente en-
tendida do diagrama, já que as geodésicas radiais nulas são linhas a 45◦ nas coordendas
K-S. Note que o diagrama mostra que a singularidade em “r = 0” das coordenadas de
Schwarszchild corresponde nas coordenadas de K-S à duas singularidades, dadas por

240
Figura 6.11: Solução de Schwarszchild em coordenaas de Kruskal-Szekeres.


X = ± T 2 − 1. Elas estão no futuro da região II e no passado da III respectivamente.
Veja também que embora as coordenadas K-S são muito convenientes para analizar
a região de campo forte da geometria de Schwarszchild, não são uteis para estudar o
limite r → ∞, já que guu e gvv caem exponencialmente com r.

O espaço-tempo de Schwarszchild extendido tem uma estrutura complexa. A região I


da figura corresponde à região r > 2M nas coordenadas de Schwarszchild, e pode ser
usada para representar o exterior de um corpo esférico. Já no caso de um buraco negro,
qualquer partı́cula em queda radial na região I atravesará a linha X = T (ou r = 2m)

a(e não poderá mais sair dela), e atingirá a singularidade situada em X = T 2 − 1.
A região II é então o interior de um buraco negro. De fato, a figura mostra que as
linhas de r =constante são hipérboles. Para r > 2M , as hiperboles são quase verticais,
enquanto que para r < 2M , elas são quase horizontais. Segue que uma partı́cula se
movendo dentro do cone de luz em r < 2M não pode permanecer com r = constante;
a sua coordenada r vai diminuindo até cair inevitavelmente na singularidade.

O diagrama mostra também que o horizonte é uma linha nula (isto é, ela forma um
ângulo de 45◦ com o eixo horizontal). Isto reflete o fato de que o horizonte é a divisoria
entre aqueles raios que não podem escapar e aqueles que escapam. Ele é o caminho
percorrido pelo raio “marginal”.

A região III é exatamente o contrário: trata-se de um buraco branco. Qualquer


partı́cula presente na região III deve necessariamente ter saido da singularidade

X = − T 2 − 1, e deve deixar a região III num tempo finito. A região IV tem as
mesmas propriedades que a I, e representa uma outra região assintoticamente plana.
Notar que não é possı́vel trocar sinais entre pontos das regiões I e IV: inevitávelmente
se produz um encontro com a singularidade 14 .

A pregunta é: representa esta extensão da solução original de Schwarszchild algum


objeto existente na natureza? A métrica extendida é solução das equações de Einstein
14
De fato, a métrica de K-S não é estática, ela evolue no tempo [42].

241
no vácuo, mas da discusão de colapso gravitacional sabemos que o interior de um
corpo em colapso não será descrito pela métrica de Schwarszchild (já que Tµν 6= 0
alı́). Por causa do teorema de Birkhoff, o exterior do corpo estará representado pela
geometria de Schwarszchild. O espaço-tempo correspondente ao colapso gravitacional
nas coordenadas de K-S está representado pela figura 6.12. As regiões III e IV (assim

Figura 6.12: Espaço-tempo resultante do colapso gravitacional completo de um corpo com


simetria esférica. As regiões III e IV da solução de Schwarszchild extendida estão cobertas
por matéria.

como partes da I e II) são cobertas por materia, e nelas a solução das EE não é a de
vácuo. Somente uma parte da região II do espaço-tempo de K-S aparecerá quando a
matéria colapsando atravessar r = 2M . Assim, as regiões III e IV não são relevantes
no colapso gravitacional.

6.6 Outros buracos negros

Até aqui analisamos a solução de Schwarszchild, que possui um alto grau de sime-
tria (ela é esféricamente simétrica e estática). Do ponto de vista da astrofı́sica, seria
interessante dispor também de soluções descrevendo objetos em rotação (isto é com
simetria axial). Estudaremos a seguir um tipo de buraco negro que possui velocidade
angular não nula.

6.6.1 O buraco negro de Kerr

A métrica que descreve o espaço-tempo de um buraco negro em rotação pode ser


escrita convenientemente de três formas diferentes. A primeira é a forma de Eddington-
Finkelstein avançada, dada por
 
2 2M r 2M r
ds = 1− 2 dv 2 − 2 dv dr + 2 (2a sin2 θ) dv dφ̄ + 2a sin2 θ dr dφ̄ − ρ2 dθ2
ρ ρ

242
 
2M r 2 4
2 2 2
− (r + a ) sin θ + 2 a sin θ) dφ̄2 , (6.38)
ρ
onde
ρ2 = r2 + a2 cos2 θ.
Esta forma pode ser obtida a partir da métrica de Schwarszchild , fazendo uma trans-
formação de coordenadas onde r pode ter valores complexos [5]. A segunda forma da
solução é em coordenadas tipo cartesianas, como foi descoberta por Kerr. Pode ser
obtida da anterior fazendo a transformação

t̄ = v − r,

x = r sin θ cos φ + a sin θ sin φ,


y = r sin θ sin φ − a sin θ cos φ,
z = r cos θ.
O resultado é
2M r3

2 2 2 2 2 r a z
ds = dt̄ −dx −dy −dz − 4 d t̄ + (x dx + y dy) + (y dx − x dy) + d
r + a2 z 2 a2 + r2 a2 + r 2 r
Finalmente, a métrica de Boyer-Lindquist (B-L):

∆ sin2 θ  2 2 ρ2 2
ds2 = (dt − a sin 2
θdφ 2 2
) − (r + a 2
)dφ − adt − dr − ρ2 dθ2 , (6.39)
ρ2 ρ2 ∆
onde
∆ = r2 − 2M r + a2 .
Os detalhes do cálculo da solução podem ser encontrados por exemplo em [31].

6.6.2 Propriedades da solução de Kerr

A forma de B-L é talvez a mais utilizada, e vale a pena salientar algumas das suas
propriedades. Primeiramente, as superfı́cies t = constante, r = constante não tem a
métrica da 2-esfera, como era de esperar numa geometria sem simetria esférica. Em
segundo lugar, a métrica de Kerr depende de dois parâmetros, m e a. Fazendo a = 0
recuperamos a solução de Schwarszchild nas coordenadas de Schwarszchild (eq.(6.3)),
e então M é a massa do buraco negro. Vemos também que os coeficientes da métrica in-
dependem de t e φ, e conseqüentemente a solução é estacionaria e axialmente simétrica
(ela é invariante respeito de rotações com eixo z). A métrica tem ainda duas simetrias
discretas: ela é invariante sob a transformação

t → −t, φ → −φ,

e sob
t → −t, a → −a.

243
A primeira sugere que o campo tem como fonte um corpo em rotação, já que correr
o tempo para atrás com uma direção de rotação negativa é equivalente a correr o
tempo para adiante com uma direção de rotação positiva. A outra simetria sugere que
a tem relação com o momento angular. De fato, e possı́vel mostrar que a é o momento
angular por unidade de massa, a = J/M [17].

Singularidades e horizontes

O cálculo dos invariantes mostra que a métrica de Kerr tem somente uma singularidade
intrı́nseca quando ρ = 0. Da definição de ρ,

ρ2 = r2 + a2 cos2 θ,

vemos que ρ = 0 traz como conseqüência r = cos θ = 0. A partir da transformação de


coordenadas ligando a métrica em coordenadas E-F com a métrica em coordenadas
tipo cartesianas obtemos as equações

x 2 + y 2 = a2 , z = 0,

que fornecem os pontos singulares. Fica claro que a diferença do caso de


Schwarszchild onde a singularidade é um ponto, a singularidade na geometria de Kerr é
um anel de raio a no plano equatorial z = 0. As superfı́cies dadas pela condição g00 = 0,
ou

rS± = M ± M 2 − a2 cos2 θ,
que chamaremos S+ e S− têm propriedades especiais, como veremos mais adiante. No
limite a = 0, a expressão para rS± se reduz a rS+ = 2M , rS− = 0. As superfı́cies tem
simetria axial, e a S− está dentro da S+ . Já os dois horizontes da solução de Kerr
estão determinados pela equação g 11 = 0, cuja solução é

r± = M ± M 2 − a2 .

no caso em que a2 < M 2 (o momento angular é menor que a massa), que é o rele-
vante em astrofı́sica 15 . A solução de Kerr é então regular nas três regiões seguintes:
r+ < r < ∞, r− < r < r+ , e 0 < r < r− . O horizonte r+ está totalmente dentro de S+ ,
e a região entre eles é a ergosfera, cujas propriedades discutiremos depois. A figura 6.13
mostra um esquema da solução de Kerr. Note que no caso a > M terı́amos o campo
gravitacional de uma singularidade “nua” (isto é, não “vestida” pelo horizonte). Dev-
ido ao fato de que tanto o espaço e o tempo deixam de ter sentido nas vizinhanças da
singularidade, e sendo que as leis da fisica pressupõem a existência destes, uma singu-
laridade nua seria um “lugar onde todo vale”. Por este motivo, R. Penrose formulou
em 1969 a Conjectura de Censura Cósmica , que afirma que o colapso gravitacional
não pode ter como resultado uma singularidade nua. Quase 30 anos depois de sua
formulação , ainda não foi possı́vel provar tal conjectura.
15
Veremos uma justificativa para este resultado mais abaixo.

244
Figura 6.13: Esquema da solução de Kerr

As congruências nulas principais

A solução de Kerr não tem simetria esférica, e por tanto não existem nela curvas
que correspondam a geodésicas radiais. Na relatividade geral, isto pode ser entendido
como o fato de que a fonte em rotação arrasta o espaço perto dela e conseqüentemente
as geodésicas (veja Sec.6.6.2). A situação é bem diferente do que acontece na teoria
de Newton, onde sempre podemos levar a fonte ao repouso mudando ao referencial
em rotação com a fonte. Mas isto não é possı́vel na RG já que não existe nenhuma
transformação de coordenadas que leve da métrica de Kerr na de Schwarszchild. Não
estudaremos aqui o detalhe das geodésicas (ver [16] e [17]), mas é possı́vel mostrar que
existem duas congruências de geodésicas nulas, definidas pelas equações
(r2 + a2 )l
ṫ = ,

ṙ = ±l,
al
φ̇ = ,

onde l é uma constante do movimento. Como no caso de Schwarszchild, temos duas
congruencias nulas, correspondentes aos dos sinais na equação para ṙ. Escolhendo
ṙ = +l, as equações podem ser integradas no caso a2 < M 2 , e o resultado é
M2 M2
   
t=r+ M +√ ln |r − r+ | + M − √ ln |r − r− | + constante,
M 2 − a2 M 2 − a2
a r − r+
φ= √ ln + constante.
2
2 M −a 2 r − r−

245
Do fato que ∆ > 0 nas regiões I e III, e < 0 na II, junto com a equação

dt ṫ r 2 + a2
= = ,
dr ṙ ∆
segue que dr/dt > 0 na região I, e consequentemente esta congruência é chamada
de congruência principal de geodésicas nulas emergentes. A solução com o sinal “-”
pode ser obtida da solução com o sinal “+”, fazendo a mudança t → −t, φ → −φ.
Obtem-se então a congruência principal de geodésicas nulas incidentes. Estas duas con-
gruências desempenham um papel análogo as congruências estudadas na solução de
Schwarszchild. Fazendo um diagrama espaço-tempo encontramos na região I uma
situação semelhante aquela vista na Fig. 6.2 no caso de Schwarszchild. Os cones de
luz vão se afinando quanto mais perto chegarmos de r = r+ , onde t e φ são infinitos,
sugerindo que se trata de una singularidade do sistema de coordenadas. Fazendo as
transformações
2M r
t → t̄, onde dt̄ = dt + dr,

a
φ → φ̄, onde dφ̄ = dφ + dr,

e definindo uma coordenada tempo avançado,

v = t̄ + r,

obtemos a forma de E-F da métrica Kerr, ver figura (6.14). Vemos do diagrama que
nenhum raio de luz pode sair da região II para a região I. Segue então que a superfı́cie
r = r+ é um horizonte. Já na região II, os cones estão inclinados na direção da
singularidade em r = 0, e qualquer partı́cula que entre na região II se moverá na
direção da singularidade até cruzar a superfı́cie r = r− ou alcançá-la asintoticamente.
Já na região III, a partı́cula não necessariamente cai na singularidade.

Arraste dos sistemas inerciais

Diferentemente da métrica de Schwarszchild, a métrica de Kerr tem um termo


não diagonal, dado por
2M r sin2 θ
gtφ = −a .
ρ2
Este termo origina o fenomeno do dragging dos sistemas inerciais de referência, como
veremos a seguir. Como a métrica de Kerr dada na equação (6.39) independe de t e
φ, os momentos associados pt e pφ são conservados [13]16 . Temos

pφ = g φα pα = g φφ pφ + g φt pt ,

pt = g tα pα = g tt pt + g tφ pφ .
16
A métrica de Kerr tem um tensor de Killing que fornece mais uma constante de movimento, o que
permite integrar explicitamente as equações das geodésicas, como foi mostrado num belo artigo por B.
Carter [43], utilizando a separabilidade das equações de Hamilton-Jacobi deste problema.

246
Figura 6.14: Solução de Kerr em coordenadas de E-F avançadas (a2 < M 2 ).

Seja agora uma partı́cula se deslocando com momento angular nulo, isto é pφ = 0
(notar que esta condição quer dizer que a partı́cula foi “jogada” com velocidade inicial
na direção radial no infinito). Das definições
dt dφ
pt = m , pφ = m ,
dτ dτ
a trajetória da partı́cula pode ser obtida (no caso pφ = 0) como segue:
dφ pφ g φt
= t = tt ≡ ω(r, θ).
dt p g
Esta equação define a velocidade angular de uma partı́cula com momento angular zero.
Note que ω(r, θ) sempre será diferente de zero no caso em que gtφ 6= 0. Temos então o
resultado que uma massa caindo “reto” desde infinito é arrastada pela influência da
gravitação e adquire uma velocidade angular (com o mesmo sentido que a rotação da
fonte, como veremos em seguida). No caso da métrica de Kerr em coordenadas de B-L,

a sin θ ± ∆
ω(r, θ) = √ .
(r2 + a2 ) sin θ ± ∆ sin2 θ
Quando ω(r, θ) > 0 (que é o caso do sinal ”+”) as partı́culas seguem órbitas no sentido
da rotação da fonte. É facil mostrar que na região I,

ω < 0 ↔ a sin θ − ∆ ≤ 0 ↔ r ≥ rS+ .

247
Ou seja, na superfı́cie S+ , ω = 0 17 , e dentro (na chamada ergosfera) os cones
de luz são ”inclinados” na direção de φ ”crescente”, de jeito tal que as partı́culas
são obrigadas a descrever órbitas na direção de rotação da fonte (ver figura 6.15).

Figura 6.15: Diagrama espacial da solução de Kerr (a2 < M 2 ) no plano equatorial.

Assim como a métrica de Schwarszchild pode ser usada para descrever o campo grav-
itacional no exterior de uma estrela com simetria esférica, a métrica de Kerr com
0 < a2 < m2 pode representar o exterior de uma estrela em rotação. Mas enquanto
no caso de Schwarszchild existem soluções interiores (isto é, soluções das equações de
Einstein com a matéria que compõe a estrela como fonte) que são coladas suavemente
com o exterior de Schwarszchild, não se conhecem soluções internas realistas para a
métrica de Kerr.

Finalmente, note que a métrica de Kerr pode ser estendida maximalmente utilizando
as coordenadas de E-F avançadas e retardadas (ver por exemplo [17]).

Órbitas de fótons no plano equatorial

Para entender as diferenças com o caso estático, nesta seção estudaremos as órbitas de
partı́culas de massa nula no plano θ = π/2. Neste caso, dθ = 0, mas a diferença do caso
de Schwarszchild, que tem simetria esférica, aqui estamos nos restringindo a um caso
particular: fótons que não estejam no equador podem ter órbitas bem diferentes das
que vamos estudar aqui. Não obstante, fótons inicialmente com pθ = 0 permanecerão
assim, já que a métrica tem simetria com respeito a uma reflexão no plano θ = π/2.
As simetrias da métrica garantem que pt = E e pφ = L são constantes de movimento.

17
É por isto que a superfı́cie S+ é chamada também de superfı́cie do limite estacionário.

248
Seguindo os passos dados na seção 6.4 obtemos
 2
dr
= g rr [−g tt E 2 + 2g tφ EL − gφφ L2 ],

que pode ser escrita como
 2
(r2 + a2 )2 − a2 ∆ r2 − 2M r
 
dr 2 4M ra 2
= E − 2 EL − 2 L .
dλ r4 (r + a2 )2 − a2 ∆ (r + a2 )2 − a2 ∆
(6.40)
Esta equação se reduz à equação (6.26) no caso a = 0. Note que por causa do termo
EL não podemos definir um potencial efetivo utilizando (dr/dλ)2 = E 2 − V 2 , mas o
lado direto da (6.40) pode ser fatorado assim:
 2
dr (r2 + a2 )2 − a2 ∆
= (E − V+ )(E − V− ), (6.41)
dλ r4
onde √
2M ra ± r2 ∆
V± (r) = 2 L. (6.42)
(r + a2 )2 − a2 ∆
Esta equação deve ser comparada com a (6.26) do caso de Schwarszchild, na qual o
potencial efetivo é imaginário dentro do horizonte. Já V± se torna imaginário para
∆ < 0. Nos dois casos isto significa que não há soluções para a equação dr/dλ = 0,
isto é não há pontos de retorno para os fótons, independente da energia dos mesmos.
Uma vez que os fótons cruzam a linha ∆ = 0 não podem sair. A equação ∆ = 0 então
delimita o horizonte no equador, e de fato pode mostrar-se que ela define o horizonte
mesmo fora do equador (como já vimos da figura 6.14).
A partir do gráfico de V± é possı́vel analizar qualitativamente o movimento. Nos re-
stringiremos a r ≥ r+ . Discutiremos primeiro o caso em que o fóton tem momento
angular no sentido do momento angular do buraco negro (fig. 6.16). Note que para r

Figura 6.16: Potencial efetivo no caso em que o fóton tem momento angular no sentido
do momento angular do buraco negro.

grande, as duas curvas caem como 1/r, e a rotação não tem importância. Já para r

249
perto do horizonte, aparecem caracterı́sticas próprias da rotação. Da equação (6.41)
vemos que o movimento só poder acontecer quando E > V+ ou E < V− . Aqueles
fótons com E > 0 não apresentam maiores novidades: eles vêm desde infinito, e
atingem um r mı́nimo para depois voltar para infinito, ou passam pelo horizonte se
não encontram antes o potencial. A condição E < V− permite fótons com E < 0, mas
é possı́vel mostrar que estes devem ser descartados se admitirmos que as partı́culas
somente podem viajar em direção ao futuro [18]. Devemos considerar então no gráfico
(6.16) somente geodésicas com E > V+ .

No caso de fótons com momento angular negativo aparecem novidades (ver Fig. 6.17).
De fato, da Eq.(6.42) vemos que neste caso as curvas são trocadas. Aplica-se ainda o

Figura 6.17: Potencial efetivo no caso em que o fóton tem momento angular no sentido
contrário ao momento angular do buraco negro.

raciocı́nio anterior, e só curvas com E > V+ são permitidas. Mas surpreendentemente
algums fótons que satisfazem esta condição tem energia negativa: são aqueles dentro
de r < r0 , isto é, dentro da ergosfera. A existência desta região permite que aconteça
um fenômeno incomun, que foi discutido por R. Penrose em 1969. Suponha que em
algum ponto entre r+ e r0 é criado um par de fótons, um deles tendo energia +E
e o outro −E, de manera tal que a energia total é zero, e com momentos opostos
tal que o fóton com energia positiva escapa para o infinito, enquanto o outro cai na
singularidade. O efeito resultante é que o fóton de energia positiva deixará o buraco
negro, e sua energia pode ser convertida no infinito em trabalho. Isto sugere que
é possivel extrair energia (ergo massa) do buraco negro com custo zero. Das figuras
(6.16) e (6.17) vemos que isto é possivel só se no processo diminuir o momento angular
do buraco negro. A energia extraida vem então da energia rotacional do buraco. Este
processo de extração de energia (chamado processo de Penrose) poderia acontecer toda
vez que exista uma ergosfera, seja no caso de um buraco negro em rotação ou no caso
de estrelas “exóticas” (ver [18]). Ele não tem relevância em astrofı́sica [40], mas foi
importante no desenvolvimento da termodinámica de buracosn negros (veja Sec. 6.9).

250
6.6.3 Buracos negros carregados

Existe de fato um outro tipo de buraco negro, importante do ponto de vista teórico, e
provavelmente significativo para a astrofı́sica (como parecem indicar os resultados do
modelo de emissão de gamma-ray bursts desenvolvidos em [19]). Trata-se do buraco
negro carregado, ou mais precisamente, da solução estática, assintoticamente plana, e
com simetria esférica das equações de Einstein-Maxwell descoberta por H. Reissner em
1916, e redescoberta por G. Nordstrom em 1918 (mas a interpretação da solução como
descrevendo um buraco negro carregado foi feita por J. Graves e D. Brill em 1960).
As equações relevantes são as da RG junto com as do campo eletromagnetico,

Rµν = 8πTµν ,

∇ν F µν = 0, ∂[µ Fνρ] = 0.
A fonte do campo elétrico é uma carga pontual situada na origem (logo o campo será
radial). Sem entrar nos detalhes do cálculo, a métrica de R-N tem a forma
−1
q2 q2
  
2 2M 2 2M
ds = 1 − + 2 dt − 1 − + 2 dr2 − r2 (dθ2 + sin2 θdφ2 ), (6.43)
r r r r
e o campo elétrico é
q
E(r) = .
r2
No caso q = 0, a solução de R-N se reduz à métrica de Schwarszchild. A análise da
solução mostra que no caso q 2 > m2 existe somente uma singularidade, localizada na
origem. Já no caso q 2 < m2 , a métrica tem duas singularidades, situadas em
p
r± = m ± m2 − q 2 .

O estudo da solução em coordenadas de Eddington-Finkelstein para o caso q 2 < m2


mostra que r = r+ é um horizonte, mas a singularidade em r = r− é artificial, e pode
ser removida com uma extensão analı́tica [17].

6.6.4 O buraco negro mais geral

É possı́vel obter a solução mais geral de buraco negro usando uma trans-
formação complexa na solução de R-N em coordenadas de E-F, como foi feito para
passar da métrica de Schwarszchild para a métrica de Kerr (ver detalhes em [17]). O
resultado é a métrica de Kerr-Newman
2M r q 2
 
2 2a
ds = 1 − 2 + 2 dv 2 − 2 dv dr + 2 (2M r − q 2 ) sin2 θ dv dφ̄ + 2a sin2 θ dr dφ̄
ρ ρ ρ
sin2 θ 2
−ρ2 dθ2 − [(r2 + a2 )2 − (r2 − 2M r + a2 + q 2 ) a2 sin2 θ] dφ̄ , (6.44)
ρ2
que depende de três parametros: m, a, q (massa, carga, e momento angular do bu-
raco negro respectivamente). Esta solução se reduz a de Schwarszchild no caso

251
q = a = 0, d́e Kerr se q = 0, e a de Reissner-Nordstrom se a = 0. Trata-se de
uma solução estacionária com simetria axial e assintoticamente plana, que tem uma
superfı́cie estacionária limite dada por
p
r = m + m2 − q 2 − a2 cos2 θ,

e um horizonte de eventos externo em


p
r =m+ m2 − q 2 − a2

para a2 + q 2 ≤ m2 . Os detalhes desta solução podem ser encontrados em [16].


Foi mostrado por Carter, Hawking e Robinson que a solução de Kerr-Newman é a única
solução estacionária das equações de Einstein no vácuo. Sendo que aparentemente não
existem objetos astrofı́sicos com carga apreciável, a solução de Kerr (que inclui a de
Schwarszchild como caso especial) é a solução relevante do ponto de vista astrofı́sico.
De fato, aceitando a validade da conjectura da censura cósmica, o resultado de um
colapso arbitrário (isto é, sem simetrı́as) deve dar como resultado um buraco negro de
Kerr. Ou seja, sem importar o estado inicial da matéria em colapso, o estado final é
caracterizado por M e J.
Concluimos aqui o nosso estudo das propriedades clássicas dos buracos negros iso-
lados. Várias questões fundamentais dentro deste item, mas exigindo ferramentas
matemáticas além das apresentadas neste curso, não foram abordadas aqui. Entre
elas podemos citar a teoria de perturbações em geometrias descrevendo buracos ne-
gros [16], e os detalhes do colapso gravitacional. Na seção seguinte estudaremos alguns
fenômenos astrofı́sicos envolvendo buracos negros.

6.7 Buracos Negros Astrofı́sicos


Até aqui exploramos algumas propriedes clássicas de buracos negros isolados, mas
estes dificilmente podem ser observados. Nesta seção discutiremos brevemente a ob-
servação de buracos negros em interação com um corpo celeste (uma estrela normal ou
uma anã branca por exemplo). Neste caso, a fortı́ssima atração gravitacional do bu-
raco negro faz com que a matéria que compõe a estrela começe a “cair” na direção do
buraco. A descrição deste fenômeno é extremamente complicada: trata-se de um prob-
lema de hidrodinâmica onde o fluxo se produz num disco que gira em torno do equador
do buraco negro. As diferentes camadas do disco giram com uma velocidade angular
que aumenta com a proximidade ao buraco, provocando o aquecimento do material em
queda até altissimas temperaturas. O material quente emite radiação , que pode ou
não interagir fortemente com o gas. Em muitos casos existe um campo magnético na
estrela, o que transforma o processo num problema de magnetohidrodinâmica. Final-
mente, todo isto acontece com a geometria de Kerr como pano de fundo. Resumindo,
trata-se de um problema de magnetohidrodinâmica relativista dependente do tempo,

252
Figura 6.18: O desenho mostra o disco de acreção em torno de um buraco negro que
atrai matéria de uma estrela normal (ilustrando a situação no sistema GRO J1655-40, na
galáxia Scorpius). Vemos ainda o vento produzido pela presença de um campo magnético,
e o espectro de emissão de raios X. Crédito: Chandra Photo Album.

com equações em duas (ou três) dimensões, com transferência radiativa! [45] (veja a
Figura 6.18).
O caminho que leva a o modelo descrito no parágrafo anterior começou no ano 1962,
quando foram observadas as primeiras fontes de raios X em nossa galáxia, num pro-
jeto comandado por R. Giacconi (Prêmio Nobel 2002 por seu trabalho em astronomia
de raios X). Logo foram observadas fontes variáveis no tempo, algumas com contra-
partida na parte óptica do espectro. Mas o aporte decisivo foi o do primer satélite
dedicado à observações astronómicas, o Uhuru 18 . Ele observou mais de 300 fontes
de raios X, muitas delas em sistemas binários. Estes dados foram interpretados como
conseqüência da acreção de matéria num objeto compacto. Os motivos que sustentam
tal interpretação ão os seguintes:

• A variabilidade observada na emissão dos raios X tem uma escala temporal curta,
o que se deve ao fato de que a região emissora deve ser pequena (do tamanho de
um objeto compacto).
• Muitas das fontes são efetivamente sistemas binários, com uma estrela observável
no óptico em órbita elı́ptica em torno de um companheiro “invisı́vel”.
• Como mencionado na seção 6.4, a queda de matéria num buraco negro é um meio
muito eficiente de conversão de massa em energı́a.

Acredita-se hoje que a emissão de raios X deve-se ao processo descrito acima, cuja
observação é uma prova indireta da existência dos buracos negros. De fato, supõe-se
que buracos negros supermassivos (com massas entre 105 e 109 vezes a massa do Sol)
existem no centro da maioria das galáxias (incluindo a nossa), e buracos negros da
ordem de algumas massas solares compõem os sistemas binários mencionados acima.
18
Uhuru significa liberdade em swahili, lingua falada na Etiopia, paı́s de onde foi lançado o satélite.

253
Mas devemos mencionar o fato de que no caso dos sistemas binários é preciso decidir
por meio da observação (por exemplo através da medida da massa) se o objeto “escuro”
é um buraco negro ou uma estrela de nêutrons. Uma outra possibilidade envolve
a diferência fundamental entre estes dois objetos: a estrela de nêutrons tem uma
superfı́cie sólida, enquanto o horizonte do buraco negro é uma superfı́cie matemática
(veja [41] para detalhes).
Para concluir, é importante notar que toda a evidência observacional que apoia a
existência de buracos negros é indireta, mas a quantidade de evidência disponı́vel
crece rápidamente, apontando para a plausibilidade da hipôtese da existência dos
buracos negros [44].

6.8 Buracos negros e mecânica quântica


Em 1974 Hawking surpreendeu a comunidade dos fı́sicos teóricos ao mostrar que os
buracos negros são negros somente quando considerados como objetos clássicos. Se
levarmos em conta as leis da mecânica quântica, os buracos negros emitem energia
continuamente, e não são então as estruturas permanentes que a fı́sica clássica prediz
[20]. Os cálculos de Hawking estão baseados no uso de teoria quântica de campos num
espaço-tempo curvo, e nos limitaremos aqui a apresentar uma justificativa heuristica
deste resultado.
A teoria quântica nos diz que o estado que chamamos de vácuo clássico pode ser
pensado como um mar de partı́culas virtuais, que se materializam em pares partı́cula-
antipartı́cula, para aniquilarem-se pouco depois. Esta ideia que pode parecer um pouco
bizarra tem conseqüências observacionais diretas, como por exemplo o Lamb shift no
espectro do átomo de hidrogênio [21]. Lembrando que a solução de Schwarszchild é
uma solução de vácuo das equações de Einstein, perto do horizonte acontecerá também
a criação de pares. Embora muitos pares sejam engolidos pelo buraco, dependendo
do momento de cada uma das partı́culas do par, alguns pares podem ser separados,
caindo uma das partı́culas no buraco negro e escapando a outra em direção ao infinito,
onde seria interpretada como radiação emitida pelo buraco. Hawking mostrou que a
radiação estarı́a distribuida segundo um espectro de corpo negro. Este processo, que
diminue a massa (e o tamanho) do buraco negro, continua sem interrupção, até a
evaporação final do buraco. Para buracos negros grandes a evaporação total levaria
muito tempo (1066 anos para um buraco de massa M ).
O resultado de Hawking é de extrema importância para a compreensão de fenômenos
descritos pela teoria quântica de campos em espaço-tempo curvo. Mas a possibili-
dade de observar em buracos negros astrofı́sicos a radiação decorrente é nula, já que
os buracos negros astrofı́sicos estão rodeados por material em queda em espiral na
direção da singularidade. Este material forma um disco de acreção, e está a temper-
aturas elevadas, emitindo consequentemente radiação a altas temperaturas perto do

254
horizonte (por causa da fricção). Por outra parte, a intensidade da radiação do efeito
Hawking é extremamente baixa, e não existe então possibilidade alguma de observar
este efeito nos buracos negros astrofı́sicos. Mas como veremos a seguir, existe uma
chance de medir a radiação de Hawking... no laboratório!

Buracos negros análogos

Numa direção aparentemente sem relação com a anterior, W. Unruh [22] mostrou em
1981 que é possivel gerar um modelo análogo de um buraco negro no laboratório, sem
a intervenção da gravitação. A ideia é muito simples. Considere o fluxo de um fluido
ideal (isto é, sem viscosidade). Se a velocidade do fluxo superar a partir de algum
ponto a velocidade do som no fluido, os fónons (“partı́culas de som”) que passem
deste ponto não poderam voltar, ficando então confinadas (ver Figuras 6.19 e ??).
Isto é o análogo de um buraco negro, mas para o som exclusivamente, e não para

Figura 6.19: Diagrama simplificado de um buraco negro análogo. As flechas longas indicam
a velocidade do fluido, que é maior que a velocidade dos fónons (representada com flechas
curtas) a partir da superfı́cie r = rh

outras ondas que existam no fluido (luz por exemplo). É claro que, como vimos antes,
o fenômeno da radiação de Hawking é eminentemente quântico, mas Unruh mostrou
que ao considerar o som como composto de particulas quânticas (“fonons”), o buraco
negro análogo (ou melhor, buraco “mudo” análogo!) emitiria radiação de Hawking
“sônica”. A possibilidade de observar este fenômeno gerou uma intensa atividade de
pesquisa na área de modelos análogos, onde tem sido publicados centenas de arti-
gos [23]. Em muitos deles tenta-se generalizar o fenômeno a sistemas mais complexos
(fluidos dielétricos, superfluidos, condensados de Bose-Einstein, etc), enquanto que em
outros a noção de sistema análogo foi generalizada para abranger outros sistemas difer-
entes dos buracos negros (como por exemplo os buracos de minhoca [24]). No que diz
respeito a observação da radiação de Hawking, existem ainda problemas experimen-
tais, relacionados fundamentalmente com o fato de que a temperatura da radiação é,
em todos os casos estudados até agora, bastante menor que a temperatura do ruı́do
de fundo [25].

255
Figura 6.20: O desenho mostra um corte transversal de um buraco “mudo” realizado a
partir de um fluido em fluxo radial. Vemos como os cones de luz vão sendo inclinados na
direção do centro do buraco. Crédito: [23].

6.9 Termodinâmica de buracos negros

Mencionamos na Sec.6.3 um resultado importante, obtido por Hawking: o teorema


da área, que diz que em qualquer processo fı́sico que envolva um horizonte, a área
do horizonte não pode diminuir. Este resultado pode ser enunciado matematicamente
como segue:
dA
≥ 0.
dt
Por outra parte, vimos na seção anterior que um buraco negro emite fótons com o
espectro de um corpo negro de temperatura
 
~ −7 M
T = ≈ 10 K , (6.45)
8πkM M

onde k é a constante de Boltzmann. No caso do buraco negro de Schwarszchild,


 2
2GM
A = 4π ,
c2

e então dA = 32π(G/c2 )M dM , ou

c6 dA
d(M c2 ) = ≡ T dS
G2 32πM
Como T = ~/(8πkM ) é a temperatura, segue da equação anterior que a entropia S
do buraco negro vem dada por
kc3 A
S= ,
G~ 4
e não pode diminuir por causa do teorema da área 19 . Temos então o inesperado
resultado de que o buraco negro se comporta como um corpo negro de temperatura
19
Note que S é um número extremamente grande.

256
h/8πM e entropia proporcional a A. É possı́vel mostrar que a escala temporal asociada
à perda de energia (“evaporação ”) vem dada por [45]
3
M3

M
τ≈ ≈ 1010 yr ,
~ 1015 g

que é irrelevante para buracos negros de algumas massas solares, mas não para M .
1015 g.
O fato de que os buracos negros deviam possuir entropia já tinha sido notado por
Wheeler 20 , mas a temperatura de um buraco negro segundo a fı́sica clássica é
zero, já que ele absorbe e não emite nada. Foi somente depois da descoberta da
radiação de Hawking que a termodinâmica de buracos negros foi aceita. Sem entrar
em detalhes, apresentamos a seguir uma tabela comparando as leis da termodinâmica
com conceitos de buracos negros (no caso de um buraco negro estático, κ é a força
que é necessário fazer desde o infinito para manter uma partı́cula pequena sobre o
horizonte [33]).

LEI TERMODINÂMICA BURACOS NEGROS


Zero T é constante num corpo em equilı́brio termico κ é constante no horizonte
de um bn estacionário
Primeira dE = T dS +termos de trabalho dM = κ/(8π) dA + ΩdJ
Segunda δS ≥ 0 em qualquer processo δA ≥ 0 em qualquer processo
Terceira É impossivel atingir T = 0 É impossivel atingir κ = 0
via processos fı́sicos via processos fı́sicos

6.10 Coda

Quase um século tem transcorrido desde que Schwarszchild, Reissner e Nordstrom


descobriram as soluções de buraco negro sem e com carga. Neste tempo, os buracos
negros têm se mostrado como objetos fascinantes, que podem nos conduzir a grandes
descobertas. Mencionaremos a seguir somente algumas destas possibilidades.
Como discutimos brevemente na Seção 6.9, é possivel associar uma temperatura e
uma entropia ao buraco negro. Mas a fı́sica estatı́stica mostra que no caso de sis-
temas de muitas partı́culas, a temperatura e a entropia são manifestações da fı́sica mi-
croscópica que governa as interações entre as partı́culas. Em particular, a entropia tem
relação com o número de configurações microscópicas compatı́veis com um dado es-
tado macroscópico [26]. Qual serı́a então a “fı́sica microscópica” por detrás da entropia
do buraco negro? Esta é uma pergunta que as duas teorias que pretendem descrever a
gravitação num nı́vel fundamental (isto é, a teoria de cordas e a gravitação quântica)
20
De outra forma, se um buraco negro engolise um corpo caliente, a entropia total do sistema corpo +
buraco negro decreceria para um observador externo.

257
têm tentado responder, com diferentes graus de sucesso. Embora existam respostas
parciais ao problema (ver por exemplo [27]), ainda não temos a resposta definitiva.
Seja qual for, ela estará nos dando informação sobre o regime quântico da gravitação .
Um problema que teria uma forte relação com o anterior é o do paradoxo da in-
formação. Como vimos antes, os buracos negros emitem radiação com temperatura
TH dada pela equação (6.45). Em princı́pio a emissão continuaria até o buraco negro
se evaporar completamente, deixando somente radiação, cuja temperatura e demais
caracteristicas dependem só dos parámetros que caracterizam ao buraco negro. Ou
seja, o resultado final independe do estado inicial, isto é, do estado da materia que
colapsa para formar o buraco. Em outras palavras, dado um estado final descrito pelas
caracterı́sticas da radiação , não é possivel determinar a partir dele o estado inicial.
Este é o problema da “perda de informação ”. Por argumentos que não reproduziremos
aqui, esta perda de informação traria uma violação a evolução unitária (um dos pi-
lares da mecânica quântica usual), e como conseqüência, a gravitação quântica deveria
incorporar esta não unitariedade [28].
A possibilidade de produzir micro-buracos negros em aceleradores de partı́culas tem
recibido bastante atenção recentemente. Isto tem a ver com teorias que incorporam
a idéia de que o espaço-tempo tem 4+n dimensões, sendo as n dimensões extras
de tamanho microscópico 21 (um exemplo deste tipo de teorias é a teoria de cor-
das). Nestas teorias, os efeitos da gravitação quântica começariam a se manifestar
a energias bastante menores do que EPlanck ≈ 1019 GeV, e um destes efeitos seria a
produção copiosa de micro-buracos negros. Este fenômeno poderia ser observado no
Large Hadron Collider, que entrará em funcionamento em 2008, e na interação de
partı́culas com energias muito grandes (como raios cósmicos ultraenergéticos ou neu-
trinos) [29].
Vemos então que, os buracos negros tem um enorme potencial para desempenhar um
papel fundamental no desenvolvimento das ideias da fı́sica moderna.

6.11 Exercı́cios
1. Calcule as componentes do tensor de Riemann da métrica de Schwarszchild no
sistema das tetradas dadas nas equações (6.7)-(6.10) (compare com a eq. (8) da
ref.[35]), e o invariante dado na eq.(6.5).
2. Mostre que a transformação de coordenadas
 2
MG
r =ρ 1+

leva a métrica de Schwarszchild na métrica isotrópica dada na equação 6.24.


21
Medidas decorrentes do efeito Casimir mostram que o tamanho das dimensões extras deve ser bem
menor do que 1 mm.

258
3. Mostre que a transformação de coordenadas
p
2GM/r
dtP G = dtS ± dr
1 − 2GM/r
leva a métrica de Schwarszchild á métrica de Painlevé-Gullstrand dada na
equação 6.25. Qual é a interpretação do sinal duplo?
4. Mostrar a partir das definições que seguem do potencial efetivo da métrica de
Schwarszchild , que (a) r+ > 6M , ou seja que não existem órbitas estáveis para
raios menores que 6M , e (b) que as órbitas instáveis estão restritas ao intervalo
3M < r− < 6M .
5. Prove que se uma partı́cula for perturbada da posição de equilı́brio r+ do po-
tencial de Schwarszchild, para deslocamentos pequenos o suficiente o movimento
será harmônico simples, com freqüência dada pela equação (6.32).
6. Uma partı́cula na gemoetria de Schwarszchild “em infinito” se desloca radial-
mente na direção do horizonte com velocidade coordenada u0 . Mostre que para
um valor finito r do raio a velocidade coordenada vem dada por
     
dr 2M 1 2M
= 1− 1− 2 1− ,
dt r γ0 r
onde γ0 = (1 − u20 )−1/2 . Determine a velocidade relativa a um observador esta-
cionario em r, e mostre que ela se aproxima de 1 quando r toma valores próximos
a rg , independentemente de u0 .
7. O efeito gravitomagnetico. Dois relogios se movem em direções opostas numa
órbita circular no plano equatorial da geometria de Kerr (r = constante, θ = π/2).
(a) Mostre que a equação das geodésicas radias se reduz neste caso a

Γrtt dt2 + 2Γrφt dφ dt + Γrφφ dφ2 = 0.

(b) Calcule os simbolos de Christoffel e mostre que a equação toma a forma


 2
dt dt r3
− 2a + a2 − = 0.
dφ dφ M
(c)Use a solução desta equação e a identidade para a 4-velocidade para mostrar
que o intervalo de tempo próprio dτ medido por um relogio que se desloca um
ângulo dφ vem dado por
r
3M
dτ = 1 − ± 2aω0 dφ,
r
onde ω0 = (M/r3 )1/2 é a velocidade angular de um relogio se deslocando na ge-
ometria de Schwarszchild (segundo a 3a lei de Kepler). Os sinais mais e menos
aparecem por causa do movimento direto e retrógrado, respectivamente. (d)
Mostre que na primeira ordem em a, a diferência entre os tempos proóprios
numa órbita completa (φ → φ + 2π) é

τ+ − τ− ≈ 4πa = 4πJ/M.

259
Livros de texto
Básicos: Refs.[6],[13], [17], [18], [30].
Avançados:[16], [38], [39].

Recursos em Internet
• Página sobre buracos negros do telescópio Hubble
http://hubblesite.org/explore astronomy/black holes/
• Página sobre buracos negros do observatório de raios X Chandra
http://chandra.harvard.edu/xray sources/blackholes.html
• Perguntas freqüentes sobre buracos negros
http://cosmology.berkeley.edu/Education/BHfaq.html
• Introdução aos buracos negros
http://www.damtp.cam.ac.uk/user/gr/public/bh home.html
• Uma viagem virtual a um buraco negro
http://antwrp.gsfc.nasa.gov/htmltest/rjn bht.html

6.12 Referências bibliográficas


[1] J. Michell, Phil. Trans. R. Soc. (London), 74, 35 (1784).
[2] Mecânica newtoniana, lagrangiana e hamiltoniana, J. Barcelos Neto, Ed. Livraria
da Fı́sica (2004).
[3] K. Schwarszchild, Sitzber. Deut. Akad. Wiss. Berlin Kl. Matyh-Phys. 189 (1916).
[4] Gravitational field of a spinning mass as an example of algebraically special met-
rics, Roy P. Kerr, Phys. Rev. Lett. 11, 237 (1963).
[5] E. T. Newman, R. Couch, K. Chinnapared, A. Exton, A. Prakash, R. Torrence,
J. Math. Phys. 6, 918 (1965).
[6] Spacetime Physics, E. Taylor e J. Wheeler, W. H. Freeman (1992).
[7] Complex Variables and Applications, J. Brown e R. Churchill, McGraw-Hill
(2003).
[8] A simple stationary line element for the Schwarszchild geometry, and some ap-
plications, P. Kraus, F. Wilczek, gr-qc/9406042.
[9] Simple analytic models of gravitational collapse, R.J. Adler, J.D. Bjorken, P.
Chen, J.S. Liu, gr-qc/0502040.
[10] Global aspects in gravitation and cosmology, P. S. Joshi, Clarendon Press, OUP,
Oxford (1993).

260
[11] R. Price. Phys. Rev. D 5, 2439 (1972).
[12] Ver por exemplo Classical Mechanics, H. Goldstein, C. P. Poole, J. L. Safko,
Addison Wesley (2001).
[13] Gravitation, K. Thorne, C. Misner, e J. Wheeler, W. H. Freeman (1973).
[14] Ver por exemplo Gravitation and Cosmology : Principles and Applications of the
General Theory of Relativity, S. Weinberg, Ed. Wiley (1972).
[15] Schwarszchild black hole lensing, K. Virbhadra e G. Ellis, Phys. Rev. D 62, 084003
(2000).
[16] The Mathematical Theory of Black Holes, S. Chandrasekhar, Oxford U. Press
(1998).
[17] Introducing Einstein’s Relativity, R. D’Inverno, Oxford U. Press (1992).
[18] A first course in General Relativity, B. Schutz, Cambridge University Press
(1995).
[19] The blackholic energy: long and short gamma-ray bursts (new perspectives in
physics and astrophysics from the theoretical understanding of gamma-ray bursts,
II), R. Ruffini, M. G. Bernardini, C. L. Bianco, P. Chardonnet, F. Fraschetti,
V. Gurzadyan, L. Vitagliano, She-Sheng Xue, Anais da XIth Brazilian School
of Cosmology and Gravitation, Rio de Janeiro, Brazil, 19-23 Jul 2004, a serem
publicados pela AIP em 2005, astro-ph/0503476.
[20] Black hole explosions, S. Hawking, Nature 248, 30 (1974).
[21] Ver por exemplo Introducción a la mecánica cuántica, L. de La Peña, Editora
FCE (1979).
[22] Experimental black hole evaporation, W. Unruh, Phys. Rev. Lett. 46, 1351 (1981).
[23] Artificial Black Holes, M. Novello, M. Visser e G. Volovik, World Scientific (2002).
[24] A nongravitational wormhole, F. Baldovin, M. Novello, S. E. Perez Bergliaffa, J.
Salim, Class. Quant. Grav. 17, 3265 (2000), gr-qc/0003075.
[25] Effective geometry, M. Novello, Santiago E. Perez Bergliaffa, Anais da Xth Brazil-
ian School of Cosmology and Gravitation Rio de Janeiro, Brazil, 29 Jul - 9 Aug
2002, publicados pela AIP Conf.Proc. 668, 288 (2003), gr-qc/0302052.
[26] Para uma introdução básica, ver por exemplo Fundamentals of Statistical and
Thermal Physics McGraw-Hill (1965).
[27] Strings, loops, and others: a critical survey of the present approaches to quantum
gravity, C. Rovelli, gr-qc/9803024.
[28] Ver por exemplo Black Holes: Classical Properties, Thermodynamics and Heuris-
tic Quantization, J. Bekenstein, Cosmology and Gravitation, M. Novello (ed.), At-
lantisciences, France,1 (2000), Black holes and information theory, J. Bekenstein,
Contemp. Phys. 45, 31 (2003), quant-ph/0311049.

261
[29] Production of black holes in Tev-scale gravity, A. Ringwald, Fortsch. Phys. 51,
830 (2003), hep-ph/0212342.
[30] Black Holes : The Membrane Paradigm, D. MacDonald, R. Price, and K. Thorne,
Yale U. Press (1986).
[31] Introduction to General Relativity, R. Adler, M. Bazin, e M. Schiffer, McGraw-
Hill, NY (1965).
[32] Dark energy stars, G. Chapline, astro-ph/0503200.
[33] Para uma discussão detalhada do problema das singularidades veja por exemplo
o capı́tulo 9 de General Relativity, R. Wald, The University of Chicago Press
(1984), ou a referência [37].
[34] Ver por exemplo Gravitational radiation, B. Schutz, gr-qc/0003069.
[35] Wormholes in spacetime and their use for interstellar travel: A tool for teaching
general relativity, M. Morris e K. Thorne, Am. J. Phys. 395 (1988).
[36] Agujeros Negros y Tiempo Curvo. El escandaloso legado de Einstein, Kip S.
Thorne, Ed. Crı́tica (1995).
[37] Para uma discussão do conceito de singularidade, e da sua história, veja Bangs,
Crunches, Whimpers, and Shrieks - Singularities and Acausalities in Relativistic
Spacetimes, J. Earman, Oxford U. Press (1995).
[38] Black Hole Physics - Basic Concepts and New Developments, V. Frolov e I.
Novikov, Springer (July 1998).
[39] A Relativist’s Toolkit: The Mathematics of Black-Hole Mechanics, E. Poisson,
Cambridge U. Press (2004).
[40] J. Bardeen, W. Press, e S. Teukolsky, Astrophys. J. 178, 347 (1972).
[41] Trust but verify: The Case for astrophysical black holes, Scott A. Hughes, Pro-
ceedings of 33rd SLAC Summer Institute on Particle Physics: Gravity in the
Quantum World and the Cosmos, p L006 (2005), hep-ph/0511217.
[42] Gravitation and Spacetime, Hans C. Ohanian e Remo Ruffini, W. W. Norton
(1994).
[43] B. Carter,Phys. Rev. 174, 1559 (1968).
[44] Para mais detalhes com relação à observação de buracos negros, veja R. Narayan,
New J. Phys.7, 199 (2005), gr-qc/0506078.
[45] Para uma introdução veja o livro Black Holes, White Dwarfs, and Neutron Stars:
the physics of compact objects, S. Shapiro e S. Teukolsky, Wiley (1983).

262
Capı́tulo 7

Astrofı́sica de Ondas Gravitacionais

Herman J. Mosquera Cuesta1

Em 1916, Einstein publicou sua teoria da gravitação : A Teoria Geral da Relatividade


(TGR). Essa teoria sugere que a estrutura fundamental do Universo é o espaço-tempo
(ST), uma espécie de tecido global (’substratum’) que contem tudo e interage com
tudo. Esta visão descreve a interação gravitacional entre corpos materiais, ou sim-
plesmente gravitação , como o resultado de um efeito geométrico que faz o ST sofrer
deformação , ou curvatura, ao serem colocadas nele distribuições de matéria como
galáxias, estrelas, planetas, etc. Se perturbada, esta curvatura produz uma onda de
espaço-tempo, ou uma onda gravitacional (OG). Assim, uma onda gravitacional é uma
onda de curvatura! (a curvatura é fraca longe da fonte, e muito intensa nas vizinhanças
dela). Uma OG é produzida ao ser acelerado um corpo material (uma massa qualquer)
ou energia. Neste capı́tulo, estudar-se-ão algumas das fontes astrofı́sicas destas OGs,
visando sua caracterização face a uma potencial detecção das mesmas com os mod-
ernos observatórios de OGs tais como LIGO, VIRGO, GEO-600), TAMA-300, já em
operação .

7.1 Introdução

Da mesma maneira que barcos navegando através do ocêano produzem ondas na água,
o movimento de massas, por exemplo estrelas ou buracos negros, produz OGs no
tecido do ST. Quanto mais maciço (massivo) for o corpo que se movimenta mais
poderosas serão as OGs por ele geradas, enquanto que objetos que se movimentam
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.

263
Figura 7.1: Simulação da geração de OGs por um sistema binário de estrelas
tal como o pulsar de Taylor & Hulse PSR 1913 + 16. (Versão original do site
http://imagine.gsfc.nasa.gov/docs/features/topics/edge.html).

muito rapidamente produzirão também mais OGs durante um intervalo de tempo


determinado.

7.2 Geração de ondas gravitacionais na TGR

A Fı́sica básica necessária para se descrever consistentemente a geração de OGs na


TGR exibe uma grande similaridade com aquela correspondente ao electromagnetismo
na teoria de Maxwell. Isto é, as equações que regem esses fenômenos possuem carac-
terı́sticas muito semelhantes, e sua interpretação em termos de multipólos é também
bastante parecida, conforme veremos a seguir, guardadas as exceções próprias da na-
tureza tensorial da TGR e vetorial da teoria eletromagnética de Maxwell. Esta abor-
dagem, baseada nesta analogia segue um percurso análogo ao utlizado na principal
referência sobre o tema, o livro de S. L. Shapiro & S. A Teukolsky: The physics of
compacts objetcs (Wiley & Sons. New York, 1983)
No eletromagnetismo de Maxwell, a radiação multipolar de primeira ordem que é
emitida por uma distribuição não-relativı́stica de carga é radiação dipolar. Neste caso,
o potencial vetor no ‘gauge’ de Lorentz na zona de onda é dado por

1 d n  r o
Aj (t, ~x) = dj t − , (7.1)
c r dt c
REFERENCIA??
onde r ≡ |~x|, e d~ é o momento de dipólo elétrico. Os campos elétrico e magnético
do tipo 1/r calculados a partir da fórmula dada pela Eq.(7.1) dependem somente
das componentes de d~ transversas à direção de propagação ~n = ~x/r, de maneira que
podemos substituir dj na Eq.(7.1) por sua parte transversa,

264
dTj ≡ Pjk dk , (7.2)

onde Pij é o tensor de projeção ,

Pjk ≡ δjk − nj nk . (7.3)

Assim, substituindo os campos E ~ e B~ obtidos da Eq.(7.1) (usando as equações de


Maxwell) na expressão para o vetor de Poynting, obtém-se a distribuição angular do
fluxo de energia dessa radiação eletromagnética, a qual é calculada usando a expressão

 2 T 2 T
d2 E d (dj ) d (dj )
  
1
= 3
, (7.4)
dt dΩ 4πc dt2 dt2
2 !
d2 (dj ) d2 (dj ) d2 (dj )

1
= − nj . (7.5)
4πc3 dt2 dt2 dt2

A grandeza dj deverá ser avaliada no tempo retardado t − r/c. Se escolhermos o eixo


z ao longo de ~n, pode-se integrar facilmente a Eq.(7.5) sobre ângulos sólidos para se
obter a luminosidade eletromagnética de dipólo

d2 (dj ) d2 (dj )
 
dE 2
LEM ≡ = . (7.6)
dt 3 c3 dt2 dt2

Escrevendo dj = e xj para uma carga pontual, vemos que a equação acima é simples-
mente a fórmula de Larmor.
Entretanto, e sobre bases dimensionais, podemos esperar que o termo equivalente para
a emissão de radiação gravitacional (OG), isto é; o termo de primeira ordem no caso
das OGs emitidas por uma fonte com velocidades internas baixas deve ser igualmente
dipolar, isto é:   2
G d (dj ) d2 (dj )
LOG ∝ , (7.7)
c3 dt2 dt2
onde o momento de dipólo gravitacional de um sistema de A partı́culas é definido
como
X
dj = m A xA , (7.8)
A

onde fizemos a substituição e2 −→ Gm2 na Eq.(7.6). Assim sendo, a Eq.(7.8) produz

d2 (dj ) X d2 (mA xA
j )
X dPjA
= = , (7.9)
dt2 A
dt2 A
dt

onde P~ A é o momento linear da Aesima partı́cula. Uma vez que o momento total do sis-
d2 (d )
tema se conserva, i.e., dt2j = 0, então podemos concluir que não há radiação dipolar
na relatividade geral.

265
Retornando ao eletromagnetismo, as componentes de ordem superior de ra-
diação multipolar são o dipólo magnético e o quadrupólo elétrico. O momento de
dipólo magnético de ‘massa’ é definido como

1X A d~xA 1 X~A
~≡
µ ~x × (mA )= j , (7.10)
c A dt c A

onde ~j A é o momento angular da Aesima partı́cula. Ora, pela lei de conservação do


momento angular, µ ~ = 0: isto implica que não há radiação de dipólo magnético em
relatividade geral. O termo de ordem inferior que segue na expansão é o quadrupolo
elétrico. Desta maneira, o análogo da Eq.(7.1) para as OGs demonstra-se ser2

2 G d2 n ¯T T  r o
hTjkT = I t − , (7.11)
r c4 dt2 jk c
onde r é a distância até a fonte, e I¯jk
TT
é o momento quadrupolar de massa definido
como  
¯TT
X
A A 1 A 2
Ijk = mA xj xk − δjk (x ) . (7.12)
A
3

O superı́ndice TT
significa tomar a parte transversa-sem traço da grandeza I¯jk , isto é,

1
I¯jk
TT
= Pjl Pkm I¯lm − Pjk (Plm I¯lm ). (7.13)
2
Note, de passagem, que a Eq.(7.11) pode ser obtida diretamente como uma solução das
equações de Einstein linearizadas. Este procedimento é ilustrado mais adiante na
seção sobre OGs radiadas por pulsares acelerados. (Observe-se, ainda, que para esti-
mativas de ordem de magnitude podemos escrever a amplitude da OG como o escalar
r  V 2 
S p
h' , (7.14)
r c2

onde rS = GM/c2 é definido como o raio de Schwarzschild, associado com a massa


em movimento, e com distribuição de quadrupólo, e que possui uma velocidade car-
acterı́stica Vp .)
Entretanto, o fluxo de energia no caso da distribuição quadrupolar é dado pela com-
ponente (0, r) do tensor energia-momento
* +
1 G d(I¯jkTT
) d(I¯jk
TT
)
T0r = (7.15)
32π c4 dx0 dr
2
O procedimento correto para se obter esta expressão é um processo elaborado que exige, entre out-
ras várias etapas, linearizar as equações de Einstein, a implementação apropriada de várias (2) trans-
formações de calibres, demonstrar que a onda (perturbação hjk ) possui duas polarizações , além de ser de
natureza quadrupolar, transversal e sem-traço. Após a identificação destas propriedades, resta resolver
a equação de onda para uma distribuição de matéria cujo ’tensor de inércia’ é Ijk . Este procedimento
produz o resultado indicado pela equação 7.11. Tudo isto será descrito em detalhe na próxima seção .

266
Subtituindo a Eq.(7.11) na Eq.(7.15), obtemos as equações análogas das Eqs.(7.4,7.5)
* +
d3 (I¯jk
TT
) d3 (I¯jk
TT
 2 
dE G )
= , (7.16)
dt dΩ 8πc5 dt3 dt3
* 2 +
d3 (I¯jk ) d3 (I¯jk ) d3 (I¯ij ) d3 (I¯jk ) d3 (I¯jk )

G 1
= − 2ni nk + nj nk (7.17)
.
8πc5 dt3 dt3 dt3 dt3 2 dt3

Integrando sobre ~n, isto é, sobre a parte angular da radiação , obtém-se a luminosidade
emitida na forma de OGs
 3 ¯
d (Iij ) d3 (I¯ij )

dE G
LOG ≡ = . (7.18)
dt 5 c5 dt3 dt3

Esta relação é conhecida como a fórmula de quadrupolo da relatividade geral, e é


válida para fontes em movimento lento (V  c), e com campo gravitacional fraco,
isto é; potencial quase-newtoniano (Φ  c2 ). Note que a anulação de LOG para fontes
esfericamente simétricas é um resultado geral, conhecido como o Teorema de Birkhoff.
1
No caso do eletromagnetismo, a fórmula análoga à Eq.(7.18) tem um coeficiente de 20
ao invés de 15 porque as ondas E-M estão associadas a campos vetoriais (ou de spin-1),
e não a campos tensoriais (ou de spin-2) como as OGs. Note, todavia, as unidades da
quantidade

−1
c5

G
L0 ≡ = = 3.6 × 1059 erg s−1 ! (7.19)
c5 G

Uma vez que conheçemos a massa M , velocidade caracterı́stica V e escala de tempo


dinâmica T , podemos definir a potência interna da fonte de OGs como

MV 2 Lint
Lint = −→−→−→ LOG ∼ Lint ! (7.20)
T L0
A força de reação de radiação correspondente à perda de energia descrita pela
Eq.(7.18) pode-se escrever como o gradiente de um potencial Newtoniano

G d5 (I¯jk )
F~ react = −m∇Φreact , Φreact = xj xk . (7.21)
5 c5 dt5
Assim, pode-se verificar que

dE X
= V~A · F~Areact (7.22)
dt A
2G d5 (I¯jk ) A
X  
= − mA VAj 5 5
xk (7.23)
A
5c dt
G d5 (I¯jk ) d X
= − 5 5
mA xA A
j xk (7.24)
5 c dt dt A
G d5 (I¯ij ) d(I¯ij )
= − 5 , (7.25)
5 c dt5 dt
267
onde a última linha foi obtida depois de lembrar que I¯ij δij = 0, isto é, o tensor é de
traço nulo! Calculando a média sobre vários ciclos (para uma fonte periódica), ou
sobre um tempo longo comparado com a escala temporal dinâmica (para movimento
de fontes confinadas), nos permite integrar por partes, duas vezes consecutivas, para
assim transformar
d5 (I¯ij ) d(I¯ij ) d3 (I¯ij ) d3 (I¯ij )
−→−→−→ , (7.26)
dt5 dt dt3 dt3
e dessa forma recuperar o resultado da Eq.(7.18).
Um procedimento análogo ao de cima, permite mostrar que o momento angular car-
regado pelas OGs (i.e., conforme dissipado pela força de reação de radiação )
dJi X A(react)
= ijk xA
j Fk (7.27)
dt A

pode-se rescrever como


d2 (I¯jm ) d3 (I¯km )
 
dJi 2G
= − 5 ijk . (7.28)
dt 5c dt2 dt3
Note-se que se a fonte for axissimétrica ! o momento angular seria preservado, isto
é, nenhuma OG seria produzida por tal fonte. Este é também é um resultado geral
conhecido como Teorema de Birkhoff.

7.3 Linearização da TGR


Considere-se uma pequena perturbação métrica hµν sobre um S-T de fundo
minkowskiano
gµν = ηµν + hµν , |hµν | ≡ h << 1 , (7.29)
na qual definiu-se o tensor
hµν ≡ η αµ η βν hαβ , (7.30)
tal que

(ηµν + hµν ) η αβ − hαβ



= (7.31)
ηµα η αβ − ηµα hαβ + hµα η αβ = δµβ . (7.32)

Para se obter uma teoria linearizada da TGR, começamos por definir o sı́mbolo de
Christoffel
1
Γαβν = g ασ (gσβ,ν + gνσ,β − gβν,σ ) . (7.33)
2
Substituindo a Eq.(7.29) na Eq.(7.33) obtém-se

Γαβν = (η ασ − hασ ) {hσβ,ν + hνσ,β − hβν,σ } (7.34)


1 α
h β,ν + hα ν,β h − h,α

= βν . (7.35)
2
268
CORREGIR
Ora, das seções anteriores, a definição do tensor de Riemann no referencial inercial
(no qual as Γs são nulas, mas não suas derivadas) é

Rµ ναβ = Γµ νβ,α − Γµ να,β


1 µ
hβ,να − hµα ,νβ − h,µ ,µ

= νβα + hναβ , (7.36)
2

CORREGIR podemos substituir a Eq.(7.35) na Eq.(7.36). Este resultado pode ser então
levado ao tensor de Riemann (note que o traço e o operador D’Alembertiano são dados,
respectivamente, por

hµ µ,νβ = h,νβ (7.37)


h,µ
νβ µ = hνβ . (7.38)

)
CORREGIR

Rµ νµβ = Rνβ (7.39)


= Γµ νβ,µ − Γµ νµ,β (7.40)
1 µ
hβ,νµ + hµν,µβ − hµµ,νβ − h,µ

= νβµ (7.41)
2
1 µ
hβ,νµ + hµν,µβ − h,νβ − hνβ .

= (7.42)
2

Finalmente, pode-se calcular o escalar de curvatura a partir da expressão


1 νµ
h,νµ + hµν ν ν

R = ν,µ − h,ν − hν (7.43)
2
1
= (2hµν ,µν − 2h)
2
= (hµν ,µν − h) . (7.44)

As expressões assim obtidas podem ser substituidas nas equações de campo, as quais
tomam a seguinte forma
1
Rµν − gµν R = 8πTµν (7.45)
2
1 α 1
hν,µα + hαµ,αν − h,µν − hµν − hµν
 
,µν − h gµν =
2 2
1h α  i
hν,µα + hαµ,αν − h,µν − hµν − ηµν hαβ,αβ − h = 8πTµν . (7.46)
2
A Eq.(7.46) constitui a realização do processo de linearização da TGR. Ela descreve a
propagação de OGs cuja fonte (distribuição de matéria-energia) é bem caracterizada
pelo tensor Tµν .

269
7.3.1 A transformação de calibre

Ao analisar a estrutura da Eq.(7.46) vemos que esta possui um número grande


de termos que são combinações diversas dos sub-ı́ndices que definem o tensor per-
turbação hµν . Isto sugere que deve existir uma maneira de reduzir ao mı́nimo esta
expressão. Este procedimento se conhece como uma transformação de calibre. Assim,
sob uma transformação infinitesimal de coordenandas na qual 3
0
xα −→ x µ = xµ + ξ µ , (7.47)

as equações da TGR linearizada passam a ser


∂x0α
Λ0µ β = (7.48)
∂xβ
∂xα ∂ξ α
= + 
∂xβ ∂xβ
= δ β + ξ µ ,β .
α
(7.49)

Portanto,
xα = x0α − ξ α , (7.50)
do qual se segue que
∂xα
Λαβ0 =
∂x0β

= (x0α + ξ α )
∂x0β
∂ξ α
= δ α β −  0β
∂x
µ
∂x ∂ξ α
= δβα −  0β µ
∂x ∂x
∂ ∂ξ α
= δβα −  0β (x0µ − ξ µ ) µ
∂x ∂x
= δ α β − ξ α 0β . (7.51)

Nesta expressão, termos de ordem superior em  foram desprezados. Assim, lembrando


0
que gµν transforma segundo a regra

0 ∂xα ∂xβ
gµν = gαβ
∂x0µ ∂x0ν
= gµν − 2ξ(µ,ν) (7.52)

podemos mostrar que a perturbação pode se escrever como

h0µν = hµν − 2ξ(µν) . (7.53)

Agora, pela analogia com o electromagnetismo dsiscutida acima, podemos propor a


seguinte transformação de calibre4 :
1
ψµν ≡ hµν − ηµν h , (7.54)
2
3
Esta transformação é gerada por um vetor ξ µ cujás componentes são funções da posição, tal que ξ µ
é suficientemente pequeno, isto é, |ξ α ,β |  1.
4
Note que ψ ≡ −h

270
do qual segue-se que o tensor de Ricci passa a ter a forma
1 α
ψ ν,µα + ψ αµ,αν − hµν ,

Rµν = (7.55)
2
enquanto que o escalar de curvatura resulta ser
1 να

R= 2ψ,αν − h . (7.56)
2
Desta maneira, o tensor de Einstein passa a ser escrito como
1 α
+ ψα − ψµν − ηµν ψ αβ

Gµν = ψ ν,µα µ,αν ,αβ (7.57)
2
A Eq.(7.57) pode ser então reduzida a uma equação de onda se impusermos a condição
que
ψ µ ν,µ = 0 , (7.58)
ou equivalentemente
1
hµν,µ = h,ν . (7.59)
2
CORREGIR
O calibre definido pela Eq.(7.59) é conhecido como calibre de Einstein, Hilbert, de
Donder, ou Fock. É interesante notar como muda este calibre sob uma transformação
de coordenadas do tipo
hµν −→ h0µν = hµν − 2ξ(µ,ν) . (7.60)
O calibre da Eq.(7.59) neste caso toma forma
0
ψµν = ψµν − 2ξ(µ,ν) + ηαβ ξ µ ,µ . (7.61)

Desta maneira, a nova variável ψ 0µν se transforma em

ψ 0µ ν = ψµ ν − 2ξ µ( , ν) + δ µν ξ σ ,σ . (7.62)

a qual após uma primeira derivação respeito de xµ torna-se

ψ 0µ ν,µ = ψ µν,µ − ξν . (7.63)

Portanto, essa transformação deixa o calibre invariante se fizermos a seguinte escolha

ψµ ν,µ = ξν . (7.64)

A Eq.(7.64) não fixa o calibre univocamente visto que sempre poderemos realizar
transformações adicionais com a outra parte da igualdade, isto é, com ξµ , o que
permitirá manter ψ µν,µ do jeito que era.
Desta maneira, as equações de Einstein em presença de matéria tomam a forma

ψµν = −16πTµν ,
(7.65)

271
enquanto no vácuo escrevem-se
hµν = 0 . (7.66)
Podemos propor uma solução de onda para a Eq.(7.66) do seguinte tipo
α
ψµν = Aµν eikα x , (7.67)
onde o quadri-vetor kα respresenta as componentes constantes de algum tipo de 1-
forma, e Aµν define as componentes constantes de algum tensor simétrico. Assim
sendo, a Eq.(7.66) pode-se escrever na seguinte forma
kα k α ψ µν = 0 . (7.68)
Esta condição só pode ser satisfeita se kα k α = 0, isto é, se kα é um vetor nulo. Portanto,
para um valor de xν k ν constante teremos uma hipersuperficie em que hµν é constante,
tal que
kα xα = k0 t − kx = constante . (7.69)
Por convenção , passaremos a nos referir a k0 como a frequência da onda após a
decomposição (3+1) espaço-temporal
kα −→ (ω, k) . (7.70)
Uma vez que o vetor kα é nulo, nos temos
k α kα = k 0 k0 − k i ki = 0
k 0 k0 = k i ki
ω 2 = |k|2 . (7.71)
Esta equação define a relação de dispersão para essa onda. Note ainda que a velocidade
de fase da onda é c = 1! (nestas unidaes), bem como sua velocidade de grupo.

7.4 Mais um vı́nculo


As equações de Einstein assumem a forma ψ αβ = 0 se nos impôrmos sobre o termo
ψ αβ mais uma condição de calibre do seguinte tipo
ψ µν ,ν = 0 . (7.72)
Este nos conduz a
kµ Aµν = 0 . (7.73)
A Eq.(7.73) implica que kµ é ortogonal a Aµν . Isto, por sua vez, impõe também uma
α
restrição sobre a amplitude da onda. A solução Aµν expixα k é chamada uma onda
plana. Os teoremas oriundos da análise de Fourier indicam que qualquer solução ao
conjunto de equações
ψ µν = 0
ψ µν ,ν = 0 (7.74)
é uma superposição de soluções do tipo onda plana.

272
7.4.1 O calibre transverso-sem-traço

Até agora só impusemos uma restrição sobre a Eq.(7.66). Portanto, se lembrarmos
agora que a outra parte da restrição tinha relação direita com o vetor ξ, o qual satisfaz
uma equação de campo igual á Eq.(7.66), podemos então impôr algum outro tipo de
restrição sobre o próprio vetor ξ. Desta maneira,

ξµν = 0. (7.75)

Para resolver esta equação podemos escolher uma solução da forma


α
ξµ = Bµ expikα x , (7.76)

onde kα é um vetor de onda nulo, e Bµ é uma constante. Viu-se acima que isto produz
uma mudança em hµν dada por

h0µν = hµν − ξµ,ν − ξν,µ , (7.77)

e consequentemente uma mudança em ψµν , levando-o á forma

0
ψµν = ψµν − ξµ,ν − ξν,µ + ηµν ξ α ,α . (7.78)

Retornando á Eq.(7.76) e substituindo obtemos

A0µν = Aµν − Bµ kµ + ηµν B α kα . (7.79)

Se escolhermos Bµ de tal maneira que possamos impôr sobre Aµν o seguinte par de
restrições

Aµµ = 0 −→ sem-traço (7.80)


Aµν uν = 0 −→ transverso, (7.81)

onde uν é um quadri-vetor velocidade fixo, isto é, qualquer vetor tipo-tempo unitário
que nos quisessemos escolher.
O conjunto de equações (7.80,7.81) é chamado vı́nculo transverso-sem-traço, ou T T .
Notemos que tanto a condição do traço nulo bem como a Eq.(7.54) implicam que

1
ψµν = hµν − ηµν h
2
TT TT TT
ψµν = hµν = hµν . (7.82)

Retornando ao referencial de Lorentz, no “background” do espaço-tempo de


Minkowski, onde o vetor uµ tem a forma uµ = δ0µ , vê-se que a Eq.(7.81) implica
que
Aα0 = 0 , ∀α! (7.83)

273
Neste referencial vamos escolher o eixo ordenado z tal que

k −→ (ω, 0, 0, ω) . (7.84)

Assim, a Eq.(7.73) implica que


Aαz = 0; ∀α! (7.85)
A expressão anterior dá origem ao rótulo “transverso” para o calibre! Isto é, Aµν não
tem qualquer projeção sobre a direção do eixo z. As restrições anteriores significam
que as componentes Axx , Axy , Ayx e Ayy são não-nulas. Além disso, a condição de
traço-nulo implica que

Aµ ν = 0
Ax x + Ay y = 0
Axx = −Ayy . (7.86)

Desta maneira, podemos escrever o tensor de perturbação Aµ ν em forma matricial


 
0 0 0 0
 0 A Axy 0 
xx
ATµνT =  .
 
 0 Axy −Axx 0 
0 0 0 0

Analisando esta matriz vemos que só duas de suas componentes são linearmente in-
dependentes.
Consideremos a seguir o que aconteceria a uma partı́cula que fosse atingida por uma
onda gravitacional na TGR, no caso uma onda se propagando na direção do eixo z.
Vamos supôr que a partı́cula está inicialmente em uma região livre de ondas. Se escol-
hermos o referencial de Lorentz, no qual a partı́cula está inicialmente em repouso, o
calibre T T associado a este sistema de referência cuja quadri-velocidade é uα , será tal
que a partı́cula obedece a equação geodésica para uma partı́cula livre, i. e.,
duα
+ Γα µν u
µ ν
u = 0. (7.87)

Lembrando que a partı́cula esta inicialmente em repouso, segue-se que
 α
du
= −Γα µν δ0µ δ0ν (7.88)
dτ τ =0
1
= −Γα 00 = − η αβ (hβ0,0 + h0β,0 − h00,β ) , (7.89)
2
mas sabemos também que A0α=0 , portanto
 α
du
= 0. (7.90)
dτ τ =0
Isto significa que a partı́cula sempre permanecerá em repouso uma vez que tal
condição seria mantida para qualquer outro instante de tempo. Entretanto, embora

274
estar em repouso signifique que a partı́cula mantém sua posição coordenada constante
com tempo, não podemos dar uma interpretação simples a tal fato já que ao fazermos
a escolha do calibre T T nos definimos um sistema coordenado que permanece fixo ás
partı́culas, individualmente.
Para se ter uma melhor idéia do que acontece, vamos considerar duas partı́culas (ambas
em repouso): uma na origem do sistema coordenado e a outra na posição x = . Além
disso, vamos supôr que y = z = 0. Portanto, ambas as partı́culas estarão fixas
em suas posições coordenadas, do qual segue-se que sua distância média é dada pela
relação
 
1 1 k
∆l = |gxx (x = 0) | 2  = (1 − khxx ) 2  = 1 − Axx cos (ωt) . (7.91)
2
Isto mostra que a distância própria entre as duas partı́culas muda com o tempo.
As partı́culas permanecem em repouso relativo respeito de suas coordenadas, mas as
coordenadas mesmas oscilam em relação a uma fita métrica.
Uma maneira alternativa de se entender este proceso seria observar o desvio geodésico
entre as duas partı́culas, quando conectadas por um vetor ξ µ (sendo µ = 0, 1, 2, 3 ou
t, x, y, z ) que obedece a equação

d2 ξ α
= Rα µνβ u
µ ν β
u ξ . (7.92)
dτ 2
Neste caso, esta caracterı́stica pode se escrever ξ β −→ (0, , 0, 0), e portanto

d2 ξ
= Rα 00α ξ
α
= −Rα 0α0 ξ
α
= −Rx 0x0 . (7.93)
dτ 2
Lembrando a (Eq.7.36) temos que
1 T
Rx 0x0 = Rx0x0 = − hTxx,00 (7.94)
2
1 TT
Ry 0x0 = Ry0x0 = − hxy,00
2
1 T
Ry 0y0 = Ry0y0 = −Rx0x0 = − hTyy,00 , (7.95)
2
o qual indica que as partı́culas afastadas ao longo do eixo x tem um vetor deslocamento
ξ µ que satisfaz a relação
d2 ξ α ∂ 2ξ1 1 ∂ 2 hxx
= = 
dτ 2 ∂t2 2 ∂t2
∂ 2ξx 1 ∂ 2 hxy
=  (7.96)
∂t2 2 ∂t2
Entretanto, se as partı́culas estivessem afastadas ao longo do eixo y teriamos que
∂ 2ξ2 1 1 ∂ 2 hxx
= hyy = − 
∂t2 2 2 ∂t2
∂ 2ξy 1 ∂ 2 hyx
=  . (7.97)
∂t2 2 ∂t2
275
Figura 7.2: Deformação sofrida por um “anel” de partı́culas em repouso quando é atingido
por uma onda gravitacional.

7.5 Polarização de Ondas Gravitacionais

O formalismo descrito acima pode nos ajudar a descrever a polarização da onda grav-
itacional. Para tal feito, consideremos um anel de partı́culas inicialmente em repouso
no plano x, y. Neste caso, h21 = hxy = h12 = 0, e o elemento de linha será

ds2 = dt2 − (1 + hxx ) dx2 − (1 − hxx ) dy 2 . (7.98)

Observemos o que acontece com as duas partı́culas que inicialmente tem coordenadas
(x0 , y0 ) e (x0 + dx, y0 ). Tomando o elemento de linha

ds2 = − (1 + hxx ) dx2 , (7.99)

e considerando hxx como uma função oscilatória, vemos que quando hxx passa de
hxx = 0 para hxx ≥ 0, as partı́culas se afastam entre si, e viceversa, quando hxx
passa de hxx = 0 para hxx ≤ 0, elas tendem a se juntar. Uma situação análoga
deverá acontecer se considerassemos as partı́culas com (x0 , y0 + dy). Assim, se uma
onda plana propaga-se na direção z, e incide sobre um anel de partı́culas no plano
x, y, o anel vai se distorcer formando uma elipse pulsante cujo eixo maior gira até
ficar paralelo inicialmente ao eixo x, e posteriormente ao eixo y. Define-se este tipo de
polarização como polarização +.
Analisemos agora o que acontece quando hyx = hxy = h12 = h21 6= 0. Neste caso, o
elemento de linha é

ds2 = dt2 − dx2 − dy 2 − dz 2 + 2hxy dxdy. (7.100)

Efetuando uma transformação de coordenadas que faz rodar os eixos coordenados por

276
π/4 radianos no plano x, y obtemos
1
y −→ y 0 = √ (y + x)
2
1
x −→ x0 = √ (y − x) . (7.101)
2
de forma que o elemento de linha passa a ser

Figura 7.3: Polarização de ondas gravitacionais. Modo + á esquerda e modo × á direita.

ds2 = dt2 − (1 + hxx ) dx2 − (1 − hxx ) dy 2 − dz 2 . (7.102)

Comparando este com o elemento de linha da Eq.(7.99) percebe-se que são os mesmos
elementos de linha, e que por tal motivo causam idênticos efeitos que hxx , mas após
uma rotação de 45 graus dos eixos coordenados, ou equivalentemente, a uma defasagem
de π/4. A este tipo de polarização se denomina polarização ×.
Para concluir, note-se que uma onda gravitacional é em geral uma superposição dos
dois modos de polarização + e ×.

7.6 Ondas gravitacionais emitidas por massas acel-


eradas: Pulsares

7.6.1 OGs a partir de pulsares accelerados na Galáxia

Para se descrever a emissão de OGs durante a fase de impulsão inicial de pulsar, que é
acelerado a alta velocidade na Galáxia, durante por exemplo, uma explosão supernova,
podemos começar por linearizar as equações de Einstein (conforme a gente viu acima)

Gµν = −kTµν ; (7.103)

onde Gµν e Tµν são, respectivamente, os tensores de Einstein e de matéria-energia, e


k é uma constante. Uma vez que o campo gravitacional, ou perturbação , gerado pelo

277
deslocamento do pulsar é fraco (devido a sua baixa velocidade: VPSR  c), pode-se
usar então a expansão métrica

gµν ' ηµν + hµν , (7.104)

onde ηµν define a métrica de Minkowski, e hµν << 1 representa a perturbação do


espaço-tempo produzida pelo lançamento com movimento ‘tipo-foguete’ de um pulsar
especı́fico.
Doravante usar-se-á a métrica gµν com a assinatura (−+++), coordenadas cartesianas
rλ = (t, ri ), onde ri = x1 = x, x2 = y, x3 = z, e também unidades geométricas nas
que G = c = 1, de maneira que a constante acima k = 8π. Desta forma, no ‘gauge’
harmônico (ou de de Donder)
h̄αν0ν = 0, (7.105)
obtemos
2h̄µν = h̄µν0 ββ = 16πTµν , (7.106)
onde
1
h̄µν = hµν − ηµν hαα . (7.107)
2
O pulsar é imaginado daqui para frente como sendo uma ‘partı́cula’ de massa M?
movendo-se ao longo de uma linha-mundo rλ (τ ) (com τ sendo o tempo próprio) e
possuindo um tensor energia-momento
Z
Tµν (x) = M? Vµ Vν δ (4) [x − r(τ )] dτ , (7.108)

onde V α = drα /dτ é o 4-vetor velocidade da partı́cula. Note que os super/[sub])-


ı́ndices são subidos[baixados] com a métrica de Minkowski ηµν ). Substituindo este
tensor energia-momento na Eq.(7.106) nos conduz à solução retardada (uma general-
ização da solução de Lienard-Wiechert do eletromagnetismo)

Vµ (τ )Vν (τ )
h̄µν = 4 M? . (7.109)
−Vλ · [x − r(τ )]λ τ =τ0

Este resultado deve ser avaliado no tempo retardado, o qual corresponde ao tempo
de interseção de rα (τ ) com o cone-de-luz passado do observador. Note que é este
fator −Vλ · [x − r(τ )]λ ; que depende da velocidade no denominador da Eq.(7.109),
que é responsável pela caracterı́stica da amplitude de ser não-evanescente, a chamada
“memória” do sinal de OG produzido pelo lançamento do pulsar à sua trajetória atual.
Esta perturbação métrica pode ser rescrita no ‘gauge’ de Lorentz, passando a ter a
forma
1
hµν = h̄µν − ηµν h̄αα ; (7.110)
2
ou equivalentemente
 
4 M? 1
hµν = Vµ (τ )Vν (τ ) + ηµν . (7.111)
−Vλ · [x − r(τ )]λ 2

278
Figura 7.4: Sinais de OG emitidos: a) durante a aceleração de um pulsar e b) na ocorrência
de um ‘gamma-ray burst’. Compara-se a distribuição com o ângulo de visada do sinal de
OG produzido durante a fase inicial de aceleração de um pulsar (linha tracejada –verde),
com parâmetros: V?ave = 450 km s−1 , e distância = 10 kpc, com o sinal de OG produzido
por um ‘gamma-ray burst’ (linha sólida–vermelha), como uma função do ângulo que o
jato forma com a linha de visada, e com parâmetros: Eave = 1051 erg, γ = 100, à distância
= 1 Mpc. Notável resulta a localização do máximo em cada curva.

A Eq.(7.111) deve finalmente ser rescrita no ‘gauge’ transverso, sem-traço (T T ), isto


é; hµν −→ hTµνT ; que é o mais apropriado para se discutir a resposta do detector de OGs
ao sinal. Este procedimento leva ao resultado apresentado na Eq.(7.112), abaixo. Uma
análise mais detalhada [ver Refs. [?, ?])] mostra que a deformação máxima da OG no
detector é obtida para um vetor de onda, ~n, que seja ortogonal ao braço do detector.
Neste caso, a amplitude de OG gerada pela impulsão abrupta do pulsar (limite não
relativı́stico) resulta ser (unidades c.g.s. reinseridas)
  Z θV
γ M? β 2 sen3 θsen2∆φ
 
G
hmax = 2 2 dθ , (7.112)
c 0 D? ∆Ω(1 − β cos θ)
 
onde ∆Ω ' π(∆θ)2 , ∆φ = cos−1 cos ∆θ−cos θV cos θ
senθV senθ
, β = |~v |/c, com |~v | a velocidade 3-
D do pulsar, tal grandeza é definida como: V?fin (t), θ o ângulo entre ~v e ~n (isto é; ~v ·~n =
V?fin (t) cos θ), D? a distância ao pulsar, e γ o fator de Lorentz; o qual pode ser suposto
neste caso igual a 1 porque V?fin (t)  c. O resultado mostrado na Fig.7.4, estabelece
que a perturbação de OG do espaço-tempo não é fortemente colimada na direção para
frente ~n, como é o caso da radiação eletromagnética. Contrariamente a esta última,
a perturbação métrica no limite ultra-relativı́stico (não aplicável aos RAPs) tem uma
dependência direcional que é proporcional a 1+cos θ. Num tal caso, devido o forte efeito
de colimação como nos ‘gamma-ray bursts’; por exemplo, a radiação eletromagnética
emitida pela fonte durante o mesmo intervalo de tempo é visı́vel somente dentro do
pequenı́ssimo ângulo sólido (θ ∼ γ −1 )2 , enquanto que o sinal de OG é observável
dentro de um ângulo sólido maior: quase 2π radianos (ver Fig.7.4). Além do que, a

279
frequência observada da OG é deslocada para o azul na direção para diante, e portanto
o fluxo de energia carregado pelas OGs é também colimado na direção para frente.
Ainda mais notável, no caso dos RAPs, é que o sinal de OG terá seu máximo para
ângulos de visada θ ∼ π/2, isto é, para o movimento do pulsar puramente no plano
do céu, conforme ilustrado na Fig.7.4.

Figura 7.5: Sensibilidades do LIGO I e de sua versão avançada, comparadas com as


caracterı́sticas do sinal de OG produzido por cada um dos 153 pulsáres que perambu-
lam pela nossa galáxia, para os quais conhecemos suas atuais velocidades e distâncias.
Pode-se verificar que muitos (∼ 45) destes sinais individuais serão detectáveis pela con-
figuração avançada do observatório LIGO.

7.7 Ondas gravitacionais emitidas por sistemas


binários
Considere primeiro o caso de duas massas pontuais M1 e M2 em uma órbita circular de
raio a (ver Figura 7.7), por exemplo uma estrela compacta ao redor de sua companheira
orbital. Se a1 e a2 são suas distâncias ao centro de massa, então
M1 a1 = M2 a2 = µa, (7.113)
onde definiu-se
M1 M2
µ≡ , (7.114)
M1 + M2
como a massa reduzida do sistema binário. Se o eixo z for o eixo de rotação , e φ
o ângulo azimutal medido desde o eixo x à linha que une as massas, então podemos
escrever
I¯xx = M1 a21 + M2 a22 cos2 φ + Constante.

(7.115)
Aqui usamos a convenção de que Mi a21 /3, i = 1, 2 é uma ‘Constante’ para cada
partı́cula. A Eq.(7.115) pode-se rescrever também como
1
I¯xx = µa2 cos 2φ + Constante. (7.116)
2
280
Figura 7.6: Descrição esquemática da órbita de um pulsar binário. ([7](Site
http://astrosun2.astro.cornell.edu/academics/courses/astro201/psr1913.htm).

Similarmente,
1
I¯yy = − µa2 cos 2φ + Constante. (7.117)
2
1
I¯xy = I¯yx = µa2 sen2φ. (7.118)
2
Visto que φ = Ωt, onde ω é a frequência angular orbital, encontramos usando a terceira
lei de Kepler,
GM
Ω2 = 3 , com M ≡ M1 + M2 , (7.119)
a
que a luminosidade em OGs emitida pelo sistema vem dada por
 3 ¯
d (Iij ) d3 (I¯ij )

G
LOG = (7.120)
5 c5 dt3 dt3
 
G 6 1 2
= 5
(2Ω) µa sen2 2Ωt + sen2 2Ωt + 2 cos2 2Ωt (7.121)
5c 2
32 G4 M 3 µ2
= . (7.122)
5 c 5 a5

A perda de energia leva a um decréscimo da separação a e portanto um decréscimo


no perı́odo orbital P ≡ 2π/Ω. Lembrando que a energia é
 
1 GM1 M2
E = M1 a1 + M2 a2 Ω2 −
2 2
, (7.123)
2 a
1 GµM
= − , (7.124)
2 a
temos que

1 dP 3 da
= , (7.125)
P dt 2a dt
3 1 dE
= (7.126)
2a E dt
96 G3 µM 2
= − . (7.127)
5 c 5 a4
281
Com base na análise precedente pode-se demonstrar que as relações acima são válidas
quando a −→ 0, de maneira que o tempo T0 transcorrido até a −→ 0 é dado por
(Peters & Mathews 1964)
5 c5 a4atual
T0 = . (7.128)
256 G3 µM 2
Entretanto, usando a Eq.(7.28), que define o momento angular radiado na forma de
OGs, pode-se mostrar que para órbitas circulares

dJ 32 G7/2 µ2 M 5/2
=− , (7.129)
dt 5 c5 a7/2
de maneira que a perda de energia e de momento angular satisfazem a condição
dE dJ
=Ω . (7.130)
dt dt
Esta última relação indica que uma órbita circular permanece circular enquanto as
estrelas do sistema binário se aproximam entre si.
Por outro lado, se as duas massas estão em órbita elı́ptica com excentricidade e, e se
calcularmos a média das grandezas dE
dt
e dJ
dt
, para uma única órbita, obtemos (Peters
& Mathews 1964)

dE dE
= f (e), (7.131)
dt dt e=0
dJ dJ
= g(e), (7.132)
dt dt e=0
 
73 2 37 4 −7/2
f (e) = 1+ e + e 1 − e2 , (7.133)
24 96
 
7 2 −2
g(e) = 1+ e 1 − e2 . (7.134)
8

Uma vez que as Eqs.(7.119) e (7.123) são válidas para órbitas elı́pticas, a Eq.(7.125)
se transforma em
1 dP 96G3 µM 2
=− 5 f (e). (7.135)
P dt 5c a4

7.8 Taylor & Hulse: Um prêmio Nobel pelas OGs


do pulsar binário PSR 1913 + 16

Atualmente, a evidência mais forte da existência das ondas gravitacionais proviene dos
estudos da órbita do primeiro pulsar binário descoberto em observações astronômicas.
Este feito foi logrado por J. Taylor & R. Hulse em 1974. O sistema hoje é chamado o
pulsar de Taylor & Hulse ou PSR 1913 + 16 (suas coordenadas celestes).
Imediatamente após sua descoberta, estes pesquisadores perceberam que mudanças
aparentes na frequência do pulsar poderiam ser explicadas pelo efeito Doppler devido

282
ao movimento orbital ao redor de uma companheira invisı́vel com perı́odo de 7h:45’. A
presença de um relógio de altı́ssima precisão, o pulsar, movendo-se a uma velocidade
de ∼ 300 km s−1 através do campo gravitacional da companheira causou uma ‘onda’
de atividade na comunidade relativı́stica. A Natureza teria fornecido um sistema as-
trofı́sico no qual poderiam se testar, muito além dos limites fornecidos pelos estudos
de dinâmica pós-newtoniana (PPN) no Sistema Solar, vários outros efeitos previstos
pela TGR. Na prática, estes efeitos são procurados através do estudo dos tempos de
chegada dos pulsos emitidos pelo pulsar.

Para entendermos melhor esta análise, suponhamos que M1 seja a massa do pulsar e
M2 a de sua companheira. Se supormos que eles são astros esféricos, então na ordem
mais baixa (gravidade Newtoniana) eles se movem em órbitas elı́pticas ao redor de
seu centro de massa comum. Se supormos que a órbita está no plano x − y, com sua
origem no centro de massa, a inclinação do plano orbital em relação à linha de visada
será i. Podemos ainda supôr que o eixo x está orientado ao longo da linha de nós, ou
seja, a linha que passa através da origem ao longo da intersecção do plano orbital com
o plano perpendicular à linha de visada (ver Figura 7.7). Seja ω a distância angular do
periastro a partir do nó, medido no plano orbital. Com estas definições , a posição do
pulsar a qualquer instante é dada por

x = r1 cos φ, y = r1 senφ, (7.136)

onde
a1 (1 − e2 )
ψ = ω + φ, r1 = . (7.137)
1 + e cos φ
O ângulo φ, a coordenada polar medida a partir do periastro, é chamada de anomalia
verdadeira, na mecânica celeste.

A razão entre o perı́odo emitido pelo pulsar e aquele recebido pelo observador, pode-se
escrever como

∆t|rec ∆t|rec ∆t|stat


= , (7.138)
∆t|em ∆t|stat ∆t|em

onde o subı́ndice ‘stat’ denota um observador na posição do pulsar, que é estacionário


com relação ao centro de massa. suponha de momento que o receptor na Terra, é
também estático com relação ao centro de massa. Assim, se r é a distância entre M1
e M2 , então
 −1
∆t|rec GM2
= 1− , (7.139)
∆t|stat rc2
pela definição do deslocamento para o vermelho ou ‘redshift’. A fórmula Doppler dá
−1/2 " #
V12 V~1 · ~n

∆t|stat
= 1− 2 1+ , (7.140)
∆t|rec c c

283
Figura 7.7: Órbita do Pulsar Binário PSR J0737-3039A,B conforme vista da Terra. Note
que o pulsar binário PSR 1913+16 apresenta uma configuração similar, mas sua geome-
tria é muito diferente. [Original de Dunc Lorimer, in the 19th European Cosmic Rays
Symposium (10/09/2004)].

284
onde ~n é um vetor unitário que aponta da terra ao emissor. Assim, a Eq.(7.138) se
transforma (até ordem (V 2 )) e (M/r)) em
" #
∆t|rec ~
V1 · ~n 1 V12 GM2
= 1+ + + . (7.141)
∆t|em c 2 c2 rc2

Agora, note que da Figura 7.7 se tem ~n = ~ez0 = cos i~ez + seni~ey . Desta forma, a
Eq.(7.136) conduz a
V~1 · ~n = (r1 senψ + r1 ψ̇ cos ψ)seni. (7.142)

Usando a Eq.(7.137) e a segunda lei de Kepler, esta última escrita na forma



φ̇ = 2 3/2
(1 + e cos φ)2 , (7.143)
P (1 − e )

encontra-se, depois de um pouco de algebra simples, que

V~1 · ~n = K{cos(ω + φ) + e cos ω)2 }, (7.144)

onde
2πa1 seni
K≡ . (7.145)
P (1 − e2 )1/2

A análise apresentada até agora é exatamente a mesma que é feita para uma binária
espectroscópica de uma ‘única-linha’, com a importante diferença de que ∆t|em , não
sendo de uma linha espectral, não resulta ser conhecido. Assim, qualquer termo con-
stante do lado direito da Eq.(7.141) não é mesurável: ele é simplesmente absorbido em
∆t|em . Em particular, uma velocidade uniforme entre o centro de massa do sistema
solar e o centro de massa do pulsar não é mesurável. (O movimento orbital da Terra
introduz um efeito Doppler que deve ser substraı́do usando a velocidade, conhecida,
da Terra no sistema solar).
A partir do termo Doppler de primeira ordem, os seguintes parâmetros podem ser
encontrados: e e P através da Eq.(7.143), que quando integrada dá φ(t), e também K
e ω a partir dos dois termos independentes, que variam com o tempo, proporcionais
a cos φ e senφ na Eq.(7.144). A partir de K obtém-se a1 seni, e a partir de P e a1 seni
se obtém a função de massa introduzida no Cap.??, Sec. 9.7 .

(M2 seni)3 (a1 seni)3


 
2π 2
f (M1 , M2 , i) ≡ = ( ). (7.146)
(M1 + M2 )2 G P

Devido a alta precisão do acompanhamento temporal de evolução do pulsar (‘pulsar


timing’) os termos de deriva Doppler transversa e redshift gravitacional na Eq.(7.141)
podem ser medidos. Encontra-se que

V12 = ṙ12 + r12 ψ̇ 2 (7.147)


 2 
2π 2 a1
= ( ) (1 + 2e cos φ + e2 ), (7.148)
P 1 − e2

285
e também
GM2 GM22
= . (7.149)
r (M1 + M2 )r
Além do que, pela terceira lei de Kepler

2π 2 GM23
( ) = , (7.150)
P (M1 + M2 )2 a31

obtém-se
1 2 GM2
V + = β cos φ + Constante, (7.151)
2 1 r
onde foi definido
GM22 (M1 + 2M2 ) e
β≡ . (7.152)
(M1 + M2 )2 a1 (1 − e2 )

Note que o teorema do virial implica que só mais uma nova variável apareceria se
usarmos o redshift gravitacional e o efeito Doppler, ambos de segunda ordem. Contudo,
note -se que a dependência temporal na Eq.(7.151) é exatamente a mesma daquela do
termo de primeira ordem K cos ω cos φ na Eq.(7.144). Mais peculiar ainda, note que
para movimento elı́ptico o parâmetro β não é mensurável! E então, como fica esta
questão ?
Felizmente, a relatividade geral salva a gente desta ‘encrucilhada’ ! A órbita não é
exatamente uma elipse. Ela ‘deriva’ ou precessiona! com o avanço do periastro sendo
dado por
6πGM2
ω̇ = . (7.153)
a1 (1 − e2 )P c2
A média de ω̇ é ∼ 4.20 por ano para o pulsar binário. Este valor pode comparar-se
00
aos ∼ 43 por século para o planeta Mercúrio! Assim, se fizermos ω −→ ω0 + ωt
na Eq.(7.144), teremos agora quatro combinações trigonométricas de φ e ω̇t indepen-
dentes, que variam com o tempo. Portanto, mediante observações do PSR 1913 + 16,
em uma escala temporal de anos poderá se separar K, ω0 , ω̇ e β. Em particular, ω̇ e
β envolvem duas combinações diferentes dos quatro parâmetros M1 , M2 , a1 e seni, a
partir da função de massa, e a1 seni. Em conclusão, medições de ω̇ e β permitem uma
solução completa para os parâmetros do sistema binário.
Agora, considere a Eq.(7.153) para Ṗ de um sistema binário. Uma vez que todos
os parâmetros orbitais são conhecidos, podemos predizer um valor para Ṗ . Se este
concordar com o valor medido, teriamos por força confirmado a existência das ondas
gravitacionais !!
Uma ampla gama de outros efeitos astrofı́sicos poderiam também produzir uma
variação do perı́odo orbital do pulsar binário com magnitude similar á observada.
Contudo, a moderna análise de todos estes possı́veis efeitos tem demonstrado que ou
eles não agem neste sistema ou sua contribuição é excessivamente pequena como para
concorrer com as predições da relatividade geral [ver Taylor (2003) para uma revisão
completa desta questão fundamental].

286
Figura 7.8: Parâmetros da órbita do Pulsar Binário (PSR 1913 + 16) medidos pelo grupo
de J. H. Taylor. T0 é a época, ou origem do tempo para as medições . Os números entre
parentesis representam a incerteza nos últimos dı́gitos. (Tabela original publicada por
Clifford M. Will em ‘The Living Reviews on General Relativity’).

Na medida em que a precisão do ‘timing’ melhora, resulta possı́vel medir outros efeitos
relativı́sticos. Dentre estes, o atraso-temporal de sinais que atravessam a órbita em
caminho à Terra, são efeitos hoje já medidos com sondas espaciais no sistema solar.
Além disto, existem vários desvios periódicos pós-Newtonianos do movimento elı́ptico,
ainda não verificados no sistema solar. Na relatividade geral cada um destes termos
contém uma combinação desconhecida de M1 , M2 , a1 e seni. Enquanto mais e mais
destes termos sejam medidos (hoje sabemos quantos destes termos foram efetivamente
medidos) e se eles concordam com as predições da relatividade geral, então o argu-
mento em favor da relatividade geral, e das ondas gravitacionais, em particular, se
tornará cada vez mais incontestável.

O pulsar binário tem sido observado durante mais de trinta anos por J. Taylor e
seus colaboradores, sendo a precisão das observações cada vez maior. O valores atuais
dos vários parâmetros do sistema aparecem na Tabela apresentada na Figura 7.8. A
grandeza γ, um dos parâmetros pós-Newtonianos, está relacionada com β, o segundo

287
parâmetro PPN, através da condição
βP (1 − e2 )
γ≡ . (7.154)
2πc2
O efeito de atraso temporal e os efeitos orbitais pós-Newtonianos são muito bem
conhecidos hoje (ver Tabela da Figura 7.8). Note, entretanto, que a Eq.(7.153) pode
rescrever-se como
6πGM2 seni
ω̇ = (7.155)
a1 seni(1 − e2 )P c2
5/3
3G2/3 (M1 + M2 )2/3


= (7.156)
(1 − e2 )c2 P
Usando o valor medido de ω̇ dado na Tabela da Figura 7.8, junto com os valores de
P e e, encontramos que
M1 + M2 = 2.8278(7) M . (7.157)
Ainda podemos escrever os parâmetros γ, seni, e Ṗ , que são determinados com muita
menor precisão, inserindo os valores de P , e, a1 seni, e M1 + M2 . A Eq.(7.154) se
transforma em
 1/3
G2/3 M2 (M1 + M2 )e P
γ= = (0.0007344 s)M2 (2.8278 + M2 ), (7.158)
(M1 + M2 )4/3 2π
com M2 medido em massas solares (M ). A terceira lei de Kepler, Eq.(7.150), produz
 2/3
2π (M1 + M2 )2/3 a1 seni 1.019
seni = 1/3
= , (7.159)
P G M2 M2
enquanto que a Eq.(7.153) leva a

192πG5/3 M1 M2 f (e)
 
2π 5/3
Ṗ = − 5 1/3
) (7.160)
5c (M1 + M2 ) P
= −1.202 × 10−12 M2 (2.8278 − M2 ). (7.161)

Note que em ordem de magnitude, ∆P ∼ 10−4 s yr−1 . Considerando que o pulsar


binário está a quase 5 kpc de distância, é supreendente que a precisão do ‘timing’
permita, a todos nós, conferir a medição de um efeito tão pequeno! Tomando γ =
(0.00438 ± 0.000024) s, encontra-se da Eq.(7.158) que M2 = (1.41 ± 0.06) M , e
portanto da Eq.(7.157) M1 resulta ter o mesmo valor! Consequentemente, a Eq.(7.161)
prediz
s
Ṗ = −2.40 × 10−12 , (7.162)
s
em excelente concordância com o valor medido de (−2.30 × 10−12 ). Este resultado
fundamental é ilustrado na Figura 7.9.
Alcançado este momento, devemos fazer uma pausa para uma breve reflexão a respeito
da importância deste sistema para a validação das teorias da gravitação . Passaram-
se já mais de trinta anos de observações do PSR 1913 + 16, e apesar das inúmeras

288
Figura 7.9: Evolução da órbita do Pulsar Binário (PSR 1913 + 16): Deriva cumulativa
do tempo (s) de passagem pelo periastro durante 25 anos de observação , comparada
com a predição da relatividade geral para a evolução da mesma grandeza como devida
a perda de momento angular por emissão de OGs. (Versão tomada do original do site
http://astrosun2.astro.cornell.edu/academics/courses/astro201/psr1913.htm).

289
alternativas existentes para se entender sua evolução , a teoria da relatividade geral
parece ser todo o que se necessita para explicar sua dinâmica. A fórmula de quadrupólo
para a emissão de ondas gravitacionais tem sido confirmada com um erro de  0.1%!
Em conclusão: a demonstração direta da existência das OGs abrirá uma nova janela
para o Cosmo, de modo semelhante ao sucedido com a verificação em laboratório da
existência das ondas eletromagnéticas previstas por Maxwell e descobertas por Hertz.
Neste sentido, a ‘fortuna’ dos astrofı́sicos relativistas não parece ter chegado a seu
fim: em 2003 foi confirmada a observação de um novo pulsar verdadeiramente binário,
formado por duas estrelas de nêutrons! Este sistema conhecido como PSR J0737-3039
A,B, conforme já referido anteriormente, constitui-se num laboratório ainda melhor
para a realização de testes das teorias da gravitação . A Natureza parece continuar a
nos providenciar O Laboratório Ideal!

7.9 Astronomia de ondas gravitacionais

Retomando nossa analogia inicial entre o eletromagnetismo e a gravitação , vejamos


o que as observações de OGs poderão nos dizer a respeito do Universo.
Primeiramente, note que contrário às ondas eletromagnéticas (OEMs) que são ab-
sorbidas e reemitidas por corpos materiais, as OGs sendo vibrações do próprio S-T
não podem ser absorvidas pela matéria já que esta segue o “caminho” definido pela
geometria do S-T. Elas atravessam praticamente todo sem qualquer absorção pelo
meio material. Além disto, o comprimento tı́pico de uma OEM é sempre muito menor
do que o tamanho da fonte que a emite. Contrário a isto, as OGs possui comprimentos
de onda caracterı́sticos que se comparam ou resultam ser maiores do que a escala fı́sica
das fontes que as emitem. Em consequência, as OGs não podem ser usadas para formar
imágens das fontes, mas podem ser o análogo do som (onda de natureza longitudinal),
e podem portanto fornecer uma descrição estereofônica da dinâmica da fonte graças a
seus dois modos de polarização (transversais á direção de propagação da onda).
Ainda, os grávitons num surto de OGs são coerentes em fase; enquanto que os fótons
das OEMs normalmente são incoerentes em fase. Isto se deve ao fato que cada gráviton
é produzido a partir do movimento global da matéria da fonte ou da curvatura do
espaço-tempo, enquanto que os fótons são gerados por eventos independentes, difer-
entes que envolvem átomos, ı́ons e elétrons. Vistas desta maneira, as OGs são similares
à luz laser! Os detectores de OGs tiram proveito desta importante propriedade fı́sica.
Uma consequência extremamente importante desta coerência é que a grandeza direta-
mente observável da radiação gravitacional é a deformação (‘strain’) h, que cai com o
inverso da distância como 1/r. Por isso, medir OGs coerentes é o análogo de medir um
campo eletromagnético coerênte do tipo 1/r. Esta queda comparativamente lenta com
a distância r, tem um tremendo impacto sobre a ‘Ciência’ a ser feita com OGs: Dobrar
a sensibilidade de um detector significa dobrar a distância até as fontes que podem ser

290
detectadas. Isto aumenta enormemente, num fator de 8, o volume do universo para o
qual as fontes são mesuráveis.
Finalmente, em muitos casos a astronomia eletromagnética está baseiada em um im-
ageamento profundo de pequenos campos de visada. Assim, os observadores obtém
uma grande quantidade de informação sobre as fontes em uma pequena parcela do
céu. Oposto a isto, a astronomia de OGs será uma ‘affair’ de quase o céu inteiro! Os
detectores de OGs tem uma cobertura de quase 4 π stereoradianos de sensibilidade
a eventos no céu. Isto significa que um detector moderno tem uma capacidade não
muito boa de localizar uma fonte no céu com base nos padrões astronômicos, mas
ao mesmo tempo isto significa que qualquer fonte no céu poderá ser detectável, não
somente aquela para o qual o instrumento está apontado! Este contraste entre sen-
sibilidade de céu inteiro mas uma pobre resolução angular dos observatórios de OGs,
e a resolução angular, pontuada dos telescópios é muito semelhante ao contraste de
resolução angular do ouvir e enxergar, o que reforça ainda mais a utilidade da analogia
das OGs com o som.
Para terminar, lembramos que o espectro de frequências (fGW ) das OGs divide-se, na
perspectiva de sua detectabilidade no futuro ‘próximo’, em a) OGs de alta frequência,
se
10 Hz < fGW < 104 Hz, (7.163)
que corresponde a banda de sensibilidade de observatórios de OGs já opera-
cionais como o ‘Laser Interferometric Gravitational-Wave Observatory’ (LIGO,
http://www.ligo.caltech.edu/LIGO web/about/), e seus similiares VIRGO, GEO-600,
TAMA-300, e AIGO (também já operacionais), e b) OGs de baixa frequência, se

10−1 Hz < fGW < 10−5 Hz, (7.164)

que corresponde a banda de sensibilidade de observatórios planejados para serem colo-


cados em órbita seguindo a Terra ao redor da Sol, tal como o ‘Laser Interferometric
Space Antenna’ (LISA). Salientamos ainda que esta frequência caracterı́stica da OG
emitida por uma fonte especı́fica pode ser estimada usando o inverso da escala tem-
poral dinâmica do sistema sob consideração , isto é:

fGW (Hz) ∼ {Tdin (s)}−1 . (7.165)

As fontes mais alvejadas para detecção variam desde a coalescência de sistemas


binários de estrelas de nêutrons, buracos negros, ou combinações entre estes, exp-
losões de supernova, colapso gravitacional de estrelas massivas, modos quase-normais
de estrelas de nêutrons e também de buracos negros, transições de fase em estrelas de
nêutrons, OGs relı́quias do Big Bang, transições de fase primordias, coalescência de
buracos negros en núcleos ativos de galáxias (AGNs), etc., e conforme sugerido pela
primeira vez no Capı́tulo 6 deste PMC, a novidosa predição da detectabilidade das
OGs emitidas durante a fase inicial de aceleração dos pulsáres acelerados observados
hoje perambulando pela na nossa galáxia.

291
7.10 Exercı́cios
1. Usando a Eq.(??) e a condição da Eq.(??), obter a Eq.(7.106).
2. Calcule a potência total radiada por um pulsar de uma massa solar, e 10 km de
raio, que é impulsado do repouso até alcançar uma velocidade final de 10.000
km/s em 0.02 µas de distância. Qual é a amplitude do sinal de OG emitido neste
processo? Qual sua frequência?
3. Mostre que usando a relação para a órbita elı́ptica

2EJ 2
e2 = 1 + , (7.166)
G2 µ3 M 2
se conclue que a emissão de OGs tende a circularizar uma órbita elı́ptica ! Isto
é, mostre que de/dt < 0.
4. Verifique a relação expressa na Eq.(??) .
5. usando a relação de Peters & Mathews (1964)[6], descrita na seção do pulsar
binário, i.e., Eq.(7.125), determine a escala temporal para a coalescência ou co-
lisão entre as estrelas componentes da binária de Taylor & Hulse devido á emissão
adiabática de OGs.
6. Sugere-se ao leitor mais dedicado ao estudo deste curso completar as passagens
analı́ticas formais faltantes no processo estudado na Seção Ondas gravita-
cionais emitidas por massas aceleradas: Pulsares

7.11 Referências bibliográficas


[1] S. L. Shapiro, S. A. Teukolsky, White dwarfs, black holes and neutron stars: The
Physics of compact objetcs. Wiley & Sons, New York (1983)
[2] R. d’Inverno, Introducing Einstein’s Relativity, Clarendon Press, Oxford, UK
(1992)
[3] Ehud B. Segalis, Amos Ori, Phys. Rev. D 64, 064018 (2001)
[4] Norichika Sago, Kunihito Ioka, Takashi Nakamura, Ryo Yamazaki, Phys. Rev. D
70, 104012 (2004)
[5] V. Braginsky, K. S. Thorne, Nature 316, 610-612 (1985)
[6] P. C. Peters, J. Mathews, Phys. Rev. 131, 435-439 (1963)
[7] J. H. Taylor, J. M. Weisberg, RELATIVISTIC BINARY PULSAR B1913+16:
THIRTY YEARS OF OBSERVATIONS AND ANALYSIS, Proceedings of Aspen
Winter Conference on Astrophysics: Binary Radio Pulsars, Aspen, Colorado, 11-
17 Jan. (2004)
[8] H. J. Mosquera Cuesta, arXiv:0711.3046 [astro-ph] (2007)

292
Capı́tulo 8

Astropartı́culas I

Sergio E. Jorás1

8.1 Introdução

Por que estudar partı́culas elementares em um curso de Cosmologia?


Um resultado experimental bastante conhecido é que o universo está em processo de
expansão. Tal como um gás ideal, ele se esfria à medida em que se expande. Assim, se
o estudarmos em épocas cada vez mais antigas, ele apresentará temperaturas cada vez
maiores. Temperaturas altas correspondem a grandes valores de energia disponı́vel, e
por isso é comum alternar-se entre as duas descrições. Por exemplo, em um certo in-
stante tH , quando a radiação presente no universo atinge uma temperatura de 104 K,
a energia média destes fótons é de E ≈ kB T ≈ 13, 6 eV , ou seja, suficiente para a
ionização do átomo de hidrogênio. 2 Assim, para instantes anteriores a tH , podemos
pensar que o universo era composto (basicamente) por núcleos do átomo de hidrogênio
(prótons) e elétrons dissociados uns dos outros, além, claro, de fótons. O que acontece
se retocedermos no tempo, aumentando ainda mais a temperatura da radiação? É nat-
ural imaginarmos que as partı́culas “elementares” se dissociem em seus constituintes,
tal qual o átomo de hidrogênio em próton e elétron. Assim, o Universo primordial
pode ser visto como um acelerador de partı́culas extremo, onde energias inimagináveis
foram de fato atingidas. A experiência, claro, não pode ser repetida como em um
1
Afiliação : Instituto de Fisica, Cidade Universitaria, UFRJ, Caixa Postal 68528 21945-970 Rio de
Janeiro, RJ.
2
Um estudo mais rigoroso leva em conta o espectro dos fótons, ou seja, sua distribuição em relação
à energia, e mostra que tH é, na verdade, um pouco posterior ao instante que este argumento ingênuo
indica.

293
laboratório terrestre, mas a quantidade de informação adquirida não pára de crescer
ainda hoje, mesmo depois de bilhões de anos de realizada.
Na seção 8.2 veremos como o estudo das forças forte e fraca propiciaram a classi-
ficação das partı́culas elementares segundo o modelo padrão adotado atualmente. Na
seção 8.3, estudaremos os elementos básicos que nos ajudarão a entender a abordagem
matemática da classificação padrão. Na seção 8.4 faremos uma rápida introdução à
Teoria de Campos, que é o formalismo moderno para descrição das interações. To-
dos os aspectos serão colocados em conjunto na última seção deste capı́tulo, onde
estudaremos a história térmica do universo — veja também o capı́tulo 2.

8.2 Modelo Padrão de Partı́culas Elementares

Nesta seção estudaremos as forças nucleares e os métodos usados para classificar dois
importantes grupos de partı́culas elementares: os quarks e os léptons.

8.2.1 A força forte

Em 1932, experiências de Chadwick e Joliot-Curie mostraram que os núcleos atômicos


eram formados por prótons e nêutrons. A força forte, atuando entre eles, impede
que o núcleo se desfaça sob ação da força eletromagnética. Estas duas partı́culas
apresentam massas similares entre si mas se diferenciam, principalmente, pela carga
elétrica existente no primeiro. Se lembrarmos que a força eletromagnética entre dois
prótons é cerca de 1000 vezes menor que a força forte entre eles, seremos levados
a admitir a existência de uma simetria, ainda que não exata, entre eles. Inspirados
no elétron, que pode se apresentar em dois estados de spin, conjecturou-se que uma
partı́cula denominada núcleon poderia manifestar-se como um próton ou um nêutron,
dependendo do seu estado de isospin. Estas partı́culas formavam, então, um par ou
dubleto !
p+
. (8.1)
n
Este novo número quântico, isospin, poderia assumir os valores ±1/2 e era conservado
pela interação forte. Em 1947, no entanto, o pı́on – considerado então o mediador da
força forte – foi descoberto pela equipe de Occhialini e Powell, com a participação
fundamental do fı́sico brasileiro Cesar Lattes. Nos anos seguintes, outras partı́culas
que compartilhavam a interação forte foram descobertos, e o núcleon perdeu seu lugar
de destaque no quadro das partı́culas elementares. Algumas destas partı́culas apresen-
tavam meia-vidas extremamente longas (Σ− , por exemplo), apesar de serem relativa-
mente massivas. Não se compreendia porque elas não decaı́am em outras mais leves
através de reações perfeitamente plausı́veis do ponto de vista energético, por exem-
plo. Em 1953, Gell-Mann e Nishijima [1] sugeriram uma explicação para a mı́riade de

294
Q B S Y
u +2/3 1/3 0 1/3
d -1/3 1/3 0 1/3
s -1/3 1/3 -1 -2/3

Tabela 8.1: Números quânticos – carga elétrica, bariônico, estranheza e hipercarga, re-
spectivamente – dos três quaks mais leves.

partı́culas “elementares” observadas e para a meta-estabilidade de algumas delas. A


numerosa variedade de partı́culas poderia ser explicada nos mesmos moldes da tabela
de elementos atômicos de Mendeleiev, que descrevia todos os elementos quı́micos a
partir de combinações com diferentes números de prótons e nêutrons. Isto poderia ser
feito aqui, ampliando-se a simetria de isospin usada anteriormente com o núcleon. Os
hádrons – partı́culas que interagem através da força forte – seriam formados a partir
de combinações de 3 elementos básicos:
 
u
 d  . (8.2)
 

A meta-estabilidade, por sua vez, poderia ser explicada através da existência de um


novo número quântico. Da mesma forma que uma reação nuclear deve conservar o
momento linear P ou a carga elétrica Q dos reagentes, a conservação desta nova
quantidade impedia (ou dificultava) o decaimento de algumas partı́culas, aumentando
assim sua vida média. Este número quântico recebeu o nome de “estranheza”3 S. Para
levar em consideração também a conservação do número de bárions (ou bariônico) B,
definiu-se a hipercarga Y = B + S. Como um bárion apresenta, obviamente, B = ±1
e Q = ±e, cada um destes novos elementos básicos deve ter B = ±1/3 e Q = ±1/3e.
Veja a tabela 8.1. A suposição de uma estrutura mais fundamental colocou ordem no
zoológico de partı́culas que começava a se formar na década de 60. Suas caracterı́sticas
também poderiam ser facilmente explicadas admitindo-se que eram compostas por 2
ou 3 elementos básicos, definindo assim os mésons e os bárions, respectivamente:
De fato, em 1967, experiências no SLAC (Stanford Linear Accelerator) indicaram
que os prótons e nêutrons pareciam ter estruturas internas. Já sabia-se que colisões
p − p (10 GeV ) produziam um grande número de pı́ons praticamente colineares com
a direção da colisão, o que indicava que prótons eram formados por muitas partı́culas
praticamente livres em relação à força forte. O problema é que, no SLAC, elétrons
(20 GeV ) eram espalhados inelasticamente por prótons em ângulos muito grandes,
como se colidissem com poucas partı́culas carregadas eletricamente. Para conciliar
ambas as experiências, Bjorken e Feynman sugeriram que o próton era formado por
uma coleção de partı́culas eletricamente carregadas – os pártons e, possivelmente,
3
Do inglês strangeness.

295
MÉSONS BÁRIONS
π+ : ud¯ p+ : uud
π− : dū n: ddu
q
0
π : 1
(uū ¯ Σ+ :
− dd) uus
2
.. ..
. .

Tabela 8.2: Composição de alguns mésons e bárions.

outras partı́culas neutras responsáveis pelas suas interações. Um elétron com energia
suficiente poderia arrancar um párton do núcleo, e os pedaços da colisão se mate-
rializariam como jatos de hádrons. No referencial do projétil, a dilatação temporal
diminui a taxa de interação entre os pártons, o que justifica considerá-los pratica-
mente livres durante o processo de colisão. Este comportamento se traduz experimen-
talmente através da análise das seções de choques, que diferiam daquelas esperadas
para partı́culas puntiformes [2]:
   
dσ dσ
= |F (~q)|2 , (8.3)
dΩ exp dΩ punt
onde q é o momento linear transferido pelo projétil e o fator de forma F (~q) indica a
distribuição de carga ρ(~x) no alvo (se ignorarmos seu recuo):
Z
F (~q) = ρ(~x) e−i~q·~x d3 x . (8.4)

A estrutura do próton pode ser verificada experimentalmente através da generalização


relativı́stica do fator de forma definido acima. Sendo ~x a fração do momento linear do
próton carregada por cada párton, o fator de forma relativı́stico F2 (x) apresentaria
um pico em x = 1 se o próton fosse realmente elementar (ou composto por apenas
um párton). Sendo composto por 3 pártons livres, F2 (x) deveria apresentar um pico
em x = 1/3. A interação entre eles, no entanto, redistribui o momento, o que alarga
a curva do fator de forma, mas ainda não reproduz o comportamento observado. Este
só pode ser explicado admitindo-se a existência de um mar de partı́culas lentas. Os
3 pártons podem ser comparados aos elétrons de valência dos átomos. Estes elétrons
definem as ligações quı́micas, mas sua existência e distribuição só podem ser explicadas
se levarmos em consideração os elétrons localizados nas “camadas” inferiores.
O modelo de pártons, no entanto, é incompleto, pois ignora o papel dinâmico dos
intermediários da força forte, os glúons, que podem carregar cerca de 50% do momento
linear total do próton. Um efeito previsto pelo modelo de pártons e contrariado pela
experiência era a colinearidade entre o jato hadrônico resultante da colisão e − p e o
fóton virtual trocado pelo elétron e pelo párton interagente. Ou seja, não era possı́vel
explicar a existência de jatos com momento linear transversal não nulo.
Sabe-se hoje que a simetria proposta por Gell-Mann e Zweig é apenas aproximada, e
fornece bons resultados porque os elementos básicos usados correspondem aos 3 quarks

296
Figura 8.1: Fatores de forma relativı́sticos F2 (q) em função da fração x do momento do
próton carregada por cada partı́cula constituinte, para diversos modelos de composição
do próton: (a) sem estrutura interna; (b) composto por 3 partı́culas elementares livres;
(c) por 3 partı́culas interagentes e (d) como o anterior, mas na presença de um mar de
quarks.

mais leves, cujas massas são muito menores que a dos outros. Aliado aos resultados
animadores do modelo de pártons, este modelo abriu o caminho para a classificação
das partı́culas elementares descrita na seção 8.2.3.

Resta ainda um ingrediente fundamental: Todos os quarks são férmions, isto é, têm
spin fracionário, enquanto os bárions podem ter spin inteiro (sendo classificados então
como bósons) ou não. A conseqüência básica desta caracterı́stica4 e que nos interessa
é que os férmions obedecem à estatı́stica de Fermi-Dirac — enquanto que os bósons
obedecem à estatı́stica de Bose-Einstein; daı́ seus nomes. Ou seja, os férmions seguem
o Princı́pio de Exclusão de Pauli: não podem ocupar o mesmo estado quântico simul-
taneamente, ao contrário dos bósons, que podem formar os chamados Condensados
de Bose-Einstein, estado no qual todas as partı́culas estão no mesmo estado funda-
mental. A existência da ressonância ∆++ , formada por três quarks up, apontou um
problema: como três quarks idênticos podem ocupar o estado fundamental, sendo
férmions? A saı́da foi acrescentar um novo número quântico, de tal forma que cada
quark ocupasse um estado diferente, obedecendo, assim, o Princı́pio de Exclusão de
Pauli. Dito de outra forma, o estado fundamental é triplamente degenerado. Este novo
número quântico recebeu o nome de cor, que, obviamente, não tem relação alguma
com as faixas do espectro eletromagnético visı́vel. Assim, na ressonância ∆++ , um
quark ocupa o estado vermelho, outro o estado azul e outro, o verde. O conjunto como
um todo — tal qual um disco de Newton — é branco: ou seja, a ressonância ∆++
não possui cor. Mésons, formados por um quark e um anti-quark, também devem
ser brancos. Para isso, deve-se sempre agrupar uma cor com sua anti-cor: vermelho
4
Ver Teorema Spin-Estatı́stica [3].

297
Figura 8.2: Criação de um par quark-antiquark na tentativa de separação do par já
existente.

com anti-vermelho, por exemplo. Quarks são, portanto, eletricamente carregados e


coloridos.
Como veremos mais adiante, a força forte entre dois quarks é mediada pela troca
de cores entre eles, ou seja, por 8 glúons bicolores (que são eletricamente neutros).
Glúons, portanto, interagem entre si – ao contrário de fótons, que apesar de mediarem
a interação eletromagnética, são neutros. Além disso, a intensidade da interação tem
um comportamento oposto ao esperado: diferentemente do que acontece com outras
partı́culas, a interação entre quarks não cai com a distância; pelo contrário, aumenta!
Seu valor só tende a zero quando a distância entre elas também o faz – a denomi-
nada liberdade assintótica dos quarks. Figurativamente, pode-se comparar a interação
quark-antiquark com a força exercida por uma mola entre duas massas: quanto maior
a distensão, maior será a força de atração. De uma maneira ilustrativa, pode-se dizer
que a energia armazenada na mola dará origem a um novo par quark-antiquark quando
atingir um valor alto o bastante (veja Figura 8.2). Assim, não é possı́vel observar um
quark isoladamente, por maior que seja a energia do processo de colisão. Pode-se fazer
uma analogia do par quark-antiquark com um ı́mã, cujos pólos não podem ser sepa-
rados. Pelo mesmo motivo, não é possı́vel observar nenhuma partı́cula “colorida” na
natureza: todos os quarks se agrupam de forma a formar partı́culas “brancas”. Esta
caracterı́stica é fundamental, já que a necessidade deste novo número quântico é indi-
reta, não tendo sido observado diretamente. David Gross, Frank Wilczek e H. David
Politzer receberam o Prêmio Nobel de 2004 pelo desenvolvimento da Cromodinâmica
Quântica, que apresenta naturalmente o conceito de liberdade assintótica.

8.2.2 A força fraca

Os lentos decaimentos do pı́on π − e do muon µ− , com meia-vidas de 10−8 s e 10−6 s,


respectivamente, indicaram a existência de uma outra força nuclear, mas de intensi-
dade muito menor que a da forte. O pı́on, em particular, não pode decair através da
interação forte, já que é o hádron de menor massa que existe.
A equação de Dirac, que descreve partı́culas de spin 1/2, introduziu o conceito de
helicidade (também conhecida como quiralidade) como um novo número quântico

298
conservado. A helicidade é definida como a projeção do spin na direção do momento
linear da partı́cula em questão. Para partı́culas sem massa, ela só pode assumir os
valores ±~/2. De acordo com o sinal, diz-se que a partı́cula é de “mão direita” (helici-
dade positiva) ou “mão esquerda” (negativa). Pode-se mostrar que a interação eletro-
magnética também conserva a helicidade em altas energias. A simetria entre partı́culas
de helicidades opostas é chamada de paridade. A interação fraca, no entanto, quebra
esta simetria: apenas neutrinos de mão esquerda (e anti-neutrinos de mão direita)
se acoplam a léptons carregados através desta interação. Os (anti-)neutrinos com he-
licidade “errada”, portanto, não podem interagir e não são observados. Até hoje as
experiências concordam com este modelo, mas ele só é válido para o caso de neutrinos
sem massa. De outra forma, poder-se-ia realizar uma transformção de Lorentz para um
referencial onde o momento do neutrino teria o sinal oposto, e também a helicidade.
Isto seria equivalente a transformar um neutrino de mão esquerda em um de direita,
e vice-e-versa.
O passo natural que se seguiu foi, como antes, a ampliação da simetria através da in-
clusão do quark c, de “charmoso” 5 . De fato, o estudo de colisões elétron-pósitron con-
firmou sua existência em 1974. 6 O novo quark c foi necessário para explicar alterações
na esperada estrutura de jatos ao atingir-se a energia necessária para sua criação. Os
férmions conhecidos até então podiam ser dispostos em 2 famı́lias de dubletos7 :
! !
e− µ−
νe νµ
L L
, (8.5)
! !
u c
d s

onde o ı́ndice L lembra que apenas estados de mão esquerda participam da in-
teração. Transições entre os membros de cada dubleto acontecem através da força
fraca. Esperava-se, portanto, transições apenas entre os quarks u e d e entre c e s.
Havia, no entanto, um contra-exemplo:

K + (us̄) −→ µ+ ν̄µ . (8.6)

Foi necessário, então, admitir que a interação fraca acoplava quarks “rotacionados”:
! !
u c
e , (8.7)
d0 s0
5
Do inglês charm.
6
O leitor atento pode-se perguntar como se obtém quarks a partir da colisão de elétrons, que não são
formados por eles. Na verdade, o uso de partı́culas elementares como elétrons facilita muito os cálculos
e a interpretação dos resultados: a aniquilação de um par e− − e+ pode gerar energia suficiente para a
criação de um par q − q̄ e daı́, jatos de hádrons.
7
E nos singletos de “mão-direita” e− −
R , µR .

299
onde 
0
 d =
 d cos θc + s sin θc
(8.8)
 0
s = −d sin θc + s cos θc .

A variável θc , conhecida como ângulo de Cabibbo, foi introduzida em 1963 para


explicar o decaimento de partı́culas estranhas, e é determinado experimentalmente:
θc ≈ 13o . A existência desta rotação não foi detectada anteriormente porque cos2 (θc ) 
sin2 (θc ). Rotações totalmente equivalentes poderiam ter sido definidas no setor (u, c)
ou em todos os 4 quarks simultaneamente. Este mixing acontece porque os autoestados
da interação fraca (d0 , s0 ) não são autoestados de massa. No setor leptônico, por outro
lado, isto não pode acontecer se os neutrinos forem de fato, não massivos.
Em 1977, com a descoberta do quark b, de “baixo” 8 , a estrutura de dubletos dos
quarks passou a indicar a existência de um sexto integrante, o quark t, de “topo” 9 .
O mecanismo de mistura (ou rotação) de Cabibbo foi então estendido por Kobayashi
e Maskawa para descrever interações entre todos eles. Os termos Uud , Ucs e Utb desta
matriz (denominada CKM ) são claramente dominantes. Em particular, |Ucs | ≈ 0.97
indica que partı́culas charmosas decaem, preferencialmente, em partı́culas estranhas.
Uma diferença fundamental existe na matriz CKM : ela apresenta elementos com-
plexos que não podem ser eliminados, que implicam a violação da simetria CP (carga
e paridade). O operador C inverte o sinal da carga da partı́cula, enquanto que o op-
erador P equivale à reflexão em um espelho, invertendo o sinal da helicidade. Assim,
a aplicação CP leva uma partı́cula à anti-partı́cula correspondente. Seria natural es-
perar que ambas se comportassem da mesma maneira, ou seja, a simetria CP dveria
ser respeitada pela natureza. Mas, na verdade, Kobayashi e Maskawa propuseram a
existência da terceira geração de quarks para explicar a violação de CP já detectada
9 anos antes, no decaimento do káon neutro K0 (ds̄), que ocorre em taxa ligeiramente
diferente do K̄0 . Esta assimetria foi fundamental para que o número de bárions se
tornasse ligeiramente maior do que o de anti-bárions no universo primordial.

8.2.3 A classificação padrão

Aqui faremos uma rápida descrição da classificação atual das partı́culas elementares,
antecipando alguns resultados que serão discutidos mais adiante.
As partı́culas elementares podem ser classificadas em dois grandes grupos: os léptons
e os hádrons. Pode-se ainda falar em um terceiro grupo, formado pelos chamados
campos de gauge, responsáveis pela propagação das interações entre as partı́culas dos
dois primeiros grupos. A caracterı́stica fundamental dos léptons é não interagirem
através da força nuclear forte. Os léptons são formados por três famı́lias (ou sabores),
8
Do inglês bottom.
9
Do inglês top.

300
cada uma com dois participantes: a primeira, mais leve, é formada pelo elétron (e)
e pelo neutrino a ele associado (νe ). A segunda, pelo muon (µ) e seu neutrino (νµ );
a terceira, pelo tauon (τ ) e seu neutrino (ντ ). Os primeiros membros de cada famı́lia
tem cargas elétricas iguais entre si, enquanto que os outros são, como o próprio nome
indica, neutros.
! ! !
e µ τ
, eR , µR , τR (8.9)
νe νµ ντ
L L L

Os membros da primeira linha dos dubletos são massivos, e há fortes indı́cios exper-
imentais de que os neutrinos também o sejam. Os seis quarks existentes receberam
nomes exóticos como up, down, charm, strange, top e bottom e também são ordenados
em 3 famı́lias, em ordem crescente de massa:
! ! !
u c t
(8.10)
d s b

Os membros da primeira linha têm carga elétrica positiva, igual em módulo a 2/3 da
do elétron — que não é, portanto, a carga elétrica fundamental — e os da segunda
linha, carga negativa igual a −1/3e. Os hádrons são formados pelos quarks, sempre em
grupos de dois ou três, caracterizando os chamados mésons e bárions, respectivamente.
Os bárions presentes na matéria comum — prótons e nêutrons — são formados por
combinações apenas dos dois quarks mais leves. Assim, para conseguirmos uma carga
elétrica igual (em módulo) à do elétron para o próton, temos que combinar dois quarks
up e um down. Para anular a carga elétrica total do nêutron, basta juntarmos um up
e dois down.
Reações nucleares devem conservar os chamados “bons” números quânticos, como a
carga elétrica total Q e o número de léptons (ou leptônico) L. Por exemplo, um nêutron
(Q = 0, L = 0) decai em um próton (Q = +1, L = 0) emitindo um elétron (Q = −1,
L = 1) e um anti-neutrino do elétron (Q = 0, L = −1). Deste modo, podemos prever
a existência de um anti-neutrino ao invés de um neutrino como sub-produto desta
reação.

n −→ p + e + ν̄e
Q : 0 = +1 −1 +0 (8.11)
L: 0 = 0 +1 −1

Os campos de gauge, como já mencionado, são responsáveis pela interação entre os
léptons e hádrons. Assim, a força eletromagnética é intermediada pelo fóton (γ), en-
quanto que a força nuclear fraca o é pelos bósons vetoriais Z o e W ± . 10 O fóton, por não
10
Na verdade, como veremos mais adiante, pode-se descrever estas duas forças através do mesmo
formalismo matemático, o que significa que são apenas aspectos diferentes da mesma interação, conhecida
como eletrofraca [6]. O mesmo raciocı́onio nos leva a falar da força eletromagnética, mesclando seus
aspectos elétrico e magnético.

301
ter carga, não interage consigo mesmo e é o único bóson interagente sem massa. Já as
partı́culas responsáveis pela interação forte, os glúons, carregam 2 cores, e, portanto,
interagem entre si.
Até hoje, os léptons e os quarks não mostraram sinais de uma estrutura interna e, por-
tanto, até resultados em contrário, podem ser considerados partı́culas verdadeiramente
elementares ou fundamentais.

8.3 Elementos de Teoria de Grupos

Em Mecânica clássica, é usual investigar as simetrias de um sistema frente a mudanças


em seus graus de liberdade externos: a invariância de um sistema sob translações
espaciais leva à conservação do momento linear; sob transformações espaciais, à con-
servação da energia; sob rotações, à conservação do momento angular. Veremos na
Seção 8.4 que o mesmo raciocı́nio pode ser aplicado em Teoria de Campos. O que
poderemos aprender se investigarmos as simetrias dos graus de liberdade internos das
partı́culas elementares?
O tratamento rigoroso das simetrias encontradas em uma classificação das partı́culas
elementares pode nos fornecer mais do que uma simples justificativa estética. Um
estudo detalhado pode prever a existência de partı́culas ainda não observadas e, como
veremos mais tarde, indicar o caminho da unificação das forças fundamentais — que
deve ter sido percorrido pelo universo primordial.
Nesta seção veremos os ingedientes fundamentais de Teoria de Grupos, com ênfase
naqueles que nos serão úteis mais adiante. Referências especı́ficas [8, 9] podem ajudar
a preencher as lacunas aqui deixadas (veja também a Seção 12.9).

8.3.1 Definições

Um grupo G é um conjunto de elementos Ai que obedecem a uma regra de composição


adequada:

• a composição de dois elementos também é um elemento do mesmo grupo;


• a composição é associativa.

Os elementos neutro A0 , tal que

A0 · Ai = Ai · A0 = Ai , ∀Ai (8.12)

e inversos (Ai )−1 , tais que

(Ai )−1 · Ai = Ai · (Ai )−1 = A0 , ∀Ai (8.13)

302
são obrigatórios em um grupo. Se a composição de quaisquer dois elementos de um
grupo independe da ordem destes elementos, isto é, se

Ai · Aj = Aj · Ai ∀{Ai , Aj } ∈ G , (8.14)

então o grupo G é dito comutativo ou abeliano. O número de elementos é a ordem


do grupo. Um grupo de ordem 1 é obrigatoriamente composto apenas pelo elemento
neutro. Um grupo de ordem 2 contém, além do elemento neutro, apenas um outro
elemento, que portanto deve ser sua própria inversa. Dois elementos pertencentes a
grupos de ordem 2 já foram mencionados: os operadoes de paridade P e carga Q. O
primeiro equivale à troca x → −x e o segundo, à troca q → −q. Os vários exemplos
concretos de um mesmo grupo abstrato são chamados realizações do grupo.
Um grupo é dito contı́nuo quando seus elementos são “próximos” entre si. Isto acon-
tece, por exemplo, quando os elementos do grupo são dados em função de um ou mais
parâmetros que variam continuamente: Aa,b,... , com a, b ∈ <. Se houver um número
finito de tais parâmetros, o grupo é finito. Se seu domı́nio de variação finito, o grupo
é chamado fechado. A regra de composição impõe relações entre os parâmetros de 3
elementos do grupo:

Aa = Ab · Ac ⇒ a = f (b, c) . (8.15)

Ou seja, a é uma função de b e c. Se esta função for infinitamente diferenciável e se


o parâmetro que fornece o inverso de um dado elemento for dado por uma função
analı́tica dele, ou seja,

Ab = (Aa )−1 ⇒ b = f (a) , onde f é uma função analı́tica, (8.16)

então G é dito um grupo de Lie.

8.3.2 Exemplos

Vamos nos concentrar em alguns grupos especı́ficos para fixar os conceitos introduzidos
e facilitar a explicação de novos.

• Multiplicação simples por escalar


Um exemplo simples de grupo de Lie é dado pela operação x0 = ax, a 6= 0. A
regra de composição dos elementos Aa ≡ a é a multiplicação simples: c = ba; o
elemento neutro é A1 = 1 e o inverso, (Aa )−1 = A1/a = 1/a.
• Translações
Este grupo é formado pelo conjunto de translações no espaço de coordenadas:
µ
x µ → x 0 = x µ + aµ . (8.17)

303
É fácil verificar que esta operação obedece às regras para formar, de fato, um
grupo. A regra de composição é a soma vetorial; o elemento neutro é o vetor nulo
e o inverso, −aµ .
A variação em uma função escalar destas coordenadas provocada por uma
translação infinitesimal é

δφ(xµ ) ≡ φ(xµ + aµ ) − φ(xµ ) (8.18)


≈ φ(xµ ) + aα ∂α φ(xµ ) − φ(xµ )
≈ aα ∂α φ(xµ ) . (8.19)

O operador aµ ∂µ é dito, portanto, o gerador de translações.


• O(2)
Este é o grupo formado pelas transformações lineares em um espaço bidimensional
(xy) que deixam a distância até a origem invariante:

x2 + y 2 : invariante . (8.20)

É claro que estamos tratando as rotações em torno do eixo perpendicular ao plano


em questão. Se x e y forem consideradas componentes de um vetor, podemos usar
notação matricial e escrever:
!
cos θ sin θ
~r 0 = O ~r , onde O = . (8.21)
− sin θ cos θ

A matriz O é ortogonal: OT = O−1 , como pode ser facilmente verificado. Seu


determinante só pode assumir os valores ±1, pois

1 = det(OOT ) = det O det OT = (det O)2 . (8.22)

As matrizes com determinante −1 formam um subgrupo à parte, composto pelos


mesmos elementos de SO(2) multiplicados pela matriz
!
1 0
P = , (8.23)
0 −1

que provoca uma reflexão em relação ao eixo x, e que corresponde à operação


de Paridade já mencionada e a uma simetria discreta: P 2 = 1. As matrizes com
determinante +1 formam o subgrupo11 SO(2). Este é claramente um subgrupo
de apenas um elemento, contı́nuo e fechado, pois θ ∈ [0, 2π]. Também é abeliano,
pois O(θ1 )O(θ2 ) = O(θ1 + θ2 ) = O(θ2 )O(θ1 ). As transformações pertencentes ao
subgrupo SO(2) podem ser levadas continuamente para a identidade, e, portanto,
pode-se falar de transformações infinitesimais, cujas expressões podem ser obtidas
11
Onde S vem do inglês special.

304
expandindo-se a Eq. (8.21) em torno de θ = 0. A variação em cada componente
do vetor ~r é escrita

δx = −y δθ (8.24)
δy = x δθ . (8.25)

A mudança em uma função qualquer F (~r) causada por uma transformação in-
finitesimal como esta é
∂F ∂F
δF = δx + δy
∂x ∂y
 
∂ ∂
= δθ x −y F . (8.26)
∂y ∂x
 
∂ ∂
O operador X ≡ − x ∂y y ∂x
é o operador – ou gerador – de transformações
infinitesimais do grupo O(2), e corresponde ao momento angular em torno do
eixo z.

• SU(1)
Vamos investigar uma transformação especı́fica em objetos complexos z, dada
pela operação z 0 = U (θ)z, onde U (θ) ≡ exp(iθ). Este operador é obviamente
unitário, isto é,
U † = U −1 . (8.27)

O leitor pode verificar que o conjunto de operadores U (θ), com θ ∈ [0, 2π] forma
um grupo abeliano, denominado U (1). Como tem o mesmo número de parâmetros
(1) e a mesma regra de composição do grupo O(2), diz-se que estes grupos são
isomorfos.
Este é um grupo de simetria presente na Mecânica Quântica, onde o parâmetro θ
representa a fase da função de onda, inobservável [7]. Como veremos mais tarde,
esta simetria também aparece no eletromagnetismo.

• O(3)
Esta é a generalização direta do grupo O(2) para três dimensões. Este grupo é
formado pelas transformações lineares que mantém invariante a distância até a
origem:
x2 + y 2 + z 2 : invariante . (8.28)

Em notação matricial12 :
(xj )0 = Ojk xk , (8.29)

onde O são matrizes 3 × 3 ortogonais. Se nos restringimos ao subgrupo SO(3),


como antes, podemos tratar as transformações infinitesimais e escrever O = 1+B,
12
Aqui, o espaço é euclideano e não há necessidade de mudar o andar dos ı́ndices.

305
onde B é uma matriz anti-simétrica com apenas três elementos infinitesimais
independentes (i ), correspondentes aos três ângulos de Euler [10]:
 
0 −3 −2
B =  3 0 1  (8.30)
 

2 −1 0

Analogamente ao caso anterior, podemos escrever a variação de uma função


F (x, y, z) sob ação de uma transformação infinitesimal como
      
∂ ∂ ∂ ∂ ∂ ∂
δF = 1 z −y − 2 z −x + 3 y −x F .
∂y ∂z ∂x ∂z ∂x ∂y
(8.31)
j k
Os operadores Xi ≡ −ijk (x ∂k − x ∂k ) são os operadores de momento angular
em cada direção, e obedecem a

[X1 , X2 ] = X3 , [X2 , X3 ] = X1 , [X3 , X1 ] = X2 . (8.32)

Este grupo, portanto, não é abeliano. Estas regras de composição mostram que há
um espaço vetorial, associado ao grupo SO(3), cuja base é dada pelos operadores
infinitesimais Xi . As regras da mutiplicação acima mostram que este espaço é
fechado e definem sua álgebra de Lie.
Qualquer matriz ortogonal pode ser escrita como a exponencial de uma matriz
anti-simétrica:

X 1
O(θ) = exp(θA) ≡ (θA)n . (8.33)
n=0
n!
Como os elementos de SO(3) são defindos por três parâmetros, qualquer matriz
O pertencente a este grupo pode ser escrita na forma
3
!
X
O = exp i θj Aj , (8.34)
j=1

onde podemos tomar


     
0 0 0 0 0 −1 0 1 0
1
A = −i  0 0 1  A2 = −i  0 0 0  A3 = −i  −1 0 0  .
     

0 −1 0 1 0 0 0 0 0
(8.35)
As matrizes Aj também obedecem a sua álgebra de Lie:

[Aj , Ak ] = i jkl Al . (8.36)

Os coeficientes do lado direito das relações de comutação acima são as constantes


de estrutura da álgebra.
• SU(2)

306
Este grupo generaliza o SO(2) para coordenadas e parâmetros complexos:
! !
x0 x
=A , (8.37)
y0 y

onde todos os elementos são complexos e det A = +1. Exigindo-se a conservação


da distância à origem, descobrimos que a matriz A deve ser unitária: A† = A−1 .
Qualquer matriz unitária pode ser escrita como a exponencial de uma matriz
hermiteana (H † = H):
A = exp(iH) (8.38)

Como a matriz A tem (2 × 4) − 4 − 1 = 3 parâmetros livres (verifique!), qualquer


elemento do SU (2) deve poder ser escrito como

A = exp(iθj Hj ) j = 1, 2, 3 (8.39)

onde a soma sobre ı́ndices repetidos está implı́cita13 . Um conjunto particular-


mente útil de três matrizes hermiteanas é dado pelas matrizes de spin de Pauli:
! ! !
0 1 0 −i 1 0
σ1 = σ2 = σ3 = , (8.40)
1 0 i 0 0 −1

que obedecem à mesma álgebra de Lie dos elementos de O(3), dada pela
Eq. (8.36). Assim, os grupos O(3) e SU (2) são isomorfos. 14 A utilização deste
grupo leva ao tratamento espinorial, que foge ao escopo deste livro.
• SU(3)
Este é o grupo das transformações unitárias em três dimensões. A representação
matricial tem determinante 1 e (32 − 1) = 8 parâmetros livres. Tal como na
álgebra de momentos angulares em Mecânica Quântica, aqui também há apenas
dois operadores que podem ser diagonalizados simultaneamente.
Trataremos das propriedades deste grupo com mais detalhe ao discutirmos a força
forte.

Um conceito bastante importante é o de redutibilidade. Dada uma certa representação


de um grupo – uma matriz M – é possı́vel expressá-la em termos de outras mais simples
– matrizes diagonais (em bloco) ou triangulares, por exemplo? Se a resposta for sim,
diz-se que a representação utilizada inicialmente é redutı́vel.
Se for possı́vel escrever todos os geradores de um grupo na forma de matrizes diagonais
em bloco, ou seja, como !
D1 0
M= , (8.41)
0 D2
13
Aqui também ignoramos os andares dos ı́ndices.
14
Apenas localmente, pois não é possı́vel fazer uma associação biunı́voca global entre os geradores.

307
onde D1 e D2 são matrizes m × m e n × n, respectivamente, então ele é dito com-
pletamente redutı́vel. Neste caso, o espaço gerado pelos vetores de estado ψ pode ser
separado em 2 subespaços invariantes (e, portanto, desconexos); um com dimensão m
e outro com dimensão n. O espaço pode então ser escrito como a soma direta destes
dois subespaços.
Freqüentemente, uma representação só pode ser reduzida à forma triangular, ou seja,
!
D1 T
M= . (8.42)
0 D2

Neste caso, o subespaço m−dimensional, correspondente às primeiras m componentes


da base adotada, é invariante, mas não o restante. Vamos a um exemplo [9]: digamos
que, em uma dada representação de um grupo que atua em um espaço tridimensional,
os operadores têm a forma triangular dada por
 
a b c
M= d e f  . (8.43)
 

0 0 g

Neste caso, um vetor com a terceira componente nula


 
x
v1 =  y  (8.44)
 

será transformado em  
ax + by
v10 = Mv1 =  dx + ey  , (8.45)
 

0
o que ilustra a invariância do subespaço gerado pelos vetores (1, 0, 0) e (0, 1, 0). O
subespaço gerado pelo vetor  
0
v2 =  0  , (8.46)
 

z
por outro lado, não é invariante (verifique!).
Esta redução, quando permitida, indica os vetores fundamentais de cada grupo, que
estarão ligados, como veremos adiante, às particulas básicas da natureza. Para explic-
itar a relação destes grupos de simetria com a classificação das partı́culas elementares,
vamos seguir uma linha cronológica.

8.3.3 Revisitando a classificação das partı́culas elementares

Até o inı́cio da década de 50, julgava-se que o núcleon seria uma partı́cula capaz de
assumir dois estados: próton e nêutron, que seriam autoestados de um certo operador

308
T1 :

T1 ψn = λn ψn : nêutron (8.47)
T1 ψp = λp ψp : prótron . (8.48)

O operador T1 é, portanto, diagonal na base formada por ψn e ψp :


!
λn 0
T1 = . (8.49)
0 λp

Os operadores T2 e T3 respondem pela transformação de um nêutron em um próton e


vice-e versa15 : ! !
0 1 0 0
T2 = T3 = . (8.50)
0 0 1 0
Fisicamente, a aplicação destes operadores representam um decaimento beta (inverso
ou não):
n −→ p+ + e− + ν̄e .

Os operadores Ti definidos acima obedecem a uma álgebra de Lie semelhante àquela


dos operadores de momento angular da Eq. (8.32), se tomarmos λn = −λp = 1/2. O
espaço gerado pelos vetores de estado ψn e ψp é chamado espaço de spin isotópico.
Em 1953, Gell-Mann e Zweig sugeriram que havia apenas três partı́culas fundamentais,
os quarks, que formavam uma representação do grupo SU (3). Mésons seriam formados
por dois quarks, e bárions por três. Podemos agrupá-los de acordo com a simetria sob a
operação dos elementos de SU (3): há 6 combinações simétricas e 3 anti-simétricas sob
a troca de 2 quarks. Cada combinação corresponde a uma partı́cula subatômica. Pode-
se também classificá-los de outra forma: há uma combinação totalmente simétrica, que
se mantém invariante: r
1
1= (uū + dd¯ + ss̄) (8.51)
3
¯ sd,¯ ¯ e
p
e outras 8 que se transformam entre si: sū, dū, ds̄, us̄, ud, 1/2(uū − dd)
1/6(uū + dd¯ − 2ss̄), formando um singleto e um octeto, respectivamente. Ambas
p

classificações podem ser indicadas por

Mésons: 3 ⊗ 3 = 6 ⊕ 3̄ = 8 ⊕ 1 (8.52)

Da mesma forma, os bárions podem ser classifcados em 10 combinações simétricas,


que se transformam entre si (um decupleto), 2 octupletos e um singleto:

Bárions: 3 ⊗ 3 ⊗ 3 = 10 ⊕ 8 ⊕ 8 ⊕ 1 . (8.53)

Cada combinação corresponde a uma partı́cula subatômica.


15
Qual delas transforma um próton em um nêutron?

309
Como já mencionado anteriormente, atualmente sabe-se que esta simetria é apenas
aproximada. Como ela relaciona quarks de diferentes famı́lias (também conhecidas
como gerações ou sabores), ela é conhecida como flavor SU (3).
A simetria SU (3) referente à cor, por outro lado, é exata. Para diferenciá-la da anterior,
indica-se SU (3)C . As três cargas coloridas vermelho, verde e azul – ou R, G e B,
tomando suas inciais do inglês – formam uma representação fundamental deste grupo.
A analogia com cor não é perfeita, pois induz à conclusão errônea que um estado
simétrico (branco) em relação a SU (3)C pode ser definido agrupando apenas um quark
de uma cor com outro que possua a anti-cor. No entanto, é fácil ver que um estado
verdadeiramente simétrico deve conter todas as 3 cores:
q q̄ = (RR̄ + GḠ + B B̄) . (8.54)
Os geradores são 8 matrizes 3 × 3, das quais apenas 2 podem ser diagonalizadas
simultaneamente e que têm R, G e B como autoestados. Outros geradores (glúons)
atuando sobre estados (quarks) mudarão suas cores. Veja o que acontece, por exemplo,
quando o gerador λ1 atua sobre o estado R. Sendo
   
0 1 0 1
λ1 =  1 0 0  e R =  0  , (8.55)
   

0 0 0 0
então  
0
λ1 R =  1  = G . (8.56)
 

0
Assim, pode-se dizer que o glúon λ1 carrega 2 cores: verde e anti-vermelho; ao interagir
com o quark vermelho (R), troca a cor deste, de vermelho para verde. Como glúons
carregam cores, podem interagir entre si – ao contrário de fótons, que são eletricamente
neutros apesar de mediarem a interação eletromagnética.
Devemos mencionar ainda o grupo responsável pela força fraca: SU (2). Se recordarmos
que neutrinos de mão direita ainda não foram observados – porque não interagem ou
porque não existem – percebemos que os elétrons de mão direita não tem como serem
agrupados, formando singletos. Neutrinos de mão esquerda, por outro lado, interagem
com elétrons (e suas versões mais massivas, o múon e o táuon); estes podem ser
agrupados, portanto, em dubletos.
! ! !
e− µ− τ−
νe νµ ντ
L L L

! ! !
u c t . (8.57)
d0 s0 b0
L,R L,R L,R

     
− − −
e µ τ
R R R

310
Agora podemos explicar a necessidade do ângulo de Cabibbo de um outro ponto
de vista: os autoestados dos geradores de SU (2)L não são autoestados de massa.
Isto também justifica a inexistência de uma mistura equivalente no setor leptônico:
neutrinos têm massa nula, e por isso, são autoestados simultâneos de massa e dos
geradores de SU (2)L .
As diversas simetrias indicam a conservação das diversas “cargas” a elas associadas,
como pode-se verificar pelos argumentos expostos acima. Precisamos, contudo, de um
formalismo matemático capaz de explicar as interações entre as partı́culas, em especial
entre quarks. Por que eles ainda não foram observados individualmente? Na verdade,
o mesmo acontece com qualquer partı́cula colorida. Por quê? Este é o objetivo da
próxima seção.

8.4 Elementos de Teoria de Campos

No Modelo Padrão, todas as interações fundamentais (com exceção da gravitação!) são


descritas através de simetrias de gauge — a serem definidas adiante — como acontece
no eletromagnetismo (EM). Nesta seção faremos uma breve introdução ao formalismo
de Teoria de Campos, com ênfase nos pontos que serão necessários mais adiante.

8.4.1 Campo Escalar Real

Um formalismo bastante elegante para a Mecânica Clássica é o Lagrangeano, pois


permite uma extensão direta à Teoria de Campos, Clássica ou Quântica. Faremos
agora uma breve revisão desta abordagem.
A equação de movimento de uma partı́cula pode ser obtida a partir do Princı́pio da
Mı́nima Ação S, que é definido como
Z t2
S[x(t)] = L[x(t), ẋ(t)] dt (8.58)
t1
δS = 0 , (8.59)

onde L é a Lagrangeana da partı́cula. A trajetória clássica xc (t) que liga dois pontos
fixos x(t1 ) = x1 e x(t2 ) = x2 pode ser obtida exigindo-se que a S[xc (t)] seja um
extremo no espaço funcional, ou seja, δS[xc (t)] = 0. Assim,
Z t2  
dL δL
δS = δ ẋ + δx dt (8.60)
t1 dẋ δx
Z t2      
d dL d dL dL
= δx − δx + δx dt (8.61)
t1 dt dẋ dt dẋ dx
  t2 Z t2    
dL d dL dL
= δx − − δx dt (8.62)
dẋ t1 t1 dt dẋ dx

311
onde admitimos que podemos escrever δ ẋ = (δx). ˙ O primeiro termo da Eq. (8.62) é
nulo, uma vez que os extremos da trajetória são fixos. Termos deste tipo são conhecidos
genericamente como termos de superfı́cie. O segundo termo deve, portanto, se anular
para quaisquer δx. Obtemos, assim, a equação de Euler-Lagrange:
d dL dL
− =0 (8.63)
dt dẋ dx
O estudo de um campo escalar aparece naturalmente como a extensão da Mecânica
Clássica a sistemas contı́nuos. Assim, podemos pensar em uma coleção de osciladores
(harmônicos) formando uma rede unidimensional de parâmetro a, cujos deslocamentos
ηi das respectivas posições de equilı́brio definirão o campo escalar φ(t, x) ao tomarmos
o limite para o contı́nuo a → 0. A Lagrangeana deste sistema deve ser a soma das
Lagrangeanas de todos os osciladores:
1X 1 X
L= mi η̇i2 − k (ηi+1 − ηi )2 , (8.64)
2 i 2 i
A Lagrangeana total pode ser então escrita como
"  2 #
1X m 2 ηi+1 − ηi
L = a η̇ − ka (8.65)
2 i a i a
"  2 #
1X η i+1 − ηi
= a µ η̇i2 − Y (8.66)
2 i a
X
= aLi (8.67)
Zi
−→ dx L quando a → 0 , (8.68)

onde µ = m/a é a densidade linear de massa, Y = ka é o Módulo de Young do meio e


"    2 #
2
1 ∂φ ∂φ
L= µ −Y (8.69)
2 ∂t ∂x
é a chamada densidade de Lagrangeana, por motivos óbvios, e a integral é realizada
sobre todo o “volume” ocupado pelo campo. A aplicação da equação de Lagrange
resulta na bem conhecida equação de uma onda que se propaga com velocidade v =
p
Y /µ:
d2 φ Y d2 φ
− =0 . (8.70)
dt2 µ dx2
Terı́amos obtido exatamente a mesma equação se tivéssemos começado com uma La-
grangeana que difere da Eq. (8.68) apenas por uma constante multiplicativa (o fator
1
2
é mantido por convenção):
"  2 #
1 m 2 ηi+1 − ηi
L = η̇ − (8.71)
2 ka2 i a
" 2  2 #
a→0 1 1 ∂φ ∂φ
−→ − . (8.72)
2 v ∂t ∂x

312
Por isso, quando φ descreve perturbações que se propagam com velocidade da luz, é
natural substituir v por c na equação acima e escrever sua Lagrangeana16 em 3 + 1
dimensões como
1
L = ∂µ φ ∂ µ φ . (8.73)
2
O campo φ é de fato um escalar relativı́stico, pois sob uma transformação de coorde-
nadas (veja Eq. (12.48))
µ
xµ → x0 = Λµ ν xν + aµ (8.74)

se transforma como
φ(x) → φ0 (x0 ) = φ(x) . (8.75)

Pode-se mostrar que o sistema obedece às equações de Lagrange equivalentes para o
campo escalar φ,
dL dL
∂µ − =0 , (8.76)
d(∂µ φ) ∂φ
a menos de termos de superfı́cie, como antes.
Se a Ação for invariante sob uma transformação de um parâmetro α na Lagrangeana,
então é fácil mostrar que

dL dφβ
Z  
δS = ∂µ δα d4 x . (8.77)
d∂µ φβ dα

A corrente
dL dφβ
Jαµ ≡ , (8.78)
d∂µ φβ dα
R
portanto, é conservada. Definindo a carga Qα ≡ Jα0 d3 x e integrando
Z
d
0 = ∂µ Jαµ d3 x = Qα + termos de superfı́cie. (8.79)
dt
Em outras palavras, a carga Q é conservada se não houver fluxo através da superfı́cie
que limita o sistema. Todas as simetrias existentes, portanto, implicam a conservação
de uma “carga” – este é o teorema de Noether [3]. Se a simetria acontece no espaço
de coordenadas, obtemos a conservação de energia, momento linear e angular, etc. No
caso dos grupos que atuam no espaço interno das partı́culas, obtemos a conservação
dos números quânticos: carga elétrica, número bariônico, etc.
Aplicando este raciocı́nio ao grupo de translações através da Eq. (8.19), obtemos

aµ ∂µ L = δL (8.80)
dL ν dL ν
= a ∂ν φ + a ∂ν ∂µ φ (8.81)
dφ d∂µ φ
 
ν dL
= a ∂µ ∂ν φ , (8.82)
d∂µ φ
16
Como trataremos, daqui por diante, sempre de campos, o termo “densidade” deverá estar subenten-
dido ao nos referirmos à Lagrangeana.

313
onde foi utilizada a equação de Euler-Lagrange na última passagem. Igualando o
primeiro e o último termos da expressão acima, obtém-se
 
dL
∂µ ∂ν φ − L δν aν = 0 ∀aν
µ
, (8.83)
d∂µ φ

que nos permite definir o tensor momento-energia de um campo escalar φ


dL
T µν ≡ ∂ν φ − L δνµ , (8.84)
d∂µ φ

que é conservado, como mostra a Eq. (8.83).


A maior generalização que se pode fazer para a Lagrangeana (8.73) é acrescentar um
termo de potencial V [φ]:
1
L = ∂µ φ ∂ µ φ − V [φ(x)] , (8.85)
2
Quando o potencial é quadrático e dado por V [φ] = 21 µ2 φ2 , obtém-se a equação de
Klein-Gordon:17
(∂µ ∂ µ + µ2 )φ = 0 . (8.86)

que descreve a propagação de perturbações em um campo com massa µ. De fato,


quando µ = 0, recaı́mos na Eq.(8.73), com propagação na velocidade da luz. Além
disso, podemos passar ao espaço dos momenta, realizando uma Transformada de
Fourier na equação acima, obtendo

−E 2 + p2 + µ2 = 0 . (8.87)

Uma regra fácil de ser aplicada para a determinação da massa de um campo — sem
correções quânticas — é calcular a derivada segunda do seu potencial no seu estado
de menor energia. Assim, de modo geral, pode-se dizer que

∂ 2V
µ2 = . (8.88)
∂φ2 φ0

A quantização deste campo, que foge ao escopo deste curso, mostra que µ é realmente
a massa dos quanta deste campo.

8.4.2 Campo Eletromagnético

O potencial vetor A ~ e o potencial elétrico φ do eletromagnetismo (EM) podem ser


~ É fácil verificar que ele de fato se comporta
usados para definir o 4-vetor Aµ ≡ (φ, A).
como tal sob uma transformação de coordenadas do tipo (12.48). Procuramos agora
uma Lagrangeana que forneça as equações de Maxwell ou, equivalentemente, uma
equação de onda para o campo Aµ . Como o potencial vetor define o campo magnético a
17
Note que o sinal do último termo depende da assinatura da métrica usada.

314
menos de um gradiente, esta Lagrangeana deve ainda ser invariante sob transformações
do tipo
Aµ −→ Aµ + ∂µ Λ . (8.89)

Duas transformações consecutivas deste tipo estão relacionadas a uma terceira do


mesmo tipo:
∂µ Λ1 + ∂µ Λ2 = ∂µ Λ3 ⇐⇒ Λ1 + Λ2 = Λ3 . (8.90)

Estas transformações de gauge – ou de calibre – formam um grupo, cuja regra de


composição é a mesma do grupo U (1). O EM é, portanto, invariante sob U (1).
A Lagrangeana que fornece as equações de Maxwell do EM é

L ≡ C Fµν F µν − j µ Aµ , (8.91)

onde C é uma constante (ver exercı́cio 8) e

Fµν ≡ ∂µ Aν − ∂ν Aµ (8.92)
j µ ≡ (ρ, ~j) (8.93)

cujos componentes designam os campos elétrico e magnético e a densidade e corrente


elétricas.
Note que um termo de massa, do tipo 21 m2γ Aµ Aµ , não seria invariante pela trans-
formação (8.89). Por um lado, esta é uma boa notı́cia; afinal, fótons não têm massa.
Por outro lado, deve haver uma maneira de contornarmos esta restrição, se desejamos
descrever as interações eletromagnética e a fraca através do mesmo formalismo, já
que esta é mediada por bósons massivos, como já mencionado. Poderı́amos perguntar
porque não se acrescenta novos termos que se transformem de modo a cancelar a con-
tribuição dos termos de massa. A razão é que estes novos termos levariam a uma teoria
não-renormalizável.18 O procedimento adequado, chamado Mecanismo de Higgs, será
tratado a seguir.

8.4.3 Mecanismo de Higgs

Vamos considerar um campo escalar um pouco mais geral: o complexo. A Lagrangeana


mais simples que podemos escrever é dada por

1 1
L = (∂µ φ)∗ ∂ µ φ − m2φ φ∗ φ , (8.94)
2 2
onde (·)∗ indica o complexo conjugado. Note que ela é invariante sob a transformação
φ → φ exp(ieα), pertencente ao grupo U (1). Quando α é uma constante, a simetria
sob U (1) é dita global.
18
Onde os termos divergentes não podem ser absorvidos por redefinições dos parâmetros da teoria.

315
Figura 8.3: Potencial com quebra espontânea de simetria para um campo escalar com-
plexo, com a 6= 0. O plano horizontal é definido pelas componentes real e imaginária do
campo φ. O cı́rculo, pertencente a este plano, é o vácuo deste campo.

Suponhamos agora uma Lagrangeana que acople este campo e o EM, dada por19
1
L = − Fµν F µν + (Dµ φ)∗ (Dµ φ) − V (φ) (8.95)
4
λ ∗ 2
onde V (φ) = φ φ − a2 , (8.96)
4!
na ausência de termos de fontes do EM. A definição da chamada derivada covariante20
Dµ ≡ ∂µ + ieAµ torna esta Lagrangeana invariante sob transformações locais U (1) (ou
SO(2), claro) de ambos os campos, na quais o parâmetro α depende da posição xν no
espaço de coordenadas:

φ(x) → φ(x) exp[ieα(x)] (8.97)


Aµ (x) → Aµ (x) − ∂µ α(x) (8.98)

Note que esta definição identifica a constante e com a carga elétrica, que acopla o
campo EM com o campo φ – representando, portanto, uma partı́cula carregada elet-
ricamente.
Um esboço do potencial V (φ) pode ser visto na Fig.(8.3). A configuração de menor
energia do campo φ – seu vácuo – é definida pelo mı́nimo deste potencial, em φ∗ φ = a.
Podemos estudar suas excitações ao redor de um vácuo especı́fico, φP = a e escrever
as variações em relação a φP em termos de suas partes real e imaginária, φ ≡ φR +i φI ,
ou seja,
1
φ(x) = a − √ (φR (x) + i φI (x)) . (8.99)
2
Ao redor deste ponto, o potencial dado pela Eq. (8.96) fica
1 λa2 2
V (φ) = φR + O(φ3 ) . (8.100)
2 6
Seguindo a mesma argumentação usada no campo escalar real, Eq. (8.88), podemos
ver que o campo φR possui massa quadrada m2R = λa2 /6, enquanto que o campo φI
19
Por que não há um fator 1/2 multiplicando o termo cinético do campo φ?
20
Não confundir com a derivada covariante da Relatividade geral.

316
não tem massa. Este é o chamado bóson de Goldstone, e aparece sempre que a simetria
do campo é quebrada espontaneamente [11].
O campo de gauge Aµ também adquire um termo de massa. Expandindo o termo da
derivada covariante e lembrando que o módulo do campo φ no seu estado de vácuo
vale a 6= 0, obtemos o termo
e2 a2 Aµ Aµ (8.101)

o que indica uma massa mA = 2ea para o campo de gauge Aµ .

8.5 Unificação das Forças Fundamentais e


Transições de Fase
Na seção anterior, acoplamos um campo escalar complexo ao campo eletromagnético
(EM) exigindo que a Lagrangeana resultante fosse invariante sob transformações locais
U (1). Assim, obtivemos um termo de massa para o campo Aµ — o ingrediente de que
precisávamos (seção 8.4.2) para conectar os campos do EM (sem massa) e da força
nuclear fraca (com massa). Agora vamos verificar, de maneira mais formal, como o
mecanismo de Higgs permite a unificação destas forças.
A generalização da derivada covariante para manter a Lagrangeana invariante sob a
ação de grupos não-abelianos é direta:
i i
∂µ −→ Dµ ≡ ∂µ + gAcµ σ c − g 0 Bµ , (8.102)
2 2
onde há 4 campos de gauge: três Acµ (c = 1, 2, 3), associados ao grupo SU (2), e Bµ ,
ao U (1). As matrizes σ c são as matrizes de Pauli, como discutido anteriormente, na
Eq. (8.40). Da mesma forma que antes, usamos o potencial (8.96) para o campo φ,
pois apresenta um vácuo não-trivial. Assim, podemos estudar o comportamento da
Lagrangeana ao redor de !
1 0
φP = √ . (8.103)
2 a
p
O campo φ, como antes, adquire massa mφ = a λ/6. Os valores das massas adquiridas
pelos campos de gauge podem ser obtidos calculando |Dµ φ|2 diretamente da expressão
(8.102), o que leva aos termos extras
1 a2  2 1 2
g (Aµ ) + g 2 (A2µ )2 + (−gA3µ + g 0 Bµ )2

(8.104)
2 4
na Lagrangeana. Os campos A1µ e A2µ são associados aos bósons vetoriais carregados
Wµ± , com massa ag/2. O terceiro termo acima representa o Zµ0 , com massa a/2. Estes
são os três mediadores da força fraca. Há um quarto grau de liberdade, pois começamos
com 4 campos de gauge. Exigindo-se ortogonalidade ao Zµ0 , obtemos a expressão
1 0 3

Aµ = p g Aµ + gBµ , (8.105)
g2 + g02

317
que é associado ao fóton. Assim, o campo eletromagnético não é associado à simetria
U (1) presente no inı́cio, mas à que permaneceu após a quebra. Indica-se este processo
por
SU (2)L ⊗ U (1)Y −→ U (1)EM , (8.106)

associando a simetria incial à hipercarga discutida anteriormente.

Esta é a teoria das interações eletrofracas de Glashow-Weinberg-Salam [6], pela qual


seus autores ganharam o prêmio Nobel de 1979. O bóson de Higgs, representado aqui
pelo campo φ, é o único campo escalar previsto no modelo padrão, e até o momento
ainda não foi observado. Exatamente o mesmo processo acontece em supercondutivi-
dade, e pode ser usado para explicar a expulsão do campo magnético de dentro de
supercondutores: o fenômeno Meissner, que passamos a explicar. À medida em que a
temperatura abaixa, a forma do potencial passa de um mı́nimo global para uma que
apresenta mı́nimos degenerados, como o discutido aqui. Assim, a simetria é quebrada,
e o campo de gauge mediador da interação adquire massa. A diferença é que aqui a
interação efetiva é a eletromagnética; pode-se dizer, então, que tudo acontece como se
os fótons fossem massivos no interior do material, tendo, portanto, um alcance finito:
não há campos EM nesta região do espaço!

Todo o mecanismo é possı́vel graças à forma do potencial, que permite que o campo
φ tenha um valor não-nulo no seu estado de vácuo. Se isto não acontecesse, as forças
fraca e eletromagnéticas seriam mediadas pelos campos de gauge Acµ e Bµ , todos sem
massa.21 . O cálculo do potencial efetivo requer conhecimentos de Teoria Quântica de
Campos que fogem a este curso, mas podemos entendê-lo como o potencial clássico
adicionado de correções quânticas. Em primeira ordem, estas correções indicam a
energia das flutuações ao redor da configuração clássica do campo φ. A principal
caracterı́stica dos potenciais efetivos que nos interessa é a mudança no sinal do termo
de massa, que depende da temperatura do sistema:

1 σ λ
VT (φ) = m2T φ2 + φ3 + φ4 (8.107)
2 3! 4!

Assim, o potencial pode ter um ou dois mı́nimos, se o sistema estiver, respectivamente,


acima ou abaixo da temperatura crı́tica Tc definida pela mudança de sinal de m2T .22 A
quebra de simetria com a diminuição da temperatura não é totalmente inesperada. O
mesmo fenômeno acontece, por exemplo, em um ferromagneto. Em altas temperaturas,
os spins eletrônicos estão orientados em todas as direções – o sistema é simétrico
sob ação de O(3). Quando o sistema se esfria abaixo da temperatura de Ginzburg,
aparecem domı́nios de orientação: blocos onde o spin está orientado na mesma direção.
O sistema escolheu um vácuo e quebrou a simetria.
21
Basta fazer a = 0 nas expressões acima.
22
Aqui optamos por utilizar a notação usual na literatura e indicar o termo de massa por m2 , ainda
que este possa ser negativo.

318
Figura 8.4: Comportamento do potencial efetivo V [φ] com a mudança progressiva no
sinal do termo de massa para uma transição de fase de primeira (à esquerda) e segunda
(à direita) ordens.

Mais do que uma curiosidade, há uma analogia formal entre a quebra de simetria
em Teoria de Campos a temperatura Finita (isto é, não nula) e transições de fase
em Mecânica Estatı́stica. Pode-se adotar, por exemplo, o valor esperado do vácuo
do campo φ como parâmetro de ordem; a fase ocupada pelo sistema é caracterizada
pelo valor deste parâmetro. Seguindo a nomenclatura clássica de transições de fase,
diz-se que a transição é de primeira ordem quando a mudança no valor é brusca e
se dá através da nucleação de bolhas da nova fase em meio à atual. O potencial
efetivo apresenta um mı́nimo local na posição da fase atual, e um global na posição
da fase nova, para a qual o sistema está passando – ver Fig. (8.4a). Assim sendo,
é energeticamente favorável realizar a transição, que acontence tanto por ativação
térmica quanto por tunelamento. Existe um valor crı́tico para o raio das bolhas23
abaixo do qual a tensão superficial supera o ganho energético da transição e faz com
que elas encolham até desaparecer por completo. As bolhas com raio maior que este
valor crı́tico se expandem até percolarem, ocupando, então, todo o volume disponı́vel
e completando a transição. Um exemplo tı́pico é a transição lı́quido-vapor que a água
sofre ao atingir a temperatura de ebulição. 24 Quando a mudança no parâmetro de
ordem é suave, a transição é dita de segunda ordem. Não há barreira no potencial
efetivo entre as fases atual e futura – ver Fig. (8.4b). Este processo de transição recebe
o nome de decomposição espinodal e pode ser entendido decompondo-se o campo φ
em seus modos normais: os de maiores comprimentos de onda decaem primeiro. Ou
seja, a transição se dá de maneira deslocalizada no espaço.

A busca por uma teoria de unificação (GUTs25 ) da força forte com eletrofraca é
perseguida avidamente. Um dos indı́cios de que esta unificação é real é a observação de
que as constantes de acoplamento das três forças convergem para aproximadamente
o mesmo valor à medida em que a energia aumenta. No caso do eletromagnetismo,
23
Neste caso, a configuração do campo recebe o nome de sphaleron.
24
Em um lı́quido real, claro, há que se levar em conta o empuxo, que dificulta a colisão entre as bolhas
antes que elas sejam literalmente jogadas para fora do sistema.
25
Do inglês Grand Unified Theories.

319
Figura 8.5: Esquematização do processo de blindagem de uma carga elétrica positiva em
um meio dielétrico.

esta constante é (proporcional a) a carga elétrica e. Sua dependência com a energia


pode ser entendida através da criação de pares virtuais, também conhecida como po-
larização do vácuo – visto como um meio dielétrico ordinário. Assim, a carga vista
por um projétil depende da sua distância mı́nima até a carga espalhadora central e,
portanto, da energia do processo de colisão. Este efeito, conhecido como blindagem ou
screening, está ilustrado na Fig. 8.5 e equivale ao aumento da carga elétrica (ou seja,
do acoplamento) com a energia.

Em teorias não-abelianas, ao contrário, acontece o efeito inverso: a anti-blindagem


[3]. A constante de acoplamento diminui com o aumento da energia. Este processo
está intimamente ligado com o que se chama de liberdade assintótica dos quarks, já
mencionado anteriormente.

Uma extrapolação deste comportamento mostra que as três constantes de interação


(eletromagnética, fraca e forte) devem alcançar aproximadamente o mesmo valor em
torno de E ∼ 1015 GeV – veja a Fig. 8.5. Atualmente, os aceleradores atingem cerca
de 105 GeV . Para se chegar a este resultado, somos obrigados a supor que nada fora do
modelo padrão acontecerá no deserto de várias ordens de grandeza em energia entre
a unificação eletrofraca e a total.

Tentativas de agrupamento das simetrias SU (2)L , U (1)Y e SU (3)C ainda não foram
bem sucedidas. O grupo mais simples com graus de liberdade suficientes é o SU (5)
[4, 5], no qual os quarks e léptons são membros do mesmo multipleto. Infelizmente,
este modelo foi descartado porque previa um decaimento do próton em uma escala de
tempo já descartada experimentalmente.

Outros motivos para buscar um grupo mais fundamental são dados pelas falhas do
modelo padrão em explicar o grande número de parâmetros livres (constantes de
acoplamento, massas), a existência de três famı́lias de léptons, que parecem se repetir,
e a existência do bóson de Higgs, ainda não observado experimentalmente. Um dos
candidatos atuais a este posto é a chamada supersimetria, que permitiria a trans-
formação de férmions em bósons, colocando-os em um mesmo multipleto.

320
Figura 8.6: Variação das constantes de interação com a energia. O eixo horizontal se
estende por várias ordens de grandeza.

8.6 O Universo como um acelerador

O modelo padrão das partı́culas elementares é bem testado até a unificação eletrofraca.
Um modelo verdadeiramente fundamental para as partı́culas elementares, contudo,
deve ser válido, no mı́nimo, até a energia de Planck, da ordem de 1019 GeV , acima da
qual a gravitação deve obrigatoriamente ser considerada. É claro que energias deste
nı́vel não podem ser obtidas em nenhum acelerador no planeta, mas há um local, ou
melhor, uma época, quando elas eram perfeitamente acessı́veis: quando o universo
tinha cerca de 10−44 s de idade. A partir deste instante, a expansão do universo foi
paulatinamente diminuindo a temperatura e, acredita-se, permitindo uma seqüência
de quebras de simetrias (veja também o Capı́tulo 2):

• GUT
Pelas justificativas apresentadas anteriormente, acredita-se que um grupo de
simetria que englobaria as forças forte e eletrofraca deve ter se dividido nos
conhecidos SU (3)C ⊗ SU (2)L ⊗ U (1)Y quando T ∼ 1015 GeV e t ∼ 10−36 s.
• Eletro-fraca
A transição eletro-fraca, que separou a força fraca da eletromagnética quebrando
os grupos SU (2)L ⊗ U (1)Y → U (1)EM , ocorreu em t ∼ 10−10 s, a uma tem-
peratura T ∼ 300 GeV . Nesta quebra as partı́culas adquirem massa através do
mecanismo de Higgs. Não se sabe, ao certo, qual a ordem desta transição, mas
parece ser fracamente de primeira ordem.
Acredita-se que esta transição seja fundamental para a existência de matéria
atualmente em nosso universo, através do mecanismo explicado mais adiante.
• Quiral
Dois fenômenos caracterizam o final da época das transições, quando t ∼ 10−6 s,
e T ∼ 1 GeV : o confinamento dos quarks e a conseqüente formação dos hádrons.
Nesta faixa de energia, é razoável desprezar as massas dos dois ou três quarks
mais leves: u, d e s. A quebra espontânea da simetria quiral fornece, através

321
do mecanismo de Higgs, massa para estes quarks — que são então confinados.
Claro, as massas efetivas adquiridas são muito maiores do que as massas inici-
ais desprezadas, o que justifica a aproximação. Os bósons de Goldstone desta
simetria são os pı́ons, cujas pequenas massas indicam a validade do raciocı́nio.
Esta simetria não descreve uma relação fundamental, e é conseqüência apenas
dos pequenos valores das massas dos três quarks mencionados.
Antes desta transição, o universo era composto por um plasma de quarks e
glúons. Experiências estão atualmente em curso no Relativistic Heavy Ion Col-
lider (RHIC), em Brookhaven (NY, EUA), para tentar reproduzir este estado da
matéria.

A partir deste ponto, o universo é muito bem descrito pelo modelo cosmológico padrão.
Vejamos a seguir como este cenário pode responder a uma pergunta fundamental: se
partı́culas e anti-partı́culas foram criadas em igual número, de onde veio toda a matéria
que conhecemos? Não é plausı́vel imaginar um mecanismo que separasse estes pares
por distâncias tão grandes a ponto de não poderem se aniquilar.

Deve haver, portanto, um mecanismo para criar mais partı́culas do que anti-partı́culas.
A diferença relativa, expressa em função do número total de bárions NB e de anti-
bárions NB̄ como
NB − NB̄
δ= (8.108)
NB + NB̄
é estimada em torno de 10−9 . Apesar de parecer pequena, corresponde a toda a matéria
ordinária presente no universo.

Sakharov [13] determinou as três condições necessárias para a criação de bárions — a


chamada bariogênese:

1. Interações que violem a conservação do número de bárions:


De outra forma, um bárion seria criado sempre com um anti-bárion, e deveria-se
imaginar um mecanismo bastante eficiente para separá-los espacialmente e evitar,
assim, sua futura aniquilação mútua.

2. O sistema deve estar fora do equilı́brio térmico:


Em equilı́brio, as reações que geram a procurada assimetria podem ser invertidas
com a mesma taxa, anulando seu efeito. Isto é alcançado quando as taxas de
reações são menores que a taxa de expansão do universo (dada pela constante de
Hubble) ou em transições de fase de primeira ordem, como as que acontecem em
algumas quebras de simetria, dependendo do potencial efetivo.

3. Interações que discriminem matéria de anti-matéria:


Ou seja, violação das simetrias discretas de carga (C) e paridade (P) simultane-
amente. Já observadas em laboratório no decaimento do káon, controlado pela
interação fraca.

322
Antes da primeira quebra de simetria, não havia diferença entre as partı́culas e suas
forças de interação; partı́culas supermassivas presentes – quaisquer que fossem – po-
diam decair em prótons ou em elétrons e vice-e-versa. Não havia conservação, por-
tanto, de número bariônico (item 1 de Sakharov). Isto, contudo, não era suficiente,
pois bárions e anti-bárions eram criados à mesma taxa.
Abaixo da escala de unificação, no entanto, as partı́culas supermassivas devem decair
em bárions ou léptons, mas esta reação não podem ser invetida, pois a taxa de expansão
do universo é muito alta: não há mais energia disponı́vel para criar as partı́culas
supermassivas – o sistema está fora do equilı́brio (item 2).
O último ingrediente é obtido pelas interações fracas, que violam CP naturalmente.
O processo de geração da assimetria bariônica durante a quebra de simetria eletro-fraca
pode ser assim resumido: o universo atinge a temperatura crı́tica; o potencial efetivo
correspondente adquire uma estrutura de mı́nimos degenerados. A seguir, os mı́nimos
diferenciam-se e bolhas da nova fase, mais favorável energeticamente, começam a
surgir; aquelas com raio acima de um certo valor crı́tico se expandem. Dentro de cada
bolha, a simetria foi quebrada; fora, o sistema ainda está na fase anterior. À medida em
que uma determinada bolha se expande, o parâmetro de ordem muda abruptamente
com a passagem da parede, deixando o sistema fora do equilı́brio térmico: o sistema
passa rapidamente de um mı́nimo local a um global. Uma flutuação local no número
médio de bárions, presente no instante de passagem da parede da bolha, seria então
mantida.
Embora todos os ingredientes pareçam estar presentes no universo primordial, o
mecanismo exato e seus detalhes permanecem em aberto e são objeto de intenso estudo
atual.

8.7 Exercı́cios
1. Conjecture a existência de partı́culas compostas por cinco quarks (um pen-
taquark), obtidas através da colisão de raios γ ou de pósitrons sobre núcleos
de Deutério. Quais quarks comporiam estas partı́culas, supondo que elas teriam
cargas +1 ou nula? Procure nos ArXives referências a respeito.
2. Mostre que o operador de paridade é um elemento do grupo de ordem 2. Qual a
regra de composição adequada?
3. Considere o grupo de ordem 3. Mostre que este é um exemplo de grupo cı́clico,
isto é, onde todos os elementos são potencias de um mesmo. Mencione algumas
realizações deste grupo.
4. O grupo de matrizes 2 × 2 com elementos reais com multiplicação matricial como
regra de composição é um grupo de Lie. Determine seus elementos inversos e o
neutro. Este grupo é abeliano?

323
5. Prove que a matriz B, dada pela Eq. (8.30) deve ser anti-simétrica.
6. Prove a Eq. (8.31).
7. Prove a Eq. (8.33). Dica: separe a expansão em potências pares e ı́mpares.
8. Deduza as equações de Maxwell no vácuo a partir da Eq. (8.91). Qual equação
deve ser imposta para obtê-las na forma usual? Determine a constante C ade-
quada.
9. Considere o potencial V (φ) = aφ2 + bφ3 + cφ4 , com a, b e c constantes conhecidas
e com os sinais adequados para uma transição de fase de primeira ordem. Estime
o valor crı́tico para o raio da bolha.

8.8 Referências bibliográficas


[1] M; Gell-Mann, Phys. Rev. 92, 883 (1953), Nuovo Cimento 4, Suppl. 2, 848 (1956).
T. Nakano e K. Nishijima, Prog. Theor. Phys. 10, 581 (1953).
[2] Quarks and Leptons: An Introductory Course in Modern Particle Physics, F.
Halzen e A.D. Martin (Wiley, 1984)
[3] An introduction to Quantum Field Theory, M.E. Peskin e D.V. Schroeder (Addi-
son Wesley, 1995).
[4] J.C. Pati e A. Salam, Phys. Rev. Lett. 31, 275 (1973).
[5] H. Georgi e S.L. Glashow, Phys. Rev. Lett. 32, 438 (1974).
[6] S.L. Glashow, Nucl. Phys. 22 (1961) 579. S. Weinberg, Phys. Rev. Lett. 19 (1967)
1264. A. Salam, Proceedings of the Eighth Nobel Symposium, N. Svartholm (Ed.)
(1968, Wiley-Interscience, New York), p. 367.
[7] Quantum Mechanics, C. Cohen-Tannoudju, B. Diu e F. Laloë (John Wiley &
Sons, 1977).
[8] Quantum Field Theory, M. Kaku (Oxford Univ. Press, 1993)
[9] Group Theory and its application to physical problems, M. Hamermesh (Dover,
1962).
[10] Classical Mechanics, H. Goldstein (Addison Wesley, 1965)
[11] J. Goldstone Nuovo Cimento 19 (1961) 154. J. Goldstone, A. Salam, e S. W.
Weinberg, Phys. Rev. 127 965.
[12] P.W. Higgs, Phys. Lett. 12 (1964) 132; Phys. Rev. Lett. 13 (1964) 308; Phys. Rev.
145 (1966) 1156. T.W.B. Kibble, Phys. Rev. 155 (1967) 1554.G.S. Guralnik, C.R.
Hagen and T.W.B. Kibble,Phys. Rev. Lett. 13 (1964) 585. F. Englert e R. Brout,
Phys.Rev. Lett. 13 (1964) 321.
[13] A.D. Sakharov, Pis’ma Zh. Eksp. Teor. Fiz. 5 (1967) 32.

324
Capı́tulo 9

Astropartı́culas II

Júlio C. Fabris1

9.1 Introdução
A relatividade geral é a moderna teoria da gravitação, que substituiu a teoria da
gravitação newtoniana, contendo-a unicamente como o limite de campos fracos. A
relatividade geral é uma teoria clássica, no sentido de não quântica, que quando apli-
cada ao estudo do Universo como um todo gera o que usualmente se denomina de
Modelo Cosmolǵico Padrão (MCP). A descrição do Universo utilizando como base a
teoria da relatividade geral está, em geral, em excelente acordo com a observação.
Mas, sob vários aspectos, a descrição que ela fornece é considerada incompleta. Ao
mesmo tempo, existem uma série de problemas que afetam o MCP que, mantendo-se a
nı́vel puramente clássico, só podem ser resolvidos introduzindo condições inicias muito
especiais no inı́cio da história do Universo.
A teoria quântica de campos é um outro alicerce da fı́sica moderna. Ela é a base
do modelo padrão das partı́culas elementares. Este modelo padrão das partı́culas el-
ementares, assim como os conceitos básicos da teoria quântica de campos, foram de-
scritos no capı́tulo precedente. Quando se considera a existência de campos quânticos
no Universo em expansão descrito pela relatividade geral, vários fenômenos novos
são preditos. Em particular, espera-se a formação de defeitos topológicos devido às
transições de fase nos sistemas quânticos graças ao processo de resfriamento do Uni-
verso que se expande. Por outro lado, campos quânticos podem gerar sistemas com
pressão negativa, em fases altamente “quentes” da história do Universo, dando lugar
1
Afiliação : Departamento de Fı́sica, Universidade Federal do Espı́rito Santo, Goiabeiras - Vitória -
CEP29060-900, Espı́rito Santo .

325
ao que se denomina de “modelos inflacionários”. Estes modelos inflacionários podem
responder favoralmente aos problemas de condições iniciais no Universo a que se fez
menção acima. Ao mesmo tempo, talvez a existência de campos quânticos no Universo
possa resolver dois dos maiores problemas existentes atualmente em cosmologia: o da
matéria e energia escura.
Neste capı́tulo abordaremos alguns tópicos relacionados à introdução de campos
quânticos em um Universo em expansão descrito pela teoria (clássica) da relativi-
dade geral. Os tópicos selecionados, em um área extremamente vasta, abrangem os
defeitos topológicos, o modelo inflacionário, o problema da matéria e energia escura,
abordando-se rapidamente outros assuntos como os raios cósmicos de alta energia. Em
vez de exaurir o problema das consequências da existência de campos quânticos em um
Universo em expansão, procura-se ilustrar alguns aspectos da combinação da teoria
quântica de campos e a cosmologia, através de uma análise relativamente detalhada
dos tópicos citados acima.

9.2 Defeitos Topológicos

9.3 Introdução
Defeitos topológicos são estruturas resultantes de transições de fase em um sistema
fı́sico. Nem toda transição de fase implica no aparecimento de defeitos topológicos;
entretanto, se há, em um dado sistema, defeitos topológicos, podemos dizer que houve
neste sistema uma transição de fase. Um dos exemplos mais simples de formação
de defeitos topológicos é o processo de congelamento de uma superfı́cie de um lago.
No estado lı́quido, as moléculas de água se encontram em um estado completamente
desordenado, e portanto altamente simétrico: a água parecerá sempre ter o mesmo
aspecto em qualquer lugar do fluido. Entretanto, quando a temperatura cai abaixo
do ponto crı́tico de congelamento (zero grau Celsius), gelo se forma, o que implica
que as moléculas se ordenam naquela região, formando uma estrutura cristalina. Mas,
a superfı́cie de um lago não se congela instantânea e simultaneamente em todos os
pontos. Desta forma, o ordenamento do cristal em uma região que se congelou pode
não ser o mesmo que em outra região onde também houve o congelamento. Quando
estas regiões diferentes se tocam, a interface entre elas forma um defeito topológico
devido exatamente ao diferente ordenamento da estrutura cristalina que cada uma
delas apresenta. Muitos outros exemplos de formação de defeitos topológicos podem
ser extraı́dos da fı́sica do estado sólido.
Em cosmologia, os defeitos topológicos surgem devido ao processo de resfriamento
que ocorre graças à expansão do Universo. A Teoria Quântica de Campos prevê que,
à medida que a temperatura abaixa, transições de fase devem ocorrer. O mecanismo
que gera estas transições de fase foi descrito no capı́tulo precedente. No processo de

326
transição de fase, o sistema descrito por campos quânticos deve tender ao seu estado
de vácuo, quer dizer, o estado de energia mı́nima. Se o vácuo de um dado sistema
não é único, então diferentes regiões do espaço podem estar em diferentes estados de
vácuo. Na interface entre estas diferentes regiões, defeitos topológicos se formarão.
O horizonte cosmológico define uma região que está causalmente conectada. De uma
maneira grosseira podemos definir o horizonte cosmológico, em um dado tempo t,
como a distância percorrida por um raio luminoso entre o instante inicial da evolução
do Universo e o instante de tempo t. Como será descrito na próxima seção, o Uni-
verso visı́vel hoje pode ser constituı́do de regiões que não tinham conexão causal em
épocas bem remotas. Se transições de fase ocorreram naquela época, podemos ter a
presença de defeitos topológicos no Universo visı́vel pois diferentes regiões podem ter
”escolhido” diferentes estados de vácuo. Entretanto, estas regiões que estavam, no Uni-
verso primordial, causalmente desconectada podem se encontrar dentro do horizonte
cosmológico hoje.
A natureza do defeito topológico que se forma devido ao resfriamento provocado pela
expansão do Universo, e da existência de um horizonte causal finito, depende da
estrutura dos campos quânticos envolvidos. Dito de outra forma, a natureza do defeito
topológico depende da estrutura do vácuo da teoria. Há três defeitos principais que
podem se formar no processo de expansão do Universo: as paredes cósmicas, as cordas
cósmicas e os monopolos2 . As paredes seriam defeitos bi-dimensionais, ao passo que as
cordas seriam defeitos uni-dimensionais e os monopolos defeitos pontuais. A formação
de um destes defeitos será determinada pelo tipo de simetria apresentado pelo estado
de vácuo. Descreveremos a seguir o processo de formação de cada um destes defeitos
e suas consequências para a evolução ulterior do Universo.

9.4 Paredes cósmicas


As paredes cósmicas se formam quando o estado de vácuo não é único e apresenta, além
disto, simetria discreta. Isto quer dizer que poderemos, por exemplo, ter dois diferentes
estados de energia mı́nima. Vamos considerar um campo escalar real quântico cuja
Lagrangiana, no espaço-tempo de Minkowski, é dada por
1
L = ∂µ φ∂ µ φ − V (φ) , (9.1)
2
onde o primeiro termo do lado direito corresponde ao termo cinético, ao passo que
o segundo termo corresponde ao potencial. Suponhamos agora que o potencial, que
representa a auto-interação do campo, seja dado por
λ 2
V (φ) = (φ − η 2 )2 . (9.2)
4
2
Há ainda um outro tipo importante de defeito topológico denominado de textura, sobre o qual faremos
menção posteriormente

327
O potencial é sempre positivo definido, se anulando unicamente em dois pontos, φ =
±η, o que define os estados de vácuo. Neste caso, observe-se primeiramente que o vácuo
não é único; os dois estados de vácuo estão ligados por operação discreta: η → −η.
Além disto, o potencial tem um máximo local em φ = 0. Este é um ponto de equilı́brio
mas meta-estável. Este estado é chamado de falso vácuo.
A equação de movimento que rege a evolução deste campo é,

2φ = −V 0 (φ) , (9.3)

onde a linha indica derivada em relação ao campo φ. Utilizamos também a notação


padrão para o operador D’Alambertiano:

1 ∂2 ∂2 ∂2 ∂2
2≡ − − − . (9.4)
c2 ∂t2 ∂x2 ∂y 2 ∂z 2

Consideremos agora uma configuração estática do campo φ onde ele dependa apenas
da coordenada z. Neste caso a equação (9.3) se simplifica, resultando em,

d2 φ
2
= V 0 (φ) . (9.5)
dz
Esta equação admite a integral primeira (após ser multiplicada por dφ
dz
), que tem a
forma
1  dφ 2
−V (φ) = C , (9.6)
2 dz
onde C é uma constante. Procurando agora uma solução tal que o potencial e o
termo cinético se anulem quando z → ±∞, o que é necessário para que a energia da
configuração seja finita, obtemos a integral
Z r Z
dφ 2 dφ
z − z0 = ± p =± . (9.7)
2V (φ) λ φ2 − η 2

Esta integral tem solução sob a forma,



2 φ
z − z0 = ∓ √ arctanh . (9.8)
η λ η

Ou,
h η √λ i
φ = ∓η tanh √ (z − z0 ) . (9.9)
2
Observe-se que, quando z → ±∞, φ → ±η. Além do mais, a derivada de φ tende a
zero neste limite, o que mostra a coerência com a condição inicialmente imposta.
A solução descrita anteriormente pode dar origem a uma parede cósmica. Existem,
de fato, duas soluções: a que corresponde ao sinal positivo e a que corresponde ao
sinal negativo. No primeiro caso, a configuração tende para o estado de vácuo −η
quando z → +∞, e para o estado de vácuo +η quando z → −∞. No segundo caso, o
comportamento é invertido. A existência de uma parede cósmica, neste caso, é devido

328
ao fato que, se em duas regiões vizinhas, uma delas se encontra no primeiro estado,
e a outra no segundo estado, há um defeito topológico na superfı́cie de contato entre
estas duas regiões. No caso, a superfı́cie de contato que define o defeito topológico é o
plano (x, y); logo, a parede cósmica é um defeito topológico bi-dimensional. Observe-
se que uma das configurações não pode se deformar continuamente levando à outra
configuração. Desta forma, o defeito se forma inevitavelmente na interface entre as
duas regiões que se estabeleceram em diferentes estados de vácuo.
Na interface entre duas regiões em diferentes estados de vácuo o campo escalar não
pode se encontrar em nenhum dos dois estados de vácuo diferentes. Logo, a única
possibilidade é que o campo escalar esteja no estado de falso vácuo, quer dizer, no
estado φ = 0. Portanto, a parede carrega uma energia com densidade correspondendo à
do falso vácuo. As paredes cósmicas são, devido a isto, defeitos topológicos perigosos
do ponto de vista cosmológico: como são objetos bi-dimensionais, a quantidade de
energia que elas carregam é imensa, e pode conduzir ao recolapso do Universo ainda
em sua fase primordial. Entretanto, configurações mais complexas que a descrita acima
podem fornecer resultados que evitam este problema.

9.5 Tensor de momento energia para um fluido de


parede cósmica
Podemos calcular a energia e a equação de estado de um fluido de paredes cósmicas.
O tensor de momento-energia associado a um campo escalar com auto-interação é
1 1
Tµν = φ,µ φ,ν − gµν φ,ρ φ,ρ + gµν V (φ) . (9.10)
2 2
A densidade de energia está associada à componente 0 − 0 do tensor de momento-
energia, enquanto a pressão está associada às componentes espaciais Tij :

T00 = ρ , Tij = pδij . (9.11)

Calcularemos primeiramente a densidade de energia:


1
ρ = T00 = ∂t φ∂t φ − g00 ∂ρ φ∂ ρ φ + g00 V (φ)
2
1  2 1
= ∂z φ + λ(φ2 − η 2 )2
2 4
λ 4 1
= η h √ i , (9.12)
2 cosh4 η√ λ (z − z )
2 0

onde utilizamos a solução para paredes cósmicas (9.9) e a métrica minkowskiana gµν =
ηµν = (1, −1, −1, −1). Para a pressão px ao longo do eixo x, temos
1
px = Txx = ∂x φ∂x φ − gxx ∂ρ φ∂ ρ φ + gxx V (φ)
2
329
1  2 1
= − ∂z φ − λ(φ2 − η 2 )2
2 4
λ 4 1
= − η h √ i . (9.13)
2 cosh4 η√ λ (z − z )
2 0

Seguindo os mesmos passos, podemos encontrar a expressão para a pressão nas direções
y e z:
λ 1
py = − η 4 h √ i , (9.14)
2 cos4 η√ λ (z − z )
2 0

pz = 0 . (9.15)

Desta forma, a expressão o tensor de momento-energia de uma corda cósmica é


λ 4 1
Tµν = η h √ i (1, −1, −1, 0) . (9.16)
2 cos4 η√ λ (z − z )
2 0

O exemplo apresentado acima refere-se a uma parede cósmica orientada ao longo da


direção z. Em um Universo homogêneo e isotrópico, tem-se na verdade um gás de
paredes cósmicas, com orientações aleatórias. Logo, para se obter a equação de estado
associado a um fluido de paredes cósmicas, é preciso realizar uma média espacial sobre
todas as orientações possı́veis. Realizando esta média espacial, obtém-se a seguinte
expressão para um fluido cosmológico de paredes cósmicas:

Tµν = ρ(1, −2/3, −2/3, −2/3) . (9.17)

Logo, neste caso, a equação de estado para um fluido cosmológico de cordas cósmicas

2
p=− ρ . (9.18)
3
As cordas cósmicas representam, portanto, um fluido com pressão negativa. Estes
tipos de fluidos desempenham um papel muito importante em cosmologia visto que eles
podem gerar uma fase de expansão acelerada do Universo, o que é bastante interessante
por razões que serão expostas posteriormente.

9.6 Cordas cósmicas e monopolos


As propriedades discutidas acima para o caso das paredes cósmicas estão intrinsica-
mente ligadas ao fato que o estado de vácuo para o campo escalar apresenta a simetria
discreta η → −η. Entretanto, existem teorias de campos baseadas em campos escalares
complexos. Para estes campos a simetria do estado de vácuo muda inteiramente. Além
do mais, o próprio campo escalar pode ser um multipleto, com componentes definidas
em um espaço abstrato, que podemos denominar de espaço interno. Podemos ilustrar
o significado deste espaço interno considerando o caso das partı́culas elementares. Os

330
quarks, por exemplo, aparecem em três pares, como explicitado no capı́tulo anterior.
Cada par é caracterizado por um ”sabor”, sendo que as partı́culas de cada par se
distinguem pela carga elétrica. Existem propriedades de simetria conectando estas
partı́culas. Diz-se então que estas simetrias agem sobre o espaço abstrato, interno,
onde cada vetor neste espaço caracteriza um estado associado a uma determinada
partı́cula com um valor para a carga elétrica e com um determinado sabor. Estas
simetrias diferem portanto das simetrias do espaço-tempo, como translação e rotação.
Do ponto de vista do espaço-tempo, o campo complexo a que nos referimos inicial-
mente é um escalar; mas do ponto de vista do espaço interno, ele se comporta como
uma quantidade contendo componentes e que possui simetrias especı́ficas. Com es-
tas estruturas mais complexas, podem-se se formar defeitos topológicos chamados de
cordas cósmicas, ou ainda podem se formar os chamados monopolos magnéticos. O
que distingue um caso do outro é a estrutura do vácuo, em particular seu grupo de
simetria.
No caso das cordas cósmicas o campo escalar é complexo. Portanto, a Lagrangiana
que descreve o sistema lê-se
√ h1 i
L= −g ∂ρ φ∗ ∂ ρ φ − V (φ∗ φ) . (9.19)
2
Seguindo o exemplo anterior, pode-se escolher um potencial sob a forma

λ ∗
V (φ∗ φ) = (φ φ − η 2 )2 . (9.20)
4
Este potencial tem um estado de vácuo, caracterizado como antes por V (φ∗ φ) = 0,
correspondendo a
φ = η eiθ . (9.21)

Quando θ é uma constante, teremos uma corda cósmica global. Por outro lado, quando
θ for uma função das coordenadas espaciais e temporais, tem-se uma corda cósmica
local. Neste último caso, é necessário considerar também, na análise do problema, o
campo eletromagnético que corresponde a esta corda. Por simplicidade, vamos nos
deter no caso das cordas cósmicas globais.
O potencial (9.20) tem a forma de um ”chapéu mexicano” que foi mostrado no capı́tulo
anterior. O estado de vácuo onde V (φ∗ φ) = 0 corresponde a um cı́rculo. Existe ainda
4
um máximo local em φ = 0, onde a energia é dada por V (0) = λη4 . Quando o campo
escalar se estabelece no seu estado de menor energia, ele deve ”escolher” um valor para
o mı́nimo permitido por (9.21), o que implica em definir um valor para θ no intervalo
0 ≤ θ ≤ 2π. Diferentes regiões, que não possuam contato causal, escolherão diferentes
valores para θ, portanto diferentes estados de vácuo. Isto novamente criará defeitos
topológicos. Só que agora, devido à simetria do estado de vácuo, os objetos serão cor-
das cósmicas, defeitos topológicos unidimensionais que apresentam, por conseguinte,
simetria cilı́ndrica, como veremos posteriormente.

331
Quando duas regiões com diferentes escolhas de θ se tocam, é possı́vel ”girar” contin-
uamente a orientação do vácuo de maneira a fazer a transição de um estado de vácuo
para o outro e nenhum defeito topológico ocorre. Mas quando três regiões que corre-
spondem a diferentes ”escolhas” de θ se tocam, isto não ’e mais possı́vel. A interseção
entre três regiões formará uma linha. Nestes pontos de interseção, o campo escalar
não poderá ter o valor correspondente a nenhum dos três estados de vácuo. Logo, a
única configuração de equilı́brio possı́vel é que o campo escalar fique no máximo local
correspondente a φ = 0. Este é o estado de falso vácuo para esta teoria. Temos por-
tanto uma corda cósmica, um defeito topológico que, no modelo descrito pelo potencial
(9.20), possui uma energia associada ao estado de falso vácuo.
O cálculo das componentes do tensor de momento-energia da corda cósmica apre-
senta dificuldades consideráveis, comparado com o que foi apresentado para as pare-
des cósmicas. As equações, de fato, são muito mais complicadas, sobretudo quando
se considera cordas cósmicas com simetria local, e em geral é preciso realizar uma
série de aproximações ou simplesmente empregar métodos numéricos. Tais análises
mostram que quando se tem um fluido cosmológico de cordas cósmicas, o tensor de
momento-energia deste fluido assume a forma

Tµν = ρ(1 − 1/3, −1/3, −1/3) . (9.22)

O fluido cosmológico de cordas cósmicas apresenta, como no caso das paredes cósmicas,
pressão negativa.
Ao contrário do caso das paredes cósmicas que apresentam vários problemas quando
introduzidas em uma estrutura cosmológica, as cordas cósmicas se revelam bem mais
interessantes. Em primeiro lugar, a contribuição de um fluido de cordas cósmicas para
a densidade total de energia do Universo não é tão catastrófica como no caso das
paredes cósmicas, justamente por se tratarem de objetos uni-dimensionais: um fluido
de corda cósmica pode existir sem contradizer o cenário de um Universo em expansão
compatı́vel com as observações. Além do mais, as cordas cósmica fornecem um cenário
para a formação de estruturas locais no Universo (galáxias, aglomerados de galáxias,
etc.) bem atraente.
De fato, um dos grandes problemas para explicar a existência de estruturas locais no
Universo reside no mecanismo de aglomeração local de matéria quando se considera
um universo globalmente homogêneo e isotrópico. O espaço-tempo criado por uma
corda cósmica se assemelha ao de um plano do qual se teria tirado uma fatia em
forma de cunha, a partir do ponto onde se localiza a corda cósmica, e depois colado as
bordas. Isto é denominado de ”déficite angular”. Partı́culas que se deslocam a partir
de regiões distantes (portanto planas), em trajetórias paralelas, ao se aproximarem da
corda cósmica são como que ”focalizadas”, suas trajetórias se aproximando. Quando
as cordas cósmicas se deslocam em um espaço onde as partı́culas estão em repouso
(precisamente o que acontece em um universo homogêneo e isotrópico, no sistema

332
de coordenadas co-móvel), este deslocamento provoca aglomeração de matéria, dev-
ido ao déficite angular na geometria na vizinhança da corda cósmica, provocando o
aparecimento de poços de potencial que gerarão posteriormente objetos como galáxias
e aglomerados de galáxias. Se este cenário corresponde realmente ao que ocorre na
natureza, apenas uma comparação detalhada com a observação poderá decidir.
Outro defeito topológico possı́vel são os monopolos magnéticos. Para que eles ocorram
é necessário que exista um multipleto de campos escalares. Quando este multipleto
inclui três campos escalares, podemos escrever

~ = (φ1 , φ2 , φ3 ) .
φ (9.23)

Ao escrevermos o campo como em (9.23) estamos querendo dizer que os três campos
escalares estão relacionados por transformações de simetria, que no caso são simetrias
internas (quer dizer, simetrias diferentes às do espaço-tempo), como às do isospin.
Neste caso, o grupo de simetria é o SO(3) que corresponde ao grupo rotação neste
espaço abstrato.
Os monopolos seriam, portanto, descritos pela Lagrangeana
√ ~ µφ~ − V (φ.
~ φ)]
~
L= −g[∂µ φ.∂ , (9.24)

onde o potencial pode ser, por exemplo,

V (φ. ~ = λ (φ.
~ φ) ~φ ~ − η 2 )2 . (9.25)
4
Observem que definimos um produto interno no espaço interno onde ”vive” o mul-
tipleto de campos escalares. Novamente, temos um máximo local, correspondendo a
~ = ~0, e um estado de vácuo correspondendo a φ.
φ ~φ ~ = η 2 . Agora, o estado de vácuo
tem uma simetria SO(3), com a estrutura de uma esfera, e não mais de um cı́rculo
como no caso das cordas cósmicas.
Para que um defeito topológico se forme agora será preciso a interseção de quatro
regiões que se estabeleceram em diferentes estados de vácuo. Temos assim um ponto.
Neste ponto, os campos não poderão estar em nenhum dos diferentes estados de vácuo
das regiões que se interceptam. Assim, de novo, a única possibilidade é que ali os
campos se encontrem no estado de equilı́brio correspondente ao máximo local. Temos
portanto um defeito pontual. É este defeito que chamamos de ”monopolo magnético”.
Esta denominação se deve ao fato que, além do defeito ser pontual, a interação que
ele cria em torno dele, possui simetria esférica. Tudo se passa, portanto, como se este
defeito correspondesse a uma carga pontual.
Os monopolos magnéticos carregam também uma energia associada ao fato de se en-
contrarem em um estado de falso vácuo. Mas, a existência de monopolos magnéticos
traz também problemas a nı́vel cosmológicos. Isto porque a energia deste estado
de falso vácuo é determinada pela energia em que ocorre a transição de fase. Con-
figurações do tipo monopolar surgem em teorias de Grande Unificação, que predizem

333
transições de fase com escalas de energia da ordem de 1014 GeV . Como no caso das
cargas elétricas, teremos dois ”sinais” possı́veis, correspondendo aos monopolos e anti-
monopolos. Calculando a abundância de monopolos criados no momento da transição
de fase, teremos uma contribuição destes objetos para a densidade total do Universo
muito superior à densidade crı́tica, e o Universo já teria se recolapsado muito antes
que as galáxias pudessem ter se formado. Este problema pode ser resolvido no âmbito
do modelo de inflação a ser descrito posteriormente.
Existem várias outras estruturas de defeitos topológicos possı́veis. Se considerarmos,
por exemplo, um multipleto de campos escalares com quatro componentes, transições
de fase podem originar o que se denomina usualmente de texturas. A representação
visual de tais defeitos é bem mais complicada. Por outro lado, podem existir defeitos
hı́bridos, como cordas cósmicas que têm em suas extremidades monopolos magnéticos.
Outras configurações são possı́veis, e que dependem do conteúdo da teoria e do mecan-
ismo de quebra de simetria.

9.6.1 Defeitos topológicos e os raios cósmicos de alta energia

Existem ”sinais” que permitem detectar a presença dos defeitos topológicos descritos
acima? Em princı́pio, existem várias possibilidades de verificar se defeitos topológicos
se formaram durante a evolução do Universo. Uma delas já foi mencionada: as cordas
cósmicas podem gerar um mecanismo para a formação das estruturas locais existentes
no Universo. Se as cordas cósmicas foram realmente as ”sementes” das estruturas
locais, o mecanismo de geração dessas estruturas deve estar refletido nas caracterı́sticas
gerais da distribuição de matéria no Universo, por exemplo no espectro da anisotropia
da radiação cósmica de fundo, que será descrito posteriormente.
Mas, existem outras possibilidades. Uma delas vem dos chamados ”raios cósmicos de
alta energia”. A Terra é constantemente bombardeada por partı́culas vindas do espaço,
por exemplo prótons. Estes prótons possuem em geral uma energia extremamente alta,
e ao colidirem com as partı́culas da região externa da atmosfera terrestre, geram um
”chuveiro” de partı́culas secundárias que chegam à superfı́cie da Terra. O estudo da
estrutura deste ”chuveiro” de partı́culas permite ter várias informações, como a energia
do próton primário, a direção da região no espaço de onde veio o próton, etc.
Raios cósmicos de energias extremamente altas já foram detectados. Tem-se eventos
de raios cósmicos com energia de até 1022 eV , o que é uma energia muito alta. Afinal,
aceleradores na Terra permitem acelerar partı́culas com energia de até 1012 eV . Muitos
daqueles raios cósmicos de alta energia podem ter se originados em mecanismo con-
hecidos, como a explosão de supernovas. Mas, quando a energia se torna muito elevada,
não se tem ainda um mecanismo eficaz para gerá-los.
Além do mais, as partı́culas ao se deslocarem no espaço interagem com os fótons
da radiação cósmica de fundo. Eles perdem portanto energia devido à interação com

334
estes fótons através do efeito Compton. Cálculos detalhados indicam que nenhuma
partı́cula deveria chegar à Terra com energia superior a aproximadamente 1020 eV .
Este é o chamado limite GZK3 . O fato de partı́culas de origem cósmica com energia
superior ao estabelecido por aquele limite já tenham sido detectadas é um dos grandes
enigmas na fı́sica atual.
Os defeitos topológicos são um dos candidatos para a origem de raios cósmicos com
energia tão alta. Como já foi dito, os defeitos topológicos carregam uma grande quan-
tidade de energia. Partı́culas podem, portanto, se encontrar aprisionadas no defeito.
Devido a própria dinâmica seguida por estes defeitos, estas partı́culas podem se lib-
erar, decaindo em seguida em, por exemplo, prótons com energia compatı́vel com
os raios cósmicos mais energéticos já detectados. Este mecanismo é particularmente
atraente no caso dos monopolos e das cordas cósmicas. Mas, apenas um estudo mais
detalhado permitirá decidir a verdadeira origem destes misteriosos raios cósmicos de
alta energia.

9.7 O modelo de Inflação

9.7.1 Introdução

O modelo cosmológico padrão (MCP) é muito bem sucedido sob vários aspectos.
Esteticamente, trata-se de um modelo simples e coerente. Além disto ele leva a
predições que concordam de maneira surpreendente (dada a sua simplicidade) com
as observações. Em primeiro lugar, ele incorpora naturalmente o cenário de um Uni-
verso em expansão. Depois, ele explica de forma muito natural a existência de uma
temperatura do Universo, representada pela radiação cósmica de fundo, altamente
isotrópica, consistente com o espectro planckiano de um corpo negro à temperatura
de 2, 7 K. Por fim, o MCP prevê a abundância dos elementos quı́micos leves (hidrogênio
até o lı́tio), com uma concordância com os dados observacionais a menos de 1%, algo
extraordinário tendo-se em vista que o processo de nucleossı́ntese primordial ocorreu
nos primeiros 180 s da história do Universo, quer dizer, em torno de 15 bilhões de anos
atrás.
Os sucessos do MCP não devem, entretanto, ocultar os sérios problemas que o afetam.
Entre estes problemas podemos citar, notadamente, o da platitude do Universo, o do
horizonte e o da formação das estruturas locais (galáxias, aglomerados de galáxias,
etc) observadas. Esses problemas serão descritos com mais detalhes a seguir, mas
no momento podemos unicamente enfatizar que todos eles estão relacionados com a
questão da escolha de condições iniciais muito particulares para o Universo no seu
inı́cio para que aqueles sucessos citados anteriormente sejam obtidos.
3
Abreviação dos sobrenomes dos fı́sicos que determinaram este fenômeno, o americano Kenneth
Greisen e os russos Georgi Zatsepin e Vadim Kuz’min

335
Estas dificuldades associadas ao MCP podem ser, de uma certa maneira, resolvidas se
supusermos que existiu uma fase de expansão exponencial no Universo primordial, bem
antes que a nucleossı́ntese ocorra. Este perı́odo de expansão exponencial, ou quase ex-
ponencial, é denominado de fase inflacionária. Chama-se de modelos inflacionários as
tentativas de explicar porque esta fase ocorreu. Este capı́tulo destina-se a fornecer uma
visão geral do que seria esta fase inflacionária, como ela resolve alguns dos problemas
do MCP, e quais são as dificuldades que se encontram para sua implementação. Um
aspecto muito interessante dos modelos inflacionários é que eles constituem uma inter-
essante aplicação dos conceitos e técnicas da teoria quântica de campos à cosmologia,
tais como teorias de unificação, transições de fase, etc. Fundamentalmente, o modelo
de inflação se baseia em um campo escalar, denominado inflaton, que adquire massa
em um processo de quebra espontânea de simetria devido ao processo de expansão, e
consequente resfriamento, do Universo.

9.8 Os problemas do Modelo Cosmológico Padrão


Vamos descrever agora brevemente quatro dos principais problemas do modelo cos-
mológico padrão: o problema do horizonte; o problema da platitude; o problema das
perturbações cosmológicas iniciais; o problema dos monopolos magnéticos.

9.8.1 O problema do horizonte

O Universo encontra-se hoje em um estado de equilı́brio térmico, exibindo uma tem-


peratura de 2, 7 K. Em qualquer direção do céu, o espectro fotônico de fundo é sempre
o mesmo, a menos de pequenas anisotropias da ordem de 10−5 . Entretanto, se recuar-
mos no passado, percebe-se que estamos recebendo fótons de regiões que, no momento
de sua emissão, não se encontravam em contato causal. Logo, é surpreendente que
estas regiões exibam a mesma temperatura.
Para compreender quantititativamente isto, vamos considerar que recebemos agora
fótons vindos de duas fontes localizadas em direção diametralmente opostas no céu.
Estes fótons foram emitidos no momento em que a radiação se desacoplou da matéria.
No MCP, isto ocorreu em td ∼ 1012 s, sendo que t0 ∼ 1017 s corresponde ao momento
atual. Podemos calcular a distância da fonte até nós considerando a trajetória do
fóton. Vamos supor que esta trajetória seja radial. Por simplicidade, será assumido
que o fator de escala se comporta como a(t) = a0 t1/2 , sendo a0 uma constante que fixa
a escala, durante toda a história do Universo. Isto introduz, em relação ao resultado
exato, um erro da ordem da unidade. Então,
dt
ds2 = c2 dt2 − a2 (t)dr2 = 0 → dr = ±c
a(t)
Z 0 Z tr
dt 1 1
dr = −c → re = 2c (tr1/2 − te1/2 ) ≈ 2c t1/2 . (9.26)
re te a(t) a0 a0 r

336
onde designamos pelo sub-escrito e as quantidades de emissão, e pelo sub-escrito r
as quantidades de recepção. Escolhemos acima o sinal negativo de maneira a ter um
valor positivo para a distância coordenada da fonte ao receptor. Consideramos que
tr >> te .
Por outro lado, nós podemos calcular o tamanho do horizonte causal na época em que
os fótons foram emitidos, quer dizer, te . Isto define a região que possui conexão causal.
Para calcular esta região, naquela época, devemos avaliar a distância percorrida por
um fóton desde o inı́cio da história do Universo. Temos, usando o mesmo procedimento
que no caso anterior,
Z te 1/2
dt te
rc = c = 2c .. (9.27)
0 a(t) a0
Dividindo a distância coordenada entre as fontes pela distância causal, obtemos
r
2re tr
= ∼ 103 . (9.28)
rc te

Assim, as regiões que emitiram os fótons que recebemos hoje em direções diametral-
mente opostas, estavam separadas por uma distância mil vezes maior que o horizonte
causal naquela época. Logo, elas não poderiam se encontrar hoje em equilı́brio térmico.
Entretanto, observamos que estas regiões exibem a mesma temperatura. Este é o prob-
lema do horizonte.

9.8.2 O problema da platitude

Em princı́pio, o Universo pode apresentar uma curvatura espacial positiva (uma es-
fera), nula (um plano) ou negativa (uma pseudo-esfera). A curvatura espacial do Uni-
verso é determinada pela densidade de matéria nele existente. Para uma dada densi-
dade, denominada de densidade crı́tica, o Universo teria curvatura espacial nula; se
a densidade for superior a esta densidade crı́tica, sua curvatura será positiva; se a
densidade for inferior à densidade crı́tica, a curvatura será negativa.
Consideremos a equação de Friedmann, quer dizer, a componente temporal das
equações de Einstein:
 8π
H2 + 2 = Gρ , (9.29)
a 3
onde H = aȧ , ρ é a densidade total de matéria do Universo, incluindo a contribuição dos
bárions, radiação, etc, e k é a curvatura da seção espacial. Dividindo toda a equação
por H 2 e re-arranjando os termos, temos então,
 8πG ρ
1−Ω=− , Ω= . (9.30)
a2 H 2 3 H2
O parâmetro Ω é conhecido como parâmetro de densidade. Observe-se que quando Ω =
1, o Universo é espacialmente plano, quer dizer, k = 0. Isto define a densidade crı́tica.
Utilizando os valores de hoje, quer dizer, H0 ≈ 72 Mkmpc.s
, obtemos ρc0 ≈ 10−29 cmg 3 .

337
As observações hoje indicam que Ω0 ∼ 1, 02, quer dizer, a densidade do Universo é,
pelo menos, muito próxima à densidade crı́tica. O problema da platitude surge do fato
que a equação (9.30) depende do tempo. Para um Universo em expansão dominado
pela matéria, a = a0 t2/3 e H = 3t2 . Assim,

9 t2/3
1−Ω=− . (9.31)
4a20

Logo, a medida que o tempo passa, o parâmetro de densidade se afasta do seu valor
crı́tico, salvo se desde o inı́cio Ω = 1, o que fixa de uma vez por todas k = 0.
Reversamente, a medida que voltamos a tempos anteriores, para um dado valor de Ω,
mais e mais o parâmetro de densidade se aproxima do seu valor crı́tico. Em outras
palavras, a densidade crı́tica representa um ponto de equilı́brio instável. Por exemplo,
se hoje (t0 ∼ 1017 s), Ω0 é próximo da unidade pelo valor citado acima, quer dizer
Ω0 −1 ∼ 0.02, na época do desacoplamento entre a matéria e a radiação (td = 1011 s), o
parâmetro de densidade deveria ter um valor tal que Ωd −1 ∼ 2×10−4 . Se remontarmos
ao perı́odo da nucleossı́ntese primordial (tn ∼ 1 s), Ωn − 1 ∼ 10−6 .
Em outras palavras, para que o parâmetro de densidade tenha hoje um valor próximo
ao crı́tico, em tempos anteriores, ele deveria estar extremamente próximo ao valor
crı́tico.
Este fato implica que, para explicar o valor de Ω hoje, é preciso uma escolha ex-
tremamente particular do parâmetro de densidade no inı́cio da história do Universo.
Esta escolha parece ser pouco natural, por ser muito particular. Este é o problema da
platitude.

9.8.3 O problema das perturbações primordiais

O raio visı́vel do Universo hoje é o chamado raio de Hubble. O raio de Hubble pode ser
caracterizado pela distância que a luz percorreu desde o inı́cio da história do Universo
até hoje. Logo,
c
RH = , (9.32)
H0
uma vez que a idade do Universo é dada pelo inverso da constante de Hubble. As
estruturas locais no Universo são caracterizadas por flutuações na distribuição de
matéria cuja escala é dada pelo comprimento de onda λ. Em princı́pio, λ se estende,
teoricamente, de zero a infinito. Vamos considerar uma flutuação ocorrida no Uni-
verso primordial, de comprimento de onda λi . À medida que o Universo expande, o
comprimento de onda da flutuação é também esticado devido à variação do fator de
escala a(t). Aliás isto resulta da própria noção de fator de escala. Entretanto, o raio
de Hubble definido acima varia com a constante de Hubble, isto é, cresce linearmente
com o tempo, já que H ∝ 1t . Mas, para um Universo dominado pela radiação ou pela
matéria, o fator de escala varia com o tempo segundo uma lei de potência: a(t) ∝ t2/3

338
para um Universo dominado pela matéria; a(t) ∝ t1/2 , para um Universo dominado
pela radiação. Assim, se uma dada perturbação se originou no Universo primordial
dentro do raio de Hubble naquela época (o que devemos esperar, uma vez que a flu-
tuação deve ter uma origem causal), ela terá uma escala efetiva cada vez menor que o
raio de Hubble, de maneira que hoje todas aquelas flutuações deveriam ter uma escala
extremamente menor que raio de Hubble hoje. Mas, existem estruturas cuja dimensão
caracterı́sticas são da ordem do raio de Hubble. Há aı́ uma dificuldade inegável.

Por outro lado, é preciso compreender a origem das flutuações primordiais que deram
origem às estruturas conhecidas hoje. O mecanismo de geração destas flutuações deter-
mina as propriedades estatı́sticas da aglomeração de matéria hoje. No MCP, não existe,
em princı́pio, nenhum mecanismo natural, a não ser as flutuações estatı́sticas normais
de um gás. Ocorre, que isto resulta em flutuações de amplitude extremamente pequenas
que não poderiam resultar nas estruturas observadas hoje. Há também o mecanismo
das cordas cósmicas que, entretanto, parece ser desfavorecido pela observação.

9.8.4 O problema dos monopolos magnéticos

Poderı́amos dizer que o problema do monopolo reflete na verdade a dificuldade do


MCP de incorporar, por si só, o aparecimento de qualquer fóssil de uma transição
de fase ocorrida no Universo primordial. Suponhamos uma transição de fase ocor-
rida quando o Universo tinha t ∼ 10−30 s. Nesta época, a temperatura do Universo
deveria ser da ordem de T ∼ 1016 GeV . O raio de Hubble na época era igual a
RHi ∼ 10−20 cm. Suponhamos agora que um monopolo magnético tenha sido for-
mado, graças a esta transição de fase, em cada região causal. Quer dizer, terı́amos um
monopolo magnético por horizonte de Hubble naquela época. Ora, a massa de cada
monopolo pode ser avaliada, e para transições no seio da Teoria de Grande Unificação,
terı́amos uma massa mm ∼ 1016 GeV . Isto conduz a uma densidade de matéria, na
época, devido aos monopolos, da ordem de ρi ∼ 1045 cmg 3 . Se a densidade de matéria
decresce com o cubo do fator de escalar, isto corresponderia hoje a uma densidade
de matéria devida aos monopolos da ordem de ρ0 ∼ 1013 cmg 3 . Esta densidade é 42
ordens de magnitude maior que a densidade crı́tica. Em outras palavras, a existência
de monopolos magnéticos devido a transição de fase resultante da quebra espontânea
de simetria em Teorias de Grande Unificação, implicaria que o Universo teria uma
curvatura positiva extremamente grande, e já teria recolapsado muito antes que as
galáxias (e consequentemente a vida tal como a conhecemos) tivessem se formado.
Assim, o MCP dificilmente poderia incorporar a existência de fósseis das transições
de fase que devem ter ocorrido no Universo primordial.

339
9.9 Uma fase de expansão acelerada no Universo
primordial
Uma das caracterı́sticas importantes do MCP é o fato que o Universo exibe uma
expansão sub-luminal. Isto quer dizer que o Universo está desacelerando: ä < 0. A
desaceleração do Universo é fruto do tipo de matéria que nele existe, radiação ou
matéria sem pressão. De fato, a partir das equações de Einstein, nós temos
n
ä 4πG X
=− (1 + 3ωi )ρi , (9.33)
a 3 i=0

onde i = 1, ..., n indicam oss diferentes componentes materiais, e onde supomos que
estes diferentes componentes obedecem uma equação de estado pi = αi ρi . É evidente,
a partir desta expressão, que se 1 + 3αi > 0, então inevitavelmente ä < 0, e o Universo
desacelera. Isto ocorre em particular se a pressão de cada fluido é positiva. Mas, se
por acaso existem fluidos de pressão negativa, é possı́vel gerar uma fase de expansão
acelerada.
Os problemas citados anteriormente que afetam o MCP podem ser solucionados se
houver uma fase na história primordial do Universo em que os fluidos que dominaram
o conteúdo energético têm pressão negativa, gerando conseqüentemente uma expansão
acelerada. A seguir, nós veremos que a introdução de uma fase de expansão acelerada,
pode solucionar os problemas citados acima. Entretanto, podemos observar a partir
de (9.33) que para se obter uma expansão acelerada é preciso introduzir um fluido
com pressão negativa, tal que 1 + 3αi < 0.
Fluidos com pressão negativa são, em princı́pio, objetos exóticos. Mas, na verdade,
eles ocorrem em situações ordinárias. Pode-se ter uma descrição de situações onde
eles surgem nas referências [5, 6]. Em Relatividade Geral, há uma forma natural de
introduzir uma fase acelerada: a inclusão de uma constante cosmológica nas equações
de Einstein. Na verdade, a quatro dimensões, a forma mais geral de se escrever as
equações de Einstein é:
1
Rµν − gµν R − Λgµν = 8πG Tµν , (9.34)
2
onde Λ é a constante cosmológica. Esta é a forma mais geral das equações de Einstein
visto que o lado esquerdo desta equação representa o tensor mais geral que se pode
escrever a quatro dimensões que tenha divergência nula e que conduza a equações
diferenciais de segunda ordem (ainda que não lineares).
Com a introdução da constante cosmológica, as equação (9.33) se torna,
n
ä 4πG X Λ
=− (1 + 3ωi )ρi + , (9.35)
a 3 i=0 3

Portanto, a constante cosmológica pode gerar uma fase de expansão acelerada (ä > 0)
se este termo dominar sobre as outras formas de matéria.

340
Vamos, a seguir, considerar que o termo cosmológico domina sob os demais. Se pode-
mos ignorar o primeiro termo do lado direito de (9.35), nós temos como solução para
o fator de escala, para o caso onde a secção espacial é plana:
r Λ 
a(t) ∝ exp t . (9.36)
3
Quer dizer, o Universo se expande exponencialmente. Uma fase onde o Universo se
comporta desta forma é denominada de fase de de Sitter.
Vamos supor, por enquanto, que o Universo atravessou uma fase de expansão aceler-
ada bem no inı́cio de sua história. Isto pode conduzir a uma solução para os problemas
citados acima. A solução para o problema da platitude é imediata. Basta analisar a
equação (9.30): O termo H é constante, enquanto o fator de escala cresce exponen-
cialmente; logo, 1 − Ω se aproxima exponencialmente de zero; uma fase acelerada
prediz que o Universo deve tender rapidamente para uma situação onde sua densidade
é quase igual à densidade crı́tica, como observamos hoje.
No que diz respeito ao problema do horizonte, é preciso analisar novamente a evolução
do horizonte partı́cula. Tı́nhamos visto que a distância coordenada do horizonte
partı́cula é dado por (9.26). Agora, nós devemos dividir o processo de integração
em duas partes: primeiramente, o Universo é dominado pela constante cosmológica,
o que gera a expansão acelerada; depois, a radiação domina o conteúdo material do
Universo. Os detalhes relativos à implementação deste cenário serão discutidos poste-
q
riormente. O fator de escala se comporta inicialmente como a(t) = a1 eM t , M = Λ3 ,
evoluindo posteriormente como a(t) = a2 t1/2 . As constantes a1 e a2 dependem das
condições de junção, que impõe que o fator de escala deve ser uma função contı́nua
do tempo, e da normalização escolhida para este mesmo fator de escala. Neste caso,
considerando que a fase de expansão acelerada termina em t = tf , impondo que o
valor do fator de escala neste momento é igual a 1 (o que sempre é possı́vel, já que
isto implica em fixar a escala), obtemos :

a = eM (t−tf ) , 0 ≤ t ≤ tf ; (9.37)
(9.38)

Assim,
tf
dt0
Z
rc = . (9.39)
0 a(t0 )
Tem-se então,
1 M tf
rc = (e − 1) . (9.40)
M
Vamos supor que tf ∼ 10−33 s, que é a época onde a Teoria de Grande Unificação
sofre uma quebra espontânea de simetria. O valor final de rc , quer dizer, da região
causalmente conectada, pode ser extremamente grande se M tf >> 1. Isto implica que
o valor da constante cosmológica deverá ser muito grande para que o problema do
horizonte seja resolvido. Veremos posteriormente que isto pode de fato ocorrer.

341
O problema da superprodução de monopolos é resolvido similarmente. Como a den-
sidade de monopolo decresce com o inverso do cubo do fator de escala, obtemos que,
devido a expansão exponencial do Universo, a densidade de monopolos decresce ex-
ponencialmente, e com isso a contribuição dos monopolos para a densidade total do
Universo deve ser extremamente pequena. No caso dos problemas das flutuações pri-
mordiais, a expansão acelerada também conduz a resultados bastante positivos. Afi-
nal, as distâncias fı́sicas variam com o fator de escala. Desta forma, durante a fase de
expansão acelerada, os comprimentos de onda das perturbações são esticadas expo-
nencialmente, enquanto o raio de Hubble H = aȧ permanece essencialmente constante.
Com isto, nessa fase, o comprimento de onda das perturbações se torna muito maior
que o raio de Hubble. Quando a fase de expansão acelerada termina, o comprimento
de onda cresce mais lentamente que o raio de Hubble, e pode-se assim facilmente se
ter hoje perturbações cuja escala é comparável ao raio de Hubble hoje.

A fase de expansão acelerada fornece uma elegante explicação para a origem das
flutuações que resultaram nas estruturas observadas hoje no Universo. Como o com-
primento de onda cresce exponencialmente durante esta fase, elas poderiam ser ini-
cialmente muito menores que o raio de Hubble naquela época. Com isto, podemos
pensar que as flutuações primordiais eram de origem quântica. Os termos perturba-
tivos devem, portanto, serem descritos por modos quânticos. Estes modos quânticos
devem ser, obviamente, ortonormais. Devido ao processo de normalização dos modos
quânticos, é possı́vel obter o valor da amplitude destas flutuações assim como suas
caracterı́sticas estatı́sticas, uma vez que o estado de vácuo quântico pode ser rep-
resentado por uma distribuição gaussiana, como no caso do problema do oscilador
harmônico na mecânica quântica usual. De fato, os modos perturbativos podem ser
pensados como um conjunto de osciladores harmônicos desacoplados. As observações
recentes do espectro da anisotropia da radiação cósmica de fundo parecem estar em
acordo com este cenário. No caso clássico, a amplitude das perturbações permanece
completamente arbitrária.

9.10 Implementando um modelo inflacionário

Os resultados descritos acima indicam que a existência de uma fase de expansão acel-
erada do Universo, conhecida como fase inflacionária, pode resolver satisfatoriamente
os problemas mais importantes que afetam o modelo cosmológico padrão. A questão é
como gerar esta fase de expansão acelerada. Vimos acima que isto pode ser conseguido
através de uma constante cosmológica. Mas, há um problema maior em utilizar uma
constante cosmológica para este fim: exatamente porque o valor de Λ é constante, en-
quanto todas as outras formas de energia implicam uma densidade que decresce com
a expansão do Universo. Logo, uma vez que a constante cosmológica domina sobre
as outras formas de energia, ela continuará dominando posteriormente. Neste caso, a

342
fase de expansão acelerada jamais terminaria, e isto está em evidente contradição com
o que se conhece do Universo.
Há uma forma elegante e bastante atraente de se lidar com este problema. Ela consiste
em considerar que a fase de expansão acelerada não é gerada por uma constante cos-
mológica, mas por um campo que evolui com a expansão do Universo e que, por um
breve perı́odo de tempo, se comporta como uma constante cosmológica. Tais campos
podem se originar no processo de quebra espontânea de simetria em teorias funda-
mentais, como a teoria de Grande Unificação.
Consideremos um campo escalar com auto-interação. O tensor de momento-energia
para tal campo é dado por
1
Tµν = ∂µ φ∂ν φ − gµν ∂ρ φ∂ ρ φ + V (φ) , (9.41)
2
onde V (φ) é o termo de potencial que expressa a auto-interação do campo. No caso
em que consideramos a métrica de Friedmann-Robertson-Walker,

ds2 = dt2 − a2 (t)γij dxi dxj , (9.42)

onde γij é a métrica sobre a seção espacial a curvatura constante, temos então para
as componentes do tensor momento-energia do campo escalar,
1
T00 = φ̇2 + V (φ) , (9.43)
2
1 
Tij = φ̇ − V (φ) a2 (t)γij .
2
(9.44)
2
Podemos comparar estas expressões com as de um fluido perfeito, para o qual

T00 = ρ , Tij = p a2 (t)γij . (9.45)

Assim, a densidade de energia e a pressão associada a este campo escalar se escrevem,


respectivamente,
1
ρ = φ̇2 + V (φ) , (9.46)
2
1
p = φ̇2 − V (φ) . (9.47)
2
Vimos anteriormente que para gerar uma fase de expansão acelerada é necessário que
o Universo seja dominado por um fluido de pressão negativa. Isto pode acontecer, no
caso de um campo escalar com auto-interação, caso o termo de potencial domine sobre
o termo cinético. De fato, se
1
V (φ) >> φ̇2 , (9.48)
2
então
p ≈ −ρ . (9.49)
Ora, uma equação de estado p = −ρ é o que caracteriza uma constante cosmológica
ou, em outras palavras, um fluido cuja densidade de energia é constante. De fato,

343
Figura 9.1: Forma tı́pica do potencial do inflaton.

utilizando a lei de conservação para um fluido de densidade ρ e pressão p em um


Universo em expansão, junto com a equação de estado acima, temos,


ρ̇ + 3 (ρ + p) = 0 ⇒ ρ̇ = 0 ⇒ ρ = constante . (9.50)
a

O que se deseja no fundo, é um campo escalar com auto-intereção tal que, inicialmente,
o termo cinético domine sobre o termo de potencial, seguido de uma fase onde o termo
de potencial domine sobre o termo cinético (o que gera a expansão acelerada), depois
do que o termo cinético volta a dominar, de tal maneira que o Universo se comporte
como no MCP. Isto pode ser obtido se o potencial tiver, por exemplo, a forma esboçada
na figura (9.1). Um exemplo de potencial com as caracterı́sticas desejadas é o dado
por
V (φ) = V0 − βφ3 + λφ4 , (9.51)

onde V0 , β e λ são constantes positivas. Este potencial diverge para φ → ±∞. Por
outro lado, ele se comporta de forma praticamente constante para φ ≈ 0. Além do
mais, ele tem um mı́nimo absoluto em


φm = . (9.52)

Obviamente, tal potencial representa um campo massivo. De fato, a massa de um
campo escalar é dada por

9 β2
m2 = V 00 (φ)|φ=φm = . (9.53)
4 λ

Um aspecto fundamental no cenário inflacionário é a necessidade que tal modelo leve


a uma transição para a fase de um Universo dominado pela radiação. Afinal, é preciso
que a nucleossı́ntese ocorra, e isto requer um Universo quente, dominado pela radiação.
O modelo descrito acima pode conduzir a esta transição para um Universo dominado
pela radiação. De fato, quando φ ≈ 0, a energia do campo escalar está armazenada
sob a forma de energia potencial, a pressão efetiva é negativa, e o campo escalar se

344
comporta como uma constante cosmológica, gerando uma expansão acelerada. Lenta-
mente, o campo escalar se dirige ao mı́nimo do potencial. Quando isto ocorre, ele
começa a oscilar em torno do ponto mı́nimo. Esse campo escalar não é o único campo
fundamental a estar presente no Universo. Existem os outros campos, que represen-
tam as demais interações. Estes campos estão, no fundo, acoplados. O processo de
oscilação do inflaton, conjuntamente com o seu acoplamento aos outros campos, gera
uma transferência de energia. Os outros campos são excitados, dando inı́cio a um
Universo dominado pela radiação. Tal processo se denomina reaquecimento. Pode-se
também entender este processo como sendo a transformação da energia potencial em
cinética.

Um aspecto delicado no modelo inflacionário reside no fato que não se conhece ainda
campos escalares fundamentais. Entretanto, estes campos devem resultar de teorias
como a Teoria de Grande Unificação, cujos efeitos caracterı́sticos se manifestam a
escalas de energia extremamente altas, muito superiores às que podem ser alcançadas
nos atuais aceleradores de partı́culas. Entretanto, as consequências muito positivas que
tais teorias teriam a nı́vel cosmolológico, as tornam extremamente atrativas. Poderia
ser dito que as consequências cosmológicas de tais teorias são evidências indiretas que
elas devem se realizar na natureza.

9.11 Matéria e energia escuras

9.11.1 Introdução

Um dos problemas maiores em cosmologia consiste em medir a quantidade de matéria


existente no Universo e sua natureza. A forma mais direta de realizar esta medida é
através da detecção e análise da radiação eletromagnética emitida pela matéria dis-
persa no Universo. Entretanto, existem dificuldades quando se tenta deduzir a quan-
tidade de matéria existente no Universo a partir deste método direto. A mais evidente
delas é devido ao processo de absorção: a luz emitida, por exemplo, por um gás em
uma galáxia distante é absorvida parcialmente ou totalmente pela matéria que existe
entre os emissores e os nossos detectores. Logo, devemos esperar que a determinação
da matéria existente no Universo pelo método de detecção direta revele apenas uma
fração da massa total existente.

Assim, é interessante desenvolver métodos indiretos de estimativas da matéria exis-


tente no Universo que não sejam unicamente baseados na detecção da radiação emitida
pela matéria. Um dos métodos indiretos possı́veis é a análise do efeito gravitacional que
a matéria exerce nas suas vizinhanças. Outros métodos foram desenvolvidos através
da análise da anisotropia da radiação cósmica de fundo, lentes gravitacionais, estudo
da distância luminosidade de objetos distantes, como as supernovas tipo Ia, etc. Tais

345
testes, frequentemente, permitem fornecer informações não apenas sobre a quantidade
de matéria, como também sobre sua natureza.

Quando tais métodos indiretos são utilizados, grandes surpresas aparecem. Aparente-
mente, a maior parte da matéria existente no Universo, em torno de 99%, não é detec-
tada diretamente. Uma fração substancial desta matéria não deve ser constituı́da de
átomos ou pelas partı́culas elementares que conhecemos. Além do mais, a maior parte
desta ”matéria oculta” deve ser constituı́da por um fluido exótico cuja a pressão é neg-
ativa (denominado de energia escura), enquanto a outra parte deve ter pressão nula
(denominado de matéria escura). O que são estes constituintes ”não-convencionais”
do Universo? Este é um dos problemas mais importantes hoje em cosmologia.

Neste capı́tulo, revisaremos como se chega às conclusões expostas acima e quais são
as hipóteses para explicar a existência e a natureza da matéria exótica no Universo.
O leitor poderá também consultar as referências [7, 8].

9.12 A matéria escura

A primeira evidência da existência de um constituinte material exótico no Universo


vem da dinâmica das galáxias espirais. As galáxias em geral podem ser classificadas
em espiriais (barradas ou não), elı́pticas e irregulares. As galáxias espiriais são, grosso
modo, caracterizados por uma parte central extremamente densa, de formato aprox-
imadamente esférico, chamado bojo, e pelos braços espirais, bem menos densos. Os
objetos (estrelas, nuvens de gás, etc.) que formam estas galáxias giram em torno
do centro da galáxia em órbitas bem definidas: são órbitas elı́pticas, quase circulares,
sendo o sentido de rotação inteiramente determinado pela estrutura dos braços espirais.
Estas órbitas são chamadas de keplerianas, pois suas caracterı́ticas são essencialmente
as mesmas que as do problema da órbita de um planeta em torno do sol.

Estudanto a órbita das estrelas e nuvens de gás em torno do centro da galáxia, pode-
se ter informações sobre a quantidade de matéria existente. Para simplificar a análise
do problema vamos fazer a aproximação (muito grosseira) que a galáxia é um objeto
esférico. Um cálculo mais preciso mudará os resultados por um fator da ordem da
unidade. Além do mais, e ainda para simplificar a análise, vamos considerar que a
densidade é constante e que as órbitas são circulares. Considere então uma órbita de
raio r menor que o raio da galáxia (a definição do que seja o raio da galáxia não é
algo simples, mas vamos ignorar no momento esta questão). A velocidade de rotação
será, nas circunstâncias descritas acima, determinada pela massa contida na esfera
interior à órbita. Digamos que M é a massa total da galáxia. A densidade de matéria
ρ (suposta uniforme) então será dada por

3M
ρ= , (9.54)
4πR3
346
onde R é o raio da galáxia. Usando o teorema de Gauss, o campo gravitacional a uma
distância r do centro da galáxia será dado por

m(r) M r3
~g = −G 2 r̂ , m(r) = , (9.55)
r R3
onde m(r) designa a massa total no interior da esfera de raio r. Assim, o campo
gravitacional pode ser escrito como
Mr
~g = −G r̂ . (9.56)
R3

Como as órbitas são circulares, a aceleração da estrela (ou nuvem de gás) é dada por
2
a = vr . Assim, tem-se
v2 Mr
=G 3 ⇒ v∝r . (9.57)
r R
Desta forma, a velocidade de rotação deve crescer com a distância ao centro da galáxia.
Por outro lado, se a estrela se encontra além do raio da galáxia (existem de fato objetos
ligados gravitacionalmente à galáxia e que estão a uma distância do centro maior que o
raio da galáxia), toda a massa da galáxia estará em seu interior. Desta forma, tem-se,
ainda para órbitas circulares,

v2 M 1
=G 2 ⇒ v∝√ . (9.58)
r r r

Assim, na borda da galáxia a velocidade de rotação deve cair com o inverso da raiz
quadrada da distância ao centro da galáxia.
Pode-se medir a velocidade de rotação nas galáxias espirais usando o efeito Doppler.
O resultado é surpreendente: enquanto no interior da galáxia a velocidade de rotação
cresce realmente com a distância, nas bordas da galáxia ela permanece constante, e
isto para distância às vezes muito superiores ao raio ótico da galáxia. Isto contraria o
que foi deduzido acima. Uma maneira de explicar este resultado é dizer que a galáxia
está envolta em um halo de matéria escura, que não pode ser detectada pela emissão
de radiação eletromagnética de nenhuma espécie, e que se estende muito além do raio
ótico. A adição deste halo escuro pode explicar as caracterı́sticas da curva de rotação
observada ajustando-se o tamanho do halo e sua densidade.
Uma quantidade importante na caracterização de uma galáxia é a razão massa-
luminosidade, quer dizer a quantidade de matéria dividida pela quantidade de luz
emitida, ambos em unidades solares. Estudando-se a vizinhaça do sol, tem-se que a
razão massa-luminosidade é da ordem de 5. A adição de matéria escura necessária
para explicar a curva de rotação observada pode aumentar esta relação luminosidade
para 15 ou mais: há muito mais matéria do que a que pode ser detectada diretamente
através da emisssão de radiação eletromagnética.
A situação se torna muito mais séria quando se considera agora aglomerados de
galáxias. Galáxias podem formar sistemas gravitacionalmente ligados, os chamados

347
Figura 9.2: Forma tı́pica da curva de rotação predita e observada em galáxias espirais.

aglomerados de galáxias. Existem aglomerados de algumas dezenas de galáxias até


aglomerados contendo centenas de galáxias, os chamados aglomerados ricos. Pode-se
avaliar a quantidade de matéria total do aglomerado utilizando o teorema do virial,
que estabelece que em um sistema dinamicamente em equilı́brio, a energia cinética
média é a metade da energia potencial:
1
< Ec >= − < Ep > . (9.59)
2
Para provar esta relação considere um sistema de partı́culas sob atração gravitacional
mútua:
N N 0
X X mi mj
mi~v˙i = −G 2
r̂ij , (9.60)
i=1 i,j=1
rij
onde rij = |~ri − ~rj | e a linha na somatória (dupla) do lado direito indica que o caso
i = j deve ser excluı́do. Calculando o produto escalar de toda a expressão por ~ri ,
temos
N N 0
X
˙
X mi mj
mi~ri .~vi = −G 3
~ri .(~rj − ~ri ) . (9.61)
i=1 i,j=1
rij

Integrando por partes, o lado esquerdo se torna,


N N N
X X d X
mi~ri .~v˙i = − mi vi2 + mi (~ri .~vi ) . (9.62)
i=1 i=1
dt i=1

para o lado direito temos


N 0 N 0
X mi mj X mj mi
G 3
~ri .(~rj − ~ri ) = G 3
~rj .(~ri − ~rj )
i,j=1
rij i,j=1
rij
N 0
X mj mi
= −G 3
~rj .(~rj − ~ri ) . (9.63)
i,j=1
rij

Logo, o lado direito pode ser escrito como


N 0 N 0 N 0
X mi mj 1 X mi mj 1 X mi mj
G 3
~ri .(~rj − ~ri ) = G 3
~ri .(~rj − ~ri ) + G 3
~ri .(~rj − ~ri )
i,j=1
rij 2 i,j=1 rij 2 i,j=1 rij

348
N 0 N 0
1 X mi mj 1 X mi mj
= G 3
~ri .(~rj − ~ri ) − G 3
~rj .(~rj − ~ri )
2 i,j=1 rij 2 i,j=1 rij
N 0
1 X mi mj
= − G = Ep . (9.64)
2 i,j=1 rij

Desta forma, obtém-se


N N N 0
X d X 1 X mi mj
− mi vi2 + mi (~ri .~vi ) = G
i=1
dt i=1 2 i,j=1 rij
N
d X
−2Ec + mi (~ri .~vi ) = Ep . (9.65)
dt i=1

O segundo termo do lado esquerdo se anula quando se calcula seu valor médio ao longo
de uma órbita fechada, pois o produto interno muda de sinal ao longo de um ciclo.
Assim, obtém-se o teorema do virial:
1
< Ec >= − < Ep > . (9.66)
2

Em um aglomerado de galáxias pode-se medir, também por efeito Doppler, a veloci-


dade de cada galáxia. Tem-se assim a energia cinética do aglomerado. Se o aglomerado
está em equilı́brio dinâmico, o teorema do virial se aplica, e pode-se então estimar a
energia potencial do aglomerado e, por conseguinte, sua massa. Aplicando-se este pro-
cedimento ao aglomerado de COMA, que possui algo como 500 galáxias, obtém-se
uma relação massa-luminosidade da ordem de 200, quer dizer, da ordem de dez vezes
mais que a obtida para uma galáxia espiral isolada. Novamente, isto pode ser expli-
cado introduzindo-se matéria que não emite radiação e que, provavelmente, não é de
origem bariônica. O fato é que todas estas observações indicam que a matéria escura
é pelo menos 6 vezes mais abundante que a matéria bariônica.
O que é esta ”matéria escura”? Existem vários candidatos possı́veis, todos oriundos
de teorias fundamentais como a de Grande Unificação (áxions), supersimetria (neu-
tralinos), etc. Um aspecto complexo disto é que nenhuma destas teorias ainda foi
verificada experimentalmente, permanecendo, no momento atual, como teorias espec-
ulativas, ainda que muito bem fundamentadas. Por várias razões, acredita-se que a
pressão efetiva da matéria escura deva ser nula. Uma destas razões é que, como a
matéria escura segue a distribuição de galáxias, ela deve sofrer o processo de colapso
gravitacional, e isto requer que sua pressão efetiva seja essencialmente nula. Logo, a
massa das partı́culas que constituem a matéria escura não pode ser nula, pois massa
nula implicaria um gás de partı́culas relativistas, cuja pressão não é nula. A massa das
partı́culas que constituiriam a matéria escura depende da origem destas partı́culas.
Se elas forem axions, partı́culas que se originam em quebras de simetria nas teorias
de Grande Unificação, estima-se que a massa as partı́culas constituintes da matéria

349
escura deva ser tal que m > 5 eV . Se forem neutralinos, partı́culas que surgem em
teorias supersimétricas, ela deve ser da ordem de 50 GeV .
Por outro lado, a matéria escura deve ser formada por partı́culas que interagem fraca-
mente com a matéria ordinária, bariônica, pois senão elas já teriam sido detectadas.
Assim, elas são denominadas de WIMPS, abreviação em inglês para partı́culas massi-
vas de fraca interação. Tanto o áxion quanto o neutralino satisfazem esta condição.

9.13 A energia escura

As observações descritas anteriormente da dinâmica das galáxias espirais e de aglom-


erados de galáxias indicam a existência de muito mais matéria no Universo do que
podemos detectar diretamente. A abundância de matéria bariônica no Universo é da
ordem de Ωb = 0, 04 em unidades da densidade crı́tica ρc , que é a densidade necessária
para que o Universo seja espacialmente plano. A densidade crı́tica hoje seria em torno
de ρc = 10−29 g/cm3 , como já foi dito anteriormente. As observações de objetos aglom-
erados indicam Ωme ∼ 0, 3, onde o subscrito me refere-se a matéria escura. No entanto,
existem outros testes indiretos para avaliar o conteúdo material total do Universo, e
que não se referem unicamente à análise da dinâmica de objetos aglomerados como
galáxias e aglomerados de galáxias. Quando estes outros métodos são empregados,
resultados mais surpreendentes emergem.
Um destes novos testes indiretos é a análise da anisotropia da radiação cósmica de
fundo. O modelo cosmológico padrão é composto fundamentalmente de duas fases:
o perı́odo inicial onde a radiação domina o conteúdo material do Universo, seguido
do perı́odo (que incluiria o que vivemos hoje) em que a matéria bariônica domina
o conteúdo material4 . Vivemos hoje imersos em um banho térmico a 2, 7 K que é
uma relı́quia da fase radioativa. Esta radiação é extremamente isotrópica. Entretanto,
devemos esperar a existência de pequenas anisotropias nesta temperatura devido a
existência de perturbações que deram origem às estruturas observadas no Universo
em grande escala, como galáxias e aglomerados de galáxias.
Durante os anos 80, procurou-se detectar aquelas anisotropias na RCF utilizando-
se sobretudo detectores baseados na Terra. Durante muito tempo, o máximo que
se conseguiu foi estabelecer limites superiores: se estas flutuações na temperatura
existissem, elas deveriam ser, em termos fracionais, tais que

∆T
≤ 10−4 . (9.67)
T
No inı́cio dos anos 90, entretanto, observações feitas a partir do satélite COBE5 final-
4
Freqüentemente, na literatura recente, a fase inflacionária primordial também é incluı́da no cenário
padrão
5
Abreviação para o nome em ingês Cosmic Observatory Background Explorer

350
Figura 9.3: Espectro da anisotropia da radiação cósmica de fundo com os diferentes
resultados observacionais.

mente detectaram a existência de flutuações tais que


∆T
∼ 10−5 . (9.68)
T
Desde então, uma série de outros programas observacionais (Boomerang, WMAP,
etc.) confirmaram a existência destas flutuações. Um exame detalhado do espectro
destas flutuações foi feito. A análise do espectro da radiação cósmica de fundo é feita
essencialmente através da decomposição multipolar, obtida exprimindo as flutuações
em harmônicos esféricos:
∞ m=+l
∆T (θ, φ) X X
= alm Ylm (θ, φ) , (9.69)
T l=0 m=−l

onde os alm são os coeficientes multipolares. A análise des coeficientes multipolares


conduz a uma série de informações sobre o conteúdo material do Universo, além de
desevendar a natureza das flutuações primordiais que geraram as estruturas hoje ob-
servadas no Universo.
O espectro da anisotropia possui caracterı́sticas bastante claras: há inicialmente
uma parte plana, correspondendo a valores pequenos de l, que implicam grandes
distâncias angulares, seguido de uma sequência de picos de amplitude, denominados
picos acústicos. A posição do primeiro pico acústico está relacionado com a densidade
total do Universo através da expressão
l
ΩT ∼ , (9.70)
220
onde ΩT é o parâmetro de densidade total do Universo e l indica a ordem multipolar
onde o primeiro pico aparece. As observações indicam que o primeiro pico ocorre em
l ∼ 220, o que implica ΩT ∼ 1. Logo, o Universo deve ser quase espacialmente plano.
Entretanto, as observações da dinâmica da matéria aglomerada indicam Ω ∼ 0, 3.

351
Assim, a anisotropia da RCF sugere que 70% da matéria existente no Universo não se
aglomera. Esta componente ”suave” foi denominada de energia escura, visto que ela
participa da dinâmica do Universo, mas não se aglomera e nem pode ser detectada
por meios diretos.
Outro teste que indica a existência de energia escura é a determinação do valor do
parâmetro de desaceleração hoje, q0 , que é definido como
aä
q0 = − |t=t0 , (9.71)
ȧ2
sendo a o fator de escala e t0 o tempo hoje. Este parâmetro pode ser avaliado através
do desvio da lei de Hubble do seu regime linear. A lei de Hubble estabelece que a
velocidade de recessão de objetos distantes deve ser proporcional à distância destes
objetos de nós. Mas, tal relação só se aplica estritamente para objetos relativamente
próximos; a grande distância, esta lei deve ser modificada, tomando a forma
1
rH0 ≈ z − (1 + q0 )z 2 , (9.72)
2
onde z é o desvio para o vermelho associado à radiação emitida pelo objeto distante,
definido por
∆λ
z= , (9.73)
λ
sendo λ o comprimento de onda da radiação emitida e ∆λ a mudança deste compri-
mento devido ao efeito Doppler cosmolológico.
Até aproximadamente 1998, acreditava-se que o Universo se encontrava em uma fase
desacelerada, quer dizer, q0 > 0. Isto aliás era de se esperar, visto que se pensava
até então que o conteúdo material do Universo era dominado por fluidos com pressão
positiva ou nula. De fato, considerando o Universo dominado por um único fluido com
densidade ρ e pressão p, temos pelas equações de Einstein,
 ȧ 2 8πG
= ρ , (9.74)
a 3
ä  ȧ 2
2 + = −8πG p . (9.75)
a a
Combinando as duas equações obtém-se,
ä 8πG
=− (ρ + 3p) . (9.76)
a 3
Desta forma pode-se ver que se a pressão é positiva, inevitavelmente ä será negativo
e o parâmetro de desaceleração será positivo.
Para se medir o desvio da linearidade da lei de Hubble é necessário observar objetos
bastante distantes, com altos z, quer dizer, z ∼ 1. Observar objetos tão distantes
traz problemas consideráveis. Em geral, utiliza-se galáxias. Mas, não se conhece ainda
muito bem o processo evolutivo das galáxias, e as medidas apresentam grandes in-
certezas. Desde a segunda metade da década de 90, passou-se a observar supernovas

352
do tipo Ia. Estas supernovas originam-se do processo de acréscimo de massa de uma
anã branca devido a presença de uma estrela massiva em um sistema binário. Quando a
massa da anã branca ultrapassa o limite de Chandrasekhar, quer dizer M ∼ 1, 4 M ,
ela se torna instável, dando origem a uma supernova. Como a explosão da estrela
ocorre em condições sempre muito semelhantes, a luminosidade intrı́nseca da super-
nova é padrão. Medindo-se a magnitude aparente, tem-se então a distância desta
supernova com grande precisão. As supernovas apresentam grande luminosidade, o
que permite observá-las a grande distância.
As observações de tais supernovas indicaram q0 < 0. Isto implica, a partir de (9.76) que
o Universo deve ser dominado hoje por um fluido de pressão negativa. Além do mais,
um estudo detalhado tem mostrado que os resultados observacionais são compatı́veis
com os teóricos se ΩT ∼ 1. Novamente, o estudo das supernovas tipo Ia indicam que
70% da matéria do Universo não aparecem na dinâmica dos objetos aglomerados,
constituindo uma componente ”suave” da matéria existente no Universo e que, além
do mais, deve exibir pressão negativa.

9.14 Constante cosmológica, quintessência ou...

Tı́nhamos visto anteriormente que a possibilidade da existência de matéria escura no


Universo traz o problema de qual seria o seu constituinte. Existem várias possibilidades
ligadas a predições de teorias fundamentais como a de Grande Unificação. A possı́vel
existência de uma energia escura traz um problema ainda maior: além de não poder
ser detectada diretamente, a energia escura deve exibir pressão negativa; ela seria um
fluido altamente exótico. O que seria esta energia escura?
Existem vários candidatos possı́veis. O primeiro destes candidatos seria a constante
cosmológica Λ. Nós discutimos a constante cosmológica no capı́tulo sobre o modelo in-
flacionário. Vamos revisar, entretanto, seus aspectos essenciais tendo em mente agora
o problema da energia escura. A constante cosmológica foi incluı́da nas equações de
Einstein desde o inı́cio da teoria da Relatividade Geral, na busca de soluções que
revelassem um Universo estático. Mas, elas foram rapidamente descartadas devido
a descoberta da expansão do Universo, no final dos anos 20, por Hubble. Entre-
tanto, teoricamente, nada impede introduzir a constante cosmológica nas equações
de Einstein. De fato, a forma mais geral de equações de campo geométricas levando a
equações diferenciais de segunda ordem, a quatro dimensões, é

1
Rµν − gµν R − Λgµν = 8πGTµν , (9.77)
2
onde Λ é a constante cosmológica. Essas equações conduzem também à conservação
da matéria, da mesma forma que no caso tradicional onde Λ está ausente, pois a
derivada covariante da métrica é nula. À constante cosmológica podemos associar

353
uma densidade de energia dada por
Λ
ρΛ = . (9.78)
8πG
Esta densidade de energia permanece constante, mesmo para um Universo em ex-
pansão. Uma constante cosmológica pode ser também representada por um fluido
com pressão negativa tal que pΛ = −ρΛ . De fato, pela lei de conservação para um
Universo homogêneo e isotrópico em expansão, temos

ρ̇Λ + 3 (ρΛ + pΛ ) = 0 ⇒ ρ̇Λ = 0 ⇒ ρΛ = constante . (9.79)
a
Como as formas de energia têm densidade decrescente em função da expansão do
Universo, se existe uma constante cosmológica não nula, ela deverá dominar a dinâmica
cósmica a partir de um certo momento. Mas, se ela começa a dominar hoje a dinâmica
do Universo, não há contradição com as observações ao contrário do que ocorria no
caso do cenário inflacionário.
Por enquanto, tudo parece concorrer para se admitir que é a constante cosmológica a
responsável pela expansão acelerada do Universo hoje. Mas, há vários problemas com
este cenário. O primeiro vem da teoria quântica de campos. Suponhamos um campo
quântico que possa ser representado sob a forma de osciladores harmônicos. A energia
deste campo é dada por
∞ 
X 1
E= n+ ~ω . (9.80)
n=0
2
O estado de vácuo é dado por n = 0. O estado de vácuo quântico é descrito por
uma expressão idêntica à da constante cosmológica, pois o vácuo quântico deve ser
invariante de Lorentz. Consideremos a densidade de energia deste campo quântico no
seu estado de vácuo. Ela será dada por
Z
ρ = ~ω dVω , (9.81)

onde dVω é o volume do espaço de fase. Temos então,


Z ∞
ρ = 4π ~ω 3 dω . (9.82)
0

Na verdade a integração deve ser feita até ωP l que é a frequência de Planck, pela
simples razão que desconhecemos qual fı́sica deve ser utilizada acima desta frequência.
Assim, a densidade de energia do vácuo seria dada por

ρ = π~ωP4 l ∼ 1072 GeV 4 . (9.83)

Este valor é muito superior ao valor que deve ter a densidade de energia associada
à constante cosmológica necessário para explicar a aceleração do Universo hoje, que
é ρΛ = 10−47 GeV 4 . Há uma discrepância de 120 ordens de magnitude entre o valor
predito e o valor observado.

354
Outro problema se refere à chamada coincidência cósmica. Por que a constante cos-
mológica, se ela existe, tem um valor tal que somente agora ela começou a dominar o
conteúdo material do Universo? De fato, se a constante cosmológia tivesse um valor
maior que o observado, o Universo teria começado a se acelerar muito mais cedo e isto
comprometeria o processo de formação de galáxias, já que em um Universo acelerado as
perturbações que devem dar origem às estruturas locais, como galáxias e aglomerados
de galáxias, não crescem. Assim, se o Universo tivesse começado a se acelerar muito
antes que a fase atual, as galáxias não teriam se formado. Consequentemente, a vida
inteligente muito provavelmente não teria surgido. Para tentar contornar estas dificul-
dades, foram propostos cenários alternativos, como o de quintessência. Neste cenário,
recupera-se o mecanismo de inflação descrito anteriormente e que visava resolver os
problemas do modelo cosmológico padrão. Tenta-se, ao mesmo tempo, resolver o prob-
lema da coincidência cósmica de uma forma dinâmica: a própria evolução dos campos
responsáveis pela fase inflacionária atual implicaria que o Universo só poderia começar
a se acelerar em uma fase posterior à fase de formação das galáxias.
No modelo de quintessência, a aceleração do Universo é provocada por um campo
escalar com auto-interação descrito por uma Lagrangiana do tipo
1 √
L= ∂µ φ∂ µ φ − V (φ) −g . (9.84)
2
Como foi visto no caso do modelo inflacionário, a este modelo de campo escalar com
auto-interação podemos associar uma densidade de energia e uma pressão. Com uma
escolha judiciosa do potencial, pode-se ter um cenário onde inicialmente o campo
escalar apresente pressão positiva, evoluindo depois para uma configuração de pressão
negativa, o que induziria a fase de expansão acelerada.
Potenciais oriundos de teorias fundamentais como as de supergravidade podem ter as
boas caracterı́ticas para a descrição da quintessência. Entretanto, para que o resultado
final concorde com a observação é necessário um ajuste de parâmetros, o que sempre
provoca um certo desconforto. Entretanto, modelos de quintessência podem conduzir a
uma explicação para a questão da concordância cósmica: a dinâmica do campo escalar
é tal que só em momentos muito recentes ele pode provocar uma expansão acelerada
do Universo. Mas, várias outras propostas têm surgido na literatura e o campo está
inteiramente aberto para novas sugestões.

Exercı́cios
1. Mostre, por princı́pio variacional, que a Lagrangiana
1
L = ∂µ φ∂ µ φ − V (φ)
2
conduz à equação de movimento para o campo φ

2φ = −V 0 (φ) ,

355
onde a linha indica derivada em relação a φ.
2. Qual é a velocidade que teria uma bola de tênis, de massa m = 50 g, com energia
igual a 1022 eV ?
3. Calcule o valor da energia associada à constante cosmológica quando

Λ
∆t = 60 , ∆t = 10−30 s .
3
4. Deduza a partir da equação (9.41) as expressões para a densidade de energia e
pressão (9.46,9.47) .
5. Se a energia escura representa 70% da densidade crı́tica hoje, e a constante cos-
mológica é responsável por ela, deduza a densidade de energia associada à con-
stante cosmológica, no sistema de unidades CGS e em undidades GeV 4 , fazendo
neste último caso c = 1 e ~ = 1.
6. A razão massa-luminosidade, em unidades solares, do aglomerado de COMA, é
aproximadamente igual a 200 em unidades solares. Se o aglomerado de COMA
fosse formado por 500 galáxias idênticas à Via Láctea, qual seria a massa total
do aglomerado em gramas?
7. Estime a energia do vácuo quântico caso a frequência de corte for determinada
pela energia da quebra de simetria eletrofraca, Eef ∼ 100 GeV .

9.15 Referências bibliográficas


[1] A. Vilenkin, E. P. S. Shellard e P. V. Landshoff, Cosmic string and other topo-
logical defects, Cambridge University Press, Cambridge(1994).
[2] P. Peter e A. Gangui, Des défauts dans l’Univers, CNRS Editions, Paris(2003).
[3] S.K. Blau e A.H. Guth, in 300 Years of Gravitation, editado por S. Hawking e
W. Israel, Cambridge University Press, Cambridge(1987).
[4] E.W. Kolb e M.S. Turner, The early Universe, Addison-Wesley, Nova
Iorque(1990).
[5] L. Landau e E. Lifchitz, Physique statistique, Edições Mir, Moscou(1967).
[6] H. Maris e S. Balibar, Physics Today, fevereiro de 2002;
[7] C.A.W. de Souza, Ciência Hoje, 32, 6(2003).
[8] K.A. Olive, TASI lectures on astroparticle physics, astro-ph/0503065;
[9] S.M. Carroll, The cosmological constant, Living Reviews in Relativity 4, 1(2001).

356
Capı́tulo 10

Gravitação e Cosmologia Quânticas

Nelson Pinto Neto1

10.1 Introdução
Neste curso foram introduzidos os fundamentos da moderna teoria da gravitação, a
Teoria da Relatividade Geral (TRG), e da Cosmologia. Viu-se que, como toda forma de
energia presente na natureza interage gravitacionalmente, a teoria que descreve a in-
teração gravitacional pode ser entendida como uma teoria dinâmica do espaço-tempo,
propiciando, quando aplicada à totalidade do mundo fı́sico, uma teoria cosmológica
consistente de um Universo dinâmico com distintas fases em sua história. Estas foram
duas das grandes revoluções ocorridas na fı́sica no século XX, que modificaram total-
mente nossas concepções de espaço, tempo e cosmo.
A terceira grande revolução acontecida no século passado foi, como todos sabem, a
formulação da Teoria Quântica. Num nı́vel fundamental, ela mostrou-se absolutamente
necessária para a descrição correta e precisa de todo tipo de matéria, campos e sistemas
que existem na natureza com apenas uma exceção: justamente o campo gravitacional,
aquele que interage com tudo que existe e, como consequência, o Universo. Assim,
por um lado a TRG e a Cosmologia contemporâneas são teorias puramente clássicas
e por outro toda a Teoria Quântica (TQ) de partı́culas e campos se desenvolve num
espaço-tempo fixado de inı́cio (em franca oposição ao que há de mais básico na TRG, a
inexistência de um espaço-tempo fundamental a priori). Ou seja, as grandes revoluções
do século XX são teorias universais mas não se interpenetram, o que soa como um
contrasenso, indicando que a nossa compreensão da fı́sica contemporânea ainda não
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.

357
está completa, que estas são apenas teorias efetivas, sendo necessária a construção de
uma Teoria Quântica da Gravitação (TQG) e da chamada Cosmologia Quântica (CQ).
Entretanto, não há nenhuma observação que nos imponha a construção destas teorias.
Pior, todas as tentativas feitas até hoje mostraram a imensa dificuldade de se construir
tais teorias, parecendo que seus princı́pios fundamentais não podem ser colocados lado
a lado, ou seja, que a TRG e a TQ devem realmente se manter separadas. Apesar
disso, tentarei mostrar nesta introdução porque a construção destas teorias é tão
importante. Na verdade, as tentativas de construı́-las apresentaram grande avanço na
última década além de terem propiciado uma compreensão bem mais ampla da TRG,
da Cosmologia e, principalmente, da TQ.

10.1.1 Argumentos a favor da construção de uma Teoria


Quântica da Gravitação e da chamada Cosmologia Quântica

1) A presença de singularidades na TRG e na Cosmologia

Viu-se nos capı́tulos anteriores que a TRG, sob condições bastante razoáveis, desen-
volve singularidades do espaço-tempo, como os buracos negros e a singularidade inicial
cosmológica, onde quantidades fı́sicas como a curvatura do espaço-tempo e densidades
de energia divergem e nenhuma fı́sica faz sentido. Ou seja, a TRG prevê situações
onde ela própria não se aplica. Este tipo de problema já esteve presente em outras
teorias fı́sicas, como o colapso da estrutura clássica da matéria (o eletron clássico gi-
rando em volta do núcleo atômico perderia energia através da emissão de radiação
eletromagnética e cairia no núcleo) e a a divergência do campo elétrico clássico na
vizinhança de uma partı́cula carregada, ambas resolvidas através da teoria quântica
da matéria e da Eletrodinâmica Quântica. Talvez, como nesses casos, efeitos quânticos
do campo gravitacional descritos numa TQG consistente possam evitar essas singu-
laridades, propiciando uma descrição completa e consistente dos buracos negros e do
Universo. Cabe salientar, porém, que tais singularidades também podem ser evitadas
através de modificações clássicas da TRG, como o aparecimento de interações, não
previstas na teoria de Einstein, entre os campos de matéria e a curvatura nestas
situações extremas (quanto maior a curvatura mais estas modificações se tornariam
importantes), ou pela existência de materiais exóticos com pressão muito negativa
cujos efeitos fı́sicos só se manifestariam nestas regiões.

2) Incompatibiliade entre um campo gravitacional clássico e demais campos


e matéria quânticos

O problema está relacionado com a insistência em mantermos a geometria clássica


mesmo sabendo que a matéria e demais campos da Natureza são fundamentalmente
quânticos. A única maneira de compatibilizar a TRG clássica com os efeitos quânticos

358
da matéria seria através da generalização das equações de Einstein

Gµν = −κTµν −→ Gµν = −κ < T̂µν >, (10.1)

onde κ ≡ 8πG/c4 sendo G a constante de Newton e c a velocidade da luz no vácuo, e


<> significa valor médio dos operadores presentes em T̂µν avaliado no estado quântico
do sistema obtido de uma equação tipo Schrödinger

∂Ψ
i~ = ĤΨ, (10.2)
∂t

onde o operador hamiltoniano Ĥ é calculado supondo que o espaço-tempo de fundo seja


plano com métrica de Minkowski ηµν . Note que não se pode escrever simplesmente T̂µν
do lado direito porque o lado esquerdo, por hipótese, não tem operadores. Entretanto,
< T̂µν > curva o espaço tempo através da equação de Einstein modificada (10.1),
transformando ηµν num novo gµν e, por consequência, a hamiltoniana quântica do
sistema Ĥ e a equação (10.2). Assim, o valor médio terá que ser tomado em um novo
estado, modificando o valor de < T̂µν >, o que implicará numa outra métrica, e assim
por diante. Este procedimento não converge e a teoria não faz sentido.

3) Medidas de distância sugerem a discretização do espaço se a Relatividdae


Geral e a Mecânica Quântica forem levadas em conta.
Um argumento heurı́stico para a discretização do espaço abaixo de uma certa escala
de distância pode ser descrito da seguinte forma: sabemos da mecânica quântica que
para medir um comprimento l precisamos de pacotes de onda contendo fótons com
comprimento de onda λ < ∆x < l , onde ∆x é o tamanho do pacote onde sua energia
está localizada, para que nào haja difração. Mas a energia do pacote é tipicamente
E ≈ hc/λ, onde h é a constante de Planck, e portanto o raio de Schwarzchild deste
pacote, como vimos em cursos anteriores, é dado por

2GM 2GE 2Gh


rs = 2
= 4 = 3 . (10.3)
c c cλ
Quanto menor for l, menor deve ser λ e maior será o raio de Schwarzchild do pacote,
até atingir-se a situação onde o comprimento a ser medido é da ordem do raio de
Schwarzchild do pacote. Neste caso, este colapsaria num buraco negro e nada poderia
ser visto. Isto se dá quando
2Gh
l< 3 , (10.4)
cl
o que implica que distâncias l tais que
r
2Gh √
l< 3
=: 2 πlpl (10.5)
c
não seriam possı́veis de ser medidas. O comprimnto lpl é chamado de comprimento de
Planck, escala a partir da qual o espaço provavelmente deva ser quantizado.

359
4) A existência da escala de Planck sugere uma TQG.
Tomando conjuntamente a constante de Newton G, a constante de Planck ~ e a ve-
locidade luz c, constantes fundamentais que dizem respeito à gravitação, mecânica
quântica e Relatividade, respectivamente, obtemos uma escala de comprimento,
tempo, massa e densidade de energia: a escala de Planck. Elas são:
r
~G
lpl = ≈ 10−33 cm, (10.6)
c3
r
~G
tpl = ≈ 10−43 s, (10.7)
c5
r r
~c ~c3
mpl = ≈ 10−5 g ; Epl = ≈ 1028 ev; (10.8)
G G
c5
ρpl = 2
≈ 1094 g/cm3 . (10.9)
~G
Como se vê, o comprimento e o tempo de Planck são extremamente pequenos: o
comprimento de Planck é tão menor que as dimensões de um núcleo atômico, da
ordem de 10−20 cm, quanto uma árvore é menor que uma galáxia tı́pica, e existem mais
tempos de Planck numa piscada de olho do que átomos no Monte Everest! Por outro
lado, a massa de Planck e a densidade de Planck são imensas: a massa de um eletron é
me ≈ 10−28 g, as energias mais altas que se atingiram até hoje nos grandes aceleradores
de partı́culas são da ordem de 1012 ev e a densidade de um núcleo atômico, o objeto
mais denso que se conhece, é da ordem de 1015 g/cm3 . É nessas escalas de tempo,
comprimento e energia que se espera que efeitos quânticos do campo gravitacional se
tornem importantes. Devido a esses valores extremos, não surpreende que até agora
não se tenha podido detetar tais efeitos. Por outro lado, a esperança de podermos
observá-los num futuro próximo parece bem difı́cil.

5) O problema da constante cosmológica.


Vimos em capı́tulos anteriores que a constante cosmológica efetiva observada tem que
ser tal que Λef < 10−56 cm−2 . Esta constante cosmológica efetiva tem uma contribuição
da constante cosmológica introduzida por Einstein e da energia do vácuo quântico:
Λef = Λ + Λvac . Entretanto, a teoria quântica de campos sugere que Λvac ≥ 106 cm−2
2
. Assim temos, na melhor das hipóteses, 10−56 cm−2 = 106 cm−2 + Λ. Para que esta
igualdade seja satisfeita, a constante Λ, arbitrária classicamente, deveria ter ajustados
62 dos seus dı́gitos para reduzir a enorme constante cosmológica do vácuo quântico
aos valores ı́nfimos observados da constante cosmológica efetiva. Este é o chamado
2
Como os campos quânticos são, a grosso modo, uma coleção infinita de osciladores harmônicos, a
energia do vácuo seria a soma das energias de ponto zero de todos eles, E = ~w/2, onde o máximo desta
enegia deveria ser a energia da quebra da supersimetria (Eqss > 1013 ev), que será discutida mais adiante.
Esta é a energia a partir da qual as energias do vácuo dos férmions se cancelariam com as dos bósons
devido à existência desta simetria. Isto leva a este valor mı́nimo para Λvac , que pode ser muito maior se
a supersimetria não existir.

360
problema do ajuste fino da constante cosmológica, um dos maiores problemas da fı́sica
teórica contemporânea, que provavelmente só poderá ser resolvido com a elaboração
de uma Teoria Quântica da Gravitação consistente.

6) A unificação de todas as interações da Natureza exige uma TQG.

Ao longo da história tem-se verficado a unificação de descrições de fenômenos


fı́sicos aparentemente distintos: o movimento de projéteis na Terra e o movimento
planetário através da teoria de Newton, os fenômenos elétricos e magnéticos através
da Eletrodinâmica de Maxwell, a unificação das interações eletromagnéticas e fraca na
teoria eletrofraca de Salam-Weinberg, etc. Isto tem levado muitos fı́sicos a acreditar
ser possı́vel unificar todas interações da natureza numa única descrição. Como todas
as demais interações são quantizadas, isto só será possı́vel se a gravitação também o
for. Note que esta é uma razão puramente estética já que não há nenhuma evidência
observacional ou teórica de que tal teoria de grande unificação de fato exista.

7) A Cosmologia Quântica pode servir como teoria de condições iniciais


para a Cosmologia.

Para se fazer previsões sobre um sistema fı́sico clássico ou quântico, duas etapas são
necessárias: a formulação de uma dinâmica que descreva a evolução deste sistema
através de equações diferenciais e as condições iniciais satisfeitas por este sistema
para determinar univocamente sua evolução. Normalmente, tais condições iniciais são
especificadas através de uma preparação experimental (ao lançarmos, num exemplo
clássico, um projétil de uma determinada posição com uma determinda velocidade
inicial ou, num exemplo quântico, para avaliarmos a probabilidade de decaimento de
um átomo excitado quando ele é preparado inicialmente neste estado), ou através de
especificações originadas do ambiente no qual o sistema está inserido (por exemplo, se
estivermos interessados na evolução do campo eletromagnético em uma sala onde não é
observada a entrada de qualquer radiação eletromagnética, resolvemos as equações de
Maxwell com condições de contorno de acordo com este fato). Entretanto, o Universo,
objeto de estudo da Cosmologia, é um sistema essencialmente diferente já que não
se pode manipular ou preparar o Universo, nem há nada exterior ao Universo que
passe suas especificações para ele. Assim, tão importante quanto haver uma teoria
dinâmica para o Universo, que sabemos ser a TRG, é crucial formular uma teoria de
condições iniciais para que possamos entender este sistema sem paralelo na fı́sica de
forma completa. Isto se torna ainda mais importante quando sabemos que o Universo
em que vivemos é bastante peculiar por ser altamente homogêneo e isotrópico (dentro
das possı́veis soluções cosmológicas das equações de Einstein, a grande maioria não
tem qualquer traço de homogeneidade e isotropia 3 ).
3
Numa contagem simplória, a probabilidade de encontrarmos uma solução homogênea e isotrópica
dentre todas a possı́veis soluções das equações de Einstein é 1/∞3 , ou seja, zero!

361
Uma formulação quântica para a Cosmologia talvez possa resolver este problema
pois usualmente em teoria quântica surgem regras de seleção e a noção de estado
quântico fundamental. Isto será discutido mais adiante quando falarmos em Cosmolo-
gia Quântica.

Este problema não se restringe puramente à Cosmologia. Existem várias hipóteses


dentro da fı́sica que assumimos sem questionar que dependem da caracterização do
estado quântico inicial do Universo. Seguem alguns exemplos:

i) Uma prática fundamental utilizada por todo fı́sico ao estudar algum sistema é isolá-
lo, ou seja, considerar que sistemas distantes não interferem na evolução do mesmo.
Entretanto, isto não seria possı́vel se a função de onda do Universo não pudesse ser
escrita da forma
Ψ(q i , QA , t) ≈ ψ(q i , t)ϕ(QA , t), (10.10)

onde q i representa os graus de liberdade do sistema e QA do resto do Universo. Se


Ψ(q i , QA , t) não pudesse ser separada como na Eq.(10.10), haveria um entrelaçamento
quântico entre o sistema e o resto do Universo que impediria o isolamento do sistema
em estudo. Ou seja, o próprio fato de podermos fazer fı́sica tal como a conhecemos
depende do estado quântico inicial do Universo!

ii) Vários sistemas fı́sicos se comportam classicamente. Entretanto, isto depende


também da função de onda do Universo. Para ilustrar este ponto, do teorema de
Ehrenfest temos que md2 < x > /dt2 = − < ∂V (x)/∂x >, onde <> significa valor
médio. Para que o limite clássico seja atingido é necessário mudar o lado direito desta
igualdade para
d2 < x > ∂V (< x >)
m ≈ − , (10.11)
dt2 ∂<x>
o que só é possı́vel para determinadas funções de onda (tipicamente pacotes de onda
estreitos). Num quadro mais geral, vemos que a existência do mundo clássico que
observamos também depende do estado inicial do Universo.

iii) Como Boltzmann uma vez setenciou, a segunda lei da termodinâmica (a entropia
de sistemas isolados cresce com o tempo) também está relacionada com o estado
inicial do Universo: ‘A segunda lei da termodinâmica pode ser provada de uma teoria
mecânica [invariante por reversão temporal 4 ] se for assumido que o estado atual do
Universo ... começou a evoluir de um estado altamente improvável’.

Vê-se portanto que a construção da Gravitação e Cosmologia Quânticas, embora sem


nenhuma motivação observacional direta, é altamente desejável do ponto de vista
teórico, seja por razões de auto-consistência, para resolver problemas em aberto ou
por razões estéticas. O objetivo é altamente ambicioso e por isso mesmo o caminho
para atingı́-lo é bastante difı́cil de percorrer. É o que veremos a seguir.
4
Quase todas as interações fundamentais da natureza satisfazem esta simetria.

362
10.2 Gravitação Quântica
Dentro da TRG, quantizar a gravitação significa quantizar o próprio espaço-tempo.
O que se havia feito até então era quantizar campos em espaços-tempos de fundo
fixados, ou seja, quantizar objetos se propagando em uma arena fixa. Agora, ter-se-ia
que quantizar a própria arena!
Essencialmente dois tipos de abordagem foram utilizados para quantizar a gravitação.
A primeira, a chamada quantização canônica, utilizou métodos canônicos de quan-
tização através da construção da hamiltoniana da TRG (o que implica numa separação
do espaço-tempo em espaço e tempo), procurando respeitar o aspecto mais profundo
da TRG: não há espaço-tempo absoluto. A segunda, chamada de quantização covari-
ante, procurou usar os mesmos métodos utilizados para os outros campos. Expandiu-se
a métrica gµν na forma gµν = ηµν + hµν para quantizar o campo hµν no espaço-tempo
de fundo de Minkowski cuja métrica é ηµν . Embora não seja necessária uma separação
do espaço-tempo em espaço e tempo como na primeira, daı́ o nome covariante, esta
abordagem utiliza a métrica de fundo ηµν como palco absoluto onde se propaga o
campo hµν .
Por ter sido a primeira abordagem a ser tratada de forma séria, vamos rever primeiro
a Quantização Canônica.

10.2.1 Quantização Canônica

No final da década de 40 do século passado iniciou-se o programa de quantização da


TRG. Àquela época, a Eletrodinâmica Quântica já se encontrava razoavelmente bem
estabelecida e o próximo passo seria quantizar a outra teoria fundamental conhecida
naquele instante: a TRG. Paul Dirac, o mesmo que compatibilizou a Relatividade
Restrita com a TQ através da famosa equação que leva o seu nome, passou a dedicar-
se neste momento a fazer o mesmo com a Relatividade Geral. Para tanto, dentro
da perspectiva da quantização canônica, era necessário encontrar a hamiltoniana da
TRG. Como sabemos, para se escrever a equação de Schroedinger de um sistema é
preciso conhecer a hamiltoniana do mesmo:

∂Ψ(q, t)
i~ = H(p̂, q̂)Ψ(q, t), (10.12)
∂t
onde H é a função hamiltoniana do sistema expressa em termos dos operadores mo-
mentum e posição.
Entretanto, a simples tarefa de se encontrar a hamiltoniana da TRG revelou-se mais
difı́cil do que se esperava. O fato de a TRG ser uma teoria covariante por trans-
formações gerais de coordenadas e expressa em termos de tensores, como visto nos
cursos anteriores, implica que várias componentes do tensor métrico podem ser fix-
adas mediante escolhas apropriadas das coordenadas (lembre-se como foram obtidas

363
as métricas de Schwarzchild e cosmológica: várias simplificações foram feitas através
de escolhas de coordenadas que acomodassem as simetrias presentes em cada caso).
Assim, nem todas as componentes do tensor métrico são graus de liberdade genuı́nos:
muitas delas podem ser eliminados. No formalismo hamiltoniano, isto se traduz em ter-
mos de relações entre componentes do tensor métrico e seus momenta canonicamente
associados que devem ser satisfeitas pelos mesmos. Estas relações são chamadas de
vı́nculos.
Uma outra maneira de ver a presença destes vı́nculos é através das equações de Ein-
stein:
Gµν = −κTνµ . (10.13)
É fácil verificar que as equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i (i varia de 1 a
3 e corresponde aos ı́ndices espaciais) não envolvem derivadas segundas da métrica, só
derivadas primeiras. Como as derivadas primeiras estão usualmente relacionadas aos
momenta, estas são as relações de vı́nculo citadas acima. As únicas equações dinâmicas,
que envolvem derivadas segundas da métrica, em particular, das componentes gij , são
as equações com ı́ndices µ = i, ν = j.
Como não há equações envolvendo derivadas segundas das componentes g00 e g0i ,
estas não são variáveis dinâmicas, podendo portanto ser fixadas por uma escolha con-
veniente de coordenadas. Assim, dada uma hipersuperfı́cie tridimensional inicial de
métrica gij (xk , t0 ), que não pode ser qualquer uma pois ela deve satisfazer os vı́nculos
provenientes das equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i, as equações de
Einstein com µ = i, ν = j nos dizem como encontrar a hipersuperfı́cie de métrica
gij (xk , t0 + ∆t) num instante posterior. O empilhamento destas hipersuperfı́cies tridi-
mensionais ao longo do tempo nos dão a quadri-geometria gµν que é solução das
equações de Einstein com estas condições iniciais.
Para lidar com os vı́nculos da TRG e chegar a sua hamiltoniana, Dirac desenvolveu
toda uma teoria denominada formalismo hamiltoniano de sistemas vinculados, com
aplicações também ao Eletromagnetismo e outras interações. Nesta formulação, a
hamiltoniana final é composta pela hamiltoniana canônica Hc = pq̇ − L, adicionada de
multiplicadores de Lagrange multiplicando os vı́nculos para garantir a sua validade.
Desta maneira, ele chegou a uma hamiltoniana correta para a TRG, que depois foi
colocada sob uma forma bem mais simples, envolvendo quantidades geométricas bem
definidas, por Arnowitt, Deser e Misner. Esta hamiltoniana tem a forma
Z
H = d3 x[N H(x) + Ni Hi (x)] + T S (10.14)

onde H(x) e Hi (x) são os vı́nculos referidos anteriormente e dependem das coordenadas
espaciais x. O primeiro está relacionado com a invariância da TRG por transformações
da coordenada temporal e o segundo com a invariância da TRG por transformações
de coordenadas espaciais. Os ı́ndices i variam de 1 a 3. N e Ni , relacionados com as
componentes g00 e g0i da métrica, são os multiplicadores de Lagrange que impõem a

364
validade dos mesmos: ao derivarmos a hamiltoniana com respeito a eles encontramos
H(x) = 0 e Hi (x) = 0, que reproduzem na linguagem hamiltoniana as equações de
Einstein (10.13) com µ = 0, ν = 0 e µ = 0, ν = i.

As funções H(x) e Hi (x) dependem apenas de gij , de eventuais campos que descrevam
a matéria e campos não gravitacionais, e de seus momenta conjugados. As equações
de Hamilton para estas quantidades (a forma geral das equações de Hamilton para
varáveis canônicas q e p é q̇ = ∂H/∂p e ṗ = −∂H/∂q) fornecem as equações de
Einstein com µ = i, ν = j. Desta maneira, obtemos todas as equações de Einstein
(10.13) dentro deste formalismo.

O termo T S é um termo de superfı́cie no infinito envolvendo todo o espaço. Ele só pode
ser calculado em situações bastante especiais. Se o espaço é fechado, isto é, finito e sem
fronteiras como a superfı́cie de uma bola de futebol, ele é zero. Para visualizarmos este
fato, sigamos com o exemplo da superfı́cie de uma bola de futebol. Nesta superfı́cie, o
análogo de uma esfera envolvendo um ponto no espaço tridimensional é um cı́rculo en-
volvendo um ponto na superfı́cie da bola. Ao aumentarmos progressivamente o cı́rculo
em torno do ponto, ele desaparecerá no ponto diametralmente oposto ao ponto inicial.
Assim, a integral T S será sobre um domı́nio nulo e portanto T S = 0 neste caso. Nos
restringiremos a partir de agora a esta situação, que é o caso de interesse cosmológico.
Note que para espaços fechados, onde o termo T S é nulo, a hamiltoniana, por ser uma
combinação linear dos vı́nculos aos quais toda solução deve satisafazer, é nula. Se ex-
trapolarmos para a TRG a interpretação usual da hamiltoniana como sendo a energia
do sistema, a conclusão é que a energia total de qualquer sistema gravitacional que
tenha espaço fechado é nula. Por isso, universos com espaços fechados são preferidos
em Cosmologia: eles têm energia zero!

Os passos usuais para se quantizar uma teoria são:

i) Transformar as variáveis canônicas em operadores que obedecem regras de co-


mutação oriundas dos parênteses de Poisson. Em geral, para funções A(q, p) e B(q, p)
temos [Â, B̂] ≡ ÂB̂ − B̂ Â = i~{A, B} ≡ (∂A/∂q)(∂B/∂p) − (∂B/∂q)(∂A/∂p),

ii) Escrever a hamiltoniana em termos destes operadores.

iii) Escrever a equação de Schroedinger associada [Eq.(10.12)].

Mas o que fazer quando aparece um vı́nculo f (q, p) = 0 na teoria? Não podemos
escrevê-los simplesmente como identidades entre operadores pois se f (q̂, p̂) = 0 então
[f, A] = 0 para qualquer A. Entretanto, {f, A} não se anula para qualquer A (tente
se convencer disso com um exemplo) e assim terı́amos uma contradição com a regra
(i). Dirac propôs então a regra5 :

iv) f (q̂, p̂)Ψ = 0


5
Na verdade a nova regra depende do tipo de vı́nculo em questão. Mas na TRG só aparecem vı́nculos
do tipo em que a regra a seguir é válida.

365
Neste momento, o melhor a fazer é investigarmos um exemplo concreto para fixarmos
estas idéias.
Seja uma partı́cula não relativı́stica com a ação
Z
S = dtL(q, dq/dt, t) (10.15)

onde L representa a sua lagrangeana. A hamiltoniana pode ser definida a par-


tir da definição do momentum p = ∂L/∂(dq/dt) e da transformação de Legendre
H = pdq/dt − L. A quantização da teoria fornece a equação de Schroedinger usual
(10.12).
Suponha agora que escolhamos um novo parâmetro temporal τ e que o tempo t antigo
se torne uma nova coordenada generalizada t = t(τ ). A nova ação fica:
Z
S = dτ ṫL(q, q̇/ṫ, t). (10.16)

O ponto significa derivada em relação a τ . É fácil mostrar que a ação (10.16) não muda
de forma se reparametrizarmos novamente o tempo, τ̃ = τ̃ (τ ), ou seja, ela apresenta
a mesma propriedade da ação da TRG de ser invariante por transformações gerais no
tempo.
A nova lagrangeana é dada por L̄(q, q̇, t, ṫ) = ṫL(q, q̇/ṫ, t). Os momenta são dados por

∂ L̄ ∂L ∂(dq/dt)
π≡ = ṫ =p (10.17)
∂ q̇ ∂(dq/dt) ∂ q̇
e
∂ L̄ dq
π0 ≡ = L(q, q̇/ṫ, t) − p = −H(q, p, t) = −H(q, π, t). (10.18)
∂ ṫ dt
Assim temos o vı́nculo
π0 + H(q, π, t) = 0, (10.19)
que é uma relação do tipo f (q, t, π, π0 ) = 0.
A hamiltoniana canônica é

Hc = π0 ṫ + π q̇ − L̄ = ṫ[π0 + H(q, π, t)], (10.20)

que é nula devido ao vı́nculo (10.19). Assim, segundo a prescrição de Dirac, a hamil-
toniana total é
HT = N [π0 + H(q, π, t)], (10.21)
onde N é o multiplicador de Lagrange associado ao vı́nculo (10.19).
É fácil verificar que esta hamiltoniana fornece as equações corretas do sistema. A
variação em relação a N fornece o vı́nculo H = 0. As equações de Hamilton ṫ =
∂HT /∂π0 , π˙0 = −∂HT /∂q0 , q̇ = ∂HT /∂π e π̇ = −∂HT /∂q nos dão que N = ṫ, a
conservação de H em t se esta não depende explicitamente do tempo t e as equações
de Hamilton do sistema original envolvendo a evolução no tempo t, respectivamente.

366
Aplicando as regras de quantização de Dirac para este tipo de sistema obtemos a
equações
∂Ψ(q, t, τ )
i~ = HT (π̂, πˆ0 , q̂, τ̂ , )Ψ(q, t, τ ), (10.22)
∂τ
e a regra de quantização (iv) fornece, neste caso,

[π̂0 + H(q̂, π̂, t̂)]Ψ(q, t, τ ) = 0. (10.23)

Usando a Eq.(10.23) em (10.22) obtemos que o lado direito é nulo e portanto Ψ não
depende de τ . Na representação π̂0 = −i~∂/∂t, a Eq.(10.23) fornece exatamente a
equação de Schroedinger original (10.12). As regras de quantização de Dirac para
sistemas vinculados são perfeitamente consistentes.
Voltemos agora a hamiltoniana da TRG
Z
H = d3 x[N H(x) + Ni Hi (x)] (10.24)

já assumindo T S = 0. Note que, como no exemplo acima, a hamiltoniana é zero: ela
é uma combinação linear de vı́nculos. Isto implica, como no exemplo anterior, que
ao impormos a equação de Scroedinger encontraremos simplesmente que a função de
onda não depende de t, ou seja, ela depende somente da métrica gij , a única variável
dinâmica relacionada ao campo gravitacional, e dos campos de matéria. Temos ainda
as equações quânticas provenientes dos vı́nculos:

ĤΨ = 0 (10.25)

e
Ĥi Ψ = 0. (10.26)

A segunda atesta simplesmente que a função de onda é invariante por transformações


gerais de coordenadas espaciais.
Como a primeira está ligada ao vı́nculo relacionado à invariância da TRG por trans-
formações gerais da coordenada temporal, presume-se, analogamente ao exemplo ex-
ibido, que ela forneça a dinâmica da função de onda com relação a algum tempo escon-
dido nas demais variáveis canônicas. Ela é chamada de equação de Wheeler-DeWitt,
em homenagem aos seus formuladores Bryce DeWitt e John Wheeler.
No caso da partı́cula não relativı́stica descrito anteriormente, foi fácil encontrar a
variável canônica que faz o papel do tempo: o vı́nculo (10.19) apresenta um termo
linear num dos momenta conjugados. Desta forma, a coordenada conjugada a este
momento pode ser associada ao tempo já que a dependência linear no seu momento
conjugado implica, na representação de coordenadas, uma derivada de primeira ordem
nesta coordenada, exatamente como acontece com o tempo na equação de Schrödinger
usual, como foi visto acima. Entretanto, na maior parte dos casos, Ĥ não apresenta
dependência linear em nenhum dos momenta que nele aparecem e portanto fica muito

367
difı́cil saber qual variável faz o papel do tempo nesta aboradgem da TQG. Pior que
isso, como a equação (10.25) em geral não se apresenta na forma de Schrödinger, fica
muito difı́cil saber como calcular probabilidades a partir de uma solução Ψ. Uma boa
probabilidade tem que ser positiva definida e sua soma ou integral sobre todos os
resultados possı́veis ser igual a 1. Se Ψ satisfaz uma equação tipo Schrödinger (com
derivada primeiro no tempo), é fácil mostrar, sendo Ĥ auto-adjunto, que |Ψ|2 satisfaz
estas propriedades. Caso contrário, o problema é bem mais complexo.

Há algumas saı́das para este problema:

i) Aceitar que neste nı́vel fundamental realmente não exista noção de tempo. O tempo
só aparece quando a geometria começa a se comportar classicamente. De fato, foi
mostrado que na aproximação clássica, a equação (10.25) pode ser escrita na forma de
Schrödinger. No regime puramente quântico, deve-se procurar outras formas de definir
probabilidade com Ψ.

ii) Encontrar nos campos de matéria o tempo ou reescrever (10.25) na forma de


Schrödinger de alguma maneira.

iii) Utilizar uma interpretação da TQ onde probabilidades não sejam fundamentais.


Isto será visto com mais detalhe na próxima seção.

Além deste problema do tempo, a equação de Wheeler-DeWitt é extremamente com-


plicada. Não se conhece nenhuma solução para ela, a não ser que várias simplificações
sejam impostas de inı́cio.

Estes problemas deixaram por algum tempo esta abordagem parada, até que nos
anos 80, Abhay Ashtekar conseguiu simplificar dramaticamente o vı́nculo H utilizando
novas variáveis, chamadas variáveis de Ashtekar, tornando-o similar aos vı́nculos que
aparecem em outras teorias cuja quantização é bem conhecida. Isto deu um novo
impulso à quantização canônica da gravitação.

Estas novas variáveis eram generalizações complexas da conexão. Um grave prob-


lema inicial foi o de retornar a variáveis reais, que exigia resolver equações quase
tão complicadas quanto a própria equação de Wheeler-DeWitt original. Após alguns
anos de trabalho, com algumas desistências pelo meio do caminho, mostrou-se que
generalizações das variáveis de Ashtekar originais, que podiam ser reais e continham
um parâmetro arbitrário, também simplificavam a equação de Wheeler-DeWitt. A
seguir, foram encontradas inúmeras soluções destas equações quânticas, que formam
uma base, em termos de integrais de caminho fechado destas variáveis. Probabili-
dades bem definidas foram construı́das a partir destas soluções. A teoria passou a se
chamar Gravitação Quântica de Laços, os laços se referindo a esses caminhos fechados
nas integrais. Mostrou-se que esses laços poderiam se agrupar nas chamadas redes de
spin, entidades matemáticas que já haviam sido sugeridas por Roger Penrose como
relevantes para a Gravitação Quântica. Hoje, esta formulação da TQG apresenta um
quadro bem preciso do espaço-tempo quântico na escala de Planck em termos desta

368
rede de spins e dos nós que estes laços podem apresentar. Não há noção de tempo nesta
escala, ou seja, nesta teoria foi adotada a postura (i) citada acima para resolver o prob-
lema do tempo na equação de Wheeler-DeWitt. Foi possı́vel mostrar a quantização da
área e do volume nestas escalas. Com o ajuste adequado do parâmetro arbitrário que
aparece nas novas variáveis, citado acima, conseguiu-se também mostrar a fórmula da
entropia dos buracos negros em função da área do seu horizonte.
O grande problema deste formalismo é obter, a partir destas redes de spin, o estado
fundamental da teoria e o espaço-tempo contı́nuo da TRG clássica. Sem isso, é im-
possı́vel fazer qualquer predição que possa ser testada. Este é o problema crucial que
os pesquisadores que atuam nesta área estão agora atacando.

10.2.2 Quantização Covariante

Na década de 60 do século XX, foi iniciada uma outra abordagem para quantizar
a gravitação baseada no que já se tinha feito para quantizar outras interações da
natureza.
Por exemplo, a repulsão eletromagnética entre dois elétrons é vista, do ponto de vista
quântico, como uma troca incessante dos quanta de campo eletromagnético, os fótons,
partı́culas de spin 1, como dois patinadores de gelo que se afastam um do outro ao
arremessarem um ao outro uma pesada bola. Esta troca é regida pelo tipo de potencial
de interação entre os elétrons e o fóton e é calculada perturbativamente através de
uma expansão em potências do parâmetro adimensional da teoria, e2 /(~c) = 1/137,
onde e é a carga do elétron. As possibilidades quânticas no caminho do fóton entre
os dois elétrons são inúmeras: o fóton pode ir direto, mas também pode desapare-
cer no meio do caminho produzindo um par partı́cula e anti-partı́cula, um elétron e
um pósitron, que logo após desaparecem fazendo reaparecer o fóton. Como só os dois
elétrons em interação podem ser observados, o fóton e o par entre eles não podem ser
detetados e por isso são chamados de partı́culas virtuais. Este processo intermediário
pode acontecer várias vezes no caminho do fóton e num curtı́ssimo intervalo de tempo.
Lembrando a relação de incerteza quântica envolvendo tempo e energia, as energias
envolvidas neste processo podem ser muito altas. O resultado final do cálculo de todos
esses processos possı́veis são inúmeros infinitos, o que parece tornar a teoria inconsis-
tente. Mesmo as massas e cargas dos elétrons calculadas desta maneira são infinitas.
Mas foi observado um fato matemático espantoso: se simplesmente retirarmos os in-
finitos das cargas e massas para que estas apresentem os valores finitos observados,
todos os outros infinitos desaparecem! Desta maneira a teoria faz sentido e produz
números que estão de acordo com resultados experimentais em até 12 casas decimais!
Este processo de retirada de infinitos é chamado de renormalização e a teoria é dita
renormalizv́el.
A idéia é fazer o mesmo com a gravitação. Para tal, escreve-se a métrica gµν na

369
forma gµν = ηµν + hµν (cuja inversa g µν se escreve como uma série infinita, g µν =
η µν + hµν + hµα hνα + ...), onde ηµν é a métrica de Minkoski, e faz-se a substituição
na lagrangiana da TRG. A teoria agora é entendida não da forma geométrica que
Einstein propôs mas como uma teoria do campo hµν se propagando no espaço-tempo de
Minkowski, interagindo com todos os campos da Natureza e consigo próprio (lembre-
se que o campo gravitacional interage com qualquer forma de energia). A quantização
da teoria levaria a um quadro similar ao da Elotrodinâmica Quântica descrito acima:
duas formas de energia interagiriam gravitacionalmente através da troca de quanta do
campo hµν , o chamado gráviton, de spin 2, que se propagaria no espaço-tempo de fundo
de Minkowski. Entretanto, os cálculos através de métodos perturbativos similares aos
da Eletrodinâmica Quântica mostraram uma situação catastrófica: os infinitos são
infinitamente diversos, ou seja, a remoção a mão de 2 ou 3 deles através de uma
renormalização não elimina os demais. Seriam necessárias infinitas renormalizações
para se encontrar resultados finitos. A TRG não é renormalizável do ponto de vista
perturbativo. Uma das razões é que, diferentemente das outras interações onde altas
energias não implicam em forte interação, partı́culas virtuais com energia tendendo
a infinito, permitidas pelo princı́pio da incerteza, interagem gravitacionalmente de
forma ilimitada, produzindo infinitos intratáveis.
Isto desanimou grande parte da comunidade até que um novo alento surgiu. Sabia-
se até então da existência de dois tipos de partı́culas fundamentais: os férmions,
de spin semi-inteiro, relacionados com a matéria propriamente dita, e os bósons, de
spin inteiro, relacionados com os quanta das interações fundamentais. Elas obedecem
estatı́sticas totalmente diferentes devido ao princı́pio da exclusão de Pauli. Em meados
da década de 70, mostrou-se a existência de uma simetria, chamada supersimetria, que
relacionava bósons com férmions: para cada bóson existiria um férmion associado (o
fóton, de spin 1, teria seu parcerio supersimétrico, o fotino, de spin 1/2, e assim
por diante) e vice-versa. Teorias supersimétricas teriam bem menos infinitos que as
teorias usuais já que os infinitos dos férmions se cancelam com os dos bósons. Com isto
foi construı́da a chamada supergravidade, uma teoria supersimétrica da gravitação e
que também pretendia ser uma teoria de unificação. Entretanto tal teoria, embora
bem menos problemática do ponto de vista perturbativo que a TRG, ainda não era
renormalizável.
Na década de 60 surgiu a idéia de se descrever processos da interação forte, aquela
responsável por manter o núcleo atômico estável, por meio de cordas segurando as
partı́culas do núcleo. Esta abordagem foi abandonada devido ao sucesso da teoria
que passou a descrever estas interações, a Cromodinâmica Quântica. Como era sabido
que as excitações destas cordas produziam, entre outras, partı́culas de spin 1 como
o fóton e de spin 2 como o gráviton, foi sugerido na década de 80 que elas fossem
utilizadas não apenas para descrever as interações fortes mas para um projeto bem
mais ambicioso: a descrição unificada de todas as interações. Assim, o mundo não
seria constituı́do de partı́culas mas de cordas, cujas excitações nos dariam todas as

370
partı́culas mediadoras das interações conhecidas e, quando tornada supersimétrica, as
partı́culas que compõem os átomos formadores da matéria usual. A teoria era formu-
lada em 9 dimensões espaciais e 1 de tempo, sua expansão perturbativa não continha
infinitos e produzia, num certo limite, a TRG. Houve grande excitação já que esta
era a primeira vez que se inseria a TRG numa teoria consitente perturbativamente, e
ainda por cima que encampava as outras interações.
Entretanto, vários problemas foram surgindo:
i) Percebemos apenas 3 dimensões espaciais e portanto é necessário incluir na teoria
uma dinâmica que possibilite a compactificação das outras 6 dimensões espaciais em
tamanhos minúsculos para que não possamos percebê-las. Porém, existem milhares
de esquemas de compactificação possı́veis, deixando a teoria praticamente sem poder
preditivo: cada maneira de compactificar implica em um determinado tipo de teoria
de campos e partı́culas nas 3 dimensões espaciais não compactificadas que observamos.
ii) Embora a série perturbativa tenha seus elementos finitos, existem fortes indicações
de que a série não converge, deixando assim muitas dúvidas sobre a validade do trata-
mento perturbativo também para esta teoria.
iii) A teoria é formulada num espaço-tempo de fundo fixado, sem dinâmica, onde as
cordas se propagam e interagem, em franca oposição ao espı́rito da TRG, onde não
cabe um espaço-tempo a priori.
Hoje existem algumas teorias de corda, todas elas interligadas por certas trans-
formações, que levou muitos a conjecturar que exista uma teoria ainda mais fun-
damental, denominada teoria M, da qual todas elas provêm.
As teorias de cordas também são bem sucedidas em calcular a entropia do buraco
negro, mas só dos carregados cuja carga elétrica, quando multiplicada pelas constantes
apropriadas, tem valor bem próximo da sua massa. As teorias de corda têm uma escala
diferente da escala de Planck já que existe uma quantidade, a tensão fundamental
da corda, que define outras escalas de comprimento, tempo e energia. A escala de
comprimento é maior que o comprimento de Planck. A constante gravitacional G é
governada por um campo e portanto varia com o tempo, tendendo ao valor atual após
vários processos dinâmicos ocorridos na teoria.

10.2.3 Gravitação Quântica de Laços ou Supercordas? Ou


ambas?

Os problemas e virtudes da Gravitação Quântica de Laços (dificuldade de se obter o


espaço-tempo clássico e fazer cálculos de espalhamento por um lado, independência de
um espaço de fundo, formulação não perturbativa com descrição detalhada do espaço-
tempo quântico, por outro) são complementares aos problemas e virtudes da teoria de
cordas (dificuldade de se formular a teoria sem um espaço-tempo de fundo, formulação

371
perturbativa problemática, ambiguidade por haver inúmeras teorias possı́veis por um
lado, possibilidade de fazer cálculos de espalhamento utilizando a noção de gráviton,
espaço-tempo clássico facilmente recuperável, teoria de unificação, por outro).
Isto sugere a alguns pesquisadores que elas sejam dois lados complementares de uma
teoria mais fundamental, ademais sabendo que a escala de comprimento vinda das
cordas é maior que a escala de Planck. Na escala de Planck mais fundamental, terı́amos
então uma teoria de laços, nós e redes de spins, que em escalas maiores geram as cordas,
e não diretamente o espaço-tempo contı́nuo, que então nos levaria aos espaços-tempos
soluções das equações de Einstein que tanto procuramos. Talvez este seja o melhor
esboço da teoria M que se tem hoje mas ainda falta muito para obtê-la em termos
matemáticos precisos.

10.3 Cosmologia Quântica


Poder-se-ia pensar que, uma vez obtida uma TQG consistente, sua aplicação à Cos-
mologia seria imediata. Entretanto, a formulação de uma TQG consistente é uma
condição necessária mas não suficiente para se obter uma Cosmologia Quântica com-
pleta. Isto se deve ao fato de a Cosmologia ser uma disciplina da fı́sica muito especial:
o sistema de estudo é a totalidade de todos os processos fı́sicos. Isto impõe dois prob-
lemas adicionais.
O primeiro, já discutido na introdução, diz respeito às condições iniciais: não basta
ter as equações da TQG e sua solução geral mas é preciso haver um critério para
selecionar dentre elas aquela que represente a função de onda do Universo.
O segundo, diz respeito à interpretação da Teoria Quântica: aquela que se aprende
nos cursos de graduação em fı́sica, a interpretação de Copenhaguen, não pode ser
aplicada ao Universo. Isto vem da maneira como ela resolve o problema da medida
quântica. Quando um aparelho de medida interage com o sistema observado para medir
o valor de um observável, a função de onda que descreve tanto o sistema quanto o
aparelho de medida se divide em vários ramos que não se superpõem, cada um contendo
um dos auto-estados possı́veis do sistema relacionados aos possı́veis auto-valores do
observável e o ponteiro do aparelho de medida apontando para este auto-valor. Este
processo pode ser descrito pela equação de Schrödinger que evolui a função de onda.
Entretanto, o resultado final da medida é apenas um desses ramos. Diz-se portanto
que os outros ramos colapsam, o chamado colapso da função de onda. Este processo
não pode ser descrito pela equação de Schrödinger, ou qualquer equação quântica
linear que implique num operador evolução que conserve probabilidade. Desta forma,
a interpretação de Copenhaguen afirma que este processo se dá num mundo clássico,
através de uma aparelho de medida e/ou observador macroscópicos que só podem ser
descritos classicamente, exterior ao sistema observado. Mas se o sistema é o Universo,
que contem tudo que existe, inclusive nós, os observadores, não há lugar para um

372
mundo clássico externo a este sistema. Assim a interpretação de Copenhaguen não
pode ser utilizada na Cosmologia Quântica.

Há no entanto interpretações da TQ alternativas a de Copenhaguen, algumas formu-


ladas exatamente para resolver este problema, que podem ser utilizadas. Elas são:

1) Mecânica quântica não linear.

Nesta abordagem, a intervenção de um aparelho de medida clássico macroscópico induz


não linearidades na equação de Schrödinger que provoca dinamicamente o colapso.
Esta tese é defendida por Ghirardhi, Rimini e Penrose, este último argumentando que
os efeitos gravitacionais do aparelho macroscópico induziriam este processo.

2) A interpretação de vários mundos.

Esta interpretação foi sugerida por Everett no final da década de 50 do século XX


justamente para ser aplicada à Cosmologia Quântica. Nela não há colapso: todos os
ramos nos quais a função de onda se dividiu continuam existindo, cada uma contendo
um observador que registra o seu respectivo auto-valor. Nenhum dos observadores tem
consciência da existência dos outros pois os ramos não se interpenetram. Ou seja, há
uma multiplicação de mundos em cada processo de medida quântica e para cada ob-
servador o colapso é aparente mas de fato não é real. Isto soa estranho mas não há
nenhuma evidência concreta que ela esteja errada. Mesmo que não seja respeitada a
conservação de energia com a criação de todos esses mundos, cada observador perce-
berá que no mundo que ele observa vale a lei de conservação de energia.

Não havendo colapso, não há necessidade de mundo clássico externo, a evolução
quântica é sempre linear e pode ser aplicada ao Universo. Esta é a interpretação
mais usada em Cosmologia Quântica e defendida por vários teóricos de fundamentos
da TQ.

3) A interpretação de Bohm-de Broglie.

Nesta interpretação, proposta por Louis de Broglie e elaborada por David Bohm no
começo dos anos 50, além da função de onda, o sistema quântico é definido também
pelas trajetórias de partı́culas e campos bem definidas e com realidade objetiva (exis-
tem independentemente da observação). No processo de medida, as partı́culas que de-
screvem o sistema observado e o aparelho de medida entram em apenas um dos ramos
seguindo a sua trajetória, singularizando este ramo com respeito aos outros. Pode-se
mostrar que os demais ramos, sem a presença das partı́culas e por isso chamadas de
ondas vazias, não podem ser detetadas por qualquer outro observador. Assim, como
no caso anterior, o colapso é aparente mas não é real. O auto-valor selecionado é
aquele em cujo ramo as partı́culas entraram. Novamente, não havendo colapso, não

373
há necessidade de mundo clássico externo, a evolução quântica é sempre linear e pode
ser aplicada ao Universo.

Por enquanto não há nenhuma evidência experimental que privilegie uma interpretação
em relação a outra, incluindo a interpretação de Copenhaguen. As preferências por
uma ou por outra são de caráter puramente estético e/ou filosófico. Para fins didáticos
passarei a descrever com mais detalhe a interpretação de Bohm-de Broglie por ser
aquela onde é mais fácil obter resultados e interpretá-los em Cosmologia Quântica.

10.3.1 A interpretação de Bohm-de Broglie

Em 1927, de Broglie apresentou sua interpretação de onda piloto da mecânica quântica


no congresso de Solvay. Pauli fez crı́ticas que de Broglie não conseguiu responder e
ela foi abandonada em favor da interpretação de Copenhaguen, que emergia na época.
Após escrever seu livro de mecânica quântica, utilizando a interpretação da Copnh-
aguen, Bohm, insatisfeito com as várias lacunas desta interpretação, escreve em 1952
um artigo cientı́fico onde elabora a teoria de de Broglie e responde às crı́ticas de Pauli.
Vamos examinar como ela funciona no caso da mecânica quântica não relativı́stica:
Seja a equação de Schrödinger

~2 2
 
∂Ψ(x, t)
i~ = − ∇ + V (x) Ψ(x, t). (10.27)
∂t 2m

Escrevendo Ψ na forma polar Ψ = A exp(iS/~) obtem-se

∂A2  ∇S 
+ ∇· A2 = 0, (10.28)
∂t m

∂S (∇S)2 ~2 ∇2 A
+ +V − = 0. (10.29)
∂t 2m 2m A
A primeira é simplesmente uma equação de continuidade para A2 . A segunda é uma
~2 ∇2 A
equação de Hamilton-Jacobi com um potencial extra Q ≡ − 2m A
.
Até aqui, apenas escreveu-se equação de Schrödinger de outra forma. Entretanto, esta
forma sugere as novas hipóteses de Bohm, que são:
i) A trajetória x(t) da partı́cula existe, independentemente de observações! Esta é
uma mudança radical em relação à interpretação de Copenhaguen, para a qual o
mundo quântico não observado não passa de um conjunto de meras potencialidades
sem existência concreta.
ii) A equação (10.29), do tipo Hamilton-Jacobi, sugere que a trajetŕia da partı́cula
satisfaça a equação p = mẋ = ∇S(x, t), como na formulação de Hamilton-Jacobi
da mecânica clássica usual. A solução desta equação x = x(x0 , t) é a trajetória da

374
partı́cula, que no entanto só será determinada completamente com o conhecimento
da constante inicial x0 . A grande diferença do caso clássico é a presença do potencial
~2 ∇2 A
Q ≡ − 2m A
, cujas propriedades serão discutidas adiante. Devido à presença deste
potencial, S não é a função de Hamilton-Jacobi clássica e portanto as trajetórias
encontradas a partir dela serão diferentes da trajetória clássica. O potencial Q ≡
~2 ∇2 A
− 2m A
é portanto o responsável pelos efeitos quânticos. Por isso ele é chamado de
potencial quântico.

iii) A condição inicial x0 é a variável escondida da teoria. O sistema só é comple-


tamente determinado se a conhecermos mas se procurarmos obtê-la através de uma
medida, a partı́cula sairá da sua trajetória inicial. Se pensarmos agora um fluido destas
partı́culas com diferentes posições iniciais x0 cuja distribuição de probabilidade é dada
por P (x0 ) = A2 (x, t = t0 ), a equação (10.28) implica que a probabilidade de encon-
trarmos a partı́cula numa posição qualquer x num tempo posterior é P (x) = A2 (x, t),
recuperando-se todas as previsões estatı́sticas da mecânica quântica usual. Note que,
neste ponto de vista de fluidos e uma vez que as partı́culas do fluido satisafazem
mẋ = ∇S(x, t), a equação (10.28) nada mais é que dP/dt = 0, ou seja, as trajetórias
não podem ser criadas ou aniquilidas (lembre-se que estamos tratando de partı́culas
não-relativı́sticas).

Algumas observações importantes:

a) Q é altamente não local e dependente de contexto. Ele é o responsável pelos efeitos


quânticos. Por exemplo, na experiência de interferência quântica da fenda dupla, é ele
que age nos elétrons no caminho para o anteparo, levando-o a trajetórias totalmente
diferente das clássicas. Como a função de onda na experiência da fenda dupla depende
da abertura das fendas e da separação entre elas, o potencial quântico também. Assim
esta informação está a todo instante sendo passada às partı́culas e não apenas por
interações locais com a fenda quando elas passam por elas como aconteceria com
partı́culas clássicas. O resultado final é uma distribuição de partı́culas no anteparo
exatamente igual à figura de interferência que todos vemos nos cursos de quântica.
Note que, contrariamente ao que muitas vezes é ensinado, a interferência quântica na
experiência da fenda dupla não implica que trajetórias não façam sentido em mecânica
quântica. A teoria de Bohm é um sólido contra exemplo.

b) Q = 0 é o limite clássico.

c) Contrariamente a todas as outras interpretações, probabilidades não são as únicas


informações que podemos extrair de um sistema quântico já que há muita informação
contida também na equação p = mẋ = ∇S(x, t). Esta é uma vantagem desta inter-
pretação em relação a todas as outras quando a aplicamos à Cosmologia Quântica de-
vido à dificuldade apontada anteriormente de se definir probabilidades nesta situação.
Veremos um exemplo disso na próxima sub-seção.

375
10.3.2 A Cosmologia Quântica e a singularidade cosmológica

Um das grandes perguntas que se espera poder responder com a Cosmologia Quântica
é saber se o Universo teve um começo realmente ou se ele é eterno. Evidentemente
esta pergunta ainda não pode ser respondida no estágio atual mas os caminhos que
podem nos levar a uma resposta definitiva e que tipo de resposta pode ser dada estão
cada vez mais claros.
O procedimento utilizado foi o de usar as grandes simetrias apresentadas pelo Universo
em que vivemos, sua homogeneidade e isotropia, para simplificar drasticamente a
equação de Wheeler-DeWitt e resolvê-la. Assim, ao invés de se quantizar o campo
gravitacional na sua generalidade, quantiza-se apenas os graus de liberdade que restam
de uma geometria homogênea e isotrópica.
Seja portanto a métrica homogênea e isotrópica mais geral dada por:

ds2 = N (t)2 dt2 − a(t)2 γij dxi dxj


a(t)2
= N (t)2 dt2 − [dr2 + r2 (dθ2 + sin2 (θ)dϕ2 )] , (10.30)
(1 + 4 r2 )2
onde N (t) é uma função colocada para deixar livre a escolha do tempo (N (t) = 1
corresponde ao tempo cósmico, N (t) = a(t) ao tempo conforme, etc) e corresponde ao
N (x, t) que aparece no formalismo hamiltoniano da TRG completa em (10.14), a(t) é
o fator de escala, com dimensão de comprimento e que não pode ser negativo e k é a
curvatura das hipersuperfı́cies espaciais: k = ±1, 0.
A ação de Einstein-Hilbert que fornece a parte gravitacional das equações de Einstein
gerais é

Z
1
I=− dt d3 x −gR , (10.31)

onde g é o determinante da métrica e R o escalar de curvatura.
Substiuindo a métrica (10.30) em (10.31) encontramos:

3 √ N a3  ȧ2
Z Z
1 ä ȧ Ṅ 
I= d x γ dt + − + . (10.32)
2κ 6 N 2 c2 a2 N 2 c2 a a c2 N 3 a2

Escrevendo  
ȧa2
äa 2 2
ȧa Ṅ d ȧ2 a
N
− = −2 , (10.33)
N N2 dt N
e substituindo em (10.32), eliminando a derivada total e fazendo a integral espacial
que fornece o volume comóvel V total do tri-espaço fechado, encontramos:
ȧ2
Z
3V  
I= N a3 − 2 2 + 2 dt . (10.34)
κ N a a

Vamos agora estudar dois modelos simples de Cosmologia Quântica, o primeiro cuja
fonte é a constante cosmológica com  = 1 e o segundo um fluido radiativo com p = ρ/3
com  = 0.

376
a) Constante cosmológica e  = 1
Adicionando-se a constante cosmológica Λ > 0 à ação (10.34) tem-se:

ȧ2
Z
3V 3
 1 Λ
I= Na − 2 2 2 + 2 − dt . (10.35)
κ cN a a 3

É fácil verificar que a variação desta ação com relação a N fornece a equação de
Friedmann (a equação de vı́nculo correspondente à equação de Einstein G00 = −Λ)

ȧ2 1 Λ
2 2 2
=− 2 + , (10.36)
cN a a 3
enquanto a outra nos dá a equação dinâmica (correspondente à equação Gij = −Λδji )

2ä ȧṄ N ȧ2


−2 2 + 2 + 2 2 − ΛN = 0 . (10.37)
c2 aN c aN a caN
Para reobter as equações no tempo cósmico é só fazer N = 1 nestas equações.
Podemos também facilmente obter a hamiltoniana definindo p = ∂L/∂ ȧ e λ =
3V c4 /(8πG) encontrando:
 2 2
λΛa3

cp
H ≡ N H0 = N − − λa + , (10.38)
λ4a 3

As constantes foram absorvidas na definição de N . É fácil verificar que, usando a


equação de hamilton ȧ = ∂H/∂p, o vı́nculo H0 = 0 fornece (10.36), enquanto que
a outra equação de hamilton ṗ = −∂H/∂a nos dá (10.37). Compare esta hamilto-
niana com a hamiltoniana geral da TRG (10.14). Vemos que só aparece o vı́nculo
relacionado às transformações no tempo. O vı́nculo relacionado às transformações de
coordenadas espaciais não aparece aqui porque as simetrias de isotropia e homogenei-
dade das hipersuperfı́cies espaciais impuseram uma escolha de coordenadas espaciais
adaptadas a esta simetria. Veja também como foi importante considerarmos N na
métrica (10.30): sem isto não terı́amos obtido a equação de Friedmann (10.36), obtida
tanto da ação (10.35) quanto da hamiltoniana (10.38) pela variação destas em relação
a N.
Implementando agora o método de quantização de Dirac exposto na seção anterior,
encontramos a seguinte equação de Wheeler-DeWitt para este modelo:
2 2
"  #
2lpl ∂2
Ĥ0 Ψ(a) = 0 → − + a2 − Λa4 Ψ(a) = 0. (10.39)
3V ∂a2

Ela corresponde a uma equação de Schrödinger unidimensional estacionária (o tempo


não aparece) para a variável a com energia nula e potencial V (a) = a2 − Λa4 . A
região entre a = 0 (a singularidade) e a = Λ−1/2 é uma região classicamente proibida
pois o potencial V (a) > 0 = E e a região a > Λ−1/2 é classicamente permitida
pois V (a) < 0 = E. Este modelo bem simples sugere a possibilidade quântica de o

377
Universo ter tido um começo não singular tunelando do nada e passando a existir
com raio mı́nimo a = Λ−1/2 . Este tipo de comportamento aparece em outros modelos
mais elaborados. Note que esta criação quântica do Universo é também a criação do
espaço-tempo.

b) Fluido de radiação e  = 0
Como neste caso a obtenção da hamiltoniana da parte material não é trivial, embora a
sua forma final seja bastante simples, escreverei-a diretamente. Cabe ao leitor verificar
que ela de fato gera as equações de Einstein para o modelo do Friedmann com radiação
e k = 0. Ela se escreve na forma
 2 2 
pc PT
H ≡ N H0 = N − + . (10.40)
λ4a a

A quantidade conservada PT está relacionada à quantidade total de radiação no Uni-


verso ρR = PT /a4 e tem dimensão [PT ] = g cm3 /s2 . Note que ele aparece linearmente
na hamiltoniana e portanto sua variável conjugada T pode ser associada ao tempo
(embora [T ] = s/cm). Escolher esse T é equivalente a fazer N = a/l0 , l0 sendo uma
constante arbitrária com dimensão de comprimento que será cancelada (verifique), ou
seja, escolher o tempo conforme. Este é um daqueles casos onde a matéria fornece uma
referência temporal. Definindo η = cT e
r
a 3V
ã = ,
lpl 8π

a quantização fornece
∂Ψ ∂ 2Ψ
Ĥ0 Ψ(a, η) = 0 → i =− . (10.41)
∂η 4∂a2
Uma solução para esta equação pode ser obtida da evolução unitária da gaussiana
inicial6 :  8b 1/4
Ψ0 (a) = exp(−ba2 ), (10.42)
π
gerando
 8b 1/4  1 1/2 nih i i o
Ψ(a, η) = exp 1+ a2 . (10.43)
π bη − i η (bη − i)
Vamos interpretar esta solução usando a interpretação de Bohm-de Broglie após es-
crevermos Ψ = AeiS e substituindo em (10.41) obtendo:

∂A2  ∇S 
+ ∇· A2 = 0, (10.44)
∂t 2

∂S (∇S)2 ~2 ∇2 A
+ − = 0. (10.45)
∂t 4 4 A
6
O fato do domı́nio de a ser o conjunto dos reais positivos torna a tarefa um pouco mais elaborada,
R∞
tendo que se ter cuidado para que a solução encontrada satisfaça 0 da|Ψ2 (a, η)| = 1.

378
Através da equação p = 2ȧ = ∇S = ∂S/∂a, de onde interpretamos a primeira equação
como uma equação de continuidade [veja a sub-seção (3.1)], é possı́vel integrar a(t)
obtendo
p
a(η) = a0 b2 η 2 + 1 (10.46)

Esta solução é bastante interessante. Representa um universo eterno sem singulari-


dade que se contrai de η = −∞ classicamente, onde ele é imenso, praticamente vazio
e plano, chega a un mı́nimo quando sua contração é interrompida pela ação do po-
tencial quântico, que funciona como um potencial repulsivo neste momento, e depois
se expande novamente até atingir o limite clássico em η = ∞. Pode-se mostrar que o
potencial quântico tende a zero para η = ±∞ mas é bastante relevante perto do raio
mı́nimo. Assim, efeitos quânticos podem evitar a singularidade tornando o Universo
eterno. Como radiação é um bom modelo para a descrição do Universo primordial
(a temperaturas altas, todas as partı́culas se tornam relativı́sticas pois suas energias
cinéticas ficam muito maiores que as energias de repouso), este resultado pode real-
mente indicar o que acontece com o Universo primordial a altas energias. Note que
após a fase quântica, este modelo entra numa fase clássica consistente com as ob-
servações. Este resultado é vaĺido qualquer que seja o valor da constante inicial (a
variável escondida de Bohm) a0 . Chegamos portanto a essas conclusões sem usar a
noção de probabilidade, o que mostra a força desta interpretação.

Existem ainda outras possibilidades de descrição da história completa do Universo,


algumas vindas das teorias de cordas.
Numa delas, o Universo viria de uma eterna expansão acelerada com k = 0 desde
t = −∞ com a(t) ∝ |t|−p , p > 0. Este comportamento é bastante curioso: para
t → −∞ o Universo é muito pequeno, a(t) → 0, mas é praticamente plano pois a
curvatura R ∝ |t|−2 tende a zero. Para t → 0 o Universo é muito grande, a(t) → ∞,
mas tende à singularidade pois a curvatura R ∝ |t|−2 tende a infinito neste limite.
Nesta situação, correções quânticas provenientes da teoria de cordas imporiam uma
transição para uma nova fase em t > 0 de expansão desacelerada a(t) ∝ tp (com
0 < p < 1) do Universo clássico usual. Note que tanto neste caso como no exemplo (b)
acima, podemos entender fundamentalmente o Universo como tendo evoluı́do de uma
instabilidade quântica do espaço-tempo de Minkwski, no primeiro caso pequeno que
se expande aceleradamente e no segundo muito grande que se contrai, e que num certo
momento efeitos quânticos introduzem uma transição para a expansão desacelerada
do Universo clássico usual.

10.3.3 Condições iniciais

Existem várias propostas de condição de contorno para a equação de Wheeler-DeWitt


que permita obter uma única solução da mesma. A mais famosa é a de Hartle-Hawking.

379
Eles se utilizam de uma definição de estado de vácuo baseada em uma formulação da
mecânica quântica em termos de integrais de trajetória proposta por Richard Feyn-
man, onde não é necessária a definição de energia mas que obviamente fornece o estado
de mı́nima energia e excitação nos sistemas onde estes conceitos podem ser definidos.
Esta definição pode ser generalizada e aplicada à quantização da TRG de onde produz,
em sistemas cosmológicos, a função de onda do Universo. É uma proposta com grande
apelo geométrico que já produziu alguns resultados bastante razoáveis (no sentido
de implicar a formação do Universo observado). Entretanto, em algumas situações,
esta prescrição não produz uma única solução da equação de Wheeler-DeWitt: muitas
vezes os caminhos nas integrais de trajetória têm que ser complexos e o resultado final
pode depender do caminho complexo escolhido. Este assunto ainda está em discussão.
Existem outras propostas, como a condição de contorno de tunelamento proposta
por Alexander Vilenkin, que essencialmente tenta impor às soluções da equação de
Wheeler DeWitt que, como no exemplo (a) da subseção anterior, o Universo surgiu
de um tunelamento do nada. Ela não tem o mesmo apelo geométrico da condição
de Hartle-Hawking mas também produz resultados consistentes, em alguns exemplos
melhores que os provenientes da condição de Hartle-Hawking.
Esta área de pesquisa ainda é muito especulativa pois depende muito da formulação
final de uma TQG consistente mas isto não impede a proposição de sugestões e seu
estudo em sistemas simples, como exposto acima, para examinar sua consistência e
viabilidade.

10.4 Comparação com a Observação


Embora por muito tempo se considerasse que a construção de uma TQG e CQ fosse
apenas um exercı́cio teórico sem qualquer possibilidade de verificação experimental,
dada a pequenez das escalas de Planck de tempo e comprimento e o alto valor das en-
ergias envolvidas, hoje já se começa a vislumbrar algumas possibilidades de verificação
observacional das idéias propostas. Vamos citar algumas:

10.4.1 Verficação da natureza discreta do espaço-tempo

Os ‘átomos’ de espaço-tempo, segundo as teorias descritas aqui, teriam dimensões ex-


tremamente pequenas, da ordem do comprimento de Planck, e portanto muito difı́ceis
de serem observadas. Entretanto, para partı́culas que viajassem por longas distâncias,
o efeito desta natureza discreta do espaço-tempo pode ser cumulativo e se tornar
relevante.
Um exemplo de aplicação desta idéia seriam os raios cósmicos de altas energias que
atingem a atmosfera terrestre. Eles provavelmente têm origem cosmológica (sua dis-
tribuição no céu é bem isotrópica, não parecendo vir de uma localidade vizinha), en-

380
ergias altı́ssimas da ordem de 1020 ev (lembre-se das energias produzidas nos grandes
aceleradores, da ordem de 1012 ev) e parecem ter viajado por longas distâncias. É um
mistério eles conseguirem viajar por tão longas distâncias: por serem altamente en-
ergéticos, eles perecebem, do ponto de vista do seu referencial próprio, a radiação
de fundo cósmica a altı́ssima temperatura e portanto tenderiam a se aniquilar pela
contı́nua exposição a esta radiação. Existem possı́veis explicações convencionais para
este fenômeno e nem se sabe ao certo se eles viajaram reamente por longas distâncias
(não é descartada a hipótese deles terem sido produzidos nas imediações da nossa
galáxia). Entretanto, nenhuma dessas explicações paraece satisfatória.
Porém, alguns teóricos vislumbraram uma outra explicação para a observação destes
raios cósmico. A natureza discreta do espaço-tempo implica que num nı́vel fundamental
as transformações de Lorentz não sejam válidas. Estas transformações são deduzidas do
princı́pio da relatividade, invariância da velocidade da luz e da suposição que o espaço-
tempo é homogêneo e isotrópico. Mas um espaço-tempo discreto não é homogêneo.
Ademais, se realmente existe uma TQG que se manifesta na escala da energia de
Planck, esta escala também tem que ser um invariante pois senão observadores com
diferentes velocidades discordariam da energia segundo a qual efeitos quânticos são
p
importantes. Por exemplo, da fórmula relativı́stica E = mc2 com m = m0 / 1 − v 2 /c2 ,
onde m0 é a massa de repouso de uma partı́cula, com E = m0 c2 << Epl , vê-se
facilmente que observadores com velocidades próximas a da luz veriam esta partı́cula
com altı́ssima energia, talvez bem maior que a energia de Planck, discordando de
um observador em repouso em relação a partı́cula sobre se ela deve ser tratada por
uma TQG ou não. Isto implica numa modificação das transformações de Lorentz para
energias da ordem da energia de Planck. Um exemplo seria
mc2
E= 2 . (10.47)
1 + mc
Epl

É fácil ver que jamais a energia da partı́cula pode superar a energia de Planck segundo
esta fórmula.
Modificações na expressão da energia de partı́culas altamente relatı́visticas, como é o
caso destes raios cósmicos, poderiam implicar que eles não veriam a radiação de fundo
cósmica tão energética, e portanto poderiam atravessá-la por longas distâncias e chegar
até nós. Para saber se esta especulação é verdadeira, será necessário um estudo mais
aprofundado destes raios cósmicos de altı́ssimas energias, o que será feito em breve
pelo Observatório Auger na Argentina. Talvez seja possı́vel que as observações do
Auger evidenciem a natureza discreta do espaço-tempo.

10.4.2 Uma escala de Planck observável

Uma possibilidade surgida nas teorias de cordas, que como descrito anteriormente são
teorias formuladas em 9 dimensões espaciais e 1 de tempo, é a possibilidade das de-

381
mais dimensões espaciais não serem diminutas e compactas mas extensas. Para que
não as observemos, basta que as interações fundamentais não gravitacionais estejam
confinadas nas 3 dimensões espaciais que observamos. A única interação que poderia
penetrar nas outras dimensões seria a gravitacional mas o modelo pode ser ajustado
de forma a ainda não ser possı́vel detetar estas interações com experimentos gravita-
cionais. Entretanto, o fato da interação gravitacional se diluir em outras dimensões
implicaria numa redução drástica na energia de Planck, reduzindo-a a patamares onde
o novo grande acelerador que está sendo construı́do em Genebra, no CERN, poderia
alcançar (energias da ordem de 1013 ev). Assim, se este modelo estiver correto, efeitos
da gravitação quântica poderiam ser testados neste novo acelerador.
Entretanto, cabe ainda uma questão final: o que leva os fı́sicos a acreditarem que a
nova escala de Planck seria exatamente esta e não qualquer valor entre 1013 ev e a es-
cala de Planck usual? A resposta é que isto explicaria um grande mistério da fı́sica de
partı́culas. Vários experimentos indicam que o bóson de Higgs, aquele que dá massa
às partı́culas fundamentais, tenha uma energia da ordem de 1012 ev enquanto argu-
mentos teóricos sugerem uma energia da ordem da energia de Planck (este problema é
análogo ao problema constante cosmológica). Se esta tiver o valor mencionado acima,
não haveria discrepância alguma entre a previsão teórica e a indicação experimen-
tal, contrariamente ao valor usual, muitas ordens de grandeza maior que o sugerido
experimentalmente7 .

10.4.3 A radiação de fundo e a Cosmologia Quântica

As medidas das anisotropias da radiação de fundo têm se tornado cada dia mais
precisas. Estas anisotropias têm origem, como explicado em outros cursos deste livro,
nas pequenas flutuações de densidade, possivelmente de origem quântica, que existiam
no Universo primordial.
Os modelos de Cosmologia Quântica mencionados na seção anterior, principalmente
aqueles modelos eternos provenientes de uma instabilidade do espaço-tempo plano,
geram anisotropias da radiação de fundo com sinais bem caracterı́sticos. Por exemplo,
os modelos com uma fase de contração anterior à fase de expansão em que vivemos
provavelmente implicam em pequenas oscilações no espectro de anisotropias da ra-
diação de fundo que poderiam ser observadas num futuro próximo, principalmente
quando o satélite Planck começar a produzir resultados no final da presente década.
Entretanto, tais oscilações podem ter outras origens que não evoquem a Cosmologia
Quântica.
Um canal observacional mais limpo é a observação das anisotropias da radiação de
fundo provocadas por ondas gravitacionais primordiais e seus efeitos na polarização
7
A supersimetria também poderia resolver esta discrepância já que ela introduz uma nova escala na
fı́sica de partı́culas.

382
desta radiação. Existem poucos dados observacionais atualmente mas a situação deve
melhorar nos próximos anos. Neste caso, modelos de Cosmologia Quântica prevêem
resultados diferentes da Cosmologia clássica padrão que são difı́ceis de ser explicados
de outra maneira.
Finalmente, algumas cosmologias provenientes das teorias de cordas citadas na seção
anterior já foram refutadas pelas observações das anisotropias da radiação de fundo
por não reproduzirem uma faixa do espectro observado. Ou seja modelos cosmológicos
oriundos de teorias quânticas da Gravitação já podem ser refutados pelas observações!

10.5 Conclusão

A história da quantização da gravitação já tem mais de 50 anos e ainda não está
acabada. Poucas vezes na história da fı́sica tantas mentes brilhantes levaram tanto
tempo para realizar uma tarefa sem obter ainda um resultado conclusivo. De fato,
quantizar o espaço-tempo, a arena da fı́sica envolve imensas dificuldades.
Entretanto, como vimos, houve grande progresso. Pela primeira vez temos uma teoria
quântica do espaço-tempo, a Gravitação Quântica de Laços, que embora não pos-
samos afirmar ser a definitiva TQG pela falta de predições observáveis, mostra que os
princı́pios da TRG e os princı́pios da TQ não são afinal incompatı́veis como muitos
afirmavam. Ela é um forte contra-exemplo a esta crença. Ademais, ela mostrou como
construir uma TQG sem usar métodos perturbativos que parecem, inapropriados num
nı́vel fundamental.
As duas abordagens principais, a quantização canônica, através da Gravitação
Quântica de Laços, e a quantização covariante, através das teorias de supercordas,
têm produzido resultados complementares que servem para montar um quadro mais
abrangente da teoria fundamental que as contem. A formulação desta teoria pode es-
tar mais próxima uma vez que as duas comunidades que antes trabalhavam nos seus
respectivos setores sem se comunicar, têm dialogado mais. Alguns temas obscuros,
como a termodinâmica dos buracos negros, têm sido melhor compreendidos e elucida-
dos. Como vimos na seção anterior, até mesmo a possibilidade de testar estas teorias
têm sido vislumbradas.
A Cosmologia Quântica, embora ainda esteja longe de produzir resultados definitivos,
tem oferecido descrições bastante sensatas a respeito do Universo primordial e se teve
ou não um começo. Se teve um começo, o Universo surgiu muito pequeno, mas com
um tamanho finito, de um tunelamento quântico a partir do nada (aqui entendido de
uma maneira mais radical como a ausência de espaço, tempo e matéria). Mas outros
modelos sugerem que ele possa ser eterno, resultante da instabilidade do espaço-tempo
plano. O mais impressionante é que estes modelos podem talvez ser testados num
futuro próximo através do estudo dos efeitos destas fases primordiais nas anisotropias

383
da radiação de fundo, alguns deles até já tendo sido refutados pelas observações! Uma
teoria cientı́fica começa a adquirir status quando ela permite ser refutada. Ademais, a
Cosmologia Quântica propiciou um grande aprofundamento na compreensão da TQ.
Percebeu-se as fortes limitações da interpretação de Copenhaguen, todos os pontos
obscuros que eram colocados debaixo do tapete e que não podiam lá continuar quando
o objeto a ser quantizado era o Universo. Construiu-se interpretações alternativas
ou tentou-se aprimorar a interpretação de Copenhaguen, implicando numa grande
evolução do nosso conhecimento sobre a TQ.
Evidentemente, a construção de uma teoria consistente da gravitação e cosmologia
quânticas com confirmação observacional e experimental não significa o fim da fı́sica,
mesmo que ela seja uma teoria unificada de todas as interações. Em primeiro lu-
gar porque as teorias fı́sicas são construções mentais às quais tentamos acomodar
os fenômenos naturais conhecidos e por isso mesmo podem ser refutadas diante de
qualquer novo fenômeno.
Em segundo lugar porque, ao contrário, ela abrirá portas que hoje nem imaginamos.
Por exemplo, será que com o conhecimento destas novas teorias conseguiremos con-
struir os chamados buracos de minhoca, atalhos do espaço-tempo que conectam dois
lugares distantes possibilitando a sua travessia em tempos curtı́ssimos? E com estes
atalhos, será possı́vel constrir máquinas do tempo? Será que as energia e matéria
escuras que parecem compor 97% da matéria do Universo não são simplesmente man-
ifestações de modificações da TRG em larga escala que serão compreendidas pela
TQG, da mesma maneira que a precessão do perihélio de Mercúrio foi explicada por
uma revolução na teoria de Newton, a TRG, e não pela presença de um planeta não
observado (Vulcano) entre Mercúrio e o Sol?
A construção da Gravitação e da Cosmologia quânticas é certamente um dos proble-
mas mais profundos e difı́ceis da história da fı́sica. Sua solução exige trabalho árduo,
colaboração e criatividade e certamente trará resultados surpreendentes e inúmeras
perspectivas. Por isso este é, a meu ver, o problema mais fascinante da fı́sica contem-
porânea.

10.6 Leituras Recomendadas

1) Lee Smolin, Three Roads to Quantum Gravity, Basic Books-New York (2001).
2) Jonathan Halliwell, Quantum Cosmology and the Creation of the Universe, Scientific
American 265, n 6, 76 (1991).
3) Michio Kaku, Hiperespaço, Editora Rocco (1994).
4) Nelson Pinto Neto, Quantum Cosmology, Cosmology and Gravitation II: Proceed-
ings of the VIII Brazilian School of Cosmology and Gravitation, 229, editado por
Mário Novello, (Editions Frontieres 1995).

384
5) Franck Laloe, Do we really understand quantum mechanics?, American Journal of
Physics 69, 655 (2001).
6) Kip S. Thorne, Black Holes and Time Warps, W.W. Norton and Company (1994).

Exercı́cios
1. Prove que a ação da equação (11) não muda de forma por uma transformação
τ̃ = τ̃ (τ ).
2. Prove as relações (12,14,15).
3. Encontre as equações de Hamilton da hamiltoniana (16) e interprete-as.
4. Deduza as equações (23) e (24) da equação (22).
5. Mostre, usando uma analogia com fluidos e a relação p = mẋ = ∇S(x, t), que a
equação (23) é uma equação de continuidade.
6. Deduza a ação (29) da ação mais geral (26) se usarmos (25).
7. Obtenha as equações de Friedmann da ação (30) e obtenha a solução clássica
para N = 1.
8. Obtenha a hamiltoniana (33) e calcule as equações de hamilton. Compare com o
resultado do exercı́cio anterior.
9. Calcule as equações de Hamilton provenientes da hamiltoniana (35) e encontre
as equações de Friedmann para radiação. Interprete Pt . Encontre as soluções
para N = 1 e N = a/l0 , onde l0 é uma constante arbitrária com dimensão de
comprimento.
10. Mostre que (38) é solução de (36).
11. De p = 2ȧ = ∂S/∂a, encontre a solução (41) e interprete-a para η >> 1/b.
12. Calcule o potencial quântico correspondente à função de onda (38) e faça o seu
gráfico. Verifique o seu comportamente ao longo das trajetórias (41) e interprete
o seu resultado.
13. Da relação (42), faça um gráfico E x v para 0 < v < c.

10.7 Agradecimentos
Agradeço ao CNPq pela bolsa de pesquisa concedida.

385
Capı́tulo 11

Geometria Diferencial

Nelson Pinto Neto1

11.1 Introdução

No inı́cio do século XX, as chamadas geometrias curvas já eram bem conhecidas. Elas
foram desenvolvidas ao se abandonar o quinto postulado da geometria plana de Eu-
clides. Esse postulado afirma que se uma reta cruza outras duas e se a soma dos ângulos
internos às duas retas for menor que 180o num lado, então as retas se encontrarão,
se estendidas para além desse lado. Durante dois milênios tentou-se provar que esse
postulado poderia ser deduzido dos outros quatro, mas o máximo que se conseguiu
foi escrevê-lo de formas equivalentes. Até que o jesuı́ta Geralamo Saccheri tentou ver-
ificar, pela primeira vez, como seria uma geometria sem o quinto postulado. A partir
daı́, o estudo dessas geometrias ganhou um grande impulso com Gauss, Lobachevski
e Bólyai, com seus estudos de geometrias curvas bi-dimensionais e com Riemann, que
generalizou esse estudo para geometrias n-dimensionais, por volta de meados do século
XIX. Nessas geometrias, coisas bizarras acontecem, como a soma dos ângulos inter-
nos de um triângulo ser diferente de 180o e o perı́metro d de um cı́rculo ser diferente
de 2πr. O ramo da Matemática que estuda estas geometrias denomina-se Geometria
Diferencial. Resumiremos a seguir seus principais conceitos e deifinições.

1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.

386
11.2 Objetos geométricos

11.2.1 Curvas e vetores

Uma curva é uma função diferenciável xµ (λ) do < → <n , que associa a cada valor do
parâmetro λ ∈ < sobre a curva. as coordenadas xµ ∈ <n de um ponto p do espaço
curvo de dimensão n, onde os ı́ndices µ assumem n valores.
Um vetor é qualquer elemento de um espaço vetorial, cuja definição é bem conhecida
da Ágebra Linear. Exemplos de vetores são os vetores deslocamento num espaço plano,
velocidade instantânea (tangente a uma curva) e, num campo mais abstrato, os oper-
adores de diferenciação ∂/∂xµ . Num espaço curvo, o vetor deslocamento perde sentido
(por exemplo, o deslocamento entre dois pontos de uma esfera sequer pertence à
esfera). Por isso vamos definir vetores lançando mão de operadores de diferenciação
associados às tangentes a uma curva. Assim, vetores tangentes a uma curva num ponto
p, que formam um espaço vetorial de dimensão n, são dados por

d dxµ ∂
V≡ = , (11.1)
dλ dλ ∂xµ
onde os operadores de diferenciação atuam numa função escalar teste qualquer f (xµ ),
fornecendo a sua derivada no ponto p, e usamos a convenção de Einstein: ı́ndices
repetidos correspondem a uma soma de 1 a n.
Pode-se entender o conjunto de n vetores eµ ≡ ∂/∂xµ como uma base particular deste
espaço vetorial, constituı́da dos vetores tangentes às linhas coordenadas xµ no ponto
p, e dxµ /dλ como as componentes do vetor d/dλ nesta base. Se quisermos utilizar
um outro sistema de coordenadas para descrever os pontos do espaço curvo através
da transformação de coordenadas x0 µ = g µ (xν ) que, para ser bem definida, deve ter
jacobiano não nulo no ponto p, J ≡det|∂xν /∂x0 µ | = 6 0, as novas componentes do
mesmo vetor V = d/dλ = (dx /dλ)(∂/∂x ) na base (∂/∂x0 µ ) associada a estas novas
0µ 0µ

coordenadas serão dadas por

0µ dx0 µ ∂x0 µ dxν ∂x0 µ ν


V ≡ = = V . (11.2)
dλ ∂xν dλ ∂xν
e a base muda como

∂ ∂xν ∂ ∂xν
eµ0 ≡ = = eν . (11.3)
∂x0 µ ∂x0 µ ∂xν ∂x0 µ
Note que a base se transforma contrariamente às componentes e por isso os vetores
tangentes são também chamados de vetores contravariantes.

11.2.2 Tensores

O espaço vetorial de vetores tangentes à curva no ponto p definido acima, denotado


Tp , é chamado de espaço tangente e existe um espaço tangente diferente a cada ponto

387
da variedade. Como sabemos da álgebra linear, pode-se construir o espaço dual a
Tp , chamado Tp∗ , através do conjunto das aplicações lineares b̃ que levem um vetor
tangente pertencente a Tp num número real, b̃(V) = a. Pode-se construir a chamada
base dual de Tp∗ , w̃µ , através da definição

w̃µ (eα ) = δαµ . (11.4)

Os elementos deste espaço b̃ = bµ w̃µ , chamados de 1-formas ou vetores covariantes [é


fácil ver que suas componentes bµ se tranformam como a base (11.3)], são os tensores
(0,1), enquanto os vetores tangentes, ou contravariantes, são os tensores (1,0). Gen-
eralizando, os tensores T (M,N) são definidos como as aplicações (M,N)-lineares que
levam M 1-formas e N vetores tangentes num número real: T(b̃, d, ˜ ..., V, U, ...) = a.
Suas componentes são dadas pelo número real obtido da aplicação de T numa base
de 1-formas e vetores tangentes,

αβ...
Tµν... ≡ T(w̃α , w̃β , ...eµ , eν , ...). (11.5)

Se fizermos uma mudança de coordenadas, usarmos a linearidade da tranformação e


as Eqs. (11.3,11.4), é fácil mostrar que as componentes do tensor T se transformam
como

αβ... λ ∂x0 α ∂x0 β ∂xθ ∂xφ ρσ... λ


T 0 µν... (x0 ) = ρ σ
... 0 µ 0 ν ...Tθφ... (x ). (11.6)
∂x ∂x ∂x ∂x

Campos tensoriais são os conjuntos de tensores T avaliados em cada ponto da var-


αβ... 
iedade, de componentes Tµν... (x ).

11.3 Derivada covariante de campos tensoriais

A noção de derivada pressupõe a comparação de dois objetos em pontos diferentes.


Como os objetos geométricos em pontos diferentes de um espaço curvo pertencem
a espaços vetoriais diferentes (os espaços tangentes), é necessária uma definição de
transporte para que possamos levar um objeto geométrico de um ponto a outro do
espaço curvo e assim compararmos objetos pertencentes a um mesmo espaço tangente.

A derivada covariante é obtida a partir de uma noção de transporte de tensores que


exige a definição de uma nova quantidade Γαµν chamada conexão, que conecta vetores de
espaços tangentes diferentes através do chamado transporte paralelo. As componentes
do vetor transportado paralelamente são então dadas por

Akα (xγ + dxγ ) = Aα (xγ ) − Γαλµ (xγ )Aλ (xγ )dxµ , (11.7)

388
o que define a derivada covariante como
Aβ (xγ + dxγ ) − Akβ (xγ + dxγ )
Aβ||α ≡ Aβ;α ≡ ∇α Aβ ≡ lim
dx →0α dxα
= ∂α Aβ + Γβαν Aν . (11.8)

Outra maneira equivalente de definir Γβαµ é através da base: ∇α eµ ≡ Γβαµ eβ , ou seja,


Γβαµ é a componente β na base e do vetor resultante da aplicação da componente α
da derivada covariante no vetor de base eµ . Usando a regra de Leibniz e o fato de o
operador ∇α se reduzir a ∂α ao atuar numa função, pode-se reobter a equação (11.8)
de ∇α Aβ ≡ (∇α A)(w̃β ) e A = Aµ eµ (exercı́cio).
Da Eq. (11.4), pode-se obter ∇α w̃µ = −Γµαβ w̃β e assim a derivada covariante de
qualquer tensor (M,N):

αβ...
∇λ Tµν... αβ...
≡ ∂λ Tµν... ηβ...
+ Γαηλ Tµν... + Γβηλ Tµν...
αη...
+ ...
−Γηµλ Tην...
αβ...
− Γηνλ Tµη...
αβ...
− .... (11.9)

Uma curva geodésica é definida como aquela cujo vetor tangente transportado parale-
lamente ao longo da curva do ponto p ao ponto q é igual ao próprio vetor tangente no
ponto q [V α (λ + dλ) = V kα (λ + dλ)], o que implica em V α ∇α V β = 0. Isto impõe a
equação da geodésica, dada por
d2 xµ α
µ dx dx
ν
+ Γ αν = 0. (11.10)
dλ2 dλ dλ
Como será visto, ela está relacionada com a queda livre dos corpos num campo grav-
itacional.
Note que no espaço plano em coordenadas cartesianas, cujas bases são constantes,
∇α eµ = 0 ⇔ Γβαµ = 0 (ou seja, no espaço plano em coordenadas cartesianas o trans-
porte paralelo não altera o vetor, como já sabemos) e a solução de (11.10) é a reta
tradicional. Evidentemente, para outros espaços, ou se trabalharmos com coordenadas
curvilı́neas no espaço plano, a conexão Γ não será nula e a solução da equação da
geodésica não será mais uma reta.
Como ∇α Aβ são as componentes de um verdadeiro tensor (1,1) e como ∂α Aβ não
se tranforma como um tensor, então Γβαµ também não pode se transformar como
um verdadeiro tensor para poder compensar este fato. É fácil verificar que Γβαµ se
transforma como

α γ ∂x0 α ∂xθ ∂xφ ρ γ ∂x0 α ∂ 2 x


Γ0 µν (x0 )
= Γ (x ) + . (11.11)
∂xρ ∂x0 µ ∂x0 ν θφ ∂x ∂x0 µ ∂x0 ν
A existência do termo não homogêneo simétrico permite anular a parte simétrica da
conexão num ponto p mediante uma escolha de coordenadas. A parte anti-simétrica
α
da conexão, Tµν = Γαµν − Γανµ , é chamada torção e não pode ser anulada, por se tratar
de um verdadeiro tensor. No nosso curso consideraremos a torção nula.

389
Figura 11.1: Transporte paralelo.

11.4 O tensor de curvatura


O tensor de curvatura é definido como

Rµνβα Aν ≡ ∇α ∇β Aµ − ∇β ∇α Aµ . (11.12)
Das equações acima podemos obter sua relação com a conexão:

Rµνβα = ∂α Γµνβ − ∂β Γµνα + Γµα Γνβ − Γµβ Γνα . (11.13)

Pode-se mostrar que o tensor de curvatura é proporcional à mudança sofrida por


um vetor quando este é transportado paralelamente ao longo de uma curva fechada.
Por exemplo (veja figura 11.1), transporte paralelamente o vetor A através da curva
coordenada xµ (µ é um ı́ndice determinado) de xµ = a até xµ = a + δa, depois
transporte-o ao longo da curva coordenada xν (ν é outro ı́indice determinado com
ν 6= µ) de xν = b até xν = b + δb, a seguir retorne ao longo da curva coordenada xµ
de xµ = a + δa até xµ = a, e finalmente volte ao ponto inicial através do transporte
ao longo da curva coordenada xν de xν = b + δb até xν = b. É fácil mostrar que a
diferença entre o vetor original e o transportado ao longo da curva fechada, supondo
os deslocamentos infinitesimais e indo até segunda ordem, é dada por

δAα = −Rαβµν Aβ δaδb (11.14)

O tensor de curvatura também está relacionado com uma quantidade muito impor-
tante: o desvio geodético. Seja η α o vetor que conecta dois pontos de mesmo parâmetro
ao longo de duas geodésicas vizinhas de vetor tangente V µ , que diferem uma da outra
apenas por uma pequena diferença nas suas condições iniciais. A equação do desvio
geodético é dada por

 D2 ~η µ
≡ V α ∇α (V β ∇β η µ ) = Rµναβ V ν η α V β . (11.15)
Dλ2
390
Note que o tensor de curvatura é um tensor e não pode ser anulado por uma trans-
formação de coordenadas. Pode-se mostrar que um espaço é plano se e somente se o
tensor de curvatura é nulo em todos os pontos. Assim, o mais importante para carac-
terizar um espaço curvo não é a equação da geodésica, já que a conexão pode ser não
nula no espaço plano ou nula num ponto em um espaço curvo, mas sim a equação do
desvio geodético. Ela está relacionada, como será visto, com os efeitos de maré num
dado campo gravitacional.
O tensor de curvatura ainda satisfaz as chamadas identidades de Bianchi (verifique):

∇ Rµναβ + ∇β Rµνα + ∇α Rµνβ = 0 (11.16)

11.5 O tensor métrico

Esta é uma outra estrutura que podemos definir sobre a variedade, totalmente inde-
pendente da conexão. Ela é um campo tensorial (0,2) que associa dois vetores a um
número real, que fornece o ângulo entre eles. Tratando-se do mesmo vetor, podemos
associar tal número a sua magnitude. Suas componentes são gµν ≡ g(eµ , eν ). Nestas
notas, consideraremos a métrica simétrica. Para dois eventos separados pelo vetor
infinitesimal dxµ , o elemento de linha infinitesimal será dado por

ds2 = gµν dxµ dxν . (11.17)

Note que para um espaço plano n-dimensional em coordenadas cartesianas, gµν = δµν
(g = I) e para o espaço-tempo de Minkowski, gµν = ηµν .
Com o tensor métrico podemos definir um vetor covariante associado ao vetor con-
travariante V α da forma Vβ ≡ gβα V α ou, reciprocamente, com a sua inversa g µν ,
V β ≡ g βα Vα .
Podemos estabelecer uma relação entre a conexão e o tensor métrico impondo que
o ângulo entre dois vetores transportados pela conexão ao longo de uma curva se
mantenha constante ao longo deste transporte. Isto implica (verifique) que ∇α gµν = 0.
Estes são chamados de espaços de Riemann. Pode-se obter a conexão simétrica de um
espaço de Riemann completamente em função da geometria permutando-se os ı́ndices
da equação ∇α gµν = 0, obtendo (verifique)

1
Γβαν ≡ g βµ (∂ν gαµ + ∂α gνµ − ∂µ gαν ). (11.18)
2
Quando a conexão é dada por (11.18), as curvas geodésicas são também curvos com
ds extremo. Para o espaço plano, isto significa distância mı́nima. Para o espaço-tempo
plano de Minkowski, isto implica em distância mı́nima ou tempo próprio máximo
dependendo se a geodésica é tipo-espaço ou tipo-tempo, respectivamente.

391
Nos espaços de Riemann, o tensor de curvatura Rµναβ é anti-simétrico na troca de
ı́ndices nos primeiro e segundo pares, simétrico na troca global do primeiro par pelo
segundo e ainda satisfaz uma propriedade cı́clica nos últimos 3 ı́ndices

Rµναβ + Rµβνα + Rµαβν = 0. (11.19)


Isto faz com que ele tenha somente 20 componentes independentes, permitindo a
definição, sem ambiguidade, do tensor de Ricci

Rνβ ≡ Rαναβ , (11.20)


do escalar de curvatura

R ≡ g νβ Rνβ , (11.21)
e do tensor de Einstein

1
Gµν ≡ Rµν − Rgµν , (11.22)
2
que satisfaz, das identidades de Bianchi (11.16),

∇α Gαν = 0. (11.23)

Num ponto p, é sempre possı́vel diagonalizar a métrica e normalizar seus elementos


mediante uma escolha apropriada do sistema de coordenadas no ponto. O conjunto de
sinais destes termos diagonais é chamado de assinatura da métrica. Na Relatividade
Geral, que tem como limite a Relatividade Especial, esta assinatura é (+, −, −, −).
Como ainda podemos anular as conexões ou, equivalentemente num espaço de Rie-
mann, as derivadas primeiras da métrica, pode-se nestes sistemas escrever a métrica
em torno do ponto p como

1 ∂ 2 gµν
gµν = ηµν + | δxα δxβ + ... . (11.24)
2 ∂xα ∂xβ p
Portanto, nestes sistemas efeitos gravitacionais só podem ser percebidos em segunda
ordem nos deslocamentos. Referenciais associados a estes sistemas são chamados de
referenciais de Lorentz locais, em torno dos quais Einstein formulou seu Princı́pio de
Equivalência.

11.6 Exercı́cios
1) Mostre que, usando a regra de Leibniz e o fato de o operador ∇α se reduzir a ∂α
ao atuar numa função, pode-se reobter a equação (11.8) de ∇α Aβ ≡ (∇α A)(w̃β ) e
A = Aµ eµ .

392
2) Mostre as Eqs. (11.9),(11.10) e (11.11).
3) Mostra a Eq. (11.13) a partir de (11.12). Deduza (11.14).
4) Mostre que se o produto escalar entre dois vetores transportados pela conexão ao
longo de uma curva se mantem constante ao longo deste transporte então ∇α gµν = 0.
A seguir obtenha a Eq. (11.18) realizando permutações desta relação.
5) Mostre a identidade de Bianchi (11.16) e sua consequência (11.23). Sugestão: utilize
o sistema de coordenadas em que a conexão é nula e mostre que o resultado obtido é
válido em qualquer sistema de coordenadas.
6) Usando a mesma sugestão da questão anterior, demonstre a Eq. (11.19) e mostre
que o tensor de Riemann tem apenas 20 componentes independentes em 4 dimensões.
7) Calcule expressão explı́cita em termos de coordenadas esféricas em um espaço plano
tri-dimensional do laplaciano covariante de uma função escalar f , g αβ ∇α ∇β f , usando
a Eq. (11.18). Compare com o resultado conhecido.

393
Capı́tulo 12

Teoria da Relatividade Especial

Renato Klippert1

12.1 Introdução
A intuição corresponde a uma espécie de sı́ntese das experiências (vividas ou pen-
sadas) que constituem o passado daquele que possui tal intuição. Portanto, trata-se
de uma noção não objetiva, mas fortemente dependente do observador. Apesar disso,
ao deparar-se pela primeira vez com o estudo da Relatividade Especial, o aluno de
cursos de ciências exatas já deve ter sido apresentado a alguma disciplina de Mecânica
de Newton e, possivelmente, também ao Eletromagnetismo de Maxwell. Desta forma,
sua intuição incluirá certas experiências conceituais básicas relativas a tais temas. À
intuição partilhada por uma expressiva parcela da população denominamos senso co-
mum. Esta intuição é extremamente útil para avaliar o que é ou não razoável num
enorme número de problemas simples da vida cotidiana, e não deve de modo algum
ser descartada. Contudo, esta mesma intuição é por vezes um freio à compreensão de
novos fenômenos ou idéias, e isto freqüentemente de fato ocorre no estudo da Relativi-
dade Especial. Desta forma, este capı́tulo pretende levar o aluno a desenvolver uma
intuição relativı́stica.

12.1.1 Sinopse

São imprescindı́veis neste capı́tulo conhecimentos prévios de mecânica, brevemente re-


vista na Sub-seção 12.2.1, bem como de cálculo diferencial e integral; já o estudo prévio
1
Afiliação: Instituto de Ciências Exatas (ICE), Universidade Federal de Itajubá (UNIFEI), PO Box
50 37500-903 Itajuba, MG.

394
do eletromagnetismo será importante somente para a leitura da Sub-seção 12.2.3 (a
qual pode ser omitida sem prejuı́zo na compreensão do conteúdo posterior). A Seção
12.3 desenvolve as bases fı́sicas da Relatividade, e a Seção 12.4 apresenta sua for-
mulação matemática em termos de coordenadas cartesianas. A Seção 12.5 detalha al-
gumas conseqüências desta teoria para a descrição cinemática de fenômenos da fı́sica,
e faz uso de conhecimentos básicos de ondulatória na Sub-seção 12.5.2 (a qual pode
ser omitida). A Seção 12.6 apresenta uma formulação relativı́stica da mecânica new-
toniana. Toda esta construção baseia-se numa unificação dos conceitos (previamente
independentes) de espaço e de tempo, numa nova entidade denominada espaço-tempo,
conforme é apresentado na Seção 12.7, numa técnica que é utilizada para resolver
problemas tı́picos da Teoria da Relatividade na Seção 12.8. Na Seção 12.9 analisa
uma generalização relativı́stica do Grupo de Galileu da mecânica clássica, fazendo
uso marginal do conceito matemático de grupo (cujo estudo prévio não é essencial), e
dando lugar à construção das grandezas fundamentais da fı́sica relativı́stica: os ten-
sores. A Seção 12.10 apresenta uma lista sumária de resultados de testes experimentais
da Relatividade Especial, servindo como uma justificativa pragmática ao estudo desta
teoria. As citações bibliográficas ao longo deste capı́tulo correspondem à lista a seguir
apresentada. Exercı́cios relativos ao presente capı́tulo encontram-se colecionados na
Seção 12.12. Um ı́ndice analı́tico dos principais termos utilizados no capı́tulo figura ao
final do mesmo.

A idéia básica desse texto consiste em servir como material de apoio a um mini-curso
do tema, de modo que sua estrutura pode ser particionada em aulas (com duração de
duas horas cada). Uma primeira aula é dedicada à apresentação do curso e às Secs.
12.2 e 12.3. As demais seções deste capı́tulo foram programadas para apresentação em
uma aula cada. Assim, a segunda aula é dedicada à Sec. 12.4, a terceira aula à Sec.
12.5, a quarta aula à Sec. 12.6, a quinta aula à Sec. 12.7, a sexta aula à Sec. 12.8 (com
possibilidade de inclusão de crı́ticas adicionais), e a sétima aula à Sec. 12.9. Desta
forma, o estudo dirigido deste capı́tulo requer um total de 14 horas, distribuı́das num
total de 7 aulas.

12.2 Mecânica versus Eletromagnetismo

A Mecânica de Newton [3] consiste numa das mais sólidas e frutı́feras estruturas
conceituais até hoje concebidas no âmbito cientı́fico. Aliás, a noção atual do termo
ciência adquire seu significado à luz dessa teoria. Por outro lado, a primeira e mais bem
sucedida teoria de campo da fı́sica foi o Eletromagnetismo de Maxwell [2]. Nesta seção,
observaremos que a estrutura de invariância associada às leis da Mecânica Newtoniana
é incompatı́vel com aquela das leis do Eletromagnetismo Maxwelliano. A observação
deste fato levou os fı́sicos do século XIX a admitirem a existência do éter luminı́fero,
um meio material tênue e virtualmente imponderável, com respeito ao qual as leis

395
de Maxwell seriam válidas. Tentativas de evidenciar experimentalmente a presença
desse éter foram todas infrutı́feras (conforme os resultados da Sec. 12.10), fato que foi
julgado paradoxal na sua época mas que é essencial à Teoria da Relatividade Especial.

12.2.1 Mecânica de Newton

Apresenta-se aqui uma breve revisão dos conceitos e leis da mecânica de Newton [3].
A forma de apresentação adotada não necessariamente coincide com aquela suposta-
mente estudada anteriormente [7, 8].

Postulados de Newton

Tempo (Absoluto) é uma noção exata e universal, e flui uniformemente sem


relação com qualquer coisa externa.
Espaço (Absoluto) é uma noção exata e universal, e se extende uniformemente
sem relação com qualquer coisa externa.
Referencial Inercial é uma coleção coerente de instrumentos de medida
(réguas e relógios) capaz de determinar diferenças de Tempo Absoluto e
de Espaço Absoluto.
Momentum Linear é uma grandeza vetorial para cada sistema fı́sico que de-
termina sua capacidade potencial de modificar sua vizinhança.
Força é uma grandeza vetorial que determina a forma como os corpos sensı́veis
interagem mutuamete.
Leis da Mecânica de Newton relativas às observações e medidas efetuadas por um
referencial inercial.
Inércia Apresenta momentum linear constante no tempo todo e somente aquele
sistema sobre o qual seja nula a resultante vetorial das forças atuantes.
Dinâmica A taxa de variação temporal do momentum linear total de um sistema
equivale à força resultante que sobre ele atua.
Ação e Reação A cada força exercida por um sistema X sobre um sistema Y,
corresponde uma força de mesma direção e magnitude e de sentido contrário,
exercida pelo sistema Y sobre o sistema X.

Decorre dessas definições e leis que, do ponto de vista estrito da mecânica de Newton,
todos os referenciais inerciais são indistingüı́veis entre si. Este importante re-
sultado constitui a assim denominada Relatividade Galileana da mecânica de Newton,
garantindo a possibilidade de escolha do referencial inercial a ser adotado conforme a
necessidade e/ou conveniência de cálculos. Os detalhes dessa relatividade de Galileu
serão analisados na Sec. 12.2.2, que corresponde à estrutura matemática subjacente à
Teoria Newtoniana.

396
Método de Galileu-Newton

1. Identificação do Sistema de interesse.


2. Identificação da Vizinhança do Sistema de interese.
3. Escolha de um Referencial inercial.
4. Escolha de um Sistema de coordenadas.
5. Identificação das interações da Vizinhança sobre o Sistema de interesse.
6. Expressão das leis da Mecânica para o Sistema de interesse.
7. Retorno ao item (1) acima, tantas vezes quantas sejam necessárias (possivel-
mente nenhuma), visando o equilı́brio entre o número de relações e o número
de variáveis.
8. Manipulação das equações obtidas no item (6), segundo as regras do cálculo
vetorial e de comparação de medidas entre referenciais inerciais, visando a
determinação explı́cita das variáveis.

A noção de força postulada por Newton apresenta problemas conceituais que foram
percebidos à época de sua construção. Em particular, a idéia de força pressupõe uma
espécie de ação à distância: um corpo atua sobre outro instantaneamente, indepen-
dentemente da distância entre ambos. Assim, para determinar todas as influências
sobre um dado corpo, faz-se necessário conhecer tudo o que existe em todo o Universo
sensı́vel.
Esta dificuldade levou à construção teórica da noção de campo, uma espécie de in-
termediário das interações entre os corpos, responsável pela transmissão através do
espaço e do tempo da informação relativa à presença do corpo-agente até o corpo-
objeto. A forma como este campo é produzido é descrita pela fı́sica de forma análoga
às leis de força, enquanto que sua ação sobre os corpos é descrita por uma lei que
envolve somente o corpo-objeto e o valor do campo na posição deste objeto. Para
descrever a forma de propagação desse campo, a fı́sica se vale usualmente da teoria
ondulatória. Com isso, o campo produzido por um corpo corresponde às potenciais
influências deste corpo sobre seu ambiente, e se propaga na forma de uma onda.

12.2.2 Grupo de Galileu

Conforme observado na Seção 12.2.1, a mecânica de Newton apresenta como estrutura


de invariância o Grupo de Galileu2 relativo à mudanca de coordenadas cartesianas
adaptadas a referenciais inerciais em movimento relativo. Assim, seja O um referencial
2
Matematicamente, um grupo é um par ordenado da forma (X, ∗), onde X é um conjunto e ∗ é uma
operação binária em X tal que: (1) a operação ∗ é associativa, (x∗y)∗z = x∗(y ∗z) para todos x, y, z ∈ X;
(2) existe um elemento identidade i ∈ X neutro pela operação ∗, de modo que i ∗ x = x = x ∗ i para
todo x ∈ X; (3) para cada x ∈ X, existe um correspondente elemento x−1 ∈ X inverso de x, tal que
x−1 ∗ x = i = x ∗ x−1 .

397
inercial com coordenadas cartesianas de espaço e tempo (t, x, y, z), para o qual as
leis de Newton são válidas. Analogamente, seja O0 um outro referencial inercial com
coordenadas cartesianas (t0 , x0 , y 0 , z 0 ) — para o qual as leis de Newton são igualmente
válidas.
Suponhamos que o referencial O0 se move com velocidade V~OO0 , conforme determinada
pelo referencial O. Se ambos os referenciais são inerciais, então a velocidade relativa
V~OO0 entre eles é constante. Seja P um arbitrário evento (isto é, um ponto do espaço
num especı́fico instante de tempo). Sejam (tP , xP , yP , zP ) as coordenadas de espaço
e de tempo do evento P relativas ao referencial O, e designemos as correspondentes
coordenadas deste mesmo evento P relativas ao referencial O0 por (t0P , x0P , yP0 , zP0 ). Por
simplicidade, suponhamos que os eixos cartesianos correspondentes nos referenciais
inerciais O e O0 sejam paralelos, e que a velocidade relativa V~OO0 seja V dirigida ao
longo do eixo Ox. Esses conjuntos de coordenadas se relacionam segundo o Grupo
de Galileu:  0

 tP = tP + to
 x0 = x − V t + x

P P P o
0
(12.1)


 y P = yP + yo
 0
zP = zP + zo .
Nas Eqs. (12.1) figuram as constantes (to , xo , yo , zo ), as quais correspondem tão so-
mente a uma translação constante na origem temporal e espacial, e que são usualmente
omitidas por simplicidade. Destas relações decorre que as diferenças entre essas co-
ordenadas são ∆t0P = ∆tP e ∆R ~ 0 = ∆R ~ − V~OO0 ∆tP (em notação vetorial). Assim, a
velocidade do referencial O com respeito ao referencial O0 é
dR~0 d ~ ~
V~O0 O = O
= (RO − ~OO0 tO ) = dRO − V~OO0 = −V~OO0 ,
V
dt0O dtO dtO
onde a última igualdade acima resulta do fato de ser constante no tempo a posição
no espaço da origem espacial do referencial O, conforme determinado pelo próprio
~ O /dtO = ~0. Assim, obtemos que V~O0 O = −V~OO0 .
referencial O. Isto é, dR
Do ponto de vista do referencial O0 , e considerando o resultado acima, temos as Eqs.
(12.1) na forma inversa
tP = t0P + t0o



 x = x0 + V t 0 + x0

P P P o
0 0
(12.2)


 yP = yP + yo
zP = zP0 + zo0 ,

onde as novas constantes (t0o , x0o , yo0 , zo0 ) podem ser facilmente determinadas em termos
de (to , xo , yo , zo ) e da velocidade relativa V~OO0 entre os referenciais.

12.2.3 Eletromagnetismo de Maxwell

Apresenta-se aqui somente um resumo da Teoria Eletromagnética de Maxwell [2, 9]. As


leis de Maxwell do eletromagnetismo descrevem os fenômenos elétricos e magnéticos,

398
bem como a propagação de ondas eletromagnéticas (tais como a luz visı́vel). Esta
~ = (Ex , Ey , Ez ) e magnético B
teoria baseia-se na existência dos campos elétrico E ~ =
(Bx , By , Bz ), bem como na noção de carga elétrica q e de corrente elétrica i. Por
simplicidade, consideraremos somente o eletromagnetismo no vácuo.
~ e
Um corpo carregado com carga q e velocidade ~v , na presença de campos externos E
~ encontra-se sujeito à força local de Lorentz
B,

~ + q ~v × B.
F~ = q E ~ (12.3)
c

As leis de Maxwell no vazio podem ser expressas conforme segue.3

Monopolo elétrico O fluxo de campo elétrico através de qualquer superfı́cie fechada


equivale à quantidade total de carga elétrica envolvida por esta superfı́cie.

Monopolo magnético O fluxo de campo magnético através de qualquer superfı́cie


fechada é igual a zero.

Lei de Faraday-Lenz A circulação do campo elétrico no contorno de qualquer su-


perfı́cie aberta equivale ao oposto da taxa de variação temporal do fluxo de campo
magnético através desta superfı́cie.

Lei de Ampère-Maxwell A circulação do campo magnético no contorno de qual-


quer superfı́cie aberta equivale à soma da taxa de variação temporal do fluxo
de campo elétrico através desta superfı́cie com a quantidade lı́quida de corrente
elétrica que a atravessa.

Mais formalmente, essas leis podem ser escritas no sistema internacional de unidades
(por meio da permissividade elétrica do vácuo εo e da permeabilidade magnética do
vácuo µo ) na forma integro-diferencial

~ = Q
~ · dS
H
S
E εo
~ ~
H
S
B · dS = 0
(12.4)
~ = −d
~ · d` ~
~ · dS
H R
E B
C dt

S

~ = µ o i + εo d
~ · d` ~ ,
~ · dS
H R
B E
C dt S

onde S representa uma superfı́cie fechada arbitrária nas duas primeiras igualdades e
Q é a carga elétrica lı́quida contida no volume limitado pela superfı́cie S, ao passo que
nas duas últimas igualdades S é uma superfı́cie aberta arbitrária cujo contorno é a
curva C e i é a corrente elétrica lı́quida que atravessa a superfı́cie S. Alternativamente,

3
As leis de Maxwell foram traduzidas em palavras visando o máximo de simplicidade, às custas de
precisão: o sistema de unidades no qual tais enunciados são válidos pode ser desconhecido ao estudante.

399
podemos escrever essas leis na forma diferencial
~ ·E
∇ ~ = ρ
εo
~ ·B
∇ ~ = 0
(12.5)
∇ ~ = −∂B
~ ×E ~
∂t
 
∇ ~ = µo J~ + εo ∂ E
~ ×B ~ ,
∂t
onde ρ é a densidade volumétrica de carga elétrica e J~ é a densidade superficial de
corrente elétrica.
As Eqs. (12.5), quando escritas na ausência de fontes (ρ = 0 e J~ = ~0 ), implicam (ver
Exercı́cio 1) que cada uma das componentes cartesianas de ambos os campos elétrico
e magnético são soluções da equação da onda
1 ∂2
 
2
− ∇ Φ(t, x, y, z) = 0, (12.6)
v 2 ∂t2

(isto é, Φ = Ex e Φ = By são soluções), com velocidade v = 1/ µo εo = c cujo
valor numérico coincide com o valor experimental (Sec. 12.10) para a velocidade de
propagação da luz no vácuo. Assim, a teoria de Maxwell prevê uma velocidade natural
de propagação da luz no espaço vazio, em contradição com a relatividade de Galileu.
Pois, conforme as Eqs. (12.1), se algum referencial inercial O determina para a luz
uma velocidade de propagação v = c, outro referencial inercial O0 que se move com
respeito ao primeiro com velocidade u 6= 0 (na mesma direção e sentido do movimento
luminoso) irá determinar para a luz uma velocidade de propagação v 0 = c − u distinta
da velocidade v = c.

12.3 Fundamentos da Relatividade Especial


Dada a incompatibilidade teórica discutida na Seção 12.2, e tendo a experiência re-
sultado favorável ao eletromagnetismo (conforme Seção 12.10), faz-se necessário re-
formular a mecânica de Newton de modo a descrever adequadamente situações que
envolvem velocidades comparáveis à da luz no vácuo. São aqui apresentados os fun-
damentos de uma generalização da Mecânica Newtoniana, tal que seja adequada ao
problema proposto acima, e que recupera (em caráter aproximado) os resultados da
teoria de Newton na situação convencional de velocidades pequenas (se comparadas à
velocidade da luz no vácuo).
A dificuldade básica da mecânica, sob o ponto de vista da teoria mais correta do
eletromagnetismo, consiste na fórmula de adição de velocidades

vO0 = vO − VOO0 ,

relativa a medidas arbitrárias em distintos referenciais inerciais, e conseqüência ime-


diata do princı́pio de relatividade de Galileu. Mas, se a teoria prevê uma velocidade

400
absoluta para a propagação da luz no vácuo, então o princı́pio de relatividade de
Galileu deve estar errado. Portanto, (pelo menos) uma dentre as seguintes alternati-
vas deverá ser verdadeira: ou existem referenciais inerciais privilegiados (aqueles que
determinam para a luz a velocidade c prevista teoricamente, e que se encontram em
repouso no espaço absoluto), ou as Eqs. (12.1) não são válidas no caso geral envol-
vendo altas velocidades. As evidências experimentais apontaram para a última dessas
possibilidades (conforme a relação apresentada na Seção 12.10), e o raciocı́nio que
segue admite isto como válido.

12.3.1 Princı́pio da Relatividade Especial

A Teoria da Relatividade Especial [4] supõe verdadeiras as afirmações a seguir.

Postulados de Einstein

Covariância As leis da fı́sica apresentam a mesma forma em qualquer referencial


inercial.
Invariância A velocidade da luz no vácuo é independente do estado de movi-
mento do observador bem como da fonte luminosa.

Sabemos, da geometria analı́tica, que uma igualdade da forma A = B ~ é desprovida de


sentido (uma grandeza escalar não pode ser igual a uma grandeza vetorial). Assim, uma
tal expressão é rejeitada pelo crivo lingüı́stico da geometria. O postulado de covariância
parece uma natural generalização à toda fı́sica (e não somente à mecânica) do princı́pio
de relatividade de Galileu. Na forma acima, ele garante que somente aquelas relações
que preservam sua forma perante uma mudança de referenciais inerciais podem ser
aptas ao tı́tulo de Lei da Fı́sica. O postulado de covariância exige da Fı́sica uma
espécie de crivo lingüı́stico da relatividade, justificando assim seu nome: as leis da
fı́sica são covariantes perante mudança de referencial inercial. Observa-se que a noção
de covariância não é uma inovação da Relatividade Especial, mas igualmente ocorre
na Geometria [1] (covariância vetorial) e na Mecânica de Newton [3] (covariância de
Galileu). O caráter original deste postulado refere-se ao tipo de covariância em questão,
e será detalhado no que segue (bem como nas Seções 12.4, 12.5 e 12.9).

O postulado de invariância da velocidade da luz no vácuo é bem menos intuitivo. Com


efeito, nossa crença na relatividade de Galileu é tanta que este postulado parece-nos, à
primeira vista, contradizer o postulado anterior. Demonstraremos a seguir o contrário
disto, ou seja, a compatibilidade desses dois princı́pios. Contudo, é verdade que diver-
sos resultados usuais da fı́sica pré-relativı́stica, tomados tacitamente como verdadeiros
por nosso senso comum, tornam-se incorretos se analisados sob a perspectiva da Re-
latividade Especial.

401
A noção de espaço é claramente dependente da escolha do observador inercial que
o determina, bem como a idéia de deslocamento.4 Por outro lado, a velocidade de
um corpo material (ponderável ou não) é, por definição, o espaço por ele percorrido
na unidade de tempo, conforme determinados por um observador (inercial). Assim, a
conjunção dos dois postulados de Einstein implicam (ver Exercı́cio 2) que a noção de
intervalo de tempo seja também dependente de observador, de tal modo que a razão
Espaço percorrido pela luz
Tempo de percurso
possa resultar numa grandeza absoluta (e igual a c), independente do observador
inercial escolhido, tal como requer o postulado de invariância. Portanto, as idéias
Newtonianas de tempo absoluto e de velocidades relativas ao observador devem ser
substituı́das na Relatividade Especial pelas idéias Einsteinianas de tempo relativo
ao observador e de velocidade da luz absoluta.5 Isto posto, fica claro que o enunci-
ado “Tudo é relativo”, usualmente atribuı́do à Relatividade Especial, é exagerado e
enganoso, se não quisermos ser rigorosos em considerá-lo como sendo completamente
equivocado.
É usual o estudante sentir dificuldades na mecânica de Newton ao estudar o tema ‘re-
ferenciais inerciais’, por não depositar a devida atenção à questão “Qual observador
faz qual medida?”. Essas dificuldades costumam ter lugar também no estudo da Re-
latividade Especial, pela mesma razão, e são agravadas pela relatividade das medidas
de tempo impostas por esta teoria (contrariamente ao senso comum que atribui ao
tempo uma noção absoluta). Assim sendo, o item (8) do Método de Newton (Seção
12.1) deve ser entendido na Relatividade Especial como referindo-se à comparação
relativı́stica entre medidas efetuadas em distintos referenciais inerciais, tema central
da Seção 12.4.
Ainda com respeito aos fundamentos da teoria, é freqüente encontrar textos mencio-
nando que a Relatividade Especial vale apenas para movimento uniforme, sendo ina-
dequada para descrever movimentos acelerados (cujo estudo requereria a Relatividade
Geral para uma descrição relativı́stica adequada). Também isto é incorreto, embora
um pouco mais próximo da verdade. A Relatividade Especial é uma teoria sobre a
comparação entre medidas efetuadas por referenciais inerciais em movimento relativo,
e não sobre quais são essas medidas. Desta forma, ela admite que o observador seja
inercial, mas nada afirma a respeito do tipo de movimento de um corpo descrito por
esse observador. Em outras palavras, a aceleração do Sistema de interesse é um con-
ceito tão lı́cito na Relatividade Especial quanto o é na Mecânica Newtoniana. Contudo,
referenciais não inerciais são desqualificados pela Relatividade Especial (tal como o
eram pela Mecânica Newtoniana). Medidas feitas por tais “maus observadores” com
efeito requerem a Relatividade Geral para uma descrição adequada a situações onde
4
Esta relatividade do espaço também ocorre na mecânica de Newton.
5
Velocidades outras que não a da luz no vácuo são dependentes de observador também na Relatividade
Especial, conforme a Seção 12.5.1.

402
as velocidades envolvidas são comparáveis à velocidade da luz no vácuo. O estudo da
Teoria da Relatividade Geral é tema do Capı́tulo 1.
Como última observação de caráter geral, cumpre salientar o papel do sistema de
coordenadas. Visto que a Relatividade Especial resulta ser, em essência, uma teoria
sobre a linguagem da fı́sica, não é surpreendente que distintos sistemas de coordenadas
sejam tratados de forma distinta. Em primeiro lugar, é comum (e nem sempre cor-
reto) identificar escolha do referencial inercial com escolha do sistema de coordenadas
cartesianas. Quando isto é feito, entende-se que o sistema de coordenadas escolhido
está adaptado ao observador; ou seja, a coordenada que mede o tempo associado aos
eventos neste sistema coordenado coincide com algum instrumento (como um relógio)
que mede a passagem do tempo ao longo da história do observador (isto é, a coleção
de eventos que o localizam no espaço ao longo do tempo). Embora seja bastante raro
uma escolha de coordenadas não adaptadas ao observador no contexto da Relativi-
dade Especial, observa-se o contrário na Teoria da Relatividade Geral. Desta forma,
o presente capı́tulo utiliza-se exclusivamente de sistemas coordenados adaptados ao
observador.
Em segundo lugar, o sistema de coordenadas cartesianas nem sempre é a forma mais
conveniente de descrever um dado Sistema (fı́sico ou matemático) de interesse. Com
efeito, o estudante talvez já esteja familiarizado com alguns sistemas de coordenadas
curvilı́neas, tais como as coordenadas polares (a duas dimensões), e as cilı́ndricas
e esféricas (a três dimensões). Embora seja possı́vel utilizar tais sistemas coordena-
dos não cartesianos na Relatividade Especial, isto introduz complicações matemáticas
desnecessárias neste momento, de modo que a apresentação neste capı́tulo restringe-se
ao uso de coordenadas cartesianas. Tais dificuldades não podem ser evitadas no estudo
da Relatividade Geral, contudo. Portanto, é sugerido ao leitor que, após ter concluı́do
o estudo dos Capı́tulos 1 e 11, retorne ao presente capı́tulo para considerar as modi-
ficações necessárias à Teoria da Relatividade Especial quando descrita em termos de
sistemas de coordenadas não cartesianos.

12.3.2 Sincronicidade

Dos resultados obtidos na Sec. 12.3.1 temos que o conceito relativı́stico de tempo não
é independente do observador inercial que o determina. Apesar disso, como veremos
na Sec. 12.4.2, a ordem temporal com que os observadores percebem os eventos é
preservada. Esta ordem unı́voca corresponde, de certa forma, à noção de causalidade da
fı́sica: as influências ocorrem de modo que as causas precedem seus próprios
efeitos. A conexão entre ordem temporal de eventos e causalidade requer uma espécie
de revisão no contexto da Relatividade Especial.
Entende-se por referencial uma coleção de observadores (um em cada ponto relevante
do espaço), em repouso relativo entre si, dispondo de réguas e relógios sincronizados.

403
Um destes observadores é qualificado, arbitrariamente, como sendo a “origem” do
referencial. A cada um desses observadores, associa-se coordenadas espaciais corres-
pondentes à sua respectiva posição relativa à origem, conforme medidas por qualquer
um deles. Embora essas posições espaciais não representem dificuldade, a sincronização
de seus relógios apresenta certa arbitrariedade.
Suponhamos que os observadores desse referencial disponham de relógios que operem
com mecanismos idênticos. Um desses observadores “mostra” ao outro a medida que
consta em seu próprio relógio. Para que o outro observador “veja” isto, é necessário
que a luz que codifica essa imagem viaje desde o primeiro observador até o segundo,
percorrendo com velocidade c a distância finita entre eles e, portanto, levando neste
percurso um tempo finito. Assim, a imagem que o segundo observador percebe do
relógio do primeiro encontra-se temporalmente atrasada com respeito àquela de seu
próprio relógio no evento A caracterizado por “segundo observador vê o relógio do
primeiro observador”. Este atraso inferido ∆t corresponde à razão entre a distância
∆x entre os observadores e a velocidade da luz nesse percurso retilı́neo, ou seja ∆t =
∆x/c. Desta forma, se a diferença entre a leitura do relógio do segundo observador no
evento A e a leitura por ele visualizada no relógio do primeiro observador nesse evento
coincidir exatamente com o cálculo ∆t acima, então dizemos que os relógios desses
dois observadores estão sincronizados (a la Einstein).
Para efetuar a sincronização de todos os relógios de um dado referencial inercial pelo
método acima, imaginemos que o observador na origem deste referencial ilumina mo-
mentaneamente seu próprio relógio no instante em que este marca o tempo “zero”. A
imagem assim produzida evolui no espaço, e progressivamente atinge os demais ob-
servadores desse referencial, tanto mais atrasada quanto maior a distância da origem
até cada um deles. Cada um desses observadores A, à distância dA da origem, é pre-
viamente instruı́do para acionar seu relógio, marcando “zero” + (dA /c), no instante
em que a imagem do tempo “zero” na origem o atinge. Como tratam-se de relógios
com mecanismos idênticos, seu funcionamento similar a partir de então deve preservar
este sincronismo inicial,6 de modo tal que esses relógios estarão sincronizados (a la
Einstein) para medições futuras de tempo.

12.4 Transformações de coordenadas de Lorentz

Com base nos postulados de Einstein (Sec. 12.3.1), encontram-se desenvolvidas aqui as
regras relativı́sticas de comparação de medidas efetuadas por referenciais inerciais em
movimento relativo, denominadas Leis de Transformação de Coordenadas (Cartesianas
adaptadas) de Lorentz (ou simplesmente Transformações de Lorentz). Estas regras as-
sumem, na Relatividade Especial, o papel desempenhado na Mecânica de Newton
6
Isto é válido se o espaço é homogêneo e isotrópico, como estamos ora supondo, mas via de regra não
é verdadeiro nas situações mais amplas descritas pela Relatividade Geral.

404
pelas leis de transformação de coordenadas de Galileu, Eqs. (12.1). A obtenção das
Transformações de Lorentz encontra-se a seguir desenvolvida passo-a-passo [7], em
termos de Gedankenexperiment, (experiências de pensamento), isto é, experimentos
idealizados realizáveis em princı́pio (porém não realizados efetivamente), cujos resulta-
dos podem ser previstos teoricamente apenas com base nos postulados e nas definições
das grandezas fı́sicas envolvidas.

12.4.1 Coordenadas transversas

Suponhamos um referencial inercial O e outro referencial inercial O0 que se move


relativamente a O com velocidade u constante, dirigida ao longo do sentido positivo
do eixo cartesiano Ox. Suponhamos ainda que os eixos coordenados espaciais cor-
respondentes nesses referenciais sejam paralelos.7 Consideremos dois bastões, A e B,
idênticos em tamanho e forma. Suponhamos que o bastão A esteja em repouso com
respeito ao referencial inercial O, ao longo do eixo Oy deste, e com uma de suas
extremidades na origem deste referencial, de modo que y ≥ 0 para eventos sobre o
bastão A. Analogamente, suponhamos que o bastão B esteja em repouso com respeito
ao referencial inercial O0 , ao longo do eixo O0 y 0 deste, e com uma de suas extremidades
na origem deste referencial, de modo que y 0 ≥ 0 para eventos sobre o bastão B. Ver
Fig. 12.1 (a).

Figura 12.1: As coordenadas transversas ao movimento relativo devem apresentar na-


tureza invariante perante a mudança de referencial inercial, de modo que a noção de
evento possa ser independente do observador.

Seria possı́vel, em princı́pio, que o referencial O atribuı́sse tamanhos distintos aos


bastões A e B, devido ao fato deste último encontrar-se com velocidade u (ao passo que
A está em repouso) com respeito a este referencial. Suponhamos, momentaneamente
e para fixar idéias, que o movimento na direção x tornasse mais curtas as dimensões
transversas y e z. Neste caso, para O, o bastão B pareceria menor do que o bastão A
7
Salvo menção explı́cita em contrário, todos os referenciais inerciais utilizados nesse capı́tulo utilizam-
se de sistemas de coordenadas com eixos correspondentes paralelos entre si.

405
e, ao passar por este, determinaria um ponto interno ao bastão A correspondente à
extremidade superior de B naquele evento, conforme Fig. 12.1 (b).
Consideremos o ponto de vista do observador O0 , para quem B está em repouso e A
encontra-se com velocidade u dirigida ao longo do sentido negativo do eixo O0 x0 . Como
supusemos que o movimento encurta as dimensões transversas, parecerá a O0 que o
bastão A é o menor. Portanto, ao passar por B, o bastão A determinaria um ponto
interno àquele correspondente à extremidade superior de A naquele evento, conforme
Fig. 12.1 (c).
A noção de evento, contudo, não deve depender do observador: se o evento “extremi-
dade superior do menor bastão no instante de encontro dos bastões” localiza para O
um ponto interno ao bastão A, então é inaceitável que este mesmo evento localize para
O0 a extremidade de A. Assim, a hipótese acima de que o movimento ao longo de x
reduz as dimensões y e z não pode ser verdadeira, pois conduziria a uma contradição.
É imediato perceber que a hipótese de que o movimento em x dilate as dimensões
y e z conduziria analogamente a resultados igualmente inaceitáveis, sendo portanto
igualmente falsa. Resulta desse raciocı́nio que o movimento ao longo da direção x não
modifica quaisquer das dimensões transversas y e z:
(
y = y0
(12.7)
z = z0.

Em geral, temos que comprimentos ao longo de direções transversas ao movi-


mento não são por este alteradas.

12.4.2 Dilatação do tempo

Considere os mesmos referenciais inerciais O e O0 acima, em movimento relativo com


velocidade u ao longo da direção x. Suponhamos que O0 dispõe de uma lanterna e de
um espelho, fixando a lanterna na origem e o espelho a uma altura fixa y 0 = d sobre
o eixo O0 y 0 . Então, o observador O0 aciona a lanterna, disparando um lampejo de luz.
O raio de luz sobe a distância d até encontrar o espelho, reflete-se (instantaneamente)
neste, e retorna pelo mesmo caminho até a origem. Ver Fig. 12.2 (a).

A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de subida e descida é 2d, então devemos ter t0 = 2d/c para o tempo de
trânsito da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal. Para O, o cami-
nho percorrido pelo raio de luz que atinge o espelho e retorna à lanterna não é vertical,

406
Figura 12.2: A invariância da velocidade da luz requer que o tempo entre dois dados
eventos pareça menor para o observador inercial que os situa no mesmo ponto do espaço
do que para qualquer outro observador inercial em movimento com respeito ao primeiro.

mas sim uma trajetória inclinada como ilustra a Fig. 12.2 (b). Para a subida, enquanto
o raio luminoso desloca-se verticalmente a distância y = d — igual àquela medida pelo
referencial O0 , pois trata-se de um comprimento medido perpendicularmente ao movi-
mento relativo, conforme discutido na Sec. 12.4.1 — ele também desloca-se horizontal-
mente a distância x = ut1 no tempo de subida t1 . Assim, a distância total percorrida
p
pela luz na subida é dada (pelo teorema de Pitágoras) por l1 = d2 + (ut1 )2 . Como
trata-se de um raio de luz percorrendo no vácuo a distância l1 no tempo t1 , temos (por
postulado) que l1 = ct1 , de modo que a igualdade entre estas distâncias resulta em

t1 = d/ c2 − u2 . Para o trajeto de descida, temos relações análogas: a distância per-
p √
corrida no tempo t2 de descida será l2 = d2 + (ut2 )2 = ct2 , donde t2 = d/ c2 − u2 .

O tempo total do percurso luminoso será t = t1 + t2 = 2d/ c2 − u2 .

Desta forma, os eventos A e B definem para o observador O o intervalo de tempo

t0
t= p , (12.8)
1 − (u/c)2

onde t0 é o intervalo de tempo definido entre esses mesmos eventos pelo observador O0
que os observa no mesmo ponto do espaço. Em geral, o intervalo de tempo τ = t0 na
Eq. (12.8), relativo a medidas entre dois eventos A e B no mesmo ponto do espaço,
é denominado (no contexto da Relatividade Especial) de tempo próprio entre esses
eventos, e corresponde ao menor lapso de tempo possı́vel entre os referidos eventos que
pode ser determinado por algum referencial inercial (pois t ≥ t0 ). É usual representar
intervalos de tempo próprio pelo sı́mbolo τ .

407
12.4.3 Contração do comprimento

Considere os mesmos referenciais inerciais O e O0 acima, em movimento relativo com


velocidade u ao longo da direção x. Suponhamos novamente que O0 disponha de uma
lanterna e de um espelho, fixando a lanterna na origem e o espelho a uma posição fixa
x0 = d sobre o eixo O0 x0 . Então, o observador O0 aciona a lanterna, disparando um
lampejo de luz. O raio de luz percorre a distância d até encontrar o espelho, reflete-se
(instantaneamente) neste, e retorna pelo mesmo caminho até a origem. Ver Fig. 12.3
(a).

Figura 12.3: A invariância da velocidade da luz requer que a distância entre dois dados
eventos pareça maior para o observador inercial que os determina entre pontos em repouso
no espaço do que para qualquer outro observador inercial em movimento com respeito ao
primeiro.

A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de ida e volta é 2d, então devemos ter t0 = 2d/c para o tempo de trânsito
da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal, conforme a Fig.
12.3 (b). Para O, o ponto do espaço onde a luz atinge o espelho corresponde ao encontro
no instante intermediário t1 do raio de luz (com velocidade c a partir da origem) com
o espelho (com velocidade u a partir da posição inicial x). Assim, temos ct1 = x + ut1 ,
donde x = (c − u)t1 , pois o espelho e o raio de luz viajam no mesmo sentido. Para
o retorno do raio de luz, contudo, o raio de luz e seu alvo (a lanterna), embora
inicialmente separados pela mesma distância x acima, viajam em sentidos opostos
com velocidades de mesma magnitude que acima. Portanto, o tempo de retorno t2
satisfaz à relação x = (c + u)t2 . Desta forma, o tempo total (ida e volta) do percurso

408
luminoso será  
1 1 2c
t = t1 + t2 = x + =x .
c−u c+u c2 − u2
Conforme o resultado da Sec. 12.4.2, o tempo próprio t0 entre os eventos A e B (pois
o referencial O0 os determina no mesmo ponto do espaço) relaciona-se com o tempo t
acima por meio da Eq. (12.8), de modo que temos
1 t 2xc/(c2 − u2 ) x 1
p = 0 = = .
1 − (u/c)2 t 2d/c d 1 − (u/c)2
Desta forma, obtemos finalmente que a distância x entre a lanterna e o espelho em
movimento, como determinado pelo referencial O, é dada por
p
x = 1 − (u/c)2 x0 , (12.9)

em termos do comprimento próprio ` = x0 = d, determinado pelo referencial O0


que localiza em repouso no espaço os pontos que localizam as extremidades desse
comprimento. É usual representar intervalos de comprimento próprio pelo sı́mbolo `.

12.4.4 Simultaneidade relativa

Estando sincronizados os relógios de um dado referencial inercial pelo procedimento


descrito na Sec. 12.3.2, consideremos dois eventos A e B correspondendo ao acender
das lâmpadas de dois postes de iluminação pública nas posições a e b, ao longo de
uma avenida. Para tanto consideremos novamente os mesmos referenciais inerciais O
e O0 acima, em movimento relativo com velocidade u ao longo da direção x.
Suponhamos que O0 percebe os postes em repouso, associando a eles uma distância
própria x0 = 2`. Suponhamos, também, que os eventos A e B são vistos por O0 como
simultâneos, de modo que os raios de luz provenientes dos eventos A e B atingem
simultaneamente o ponto médio do espaço entre as posições espaciais desses eventos
(conforme determinadas por O0 ) no evento C, à distância ` deles. Ver Fig. 12.4 (a).
Do ponto de vista do referencial O, que também tem seus relógios sincronizados a la
Einstein, as posições a e b dos postes estão em movimento uniforme com velocidade u.
p
De acordo com os resultados da Sec. 12.4.3, a distância entre a e b é x = 2` 1 − (u/c)2 .
p
Desta forma, o ponto médio entre a e b encontra-se à distância ` 1 − (u/c)2 destes,
e viaja igualmente com velocidade u. O raio de luz de a para b viaja com velocidade c
no sentido oposto ao movimento dos postes, aproximando-se com uma velocidade c+u
p
do ponto médio, e atingindo-o, portanto, após o tempo tA = ` 1 − (u/c)2 /(c + u).
Ver Fig. 12.4 (b). Já o raio de luz de b para a viaja com velocidade c no mesmo sentido
de movimento dos postes, aproximando-se com uma velocidade c − u do ponto médio,
p
e atingindo-o no tempo tB = ` 1 − (u/c)2 /(c − u), como ilustrado na Fig. 12.4 (c).
Portanto, a diferença de tempo
2` u/c2
 
p 1 1
t = tB − tA = ` 1 − (u/c)2 − =p
c−u c+u 1 − (u/c)2

409
Figura 12.4: Eventos simultâneos para um dado referencial inercial podem ser caracteriza-
dos como ocorrendo em tempos diferentes para um referencial inercial em movimento com
respeito ao primeiro, devido ao procedimento de Einstein de sincronização de relógios.

entre a chegada ao ponto médio dos pulsos de luz emitidos nos eventos A e B é
percebida pelo referencial O como sendo a diferença de tempo entre esses eventos.

Assim, se o referencial O0 determina como simultâneos dois eventos separados pela


distância x0 , o referencial O que se move com respeito ao primeiro com velocidade u
determina esses eventos como ocorrendo em instantes distintos, separados pelo lapso
de tempo
x0 u 1
t= 2 p . (12.10)
c 1 − (u/c)2

Para O, o evento A precede temporalmente o evento B, pois a posição espacial b


de B precede a posição espacial a de A relativamente à orientação da velocidade u.
Desta forma, um outro referencial O00 , com velocidade u com respeito a O0 no sentido
negativo do eixo O0 x0 , perceberia os eventos A e B também separados temporalmente
pelo tempo dado pela Eq. (12.10), porém de modo que o evento B precede o evento
A. Com isto, a ordem temporal entre os eventos A e B depende do observador. De
acordo com o procedimento de sincronização de relógios de Einstein (Sec. 12.3.2), se
existir um referencial inercial que observa eventos espacialmente separados
como sendo simultâneos, então existirão outros referenciais inerciais que
os distingüem temporalmente. A ordem temporal com que esses eventos ocorrem
depende da escolha do referencial.

12.4.5 Transformações de Lorentz


p
Por simplicidade de notação, visto ser o fator adimensional 1 − (u/c)2 que figura
nas Eqs. (12.8)–(12.10) muito freqüente em expressões relativı́sticas, é conveniente
introduzir para ele um sı́mbolo especial. Assim, define-se o “fator de Lorentz”

1
γ=q , (12.11)
1 − (u/c)2

410
de mudança de coordenadas entre referenciais inerciais com magnitude da velocidade
relativa u. O fator de Lorentz satisfaz a relação γ ≥ 1. Nos casos em que esta velocidade
relativa u não seja clara do contexto, a notação γu é preferı́vel.

Com o auxı́lio da Eq. (12.11), podemos exprimir as considerações anteriores sobre


coordenadas transversas, dilatação temporal, contração espacial, e simultaneidade re-
lativa, expressos nas Eqs. (12.7)–(12.10) na forma a seguir. Temos que ∆y 0 = ∆y e
∆z 0 = ∆z. Se o referencial O0 efetua medidas no mesmo ponto do espaço (∆x0 = 0),
então temos ∆t = γ ∆t0 em acordo com a Eq. (12.8). No caso de medidas simultâneas
para o referencial O (∆t = 0), temos ∆x0 = γ ∆x em acordo com a Eq. (12.9). Para
medidas simultâneas para O0 (∆t0 = 0), temos ∆t = (γu/c2 ) ∆x0 em acordo com a
Eq. (12.10). Admitindo a linearidade das transformações de coordenadas de espaço e
tempo, estes resultados podem ser sumarizados na forma da lei de transformação de
coordenadas de Lorentz
 0

 t = γ(t − ux/c2 ) + to
 x0 = γ(x − ut) + x

o
0
(12.12)


 y = y + y o
 0
z = z + zo ,

e sua lei inversa (ver Exercı́cio 5), a qual pode ser obtida daquela acima por meio das
~ ↔R
substituições formais t ↔ t0 , R ~ 0 , e u → −u (além de to → t0o e R
~o → R
~0 )
o

t = γ(t0 + ux0 /c2 ) + t0o





 x = γ(x0 + ut0 ) + x0

o
0 0
(12.13)


 y = y + yo
z = z 0 + zo0 ,

onde as constantes (to , xo , yo , zo ) e suas análogas (t0o , x0o , yo0 , zo0 ) desempenham, na
Relatividade Especial, papel análogo das constantes homônimas que figuram nas Eqs.
(12.1) na Mecânica de Newton — e serão, em geral, omitidas na teoria de Einstein
tal como o eram na de Newton. Aliás, as Eqs. (12.12) desempenham elas próprias na
Relatividade Especial o mesmo papel das Eqs. (12.1) na Mecânica de Newton.

Cumpre notar que as Eqs. (12.12) de Lorentz aproximam-se das Eqs. (12.1) de Galileu
no limite de baixas velocidades u  c (de modo que c2 → ∞ e γ → 1). Por exemplo,
para uma velocidade u = 30Km/s (tı́pica para o movimento dos planetas em torno do
Sol, e sensivelmente maior do que as velocidades de objetos macroscópicos na superfı́cie
terrestre), temos u/c ≈ 10−4 e γ − 1 ≈ 5 · 10−9 . Portanto, a Mecânica de Newton deve
ser encarada, nesta perspectiva, como o limite de baixas velocidades da Mecânica de
Einstein (ou relativı́stica), a qual será formulada posteriormente (Sec. 12.6) com base
nos resultados acima.

411
12.5 Cinemática relativı́stica

Uma vez determinadas as leis fundamentais de transformação de coordenadas en-


tre referenciais inerciais, codificadas nas Eqs. (12.12) da Seção 12.4, analisaremos
aqui o problema da comparação do movimento conforme descrito por tais referenciais.
Determinam-se, desta forma, em analogia com as Eqs. (12.12), leis de transformação
entre referenciais inerciais das principais grandezas cinemáticas envolvidas no estudo
da mecânica — o deslocamento, a velocidade, e a aceleração de um arbitrário sistema
mecânico — e da ondulatória — o comprimento de onda, a freqüência, e o vetor de
onda de um arbitrário sistema ondulatório.

12.5.1 Sistemas mecânicos

Considere o movimento de uma partı́cula material P (ou qualquer outro sistema fı́sico
de interesse cuja descrição, em cada instante, resume-se a um ponto do espaço),
conforme descrito por um referencial inercial O. Assim, num genérico instante t,
a partı́cula P encontra-se no ponto caracterizado pelo vetor posição R ~ = R(t)
~ =
~ ~ ~
x(t)i + y(t)j + z(t)k expresso nas coordenadas cartesianas utilizadas pelo referencial
O. Com isto, a história da partı́cula P (ou sua
 linha
 de universo) é definida (por
~
O) pela coleção de eventos da forma t, R(t) = t, x(t), y(t), z(t) para todos os
valores do parâmetro t no domı́nio das funções x(t), y(t), e z(t).
Embora a representação de um evento em coordenadas possa depender do observador
inercial escolhido, o evento não é dependente do observador nem das coordenadas por
ele escolhidas. Assim, a história da partı́cula P , conforme a definição acima, é uma
noção relativisticamente invariante.
Considere dois arbitrários eventos A e B na história de P , respectivos aos (igual-
mente arbitrários) instantes de tempo tA e tB determinados por O. O deslocamento
Newtoniano da partı́cula P desde A até B é dado por
   
~ ~ ~
RAB = R(tB ) − R(tA ) = x(tB ) − x(tA ), y(tB ) − y(tA ), z(tB ) − z(tA ) .

Com isto, a velocidade média Newtoniana de P nesse percurso é dada por

~ AB
~v AB = (vABx , vABy , vABz ) = t R− tA
 B 
x(tB ) − x(tA ) y(tB ) − y(tA ) z(tB ) − z(tA )
= tB − tA , tB − tA , tB − tA .

A velocidade instantânea Newtoniana de P no evento A é então


 
~vA = vx (tA ), vy (tA ), vz (tA ) = lim ~v AB
 tB →tA 
x(tB ) − x(tA ) y(tB ) − y(tA ) z(tB ) − z(tA )
= lim t −t , lim t −t , lim t −t ,
tB →tA B A tB →tA B A tB →tA B A

412
 
e, em geral, ~v (t) = vx (t), vy (t), vz (t) para cada instante de tempo t.
A aceleração média Newtoniana de P no percurso de A para B é dada por
 
~v AB vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
~aAB = = , , .
tB − tA tB − tA tB − tA tB − tA
A aceleração instantânea Newtoniana de P no evento A é então
 
~aA = ax (tA ), ay (tA ), az (tA ) = lim ~aAB
 tB →tA 
vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
= lim t −t , lim t −t , lim t −t ,
tB →tA B A tB →tA B A tB →tA B A
 
e, em geral, ~a(t) = ax (t), ay (t), az (t) para cada instante de tempo t.
Consideremos a construção dessas mesmas quantidades cinemáticas conforme deter-
minadas pelo referencial inercial O0 , que se move com respeito ao referencial O com
velocidade u dirigida no sentido positivo do eixo Ox, conforme a Sec. 12.4. Para O0 , os
eventos que constituem a história de P são representados, conforme as Eqs. (12.12),
por
   
t0 , x0 (t0 ), y 0 (t0 ), z 0 (t0 ) = γu [t − u x(t)/c2 ], γu [x(t) − u t], y(t), z(t) .

Assim, o deslocamento Newtoniano de P desde A até B é dado por


   
~ 0 ~ 0 0 ~ 0 0 0 0 0 0 0 0 0 0 0 0 0 0
R AB = R (tB ) − R (tA ) = x (tB ) − x (tA ), y (tB ) − y (tA ), z (tB ) − z (tA )
 
= γu {[x(tB ) − x(tA )] − u[tB − tA ]}, y(tB ) − y(tA ), z(tB ) − z(tA ) .

Com isto, a velocidade média Newtoniana de P nesse percurso é dada por

0 0 0 0 R~0
~v AB = (vABx , vABy , vABz ) = 0 AB 0
tB − tA
 0 0 
x (tB ) − x (tA ) y (tB ) − y 0 (t0A ) z 0 (t0B ) − z 0 (t0A )
0 0 0 0
= , ,
t0B − t0A t0B − t0A t0B − t0A
 
γu {[x(tB ) − x(tA )] − u(tB − tA )} y(tB ) − y(tA ) z(tB ) − z(tA )
= , ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 } t0B − t0A t0B − t0A
 
[x(tB ) − x(tA )]/(tB − tA ) − u y(tB ) − y(tA ) z(tB ) − z(tA )
= , , .
1 − u[x(tB ) − x(tA )]/[c2 (tB − tA )] t0B − t0A t0B − t0A
Ou seja, a componente longitudinal (isto é, na direção do movimento relativo entre os
0 0
referenciais) da velocidade ~v AB é então vABx = [vABx − u]/[1 − vABx u/c2 ]. Já para as
0
componentes transversais da velocidade ~v AB , temos
0 y(tB ) − y(tA ) vABy
vABy = 2 = ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c } γu (1 − vABx u/c2 )
0
e analogamente vABz = vABz /[γu (1 − vABx u/c2 )]. Para a velocidade instantânea de P
em A, temos
~v 0A = 0
lim (vABx 0
, vABy 0
, vABz )
t0B →t0A
 
v Ax − u vAy vAz
= , , .
1 − vAx u/c2 γu (1 − vAx u/c2 ) γu (1 − vAx u/c2 )

413
 
Para cada instante de tempo t0 , temos v 0 (t0 ) = vx0 (t0 ), vy0 (t0 ), vz0 (t0 ) ≡ (vx0 , vy0 , vz0 )
onde

vx0 = vx − u 2





 1 − vx u/c
 vy
vy0 = (12.14)

 γu (1 − vx u/c2 )

 vz0 =

 vz ,
γu (1 − vx u/c2 )

onde foram omitidas as dependências funcionais por simplicidade de notação. As Eqs.


(12.14) representam a lei de transformação de velocidades ~v e ~v 0 entre os referenciais
inerciais O e O0 , cuja lei inversa deve ter a mesma forma dessa (ver Exercı́cio 6), e
pode ser dela obtida pelas substituições formais u → −u e ~v ↔ ~v 0 :

vx0 + u

 vx =
1 + vx0 u/c2




vy0


vy = (12.15)

 γu (1 + vx0 u/c2 )
vz0



 vz =
 .
γu (1 + vx0 u/c2 )

Observa-se que os numeradores dessas relações coincidem com as expectativas Newto-


nianas para essas velocidades, e que os denominadores apresentam valores próximos
da unidade para movimentos de corpos macroscópicos na vizinhança da superfı́cie ter-
restre (i.e., para v  c). Além disso, é notável a distinção de tratamento entre as
componentes longitudinal e transversais da velocidade para a lei de transformação de
velocidades, Eq. (12.14), tal como são distintamente tratadas as coordenadas longitu-
dinal e transversais pela lei de transformação de coordenadas, Eq. (12.12).

A aceleração média Newtoniana de P no percurso de A para B, conforme determinada


pelo referencial O0 , é então ~a0AB = (a0ABx , a0ABy , a0ABz ), de modo que sua componente
longitudinal é dada na forma

vx (tB ) − u vx (tA ) − u
2 −
vx0 (t0B )
− vx0 (t0A ) 1 − vx (tB )u/c 1 − vx (tA )u/c2
a0ABx = =
t0B
− t0A γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 }
[vx (tB ) − u][1 − vx (tA )u/c2 ] − [vx (tA ) − u][1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ]γu (tB − tA )[1 − vABx u/c2 ]
[vx (tB ) − vx (tA )][1 − u2 /c2 ]
=
γu [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](tB − tA )[1 − vABx u/c2 ]
= aABx .
(γu )3 [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]

414
Para as componentes transversais, temos

vy (tB ) vy (tA )
vy0 (t0B )
− vy0 (t0A ) −
γ [1 − vx (tB )u/c ] γu [1 − vx (tA )u/c2 ]
2
a0ABy = = u
t0B
− t0A γu (tB − tA )[1 − vABx u/c2 ]
vy (tB )[1 − vx (tA )u/c2 ] − vy (tA )[1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](γu )2 (tB − tA )[1 − vABx u/c2 ]
vABy − {[vy (tB ) − vy (tA )]vx (tA ) − vy (tA )[vx (tB ) − vx (tA )]}u/c2
=
(γu )2 (tB − tA )[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
aABy − [aABy vx (tA ) − vy (tA )aABx ]u/c2
=
(γu ) [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
2

aABy [1 − vx (tA )u/c2 ] + aABx vy (tA )u/c2


= ,
(γu ) [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
2

e analogamente

aABz [1 − vx (tA )u/c2 ] + aABx vz (tA )u/c2


a0ABz = .
(γu )2 [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]

0
A
 aceleração instantânea  Newtoniana de P no evento A é então expressa na forma ~aA =
a0x (t0A ), a0y (t0A ), a0z (t0A ) = 0lim0 ~a0AB = 0lim0 (a0ABx , a0ABy , a0ABz ), com componente
tB →tA tB →tA
longitudinal

a0x (t0A ) = lim aABx


(γu )3 [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
tB →tA

ax (tA )
= ,
(γu )3 [1 − vx (tA )u/c2 ]3

e componentes transversais

aABy [1 − vx (tA )u/c2 ] + aABx vy (tA )u/c2


a0y (t0A ) = lim 2 2 2 2
tB →tA (γu ) [1 − vx (tA )u/c ][1 − vx (tB )u/c ][1 − vABx u/c ]

a (t )[1 − vx (tA )u/c2 ] + ax (tA )vy (tA )u/c2


= y A ,
(γu )2 [1 − vx (tA )u/c2 ]3
e
az (tA )[1 − vx (tA )u/c2 ] + ax (tA )vz (tA )u/c2
a0z = .
(γu )2 [1 − vx (tA )u/c2 ]3
 
Em geral, ~a (t ) = ax (t ), ay (t ), az (t ) ≡ (a0x , a0y , a0z ) para cada instante de tempo
0 0 0 0 0 0 0 0

t0 , onde
ax

a0x = 3
vx u/c2 ]3




 (γ u ) [1 −
a [1 − vx u/c2 ] + ax vy u/c2


a0y = y (12.16)
 (γu )2 [1 − vx u/c2 ]3

a [1 − vx u/c2 ] + ax vz u/c2


 a0z = z ,


(γu )2 [1 − vx u/c2 ]3
onde a dependência funcional das funções foi omitida por simplicidade de notação.
As Eqs. (12.16) estabelecem a lei de transformação de acelerações entre referenciais

415
inerciais, cuja lei inversa deve ter a mesma forma (ver Exercı́cio 6), e pode ser dessa
obtida pelas substituições formais u → −u e ~v ↔ ~v 0 e ~a ↔ ~a0
γu a0x

a x =
[1 + vx0 u/c2 ]3





a0 [1 + vx0 u/c2 ] − a0x vy0 u/c2


ay = y (12.17)

 γu [1 + vx0 u/c2 ]3

0 0 2 0 0 2
 az = az [1 + vx u/c 0] − a2x v3z u/c .



γu [1 + vx u/c ]
Observa-se das Eqs. (12.16) que, à diferença do que ocorre no caso das velocidades
Eqs. (12.14), a escolha do observador pode alterar o número de componentes não nulas
da aceleração de um dado sistema fı́sico: por exemplo, se ax 6= 0 e ay = 0, com vy 6= 0,
então as Eqs. (12.16) implicam em a0x 6= 0 e a0y 6= 0.

12.5.2 Sistemas ondulatórios

Façamos algumas considerações concernentes ao movimento ondulatório, de modo a


fornecer as correções relativı́sticas ao efeito Doppler longitudinal, cujo exemplo quo-
tidiano é o fenômeno de alteração da freqüência sonora atribuı́da a uma sirene móvel
conforme esta se aproxima ou se afasta do observador. E apresentamos o efeito Doppler
transversal, o qual não possui análogo Newtoniano [7]. Para o estudo desta seção, serão
necessários os conhecimentos elementares de fı́sica ondulatória: significado e manipu-
lação dos conceitos de comprimento de onda λ, de freqüência ν, do perı́odo T , e de
velocidade V de uma onda.
A primeira observação importante, no que tange ao conceito de uma onda, consiste
em sua classificação. Entre outras classificações relevantes de ondas, estamos aqui
interessados em sua classificação quanto ao tipo:

Ondas Mecânicas são perturbações ondulatórias de configurações materiais, e por-


tanto sua propagação exige a presença de um meio mecânico. Exemplos familiares
são as ondas sonoras (perturbação na densidade e na pressão) em um fluido, e
as ondas elásticas (perturbação na conformação espacial) em uma corda ou em
uma mola.
Ondas de Campos são perturbações ondulatórias na configuração de campos fun-
damentais da fı́sica, cuja existência prescinde de um meio material (e podem se
propagar no interior da matéria bem como no vácuo). Exemplos familiares são
as ondas eletromagnéticas (perturbação na configuração dos campos elétrico e
magnético) que constituem a caracterização clássica da luz visı́vel e de outras ra-
diações eletromagéticas invisı́veis ao olho humano (infra-vermelho, ultra-violeta,
raio-X etc).

Embora sua descrição seja mais trabalhosa, as ondas mecânicas são usualmente mais
intuitivas ao leigo, talvez por tratarem de conformações materiais ao invés de con-

416
figurações de grandezas abstratas. Assim sendo, discutiremos inicialmente o efeito
Doppler para ondas mecânicas.

Considere uma fonte F e um detector D de pulsos mecânicos ondulatórios, ambos imer-


sos num meio material M homogêneo e isotrópico com respeito ao qual esses pulsos
propagam-se8 com velocidade V , e sejam νo = 1/To e λo respectivamente a freqüência
e o comprimento de onda desses pulsos conforme determinados pelo referencial inercial
fixo à fonte F . O efeito Doppler consiste na descrição da possı́vel diferença existente
entre essas grandezas e as quantidades νd = 1/Td e λd correspondentes que são deter-
minadas pelo referencial inercial fixo ao detector D, devido ao movimento de F e/ou
de D com respeito a M .

Supondo que M seja um meio inercial (isto é, seja não acelerado), denomine-se O um
referencial inercial com respeito ao qual M encontra-se em repouso. Analogamente,
sejam O0 e O00 referenciais inerciais (com coordenadas cujos eixos sejam paralelos aos
correspondentes eixos das coordenadas de O) tais que se encontram em repouso F
com respeito a O0 e D com respeito a O00 . Por simplicidade, trataremos inicialmente
o problema unidimensional (direção Ox). Sejam xF e vF respectivamente a posição e
a velocidade da fonte, e sejam xD e vD respectivamente a posição e a velocidade do
detector, com respeito a O. Se xD − xF > 0, então temos que vF > 0 significa que o
movimento de F aproxima-a de D, e vD > 0 significa que o movimento de D afasta-o
de F .

Consideremos os eventos A “extremidade esquerda do primeiro pulso no instante si-


multâneo para O0 de geração de sua extremidade direita”, B “extremidade direita do
primeiro pulso no instante de geração desta”, e C “extremidade direita do segundo
pulso no instande de geração desta”. Cada pulso propaga-se com velocidade V (por
hipótese) no meio M , atingindo posteriormente o detector D se V 6= vD . Neste caso,
consideremos os eventos9 Ā “extremidade esquerda do primeiro pulso no instante si-
multâneo para O00 de detecção de sua extremidade direita”, B̄ “extremidade direita do
primeiro pulso no instante de detecção desta”, e C̄ “extremidade direita do segundo
pulso no instante de detecção desta”.

Para um observador em repouso com respeito a O0 (tal como a fonte F , por exemplo),
cada pulso produzido por F tem extensão espacial λo , sendo dois sucessivos pulsos
separados pelo lapso de tempo To . Por definição de comprimento de onda e de perı́odo,

8
A propagação de uma dada onda num dado meio é tema da fı́sica ondulatória, e a velocidade de
propagação desta onda resulta depender tanto das carcterı́sticas desta quanto das do meio material no
qual ela se propaga. Não serão discutidos aqui esses detalhes.
9
Observa-se que não estamos supondo que os pulsos possuam identificação invariante, de modo que o
“primeiro pulso produzido por F ” pode eventualmente jamais ser detectado por D. Os termos primeiro e
segundo que figuram nos enunciados dos eventos referem-se ora à ordem com que os pulsos são produzidos
por F (para os eventos A, B, C), ora à ordem com que eles são detectados por D (para os eventos Ā, B̄,
C̄).

417
neste referencial temos λo = |x0AB | (os eventos A e B são simultâneos) e To = t0BC (os
eventos B e C ocorrem no mesmo ponto do espaço).

Para um observador em repouso com respeito ao referencial O00 (tal como o detector
D, por exemplo), temos λd = |x00ĀB̄ | (pois os eventos Ā e B̄ são simultâneos) e Td = t00B̄ C̄
(pois os eventos B̄ e C̄ ocorrem no mesmo ponto do espaço).

Para um observador em repouso com respeito a O (tal como o meio M , por exemplo),
as quantidades xAB e tBC podem ser obtidas da lei de transformação de coordenadas
de Lorentz, Eqs. (12.13), fazendo u = vF (velocidade de O0 com respeito a O) nes-
sas equações. Resulta, portanto, que xAB = γvF λo e tBC = γvF To . Analogamente, as
quantidades xĀB̄ e tB̄ C̄ podem ser obtidas daquela mesma lei fazendo u = vD (veloci-
dade de O00 com respeito a O) nessas equações. Resulta, portanto, que xĀB̄ = γvD λd
e tB̄ C̄ = γvD Td . Mas, e quanto à relação existente entre xĀB̄ e xAB (bem como aquela
existente entre tB̄ C̄ e tBC )?

Figura 12.5: Perı́odo Tm e comprimento de onda λm de uma onda produzida por uma
fonte F em movimento e detectada por um detector D em movimento, em termos de um
referencial que a caracteriza com velocidade V .

Como os eventos A e B são simultâneos para O0 , aparentam para O estarem sepa-


rados temporalmente pelo intervalo tAB = γvF |vF |λo /c2 . E também, como os eventos
B e C ocorrem no mesmo ponto do espaço para O0 , aparentam para O estarem
separados espacialmente pela distância |xBC | = γvF |vF |To . De forma análoga, temos
tĀB̄ = γvD |vD |λd /c2 e |xB̄ C̄ | = γvD |vD |Td . Denote-se respectivamente por νm = 1/Tm e
λm a freqüência e o comprimento de onda dos pulsos produzidos por F , tal como são
determinados pelo referencial O. Então, em termos dos eventos B e C da emissão por
F , o espaço xBC = vF tBC percorrido pela fonte somado à distância V Tm entre dois
pulsos deve igualar a distância V tBC percorrida pelo pulso, donde Tm = (1−vF /V )tBC ;
analogamente, temos Tm = (1 − vD /V )tB̄ C̄ em termos dos eventos B̄ e C̄ de detecção

418
por D, conforme a Fig. 12.5 (a). Da igualdade entre essas duas expressões, temos
s
V − vF tB̄ C̄ γvD Td 1 − (vF /c)2 Td
= = = ,
V − vD tBC γvF To 1 − (vD /c)2 To

de modo que a freqüência νd = 1/Td medida pelo detector D é dada em termos da


freqüência νo = 1/To medida pela fonte F por
s
νd V − vD 1 − (vF /c)2
= . (12.18)
νo V − vF 1 − (vD /c)2

Por outro lado, em termos dos eventos A e B, a distância xAB entre as duas ex-
tremidades do mesmo pulso (em instantes distintos) deve corresponder à soma do
comprimento de onda λm com a distância V tAB percorrida pelo pulso. Ver Fig. 12.5
(b). Deste modo, temos λm = xAB − V tAB em termos da emissão por F ; analoga-
mente, λm = xĀB̄ − V tĀB̄ em termos da detecção por D. Da igualdade entre essas
duas expressões, temos
xĀB̄ − V tĀB̄ γvD (1 − V vD /c2 )λd
1= = ,
xAB − V tAB γvF (1 − V vF /c2 )λo
de modo que o comprimento de onda λd medido pelo detector D é dado em termos
do comprimento de onda λo medido pela fonte F por
s
λd 1 − V vF /c2 1 − (vD /c)2
= . (12.19)
λo 1 − V vD /c2 1 − (vF /c)2

As Eqs. (12.18) e (12.19) descrevem a versão relativı́stica do efeito Doppler Newtoniano


(ou longitudinal) para ondas mecânicas. A interpretação elementar deste efeito consiste
em observar dois fatos: primeiro, devido à velocidade da fonte, os pulsos tornam-se
mais próximos diante da fonte e mais afastados atrás desta, o que altera o comprimento
de onda; e segundo, devido à velocidade do detector, o número de frentes de onda por
ele observadas aumenta caso seu movimento seja no sentido da fonte e diminui caso
seja no sentido oposto, o que altera a freqüência da onda. Combinados, esses dois
resultados dão conta das frações à direita do sinal de igualdade (e que envolvem a
velocidade V da onda) em ambas as Eqs. (12.18) e (12.19). A contribuição da raiz
quadrada, em ambos os casos, corresponde à correção relativı́stica desse fenômeno, e
deve-se à diferença entre as noções de simultaneidade para os referenciais envolvidos.
Para o caso em que os pulsos propagam-se com velocidade V = c com respeito a O
(e, portanto, também com respeito a O0 e O00 ), a construção acima permanece correta
— embora seja um tanto artificial, pois o referencial O não é definido fisicamente —
e seus resultados podem ser expressos (ver Exercı́cio 7) na forma
 r
ν 1 + v/c
 νdo =


r − v/c
1
(12.20)
λ d 1 − v/c
= ,


λo 1 + v/c

419
onde v = (vF − vD )/(1 − vD vF /c2 ), obtida das Eqs. (12.14), é a velocidade da fonte
F como medida pelo detector D, a qual é tomada como positiva caso a fonte e o
detector se aproximem e negativa caso se afastem. As Eqs. (12.20) descrevem o efeito
Doppler longitudinal para ondas de campo (tais como, por exemplo, as ondas eletro-
magnéticas). Assim, a luz visı́vel emitida por um corpo que se afasta do observador
é detectada por este como apresentando uma tonalidade mais avermelhada (compri-
mento de onda maior e freqüência menor) do que aquela com que foi emitida; con-
trariamente, essa tonalidade lhe parecerá mais azulada (comprimento de onda menor
e freqüência maior) no caso de aproximação relativa entre a fonte e o observador.
Consideremos, agora, o efeito de diferença no comprimento de onda e na freqüência
de uma onda devido ao movimento da fonte F e do detector D na direção transversal
à direção de propagação da onda, fenômeno conhecido como efeito Doppler transver-
sal. Podemos construir esse efeito a partir do raciocı́nio anterior, fazendo a veloci-
dade da onda V na direção Oy. Para evitar aproximações desnecessárias ao problema,
suponhamos que os pulsos gerados por F são frentes de onda plana horizontais. Com
isto, o movimento horizontal da fonte e/ou do detector em nada modificam a in-
terpretação Newtoniana para o movimento dos pulsos e sua detecção, de modo que
terı́amos νd /νo = 1 e λd /λo = 1. As correções relativı́sticas a esse resultado Newtoni-
ano se aplicam da mesma forma que no caso anterior, de modo que o efeito Doppler
transversal para ondas mecânicas é descrito (ver Exercı́cio 8) por
 r
ν 1 − (vF /c)2
 νdo =


2
r1 − (vD /c) (12.21)
1 − (vD /c)2
 λd = .


λo 1 − (vF /c)2

Para o caso de ondas de campo, propagando-se com velocidade c em qualquer re-


ferencial, a construção acima ainda é correta, embora carregue o mesmo grau de
artificialidade observado para o caso do efeito Doppler longitudinal de ondas de campo.
O resultado pode ser obtido mais diretamente das leis de dilatação do tempo (donde
contração da freqüência), e de contração do comprimento, em termos da velocidade
relativa v entre F e D, de modo que o efeito Doppler transversal para ondas de campo
é dado (ver Exercı́cio 9) na forma

ν
 p
 νdo = 1 − (v/c)2

λd 1 (12.22)
 λo = p
 .
1 − (v/c)2

12.6 Mecânica relativı́stica

Observa-se que a cinemática relativı́stica consiste numa coleção de regras de comu-


nicação das medidas efetuadas por diferentes referenciais inerciais, mas não atenta

420
para a questão fundamental de caracterizar as leis fı́sicas que determinam tais me-
didas. Com base na cinemática relativı́stica por um lado e na mecânica Newtoniana
por outro, apresenta-se aqui um resumo da teoria fı́sica que pretende generalizar a
mecânica de Newton para os domı́nios de movimentos com velocidades comparáveis à
da luz no vácuo.

A estrutura das leis da Mecânica de Newton baseia-se não apenas na idéia de in-
variância de Galileu, mas também na noção fundamental de momentum linear. Em
particular, a lei de inércia garante a conservação no tempo do momentum linear total
de um sistema isolado, resultado que deve ser válido em qualquer referencial inercial.
Embora a noção Newtoniana de força seja frágil em seu aspecto de ação à distância, a
idéia de campo permite validar seu aspecto de ação local (tal como no caso das forças
de contato). Desta forma, a Teoria da Relatividade Especial não se furta de fazer uso de
algumas forças. Mas, devido à forma distinta com que são tratadas pelas Eqs. (12.14)
as componentes longitudinal e transversais da velocidade, a conservação da quanti-
P
dade k mk~v k num referencial inercial implica, em geral, em sua não conservação em
outros referenciais inerciais em movimento relativo com respeito ao primeiro. Assim,
essas expressões relativı́sticas contradizem a Mecânica de Newton. Este fato, a ser
detalhado a seguir, suscita uma correção relativı́stica à definição Newtoniana p~ = m ~v
do momentum linear de um sistema de massa m com velocidade ~v . Tal correção tem
implicações na noção de energia de um sistema fı́sico, originando assim uma nova
forma de energia: a energia de repouso.

12.6.1 Momentum linear

O exemplo mais simples de contradição entre a noção clássica de momentum linear e a


lei relativı́stica de transformação de velocidades advém de tratar-se a colisão elástica
de duas partı́culas idênticas A e B de massa m. Seja o referencial inercial O do centro
de massa do sistema isolado composto pelas partı́culas A e B. Neste referencial, antes
da colisão, as partı́culas têm velocidades ~v Ai e ~v Bi iguais e opostas: vxA
i i
= −vxB ≡ vx e
i i
vyA = −vyB ≡ vy , conforme ilustrado na Fig. 12.6. No instante da colisão, as partı́culas
A e B encontram-se em contato segundo uma direção — representada verticalmente
na Fig. 12.6 — não paralela à velocidade inicial relativa ~v Bi − ~v Ai = −2(vx~i + vy~j )
entre ambas, caracterizando assim uma colisão não frontal. Sendo a colisão elástica,
a energia mecânica do sistema é conservada pela colisão. Sendo o sistema isolado,
e desprezando-se a interação à distância entre as partı́culas, a energia mecânica do
sistema resume-se à sua energia cinética.

Considere a descrição pelo referencial O. No instante i antes da colisão, a partı́cula


A apresenta energia inicial KAi = m(vx2 + vy2 )/2 e momentum linear inicial com
componentes pixA = m vx e piyA = m vy , e a partı́cula B apresenta energia inicial
KBi = m[(−vx )2 + (−vy )2 )]/2 e momentum linear inicial cujas componentes são dadas

421
Figura 12.6: Colisão elástica não frontal de duas partı́culas idênticas, analisada no referen-
cial do centro de massa do sistema, antes (diagonal SW-NE), depois (diagonal NW-SE),
e no momento (centro) da colisão.

por pixB = −m vx e piyB = −m vy . Designando pelo ı́ndice f as correspondentes quan-


tidades após a colisão, a conservação da energia

KAf + KBf = KAi + KBi , (12.23)

e de cada componente cartesiana do momentum linear total do sistema


(
pfxA + pfxB = pixA + pixB
(12.24)
pfyA + pfyB = piyA + piyB ,

fornecem, em conjunto, o familiar resultado Newtoniano [7, 8]


( (
f i f i
vxA = vx = vxA vxB = −vx = vxB
f i f i
(12.25)
vyA = −vy = −vyA , vyB = vy = −vyB ,

ilustrado na Fig. 12.6. A conservação do momentum linear clássico do sistema


( (
f f
Pxi = m(vxAi i
+ vxB )=0 Pxf = m(vxA + vxB )=0
i i i f f f
Py = m(vyA + vyB ) = 0, Py = m(vyA + vyB ) = 0,

tem a forma Pxf = 0 = Pxi e Pyf = 0 = Pyi .

Considere a colisão das partı́culas A e B conforme determinada pelo referencial inercial


O0 que se move na direção Ox com velocidade u = vx . Para O0 , em acordo com as
Eqs. (12.14) de transformação de velocidades entre referenciais inerciais, a partı́cula
i0 i0
p
A apresenta velocidade inicial vxA = 0 e vyA = vy / 1 − (vx /c)2 e velocidade final
f0 f0
p
vxA = 0 e vyA = −vy / 1 − (vx /c)2 ; e a partı́cula B apresenta velocidade inicial
i0 i0
p
vxB = −2vx /[1 + (vx /c)2 ] e vyB = −vy 1 − (vx /c)2 /[1 + (vx /c)2 ] e velocidade final

422
f0 f0
p
vxB = −2vx /[1+(vx /c)2 ] e vyB = vy 1 − (vx /c)2 /[1+(vx /c)2 ]. Com isto, o momentum
linear (clássico) total do sistema tem componentes
−2m vx

i0 i0 i0
 Px = m(vxA + vxB ) = 1 + (vx /c)2


2
i0 i0 i0 2m vy (v x /c)
 P
 y
 = m(vyA + vyB ) = p ,
[1 + (vx /c)2 ] 1 − (vx /c)2
−2m vx

f0 f0 f0 i0
 Px = m(vxA + vxB ) = 1 + (v /c)2 = Px


x

f0 f0 −2m vyp (vx /c)2


 Pyf 0 = m(vyA + vyB ) = = −Pyi 0 .


[1 + (vx /c)2 ] 1 − (vx /c)2
Desta forma, o referencial O0 observa a conservação do momentum linear clássico
longitudinal Pxf 0 = Pxi 0 , mas percebe uma violação na conservação do momentum
linear clássico tranversal Pyf 0 6= Pyi 0 devido à inversão do sinal algébrico. Esta violação
é precisamente aquilo que se pretendia evidenciar, e demonstra a incompatibilidade
da Mecânica Newtoniana com as Transformações de Lorentz.
Uma solução conveniente para esse impasse consiste em efetuar modificações sutis
na Mecânica Newtoniana, imperceptı́veis no regime de baixas velocidades ao qual
nosso senso comum é adequado, mas que sejam suficientes para que a compatibilidade
com a cinemática relativı́stica possa ser mantida. Como já antecipado, a Mecânica
Relativı́stica será aqui construı́da com base numa modificação no conceito Newtoniano
de momentum linear. De fato, conforme a análise da dilatação temporal da Sec. 12.4.2,
temos que um intervalo de tempo coordenado dt entre dois eventos relaciona-se com o
intervalo de tempo próprio dτ (caso exista, conforme a Sec. 12.7) entre esses mesmos
p
dois eventos pela equação dt = γ dτ , onde γ = 1/ 1 − (u/c)2 em termos da velocidade
u < c de movimento uniforme entre os referidos eventos. Enquanto dt depende de
observador, temos que dτ é independente da escolha de referencial. Este fato sugere a
definição relativı́stica do momentum linear
~
dx ~
dx m ~v
P~ = m = γv m = γv m ~v = p . (12.26)
dτ dt 1 − (|~v |/c)2
Observa-se que a diferença com respeito à definição clássica do momentum linear é
a presença do fator de Lorentz γ na expressão relativı́stica, de modo tal que a Eq.
(12.26) produz resultados muito semelhantes aos da mecânica clássica nos casos de
baixas velocidades.
Em termos da Eq. (12.26), podemos re-analisar a colisão entre as partı́culas A e B. Para
o referencial O, todosqos momenta anteriormente calculados devem ser multiplicados
pelo mesmo fator 1/ 1 − (vx2 + vy2 )/c2 , de modo que a conservação do momentum
linear relativı́stico nesse referencial é equivalente à conservação do momentum linear
clássico construı́da anteriormente.
1 − (vx /c)2 = vAf 0 para a partı́cula A,
0 i0
p
Para o referencial
q O , temos v A = v y /
e vBi 0 = (2vx )2 + vy2 − (vx vy )2 /c2 /[1 + (vx /c)2 ] = vBf 0 para a partı́cula B. Com

423
p
isto, temos γA = [1 − (vx /c)2 ]/{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula A, e
p
γB = [1 + (vx /c)2 ]/ [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula B. Desta
f0
i0
p
forma, temos γA vyA = −γA vyA = vy / 1 − [(vx /c)2 + (vy /c)2 ] para a partı́cula A, e
f0 f0
i0
p i0
γB vxB = γB vxB = −2vx / [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} e γB vyB = −γB vyB =
f0
γA vyA para a partı́cula B. Finalmente, as expressões relativı́sticas para o momentum
linear do sistema são
−2m vx

 Pxi 0 = m(γA vxA
i0 i0
+ γB vxB )= p
[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}

 i0
 i0 i0
Py = m(γA vyA + γB vyB ) = 0,
−2m vx

f0 f0
 Pxf 0 = m(γA vxA + γB vxB ) = p

[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}
 f0
 f0 f0
Py = m(γA vyA + γB vyB ) = 0.
Obtém-se assim que, tanto para o referencial O quanto para o referencial O0 , na colisão
das partı́culas A e B acima, vale a conservação do momentum linear relativı́stico dado
pela Eq. (12.26), onde as medidas de velocidade efetuadas por esses dois referenciais
são relacionadas pela lei de transformação de velocidades de Lorentz, Eqs. (12.14). Em-
bora seja um caso particular, este cálculo ilustra um resultado geral de conservação do
momentum linear relativı́stico de um sistema fı́sico isolado. Este resultado estabelece,
portanto, a versão relativı́stica da Lei de inércia da Mecânica Newtoniana.

12.6.2 Energia

Suponhamos que a Lei da dinâmica Newtoniana F~ = dP~ /dt seja válida no contexto
relativı́stico, onde F~ é uma força de origem local, por meio de uma re-interpretação do
vetor P~ como sendo o momentum relativı́stico da Eq. (12.26). Neste caso, o teorema
Trabalho-Energia fornece a variação da energia cinética de um sistema de massa m
sujeito à ação da força F~ na forma

∆K = F~ · ds ~ = dP~ · ~v dt = d(γ m ~v ) · ~v dt = ~v · d(γ m ~v )


R R R R
R dt Rdt R
= [d(~v · γ m ~v ) − γ m ~v · d~v ] = d(γ m v 2 ) − γ m v dv
R x=v/c x dx  √ 
= ∆ (γ m v 2 ) − m c2 √ = ∆ (γ m v 2
) + ∆ m c2
1 − x 2
1 − x2 x=v/c
2 2 2 2
= ∆ (γ m c [(v/c) + 1/γ ]) = ∆ (γ m c ) .

Assim, se a força resultante F~ sobre o sistema de massa m acelera-o desde o repouso


inicial até a velocidade final v, temos Kv = γv m c2 − γ0 m c2 = (γ − 1)m c2 . Desta
forma, a energia cinética relativı́stica de um sistema de massa m com velocidade v é
dada pela relação
K = (γ − 1)m c2 , (12.27)
em termos do fator γ de Lorentz desse sistema. Fazendo a aproximação de baixas
velocidades, o fator γ pode ser escrito em série de potências em v/c até segunda or-
dem na forma γv = 1 + v 2 /2c2 + O(v/c)4 . Com isto, obtemos que a energia cinética

424
relativı́stica, Eq. (12.27), toma a forma Newtoniana K ≈ m v 2 /2 a menos de correções
relativı́sticas de quarta ordem na razão v/c. Desprezı́veis no contexto de baixas veloci-
dades, essas correções tornam-se significativas quando v → c. Pois a energia cinética
relativı́stica assume valores arbitrariamente grandes neste último limite. Desta forma,
acelerar um corpo de massa m desde o repouso até a velocidade da luz no vácuo
demandaria uma energia infinita, sendo portanto impossı́vel. Estas previsões foram
verificadas experimentalmente (Sec. 12.10).

Observa-se que a energia cinética relativı́stica corresponde à diferença entre a grandeza


γ m c2 dependente do movimento e a quantidade constante m c2 que independe do
estado de movimento do sistema. Este resultado sugere que esta constante seja uma
forma de energia do sistema de massa m, associada meramente à sua condição massiva.
Define-se, portanto, a energia de repouso de um sistema fı́sico de massa m pela
relação
Eo = m c2 . (12.28)

Cumpre notar que a Eq. (12.28) fornece uma grande quantidade de energia para
quantidades relativamente pequenas de massa, nas escalas familiares de grandeza. Em
valores numéricos, m = 1Kg equivale a cerca de Eo = 8, 987 · 1016 J. Tendo em conta
a forma de repouso da energia, tem lugar a definição da energia total

E = γ m c2 , (12.29)

ou E = K + Eo , do sistema mecânico isolado, bem como a definição da energia


mecânica total EM = E + U = K + U + Eo de um sistema mecânico sob a ação de
uma força resultante conservativa F~ = −∇U
~ com energia potencial U .

Observa-se (ver Exercı́cio 11) que, para um sistema mecânico de massa m, sua energia
total E dada pela Eq. (12.29) relaciona-se com seu momentum relativı́stico P~ dado
pela Eq. (12.26) na forma
E 2 − c2 P~ · P~ = (Eo )2 , (12.30)

onde Eo é a energia de repouso desse corpo, dada pela Eq. (12.28). Ademais, segundo
uma transformação de Lorentz entre referenciais, um referencial inercial O0 que deter-
mina para o corpo de massa m uma energia total E 0 e um momentum relativı́stico P~ 0
descreve a relação entre energia total e momentum na forma (E 0 )2 − c2 P~ 0 · P~ 0 = (Eo )2 ,
a qual é formalmente similar à Eq. (12.30).

Ainda, é comum interpretar as Eqs. (12.26)–(12.27) sob uma perspectiva excessiva-


mente Newtoniana, observando que a combinação relativı́stica γ m aparece nessas
relações em substituição à massa m que figura nas expressões clássicas. Isto enseja
a definição de uma massa relativı́stica m(v) = γv m dependente da velocidade v, em
termos da massa de repouso m. Este ponto de vista não será adotado no presente
estudo.

425
12.7 Espaço-tempo

A linguagem estabelecida pela Relatividade Especial parece inicialmente pouco intu-


itiva, e suas expressões matemáticas — tais como as leis de transformação de coor-
denadas Eqs. (12.12), de velocidades Eqs. (12.14), de acelerações Eqs. (12.16) etc —
não raro são difı́ceis de memorizar devido à sua elaboração algébrica. Visando sim-
plificar a compreensão dos fenômenos envolvidos, mas sem restringir-se ao âmbito
da metafı́sica [6], apresenta-se nesta seção uma interpretação geométrica dos resulta-
dos relativı́sticos, a qual unifica o tempo e o espaço fı́sicos numa nova estrutura de-
nominada contı́nuo de espaço-tempo [4]. Em termos dessa nova e abstrata estrutura,
inicialmente estranha ao estudante, os problemas tratados por essa teoria tornam-se
representáveis na forma de diagramas, favorecendo assim o desenvolvimento de uma
intuição relativı́stica baseada em figuras ao invés de fórmulas. Com efeito, as expressões
relativı́sticas assusmem uma forma muito mais simples quando expressas em termos
de espaço-tempo. Com o auxı́lio dessa interpretação, os paradoxos mais comuns da
relatividade são discutidos na Sec. 12.8. Embora os aparentes paradoxos representem
historicamente uma crı́tica Newtoniana à nova teoria, sua solução revela o cuidado
requerido pela relatividade para com a linguagem, de modo que esta possa revelar-se
útil e objetiva.
Embora o espaço-tempo não seja uma estrutura essencial na descrição dos fenômenos
concernentes à Relatividade Especial, mas somente uma ferramenta útil nesse con-
texto, trata-se de uma noção sine qua non ao estudo da Teoria da Relatividade Geral,
conforme a apresentação no Cap. 1.

12.7.1 O espaço-tempo de Minkowski

Já tivemos oportunidade de verificar, nas seções precedentes deste capı́tulo, que a
noção fundamental da relatividade (qual seja, a idéia de “evento”) requer, para sua
completa especificação num dado sistema coordenado de um referencial dado, quatro
valores numéricos: um deles qualificando um instante no tempo e os demais determi-
nando uma posição no espaço. Com o auxı́lio da velocidade da luz no vácuo c, admitida
por postulado como uma constante da fı́sica, podemos uniformizar as unidades fı́sicas
dessas coordenadas dos eventos. Com efeito, um evento A caracterizado num dado refe-
rencial por (t, x, y, z) equivalentemente pode ser caracterizado por (ct, x, y, z) nesse
mesmo referencial. Para facilitar essa padronização, denominaremos por coordenadas
de eventos no espaço-tempo aos valores (x0 , x1 , x2 , x3 ), onde
 0

 x = ct
 x1 =

x
(12.31)


 x2 = y
 3
x = z.

426
A escolha do ı́ndice 0 como correspondente à coordenada temporal10 de eventos no
espaço-tempo evita ambigüidades posteriores,11 e salienta o caráter distinto dessa co-
ordenada com respeito às demais, representadas por um ı́ndice “espacial” positivo.
Quanto ao fato de utilizarmos uma notação de ı́ndices sobrescritos x0 ao invés de
ı́ndices subescritos x0 , esta escolha corresponde ao caráter tensorial a ser discutido
na Sec. 12.9. Embora possa causar estranheza, por assemelhar-se a uma potência
algébrica, a ambigüidade é evitada utilizando-se da notação (x)0 (sem omitir os
parênteses, que de outro modo seriam supérfluos) sempre que for necessária uma
potência de uma grandeza com componentes coordenadas.
Temos à disposição, portanto, um ambiente quadridimensional denominado espaço-
tempo (de Minkowski, em referência ao matemático Herman Minkowski que o estabe-
leceu em 1908), cuja estrutura autônoma deve-se, em grande medida, à possibilidade
de uniformização das unidades fı́sicas correspondentes às medidas ao longo de seus
“eixos ortogonais” de espaço e de tempo. Embora seja algo difı́cil “visualizar” figu-
ras em quatro dimensões, podemos visualizar com facilidade as suas diversas seções
bidimensionais, obtidas por técnica similar à construção de curvas de nı́vel (de altura
constante) a partir do mapa topográfico de um terreno. A principal diferença con-
ceitual introduzida por esta abordagem consiste no fato que, com freqüência, uma
das coordenadas apresentadas nessa visualização por redução dimensional possui um
caráter temporal.
Expressos em termos dessa linguagem, os corpos mecânicos não evoluem no espaço
conforme a passagem do tempo, mas somente existem no espaço-tempo, sendo cada
um deles caracterizado por sua respectiva história. Desta forma, a noção de espaço-
tempo acima corresponde a uma visão estática do mundo. Embora revisada, esta visão
filosófica de um mundo mecânico estático (apesar de sua dinâmica intrı́nseca) perdura
na Relatividade Geral (Cap. 1), bem como na Cosmologia Relativı́stica (Caps. 2 e 3).
Tal como os espaços vetoriais abstratos da geometria analı́tica, o espaço-tempo acima
possui uma estrutura matemática de espaço vetorial: podemos definir um vetor
posição quadridimensional X no espaço-tempo como sendo a representação de even-
tos12 em termos das coordenadas (x0 , x1 , x2 , x3 ) utilizadas por um referencial inercial
O. Ou seja, escrevemos a relação X = (x0 , x1 , x2 , x3 ). Dados arbitrariamente o es-
calar α e os vetores X = (x0 , x1 , x2 , x3 ) e Y = (y 0 , y 1 , y 2 , y 3 ) (expressos no mesmo
sistema de coordenadas de um mesmo referencial inercial), as operações vetoriais de
soma X + Y = (x0 + y 0 , x1 + y 1 , x2 + y 2 , x3 + y 3 ) e de multiplicação por escalar
10
Observe-se que as unidades fı́sicas de comprimento dessa coordenada não alteram seu caráter tem-
poral, pois especifica um instante de tempo do referencial escolhido.
11
Sob a perspectiva relativı́stica, o número quatro acima não é fundamental: poder-se-ı́a estabelecer
igualmente a Relatividade Especial em d dimensões espaciais, sendo d um número inteiro positivo ar-
bitrário. A escolha d = 3 deve-se à nossa percepção usual do mundo mecânico como sendo composto de
objetos existentes num ambiente espacial de três dimensões.
12
Mais rigorosamente, trata-se do deslocamento com respeito à origem deste espaço vetorial. A noção
de vetor será apresentada de modo mais preciso na Sec. 12.9.

427
α X = (α x0 , α x1 , α x2 , α x3 ) localizam igualmente eventos válidos do espaço-tempo.
E, por conseguinte, são vetores legı́timos dessa estrutura vetorial abstrata. Como uma
interpretação geométrica, a soma X + Y localiza com respeito à origem O o evento
localizado por Y relativamente à origem deslocada Ō, a qual é localizada por X com
respeito a O. A interpretação para o produto por escalar no espaço-tempo é menos
intuitiva, contudo.
Em vista da universalidade da constante c, uma velocidade Newtoniana ~u ar-
bitrária pode ser completamente caracterizada pela grandeza tridimensional β~ =
(βx , βy , βz ) = ~u/c denominada velocidade Newtoniana adimensional. Esta definição
corresponde meramente a medir a velocidade Newtoniana ~u em unidades da veloci-
dade da luz no vácuo c. Em termos dessa escala de unidades, a velocidade da luz
no vácuo tem valor unitário. Em alguns textos avançados, isto corresponde à escolha
geométrica de unidades c = 1.
Consideremos dois referenciais inerciais O e O0 em movimento relativo com velocidade
relativa u de O0 com respeito a O, dirigida ao longo do sentido positivo do eixo Ox.
Seja um arbitrário evento A. Em termos do referencial O, este evento corresponde ao
vetor X = (x0 , x1 , x2 , x3 ). Já com respeito ao referencial O0 , este evento corresponde
ao vetor X0 = (x0 0 , x0 1 , x0 2 , x0 3 ). A relação entre os vetores X e X0 — mais rigo-
rosamente, trata-se do mesmo vetor expresso em dois distintos referenciais — pode
ser imediatamente obtida da lei de transformação de coordenadas de Lorentz entre
referenciais inerciais, Eqs. (12.12), na forma
 00

 x = γ(x0 − βx1 )
 x0 1

= γ(x1 − βx0 )
(12.32)


 x0 2 = x2
 03
x = x3 ,
p
onde γ = 1/ 1 − (β)2 é o fator de Lorentz da Eq. (12.11) expresso em termos da
velocidade Newtoniana adimensional β, ou sua representação recı́proca

γ(x0 0 + βx0 1 )
 0

 x =
 x1 = γ(x0 1 + βx0 0 )

(12.33)


 x2 = x0 2
x0 3 .
 3
x =

As Eqs. (12.32) são a representação das Eqs. (12.12) em termos de grandezas no


espaço-tempo, sendo portanto igualmente denominadas como a lei de Lorentz de trans-
formação de coordenadas entre referenciais inerciais.
Consideremos mais seriamente a noção vetorial de velocidade. Do ponto de vista New-
toniano, a velocidade de um dado corpo pode ser representada por meio da linguagem
vetorial tridimensional usual em termos de três valores numéricos que determinam
a taxa de deslocamento desse corpo com respeito ao tempo em cada uma das três

428
direções espaciais. Expressa na linguagem quadridimensional do espaço-tempo rela-
tivı́stico, contudo, a velocidade vetorial de um corpo num arbitrário evento A dado
corresponde à razão entre o vetor quadridimensional XAB = XB − XA que especifica
seu deslocamento até um evento B futuro na história desse corpo e o intervalo de
tempo próprio x0 0 = c τAB (expresso em unidades de comprimento) entre esses dois
eventos, no limite B → A. Pois, para que essa razão forneça como resultado um vetor
(também quadridimensional), ela deve ser tal que corresponde à operação de produto
do vetor XAB por um escalar. Mas, sendo c tAB uma das componentes de um vetor
(qual seja, o vetor XAB ), este intervalo de tempo coordenado não é um escalar, e muda
de valor perante as Eqs. (12.12). Já o intervalo de tempo próprio entre dois eventos é
uma noção invariante perante mudança de referenciais, donde é um escalar no espaço-
tempo. Podemos expressar o tempo próprio em termos do tempo coordenado na forma
x0 0 = x0 /γ, em acordo com a Eq. (12.8) e as Eqs. (12.32). Com isto, definimos o vetor
velocidade relativı́stica (quadridimensional) V = (V 0 , V 1 , V 2 , V 3 ) por
 0
 V0 = γ dx0 =γ
dx1



γ dx0

 V1 =

= γ βx
dx2 (12.34)
 V = γ dx0
2
= γ βy
dx3



V 3 = γ dx0

= γ βz ,


dx

onde ~v = c β~ = (c/V 0 )(V 1 , V 2 , V 3 ) = (v 1 , v 2 , v 3 ) corresponde à velocidade vetorial


Newtoniana, e γ = (1 − β~ · β~ )−1/2 . Assim, a velocidade relativı́stica V de um corpo
mantém correspondência biunı́voca com sua correspondente velocidade Newtoniana,
pois qualquer uma das duas determina univocamente a outra. Uma importante relação
entre as componentes coordenadas da velocidade relativı́stica da Eq. (12.34) é

(V 0 )2 − [(V 1 )2 + (V 2 )2 + (V 3 )2 ] = γ 2 {1 − [(β 1 )2 + (β 2 )2 + (β 3 )2 ]} = 1.

Considere a velocidade relativı́stica do mesmo corpo no mesmo evento, porém de-


terminada pelo referencial inercial O0 descrito anteriormente. Assim, temos V0 =
(V 0 0 , V 0 1 , V 0 2 , V 0 3 ), em correspondência com a velocidade Newtoniana ~v 0 que este
referencial determina. Poderı́amos obter a lei de transformação entre as velocidade
relativı́sticas Eqs. (12.34) a partir da lei de transformação entre as correspondentes
velocidades Newtonianas, Eqs. (12.14) (ver Exercı́cio 13). Ao invés disso, observamos
que V = dX/d(c τ ) e V0 = dX0 /d(c τ ), onde τ é o tempo próprio sobre a história do
corpo em estudo. Com isto, a regra da cadeia fornece

dX0 ∂X0 ∂X0


   
0 dX
V = = · = · V,
d(c τ ) ∂X d(c τ ) ∂X

onde a matriz 4 × 4 de derivadas parciais (∂X0 /∂X) pode ser imediatamente calculada

429
das Eqs. (12.32) na forma
 
γ −γβ 0 0
∂X0
   −γβ γ 0 0 
= . (12.35)
 
∂X  0 0 1 0 
0 0 0 1

É então evidente que a velocidade relativı́stica apresenta, perante uma mudança de


referenciais inerciais, lei de transformação cuja estrutura algébrica possui a mesma
forma das Eqs. (12.32) de Lorentz,
 00

 V = γ(V 0 − βV 1 )
 V 0 1 = γ(V 1 − βV 0 )

(12.36)
 V 02 = V 2


 03
V = V 3.

Assim, a velocidade relativı́stica evidencia um caráter de elevada simetria em com-


paração com a correspondente noção de velocidade Newtoniana. O preço a pagar por
este ganho em simplicidade consiste em considerar uma componente a mais para a
velocidade, a qual aponta “na direção do tempo”.
E quanto à aceleração Newtoniana? Será verdade que existe uma aceleração rel-
ativı́stica que, à semelhança do caso da velocidade, perante uma mudança de ref-
erenciais inerciais apresenta lei de transformação mais simples do que aquela cod-
ificada pelas Eqs. (12.16)? Felizmente, a resposta é afirmativa. Em analogia com
a velocidade relativı́stica, podemos definir a aceleração relativı́stica na forma A =
(A0 , A1 , A2 , A3 ) = dV/d(c τ ) = γ dV/dx0 = (γ/c) dV/dt. A regra da cadeia fornece
dγ/dx0 = (∂γ/∂ β) ~ · (dβ/dx
~ 0
) = (γ/c)3 ~v · ~a, onde ~v = (vx , vy , vz ) = (v 1 , v 2 , v 3 ) e
~a = (ax , ay , az ) = (a1 , a2 , a3 ) são respectivamente a velocidade e a aceleração Newto-
nianas. Com isto, a aceleração relativı́stica A é dada em componentes em termos da
velocidade e aceleração Newtonianas ~v e ~a por

dV 0 = γ 4 ~v · ~a

0
 A = γ
dx0 c32


2
 A1 = γ dV = γ [ax + γ ~v · ~a vx ]

 1

0 2
dx c2 2
c2 (12.37)
2
2 γ
dV = [a + γ ~
v · ~a
 A = γ y v y ]
dx0 c2 c2



 A3 = γ dV 3 = γ 2 [a + γ 2~v · ~a v ],


dx0 c2 z c2 z

de modo que a aceleração Newtoniana ~a pode igualmente ser calculada em termos da


velocidade e aceleração relativı́sticas V e A na forma
 c 2  c2 A 0 1 2 c2 A0 2 3 c2 A0 3

1
~a = A − 0 3V ,A − 0 3V ,A − 0 3V .
V0 (V ) (V ) (V )

E quanto à mudança de referencial inercial inicialmente proposta? No referencial O0


acima, a aceleração relativı́stica é dada na forma A0 = (A0 0 , A0 1 , A0 2 , A0 3 ). Usando o

430
mesmo raciocı́nio adotado para a transformação de velocidades, temos

dV0 ∂V0 ∂X0


   
0 dV
A = = · = · A,
d(c τ ) ∂V d(c τ ) ∂X

de modo que a aceleração relativı́stica também segue uma lei de transformação na


forma  00

 A = γ(A0 − βA1 )
 A0 1 = γ(A1 − βA0 )

02 2
(12.38)


 A = A
 03
A = A3 .
Desta forma, também para a aceleração é verdadeira a afirmação que a formulação
relativı́stica (i.e. no espaço-tempo) oferece simplificação com respeito às leis de trans-
formação entre referenciais inerciais. Apesar de sua conexão com a versão Newtoniana
da aceleração não ser tão simples quanto as equações correspondentes para a veloci-
dade, as expressões para a aceleração acima guardam notável simetria entre suas
componentes espaciais.
Pode-se também introduzir no espaço-tempo um vetor P (vetor momentum-energia)
para caracterizar as grandezas dinâmicas E = γmc2 e P~ = γm~v dos sistemas
mecânicos, conforme a discussão na Sec. 12.6.2. Em termos do referencial O que usa
coordenadas (x0 = ct, x1 = x, x2 = y, x3 = z), definimos
 0

 P = γv mc2
 P1 =

−γv mv 1
(12.39)
 P2 =
 −γv mv 2

 3
P = −γv mv 3 .

O referencial O0 com coordenadas (x0 0 = ct0 , x0 1 = x0 , x0 2 = y 0 , x0 3 = z 0 ) relacionadas


às coordenadas de O por meio das transformações de Lorentz Eqs. (12.12) determina
um vetor energia-momentum P0 = (γv0 mc2 , γv0 mv 0 1 , γv0 mv 0 2 , γv0 mv 0 3 ) que pode ser
escrito (ver Exercı́cio 15) em termos do vetor P na forma
 00

 P = γu (P0 − βu P1 )
 P0 1

= γu (P1 − βu P0 )
(12.40)


 P0 2 = P2
 03
P = P3 .

12.7.2 Geometria do espaço-tempo de Minkowski

Podemos acentuar ainda mais o caráter geométrico do espaço-tempo de Minkowski


construı́do na Sec. 12.7.1. Isto é obtido introduzindo uma noção invariante de distância
entre pontos desse espaço vetorial (que são os eventos do espaço-tempo). Veremos que
essa noção generaliza a idéia da distância Euclidiana entre pontos do espaço tridimen-
sional, evidenciando o caráter pseudo-Euclidiano do espaço-tempo. Isto significa que,

431
embora o espaço e o tempo não tenham existência invariante independentemente, mas
encontrem-se unificados num contı́nuo de espaço-tempo, ainda assim as noções intu-
itivas de espaço e de tempo são tais que não podem ser completamente identificadas
entre si.
Consideremos um lampejo luminoso produzido no evento A origem de um referen-
cial inercial O por uma fonte puntual isotrópica. Conforme determinado por esse
referencial, o pulso propaga-se (no vácuo) em todas as direções espaciais com veloci-
dade c, de modo que num instante posterior dt apresenta forma esférica com raio
p
r = (dx)2 + (dy)2 + (dz)2 = c dt. Assim, um genérico evento B sobre a superfı́cie
esférica desse pulso satisfaz uma relação

(dx0 )2 − [(dx1 )2 + (dx2 )2 + (dx3 )2 ] = 0, (12.41)

semelhante na forma àquela verificada pelas componentes da velocidade relativı́stica


V (naquele caso, o lado direito era igual a 1). Os eventos correspondentes ao inte-
rior espacial dessa superfı́cie esférica — ou seja, aqueles considerados por O como
simultâneos com o evento B e cuja distância espacial até a origem é menor do que r
— são tais que o lado esquerdo da Eq. (12.41) torna-se positivo (i.e. o termo “tem-
poral” é dominante na equação acima). Estes eventos são exatamente aqueles que,
em acordo com a lei de transformação de Lorentz Eqs. (12.32) (ou melhor, com sua
generalização proposta no Exercı́cio 12), podem ser considerados por um referencial
inercial O0 como ocorrendo no mesmo ponto do espaço em que o pulso luminoso foi
produzido. Pois a velocidade Newtoniana (medida por O) requerida para o referencial
O0 para que sua história contenha o evento A e um arbitrário, mas fixo, de tais eventos
seria inferior à velocidade c, exigência matemática para a validade das leis de Lorentz.
Portanto, existe o tempo próprio entre o evento A e qualquer evento localizado no
interior espacial da superfı́cie esférica do pulso luminoso. Analogamente, os eventos
correspondentes ao exterior espacial da superfı́cie esférica do pulso luminoso são tais
que o lado esquerdo da Eq. (12.41) torna-se negativo (os termos “espaciais” dominam).
Estes últimos eventos são exatamente aqueles que, não podendo ser considerados como
ocorrendo no mesmo ponto do espaço por nenhum referencial inercial, podem contudo
ser considerados por um referencial inercial O00 como simultâneos com o evento A de
emissão do pulso. Portanto, existe comprimento próprio entre o evento A e qualquer
evento localizado no exterior espacial da superfı́cie esférica do pulso luminoso. Para o
próprio evento B, bem como para qualquer outro sobre a superfı́cie esférica do pulso
luminoso, não existem nem o tempo próprio nem o comprimento próprio até o evento
A.
Podemos verificar, desses resultados, que a noção invariante de existência seja de um
tempo próprio (caráter temporal) seja de um comprimento próprio (caráter espacial)
entre quaisquer eventos próximos A e B (não necessariamente aqueles mencionados
acima) encontra-se condicionada ao fato de resultar respectivamente positivo ou neg-
ativo o cálculo do lado esquerdo da Eq. (12.41) para esse par de eventos; a existência

432
de qualquer dessas duas grandezas será impossı́vel caso a Eq. (12.41) seja satisfeita
(sendo A e B eventos distintos). Define-se, assim, um intervalo de espaço-tempo
ds2AB (ou distância relativı́stica) entre A e B como sendo o escalar, invariante por
transformações de Lorentz entre referenciais inerciais (ver Exercı́cio 16), dado por13

ds2AB = (dx0AB )2 − [(dx1AB )2 + (dx2AB )2 + (dx3AB )2 ]. (12.42)

Para o caso ds2AB < 0, diz-se que esses eventos determinam entre si um intervalo tipo
espaço ds2AB = −(d`AB )2 onde d`AB é a distância própria entre A e B. Caso ds2AB = 0,
esses eventos determinam entre si um intervalo tipo luz (ou nulo), de modo que um
raio de luz viajando livremente no vácuo pode propagar-se entre A e B. Finalmente,
se ds2AB > 0, os eventos determinam entre si um intervalo tipo tempo ds2AB = c dτAB
onde dτAB é o tempo próprio entre A e B.

12.7.3 Diagramas de espaço-tempo

A fı́sica elementar nos mostra que uma boa ilustração pode conter uma grande quanti-
dade de informações. Adotaremos essa perspectiva geométrica no restante desta seção
para as investigações no âmbito relativı́stico. Tendo em vista a completa semelhança
fı́sica entre as coordenadas espaciais dos eventos, vamos freqüentemente restringir-
nos nesta seção ao estudo do espaço-tempo no setor bidimensional (t, x). Ou seja,
trataremos somente de casos em que y e z sejam constantes para todos os eventos en-
volvidos. Embora a construção dos diagramas de espaço-tempo discutidos nesta seção
poderia prescindir das noções genéricas de espaço-tempo apresentadas previamente, a
compreensão que esses diagramas proporcionam ao estudante seria consideravelmente
prejudicada.
Considere o problema do pulso luminoso esférico emitido a partir da origem do refer-
encial inercial O, apresentado na Sec. 12.7.2. Podemos representar a trajetória desse
pulso de luz num diagrama de espaço-tempo (x0 , x1 ). Nesta representação bidimen-
sional, os eventos sobre a história do pulso luminoso encontram-se sob as duas semi-
retas bissetrizes dos dois primeiros quadrantes desse diagrama. Seja A o evento na
origem do referencial O, e seja B um qualquer evento próximo de A tal que ds2AB é
do tipo tempo com dτAB > 0, de modo que B encontra-se no futuro de A. Então,
B localiza-se “entre” a cunha formada pelas duas semi-retas, conforme a Fig. 12.7
(a). Analogamente, seja C um evento próximo de B com ds2BC do tipo tempo com
dτBC > 0 (de modo que C encontra-se no futuro de B). Resulta que o evento C localiza-
se também entre aquela cunha, e encontra-se “visualmente” mais longe da origem A
do que o evento B. O evento C encontra-se, portanto, também no futuro14 de A. Este
13
A escolha do sinal global na Eq. (12.42) é arbitrária. Seja a escolha apresentada ou a sua oposta, o
intervalo ds2 pode apresentar qualquer sinal algébrico.
14
Note que o intervalo de tempo próprio dτAC em geral não corresponde à soma dτAB + dτBC , pois
esses três tempos próprios podem estar associados a três distintos referenciais inerciais.

433
Figura 12.7: Diagrama bidimensional (a) de espaço-tempo para o referencial O, que ilustra
a transitividade de intervalos tipo tempo e a falta de transitividade de intervalos tipo
espaço. Raios de luz no vácuo são representados por retas a 45o . Uma versão simplificada
(b) do diagrama tridimensional de espaço-tempo apresenta as regiões relativas ao evento
A e a história de um corpo material M .

raciocı́nio pode ser repetido indefinidamente, de modo que podemos concluir que toda
a região entre as cunhas pertence ao futuro do evento A. Uma construção inteiramente
análoga mostra que a “região” entre a cunha tracejada da Fig. 12.7 (a) (correspon-
dente ao prolongamento da trajetória do pulos luminoso para tempos anteriores à sua
produção) determina eventos no passado de A. Dado seu caráter geométrico, esses
dois setores desconexos do espaço-tempo são conhecidos como futuro invariante (ou
absoluto) e passado invariante (ou absoluto) do evento A. Um qualquer evento D
no contorno dessas regiões é caracterizado de modo invariante como estando sobre o
cone de luz do evento A. Um arbitrário evento E que não pertence nem ao futuro
invariante de A, nem ao seu passado invariante, e nem ao cone de luz desse evento,
é tal que pode ser considerado simultâneo ao evento A por algum referencial inercial
RE
O0 , de modo que o intervalo A ds2 entre os eventos A e E é do tipo espaço, qualquer
que seja a escolha dos eventos que compõe no espaço-tempo a “integral de trajetória”
de modo a formar um “caminho contı́nuo” que conecta os eventos A e B; embora o
valor dessa integral possa mudar, seu sinal algébrico não se altera. Geometricamente,
o evento E está exterior (isto é, “para fora”) ao cone de luz de A. A coleção de eventos
exteriores ao cone de luz de A caracteriza invariantemente o setor do espaço-tempo
denominado alhures (ou presente relativo) desse evento, ilustrado na Fig. 12.7 (b), e
compreende o conjunto de eventos que não apresentam conexão causal com o evento
A: não existe sinal que possa propagar-se entre A e algum desses eventos com veloci-
dade não superior à velocidade c da luz no vácuo; a seqüência temporal entre A e um
arbitrário (mas fixo) desses eventos alhures pode ser alterada perante uma mudança
de referencial inercial, conforme a análise da Sec. 12.4.4. Analogamente, seja F um

434
evento externo ao cone de luz de E, de modo que o intervalo entre E e F seja do tipo
espaço. Embora os intervalos entre A e E bem como entre E e F sejam ambos do tipo
espaço, o intervalo entre A e F não necessariamente será do tipo espaço, conforme
ilustrado na Fig. 12.7 (a). Em particular, podemos ter F = B se `AE > c τAB .

Temos que a história de um corpo material M é constituı́da pela coleção de eventos


que o localizam. Independentemente das leis que determinem a forma especı́fica de
movimento desse corpo, é necessário que, em cada instante ao longo de sua trajetória,
sua velocidade Newtoniana seja inferior à da luz no vácuo, conforme determinados (ins-
tante e velocidade) por um referencial inercial O. Pois, caso houvesse algum evento A
no qual a velocidade Newtoniana do corpo não fosse menor do que c, os eventos futuros
a A pela história de M infinitesimalmente próximos desse evento A seriam considerados
por O como alhures de A, de modo que haveria algum referencial inercial O0 que os
determinaria no passado de A. Essa inversão na seqüência temporal de eventos é
fisicamente irrelevante para eventos sem conexão causal, mas seria contraditória para
eventos que possam ser denominados causa e efeito. Portanto, a história de M pode
ser representada no espaço-tempo como uma curva contı́nua completamente contida
no interior do cone de luz de qualquer evento que a constitui, conforme ilustra a Fig.
12.7 (b).

Considere a representação num diagrama bidimensional de espaço-tempo, conforme


determinada por um referencial inercial O, dos eixos coordenados relativos às coor-
denadas (x0 0 , x0 1 ) adotadas por um referencial inercial O0 que se move com respeito
a O com velocidade adimensional β orientada no sentido positivo do eixo Ox1 , no
instante em que as origens dos dois referenciais coincidem. Note que o eixo O0 x0 0
corresponde aos eventos com coordenada x0 1 = 0, e o eixo O0 x0 1 àqueles com coor-
denada x0 0 = 0. Por meio das Eqs. (12.32) de Lorentz no espaço-tempo, temos que
x0 0 = 0 ⇔ x0 − βx1 = 0 e x0 1 = 0 ⇔ x1 − βx0 = 0, de modo que os eixos O0 x0 0
e O0 x0 1 são representados respectivamente pelas retas x1 = βx0 e x0 = βx1 . Na Fig.
12.8, ilustra-se como aparentam para O os eixos de tempo e espaço utilizados por O0
no instante de coincidência das origens, conforme a simultaneidade determinada por
O. Do ponto de vista de O, os eixos de O0 parecem não ser perpendiculares entre si,
mas cada um deles “apertado” na direção do outro: as componentes positivas desses
eixos apertados localizam eventos interiores ao primeiro quadrante no diagrama. Con-
sidere o ângulo ᾱ tal que tan ᾱ = β. O ângulo medido por O entre os eixos temporais
Ox0 e O0 x0 0 vale −ᾱ, enquanto que aquele entre os eixos espaciais Ox1 e O0 x0 1 vale
ᾱ, segundo a orientação convencional de ângulos positivos no sentido anti-horário.
Assim, a interpretação geométrica no espaço-tempo para a velocidade (adimensional)
Newtoniana é a medida do arco cuja tangente fornece a inclinação dos eixos adaptados
ao referencial que se move com essa velocidade.

As escalas de medida dos eixos nos dois referenciais podem ser determinadas por

435
Figura 12.8: Representação no espaço-tempo da lei de transformação de Lorentz das
coordenadas, onde o eixo vertical convencionalmente tem caráter temporal. Hipérboles da
forma (x0 )2 − (x1 )2 = a2 e (x1 )2 − (x0 )2 = b2 são invariantes.

métodos geométricos. Com efeito, das Eqs. (12.32), temos


(x0 0 )2 − (x0 1 )2 = γ 2 [(x0 − βx1 )2 − (x1 − βx0 )2 ] = γ 2 (1 − β 2 )[(x0 )2 − (x1 )2 ]
= (x0 )2 − (x1 )2 ,
de modo que hipérboles da forma (x0 )2 − (x1 )2 = a2 (cujas assı́ntotas são o cone
de luz da origem) são preservadas perante uma mudança de referenciais inerciais; e
resultam igualmente invariantes as hipérboles da forma (x1 )2 − (x0 )2 = b2 (com as
mesmas assı́ntotas), conforme ilustrado na Fig. 12.8. Com isto, a hipérbole invariante
(x0 )2 − (x1 )2 = 1 intercepta os eixos temporais Ox0 e O0 x0 0 respectivamente nos even-
tos (x0 , x1 ) = (±1, 0) e (x0 0 , x0 1 ) = (±1, 0). Analogamente, a hipérbole invariante
(x1 )2 −(x0 )2 = 1 intercepta os eixos espaciais Ox1 e O0 x0 1 respectivamente nos eventos
(x0 , x1 ) = (0, ±1) e (x0 0 , x0 1 ) = (0, ±1).
Graças à identidade trigonométrica hiperbólica cosh2 α − senh2 α = 1, a relação entre
as coordenadas dos referenciais O e O0 dada pelas Eqs. (12.33) pode ser expressa
matricialmente como
! ! !
x0 cosh α senh α x0 0
= , (12.43)
x1 senh α cosh α x0 1
onde fizemos cosh α = γ e senh α = γβ, donde obtemos tan ᾱ = β = tanh α, sendo
α um ângulo hiperbólico (isto é, um número real) determinado pela expressão α =
ln[γ(1 + β)] (ver Exercı́cio 18). Portanto, fixar um valor para β implica em fixar
um valor para α, e vice-versa. A tı́tulo de comparação com a representação acima,
podemos também representar matricialmente o efeito de uma rotação de eixos segundo
um ângulo θ na forma
! ! !
x2 cos θ −sen θ x0 2
= . (12.44)
x3 sen θ cos θ x0 3

436
Figura 12.9: Rotação elı́ptica (a) de eixos espaciais do espaço-tempo segundo um ângulo
θ, e rotação hiperbólica (b) de eixos temporal e espacial do espaço-tempo segundo um
ângulo α = tanh−1 β. A construção geométrica das coordenadas de espaço-tempo de um
ponto/evento P arbitrário é apresentada em ambos os casos.

Enquanto a Eq. (12.43) preserva hipérboles da forma (x0 )2 − (x1 )2 = ±a2 , temos
que a Eq. (12.44) preserva circunferências da forma (x2 )2 + (x3 )2 = +a2 . Da seme-
lhança formal entre as Eqs. (12.43) e (12.44), a lei de transformação de Lorentz é
também denominada rotação hiperbólica no espaço-tempo, ao passo que a rotação
usual é denominada rotação elı́ptica no espaço-tempo. O efeito de cada uma dessas
transformações encontra-se ilustrado na Fig. 12.9.

12.8 Cálculos simples em relatividade

Os resultados da Relatividade Especial foram, até agora, apresentados de uma forma


direta, e não foram aqui criticados, ainda que alguns deles sejam bastante estranhos
ao senso comum. Crı́ticas não faltam, contudo. Expõe-se, a seguir, duas dentre as
mais comuns. Em geral, o problema surge de utilizar-se uma intuição Newtoniana sem
atentar devidamente para o exato significado daquilo que é medido, ou por quem é
medido. Portanto, a solução de tais paradoxos aparentes consiste em geral numa clara
especificação dos eventos envolvidos, e em recusar-se a caracterizá-los em coordenadas
sem mencionar explicitamente com respeito a qual referencial inercial tais coorde-
nadas são escolhidas. A representação do problema em um diagrama de espaço-tempo
freqüentemente dirime todas as dificuldades conceituais a que o estudante pode ser
induzido na relatividade pelo uso da imprecisa linguagem quotidiana com que estamos
habituados [5].

437
12.8.1 Paradoxo dos gêmeos

Seguramente, o chamado paradoxo dos gêmeos é a mais difundida dessas crı́ticas [12,
13]. Considere dois irmãos gêmeos, denominados I e G (as iniciais de Irmãos Gêmeos),
e suponha que I seja um fı́sico e G um astronauta. No dia em que eles comemoram
seu trigésimo aniversário, G embarca numa espaçonave e viaja em direção a uma
Estrela fixa a 20 anos-luz de distância,15 movendo-se relativamente à Terra a 80% da
velocidade c da luz no vácuo. Ao atingir a referida Estrela, passados 25 anos de seu
embarque segundo os cálculos de I (pois 20/0, 8 = 25), o astronauta G é acometido de
súbita melancolia, e decide voltar imediatamente a seu planeta natal, desenvolvendo
no retorno a mesma velocidade com que percorreu a primeira parte de sua jornada.
Tendo G enviado para a Terra por rádio sua decisão, seu irmão pode prever que o
percurso total levará 50 anos, de modo que I contará com a avançada idade de 80 anos
até que possa rever seu irmão novamente. Contudo, por seus estudos de relatividade,
I estima que o tempo passe mais lentamente na espaçonave, seja na ida quanto no
retorno, segundo um fator de Lorentz γ = [1 − (0, 8)2 ]−1/2 = 5/3. Assim sendo, o
tempo total de viagem de G medido por ele próprio deverá ser de apenas 30 anos
(50 · 3/5 = 30), de modo que G deve contar com 60 anos no momento do re-encontro.
Portanto, I estará 20 anos mais velho que seu irmão gêmeo G ao revê-lo na Terra.

Até aqui, trata-se apenas de mais uma das “esquisitices” da relatividade. Con-
tudo, para ser astronauta, G também precisou estudar alguns elementos dessa teoria
(ainda que contra sua própria vontade). Sendo constante a velocidade relativa entre a
espaçonave e a Terra, seja na ida quanto no retorno, a simetria da cinemática confere
a G o direito de fazer uso de um raciocı́nio similar. Do ponto de vista de G, foi seu
irmão I quem “viajou para trás” e retornou depois. Portanto, G pode calcular para si
mesmo a idade de 80 anos e para seu irmão I a idade de 60 anos, de modo que I será
20 anos mais jovem do que G ao se re-encontrarem na Terra.

Embora possam estar ambos errados, não resta dúvida que os cálculos de I e de G
não podem ser ambos corretos: estando ambos frente a frente, a diferença de idade
entre I e G não pode ser 20 anos para mais e para menos. A lógica elementar parece
depor contra a relatividade, segundo o paradoxal argumento exposto acima.

A solução do paradoxo poderia ser obtida pelo “argumento de autoridade”: sendo I


um fı́sico, ele deve saber mais sobre fı́sica do que seu irmão G, de modo que I será o
gêmeo mais velho quando ambos se re-encontrarem. Mas esta forma de argumentação
não deve satisfazer o estudante (ou, pelo menos, não deveria). Passemos, portanto,
para uma linha de raciocı́nio mais convincente, baseada em argumentos de caráter
demonstrativo que estejam mais em acordo com o espı́rito investigativo tı́pico do
estudante.
15
Ano-luz é definido como a distância percorrida por um raio de luz que viaja no vácuo pelo perı́odo
de um ano terrestre (cerca de 3, 156 · 107 segundos), e vale cerca de 9, 459 · 1015 metros.

438
Note que G sofre uma aceleração infinita ao inverter o sentido de velocidade de sua
espaçonave, enquanto que I é um observador inercial durante toda a viagem (note que
o problema proposto é acadêmico, ignorando os movimentos não inerciais do planeta).
Assim sendo, os dois observadores não são fisicamente equivalentes, de modo que a
descrição dos fenômenos caracterizados por eles não precisaria ser simétrica. Com isto,
a lógica elementar não depõe contra a relatividade, tal como parecia fazê-lo à primeira
vista: embora seja estranha ao senso comum, uma diferença de idades resultante não
contradiz a si mesma. Mas qual dentre os dois irmãos gêmeos resulta, após decorrida
a viagem, ser “primogênito a posteriori”?

Sejam os eventos A “posição e instante em que I e G se separam”, B “posição e


instante em que G e a estrela se encontram”, e C “posição e instante em que I e G
se re-encontram”. Seja O um referencial inercial fixo à Terra cujo eixo coordenado
Ox aponta diretamente para a referida estrela. Seja O0 um referencial inercial que se
move com respeito a O com a mesma velocidade βO0 = 0, 8 da espaçonave no trajeto
AB, e seja O00 um referencial inercial que se move com respeito a O com a mesma
velocidade βO00 = −0, 8 da espaçonave no trajeto BC, sendo ambos os eixos espaciais
O0 x0 e O00 x00 orientados na mesma direção do eixo O. Temos γO0 = γO00 = 5/3 = γO .
Por simplicidade, adotaremos as escalas de medida de tempo em anos terrestres, e de
distância em anos-luz; e também adotaremos a coincidência das origens de todos os
referenciais.

Com respeito ao referencial O, o observador G é co-móvel com o referencial O0 no


trajeto AB, e é co-móvel com o referencial O00 no trajeto BC. O referencial O de-
termina o evento A com coordenadas (tA , xA ) = (0, 0). Estando a Terra e a Estrela
em repouso, o observador I na Terra determina a distância própria `T E = 20 entre a
Terra e a Estrela, de modo que xB = 20. Como o observador G efetua o deslocamento
xAB = 20 com velocidade βO0 = 0, 8, o tempo de percurso neste deslocamento será
tAB = xAB /βO0 = 25, de modo que o evento B tem coordenadas (tB , xB ) = (25, 20).
Analogamente, I percorre o deslocamento xBC = −20 com velocidade βO00 = −0, 8, de
modo que o evento C apresenta coordenadas (tC , xC ) = (50, 0). Tendo permanecido
em repouso ao longo de todo o experimento, o observador I determina o tempo próprio
τAC = 50 de duração da viagem de G.

Com respeito ao referencial O0 , o evento A tem coordenadas (t0A , x0A ) = (0, 0). Tendo
permanecido em repouso (neste perı́odo), o observador G determina o tempo próprio
τAB para o deslocamento da Estrela até a espaçonave. Da lei de Lorentz, temos τAB =
tAB /γO = 15, de modo que o evento B tem coordenadas (t0B , x0B ) = (15, 0). Como o
observador I mede o tempo próprio τAC = 50, temos t0C = γO τAC = 250/3. Visto que
o observador I se move com velocidade βO = −βO0 = −0, 8, temos x0AC = βO t0AC =
−200/3, de modo que o evento C tem coordenadas (t0C , x0C ) = (250/3, −200/3).

Com respeito ao referencial O00 , o evento A tem coordenadas (t00A , x00A ) = (0, 0). Como
o observador I mede o tempo próprio τAC = 50, a lei de Lorentz fornece t00C = γO τAC =

439
250/3. Visto que I se move com velocidade β̄O = 0, 8, temos x00AC = β̄O t00AC = 200/3,
de modo que o evento C se expressa em coordenadas por (t00C , x00C ) = (250/3, 200/3).
Como o observador G mede o tempo próprio τBC , temos τBC = tBC /γO = 15, de modo
que t00B = t00C − τBC = 205/3. Visto que I mede a distância própria `T E entre a Terra
e a Estrela, temos x00AB = `T E /γO = 12, de modo que o evento B tem coordenadas
(t00B , x00B ) = (205/3, 12).

Enquanto a viagem do observador G leva o tempo próprio τAC = 50, a viagem do


observador I leva o tempo próprio τAB + τBC = 30. Desta forma, no evento C de
re-encontro dos irmãos gêmeos, I terá 80 anos de idade, enquanto G terá 60 anos de
idade. Os cálculos de I estavam corretos, enquanto que G cometeu um equı́voco (pos-
sivelmente causado por ter estudado relatividade contra sua vontade) ao subestimar
a importância da necessária troca de referencial inercial no evento B, ocasionada pela
sua própria aceleração (infinita) nesse evento. O resultado enunciado pelo argumento
de autoridade é verdadeiro, mas agora temos uma boa justificativa para afirmá-lo.

Figura 12.10: Diagrama de espaço-tempo para o paradoxo dos gêmeos na forma qualitativa
(eixos representados fora de escala). O intervalo τEF determina a diferença de idades, a
menos do fator multiplicativo relativı́stico γ/(1 + γ).

O diagrama de espaço-tempo determinado pelo referencial O, ilustrado de forma


qualitativa na Fig. 12.10, apresenta uma justificativa geométrica para a diferença
de idades acima. Em termos dos eventos E “posição de I simultânea para O0 ao
evento B”, e F “posição de I simultânea para O00 ao evento B”, podemos verificar
que a simetria cinemática clamada por G fornece as igualdades τAC = γ(τAB + τBC )
e (τAB + τBC ) = γ(τAE + τF C ) = γ(τAC − τEF ) (movimento relativo com velocidade
β = 0, 8), de modo que temos

∆τ = τAC − (τAB + τBC ) = γ[(τAB + τBC − (τAC − τEF )] = γ(τEF − ∆τ ),

440
donde ∆τ = [γ/(1 + γ)]τEF . Em números, obtemos τAE = 9 = τF C e τEF = 32, donde
a diferença de idade resultante ao final da viagem de ida e retorno de G (pois foi G
quem sofreu aceleração no evento B) consiste em ∆τ = 20 anos.
O exemplo idealizado acima corresponde a uma simplificação nos cálculos advinda da
aceleração infinita de G no evento B, o que ocasiona-lhe a “perda” do tempo próprio
τEF . Em uma situação mais realista, G sofreria uma aceleração elevada (porém finita)
durante um certo tempo no entorno do evento B, o que ocasionaria uma rápida (porém
contı́nua) passagem daquele tempo se comparada ao curto intervalo de tempo próprio
de duração de sua aceleração.

12.8.2 Paradoxo da garagem

Menos popular do que o paradoxo dos gêmeos, a variação dos comprimentos com
respeito ao estado de movimento, que origina o problema da garagem, será analisada
de forma substancialmente mais suscinta.
Considere um milionário M , que enriqueceu após ter estudado a Relatividade Especial.
O milionário M possui uma grande mansão, com uma garagem bastante ampla. Ele
adquiriu a poucos instantes um carro novo de altı́ssima performance, mas tão longo
que seu comprimento Lo ultrapassa a extensão d da garagem. Ao verificar que seu
exagero causou-lhe um inconveniente, M lembra-se de seus antigos estudos, e percebe
que pode utilizar a contração relativı́stica de comprimentos em seu favor. Ele pede à
sua esposa E, excelente motorista, para dirigir seu carro novo em direção à garagem,
de modo que o velocı́metro acuse o valor v, e freá-lo bruscamente imediatamente antes
da colisão com o fundo dessa. A novı́ssima performance de seu carro lhe confere, além
de alta velocidade, a possibilidade de parar instantaneamente. Com respeito a M , que
permanece à entrada da garagem, o carro apresenta um comprimento reduzido L =
Lo /γv < d (para a velocidade v escolhida), de modo que M pretente fechar o portão
de ingresso da garagem imediatamente após o carro encontrar-se completamente no
interior desta. Sendo freado subitamente após isto, o carro não poderia “expandir-
se” ao seu comprimento natural Lo , pois estaria limitado pela garagem em seus dois
extremos: estando ambos em repouso relativo, o carro e a garagem não poderão colidir
— o carro deverá permanecer “encolhido”.
Nova “esquisitice”, mas pode piorar. Pois, tendo desconfiado da longa demora nas
reuniões de trabalho de seu marido, E revirou os pertences deste, tendo encontrado
alguns textos universitários que lhe explicaram fisicamente o fenômeno de dilatação
do tempo. Ficando muito impressionada com esta justificativa, E dedicou-se a ler o
restante, e também aprendeu algo a respeito do fenômeno de contração do compri-
mento. Assim, enquanto dirigia o novo carro de seu marido, E fez algumas contas de
cabeça. Do ponto de vista de E, a situação é completamente simétrica: é a garagem
que se move com velocidade −v, de modo que é esta que apresenta um comprimento

441
reduzido d/γv . Assim, E julga que o problema do estacionamento do carro novo é
ainda mais difı́cil devido à relatividade.
Claro está, a razão
comprimento do carro
comprimento da garagem
não pode aumentar e diminuir devido ao movimento relativo entre ambos. Eis que,
novamente, encontramos um paradoxo.
A solução para o impasse apresentado acima decorre, tal como no caso do paradoxo dos
gêmeos, de um maior cuidado com o uso da linguagem. E, talvez não por coincidência,
também aqui é a relatividade da simultaneidade a causa dos mal-entendidos. Sejam os
referenciais inerciais O que determina M em repouso, e O0 que se move com velocidade
Newtoniana β = v/c com respeito a O no sentido positivo do eixo Ox. Seja o evento
A “posição e instante em que a extremidade dianteira do carro e a parede da garagem
se encontram”.
Omitindo a discussão algébrica de todos os eventos relevantes à solução desse pro-
blema, passemos diretamente para a sua formulação geométrica no espaço-tempo,
ilustrada na Fig. 12.11. Conforme o acordo proposto, E freia o carro no evento A. Da
invariância das hipérboles, obtemos que os eventos A e B apresentam coordenadas
espaciais xB = L = γv Lo e x0A = L numericamente iguais x0A = xB ; analogamente,
temos x0D = Lo = xC . Como L < Lo , a extremidade posterior do carro encontra-se
no evento F no instante do evento A, conforme a simultaneidade de O0 . Do ponto de
vista de O, os eventos A e F não são simultâneos: apesar de M ter solicitado que E
freasse (todo) o carro apenas para evitar a colisão, parece-lhe que sua esposa se recusa
a fazê-lo, utilizando-se dos freios traseiros bem antes do momento em que seu marido
julga necessário fazê-lo.

Do ponto de vista do observador M , o carro não se comporta como um corpo rı́gido


tal como se poderia imaginar à primeira vista, mas “estica-se” enquanto é freado
gradativamente desde sua extremidade posterior até a anterior. Este fato também
ilustra um resultado genérico, que poderia ser obtido diretamente do princı́pio fı́sico
de causalidade: a Relatividade Especial é incompatı́vel com a noção clássica
de corpo rı́gido, visto que este último poderia propagar informações com velocidade
virtualmente infinita.
Assim, a engenhosa solução proposta por M para estacionar seu carro novo não fun-
ciona, devido a um problema de comunicação com sua esposa E: enquanto esta
encontra-se em movimento ao volante, a noção de simultaneidade não é partilhada
pelo casal. Também este é um paradoxo aparente. Os cálculos de ambos os cônjuges
estava errado (talvez por estarem mais habituados a cifras monetárias do que rela-
tivı́sticas). A situação fı́sica invariante é que aquele carro definitivamente não cabe
naquela garagem.

442
Figura 12.11: Diagrama de espaço-tempo para o paradoxo da garagem. A linha vertical
representa a história da parede. Arcos das hipérboles invariantes que contém os eventos
A e C também estão ilustrados.

12.9 Formalismo tensorial

Apresenta-se nesta seção uma linguagem adequada à representação de quaisquer pro-


blemas de natureza vetorial, ainda que sua aplicação seja aqui discutida somente para
dois tipos de vetores: os vetores tridimensionais espaciais usualmente manipulados nos
cursos elementares de fı́sica, e os vetores quadridimensionais do espaço-tempo apresen-
tados na Sec. 12.7. Trata-se do formalismo tensorial [11], inicialmente identificado com
notação de ı́ndices.16 Esta linguagem baseia-se nas leis da álgebra matricial, e atende
ao mesmo propósito das matrizes e dos vetores: representar de forma compacta uma
coleção de quantidades.

12.9.1 Rotações espaciais

Utilizando a mesma notação (x1 , x2 , x3 ) ≡ (x, y, z) introduzida na Sec. 12.7, podemos


escrever a relação inversa da Eq. (12.44) de rotação no plano yz segundo um ângulo
θ na forma matricial tridimensional
    
x0 1 1 0 0 x1
 02  
 x = 0 cos θ sen θ   x2  .
 

x0 3 0 −sen θ cos θ x3

16
O estudante atento à nomenclatura observará, no estudo da Relatividade Geral (Cap. 1), que a
notação de ı́ndices se aplica com igual propriedade também para grandezas não tensoriais. A noção
precisa de tensor será formalizada na Sec. 12.9.2.

443
Da mesma forma, uma rotação no plano xy segundo um ângulo ϕ e uma rotação no
plano xz segundo um ângulo ϑ têm a forma
    
x0 1 cos ϕ sen ϕ 0 x1
 02  
 x  =  −sen ϕ cos ϕ 0   x2 
 

x0 3 0 0 1 x3
    
x0 1 cos ϑ 0 sen ϑ x1
 02  
 x = 0 1 0   x2  .
 

x0 3 −sen ϑ 0 cos ϑ x3

Denominando temporariamente por Rθ , Rϕ , e Rϑ as três matrizes quadradas que figu-


ram nas três equações matriciais acima, observa-se que cada uma dessas três matrizes
apresenta determinante unitário: det Rθ = det Rϕ = det Rϑ = 1. Além disso, cada
uma dessas matrizes admite uma matriz inversa do mesmo tipo, correspondente ao
negativo do ângulo de rotação original, e que resulta ser igual à matriz transposta da
matriz original, donde são ditas ortogonais. Uma rotação genérica no espaço tridimen-
sional (x1 , x2 , x3 ) pode ser representada pela multiplicação das matrizes de rotação
elementares Rθ , Rϕ , e Rϑ que figuram nas três equações matriciais acima. A ordem
com que as matrizes se encontrem multiplicadas é relevante, visto que essas matrizes
não comutam entre si no caso geral. Além disso, observa-se que tal multiplicação re-
presenta a sucessão de três rotações, de modo que o eixo fixo da segunda pode estar
alterado pela ação da primeira (os eixos dessas três rotações não coincidem com os
eixos cartesianos originais, no caso geral). Sem entrar nos detalhes desse estudo, pode-
mos afirmar genericamente que uma rotação em torno de um qualquer eixo que passa
pela origem pode ser expressa na forma
   
x0 1 x1
 02 
 x  = R  x2  , (12.45)
 

x0 3 x3

em termos de uma única matriz de rotação ortogonal R = R(θ, ϕ, ϑ) com determi-


nante unitário, det R = 1, e com inversa dada pela matriz transposta R̄. O conjunto de
todas as rotações espaciais constitui o Grupo de Rotações (ou Grupo Ortogonal),
caracterizado por 3 parâmetros independentes (os 3 ângulos θ, ϕ, ϑ acima). Geometri-
camente, dois desses ângulos especificam a direção do eixo de rotação, enquanto que
o ângulo remanescente determina a extensão do giro em torno desse eixo.
A transformação de rotação descrita pela Eq. (12.45) preserva esferas de raio r ar-
bitrário centradas na origem,

(x1 )2 + (x2 )2 + (x3 )2 = r2 = (x0 1 )2 + (x0 2 )2 + (x0 3 )2 .

Uma equação matricial é dita verdadeira exatamente quando forem iguais as compo-
nentes correspondentes das matrizes equacionadas, de modo que podemos escrever a

444
Eq. (12.45) em suas componentes na forma
3
X
x 0 i = R i 1 x1 + R i 2 x2 + R i 3 x3 = R i j xj , (12.46)
j=1

para cada valor de i = 1, 2, 3, em termos da notação de somatório ( ). Aqui, Ri j


P

representa o elemento de matriz na i-ésima linha e na j-ésima coluna da matriz R,


enquanto que xj representa o elemento de matriz na j-ésima linha da matriz-coluna
x (e analogamente para o elemento x0 i da matriz-coluna x0 ). Observe que a operação
designada pelo sı́mbolo de somatório corresponde à soma de monômios onde o ı́ndice
de soma (j) figura exatamente duas vezes, uma vez como ı́ndice superescrito (em
xj ) e outra como ı́ndice subescrito (em Ri j ). Além disso, o ı́ndice livre (ou seja,
que não encontra-se somado nessa operação) aparece igualmente em cada termo da
equação, conferindo-lhe o caráter vetorial desejado; por não estar somado, o ı́ndice
i da Eq. (12.46) pode assumir qualquer valor dentre as possibilidades i = 1, i = 2,
e i = 3, fornecendo em cada caso uma equação numérica. Quanto às esferas que a
transformação dada pela Eq. (12.46) preserva, podemos escrevê-las de acordo com as
observações acima na forma 3i=1 3j=1 Iij xi xj = r2 , onde
P P

 
1 0 0
I= 0 1 0 
 

0 0 1

é a matriz identidade (Iij = 1 se i = j, e Iij = 0 se i 6= j). Note que a representação


mais simples 3i=1 xi xi = r2 não é conveniente, pois o ı́ndice de soma i no monômio
P

xi xi figura duas vezes na forma superescrita.


É fácil perceber que, para expressões com uma complexidade algébrica maior, a con-
strução acima nos conduz à manipulação de um número considerável de sı́mbolos
de somatório. Porém, se tomarmos o cuidado de que sejam satisfeitas ambas as ob-
servações acima por toda expressão que escrevermos, podemos simplificar-lhes a escrita
por meio da omissão dos sı́mbolos de somatório onde quer que apareçam. Com isto, a
Eq. (12.46) pode ser escrita na forma definitiva

x0 i = R i j xj , (12.47)

onde a mera repetição do ı́ndice j em alturas diferentes (uma vez subescrito e outra
vez superescrito) no monômio Ri j xj determina implicitamente sua soma sobre todas
as possibilidades de valores desse ı́ndice. Esta notação de ı́ndices é conhecida como
notação tensorial, e a convenção de omissão dos sı́mbolos de somatório é conhecida
por convenção de soma implı́cita de Einstein.
Em termos dessa notação, podemos escrever a forma recı́proca da Eq. (12.47) como
xi = R̄i j x0 j (soma implı́cita no ı́ndice j), onde R̄ é a matriz inversa da matriz R. Isto é,
o produto matricial de R e R̄ em ambas as ordens possı́veis fornece a matriz identidade

445
I (I i k = 1 se i = k, e I i k = 0 se i 6= k) representada acima: Ri j R̄j k = I i k = R̄i j Rj k .
Do ponto de vista geométrico, R̄ representa a rotação inversa àquela representada por
R.
Para uma transformação de coordenadas dada pela Eq. (12.47), temos que ∂x0 i /∂xj =
Ri j , de modo que a matriz de rotação R pode ser interpretada como a matriz Jaco-
biana da transformação de coordenadas. Analogamente, temos a relação recı́proca
R̄i j = ∂xi /∂x0 j . Da regra da cadeia, e fazendo uso da convenção de Einstein, temos
que as derivadas parciais com respeito às coordenadas x0 são dadas por ∂/∂x0 j =
R̄i j (∂/∂xi ) em termos das derivadas parciais com respeito às coordenadas x, por uma
regra distinta daquela da Eq. (12.47): além de fazer uso de matrizes inversas entre
si, o ı́ndice livre (não somado) encontra-se em posições diferentes em cada caso, ora
subescrito ora superescrito.
Por meio da convenção de Einstein, as esferas invariantes do problema acima podem
ser escritas na forma Iij xi xj = r2 . Como outro exemplo, na álgebra matricial obtém-
se [14] a identidade det A = [(Tr A)3 − 3(Tr A) Tr (A2 ) + 2 Tr (A3 )]/6, válida para
qualquer matriz A de ordem 3 × 3, onde o traço Tr A de uma matriz A é definido
como sendo igual à soma de suas componentes diagonais. Em termos da convenção de
Einstein, temos Tr A = Ai i . Com isto, essa convenção permite expressar a condição
de determinante unitário da matriz de rotação R na forma

(Ri i )3 − 3Ri i Rj k Rk j + 2Ri j Rj k Rk i = 6.

Observa-se, nesta expressão, o uso de diversos ı́ndices com soma implı́cita. O uso do
mesmo nome i para o ı́ndice de soma no monômio (Ri i )3 e no monômio −3Ri i Rj k Rk j
não significa qualquer correlação entre eles, mas reflete apenas uma economia no
número de sı́mbolos envolvidos.
O estudante deve atentar para o fato de não ser válido “isolar” um fator que apresenta
um ı́ndice somado numa equação que seja escrita segundo a convenção de Einstein.
Assim, por exemplo, sendo válida a equação Iij xi xj = 3 (cujo significado fı́sico é irre-
levante para o argumento), seria completamente errado daı́ obter que Iij = 3/(xi xj ),
tal como de A~·B~ = 5 seria errado obter que A ~ = 5/B. ~

12.9.2 Grupo de Lorentz-Poincaré

Consideremos a relação inversa da Eq. (12.43) escrita matricialmente levando em con-


sideração todas as dimensões espaciais (além da dimensão temporal), na forma

x0 0 x0
    
γ −γβ 0 0
 x0 1   −γβ γ 0 0   x1 
= , (12.48)
     
x0 2 x2
  
   0 0 1 0   
x0 3 0 0 0 1 x3

446
onde a matriz quadrada de ordem 4 × 4 acima é a mesma que tı́nhamos encontrado
na Eq. (12.35). Por seu uso freqüente na relatividade, esta matriz (e qualquer outra
dela obtida por uma rotação de eixos espaciais, multiplicando-a convenientemente
por versões quadridimensionais de espaço-tempo das matrizes R da Sec. 12.9.1) é
re-denominada pelo sı́mbolo Λ e referida como matriz de Lorentz. Não seria muito
apropriado utilizar-se da nomenclatura Λi j para designar as componentes dessa matriz,
pois a notação de ı́ndices estabelecida na Sec. 12.9.1 nos induziria a pensar que trata-
se de uma matriz espacial 3 × 3. Introduz-se, assim, uma nova categoria de ı́ndices,
designados por letras gregas minúsculas (α, β, γ, etc), para designar as componentes de
matrizes quadridimensionais no espaço-tempo. Mais explicitamente, as possibilidades
de valores para um ı́ndice α são: α = 0, α = 1, α = 2, e α = 3. Com esta convenção, a
matriz de Lorentz Λ tem componentes Λα β . As coordenadas do espaço-tempo, reunidas
na forma da matriz-coluna da Eq. (12.48), são analogamente designadas pelo sı́mbolo
x, cujas componentes xα são precisamente essas coordenadas.
Podemos escrever a Eq. (12.48) de Lorentz na linguagem tensorial, na forma x0 α =
P3 α β
β=0 Λ β x . Porém, usando a convenção de Einstein (agora para ı́ndices quadridi-
mensionais de espaço-tempo), essa equação toma sua forma definitiva x0 α = Λα β xβ .
Neste momento, é interessante recuperar as constantes aditivas que figuram nas ex-
pressões originais da lei de Lorentz, Eqs. (12.12) da Sec. 12.4.5. Definindo o conjunto
quadridimensional de constantes z 0 = c to , z 1 = xo , z 2 = yo , e z 3 = zo , a lei de trans-
formação de coordenadas de Lorentz no espaço-tempo assume a forma de Poincaré

x0 α = Λα β xβ + z α . (12.49)

A matriz de Lorentz Λ resulta ser a matriz Jacobiana dessa transformação,


∂x0 α
Λα β = , (12.50)
∂xβ
conforme já havı́amos determinado na Eq. (12.35). Observa-se que a Eq. (12.50) é
válida mesmo no caso da transformação generalizada de Poincaré. Consideremos a
transformação inversa de Poincaré, xα = Λ̄α β x0 β − Λ̄α β z β , onde Λ̄α β é a matriz inversa
quadridimensional da matriz Λα β (isto é, Λα β Λ̄β γ = I α γ = Λ̄α β Λβ γ , onde I α γ = 1
se α = γ e I α γ = 0 se α 6= γ). Com isto, obtemos Λ̄α β = ∂xα /∂x0 β , de modo que
a lei de transformação para as derivadas parciais com respeito às coordenadas de
espaço-tempo, dada pela regra da cadeia, toma a forma
∂ ∂
0 β
= Λ̄α β α , (12.51)
∂x ∂x
à semelhança do resultado tridimensional obtido na Sec. 12.9.1. Observa-se, ainda,
que Λ̄σ τ (β~ ) = Λσ τ (−β~ ), onde β~ representa uma velocidade Newtoniana entre dois
referenciais inerciais cujas coordenadas se relacionam segundo a Eq. (12.49).
Na forma simétrica dada pela Eq. (12.48), a matriz de Lorentz Λ representa uma
rotação hiperbólica no plano x0 x1 (conforme a Sec. 12.7.3), e temos que det Λ = 1.

447
Fazendo β = 0 na Eq. (12.48) e transformando as coordenadas espaciais por uma
rotação de eixos, conforme a Sec. 12.9.1, a matriz de Lorentz resultante representa
uma rotação elı́ptica, e temos det Λ = 1 (conforme a Sec. 12.9.1). Neste caso, a matriz
de Lorentz torna-se uma forma quadridimensional da matriz R de rotação espacial. No
caso geral, a matriz Λ pode representar uma rotação genérica no espaço-tempo, seja do
tipo hiperbólico (matriz simétrica) ou elı́ptico (matriz ortogonal), ou de ambos os tipos.
O determinante da matriz de Lorentz é unitário em qualquer caso, det Λ = 1. Com isto,
temos que a matriz Λ (com 16 componentes) apresenta 6 componentes independentes,
determinadas pelos 3 ângulos elı́pticos (medidos nos planos x1 x2 , x1 x3 , e x2 x3 ) e
pelos 3 ângulos hiperbólicos (medidos nos planos x0 x1 , x0 x2 , e x0 x3 ). Desta forma, o
chamado Grupo de Lorentz é caracterizado por 6 parâmetros independentes.
Se aliarmos ao Grupo de Lorentz a matriz-coluna z α da Eq. (12.49), obtemos o
chamado Grupo de Poincaré, caracterizado por 10 parâmetros independentes. En-
quanto o Grupo de Lorentz descreve rotações arbitrárias no espaço-tempo, preser-
vando as seções hiperbólicas (x0 )2 − [(x1 )2 + (x2 )2 + (x3 )2 ] = constante, o Grupo
de Poincaré descreve transformações lineares arbitrárias (translações e rotações) no
espaço-tempo, preservando as seções hiperbólicas entre eventos A e B da forma
(x0B − x0A )2 − [(x1B − x1A )2 + (x2B − x2A )2 + (x3B − x3A )2 ] = constante.
Observamos também que a lei de transformação para a velocidade relativı́stica, con-
forme as Eqs. (12.36), pode ser escrita na forma

v 0 α = Λα β v β , (12.52)

e aquela correspondente à aceleração relativı́stica, conforme as Eqs. (12.38), na forma


a0 α = Λα β aβ . Verifica-se, formalmente que, à semelhança do caso das rotações tridi-
mensionais, as leis de transformação dadas pelas Eqs. (12.51) e (12.52) são distintas:
para a última destas relações o ı́ndice livre (isto é, não somado) é o ı́ndice superescrito
da matriz Λ, enquanto que para a primeira é o ı́ndice subescrito da matriz inversa
Λ̄. Com isto, definimos dois tipos de tensores no espaço-tempo: temos vetores con-
travariantes, Y α , cuja lei de transformação assemelha-se à das velocidades

Y 0 α = Λα β Y β , (12.53)

e vetores covariantes, Zβ , cuja lei de transformação assemelha-se à dos gradientes

Zβ0 = Λ̄α β Zα , (12.54)

perante uma mudança de referenciais de Poincaré dada pela Eq. (12.49). Devido à ho-
mogeneidade dos ı́ndices livres que figuram nas equações tensoriais, decorre que vetores
contravariantes apresentam um ı́ndice livre superescrito, enquanto que vetores covari-
antes apresentam um ı́ndice livre subescrito. Em conseqüência, também denominam-se
contravariantes os ı́ndices superescritos, e covariantes os ı́ndices subescritos, em uma
equação tensorial.

448
Resulta da definição acima que a diferença entre as coordenadas de espaço-tempo de
dois eventos (para evitar as constantes aditivas da tranformação de coordenadas de
Poincaré) constituem um vetor contravariante, bem como são vetores contravariantes
as versões relativı́sticas da velocidade e da aceleração; enquanto que as derivadas
parciais com respeito às coordenadas do espaço-tempo constituem um vetor covariante.

Seja o produto direto P das componentes de dois vetores, P α β = X α Yβ . Como esta


equação apresenta dois ı́ndices livres, o resultado desse produto é uma matriz quadridi-
mensional no espaço-tempo. Perante uma mudança de coordenadas de Poincaré, Eq.
(12.49), a matriz P transforma-se como P 0 α β = Λα σ Λ̄τ β P σ τ . Assim, as componentes
da matriz P 0 relacionam-se às componentes da matriz P perante o produto matri-
cial com as matrizes Λ e Λ̄ de Lorentz, segundo uma lei contravariante e covariante.
Portanto, podemos generalizar a idéia de vetor no espaço-tempo para o noção de um
tensor de segunda ordem, cujos ı́ndices podem apresentar a posição covariante (Pαβ ),
contravariante (P αβ ), ou ambas (P α β ou Pα β ), conforme as três possı́veis leis de trans-
formação de suas componentes (tais que envolvem somente o produto matricial com
Λ e Λ̄) perante uma mudança de coordenadas de Poincaré.

Este raciocı́nio pode ser estendido para produtos diretos de mais do que dois vetores,
dando lugar a grandezas abstratas que necessitam de mais ı́ndices para especificar uma
de suas componentes. Este resultado nos permite definir, em definitiva, um tensor no
espaço-tempo como sendo um objeto Z com m ı́ndices contravariantes α1 , α2 , . . . , αm
e n ı́ndices covariantes β1 , β2 , . . . , βn , de modo que suas componentes se relacionam
por

Z 0 α1 α2 ...αm β1 β2 ...βn = (Λα1 σ1 Λα2 σ2 · · · Λαm σm )(Λ̄τ1 β1 Λ̄τ2 β2 · · · Λ̄τn βn )Z σ1 σ2 ...σm τ1 τ2 ...τn ,
(12.55)
perante uma mudança de coordenadas dada pela Eq. (12.49). Este tensor é dito de
ordem (m, n), ou m vezes contravariante e n vezes covariante. Quando a diferença
entre o caráter de contravariância e de covariância não for importante para o contexto,
o tensor Z acima é dito de ordem m + n. Assim, por exemplo, dirı́amos que o tensor
P construı́do explicitamente acima apresenta ordem (1, 1), ou simplesmente que é um
tensor de ordem 2. Em particular, as matrizes de Lorentz Λ e Λ̄ são, ambas, tensores
de ordem (1, 1). Tensores de ordem superior a 2 não são freqüentes na Relatividade
Especial, mas um tensor de ordem (1, 3) é fundamental na descrição geométrica da
interação gravitacional pela Teoria da Relatividade Geral (o tensor de curvatura de
Riemann, conforme o Cap. 1).

A estrutura fundamental do espaço-tempo de Minkowski, apresentado na Sec. 12.7.2,


pode ser expressa de forma simples em termos da noção de tensor no espaço-tempo.
Considere o tensor g de ordem (0, 2), dado em coordenadas (x0 , x1 , x2 , x3 ) de um

449
referencial inercial por
 
1 0 0 0
 0 −1 0 0 
gµν =  . (12.56)
 
 0 0 −1 0 
0 0 0 −1
Com o auxı́lio do tensor g, o intervalo invariante ds2AB entre dois eventos A e B —
dado pela Eq. (12.42) da Sec. 12.7.2 — pode ser expresso na forma

ds2AB = gµν dxµAB dxνAB , (12.57)

ou meramente ds2 = gµν dxµ dxν . O caráter de invariância do intervalo ds2 decorre
imediatamente da forma como a Eq. (12.57) foi escrita, pois corresponde a uma con-
tração (soma implı́cita de Einstein) do tensor g de ordem (0, 2) com dois tensores dx
de ordem (1, 0), de modo que não resta nunhum ı́ndice livre nesta relação. O tensor g
da Eq. (12.56) é denominado “tensor métrico”, ou métrica, do espaço-tempo, pois es-
tabelece uma generalização ao espaço-tempo do Teorema de Pitágoras ds2 = Iij dxi dxj
tridimensional. Esta última observação mostra que a própria noção de tensor definida
acima também admite uma generalização. Com efeito, os tensores caracterizados pela
Eq. (12.55) fazem explı́cita menção à lei de Lorentz (ou de Poincaré) de transformação
de coordenadas do espaço-tempo. Poderı́amos, alternativamente, ter privilegiado uma
outra lei de transformação de coordenadas, ou mesmo utilizar coordenadas num espaço
vetorial distinto do espaço-tempo (como no caso do espaço tridimensional), de modo a
construir uma noção diferente de tensor. Assim, o termo tensor carrega, implicita ou
explicitamente, uma particular lei de transformação de coordenadas assumida como
fundamental. Por vezes, designam-se num mesmo contexto os tensores quadridimen-
sionais do espaço-tempo (transformação de Lorentz) e os tensores tridimensionais es-
paciais (transformação de coordenadas espaciais de Galileu).
As Eqs. (12.5) da eletrodinâmica de Maxwell apresentadas na Sec. 12.2.3 admitem uma
formulação compacta na linguagem tensorial. Definem-se os dois seguintes tensores [10]
de ordem (2, 0):
 
0 −Ex −Ey −Ez
µν
 E
 x 0 −Bz By 
F =  (12.58)


 Ey Bz 0 −Bx 
Ez −By Bx 0
 
0 −Dx −Dy −Dz
µν
 Dx 0 −Hz Hy 
P =  , (12.59)
 
 Dy Hz 0 −Hx 
Dz −Hy Hx 0
~ = εE
onde D ~ eH
~ = B/µ
~ são os vetores de indução eletromagnética (no vácuo, ε = εo
e µ = µo ). As Equações de Maxwell tomam, então, a forma
∂ µν
F = 0 (12.60)
∂xν
450
∂ µν
P = J µ, (12.61)
∂xν
onde J µ = (ρ, Jx , Jy , Jz ) em termos da densidade volumétrica ρ de carga elétrica e da
densidade superficial J~ = (Jx , Jy , Jz ) de corrente elétrica.

12.10 Contribuições da fı́sica experimental


Apresentam-se nesta seção duas listagens sumárias (e não exaustivas) de alguns expe-
rimentos efetivamente levados a cabo. A primeira listagem descreve alguns métodos de
determinação experimental da velocidade da luz no vácuo, sendo os resultados obtidos
todos compatı́veis com o valor teórico c = 2.997 · 108 m/s previsto por Maxwell [2]. A
segunda listagem relata alguns experimentos cujos resultados encontram-se em acordo
com a Teoria da Relatividade Especial [4], e em desacordo com a Fı́sica Newtoniana [3].
Um breve comentário sobre cada experimento apresentado permite ao estudante esti-
mar a forma de sua execução, bem como avaliar o seu significado contextual histórico
no desenvolvimento da assim denominada fı́sica moderna [8].

• Determinação experimental da velocidade da luz no vácuo

Perı́odo de satélites dos planetas exteriores O perı́odo de translação, em torno


de Júpiter, de sua lua mais próxima denominada Io, apresenta comportamento
variável conforme a distância da Terra ao planeta. A diferença observada corres-
ponde ao tempo de trânsito da luz ao percorrer o diâmetro da órbita da Terra
em torno do Sol.
Aberração óptica A observação astronômica de corpos distantes requer o apon-
tamento do telescópio segundo um ângulo ligeiramente distinto da posição do
astro, devido ao movimento da Terra, para evitar que sua luz atinja as paredes
do equipamento (tal como um guarda-chuva deve ser mantido algo à frente do
corpo de alguém que anda rápido sob a chuva sem vento).
Roda dentada Um feixe luminoso passa entre os dentes de uma roda dentada em
rápida rotação na ida e retorno de uma longa trajetória. O tempo de percurso
deve corresponder ao tempo de giro pelo ângulo de um dos dentes.
Cavidade ressonante A medida da freqüência de ressonância para um dado número
de metades de comprimento de onda de radiação luminosa contidos numa cavi-
dade material com paredes internas refletoras permite determinar a velocidade
(de fase) da luz, dada por c = λ ν.

• Testes experimentais da Teoria da Relatividade Especial

Interferômetro de Michelson-Morley Um feixe luminoso coerente (laser) é sepa-


rado em dois raios que percorrem trajetórias ortogonais, sendo a seguir recombi-
nado, de modo a produzir franjas de interferência. A hipótese do éter luminı́fero

451
prevê para a luz velocidades diferentes nos braços do interferômetro, produzindo
um deslocamento nas franjas de interferência ao longo do tempo. Este desloca-
mento de franjas previsto não foi observado.
Decaimento de partı́culas A vida-média de múons (partı́cula semelhante ao
elétron, porém mais pesada) produzidos em laboratório é menor do que seria
necessário classicamente para permitir a observação no solo de múons produzi-
dos na alta atmosfera, provenientes de raios cósmicos. A relatividade explica a
observação dos múons ou pela dilatação do tempo ou pela contração do compri-
mento.
Acelerador linear Embora sujeitas a elevadas forças de aceleração, as partı́culas
elementares massivas observadas nos aceleradores adquirem velocidades limitadas
superiormente pela velocidade da luz no vácuo, em acordo com a energia cinética
relativı́stica.
Acelerador sı́ncrotron Partı́culas carregadas podem ser aceleradas em anéis circu-
lares pela ação de campos eletromagnéticos oscilantes. A freqüência de oscilação
adequada ao efeito é dada pela lei de Lorentz.
Pulsos de radar A distância média da Terra à Lua é conhecida com grande pre-
cisão por medidas de radar, e suas variações são descritas pelo efeito Doppler
relativı́stico.

12.11 Referências bibliográficas


[1] René Descartes, “The geometry of René Descartes” [1637] (Dover, New York,
1954).
[2] James Clerk Maxwell, “A treatise on electricity and magnetism” [1873] (Dover,
New York, 1954) [baseado na 3ª edição (Clarendon, Oxford, 1891)].
[3] Isaac Newton, “Philosophiæ naturalis principia mathematica” [1686], 2ª edição da
tradução para o português (EdUSP, São Paulo, 2002).
[4] Albert Einstein, “A teoria da relatividade especial e geral” [1916] (Contraponto,
Rio de Janeiro, 1999).
[5] Hans Reichenbach, “From Copernicus to Einstein” [1927] (Dover, New York, 1980)
[baseado na 1ª edição corrigida (Phylosophical Library, 1942)].
[6] Henri Poincaré, “O valor da ciência” [1905] (Contraponto, Rio de Janeiro, 1995).
[7] Charles Kittel, Walter D. Knight, e Malvin A. Ruderman, “Berkeley physics course
Vol. 1. Mechanics” (McGraw-Hill, New York, 1965).
[8] Marcelo Alonso e Edward J. Finn, “Fı́sica: um curso universitário Vol. I.
Mecânica”, 2ª edição (Edgard Blücher, São Paulo, 1972).

452
[9] John David Jackson, “Classical electrodynamics”, 3ª edição (John Wiley & Sons,
New York, 1999).
[10] Lev D. Landau & Eugene M. Lifshitz, “Elettrodinamica dei mezzi continui” (Ri-
uniti, Roma, 1986) [Coleção de Fı́sica Teórica v. 8].
[11] Jan Arnoldus Schouten, “Tensor analysis for physicists” (Dover, New York, 1989)
[baseado na 2ª edição (Clarendon, Oxford, 1954)].
[12] “Scientific American Brasil”, edição especial, ano 3, nº 29 (Duetto, São Paulo,
outubro de 2004).
[13] “Galileu” nº 161 (Globo, Rio de Janeiro, dezembro de 2004).
[14] Ronaldo Rodrigues da Silva, “The trace formulas yield the inverse metric for-
mula”, Journal of Mathematical Physics, vol. 39 (N. 11), pag. 6206-6213 (1998).

453
12.12 Exercı́cios

1. Demonstre que, no espaço vazio e na ausência de densidades de carga e corrente


~ bem
elétricas, as Eqs. (12.5) implicam que cada componente do campo elétrico E,
como cada componente do campo magnético B, ~ satisfaz a Eq. (12.6) da onda no
~ = ∇(
espaço. [Pode ser útil a seguinte identidade vetorial: ∇2 A ~ ∇~ ·A~)−∇ ~ ×
~ ×A
(∇ ~ ).]

2. Verifique que os dois postulados de Einstein (Seção 12.3.1) são incompatı́veis com
a idéia Newtoniana de que todos os referenciais inerciais determinam o mesmo
intervalo de tempo entre dois dados eventos.
3. A sincronização de relógios apresentada na Sec. 12.3.2 baseia-se no postulado de
invariância da velocidade da luz. Explique, com suas próprias palavras, porque
é desaconselhável o método de simplesmente acionar cada um dos relógios na
origem, simultaneamente, evitando as ambigüidades, e somente então transportá-
los para suas correspondentes posições fixas no referencial.
4. Considere em repouso um bastão de comprimento `, inclinado no plano xy se-
gundo um ângulo θ com o eixo horizontal Ox, conforme determinado por um
referencial inercial O. Seja O0 um referencial inercial em movimento na direção
Ox com velocidade v, segundo as medidas do referencial O. Determine o compri-
mento e a orientação espacial do bastão, segundo as medidas efetuadas pelo
p
referencial O0 . [Solução: `0 = ` 1 + (γ v cos θ/c)2 e tan θ0 = tan θ/γ, onde
γ = (1 − v 2 /c2 )−1/2 .]
5. A lei inversa de transformação de coordenadas de Lorentz, Eq. (12.13), foi obtida
no texto por simetria com respeito à velocidade relativa entre os referenciais.
Mostre, por substituição direta, que as Eqs. (12.13) são inversas das Eqs. (12.12),
ignorando as constantes (to , xo , yo , zo ) e (t0o , x0o , yo0 , zo0 ).
6. Repita o exercı́cio 5 acima para as leis de transformação de velocidade e de
aceleração entre referenciais inerciais. Isto é, mostre por substituição direta que
as Eqs. (12.15) são inversas das Eqs. (12.14), e que as Eqs. (12.17) são inversas
das Eqs. (12.16).
7. Obtenha as expressões (12.20) da Sec. 12.5.2 para o efeito Doppler longitudinal
de ondas de campo, a partir das Eqs. (12.18)–(12.19). [Sugestão: use a relação
p p
1 − (v 0 /c)2 (1 − uvx /c2 ) = [1 − (u/c)2 ][1 − (v/c)2 ], onde v e v 0 são os módulos
das velocidades de uma mesma partı́cula relativamente aos observadores O e O0
que se movem ao longo do eixo Ox com velocidade relativa u.]
8. Obtenha as expressões (12.21) da Sec. 12.5.2 para o efeito Doppler transversal de
ondas mecânicas, a partir da construção de eventos de emissão e detecção dessas
ondas e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
9. Obtenha as Eqs. (12.22) da Sec. 12.5.2 para o efeito Doppler transversal de ondas

454
de campo, a partir da construção de eventos de emissão e detecção dessas ondas
e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
10. Um dado semáforo de trânsito encontra-se brilhando com sua luz vermelha. Deter-
mine o estado de movimento de um condutor de veı́culo automotor com respeito
ao semáforo para que esse brilho lhe pareça verde.
11. Deduza a Eq. (12.30) da Sec. 12.6.2, que descreve a relação invariante existente
entre a energia total E de um sistema mecânico de massa m e seu momentum
relativı́stico P~ .
12. Generalize a lei de Lorentz de transformação de coordenadas do espaço-tempo,
Eqs. (12.32) da Sec. 12.7.1, para o caso de um movimento relativo de referenciais
com velocidade Newtoniana adimensional β~ numa direção arbitrária. [Solução:
x0 0 = γ(x0 − β~ ·~x) e ~x0 = ~x + (γ − 1)(β~ ·~x)β/(
~ β~ · β)
~ − γ βx
~ 0 , onde ~x ≡ (x1 , x2 , x3 ).]
13. Verifique que a lei de transformação da velocidade relativı́stica Eqs. (12.36) da
Sec. 12.7.1 determina velocidades tridimensionais compatı́veis com a lei de trans-
formação da velocidade Newtoniana Eqs. (12.14) da Sec. 12.5.1.
14. Considere o problema de lançamento de um projétil a partir do solo, com veloci-
dade Newtoniana ~u segundo um ângulo θ com o plano horizontal. Admitindo
que um referencial inercial O fixo ao solo verifique ser correta a cinemática
Newtoniana para esse projétil (que fornece a trajetória parabólica usual), de-
termine as componentes dos vetores velocidade V~ e aceleração A ~ relativı́sticas do
projétil ao longo de sua trajetória. [Solução: V~ = (γ/c)(c, v cos θ, v sen θ − g t, 0)
eA~ = (γ 2 g/c3 ){γ(g t − v cos θ)V~ − (0, 0, c, 0)}, com 0 ≤ t ≤ 2 v sen θ/g, onde
√ p
v = ~u · ~u e γ = 1/ 1 − (v/c)2 .]
15. Utilizando o resultado do Exercı́cio 11 acima, obtenha as Eqs. (12.40) da Sec.
12.7.1.
16. Considere dois eventos A e B infinitesimalmente próximos, descritos em termos
de um referencial O por A = (x0 , x1 , x2 , x3 ) e B = (x0 + dx0AB , x1 + dx1AB , x2 +
dx2AB , x3 + dx3AB ). Seja O0 um referencial relacionado a O pelas transformações
de Lorentz Eqs. (12.12). Desprezando diferenciais de ordem superior, mostre que
o elemento de intervalo no espaço-tempo definido pela Eq. (12.42) é invariante.
Isto é, mostre que
(dx0AB ) − [(dx0AB
0 2
) + (dx0AB
1 2
) + (dx0AB
2 2 3 2
) ] = (dx0 )2 − [(dx1 )2 + (dx2 )2 + (dx3 )2 ].

17. Considerando a Fig. 12.8 da Sec. 12.7.3, que apresenta como o observador O
descreve os eixos coordenados do observador O0 , esboce o diagrama de espaço-
tempo recı́proco, que ilustra a forma como o observador O0 descreve os eixos
coordenados do observador O.
18. Obtenha a expressão α = ln[γ(1 + β)] para o ângulo α de rotação hiperbólica no
espaço-tempo devido a uma mudança de coordenadas dadas pelas Eqs. (12.32)
de Lorentz. [Sugestão: tanh α = senh α/ cosh α = (e2α − 1)/(e2α + 1).]

455
Capı́tulo 13

Panorama Breve da Cosmologia


Contemporânea

Luiz Alberto Oliveira1

13.1 Introdução: A Cosmologia e seus Objetivos

PARAGRAFOS!!

A Cosmologia cientı́fica é uma ciência fı́sica que objetiva descrever a gênese, a con-
stituição e o desenvolvimento da totalidade organizada dos eventos fı́sicos, denomi-
nada de Cosmos, que identificamos ao Universo astronômico enquanto expressão mais
abrangente da realidade natural. Ademais das leis fı́sicas conhecidas em laboratório, a
moderna Cosmologia possui como suporte observacional as evidências produzida pela
Astronomia profunda e, como quadro conceitual de fundo, a Teoria da Relatividade
Geral (TRG), que permite caracterizar o cenário global (o contı́nuo espaço-tempo)
onde sucederiam os processos fı́sicos relevantes em escala cósmica.

Dois planos de análise - o primeiro compreendendo uma apreciação do território


epistêmico em que se fundamentam os princı́pios e concepções básicas que informam o
programa da Cosmologia Relativı́stica moderna desde seu estabelecimento como dis-
ciplina cientı́fica, no primeiro quarto do Sec. XX; o segundo, um resumo histórico das
diferentes abordagens propostas para tratar os problemas cosmológicos, suas vicissi-
tudes, sucessos e impasses - permitem definir os traços gerais da cosmovisão corrente-
mente aceita e indicar suas perspectivas de transformação.
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.

456
13.2 Os Antecedentes
Iniciemos nossa exploração indagando pela origem da imagem comum, habitual, que
temos sobre o Cosmos. Há diversos conceitos básicos que precisamos conhecer para
compreender o mundo natural e, em particular, descrever as caracterı́sticas do Uni-
verso, como espaço, tempo, corpo, causa, luz, dentre outros. Vamos, então, empreen-
der uma genealogia, uma análise histórico-genética desses conceitos, principiando pelos
mais básicos, que são as noções de espaço e de tempo. Para este fim vamos narrar uma
série de episódios que, em linhas gerais, nos fornecerão um entendimento suficiente
sobre os antecedentes da atual visão cientı́fica sobre o Cosmos.
Espaço e Tempo da Sensibilidade:
Nossa narrativa começa com um experimento que hoje é clássico, realizado por Mat-
urana e outros nos anos 50. Eletrodos foram fixados nos nervos ópticos de uma rã, na
tentativa de identificar as formas de objetos que os excitariam. Os resultados foram
surpreendentes: a rã reagia a dois padrões de movimento somente, o de um pequeno
objeto esvoaçando horizontalmente (o ”padrão-inseto”, do qual a rã tendia a se aprox-
imar) e o de uma grande sombra pairando ao alto (o ”padrão-cegonha”, do qual a rã
procurava se afastar). Ora, rãs comem insetos, e cegonhas comem rãs; os comporta-
mentos de ataque e fuga são perfeitamente compreensı́veis. O singular é que entre a
apresentação dos padrões a rã não processava quaisquer estı́mulos visuais - como se o
mundo simplesmente desaparecesse. Ela sequer podia distinguir se uma mosca única
foi e voltou ou se duas moscas distintas passaram sucessivamente - dois padrões-mosca
sucederam, é tudo. O Universo da rã é descontı́nuo, sua ’cosmologia’ é ’estroboscópica’:
não existem objetos perduráveis no mundo da rã. A pergunta então é: como surgiram
os objetos?
Para procurar uma resposta, devemos recorrer à Paleoneurologia, a ciência da evolução
dos sistemas nervosos. Nossa história remonta assim a cerca de 65 milhões de anos
atrás, quando um acidente cósmico - o choque de um grande asteróide com a Terra
- provocou mudanças profundas nas condições ambientais do planeta e determinou
a extinção do gênero então dominante - os dinossauros. Foi a partir desta catástrofe
(coincidente, além disso, com a erupção de grandes vulcões e o possı́vel alastramento
de epidemias de vı́rus) que os mamı́feros, até então circunscritos a nichos ecológicos
especı́ficos, encontraram campo livre para expandir-se e aceleraram sua evolução. Em
particular, um fato decisivo transcorreu: com o abandono dos hábitos noturnos em fa-
vor da atividade diurna agora possı́vel, a visão dos mamı́feros, acostumada às condições
da noite, teve de adaptar-se à clareza do dia. A flexibilização dos centros cerebrais da
visão, requerida para tal tarefa, permitiu que o sistema perceptivo dos mamı́feros
adquirisse uma capacidade notável, que podemos chamar de sı́ntese dos sentidos de
longo alcance, ou seja, seus cérebros passaram a integrar os estı́mulos recebidos pela
visão, pelo olfato e pela audição num mapa unificado - operação extremamente sofisti-
cada, uma vez que os sinais visuais, olfativos e sonoros são de natureza muito distinta.

457
Esta sı́ntese permitiu que os objetos percebidos ganhassem identidade e estabilidade,
ainda que estivessem em movimento ou que o observador mudasse seu ponto de vista (é
por isso que ao caminharmos em volta de uma árvore, digamos, ela continua a mesma,
embora os estı́mulos que recebemos dela estejam variando continuamente!). Em con-
seqüência, o mundo dos mamı́feros ganhou continuidade e passou a ser constituı́do
por objetos duráveis. Esta objetificação do mundo foi o nascimento do Tempo e do
Espaço da Sensibilidade, o quadro biológico de fundo a partir do qual apreendemos a
realidade e nos situamos nela.

Espaço e Tempo Simbólicos:

Nossa próxima etapa também está associada a uma variação climática: há cerca de 5
milhões de anos, na África, grandes regiões de densas florestas tropicais foram pouco
a pouco se transformando em savanas de vegetação baixa. Privados do ambiente mul-
tidimensional da floresta fechada, alguns primatas que aı́ viviam adaptaram-se às
novas condições assumindo uma postura ereta (ou seja, verticalizando a coluna verte-
bral). Esta mudança aparentemente tão simples teve imensas consequências. As patas
dianteiras puderam ser liberadas da função exclusiva de locomoção; a progressiva
oposição do polegar aos outros dedos (permitindo pinçar os objetos) combinada a um
delicado alinhamento do olhar com o movimento dos punhos (garantindo a precisão
dos gestos) acabou por transformar as patas em mãos. Assim, esses primatas cam-
inhantes - nossos ancestrais - se tornaram animais técnicos, e conseguiram, há um
milhão de anos, o extraordinário feito de adquirir controle sobre um processo: o fogo.
As mãos passaram a levar o alimento à boca; liberada da função de agarrar a presa, a
mandı́bula pôde suavizar-se e diminuir de tamanho, facilitando a emissão de sons (e
o aumento concomitante da capacidade craniana). A maneira mais ’econômica’ de se
produzir todo este conjunto de alterações morfológicas é atrasar a maturação dos fetos
- processo a que os paleoantropólogos chamam de neotenia. Os bebês proto-humanos,
assim, passaram a nascer cada vez mais ’inacabados’, ou seja, sua maturação com-
pleta começou a ocorrer depois de nascidos. O desenvolvimento retardado reduz a
influência dos padrões de comportamento inatos e aumenta a capacidade (graças aos
cérebros aumentados e complexificados) de se aprender padrões; progressivamente, a
transmissão de comportamentos torna-se cada vez mais importante.

Ora, estes bebês neotênicos são, durante um longo perı́odo, relativamente incapazes, e
requerem por isso cuidados intensivos por parte do grupo. A simples sobrevivência da
espécie exigiu então uma forte coesão da coletividade, uma socialização integradora,
para que os cuidados com os infantes pudessem ser ministrados. A inovação revolu-
cionária que fomentou o fortalecimento dos laços sociais foi uma nova forma de co-
municação, apoiada na facilidade de emitir sons. A voz converteu-se assim em um
novo suporte de registro em que o significado dos gestos e posturas (de alerta, de
afeto, etc) empregados pelo grupo foi traduzido em palavras. O surgimento da fala:
talvez o acontecimento mais decisivo da história de nossa espécie. Ao comunicar-se

458
entre si, esses animais falantes produziram uma tecnologia prodigiosa, uma memória
compartilhada, fora do corpo dos indivı́duos. Pela simbolização, a codificação de sinais
substituindo coisas ou ações, o repertório de experiências e conhecimentos de todo o
grupo podia agora ser continuamente acumulado e transmitido às novas gerações. À
medida que os ciclos naturais - os perı́odos de migração de manadas e as estações do
ano, por exemplo - foram sendo recordados e correlacionados, os registros de fatos já
vividos transformaram-se em expectativas, e daı́ em previsões; rebatida sobre o fu-
turo, a memória se converte em antecipação, possibilitando a nossos ancestrais operar
com uma dimensão sem precedentes, que nenhum outro animal parece apreender: o
amanhã. Este foi o nascimento do Tempo e do Espaço Simbólicos, o quadro coletivo
de fundo a partir do qual concebemos a realidade e atuamos nela.

Ciclos e Simetrias:

A observação de que a natureza é rica em regularidades - isto é, fenômenos rı́tmicos


ou periódicos - foi um dos sinais inequı́vocos do desenvolvimento da inteligência no
homem, e suas evidências arqueológicas remontam a dezenas de milhares de anos.
Não admira que a imagem mais arcaica do tempo de que podemos dispor, segundo os
historiadores das idéias, seja a do ciclo. Desde as eras mais remotas, inúmeros povos
compartilharam a convicção de que a Natureza se organizaria ritmicamente, sendo
a conjugação dos diversos ritmos naturais a própria expressão da ordem cósmica ou
divina vigente. Por exemplo, nas mitologias de praticamente todas as culturas hu-
manas encontramos a associação de eventos primordiais (relatos da Origem, episódios
fundadores, feitos heróicos) com a disposição de constelações no céu. Tão generalizada
parece ter sido a prática humana de codificar acontecimentos modelares por meio de
uma simbologia celeste - ou estelar - que Giorgio de Santillana arrisca-se a afirmar,
invertendo os termos da equação habitual, que a observação ’cientı́fica’ precederia a
enunciação ’mı́tica’, e resume esta opinião numa fórmula atrevidamente atraente: ’O
Homem é o animal que olha para o céu’.

Não há controvérsias, todavia, acerca do papel verdadeiramente capital desempenhado


na história do conhecimento cientı́fico pelo longo (e possivelmente árduo) processo de
registro de correlações entre os ritmos que regulam os fenômenos naturais - biológicos,
climáticos, sazonais - terrestres e a repetição de configurações dos astros. Neste sentido,
a Astronomia seria indubitavelmente a ”primeira” das ciências, e a elaboração de
calendários - tabelas que exprimem associações entre ciclos da natureza e ciclos celestes
- a ”primeira” das tecnologias. Ao seu estabelecimento se deve o triunfo da revolução
agrı́cola do Neolı́tico e a conseqüente aparição e prosperidade das grandes civilizações
antigas, cujas mitologias e cosmogonias costumavam conceber o Tempo exatamente
como a repetição cı́clica dos acontecimentos.

Os Gregos, a quem se costuma atribuir a gênese do sistema de pensamento que virá


a ser chamado de Ocidente, ofereceram uma contribuição inteiramente original para a
representação da Natureza ao lançarem mão de imagens geométricas como sı́mbolos,

459
metáforas para figurar os seres e os acontecimentos do mundo natural e, em particular,
para a descrição da relação entre o Céu e a Terra. Se considerarmos a história das
culturas, encontraremos uma variedade de formas para esta relação: os egı́pcios, por
exemplo, figuravam o céu como uma mulher que abraça seu enamorado, o mundo; os
navajos norte-americanos falavam da grande serpente do céu, cuja troca periódica de
escamas correspondia ao ciclo das estações, e assim por diante, na Índia, em Babilônia,
etc. Essas alegorias de ı́ndole animista não deveriam nos admirar; surpreendente, na
verdade, é a concepção abstrata, de caráter artificial, que graças à inspiração de Tales
de Mileto e de Pitágoras de Samos os Gregos da época clássica produziram, ao tomarem
como sı́mbolo de perfeição, ordem e equilı́brio uma figura geométrica maximalmente
simétrica, a esfera, e afirmarem que o Todo se assemelharia a uma seqüência de cascas
esféricas concêntricas, encaixadas umas nas outras. Esta imagem de uma totalidade
grandiosamente arredondada, que surge já em traços bem acabados no Timeu de
Platão, foi denominada de Cosmos, significando Todo-Ordenado ou Todo-Belo, pois
para estes Gregos as noções de simetria e ordem vinculavam-se à de beleza (em grego,
kosmé, raiz também de cosmético). Uma totalidade em que cada parte tem o seu lugar
definido em função de um princı́pio ideal de proporções harmoniosas: não seria absurdo
afirmar que a apreensão dessa Harmonia constituiu o objetivo último da Ciência grega.
Era uma concepção de mundo que ninguém havia imaginado antes, e que irá dominar
a imaginação dos homens por quase 20 séculos.
O Cosmos de Dante:
Assim, o céu foi convertido em uma abóbada, uma cúpula esférica, e o tempo cı́clico
recebeu uma metáfora inesquecı́vel: o cı́rculo. Tal como os astros se moveriam em
órbitas esféricas porque perfeitas, o Tempo, que Platão chama de ”imagem móvel
da eternidade”, exibiria a forma irretocável da circularidade. Aristóteles manterá
a esfericidade essencial do Cosmos e denominará o Tempo de ”medida do movi-
mento”, recusando-lhe autonomia mas confirmando sua reiteração circular. O tempo
aristotélico continuará a ter como modelo o ciclo, uma vez que os movimentos ce-
lestes perfeitos são cı́clicos; eventualmente, esses ciclos se completarão numa espécie
de grande ano cósmico. No século II da Era Comum, no cadinho de culturas e tradições
ocidentais e orientais que era Alexandria, esta concepção cosmológica qualitativa, ge-
ometricamente inspirada, advinda da filosofia helênica encontrou-se com a astronomia
observacional muito precisa dos Babilônios e, em particular, com a aritmética de base
sexagesimal (muitı́ssimo mais manejável que a dos Gregos) que estes empregavam.
Desta mescla entre esquema geométrico, medições detalhadas e agilidade de cálculo
resultou uma das grandes obras do pensamento Antigo, o Almagesto (”O Grande
Tratado”) de Ptolomeu. Primeiro modelo descritivo e preditivo da Fı́sica Matemática,
o Cosmos de Ptolomeu permitia representar quantitativamente os movimentos dos
astros errantes (suas ”revoluções”) através da concatenação de sucessivas rotações (os
”epiciclos”, assentados sobre cı́rculos básicos ou ”eferentes”), cuja resultante podia
ser projetada como uma linha (a ”trajetória”) numa carta ou planisfério. Gerações de

460
astrônomos aperfeiçoaram este arranjo de ciclos e epiciclos, complicando-o cada vez
mais; o esforço de Copérnico, no sec XVI, não visava senão simplificar essa barafunda
de esferas engrenadas em esferas - mas acabou, como veremos, por assinalar uma
mudança da própria civilização.
O Ocidente, porém, foi poderosamente marcado por uma outra concepção de espaço
e de tempo, igualmente original, mas inteiramente diversa da dos Gregos: a de que o
mundo (e portanto o tempo) teve um começo (e terá um fim). Atribuı́da a Zoroastro,
o profeta persa, e imensamente difundida pela Bı́blia judaico-cristã, esta doutrina
extraordinária afirma que há acontecimentos singulares que nunca se repetiram nem
se repetirão (a Gênese, a Crucificação, o Apocalipse), sendo o tempo demarcado por
estes eventos únicos. O Genesis, de fato, consiste de uma exposição temporalizada
da criação em que o espaço está quase ausente, e é decididamente secundário (sua
principal representação é o Tabernáculo, cuja estrutura remete diretamente à de uma
tenda quadrangular, montada sobre as areias do deserto). Jorge Luı́s Borges, em uma
página memorável de História da Eternidade, registra sua perplexidade perante esta
figura do tempo, pois se a essência do tempo é haver um antes sucedido por um depois,
o que dizer de um instante que não teria precedentes, que não seria a sucessão de um
instante anterior? (Kant chegará a reconhecer nesta borda absurda do tempo uma
antinomia, isto é, uma contradição intrı́nseca, da própria Razão.) Mas se os Gregos
encarnavam a repetição periódica na metáfora do cı́rculo, a figura bı́blico-zoroastriana
do tempo corresponderia a uma outra entidade geométrica: um segmento de reta,
confinado por extremidades abertas (e inconcebı́veis). Como é evidente, estas dı́ades
de imagens do espaço e do tempo, o Céu esferóide e a repetição perpétua, o Céu
poliédrico e a duração finita, são rigorosamente dı́spares, e para compatibilizá-las o
Ocidente teve que aguardar a obra de dois santos, Agostinho e Tomás de Aquino. A
concepção de Todo vigente na Idade Média européia - o magnı́fico Cosmos de Dante
- resultou deste autêntico milagre de conciliação de incompossı́veis.
De fato, recebemos desse grandı́ssimo pensador medieval a figura de um cosmos organi-
camente estruturado, demarcado por noções bem-definidas de duração e eternidade, e
de limite e infinidade. Vejamos o modelo espaciotemporal que Dante nos oferece: trata-
se antes de tudo da associação entre dois reinos ou domı́nios distintos, o material e o
espiritual. A geografia, ou mais exatamente, a cosmografia que Dante nos apresenta
articula-se com a imagem nuclear da cosmovisão medieval, a Grande Cadeia dos Seres,
segundo a qual todo e qualquer acontecimento subordina-se a uma ordem cósmica
global. Neste mundo organicamente estruturado, nenhum evento pode suceder num
local qualquer que não seja um reflexo dessa ordem cósmica - e que não se reflita nela
(por isso o terror dos cometas e dos meteoros, daquilo que surge inesperadamente no
céu e quebra a boa ordem da natureza, resultando invariavelmente em catástrofes para
reinos e pessoas). Essa subordinação do local ao global, consubstanciada na Grande
Cadeia dos Seres, é coetânea à imagem de um mundo cerrado, fechado sobre si, hi-
erarquizado formalmente. Com efeito, a forma de cada ser prescreve seu lugar numa

461
hierarquia vertical: há a profundidade infernal, a superfı́cie da Terra - onde ressalta
o monte do Purgatório - em seguida a sucessão de cascas cristalinas concêntricas (as
órbitas) em que estão engastados os astros errantes ou planetas (inclusive o Sol e a
Lua), culminando na abóbada das estrelas fixas. Envolvendo esse mundo fı́sico finito,
tão reminiscente do cosmos de Ptolomeu, encontra-se a derradeira expressão da cor-
poralidade, a camada denominada de Primum Mobile que recheia, se assim se pode
dizer, a separação entre os domı́nios fı́sico e espiritual e tem a função de realizar a
causa inicial (o ”Primeiro Motor”) dos movimentos requerido por Aristóteles. Para
além, estende-se indefinidamente o reino incorporal celeste, o Empı́reo, habitado pelas
almas bem-aventuradas e pelos querubins, anjos e arcanjos da tradição cristã.

Dois aspectos dessa composição de espaços são especialmente notáveis. Primeiramente,


a assimetria vertical que manifesta a ordem cósmica global imposta pela Grande
Cadeia dos Seres e que se vincula, no âmbito terrestre, com o peso (leve ou grave)
das coisas. Além disso, há a existência de um locus fı́sico privilegiado, o centro da
Terra, em relação ao qual distribuem-se as distâncias e coordenam-se os movimentos;
desta inomogeneidade do espaço fı́sico resulta que a Terra, que repousa neste ponto
focal, deve necessariamente ser imóvel. Daı́ também decorre a dupla natureza dos
movimentos dos corpos: circular, perpétua e perfeita, nas esferas supralunares em que
se encontram os astros; linear, efêmera e aberrante, na esfera sublunar em que agem
os homens. Em segundo lugar, podemos distinguir no cosmos Dantesco uma estrutura
hierarquizada de temporalidades que reflete a organização espacial esboçada acima:
duas eternidades - a dos bem-aventurados no Paraı́so acima, a dos condenados no
Inferno abaixo - circundam a brevidade da existência neste vale de lágrimas, em que
somos colocados durante um curto transcurso para que nossas almas sejam postas à
prova. Particularmente fascinante, porém, é a dupla função exercida pela contribuição
verdadeiramente original do Medievo à doutrina cristã tradicional, o Purgatório. De
fato, espacialmente trata-se de um monte que as almas devem ascender, aliviando-se
pouco a pouco da carga (o peso) dos pecados cometidos, de modo a alcançarem o
topo - onde se encontra o Jardim do Éden perdido - já purificadas da grosseira gravi-
dade corporal e prontas para ’saltarem’ para o Empı́reo; mas paralelamente trata-se
também de um dispositivo temporal de regressão, de uma ’máquina do tempo’ que
permite à alma retornar à pureza do estado de ser primordial, anterior à Queda. Em
resumo, dois espaços - o domı́nio espiritual envolvendo os reinos astral e terrestre,
correspondendo a uma eternidade duplicada - a paradisı́aca e a infernal - envolvendo
as duas durações (inversas) da vida e da purgação.

A passagem:

Esta magnı́fica imagem de um Cosmos a um só tempo orgânico e sublime sofrerá


um golpe demolidor no Renascimento. Precursores como Nicolau de Cusa e Gior-
dano Bruno, reformadores como Copérnico e Osiander, e revolucionários como Kepler,
Galileu e Descartes nos legaram uma nova concepção de Todo ao descentralizar e homo-

462
geneizar o Espaço, liberar o Tempo de sua sujeição ao movimento, e deslocar a noção
de Causa das coisas para o comportamento das coisas. Autêntica refundação do pen-
samento do Ocidente sobre o mundo natural, cujo eixo foi o destronamento da herança
aristotélica em favor de uma concepção platônica, suas principais caracterı́sticas estão
consubstanciadas na célebre sentença de Galileu, que os séculos seguintes não es-
quecerão: ”Deus escreveu o Livro da Natureza em linguagem matemática; trata-se
doravante, para o Entendimento, de decifrar essa linguagem”. A passagem decisiva se
dá com uma série de experimentos conjeturais - perfeitamente análogos aos Gedanken-
experimente (”experimentos conjeturais”) que Einstein tanto apreciava - que acabam
por fazer Galileu concluir que os corpos tendem a manter o movimento que neles foi
impresso, até que um outro agente intervenha obrigando sua alteração (o que é a
essência do Princı́pio de Inércia, que Descartes pouco depois irá formalizar, e Newton
adotará como fundamento da moderna Mecânica). Ora, isso torna possı́vel conceber
um movimento retilı́neo de extensão e duração indefinidas, ou seja, um corpo colo-
cado em movimento retilı́neo e uniforme poderia se mover continuamente, durante
um perı́odo em princı́pio arbitrariamente longo, até sofrer uma interrupção. A prin-
cipal conseqüência dessa idéia extraordinária é abolir a distinção de natureza entre
os mundos sub- e supra-lunar; em particular, inaugura-se a possibilidade de poderem
ocorrer movimentos perpétuos lineares, e não somente circulares: à repetição cı́clica
dos astros vêm agora se somar os movimentos inerciais indefinidamente duráveis. Mas
se um corpo se move interminavelmente em linha reta, então é necessário que o espaço
fı́sico tenha uma extensão correspondentemente interminável. Rompem-se as bordas
do mundo fechado de Dante, e entra em cena o Universo infinito que será a glória de
Newton.

Vemos bem o cataclismo de que advém a Modernidade: se o espaço fı́sico se prolonga


infindavelmente, então o espaço espiritual é empurrado para depois do infinito. Se
o território propriamente espiritual que era seu lugar natural torna-se infinitamente,
logo inconcebivelmente, distante, o único domı́nio que resta às almas humanas é nossa
interioridade; somente dentro de nós pôde subsistir ainda a separação absoluta entre
corpo e alma. Transformada por Descartes em distinção entre res cogitans e res ex-
tensa, entre sujeito e objeto, essa fissura perdurará como condição de possibilidade do
sujeito moderno. Por outro lado, um movimento infindavelmente prolongado requer
uma duração igualmente infindável, e assim a eternidade do Empı́reo (em sua dupla
versão de castigo ou ventura perpétuos) é analogamente deslocada por um novo tipo
de eternidade, a da duração infinita. Tudo o que resta ao mundo é o tempo da trans-
formação; a redenção alcançada ao cabo do Purgatório se converte na expectativa
de realização da essência humana pela História. A instalação do mito moderno por
excelência, o Progresso, acompanha assim a geometrização do espaço e do tempo que
marca a ruptura entre as duas eras.

O Mundo Fechado:

463
Examinemos em algum detalhe como sucedeu a passagem do Mundo Fechado medieval
para o Universo Infinito moderno, ao cabo do perı́odo revolucionário do Renascimento.
No âmbito concreto, material, do Cosmos medieval, ocorrem duas naturezas distintas:
o mundo sublunar, o domı́nio abaixo da orbis ou camada onde a Lua está inscrita,
correspondente aos acontecimentos que sucedem na Terra; e o mundo supralunar, o
mundo da perfeição celeste, associado ao extraordinário sistema de cascas esféricas
móveis que representam o céu. Há então dois modos de movimento, correspondentes
às duas instâncias da natureza: o modo natural, espontâneo, perpétuo e perfeito dos
astros, e o modo sempre imperfeito, sempre limitado, sempre causado externamente,
dos movimentos terrestres, chamados de ”aberrantes”, pois nunca são duradouros,
invariavelmente começam aqui e terminam ali, nem espontâneos, invariavelmente as
coisas são obrigadas ”de fora” a se deslocar. Na verdade, os movimentos sublunares são
concebidos, nesta cosmovisão aristotélica, como mudanças análogas ao envelhecimento:
tirar um corpo daqui e colocá-lo ali é submetê-lo a uma transformação, é realizar
uma modificação semelhante ao envelhecer. Observemos que o conceito fundamental
aqui é o de indivı́duo; assim, o lugar que um corpo ocupa é, primordialmente, um
atributo seu, enquanto entidade individualizada. O mundo material, assim, consiste
do conjunto de todos os indivı́duos, do que decorre a noção medieval do espaço fı́sico
como correspondendo ao conjunto dos lugares habitados pelos indivı́duos. Numa tal
concepção não há lugar para o vazio - se retiramos um corpo que está separando outros
dois, seu ”lugar” viaja com ele, e os corpos restantes terão de entrar em contato.
Disso então resulta um mundo pleno, um mundo inteiramente denso, em que o vazio
é impossı́vel.
Além disso, há Quatro Causas ou Princı́pios Primeiros que explicam o que são as
coisas ou indivı́duos, isto é, dão conta de sua origem, essência e razão de ser, que po-
dem ser ilustradas pela famosa imagem das etapas de criação de uma estátua por um
escultor, que Aristóteles nos legou e a posteridade não esqueceu. Há primeiramente a
causa material, uma base ou suporte, análoga a um bloco de mármore bruto sobre o
qual nenhuma forma foi ainda inscrita, mas que tem a potência de receber incontáveis
formas. A seguir, há a causa formal que corresponde a uma planta ou diagrama de
proporções concebido na mente do artesão, no qual estão definidos os limites que serão
impostos àquela matéria bruta. Há então a causa eficiente, identificada ao trabalho
concreto do escultor ao desbastar a pedra e imprimir-lhe os contornos da forma dese-
jada, e enfim a causa final que é a finalidade ou objetivo da estátua pronta, ou seja,
o uso a que se destina, cerimonial, estrutural, ornamental, etc. Em suma, as Quatro
Causas dizem o quê uma coisa é - a causa material, porquê é - a causa formal, como
é - a causa eficiente, para quê é - a causa final.
Ao ser aplicada ao problema da compreensão do movimento, a doutrina das Quatro
Causas vai nos apresentar um quadro sumamente curioso. Fundamentalmente, têm
importância primordial as causas formal (segundo a qual um corpo tende a cair para
o solo ou ascender para o primeiro céu) e final (segundo a qual recuperar o repouso é

464
a tendência de todo corpo que sofre um deslocamento). É a causa formal que vai fazer
um corpo massivo, pesado, tender a dirigir-se à superfı́cie da Terra; ou, ao contrário, se
tem natureza leviana, aérea, como o fogo, tender a dirigir-se à casca da Lua, ao céu. Já
a causa final será responsável pelo destino último do movimento, que é sua extinção,
ou seja, o repouso. Todo movimento é uma transformação, e todo ser resiste a esta
transformação; portanto, quando se desloca um corpo, colocando-o em movimento,
ele naturalmente busca fazer cessar esse movimento, e para isso dirige-se para o seu
lugar natural de repouso. Quando se toma um corpo pesado, como uma pedra, e a
largamos, o que se testemunha é que ela espontaneamente se dirige para o seu lugar
natural, a superfı́cie da Terra, e lá repousa em definitivo; sem uma nova interferência
externa, ela não mais vai se animar. É essa combinação entre as causas formal e final
que irá governar o comportamento dos corpos no domı́nio sublunar.
Trata-se de uma concepção de caráter formal-qualitativo, ou seja, não importam os
caracteres quantitativos dos movimentos: não importa de que altura foi largada a
pedra, basta saber que é da sua natureza dirigir-se à Terra e lá repousar. Há, por outro
lado, uma distinção essencial entre o movimento, que é uma transformação forçada,
e o repouso, que é o estado natural de todas as coisas. Consideremos o exemplo do
movimento balı́stico: tomemos uma pedra e a lancemos para cima e para adiante.
Vemos um percurso aparentemente paradoxal: a pedra inicialmente sobe, alcança
uma altura máxima, e depois começa a descair, até chegar ao solo e parar. Por quê
a pedra não cai diretamente no chão, assim que a soltamos da mão? Não seria essa
a sua tendência ’natural’ ? Para dar conta desse tipo de fenômeno, Aristóteles lança
mão da noção de perı́stase (’quase-imobilidade’). Ao soltarmos a pedra, ela desloca o
ar de seu lugar natural, comprimindo-o à frente e o rarefazendo atrás. Ora, o ar busca
retornar a seu estado natural de imobilidade, e assim trata de compensar o desarranjo
em que se encontra migrando da frente da pedra para trás, o que resulta em um
empurrão contı́nuo do ar sobre a pedra na direção do movimento. É a combinação
entre as tendências da pedra e do ar de retornar a seus devidos lugares naturais que
explicará - de maneira inteiramente consistente com os princı́pios causais adotados, e
conforme ao testemunho dos sentidos - as trajetórias balı́sticas.
Por outro lado, trata-se de um mundo finito, isto é, o espaço, o conjunto de lu-
gares habitados pelos indivı́duos, é necessariamente finito. Por quê? De acordo com
o princı́pio da causa formal, quando um corpo é afastado do seu lugar natural de
repouso espontâneo, ele tem avidez de retornar a esse lugar, de recuperar a natural-
idade do repouso. Sabemos que de quanto mais alto for largada uma pedra, maior
será sua velocidade ao precipitar-se de volta ao chão, porque maior será sua avidez
de recuperar seu lugar natural (isto nos faria crer, por exemplo, que uma bala acel-
era ao deixar a arma...). Em resumo, quanto mais distante estiver um corpo de seu
lugar natural, maior será sua avidez em recuperá-lo. Ora, se houvesse um corpo a
uma distância infinita da Terra, ele buscaria a Terra com uma velocidade infinita -
e nós não vemos corpos passarem por nós com velocidades infinitas; logo, não há

465
corpos situados a uma distância infinita, e portanto o mundo é finito e fechado, o
espaço é cerrado. Não obstante o rigor lógico desse raciocı́nio, a finitude do Cosmos
vai colocar interessantı́ssimos problemas para os medievais; por exemplo, é possı́vel
a um anjo colocar o braço para além da última das esferas? Se o anjo puder fazer
isto, lugar, ou seja, espaço, estará sendo criado, o que é em princı́pio uma violação
da ordem cósmica preestabelecida desde o momento singular - e supostamente único
- da criação. Por outro lado, se o anjo não puder estender o braço para fora da última
esfera, então mesmo a onipotência da divindade terá limites; a vontade do anjo terá de
estar submetida à sua razão, Deus terá de ser racional antes de ser voluntarioso. Este e
outros problemas ditos ”bizantinos” - quantos anjos cabem na cabeça de um alfinete,
como fazer um camelo passar pelo buraco de uma agulha - costumam hoje em dia ser
ridicularizados, mas na verdade constituı́ram esforços profundos de investigação lógica
acerca da natureza do espaço.

Essa concepção das causas do movimento vai estar intimamente associada a uma noção
correlata acerca do tempo como um conceito derivado, dependente do conceito de
movimento: é porque há movimento que há o tempo, enquanto imagem ou sintoma da
mudança; se porventura as mudanças cessassem, cessaria todo transcurso. Assim, para
os escolásticos medievais, cultores do aristotelismo, o Espaço fı́sico era definido como a
soma dos lugares ocupados pelos corpos (e portanto o vazio - o lugar de corpo nenhum
- era absurdo), o Movimento era entendido como uma transformação, a remoção de
um corpo de seu estado ’natural’ de repouso devido a uma perturbação externa, e
o Tempo era um mero efeito da transformação em curso num dado fenômeno, sem
existência ou autonomia próprias. Ora, podemos dizer que uma das principais vias
de passagem do Mundo medieval fechado e orgânico ao Universo moderno infinito
e mecânico ocorrerá através de uma renovação do entendimento acerca da natureza
do movimento, envolvendo um deslocamento da noção de causa e uma libertação do
tempo de sua dependência ao movimento.

A Revolução do Renascimento:

Quais foram, primeiramente, as novas considerações acerca das causas do movimento?


A ênfase deixa de recair sobre as causas formal e final, para doravante privilegiar-se
a causa eficiente. Ou seja: há um agente que opera sobre um corpo e lhe imprime
movimento, e esse movimento tenderá a ser mantido, conservado pelo corpo, até que
um outro agente novamente aja sobre ele e modifique este estado de movimento. Esta
mudança de ênfase para a causa eficiente pode ser ilustrada por uma série de notáveis
experimentos concebidos e descritos por Galileu (embora, para muitos, alguns deles
nunca tenham sido realizados de fato).

Suponhamos, diz Galileu, que alguém esteja à beira de um cais num lago tranqüilo,
e que um marinheiro esteja no alto do mastro de um barco que está passando bem
próximo, num curso paralelo ao cais. Quando estão frente a frente, e quase podem
se tocar, ambos largam uma pedra, simultaneamente; o mesmo fenômeno, ocorrendo

466
em circunstâncias muito próximas. O que irá se passar? As duas pedras vão cair em
locais separados, uma no pé do cais, outra no pé do mastro do barco, embora tanto
o observador do cais quanto o marinheiro barco considerem a queda da sua pedra
perfeitamente vertical. A conclusão brilhante de Galileu é que para o experimentador
no cais o movimento do barco para avante foi emprestado para a pedra embarcada,
e reciprocamente, para o marinheiro foi o movimento ’para trás’ do cais em relação
ao barco que foi emprestado para a pedra terrestre. Ou seja, movimentos podem ser
cedidos a um corpo e se compor, adicionar-se, subtrair-se, até mesmo compensar-se;
ainda mais, corpos idênticos (com a mesma forma, portanto) podem se mover de modo
diferente de acordo com a composição de movimentos recebida - ou, equivalentemente,
de acordo com o movimento relativo entre os observadores. Galileu acabou de estab-
elecer que a velocidade de um corpo é uma grandeza relativa, ou seja, seu valor varia
para cada observador, conforme seu respectivo estado de movimento. O movimento
principia a se descolar da causa formal.
Ainda mais significativo é a conclusão seguinte, em que Galileu anuncia que um corpo
abandonado a si próprio manteria seu estado de movimento. Ele derivou esta concepção
revolucionária da seguinte experiência: seja uma esfera lisa, que deixamos escorregar
num plano inclinado. O que se verifica? Que a esfera adquire velocidade na descida,
alcança o piso, anda um pouco - e pára. Suponhamos, diz Galileu, que o piso seja
bem encerado. Nesse caso, observarı́amos a esfera, largada da mesma altura, atingir
uma distância bem maior. E se estivéssemos em um daqueles magnı́ficos palácios flo-
rentinos, com um assoalho de mármore perfeito, e exaustivamente encerado, a esfera
iria mais longe ainda. Neste momento, Galileu realiza um salto cognitivo, exibe uma
ousadia conceitual raras vezes igualada, e sugere: se o piso fosse um plano perfeita-
mente liso, um plano geométrico ideal, o corpo a que fosse emprestada essa velocidade
jamais cessaria seu movimento, se moveria perpetuamente. É importante notar que
invariavelmente se vê as coisas saı́rem daqui e pararem ali, quer dizer, ninguém jamais
observou este movimento interminável suceder - não se trata portanto de simplesmente
descrever um fenômeno tı́pico, pertinente ao mundo sensı́vel, e sim de vislumbrar o
fenômeno ’purificado’, apreendido em sua essência ou arquétipo. Galileu, revelando
sua inspiração platônica, irá defender resolutamente a predominância dessa realidade
esquemática, idealizada, sobre a realidade concreta; afirmação ardente de uma con-
cepção idealista em oposição ao senso comum fundado na experiência sensı́vel - como
se Platão fosse, ironicamente, o renovador de Aristóteles...
Mas nesse caso o movimento não seria governado por sua extinção: ambos, repouso e
movimento, tenderiam a se manter. Desaparece a diferença de natureza entre repouso
e movimento, e portanto a regência da causa final: o repouso é somente um caso
particular de movimento, o movimento com velocidade nula. Desaparece também, em
princı́pio, a distinção entre movimentos celestes e terrestres: uma vez que se conceba
a possibilidade de que um movimento possa ser impresso a um corpo sem buscar
extinguir-se no repouso, então, em princı́pio, esse movimento pode perdurar, quiçá in-

467
definidamente; ou seja, deixam de haver fronteiras invioláveis entre os orbes terrestre
e celeste, não há distâncias preestabelecidas que esse corpo não possa alcançar, movi-
mentos celestes e terrestres podem ambos ser perpétuos. Um movimento aberrante
de duração indefinida... Estilhaçam-se os contornos do mundo fechado medieval, e se
inaugura a extraordinária concepção de um espaço e de um tempo infinitos.

O Universo Infinito:

Os medievais diziam: a Terra é imóvel. Como é possı́vel demonstrar essa imobilidade?


Simples, vamos até o alto de uma torre e de lá lançamos um corpo pesado. Se a Terra
estivesse em movimento, ela se deslocaria por debaixo do corpo durante a queda,
de modo que o corpo cairia sempre longe do pé da torre, e não na vertical, como
notoriamente acontece. Portanto, o fato de que os corpos caem na vertical é uma
comprovação de que a Terra está imóvel. Essa demonstração se baseia nas noções
aristotélicas de que o movimento é uma transformação à qual o móvel resiste, que o
movimento busca extinguir-se, que o movimento não é mantido pelo corpo. É esta
também a experiência sensı́vel imediata, indiscutı́vel, que temos desse fenômeno. Mas
eis que chega Galileu, proclama que os corpos tendem a manter seu movimento, e
se agora vamos até o alto de uma torre de lá lançamos um corpo pesado, o que
observamos? Que a pedra, como sempre, cai na vertical. Mas se por hipótese a Terra
estivesse girando, a pedra compartilharia e manteria este movimento, e giraria junto
com a Terra; perfeitamente compreensı́vel, portanto, que ela caia no pé da torre, uma
vez que ambos, a Terra e a pedra, estão num movimento sı́ncrono. Vemos aqui, com
clareza, que um mesmo fenômeno - a queda de um corpo - pode ser interpretado
de diferentes maneiras, e servir para validar conjuntos de explicações completamente
distintos, dependendo de como é concebido e contextualizado. Ou seja, os fatos, neles
próprios, não são suficientes para definir um sentido para os acontecimentos; apenas
a conjunção dos fatos com uma teoria, em cujo âmbito são inseridos e interpretados,
é que pode proporcionar a elaboração de uma visão-de-mundo integrada e eficaz. Um
novo conceito (a composição de movimentos) transforma o sentido do fato (a queda
vertical do corpo); em conseqüência, o deslocamento da Terra torna-se consistente
com as evidências do senso comum - e a ’hipótese simplificadora’ de Copérnico, de que
era o Sol e não a Terra o centro imóvel dos movimentos celestes, pode doravante ser
admitida como válida.

O modelo heliocêntrico de Copérnico é pouco mais que uma adaptação, buscando a


simplificação, do modelo geocêntrico de Ptolomeu, sancionado pela Igreja.. Fiel aos
ideais platônicos de uniformidade do movimento dos objetos celestes, incomodava-se
com as velocidades variáveis que, na concepção dos epiciclos de Ptolomeu, os astros
exibiam ao girar em volta da Terra. Assim, procura restaurar a perfeição platônica
propondo, sob a guisa de ’facilitar’ os cálculos envolvidos no modelo de Ptolomeu,
a hipótese de centrar-se os movimentos celestes não na Terra, mas no Sol. Em vida,
Copérnico relutou em autorizar a publicação de seus escritos; após sua morte, deu-

468
se a ’traição’ de seu amigo Andreas Osiander, que ainda assim apresenta a proposta
heliocêntrica como mera conjetura. Em breve, porém, a concepção de Copérnico irá
destronar a tradição ptolomaica.

De fato, as repercussões que a obra de Copérnico - ”Sobre a Revolução dos Orbes


Celestes” - terá no século seguinte foram tamanhas que o próprio sentido do termo
’revolução’, que não designava senão a circularidade monótona e invariável dos movi-
mentos dos astros, passou a indicar uma transformação radical, abrupta e até violenta,
dos fundamentos de uma época ou sistema. Galileu foi apenas um dentre muitos outros
leitores ávidos e defensores entusiasmados da concepção heliocêntrica esboçada nesse
livro, mas coube a ele concretizar o processo de ’excentrização’ da Terra que acabaria
por desmantelar definitivamente a velha Imagem de Mundo geocêntrica. Ao receber
da Holanda um arranjo de lentes dispostas sobre um suporte (o ’perspicilo’, que logo
será chamado de telescópio), Galileu imediatamente o aperfeiçoou com sua habilidade
de artesão (e a seguir ofereceu, como criação sua, para o governo de Veneza prevenir-
se dos ataques da frota otomana). Mas o perspicilo era encarado então como uma
’curiosidade’, um dispositivo de trucagem que servia para produzir ilusões, análogo
a um caleidoscópio de brinquedo: quando era apontado para um alvo, este não ape-
nas era aparentemente ’trazido para perto’ como aparecia invertido, de cabeça para
baixo, embora evidentemente não tivesse saı́do do lugar - prova bastante da natureza
de truque de prestidigitação, ou mesmo da ı́ndole diabólica, do ardiloso artefato.

Galileu, porém, empreende uma verdadeiro programa de experimentação sistemática,


conferindo cuidadosamente se as caracterı́sticas do alvo, tal como surgiam na imagem
ampliada exibida pelo telescópio e por ele desenhadas em seu caderno, coincidiam
fielmente com a realidade. Ele repetiu esta comprovação centenas de vezes, até se cer-
tificar que o telescópio não produzia ilusões: a imagem obtida era uma representação
fidedigna do objeto observado. Com este procedimento metódico, Galileu transformou
o telescópio de um mero brinquedo em um instrumento de observação. Quando en-
fim apontou sua luneta para o céu, estava seguro de que tudo o que visse seria real.
Descobre incontáveis novos astros, distingue montanhas na Lua, registra satélites gi-
rando em torno de Júpiter, ou seja: expande os limites do Cosmo aristotélico, abole
a diferença de natureza entre os mundos sub e supra-lunar, demonstra que há mais
de um centro de movimentos. Em O Mensageiro das Estrelas, apresenta de uma só
vez tais ”coisas que ninguém nunca viu antes”, exprime ”pensamentos que ninguém
nunca teve”. O arrebatamento de Galileu perante a conquista que lhe foi concedida
é enorme; ele havia sido agraciado com o privilégio de fazer nascer um novo mundo
das cinzas da visão aristotélica - que era sancionada pela Igreja. Levado às barras do
tribunal da Inquisição, abjura do heliocentrismo, mas tem a ı́ntima convicção - que a
Era Moderna que então se inaugura irá vindicar - de que o mundo, agora, se move.

A Ciência Moderna:

Vemos assim as grandes linhas esboçadas por Galileu para a nova maneira de empreen-

469
der as investigações da Filosofia Natural: a partir de estudos empı́ricos (experimentos
e observações) de cada classe de fenômenos (descartando a vinculação ’orgânica’ en-
tre local e global que vigorava na Grande Cadeia dos Seres), trata-se de elaborar
regras quantitativas (expressas, portanto, em linguagem matemática) que incorporem
os dados medidos (por exemplo, sobre velocidades, distâncias percorridas, durações,
no caso de um movimento), correlacionando as grandezas relevantes para a caracter-
ização teórica (ou seja, universal) desses eventos. É esta abordagem empı́rico-teórica
que Kepler, num dos maiores feitos da história das Ciências, emprega para extrair
das tabelas de observações astronômicas de Tycho Brahe as leis cinemáticas que de-
screvem as trajetórias dos planetas no Sistema Solar. Ironicamente, o próprio Galileu
não valorizará essa conquista, porque o método galileano de Kepler acabou por revelar
órbitas planetárias elı́pticas, e não circulares, como invocavam os venerandos preceitos
que entronizavam a esfericidade como imagem da perfeição celeste - que Galileu, ele
mesmo, não foi capaz de abandonar... A fidelidade às medições, porém, encarnará
o traço mais decisivo desta nova forma de dialogar com a Natureza: as observações
empı́ricas - ou seja, os próprios fenômenos - terão a última palavra acerca da validação
ou não de uma dada teorização, tornando o empreendimento cientı́fico auto-corretivo e,
portanto, progressivo. Novas observações serão sempre capazes de impor modificações
aos princı́pios e noções já estabelecidos.
Por exemplo, consoante à subordinação do local ao global, os acontecimentos da na-
tureza deviam estar sempre em harmonia com a ordem cósmica; assim, os ciclos que se
repetem na disposição dos astros fundavam a imagem de um tempo quotidiano, comez-
inho, submetido à determinação das esferas celestiais. Ao incorporar as medições dos
perı́odos dos acontecimentos às leis formais que doravante irão descrevê-los, Galileu
opera uma transmutação fundamental: de sintoma ou efeito do movimento, o tempo
se externaliza, passa a ser uma referência externa, um descritor autônomo e indepen-
dente para os fenômenos. O tempo se liberta do movimento: mal podemos imaginar as
dificuldades excruciantes com que seu espı́rito se defrontou para lograr essa autêntica
transição entre duas eras do pensamento.
A princı́pio, essa modificação vai se dar quase imperceptivelmente, a partir de uma
inovação no domı́nio da música. Nos conventos cristãos medievais perpetuava-se a
tradição judaica da ”salmodia”, que consiste em fazer uma leitura cantada do Evan-
gelho, do texto sagrado. Contudo, quando se procurou usar vários leitores, de modo
a que suas vozes se combinassem nessa fala cantada, surge o problema de como fazer
todos os cantores entrarem em compasso. Este é o problema da constituição da música
polifônica - como fazer todas as vozes atuarem em conjunto (que é o mesmo problema
do mestre de harmonia na escola de samba). Num pergaminho datado do século XIII,
encontrado em Notre Dame, surge uma solução: a elaboração de uma notação musical
inovadora, um signo abstrato que representa uma unidade arbitrária de duração. A
extensão dessa unidade não é definida, pode ser mais curta ou mais longa, de acordo
com a decisão do regente; o que importa é que as vozes irão entrar na canção numa

470
seqüência bem determinada, garantindo a harmonização dos diferentes cantores (mais
tarde, o metrônomo irá realizar precisamente essa função).

Foi dessa maneira tão pouco espetacular que foi concebida a idéia de que o tempo pode
ser dividido. Delineia-se agora a idéia de um tempo que seria essencialmente divisı́vel,
segmentável, e que portanto pode ser concebido como uma sucessão de unidades fixas.
Quando essa noção aparentemente inconseqüente encontrou-se com um dispositivo
igualmente revolucionário - o relógio mecânico - o resultado foi uma transformação
sem precedentes das próprias bases da cultura ocidental. No mundo medieval, a rigor,
a divisão do tempo não tinha um sentido profundo, porque o tempo cı́clico é um
fluir contı́nuo, o ciclo do dia e da noite encadeando-se com o das semanas, e com o
das estações, e com o dos anos. Ademais, os pedaços do dia, ou seja, as horas, eram
elásticas: mais compridas no verão, mais curtas no inverno, e assim só possuı́am,
desde a Antiguidade, um caráter meramente convencional. Uma vez que a verdadeira
natureza do tempo seria contı́nua, cortá-lo só podia ser encarado como um artifı́cio. O
relógio mecânico veio mudar tudo isso, graças à invenção, por um gênio desconhecido,
do escape, um dispositivo muito simples (como costumam ser as grandes invenções)
que permitia transformar um processo contı́nuo - a queda de um peso - num processo
descontı́nuo, repetidamente interrompido e retomado, que torna o ’fluir’ do tempo
numa sucessão de segmentos de duração fixa.

Até então os relógios eram grandes mecanismos que procuravam encarnar os ciclos
naturais. O curso dos planetas e da Lua, o dia, a noite, os relógios representavam
pictoricamente esses grandes ciclos naturais. Mas um gênio florentino desconhecido
teve a idéia de colocar num cantinho despretensioso um movimento que dependia ex-
clusivamente das engrenagens do próprio relógio, um movimento que não remetia a
nenhum ciclo natural. Uma medida de tempo puramente convencional, dependente
apenas da estrutura interna do relógio. Por exemplo, a divisão do dia em doze ho-
ras é uma herança da aritmética babilônia (que usava a base doze), que persistiu
através da astrologia; não representa qualquer aspecto particular da natureza. Graças
à colocação dos relógios no alto da torre das igrejas, esse ciclo puramente convencional
de tempo rapidamente vai se tornar a referência em relação à qual os ciclos naturais
serão medidos. Em conseqüência, o tempo natural passará a ser coordenado. Até então,
trabalhava-se do nascer ao por do sol; no verão esse perı́odo tem uma extensão, no
inverno outra - mas agora a independência com relação aos ciclos naturais, assegurada
pela convencionalidade do tempo do relógio mecânico, vai tornar possı́vel que meninos
de doze anos trabalhem nas minas de Gales, no final do século passado, um perı́odo
fixo: dezesseis horas por dia...

Vemos assim que em certos momentos cruciais da história do pensamento, a Arte


antecipou-se à Ciência ao inaugurar a utilização de noções que posteriormente desem-
penhariam um papel capital em transformações cientı́ficas basilares. O mesmo sucedeu
no que diz respeito às concepções do espaço, tal como revela um exame da passagem da

471
pintura Medieval para a Renascentista. Recordemos as Madonas medievais: as figuras
são bidimensionais, plasmadas na tela, suas proporções são estruturadas simbolica-
mente e definidas apenas pelos contornos. Não há qualquer intenção de se representar
’realisticamente’ as figuras: a Madona e o Menino são imensos (dada sua importância
religiosa) frente aos minúsculos pastores e animais presentes na base do quadro, a
paisagem de fundo é tão somente ornamental. Tampouco se pretende apresentar acon-
tecimentos: o objetivo é transmitir o sı́mbolo da sagrada Maternidade de Deus, e não
descrever as tensões musculares dos braços da Dama ao sustentar o corpo do Infante.
O tempo, portanto, está ausente: mesmo na Via Sacra, em que a história do martı́rio
de Cristo é narrada em sucessivas etapas, cada quadro retrata uma cena exemplar - e
essencialmente estática. Quando Simão o Cireneu se compadece do Cristo vergado sob
a cruz e lhe empresta o braço para aliviar Sua carga, trata-se da imagem paradigmática
da Caridade solidária, e não do movimento corporal requerido para a ação fı́sica de
rebalancear o peso do madeiro.

Na passagem da arte Medieval para a Renascentista, a introdução da dobra - especi-


ficamente, as pregas das vestimentas, importadas da arte bizantina - faz os corpos
representados ganharem espessura, enchendo-se em volumes, e assim o plano pictórico
adquire uma dimensão suplementar, a profundidade. Qual é o efeito de uma dobra?
Induzir a existência de uma outra superfı́cie, não vista mas intuı́da, ’por detrás’ da su-
perfı́cie aparente. Mas então o olhar se detém na camada ’externa’, depois segue para
a segunda camada, e ainda para uma terceira... Ou seja: a dobra vai permitir que os
corpos se avolumem e que portanto o quadro adquira uma terceira dimensão espacial,
uma profundidade. Este novo espaço representativo tridimensional logo depois será
ordenado more geometrico pela adoção da perspectiva, ”naturalizando-se”. Ora, se os
corpos se encheram e passaram a ser posicionados segundo as regras da perspectiva,
com as proporções das figuras simulando as distâncias entre elas, então o olhar se
demora ao penetrar nesse espaço, e assim ainda uma outra dimensão suplementar é
acrescentada - o tempo. A introdução da terceira dimensão espacial é simultaneamente
a aparição de uma sensação de duração - o que vai permitir que a arte Renascentista
passe a reproduzir movimentos, retratando acontecimentos e não somente conteúdos
puramente simbólicos. Um bom exemplo são as gloriosas flâmulas dos cavaleiros de
Paolo Ucello. Guerreiros de armadura, montados em corcéis magnificamente ajaeza-
dos, portando imensas lanças em cujas extremidades se desfraldam pendões - e esses
pendões drapejam, ondulam, se contorcem. Quase se pode sentir o vento, e o galope
dos cavalos, e o ı́mpeto da marcha, graças ao tremular dos estandartes. Represen-
tar acontecimentos concretos numa ambiência geometricamente estruturada, voltar-se
para os estados-de-coisas segundo um viés naturalista, explicitar o tempo: estas foram
as inovações maiores da revolução artı́stica do Renascimento. Como as mudanças da
Arte, muitas vezes, antecipam os avanços da Ciência, a revolução cientı́fica do Re-
nascimento nutriu-se largamente da artı́stica. Giotto é um indispensável predecessor
de Galileu.

472
A Arte, então, preparou a passagem da antiqüı́ssima noção do tempo como um fluxo
contı́nuo para a nova noção do tempo como uma sucessão de unidades descontı́nuas
- que o relógio mecânico virá a implementar - e organizou geometricamente o espaço,
abrindo caminho tanto para a Mecânica quanto para a Óptica. Com o espaço iden-
tificado a um volume geométrico, as distâncias serão definidas pela separação entre
pontos geométricos, e da mesma maneira as durações serão medidas em termos de
unidades referidas a um tempo descritor, exteriorizado e autônomo.

O Corte Cartesiano:

Essa tematização revolucionária da realidade fı́sica encontrará seu acabamento com


Descartes, talvez o último grande filósofo-cientista. Descartes vai radicalizar a postura
de Galileu de abandonar as amarras da cosmovisão finalista e globalizante que domi-
nava a época anterior, e investigar apenas os fatores que diretamente incidem sobre um
dado fenômeno. Ou seja, para se descrever o movimento de um corpo não importam
sua cor, ou cheiro, os sons que o cercam, etc.; apenas o seu caráter de ocupar espaço, e
sua capacidade de, dessa posição, deslocar-se para outra. Descartes leva ao limite essa
desvinculação entre local e global, identificando matéria e extensão: da matéria, tudo
o que importa dizer - tudo que é indispensável dizer - é que ela ocupa largura, com-
primento e profundidade. Opera-se aqui uma identificação extraordinária: um corpo
e a região que habita, matéria e extensão, são uma e a mesma coisa. Por outro lado,
Descartes rejeita a idéia de vazio com maior ênfase ainda que os aristotélicos. Os atom-
istas, por exemplo, afirmavam que os corpos materiais são compostos por diminutas
unidades elementares chamadas átomos, e entre eles haveria um vazio, a ausência de
qualquer meio fı́sico. Descartes nega essa hipótese e concebe um plenum que acaba
por identificar à própria natureza do espaço. O espaço fı́sico não seria um vazio, pois
estaria sempre preenchido desse plenum ou éter, que seria percorrido pelos corpos em
seus movimentos.

Em seguida, Descartes quantifica os movimentos através da definição de momentum ou


quantidade de movimento: quando se imprime movimento a um determinado corpo,
essa ação corresponde a uma certa quantidade de impulsão, que tenderá a permanecer
inalterada enquanto uma ação externa não incidir sobre o móvel. Descartes enuncia
assim a chamada ”lei da conservação da quantidade de movimento”: todo corpo em
movimento livre tem conservado o seu momentum, a quantidade de movimento que
lhe está associada, que só será alterada se um outro corpo qualquer lhe ceder ou retirar
movimento. A lei da conservação da quantidade de movimento vai estar intimamente
associada à chamada ”lei da inércia”, que constitui a primeira das três leis da Mecânica
que Newton irá sintetizar meio século mais à frente.

O princı́pio de inércia afirma que quando não há agentes externos operando sobre
um corpo, esse corpo realizará um movimento retilı́neo e uniforme, com velocidade
constante, ou seja, a intensidade, a direção e a natureza do movimento serão man-
tidas. Descartes separa estes três aspectos do princı́pio de inércia: a quantidade de

473
movimento ser invariante, o corpo manter a direção, e o movimento ser retilı́neo.
Mas para nós modernos (para nós, cartesianos) esses três aspectos na verdade são
um só: um corpo deixado entregue a si mesmo move-se espontaneamente em movi-
mento retilı́neo e uniforme, ou seja, permanentemente com a mesma taxa. A noção de
inércia irá fundamentar a metáfora do mundo fı́sico como o análogo de uma máquina,
a metáfora-matriz da modernidade.

Novamente, temos a imagem de uma plenitude fı́sica, um mundo perfeitamente cheio,


só que agora Descartes também será radical ao negar, devido ao princı́pio da inércia,
que esse mundo possa ter limites. Se um corpo em movimento pode se mover in-
definidamente, os contornos desse mundo perfeitamente cheio, ao contrário do cosmos
cerrado medieval, são também indefinidos. Como Alexandre Koyré assinala, para de-
screver a abrangência do universo Descartes não usa o termo infinito (que reserva para
Deus), mas sim os termos intérmino, ilimitado, indefinido. Ele sustenta essa concepção
na célebre querela com Henry More acerca dos atributos de Deus e dos atributos do
espaço. Uma outra contribuição fundamental de Descartes é a geometria analı́tica,
que é a tradução, em relações algébricas, puramente quantitativas, das formas da ge-
ometria; como se fosse a transposição de uma linguagem das formas espaciais para
uma linguagem algébrica, de signos abstratos. Descartes faz essa convergência de lin-
guagens mostrando que é possı́vel uma associação entre formas e coordenadas, entre
números e curvas que compõem formas, entre medidas e linhas de pontos.

Essa associação vai permitir que a inovadora noção do tempo como uma seqüência de
unidades se torne ainda mais revolucionária, porque agora vai tornar possı́vel conceber-
se - e Descartes é o primeiro a fazê-lo - uma unidade de tempo de extensão nula; um
ponto de tempo (ou instante). Com efeito, se as etapas do movimento devem ser
referidas a frações sucessivas de tempo, como compatibilizar a continuidade suave do
deslocamento de um corpo com uma duração descontı́nua, segmentada? Dito de outro
modo, como encaixar as ’bordas’ dos perı́odos consecutivos? O que se passaria nas
extremidades de cada segmento unitário - e pior ainda, entre elas? O mundo se desfaria
para em seguida se reconstituir por inteiro? Para superar estes obstáculos Descartes
propõe que a noção de unidade de tempo seja levada ao limite infinitesimal, ou seja,
as durações são contraı́das até a aniquilação, até a extensão nula: o ponto. Ocorre
assim uma assimilação completa do tempo a uma imagem geométrica: identificado
a uma linha de pontos, o tempo torna-se denso - entre duas durações inextensas ou
instantes sempre há um outro instante - e portanto contı́nuo. Com Galileu o tempo
havia adquirido externalidade, mas é Descartes que arremata esta vasta operação de
geometrização do tempo, ao lhe conferir o atributo da densidade. Configura-se assim a
Imagem do tempo como uma linha infinita de pontos, percorrida uniformemente pelo
agora perpetuamente movente, desde um passado infinitamente remoto até um futuro
infinitamente ignoto, e correspondentemente o real, o mundo que está em ato, se acha
embarcado numa perene viagem ao longo desta linha dos instantes, deste tempo único.

474
Igualmente notável é o deslocamento seguinte: a identificação do espaço real no qual
os corpos se movem ao espaço abstrato da geometria euclidiana. Ou seja, um am-
biente concreto como uma sala, onde há cheiros, gostos, luzes, tensões, pressões,
onde fenômenos acontecem, passa a ser recoberto por um espaço abstrato de pon-
tos geométricos. Observemos que se trata de um feito extraordinário do pensamento,
absolutamente não trivial, o de recobrir o mundo sensı́vel com uma capa de pontos
geométricos. De tal maneira que doravante vai-se definir a relação de distância, a sep-
aração entre objetos, em termos da distância que existe entre pontos que representam
cada um dos objetos. Desse modo, o espaço fı́sico da sala será identificado a um vol-
ume geométrico, um paralelogramo, digamos. Seu principal atributo é a capacidade de
conter corpos, de ser preenchido - ou não - por corpos fı́sicos. Contudo, ainda que tais
corpos sejam retirados, o espaço dantes ocupado permanece; de fato, o espaço passa a
ser, fundamentalmente, espaço vazio, pura capacidade de continência. Essa noção de
espaço contentor é também o modelo do próprio universo; basta estender ilimitada-
mente as paredes dessa caixa. Habitado por corpos materiais que atuam uns sobre os
outros pela ação de forças - agentes da modificação de movimentos, que concretizam
a prevalência da causa eficiente - esse espaço geometrizado, neutro e abstrato, que
Newton chamará de ”absoluto”, será o substituto do espaço hierarquizado do cosmos
medieval.

A Mecânica:

Com todos estes componentes, não é de admirar que se possa de fato pensar o mundo
como um colossal mecanismo; tal como as engrenagens em uma máquina, o Universo
tem suas partes precisamente ajustadas de tal modo que o movimento de uma delas
implica nos movimentos de todas as demais. Todavia, não há mais aqui, na mod-
ernidade, uma ordem hierárquica entre o todo e a parte. Agora a parte é homogênea
ao todo, ambos têm a mesma natureza. Corpos em movimento, extensão em movi-
mento: apenas isto é o que existe. Entre o local e o global, entre o mundo terrestre e
o mundo celeste; por toda parte, vigora tão somente a uniformidade mecânica. Agora,
então, o pensamento deve procurar não mais os universais, aqueles nomes gerais que
dizem as classes de seres que existem no mundo; o que doravante interessa ao pensa-
mento é o simples, é a parte mais elementar à qual seja possı́vel reduzir-se um sistema,
um corpo, um todo.

Newton recebe estas concepções modernas de espaço, tempo e movimento e as pro-


move a um patamar ainda mais abstrato em sua grande sı́ntese das leis dinâmicas, a
Mecânica. O tempo Newtoniano, por exemplo, além de linear, sucessivo e instanta-
neizado, é universal, uniforme e absoluto - quer dizer, todas as regiões do espaço são
englobadas pelo mesmo instante, os instantes se sucedem sempre na mesma cadência
(o tempo não se condensa nem se distende, não ’acelera’ nem ’freia’), e quaisquer obser-
vadores concordarão quanto à duração que separa dois eventos dados. Como em cada
instante haverá uma dada distribuição de corpos ao longo do espaço, o ’transcurso do

475
tempo’ - a duração de um dado acontecimento, por exemplo - será caracterizado pela
diferença na distribuição espacial dos objetos. Todos os sistemas mecânicos periódicos
podem ser eleitos como ”relógio”, em função de cujo ritmo a evolução de outros sis-
temas mecânicos será descrita; como se, de fato, constituı́ssem encarnações distintas
de um único relógio universal. Assim, qualquer movimento escolhido como padrão
pode ser ’abstratizado’ para adquirir esta função de ’relógio cósmico’, que fornecerá
uma medida absoluta (global, única e independente) para os intervalos entre instantes
e para o qual as leis da Mecânica assumirão a forma mais simples. Todos os relógios,
uma vez sincronizados, manterão perpetuamente esse sincronismo concordando invari-
avelmente em assinalar o mesmo instante, independentemente de suas localizações ou
movimentos. Contudo, como as leis da Mecânica dependem apenas da extensão da sep-
aração temporal entre dois quaisquer eventos, o tempo Newtoniano é intrinsecamente
reversı́vel, ou seja, não é orientado, não define um sentido absoluto entre passado e
futuro. Cada estágio da ’história cósmica’ (as mudanças na constelação dos corpos)
determina (e é equivalentemente determinado por) todos os estágios precedentes e
subsequentes.
Os relógios, portanto, foram fundamentais na instalação da concepção mecanicista
do mundo natural, inclusive na medida em que forneceram a metáfora nuclear desta
Imagem de Mundo: a de que o Universo seria comparável a uma grande Máquina, a um
vasto mecanismo cujo funcionamento é rigorosamente determinado (e por conseguinte
inteiramente predizı́vel) em virtude da concatenação exata de suas peças, de suas
partes simples. Esta analogia não apenas privilegiou a postura analı́tica e reducionista
que se tornaria tı́pica do Mecanicismo, como deu também lugar àquela que talvez seja
a mais espantosa concepção de divindade jamais imaginada por qualquer sociedade
humana: a do Deus Relojoeiro, que monta o mecanismo do mundo e depois se afasta,
deixando o pobre aparelho entregue a si mesmo... Implı́cita nesta imagem maquı́nica do
mundo está a idéia de determinismo, tão cara ao século XIX: nenhum acontecimento
natural é ”livre”, cada parte da grande máquina universal está determinada, está
condicionada a mover-se em acordo com o movimento das outras peças, de tal modo
que se conhecemos uma configuração do conjunto das engrenagens num dado momento,
poderemos em princı́pio prever qualquer configuração futura ou retroceder a qualquer
configuração passada.
Por exemplo, se conhecemos a posição e a velocidade da Lua hoje, aplicando as leis da
Mecânica clássica poderemos prever a posição e a velocidade da Lua daqui a um mês ou
rever a posição que ocupava no mês passado, com a exatidão que desejarmos. Assim, se
fosse possı́vel tirar fotografias da totalidade - recordemos que fotografias, antigamente,
se chamavam ”instantâneos” - a história universal, a história do Cosmos, poderia ser
reduzida a uma série de ”instantâneos”, cada um retratando uma dada configuração,
uma dada distribuição dos corpos no espaço. Isto corresponde à idéia de que cada
instante é universal, é o mesmo em toda parte, a mesma badalada ressoa em todos os
confins do Universo, o infinito do espaço habita o infinitésimo do tempo. Não admira

476
que possamos então conceber o Universo como uma máquina, como um conjunto de
engrenagens perfeitamente ajustadas e azeitadas que, ao se movimentarem, assumem
de instante a instante uma disposição diferente. Na verdade, é discutı́vel a aplicação do
termo ’história’ - na medida em que este denotar uma autêntica progressão evolutiva
dos sistemas materiais - ao Cosmos mecânico. Perante uma imagem tão completa-
mente inumana da totalidade, não admira o espanto e o temor que acometem Pascal,
como nos recorda Jorge Luis Borges. Contemplando a frieza incomensurável do cos-
mos mecânico, Pascal se interroga: se o espaço é infinito, a rigor não há um onde; se
o tempo é infinito, a rigor não há um quando. Quem somos nós? O que somos nós?
Talvez não seja inútil observar, por fim, que no âmbito do determinismo mecanicista
a Vida, com seu repertório de contingências e imprevisibilidades, assume a feição de
uma anomalia.

A Revolução Cientı́fica Contemporânea:

Desde seu inı́cio, o século XX testemunhou a realização de uma série de experimen-


tos decisivos e teorizações audaciosas que acabaram por demonstrar a inadequação
da abordagem Newtoniana ou clássica com respeito a fenômenos que ocorrem em
escalas (de comprimentos, durações ou velocidades) inumanas, estranhas à nossa per-
cepção costumeira dos acontecimentos - como o comportamento dos componentes
microscópicos da matéria (moléculas, átomos, partı́culas) ou a estrutura do universo
astronômico (galáxias, grupos, aglomerados). Esses novos domı́nios de investigação
terão uma conseqüência deveras notável: a Natureza deixa de ser monótona. O que
os avanços do presente século vão engendrar é uma multiplicação, uma tripartição,
digamos, dos modos de apresentação da natureza, ou seja, a Natureza vai apresentar
distintos modos de ser de acordo com a escala do fenômeno investigado, aparições
diferenciadas se focamos a escala microscópica, a escala clássica (que estamos mam-
iferamente equipados a experimentar) ou a escala cosmológica, astronômica. Depen-
dendo da escala que se considera, diferentes naturezas, ou seja, diferentes conjuntos
de fenômenos, com suas relações tı́picas, seus caracteres próprios, serão manifestadas.
Logo, o mundo natural deixa de ser unânime, não é mais o mesmo em todas as escalas.
Toda uma série de problemas interessantı́ssimos e revolucionários vão surgir a partir
dessa constatação.

A Revolução Cientı́fica contemporânea - para usar a bem conhecida denominação


de Thomas Kuhn - motivou toda uma nova compreensão acerca da realidade fı́sica
básica e acarretou a instalação, atualmente em curso, de uma Imagem de Mundo
renovada, profundamente original. Pois para que se pudesse descrever corretamente
essas classes de fenômenos até então inacessı́veis, foi necessário proceder a uma revisão
radical dos próprios princı́pios que fundamentavam o estimado paradigma mecanicista
e circunscrever seu domı́nio de validade observacional. Podemos tentar resumir as
conseqüências deste conjunto de inovações radicais sobre o panorama epistemológico
da atualidade associando-as à introdução de um novo tipo de objeto do conhecimento

477
- o objeto complexo, por referência ao que seria o objeto simples, tı́pico da forma
de conhecimento clássica vigente até o século passado. Evidentemente, a aparição
do objeto complexo será correlata à constituição de uma nova noção de sujeito do
conhecimento.
O objeto complexo perpassa os vários domı́nios ou modos de natureza, do mais ele-
mentar ao mais abrangente - e cada um deles parece se esmerar em nos surpreender.
A Microfı́sica quântica, na escala atômica, delineia uma matéria dessubstancializada,
elusiva, eivada de paradoxalidades, em relação à qual o observador se torna um par-
ticipador, configurando-se assim uma realidade elementar fundamentalmente incerta,
em que desaparece, por exemplo, a distinção entre corpúsculo e onda, entre corpo lo-
calizado e padrão extenso. Já no que podemos chamar de escala mesofı́sica, que exper-
imentamos diretamente pelos sentidos, o estudo dos Sistemas Dinâmicos não-lineares
conduz à concepção de estados longe do equilı́brio marcados pela imprevisibilidade,
mas aptos a engendrar hierarquias sofisticadas de organização, bem como comporta-
mentos ricos em potenciais de evolução, forçando assim o pensamento a abdicar da
pretensão mecanicista de lograr um controle absoluto, correlato de uma previsibili-
dade sem limites, sobre os processos do mundo natural. A Macrofı́sica relativı́stica,
enfim, na escala astronômica, possibilitou a maior descoberta que o homem já fez
sobre o mundo natural - a constatação de que habitamos e somos parte de um Todo
dinâmico, evolutivo, inacabado, em suma, de uma totalidade aberta. Tal concepção
de um Cosmos histórico leva-nos a identificar o Universo como o próprio reino da
complexidade.
Esta entidade tão peculiar - a Totalidade Evolutiva - é o objeto de estudo da Cos-
mologia contemporânea.

13.3 Os Fundamentos: As Teorias da Relatividade

As Teorias da Relatividade de Albert Einstein nos proporcionam os meios de tratar


tanto os processos fı́sicos mais fundamentais (a Relatividade Especial) quanto os mais
abrangentes (a Relatividade Geral) - e as figuras de espaço e tempo que ambas oferecem
parecem de tal modo paradoxais para nosso senso comum que torna-se lı́cito duvidar
se nossos cérebros mamı́feros teriam a capacidade de representá-las de outro modo
que não através de conceitos abstratos, expressos em linguagem matemática. Para
as criaturas eminentemente visuais que somos, tal impossibilidade de representação
imagética é terrı́vel: as essências dos conteúdos do mundo se destacam definitivamente
de suas aparências, como se Apolo, o deus grego das formas, tivesse desertado de nós...
A Teoria Especial da Relatividade
Após considerar longamente certas incongruências entre as prescrições da Mecânica
e do Eletromagnetismo, no anno mirabili de 1905 Einstein apresentou uma nova

478
fundação conceitual para regular a comparação de medidas obtidas por diferentes ob-
servadores inerciais (ou seja, associados a corpos em movimento livre), centrada não
mais no postulado da invariância dos intervalos temporais introduzido por Galileu
(e que conduzia à noção de simultaneidade absoluta de eventos), e sim no caráter
invariante doravante conferido a uma razão entre medidas de espaço e de tempo -
a velocidade de propagação da radiação luminosa. A Relatividade Especial é assim
uma nova teoria da relação entre observadores, subordinada ao princı́pio de que as leis
fı́sicas devem ser indiferentes aos modos particulares com que cada observador procede
ao etiquetamento, por meio de medidas de distâncias e durações, dos fenômenos fı́sicos,
e resultou no que Géza Szamosi chama de ”ruptura da fundação mamı́fera”, pois suas
conseqüências para a compreensão da estrutura do mundo fı́sico se revelaram devas-
tadoras: as medidas de distância (que definem o espaço) e de duração (que definem
o tempo) não serão mais absolutas, seus valores deixam de ser os mesmos para todo
observador, ou seja, cada observador recorta de uma maneira própria, relativa ao seu
’ponto-de-vista’, a massa de acontecimentos do mundo - e esses recortes individuais, a
espacialização e a temporalização que os observadores realizam sobre seus dados, são
meras perspectivas, irrelevantes para a descrição concreta desses acontecimentos.
O que importa são as relações invariantes (que têm o mesmo valor para qualquer obser-
vador) que possam ser construı́das com esses dados, como a velocidade de propagação
da radiação eletromagnética no vácuo (ou velocidade da luz, denotada pela letra c),
que irá governar a comunicação entre os observadores e determinar uma estrutura
causal única para o mundo. Isto significa, por exemplo, que em geral a separação tem-
poral - a duração - entre dois eventos dados dependerá do observador: os intervalos de
tempo medidos por um observador se dilatam ou se contraem com respeito às medi-
das de outro, e por conseguinte fica por completo abolida a noção de simultaneidade
universal - eventos que são coincidentes para um observador serão descompassados
para outros. O mesmo vale para as distâncias, as separações espaciais: observadores
em diferentes estados de movimento obterão distintos valores ao medirem os compri-
mentos caracterı́sticos de um dado sistema - implicando que a distribuição espacial de
seus componentes, e portanto sua forma, será doravante relativa a cada observador.
A dilatação dos tempos, bem como a contração dos comprimentos, são fatos concre-
tos, determinados com grande precisão nos laboratórios - mas o tempo e o espaço
relativı́sticos, maleáveis e individualizados, não mais constituem uma regra métrica
unânime abrangendo a totalidade da existência: acabaram-se o instante global e a
forma unı́voca. O famoso paradoxo dos gêmeos ilustra a ruptura das noções rela-
tivı́sticas com o bom senso velho de guerra:
Os gêmeos X e Y têm, obviamente, a mesma idade. X permanece na Terra, enquanto
Y empreende uma viagem espacial numa nave muito rápida (capaz de mover-se quase
à velocidade da luz). Para X, a viagem do irmão dura dez anos, ao longo dos quais
seu coração bateu cerca de 36 milhões de vezes. Para Y, contudo, a viagem demorou
um ano, e seu coração bateu 3,6 milhões de vezes. Ao se reencontrarem, X está fisio-

479
logicamente 9 anos mais velho que seu irmão; deixaram de ser gêmeos...

Mais ainda, ao longo destes dez anos, todos os dias X levantava a vista para o Sol
e, vendo-o sempre com o mesmo aspecto - o de um cı́rculo dourado - não obstante
o movimento de translação da Terra durante todo o ano, concluiu com bem-fundada
convicção que nossa estrela é uma esfera amarela. Para Y, porém, ao dirigir-se em alta
velocidade em direção ao Sol, este lhe surgiu como se um disco achatado, semelhante
a uma panqueca, e azul; recordou-se então que, quando partiu, o Sol também lhe
parecera um disco achatado - só que vermelho. A gloriosa esfericidade áurea do Astro-
Rei, longe de definir sua essência, não passa de mero ponto-de-vista...

A multiplicação dos espaços e dos tempos - doravante meramente noções relativas


aos pontos-de-vista de diferentes observadores - não é ainda, contudo, o aspecto mais
paradoxal das conceituações relativı́sticas. É indiscutı́vel, para nós, a distinção de
natureza entre distâncias e durações, entre espaço e tempo. Para a Relatividade, essa
distinção é, mais uma vez, dispensável: uma dada grandeza de um fenômeno, que um
observador mede com uma régua e define como um comprimento, um outro observador
poderá medir com um relógio e definir como uma duração. Inaugura-se do mesmo modo
a possibilidade de conversão mútua entre massa (medida da inércia de um corpo) e
energia (medida da atividade do corpo), expressa na célebre fórmula: E = mc2 .

Em resumo, as distinções entre tempo e espaço e entre matéria e movimento tornam-


se fisicamente irrelevantes. A formulação mais apropriada para a aplicação das leis
da Natureza não envolve mais o cenário Newtoniano de três dimensões espaciais e
uma dimensão temporal essencialmente distintas e autônomas, mas sim o chamado
continuum quadridimensional ou espaço-tempo de Minkowski, a coleção causalmente
ordenada de eventos (acontecimentos no espaço e no tempo) registrados por classes
de observadores, cada qual construindo seu ”aqui-e-agora” particular. O ’espaço’ e
o ’tempo’ se convertem assim em simples medidas de parâmetros, e de constituintes
fundamentais da realidade fı́sica passam a ser tão-somente um resultado do aparato
instrumental de cada observador.

A formulação de Minkowski, porém, não pode ser representada visualmente. Consid-


eremos um exemplo básico, o da propagação da luz. De acordo com nossa perspectiva
’espaço e tempo’, quando acendemos uma lâmpada o que ’vemos’ é uma esfera lu-
minosa se expandindo (ocupando diferentes posições em diferentes momentos). Na
linguagem ’espaço-tempo’, este fenômeno é descrito por uma pura forma geométrica,
correspondente à figura de um cone em quatro dimensões: não há movimento algum.
A noção habitual de trajetória (percurso de um corpo no espaço, referido a um dado
decurso de tempo) deve ser substituı́da por um conceito análogo, mas relativistica-
mente invariante: o de linha-de-universo (percurso de um corpo no espaço-tempo).
O mundo fı́sico pode ser entendido como o conjunto de todas as linhas-de-universo
distribuı́das numa variedade Minkowskiana. Contudo, a evolução natural não parece
ter dotado os centros visuais de nosso cérebro com a capacidade de figurar objetos

480
quadridimensionais, tais como os chamados hipercubos ou tesseracts; o espaço-tempo
pode ser concebido e compreendido, mas não pode ser visto. Quem sabe, no futuro,
um artista pós-mamı́fero se tornará no Giotto dos tesseracts?

Mas talvez, para nossa perspectiva lastreada no bom senso nosso de cada dia, a pos-
sibilidade mais perturbadora oferecida pelas abordagens relativı́sticas seja a admissi-
bilidade de ocorrerem circuitos cronológicos fechados, ou seja, caminhos que podem
retornar sobre si mesmos no espaço e no tempo - de tal modo que prosseguir rumo ao
futuro não significaria necessariamente afastar-se do passado! Caso existam de fato (no
momento só sabemos que não parecem ser impossı́veis), estas curvas ’fechadas’ rompe-
riam com um dos atributos mais estimados de nossa figuras tradicionais do tempo, a
globalidade temporal: linhas-de-universo de objetos fı́sicos devem ser monótonas, ou
seja, cruzar um ponto do espaço-tempo uma e só uma vez. A (presumı́vel) viabilidade
fı́sica de tais ”viagens no tempo”, para além de proporcionar material saboroso para
ficcionistas, coloca problemas agudos para nosso entendimento sobre a causalidade -
como exemplificado pelos paradoxos do tipo ’neto viaja no tempo e mata o próprio
avô, mas então não haveria neto para matar o avô, então o avô não morre, então
poderia haver um neto que o matasse’, e assim por diante, !!!!!

A Teoria da Relatividade Geral

Já em 1917 Einstein, exclusivamente a partir da consideração de princı́pios primeiros


e independentemente de quaisquer evidências ou dados sugestivos, completou a elab-
oração da teoria da Relatividade Geral - para Max Born, ”o maior feito do pen-
samento humano sobre a natureza, a mais impressionante combinação de penetração
filosófica, intuição fı́sica e habilidade matemática”. Procurando generalizar a aplicação
do princı́pio de invariância das leis fı́sicas (ou seja, tais leis devem ser expressas por
relações matemáticas manifestamente independentes do particular procedimento de
etiquetamento dos eventos fı́sicos adotado) para observadores não-inerciais (ou seja,
associados a corpos acelerados), Einstein termina por promover uma fecunda - e in-
teiramente imprevista - combinação entre a interação gravitacional (a força universal
de atração entre as massas, descoberta por Newton) e a estrutura geométrica do
espaço-tempo (que irá agora constituir o cenário básico global para a descrição dos
eventos fı́sicos). A geometria do mundo não está fixada a priori, como se pensava
desde Euclides, mas é na verdade determinada fisicamente: os campos gravitacionais
gerados por uma dada distribuição de matéria-energia serão associados, de maneira
não-linear, a tensões do tecido espaciotemporal, como se a estrutura geométrica do
mundo fosse elástica. A gravidade (força) se identifica às deformações do espaço-tempo
(geometria). A Relatividade Geral, com efeito, é um exemplo de teoria fı́sica explici-
tamente não-linear, em cujo escopo é admissı́vel o rebatimento - ou mútua afecção -
entre a curvatura (gravitação) e suas fontes materiais. De fato, é possı́vel até mesmo
a ocorrência de processos de autocatálise pelo quais a gravitação gera gravitação - ou
seja, modelos fı́sicos em que campos gravitacionais (equivalentes a deformações da ge-

481
ometria do mundo) alteram suas caracterı́sticas interagindo consigo próprios. Em con-
seqüência, pode-se até mesmo gerar configurações não-deterministas (”caóticas”) em
que a evolução dinâmica do problema (inclusive no caso do sistema fı́sico ”Universo”)
apresentará bifurcações, ou seja, comportamento irredutivelmente imprevisı́vel.
A TRG pode ser resumida, de modo extremamente esquemático, à combinação de
duas idéias tão simples quanto poderosas. A primeira é o Princı́pio de Equivalência
(o ponto-de-vista de um observador acelerado não pode ser distinguido, por nenhum
experimento laboratorial, do ponto-de-vista de um observador inercial imerso em um
campo gravitacional), que vincula não-inercialidade e gravitação; a segunda é a rev-
olucionária associação entre a força gravitacional experimentada por um corpo e a
deformação (não-Euclidianicidade) que vigora na região do contı́nuo em que ele se en-
contra, que vincula gravitação (força) e geometria (curvatura). A geometria torna-se
um agente dinâmico, determinado em cada local pela distribuição de matéria-energia
ali presente, e simultaneamente prescrevendo o comportamento gravitacional desta
matéria. De acordo com a hipótese mais simples para a interação da gravitação com
os demais campos da fı́sica (o princı́pio do acoplamento mı́nimo), os espaços curvos de
Riemann (nos quais o comprimento de vetores permanece invariante sob transporte
infinitesimal) surgiram como generalização ’natural’ dos espaços de Minkowski para
situações em que a intensidade do campo gravitacional (ou seja, o grau de distorção das
linhas de universo na região sob exame) não pode ser desprezada. Na TRG, portanto,
a caracterização da estrutura do espaço-tempo como uma geometria não-Euclidiana de
Riemann permitirá conferir um conteúdo operacional à noção fundamental de intervalo
entre dois quaisquer eventos, pra quaisquer observadores inerciais ou acelerados.
Os notáveis sucessos da teoria no que tange a fenômenos à escala do sistema so-
lar (os chamados ”testes clássicos”) garantiram-lhe o estatuto de quadro conceitual
de fundo para a investigação dos fenômenos gravitacionais - planetários, estelares,
galáticos e, inclusive, os referentes à peculiar entidade fı́sica que denominamos de Uni-
verso. Com efeito, no escopo da Relatividade Geral torna-se possı́vel elaborar modelos
matemáticos capazes de representar a estrutura Riemanniana que, de acordo com as
equações geométrico-gravitacionais de Einstein, estaria associada ao conteúdo mate-
rial do Universo astronômico em larga escala. Coube à TRG, sobretudo, assimilar a
extraordinária observação de Edwin Hubble, de 1929, acerca do afastamento uniforme
das galáxias (ou seja, que o Universo encontra-se num estado dinâmico de expansão
global), que para muitos foi a maior descoberta já feita pelo Homem sobre o mundo
natural e assinala o nascimento da atual Cosmologia Relativı́stica.

13.4 A Cosmologia Relativı́stica

O que mais nos interessa neste ponto é constatar a aparição no domı́nio das ciências
fı́sicas, graças aos modelos cosmológicos relativı́sticos, de uma nova figura de total-

482
idade: o espaço-tempo Riemanniano da Relatividade Geral, que pelas equações ge-
ometrodinâmicas de Einstein se articularia não-linearmente com a distribuição de
matéria-energia em escala cósmica, de modo a constituir um modelo matemático do
Universo que pode ser comparado às observações. Espaço-tempo-matéria-energia: eis
a nova face do Todo, de Tudo-o-que-existe. O caráter universal (ou seja, o alcance
infinito) da atração gravitacional lhe assegura a função de organizar essa totalidade,
que pode ser denominada, praticamente no sentido do termo original grego de todo-
ordenado, de Cosmos.
Particularmente notável é o fato de podermos dispor de evidências acerca de carac-
terı́sticas globais dessa entidade: por exemplo, seu conteúdo material visı́vel, segundo
a astronomia profunda têm nos revelado, se assemelha a um ”fluido cosmológico”
notavelmente homogêneo (mais ”liso”, ou uniforme, que a superfı́cie de uma bola de
bilhar), composto por cerca de cem bilhões de galáxias - cada uma contendo em média
cem bilhões de sóis - reunidas numa hierarquia crescente de grupos, aglomerados, su-
peraglomerados e, finalmente, estruturas em larga escala, tudo isso distribuı́do num
volume de cerca de doze bilhões de anos-luz - ou cem quintilhões de quilômetros - de
raio. Ainda mais significativo, porém, é seu caráter dinâmico, caracterizado pelo afas-
tamento mútuo das galáxias descoberto por Hubble: a configuração dessa totalidade
é mutável, ou seja, o Cosmos tem uma história. Em resumo, a Totalidade pode ser
observada, e é evolutiva. Todavia, ainda que legı́timo do ponto de vista da epistemolo-
gia das ciências naturais, o Todo Evolutivo, foco do estudo da Cosmologia, será um
objeto fı́sico deveras peculiar.
Curiosamente, ao principiar as aplicações da Relatividade Geral à Cosmologia o
próprio Einstein procurou desenvolver um modelo de um Cosmos finito e estático,
por ele considerado como o mais pertinente dos pontos de vista da simplicidade e
elegância filosófica. A natureza exclusivamente atrativa da gravitação, porém, impôs
a adição de um termo suplementar ”repulsivo” nas equações de Einstein, a chamada
”constante cosmológica”, para que um modelo estático pudesse ser logrado. A insta-
bilidade intrı́nseca do Universo de Einstein frente a perturbações e, mais ainda, as
observações de Hubble acerca do processo global de afastamento das galáxias - ev-
idenciado pelo desvio para o vermelho da luz por elas emitida, tão mais acentuado
quanto mais distante estiver a fonte - logo inviabilizaram o modelo de Einstein, que
cedeu lugar à concepção de Friedman de um Universo dinâmico. Trabalhos seguintes de
De Sitter, Lemâitre e Robertson motivaram a adoção das cosmologias espacialmente
homogêneas de Friedman-Robertson-Walker (FRW) como ”geometrias-padrão”. Os
modelos FRW admitem a ocorrência de um estágio primordial muito denso e quente
que, segundo os estudos de Gamow nos anos 50 permitiriam, em conjugação com as
teorias da Fı́sica Nuclear e das Partı́culas Elementares, a elaboração de uma ”história
térmica” da matéria cósmica, associada à evolução do cenário cósmico global, repro-
duzindo adequadamente as abundâncias globais observadas dos elementos quı́micos
(nucleossı́ntese); de acordo com esta proposta, a história do Cosmos se iniciaria com

483
um prodigioso ’disparo’ primordial que assinalaria a entrada em existência do próprio
Universo, e prosseguiria até o estágio homogêneo, pouco denso e moderadamente ex-
pansivo que testemunhamos hoje.
Bondi, Hoyle e Gold, por outro lado, criticaram a concepção de Gamow, batizando-a,
ironicamente, de modelo da ”Grande Explosão Quente”(Hot Big-Bang), e sugeriram
como alternativa o chamado ”Modelo do Estado Estacionário” (Steady-State cosmol-
ogy), em que periodicamente ocorreria criação de matéria adicional de modo a fazer
a densidade cósmica invariante, apesar da expansão de Hubble, tornando assim a
evolução cosmológica compatı́vel com o chamado ”Princı́pio Cosmológico Perfeito” (o
Universo é homogêneo no espaço e no tempo). O debate só seria resolvido ao final dos
anos 60, com a descoberta (acidental) de Penzias e Wilson da presença de uma radiação
térmica (ou seja, com espectro de corpo negro) que permearia o Cosmos de todas as
direções (a chamada ”radiação cósmica de fundo de 3◦ K”) e que pôde ser interpretada,
no escopo do modelo do Big-Bang, como uma radiação residual ou ”fóssil” remanes-
cente do perı́odo primordial de grande compressão (quando o Universo, devido à alta
densidade, era opaco para os fótons). Esses sucessos - a descrição da nucleossı́ntese
e a incorporação ra radiação cósmica de fundo - fundamentaram a consolidação, na
década de 1970, do modelo da Grande Explosão Quente como eixo paradigmático
(ou ”Modelo-Padrão”) dos estudos cosmológicos. Pela primeira vez, havia sido pro-
duzida uma cosmogonia legitimamente cientı́fica, porque verificável pela observação;
a Cosmologia tornou-se assim uma disciplina própria da Fı́sica.

13.5 Problemas da Cosmologia Relativı́stica


Alternativas ao Modelo-Padrão
Não obstante esses sucessos, o Modelo-Padrão HBB apresenta uma série de graves
dificuldades técnicas e filosóficas, que podemos grupar genericamente sob dois tı́tulos:
problemas das condições iniciais - ocorrência primordial de horizontes causais que im-
pediriam a homogeneização hoje verificada; ”coincidência” com o limiar Euclidiano
entre expansão perene e recolapso, exigindo um ”ajuste fino” das condições primor-
diais; ausência da constante cosmológica, que não obstante é prevista por uma var-
iedade de teorias acerca do espectro observado de partı́culas elementares; explicação
pouco convincente para a formação das galáxias, dentre outros; e problemas da sin-
gularidade - divergências (valores infinitos) das grandezas fı́sicas na origem explosiva,
implicando, por conseguinte, a violação, nessa origem, de leis fundamentais como a
da conservação da energia e resultando em uma proveniência inescrutável para as leis
fı́sicas, dado que tal singularidade inicial constituiria uma fronteira absoluta para o
conhecimento através de modelagens causais.
Esses aspectos sumamente incômodos, bem como a escassez de observações defini-
tivas acerca do comportamento dos campos fı́sicos sob condições extremas (ou seja,

484
não-solares) conduziram ao surgimento, nos últimos anos, de uma série de propostas
alternativas visando eliminar ou ao menos atenuar as caracterı́sticas problemáticas
exibidas pelo HBB, através da alteração ou substituição de alguns dos ingredientes
básicos em jogo - por exemplo, sugestões de reinterpretação da atual fase expansiva;
modificações dos atributos usuais da matéria; introdução de outros campos fı́sicos de
caráter primordial (como nos modelos inflacionários); abandono do requisito de estrita
homogeneidade; teorias alternativas da gravitação e/ou do espaço-tempo; esboços de
cosmologia quântica, etc. Recentemente, um número crescente de observações tem in-
dicado que as variedades de matéria luminosa presente no Cosmos constituiriam não
mais que escassos 5% (cinco por cento!) do conteúdo cósmico, sendo os 95% restantes
compostos por espécies de matéria e energia ”escuras” (não-luminosas) cujos atributos
e natureza são inteiramente desconhecidos. Este problema inesperado e perturbador é
sem dúvida o grande desafio para os cosmólogos na presente década.

Transição Paradigmática?

Parece outrossim crescer entre os cosmólogos o entendimento de que a cosmogonia


associada ao HBB singular representaria um estágio preliminar de uma teoria cos-
mológica mais completa, ainda por ser estabelecida. Por exemplo, desde os anos 80
diferentes abordagens, clássicas e quânticas, têm coincidido na obtenção de cenários
compatı́veis com modelos de universos tipo-FRW porém não-singulares, ou seja, sem
”princı́pio” nem ”fim”. Assim, a idéia de um Universo ”eterno” tem ganho vigor teórico
e vem sendo encarada como suporte para uma nova visão cósmica. Num modelo sim-
ples, por, exemplo, o Universo se estenderia a partir de uma região no infinito passado
que pode ser identificada com o vazio do espaço-tempo e retornaria a esse vazio no
infinito futuro. Nosso universo hierarquizado e populado seria assim nada mais do que
uma flutuação, um estado transiente, de uma estrutura fundamental de espaço-tempo
que identificamos com o vazio Minkowskiano: uma região isenta de matéria ou de
qualquer ação dinâmica, e portanto privada de qualquer manifestação de existência
ou processo fı́sico.

Paralelamente a essa revolução nas nossas idéias sobre a totalidade espaço-tempo, os


fı́sicos vem examinando a possibilidade de um casamento entre a Teoria Quântica da
matéria e a Cosmologia provocando, por sua vez, questões de fronteira extremamente
delicadas. Entre estas, e só para citar um exemplo notável, a idéia francamente auda-
ciosa - (mas cientificamente respeitável, porquanto produzida no contexto da ciência) -
de que nosso Universo seria a conseqüência de um processo que, embora proibido den-
tro das leis da Fı́sica Clássica, ganha na Fı́sica Quântica uma probabilidade de ocorrer
(a criação do Universo por ”tunelamento quântico”). Assim, nosso Universo teria uma
probabilidade não nula de existir a partir de uma flutuação do ”vazio quântico”. Mas
quem mediria essa probabilidade? Quer dizer, se definimos nossa totalidade cósmica
como um evento quântico, que procedimento observacional a teria retirado do ”limbo”
quântico dos estados não observados, do oceano de Universos possı́veis, mas irrealiza-

485
dos (pelo menos por nós), associados a outras flutuações? Alguns cientistas foram
obrigados por essa e outras questões análogas a reverem os dogmas da interpretação
tradicional da Escola de Copenhagen, para que a concepção de um Cosmos Quântico
(totalidade que se auto-observaria) pudesse ganhar sentido.
Caberia então indagar: estarı́amos a ponto de presenciar uma autêntica transição
ou revolução paradigmática na Cosmologia? Não obstante as óbvias dificuldades do
paradigma-padrão encarnado no HBB, suas bases observacionais não foram ainda
postas em dúvida, e as várias propostas alternativas presentemente sob exame procu-
ram incorporar essas bases, dispondo portanto de um estatuto observacional equiv-
alente. Assim, somente a obtenção de novas evidências cósmicas poderá regular a
seleção dentre as variadas abordagens em curso hoje em dia e definir as linhas gerais
de uma cosmovisão reconhecidamente mais aperfeiçoada. A inauguração, na presente
década e na próxima, de aparatos de medida inovadores - detectores de ondas gravita-
cionais e de neutrinos cósmicos, novos telescópios terrestres e espaciais - permitirá pôr
em teste muitas de nossas atuais concepções fundamentais sobre o Universo em larga
escala (inclusive a TRG), permitindo antecipar a excitante perspectiva de importantes
inovações a curto e médio prazos.

13.6 Questões Epistemológicas

Finalmente, no que tange a uma avaliação do território epistemológico de moderna


Cosmologia, uma série de graves questões requer consideração atenta. O projeto cos-
mológico contemporâneo da construção de uma racionalidade para o Universo fı́sico
identifica-se, desde os trabalhos pioneiros de Einstein, Lemâitre, Eddington e outros,
às tentativas de conceituação do Universo como uma totalidade fechada, auto-referente
e (de acordo com os preceitos da TRG) organizada tão-somente pela interação grav-
itacional. A introdução dessa concepção do Cosmos como uma totalidade fechada,
todavia, acarreta dificuldade técnicas, filosóficas e mesmo puramente lógicas (como
indica o teorema de Gödel sobre sistemas formais privados de contexto).
Por exemplo, na Relatividade Geral trabalha-se com pelo menos duas noções de tempo
diferentes, o ’tempo próprio’ que cada observador emprega para comparar, de maneira
invariante, intervalos temporais (mas que carece de globalidade espacial, visto depen-
der da própria estrutura métrica local), e o tempo paramétrico ou ’coordenada-tempo’,
que possui globalidade mas não metricidade (não permite uma medida invariante
de intervalos) e pode ser reescalado de ponto a ponto (ou seja, há infinitos tempos
paramétricos equivalentes!). O tempo paramétrico, de fato, constitui a noção mais
rudimentar que se pode associar ao termo ’tempo’: uma simples linha contı́nua. Ora,
se o Universo é histórico, podemos então definir uma assimetria cósmica global (ou
tempo cosmológico) associada à expansão cósmica. Este tempo, porém, é privado
de externalidade - já que é o resultado da interação entre a configuração global de

486
matéria-energia e o tecido do espaço-tempo, e é referido a uma classe privilegiada
de observadores ditos co-moventes ou ”fundamentais” - dos quais, curiosamente, a
Cosmologia não pôde ainda se desvencilhar de modo convincente.

Se, por outro lado, definimos ”existir” por ”acontecer no espaço e no tempo”, como
é costumeiro, então ”tudo-o-que-existe” se identifica à estrutura global do contı́nuo
espaço-tempo da TRG, que é a figura de totalidade representativa dos eventos espa-
ciotemporais (acontecimentos) introduzida por Einstein e assimilada, em seguida, ao
paradigma padrão unificacionista vigente. Mas a própria Relatividade Geral, funda-
mento conceitual de tal programa, implica na possı́vel ocorrência de uma variedade
de entidades bizarras que, paradoxalmente, elidem a capacidade de registro e rep-
resentação de eventos de qualquer observador - buracos negros (sorvedouros de que
nada foge), buracos brancos (nascedouros em que nada penetra), indescritı́veis sin-
gularidades ”nuas”; ou regiões do mundo para sempre alheias, mesmo em princı́pio,
a toda possibilidade de contato ou observação devido a horizontes causais (que de-
sconectariam por completo diferentes regiões do espaço-tempo); ou ainda a existência
de ”torpezas” topológicas (como monopolos, cordões cósmicos, paredes de domı́nio)
que equivaleriam a ’fraturas’ do tecido geométrico; e até mesmo a viabilidade da con-
strução de caminhos ”fechados” nos quais avançar para o futuro significaria, para um
viajante, aproximar-se de seu passado (”viagens no tempo”), graças a ”buracos de
minhoca” construı́dos com algum tipo de matéria ”exótica” e que possibilitariam por
em contato locais muitı́ssimo distantes do Universo (ou até, especulativamente, de
Universos diferentes...), e etcetera. Qual o estatuto de existência dessas configurações
peculiares que, embora postas em cena pela TRG (o quadro conceitual de fundo,
repetimos, para nossa descrição dos fenômenos em escala cósmica) acabam por se
evadir de toda representação espaciotemporal? Seria necessário, talvez, invocar uma
modalidade ainda mais abrangente de ”realidade”, ou mesmo uma nova ”totalidade
universal”, que subsumisse igualmente essas entidades exóticas? Ou um tal impasse
sugeriria uma crise dos próprios fundamentos metacosmológicos em que se apóia a cos-
mologia clássica, que assim demandaria uma profunda crı́tica da razão cosmológica?

Em relação aos problemas associados à noção de totalidade cabe ainda citar a busca por
uma formulação unificada da qual todos os fenômenos observados pudessem ser deriva-
dos, a qual remonta à antiga aspiração por uma unificação das causas dos fenômenos
fı́sicos (”Unidade do Mundo”) e que constitui o cerne do moderno Programa de Ein-
stein em prol da obtenção de uma ordem harmônica e determinada para o Universo.
Na atualidade, este objetivo se encarna na procura por uma base comum que permita
a fusão das linguagens próprias aos domı́nios Macro- e Microscópico da Fı́sica, através
da integração das quatro interações conhecidas - gravitação, eletromagnetismo, força
nuclear fraca, força nuclear forte - em um único corpo descritivo - uma Teoria de Tudo.
As chamadas Teorias de Cordas e Teorias de Branas são, na atualidade, as candidatas
mais bem consideradas para a viabilização deste programa.

487
Embora dominante em nossa época, principalmente em virtude dos sucessos al-
cançados pelas chamadas teorias de calibre da Fı́sica de Partı́culas, este projeto de
modo algum é o único perseguido pelos fı́sicos (como alternativas, podem ser cita-
dos por exemplo o Programa de Boltzmann de fundamentação do mundo fı́sico a
partir de um fecundo ”caos” originário, ou o Programa de Dirac de multiplicação das
variáveis cósmicas) e tem sido obstaculizado pela forte não-linearidade das equações da
gravitação, que impediu até aqui a elaboração de uma teoria satisfatória da gravitação
e do espaço-tempo em escalas quânticas. A aguda sensibilidade dos modelos de que
atualmente dispomos com relação a variações das (inacessı́veis) condições iniciais -
insinuando um ”design” cósmico primordial incrivelmente preciso para uma variedade
de cenários razoáveis - é outra dificuldade encontrada na implementação de uma to-
talização auto-suficiente do mundo. Como derradeira observação, sugerimos que o
próprio apogeu do programa cosmológico contemporâneo, seus impasses e realizações,
parecem demandar por uma reavaliação das diretrizes metodológicas e mesmo do ”te-
los” conceitual do atual corpo de modelizações totalizantes e auto-referentes acerca do
Universo em que habitamos, procurando ampliar o escopo de compreensão dos pro-
cessos cósmicos, já como pertinentes a um Universo contextualizado, incorporado a
um complexo ulterior de relações que o abrange e ultrapassa - uma totalidade aberta.
Bibliografia básica:
A. Novaes, Org., A Crise da Razão (MINC/Funarte - Companhia das Letras, São
Paulo, 1996).
A. Novaes, Org., O Homem-Máquina (Companhia das Letras, São Paulo, 2003).
Alexandre Koyré, Do Mundo Fechado ao Universo Infinito (Forense/EdUSP, São
Paulo, 1979).
Arthur Koestler, O Homem e o Universo (Ibrasa, São Paulo, 1989).
Craig Stanford, Como nos Tornamos Humanos (Campus, Rio de Janeiro, 2004)
Daniel Boorstin, Os Descobridores (Civilização Brasileira, Rio de Janeiro, 1989).
Edward Speyer, Seis Caminhos a partir de Newton, (Campus, Rio de Janeiro, 1995).
Ernesto Sábato, Nós e o Universo (Francisco Alves, Rio de Janeiro, 1985).
F. Balibar, Einstein: uma Leitura de Galileu e Newton, (Edições 70, Lisboa, 1988).
F. Durham & R. Purrington, Frame of the Universe (Columbia University Press, New
York, 1983).
Fayga Ostrower, A Sensibilidade do Intelecto (Campus, Rio de Janeiro, 1998).
G. C. Branco, Org., Descartes - A Ordem das Razões , A Ordem das Paixões (NAU
Editora, Rio de Janeiro, 1999).
George Withrow, O Tempo na História (Jorge Zahar, Rio de Janeiro, 1997).
Géza Szamosi, Tempo e Espaço - as Dimensões Gêmeas (J. Zahar, Rio de Janeiro,
1988).

488
Giorgio de Santillana & Hertha von Deschend, Hamlet’s Mill (David R. Godine,
Boston, 1983).
Heinz Pagels, O Código Cósmico (Gradiva, Lisboa, s/d).
Hubert Reeves, Um Pouco Mais de Azul (Martins Fontes, São Paulo, 1986).
Ian Stewart, Será que Deus joga dados? (J. Zahar, Rio de Janeiro, 1991).
Ilya Prigogine & Isabelle Stengers, Entre o Tempo e a Eternidade (Gradiva, Lisboa,
1990).
Jean Pierre Vernant, As Origens do Pensamento Grego (Difel, São Paulo, 1981).
Jorge Luı́s Borges, Ficções (Globo, São Paulo, 1997).
M. Doctors, Org., Tempo dos Tempos (J. Zahar, Rio de Janeiro, 2003).
Margaret Wertheim, Uma História do Espaço de Dante à Internet (J. Zahar, Rio de
Janeiro, 2002).
Mário Novello, Cosmos e Contexto (Forense Universitária, Rio de Janeiro, 1988).
Mário Novello, O Cı́rculo do Tempo (Campus, Rio de Janeiro, 1997).
Martin Rees, A Evolução do Universo, in Andrew C. Fabian, Org., A Evolução (Ter-
ramar, Lisboa, 2000).
Max Born, Einstein’s Theory of Relativity (Dover, New York, 1965).
Michael Friedman, Foundations of Space-Time Theories (Princeton University Press,
New Jersey, 1983).
Mircea Eliade, O Mito do Eterno Retorno (Edições 70, Lisboa, s/d).
Nigel Calder, O Universo de Einstein (Ed. UnB, Brası́lia, 1988).
P. Coveney & R. Highfield, A Flecha do Tempo (Siciliano, Rio de Janeiro, 1993).
Paul Davies, Space and Time in the Modern Universe (Cambridge University Press,
London, 1977).
Rudy Rucker, The Fourth Dimension (Houghton Mifflin, Boston, 1984).
Steven Weinberg, Os Primeiros Três Minutos (Gradiva, Lisboa, 1988).
Thomas S. Kuhn, A Estrutura das Revoluções Cientı́ficas (Perspectiva, São Paulo,
1975).
Timothy Ferris, O Despertar na Via-Láctea (Campus, Rio de Janeiro, 1990).

489

Você também pode gostar